241 25 4MB
German Pages 629 Year 2008
Heinz Lüneburg
Von Zahlen und Größen Dritthalbtausend Jahre Theorie und Praxis Band 2
Birkhäuser Basel · Boston · Berlin
Autor: Heinz Lüneburg Fachbereich Mathematik Technische Universität Kaiserslautern Erwin-Schrödinger-Straße D-67663 Kaiserslautern e-mail: [email protected]
Bibliografische Information der Deutschen Bibliothek Die Deutsche Bibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über abrufbar.
ISBN 3-7643-8778-5 Birkhäuser Verlag, Basel – Boston – Berlin Das Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte, insbesondere die des Nachdrucks, des Vortrags, der Entnahme von Abbildungen und Tabellen, der Funksendung, der Mikroverfilmung oder der Vervielfältigung auf anderen Wegen und der Speicherung in Datenverarbeitungsanlagen, bleiben, auch bei nur auszugsweiser Verwertung, vorbehalten. Eine Vervielfältigung dieses Werkes oder von Teilen dieses Werkes ist auch im Einzelfall nur in den Grenzen der gesetzlichen Bestimmungen des Urheberrechtsgesetzes in der jeweils geltenden Fassung zulässig. Sie ist grundsätzlich vergütungspflichtig. Zuwiderhandlungen unterliegen den Strafbestimmungen des Urheberrechts.
© 2008 Birkhäuser Verlag, Postfach 133, CH-4010 Basel, Schweiz Ein Unternehmen von Springer Science+Business Media Gedruckt auf säurefreiem Papier, hergestellt aus chlorfrei gebleichtem Zellstoff. TCF∞ Printed in Germany ISBN 978-3-7643-8776-1 Band 1 ISBN 978-3-7643-8778-5 Band 2 ISBN 978-3-7643-8780-8 Set Band 1 und 2
e-ISBN 978-3-7643-8777-8 e-ISBN 978-3-7643-8779-2
987654321
www.birkhauser.ch
Inhaltsverzeichnis VII. Resultanten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1. Das gaußsche Lemma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 2. Resultanten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 3. Polynomiale Restesequenzen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 4. Subresultanten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 5. Algorithmen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 6. Der laplacesche Entwicklungssatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 VIII. Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 1. Einheitswurzeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 2. Die große Arbeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 ¨ 3. Uber die Aufl¨ osung von Gleichungen dritten Grades . . . . . . . . . . . . . . . . . . . . . 53 ¨ 4. Uber die Aufl¨ osung von Gleichungen vierten Grades . . . . . . . . . . . . . . . . . . . . . 67 5. Gleichungen f¨ unften und h¨ oheren Grades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 6. Strategiewechsel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 VIIII. Der abstrakte K¨ orperbegriff . . . . . . . . . . . . . . . . . . . . . . . . . . 97 1. Weber . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 2. Galoisfelder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 3. Die Kreisteilungspolynome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 4. Der Satz von Zsigmondy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 5. Der Satz von Wedderburn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142 6. Endlich erzeugte Moduln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 7. Torsionsmoduln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156 8. Der duale Modul . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180 9. Endliche abelsche Gruppen sind galoissche Gruppen . . . . . . . . . . . . . . . . . . . . 189 X. Steinitz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193 1. Die p-adischen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193 2. Einfache Erweiterungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207 3. Algebraische Erweiterungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214 4. Separable und inseparable Erweiterungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222 5. Einfache algebraische Erweiterungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234 6. Der Satz von L¨ uroth . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237 7. Der petersonsche Algorithmus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241 XI. Transfinite Methoden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243 1. Auswahlaxiom und Wohlordnungsprinzip . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243 2. Weitere transfinite Werkzeuge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257 3. Der Heiratssatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262 4. Unabh¨ angigkeitsstrukturen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270 5. Transzendenzbasen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275 6. Der algebraische Abschluss eines K¨ orpers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 279
vi 7. 8. 9. 10.
Inhaltsverzeichnis Formal reelle K¨ orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Reelle Algebra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Sturmsche Ketten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Rodolfo Bettazzi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
287 292 300 312
XII. Geometrie lebt von der Algebra . . . . . . . . . . . . . . . . . . . . . . . 315 1. 2. 3. 4. 5. 6.
Gauß und Vandermonde . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 315 Wantzel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 332 Pythagoreische K¨ orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 346 Reine Gleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 351 Die Kreisteilungsgleichung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 355 Kreisteilungsk¨ orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 360
XIII. Galois . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 365 1. Cauchy 1815 und 1844 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 365 2. Die sylowschen S¨ atze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 379 3. Aufl¨ osbare Gruppen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 385 4. Kongruenzrelationen und Faktorstrukturen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 395 5. Freie Gruppen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 411 6. Galois’ M´emoire I . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 415 7. Irreduzible Gleichungen von Primzahlgrad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 430 8. Es steht alles schon bei Dedekind . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 435 XIIII. Miszellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 447 1. Normalbasen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 447 2. Der Fundamentalsatz der Algebra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 452 3. Der Satz von L¨ uroth . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 454 4. Ganzzahlige Polynome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 468 5. Topologische R¨aume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 472 6. Topologische Vektorr¨aume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 487 7. Das henselsche Lemma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 492 8. Algebraische Erweiterungen von Qp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 503 9. Der algebraische Abschluss von Qp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 513 10. Der Satz von Heine-Borel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 517 XV. Transzendente Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 527 1. 2. 3. 4. 5. 6. 7. 8. 9.
Kettenbr¨ uche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Kettenbruchentwicklung reeller Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Liouvillesche Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die algebraischen Zahlen sind abz¨ ahlbar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Intermezzo: Lineare Unabh¨ angigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Huygens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Euler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Zusammenhang in topologischen R¨ aumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Exponentialfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
527 534 542 544 547 555 565 570 574
Inhaltsverzeichnis
vii
10. Die Transzendenz von e und π . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 581 Lebensdaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 593 Literaturverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 597 Index . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 615
Inhaltsverzeichnis von Band I Vorwort - Der rote Faden I. Gr¨ oßen. 1. Inkommensurabilit¨ at, 2. Dedekindsche Schnitte, 3. Proportionenlehre, 4. Rechnen mit Proportionen, 5. Fl¨ acheninhalte, 6. Die vierte Proportionale, 7. Ziffer, das Wort und die Sache, 8. Dezimalbr¨ uche, 9. Nepers Logarithmen, 10. Sinustafeln. II. Zahlen. 1. Die Lehre vom Geraden und Ungeraden, 2. Teilbarkeit, 3. Rationale Gr¨ oßenbereiche, 4. Geometrische Reihen, 5. Buch IX, 6. Zahlen aus Einheiten, 7. Induktion und Rekursion, 8. Nochmals Peano. III. Das zehnte Buch. 1. Definitionen und allgemeine S¨ atze, 2. Die Mediale, 3. Existenzaussagen, 4. Summen von irrationalen Strecken, 5. Lineare Unabh¨ angigkeit, 6. Binomiale, 7. Wurzeln aus Binomialen, 8. Algebra in den Elementen, 9. Fibonaccis kubische Gleichung. IIII. Gleichungen 2., 3. und 4. Grades. 1. Al-Hwarizmi, 2. Quadratische Gleichungen, 3. Die Berechnung von Wurzeln, 4. Nepers Arithmetica localis, 5. Dramatis personae, 6. Wut u ¨ber eine verspielte Gelegenheit, 7. Kubische Gleichungen, 8. Biquadratische Gleichungen, 9. Briefverkehr. V. Negative und komplexe Zahlen, Polynome. 1. Nu˜ nez und Bombelli, 2. Polynome und negative Zahlen, 3. Polynome bei Nu˜ nez, 4. Komplexe Zahlen, 5. Polynome bei Bombelli, 6. Das delische Problem, 7. Negative Zahlen. VI. Nullstellen von Polynomen. 1. Vi`ete und Descartes, 2. Cauchy, Exercices de math´ematiques, 3. Polynomringe, 4. Symmetrische Polynome, 5. Potenzsummen, 6. Angeordnete K¨ orper, 7. Der Fundamentalsatz der Algebra, 8. Gaußens zweiter Beweis, 9. R´esum´ee. Literaturverzeichnis - Index.
VII. Resultanten 1. Das gaußsche Lemma. Die Mitte des Buches hat viele Verwandlungen durchgemacht. Das lag vor allem daran, dass die Vorlesungstermine schneller aufeinander folgten, als ich lesen konnte. Meine H¨orer haben aber, glaube ich, dennoch eine gehaltvolle Vorlesung bekommen. Es lag aber auch daran, dass ich glaubte, dass ich Lagrangens große Arbeit R´eflexions sur la r´esolution alg´ebrique des ´equations von 1770/71 erst im Zusammenhang mit der galoisschen Theorie behandeln m¨ usse. Die Methoden dieser Arbeit, die auf Cramer, B´ezout und Euler zur¨ uckzugehen scheinen, waren aber den Mathematikern des ganzen 19. Jahrhunderts gel¨ aufig und wurden von ihnen meist stillschweigend benutzt, so dass ich Lagrangens Arbeit jetzt schon, dh. im n¨ achsten Kapitel, behandele, zumal einiges davon auch schon im letzten Kapitel zur Sprache kam. Um die Arbeit von Lagrange verstehen zu k¨onnen, ben¨ otigen wir den Begriff der Resultanten zweier Polynome, ein Begriff, der am Ende des 20. Jahrhunderts nicht mehr zum Allgemeinwissen der Mathematiker geh¨orte, der durch die M¨ oglichkeiten, die der Rechner bietet, aber wieder aktuell geworden ist. Vieles, was ich in diesem Kapitel vortragen werde, stammt aus zweiter Hand. Die Bibliotheken Kaiserslauterns sind nicht von der Art, dass man in ihnen B¨ ucher von Cramer und B´ezout findet. — Man findet in ihnen auch nicht Bettine von Arnims Goethes Briefwechsel mit einem Kinde.“ — Wir gehen also wieder einmal nicht ” historisch vor. Was aber vorgetragen wird, dient dem besseren Verst¨ andnis dessen, was folgt. Um die Resultanten sauber definieren und vor allem dann auch einige ihrer Eigenschaften etablieren zu k¨ onnen, stellen wir erst noch einiges u ¨ ber Polynomringe bereit, mit denen die Mathematiker des 18. Jahrhunderts sehr non-chalent umgingen, ehe wir dann im n¨ achsten Abschnitt auf die Resultanten zu sprechen kommen. Was wir nun vortragen werden, geht u ¨ ber das hinaus, was wir f¨ ur die Resultanten ben¨ otigen. Es ist aber zum einen f¨ ur sich gesehen schon von Interesse und wird uns dar¨ uber hinaus auch sp¨ ater noch zu Nutze sein. Wir beginnen damit, den Beweis f¨ ur den in dieser Allgemeinheit von Weber stammenden Satz vorzutragen, dass Polynomringe u ¨ ber K¨ orpern stets ZPE-Ringe sind (Weber 1893). Dabei werden wir alles so formulieren, wie es in einer heutigen Vorlesung u ¨ blich ist, und dar¨ uber hinaus noch etwas allgemeiner sein, indem wir zun¨ achst von ggT-Bereichen statt von ZPE-Bereichen reden werden. Es sei R ein Integrit¨atsbereich. Sind a, b, d ∈ R, so heißt d gr¨ oßter gemeinsamer Teiler von a und b, wenn d gemeinsamer Teiler von a und b ist und wenn jeder
2
Kapitel VII. Resultanten
gemeinsame Teiler von a und b Teiler von d ist. Haben a und b einen gr¨ oßten gemeinsamen Teiler, so haben sie in aller Regel viele solche, doch unterscheiden sich diese nur um eine Einheit von R, wobei ein Element a ∈ R Einheit heißt, wenn es ein b ∈ R gibt mit 1 = ab. Der Integrit¨ atsbereich R heißt ggT-Bereich, wenn je zwei Elemente von R einen gr¨ oßten gemeinsamen Teiler haben. Der n¨ achste Satz ist Verallgemeinerung von Dingen, die wir f¨ ur N schon in den Elementen bewiesen sahen. Satz 1. Ist R ein ggT-Bereich, so gilt: a) F¨ ur alle a, b, c ∈ R ist ggT(ac, bc) = cggT(a, b). b) Sind a, b ∈ R, ist (a, b) = (0, 0) und ist g := ggT(a, b), so ist a b ggT , = 1. g g c) Sind a, b, c ∈ R und sind a und b teilerfremd, so ist ggT(a, bc) = ggT(a, c). d) Sind a, b, c ∈ R, sind a und b teilerfremd, ist ferner a Teiler von bc, so ist a Teiler von c. Beweis. a) Das ist sicher richtig f¨ ur c = 0. Es sei also c = 0. Es ist cggT(a, b) Teiler von ac wie auch von bc. Also ist cggT(a, b) Teiler von g := ggT(ac, bc). Umgekehrt ist c Teiler von g und gc ist gemeinsamer Teiler von a und b. Also ist gc Teiler von ggT(a, b) und daher g Teiler von cggT(a, b). Es folgt (bis auf Einheiten) gc = ggT(ac, bc). b) Weil a und b nicht beide null sind, ist g = 0, so dass ag und gb eindeutig festliegen. Nach a) ist a b = ggT(a, b) = g, g ggT , g g und folglich, da R ein Integrit¨atsbereich und g = 0 ist, ggT( ag , gb ) = 1. c) Es sei g := ggT(a, c). Dann ist g gemeinsamer Teiler von a und bc. Es sei t ein weiterer gemeinsamer Teiler von a und bc. Dann ist t auch gemeinsamer Teiler von ac und bc. Nach b) ist ggT(ac, bc) = cggT(a, b) = c, so dass t ein gemeinsamer Teiler von a und c und damit von g ist. Folglich ist ggT(a, bc) = g = ggT(a, c). d) Nach c) ist ggT(a, bc) = ggT(a, c). Weil a Teiler von bc ist, ist daher a = ggT(a, bc) = ggT(a, c),
1. Das gaußsche Lemma
3
so dass a Teiler von c ist. Damit ist alles bewiesen. Ist R ein ggT-Bereich, und ist g = ni:=0 ai xi ∈ R[x] ein Polynom u ¨ ber R, so nennen wir cont(g) := ggT(a0 , . . . , an ) Inhalt von g. Das Polynom g heißt primitiv , wenn cont(g) = 1 ist. Satz 2. Es sei R ein ggT-Bereich und Q(R) sei sein Quotientenk¨ orper. Ist 0 = f ∈ Q(R)[x], dem Polynomring in der Unbestimmten x u ¨ber Q(R), so gibt es ein a ∈ Q(R) und ein primitives g ∈ R[x] mit f = ag. Ist b ∈ Q(R) und h ∈ R[x], ist h primitiv und gilt f = bh, so gibt es eine Einheit u ∈ R mit g = uh. Beweis. Die Existenz der Zerlegung f = ag ist banal. Es sei also ag = f = bh mit primitiven Polynomen g und h und a, b ∈ Q(R). Es gibt dann α, β, γ, δ ∈ R γ mit a = α β und b = δ . Es folgt αδg = βδag = βδbh = βγh. Weil g und h primitiv sind, folgt mit Satz 1 a) αδ = αδcont(g) = cont(αδg) = cont(βγh) = βγcont(h) = βγv mit einer Einheit v. Letzteres, weil der ggT irgendwelcher Elemente nur bis auf Einheiten bestimmt ist. Hieraus folgt a = bv und mit u := v −1 dann ag = f = bh = auh und weiter g = uh. Damit ist der Satz bewiesen. Gauß hat das nach ihm benannte Lemma nur f¨ ur Polynome u ¨ ber dem Ring der ganzen Zahlen formuliert und bewiesen (Gauß 1801, art. 42. Was seine Formulierung dieses Lemmas anbelangt, siehe die Bemerkung vor Satz 3 weiter unten). Kronecker verallgemeinerte es dann in der Kummerfestschrift auf Polynomringe in mehreren Unbestimmten u ¨ber Rationalit¨ atsbereichen und Weber schließlich auf Polynomringe u ¨ ber beliebigen K¨ orpern (Weber 1893, S. 532). Wir gehen noch ein St¨ uck weiter und beweisen die folgende Form des gaußschen Lemmas. Gaußsches Lemma. Ist R ein ggT-Bereich und sind f und g primitive Polynome u ¨ber R, so ist auch f g primitiv. n m Beweis. Es sei f = i:=0 fi xi und g = i:=0 gi xi . Ferner sei t ein gemeinsamer Teiler der Koeffizienten von f g, der keine Einheit sein m¨oge. Es gibt dann ein i ∈ {0, . . . , m} mit ggT(f0 , . . . , fi−1 , t) = 1 = ggT(f0 , . . . , fi , t), wobei der ggT links im Falle i = 0 als t zu interpretieren ist. Es sei u := ggT(f0 , . . . , fi−1 , t).
4
Kapitel VII. Resultanten
Dann ist u keine Einheit. Es gibt daher ein j ∈ {0, . . . , n} mit ggT(g0 , . . . , gj−1 , u) = 1 = ggT(g0 , . . . , gj , u), wobei der Fall j = 0 dem Fall i = 0 analog zu interpretieren ist. Es sei v := ggT(g0 , . . . , gj−1 , u). Dann ist auch v keine Einheit. Weil v Teiler von u und u Teiler von t ist, ist v gemeinsamer Teiler der Koeffizienten von f g. Nun ist (f g)i+j =
i+j
fk gi+j−k .
k:=0
Nach Konstruktion ist v Teiler von f0 , . . . , fi−1 , gj−1 , . . . , g0 . Hiermit und mit der vorstehenden Gleichung folgt fi gj ≡ (f g)i+j ≡ 0 mod v. Also ist v Teiler von fi gj . Nun ist v = ggT(g0 , . . . , gj−1 , u) und daher 1 = ggT(g0 , . . . , gj , u) = ggT(v, gj ). Mit Satz 1 d) folgt daher, dass v Teiler von fi ist. Daher ist v ein gemeinsamer Teiler von f0 , . . . , fi−1 , fi , u und somit von ggT(f0 , . . . , fi , u) = 1. Dies widerspricht aber der Tatsache, dass v keine Einheit ist. Also ist f g doch, wie behauptet, primitiv. Das gaußsche Lemma ist ein u ¨ beraus n¨ utzliches Werkzeug, wie schon die Be¨ weise der n¨achsten S¨ atze zeigen. Satz 3 ist im Ubrigen das, was Gauß in den Disquisitiones, art. 42, f¨ ur den Fall R = Z zeigt und was er in etwa so formuliert (er schreibt Latein): Sind g und h Polynome mit Leitkoeffizient 1 und sind nicht alle Koeffizienten von g und h ganz, so sind auch nicht alle Koeffizienten von gh ganz. Was wir heute gaußsches Lemma nennen, entstammt der Analyse des gaußschen Beweises des gerade formulierten Satzes. Satz 3. Ist R ein ggT-Bereich und hat f ∈ R[x] den Leitkoeffizienten 1, ist ferner g ∈ Q(R)[x] ein Teiler von f und hat auch g den Leitkoeffizienten 1, so ist g ∈ R[x]. Beweis. Es sei f = gh mit h ∈ Q(R)[x]. Nach Satz 2 gibt es a, b ∈ Q(R) und primitive Polynome G, H ∈ R[x] mit g = aG und h = bH. Es folgt f = gh =
1. Das gaußsche Lemma
5
abGH. Nach dem gaußschen Lemma ist GH primitiv. Weil auch f primitiv ist, gibt es nach Satz 2 eine Einheit u in R mit f = uGH. Es sei γ der Leitkoeffizient von G und δ der von H. Dann ist uγδ der von f , so dass uγδ = 1 ist. Folglich sind auch γ und δ Einheiten in R. Nun ist aber aγ der Leitkoeffizient von aG = g, so dass aγ = 1 ist, da ja der Leitkoeffizient von g nach Voraussetzung gleich 1 ist. Es folgt a = γ −1 ∈ R, so dass g = aG ∈ R[x] ist. Damit ist der Satz bewiesen. Hier drei Begriffe, die wir im Folgenden brauchen. Es sei R ein Integrit¨atsbereich. Wir nennen a ∈ R reduzibel oder auch zerlegbar , wenn es b, c ∈ R gibt, wobei weder b noch c Einheit ist, so dass a = bc gilt. Ist a weder Einheit noch reduzibel, so heißt a irreduzibel oder auch unzerlegbar . Das Element p ∈ R heißt Primelement , falls es keine Einheit ist und falls f¨ ur alle a, b ∈ R aus der Eigenschaft, dass p Teiler von ab ist, folgt, dass p Teiler von a oder von b ist. Primelemente sind stets irreduzibel. Die Umkehrung gilt nicht. Ein Integrit¨ atsbereich R heißt ZPE-Bereich, wenn jedes von null verschiedene Element von R, welches auch keine Einheit ist, Produkt von Primelementen ist. Ist dies der Fall, so ist die Zerlegung auch im Wesentlichen eindeutig, was besagt, dass aus m i:=1
pi =
n
qj
j:=1
mit Primelementen pi und qj folgt, dass m = n ist und dass es Einheiten e1 , . . . , em und eine Permutation σ ∈ Sm gibt mit pi = ei qσ(i) f¨ ur i := 1, . . . , m. Daher der Name ZPE, das ist, die Zerlegung in Primelemente ist m¨oglich und dann auch eindeutig. Die Eindeutigkeit der Zerlegung zu beweisen, ¨ sei dem Leser als Ubungsaufgabe u ¨berlassen. Satz 4. Es sei R ein ggT-Bereich. Ist f ∈ R[x] primitiv, so ist f genau dann in R[x] irreduzibel, wenn f in Q(R)[x] irreduzibel ist. Beweis. Ist f in R[x] reduzibel, so auch in Q(R)[x]. Es gibt dann n¨ amlich g, h ∈ R[x], die keine Einheiten sind, mit f = gh. Es kann nicht g ∈ R gelten, da sonst g ein gemeinsamer Teiler der Koeffizienten von f w¨are. Weil f primitiv ist, w¨are g dann eine Einheit von R, was nicht der Fall ist. Ebenso gilt, dass auch h nicht in R liegt. Also haben g und h positiven Grad, so dass f = gh auch eine nicht triviale Zerlegung von f in Q(R)[x] ist. Es sei umgekehrt f = gh mit g, h ∈ Q(R)[x] und g und h m¨ogen positiven Grad haben. Nach Satz 2 gibt es a, b ∈ Q(R) und primitive G, H ∈ R[x] mit g = aG und h = bH. Es folgt f = abGH. Nach dem gaußschen Lemma ist GH primitiv. Weil auch f primitiv ist, folgt mit Satz 2, dass ab eine Einheit in R ist. Also ist f = (abG)H eine Zerlegung von f in R[x], die wegen Grad(abG) = Grad(G) = Grad(g)
6
Kapitel VII. Resultanten
nicht trivial ist. Damit ist alles bewiesen. Der gerade bewiesene Satz erh¨alt daher seine Bedeutung, dass arithmetische Eigenschaften von R es immer wieder einmal gestatten zu zeigen, dass ein primitives Polynom in R[x] irreduzibel ist. Dann ist dieses Polynom und alle seine assoziierten in Q(R)[x] irreduzibel. Typisch f¨ ur diese Situation ist das folgende Irreduzibilit¨ atskriterium, welches Sch¨onemann f¨ ur den Ring der ganzen Zahlen bewies (Sch¨ onemann 1846). Dieses Kriterium wird in der Literatur durchweg Eisenstein” kriterium“ genannt. Es wurde in der Tat von Eisenstein auch f¨ ur den ZPE-Bereich der ganzen gaußschen Zahlen formuliert und bewiesen (Eisenstein 1850). Eisenstein und die Namengeber haben offensichtlich die sch¨ onemannsche Arbeit nicht oder nicht sehr sorgf¨altig gelesen. Eisenstein jedenfalls sagt, er h¨atte bislang nur Beweise von Gauß und Kronecker daf¨ ur gesehen, dass das p-te Kreisteilungspolynom im Falle, dass p eine Primzahl ist, irreduzibel sei. Doch auch Sch¨ onemann benutzt das Kriterium, um die Irreduzibilit¨ at des p-ten Kreisteilungspolynoms zu beweisen. Die eisensteinsche Aussage nimmt Sch¨onemann zum Anlass, in Band 40 des Journals f¨ ur die reine und angewandte Mathematik (1850, S. 188.) darauf hinzuweisen, dass er im Wesentlichen das gleiche Kriterium wie Eisenstein bewiesen und wie jener zum Beweise der Irreduzibilit¨ at des p-ten Kreisteilungspolynoms benutzt h¨ atte. Es ist also Sch¨ onemann, dem die Priorit¨ at geb¨ uhrt. Ich glaubte lange Zeit, dass diese Fehlzuordnung im Umkreis von Emmy Noether, Artin, van der Waerden entstanden sei, da ich sie in van der Waerdens Algebra“ fand. Doch beim Durchbl¨ attern von Landaus Werken Bd. I fand ich ” eine Arbeit (Werke I, S. 360–364), wo Landau das fragliche Kriterium Eisenstein zuschreibt. Die Fehlzuordnung ist also a¨lter. Interessant ist jedoch Folgendes. Bei der Herausgabe der Werke Landaus hat Wefelscheid auch Sonderdrucke aus Landaus Besitz benutzt und handschriftliche Notizen Landaus in ihnen mit in die Werke aufgenommen. Die Randnotiz hier nun lautet: Schoenemann vor Eisen” stein“. Landau hat den Fehler also bemerkt, wenn auch zu sp¨ at f¨ ur die Publikation. In D. Knuth, The Art of Computer Programming. Vol II, 2. Auflage, Reading/Mass. etc. 1981 findet sich auf S. 438 ebenfalls der Name Eisensteinkriterium. Da Knuth dem Erstentdecker eines Fehlers 2 Dollar versprach, schrieb ich ihm im Jahr 1982 einen Brief des Inhalts, dass Sch¨ onemann der Entdecker des Irreduzibilit¨ atskriteriums sei in der Hoffnung, die 2 Dollar kassieren zu k¨ onnen. Ich h¨ orte nichts von ihm und vergaß das Ganze. Im Sommer des Jahres 1996 jedoch bekam ich einen Brief von Knuth. In diesem Brief fand sich neben meinem Brief von 1982 ein Schreiben von Knuth mit dem Warum-so-sp¨at und einen Scheck u ¨ ber 5$ 96c. Die Pr¨ amie war von 2 auf 3 Dollar erh¨ oht worden. Hinzu kamen noch Zinsen. Sch¨ o nemannsches Irreduzibilit¨ atskriterium. Es sei R ein ggT-Bereich und n f := i:=0 fi xi sei ein primitives Polynom aus R[x]. Ferner gelte k := ggT(fn−1 , fn−2 , . . . , f0 ) = 1.
1. Das gaußsche Lemma
7
Gibt es ein von 0 verschiedenes s in R, das auch keine Einheit ist, mit den Eigenschaften: a) s teilt k, b) Ist t Teiler von s und t2 Teiler von f0 , so ist t Einheit in R, dann ist f irreduzibel in R[x] und folglich in Q(R)[x].
a i Beweis. Es sei f = gh mit g, h ∈ R[x]. Ferner sei g = i:=0 gi x und h = b i i:=0 hi x . Ist α := cont(g) und β := cont(h), so ist αβ gemeinsamer Teiler aller fi . Weil f primitiv ist, ist also αβ eine Einheit, so dass g und h primitiv sind. Nach Voraussetzung teilt s den gr¨ oßten gemeinsamen Teiler k von f0 , . . . , fn−1 . Insbesondere ist s also Teiler von f0 = g0 h0 . Weil s keine Einheit ist, kann nach Satz 1 c) nicht gleichzeitig ggT(s, g0 ) = 1 und ggT(s, h0 ) gelten. Wir d¨ urfen annehmen, dass p := ggT(s, g0 ) = 1 ist. Es sei ferner t := ggT(p, h0 ). Dann ist t Teiler von p und damit von s. Ferner ist t auch Teiler von g0 und von h0 . Also ist t2 Teiler von g0 h0 = f0 . Auf Grund unserer Voraussetzung ist t also Einheit in R. Es gibt nun, da p Teiler von g0 ist, der keine Einheit ist, und da g außerdem primitiv ist, ein i mit 1 ≤ i ≤ a und q := ggT(g0 , . . . , gi−1 , p) = 1 = ggT(g0 , . . . , gi , p). Dann ist also q keine Einheit und es ist fi =
i
gj hi−j ≡ gi h0 mod q.
j:=0
Weil p und h0 teilerfremd sind, sind auch q und h0 teilerfremd. Also ist ggT(gi h0 , q) = ggT(gi , q) = ggT(g0 , . . . , gi−1 , gi , p) = 1. Somit ist fi zu q teilerfremd. Nun ist aber q Teiler von p und p ist Teiler von s und s ist Teiler von k. Daher ist q Teiler von f0 , . . . , fn−1 . Weil q keine Einheit ist, ist daher i = n, so dass n ≤ a gilt. Somit ist Grad(f ) = Grad(g), so dass f irreduzibel ist. Mit Satz 4 folgt schließlich, dass f auch in Q(R) irreduzibel ist. Sch¨ onemanns Irreduzibilit¨ atskriterium wird u ¨blicherweise in der folgenden, sehr viel handlicheren Fassung formuliert. n Korollar. Es sei R ein ZPE-Bereich und f := i:=0 fi xi sei ein primitives Polyur i := 0, . . . , nom aus R[x]. Ist p ein Primelement von R und gilt fi ≡ 0 mod p f¨ n − 1 und f0 ≡ 0 mod p2 , so ist f irreduzibel in R[x] und dann auch in Q(R)[x]. Dies folgt sofort mit s = p aus dem sch¨onemannschen Irreduzibilit¨ atskriterium. Ist p eine Primzahl und a eine ganze Zahl, die nicht durch p teilbar ist, so ist xn − pa f¨ ur alle nat¨ urlichen Zahlen n irreduzibel u ¨ ber Q. Dies folgt unmittelbar
8
Kapitel VII. Resultanten
aus dem Korollar. Damit ist gezeigt, dass es u ¨ ber Q irreduzible Polynome jeglichen Grades gibt. Gauß bewies in seinen Disquisitiones (art. 341), dass das p-te Kreisteilungspolynom Φp irreduzibel ist, falls p eine Primzahl ist. Hierzu ben¨otigte er, was er in art. 42 bewiesen hatte, dass eine Zerlegung von Φp u ¨ ber Q mit Polynomen deren Leitkoeffizient 1 ist, bereits eine Zerlegung u ¨ ber Z ist. Dass alle Kreisteilungspolynome irreduzibel sind, ist erst Kronecker gelungen zu zeigen (Kronecker 1854). Ist p−1 i x das p-te Kreisteilungspolynom. Der folgende p eine Primzahl, so ist f := i:=0 Beweis f¨ ur seine Irreduzibilit¨ at stammt von Sch¨ onemann (1846). Es ist der oben erw¨ahnte. p −1 . Ersetzt man hierin x durch y + 1, so folgt Es ist f = xx−1 p p p i p i−1 1 f (y + 1) = y = y . −1 + i i y i:=0 i:=1
p Nun ist ur i := 1, . . . , p − 1 durch p teilbar, da p eine Primzahl ist. i f¨ p Ferner ist p p = 1, so dass das Polynom f (y + 1) primitiv ist. Schließlich ist 1 = p nicht durch p2 teilbar. Daher ist f (y + 1) und damit f irreduzibel. Der n¨achste Satz erweitert unseren Vorrat an ggT-Bereichen. Bislang kennen wir ja nur Z und die Polynomringe in einer Unbestimmten u ¨ber einem K¨ orper als ¨ solche. Uber diese werden wir aber in Satz 7 noch mehr aussagen. Satz 5. Ist R ein ggT-Bereich, so ist auch der Polynomring R[x] in der Unbestimmten x u ¨ber R ein ggT-Bereich. Beweis. Es seien f , g ∈ R[x] und f und g seien primitiv. Weil Q(R)[x] ein euklidischer Ring ist, haben f und g in Q(R)[x] einen gr¨ oßten gemeinsamen Teiler, den wir μ nennen. Es gibt dann a, b ∈ Q(R)[x] mit f = aμ und g = bμ. Es gibt dann weiter α, β, γ ∈ Q(R) und primitive A, B, M ∈ R[x] mit a = αA, b = βB und μ = γM . Es folgt f = αγAM und g = βγBM . Nach dem gaußschen Lemma sind AM und BM primitiv, so dass αγ und βγ nach Satz 2 Einheiten von R sind, da f und g ja primitiv sind. Es folgt, dass M ein gemeinsamer Teiler von f und g in R[x] ist. Es sei d ein gemeinsamer Teiler von f und g in R[x]. Dann ist d insbesondere primitiv. Ferner ist d in Q(R)[x] Teiler von μ. Es sei μ = dν mit ν ∈ Q(R)[x]. Es gibt dann ein δ ∈ Q(R) und ein primitives N ∈ R[x] mit ν = δN . Es folgt γM = δdN . Nach dem gaußschen Lemma ist dN primitiv, so dass es nach Satz 2 eine Einheit u in R gibt mit M = udN . Folglich ist d Teiler von M , so dass M gr¨ oßter gemeinsamer Teiler von f und g ist. Es seien nun f , g ∈ R[x] beliebig. Ist f = 0, so ist ggT(f, g) = g. Entsprechend ist ggT(f, g) = f , wenn g = 0 ist. Es seien also f und g beide von null verschieden. Ferner sei α := cont(f ) und β := cont(g). Weiter sei f = αF und g = βG. Dann sind F und G primitive Polynome und haben nach dem schon Bewiesenen einen gr¨ oßten gemeinsamen Teiler D in R[x]. Es sei ferner δ := ggT(α, β). Dann ist δD ein gemeinsamer Teiler von f und g. Wir zeigen, dass δD ein gr¨ oßter gemeinsamer Teiler von f und g ist.
1. Das gaußsche Lemma
9
Es sei h ein gemeinsamer Teiler von f und g. Ferner sei := cont(h). Dann ist gemeinsamer Teiler aller Koeffizienten von f und damit Teiler von α. Entsprechend folgt, dass Teiler von β ist. Also ist Teiler von δ. Es sei ferner f = ah und a = ηA. Es folgt αF = η AH. Weil F und AH primitiv sind, gibt es eine Einheit u in R mit F = uAH, so dass H Teiler von F ist. Ebensoa folgt, dass H Teiler von G ist. Also ist H Teiler von D. Dann ist aber h = H Teiler von δD, so dass δD gr¨ oßter gemeinsamer Teiler von f und g ist. Damit ist R[x] als ggT-Bereich erkannt. Wir haben mehr bewiesen als in Satz 5 formuliert. Da dieses Mehr f¨ ur die Rechenpraxis von Bedeutung ist, formulieren wir es als eigenen Satz. Satz 6. Es sei R ein ggT-Bereich. Ferner seien f , g ∈ R[x] und es gelte f , g = 0. Ist α := cont(f ) und β := cont(g), ist ferner f = αF und g = βG, so ist ggT(f, g) = ggT(α, β)ggT(F, G). ¨ Uberdies ist ggT(F, G) primitiv. Man kann noch mehr in dieser Richtung beweisen. N¨ amlich Satz 7. Ist R ein ZPE-Bereich, so ist auch der Polynomring R[x] in der Unbestimmten x u ¨ber R ein ZPE-Bereich. Beweis. Es sei p ein Primelement von R. Ferner seien f , g ∈ R[x] und p teile f g. Dann teilt p alle Koeffizienten von f g. Wir m¨ ussen zeigen, dass p Teiler von f oder Teiler von g ist. Es sei p kein Teiler von f . Es gibt dann ein i, so dass die Koeffizienten f0 , . . . , fi−1 von f durch p teilbar sind, fi aber nicht. Dann ist fi g0 ≡
i
fj gi−j = (f g)i ≡ 0 mod p.
j:=0
Es folgt, dass p Teiler von g0 ist. Es sei k > 0 und p teile g0 , . . . , gk−1 . Dann ist fi gk ≡
i+k
fj gi+k−j = (f g)i+k ≡ 0 mod p.
j:=0
Es folgt gk ≡ 0 mod p, so dass g durch p teilbar ist. Somit ist p auch Primelement in R[x]. Es sei nun f ∈ R[x] beliebig. Dann ist f = cont(f )F mit einem primitiven Polynom F . Weil R ein ZPE-Bereich ist, ist cont(f ) Produkt von Primelementen in R und damit von Primelementen in R[x], weil die Primelemente von R in R[x] ja prim bleiben, wie gerade gesehen. Das primitive Polynom F ist Produkt von endlich vielen in R[x] irreduziblen Polynomen, da der Grad eines echten Faktors eines primitiven Polynoms ja kleiner ist, als der Grad des gegebenen Polynoms. Es ist also nur noch zu zeigen, dass ein irreduzibles Polynom prim ist. Dazu beachte man zun¨ achst, dass R[x] nach Satz 6 ein ggT-Bereich ist. Es sei f ein irreduzibles
10
Kapitel VII. Resultanten
Polynom und dieses Polynom teile das Produkt gh. Ist f kein Teiler von g, so ist ggT(f, g) = 1. Dann teilt f aber nach Satz 1 d) das Polynom h. Folglich ist f ein Primpolynom. Damit ist der Satz bewiesen. Der Nachweis innerhalb des Beweises von Satz 7, dass irreduzible Polynome aus R[x] prim sind, wenn R ein ggT-Bereich ist, liefert auch noch das allgemeinere Korollar 0. Ist R ein ggT-Bereich und ist u ∈ R irreduzibel, so ist u ein Primelement von R. Das folgende Korollar 1 steht f¨ ur endliches X, wie schon erw¨ahnt, bei Weber 1893. Korollar 1. Ist K ein kommutativer K¨ orper, so ist der Polynomring K[X] in den Unbestimmten aus X ein ZPE-Bereich. Beweis. F¨ ur endliche X folgt dies mittels Induktion aus Satz 7. Es sei also X beliebig. Sind f , g ∈ K[x], so kommen in f und g nur endlich viele x1 , . . . , xn ∈ X vor. In K[x1 , . . . , xn ] haben f und g einen gr¨ oßten gemeinsamen Teiler d. Es sei u ein gemeinsamer Teiler von f und g in K[X]. Weil K als K¨orper nullteilerfrei ist, kann kein y ∈ X − {x1 , . . . , xn } in u vorkommen, es sei denn, f und g sind beide null. Dann ist aber auch d = 0 und u Teiler von d. Im anderen Falle ist also u ∈ K[x1 , . . . , xn ] und folglich auch hier Teiler von d. Also ist d gr¨ oßter gemeinsamer Teiler von f und g in K[X], so dass K[X] ein ggT-Bereich ist. Der gleiche Schluss, der zeigte, dass d ∈ K[x1 , . . . , xn ] ist, zeigt, dass jeder Teiler eines von null verschiedenen Polynoms in K[x1 , . . . , xn ] liegt, wenn x1 , . . . , xn die Unbestimmten sind, die in dem gegebenen Polynom vorkommen. Also ist jedes Polynom in K[X] Produkt von irreduziblen Polynomen. Da K[X] ein ggTBereich ist, sind diese aber allesamt Primpolynome nach Korollar 0. Damit ist Korollar 1 bewiesen. Ebenso folgt (Kronecker?) ¨ber Korollar 2. Der Polynomring Z[x1 , . . . , xn ] in den Unbestimmten x1 , . . . , xn u Z ist ein ZPE-Bereich. Die Aussagen u ¨ ber ggT-Bereiche geh¨oren wohl, so denke ich, zur mathematischen Folklore. Ich habe mir keine M¨ uhe gegeben, sie in der Literatur aufzusp¨ uren. Die Aussage des Korollars 0 fiel mir im April 1997 auf, als ich nach einem Beweis f¨ ur Satz 7 suchte, der ihn auf Satz 5 zur¨ uckf¨ uhrt, aber nicht vom Auswahlaxiom Gebrauch macht, das ich bei fr¨ uherer Gelegenheit an dieser Stelle benutzte. Nichts von dem, was wir bislang in diesem Buche machten, ben¨ otigt das Auswahlaxiom. ¨ 2. Resultanten. Uber die Urspr¨ unge der Resultanten habe ich nur Vermutungen. Sie haben zu tun mit der Elimination einer Unbestimmten aus zwei algebraischen Gleichungen und dr¨ angen sich daher auf im Zusammenhang mit B´ezouts Satz, dass zwei ebene algebraische Kurven der Grade m und n h¨ ochstens mn Schnittpunkte haben. Geschrieben h¨ atten u ¨ ber dieses Thema G. Cramer in seinem Buch Introduction a ` l’analyse des lignes courbes, B´ezout in den M´emoires de l’Acad´emie des
2. Resultanten
11
Sciences de Paris vom Jahre 1764 und auch Euler in den M´emoires de l’Acad´emie royale des Sciences et Belles-Lettres de Berlin der Jahre 1748 und 1764, so Lagrange in Lagrange 1771, S. 141, wo er selbst auch u ¨ ber diesen Gegenstand schreibt. Die beiden eulerschen Arbeiten fand ich in Eulers Gesammelten Werken“, die bei” den anderen habe ich nicht in der Hand gehabt. Den ersten Satz entnehme ich van der Waerden 1955, S. 94. Bei ihm hat Euler Pate gestanden, wie aus van der Waerdens Text (S. 95) hervorgeht. Ein Zitat gibt er nicht. Es muss die Arbeit Euler 1764 gewesen sein, die ihn inspirierte. Darauf werden wir gleich zur¨ uckkommen. Dieser Satz und der Hinweis auf Euler findet sich auch schon in van der Waerden 1931, S. 2 und 1937, S. 88. Satz 1. Es sei R ein ggT-Bereich und f und g seien zwei von 0 verschiedene Polynome in der Unbestimmten x u ¨ber R. Genau dann haben f und g einen gemeinsamen Faktor positiven Grades, wenn es von null verschiedene Polynome γ, ϕ ∈ R[x] gibt mit Grad(ϕ) < Grad(f ) und Grad(γ) < Grad(g), so dass γf = ϕg gilt. Beweis. Es sei δ ein gemeinsamer Faktor positiven Grades. Es gibt dann ϕ, γ ∈ R[x] mit f = δϕ und g = δγ. Es folgt γf = γδϕ = ϕδγ = ϕg. Weil δ positiven Grad hat, ist der Grad von ϕ kleiner als der Grad von f und der Grad von γ ist kleiner als der Grad von g. Es gelte umgekehrt die Gleichung γf = ϕg mit den entsprechenden Nebenbedingungen. Weil R ein ggT-Bereich ist, ist dies auch R[x] nach Satz 5 von Abschnitt 1. Es folgt ϕ f = g. γ ggT(f, ϕ) ggT(f, ϕ) Weil
f ggT(f,ϕ)
und
ϕ ggT(f,ϕ)
nach Satz 1 b) von Abschnitt 1 teilerfremd sind, folgt f ggT(f,ϕ) Teiler von g f ggT(f,ϕ) ein Polynom
mit Satz 1 d) von Abschnitt 1, dass
ist. Weil der Grad von ϕ
kleiner als der Grad von f ist, ist ist alles bewiesen.
positiven Grades. Damit
Euler nimmt bei seinen Untersuchungen an, dass f und g eine gemeinsame Nullstelle haben. Dann haben f und g einen gemeinsamen Linearfaktor, mit dem er dann weiter schließt, wobei die Linearit¨ at keine wesentliche Rolle spielt. Es sei f=
m i:=0
ai xm−i , g =
n i:=0
bi xn−i , ϕ =
m−1 i:=0
ci xm−1−i , −γ =
n−1
di xn−1−i .
i:=0
Gesucht sind nun notwendige und hinreichende Bedingungen an die Koeffizienten von f und g, so dass man c und d so finden kann, dass γf +ϕg = 0 ist. Die Polynome γf und ϕg haben jeweils m + n − 1 + 1 = m + n Koeffizienten. Ausmultiplizieren der Polynome f¨ uhrt daher auf das folgende System von m + n homogenen linearen
12
Kapitel VII. Resultanten
Gleichungen f¨ ur die m + n Koeffizienten der gesuchten Polynome. 0 = d0 a0 0 = d0 a1 + d1 a0 0 = d0 a2 + d1 a1
0= 0=
dn−2 am
+ d2 a0 .. . + dn−1 am−1 dn−1 am
+ c0 b 0 + c0 b 1 + c1 b 0 + c0 b 2 + c1 b 1 + c2 b 0 .. . + cm−2 bn + cm−1 bn−1 + cm−1 bn
Es gibt also genau dann zwei Polynome γ und ϕ der verlangten Art, wenn dieses Gleichungssystem eine nicht triviale L¨osung hat, also genau dann, wenn die Determinante des Gleichungssystems 0 ist. Die folgende ((m + n) × (m + n))-Matrix ⎛
a0
⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ b0 ⎜ ⎜ ⎝
a1 a0
b1 b0
... ... a1 . . . ... ... a0 ... ... b1 . . . ... ... b0
. . . am ... ... ... ... a1 . . . bn ... ... ... ... b1 . . .
⎞ ⎟ ⎟ ... ⎟ ⎟ . . . am ⎟ ⎟ ⎟ ⎟ ⎟ ⎠ ... . . . bn
ist die Transponierte der Koeffizientenmatrix dieses Gleichungssystems. Die erste Zeile dieser Matrix besteht aus den Koeffizienten des Polynomes f gefolgt von n − 1 Nullen. Die n¨ achsten n − 1 Zeilen der Matrix entstehen aus der ersten durch zyklische Vertauschung der Koeffizienten der ersten Zeile. Die (n + 1)-ste Zeile besteht aus den Koeffizienten des Polynoms g gefolgt von m − 1 Nullen. Die restlichen m − 1 Zeilen entstehen durch zyklische Vertauschung der Koeffizienten der (n + 1)-sten Zeile. Diese Matrix wird Sylvestermatrix genannt. Sie findet sich, wohl zum ersten Male, in Sylvester 1840. Ihre Determinante heißt Resultante der Polynome f und g. Wir bezeichnen sie mit Res(f, g). Da das Vertauschen zweier Zeilen einer Matrix das Vorzeichen ihrer Determinante a¨ndert, gilt Res(g, f ) = (−1)mn Res(f, g). Da die Determinante sich beim Transponieren nicht a¨ndert, gilt, wie gesehen, der folgende Satz. n m Satz 2. Es sei R ein ggT-Bereich und f = i:=0 ai xm−i und g = i:=0 bi xn−i seien zwei Polynome vom Grade m bzw. n u ¨ber R. Genau dann haben f und g einen nicht trivialen Faktor, wenn Res(f, g) = 0 ist. Wie sehr Matrizen- und Determinantentheorie noch in den Kinderschuhen steckte, als Sylvester seine Arbeit schrieb, zeigt das folgende Zitat (Sylvester 1840). Die
2. Resultanten
13
Koeffizienten der beiden Polynome heißen auch bei Sylvester a und b. Die Rollen von m und n sind aber vertauscht. A Rule for absolutely eliminating x. Form out of the (a) progression of coefficients m lines, and in like manner out of the (b) progression of coefficients form n lines in the following manner: 1. (a) Attach (m − 1) zeros all to the right of the terms in the (a) progression; next attach (m − 2) zeros to the right and carry over 1 to the left; next attach (m − 3) zeros to the right and carry over 2 to the left. Proceed in like manner until all the (m − 1) zeros are carried over to the left and none remain on the right. The m lines thus formed are to be written under one another. 1. (b) Proceed in like manner to form n lines out of the (b) progression by scattering (n − 1) zeros between right and left. 2. If we write these n lines under the m lines last obtained, we shall have a solid square (m + n) terms deep and (m + n) terms broad . 3. Denote the lines of this square by arbitrary characters, which write down in vertical order and permute in every possible way, but separate the permutations that can be derived from one another by an even number of interchanges (effected between contiguous terms) from the rest; there will thus be half of one kind and half of another. 4. Now arrange the (m + n) lines accordingly, so as to obtain 1 2 (m + n)(m + n − 1) . . . 2.1 squares of one kind which shall be called positive squares, and an equal number of opposite kind which shall be called negative. Draw diagonals in the same direction in all the squares; multiply the coefficients that stand in any diagonal line together; take the sum of the diagonal products of the positive squares, and the sum of the diagonal products of the negative squares; the difference between these two sums is the prime derivative of the zero degree, that is, the result of elimination between the two given equations reduced to its ultimate state of simplicity, there will be no irrelevant factors to reject, and no terms which mutually destroy. Bemerkenswert finde ich auch, dass Sylvester die Zeilen seines Quadrates mit irgendwelchen Charakteren“ indiziert, bemerkenswert deshalb, weil so mancher ” Autor darauf besteht, dass die Zeilen und Spalten einer Matrix mit 1, . . . , m, bzw., 1, . . . , n zu nummerieren seien, was er dann sofort vergisst, wenn er Untermatrizen einer Matrix betrachtet. F¨ ur eine der Sache angemessene Indizierung einer gewissen uneburg 1989, S. 292 ff. (n2 × n!)-Matrix siehe der Leser L¨ Wir wollen nun f¨ ur zwei spezielle Polynome die Resultante auf eine andere Weise berechnen, n¨ amlich f¨ ur die Polynome f := a0
m i:=1
(x − ui )
14
Kapitel VII. Resultanten
in den Unbestimmten a0 , x und u1 , . . . , um und g := b0
n
(x − vi )
i:=1
in den Unbestimmten b0 , x und v1 , . . . , vn . Wir bezeichnen die elementarsymmetrischen Polynome in den Unbestimmten ui mit λ und die elementarsymmetrischen Polynome in den Unbestimmten vi mit μ. Ferner setzen wir ai := a0 (−1)i λi f¨ ur i := 1, . . . m und bi := b0 (−1)i μi f¨ ur i := 1, . . . , n. Dann ist f=
m
ai xm−i
i:=0
und g=
n
bi xn−i .
i:=0
Es folgt, dass Res(f, g) ein Polynom in den ui und vj ist. Dar¨ uber gilt der folgende Satz 3. F¨ ur das Polynom f := a0
m
(x − ui )
i:=1
in den Unbestimmten a0 , x und u1 , . . . , um und das Polynom g := b0
n
(x − vi )
i:=1
in den Unbestimmten b0 , x und v1 , . . . , vn gilt Res(f, g) = an0 bm 0
n m
(ui − vj ).
i:=1 j:=1
Beweis. Wir haben nicht spezifiziert, u ¨ ber welchem Ring wir die Polynome betrachten. Es gen¨ ugt, sie als Polynome u ¨ ber Z aufzufassen, da diese Identit¨ at u ¨ ber jedem Ring gilt, wenn sie u ¨ ber Z gilt. Setzt man ui = vj , so haben f und g den Faktor x − ui gemein. Es folgt Res(f, g) = 0, so dass ui − vj , die beiden Unbestimmten nun wieder beliebig, Teiler von Res(f, g) ist. Ferner folgt, weil alle ai durch a0 und alle bi durch b0 teilbar sind, dass an0 und bm 0 Teiler von Res(f, g) sind. Weil Z[u1 , . . . , um , v1 , . . . , vn , a0 , b0 ]
2. Resultanten
15
nach Abschnitt 1, Korollar 2 von Satz 7 ein ZPE-Ring ist, ist also an0 bm 0
m n
(ui − vj )
i:=1 j:=1
Teiler von Res(f, g). Weil die λk in ui vom Grade 1 sind, ist Res(f, g) in ui vom Grade n. Entsprechend ist Res(f, g) in vj vom Grade m. Schließlich ist Res(f, g) Graden und in b0 vom Grade m. Daher unterscheiden sich Res(f, g) in a0 vom m n und an0 bm 0 i:=1 j:=1 (ui − vj ) nur um eine Einheit. Es bleibt die Einheit −1 auszuschließen. Die h¨ ochste Potenz von bn , die in Res(f, g) vorkommt, ist bm n und der Koeffizient m bei bn ist an0 . Nun ist n m mn = b (−1) vkm , bm n 0 bm n
so dass der Koeffizient bei in Damit ist der Satz bewiesen.
an0 bm 0
k:=1
m
n
i:=1
j:=1 (ui
− vj ) ebenfalls gleich an0 ist.
Der n¨ achste Satz findet sich cum grano salis ebenfalls in der großen Arbeit von Lagrange zwischen den Untersuchungen u ¨ber die Wurzeln der Gleichung dritten Grades. Das K¨ ornchen Salz bezieht sich darauf, dass die Leitkoeffizienten bei Lagrange gleich 1 sind und das Vorzeichen nur als ± angezeigt ist. Laut Lagrange findet sich diese Aussage schon in der Introduction a ` l’analyse des lignes courbes von Gabriel Cramer. Satz 4. Es sei R ein ggT-Bereich. Ferner seien F =
m
Ai xm−i
i:=0
und G=
n
Bi xn−i
i:=0
Polynome der Grade m bzw. nu ¨ber R. Gibt es eine Erweiterung S von R, so dass u ¨ber S die Gleichung F = A0 m i:=1 (x − Ui ) gilt, so ist Res(F, G) = An0
m
G(Ui ).
i:=1
Entsprechend gilt Res(F, G) = (−1)mn B0m
n i:=1
F (Vi ),
16
Kapitel VII. Resultanten
falls G u ¨ber der Erweiterung T von R vollst¨ andig in Linearfaktoren zerf¨ allt. Beweis. Bei diesem Beweise folgen wir den Ideen, die Gauß zur Definition der Diskriminante zweier Polynome f¨ uhrten. Der Grund hierf¨ ur ist wieder der, dass wir den Zerf¨ allungsk¨ orper eines Polynoms noch nicht zur Verf¨ ugung haben. Wir betrachten die schon fr¨ uher definierten Polynome f und g. Mittels Satz 3 folgt f¨ ur sie die G¨ ultigkeit der Gleichungen Res(f, g) =
an0
m
(−1)mn bm 0
g(ui ) =
i:=1
n
f (vi ).
i:=1
Die Koeffizienten von g sind bi = b0 (−1)i μn−i . Wir betrachten den Polynomring in den Unbestimmten β0 := b0 , β1 , . . . βn . Auf Grund des waringschen Satzes gibt es einen Isomorpismus σ von R[b0 , μ] auf R[β] mit β0σ = β0 und μσi = (−1)i βi . Setzt man n γ = β0 xn + β0 βi xn−i , i:=1
nimmt noch die Unbestimmte x zu den beiden Polynomringen hinzu und setzt σ fort durch die Vorschrift xσ = x, so gilt, dass g σ = γ ist. Setzt man σ weiter fort durch die Vorschrift uσi = ui , so sieht man die G¨ ultigkeit von Res(f, γ) = an0
m
γ(ui ).
i:=1
Weil G den Grad n hat, ist B0 = 0. In Q(R)[x] gilt daher G = B0
n Bi n−i x . B i:=0 0
Ersetzt man nun der Reihe nach β0 , β1 , . . . , βn , u1 , . . . , um , durch B0 , Bn B0 , U1 , . . . , Um , so folgt in der Tat Res(F, G) = An0
m
B1 B0 ,
...,
G(Ui ).
i:=1
Hieraus folgt wegen Res(F, G) = (−1)mn Res(G, F ) auch die zweite Aussage des Satzes. m Es sei weiterhin f = a0 i:=1 (x − ui ). Dann ist f = a0
m
(x − uj )
i:=1 j∈{1,...,m}−{i}
2. Resultanten
17
und folglich
f (uk ) = a0
(uk − uj ).
j∈{1,...,m}−{k}
Nach Satz 4 ist daher Res(f, f ) = am−1 0
m
f (uk ) = a2m−1 0
k:=1
(uj − uk ).
j, k∈{1,...,m}, j=k
Setze
Dis(f ) := a2m−2 0
(uj − uk )2 .
1≤j 0. Ist 0 ≤ k < min(m, n), so setzen wir Mk := mat(xn−k−1 f, xn−k−2 f, . . . , f, xm−k−1 g, xm−k−2 g, . . . , g).
4. Subresultanten
25
Ferner setzen wir SRk (f, g) := detpol(Mk ) und nennen SRk (f, g) die k-te Subresultante von f und g. Offenbar ist M0 die Sylvestermatrix von f und g und daher SR0 (f, g) = Res(f, g), womit wir endlich wieder bei unserem Ausgangsthema, den Resultanten sind. Man beachte, dass die Mk allesamt Untermatrizen von M0 sind. Das ist wichtig zu wissen, wenn es um die Absch¨ atzung der Gr¨ oße der Koeffizienten in Mk geht, was uns hier allerdings nicht interessieren wird. Satz 2. Es sei R ein Integrit¨ atsbereich und f , g, q, und r seien Polynome der Grade nf , ng , nq und nr u ¨ber R und alle diese Grade seien positiv. Ferner sei f = qg + r und nr < ng ≤ nf . Schließlich seien cg und cr die Leitkoeffizienten von g und r. Dann gilt: a) Ist 0 ≤ j < nr , so ist n −nr
SRj (f, g) = (−1)(nf −j)(ng −j) cg f
SRj (g, r).
b) Es ist n −nr ng −nr −1 cr r.
SRnr (f, g) = (−1)(nf −nr )(ng −nr ) cg f
c) Es ist SRj (f, g) = 0, falls nr < j < ng − 1 ist. d) Es ist n −ng +1
SRng −1 (f, g) = (−1)nf −ng +1 cg f
r.
Beweis. Es sei zun¨achst j ≤ ng − 1. Dann ist mit nicht korrekter, aber wohl doch unmissverst¨ andlicher Notation, SRj (f, g) = detpol(xng −j−1 f, . . . , f, xnf −j−1 g, . . . , g). Nun ist f = qg +r. Weil Determinanten von Matrizen mit linear abh¨ angigen Zeilen null sind und sich Determinanten beim Tausch zweier Zeilen mit −1 multiplizieren, folgt SRj (f, g) = detpol(xng −j−1 r, . . . , r, xnf −j−1 g, . . . , g) = (−1)(nf −j)(ng −j) detpol(xnf −j−1 g, . . . , g, xng −j−1 r, . . . , r). a) Es sei j < nr . Der Grad von xnf −j−1 g ist ng + nf − j − 1 und der von r ist nr + ng − j − 1. Es folgt, dass die ng − j letzten Zeilen von x ng −j−1
mat(xnf −j−1 g, . . . , g, xng −j−1 r, . . . , r)
26
Kapitel VII. Resultanten
mit nf − nr Nullen beginnen. Daher ist n −nr
SRj (f, g) = (−1)(nf −j)(ng −j) cg f
SRj (g, r).
b) Es ist SRnr (f, g) = (−1)(nf −nr )(ng −nr ) detpol(xnf −nr −1 g, . . . , g, xng −nr −1 r, . . . , r). Der Grad von xng −nr −1 g ist ng + nf − nr − 1 und der von xng −nr −1 r ist ng − 1. Hieraus folgt, dass (−1)(nf −nr )(ng −nr ) detpol(xnf −nr −1 g, . . . , g, xng −nr −1 r, . . . , r) eine obere Dreiecksmatrix ist mit nf − nr Eintr¨ agen cg auf der Hauptdiagonalen und ng −nr Eintr¨ agen cr , wobei der letzte dieser Eintr¨ age wieder in r verschwindet. Daher der Exponent ng − nr − 1. Also ist in der Tat n −nr ng −nr −1 cr r.
SRnr (f, g) = (−1)(nf −nr )(ng −nr −1) cg f
c) Es sei nr < j < ng − 1. Dann ist Grad(xnf −j−1 g) = ng + nf − j − 1 und Grad(xng −j−1 r) = nr − ng − j − 1. Die letzten ng − j ≥ 2 Zeilen beginnen mit nf − ng ≥ nf − j Nullen. Insgesamt besitzt mat(xnf −j−1 g, . . . , r) genau nf + ng − 2j Zeilen und nf + ng − j Spalten. Daher ist mat(xnf −j−1 g, . . . r)k,nf −j+1 = 0 f¨ ur k = nf − j + 1, . . . , nf + ng − 2j. Folglich ist SRj (f jg) = 0. d) Es ist SRng −1 (f, g) = detpol(f, xnf −ng g, . . . , g) = (−1)nf −ng +1 detpol(xnf −ng g, . . . , g, f ) = (−1)nf −ng +1 psR(f, g) nach Satz 1. Nun ist f = qg + r. Es folgt n −ng +1
cg f
n −ng +1
f = q ∗ g + cg f
r.
n −ng +1
Mit Satz 2 von Abschnitt 3 folgt psR(f, g) + cg f
r, q. e. d.
Ist nf < ng , so ist f = 0g + f . Der Beweis von a) zeigt, dass in diesem Falle SRj (f, g) = (−1)(nf −j)(ng −j) SRj (g, f )
4. Subresultanten
27
onnen wir uns bei der Berechnung von f¨ ur alle j := 1, . . . , nf − 1 gilt. Daher k¨ Subresultantenfolgen darauf beschr¨ anken, dass Grad(f ) ≥ Grad(g) ist. Satz 3. Es sei R ein Integrit¨ atsbereich und f1 , . . . , fk sei eine polynomiale Restesequenz u ¨ber R. Mit ci bezeichnen wir den Leitkoeffizienten und mit ni den Grad ur i := 1, . . . , k − 1. Schließlich von fi . Es sei n1 ≥ n2 . Wir setzen δi := ni − ni+1 f¨ seien αi und βi nach Satz 3 von Abschnitt 3 existierende Elemente von R∗ mit βi fi ≡ αi fi−2 mod fi−1 f¨ ur i := 3, . . . , k. Ist i ∈ {3, . . . , k}, so gilt: a) Es ist n
αi i−1
−j
SRj (fi−2 , fi−1 ) = (−1)(ni−2 −j)(ni−1 −j) βi i−1 n
−j δi−2 +δi−1 ci−1 SRj (fi−1 , fi )
f¨ ur j := 0, . . . , ni − 1. b) Es ist δ
δ
i−2 αi i−1 SRni (fi−2 , fi−1 ) = (−1)(δi−2 +δi−1 δi−1 ci−1
+δi−1 δi−1 −1 δi−1 ci βi f i .
c) Es ist SRj (fi−2 .fi−1 ) = 0 f¨ ur ni < j < ni−1 − 1. d) Es ist δ
i−2 αi SRni−1 −1 (fi−2 , fi−1 ) = (−1)δi−2 +1 ci−1
+1
βi f i .
Beweis. Nach Voraussetzung gibt es ein qi ∈ R[x] mit αi fi−2 = qi fi−1 + βi fi . Es ist Grad(αi fi−2 ) = ni−2 und Grad(βi fi ) = ni , da ja αi und βi nicht null sind. Setzt man in Satz 2 nun f := αi fi−2 , g := fi−1 und r = βi fi sowie nf := ni−2 , ng := ni−1 und nr := ni , so sind die Voraussetzungen dieses Satzes erf¨ ullt, so dass die Folgerungen a) bis d) gelten. Beachtet man schließlich noch die Gleichung SRj (aF, bG) = an−j bm−j SRj (F, G), wobei F , G ∈ R[x] und m = Grad(F ) sowie n = Grad(G) ist, so sieht man unmittelbar die G¨ ultigkeit von Satz 3. Nun sind wir in der Lage, den grundlegenden Satz u ¨ber den Zusammenhang von Subresultantenfolgen und polynomialen Restesequenzen zu beweisen (Brown und Traub 1971). Satz 4. Es sei R ein Integrit¨ atsbereich und f1 , . . . , fk sei eine polynomiale Restesequenz u ¨ber R mit Grad(f1 ) ≥ Grad(f2 ). Es sei ci der Leitkoeffizient und ni der Grad von fi . Ferner seien αi und βi nach Satz 3 von Abschnitt 3 existierende
28
Kapitel VII. Resultanten
ur i := 3, . . . , k. Setzt man noch Elemente aus R∗ mit αi fi−2 ≡ βi fi mod fi−1 f¨ δi := ni − ni+1 und i n −j Aij := αl l−1 l:=3
und Bij :=
i
n
βl l−1
−j δl−2 +δl−1 cl−1 (−1)(nl−2 −ni )(nl−1 −j) ,
l:=3
so gilt f¨ ur i := 3, . . . k: a) Es ist SRj (f1 , f2 ) = 0, falls 0 ≤ j < nk ist. b) Es ist δ
Ai,ni SRni (f1 , f2 ) = Bi,ni ci i−1
−1
fi .
c) Es ist 1−δ
Ai,ni−1 −1 SRni−1 −1 (f1 , f2 ) = Bi,ni−1 −1 ci−1 i−1 fi . Beweis. Mittels Induktion folgt aus Satz 2 a) die G¨ ultigkeit von (A)
Ai−1,j SR(j (f1 , f2 ) = Bi−1,j SRj (fi−2 , fi−1 )
ur i = k + 1. zumindest f¨ ur i := 3, . . . , k. Ist nk > 0, so gilt dies auch noch f¨ Ist nk = 0, so ist die erste Aussage von a) leer. Es sei also nk > 0. Dann ist ur j := 0, . . . , nk − 1. Nach Satz 3 c) von Abschnitt SRj (f1 , f2 ) ∼ SRj (fk−1 , fk ) f¨ 3 gibt es ein α ∈ R∗ , so dass fk Teiler von αfk−1 ist. Es folgt SRj (fk−1 , fk ) = 0, f¨ ur j := 0, . . . , nk − 1. Damit ist die erste Aussage von a) bewiesen. Es sei 3 ≤ i ≤ k. Ist ni < j < ni−1 − 1, so ist SRj (fi−2 , fi−1 ) = 0 nach Satz 2 c), so dass wegen SRj (f1 , f2 ) ∼ SRj (fi−2 , fi−1 ) die Aussage a) vollst¨andig bewiesen ist. Ist j = ni , so ist nach Satz 2 b) δ
δ
i−2 αi i−1 SRni (fi−2 , fi−1 ) = (−1)(δi−1 +δi−1 )δi−1 ci−1
+δi−1 δi−1 −1 δi−1 ci βi f i .
δ
Multipliziert man nun die Gleichung (A) mit αi i−1 , so folgt die Aussage b). Nach Satz 2 d) ist δ
i−1 αi SRni−1 −1 (f1 , f2 ) = (−1)δi−2 +1 ci−1
n
−(n
+1
βi f i .
−1)
Wegen αi = αi i−1 i−1 gilt daher auch c). Damit ist alles bewiesen. Satz 2 von Abschnitt 3 ist ein Korollar zu dem gerade bewiesenen Satz. Um dies zu zeigen, seien f und g zwei Polynome positiven Grades u ¨ ber dem ggT-Bereich
5. Algorithmen
29
R. Wir d¨ urfen Grad(f ) ≥ Grad(g) annehmen. Es sei f1 = f , f2 = g, f3 , . . . , fk eine polynomiale Restesequenz und ni sei wieder der Grad von fi . Dann ist Grad(ggT(f, g)) = nk . Ist nk ≥ 1, so ist Res(f, g) = SR0 (f, g) = 0 nach Satz 4 a). Ist umgekehrt Res(f, g) = 0, so folgt aus SRnk (f, g) ∼ fk , dass nk ≥ 1 ist. Folglich haben f und g einen nicht trivialen Faktor. Zum Schluss dieses Abschnitts machen wir noch eine wichtige Bemerkung, die man schon gleich nach der Definition von SRj (f, g) h¨ atte machen k¨ onnen. Es ist SRj (f, g) gleich der Determinante der Matrix ⎛
f0
⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ g0 ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝
. . . . . . fm ... ... ... f0 . . . f0
... ... ... ... g0
... ... ... g0
... ... ... ... ... ... ... f0 gn ... ... ... ... ... ... ... g0
... fm ... fm−1 ... ... . . . fm−j−1
... ... ... ...
gn gn−1 ... gn−j−1
⎞ xn−j−1 f . ⎟ ⎟ . ⎟ ⎟ . ⎟ ⎟ . ⎟ ⎟ f ⎟ ⎟, xm−j−1 g ⎟ ⎟ . ⎟ ⎟ . ⎟ ⎟ . ⎟ ⎠ . g
wie man sieht, wenn man die Additivit¨at der Determinantenfunktion bez¨ uglich der letzten Spalte benutzt. Entwickelt man nun nach der letzten Spalte, so erh¨ alt man: Satz 5. Es sei R ein Integrit¨ atsbereich und f und g seien Polynome positiven Grades u ¨ber R. Es gibt dann Polynome uj und vj u ¨ber R mit Grad(uj ) ≤ Grad(g)− j − 1 und Grad(vj ) ≤ Grad(f ) − j − 1, so dass SRj (f, g) = uj f + vj g ist. Da besonders wichtig, sei der Fall der Resultanten gesondert hervorgehoben. Korollar. Die Voraussetzungen seien wie in Satz 5. Es gibt dann Polynome u und v u ¨ber R mit Grad(u) ≤ Grad(g) − 1 und Grad(v) ≤ Grad(f ) − 1, so dass Res(f, g) = uf + vg ist. Dass sich Res(f, g) linear aus f und g kombinieren l¨ asst, scheint der Grund daf¨ ur zu sein, dass die nicht von allen ggT-Bereichen erf¨ ullte Eigenschaft, dass sich der ggT zweier Elemente stets linear kombinieren l¨ asst, nach B´ezout benannt wird. Um hier Klarheit zu bekommen, m¨ usste man u. A. die zu Beginn von Abschnitt 2 zitierte Arbeit von B´ezout konsultieren. 5. Algorithmen. Was haben wir mit den Formeln des letzten Abschnitts gewonnen? Eine ganz Menge, wie wir jetzt sehen werden. Dazu schreiben wir die Formeln
30
Kapitel VII. Resultanten
ein wenig um. Wir setzen σi :=
i
(nl−2 − ni−1 + 1)(nl−1 − ni−1 + 1)
l:=3
τi :=
i
(nl−2 − ni )(nl−1 − ni )
l:=3
n −n +1 i βl l−1 i−1
1−δ
γi := (−1)σi ci−1 i−1
l:=3
ϑi :=
δ −1 (−1)τi ci i−1
αl
n −n i βl l−1 i
l:=3
αl
δ
l−2 cl−1
δ
l−2 cl−1
+δl−1
+δl−1
.
orper von R und es gilt: Dann liegen γi und ϑi im Quotientenk¨ A) Es ist SRj (f1 , f2 ) = 0 f¨ ur 0 ≤ j < nk und ni < j < ni−1 − 1 f¨ ur i := 3, . . . , k. ur i := 3, . . . , k. B) Es ist SRni (f1 , f2 ) = ϑi fi f¨ C) Es ist SRni−1 −1 (f1 , f2 ) = γi fi f¨ ur i := 3, . . . , k. Ferner beachten wir, dass auf Grund von Satz 4c) von Abschnitt 4 die Polynome g1 := f1 , g2 := f2 , g3 := SRn2 −1 (f1 , f2 ), . . . , gk := SRnk−1 −1 (f1 , f2 ) eine polynomiale Restesequenz bilden. Nimmt man die gi an Stelle der fi , so ist ¨ beraus einfach zu γ3 = . . . = γk = 1 in C). Es stellt sich heraus, dass die gi u berechnen sind und dass man dabei die ϑi v¨ ollig unter Kontrolle beh¨ alt. Wir beginnen mit einigen Hilfss¨ atzen, wobei wir uns an die Notation von Satz 4 von Abschnitt 4 sowie die soeben eingef¨ uhrten Bezeichnungen halten. Hilfssatz 1. Es ist i a) σi+1 − σi ≡ δi−1 + 1 + l:=3 (δl−2 + 1)δi−1 mod 2. i+1 b) τi − σi+1 ≡ l:=3 (δl−2 + 1) mod 2. c) τi − τi+1 ≡ il:=3 (δl−2 + 1)δi−1 mod 2. Dies folgt mittels einfacher Rechnungen aus der Definition der τi und σi . Hilfssatz 2. Es ist
i+1 ϑi ci αl −1 = ci . γi+1 (−1)δl−1 +1 βl l:=3
f¨ ur i := 3, . . . , k − 1. Dies folgt unter Benutzung von Hilfssatz 1 b) aus der Definition von ϑi und γi+1 i+1 αl Setze hi := c−1 ur i := 2, . . . , k − 1. Dann ist also i l:=3 (−1)δl−1 +1 β f¨ l
hi =
ϑi ci γi+1
5. Algorithmen
31
f¨ ur i := 3, . . . , k − 1. Aus der Definition der hi folgt Hilfssatz 3. Es ist hi+1 =
ci hi αi+2 (−1)δi +1 ci+1 βi+2
f¨ ur i := 2, . . . , k − 2. Weiter gilt Hilfssatz 4. Es ist
1+δ
(−1)δi−1 +1 ci i−1 βi+1 γi+1 = δi−1 γi ci−1 hi−1 αi+1 f¨ ur i := 3, . . . , k − 1. Dies folgt mittels einfacher Rechnungen unter Benutzung von Hilfssatz 1 a). Satz 1. Es sei R ein Integrit¨ atsbereich und f und g seien Polynome u ¨ber R mit Grad(f ) ≥ Grad(g) > 0. Ferner sei Q der Quotientenk¨ orper von R. Wir definieren eine polynomiale Restesequenz g1 := f , g2 := g, g3 , . . . , gk in Q[x] wie folgt, wobei ni wieder den Grad und ci den Leitkoeffizienten von gi bezeichne und δi = ni −ni+1 sei. Wir setzen g3 := (−1)δ1 +1 psR(g1 , g2 ) und δi−2 +1
gi := (−1)
psR gi−2 ,
gi−1 δ
i−2 ci−2 Hi−2
δ
1−δ
f¨ ur i := 4, . . . , k. Dabei ist H2 := cδ21 und Hi := ci i−1 Hi−1 i−1 f¨ ur i := 3, . . . , k. Dann ist SRni−1 −1 (f, g) = gi f¨ ur i := 3, . . . , k und Hi ist der Leitkoeffizient von SRni (f, g). Beweis. Wie wir wissen, gibt es αi , βi ∈ Q∗ mit αi gi−2 ≡ βi gi mod gi−1 f¨ ur i := 3, . . . , k. Andererseits ist auf Grund der Definition des Pseudorestes δ
i−2 ci−1
+1
gi−2 ≡ psR(gi−2 , gi−1 ) mod gi−1 .
Da es f¨ ur die G¨ ultigkeit unserer Formeln keine Rolle spielt, welche αi und βi wir w¨ahlen, setzen wir δi−2 +1 αi := ci−1 . Dann folgt aus obigen Gleichungen βi gi = psR(gi−2 , gi−1 ),
32
Kapitel VII. Resultanten
da die Grade dieser beiden Polynome gleich ni < ni−1 sind. Folglich ist β3 = (−1)δ1 +1 und δi−2 βi = (−1)δi−2 +1 ci−2 Hi−2 f¨ ur i := 4, . . . , k. Es ist h2 =
c−1 δ1 +1 2 α3 = c−1 = cδ21 = H2 . 2 c2 (−1)δ1 +1 β3
Es sei 2 ≤ i < k − 1 und es gelte hi = Hi . Mit Hilfssatz 3 folgt dann hi+1 =
δi +1 c−1 c−1 i+1 ci Hi αi+2 i+1 ci Hi ci+1 i = = cδi+1 Hi1−δi = Hi+1 (−1)δi +1 βi+2 ci Hiδi
Also gilt hi = Hi f¨ ur i := 2, . . . , k − 1. Es ist 2 1 δ1 +δ2 (−1)δ1 +1 c−1−δ c2 γ3 = (−1)σ3 c1−δ 2 2 = (−1)(n1 −n2 +1)(n2 −n2 +1) (−1)δ1 +1 = 1. Es sei 3 ≤ i < k und es gelte γi = 1. Mit Hilfssatz 4 folgt dann 1+δ
γi+1 =
δ
1+δ i−1 ci i−1 ci−1 Hi−1 γi+1 (−1)δi−1 +1 ci i−1 βi+1 = = = 1. δi−1 δi−1 1+δi−1 γi ci−1 Hi−1 αi+1 ci−1 Hi−1 ci
Also ist γ3 = . . . = γk = 1 und folglich SRni−1 −1 (f, g) = gi f¨ ur i := 3, . . . , k. Nun ist SRni (f, g) = ϑi gi f¨ ur i := 3, . . . , k, so dass ϑi ci der Leitkoeffizient von ur i := 3, . . . k − 1 gilt aber SRni (f, g) ist. F¨ ϑi ci =
ϑi ci = h i = Hi , γi+1
so dass Hi in diesen F¨allen der Leitkoeffizient von SRni ist. Mit Hilfssatz 5 folgt weiter δ i c k−1 ϑk ck ϑk ck = = kδk−1 . Hk−1 ϑk−1 ck−1 H k−1
Folglich ist δ
1−δk−1 ϑk ck = ckk−1 Hk−1 = Hk .
Damit ist alles bewiesen. Einige der Aussagen von Satz 1 wollen wir nun noch expressis verbis formulieren. Korollar. Die Voraussetzungen und Bezeichnungen seien wie in Satz 1. Dann gilt: a) Es ist gi ∈ R[x] f¨ ur i := 1, . . . , k.
6. Der laplacesche Entwicklungssatz
33
ur i := 2, . . . , k. b) Es ist Hi ∈ R f¨ Hi gi c) Es ist ci = SRni (f, g) ∈ R[x] f¨ ur i := 3, . . . , k. d) Ist nk > 0, so ist Res(f, g) = 0. Ist nk = 0, so ist Res(f, g) = Hk . Satz 1 l¨ asst sich leicht zu einem Schema von Algorithmen umformulieren, so dass der Titel Algorithmen“ dieses Abschnitts gerechtfertigt ist. ” Da die Koeffizienten von SRni−1 −1 (f, g) und SRni (f, g) allesamt Unterdeterminanten der Sylvestermatrix von f und g sind, hat man im Falle R = Z das Wachstum der Koeffizienten der gi verm¨oge der hadamardschen Ungleichung im Griff. F¨ ur Einzelheiten sei der Leser an L¨ uneburg 1987a verwiesen. 6. Der laplacesche Entwicklungssatz. Untersucht man die Resultante zweier Polynome und ihre Darstellung als Determinate ihrer Sylvestermatrix, so ist es gelegentlich von Nutzen, sich des laplaceschen Entwicklungssatzes zu bedienen (Kap. 8, Absch. 5). Schaut man sich aktuelle Lehrb¨ ucher der linearen Algebra an, so scheint dieser Entwicklungssatz nicht mehr zum Standardstoff zu geh¨ oren. Er sei also hier zum Abschluss dieses Kapitels noch formuliert und bewiesen. Wir zerlegen die Menge {1, . . . , n} in zwei disjunkte Teilmengen {i1 , . . . , ip } und {k1 , . . . , kq }. Ihre Elemente seien so numeriert, dass i 1 < i2 < . . . < ip und k1 < k2 < . . . < kq gilt. Ist Sn die symmetrische Gruppe vom Grad n, so bezeichne Γ die Menge aller γ ∈ Sn mit γ(i1 ) < γ(i2 ) < . . . < γ(ip ) und γ(k1 ) < γ(k2 ) < . . . < γ(kq ). Schließlich sei Πγ die Menge aller α ∈ Sn , f¨ ur die αγ(kj ) = γ(kj ) f¨ ur j := 1, . . . , q, und Π∗γ die Menge aller β ∈ Sn , f¨ ur diei βγ(il ) = γ(il ) f¨ ur l := 1, . . . , p ist. Dann gilt Satz 1. Ist π ∈ Sn , so gibt es genau ein γ ∈ Γ, genau ein α ∈ Πγ und genau ein ¨ β ∈ Π∗γ mit π = αβγ. Uberdies gilt αβ = βα. Beweis. Wir zeigen zun¨achst die Existenz der Zerlegung. Es ist klar, dass die Mengen {π(i1 ), . . . , π(ip )} und {π(k1 ), . . . , π(kq )} disjunkt sind. Es gibt daher Elemente α, β ∈ Sn , so dass α die Elemente π(ks ) und β die Elemente π(ir ) einzeln fest l¨asst und dass dar¨ uber hinaus α−1 π(i1 ) < α−1 π(i2 ) < . . . < α−1 π(ip ) und
β −1 π(k1 ) < β −1 π(k2 ) < . . . < β −1 π(kq )
34
Kapitel VII. Resultanten
gilt. Setzt man γ := β −1 α−1 π, so folgt γ ∈ Γ, α ∈ Πγ und β ∈ Π∗γ , wie leicht nachzurechnen ist. Hieraus folgt die Existenz der Zerlegung. Die hier konstruierten α und β sind vertauschbar. Es gibt genau np Teilmengen der L¨ange p und damit genau np Zerlegungen der betrachteten Art von {1, . . . , n}. Zu zwei solchen Zerlegungen gibt es genau ein Element in Γ, welches die erste Zerlegung auf die zweite abbildet. Daher ist |Γ| = np . Die Mengen Πγ und Π∗γ sind Untergruppen von Sn , die zu Sp bzw. Sq isomorph sind. Es gibt daher h¨ ochstens n p!q! = n! p Elemente in Sn , die sich als αβγ darstellen lassen. Hieraus folgt zusammen mit der Existenzaussage auch die Einzigkeit der Darstellung. Satz 2. Es sei γ ∈ Γ. Dann ist sgn(γ) = (−1)i1 +...+ip +γ(i1 )+...+γ(ip ) = (−1)k1 +...+kq +γ(k1 )+...+γ(kq ) . Beweis. Es ist i1 + . . . + ip + k1 + . . . + kq = 1 + ... + n = γ(i1 ) + . . . + γ(ip ) + γ(k1 ) + . . . + γ(kq ). Daher haben i1 + . . . + ip + γ(i1 ) + . . . + γ(ip ) und k1 + . . . + kq + γ(k1 ) + . . . + γ(kq ) die gleiche Parit¨at, so dass wir nur eine der Gleichungen beweisen m¨ ussen. Weil ip = n oder kq = n ist, k¨onnen wir durch Umbenennung erreichen, dass ip = n ist, um dann die erste Gleichung zu beweisen. Wir machen Induktion nach n. Ist n = 1, so ist γ die Identit¨ at und (−1)i1 +i1 = 1 = sgn(γ). Es sei n > 1 und der Satz gelte f¨ ur n − 1 und alle p und q mit p + q = n − 1. 1. Fall. Es sei γ(ip ) = n. Dann ist {1, . . . , n − 1} = {i1 , . . . , ip−1 } ∪ {k1 , . . . , kq } = {γ(i1 ), . . . , γ(ip−1 } ∪ {γ(k1 ), . . . , γ(kq )} und wir k¨ onnen die Induktionsannahme benutzen, da die Einschr¨ ankung γ ∗ von γ auf {1, . . . , n − 1} die Voraussetzungen des Satzes erf¨ ullt. Weil sgn(γ) = sgn(γ ∗ ) ist, folgt, wenn man noch γ(ip ) = ip ber¨ ucksichtigt, sgn(γ) = (−1)i1 +...+ip−1 +γ(i1 )+...+γ(ip−1 ) = (−1)i1 +...+ip−1 +γ(i1 )+...+γ(ip−1 )+2ip = (−1)i1 +...+ip−1 +ip +γ(i1 )+...+γ(ip−1 )+γ(ip ) .
6. Der laplacesche Entwicklungssatz
35
2. Fall. Es sei γ(ip ) < n. Wir setzen j := γ(ip ) und betrachten die Abbildung δ, die j nach j + 1 und j + 1 nach j + 2, usw., und schließlich n − 1 nach n und dann n nach j abbildet und alle u ¨brigen Ziffern fest l¨ asst. Diese Abbildung hat n − 1 − (j − 1) = n − j Inversionen, so dass sgn(δ) = (−1)n−j = (−1)n+j = (−1)ip +γ(ip ) ist. Wir zeigen, dass δ −1 γ ∈ Γ gilt und n festl¨asst. Letzteres folgt sofort aus der Konstruktion von δ. Es gilt γ(i1 ) < γ(i2 ) < . . . < γ(ip−1 ) < γ(ip ) = j. Weil δ alle Ziffern unterhalb j fest l¨asst und δ −1 (j) = n ist, folgt δ −1 γ(i1 ) < . . . < δ −1 γ(ip−1 ) < n = δ −1 γ(ip ). Es ist γ(kl ) = j f¨ ur l := 1, . . . , q. Es gibt also ein r mit γ(kr ) < j < γ(kr+1 ). Es folgt δ −1 γ(kl ) = γ(kl ) f¨ ur l ≤ r und δ −1 γ(kl ) = γ(kl ) + 1 f¨ ur r < l. Also gilt auch δ −1 γ(k1 ) < . . . < δ −1 γ(kq ). Damit ist gezeigt, dass δ −1 γ ∈ Γ ist. Wegen n = ip = δ −1 γ(ip ) folgt nach Fall 1, wenn man noch ber¨ ucksichtigt, dass f¨ ur s < p auch δ −1 γ(is ) = γ(is ) ist, sgn(δ −1 γ = (−1)i1 +...+ip +δ
−1
γ(i1 )+...+δ −1 γ(ip )
= (−1)i1 +...+ip−1 +γ(i1 )+...+γ(ip−1 ) . Somit ist
sgn(γ) = sgn(δδ −1 γ) = sgn(δ)sgn(δ −1 γ) = (−1)ip +γ(ip ) (−1)i1 +...ip−1 +γ(i1 )+...+γ(ip−1 ) ,
was zu beweisen war. Nun haben wir alles beisammen, den Entwicklungssatz von Laplace zu formulieren und zu beweisen. Entwicklungssatz von Laplace. Es sei A eine (n × n)-Matrix. Es gelte {1, . . . , n} = {i1 , . . . , ip } ∪ {k1 , . . . , kq }
36
Kapitel VII. Resultanten
mit p + q = n, wobei i und k wie zuvor monoton wachsen. Ferner haben Γ, Πγ und Π∗γ f¨ ur γ ∈ Γ die gleiche Bedeutung, wie zu Beginn dieses Abschnitts. Ist dann Aγ die Einschr¨ ankung von A auf {i1 , . . . , ip } × γ(i1 ), . . . , γ(ip ) ankung von A auf und A∗γ die Einschr¨ {k1 , . . . , kp } × γ(k1 ), . . . , γ(kq ) , so ist
det(A) =
sgn(γ)det(Aγ )det(A∗γ ).
γ∈Γ
Beweis. Es ist det(A) =
σ∈Sn
=
sgn(σ)
n
Ai,σ(i)
i:=1
sgn(αβγ)
γ∈Γ β∈Π∗ γ α∈Πγ
=
γ∈Γ β∈Π∗ γ α∈Πγ
=
p
Air ,αβγ(ir )
r:=1
sgn(αβγ)
p r:=1
q
Aks ,αβγ(ks )
s:=1
Air ,αγ(ir )
q
Aks ,βγ(ks )
s:=1
sgn(γ)det(Aγ )det(A∗γ ).
γ∈Γ
Dabei ist zu beachten, dass α und β miteinander vertauschbar sind, dass α die γ(ks ) und dass β die γ(ir ) fest l¨asst.
VIII. Lagrange 1. Einheitswurzeln. Wir sind nun ger¨ ustet, uns Lagrangens großer Arbeit R´eflexions sur la r´esolution alg´ebrique des ´equations zuzuwenden. Was Lagrange in ihr zu den Einheitswurzeln sagt, stelle ich hier an den Anfang der Erz¨ ahlung, um die sp¨ ateren Untersuchungen nicht zu unterbrechen. Wenn es um die Existenz von Einheitswurzeln geht, so fallen uns drei M¨ oglichkeiten ihres Nachweises ein. Da ist einmal die M¨oglichkeit, sich auf den Zerf¨ allungsk¨ orper des Polynoms xn − 1 zu berufen, oder aber auszunutzen, dass C algebraisch abgeschlossen ist. Die dritte M¨oglichkeit ist die, von der Analysis zu lernen, dass 2π cos 2π n + i sin n
eine n-te Einheitswurzel ist, von der sogar alle u ¨ brigen n-ten Einheitswurzeln Potenzen sind. Die Sache, die wir heute Zerf¨ allungsk¨ orper nennen, war zu Lagrangens Zeiten noch nicht bekannt. Um den Fundamentalsatz der Algebra rang auch Lagrange, wie wir im sechsten Kapitel gesehen haben, doch um die n-ten Einheitswurzeln zu konstruieren, beruft er sich auf Analysis und Geometrie. Er bringt, was er zu diesem Thema zu sagen hat, zwischen den Untersuchungen u ¨ ber die Gleichungen dritten und denen vierten Grades. Das mag der Grund sein, dass sich bis heute die Behauptung h¨ alt, Gauß sei der Erste gewesen, der die Existenz von primitiven n-ten Einheitswurzeln bewiesen h¨ atte (Lebesgue 1955, S. 215/216, van der Waerden 1985, S. 78). Lagrangens Untersuchungen der Gleichungen dritten und vierten Grades dienen der Zusammenfassung des Bekannten und der Motivierung des Weiteren, so dass sie der eilige Historiker wohl u ¨ berspringt, um gleich zu den Untersuchungen u ¨ber die allgemeine Gleichung zu kommen, wobei ihm aber Wesentliches durch die Lappen geht. Da Lagrangens Zugang zu den n-ten Einheitswurzeln sich von den Zug¨angen unterscheidet, die wir nehmen, sei sein Weg hier nachvollzogen. Ihn nachzugehen, lohnt sich, weil wir Neues dabei lernen. Zun¨ achst sei vermerkt, dass Lagrange kein eigenes Wort f¨ ur Einheitswurzel hat. Er spricht immer von den Wurzeln der Gleichung xn −1 = 0. Die Wurzel, die immer vorkommt, ist 1, so dass man xn − 1 durch x − 1 dividieren kann. Im Falle n = 3 erh¨alt er die Gleichung x2 + x + 1 = 0
38
Kapitel VIII. Lagrange
mit den beiden Wurzeln α= und
√ −1 + −3 2
√ −1 − −3 . β= 2
Diese dritten Einheitswurzeln hat er schon zuvor bei der Untersuchung der Gleichungen dritten Grades benutzt. Dann geht er zur Gleichung xn − 1 = 0 u ¨ ber. Er beobachtet zun¨ achst, was wir im n¨achsten Satz formulieren. Satz 1. Es seien n, p, q ∈ N und es gelte n = pq. Es seien α1 , . . . , αp lauter verschiedene p-te und τ1 , . . . , τq lauter verschiedene q-te Einheitswurzeln. Ferner seien β1 , . . . , βp Nullstellen der p Polynome xq − α1 , . . . , xq − αp . Dann sind τk βi mit k := 1, . . . , q und i := 1, . . . , p s¨ amtliche n-ten Einheitswurzeln. Beweis. Es ist (τk βi )n = (τkq )p (βiq )p = 1p αpi = 1, so dass τk βi eine n-te Einheitswurzel ist. Es sei τk βi = τl βj . Dann ist αi = τkq βiq = (τk βi )q = (τl βj )q = τlq βjq = αj . Hieraus folgt i = j und damit τk = τl . Dies hat wiederum k = l zur Folge. Da xn − 1 nicht mehr als n = pq Nullstellen haben kann, ist der Satz bewiesen. Lagrange sagt nichts dazu, wie man die βi findet, und wir haben in Abschnitt 2 von Kapitel 6 gesehen, dass das nicht so ohne ist. Unterstellt man aber, dass andlich zu sein —, man die βi finden kann — und Lagrange scheint das selbstverst¨ so hat man die Bestimmung der n-ten Einheitswurzeln auf die Bestimmung s-ter Einheitwurzeln zur¨ uckgef¨ uhrt, wobei s Primzahl ist. Was hier nach heutigem Verst¨ andnis passiert, ist das Folgende. Es ist U := {τ1 , . . . , τq } eine Untergruppe der multiplikativen Gruppe von C, die Gruppe der q-ten Einheitswurzeln. Bezeichnet V die Gruppe der n-ten Einheitswurzeln, so ist U eine Untergruppe von V und β1 , . . . , βp ist ein Vertretersystem von V /U . Es kommt jetzt also darauf an, die Wurzeln des Polynoms xn − 1 zu bestimmen, wobei n eine Primzahl ist. Ist n = 2, so ist das nat¨ urlich einfach. Es sei also n = 2p + 1 eine ungerade Primzahl, wobei es f¨ ur die n¨ achsten Betrachtungen nicht darauf ankommt, dass n eine Primzahl sei. Dass n ungerade ist, ist zun¨ achst wichtig. Dann ist 2p 2p+1 − 1 = (x − 1) xi . x i:=0
1. Einheitswurzeln
39
Die Nullstellen, deren Existenz in Frage stehen, sind die Nullstellen von f :=
2p
xi .
i:=0
Es folgt
p 1 f = xp 1 + xi + i . x i:=1
Ist α eine Nullstelle von f , so ist α = 0 und daher 0=1+
p 1 αi + i . α i:=1
Das deutet darauf hin, dass man Ausdr¨ ucke der Form xi + x1i untersuchen muss. Das tut Lagrange, wobei er sich der P¨ unktcheninduktion bedient, so dass der Leser einiges zu r¨atseln hat. Hier ist in heutiger Sprache, was Lagrange herausfindet. Die Korollare und die Notation f¨ ur die Binomialkoeffizienten finden sich nicht bei Lagrange. Seine Binomialkoeffizienten sind immer mittels Punkte angedeutet. Satz 2. Es sei x eine Unbestimmte u ¨ber Q. Setzt man y := x +
1 x
und k := n , so ist xn +
k 1 n in n − i − 1 = y + (−1) y n−2i . xn i i − 1 i:=1
Ferner gilt
n n−i−1 ∈ N. i i−1
Beweis. Wir setzen xn +
Es ist x +
1 x
k 1 = (−1)i an,i y n−2i . xn i:=0
= y. Ferner ist y2 =
2 1 1 x+ = x2 + 2 + 2. x x
40
Kapitel VIII. Lagrange
Es folgt, dass die Behauptung f¨ ur n = 1 und n = 2 korrekt ist. Es sei n ≥ 2 und die Behauptung gelte f¨ ur alle k ≤ n. Dann ist 1 1 1 x+ xn + n y = xn + n x x x 1 1 = xn+1 + n+1 + xn−1 + n−1 . x x Hieraus folgt, setzt man noch l := n − 1 , dass xn+1 +
1
=
xn+1
k
(−1)i an,i y n+1−2i −
i:=0
l
(−1)i an−1,i y n−1−2i
i:=0
ist. Hieraus folgt zun¨ achst an+1,0 = an,0 = 1. Ferner folgt, da ja k − 1 ≤ l ≤ k ist, xn+1 +
1 xn+1
= yn +
k
(−1)i an,i y n+1−2i −
i:=1
= y n+1 +
l
(−1)i an−1,i y n−1−2i
i:=0
k−1
(−1)i+1 an,i+1 y n+1−2(i+1) −
i:=0
= y n+1 +
k−1
l
(−1)i an−1,i y n−1−2i
i:=0
(−1)i+1 (an,i+1 + an−1,i )y n−1−2i
i:=0
+
l
(−1)j an−1,j y n−1−2j .
j:=k
Hieraus folgt weiter xn+1 +
1 xn+1
= y n+1 +
k
(−1)i (an,i + an−1,i−1 )y n+1−2i
i:=1
+
l
(−1)j an−1,j y n−1−2j .
j:=k
Hieraus folgt einmal, dass auch xn+1 +
1 xn+1
=
m
(−1)i an+1,i y n+1−2i
i:=0
ist, falls m = n+1 ur i := 1, . . . , k die Rekursionsgleichung 2 ist, und dass f¨ an+1,i = an,i + an−1,i−1
1. Einheitswurzeln
41
gilt. Wir unterscheiden nun zwei F¨ alle. 1. Fall: Es ist n = 2k. Dann ist k = n + 1 und l = 2k − 1 = k − 1. In diesem Falle ist die zweite Summe in der letzten Formel leer, so dass wir bereits alle Relationen kennen. 2. Fall: Es ist n = 2k + 1. Dann ist l = k und m = k + 1. Es folgt l
(−1)j an−1,j y n−1−2j = an−1,k .
j:=k
Andererseits ist n + 1 − 2(k + 1) = 0, so dass an+1,k+1 = an−1,k ist. Hieraus folgt mit Induktion, dass a2k,k = 2 ist f¨ ur alle k ∈ N. ur alle in Frage kommenden i. In beiden F¨ allen folgt an,i ∈ N f¨ Wir haben noch nachzuweisen, dass n n−i−1 an,i = i i−1 ist f¨ ur i := 1, . . . , k = n2 . Es sei zun¨achst n = 2k. Dann ist 2k 2k − k − 1 = 2 = an,k . k k−1 Daher gilt die Aussage in diesem Falle. Es sei i = 1. Dann ist 2 2−1−1 a2,1 = 2 = . 1 1−1 Es folgt an,1
n n−1−1 = an−1,1 + 1 = n − 1 + 1 = . 1 1−1
Es sei schließlich 1 < i und 2i < n. Dann ist n−1 n−i−2 n−2 n−i−2 an,i = an−1,i + an−2,i−1 = + . i i−1 i−1 i−2 n−2 n−i−2 n−2 n−i−2 = . i−1 i−2 n − 2i i−1
Nun ist
Schließlich ist
und
n−2 n(n − i − 1) n−1 + = i n − 2i i(n − 2i)
n(n − i − 1) n − i − 2 (n − i − 1)(n − i − 2)! n = · i(n − 2i) i−1 i (n − 2i)(i − 1)!(n − 2i − 1)! n n−i−1 = i i−1
42
Kapitel VIII. Lagrange
Also ist in der Tat an,i =
n n−i−1 i i−1
f¨ ur i := 1, . . . , n2 .
Weil die an,i nat¨ urliche Zahlen sind, gelten die Aussagen von Satz 2 auch u ¨ ber beliebigen K¨ orpern. Das erste der folgenden Korollare war der Ausgangspunkt des Beweises von Satz 2. ur Korollar 1. Es seien an,i die im Beweis von Satz 2 definierten Koeffizienten. F¨ n ∈ N und k := n2 , setzen wir Hn := y n +
k
an,i y n−2i .
i:=1
Dann ist H1 = y, H2 = y 2 − 2 und Hn+1 = Hn y − Hn−1 f¨ ur n ≥ 2. Das n¨achste Korollar ist die Interpretation der Aussage von Korollar 1 mit Hilfe der Koeffizienten der Polynome Hn . Korollar 2. Es sei k = n2 . F¨ ur die Koeffizienten an,i gilt dann: a) Es ist an,0 = 1 f¨ ur alle n ∈ N. b) Es ist an,1 = n f¨ ur alle n ∈ N − {1}. c) Es ist an+1,i = an,i + an−1,i−1 f¨ ur alle n ∈ N und alle i := 1, . . . , k. d) Ist n = 2k, so ist an,k = 2. aß Korollar 2 so aus: Der Anfang der Tabelle der an,i sieht dann gem¨ 1 2 3 4 5 6 7 8
: : : : : : : :
1 1 1 1 1 1 1 1
2 3 4 2 5 5 6 9 2 7 14 7 8 20 16 2
Blickt man einen Augenblick auf diese Tabelle, so sieht man auch die G¨ ultigkeit des folgenden Korollars. ur alle k ∈ N. Korollar 3. Es ist a2k+1,1 = a2k+1,k = 2k + 1 f¨ Beweis. Dies ist richtig f¨ ur k = 1. Es sei k ≥ 1. Dann ist a2k+3,k+1 = a2k+2,k+1 + a2k+1,k = 2 + a2k+1,1 = 2 + 2k + 1 = a2k+3,1 .
1. Einheitswurzeln
43
Damit ist alles bewiesen. Korollar 4. Ist wiederum f =
2p i:=0
xi , so ist
p 1 Hi x + f =x 1+ . x i:=1 p
Dies folgt unmittelbar aus Satz 2. Sind nun α1 , . . . , αp die Nullstellen von 1+
p
Hi
i:=1
und βi,1 , βi,2 die Nullstellen von x2 − αi x + 1, so ist αi = βi,1 + und folglich f (βi,j ) =
p βi,j
1 1 = βi,2 + βi,1 βi,2
p 1+ Hk (αi ) = 0. k:=1
Also sind die βi,1 , βi,2 die 2p von 1 verschiedenen (2p + 1)-sten Einheitswurzeln. Es gilt also auch das folgende Korollar. p Korollar. 5 Sind α1 , . . . , αp die Nullstellen von 1 + i:=1 Hi , so ist x2p+1 − 1 = (x − 1)
p
(x2 − αi x + 1).
i:=1
Diese Formulierung dieses Ergebnisses findet sich bei Vandermonde, wenn auch ohne Beweis (Vandermonde 1774, Artikel VI, S. 375). Aus seinem Text geht nicht hervor, ob er das Resultat als bekannt ansieht. Vorgetragen hat er die Ergebnisse seiner Arbeit schon im November des Jahres 1770 vor der Acad´emie royale des Sciences, also in dem Jahr, als Lagrange seine Ergebnisse publizierte, die wir hier gerade vortragen. Auf die vandermondesche Arbeit werden wir in Kapitel 12 zur¨ uckkommen. Da wir Gleichungen zweiten und dritten Grades l¨ osen k¨onnen, so Lagrange, k¨ onnen wir also alle Gleichungen der Form xn − 1
44
Kapitel VIII. Lagrange
l¨ osen, f¨ ur die n nur durch Primzahlen aus der Menge {2, 3, 5, 7} teilbar ist. Ab der Primzahl 11 versagt diese grobe Methode. Man muss subtiler argumentieren. Hier kommt nun die Analysis ins Spiel. Außerdem a¨ndert Lagrange stillschweigend die Strategie und zeigt direkt, dass es n-te Einheitswurzeln gibt, was auch immer n f¨ ur eine nat¨ urliche Zahl sei. Was wir von der Analysis ben¨ otigen, ist das Additionstheorem f¨ ur den Cosinus cos(a + b) = cos a cos b − sin a sin b, und die Formel sin2 a + cos2 a = 1, die mit b = −a aus der ersten folgt. Beide Formeln tauchen bei Lagrange nicht explizit auf, da er an dieser Stelle mit einem comme on sait — wie man weiß — argumentiert. Er beruft sich auf die Trigonometrie, die heute niemand mehr kennt. Außerdem werde ich benutzen, dass cos(−ϕ) = cos ϕ und sin(−ϕ) = − sin ϕ ist, und schließlich — zusammen mit Lagrange —, dass die Gleichungen sin a = 0
und
cos a = 1
genau dann simultan gelten, wenn a = 2kπ ist mit k ∈ Z. Schließlich brauchen wir an einer Stelle auch die Stetigkeit der betrachteten Funktionen. Ich hoffe dabei, dass der Leser solche Beweise f¨ ur all dies gesehen hat, die sich nur reeller Argumente bedienen. — Hier erhebt sich wieder die Frage nach dem Zahlenverst¨ andnis der damaligen Zeit und den Methoden, mit denen solche Aussagen verifiziert wurden. Satz 3. Es ist Hn (2 cos ϕ) = 2 cos(nϕ) f¨ ur alle n ∈ N. Beweis. F¨ ur n = 1 ist nichts zu beweisen. Es ist H2 (2 cos ϕ) = 4 cos2 ϕ − 2 = 2(cos2 ϕ + cos2 ϕ − 1) = 2(cos2 ϕ − sin2 ϕ) = 2 cos 2ϕ. Es sei n ≥ 2 und der Satz gelte f¨ ur alle k ≤ n. Nach Korollar 1 ist dann Hn+1 (2 cos ϕ) = Hn (2 cos ϕ)2 cos ϕ − Hn−1 (2 cos ϕ) = 2 2 cos nϕ cos ϕ − cos(n − 1)ϕ = 2 2 cos nϕ cos ϕ − cos nϕ cos(−ϕ) − sin nϕ sin(−ϕ) = 2 2 cos nϕ cos ϕ − cos nϕ cos ϕ − sin nϕ sin ϕ = 2 cos(n + 1)ϕ. Damit ist der Satz bewiesen.
1. Einheitswurzeln
45
Der n¨achste Satz, so Lagrange, sei die Grundlage des ber¨ uhmten Satzes von Cotes. Satz 4. F¨ ur alle n ∈ N ist
x2 − 2x cos ϕ + 1,
Teiler von x2n − 2xn cos nϕ + 1. Beweis. Es sei α eine Nullstelle von x2 − 2x cos ϕ + 1. Dann ist α+
1 = 2 cos ϕ. α
Nach Satz 2 und Satz 3 folgt αn +
1 = 2 cos nϕ αn
und weiter α2n − 2αn cos nϕ + 1 = 0. Nun ist aber x2 − 2x cos ϕ + 1 = x2 − 2x cos ϕ + cos2 ϕ + sin2 ϕ = (x − cos ϕ)2 + sin2 ϕ. Also ist
√ α = cos ϕ ± sin ϕ −1.
Ist sin ϕ = 0, so ist α nicht reell und folglich α ¯ eine von α verschiedene Nullstelle von x2 − 2x cos ϕ + 1 und dann auch von x2n − 2xn cos ϕ + 1. Hieraus folgt die Behauptung in diesem Falle. Es sei also sin ϕ = 0. Dann ist ϕ = kπ mit k ∈ Z. Ist k gerade, so ist auch nkπ gerade und folglich cos ϕ = 1 = cos nϕ. Dann ist aber das erste Polynom gleich (x − 1)2 und das zweite gleich (xn − 1)2 . Also gilt auch hier die Behauptung. Es sei k ungerade. Ist dann auch n ungerade, so ist cos ϕ = −1 = cos nϕ. Hier sind die beiden Polynome gleich (x + 1)2 und (xn + 1)2 , so dass die Behauptung ebenfalls gilt, da x + 1 ja Teiler von xn + 1 ist. Es sei schließlich k ungerade und n gerade. Dann ist cos ϕ = −1 und cos nϕ = 1. Dann sind die beiden Polynome gleich (x + 1)2 und (xn − 1)2 . Weil aber n gerade ist, ist x + 1 Teiler von xn − 1, so dass (x + 1)2 Teiler von (xn − 1)2 ist. Cotessche Formel. Es ist 2n
x
n 2kπ 2 − 2x cos nϕ + 1 = x − 2x cos ϕ + +1 . n n
k:=1
46
Kapitel VIII. Lagrange Beweis. Nach Satz 4 ist 2kπ +1 x − 2x cos ϕ + n 2
Teiler von 2n
x
2kπ − 2x cos n ϕ + + 1 = x2n − 2xn cos nϕ + 1. n n
Weil die Polynome zweiten Grades paarweise teilerfremd sind, folgt die Behauptung. Der cotessche Satz ist dann die geometrische Interpretation der cotesschen Formel. Diese Interpretation findet sich etwa in D¨ orrie 1950, S. 216 ff. Es sei wieder α eine Nullstelle von x2 − 2x cos ϕ + 1. Dann ist √ α = cos ϕ ± −1 sin ϕ. Andererseits ist auch α2n − 2αn cos nϕ + 1 = 0 und daher αn = cos nϕ ±
√ −1 sin nϕ.
Die Frage erhebt sich, welche der Vorzeichen zusammen geh¨oren. Lagrange schließt — ohne unsere Skrupel — wie folgt. Ist ϕ sehr klein, so ist bis auf unendlich Kleine ” quadratischer Ordnung“ cos ϕ = 1,
sin ϕ = ϕ,
und ebenso
cos nϕ = 1,
sin nϕ = nϕ.
Die Gleichungen f¨ ur α und αn werden dann zu √ α = 1 ± −1 ϕ √ αn = 1 ± −1 nϕ. Potenziert man nun die erste Gleichung mit n, so muss bis auf unendlich Kleine ” quadratischer Ordnung“ die zweite Gleichung herauskommen. Folglich geh¨ oren die beiden Pluszeichen und die beiden Minuszeichen zusammen. Mit andern Worten: Ist √ α = cos ϕ + −1 sin ϕ, so ist αn = cos nϕ +
√ −1 sin nϕ.
Das sind die ber¨ uhmten de moivreschen Formeln! W¨ahlt man nun ϕ :=
2πk , n
1. Einheitswurzeln
47
angigkeit von α von k durch einen Index deutlich, so ist αn = 1. Macht man die Abh¨ so sind α1 , . . . , αn s¨amtliche n-ten Einheitswurzeln. Dies schließt Lagrange daraus, dass die Paare 2πk 2πk , sin cos n n f¨ ur diese Werte von k paarweise verschieden sind und dass xn − 1 nicht mehr als n Wurzeln haben kann. Die de moivreschen Formeln besagen dar¨ uber hinaus, dass αk1 = αk ist f¨ ur k := 1, . . . , n. Es gilt sogar, wie Lagrange noch bemerkt, dass genau dann jedes αi Potenz von αk ist, wenn k und n teilerfremd sind. — Hier wird also die Existenz primitiver n-ter Einheitswurzeln sichergestellt. Es ist am Ende also nicht mehr die Rede davon, dass 2n + 1 eine Primzahl ist und dass man die L¨ osung der Gleichung 2n
xi = 0
i:=0
auf die L¨ osung einer Gleichung vom Grade 2 und einer solchen vom Grade n zur¨ uckf¨ uhrt. Es werden ja auch nicht mehr die (2n + 1)-sten Einheitswurzeln konstruiert, sondern die n-ten. Die anf¨ anglichen Untersuchungen des Halbierens des Grades der zu betrachtenden Gleichung wurde also aufgegeben und durch eine direkte Konstruktion der n-ten Einheitswurzeln ersetzt, die die de moivreschen Formeln benutzt, f¨ ur die Lagrange hier einen Beweis gibt. Lagrange sagt kein Wort zu diesem Wechsel der Strategie. — Ich weiß nichts zur Historie der cotesschen und de moivreschen Formeln. Mit unendlich kleinen und großen Gr¨ oßen zu operieren, war im 18. Jahrhundert gang und g¨ abe. Euler war ein Meister im Umgang mit ihnen, wie zum Beispiel der erste Band seiner Introductio in analysin infinitorum zeigt (Euler 1748/1922). Lange Zeit abgelehnt, sind sie heute im Rahmen der Nicht-Standard-Analysis wieder salonf¨ahig geworden, liefert die Nicht-Standard-Analysis doch ein solides Fundament f¨ ur sie. Es interessiert sich aber nur ein kleiner Zirkel von Mathematikern f¨ ur sie, obwohl sie, wie mir scheint, ein ungeheures Potential an Heuristik bietet. Liest man in Eulers Introductio, so fließt seine ber¨ uhmte Formel eix = cos x + i sin x v¨ ollig nat¨ urlich aus der Feder, wenn man sich nur dieser Gr¨oßen bedient. Selbst wenn man nicht von den Methoden der Nicht-Standard-Analysis abh¨ angen will, ist es doch n¨ utzlich zu sehen, dass eine solche Formel plausibel ist. Es ist dann zu hoffen, dass man sie am Ende auf herk¨ ommliche Weise verifizieren kann, will man sich nicht auf die Nicht-Standard-Analysis verlassen.
48
Kapitel VIII. Lagrange
Aus der eulerschen Formel fließen nat¨ urlich sofort die de moivreschen Formeln. Es ist ja (cos x + i sin x)n = e(ix)n = ei(nx) = cos nx + i sin nx. Kehren wir noch einmal zu den Ausgangs¨ uberlegungen zur¨ uck. Es sei f=
2n
ai xi .
i:=0
Ferner gelte ai = an−i f¨ ur alle i und etwa a2n = 1. Dann ist auch a0 = 1, so dass 0 keine Wurzel von f ist. Beispiel f¨ ur diese Situation ist das Polynom mit ai = 1 f¨ ur alle i, das uns am Anfang interessierte. Hier folgt nun n 1 i an−i x + i f = x an + . x i:=1 n
Mittels Satz 2 folgt hieraus n 1 f = x an + an−i Hi x + . x i:=1 n
Setzt man nun g := an +
n
an−i Hi ,
i:=1
so ist g ein Polynom vom Grade n. Ist dann α eine Nullstelle von g und ist β eine Nullstelle von x2 − αx + 1, so ist β Nullstelle des Ausgangspolynoms f . Hier ist also das Problem der Auffindung einer Nullstelle des — speziellen — Polynoms f vom Grade 2n auf das Auffinden einer Nullstelle eines Hilfspolynoms vom Grade n mit anschließender L¨osung einer quadratischen Gleichung zur¨ uckgef¨ uhrt worden. Dies h¨ atte seines Wissens, so Lagrange, de Moivre als Erster bemerkt und er zitiert dessen Miscellanea analytica. Wir wollen noch ein wenig bei den primitiven n-ten Einheitswurzeln bleiben. ur die k und n teilerfremd sind, so dass also jedes αi Das sind diejenigen αk , f¨ Potenz von αk ist. Sind i und n nicht teilerfremd, so haben sie einen gemeinsamen Primteiler p. Es folgt n
in
ni
αip = α1 p = α1 p = 1. n
n
Somit ist αi Nullstelle von x p − 1. Ist umgekehrt αi Nullstelle von x p − 1, so folgt in
1 = α1 p ,
2. Die große Arbeit
49
so dass i np Vielfaches von n ist. Es folgt, dass i Vielfaches von p ist. Ist n = pm, so sind die n-ten Einheitswurzeln, die keine m-ten Einheitswurzeln sind, wie aus dem gerade Bemerkten folgt, die Wurzeln von p−1 xn − 1 = xim . xm − 1 i:=0
Definiert man nun f¨ ur einen Primteiler p von n das Polynom fp durch fp :=
p−1
n
x p i,
i:=0
so sind die Wurzeln von fp diejenigen n-ten Einheitswurzeln, die nicht gleichzeitig n p -te Einheitswurzeln sind. Definiert man schließlich das Polynom Φn durch Φn := ggT(fp | p ist Primteiler von n), so sind die Wurzeln von Φn diejenigen n-ten Einheitswurzeln, die f¨ ur keinen Primteiler p von n auch np -te Einheitswurzel sind. Die Wurzeln von Φn sind also genau die primitiven n-ten Einheitswurzeln. Auf diese Weise konstruiert Lagrange im dritten Teil seiner Untersuchungen die n-ten Kreisteilungspolynome Φn , ohne sie so zu nennen und ohne sie irgendwie zu bezeichnen. Er schließt aus dieser Darstellung auch, dass Φn (0) = 1 f¨ ur n ≥ 2. Dies ist das fr¨ uheste Auftauchen der Kreisteilungspolynome, das ich kenne. ¨ Uber den Grad von Φn sagt Lagrange, dass man ihn a priori — ein von ihm h¨ aufig benutztes Wort — bestimmen k¨ onne. Er sei gleich der Anzahl der nat¨ urlichen Zahlen unterhalb n, die zu n teilerfremd sind. Seien r, s, t, . . . die Primteiler von n, so sei diese Anzahl gleich n (r − 1)(s − 1)(t − 1) · · · rst · · · Er beweist dies nicht, sondern verweist auf Nouveaux Commentaires de Petersbourg, tome VIII. Da mir diese Commentaires nicht zur Verf¨ ugung standen, habe ich in Lagrangens Werken nach einer entsprechenden Arbeit gesucht, aber nichts gefunden. In Eulers Werken jedoch findet sich eine Arbeit aus diesem Band, in der er die Verallgemeinerung des kleinen fermatschen Satzes beweist (Euler 1763). Dort findet sich auch die Aussage u ¨ ber die Anzahl der zu n teilerfremden Reste unterhalb von n bewiesen. Ich nehme an, dass Lagrange diese Arbeit meint. ¨ Uber die Kreisteilungspolynome wird noch ausf¨ uhrlich zu berichten sein. 2. Die große Arbeit. In Abschnitt 9 von Kapitel 6 haben wir gesehen, dass sich das Problem des Aufsuchens der Wurzeln eines Polynoms in zwei Probleme aufgespalten hatte. Es ging einmal um das Problem, die Struktur der Wurzeln
50
Kapitel VIII. Lagrange
an Hand der Koeffizienten zu erkennen, und zum Andern um die Frage, ob es u ¨ berhaupt immer Nullstellen gibt, und wo sie zu suchen sind. Bei der Behandlung dieser Frage spielte vor allem die Anordnung von Q und R eine Rolle. Typisch f¨ ur diese Untersuchungen ist die cartesische Zeichenregel und der Satz, dass jedes reelle Polynom ungeraden Gerades und auch jedes reelle Polynom mit negativem Absolutglied eine reelle Nullstelle hat. Dieser Aufspaltung des Problems war sich Lagrange bewusst, wie die Einleitung seiner großen Arbeit zeigt. Diese Einleitung ¨ sei hier in meiner Ubersetzung wiedergegeben. Die Theorie der Gleichungen ist von allen Teilen der Analysis diejenige von ” der man h¨ atte glauben m¨ ussen, dass sie, sei es wegen ihrer Wichtigkeit, sei es wegen der raschen Fortschritte, die die ersten Forscher erzielten, den gr¨oßtm¨ oglichen Grad an Perfektion erzielte; aber obgleich die Geometer, die seitdem gekommen sind, nicht m¨ ude wurden, sich daran zu versuchen, bedarf es noch viel, dass ihre Anstrengungen den Erfolg h¨ atten, den man w¨ unschen k¨ onnte. Man hat, das ist die Wahrheit, fast alles ausgesch¨opft, was die Natur der Gleichungen anbelangt, ihre Transformationen, die n¨ otigen Bedingungen, dass zwei oder mehrere Wurzeln gleich werden oder eine gegebene Relation zwischen ihnen bestehe und die Art, diese Wurzeln zu finden, die Form der Wurzeln, deren Existenz unterstellt wird, und die Methode, die Werte derjenigen zu finden, die, obgleich reell, sich unter einer imagin¨ aren Form verbergen, usw. Man hat auch allgemeine Regeln entdeckt um zu erkennen, ob alle Wurzeln einer Gleichung reell sind oder nicht, und wieviele im ersten Falle positiv sind und wieviele negativ; aber man hat bis heute noch keine allgemeine Regel gefunden, um die Anzahl der imagin¨ aren Wurzeln von Gleichungen zu erkennen, die solche enthalten, und noch viel weniger zu erkennen, wieviele positive und negative reelle es gibt, auch wenn man die Zahl der reellen und imagin¨ aren kennt; man hat nicht einmal eine Regel, um sich vergewissern zu k¨onnen, ob irgendeine gegebene Gleichung reelle Wurzeln besitzt oder nicht, zumindest dann nicht, wenn die Gleichung nicht von ungeradem Grad oder ihr letzter Term nicht negativ ist.“ Es ist nicht so, dass man nicht die Zahl der imagin¨ aren und der positiven ” oder negativen reellen Wurzeln herausfinden k¨ onnte, wenn man die numerischen Werte der Koeffizienten der vorgegebenen Gleichung kennt; die Methoden, die ich anderswo gegeben habe, ebenso die, die zum Ziele haben, die Wurzeln, so gut man nur will, zu approximieren, lassen, so scheint es mir, nichts zu w¨ unschen u ¨brig; aber es handelt sich hier um Buchstabengleichungen (´equations litt´erales) und die Frage ist, Bedingungen zu finden, die zwischen den verschiedenen Koeffizienten einer Gleichung von gegebenem Grade gelten m¨ ussen entsprechend der Beschaffenheit ihrer Wurzeln.“ Was die Aufl¨ osung von Buchstabengleichungen betrifft, so ist man kaum weiter ” gekommen als zu den Zeiten Cardanos, der als Erster die der Gleichungen dritten und vierten Grades publiziert hat. Die ersten Erfolge der italienischen Analysten ¨ in dieser Sache scheinen das Außerste der Entdeckungen zu sein, die man hier machen kann; jedenfalls ist es sicher, dass alle Versuche, die man bis heute unter-
2. Die große Arbeit
51
nommen hat, um die Grenzen dieses Teils der Algebra hinauszur¨ ucken, nur dazu gedient haben, neue Methoden f¨ ur die Gleichungen dritten und vierten Grades zu finden, von denen im Allgemeinen keine auf Gleichungen h¨ oheren Grades anwendbar erscheint.“ Ich habe mir in diesem M´emoire die Aufgabe gestellt, die verschiedenen Meth” oden zu untersuchen, die man bislang f¨ ur die algebraische Aufl¨ osung von Gleichungen gefunden hat, und sie auf allgemeine Prinzipien zur¨ uckzuf¨ uhren und a priori zu zeigen, warum diese Methoden beim dritten und vierten Grad Erfolg haben, bei h¨ oherem Grade jedoch versagen.“ Diese Untersuchungen haben einen zweifachen Vorteil: Auf der einen Seite ” dienen sie dazu, ein helleres Licht auf die bekannten L¨ osungen beim dritten und vierten Grad zu werfen; auf der anderen Seite werden sie denen n¨ utzlich sein, die sich mit der Aufl¨ osung bei h¨ oheren Graden besch¨aftigen wollen, indem ihnen verschiedene Sichtweisen dieses Unterfangens zur Verf¨ ugung gestellt und ihnen vor allem eine Vielzahl unn¨ utzer Versuche erspart werden.“ Zun¨ achst eine Bemerkung zur Passage die Form der Wurzeln, deren Existenz ” unterstellt wird“. Im Original steht la forme des radices imaginaires. Angespielt wird hier auf den Fundamentalsatz der Algebra, bei dem es im 18. Jahrhundert ja darum ging, dass man aus der angenommenen Existenz der Wurzeln schloss, dass sie komplexe Zahlen sind. Dar¨ uber haben wir im sechsten Kapitel berichtet. ¨ Um also nicht den Leser mit der Ubersetzung imagin¨ ar“ f¨ ur das Wort imagi” naire auf eine falsche F¨ ahrte zu locken, habe ich das Wort imaginaire bei seinem ersten Auftreten mit deren Existenz unterstellt wird“ u ¨ bersetzt. Beim n¨achsten ” Auftreten habe ich es dann mit imagin¨ ar“ wiedergegeben, weil hier nun die As” soziation mit den komplexen Zahlen das Richtige wiedergibt. An dieser Stelle geht es ja darum, dass sich gelegentlich reelle Wurzeln imagin¨ar darstellen, wie wir dies bei den Gleichungen dritten Grades beobachteten und was schon Cardano nach Tartaglias Zeugnis irritierte. Als N¨achstes sei vor allem klar gestellt, was aus der Sekund¨arliteratur nur hervorgeht, wenn man es weiß, was n¨amlich der Unterschied zwischen einer numerischen und einer algebraischen Gleichung in diesen fr¨ uhen Schriften der Algebra ist. Eine numerische Gleichung ist ein Polynom gleich null gesetzt, dessen Koeffizienten ganz-rationale, rationale, reelle oder komplexe Zahlen sind. Eine algebraische Gleichung ist ein Polynom gleich null gesetzt, wobei die Koeffizienten des Polynoms Unbestimmte sind. Wir subsumieren heute beide Gleichungstypen unter dem Begriff algebraische Gleichung“, woraus dem unbedarften Leser ” manches Missverst¨andnis entsteht. Wenn also Lagrange von Buchstabengleichungen, ´equations litt´erales, bzw. algebraischen Gleichungen, ´equations alg´ebriques, redet, so meint er eine Gleichung f = 0 mit Polynomen f der Form n an−i xi ∈ Q[a1 , . . . , an ][x] f= i:=0
mit Unbestimmten a1 , . . . , an und x sowie a0 = 1. Dies sollte der Leser im Auge behalten.
52
Kapitel VIII. Lagrange
Das Aufschluss gebende Wort ´equations litt´erales erscheint nur zweimal in der Einleitung und dann nie wieder. Den Zeitgenossen war wohl klar, wovon Lagrange handelte. Dennoch sei meine Forderung an meine Studenten hier wiederholt, dass n¨ amlich in der Einleitung ausgesprochene Definitionen im eigentlichen Text wiederholt werden sollten oder dass dort zumindest ausdr¨ ucklich auf sie verwiesen werden m¨ usste, um beim eiligen Leser, der die Einleitung nur u ¨berfliegt, Verwirrung zu vermeiden. Was nun die numerischen Gleichungen anbelangt, so sei der Leser auf den Abschnitt 9 von Kapitel 11 verwiesen. Im vorliegenden Kapitel untersuchen wir mit Lagrange Polynome der Form f = xn + a1 xn−1 + . . . + an ∈ Q[a1 , . . . , an ][x] mit Unbestimmten a1 , . . . , an und x u ¨ ber Q. Der Leser wundere sich, so wie auch ich mich gewundert habe, als mir so langsam die Augen aufgingen, mit welcher Unbek¨ ummertheit, aber auch Sicherheit Lagrange mit diesen Unbestimmten rechnet, n-te Wurzeln aus ihnen zieht, rationale Ausdr¨ ucke in ihnen bildet, annimmt, dass eine solche Gleichung soviele Wurzeln hat, wie ihr Grad angibt, usw. Man muss sich das wirklich vor Augen halten, was Lagrange da tut, da uns heute, mehr als zweihundert Jahre nach der Publikation von Lagrangens großer Arbeit, ein dicht gekn¨ upftes Netz von Begriffen und S¨ atzen vor dem Sturz in die Tiefe bewahrt und uns aber auch gleichzeitig den Blick verstellt f¨ ur das großartige Unterfangen, das Lagrange mit dieser Arbeit unternahm. Wie Gauß — einundvierzig Jahre j¨ unger als Lagrange — sich der Polynomringe bediente, haben wir im sechsten Kapitel gesehen. Bei ihm ist das alles schon viel differenzierter, wenn es auch ihm noch an Begrifflichkeit fehlt. Die lagrangesche Arbeit ist in vier Abschnitte (sections) eingeteilt, wovon die ersten beiden 1770 und die letzten beiden 1771 erschienen. In den ersten beiden wird alles u ¨ ber Gleichungen dritten und vierten Grades zusammengetragen, was damals bekannt war, und gr¨ undlichst untersucht. Ich werde hier wesentliche Teile dieser beiden Abschnitte vortragen, um dem Leser einen Eindruck vom rechnerischen Argumentieren der damaligen Zeit zu geben. Lagrange benutzt seine Ausf¨ uhrungen zu den Gleichungen dritten und vierten Grades zur Motivation der Untersuchungen des dritten Abschnittes, wo er den allgemeinen Fall behandelt. Der Ansatz, den er dort macht, stammt von Ehrenfried Tschirnhaus, der ihn im Jahre 1683 im ersten Band der Acta eruditorum (S. 204–207) publizierte. Langwierige Rechnungen, die vieles auch noch dem Leser zu pr¨ ufen u ¨berlassen, machen die Lekt¨ ure der letzten beiden Abschnitte f¨ ur den heutigen Leser sehr m¨ uhsam. Fortschritte in der Mathematik haben das Rechnen ja vielfach u ¨berfl¨ ussig gemacht, so dass uns Heutigen die Gel¨aufigkeit beim Rechnen fehlt. Ich werde mich daher heutiger Methoden bedienen, um die wesentlichen Resultate Lagrangens zu etablieren. Im dritten Abschnitt wird also die tschirnhausensche Methode eingehend untersucht, ohne dass das Ziel der Aufl¨ osung von algebraischen Gleichungen h¨ oheren als vierten Grades erreicht wird, ohne aber auch zu zeigen, dass sie nicht zum Ziele f¨ uhrt. Bei den Untersuchungen der ersten drei Abschnitte stellt sich heraus, dass ra-
¨ 3. Uber die Aufl¨ osung der Gleichungen dritten Grades
53
tionale Funktionen, die unter der Wirkung der symmetrischen Gruppe nur wenige Bilder haben, eine wichtige Rolle spielen. Lagrange nimmt daher nach den entt¨ auschenden Ergebnissen des dritten Abschnitts im vierten Abschnitt einen neuen Anlauf und betrachtet die Menge aller rationalen Funktionen in n Unbestimmten und ihre Strukturierung durch die symmetrische Gruppe, wobei es keine Rolle mehr spielt, dass die Unbestimmten die Nullstellen der allgemeinen Gleichung n-ten Grades sind. Er sagt zwar nicht, dass er das tut, aber de facto ist es so. Bemerkenswert ist auch, dass er in diesem Zusammenhang eine explizite Erzeugung der n! Permutationen von n Elementen gibt. Wir werden auch dem Ursprung des Namens Satz von Lagrange“ f¨ ur den Sacherhalt begegnen, dass die Ordnung ” einer Untergruppe einer endlichen Gruppe G, die Ordnung von G teilt. — Es gibt einiges zu berichten! ¨ 3. Uber die Aufl¨ osung der Gleichungen dritten Grades. Wenn im Folgenden von allgemeinen Gleichungen die Rede ist, so erinnere sich der Leser daran, dass damit Gleichungen gemeint sind, deren Koeffizienten Unbestimmte sind. Die allgemeine Gleichung dritten Grades lautet x3 + mx2 + nx + p = 0. Lagrange bemerkt an dieser Stelle, dass es bekannt sei, dass man annehmen d¨ urfe, dass m = 0 sei. Er sagt sogar noch mehr, dass man n¨ amlich bei Gleichungen vom Grade n stets zu einer ¨aquivalenten Gleichung u ¨bergehen k¨ onne, bei der das Glied vom Grade n − 1 fehle. Da es hier aber um Gleichungen mit Unbestimmten als Koeffizienten geht, muss man etwas dazu sagen. Es sei also f = xn + a1 xn−1 + . . . + an ∈ Q[a1 , . . . , an ][x] mit Unbestimmten a1 , . . . , an und x. Wir nehmen eine neue Unbestimmte y und setzen a1 g(y) := f y − . n = 0 ist, wenn nur k > n − i Setzt man weiter a0 := 1 und beachtet man, dass n−i k ist, so folgt n−i n a1 g(y) = ai y − n i:=0 n−i−k n n−i a1 n−i−k n − i = ai (−1) yk k n i:=0 k:=0 n−k−i n n n−i a1 = ai (−1)n−k−i yk k n i:=0 k:=0 n−k−i n n a1 n−k−i n − i = (−1) ai y k . k n i:=0 k:=0
54
Kapitel VIII. Lagrange
Setzt man schließlich m := n − k und m
bm :=
m−i
(−1)
i:=0
n−i n−m
a1 n
m−i ai
f¨ ur m := 0, . . . , n, so ist b0 = 1, b1 = 0 und g(y) = y n +
n
bi y n−i .
i:=2
Es folgt weiter bm =
m−1
m−i
(−1)
i:=0
n−i n−m
a1 n
m−i a i + a m = cm + a m
mit cm ∈ Q[a1 , . . . , am−1 ] f¨ ur m := 2, . . . , n. Daher ist (A)
Q[a1 , . . . , ak ] = Q[a1 , b2 , . . . , bk ]
f¨ ur k := 2, . . . , n. Definiert man f¨ ur F ∈ Q[a1 , . . . , an ] das Polynom F σ durch F σ := F (a1 , b2 , . . . , bn ), so ist σ ein Endomorphismus von Q[a1 , . . . , an ], der wegen (A) surjektiv ist. Dar¨ uberhinaus gilt, dass σ injektiv ist. W¨are dies nicht der Fall, so g¨ abe es ein F ∈ Kern(σ) mit F = 0. Es w¨are also F (a1 , b2 , . . . , bn ) = 0. Weil a1 eine Unbestimmte ist, k¨ame ein bi wirklich vor. Es sei m maximal unter ame. Entwickelte man F (a1 , b2 , . . . , bn ) den i, f¨ ur die bi in F (a1 , b2 , . . . , bn ) vork¨ nach Potenzen von bm , so folgte 0 = F (a1 , b2 , . . . , bn ) =
N
di bim
i:=0
mit di ∈ Q[a1 , b2 , . . . , bm−1 ] = Q[a1 , . . . , am−1 ] f¨ ur i := 0, . . . , N und dN = 0. Nun ist bm = cm + am mit cm ∈ Q[a1 , . . . , am−1 ]. Daher w¨are 0 = F (a1 , b2 , . . . , bn ) = aN m dN + Terme niedrigeren Grades in am . Dies aber w¨are ein Widerspruch. Also ist σ doch injektiv. Weil σ ein Automorphismus von Q[a1 , . . . , an ] ist, der a1 fest l¨asst und die urfen wir a1 , b2 , . . . , bn als Unbestimmte u ¨ ber Q u ¨ brigen ai jeweils auf bi abbildet, d¨
¨ 3. Uber die Aufl¨ osung der Gleichungen dritten Grades
55
auffassen. Diese Annahme wird von Lagrange immer gemacht, wenn er die fragliche Transformation durchf¨ uhrt, ohne dass er etwas dazu sagt. Die Methoden, mit denen wir die algebraische Unabh¨angigkeit von a1 , b2 , . . . , bn nachwiesen, standen ¨ aber auch ihm zur Verf¨ ugung. Uber den Begriff der algebraischen Unabh¨ angigkeit werden wir uns sp¨ ater noch ausf¨ uhrlich unterhalten (Kapitel 11). Dass die Charakteristik 0 ist, ist hier wesentlich, da bei der Transformation durch die nat¨ urliche Zahl n dividiert wird. Was wir gerade machten, verbirgt sich bei Lagrange unter dem W¨ ortchen be” kannt“. Wie bewusst sich Lagrange der Problematik war, wird uns verborgen bleiben. Wir halten aber fest, dass Lagrange konstatiert, dass es gen¨ uge, sich die Gleichung x3 + nx + p = 0 anzusehen. In dieser Form h¨atten Scipione del Ferro und Tartaglia die kubischen Gleichungen zuerst behandelt. Wir wissen, dass sie in Wirklichkeit drei Typen von Gleichungen dritten Grades ohne quadratisches Glied hatten, von denen del Ferro nur einen beherrschte. Außerdem wissen wir, dass Tartaglia den Zusammenhang dieser Gleichungen mit den Gleichungen, die auch ein quadratisches Glied besitzen, nicht kannte. Lagrange nun meinte, dass die nat¨ urliche Methode, kubische Gleichungen ohne quadratisches Glied zu attackieren, die Methode von Hudde sei. Hier einige Zeilen zu dem dem gemeinen Mathematiker wenig bekannten Mann. In der Literatur zur Geschichte der Mathematik findet er sich nat¨ urlich. Jan Hudde wurde um 1628 geboren und starb 1704. Mathematisch war er Sch¨ uler von Frans van Schooten dem J¨ ungeren (um 1615–1660), der die mathematischen Werke von Fran¸cois Vi`ete und die G´eom´etrie von Ren´e Descartes herausgegeben hat. Die Dinge, auf die sich Lagrange bezieht, stehen in einem Brief an Schooten vom 15. Juli 1657. Diesen Brief hat Schooten im Anhang seiner Ausgabe von Descartes’ G´eom´etrie publiziert (Hudde 1659/61. Zitiert nach Haas 1956). Nach 1663 gibt es keine mathematische Publikation von Hudde mehr. Von diesem Zeitpunkt an bis zu seinem Tode war er nur noch politisch in den verschiedens¨ ten Amtern der Stadt Amsterdam t¨atig. In dieser Zeit war er auch mehrfach B¨ urgermeister dieser Stadt. Die Angabe bei Haas 1956, S. 236, dass er es einundzwanzigmal war mit der nachfolgenden Bemerkung, dass die Amtszeit eines B¨ urgermeisters auf je zwei Jahre von dreien beschr¨ ankt“ war, bedarf der Inter” pretation. Da Hudde 1672 zum ersten Male B¨ urgermeister wurde und 1704 starb, kann ich das Ganze nur so interpretieren, dass die Amtszeit eines B¨ urgermeisters ein Jahr betrug und dass ein und dieselbe Person innerhalb von drei Jahren nur zweimal B¨ urgermeister werden konnte. Mit dieser Interpretation k¨ ame ich auf eine Zeitspanne von minimal 31 Jahren f¨ ur 21 Amtszeiten, was in die noch verbleibende Lebenszeit von Hudde passte. Das bedeutet, dass er das Amt so h¨aufig inne hatte, wie es das Gesetz u ¨ berhaupt zuließ. Er muss ein hervorragender B¨ urgermeister f¨ ur die gewesen sein, die ihn immer wieder w¨ ahlten. Soviel zu Hudde. Wer mehr u ¨ ber ihn und seine mathematischen Schriften wissen m¨ ochte, sei auf Haas 1956
56
Kapitel VIII. Lagrange
verwiesen. Lagrange setzt nun nach dem Vorbild Huddes in der reduzierten Gleichung x = y + z. Dann ergibt sich 0 = y 3 + 3y 2 z + 3yz 2 + z 3 + n(y + z) + p = y 3 + z 3 + p + (y + z)(3yz + n). Man betrachte nun die beiden Gleichungen y3 + z 3 + p = 0 3yz + n = 0. Sie ergeben z=− und weiter y3 −
n 3y
n3 + p = 0, 27y 3
das heißt
n3 = 0. 27 Diese Gleichung sechsten Grades fanden wir auch schon bei Bombelli. Sie heißt heute huddesche Resolvente. Sie ist eine quadratische Gleichung in y 3 . Es folgt n3 p2 p 3 + y =− ± 2 4 27 y 6 + py 3 −
und weiter y=
3
p − ± 2
n3 p2 + . 4 27
Damit hat man also y und z und dann auch x. Man erinnere sich. Tartaglia beginnt damit, u und v zu bestimmen mit u + v + p = 0 und 27uv + n3 = 0. Bei ihm ist dann √ √ x = 3 u + 3 v. Das ist im Wesentlichen die huddesche Methode, nur dass man bei Hudde, wie Lagrange bemerkt, sieht, wie man auf diesen Ansatz gef¨ uhrt wird. Lagrange bemerkt, dass y sechs Werte annimmt, da y ja Wurzel einer Gleichung sechsten Grades ist. Diese ergeben f¨ ur x aber nur drei Werte, da x Wurzel einer Gleichung dritten Grades ist. Nach diesem theoretischen Schluss rechnet er aus n auf die Gleichung der Gleichung f¨ ur y und der Gleichung x = y − 3y (x3 + nx + p)2 = 0
¨ 3. Uber die Aufl¨ osung der Gleichungen dritten Grades
57
f¨ ur x zur¨ uck, was den theoretischen Schluss best¨ atigt. Er kommentiert dies damit, dass das L¨osen einer kubischen Gleichung in Wirklichkeit das L¨ osen einer Gleichung sechsten Grades sei, eine Unbequemlichkeit (inconv´enient ), die bei Gleichungen zweiten Grades nicht, bei Gleichungen h¨ oheren Grades in noch viel betr¨ achtlicherem Maße auftrete, wie man noch sehen werde. Es gelte, die drei Werte von y zu finden, die die drei verschiedenen Werte von x liefern. Der Wert y aber ist in jedem Falle eine dritte Wurzel. Da ist nun grunds¨ atzlich zu sagen, dass eine von null verschiedenen komplexen Zahl stets n verschiedene n-te Wurzeln hat und dass sich je zwei von ihnen um eine n-te Einheitswurzel unterscheiden. Man kommt um die Einheitswurzeln also nicht herum. So gibt denn auch Lagrange, nachdem er die Gleichungen dritten Grades untersucht hat, einen Exkurs u ¨ber die n-ten Einheitswurzeln, den wir im ersten Abschnitt vorweggenommen haben. Im vorliegenden Falle bedient sich Lagrange also der dritten Einheitswurzeln 1, α, β, die er als Wurzeln der Gleichung x3 − 1 = 0 auffasst. Wegen 1 · α · β = 1, dem letzten Term von x3 − 1, seien α und β invers 2 3 zueinander. Setzt man q := p4 + n27 , so sind die sechs Werte von y gleich p √ p √ p √ 3 3 − ± q, α − ± q, β 3 − ± q. 2 2 2 2 n p √ 3 p √ 3 p 3 −q =− . − ± q − ∓ q= 2 2 4 3 Daher sind wegen αβ = 1 die zu y geh¨origen Werte von z der Reihe nach gleich p √ p √ p √ 3 3 − ∓ q, β − ∓ q, α 3 − ∓ q. 2 2 2 Nun ist
Da die sechs Werte von y, von der Reihenfolge abgesehen, mit den sechs Werten von z u ¨ bereinstimmen und die zu den y-Werten mit dem Pluszeichen geh¨orenden z-Werte, die mit dem Minuszeichen sind, sind die drei verschiedenen x-Werte die Werte p √ p √ 3 − + q + 3 − − q, 2 2 p √ p √ 3 α − + q + β 3 − − q, 2 2 √ p p √ β 3 − + q + α 3 − − q. 2 2 Dies zeigt, wie die Wurzeln der Ausgangsgleichung von den Wurzeln der huddeschen Resolventen abh¨angen. Lagrange nennt die huddesche Resolvente einfach die Reduzierte Er untersucht nun umgekehrt, wie die Wurzeln der Reduzierten von den Wurzeln der Ausgangsgleichung abh¨ angen. Dazu betrachtet er wieder die allgemeine Situation x3 + mx2 + nx + p = 0
58
Kapitel VIII. Lagrange
mit den Wurzeln a, b, c. Dies ist so eine Stelle, wo wir sehr viel vorsichtiger zu argumentieren h¨ atten. Wir betrachteten den Polynomring in den Unbestimmten a, b, c und n¨ ahmen f¨ ur m, n und p die elementarsymmetrischen Polynome in diesen Unbestimmten. Auf Grund des waringschen Satzes w¨ aren m, n und p algebraisch unabh¨ angig, so dass wir die lagrangesche Situation vor uns h¨ atten, wobei nun aber die Rolle von a, b und c pr¨ azisiert w¨are. Lagrange definiert weiter x , n und p durch die Gleichungen x = x − m 3 und m2 mn 2m3 n = n − 3 , p = p − 3 + 27 . Dann ergibt sich x3 + n x + p = 0. Setzt man x = y −
n 3y ,
so ergibt sich die Reduzierte y 6 + p y 3 −
Setzt man weiter r :=
3
p − + 2
n3 = 0. 27
n3 p2 + , 4 27
so erh¨alt man f¨ ur y die drei Wurzeln r, αr und βr, die verschiedene Werte von x liefern, n¨ amlich die Werte r− Setzt man s :=
n 3r ,
n , 3r
αr −
n , 3αr
βr −
so erh¨ alt man f¨ ur a, b und c die Werte m + r − s, 3 s m b = − + αr − , 3 α m s c = − + βr − . 3 β
a=−
Hieraus ergibt sich
und weiter
n . 3βr
s a − b = (1 − α) r + , α s a − c = (1 − β) r + , β α(a − b) = αr + s, 1−α β(a − c) = βr + s. 1−β
¨ 3. Uber die Aufl¨ osung der Gleichungen dritten Grades Hieraus erh¨ alt man
59
α(a − b) β(a − c) − 1−α 1−β r= α−β
und dann nach einiger Rechnung, die auch Lagrange nicht vorf¨ uhrt, r=
αb βc a + + . (1 − α)(1 − β) (α − 1)(α − β) (β − 1)(β − α)
Es ist x3 − 1 = (x − 1)(x − α)(x − β). Differenzieren ergibt 3x2 = (x − α)(x − β) + (x − 1)(x − β) + (x − 1)(x − α). Ersetzt man x der Reihe nach durch 1, α, β, so folgt 3 = (1 − α)(1 − β), 3α2 = (α − 1)(α − β), 3β 2 = (β − 1)(β − α). Geht man mit diesen Werten in die f¨ ur r gefundene Formel, so erh¨ alt man r=
a b c a + βb + αc + + = . 3 3α 3β 3
Da r eine der Wurzeln der Reduzierten ist und da die Bezeichnung der Wurzeln der Ausgangsgleichung mit a, b und c v¨ ollig willk¨ urlich ist, sieht man, dass man durch Permutation der a, b und c sechs Werte f¨ ur r bekommt, so dass die Reduzierte zwangsl¨aufig den Grad 6 hat. Lagrange sagt hier, dass man aus der Theorie der Kombinationen wisse, dass die Anzahl der Permutationen gleich 3 · 2 · 1 sei. Die Fakult¨ atenbezeichnung kennt er noch nicht. Lagrange bemerkt dar¨ uber hinaus, dass dies auch zeige, dass man die Reduzierte nach Art einer quadratischen Gleichung l¨ osen k¨onne. Dies sieht man wie folgt: Es ist a + αb + βc , 3 c + αa + βb , αr = 3 b + αc + βa . βr = 3 r=
Die verbleibenden Wurzeln sind a + αc + βb , 3 b + αa + βc , αr = 3 c + αb + βa . βr = 3 r =
60
Kapitel VIII. Lagrange
Die Reduzierte ist dann (y 3 − r3 )(y 3 − r3 ) = y 6 − (r3 + r3 )y 3 + r3 r3 . Dies zeigt in der Tat erneut, dass man die Reduzierte l¨ osen kann, indem man erst eine quadratische und dann eine reine Gleichung l¨ ost. Hier haben wir etwas anders geschlossen als Lagrange. Nun geht es Lagrange darum, eine direkte Methode zu finden, um die Reduzierte zu berechnen. Es ist also wieder x gesucht mit x3 + mx2 + nx + p = 0. Es seien a, b, c die drei Wurzeln dieser Gleichung. Wir wissen auf Grund des waringschen Satzes, dass wir a, b, c als Unbestimmte auffassen d¨ urfen. Lagrange rechnet so, als w¨are dies der Fall, ohne ein Wort dar¨ uber zu verlieren. Er macht die Annahme, dass Aa + Bb + Cc Wurzel der Reduzierten sei, wobei er kein Wort u ¨ ber die Natur von A, B und C verliert. Dieser Ansatz l¨auft darauf hinaus, die Reduzierte durch die Gleichung Y 6 − 33 A3 (r3 + r3 )Y 3 + 36 A6 r3 r3 = 0 zu ersetzen, die dann wieder Reduzierte heißt. Dies wird von Lagrange erst sp¨ ater erw¨ahnt, nachdem er schon u ¨ber A verf¨ ugt hat. Dann seien die sechs Wurzeln der Reduzierten die Elemente Aa + Bb + Cc, Aa + Bc + Cb, Ab + Ba + Cc, Ab + Bc + Cc, Ac + Ba + Cb, Ac + Bb + Ca. Hier sieht man die rekursive Erzeugung der S3 vor sich. Ist r eine dieser Wurzeln, so auch αr und α2 r, wenn nur α eine primitive 3-te Einheitswurzel ist. Dies haben wir oben gesehen. Also ist αAa + αbB + αCc eine von den f¨ unf restlichen Wurzeln. Diese kann nicht Aa + Bc + Cb, Ab + Ba + Cc, Ac + Bb + Ca
¨ 3. Uber die Aufl¨ osung der Gleichungen dritten Grades
61
sein, wobei Lagrange den letzten Fall nicht erw¨ ahnt und auch sonst nicht ganz sauber argumentiert. W¨ are sie n¨amlich gleich der ersten dieser dreien, so folgte (α − 1)Aa + (αB − C)b + (αC − B)c = 0. Wegen der algebraischen Unabh¨ angigkeit von a, b, c folgte (α − 1)A = 0, αB − C = 0, −B + αC = 0. Weil α = 1 = α2 ist, folgte schließlich A = B = C = 0. Das kann aber nicht sein. Die andern beiden F¨ alle lieferten den gleichen Widerspruch. Es ist also α(Aa+Bb+Cc) = Ab+Bc+Ca oder α(Aa+Bb+Cc) = Ac+Ba+Cb. Er nimmt nun an, es l¨ age der erste Fall vor, seine Rechnungen zeigen aber, dass er in Wirklichkeit den zweiten Fall seinen Rechnungen zu Grunde gelegt hat. Nimmt man also ohne Beschr¨ankung der Allgemeinheit an, dass α(Aa + Bb + Cc) = Ab + Bc + Ca ist, so folgt αA = C, αB = A, αC = B. Hieraus folgt wiederum, dass A nicht null sein kann. Wir d¨ urfen daher mit Lagrange annehmen, dass A = 1 ist. Dann ist C = α und B = α2 . Setze r := a + αb + α2 c und s := a + αc + α2 b. Dann sind r, αr, α2 r und s, αs und α2 s die sechs Wurzeln der (modifizierten) Reduzierten. Insbesondere gilt (y − r)(y − αr)(y − α2 r) = y 3 − r3 und (y − s)(y − αs)(y − α2 s) = y 3 − s3 . Die Reduzierte ist also (y 3 − r3 )(y 3 − s3 ) = y 6 − (r3 + s3 )y 3 + r3 s3 = 0.
62
Kapitel VIII. Lagrange
Nun sind r3 + s3 und r3 s3 auszurechnen. Einfache Rechnungen zeigen, dass r3 = a3 + b3 + c3 + 6abc + 2α(a2 b + ac2 + b2 c) + 3α2 (ab2 + bc2 + ca2 ) ist. Vertauschen von b und c liefert s3 = a3 + c3 + b3 + 6acb + 2α(a2 c + ab2 + c2 b) + 3α2 (ac2 + cb2 + ba2 ). Setze L := a3 + b3 + c3 + 6abc, M := a2 b + b2 c + c2 a, N := a2 c + c2 b + b2 a. Dann ist r3 = L + 3αM + 3α2 N und s3 = L + 3αN + 3α2 M . Folglich ist r3 + s3 = 2L + 3(α + α2 )(M + N ). Nun ist 0 = α3 − 1 = (α − 1)(α2 + α + 1). Wegen α = 1 ist daher α2 + α = −1. Also ist r3 + s3 = 2L − 3(M + N ). Einsetzen und Nachrechnen liefert r3 s3 = L L − 3(M + N ) + 9 (M 2 + N 2 )2 − 3M N . Die Koeffizienten der Reduzierten seien durch die Koeffizienten m, n, p der Ausgangsgleichung gegeben, ohne dass man Wurzeln ausziehen m¨ usse. Dies folge daraus, dass sie unter Permutation der a, b, c invariant bleiben. Diese Argumentation ist nicht ganz stichhaltig, da sie α nicht ber¨ ucksichtigt. Im Folgenden zeigt er aber direkt, dass und wie die Koeffizienten der Reduzierten von m, n und p abh¨ angen, wobei ihre Unabh¨ angigkeit von α mit herauskommt. Es ist ja −m = a + b + c, n = ab + ac + bc und −p = abc. Nach bekannten Regeln, so Lagrange, gemeint sind die newtonschen Formeln, gilt a2 + b2 + c2 = m2 − 2n, a3 + b3 + c3 = −m3 + 3mn − 3p. Hiermit findet er a3 b3 + a3 c3 + b3 c3 = n3 − 3mnp + 3p2 .
¨ 3. Uber die Aufl¨ osung der Gleichungen dritten Grades
63
Es folgt L = −m3 + 3mn − 9p, M + N = a2 (b + c) + b2 (c + a) + c2 (a + b) = 3p − mn, M N = n3 + p(m3 − 6mn) + 9p2 . Daher ist
r3 + s3 = −2m3 + 9mn − 27p, r3 s3 = m6 − 9m4 n + 27m2 n2 − 27m3 = (m2 − 3n)3 .
Die modifizierte Reduzierte ist also y 6 + (2m3 − 9mn + 27p)y 3 + (m2 − 3n)3 = 0. Erst hier geht Lagrange darauf ein, dass die Nullstellen der modifizierten Reduzierten gerade die Dreifachen der Wurzeln der eigentlichen Reduzierten sind. Sind nun z und z die Wurzeln der Gleichung z 2 + (2m3 − 9mn + 27p)z + (m2 − 3n)3 = 0, so ist a + αb + α2 c = a + α2 b + αc =
√ 3 √ 3
z , z ,
a + b + c = −m. Aus diesem System linearer Gleichungen erh¨ alt man dann wieder die Werte f¨ ur a, b und c, die wir fr¨ uher schon gefunden haben. ¨ Die bislang untersuchte Regel zur Aufl¨ osung kubischer Gleichungen, dh., Ubergang von der Gleichung x3 + mx2 + nx + p = 0 zur modifizierten reduzierten Gleichung y 6 + (2m3 − 9mn + 27p)y 3 + (m2 − 3n)3 = 0 und weiter zur Gleichung z 2 + (2m3 − 9mn + 27p)z + (m2 − 3n)3 = 0, Bestimmung der Wurzeln z und z dieser Gleichung, woraus sich dann f¨ ur die Wurzeln a, b und c der Ausgangsgleichung √ √ −m + 3 z + 3 z , a= 3√ √ −m + α2 3 z + α 3 z b= , 3 √ √ −m + α 3 z + α2 3 z c= 3
64
Kapitel VIII. Lagrange
ergibt, werde gew¨ohnlich cardanische Regel genannt. Von dieser Regel sagt er, sie sei die einzige, die die Analysten kennten. — Wer sind die Analysten? Es gebe aber noch eine zweite Regel, die auf Tschirnhaus zur¨ uckginge, und er zitiert die Acta Eruditorum vom Jahre 1683. Diese Methode, so Lagrange, bestehe darin, bei einer beliebigen Gleichung soviele Zwischenterme, wie man m¨ochte, verschwinden zu lassen. Der Autor schl¨ uge dies als allgemein vor, und er, Lagrange, w¨ urde zeigen, dass dies tats¨achlich so sei, aber die Zwischenrechnungen erforderten h¨ aufig die L¨ osung von Gleichungen h¨ oheren Grades als den der gegebenen Gleichung. Dies verhindere, dass sie bei Graden jenseits des vierten erfolgreich sei. Was hier vor sich geht, werden wir noch zu besprechen haben (Abschnitt 5). Was Tschirnhaus anbelangt, so macht er in der Tat den sp¨ ater zu besprechenden Ansatz und behauptet, dass er eine Gleichung n-ten Grades stets so transformieren k¨ onne, dass er eine reine Gleichung n-ten Grades als Hilfsgleichung erhielte. Er rechnet dies aber nur f¨ ur n = 3 nach, wobei er bei seinen Rechnungen stillschweigend unterstellt, dass seine Leser keine Schwierigkeiten bei der Elimination einer Unbestimmten aus zwei algebraischen Gleichungen haben (Tschirnhaus 1683). Lagrange erl¨ autert seine Ausf¨ uhrungen nun an Hand der allgemeinen Gleichung dritten Grades x3 + mx2 + nx + p = 0, wobei er f¨ ur die Hilfsgleichung x2 = bx + a + y ¨ ansetzt. Der Ubersichtlichkeit halber folgen wir nun nicht Lagrangens Rechnung, sondern benutzen die Sylvestermatrix f¨ ur die Polynome f := x3 + mx2 + nx + p 2 und gy = x − bx − a − y. Die Sylvestermatrix ist gleich 1 0 1 0 0
m n 1 m −b −a − y 1 −b 0 1
p n 0 −a − y −b
0 p 0 0 −a − y
Es gilt nun, deren Determinante auszurechnen. Dazu subtrahiere man die erste Zeile von der dritten und die zweite von der vierten. Dann addiere man das (b+m)fache der zweiten Zeile zu der dritten. Man erh¨ alt die Matrix 1 0 0 0 0
m 1 0 0 0
n m −a − y − n + m(b + m) −b − m 1
p 0 n p −p + n(b + m) p(b + m) −a − y − n −p −b −a − y
¨ 3. Uber die Aufl¨ osung der Gleichungen dritten Grades
65
Die Determinante dieser Matrix ist −(a + y)3 + (m2 + mb − 2n)(a + y)2 − nb2 + (mn − 3p)b + n2 − 2mp (a + y) + p(b3 + mb2 + bn + p). Dies ist, vom Vorzeichen abgesehen, auch das, was Lagrange durch Elimination von x aus den beiden Gleichungen erh¨ alt. Multipliziert man dieses Polynom mit −1 und entwickelt das entstehende Polynom nach Potenzen von y, so erh¨ alt man das Polynom y 3 + Ay 2 + By + C mit
A = 3a − mb − m2 + 2n, B = 3a2 − 2a(mb + m2 − 2n) + nb2 + (mn − 3p)b + n2 − 2mp, C = a3 − (mb + m2 − 2n)a2 + nb2 + (mn − 3p)b + n2 − 2mp a − p(b3 + mb2 + nb + p).
Gesucht sind nun a und b, so dass A = 0 = B ist. Elimination von a aus den Polynomen A und B ergibt dann eine Gleichung vom Grade 1 · 2 f¨ ur b. Die beiden Wurzeln dieser Gleichung liefern mittels A = 0 f¨ ur a ebenfalls zwei Werte, so dass es also zwei Paare (a, b) gibt, f¨ ur die A = 0 = B gilt. F¨ ur jeden dieser Werte gibt es drei Wurzeln der Gleichung y 3 + C = 0, n¨ amlich
√ 3 y = − C,
√ 3 −α C,
√ 3 −α2 C,
wobei α wieder eine primitive dritte Einheitswurzel bezeichne. Jedes dieser sechs Tripel (a, b, y) liefert mittels der Gleichung x2 = bx + a + y zwei Kandidaten f¨ ur eine Wurzel der Gleichung x3 + mx2 + nx + p = 0, so dass wir insgesamt zw¨olf Kandidaten haben. Um zu entscheiden, welche der beiden Kandidaten der richtige sei, empfiehlt er, den gr¨ oßten gemeinsamen Teiler der Polynome x3 + mx2 + nx + p und x2 − bx − a − y
66
Kapitel VIII. Lagrange
auszurechnen. Diese Idee spielt auch im allgemeinen Falle ihre Rolle, wie wir noch sehen werden (Abschnitt 5). Der gr¨ oßte gemeinsame Teiler hat mindestens den Grad 1, weil die Resultante dieser beiden Polynome ja 0 ist, meist aber auch nur den Grad 1. Den Vorteil der tschirnhausenschen Methode sieht er darin, dass sie nicht auf eine Gleichung sechsten Grades, sondern auf eine Gleichung zweiten und eine (reine) Gleichung dritten Grades f¨ uhrt. Beispiele rechnet er nicht. ¨ Uber den Zusammenhang zwischen der Berechnung des gr¨oßten gemeinsamen Teilers zweier Polynome und der Elimination einer gemeinsamen Unbestimmten schreibt Lagrange im Vor¨ ubergehen: En effet, la m´ethode ordinaire d’´elimination, suivant laquelle on fait disparaitre successivement les plus hautes puissances de l’inconnue en d´eduisant, des deux ´equations donn´ees o` u la mˆeme inconnue se trouve ´elev´ee ` a des puissances quelconques, une suite d’autres ´equations o` u le plus haut degr´e de l’inconnue est successivement moindre, jusqu’` a ce qu’on arrive ` a une ´equation o` u l’inconnue ne se trouve plus, et qui est le r´esultat de l’´elimination; cette m´ethode, dis-je, revient dans le fond ` a la mˆeme que celle qui sert a ` trouver le plus grand commun diviseur des deux quantit´es qui forment les premiers membres des deux ´equations donn´ees; les restes que l’on aura par les divisions successives qu’il faudra faire donneront, ´etant ´egal´es a ` z´ero, les mˆemes ´equations que celles qui proviennent de l’´elimination; le dernier reste o` u l’inconnue ne se trouve plus devra ˆetre ´egal a ` z´ero pour que les deux quantit´es propos´ees aient un diviseur commun du premier degr´e, lequel sera par cons´equent l’avant dernier reste o` u l’inconnue ne sera que lin´eaire; de sorte qu’en ´egalant aussi ` a z´ero cet avant-dernier reste on aura une valeur de l’inconnue qui sera la racine commune des deux ´equations. Hier ist er davon ausgegangen, dass die beiden Gleichungen nur eine Wurzel gemeinsam haben. Er schildert dann auch noch, was passiert, wenn sie zwei und mehr Wurzeln gemeinsam haben. Was durch dieses Zitat aber insbesondere klar wird, ist, dass der euklidische Algorithmus f¨ ur Polynome zu Lagrangens Zeiten wohletabliert war. Die Zusammenh¨ ange zwischen der Resultanten und ihrer Berechnung und dem euklidischen Algorithmus zur Berechnung des gr¨ oßten gemeinsamen Teilers zweier Polynome haben wir im vorigen Kapitel im Detail untersucht. Lagrange diskutiert nun noch zwei von Euler bzw. B´ezout stammende L¨osungsverfahren f¨ ur Gleichungen dritten Grades, die sich als Varianten der tschirnhausenschen L¨ osung erweisen. Dies werden wir hier nicht weiter verfolgen. Es sei aber noch res¨ umiert, was die beiden Verfahren re¨ ussieren ließ. Das huddesche Verfahren. Hier gelingt es, eine einfach zu l¨ osende Gleichung sechsten Grades, die huddesche Resolvente, zu finden, deren Koeffizienten sich rational durch die Koeffizienten der Ausgangsgleichung ausdr¨ ucken lassen. Die Nullstellen der huddeschen Resolventen sind von der Form 1 3 (xσ(1)
+ αxσ(2) + α2 xσ(3) ),
wobei α eine primitive dritte Einheitswurzel und x1 , x2 , x3 die Nullstellen der gegebenen Gleichung sind und σ die S3 durchl¨ auft. Der Ansatz ist dar¨ uber hinaus so, dass sich die xi aus den Nullstellen der huddeschen Resolventen wiederum
¨ 4. Uber die Aufl¨ osung der Gleichungen vierten Grades
67
einfach bestimmen lassen. Die huddesche Resolvente ist nichts Anderes als das ¨ ber dem K¨ orper der symmetrischen ratioMinimalpolynom von 13 (x1 + x2 + x3 ) u nalen Funktionen in den Unbestimmten x1 , x2 , x3 . Das tschirnhausensche Verfahren. Dieses Verfahren f¨ uhrt auf eine quadratische Gleichung, deren Koeffizienten sich rational durch die Koeffizienten der gegebenen Gleichung ausdr¨ ucken lassen. Nach dem L¨osen dieser Gleichung ist noch eine reine Gleichung dritten Grades zu l¨ osen. Diese Daten liefern ein Hilfspolynom des Grades 2, das einen nicht trivialen Teiler mit dem Ausgangspolynom gemeinsam hat. Die Nullstellen dieses nicht trivialen Teilers sind auch Nullstellen des Ausgangspolynoms. Sie sind u ¨ berdies leicht zu bestimmen, da der Grad des Hilfspolynoms ja 1 oder 2 ist. ¨ 4. Uber die Aufl¨ osung der Gleichungen vierten Grades. Der Erste, der Gleichungen vierten Grades allgemein gel¨ ost habe, sei Lodovico Ferrari gewesen, Zeitgenosse und sogar Sch¨ uler von Cardano. Seine Methode best¨ unde darin, die gegebene Gleichung in zwei Teile zu zerlegen und zu beiden Teilen ein und dieselbe Gr¨ oße zu addieren, so dass er aus jedem Einzelnen der Teile die Quadratwurzel ziehen k¨ onne, so dass er das Problem auf ein quadratisches zur¨ uckgef¨ uhrt h¨ atte. Bis hin zu Descartes seien alle Analysten ihm gefolgt. Descartes habe eine weniger einfache und weniger direkte L¨osung gegeben, die aber in gewisser Hinsicht dem Problem ad¨ aquater sei. Ihm folgten die Mehrzahl der Autoren bis heute. Er beg¨ anne also damit, diese beiden Methoden, eine nach der anderen, zu untersuchen. Darauf werde er zu den sonstigen bekannten L¨osungen dieser Sorte von Gleichungen kommen, darunter denen von Tschirnhaus, Euler und B´ezout. Lagrange geht dann auf die ferrarische L¨ osung ein, mit dem er annimmt, dass die Gleichung vierten Grades ihres zweiten Gliedes beraubt sei. Er betrachtet also die Gleichung x4 + nx2 + px + q = 0, wobei n, p und q wieder Unbestimmte sind. Diese Gleichung formt er um zu x4 = −nx2 − px − q und addiert auf beiden Seiten 2x2 y + y 2 . Damit erh¨alt er (x2 + y)2 = (2y − n)x2 − px + y 2 − q. Nun ist die rechte Seite gleich — diesen Zwischenschritt macht Lagrange nicht — y2 − q p (2y − n) x2 − 2 x+ . 2(2y − n) 2y − n Nimmt man nun an, was Lagrange tut, ohne ein Wort dar¨ uber zu verlieren, dass man aus 2y − n die Quadratwurzel ziehen kann, so ist dies genau dann ein vollst¨andiges Quadrat, wenn y2 − q p2 , = 2 4(2y − n) 2y − n
68
Kapitel VIII. Lagrange
dh., wenn p2 = (y 2 − q)(2y − n) 4 ist. Letzteres ist alles, was Lagrange sagt. Die letzte Gleichung ist gleichbedeutend mit der Gleichung n 4nq − p2 = 0. y 3 − y 2 − qy + 2 8 Hat man nun ein solches y — und kubische Gleichungen lassen sich ja l¨ osen —, so wird aus der ersten Gleichung die Gleichung (x + y) = (2y − n) x − 2
Hieraus folgt
2
x +y = x− 2
Setzt man z :=
√ 2y − n, so folgt
p 2(2y − n)
2 .
p 2y − n. 2(2y − n)
x2 − zx + y +
p =0 2z
1 2p x= − 4y . z + z2 − 2 z
und weiter
Dies ergibt schließlich 2p 1 2y − n + −2y − n − √ . x= 2 2y − n Da das Wurzelziehen doppeldeutig ist, ergibt ur die Ausgangs√ dies vier Wurzeln f¨ urlich das gleigleichung. (F¨ ur die beiden Vorkommen von 2y − n muss man nat¨ che Vorzeichen w¨ahlen.) Die ferrarische Methode erfordert nicht wirklich, dass das kubische Glied in der Gleichung fehlt. Lagrange geht daher des Weiteren von der Gleichung x4 + mx3 + nx2 + px + q = 0 aus. Er quadriert x2 +
mx +y 2
und dr¨ uckt x4 mittels der Ausgangsgleichung aus. Er erh¨ alt 2 mx m2 + y = 2y + − n x2 + (my − p)x + y 2 − q. x2 + 2 4
¨ 4. Uber die Aufl¨ osung der Gleichungen vierten Grades
69
Damit die rechte Seite zu einem vollst¨andigen Quadrat wird, muss wieder
my − p 2
2
m2 − n (y 2 − q) = 2y + 4
gelten. Das ergibt f¨ ur y die kubische Gleichung y3 −
(4n − m2 )q − p2 n 2 mp − 4q y + y+ = 0. 2 4 8
Dies stimmt f¨ ur m = 0 mit der vorigen Gleichung f¨ ur y u ¨ berein. Setzt man nun z :=
2y +
m2 4
− n, so erh¨alt man
2 2 mx my − p + y = z2 x + x2 + 2 2z 2 und weiter x2 +
my − p mx + y = zx + . 2 2z
Hieraus folgt wiederum x2 +
m my − p −z x+y− = 0. 2 2z
Weiter folgt 1 m 2(my − p) m2 2 x= + z − mz + − 4y + z− . 2 2 4 z Ersetzt man z wieder durch
2y +
m2 4
− n, so ergibt sich schließlich
1 2 m 1 m2 m2 4 n − mn + 2p − + 2y + − n + −2y + −n− x= . 2 2 2 4 2 2y + m4 − n Das ergibt vier Werte f¨ ur x. Weil die Gleichung f¨ ur y kubisch ist, erh¨ alt man drei L¨ osungen f¨ ur y und damit zw¨olf Kandidaten f¨ ur x. Das bedeutet, so schließt Lagrange, dass obige L¨ osung x eigentlich Wurzel einer Gleichung vom Grade 12 ist. Diese Gleichung gilt es nun zu finden. Lagrange geht hierzu wieder auf die Gleichung (A)
2 2 mx my − p + y = z2 x + x2 + 2 2z 2
70
Kapitel VIII. Lagrange
zur¨ uck, wobei z 2 = 2y +
m2 −n 4
ist. Lagrange setzt zun¨ achst allgemeiner m2 −n . z 2 = k 2y + 4 Dies wird in die Gleichung (A) eingesetzt und y dann mittels der kubischen Gleichung f¨ ur y eliminiert. Man erh¨ alt zun¨ achst 2 m2 my − p − n x2 + (my − p)x = k 2y + z2 x + 2z 2 4 (my − p)2 + . 2 4k(2y + m4 − n) Nun gilt aber (my − p)2 = 4
m2 2y + − n (y 2 − q). 4
Es folgt 2 m2 y2 − q my − p 2 z x+ − n x . = k 2y + + (my − p)x + 2z 2 4 k 2
und mit (A) dann (B)
2 mx m2 y2 − q 2 x + + y = k 2y + − n x2 + (my − p)x + . 2 4 k
Die linke Seite von (B) ergibt x4 +
m2 x2 + y 2 + mx3 + 2x2 y + mxy. 4
Bringt man die rechte Seite von (B) ebenfalls nach links, so erh¨ alt man mit ein wenig Rechnung m2 x4 + mx3 + kn + (1 − k) 2y + x2 + px 4 q + (k − 1)y 2 = 0. + k
¨ 4. Uber die Aufl¨ osung der Gleichungen vierten Grades
71
Setze X := x4 + mx3 + nx2 + px + q und h := k − 1. Dann wird aus der letzten Gleichung die Gleichung m2 y2 − q 2 − 2y x + X +h n− = 0. 4 k Hieraus gilt es nun, wie schon gesagt, y mittels der Gleichung y3 −
(4n − m2 )q − p2 n 2 mp − 4q y + y+ =0 2 4 8
zu eliminieren. Wir setzen nun m2 y2 − q 2 F := X + h n − − 2y x + 4 k und g := y 3 −
(4n − m2 )q − p2 n 2 mp − 4q y + y+ . 2 4 8
Dann ist Resy (F, g) das Resultat der Elimination. Sind y , y , y die Wurzeln von g, so gilt nach Satz 4 von Abschnitt 2 des Kapitels 7, dass Resy (F, g) = F (y )F (y )F (y ) ist. Wie in diesem Abschnitt schon gesagt, findet sich ein gleichwertiges Ergebnis im ersten Teil von Lagrangens Arbeit (Lagrange 1770/71, S. 230 f.), wobei Lagrange sagt, dass dieses Ergebnis sich schon in Gabriel Cramers Introduction a l’analyse des lignes courbes f¨ ` ande. Dieses Ergebnis benutzt Lagrange hier und folgert, dass die Koeffizienten von Resy (F, g) rational von den Koeffizienten von g abhingen, ohne dass man Wurzeln ziehen m¨ usse. Als Begr¨ undung gibt er an, dass das Produkt auf der rechten Seite bei allen Permutationen von y , y , y unver¨ andert bliebe. Nach dieser Begr¨ undung rechnet er aber noch ausdr¨ ucklich nach, wie die Koeffizienten von Res(F, g) von den Koeffizienten von g abh¨ angen. Es dauert eine Weile, bis er die n¨ otigen Rechnungen durchgef¨ uhrt hat. Weil X ein Polynom vom Grade 4 in x ist, und x außerhalb X in F nur quadratisch vorkommt, ist der Grad von F in x gleich 4. Hieraus folgt, dass der Grad von Resy (F, g) in x gleich 12 ist. Geht man nun auf den urspr¨ unglichen Fall zur¨ uck, wo k = 1 und damit h = 0 ist, so folgt Resy (F, g) = X 3 , so dass im Hintergrund der L¨ osung der Gleichung X = 0 die L¨ osung einer Gleichung 12. Grades steht, wie von Lagrange behauptet. Die L¨ osungen dieser Gleichung haben alle die Vielfachheit 3.
72
Kapitel VIII. Lagrange
Wir diskutieren immer noch den ferrarischen Ansatz, dem Lagrange noch eine weitere Nuance abgewinnt. Ist n¨amlich y Wurzel der Reduzierten, so kann man der urspr¨ unglichen Gleichung die Form 2 2 mx my − p 2 2 +y −z x+ =0 x + 2 2z 2 geben. Hieraus ergibt sich, dass x eine der beiden Gleichungen my − p mx +y+z x+ x2 + = 0, 2 2z 2 my − p mx +y−z x+ x2 + = 0, 2 2z 2 dh., eine der beiden Gleichungen m my − p +z x+y+ = 0, x2 + 2 2z m my − p x2 + −z x+y− = 0, 2 2z erf¨ ullt. Die vier L¨ osungen, die man insgesamt erh¨alt, sind dann alle L¨ osungen der Ausgangsgleichung. Es seien a und b die L¨osungen der ersten dieser quadratischen Gleichung und c und d die L¨ osungen der zweiten. Dann ist m − z, 2
ab = y +
my − p 2z
m + z, 2
cd = y −
my − p . 2z
a+b=− und c+d =− Hieraus folgt
c+d−a−b ab + cd und y = . 2 2 Dies zeigt, dass man f¨ ur y nur die Werte z=
ab + cd , 2
ac + bd , 2
ad + bc 2
haben kann, was best¨ atigt, dass y einer Gleichung dritten Grades gen¨ ugt. Diese Bemerkung f¨ uhrt zu einer direkten Herleitung der Reduzierten einer Gleichung vierten Grades. Dazu betrachtet er die Kombination (combinaison) ab + cd der vier Wurzeln. Diese hat nur drei Variationen, n¨ amlich ab + cd,
ac + bd,
ad + bc.
¨ 4. Uber die Aufl¨ osung der Gleichungen vierten Grades
73
Setze u := ab + cd. Dann ist u Wurzel einer Gleichung dritten Grades der Form u3 − Au2 + Bu − C = 0. Die Natur von Gleichungen besage dann, dass A = ab + cd + ac + bd + ad + cb B = (ab + cd)(ac + bd) + (ab + cd)(ad + cb) + (ac + bd)(ad + bc) C = (ab + cd)(ac + bd)(ad + bc) ist. Dies rechnet er um zu A = ab + ac + ad + bc + bd + cd B = a2 (bc + bd + cd) + b2 (ac + ad + cd) + c2 (ab + ad + bd) + d2 (ab + ac + bc) C = abcd(a2 + b2 + c2 + d2 ) + a2 b2 c2 a2 b2 d2 + a2 c2 d2 + b2 c2 d2 . Nun ist aber
−m = a + b + c + d n = ab + ac + ad + bc + bd + cd −p = abc + abd + acd + bcd q = abcd.
Also ist A = n. Ferner ist
a(bc + bd + cd) = −p − bcd b(ac + ad + cd) = −p − acd c(ab + ad + bd) = −p − abd d(ab + ac + bc) = −p − abc.
Also ist B = (a + b + c + d)(−p) − 4abcd = mp − 4q. Um C auszurechnen, bemerkt Lagrange zun¨achst, dass a2 + b2 + c2 + d2 = m2 − 2n ist. Dies ist nat¨ urlich eine der newtonschen Formeln, was er aber nicht erw¨ahnt. Es folgt abcd(a2 + b2 + c2 + d2 ) = (m2 − 2n)q. Quadriert man p, so folgt a2 b2 c2 + a2 b2 d2 + a2 c2 d2 + b2 c2 d2 = p2 − 2abcd(ab + ac + ad + bc + bd + cd) = p2 − 2nq.
74
Kapitel VIII. Lagrange
Die Reduzierte ist also u3 − nu2 + (mp − 4q)u − (m2 − 4n)q − p2 = 0. Der Zusammenhang mit der fr¨ uheren Reduzierten wird durch u = 2y hergestellt. Lagrange zeigt nun, dass die Kenntnis einer L¨ osung u der Reduzierten gen¨ ugt, a, b, c und d zu berechnen. Es ist ja u = ab + cd und abcd = q. Also sind ab und cd L¨osungen der Gleichung t2 − ut + q = 0. Nennt man die L¨ osung dieser Gleichung t und t , so ist also t = ab und t = cd. Man hat weiter −p = ab(c + d) + cd(a + b) = t (c + d) + t (a + b). Ferner ist a + b + c + d = −m. Es folgt a+b=
p − mt p − mt und c + d = . t −t t − t
osungen der Gleichung Da außerdem ab = t und cd = t ist, sind a und b die L¨ x2 −
p − mt x + t = 0 t − t
und c und d die L¨ osungen der Gleichung x2 −
p − mt x + t = 0. t − t
Um also die Gleichung x4 + mx3 + nx2 + px + q = 0 zu l¨ osen, bestimme man eine L¨osung u der Reduzierten u3 − nu2 + (mp − 4q)u − (m2 − 4n)q − p2 = 0, bestimme die beiden L¨osungen t und t der Gleichung t2 − ut + q = 0, um in den insgesamt vier L¨osungen der beiden quadratischen Gleichungen x2 −
p − mt x + t = 0 t − t
¨ 4. Uber die Aufl¨ osung der Gleichungen vierten Grades und x2 −
75
p − mt x + t = 0 t − t
die vier L¨ osungen der Ausgangsgleichung zu finden. Dies zeigt einmal mehr, dass eine L¨osung der Reduzierten gen¨ ugt, um alle L¨ osungen der gegebenen Gleichung zu finden. Eine Bemerkung zwischendurch. Was wir hier sagen, gilt zun¨achst alles nur f¨ ur Gleichungen mit Unbestimmten als Koeffizienten. Es gilt dann aber auch f¨ ur alle Gleichungen, die nur einfache Wurzeln haben, wie man mittels des Einsetzungshomorphismus sieht. Dabei muss man aber noch die Charakteristik des K¨orpers ins Spiel bringen, die im Falle der Gleichungen vierten Grades nicht zwei und drei sein darf. Ob eine Gleichung mehrfache Wurzeln hat, ist aber a priori feststellbar, wie wir wissen. Man konsultiere in diesem Zusammenhang auch den Abschnitt 7 von Kapitel 10. Lagrange variiert auch diesen Ansatz noch einmal, um dann zu Descartes’ Ansatz zu kommen, der eine weitere Variante des ferrarischen Verfahrens ist. Descartes setze an, dass die Gleichung x4 + mx3 + nx2 + px + q = 0 Produkt der beiden Gleichungen x2 + f x + g = 0 und x2 + hx + k = 0 sei. Aus diesem Ansatz folgen die vier Gleichungen f + h = m, f h + g + k = n, f k + gh = p, gk = q. Nimmt man dann zun¨ achst wieder an, dass m = 0 ist, so ergibt sich eine Gleichung sechsten Grades f¨ ur f , die sich als eine Gleichung dritten Grades f¨ ur f 2 interpretieren l¨ asst. Auch hier versucht er zu verstehen, warum der descartessche uhrt. Ansatz notwendig auf eine Gleichung dritten Grades in f 2 f¨ Dann wendet Lagrange sich der tschirnhausenschen Methode zu. Es handelt sich wieder um die Gleichung F (x) = x4 + mx3 + nx2 + px + q = 0. Ist G ein weiteres Polynom in x, so ist Resx (F, G + y) ein Polynom vom Grade 4 in y. Es gen¨ uge nun, G so anzusetzen, dass Resx (F, G+y) ein Polynom vom Grade 2 in y 2 ist. Dazu setze man G := x2 + f x + g.
76
Kapitel VIII. Lagrange
Dann ist Resx (F, G+y) = y 4 +uy 3 +vu2 +wy +z und u, v, w und z sind Polynome in f und g. Es hat u als Polynom in f und g den Grad 1 und w hat als Polynom in f und g den Grad 3, wie wir an der Sylvestermatrix ablesen. (Lagrange spricht in diesem Zusammenhang von Dimension und nicht von Grad.) Daraus erh¨ alt man, indem man diese Koeffizienten gleich null setzt, eine Gleichung in f bzw. in g vom Grade 3. Dies zeige, so Lagrange, dass die tschirnhausensche Methode auch bei Gleichungen vom Grade vier funktioniere. Das werde man nun auch an Hand des Kalk¨ uls sehen. Ist y Nullstelle der Reduzierten, so haben die Polynome x4 + mx3 + nx2 + px + q und x2 + f x + g + y eine gemeinsame Nullstelle und folglich einen gemeinsamen Faktor. Setzt man g := g + y, so liefert Division mit Rest den Rest p − g (m − 2f ) − nf + mf 2 − f 3 x + q − g (n − mf + f 2 ) + g 2 . Weil dieses Polynom den Grad 1 hat und die beiden urspr¨ unglichen Polynome eine gemeinsame Nullstelle haben, ist dieses Polynom der gr¨oßte gemeinsame Teiler der beiden Ausgangspolynome. Es teilt also insbesondere das Polynom x2 + f x + g . Daher ist q − g (n − mf + f 2 ) + g 2 x= 3 f − mf 2 + nf − p + (m − 2f )g Nullstelle von x2 +f x+g . Es folgt, indem man einsetzt und mit dem Hauptnenner multipliziert, 2 q − g (n − mf + f 2 ) + g 2 + f q − g (n − mf + f 2 ) + g 2 f 3 − mf 2 + nf − p + (m − 2f )g 2 + g f 3 − mf 2 + nf − p + (m − 2f )g = 0. Hierin muss man nun g wieder durch g + y ersetzen und das Ganze nach Potenzen von y sortieren. Zun¨ achst sortiert Lagrange hierzu die Gleichung nach Potenzen von g und setzt dabei F := f 3 − mf 2 + nf − p G := f 2 − mf + n H := 2f − m. Er erh¨ alt (q − Gg + g 2 )2 + f (q − Gg + g 2 )(F − Hg ) + g (F − Hg )2 = 0
¨ 4. Uber die Aufl¨ osung der Gleichungen vierten Grades
77
und weiter g 4 − (2G + f H − H 2 )g 3 + (G2 + 2q + f F + f GH − 2F H)g 2 − (2qG + f qH + f F G − F 2 )g + q 2 + qf F = 0. Wenn man die Koeffizienten zu A, B, C und D zusammenfasst, so erh¨alt man g 4 − Ag 3 + Bg 2 − Cg + D = 0. Da g in F , G und H nicht vorkommt, kommt g auch nicht in A, B, C und D vor. Setzt man nun wieder g + y f¨ ur g und entwickelt nach Potenzen von y, so erh¨alt man schließlich y 4 + (4g − A)y 3 + (6g 2 − 3gA + B)y 2 + (4g 3 − 3Ag 2 + 2Bg − C)y + g 4 − Ag 3 + Bg 2 − Cg + D = 0. In dieser Gleichung kann man nun zwei beliebige Koeffizienten zum Verschwinden bringen, etwa, wie anvisiert, die Koeffizienten bei y 3 und y. Es sei also 4g − A = 0 4g 3 − 3Ag 2 + 2Bg − C = 0. Das ergibt, wenn man noch die Br¨ uche beseitigt, A3 − 4AB + 8C = 0. Dr¨ uckt man nun A, B und C wieder durch f aus und sortiert nach Potenzen von f , so erh¨ alt man die Gleichung (m3 − 4mn + 8p)f 3 − (3m4 − 14m3 n + 8n2 + 2mp − 32q)f 2 4 m − 16m3 n + 20m2 p + 16m(n2 − 2q) − 16np f − m6 + 6m4 n − 8m3 bp − 8m2 (n2 − q) + 8mn2 p − 8p2 = 0. Ist f Nullstelle dieser Gleichung dritten Grades, so ist wegen g = y4 − Nun ist C =
AB 2
−
A 4
3A2 A2 B 4AC 3A4 − B y2 − + − + D = 0. 8 256 16 4
A3 8
und daher
y4 −
3A2 A2 B 5A4 − B y2 + − + D = 0. 8 256 16
78
Kapitel VIII. Lagrange
Diese Gleichung l¨ asst sich, wie gew¨ unscht, durch L¨ osen einer Gleichung zweiten Grades und nachfolgendem Ziehen einer Quadratwurzel l¨ osen. Mit den nun gefundenen f und y ergibt sich auf der Stelle (on aura sur-le-champ) 2 A A +y + +y q − n − mf + f 2 4 4 . x= A 3 2 +y f − mf + nf − p + m − 2f 4 Die vier L¨ osungen y erg¨ aben die vier L¨ osungen x der Ausgangsgleichung. Dies bewiese man, wie die entsprechende Aussage unter 28. Das sind die Rechnungen, die hier auf S. 69 mit der Gleichung (A) beginnen. Nun bestimmt Lagrange noch, auf welche Weise f von den vier Wurzeln a, b, c und d der Ausgangsgleichung abh¨ angt, um auf diese Weise zu erkennen, warum f einer Gleichung dritten Grades gen¨ ugt. Er benutzt hier, dass die Wurzeln der Reduzierten in Paaren y , −y und y , −y vorkommen, da die Reduzierte ja eine alt damit vier Gleichungen quadratische Gleichung in y 2 ist. Er erh¨ a2 + f a + g + y = 0 b2 + f b + g − y = 0 c2 + f c + g + y = 0 d2 + f d + g − y = 0. Hieraus folgt zun¨ achst a2 + b2 + f (a + b) + 2g = 0 c2 + d2 + f (c + d) + 2g = 0 und weiter f =−
a2 + b2 − c2 − d2 . a+b−c−d
Um nun alle m¨ oglichen Werte f¨ ur f zu bestimmen, muss man alle Permutationen von a, b, c, d betrachten. Bei diesen Permutationen bleiben die Koeffizienten der Reduzierten ja unangetastet, so dass y und y sich nicht a¨ndern. Die 24 Permutationen ergeben aber nur drei Werte f¨ ur f , n¨ amlich a2 + b2 − c2 − d2 a+b−c−d 2 a + c2 − b2 − d2 a+c−b−d a2 + d2 − b2 − c2 . a+d−b−d
¨ 4. Uber die Aufl¨ osung der Gleichungen vierten Grades
79
Daher gen¨ ugt f einer Gleichung dritten Grades. Des Weiteren geht Lagrange auf den Zusammenhang der Methoden von Ferrari, Descartes und Tschirnhaus ein, was schnell abzuhandeln w¨are, was wir hier aber trotzdem u ¨ bergehen. Man kann bei der tschirnhausenschen Methode das Polynom G als x3 + f x2 + gx + h ansetzen und versuchen, f , g und h so zu bestimmen, dass die Gleichung Resx (F, G + y) = 0 eine reine Gleichung wird. Man erh¨ alt zun¨ achst Resx (F, G + y) = y 4 + Ay 3 + By 2 + Cy + D. Dabei sind A, B und C Polynome in f , g und h von den Graden 1, 2 bzw. 3. Man m¨ochte nun erreichen, dass A = B = C = 0 ist. Eliminiert man g und h aus diesen drei Gleichungen, so erh¨ alt man eine Gleichung vom Grade 1 · 2 · 3, dh. vom Grade 6, wie Lagrange sagt. Deren L¨osung k¨ onne man aber wieder auf die L¨ osung von Gleichungen niedrigeren Grades zur¨ uckf¨ uhren. Nun untersucht er, wie f von den Wurzeln a, b, c, d der Ausgangsgleichung abh¨ angt. Er erh¨ alt einen sehr langen Ausdruck, der unter allen Permutationen von a, b, c, d sechs verschiedene Werte annimmt. Daher gen¨ uge f einer Gleichung sechsten Grades. Dann zeigt er, dass er die L¨osung dieser Gleichung auf Gleichungen niedrigeren Grades zur¨ uckf¨ uhren kann, wobei immer wieder die Permutationen der vier Wurzeln der Ausgangsgleichung ihre Rolle spielen und der Satz von Waring wesentlich ins Spiel kommt. Dabei f¨ allt weder der Name Waring noch wird sein Satz ein f¨ ur alle Mal explizit formuliert. Dies zeigt typischer Weise die folgende Stelle: . . . , on aura des fonctions de a, b, c, d, qui demeureront les m`emes, ” quelque permutation qu’on fasse entre les quantit´es a, b, c, d, et qui pourront par cons´equent s’exprimer par les fonctions rationnelle des coefficients m, n, p, q de la propos´ee dont les quantit´es a, b, c, d sont les racines. De sorte qu’on pourra par ce moyen trouver directement les valeur des coefficients dont il s’agit, comme nous l’avons d´ejˆ a pratiqu´e plusieurs fois dans le cours de ces recherches.“ Bei diesen Untersuchungen ist die Gleichung in y noch nicht explizit aufgetaucht. Sie berechnet er als N¨achstes, wobei er sich, wie schon zuvor, der Division mit Rest bedient. Hier gibt es einen freien Parameter, der je nach Wahl auf die Methode von Euler oder B´ezout f¨ uhrt. Wir fassen zusammen: Das ferrarische Verfahren. Hier wird die gegebene Gleichung so aufgeteilt, dass x4 isoliert auf der linken Seite der Gleichung steht. Addition von 2x2 y + y 2 ergibt auf der linken Seite wiederum ein vollst¨andiges Quadrat, wobei aber die Unbestimmte y eingef¨ uhrt wird. Die rechte Seite wird dann nach L¨ osung einer kubischen
80
Kapitel VIII. Lagrange
Gleichung f¨ ur y zu einem vollst¨andigen Quadrat, wobei die Vollst¨ andigkeit des Quadrates auf der linken Seite nicht zerst¨ ort wird. Aus diesen beiden Gleichungen entstehen dann durch Quadratwurzelziehen je zwei Gleichungen zweiten Grades, die sich wieder l¨ osen lassen. Aus den gewonnenen Informationen lassen sich schließlich die Wurzeln der urspr¨ unglich gegebenen Gleichung berechnen. Weitere Untersuchungen zeigen dann, dass 1 2 (x1 x2
+ x3 x4 ),
1 2 (x1 x3
+ x2 x4 ),
1 2 (x1 x4
+ x2 x3 )
die Wurzeln der Gleichung dritten Grades in y sind, wenn x1 , x2 , x3 und x4 die Wurzeln der Ausgangsgleichung sind. Diese drei Wurzeln werden bei Permutation der xi untereinander vertauscht. Die linke Seite der Gleichung dritten Grades ist daher wieder das Minimalpolynom von jeder der drei Wurzeln u ¨ber dem K¨ orper der symmetrischen Funktionen in x1 , x2 , x3 , x4 . Das tschirnhausensche Verfahren. Hier diskutierte Lagrange zwei M¨oglichkeiten des Ansatzes eines Hilfspoynoms G, einmal die, dass G den Grad 2 hat, und zum andern die, dass G den Grad 3 hat. Im ersten Fall, den wir als einzigen diskutiert haben, gen¨ ugte der Koeffizient des linearen Gliedes von G einer Gleichung dritten Grades. Die Nullstellen dieses Polynoms ließen sich durch die x1 , x2 , x3 , x4 wie folgt ausdr¨ ucken: x21 + x22 − x23 − x24 x1 + x2 − x3 − x4 x21 + x23 − x22 − x24 x1 + x3 − x2 − x4 x21 + x24 − x22 − x23 . x1 + x4 − x2 − x3 Auch diese drei rationalen Funktionen werden von der S4 als Ganzes invariant gelassen. 5. Gleichungen f¨ unften und h¨ oheren Grades. Die Untersuchungen der Gleichungen dritten und vierten Grades dienen Lagrange als Motivation f¨ ur die Untersuchungen der Gleichungen h¨ oheren Grades, die er nun anpackt. Er bemerkt zun¨ achst, dass er neben der tschirnhausenschen Methode aus dem Jahre 1683 nur noch die nicht wesentlich verschiedenen Methoden von Euler und B´ezout kenne, beide 1765 publiziert, den Fall einer Gleichung n-ten Grades anzupacken. Das tschirnhausensche Verfahren f¨ uhre bei Gleichungen f¨ unften Grades auf vier Gleichungen der Grade 1, 2, 3, 4 in vier Unbekannten, die nach Elimination eine Gleichung des Grades 1·2·3·4 = 24 erg¨ aben. Damit h¨ atte man aber nichts gewonnen, es sei denn, man k¨onnte diese Gleichung auf eine des Grades < 5 zur¨ uckf¨ uhren. Das eulersche Verfahren f¨ uhre ebenfalls auf eine Gleichung des Grades 24, w¨ ahrend das b´ezoutsche Verfahren eine Gleichung des Grades 120 liefere, die aber einer Gleichung des Grades 24 gleichwertig sei. B´ezout hoffe — und Lagrange z¨ahlt dessen Gr¨ unde auf, weshalb er hoffe —, dass sich die Gleichung vom Grade 120
5. Gleichungen f¨ unften und h¨ oheren Grades
81
auf eine vom Grade < 5 zur¨ uckf¨ uhren ließe. Lagrange ist skeptisch. Er glaubt nicht, dass diese Methode bei Gleichungen f¨ unften und h¨ oheren Grades zum Ziele f¨ uhrt. Selbst wenn man zu theoretischen Resultaten gelange, seien die Rechnungen so außerordentlich umfangreich, dass sie praktisch von keinem Nutzen seien. Es w¨ are daher sehr zu w¨ unschen, k¨ onne man a priori die Aussichten absch¨ atzen, ob diese Methoden wie bei Gleichungen der Grade 3 und 4 zum Erfolge f¨ uhrten. Er werde daher im Folgenden eine Analyse a¨hnlich der versuchen, die bei den Gleichungen 3. und 4. Grades zum Ziele f¨ uhrte. Die Idee ist die folgende. Gegeben sei die allgemeine Gleichung n-ten Grades f = 0, wobei f = xn + a1 xn−1 + . . . + an ein Polynom ist, dessen Koeffizienten a1 , . . . , an Unbestimmte sind. Man macht den Ansatz hy = xk + b1 xk−1 + . . . + bk + y mit 1 ≤ k < n, wobei u ¨ ber die bi erst sp¨ater verf¨ ugt wird. Zun¨ achst tue man so, als seien sie Unbestimmte. Man nennt hy Hilfspolynom. Dann berechne man g(y) := Resx (f, hy ) = y n + c1 y n−1 + . . . + cn . Man m¨ ochte nun die Unbestimmten bi durch solche Elemente ersetzen, dass k der Koeffizienten ci null werden oder dass gewisse, von k Gleichungen abh¨ angende Relationen zwischen den ci bestehen, so dass es einfach ist, eine Nullstelle λ von g(y) zu bestimmen. Dann haben n¨ amlich f und hλ einen nicht-trivialen — einfach zu berechnenden — Faktor gemein, dessen Grad h¨ ochstens gleich k, also kleiner als n ist. Jede Nullstelle dieses Faktors ist auch Nullstelle von f . Somit w¨ are die Bestimmung einer Nullstelle von f nach der Bestimmung von λ zur¨ uckgef¨ uhrt auf die Bestimmung einer Nullstelle eines Polynomes kleineren Grades. Ist insbesondere k = n − 1 und sind die √ bi so gew¨ahlt, dass c1 = . . . = cn−1 = 0 ist, so ist g(y) = y n + cn . Ist dann λ = n −cn , so haben f und hλ einen Faktor gemeinsam, dessen Grad h¨ ochstens n − 1 ist. Damit w¨are dann das Problem der Nullstellenfindung von f auf das Ausziehen einer n-ten Wurzel und der Nullstellenbestimmung eines Polynoms von einem Grade kleiner oder gleich n − 1 zur¨ uckgef¨ uhrt. Die Idee scheint vielverprechend, doch das Problem ist, die bi zu finden, und dieses Problem erweist sich als un¨ uberwindlich, wie sich schließlich anfangs des 19. Jahrhunderts herausstellen wird, jedenfalls dann, wenn man sich zu ihrer Bestimmung nur der rationalen Rechenoperationen und des Ausziehens von Wurzeln bedienen will. Um etwas mehr u ¨ ber die ci zu erfahren, schreiben wir g(y) mit Hilfe der
82
Kapitel VIII. Lagrange
Sylvestermatrix ein wenig expliziter auf. Es ist ⎛
1 a1 1 ⎜ ⎜ ⎜ ⎜ ⎜ g(y) = det ⎜ ⎜ 1 b1 ⎜ 1 ⎜ ⎝
... ... ... a1 . . . ... ... ... ... 1 a1 . . . . . . bk + y ... b1 . . . ... ... ...
⎞
an ... ... ...
an
... ... ... . . . . . . bk + y
⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠
Die in diesem Schema explizit aufgelisteten Koeffizienten stehen in der Matrix tats¨achlich in der gleichen Spalte, wie sie hier erscheinen. Wir ersetzen die 1 in den letzten n Zeilen der Sylvestermatrix f¨ ur den Augenblick durch die Unbestimmte b0 und zeigen nun die G¨ ultigkeit des folgenden Satzes. Satz 1. f , hy und g(y) seien wie oben gegeben. Dann ist ci ein homogenes Poly¨ber dem Polynomring nom vom Grade i in den Unbestimmten b0 , b1 , . . . , bk u Z[a1 , . . . , an ]. Beweis. Entwickelt man die fragliche Determinante gem¨ aß dem laplaceschen Entwicklungssatz nach den letzten n Zeilen, so sieht man, dass die ci Polynome in den bj sind, deren Koeffizienten wiederum Polynome in den ak sind. Wir schreiben nun ausf¨ uhrlicher g(b0 , . . . , bk , y) und ci (b0 , . . . , bk ) statt g(y) und ci . Ist nun μ eine weitere Unbestimmte, so folgt g(μb0 , . . . , μbk , μy) = μn g(b0 , . . . , bk , y), da ja die letzten n Zeilen der Sylvestermatrix mit μ multipliziert wurden. Es ist also μn y n + c1 (b0 , . . . , bk )y n−1 + . . . + cn (b0 , . . . , bk ) = (μy)n + c1 (μb0 , . . . , μbk )(μy)n−1 + . . . + cn (μb0 , . . . , μbk ). Hieraus folgt wiederum μn ci (b0 , . . . , bk )y n−i = ci (μb0 , . . . , μbk )(μy)n−i f¨ ur i := 1, . . . , n. Dies hat schließlich μi ci (b0 , . . . , bk ) = ci (μb0 , . . . , μbk ) f¨ ur alle i zur Folge. Dies zeigt die Homogenit¨ at der ci und gleichzeitig, dass i der Grad von ci ist, wenn ci nicht null ist. Es ist aber keines der ci gleich null. Dies sieht man, wenn man alle ai gleich null setzt. Dann ist n¨amlich g(y) = (bk + y)n .
5. Gleichungen f¨ unften und h¨ oheren Grades
83
Hieraus folgt ci = ni bik = 0, da wir ja mit Lagrange stillschweigend unterstellen, dass die Charakteristik gleich 0 ist. Lagrange kennt die Sylvestermatrix nicht. Er kommt aber zu dem gleichen Schluss — ohne dass er sagt, wie —, dass die Terme von g(b0 , . . . , bk , y) in b0 , . . . , bk , y allesamt vom Grade n sind, wobei er statt Grad“ das Wort dimension ” benutzt. Was bei uns bi heißt, heißt bei ihm a, b, c, . . . , wobei er fortf¨ ahrt: y compris l’unit´e, coefficient de la plus haute puissance de x dans l’´equation suppos´ee (Lagrange 1770/71, S. 231). Welcher Buchstabe f¨ ur 1 steht, sagt er nicht. Der Beweis, dass ci = 0 ist, zeigt auch die G¨ ultigkeit des folgenden Korollars. Korollar 1. Das Polynom ci hat, aufgefasst als Polynom in bk , den Grad i. Wegen k ≥ 1 folgt weiter das n¨ achste Korollar. Korollar 2. Der Grad von ci ist gleich i, auch wenn b0 = 1 gesetzt wird . Im Folgenden setzen wir wieder voraus, dass b0 = 1 ist. Dann sind die Polynome c1 , . . . , cn also Polynome in den Unbestimmten b1 , . . . , bk und der Grad von ci ist ¨ i. Uber die bj soll nun so verf¨ ugt werden, dass ci1 = 0, . . . , cik = 0 ist. Das f¨ uhre nach Elimination auf eine Gleichung des Grades i1 · i2 · · · ik , bemerkt Lagrange. Nach Elimination“, das ist so ein Stichwort! Lagrange benutzt dieses Argument ” immer wieder und kann sich anscheinend darauf verlassen, dass seine Zeitgenossen verifizieren k¨ onnen, was er sagt. Der Satz, der benutzt wird, lautet, dass aus k Gleichungen der Grade n1 , . . . , nk in k Unbestimmten k − 1 der Unbestimmten eliminiert werden k¨ onnen, wobei man ein Polynom des Grades n1 · · · nk in der letzten Unbestimmten erh¨alt. Zu jeder Wurzel der letzten Gleichung kann man dann auch Belegungen der restlichen Unbestimmten finden, so dass die Belegung der k Unbestimmten eine simultane L¨osung der Ausgangsgleichungen ist. Was man in der Literatur hierzu findet, ist d¨ urftig oder aber sehr komplex. Auch ich werde mich um diese Fragen dr¨ ucken, da sie f¨ ur die Rechenpraxis keine Bedeutung zu haben scheinen und theoretisch durch andere Argumente ersetzt werden k¨ onnen, die Lagrange uns liefert, wie wir gleich sehen werden. Neben dem gerade diskutierten Fall, dass k = n − 1 ist. Diskutiert Lagrange auch noch den Fall, dass n zusammengesetzt ist. Dazu sei etwa n = pq. Hier bringe man alle ci zum verschwinden, bei denen i nicht durch p teilbar ist. Dann ist g(y) ein Polynom in y p . Ersetzt man y p durch z, so erh¨alt man ein Polynom in z vom Grade q, wobei q kleiner als n ist. Hier ist — man f¨angt bei 0 an zu z¨ ahlen — k = pq + 1 − (q + 1) = (p − 1)q uhrt auf eine Gleichung vom Grade und Elimination der bj f¨ (pq − 1)! . (q − 1)!pq−1
84
Kapitel VIII. Lagrange
Dies ist kleiner als (n − 1)! Dieser Ansatz f¨ uhrte bei Gleichungen vierten Grades auf eine Gleichung dritten Grades, also zum Erfolg. Diesen Fall haben wir im letzten Abschnitt beschrieben. Die Methode von Tschirnhaus f¨ uhrt bei h¨ oheren Graden auf eine Reduzierte sehr hohen Grades und es sei a posteriori nicht m¨oglich zu entscheiden, ob das Problem der Nullstellenfindung der Reduzierten, sich auf eine Gleichung niedrigeren Grades zur¨ uckf¨ uhren ließe. Man k¨ onne dies aber a priori entscheiden, indem man untersuche, wie ihre Wurzeln von den Wurzeln der gegebenen Gleichung abhingen. Hier ist bemerkenswert, dass Lagrange unterstellt, dass algebraische Gleichungen stets n L¨ osungen haben — die Existenz der n-ten Einheitswurzeln aber ausf¨ uhrlich beweist. Dass man dies zumindest f¨ ur die allgemeine Gleichung n-ten Grades annehmen darf, liegt daran, dass der Polynomring R[λ1 , . . . , λn ] in den elementarsymmetrischen Funktionen λi zum Ring R[a1 , . . . , an ] in den Unbestimmten a1 , . . . , an isomorph ist. Ein solcher Isomorphismus wird definiert, indem man als Bild von ai das Element (−1)i λi nimmt. Identifiziert man also ai mit (−1)i λi und sind die λi die elementarsymmetrischen Funktionen in den Unbestimmten x1 , x2 , . . . , xn , so sind die xi die Nullstellen des Polynoms xn +
n
ai xn−i .
i:=1
Diese aber sind paarweise verschieden. Lagrange beginnt seine a-priori-Untersuchungen der Reduzierten mit dem Fall der Hilfsgleichung der Form hy = xn−1 + b1 xn−2 + . . . + bn−1 + y. Es sei α eine primitive n-te Einheitswurzel. Dann ist
(A)
xn−1 + b1 xn−2 1 1 n−1 + b1 xn−2 x2 2 + b1 xn−2 xn−1 3 3 ··· xn−1 + b1 xn−2 n n
+ . . . + bn−1 + . . . + bn−1 + . . . + bn−1 ··· + . . . + bn−1
+ + +
u = 0 αu = 0 α2 u = 0 ··· + αn−1 u = 0
ein lineares Gleichungssystem f¨ ur die Unbekannten b1 , . . . , bn−1 , u. Die Koeffizientenmatrix dieses Systems ist ⎞ ⎛ n−2 . . . x01 1 x1 n−2 0 . . . x2 α ⎟ ⎜ x2 ⎟ ⎜ n−2 . . . x03 α2 ⎟ . ⎜ x3 ⎠ ⎝ ... ... ... ... n−2 0 n−1 xn . . . xn α Die Kofaktoren der Einheitswurzeln in der letzten Spalte sind allesamt Vandermondedeterminanten und folglich, da die xi paarweise verschieden sind, von null
5. Gleichungen f¨ unften und h¨ oheren Grades
85
verschiedene Polynome. Entwickelt man die Determinante nach der letzten Spalte, so sieht man, dass sie von null verschieden ist. Folglich gibt es genau eine L¨osung are n¨ amlich u = 0, so h¨ atte man ein b1 , . . . , bn−1 , u. Es zeigt sich, dass u = 0 ist. W¨ homogenes Gleichungssystem mit der L¨osung 1, b1 , . . . , bn−1 , so dass die Determinante seiner Koeffizientenmatrix 0 w¨are. Diese Determinante ist aber ebenfalls eine Vandermondedeterminante, die von null verschieden ist, da die xi paarweise verschieden sind. osungen Satz 2. Interpretiert man die Unbestimmten bi der Hilfsgleichung als die L¨ des Gleichungssystems (A), so ist g(y) =
n−1
(y − αi u) = y n − un ,
i:=0
das heißt, es ist c1 = . . . = cn−1 = 0 und cn = −un . Beweis. In diesem Falle haben f und hαi u die gemeinsamen Nullstellen xi . Daher ist g(αi u) = 0 f¨ ur i := 0, . . . , n − 1. Weil u = 0 ist, sind dies n verschiedene Nullstellen von g, so dass nach dem Satz von Nu˜ nez in der Tat g(y) =
n−1
(y − αi u) = y n − un
i:=0
ist. Das Gleichungssystem f¨ ur b1 , . . . , bn−1 , u zeigt, dass die bi rationale Funktionen der x1 , . . . , xn , α0 , . . . , αn−1 sind. Die explizite Bestimmung dieser Funktionen wird im Folgenden aber nicht gebraucht. Die Zuordnung von xi zu αi−1 u ist nat¨ urlich willk¨ urlich. Man kann irgendeine Permutation σ ∈ Sn nehmen und die Gleichungen n−2 xn−1 σ(1) + b1 xσ(1) n−1 xσ(2) + b1 xn−2 σ(2) n−2 xn−1 + b x 1 σ(3) σ(3) ··· n−2 xn−1 σ(n) + b1 xσ(n)
+ . . . + bn−1 + . . . + bn−1 + . . . + bn−1 ··· + . . . + bn−1
+ + +
u = 0 αu = 0 α2 u = 0 ··· + αn−1 u = 0
betrachten. Da es n! Permutationen gibt, gibt es n! verschiedene Gleichungssysteme. Die Frage ist, ob sie auch verschiedene L¨ osungssysteme haben. Nicht immer, ist die Antwort, jedenfalls nicht, was die bi anbelangt. Zu jedem σ ∈ Sn gibt es eine Permutation τ auf der Menge {0, . . . , n − 1}, so dass das gerade notierte Gleichungssystem, von der Reihenfolge der Gleichungen abgesehen, mit dem Gleichungssystem xn−1 + b1 xn−2 1 1 n−1 x2 + b1 xn−2 2 xn−1 + b1 xn−2 3 3 ··· + b1 xn−2 xn−1 n n
+ . . . + bn−1 + . . . + bn−1 + . . . + bn−1 ··· + . . . + bn−1
ατ (0) u = 0 ατ (1) u = 0 ατ (2) u = 0 ··· + ατ (n−1) u = 0 + + +
86
Kapitel VIII. Lagrange
u ¨ bereinstimmt. Dieses Gleichungssystem bezeichnen wir mit Gτ . Wir betrachten nun die Permutation ρ, f¨ ur die αρ(i) = α1+i ist. Dieses ρ erzeugt eine zyklische Untergruppe Z der Ordnung n in Sn (abus de notation). Satz 3. Die Bezeichnungen seien die eingef¨ uhrten. Sind σ, τ ∈ Sn und gilt τ σ −1 ∈ Z und ist b1 , . . . , bn−1 , u L¨ osung von Gσ , so ist b1 , . . . , bn−1 , u L¨ osung von Gτ . i Dabei ist u = α u , wobei i dadurch bestimmt ist, dass τ σ −1 = ρi ist. Beweis. Nach Voraussetzung gibt es ein i mit τ σ −1 = ρi , dh., τ = ρi σ. F¨ ur die Potenzen von α in der letzten Spalte gilt dann i
ατ (k) = αρ
σ(k)
= αi+σ(k) = αi ασ(k) .
Das heißt, dass die letzte Spalte der Koeffizientenmatrix von Gτ sich von der von Gσ gerade durch den Faktor αi unterscheidet. Sind nun b1 , . . . , bn−1 und u die L¨osungen von Gσ und b1 , . . . , bn−1 , u die von Gτ , so folgt mittels der cramerschen Regel (Kapitel 6, Abschnitt 4), dass bei den bi sowohl im Z¨ahler als im Nenner der Faktor αi auftaucht, sich also weghebt. Also gilt bi = bi f¨ ur alle i. F¨ ur u gilt jedoch, dass αi nur im Nenner vorkommt. Daraus folgt dann auch die Aussage u ¨ ber u und u . Die L¨osungen des Gleichungssystems Gσ bezeichnen wir mit bi,σ , uσ . Ferner sei U0 die Untergruppe von Sn die den Punkt 0 festl¨ asst. Dann ist Sn = ZU0 und Z ∩U0 = {1}. Dann sind die Gleichungssysteme Gσ mit σ ∈ U0 die Kandidaten f¨ ur unterschiedliche L¨ osungen der b1,σ , . . . , bn−1,σ . Alle anderen Gleichungssysteme bieten nach Satz 3 nichts Neues. Satz 4. Die Bezeichnungen seien die eingef¨ uhrten. Setze Fi :=
(x − bi,σ )
σ∈U0
f¨ ur i := 1, . . . , n − 1. Dann ist Fi ∈ Q(a1 , . . . , an )[x]. Insbesondere sind die Koeffizienten von Fi unabh¨ angig von α und der Grad von Fi ist (n − 1)! Beweis. Die Aussage u ¨ ber den Grad ist klar. Eine beliebige Permutation der αj permutiert die bi,σ untereinander. Betrachtet man daher Fi als rationale Funktion in den αj , so ist Fi einei Funktion in den elementarsymmetrischen Funktionen in den αj . Diese haben aber alle die Werte 1 oder −1. Fasst man Fi auf als rationale Funktion in den xj , so bleibt Fi ebenfalls unter allen Permutationen der xj invariant. Somit ist Fi eine rationale Funktion in den elementarsymmetrischen Funktionen der xj und damit eine rationale Funktion in den aj . Damit ist alles bewiesen.
5. Gleichungen f¨ unften und h¨ oheren Grades
87
Lagrange argumentiert anders, umst¨ andlicher. Dabei gibt er eine rekursive Eronnen: Ist U0 ∼ zeugung der Sn , die wir so andeuten k¨ = Sn−1 schon gegeben, so ist Sn = U0 ∪ (0, 1)U0 ∪ (0, 2)U0 ∪ . . . ∪ (0, n − 1)U0 . Dabei bezeichne (0, i) die Transposition, die 0 mit i vertauscht. Er kommentiert dies nicht (Lagrange 1770/71, S. 312). Diese Erzeugung zeigt gleichzeitig, dass die ater aufgel¨ ost (s. Sn von Transpositionen erzeugt wird. Diese Rekursion wird sp¨ Abschnitt 6). alt, wenn man aus den c1 (b1 , . . . , bn−1 ), Die Fi sind die Polynome, die man erh¨ . . . , cn−1 (b1 , . . . , bn−1 ) die von bi verschiedenen bj eliminiert. Ist k zu n teilerfremd, so bezeichne ρk die durch ρk (αi ) = αki definierte Permutation der n-ten Einheitswurzeln. Die Gruppe der ρk bezeichnen wir mit E. Die Ordnung von E ist ϕ(n). Ist n eine Primzahl, so ist diese Gruppe transitiv auf der Menge der von 1 verschiedenen n-ten Einheitswurzeln. Das wird von Lagrange benutzt, wenn auch nicht so genannt, wie er auch den Begriff der Gruppe noch nicht kennt. Satz 5. Die Bezeichnungen seien die eingef¨ uhrten. Setze Fi,E :=
(x − bi,ρ ).
ρ∈E
Ist dann
ϕ(n) ϕ(n)
Fi,E = x
+
Bj xϕ(n)−j ,
j:=1
ur alle j. Insbesondere ist Bj unabh¨ angig von α. so ist Bj ∈ K(x1 , . . . , xn ) f¨ Beweis. Beim Beweis kommen nun die Kreisteilungspolynome ins Spiel, die Lagrange an dieser Stelle einf¨ uhrt, wie in Abschnitt 1 geschildert. Mit Hilfe der cramerschen Regel sieht man an Hand des Gleichungssystems (A), dass es Polynome N (α) und Z(α) in x1 , . . . , xn und α gibt mit N (α)bi,1 = Z(α). Es folgt
N ρ(α) bi,ρ − Z ρ(α) = 0
f¨ ur alle ρ ∈ E. Wir betrachten das Polynon N (y)x − Z(y),
88
Kapitel VIII. Lagrange
welches dadurch entsteht, dass α durch die Unbestimmte y und bi,1 durch die Unbestimmte x ersetzt wird. Es folgt ϕ(n) Resy N (y)x − Z(y), Φ(y) = P · xϕ(n) + Cj xϕ(n)−j , j:=1
wobei P ein Polynom in x1 , . . . , xn ist, welches von 0 verschieden ist. Die Polynome N (y)bi,ρ − Z(y) und Φn (y) haben die Nullstelle ρ(α) gemein. Daher ist Resy N (y)bi,ρ − Z(y), Φ(y) = 0, was, da P = 0 ist,
ϕ(n) ϕ(n)
bi,ρ +
ϕ(n)−j
Cj bi,ρ
=0
j:=1
ur alle i. nach sich zieht. Hieraus folgt Bi = Ci f¨ Nach der Gleichung des Grades (n − 1)! f¨ ur bi,1 , deren Koeffizienten in dem K¨ orper Q(a1 , . . . , an ) liegen, haben wir nun eine Gleichung des Grades ϕ(n) f¨ ur ur bi,1 gefunden, deren Koeffizienten in Q(x1 , . . . , xn ) liegen. Aber auch dieses ist f¨ n ≥ 5 kein wirklicher Gewinn, wie das Korollar zeigt. Korollar. Jedes der Bi aus Satz 5 ist Nullstelle eines Polynoms vom Grade (n − 1)! ϕ(n) mit Koeffizienten in Q(a1 , . . . , an ). Beweis. Es sei Z die vor Satz 3 und E die vor Satz 5 eingef¨ uhrte Gruppe. Dann ist ZE eine Untergruppe von Sn . Die Nullstellen von Fi,E bleiben unter Z einzeln fest und werden von E untereinander vertauscht. Also bleibt Fi,E unter ZE fest und damit jedes der Bi . Ist dann V ein Vertretersystem der Restklassen von ZE in Sn und setzt man Biσ := Vi (xσ(1) , . . . , xσ(n) ), so ist Hi :=
(x − Biσ )
σ∈V
ein Polynom des verlangten Grades, das bei allen Permutationen der x1 , . . . , xn invariant bleibt. Daher liegen alle Koeffizienten von Hi in Q(a1 , . . . , an ). F¨ ur n = 5 hat Hi den Grad 4! 4 = 6, das ist einiges besser als 24, aber immer noch zu groß. Die Situation wird umso schlechter, je gr¨ oßer n wird.
6. Strategiewechsel
89
¨ Uber die Polynome Hj kommt man zu den Koeffizienten von Fi,E und dies ist ein Faktor von Fi . Hieraus erh¨ alt man mit einem Vertretersystem der Restklassen von E in Sn−1 , weitere (n − 1)! −1 ϕ(n) Faktoren des Grades ϕ(n), so dass das Produkt aller Faktoren gerade Fi ergibt. Dies wird von Lagrange notiert. Lagrange untersucht im dritten Abschnitt auch den Fall, dass n = pq zusammengesetzt und die Hilfsgleichung hy so angesetzt ist, dass in g alle die Koeffizienten verschwinden, deren Index nicht durch p teilbar ist. Auch dies werden wir nicht weiter verfolgen, da es nichts wirklich Neues bringt. Schließlich untersucht er in langwierigen Rechnungen das Minimalpolynom von x1 + αx2 + α2 x3 + . . . + αn−1 xn , wobei α eine primitive n-te Einheitswurzel ist, mit dem Erfolg, dass es keinen Erfolg gibt. 6. Strategiewechsel. Die Terminologie ist schlecht bis auf den heutigen Tag. Polynome und Polynomfunktionen unterscheiden sich durch ihre Namen. Bei den rationalen Funktionen ist das leider nicht so. Wenn wir hier von rationalen Funktionen reden, ist immer ein Element des Quotientenk¨ orpers eines Polynomrings gemeint und nicht eine Funktion, die dadurch definiert ist, dass man eine Polynomfunktion durch eine andere teilt. Wenn man von den Werten spricht, die eine rationale Funktion annimmt, so ist in unserem Falle zun¨ achst u ¨ berhaupt nicht klar, was gemeint ist, da wir es ja nicht mit Funktionen im landl¨ aufigen Sinne zu tun haben. Um den hier benutzten Begriff pr¨azise zu fassen, sei R[x1 , . . . , xn ] ein Polynomring in den Unbestimmten ¨ ber dem Integrit¨ atsbereich R. Ist dann f ∈ R[x1 , . . . , xn ] und σ ∈ Sn , x1 , . . . , xn u so gibt es, wie wir wissen, genau einen Automorphismus von R[x1 , . . . , xn ], den wir ebenfalls σ nennen, mit f σ = f (xσ (1) , . . . , xσ (n) ) f¨ ur alle f ∈ R[x1 , . . . , xn ]. Dabei stehe σ f¨ ur σ −1 . Dann ist f στ = (f σ )τ . Der Automorphismus σ l¨ asst sich auf genau eine Weise fortsetzen zu einem Automorphismus des Quotientenk¨ orpers Q(R)(x1 , . . . , xn ) von R[x1 , . . . , xn ]. Diese f σ sind dann f¨ ur f ∈ K(x1 , . . . , xn ) das, was man in der Literatur die Funktionswerte von f nennt. Die Funktionswerte sind also gerade die Elemente der Bahn von f unter Sn . Dies zuvor. Bei den Gleichungen dritten und vierten Grades zeigte es sich, dass solche rationale Funktionen der Wurzeln der allgemeinen Gleichung zum Erfolge f¨ uhrten, die unter der Wirkung der S3 bzw. S4 nur wenige Bilder hatten. Deren Minimalpolynome hatten einen entsprechend niedrigen Grad, so dass sie gel¨ ost werden
90
Kapitel VIII. Lagrange
konnten, oder aber man fand solche Polynome, die faktorisierbar waren, so dass die Wurzeln von deren Faktoren zu bestimmen waren. Der Witz dabei war aber der, dass man diese Polynome ohne die Kenntnis ihrer Wurzeln berechnen konnte. Von den Wurzeln dieser Resolventen, das sind die Aufl¨ osenden, konnte man dann zu den Wurzeln der Ausgangsgleichung gelangen. Das Ziel war, auch bei h¨ oheren Graden, Polynome niedrigeren Grades zu finden, deren L¨ osbarkeit schon erkannt war, oder aber Polynome, die auf Grund ihrer speziellen Bauart l¨ osbar waren. Die L¨osungen solcher Gleichungen sollten dar¨ uber hinaus zu den L¨ osungen der allgemeinen Gleichung f¨ uhren. Solche Gleichungen fand Lagrange nicht. Da er solche Gleichungen nicht fand, wechselte er die Strategie, ohne dies ausdr¨ ucklich zu sagen. Er betrachtet n¨ amlich nun den Inbegriff aller rationalen Funktionen in den Unbestimmten x1 , . . . , xn und dessen Strukturierung durch die Sn . Dies wollen wir nun verfolgen. Dabei formuliere ich die S¨ atze in heutiger Sprache, Notation und Allgemeinheit, da sie nach wie vor von Interesse sind. Wenn ich hier K¨ orper sage, so ist dies so zu verstehen, dass bei Lagrange der K¨orper der rationalen Zahlen zu Grunde liegt. Im Folgenden nehmen wir stets an, dass x1 , . . . , xn Unbestimmte sind. Ferner setzen wir ai := (−1)i λi (n) f¨ ur i := 1, . . . , n, wobei λi (n) das i-te elementarsymmetrische Polynom in den Unbestimmten x1 , . . . , xn ist. Satz 1. Es sei K ein kommutativer K¨ orper und L := K(x1 , . . . , xn ) sei der Funk¨ber K. Ist dann f ∈ L und tionenk¨ orper in den Unbestimmten x1 , . . . , xn u F := (x − f σ ), σ∈Sn
so ist F ∈ K(a1 , . . . , an )[x]. Der Grad von F ist n! Beweis. Dies Ergebnis ist uns v¨ ollig klar, da F auf Grund seiner Definition ein symmetrisches Polynom u ¨ ber K(x1 , . . . , xn ) ist. Folglich liegen seine Koeffizienten nach Satz 7 von Abschnitt 4 des Kapitels 6 in K(a1 , . . . , an ). Der Witz bei diesem Satz ist, dass die Koeffizienten von F in K(a1 , . . . , an ) liegen. Lagrange rechnet dies f¨ ur n = 2 und 3 nach, was auf sehr l¨ angliche Rechnungen f¨ uhrt. F¨ ur n ≥ 4 sagt er zwar dass die Koeffizienten von F vom Vorzeichen abgesehen die elementarsymmetrischen Funktionen in den f σ und daher, wie zuvor gezeigt, rationale Funktionen der ai seien. Dies hat er jedoch nur f¨ ur n = 2 und 3 gezeigt. Er sagt ferner, dass der Grad von F gleich n! sei. Er gibt an dieser Stelle explizit ein Verfahren an, alle Permutationen der Sn zu erzeugen, damit man keines der f σ u ¨ bersehe. Er beginnt mit x1 , x2 , . . . und vertauscht zun¨ achst x1 mit x2 . Damit erh¨ alt er x1 , x2 , x3 , x4 , . . . x2 , x1 , x3 , x4 , . . .
6. Strategiewechsel
91
Das sind zwei Permutationen. In jeder der Permutationen vertauscht er x3 mit x1 und dann x3 mit x2 . Damit erh¨ alt er jeweils zwei weitere Permutationen. Insgesamt also 2 + 2 · 2 = 2 · 3. Hier sind sie: x1 , x3 , x1 , x2 , x2 , x3 ,
x2 , x2 , x3 , x1 , x3 , x1 ,
x3 , x1 , x2 , x3 , x1 , x2 ,
x4 , x4 , x4 , x4 , x4 , x4 ,
... ... ... ... ... ...
In jeder dieser Permutationen vertauscht er x4 mit x1 , dann x4 mit x2 und schließlich x4 mit x3 . Das ergibt jeweils drei weitere Permutationen, insgesamt also 2·3+2·3·3 = 2·3·4, usw. Dies ist ein weiteres Beispiel f¨ ur eine P¨ unktchenrekursion, wie sie in Abschnitt 7 von Kapitel 2 beschrieben wurde. Was die Berechnung der Koeffizenten von F anbelangt — F ist ja als Produkt von Polynomen des Grades 1 gegeben —, so verweist er auf seine Rechnungen in den F¨ allen n = 2 und n = 3 und dar¨ uber hinaus auf das von ihm schon mehrfach zitierte Werk Introduction a ` l’Analyse des lignes courbes von Gabriel Cramer und das Werk Meditationes algebraicæ von Edward Waring, welches ausgezeichnete Untersuchungen u ¨ber Gleichungen enthielte. Letzteres Werk wird hier zum ersten Mal erw¨ahnt. Wieso erst jetzt? Daf¨ ur gibt die dritte Auflage von Warings Buch eine m¨ogliche Erkl¨ arung (Waring 1782, S.vii und xxi). Dort heißt es, dass er zu Beginn des Jahres 1763 Euler ein Exemplar der ersten Auflage dieses Werkes — sie war 1762 erschienen — geschickt h¨atte. Im Mai des Jahres 1770 h¨ atte er Exemplare der zweiten Auflage, die in eben diesem Jahr erschienen war, an d’Alembert, B´ezout und Montucla, Euler, Lagrange, Frisius und andere geschickt. Ob sie angekommen w¨aren, wisse er nicht, da keiner außer Frisius ihm den Erhalt best¨ atigt h¨ atte. Es sieht also so aus, als h¨atte Lagrange von den Meditationes f¨ ur seine Arbeit zu sp¨at Kenntnis bekommen. Der erste Teil der Arbeit ist ja schon 1770 erschienen und der zweite war zu dieser Zeit im Wesentlichen wohl auch schon fertig. Das lassen die Andeutungen am Ende des ersten Teiles vermuten. Die erste Auflage der meditationes hat einen anderen Titel gehabt, n¨ amlich den Titel miscellanea analytica de aequationibus algebraicis et curvarum proprietatibus (Burkhardt 1892, S. 123, Fußnote 2). Den Ausf¨ uhrungen Warings in seiner dritten Auflage, bei der ausdr¨ ucklich auf dem Titelblatt vermerkt ist, dass es sich um die dritte Auflage handelt, ist das nicht zu entnehmen, da er immer nur von diesem ” Werk“ spricht. Man muss die B¨ ucher also in der Hand haben, um das zu sehen. Inwieweit sich die drei Auflagen der Meditationes unterscheiden, weiß ich nicht. Es kommt nat¨ urlich vor, dass etliche der f σ gleich sind. Diesen Fall untersucht Lagrange als N¨ achstes. Er nimmt zun¨ achst an, dass f (x1 , x2 , x3 , x4 , . . .) = f (x2 , x3 , x1 , x4 . . .)
92
Kapitel VIII. Lagrange
sei. Damit hat er zwei gleiche Wurzeln von F und er behauptet, dass daraus folge, dass alle Wurzeln von F in Paaren gleicher auftr¨ aten. Er f¨ ahrt fort: En effet, ” considerons une racine quelconque de la mˆeme ´equation, laquelle soit repr´esent´ee par la fonction f (x4 , x3 , x1 , x2 , . . .), comme celle-ci d´erive de la fonction f (x1 , x2 , x3 , x4 , . . .), en ´echangeant x1 en x4 , x2 en x3 , x3 en x1 , x4 en x2 , il s’ensuit qu’elle devra garder la mˆeme valeur en y changeant x4 en x3 , x3 en x1 et x1 en x4 ; de sorte qu’on aura aussi f (x4 , x3 , x1 , x2 , . . .) = f (x3 , x1 , x4 , x2 , . . .). Donc, dans ce cas, la quantit´e Θ (unser F) sera ´egale `a un carr´e θ2 , et par cons´equent l’´equation Θ = 0 se r´eduira a` celle-ci θ = 0, dont la dimension sera 2 .“ (Dabei ist unser n!) Bei dieser Argumentation unterl¨auft Lagrange ein Fehler. Es ist ja f (x2 , x3 , x1 , x4 , . . .) = f (x3 , x1 , x2 , x4 , . . .), so dass die 2-Teilmengen, die er erh¨ alt, nicht paarweise disjunkt sind. Dennoch kann man das Argument verwerten. Er tut das und formuliert nun abstrakter, wenn auch immer noch beispielhaft, so dass es nichts mehr zu beanstanden gibt, außer, dass er eben an Hand von Beispielen argumentiert und nicht so elegant und konzise formuliert, wie wir das heute tun. Was er macht, ist in heutiger Sprache notiert letztlich das Folgende. Es sei C := {σ | f σ = f }. ¨ Man nennt C den Stabilisator von f in Sn . Auf Sn definiere man die Aquivalenz−1 relation ∼ durch σ ∼ τ genau dann, wenn στ ∈ C ist. Es gilt dann der folgende Satz. Satz 2. Es sei K ein kommutativer K¨ orper und L := K(x1 , . . . , xn ) sei der ¨ber K. Ferner sei f ∈ L Funktionenk¨ orper in den Unbestimmten x1 , . . . , xn u und C sei der Stabilisator von f in Sn . Ist τ1 , . . . , τt ein Vertretersystem der ¨ ¨ Aquivalenzklassen der oben definierten Aquivalenzrelation ∼, so ist |C|t = n! Setzt man t (x − f τi ) μf := i:=1
und hat F die gleiche Bedeutung wie in Satz 1, so ist n!
F = μft .
6. Strategiewechsel
93
Ferner ist μf ∈ K(a1 , . . . , an ). Dabei ist wieder ai = (−1)i σ(n)i . Beweis. Beginnen wir damit zu zeigen, dass μf ∈ K(a1 , . . . , an )[x] ist. Dazu sei σ ∈ Sn . Es gibt dann zu jedem i mit 1 ≤ i ≤ t ein j mit 1 ≤ j ≤ t und ein ρσ,i , so dass τi σ = ρσ,i τj ist. Es folgt f τi σ = f ρσ,i τj = f τj . Dies zeigt, dass μf unter σ festbleibt. Da dies f¨ ur alle σ gilt, ist μf symmetrisch, so dass die Koeffizienten von μf in K(a1 , . . . , an ) liegen. Die Definition von C zeigt, dass f τi = f γτi ist f¨ ur alle γ ∈ C. Ferner gilt f τi = f τj , falls nur i = j ist. Schließlich gibt es zu jedem σ ∈ Sn ein γ ∈ C und ein τi mit σ = γτi . Aus all diesem folgt, dass jede Nullstelle des Polynoms F aus Satz 1 die Vielfachheit |C| hat. Hieraus folgt alles Weitere. ¨ ber K(a1 , . . . , an ). Das Polynom μf heißt Minimalpolynom von f u Von der Aussage |C|t = n! des Satzes leitet sich der Name Satz von Lagrange“ ” f¨ ur den Satz her, dass die Ordnung einer Untergruppe einer endlichen Gruppe deren Ordnung teilt. Lagrange selbst kennt den Begriff der Gruppe noch nicht. Er erw¨ahnt nicht einmal, dass die Hintereinanderausf¨ uhrung zweier Permutationen wieder eine Permutation ist. M¨ oglicherweise war ihm das u ¨ berhaupt nicht bewusst, obwohl er es implizit nat¨ urlich benutzt. Viel klarer wird eine entsprechende Situation schon zehn Jahre fr¨ uher von Euler beschrieben. Diese analoge Situation stellt sich ihm bei seinem dritten Beweis f¨ ur den kleinen Satz von Fermat, den er 1761 publizierte. N¨ aheres hierzu in Abschnitt 2 von Kapitel 9. Der n¨ achste Satz ist der H¨ohepunkt des vierten Abschnitts von Lagrangens Arbeit, wobei der Sachverhalt nat¨ urlich nur f¨ ur rationale Funktionen u ¨ber Q for¨ muliert ist. Im Ubrigen sagt Lagrange auch nur, dass unter den gegebenen Voraussetzungen g rational von f und a1 , . . . , an abhinge. So formuliert auch noch Dedekind, dessen Beweis aber das liefert, was ich hier notiert habe (Dedekind 1981). Der lagrangesche Beweis erstreckt sich u ¨ ber Seiten und ist verglichen mit Dedekinds Beweis ungenießbar. orper in den Satz 3. Es sei K ein K¨ orper und K(x1 , . . . , xn ) sei der Funktionenk¨ n Unbestimmten x1 , . . . , xn u ¨ber K. Ferner sei f ∈ K(x1 , . . . , xn ) und C sei der Stabilisator von f in Sn . Schließlich sei g ∈ K(x1 , . . . , xn ) und es gelte g σ = g f¨ ur alle σ ∈ C. Es sei τ1 = 1, τ2 , . . . , τt ein Vertretersystem der Restklassen von C in Sn . Wir ur i := 1, . . . , t und schließlich setzen fi := f τi und gi := g τi f¨ G :=
t
gi x − fi i:=1
t j:=1
(x − fj ).
94
Kapitel VIII. Lagrange
Dann ist G ∈ K(a1 , . . . , an )[x], wobei wieder ai = (−1)i λi (n) ist, und es gilt g=
G(f ) . μf (f )
Dabei sei μf das Minimalpolynom von f u ¨ber K(a1 , . . . , an ) und μf bezeichne die Ableitung von μf nach x. Beweis. Die fi sind genau die Bilder von f unter der symmetrischen Gruppe. Daher ist t (x − fi ) μf = i:=1
und folglich G :=
t
gi μf . x − fi i:=1
Ist σ ∈ Sn , so gibt es zu jedem i mit 1 ≤ i ≤ t ein j mit 1 ≤ j ≤ t und ein ρσ,i ∈ C mit τi σ = ρσ,i τj . Es folgt fiσ = f τi σ = f ρσ,i τj = fj , Ebenso folgt, dass giσ = gj ist. Dies zieht
gi x − fi
σ =
gj x − fj
nach sich. Dies impliziert wiederum Gσ = G. Nach fr¨ uheren S¨ atzen ist daher G ∈ K(a1 , . . . , an )[x]. Es gilt μf (f1 ) =
r
(f1 − fi )
i:=2
und daher μf (f1 ) = 0, da die fi paarweise verschieden sind. Es folgt g1 μf (f1 ) = g1
r
(f1 − fi ) = G(f1 ).
i:=2
Wegen τ1 = 1 ist g = g1 und f = f1 und daher μf (f ) = 0 und g= Damit ist der Satz bewiesen.
G(f ) . ϕ (f )
6. Strategiewechsel
95
Um es noch einmal — weniger pr¨azise, aber einpr¨ agsam – zu sagen: Unter den Voraussetzungen des Satzes 3 gilt, dass g ∈ K(a1 , . . . , an )[f ] ist. F¨ ur sp¨atere Verwendung notieren wir noch: Korollar. Ist K eine K¨ orper, ist K(x1 , . . . , xn ) der Funktionenk¨ orper in den Unbestimmten x1 , . . . , xn u ¨ber K, ist der Stabilisator von f ∈ K[x1 , . . . , xn ] gleich {1} und ist schließlich G :=
σ∈Sn
xσi x − fσ
(x − f τ ),
τ ∈Sn
so gilt G ∈ K[a1 , . . . , an ][x] und xi =
G(f ) . μf (f )
Dabei ist μf das Minimalpolynom von f u ¨ber K(a1 , . . . , an ). Insbesondere ist K(x1 , . . . , xn ) = K(a1 , . . . , an )[f ]. Dies folgt mit g = xi wegen f ∈ K[x1 , . . . , xn ] und C = {1} aus Satz 3. Lagrange beschließt seine Arbeit mit Anwendungen der gerade gewonnenen Einsichten. Es sind jedoch nur wieder Anwendungen in den F¨ allen von Gleichungen dritten und vierten Grades. Darauf werde ich mich nicht mehr einlassen. Auf den dedekindschen Text werden ich in Abschnitt 1 von Kapitel 9, dh. im n¨ achsten Abschnitt und in Kapitel 13 n¨ aher eingehen. Halten wir zum Schluss noch einmal fest, dass Lagrange zeigt, dass die Anzahl der Bilder von f ∈ Q(x1 , . . . , xn ) unter den Permutationen aus Sn Teiler von n! ist. Er thematisiert aber nicht die Hintereinanderausf¨ uhrung von Permutationen und er beobachtet nicht, dass die Permutationen, die f invariant lassen, eine Untergruppe der Sn bilden. Dies bringt erst Ruffini ins Spiel, der (fast) alle Untergruppen der S5 bestimmt, deren Indizes dann Auskunft u ¨ber die m¨ oglichen L¨ angen von Bahnen der rationalen Funktionen aus Q(x1 , x2 , x3 , x4 , x5 ) unter der S5 geben. Darauf werden wir in Kapitel 13 noch einmal zu sprechen kommen.
VIIII. Der abstrakte K¨ orperbegriff 1. Weber. Der Leser wird schon lange darauf warten, dass endlich einige Worte zur Entwicklung des K¨ orperbegriffs gesagt werden. Dies soll nun geschehen und dabei soll gleichzeitig noch, wie versprochen, die L¨ ucke im euler-lagrangeschen und im laplaceschen Beweis des Fundamentalsatzes gestopft werden, dass zumindest im Falle der Charakteristik 0 jedes Polynom einen Zerf¨allungsk¨ orper besitzt. Dass dieser Sachverhalt auch bei beliebiger Charakteristik gilt, werden wir erst im n¨ achsten Kapitel sehen. Wie so h¨ aufig in der Mathematik wurde auch mit dem K¨ orperbegriff eine Weile implizit gearbeitet. Man sah, dass die Irreduzibilit¨ at eines Polynoms vom Koeffi√ ¨ ber Q irreduzibel,√da 2 ja irrational ist, zientenbereich abhing. So ist x2 − 2 u √ w¨ahrend es u ¨ ber R in die beiden Linearfaktoren x − 2 und x + 2 zerf¨allt. ¨ ¨ ber R irreduzibel, w¨ahrend es u ¨ ber C zerf¨allt. Uber C Das Polynom x2 + 1 ist u zerfallen alle Polynome in Linearfaktoren, wie der Fundamentalsatz der Algebra sagt, w¨ahrend es u ¨ ber Q irreduzible Polynome jeglichen Grades gibt, wie wir im Anschluss an das sch¨ onemannsche Irreduzibilit¨ atskriterium gesehen haben (Kap. 7, Absch. 1). Man musste also klar machen, wie die Koeffizienten der Polynome gebaut sind, die man den Betrachtungen zu Grunde legte. So geschehen bei Galois und Abel, wie wir noch sehen werden, oder auch bei Kronecker (1853, Werke 4, S. 4). In dieser Arbeit findet sich auch der sog. Satz von Kronecker-Weber, dass algebraische Erweiterungsk¨orper von Q mit abelscher galoisscher Gruppe genau die Teilk¨ orper der Kreisteilungsk¨ orper sind. Dieser tief liegende Satz der algebraischen Zahlentheorie, einer der H¨ohepunkte in der Mathematik des 19. Jahrhunderts, tr¨ agt deswegen auch Weber’s Namen, weil Weber der erste war, der einen Beweis dieses Satzes publizierte (Weber 1886), von dem sich sp¨ ater herausstellte, dass er nicht ganz makellos ist (O. Neumann 1981). Kronecker macht in seiner Arbeit nur einige Andeutungen zum Beweis. In seiner Festschrift zu Kummers goldenem Doktorjubil¨ aum 1881 (Kronecker 1882) definiert Kronecker den Begriff des durch die Gr¨ oßen R , R , R , . . . bestimmten Rationalit¨ atsbereiches (R , R , R , . . .): Der Rationalit¨ ats-Bereich ” alt, wie schon die Bezeichnung deutlich erkennen l¨ asst, alle (R , R , R , . . .) enth¨ diejenigen Gr¨ ossen, welche rationale Functionen der Gr¨ossen R , R , R , . . . mit ganzzahligen Coefficienten sind.“ Der Leser wird sofort fragen, was denn mit Gr¨ osse“ gemeint sei und wie sich rationale Funktionen von solchen Gr¨ oßen ” definieren. Nun, wenig sp¨ ater sagt Kronecker hierzu das Folgende: Der Aus” druck ,Gr¨ osse‘ ist hierbei in der weitesten arithmetisch-algebraischen Bedeutung
98
Kapitel VIIII. Der abstrakte K¨ orperbegriff
zu nehmen, und es sind im Allgemeinen auch Gr¨ ossengebilde wie ,rationale Functionen unbestimmter Gr¨ ossen‘, sogenannte ,Formen beliebig vieler Ver¨anderlicher‘ u. s. w. darunter zu verstehen, denen der Begriff der Maassgr¨ osse, der des ,gr¨osser oder kleiner Seins‘ g¨ anzlich fremd ist. Aber die gew¨ohnlichen Zahlengr¨ ossen, die rationalen wie die algebraischen irrationalen Zahlen, geh¨ oren mit in die Kategorie der zu behandelnden Gr¨ ossen, und es ist desshalb ausdr¨ ucklich hervorzuheben, dass, obgleich hier das ,gr¨ osser oder kleiner Sein‘ volle Bedeutung hat, dennoch bei allen im Folgenden vorkommenden Gruppirungen, weil sie nach allgemeineren Gesichtspunkten vorzunehmen sind, die Maassgr¨ osse keinerlei R¨ ucksicht bilden wird. Bei der in § 3 erfolgenden Einf¨ uhrung des Gattungsbegriffs liegt √ z. B. die zu einer besonderen Gattung geh¨ orige Gr¨ osse 2 ,begrifflich‘ weit ab von irgend einer der Quadratwurzel aus zwei noch so nahe liegenden rationalen Zahl; ebenso tritt bei der sp¨ ateren Unterscheidung der ganzen und gebrochenen Zahlen f¨ ur die Gr¨ osse nach benachbarten Zahlen der beiden Kategorieen eine begriffliche Trennung ein. Eben desshalb, und weil man doch gewohnt ist, sich die Zahlengr¨ ossen ihrer Maassgr¨ osse nach, nicht aber ihren algebraischen Eigenschaften nach, an einander gereiht oder irgend wie r¨ aumlich gruppirt vorzustellen, halte ich es f¨ ur angemessen, in der Terminologie die Ausdr¨ ucke mit entschieden r¨ aumlichem Gepr¨age zu vermeiden und nur solche, kaum zu umgehende allgemeine Ausdr¨ ucke — wie eben jenes Wort ,Bereich‘ — oder allgemeine Bilder zu gebrauchen, welche die ursp¨ unglich r¨ aumliche Bedeutung bei ihrer vielfachen Verwendung im gew¨ ohnlichen Sprachgebrauche schon fast verloren haben. Aus diesem Gesichtspunkte habe ich auch geglaubt, von der Adoption der dedekind schen Bezeichnung ,K¨orper‘ absehen und meine a¨ltere Bezeichnungsweise im Wesentlichen beibehalten zu sollen, zumal gerade — wenigstens f¨ ur die vorliegenden Untersuchungen — mir eine ganz neue Begriffsbildung zur Zusammenfassung der rationalen Functionen bestimmter Gr¨ ossen R , R , R , . . . nicht erforderlich und diese Zusammenfassung selbst durch das Wort ,Rationalit¨ats-Bereich‘ in schlichter, ungezwungener Weise ausdr¨ uckbar erschien.“ Hiernach ist der Leser wohl auch nicht kl¨ uger, aber pr¨ aziser wird Kronecker nicht. Was jedoch klar wird, ist, dass Kroneckers Definition des Rationalit¨ atsbereiches extensional ist. Er sagt, wenn auch nicht sehr pr¨azise, wie sich die Elemente eines Rationalit¨ atsbereiches aus — stets den gleichen, endlich vielen — Gr¨ oßen angig — auch R , R , R , . . . erzeugen lassen. Sind die Gr¨oßen algebraisch unabh¨ das bleibt undefiniert —, so spricht er von dem nat¨ urlichen Rationalit¨ atsbereich (R , R , R , . . .). Ist die Menge der Gr¨oßen in der Klammer leer, so bezeichnet er dies mit R = 1 und nennt diesen Gr¨ oßenbereich den absoluten Gr¨ oßenbereich. Es ist dies der Gr¨oßenbereich der rationalen Zahlen. Bei nat¨ urlichen Gr¨ oßenbereichen nennt er die Gr¨ oßen R , etc. Variable und sagt, dass man sie auch als Unbestimmte auffassen d¨ urfe. Wovon Kronecker letztlich handelt, sind die Quotientenk¨orper Q(x1 , . . . , xn ) der Polynomringe Q[x1 , . . . , xn ] in den Unbestimmten ¨ ber dem K¨orper Q der rationalen Zahlen und deren endlichen algex1 , . . . , xn u braischen Erweiterungen. Wozu die Rationalit¨ atsbereiche dienen, sagt Kronecker im Anschluss an obiges Zitat: Mit der Fixirung des Rationalit¨ ats-Bereichs wird ”
1. Weber
99
die Frage der Zerlegbarkeit ganzer Functionen von einer oder mehreren Ver¨ anderlichen, deren Coefficienten jenem Bereich angeh¨oren, zu einer v¨ ollig bestimmten, insofern dabei verlangt wird, dass auch die Coefficienten der Factoren eben demselben Bereich angeh¨oren sollen. In diesem Sinne soll nun stets eine ganze Function von beliebig vielen Ver¨ anderlichen mit Coefficienten aus dem Rationalit¨atsbereich (R , R , R , . . .) schlechthin als ,irreductibel‘ oder ,unzerlegbar‘ bezeichnet werden, wenn sie keine eben solche ganze Function, d. h. keine ganze Function derselben Ver¨anderlichen mit Coefficienten aus demselben Rationalit¨ats-Bereich als Factor enth¨ alt.“ Kommen wir zu Dedekind, der in dem Kroneckerzitat schon erw¨ ahnt wurde. Dedekind hielt als Privatdozent in den Wintersemestern 1856/57 und 1857/58 in G¨ ottingen Vorlesungen u ¨ber h¨ ohere Algebra. Er hatte vier H¨orer, wobei ich nicht weiß, wie sie sich auf die beiden Vorlesungen verteilten. Einer der H¨ orer war Paul Bachmann, der sich sp¨ ater als Zahlentheoretiker einen Namen machte. Von diesen Vorlesungen hat Dedekind im Anschluss an sie eine Ausarbeitung gemacht. Weber sagt hierzu im Vorwort zur ersten Auflage des ersten Bandes seiner Algebra: . . . , so m¨ochte ich doch nicht unerw¨ ahnt lassen, dass ich schon vor vielen ” Jahren durch ein Heft einer Vorlesung, die er (Dedekind, Anm. H. L.) im Winter 1857/58 in G¨ ottingen u ¨ber h¨ ohere Algebra gehalten hat, ein noch lebhafteres Interesse f¨ ur diese Theorie gewonnen habe, die vordem auf unseren Hochschulen in solcher Vollst¨andigkeit wohl noch nicht vorgetragen war.“ Diese Ausarbeitung findet sich heute in Dedekinds Nachlass in G¨ ottingen. Sie wurde 1981 von Scharlau publiziert (Dedekind 1981). An Hand der Terminologie wird klar, dass sie vor 1871 entstanden sein muss, dem Jahr, in dem die zweite Auflage von Dirichlets Zahlentheorie erschien, die Dedekind mit weiteren Zus¨ atzen versehen hatte. Dort erscheint n¨ amlich Dedekinds ber¨ uhmte Definition eines K¨ orpers: Unter einem ” K¨ orper wollen wir jedes System von unendlich vielen reellen oder complexen Zahlen verstehen, welches in sich so abgeschlossen und vollst¨andig ist, dass die Addition, Subtraction, Multiplication und Division von je zwei dieser Zahlen immer wieder eine Zahl desselben Systems hervorbringt (Dirichlet 1871, Suppl. X, §159, S. 424).“ Das zehnte Supplement ist in der zweiten Auflage neu hinzugekommen. Es handelt von quadratischen Formen und ganzen algebraischen Zahlen. In der dritten Auflage ist dieses Supplementum in zwei Supplemente X und XI aufgespalten, wobei das erste von quadratischen Formen handelt und das zweite den ganzen algebraischen Zahlen vorbehalten ist. Supplementum XI beginnt mit § 159 auf S. 434. Dort heißt es: Bisher haben wir unter ganzen Zahlen ausschliesslich ” die Zahlen 0, ±1, ±2, ±3, ±4 . . . verstanden, n¨ amlich alle diejenigen Zahlen, welche durch wiederholte Addition und Subtraction aus der Zahl 1 entstehen; diese Zahlen reproduzieren sich durch Addition, Subtraction und Multiplication, oder mit anderen Worten, die Summen, Differenzen und Producte von je zwei ganzen Zahlen sind wieder ganze Zahlen. Dagegen f¨ uhrt die vierte Grundoperation, die Division, auf den umfassenderen
100
Kapitel VIIII. Der abstrakte K¨ orperbegriff
Begriff der rationalen Zahlen, unter welchem Namen die Quotienten von irgend zwei ganzen Zahlen verstanden werden; offenbar reproduzieren sich diese rationalen Zahlen durch alle vier Grundoperationen. Jedes System von reellen oder complexen Zahlen, welches diese fundamentale Eigenschaft der Reproduction besitzt, wollen wir k¨ unftig einen Zahlk¨ orper oder kurz einen K¨ orper nennen; der Inbegriff R aller rationalen Zahlen ist daher ein K¨ orper, und zwar bildet er das √ einfachste Beispiel eins solchen.“ Als weiteres Beispiel nennt er den K¨orper Q[ −1], den er zusammen mit dem in ihm enthaltenen Ring der ganzen gaußschen Zahlen eingehend untersucht. Sp¨ ater untersucht er dann beliebige endliche Erweiterungen von Q. In der vierten Auflage (Dirichlet 1894, Suppl. XI. §159, S. 434) wiederholt Dedekind das, was ich gerade zitiert habe, dh., Motivation und Definition eines K¨ orpers, wie er sie in der dritten Auflage formuliert hatte. Dann aber, in §160, S. 452, wiederholt er im Wesentlichen noch einmal die Definition aus der zweiten Auflage, wobei er aber auf das Wort unendlich“ verzichtet und noch eine Fußnote ” anh¨ angt. Er definiert: Ein System A von reellen oder complexen Zahlen a soll ” ein K¨ orper (hier wird auf die schon erw¨ ahnte Fußnote verwiesen. Sie wird gleich angef¨ uhrt werden. In der zweiten und dritten Auflage fehlt sie) heissen, wenn die Summen, Differenzen, Producte und Quotienten von jei zwei dieser Zahlen a demselben System A angeh¨ oren.“ Dedekinds Definitionen sind im Gegensatz zu Kroneckers extensionaler Definition des Rationalit¨ atsbereiches intensional. Sie nehmen ein System A von Zahlen als etwas Vorgegebenes und fragen nur, ob A unter den Operationen der Addition, Subtraktion, Multiplikation und Division abgeschlossen ist. Konstruierbarkeitsfragen, die bei Kronecker immer im Vordergrund stehen, spielen bei dieser Definition keine Rolle. Wir stehen hier am Beginn der Mengenlehre, zu der Dedekind durch seine Auffassung von Mathematik, seine Definitionen und Konstruktionen, seine Idealtheorie der Ringe ganzer algebraischer Zahlen und insbesondere auch seine Konstruktion der reellen Zahlen sowie die Begr¨ undung des Rechnens mit nat¨ urlichen Zahlen Wesentliches beigetragen hat. Dedekinds Definition eines K¨ orpers impliziert nicht, dass ein K¨ orper als Erweiterung von Q endlich erzeugt ist. Weiß man schon, was erst Steinitz erkannte, dass der Transzendenzgrad von C u ¨ ber Q gleich der M¨ achtigkeit von R ist, so findet man f¨ ur alle kroneckerschen Rationalit¨atsbereiche isomorphe Kopien in C, so dass Dedekinds Definition auch diese umfasst. Doch das war im 19. Jahrhundert noch nicht klar. Nachdem wir h¨orten, warum Kronecker seine Rationalit¨ atsbereiche Rationalit¨ atsbereiche nannte und den dedekindschen Namen K¨ orper f¨ ur sie ablehnte, wollen wir auch h¨ oren, warum Dedekind den Namen K¨orper w¨ ahlte. In der oben erw¨ahnten Fußnote sagt er: Dieser Name soll, ¨ahnlich wie in den Naturwis” senschaften, in der Geometrie und im Leben der menschlichen Gesellschaft, auch hier ein System bezeichnen, das eine gewisse Vollst¨andigkeit, Vollkommenheit, Abgeschlossenheit besitzt, wodurch es als ein organisches Ganzes, als eine nat¨ urliche Einheit erscheint. Anfangs, in meinen G¨ ottinger Vorlesungen (1857 bis 1858), hatte ich denselben Begriff mit dem Namen eines rationalen Gebietes belegt, der
1. Weber
101
aber weniger bequem ist. Der Begriff f¨allt im Wesentlichen zusammen mit Dem, was Kronecker einen Rationalit¨ atsbereich genannt hat (Grundz¨ uge einer arithmetischen Theorie der algebraischen Gr¨ ossen. 1882). Vergl. auch die von H. Weber und mir verfasste Theorie der algebraischen Functionen einer Ver¨ anderlichen. (Crelle’s Journal, Bd. 92, 1882).“ In dieser Arbeit betrachten sie algebraische Funktionen einer Variablen. Dabei heißt eine Abbildung ϑ aus C in C algebraische Funktion, falls es ein irreduzibles Polynom f ∈ Z[x, y] gibt mit f (ϑ(z), z) = 0 f¨ ur alle z aus einer offenen Teilmenge von C. Die rationalen Ausdr¨ ucke in ϑ und z bilden dann einen K¨ orper und die beiden Autoren nennen dieses Gebilde auch so. Dieser K¨ orper ist ein Rationalit¨ atsbereich im Sinne Kroneckers. In der gerade wiedergegebenen Fußnote sagt Dedekind, er h¨atte das, was er nun K¨ orper nennt, in den oben erw¨ ahnten Vorlesungen rationales Gebiet genannt. In der Nachschrift dieser Vorlesungen spricht er von Zahlengebieten und beginnt den Artikel 1 des § 3: Indem wir nun dazu u ¨bergehen, die von Galois aufgestellte ” Theorie der Gleichungen mit bestimmten Zahlenkoefficienten (im Gegensatz zu Unbestimmten als Koeffizienten, Anm. H. L.) zu er¨ortern, so ist zun¨ achst zu bemerken, dass die Grundbegriffe der Rationalit¨ at und Irrationalit¨ at hier stets in dem Sinne zu fassen sind, wie es in dem Aufsatz u ¨ ber die Reciprocit¨ at zwischen irreductiblen Gleichungen festgelegt ist.“ Er begn¨ ugt sich in diesen Notizen mit dieser Bemerkung. Eine formale Definition des Begriffs Zahlengebiet“ gibt er nicht. Er ” benutzt diesen Begriff aber stets im Sinne obiger Definition eines K¨ orpers, so dass ein Zahlengebiet stets Teilk¨orper von C ist. Von daher ist klar, dass die betrachteten Polynome stets u ¨ ber einem geeigneten Teilk¨ orper von C in Linearfaktoren zerfallen. Die Existenz des Zerf¨ allungsk¨ orpers eines Polynoms ist also kein Problem, wenn benutzt wird, dass C algebraisch abgeschlossen ist. Von dem erw¨ahnten Aufsatz u ¨ ber die Reziprozit¨ at zwischen irreduziblen Gleichungen ist wenig bis nichts bekannt. Siehe hierzu Scharlaus Kommentar in Dedekind 1981, S. 103f. Der von Dedekind benutze Name K¨ orper“ hat sich in der deutschsprachi” gen Literatur gegen¨ uber dem Kroneckerschen Rationalit¨ atsbereich“ durchgesetzt, ” wenn auch Weber in seiner Algebra meint, dass es bisweilen n¨ utzlich sei, den Ausdruck Rationalit¨ atsbereich f¨ ur einen K¨ orper dann zu gebrauchen, wenn damit ausgedr¨ uckt werden solle, dass bei einer bestimmten Aufgabe, die Gr¨ oßen dieses K¨ orpers als bekannt oder rational betrachtet werden sollten (Weber 1898, S. 494). ¨ Die Franzosen benutzen corps, das ist die w¨ortliche Ubersetzung von K¨orper. Die Italiener benutzen das Wort corpo, um nicht-kommutative K¨ orper zu bezeichnen, w¨ ahrend sie f¨ ur kommutative K¨ orper den Ausdruck campo benutzen (Curzio ¨ 1982). Das ist die Ubersetzung des Wortes field , das im Englischen f¨ ur kommutative K¨orper benutzt wird. Im Deutschen benutzen wir dieses Wort in Galoisfeld“, ” was der Name f¨ ur endliche K¨ orper ist, die wir im n¨ achsten Abschnitt studieren werden. Franzosen, wenn sie nicht corps fini (Dieudonn´e 1955) sagen, benutzen ebenfalls diesen von Moore gepr¨ agten Begriff, indem sie champs de Galois sagen (Dubreil 1946). Moore benutzt das Wort field synonym mit dem weberschen Ausdruck endlicher
102
Kapitel VIIII. Der abstrakte K¨ orperbegriff
K¨ orper , wie er in einer Fußnote auf der ersten Seite seiner Arbeit sagt (Moore 1896, S. 208). Das deutet darauf hin, dass der Name field bis dahin in der englischsprachigen mathematischen Literatur noch nicht vergeben war. Wer diesen Namen dann f¨ ur alle kommutativen K¨ orper benutzte, weiß ich nicht. Galois field nennt Moore die von Galois konstruierten endlichen K¨ orper und zeigt dann, dass jeder endliche K¨ orper zu einem Galoisfeld isomorph ist. Um diesen Satz formulieren zu k¨ onnen, muss man nat¨ urlich den abstrakten K¨ orperbegriff haben. Doch den hat man sp¨ atestens seit der weberschen Arbeit von 1893, der wir uns gleich zuwenden ¨ werden. Das Jahr 1893 ist im Ubrigen das Jahr, in dem Moore seine Resultate auf dem Weltkongress in Chicago vortrug. Er formuliert seinen Satz u ¨ber die endlichen K¨ orper so: Every existent field F [s] is the abstract form of a Galois field GF [q n ]; s = q n . Um diesen Satz zu beweisen, muss er nach all dem, was Galois schon gemacht hat und was wir im n¨ achsten Abschnitt studieren werden, nur noch zeigen, dass s Potenz einer Primzahl q ist. Dazu zeigt er, dass alle von null verschiedenen Elemente von F [s] bez¨ uglich der Addition die Ordnung q haben, wobei q eine Primzahl ist. Er zeigt ferner, dass die additive Gruppe von F [s] ein F [q]-Vektorraum ist und dass F [q] nichts anderes als GF(q) ist. Er definiert lineare Unabh¨ angigkeit u ¨ ber GF(q) und bemerkt, dass h + 1 Elemente einer elementarabelschen q-Gruppe des Ranges h linear abh¨ angig sind. H¨ atte sich das Wort Rang statt des Wortes Dimension f¨ ur Vektorr¨ aume doch durchgesetzt! Wieviel Konfusion hat es n¨ amlich schon dadurch gegeben, dass man f¨ ur Vektorr¨ aume und projektive Geometrien das gleiche Wort Dimension benutzt, diese Dimensionen sich aber um eins unterscheiden, so sie endlich sind. In seiner Kummerfestschrift schreibt Kronecker: Die im Art. 1 aufgestellte ” Definition der Irreductibilit¨ at (es ist die gewohnte. Anm. H. L.) entbehrt so lange einer sicheren Grundlage, als nicht eine Methode angegeben ist, mittels deren bei einer bestimmten, vorgelegten Function entschieden werden kann, ob dieselbe der aufgestellten Definition gem¨ ass irreductibel ist oder nicht.“ Und dann gibt er ein Verfahren an, ein Polynom mit Koeffizienten aus einem Rationalit¨ atsbereich zu faktorisieren. Dieses Verfahren ist so aufwendig, dass es sich nicht lohnt, hier darauf einzugehen. Es sei nur als weiterer Beleg erw¨ ahnt, dass Kronecker auf Konstruierbarkeit gr¨oßten Wert legt. Es ist also nicht verwunderlich, dass er versucht, arithmetische Fragen arithmetisch bzw. algebraisch zu l¨osen, ohne vom Fundamentalsatz der Algebra Gebrauch zu machen. So gelingt es ihm — ich hoffe, ich interpretiere ihn richtig — zu zeigen, dass es zu einem Polynom mit Koeffizienten aus einem Rationalit¨atsbereich stets ein irreduzibles Polynom gibt, modulo dem das gegebene Polynom in Linearfaktoren zerf¨allt. Pr¨ aziser mag ich das nicht formulieren, da ich gestehen muss, dass ich das, was Kronecker aufgeschrieben hat, nicht wirklich verstehe. Seine Beweise sind nur Skizzen, so dass ich auch nicht an Hand der Beweise den Satz rekonstruieren kann. Vielleicht hat der Leser mehr Durchhalteverm¨ogen als ich, wenn er die Arbeit Kronecker 1887 studiert. Sie macht wesentlichen Gebrauch von der Kum-
1. Weber
103
merfestschrift, von der Dedekind im Vorwort zur vierten Auflage von Dirichlets Zahlentheorie schreibt: In der grossen Festschrift, Grundz¨ uge einer arithmeti” schen Theorie der algebraischen Gr¨ ossen, durch welche Kronecker dem so bald nach ihm dahin geschiedenen Lehrer und Freunde Kummer im Voraus ein sch¨ ones Denkmal gesetzt hat, sind die umfassenden Gedanken niedergelegt, auf welchen sich eine andere Theorie der Ideale erhebt. (Kronecker lebte von 1823 bis 1891 und Kummer von 1810 bis 1893. Anm. HL.) Durch die Ver¨ offentlichung derselben (1882 in Crelle’s Journal, Bd. 92) hat Kronecker einen Wunsch erf¨ ullt, den ich schon ¨ofter, zuletzt im Juni 1880 bei Gelegenheit der Enth¨ ullung unseres Braunschweiger Standbildes von Gauss ausgesprochen hatte, wo zugleich verabredet wurde, dass diese Abhandlung vor der von H. Weber und mir ausgearbeiteten Theorie der algebraischen Functionen einer Ver¨ anderlichen in Crelle’s Journal erscheinen sollte. Ihr Inhalt war auch f¨ ur mich vollst¨andig neu, da ich nach einer alten brieflichen Mittheilung aus dem Jahre 1857 geglaubt hatte, die Theorie Kronecker’s auf ganz anderen Wegen suchen zu m¨ ussen, die ich in §. 10 meiner Schrift Sur la th´eorie des nombres entiers alg´ebriques (1877) angedeutet habe. Ein sicheres Urtheil u ¨ ber die Vorz¨ uge und Nachtheile dieser Theorie auszusprechen, deren hohe Bedeutung unzweifelhaft ist, halte ich jetzt noch nicht f¨ ur m¨ oglich, da in der Abhandlung nur die Grundgedanken in grossen Z¨ ugen vorgezeichnet sind; ich m¨ochte daher den Wunsch aussprechen, dass einer der zahlreichen Sch¨ uler Kronecker’s es untern¨ahme, eine vollst¨andige, systematische Darstellung dieser Theorie auszuarbeiten; . . . “ Auch Camille Jordan bedauert im Vorwort zu seinem Buch Trait´e des substitutions et des ´equations alg´ebriques, dass er nicht mehr von Kroneckers Resultaten habe bringen k¨ onnen (Jordan 1870/1957, S. VIII). Diverses causes nous en ont empˆech´e: la nature tout arithm´etique de ses m´ethodes, si diff´erentes de la nˆ otre; la difficult´e de reconstituer int´egralement une suite de d´emonstrations le plus souvent a peine indiqu´ees; enfin l’´esperance de voir grouper un jour en un corps de doctrine ` suivi et complet ces beaux th´eor`emes qui font maintenant l’envie des g´eom`etres. Es sind also nur die Grundgedanken in großen Z¨ ugen vorgezeichnet, so dass ich mich mit anderer Vorbildung als die Mathematiker des 19. Jahrhunderts ausgestattet nicht zu sch¨ amen brauche, wenn ich Kronecker nicht gleich verstehe. Im Gegensatz zu Kronecker ist Gauß ein Muster an Klarheit und auch mit Dedekind habe ich keine Schwierigkeiten. Dies mag daran liegen, dass Dedekinds Auffassung von Mathematik und sein Sprechen u ¨ber sie heute noch lebendig sind, wie auch Gauß mit seinen Disquisitiones die Sprache der Zahlentheorie bis heute pr¨ agte. Das bringt mich auf die Frage, was den Zeigenossen gel¨aufig war. Es gibt ja wohl so etwas wie ein Grundwissen, dass man in einer Gemeinschaft hat und auf das man zur¨ uckgreift, wenn man mit anderen kommuniziert. Was ist uns heute selbstverst¨andlich? Man weiß dies wohl nur implizit. Wie k¨ onnte man als Historiker etwas zu diesem Thema herausfinden? Man m¨ usste wohl erst der Lehrb¨ ucher der Zeit habhaft werden und dann noch versuchen, etwas u ¨ber die Inhalte der Vorlesungen von damals herauszufinden. Wenn ich an Lehrb¨ ucher des 18. und 19. Jahrhunderts denke, fallen mir zuerst die Geometrieb¨ ucher von Monge 1799 (Jahr VII des Revolutionskalenders), M¨ obius
104
Kapitel VIIII. Der abstrakte K¨ orperbegriff
1827, Steiner 1832, Pl¨ ucker 1835, von Staudt 1847, 1856, 1857, 1860, Hesse 1876, d’Occagne 1899, Study 1903 ein. Das liegt wohl an meiner Herkunft. Grassmann’s Ausdehnungslehre“ hat kaum Verbreitung gefunden. Die franz¨ osischen Cours ” d’analyse, u. a. von Cauchy und Jordan, sind ber¨ uhmt. An Algebrab¨ uchern fallen mir aber nur sehr wenige ein: Da sind einmal die Meditationes algebraicae von Waring aus dem Jahre 1770, dritte Auflage 1782 (s. hierzu Kap. 8, Absch. 6). Ferner Serrets Cours d’alg`ebre superieure von 1849 mit weiteren Auflagen in den Jahren 1854 und 1866, ein Buch das auch ins Deutsche u ¨ bersetzt wurde und von dem ich nur einmal den ersten Band in der Hand hatte, Chrystals Algebra“, ein ” Buch, das ich nur vom H¨ orensagen kenne, so dass ich nicht einmal seinen Adressatenkreis weiß, und vom Ende des Jahrhunderts Burnsides Theory of Groups ” of Finite Order“ (1897) und Webers Lehrbuch der Algebra“ in zun¨ achst zwei ” B¨anden. Camille Jordans Trait´e des substitutions ist wohl ein Buch der Forschung und kein Lehrbuch. Darauf deutet auch hin, was Felix Klein schreibt (Klein 1921, S. 51): Einen großen Eindruck machte mir Camille Jordan, dessen trait´e des sub” stitutions et des ´equations alg´ebriques eben erschienen war und uns (Felix Klein und Sophus Lie. Anm. HL) ein Buch mit sieben Siegeln war.“ Ein Buch schon der zweiten Generation ist Julius Petersens Theorie der algebraischen Gleichungen“ ” von 1878 (Peterson 1878). Petersen benutzte bei seiner Abfassung die B¨ ucher von Serret, C. Jordan sowie das Buch Theory of equations“ von Isaac Todhunter, von ” dem ich weiter keine bibliografischen Daten habe. Den forschenden Mathematikern waren auch die Disquisitiones von Gauß aus dem Jahre 1801 sowie die ber¨ uhmte Arbeit von Lagrange von 1771 gel¨ aufig, wie die Lekt¨ ure ihrer Arbeiten zeigt. Kroneckers Sch¨ uler Adolf Kneser hat eine Arbeit u ¨ ber den uns interessierenden Gegenstand verfasst (A. Kneser 1888). Aber auch er betrachtet nur Rationalit¨ atsbereiche. Seine Konstruktion ben¨ otigt, wie auch schon die kroneckersche, dass die Diskriminante des zu zerf¨ allenden Polynoms von null verschieden ist. Am Ende kommt dann heraus, wie bei der gleich zu besprechenden Arbeit von Weber klar zu erkennen ist, dass der Zerf¨allungsk¨ orper eines Polynoms unter dieser Voraussetzung stets ein primitives Element besitzt, dh., dass er von der Form K[x]/gK[x] ist mit einem irreduziblen Polynom g. Bei unvollkommenen K¨ orpern hat der Zerf¨allungsk¨ orper eines Polynoms aber meist nicht diese Form, wie wir heute wissen, so dass man also eine Bedingung wie die, dass die Diskriminante nicht verschwindet, an das zu zerf¨ allende Polynom stellen muss, will man die fragliche Konstruktion durchf¨ uhren. Es sieht also so aus, als h¨ atte erst Steinitz allungsk¨ orper in voller Allgemeinheit besessen, obgleich Weber den Satz vom Zerf¨ schon alles Werkzeug zur Verf¨ ugung hatte, ihn zu beweisen, wie wir gleich sehen werden. Die Konstruktion des Polynoms g ist sehr aufwendig und auch mit heutigen Rechnern nur f¨ ur Polynome sehr kleinen Grades durchf¨ uhrbar. Das liegt zum Teil im Prinzipiellen, da der Grad von g h¨ aufig gleich n! ist, wenn n der Grad des zu zerf¨allenden Polynoms ist. Zum Teil liegt es aber auch an der Konstruktion, bei der n weitere Unbestimmte eingef¨ uhrt werden, die am Ende wieder herausfallen. Bei Kronecker und A. Kneser l¨ost sich die Frage nach der Existenz eines Zerf¨al-
1. Weber
105
lungsk¨ orpers eines Polynoms vom Fundamentalsatz der Algebra und wird zu einer rein arithmetischen Frage. Im n¨ achsten Schritt l¨ ost sich dann der K¨ orperbegriff von den Begriffen Funktionenk¨ orper und algebraischer Zahlk¨ orper, f¨ ur die sich Kronecker und Dedekind vor allem interessierten. Dies geschah in der gerade erw¨ahnten Arbeit von Weber aus dem Jahre 1893. Sie beginnt mit einer abstrakten Definition des Gruppenbegriffs und ist von daher auch f¨ ur die Genesis des abstrakten Gruppenbegriffs von Bedeutung (Wußing 1969/1984). Die Definition der Gruppe geht dann wiederum ein in die Definition des K¨ orperbegriffs. Dass es Weber nicht mehr nur um konkrete Beispiele geht, sondern um auf alle bekannten Beispiele anwendbare S¨atze, macht er in der Einleitung zu seiner Arbeit klar, die in voller L¨ ange zitiert sei, da hier ein neues Verst¨ andnis von der Art, wie Mathematik zu betreiben sei, deutlich wird. Im Folgenden ist der Versuch gemacht, die Galois’sche Theorie der algebra” ischen Gleichungen in einer Weise zu begr¨ unden, die soweit m¨ oglich alle F¨ alle umfasst, in denen diese Theorie angewandt worden ist. Sie ergiebt sich hier als eine unmittelbare Consequenz des zum K¨ orperbegriff erweiterten Gruppenbegriffs, als ein formales Gesetz ganz ohne R¨ ucksicht auf die Zahlenbedeutung der verwendeten Elemente. Diese Begr¨ undung ist hiernach also auch ganz unabh¨ angig von dem Fundamentalsatz der Algebra u ¨ ber die Wurzelexistenz. Die Theorie erscheint bei dieser Auffassung freilich als ein reiner Formalismus, der durch die Belegung der einzelnen Elemente mit Zahlwerten erst Inhalt und Leben gewinnt. Dagegen ist diese Form auf alle denkbaren F¨alle, in denen die gemachten Voraussetzungen zutreffen, anwendbar, die einerseits in die Functionentheorie andererseits in die Zahlentheorie hin¨ ubergreifen.“ Ich beginne, um vollst¨ andig klar zu sein, mit einer genauen Begriffsbestimmung ” des Gruppen- und K¨ orperbegriffs, wobei besonders der K¨ orperbegriff so gefasst ist, dass er auch auf Gebilde anwendbar ist, die bisher unter diesem Namen nicht mitbezeichnet waren, die aber doch alle f¨ ur unsere Frage entscheidenden Merkmale besitzen, n¨amlich die endlichen K¨ orper, im eigentlichen Sinne, d. h. K¨ orper die nur aus einer endlichen Anzahl von Elementen bestehen.“ In einer Fußnote erw¨ahnt er, dass Kneser mit der oben schon zitierten Arbeit (A. Kneser 1888) a¨hnliche Ziele verfolge. Einige Zeilen sp¨ater heißt es dann — ich zitiere wieder ausf¨ uhrlich —: Ein System S von Dingen (Elementen) irgend welcher Art in endlicher oder unendlicher Anzahl wird zur Gruppe, wenn folgende Voraussetzungen erf¨ ullt sind. 1) Es ist eine Vorschrift gegeben, nach der aus einem ersten und einem zweiten Element des Systems ein ganz bestimmtes drittes Element desselben Systems abgeleitet wird . Man schreibt symbolisch, wenn A das erste, B das zweite, C das dritte Element ist AB = C, und nennt C aus A und B componirt .
C = AB,
106
Kapitel VIIII. Der abstrakte K¨ orperbegriff
Bei dieser Composition wird im Allgemeinen nicht das commutative Gesetz vorausgesetzt, d. h. es kann AB von BA verschieden sein; dagegen wird 2) das associative Gesetz vorausgesetzt , d. h. wenn A, B, C irgend drei Elemente aus S sind, so ist (AB)C = A(BC), und hieraus folgt durch die Schlussweise der vollst¨ andigen Induction, dass man auch immer zu demselben Resultat kommt, wenn man in einer beliebigen Reihe von Elementen aus S in endlicher Anzahl A, B, C, D, . . . zuerst zwei benachbarte Elemente componirt, dann wieder zwei benachbarte, u. s. f. bis die ganze Reihe auf ein Element reducirt ist, das mit ABCD . . . bezeichnet wird. 3) Es wird vorausgesetzt, dass, wenn AB = AB oder AB = A B ist, nothwendig B = B oder A = A sein muss. Wenn S eine endliche Anzahl von Elementen umfasst, so heisst die Gruppe eine endliche und die Anzahl ihrer Elemente ihr Grad . Bei endlichen Gruppen ergiebt sich aus 1), 2), 3) die Folgerung. 4) Wenn von den drei Elementen A, B, C zwei beliebig aus S genommen werden, so kann man das dritte immer und nur auf eine Weise so bestimmen, dass AB = C ist . Sind A und B die gegebenen Elemente, so f¨allt die Behauptung mit 1) zusammen. Ist aber A und C gegeben, so lasse man in dem Compositum AB die zweite Componente B das ganze System S durchlaufen, dessen Grad = n sei. Dann erh¨alt man nach 1) und 3) in AB lauter verschiedene Elemente von S und da ihre Anzahl = n ist, so m¨ ussen alle Elemente von S, also auch C, darunter vorkommen. Ebenso schliesst man, wenn B gegeben ist und A das ganze System S durchl¨ auft. F¨ ur unendliche Gruppen ist dieser Schluss nicht mehr zwingend. F¨ ur unendliche Gruppen wollen wir also die Eigenschaft 4) noch als Forderung in die Begriffsbestimmung mit aufnehmen. Hier endet das Zitat. Was Weber Grad einer endlichen Gruppe nennt, heißt heute ihre Ordnung. Weber vers¨aumt zu sagen, dass S nicht leer sein darf. Ist B ∈ S, so gibt es nach 4) ur alle genau ein Element 1 ∈ S mit 1B = B. Mit 2) folgt 1(BC) = (1B)C = BC f¨ C ∈ S. Weil jedes Element von S nach 4) von der Form BC ist, ist 1 eine Linkseins. Ebenso folgt die Existenz einer Rechtseins 1 . Weiter folgt 1 = 1 · 1 = 1. Also ist 1 eine Eins und dann auch die einzige Eins der Gruppe S. Wiederum mit 4) folgt die Existenz des Inversen A−1 f¨ ur alle A ∈ S und es gilt (AB)−1 = B −1 A−1 . Dies sind alles Schl¨ usse aus der weberschen Arbeit. Gruppen, deren Komposition kommutativ ist, nennt er commutativ oder auch abelsch, wie wir das heute noch tun, nur dass wir commutativ nicht mehr mit
1. Weber
107
einem C schreiben, auch nicht nach der Rechtschreibreform, die in vielem ja auf die vor 1902 gebr¨ auchlichen Regeln zur¨ uckgreift. Weber nennt zwei Gruppen S und S isomorph, wenn es eine Bijektion A → A von S auf S gibt mit (AB) = A B . Das Wort Bijektion benutzt er aber nicht, auch nicht das Wort Isomorphismus. Als Beispiele erw¨ahnt er: 1. Die Gruppe der Translationen der affinen Ebene u ¨ber R, die ich der K¨ urze halber so nenne, von der er bemerkt, dass sie zur additiven Gruppe von C isomorph ist. Diese Gruppe dient ihm als Beispiel f¨ ur eine unendliche Gruppe. 2. Die Gruppe der Rotationen um den Nullpunkt im R3 . Dies ist eine nichtkommutative Gruppe. Sie sei isomorph mit der Gruppe linearer Substitutionen, die rechtwinklige Koordinatensysteme in ebensolche u ¨ berf¨ uhrten. Auch diese Gruppe ist unendlich. 3. Die Untergruppen der Drehungsgruppe, die die regul¨ aren Polyeder invariant lassen. Diese Gruppen sind endlich. Hier verweist er auf Kleins Vorlesungen u ¨ ber ” das Ikosaeder“ (Klein 1884). 4. Die symmetrischen Gruppen vom Grade n. Diese Gruppen seien deshalb so wichtig, weil alle endlichen Gruppen darunter ihre Vertreter f¨ anden. Auch hier verweist er wieder auf die Literatur. 5. Als Beispiele f¨ ur endliche kommutative Gruppen nimmt er die additiven Gruppen von Z/nZ und die Einheitengruppen dieser Ringe. Als letztes Beispiel (ohne Nummer) nimmt er die Klassen bin¨arer quadratischer Formen gleicher Diskriminante, die er wie Gauß Determinante nennt, mit der von Gauß eingef¨ uhrten Komposition zweier Formen. An dieser Stelle wird nun auch die im sechsten Kapitel gestellte Frage nach dem Geschlecht von determinans beantwortet: die Determinante. — Zur Vorgeschichte der weberschen Axiomatisierung des Gruppenbegriffs wird in Abschnitt 2 von Kapitel 13 noch etwas gesagt. Dann geht es weiter mit der Definition eines K¨ orpers. Ich zitiere wieder. Eine Gruppe wird zum K¨ orper, wenn in ihr zwei Arten der Composition m¨oglich sind, von denen die erste Addition, die zweite Multiplication genannt wird. Diese allgemeine Bestimmung m¨ ussen wir aber noch etwas einschr¨ anken. 1. Wir setzen voraus, dass beide Arten der Composition commutativ seien. 2. Die Addition soll den Bedingungen 1., 2., 3., 4. allgemein gen¨ ugen. Das Einheitselement f¨ ur diese Art der Composition wird Null genannt und mit 0 bezeichnet. Das aus a und b durch Addition zusammengesetzte Element wird mit a + b bezeichnet. Ist a irgend ein Element, so wird das nach der ersten Compositionsart entgegengesetzte Element mit −a bezeichnet, und f¨ ur a + (−b) wird a − b geschrieben. Die dadurch ausgedr¨ uckte Verkn¨ upfung der Elemente a und b heisst Subtraction. 3. Die zweite Art der Composition, ist die Multiplication, die durch einfaches Nebeneinandersetzen der Componenten ab, oder auch durch a . b oder a×b bezeichnet wird. Wir brauchen auch die Ausdr¨ ucke Product, Factoren in u ¨blicher Weise. Die beiden Arten der Composition sollen durch folgende Gesetze mit einander
108
Kapitel VIIII. Der abstrakte K¨ orperbegriff
verkn¨ upft sein: α) β)
a(−b) = −ab, a(b + c) = ab + ac,
und aus α) folgt noch (nach dem Satz des vorigen Paragraphen, dass das entgegengesetzte Element des entgegengesetzten wieder das urspr¨ ungliche ist) γ)
(−a)(−b) = ab;
ferner folgt aus β), wenn man c = −b setzt: δ)
a . 0 = 0.
Aus δ) aber ergiebt sich, dass f¨ ur die zweite Composition die Forderung 3) in § 1 nicht allgemein erf¨ ullt sein kann, da, was auch a sei, immer 0 . a = 0 ist. Wir wollen aber noch die Voraussetzung machen, dass dies die einzige Ausnahme sei, d. h. aus ab = ac soll b = c folgen, ausser wenn a = 0 ist . Auch die Forderung 4) muss hiernach eine Einschr¨ ankung erfahren. Sie wird jetzt durch die folgende ersetzt. Sind b und c beliebig gegeben, so ist aus ab = c a eindeutig bestimmt, ausser, wenn b = 0 ist . Ist in diesem Ausnahmefall c nicht = 0, so giebt es kein a; ist aber c = 0, so ist a v¨ ollig unbestimmt. Daraus folgt noch dass ein Produkt nur dann null sein kann, wenn wenigstens einer seiner Faktoren null ist. Ende des Zitats. Soweit die Definition des K¨ orpers. Hier wurde nichts unterschlagen von dem, was Weber sagt. Ich sage das deshalb, weil nirgendwo von der Assoziativit¨at der Multiplikation die Rede ist. Die Ausnahmestellung der Null hat Weber offensichtlich so besch¨aftigt, dass er vergaß, die Assoziativit¨ at zu erw¨ahnen. Er erw¨ ahnt jedoch, dass 0 = 1 ist, wenn man den interesselosen Fall ausschl¨osse, dass der K¨orper nur ein Element enthielte. Als wichtigstes Beispiel f¨ ur einen K¨ orper nennt er Q. Er nennt es weiterhin bemerkenswert, dass es auch endliche K¨orper gebe und gibt als Beispiel Z/pZ mit einer Primzahl p, wobei er das aber nicht so schreibt. Er stellt auch die Frage, ob es sinnvoll sei, auf die Forderung der Kommutativit¨ at zu verzichten, oder aber noch eine dritte Komposition in Betracht zu ziehen. Er h¨ atte dies aber nicht weiter untersucht.
1. Weber
109
Es geh¨ ort unter Geometern zur Folklore, dass eine Struktur K mit zwei Verkn¨ upfungen + und · ein Schiefk¨ orper ist, dass also die Addition kommutativ ist, upfungen mittels der falls (K, +) und (K ∗ , ·) Gruppen sind und die beiden Verkn¨ Distributivgesetze miteinander verkn¨ upft sind. Dies beweist man wie folgt: Es ist 0a = (0 + 0)a = 0a + 0a und daher 0a = 0 f¨ ur alle a ∈ K. Weiter folgt a + (−1)a = 1 + (−1) a = 0a = 0 = a + (−a) und damit (−1)a = −a f¨ ur alle a ∈ K. Es seien nun a, b ∈ K. Weil (K, +) eine Gruppe ist, ist −(a + b) = (−b) + (−a). Es folgt (−1)(a + b) = −(a + b) = (−b) + (−a) = (−1)b + (−1)a = (−1)(b + a). Hieraus folgt wiederum a + b = b + a. Nach diesem Intermezzo fahren wir fort mit Webers Arbeit. Er definiert nun Polynomringe in beliebig vielen Unbestimmten u ¨ ber einem K¨ orper K, wobei er die Polynome Formen nennt. Er definiert sie als Ausdr¨ ucke von der Form Φ(x, y, z, . . .) =
axr y s z t . . . ,
wobei r, s, t, . . . nicht-negative ganze Zahlen sind und a ∈ K gilt. Dabei setzt er stillschweigend voraus, dass die Summen endlich sind. Er nennt zwei solcher Polynome gleich, wenn sie koeffizientenweise u ¨ bereinstimmen. Er sagt ferner: Die ” Variabeln x, y, z, . . . haben hier keinei selbst¨andige Bedeutung; sie sind nur Zeichen, deren Benutzung die Zusammenfassung einer Anzahl von Gleichungen in eine einzige Gleichung, und Rechnungsregeln f¨ ur die Coefficientensysteme einfach auszudr¨ ucken gestattet.“ Das ist die Vorstellung, die Cauchy bei seiner Definition der komplexen Zahlen hatte. Weber h¨ alt sich nicht damit auf, die u ¨blichen Rechenregeln f¨ ur die Polynomringe nachzuweisen. Was er jedoch beweist, ist, dass der Grad des Produktes zweier Polynome gleich der Summe der Grade der Faktoren ist. Dies zeigt insbesondere, dass die Polynomringe Integrit¨ atsbereiche sind. Demzufolge haben sie alle einen Quotientenk¨ orper, den er auf die u ¨bliche Art konstruiert. Dann zeigt er, was Gauß f¨ ur Z[x] und Kronecker f¨ ur die in seinen Rationalit¨ atsbereichen enthaltenen Polynomringe getan hat, dass die von ihm betrachteten Polynomringe ZPE-Bereiche sind. Diese Resultate haben wir im ersten Abschnitt von Kapitel 7 schon vorweggenommen. Weber unterscheidet sehr sorgf¨altig zwischen Primpolynomen und unzerlegbaren Polynomen und weist nach, dass alle unzerlegbaren Polynome prim sind. Zu erw¨ahnen ist auch, dass er darauf aufmerksam macht, dass die Begriffe Poly¨ ber Z/pZ nom und Polynomfunktion nicht identisch sind: Das Polynom xp −x ist u
110
Kapitel VIIII. Der abstrakte K¨ orperbegriff
ein von null verschiedenes Polynom. Die durch f (k) := k p − k definierte Abbildung f von Z/pZ in sich ist aber die Nullabbildung, da ja k p = k gilt f¨ ur alle k ∈ Z/pZ. Schon vor Weber hat Dedekind auf den Unterschied zwischen unzerlegbaren Elementen und Primelementen in den Ringen ganzer algebraischer Zahlen hingewiesen, wobei er Primelemente so definiert, wie wir es heute gewohnt sind (Dirichlet 1871, S. 450). Bei diesen Ringen fallen die Begriffe wirklich auseinander. Weber gibt noch eine zweite Konstruktion f¨ ur K¨ orper, die er auf Grund ihrer Herkunft Congruenzk¨ orper nennt. Er betrachtet hier die Faktorstruktur L := K[x]/gK[x] mit einem u ¨ ber K irreduziblen Polynom g. (S. hierzu Absch. 4 von Kap. 13.) Diese ist ein K¨orper. Ist n¨ amlich ψ ein nicht durch g teilbares Polynom, so sind ψ und g auf Grund der Irreduzibilit¨ at von g teilerfremd, so dass man nach dem Algorithmus des gr¨ ossten gemeinsamen Teilers“ zwei Polynome Q und ” ϕ bestimmen kann mit ψϕ + Qg = 1. Dann ist also
ψ + gK[x] ϕ + gK[x] = 1 + gK[x],
so dass L in der Tat ein K¨ orper ist. Was Weber erst sp¨ater benutzt und nicht besonders betont, ist, dass g in L eine Nullstelle hat, n¨ amlich x + gK[x]. Es ist ja g x + gK[x] = g(x) + gK[x] = gK[x]. Was bei Weber auch nicht herauskommt, ist, dass 1 + gK[x],
x + gK[x],
x2 + gK[x], . . . , xn−1 + gK[x]
eine K-Basis von L ist. Um den hierher geh¨orenden Satz zu formulieren, ben¨ otigen wir noch die Definition des Grades einer K¨ orpererweiterung. Ist L ein K¨ orper und ist K ein Teilk¨ orper, so dass L als K-Vektorraum endliche Dimension hat, so heißt diese Dimension Grad der Erweiterung L : K. Er wird mit [L : K] bezeichnet. In diesem Falle nennt man L auch endliche Erweiterung von K. Wir fassen, was wir bewiesen haben, zusammen in dem folgenden Satz 1. Ist K ein K¨ orper und ist g ∈ K[x] ein u ¨ber K irreduzibles Polynom vom Grade n, so ist L := K[x]/gK[x] ein K¨ orper vom Grade n u ¨ber K. Das Element t := x + gK[x] ist Nullstelle von g in L und 1, t, t2 , . . . , tn−1 ist eine K-Basis von L. Alle diese Aussagen finden sich explizit in der Arbeit Steinitz 1910. Weber konstruierte in seiner Arbeit von 1893, wie schon erw¨ ahnt, auch den Zerf¨ allungsk¨ orper eines Polynoms, falls seine Diskriminante verschieden von null ist. Seine Konstruktion ist insbesondere auch deswegen diffizil, weil er zugleich die galoissche Gruppe solcher Gleichungen konstruiert. Wir werden sp¨ ater einen rascheren Zugang zur galoisschen Theorie finden, so dass wir die Konstruktion Webers nur soweit verfolgen, bis wir einen zerf¨ allenden K¨ orper eines solchen Polynoms gefunden haben. Wir bleiben also bei einem Zwischenresultat Webers stehen.
1. Weber
111
Dieses gen¨ ugt aber, um die noch verbliebene L¨ ucke im euler-laplaceschen bzw. lagrangeschen Beweis des Fundamentalsatzes der Algebra zu schließen. ¨ ber dem K¨ orper K. Wir Es seien a1 , . . . , am und b1 , . . . , bm Unbestimmte u bezeichnen wieder mit λ(a) und λ(b) die elementarsymmetrischen Polynome in den Unbestimmten a bzw. b. Wir setzen f :=
m
(x − ai ) =
i:=1
m
(−1)i λi (a)xm−i .
i:=0
Dann ist
Dis(f ) = ±
(ai − aj )2 .
1≤i bf11 bf22 · · · bfmm genau dann, wenn die erste nicht verschwindende unter den Differenzen e 1 − f 1 , e 2 − f 2 , . . . , em − f m positiv ist. Wir sagen, wie schon fr¨ uher, dass ein gewisses Monom der b’s in einem Polynom vorkommt, wenn sein Koeffizient in diesem Polynom von null verschieden ist. Hiermit sind wir nun in der Lage, den folgenden Satz zu formulieren und zu beweisen. Satz 2. Der Koeffizient des h¨ ochsten in Δ(λ(a), b) vorkommenden Monoms der b’s ist — bis auf das Vorzeichen — eine Potenz von Dis(f ). Der Grad dieses Monoms ist nicht null. Beweis. Es ist ρσ(a) − ρτ (a) =
m
(aσ(i) − aτ (i) )bi .
i:=1
Daher ist das h¨ochste Monom der b’s, welches in dieser Differenz vorkommt, bi , wobei i der kleinste Index ist mit σ(i) = τ (i). Sein Koeffizient ist aσ(i) − aτ (i) . Da das h¨ ochste in Δ(a, b) vorkommende Monom der b’s das Produkt der h¨ ochsten in den Polynomen ρσ(a) − ρτ (a) vorkommenden Monome ist, ist der Koeffizient des fraglichen h¨ ochsten Monoms Produkt von Differenzen der Form ai − ak mit i = k. Da dieser Koeffizient aber ein symmetrisches Polynom in den a’s ist, muss er eine Potenz von Dis(f ) sein, da der Polynomring K[a1 , . . . , am ] ja ein ZPE-Ring ist. Es ist nicht schwer, den Exponenten von Dis(f ) zu bestimmen. Dazu muss man f¨ ur jedes i ≤ m − 1 z¨ahlen, wie oft der Faktor a1 − a2 bei bi vorkommt. Diese
1. Weber
113
Anzahl ist gleich der Zahl der Paare (σ, τ ) von Permutationen mit σ(k) = τ (k) f¨ ur k < i und σ(i) = 1 sowie τ (i) = 2. Diese Anzahl ist gleich (m − 2)!(m − i)!(m − i). Also ist der Exponent von Dis(f ) gleich (m − 2)!
m−1
(m − i)!(m − i) = (m − 2)!(m! − 1).
i:=1
Dies zeigt, dass das Vorzeichen gleich + ist, wenn m ≥ 4 ist. Wir werden aber im Folgenden weder den Exponenten noch das Vorzeichen explizit ben¨ otigen. Satz 3. Es sei g ∈ K(a, b). Es gibt dann ein χ ∈ K(l, b)[t], wobei l1 , . . . , lm und t ebenfalls Unbestimmte u ¨ber K sind, mit g(a, b) =
χ(λ(a), b, ρ) , G (ρ)
wobei G die Ableitung von G nach t ist. Beweis. Dies folgt unmittelbar aus Satz 3 von Abschnitt 6 des Kapitels 8: Was hier ρ, χ, G ist, ist dort f , G, μ. Wie oben bemerkt, ist das dortige C hier gleich {1}. Wendet man Satz 3 auf ak an, so gibt es also ein ψk ∈ K(l, b, t), dessen Nenner gleich G (t) ist, mit (1) ak = ψk λ(a), b1 , . . . , bm , ρ . Setzt man den f¨ ur ak gefundenen Ausdruck in f ein, so erh¨alt man (2) f ψk (λ(a), b, ρ) = 0. Ab hier weichen wir nun von der weberschen Arbeit ab, wobei wir uns jedoch der Methoden bedienen, die Gauß bei seinem zweiten Beweis des Fundamentalsatzes benutzte: Den waringschen Satz in seiner vollen Sch¨arfe und die Freiheit der Polynomringe. m Es sei F = i:=0 (−1)i Li xm−i ∈ K[x] mit L0 = 1 und es gelte Dis(F ) = 0. Wir setzen M := K(b1 , . . . , bm ), wobei die b’s weiterhin Unbestimmte u ¨ ber K sind. Wir definieren das Polynom H ∈ M [t] durch H := G(t, L, b), indem wir also in G(t, λ(a), b) die λi (a) durch Li ersetzen. Nach Satz 1 ist dann ur ein passendes e ∈ N, abgesehen vom Vorzeichen, der Koeffizient des Dis(F )e f¨
114
Kapitel VIIII. Der abstrakte K¨ orperbegriff
h¨ ochsten in Dis(H) vorkommenden Monoms der b’s und der Grad von Dis(H) in den b’s ist gr¨ oßer als null. Somit ist 0 = Dis(H) ∈ M.
(3)
Es sei g ∈ M [t] ein irreduzibler Faktor von H mit Leitkoeffizient 1. Dann ist also H = gh. Wir setzen N := M [t]/gM [t]. Ferner identifizieren wir k ∈ M mit k + gM [t]. Dann ist N ein K¨ orper und M ist auf die u ¨bliche Weise mit einem Teilk¨orper von N identifiziert. Die Substitution, die die λi (a) durch die Li und ρ durch t + gM [t] ersetzt, u ¨ berf¨ uhrt χ(λ(a), b, ρ) G (ρ, λ(a), b) in
χ(L, b, t + gM [t]) χ(L, b, t + gM [t]) = . G (t + gM [t], L, b) H (t + gM [t])
Dabei ist H (t + gM [t]) = G (t + gM [t], L, b) ungleich null. Denn nach (3) ist Dis(H) = 0, so dass H und H teilerfremd sind. Das Polynom H ist aber durch g teilbar, so dass H (t) eine Einheit modulo g ist. Mit (2) folgt daher F ψi (L, b, t + gM [t]) = 0 f¨ ur i := 1, . . . , m. Somit haben wir in N Nullstellen von F gefunden. Wir haben sie aber auch alle gefunden, wie wir nun zeigen werden. Nach (1) ist λ(a) = λ ψ1 (λ(a), b, ρ), . . . , ψm (λ(a), b, ρ) . Hieraus folgt Dank des waringschen Satzes und der Freiheit der Polynomringe L = λ ψ1 (L, b, t + gM [t]), . . . , ψm (L, b, t + gM [t]) und damit F =
m x − ψi (L, b, t + gM [t]) , i:=1
so dass F u ¨ ber N tats¨achlich in Linearfaktoren zerf¨ allt. Nachdem ich dies verstanden hatte, schaute ich noch einmal in die einschl¨ agige Arbeit Kroneckers (Kronecker 1887) und in der Tat, eine enge Verwandtschaft der Argumente Webers mit denen Kroneckers kann nicht geleugnet werden. Hier stellt sich noch einmal die Frage nach dem Grundwissen der Zeit. Fassen wir das Gefundene in einen Satz zusammen.
1. Weber
115
Satz 4. Es sei K ein kommutativer K¨ orper und F ∈ K[x] sei ein Polynom vom Grade m u ¨ber K, dessen Diskriminante nicht null sei. Es seien a1 , . . . , am und b1 , . . . , bm Unbestimmte u ¨ber K. Wir setzen wieder M := K(b1 , . . . , bm ) und H, g, ρ, ψi m¨ ogen die gleichen Bedeutungen wie zuvor haben, es m¨ oge also insbesondere ai = ψi λ(a), b, ρ sein. Dann ist ψi (L, b, t + gM [t]) ∈ M [t]/gM [t] und es gilt F =
m x − ψi (L, b, t + gM [t]) . i:=1
Den Funktionenk¨ orper M in den Unbestimmten b1 , . . . , bm zu betrachten ist nat¨ urlich verschwenderisch. Die Nullstellen von F erzeugen n¨amlich einen Teilk¨ orper von M , der als Vektorraum u ¨ ber K endlich erzeugt ist, w¨ahrend M dies nicht ist. Von den Potenzen einer solchen Nullstelle sind ja h¨ ochstens m u ¨ ber K linear unabh¨ angig. Die mm Produkte der jeweils m ersten Potenzen dieser Nullstellen erzeugen also einen Teilk¨orper Z von M , der u ¨ ber K h¨ ochstens die Dimension mm hat. Eine sp¨ atere Analyse wird zeigen, dass man diese Schranke durch die Schranke m! ersetzen kann, die dann aber bestm¨ oglich ist. Dieser Teilk¨ orper Z von M heißt Zerf¨ allungsk¨ orper von F . F¨ ur ihn gilt auch noch Z ⊆ K t + gK[t] , denn es ist ja t + gK[t] =
m
ψi L, b, t + gM [t] bi ,
i:=1
Korollar. Ist K ein vollkommener K¨ orper und ist F ∈ K[x], so besitzt F einen Zerf¨ allungsk¨ orper. Beweis. Nach dem Korollar zu Satz 3 aus Kapitel 6, Abschnitt 8 ist F Produkt von Polynomen mit von null verschiedener Diskriminante. Nimmt man dann das Produkt σ(F ) u ¨ ber eine maximale Menge von paarweise nicht assoziierten irreduziblen Teilern von F , so ist auch die Diskriminante von σ(F ) nach dem Korollar zu Satz 6 von Abschnitt 2 des Kapitels 7 von null verschieden, so dass σ(F ) einen Zerf¨ allungsk¨ orper hat, der dann auch Zerf¨ allungsk¨ orper von F ist. Da K¨ orper der Charakteristik 0 vollkommen sind, ist damit die L¨ ucke im eulerlagrangeschen, bzw., laplaceschen Beweis des Fundamentalsatzes geschlossen. Was f¨ ur eine Rolle spielten die Unbestimmten b1 , . . . , bm in den vorstehenden Untersuchungen? Nun, sie sorgten daf¨ ur, dass die ρσ(a) paarweise verschieden
116
Kapitel VIIII. Der abstrakte K¨ orperbegriff
waren und dies auch blieben, wenn man f¨ ur die ai die Nullstellen αi von F setzte. Hat K die Charakteristik 0, so findet man nat¨ urliche Zahlen β1 , . . . , βm , so dass ρσ(α) :=
m
ασ(i) βi
i:=1
mit variierendem σ insgesamt m! verschiedene Werte annimmt. Mit diesen βi an ultig. In diesem Falle erhalten wir, Stelle der bi bleiben alle obigen Argumente g¨ dass t + gK[t] ∈ Z ist, so dass sogar Z = K t + gK[t] gilt. Dass es diese nat¨ urlichen Zahlen gibt und dass sich die αi rational durch ρ(α, β) ausdr¨ ucken lassen, findet sich schon bei Galois in seinem ersten M´emoire. Er sagt dort, dass diese Ergebnisse bekannt seien. Wir werden auf sie zu gegebener Zeit zur¨ uckkommen (Kap. 13, Absch. 6). Dieses M´emoire ist 1830/31 entstanden — die Einleitung ist mit dem 16. Januar 1831 datiert —, aber erst 1846 erschienen ´ (Galois, Ecrits, S. 47ff.). 2. Galoisfelder. Den Galoisfeldern wollen wir diesen Abschnitt widmen, wobei wir uns auf die urspr¨ ungliche Arbeit von Galois beziehen werden (Galois 1830, ´ Ecrits, S. 113–127). Zun¨ achst aber ein paar Worte zu Galois selbst. ´ Evariste Galois ist ein sehr bemerkenswerter Mann. Er wurde am 25. November 1811 geboren und starb, erst zwanzigj¨ ahrig, am 31. Mai 1832 an den Verletzungen, die ihm am Vortage bei einem Duell zugef¨ ugt worden waren. Zwanzig Jahre ist das Alter, wo ein Akademiker gerade anf¨ angt, die ersten Schritte in seinem Beruf zu unternehmen. Galois aber hat bei seinem Tod ein Werk hinterlassen, dass die Algebra, ja die ganze Mathematik revolutionieren sollte. Sein mathematisches Talent wurde von seinem Mathematiklehrer L.-P. E. Richard schon fr¨ uh erkannt, der ihn zum Studium von Schriften Legendres, Lagrangens und Gauß’ veranlasste. Galois hatte auch Schriften Abels gelesen, den er zitiert. Er w¨ are sicherlich ein Liebling der 68er gewesen, h¨atten sie ihn gekannt. Er trat n¨ amlich auch politisch auf und wurde zu Zeiten des B¨ urgerk¨ onigs Louis-Philippe Mitglied der Garde nationale einer Unterorganisation der Republikaner. Seine politische T¨ atigkeit brachte ihn ins Gef¨ angnis. Republikanisch zu sein war unter Louis XVIII, seinem Nachfolger Charles X und Louis-Philippe nicht mehr guter Stil. Zugegeben, bei einem offentlichen Bankett mit dem offenen Messer in der Hand einen Toast auf den ¨ K¨ onig auszubringen, hat schon etwas Delikates an sich. Bei der anschließenden Gerichtsverhandlung glaubte man ihm aber, dass der Toast Auf Louis-Philippe, ” falls er zum Verr¨ ater wird“ gelautet habe und dass das Falls-er-zum-Verr¨ater-wird im entstehenden Tumult untergegangen w¨ are. Galois’ Theorie, die die Aufl¨ osbarkeit algebraischer Gleichungen durch Radikale mit Hilfe ihrer galoisschen Gruppe zu entscheiden gestattet, stieß auf Verst¨ andnislosigkeit. Das lag u. a. auch daran, dass er seine Sachen sehr knapp nur aufschrieb,
2. Galoisfelder
117
was uns Heutigei nicht mehr st¨ort, was Cauchy aber bem¨angelte, der deshalb bei einer Arbeit Galois’, die er zu begutachten hatte, sagte, er m¨oge ausf¨ uhrlicher sein, dann k¨ onne man an eine Publikation denken. In der Nacht vor dem Duell res¨ umierte Galois seine Ergebnisse noch einmal in einem Brief an seinen Freund Auguste Chevalier. Dieser Brief zeigt deutlich, dass Galois sich seiner Leistung ´ bewusst war (Ecrits, 173–185). Die Umst¨ande des Duells liegen im Dunkeln. Der Name Galoisfeld , wie die von Galois konstruierten Objekte heute genannt ¨ werden, ist eine Ubersetzung des englischen Ausdrucks Galois field“, der, wie ” schon erw¨ahnt, von E. H. Moore gepr¨ agt wurde (Moore 1896). Wir kennen schon GF(p) := Z/pZ f¨ ur eine Primzahl p. Dies sind die von Q verschiedenen Primk¨ orper und nur sie kommen als Primk¨ orper f¨ ur endliche K¨ orper in Frage. Ist also K ein endlicher K¨ orper, so gibt es eine Primzahl p mit GF(p) ⊆ K. Studiert man endliche K¨ orper, so hat man also immer die Situation, dass man zwei endliche K¨ orper K und L hat mit K ⊆ L. Diese etwas allgemeinere Situation sollte man immer im Auge haben, auch wenn wir nur von dem Falle K = GF(p) reden. Man sollte sich auch immer vor Augen halten, dass Galois den abstrakten K¨ orperbegriff noch nicht kannte. Dieser wurde ja erst 1893 von Weber eingef¨ uhrt. Galois bedient sich zur Konstruktion der Galoisfelder der irreduziblen Polynome vom Grade n. Dabei nennt er ein Polynom F u ¨ ber Z vom Grade n irreduzibel, falls es keine Polynome ϕ, ψ und χ gibt, — dass die Grade von ϕ und ψ mindestens 1 sein m¨ ussen, unterstellt er stillschweigend —, so dass ϕψ = F + pχ ist. Wir werden dies im Folgenden in heutiger Sprache darstellen, was wir z. T. auch jetzt schon taten, da wir nicht von Funktionen bzw. Gleichungen sprachen, sondern von Polynomen. Es sei also F ein u ¨ ber GF(p) irreduzibles Polynom vom Grade n. Dann sagt Galois: Dans ce cas, la congruence n’admettra donc aucune racine enti`ere, ni mˆeme au” cune racine incommensurable du degr´e inf´erieure. Il faut donc regarder les racines de cette congruence comme des esp`eces de symboles imaginaires, puisqu’elles ne satisfont pas aux questions des nombres entiers, symboles √ dont l’emploi dans le calcul sera souvent aussi utile que celui de l’imaginaire −1 dans l’analyse ordinaire.“ Ich schließe daraus und aus dem, wie er mit diesen Imagin¨aren umgeht, dass er die gleiche Vorstellung von ihnen hatte wie Cauchy von den komplexen Zahlen (Cauchy 1821. Siehe auch Kap. 6, Abschnitt 2). Er betrachtet n¨ amlich nun allgemeine Ausdr¨ ucke (expression g´en´erale) der Form (GF)
a + a1 i + a2 i2 + . . . + an−1 in−1 ,
wobei i eine Nullstelle von F und a, a1 , . . . , an−1 Elemente aus GF(p) seien. Dabei ist i Nullstelle von F “ so zu verstehen, dass er in diesen allgemeinen Ausdr¨ ucken, ”
118
Kapitel VIIII. Der abstrakte K¨ orperbegriff
wenn er sie multipliziert, Potenzen von i, so sie einen Expontenen gr¨ oßer oder gleich n haben, mittels F in die Form (GF) bringt (Division mit Rest). Er schließt nun, dass es genau pn Elemente der Form (GF) gibt. Er sagt weiter nichts dazu. Es ist aber auch klar. Denn die Elemente 1, i, i2 , . . . , in−1 sind wegen der Irreduzibilit¨ at von F ja linear unabh¨ angig, so dass die fraglichen Ausdr¨ ucke alle verschieden sind, andererseits k¨onnen die Koeffizienten jeweils p Werte annehmen, so dass die Anzahl dieser Ausdr¨ ucke gleich pn ist. Bezeichnet man die Gesamtheit n der Ausdr¨ ucke (GF) mit GF(p ), so ist 1, i, i2 , . . . , in−1 eine Basis des GF(p)Vektorraumes GF(pn ). Da wir nur benutzt haben, dass GF(p) ein K¨ orper ist, und auch die spezielle Form der Basis 1, i, . . . keine Rolle spielte, haben wir den folgenden Satz. Satz 1. Es sei L ein Vektorraum der Dimension n u ¨ber dem endlichen K¨ orper K. Ist dann |L| die Anzahl der Elemente in L und |K| die der Elemente in K, so gilt die Gleichung |L| = |K|n . Hieraus folgt als Korollar: Korollar. Ist K ein endlicher K¨ orper und ist p seine Charakteristik, ist ferner n := [K : GF(p)], so ist |K| = pn . Die Elementeanzahl eines endlichen K¨ orpers ist also stets Potenz einer Primzahl. Dies folgt wegen |GF(p)| = p aus Satz 1, da K als endlicher K¨ orper als GF(p)Vektorraum endlich erzeugt ist, so dass seine Dimension endlich ist. Galois formulierte etwas weniger. Er beobachtete nur, dass die Anzahl der Ausdr¨ ucke der Form (GF) gleich pn ist. Es sei nun u einer der Ausdr¨ ucke (GF), bei dem nicht alle der Koeffizienten null seien. Galois unterstellt im Folgenden stillschweigend, dass das Produkt zweier solcher Ausdr¨ ucke modulo F genommen seinerseits nicht null ist. Es ist ihm v¨ ollig klar, dass GF(p)[x]/F GF(p)[x] sich wegen der Irreduzibilit¨ at von F so verh¨alt wie Z/pZ. Er will zeigen, dass GF(pn ) auch die weniger trivialen Eigenschaften von GF(p) besitzt. Weniger triviale Eigenschaften von GF(p). Vor Galois war schon einiges geschehen. So hatte Pierre de Fermat in einem Brief vom 18. Oktober 1640 an Bernard Frenicle de Bessy geschrieben, dass xp−1 ≡ 1 mod p ist, falls nur p eine Primzahl und x eine nicht durch p teilbare nat¨ urliche Zahl ist (Dickson 1971, vol. I, p. 59). Ein Beweis dieses als kleiner Satz von Fermat bekannten Resultates wurde zuerst von Euler publiziert, der insgesamt drei Beweise gab (Euler 1741, 1750a, 1761). Leibniz hatte auch einen Beweis dieser Tatsache, doch der wurde erst im 19. Jahrhundert publiziert (Leibniz 1971, S. 180).
2. Galoisfelder
119
Die ersten beiden Beweise von Euler benutzen Induktion unter Zuhilfenahme der binomischen Formel p p i (x + 1) = x ≡ xp + 1 mod p. i i:=0 p
Der dritte Beweis ist bemerkenswert, in Sonderheit auch deswegen, weil er ein fr¨ uhes Beispiel eines gruppentheoretischen Schlusses ist und, wie Euler in einer sp¨ateren Arbeit zeigte, auch noch das allgemeinere Ergebnis xϕ(n) ≡ 1 mod n liefert, wenn x und n teilerfremde ganze Zahlen sind und ϕ die eulersche Totientenfunktion bezeichnet (Euler 1763). Dabei ist die eulersche Totientenfunktion dadurch erk¨ art, dass ϕ(n) die Anzahl der zu n teilerfremden nat¨ urlichen Zahlen unterhalb von n ist. Der Buchstabe ϕ f¨ ur diese Funktion wurde zuerst von Gauß benutzt (Disq., art. 38) und hat sich dann eingeb¨ urgert. Euler bemerkt zun¨ achst, indem er Euklid VII.24 zitiert, dass mit x auch x2 , x3 , . . . zu p teilerfremd sind. Weil es modulo p nur endlich viele verschiedene Reste gibt, gibt es verschiedene nat¨ urliche Zahlen k und l mit xk ≡ xl mod p. Wir d¨ urfen annehmen, dass k > l ist. Setzt man dann m := k − l, so folgt wegen der Teilerfremdheit von xl und p die Kongruenz xm ≡ 1 mod p. Ist nun d die kleinste nat¨ urliche Zahl unter diesen m, so sind 1, x, x2 , . . . , xd−1
(1)
paarweise inkongruent modulo p. Ist d = p − 1, so sind wir fertig. Ist d < p − 1, so gibt es einen Rest y, der modulo p zu keiner der Potenzen von x kongruent ist. Dann sind aber die Reste (2) y, xy, x2 y, . . . , xd−1 y zu allen Potenzen von x und auch untereinander inkongruent modulo p. Somit erhalten wir 2d zu p inkongruente Reste. Ist 2d = p − 1, so ist d Teiler von p − 1. Ist 2d = p − 1, so gibt es ein z, das zu keinem der Reste (1) und (2) kongruent modulo p ist. Dann erh¨alt man in z, xz, xz , . . . , xd−1 z
120
Kapitel VIIII. Der abstrakte K¨ orperbegriff
weitere d von (1) und (2) verschiedene Reste modulo p. Am Ende sieht man, dass d Teiler von p − 1 ist, dass es also ein e ∈ N gibt, mit p − 1 = ed. Es folgt xp−1 − 1 = (xd − 1)
e−1
xdi ≡ 0 mod p.
i:=0
Man sieht hier also die Zerlegung einer Gruppe in die Restklassen nach einer Untergruppe, so dass dieser Schluss am Ende den sog. Satz von Lagrange liefert. Um diesen Satz bei Lagrange zu erkennen, der dort nur liefert, dass die Ordnung einer Untergruppe der symmetrischen Gruppe vom Grade n Teiler von n! ist, muss man sehr genau hinschauen (Lagrange 1770/71, §§63, 64 und 83 bzw. Kap. 8, Abschnitt 6). Satz von Lagrange. Ist G eine endliche Gruppe und ist U eine Untergruppe von G, so ist |U | Teiler von |G|. Die Zahl [G : U ] :=
|G| , |U |
genannt Index von U in G, ist also stets eine nat¨ urliche Zahl. ucke u der Form (GF), bei dem Galois betrachtet nun einen der pn − 1 Ausdr¨ nicht alle Koeffizienten null sind. Da es nur endlich viele verschiedene Potenzen von u gibt, so Galois, gibt es eine nat¨ urliche Zahl m mit um = 1. (Er schreibt u ¨ brigens immer Gleichungen und keine Kongruenzen wie Gauß, den er auch in diesem Zusammenhang erw¨ahnt.) Den Zwischenschritt mit k und l macht er nicht. Man hat dann also, wenn m minimal gew¨ahlt ist, m Ausdr¨ ucke 1, u, u2 , . . . , um−1 , die allesamt voneinander verschieden sind. Sind dies noch nicht alle von null verschiedenen Ausdr¨ ucke der Form (GF), so multiplizieren wir sie mit einem weiteren Ausdruck v, usw. Galois wiederholt hier also Eulers Argument. Er erh¨ alt, dass m Teiler von pn − 1 ist und dass (Mu)
n
up
−1
=1
bzw.
n
up = u
ist f¨ ur — und das f¨ uge ich der Deutlichkeit halber hinzu — alle von null verschiedenen u bzw. f¨ ur alle u. Aus der Endlichkeit der multiplikativen Gruppe wurde die Existenz von m erschlossen. Da die spezielle Gestalt der multiplikativen Gruppe keine Rolle spielte, k¨ onnen wir syntaktisch und semantisch korrekt definieren: Ist G eine endliche Gruppe und ist u ∈ G, so heißt die kleinste nat¨ urliche Zahl m, f¨ ur die um = 1 ist, Ordnung von u. Wir bezeichnen sie im Folgenden mit o(u). Man kann o(u) etwas durchsichtiger wie folgt definieren. Die Abbildung z → uz ist ein Homomorphismus
2. Galoisfelder
121
von Z in G unabh¨ angig davon, ob G endlich ist oder nicht. Der Kern dieses Homomorphismus ist eine Untergruppe von Z. Es gibt also eine nicht negative ganze Zahl o(u), so dass o(u)Z der Kern dieses Homomorphismus ist. Ist G endlich, so ist nat¨ urlich o(u) > 0 und o(u) ist die kleinste unter den nat¨ urlichen Zahlen m mit um = 1. Ist o(u) = 0, so nennt man u auch von unendlicher Ordnung, da das Bild von Z unter dem Homomorphismus z → g z eine unendliche Gruppe ist. ur alle u ∈ G. Die Ordnung Korollar. Ist G eine endliche Gruppe, so ist u|G| = 1 f¨ eines jeden Elementes von G ist also Teiler der Ordnung von G. Argumentiert man bei der Herleitung von (Mu) statt mit GF(p) mit K und mit |K|n an Stelle von pn , so haben wir den folgenden Satz bewiesen, der einmal mehr zeigt, dass man u ¨ ber endlichen K¨ orpern Polynome und Polynomfunktionen nicht identifizieren kann. Satz 2. Es sei L ein endlicher K¨ orper und K sei ein Teilk¨ orper von L. Ist q := |K| und n := [L : K], so ist n lq = l f¨ ur alle l ∈ L. Galois sagt nun, dass man genau wie in der Zahlentheorie beweise, dass es ein primitives Element gebe, dh. ein von null verschiedenes Element u in GF(pn ) mit ¨ brigen Elemente Potenzen dieses Elementes seien. Es o(u) = pn − 1, so dass alle u geht jetzt also darum, diesen Beweis nachzutragen. Es sei wieder ϕ die eulersche Totientenfunktion. Nach Gauß 1801, art. 39 gilt Satz 3. Ist n eine nat¨ urliche Zahl, so ist n=
ϕ(d).
d|n
Beweis. Der Beweis ist eine Variante des gaußschen Beweises. Wir betrachten die n Br¨ uche (B) Ist in gek¨ urzter Form
1 2 n , , ..., . n n n d n = , n d
so ist dn = nd und daher d Teiler von n. Ist andererseits d Teiler von n und ist d teilerfremd zu d, so ist, falls n = kd ist, d kd n = = , d kd n
122
Kapitel VIIII. Der abstrakte K¨ orperbegriff
so dass d als Nenner unter den gek¨ urzten der Br¨ uche (B) vorkommt. Ferner kommt d urzten der Br¨ uche (B) vor. jeder der Br¨ uche d mit ggT(d , d) = 1 unter den gek¨ Da ϕ(d) die Anzahl dieser Br¨ uche ist, gilt die Behauptung. Die Gruppe G heißt zyklisch, wenn es ein g ∈ G gibt mit G = {g z | z ∈ Z}, dh., wenn G epimorphes Bild von Z ist. Ist G = {g z | z ∈ Z}, so heißt g Erzeugende von G. Satz 4. Es sei G eine endliche zyklische Gruppe der Ordnung n und g sei eine Erzeugende von G. Ist i ∈ Z, so ist g i genau dann Erzeugende von G, wenn ggT(i, n) = 1 ist. Die Anzahl der Erzeugenden von G ist also ϕ(n). Beweis. Es sei ggT(i, n) = 1. Es gibt dann u, v ∈ Z mit 1 = iu + nv. Es folgt g = g 1 = g iu+nv = g iu g nv = (g i )u , so dass g in der von g i erzeugten Untergruppe von G liegt. Folglich liegt G in dieser Untergruppe, so dass g i Erzeugende von G ist. Es sei g i Erzeugende von G. Es gibt dann ein u ∈ Z mit g = (g i )u . Es folgt (1−iu) g = 1 und damit 1 − iu ∈ nZ, so dass i und n teilerfremd sind. Die n¨ achsten beiden S¨ atze sind nur der Vollst¨andigkeit halber hier aufgenommen. Sie werden in diesem Kapitel nicht ben¨ otigt. Satz 5. Ist G eine zyklische Gruppe der Ordnung n, so enth¨ alt G eine und dann auch nur eine Untergruppe der Ordnung d, wenn d Teiler von n ist. Untergruppen zyklischer Gruppen sind zyklisch. Beweis. Die Untergruppen von (Z, +) sind genau die Ideale des Ringes Z. Daher sind die Untergruppen von Z alle zyklisch, da Z ja ein Hauptidealring ist. Die Aussage des Satzes folgt daher aus dem zweiten Isomorphiesatz, da die Ideale oberhalb nZ genau die Ideale dZ sind, f¨ ur die d Teiler von n ist. Dies gilt nat¨ urlich auch f¨ ur n = 0. Satz 6. Ist G eine zyklische Gruppe der Ordnung n und ist d ein Teiler von n, so enth¨ alt G genau ϕ(d) Elemente der Ordnung d. Beweis. Dies folgt unmittelbar aus Satz 5 und Satz 4. Erzeugende zyklischer Gruppen heißen in der Zahlentheorie primitive Elemente. Dieser Name wurde von Euler 1774 eingef¨ uhrt, als er versuchte, die lambertsche Behauptung von 1769 zu beweisen, dass die multiplikative Gruppe von GF(p) zyklisch ist. Lambert selbst gab keinen Beweis. Eulers Beweis ist l¨ uckenhaft, wie Gauß schreibt (Gauß 1801, art. 56), wo ich auch die Aussage u ¨ ber Lambert her habe. Gauß gab einen korrekten Beweis, den wir nun reproduzieren und der viel mehr hergibt als die gaußsche Aussage, dass es n¨amlich ein primitives Element
2. Galoisfelder
123
modulo p gebe. Zuvor jedoch hatte schon Legendre diesen Sachverhalt bewiesen und zwar laut Dickson (1905, S. 182) in den M´emoire de l’Acad´emie Royale des Sciences, Paris 1785, 471–473. Ich weiß nicht, ob der dort gegebene Beweis der gleiche ist wie der, den er in seinem ber¨ uhmten Essai sur la th´eorie des nombres gab. Dort charakterisiert er Primitivwurzeln modulo p als diejenigen Wurzeln von ur keinen Teiler q von p − 1 Wurzeln von xp−1 − 1, die f¨ x
p−1 q
−1
sind. Er zeigt ferner, dass xp−1 − 1 genau p − 1 Wurzeln modulo p hat. Schließlich behauptet er, dass es genau ϕ(p − 1) Elemente gibt, die Wurzeln von xp−1 − 1, aber nicht von p−1 x q −1 sind. Sein Beweis ist eine nicht sehr gl¨ ucklich formulierte Inklusions-ExklusionsInduktion u ¨ber die Anzahl der Primteiler von p − 1. (Legendre 1797/98, p. 413 ff.). Legendre benutzt nicht das Funktionssymbol ϕ, sondern schreibt ϕ(p − 1) explizit als Produkt. ur alle Teiler Satz 7. Es sei G eine endliche Gruppe. Hat die Gleichung xd = 1 f¨ d von |G| h¨ ochstens d L¨ osungen in G, so ist G zyklisch. Beweis (Gauß 1801, artt. 53–55). Es sei d Teiler von |G| und ψ(d) sei die Anzahl der Elemente der Ordnung d von G. Ist ψ(d) = 0, so gibt es ein g ∈ G mit o(g) = d. osungen der Gleichung xd = 1 sind. Es folgt, dass 1, g, g 2 , . . . , g d−1 allesamt L¨ Also sind dies alle L¨ osungen dieser Gleichung in G, so dass G nach Satz 5 genau ϕ(d) Elemente der Ordnung d hat. Es gilt also ψ(d) = 0 oder ψ(d) = ϕ(d). Mit n := |G| folgt, da jedes Element von G ja eine Ordnung hat, die |G| teilt, ψ(d) ≤ ϕ(d) = n n= d|n
d|n
und damit ψ(d) = ϕ(d) f¨ ur alle Teiler d von n. Insbesondere ist also ψ(n) = ϕ(n) ≥ 1, so dass es ein Element g ∈ G der Ordnung n gibt. Dieses g erzeugt nat¨ urlich die Gruppe G. Dies ist letztlich die Struktur des eulerschen, nicht ganz gelungenen Beweises (Euler 1774, Nummern 28 bis 39). Der eulersche Beweisversuch f¨ angt damit an, dass er feststellt, dass die Gleichung xn − 1 = 0 modulo einer Primzahl p h¨ ochstens n L¨osungen hat. Zum Beweis macht er eine nicht ganz gl¨ uckliche Induktion nach n. Der Beweis ist in Ordnung, wenn man statt xn − 1 ein beliebiges Polynom modulo p betrachtet. Gravierender aber ist, dass er im weiteren Verlauf benutzt, dass die Gleichung xn − 1 = 0 modulo p stets genau n L¨osungen hat, wenn n Teiler von p − 1 ist. Dies hatte er nicht bewiesen. Hier f¨ uhrt Gauß die Funktion ψ ein, die er mittels der beiden Summen gegen die eulersche Totientenfunktion ausspielt. Satz 7 findet sich mit obigem Beweis in Haupt 1929, Band I, S. 113. Haupt verweist auf Gauß und auf Frobenius und Stickelberger 1879, S. 237, wo sich der
124
Kapitel VIIII. Der abstrakte K¨ orperbegriff
Satz aber nur f¨ ur abelsche Gruppen formuliert und bewiesen findet. Der dortige Beweis ist von v¨ ollig anderer Natur und funktioniert nur bei abelschen Gruppen. Korollar 1. Es sei K ein kommutativer K¨ orper. Ist G eine endliche Untergruppe der multiplikativen Gruppe von K, so ist G zyklisch. Beweis. Dies folgt mittels Satz 7 aus der Bemerkung, dass das Polynom xd − 1 f¨ ur alle nat¨ urlichen Zahlen d h¨ ochstens d Nullstellen in K hat. Korollar 2. Die multiplikative Gruppe von GF(pn ) ist zyklisch. Damit haben wir also wie in der Zahlentheorie“ bewiesen, dass GF(pn ) ein ” primitives Element hat. Ist dies der Beweis, der Galois vorschwebte oder ist es der legendresche? Der Beweis der Existenz eines primitiven Elementes ist nicht konstruktiv und bis heute ist man aufs Probieren angewiesen, um ein solches Element zu finden. Das beste mir bekannte Verfahren ist das folgende. Man nehme sich ein von null verschiedenes Element a und berechne seine Ordnung m. Ist m = pn − 1, so hat man in a ein primitives Element gefunden. Ist m < pn − 1, so w¨ahle man ein Element b und berechne dessen Ordnung m . Ist m Teiler von m, so ist b ∈ {1, a, a2 , . . . , am−1 } (hier ben¨ otigt man Satz 6). Die Chance ein b zu finden, so dass m kein Teiler von m ist, ist also ≥ 12 . Hat man ein solches b, so konstruiere man aus a und b ein Element c der Ordnung kgV(m, m ). Hierbei kann man sich mit Vorteil des Algorithmus r bedienen (s. Satz 11, Kap. 2, Absch. 3). Dann setze man a := c und m := kgV(m, m ) und beginne aufs Neue. Einzelheiten zu diesem sehr wirkungsvollen, schon von Gauß zur Bestimmung einer Primitivwurzel modulo p benutzten Verfahren finden sich in L¨ uneburg 1987a, S. 171ff. Wir kehren wieder zur¨ uck zu der galoisschen Arbeit. Er und damit auch wir haben noch mehr bewiesen n¨amlich, dass jedes irreduzible Polynom vom Grade n n u ¨ ber GF(p) Teiler von xp − x ist. Denn die Irrationale i ist ja Nullstelle von F n pn und auch von x − x, so dass F als irreduzibles Polynom Teiler von xp − x ist. F aber war ein beliebiges irreduzibles Polynom vom Grade n u ¨ ber GF(p). Er notiert ferner, dass die Nullstellen des irreduziblen Polynoms F des Grades n die Werte 2
n−1
i, ip , ip , . . . , ip sind. Seine Begr¨ undung daf¨ ur ist, dass ja j
j
F (i)p = F (ip ) sei. Galois zeigt auch, dass das Minimalpolynom G eines Elementes j ∈ GF(pn ) keinen Grad gr¨ oßer als n haben kann. Ist n¨ amlich m der Grad von G und ist j eine Wurzel von G, so sind alle Elemente von GF(pm ) von der Form a + a1 j + a2 j 2 + . . . + an−1 j m−1
2. Galoisfelder
125
mit Koeffizienten in GF(p). Somit sind alle diese Elemente auch Elemente von GF(pn ), so dass in der Tat m ≤ n gilt. Mittels Satz 1 erhalten wir sogar noch, dass m Teiler von n ist. Ist n¨amlich k der Grad von GF(pn ) u ¨ ber GF(pm ), das wie n gesehen ganz in GF(p ) liegt, so ist nach Satz 1 ja n = mk. Um nun die irreduziblen n Polynome vom Grade n u ¨ ber GF(p) zu bekommen, befreie man xp − x von allen pm ur alle m, die kleiner sind als n, so sagt gemeinsamen Faktoren mit x − x f¨ Galois, wir sagen, f¨ ur alle von n verschiedenen m, die n teilen. Dann erh¨ alt man ein Polynom, das Produkt u ¨ber alle irreduziblen Polynome vom Grade n u ¨ ber GF(p) ist. Habe man nun eines von diesen, so sei es ein Leichtes die u ¨brigen nach der Methode des Herrn Gauß zu bestimmen. Eines aber sei h¨aufig durch Probieren zu finden. Was Galois mit der Methode des Herrn Gauß meint, ist mir nicht klar geworden. Auch hier ist das Probieren ein sehr gutes Verfahren, wie ich aus eigener Rechenpraxis weiß. Auf Grund von Korollar 1 zur m¨ obiusschen Umkehrformel (s. u.), muss man im Schnitt n Polynome vom Grade n testen, bis man ein irreduzibles gefunden hat. N¨ aheres auch hierzu in L¨ uneburg 1987a. Nachdem nun mittels eines irreduziblen Polynoms vom Grade n das Galoisfeld ¨ber seine Struktur gesagt wurde, f¨ ahrt mit pn Elementen konstruiert und einiges u Galois fort: Il s’agit maintenant de faire voir que, r´eciproquement `a ce que nous venons ” ν de dire, les racines de l’´equation ou de la congruence xp = x d´ependront toutes d’une seule congruence du degr´e ν. Dies ist schwierig zu interpretieren, da es hier um Existenzfragen geht. Hat man ein irreduzibles Polynom vom Grade n, so kann man die allgemeinen Ausdr¨ ucke (GF) hinschreiben und sie manipulieren. Hat man aber kein solches Polynom, wie n will man dann die Wurzeln von xp = x beschreiben? Ja, wie u ¨ berhaupt ihre Existenz feststellen? Seit Steinitz 1910 wissen wir, wie man dies bewerkstelligen kann, doch Galois, der lange vor Steinitz lebte, sagt nichts dazu. Hier klafft also eine L¨ ucke bei Galois. Hat man diese L¨ ucke irgendwie geschlossen und sei es mit unserem heutigen Wissen, ist das N¨achste wieder in Ordnung. Galois f¨ ahrt n¨ amlich fort: Soit en effet i une racine d’une congruence irr´eductible, et telle que toutes les ” ν racines de la congruence xp = x soient fonctions rationnelles de i. (Il est clair qu’ici, comme dans les ´equations ordinaires, cette propri´et´e a lieu)∗∗ .“ Man nehme f¨ ur i, so sage ich, etwa ein erzeugendes Element der multiplikativen n Gruppe des Zerf¨ allungsk¨ orpers von xp − x. Spannend ist die Fußnote **, die folgendermaßen lautet: La proposition g´en´erale dont il s’agit ici peut s’´enoncer ainsi: ´etant donn´ee une ” ´equation alg´ebrique, on pourra trouver une fonction rationnelle θ de toutes ses racines, de telle sorte, que r´eciproquement chacune des racines s’exprime rationnellement en θ. Ce th´eor`eme ´etait connu d’Abel, ainsi qu’on peut le voir par la premi`ere partie du m´emoire que ce c´el`ebre g´eom`etre a laiss´e sur les fonctions
126
Kapitel VIIII. Der abstrakte K¨ orperbegriff
elliptiques.“ Das heißt in unserer Sprache: Ist f ein Polynom, so gibt es ein ϑ, welches eine rationale Funktion in den Nullstellen von f ist, so dass die Nullstellen von f ihrerseits rationale Funktionen in ϑ sind. Galois behauptet hier also, dass f einen Zerf¨ allungsk¨ orper hat und dass man diesen Zerf¨allungsk¨ orper durch Adjunktion eines Elementes zum Grundk¨ orper erh¨ alt. Dass dies in der vorliegenden Allgemeinheit nicht gilt, wissen wir seit Steinitz 1910, der den G¨ ultigkeitsbereich dieses Satzes vollst¨andig kl¨ arte. F¨ ur endliche K¨ orper aber gilt er auf Grund der Zyklizit¨ at ihrer multiplikativen Gruppen. Was Galois hier beweist, ist, dass das Minimalpolyn ¨ ber GF(p) den Grad n hat. nom dieses ϑ f¨ ur das Polynom xp − x u Die Stelle bei Abel, die hier zitiert wird, ist Abel 1827. Abel zeigte in dieser Arbeit, dass die Zerf¨allungsk¨ orper von gewissen Polynomen, die mit elliptischen Funktionen zu tun haben, primitive Elemente besitzen, wobei Abel die Begriffe K¨ orper, Zerf¨ allungsk¨ orper, primitives Element einer K¨ orpererweiterung noch nicht zur Verf¨ ugung standen. Abels Rechnungen sind nur sehr m¨ uhevoll nachzuvollziehen. Die Existenz von irreduziblen Polynomen vom Grade n steht also immer noch in Zweifel. Bevor wir uns daran machen, ihre Existenz zu beweisen, sei noch gesagt, dass Galois das bisher Entwickelte an Hand des Beispiels p = 7 und n = 3 erl¨ autert. Im weiteren Verlauf der Arbeit untersucht er durch Radikale l¨ osbare Gleichungen von Primzahlpotenzgrad. Es ist also noch offen geblieben, ob das Polynom, das man erh¨ alt, indem man n m oßer xp −x von allen mit den xp −x gemeinsamen Faktoren befreit, einen Grad gr¨ als 0 hat. Nur dann sind wir sicher, dass es auch wirklich irreduzible Polynome vom Grade n gibt. Wir werden mehr tun, indem wir die genau Anzahl dieser Polynome bestimmen. Was nun folgt, ist leicht modifiziert das, was sich schon bei Dedekind findet (Dedekind 1857, S. 19 ff). Er untersucht vor allem nur den Fall, dass q eine Primzahl ist. Doch davon macht er keinen Gebrauch. Satz 8. Es sei K ein K¨ orper mit q Elementen. Ist n eine nat¨ urliche Zahl und ist f ein irreduzibles Polynom vom Grade m u ¨ber K, so ist f genau dann Teiler von n xq − x, wenn m Teiler von n ist. n Beweis. Es sei m Teiler von n. Ist m = n, so ist f Teiler von xq − x, wie wir mt bereits wissen. Es sei t ∈ N und f teile xq − x. Dann ist f wegen xq
m(t+1)
− x = xq
mt+m
= (xq
mt
m
m
− xq + xq − x m
m
− x)q + xq − x
m(t+1)
n
auch Teiler von xq − x. Also ist f Teiler von xq − x, falls m Teiler von n ist. qn Es sei f Teiler von x − x. Es gibt t, r ∈ N0 mit n = tm + r und r < m. Es folgt n (tm+r) r r xq − x = xq − xq + xq − x = (xq
tm
r
r
− x)q + xq − x,
2. Galoisfelder
127 r
oglich ist, wie wir so dass f auch xq − x teilt, was wegen r < m nur dann m¨ schon gesehen haben, wenn r = 0 ist. Also ist m Teiler von n. Damit ist der Satz bewiesen. Satz 9. Es sei ψ(m, q) die Anzahl der irreduziblen Polynome mit Leitkoeffizient 1 vom Grade m u ¨ber GF(q). Dann ist qn =
dψ(d, q).
d|n
n
n
Beweis. Die Ableitung von xq −x ist −1. Daher ist xq −x quadratfrei, also nicht n durch das Quadrat eines irreduziblen Polynoms teilbar. Nach Satz 8 ist xq − x daher das Produkt u ¨ber alle irreduziblen Polynome mit Leitkoeffizient 1, deren Grade Teiler von n sind. Gradvergleich liefert somit die Behauptung. Was uns interessiert, ist nicht die Summe u ¨ ber die ψ(d, q), sondern die ψ(d, q) selber. Auch an sie kann man herankommen und zwar mit Hilfe der m¨ obiusschen Umkehrformel, die nicht von M¨ obius stammt, wie man auf Grund des Namens meinen k¨ onnte, sondern von Dedekind, der sie in unserem Zusammenhang aufstellte (Dedekind 1857, S. 21). Sie wird uns auch die eulersche Totientenfunktion explizit in die Hand geben. Dedekind gibt keinen Beweis f¨ ur die m¨ obiussche Umkehrformel, er erscheint ihm einfach — was er ist —, wie aus der folgenden geheimnisvollen Bemerkung hervorgeht: Und es ist leicht zu sehen, dass dasselbe ” Theorem auch gilt, wenn die Functionen f , F sich auf irgend welche Elemente m beziehen, denen jedesmal bestimmte andere Elemente nach denselben Principien entsprechen, wie die Divisoren einer ganzen Zahl dieser Zahl selbst entsprechen.“ Wird hier vorweggenommen, womit Gian-Carlo Rota im 20. Jahrhundert zur Ber¨ uhmtheit gelangte? Wie sagte Emmy Noether angeblich immer: Es steht alles ” schon bei Dedekind“. Definieren wir zun¨ achst die M¨ obiusfunktion μ, die nun wirklich von M¨ obius stammt (M¨obius 1832). Ist n ∈ N, so setzen wir μ(n) := 0, falls es eine Primzahl gibt, deren Quadrat n teilt. Ist n quadratfrei, so setzen wir μ(n) := (−1)α , wenn α die Anzahl der Primteiler von n ist. Dann gilt der folgende, wie gesagt von Dedekind stammende Satz. M¨ obiussche Umkehrformel. Ist f eine Abbildung von N in eine abelsche Gruppe und definiert man F durch f (d), F (n) := d|n
so ist
n μ f (n) = F (d). d d|n
128
Kapitel VIIII. Der abstrakte K¨ orperbegriff
Beweis. Wir zeigen zun¨achst, dass
μ(d) = 0
d|n
ist, falls n ≥ 2 ist. Um dies zu zeigen, sei π(n) die Menge der Primteiler von n. Ferner setzen wir t := |π(n)|. Dann ist t ≥ 1. Weil μ(d) = 0 ist, wenn d nicht quadratfrei ist, gilt μ(d) = (−1)|X| d|n
X⊆π(n)
t = (−1) i i:=0 t
i
= (1 − 1)t = 0. Hiermit folgt weiter n n μ μ f (e) F (d) = d d d|n d|n e|d = μ(k)f (e) e,k; ek|n
=
f (e)
e|n
μ(k)
k| n e
= f (n). Korollar 0. Es ist
μ(d) =
d|n
1, 0,
falls n = 1, falls n > 1.
Korollar 1. Ist wieder ψ(n, q) die Anzahl der irreduziblen Polynome vom Grade n mit Leitkoeffizient 1 u ¨ber GF(q), so ist ψ(n, q) =
n 1 μ(d)q d . n
d|n
Beweis. Dies folgt mit f (n) = nψ(n, q) und F (n) = q n mittels der m¨obiusschen Umkehrformel aus Satz 10.
n d
Man beachte, dass die Division durch n aufgeht, da ψ(n, q) eine ganze Zahl ist. n Ist μ(d)q d von null verschieden, so ist d quadratfrei. Unter den Exponenten mit quadratfreiem d ist der am kleinsten, bei dem d das Produkt u ¨ber alle
3. Die Kreisteilungspolynome
129
Primteiler von n ist. Alle anderen vorkommenden Exponenten sind gr¨ oßer. Daher gilt n n n μ(d)q d ≡ μ(s)q s mod q s +1 , d|n
falls nur s das Produkt u ¨ber alle Primteiler von n ist. Hieraus folgt, dass nψ(n, q) = 0 und damit ψ(n, q) = 0 ist. Es gibt also zu jedem n ein u ¨ ber GF(q) irreduzibles Polynom vom Grade n. Es ist ψ(10, 2) = 99. Mittels der m¨ obiusschen Umkehrformel bekommen wir auch ϕ in den Griff. Es gilt n¨ amlich Korollar 2. Ist ϕ die eulersche Totientenfunktion, so gilt 1 1− ϕ(n) = n p p∈π(n)
f¨ ur alle n ∈ N. Dabei bezeichne π(n) wieder die Menge der Primteiler von n. Insbesondere ist ϕ(mn) = ϕ(m)ϕ(n) f¨ ur alle teilerfremden nat¨ urlichen Zahlen m und n. ¨ Der einfache Beweis sei dem Leser als Ubungsaufgabe u ¨berlassen. Dedekind benutzt die von ihm etablierte m¨ obiussche Umkehrformel in der oben erw¨ahnten Arbeit ebenfalls, um die Produktdarstellung f¨ ur ϕ(n) zu beweisen. Die Produktdarstellung selbst war schon Euler bekannt (Dickson 1971, vol. I, S. 113). 3. Die Kreisteilungspolynome. Es wurde in Abschnitt 2 schon erw¨ ahnt, dass endliche K¨ orper stets kommutativ sind. F¨ ur diesen Satz gibt es viele Beweise, von denen die meisten, direkt oder indirekt, Gebrauch von den Kreisteilungspolynomen machen. Da wir sie auch sp¨ater noch ben¨ otigen, werden wir sie hier in aller Ausf¨ uhrlichkeit behandeln. Die Menge Wn aller Nullstellen von xn − 1 ist multiplikativ abgeschlossen und daher wegen ihrer Endlichkeit eine Untergruppe der multiplikativen Gruppe von C. Da die Ableitung nxn−1 dieses Polynoms mit ihm keinen Faktor gemeinsam hat, hat xn − 1 genau n Nullstellen. Somit bilden die n-ten Einheitswurzeln eine Untergruppe Wn der Ordnung n von C∗ . Nach Korollar 1 zu Satz 8 von Abschnitt 2 ist Wn zyklisch. Es gibt somit ϕ(n) primitive n-te Einheitswurzeln in C (s. die Definition im Anschluss an Satz 7 aus Abschnitt 2). Diese Menge bezeichnen wir mit PnE. Ist n ∈ N, so setzen wir Φn := (x − λ) λ∈PnE
130
Kapitel VIIII. Der abstrakte K¨ orperbegriff
und nennen dieses Polynom n-tes Kreisteilungspolynom. Es gilt dann Grad(Φn ) = ϕ(n). Weil jede n-te Einheitswurzel eine primitive d-te Einheitswurzel ist f¨ ur einen Teiler d von n, gilt ferner xn − 1 = Φd . d|n
Dies sind die grundlegenden Eigenschaften der Kreisteilungspolynome, die unmittelbar aus ihrer Definition folgen. Es ist Φ1 = x − 1. Ist p eine Primzahl, so ist xp − 1 = (x − 1)Φp und folglich Φp =
p−1
xi .
i:=0
Dieses Polynom haben wir schon fr¨ uher als irreduzibel erkannt. Satz 1. Ist n ∈ N, so gilt a) Der Leitkoeffizient von Φn ist 1. ur n > 1. b) Es ist Φ1 (0) = −1 und Φn (0) = 1 f¨ c) Es ist Φn ∈ Z[x]. d) Φn ist primitiv. Beweis. a) folgt unmittelbar aus der Definition von Φn . b) Es ist Φ1 = x − 1 und Φ2 = x + 1. Daher gilt b) in diesen beiden F¨ allen. Es sei n ≥ 3 und es gelte Φd (0) = 1 f¨ ur alle d mit 1 < d < n. Dann ist −1 =
Φd (0) = −Φn (0),
d|n
so dass auch b) gilt. ur alle d < n. c) Es ist Φ1 = x − 1 ∈ Z[x]. Es sei n > 1 und es gelte Φd ∈ Z[x] f¨ Setze g := Φd . d|n; d 0, so ist A endlich und daher noethersch. Ist o(a1 ) = 0, so ist A zu (Z, +) isomorph und daher ebenfalls noethersch. Es sei also n > 1. Setze B := Zan . Dann ist B noethersch, wie gerade gesehen. Ferner wird A/B von a1 + B, . . . , an−1 + B erzeugt, ist daher nach Induktionsannahme noethersch, so dass A nach Satz 2 noethersch ist. Es gibt viele Beweise f¨ ur die Irreduzibilit¨ at der Kreisteilungspolynome. Als erster bewies Gauß, wie schon erw¨ahnt, die Irreduzibilit¨ at von Φp , falls p eine Primzahl ist (Gauß 1801, art. 341). P. L. Wantzel sagt in seiner Arbeit von 1837, dass man mit den gaußschen Methoden auch die Irreduzibilit¨ at von Φpn beweisen k¨ onne. Dem werden wir in Abschnitt 2 von Kapitel 12 nachgehen. Kronecker beur beliebiges n (Kronecker 1854). Die ¨alteren wies dann die Irreduzibilit¨ at von Φn f¨ Beweise finden sich bei Ruthinger 1907 zusammengestellt. Von neueren Beweisen seien noch die von Landau (1933), Schur (1933) und Levi (1933) erw¨ ahnt. Wir mischen hier den dedekindschen (Dedekind 1857a) mit dem levischen Beweis. Satz 4. Φn ist f¨ ur alle n ∈ N irreduzibel u ¨ber Q. Beweis. Wie wir wissen, gen¨ ugt es zu zeigen, dass Φn in Z[x] irreduzibel ist. Dazu sei f ein irreduzibles Polynom aus Z[x], welches Φn teilt. Weil Φn den Leitkoeffizient 1 hat, hat f den Leitkoeffizient 1 oder −1. Wir d¨ urfen daher annehmen, dass auch f den Leitkoeffizient 1 hat. Ferner gibt es eine primitive n-te Einheitswurzel ζ, die Nullstelle von f ist, da f als irreduzibles Polynom mindestens den Grad 1 hat. Dedekinds Bemerkung ist nun die, dass es gen¨ ugt zu zeigen, dass das Folgende ur alle Primzahlen p, die n nicht teilen (Dedekind gilt: Ist f (ξ) = 0, so ist f (ξ p ) = 0 f¨ 1857a). Gilt dies n¨ amlich und ist η eine von ζ verschiedene n-te Einheitswurzel, so ist η = ζ i mit i > 1 und ggT(i, n) = 1. Es gibt dann eine Primzahl p, die i teilt. −1 Wegen der Teilerfremdheit von i und n teilt sie nicht n. Setzt man ξ := ζ ip ,
3. Die Kreisteilungspolynome
133
so folgt mit der nicht explizit gemachten Induktionsannahme, dass f (ξ) = 0 ist. Hieraus folgt f (η) = f (ζ i ) = f (ξ p ) = 0, so dass alle primitiven n-ten Einheitswurzeln Nullstellen von f sind, Daher ist Grad(f ) = Grad(Φn ), so dass Φn irreduzibel ist. Der nun folgende Teil des Beweises stammt von Levi (1933). Es sei ζ eine Nullstelle von f . Wir bezeichnen mit Z[ζ] den Ring, den man erh¨ alt, wenn man im Polynomring Z[x] in der Unbestimmten x u ¨ ber Z die Unbestimmte x durch ζ ersetzt. Dann ist Z[ζ] zu Z[x]/f Z[x] isomorph. Insbesondere hat jedes Element aus Z[ζ], wenn r der Grad von f ist, die Form z0 + z1 ζ + . . . + zr−1 ζ r−1 , so dass Z[ζ] sogar als abelsche Gruppe endlich erzeugt ist. Somit ist Z[ζ] als abelsche Gruppe und dann erst recht als Ring noethersch. Dabei heißt ein Ring noethersch, wenn jede nicht-leere Menge von Idealen des Ringes ein bzg. der Inklusion als Teilordnung maximales Ideal enth¨ alt. Es sei nun p eine Primzahl, die n nicht teilt. Es gibt dann ein Ideal P von Z[ζ], welches maximal ist unter allen von Z[ζ] verschiedenen Idealen dieses Ringes, die p enthalten, da Z[ζ] ja noethersch ist. Weil jedes Ideal, welches oberhalb P liegt, ebenfalls p enth¨ alt, ist P sogar maximales Ideal von Z[ζ], so dass K := Z[ζ]/P ein K¨ orper ist. Wegen p ∈ P ist die Charakteristik von K gleich p. Weil f Teiler von Φn ist, sind die Nullstellen von f allesamt primitive n-te Einheitswurzeln. Es gibt daher nat¨ urliche Zahlen b(1), . . . , b(r − 1), so dass ζ, ζ b(1) , . . . , ζ b(r−1) die Nullstellen von f sind. Setze σ := ζ + P . Weil p kein Teiler von n ist, hat xn − 1 auch u ¨ ber K keine mehrfachen Nullstellen. Daher sind die Elemente σ, σ b(1) , . . . , σb(r−1) paarweise verschieden. Es sei f =
r
g :=
i:=0 r
ai xi und
(ai + P )xi .
i:=0
Dann ist g := (ar + P )
r−1
(x − σ b(i) ).
i:=0
wobei b(0) := 1 gesetzt wurde. Nun ist, da ja api ≡ ai mod p ist, g(σ p ) =
r i:=0
(ai + P )σ pi =
r
(api + P )σ pi = g(σ)p = 0.
i:=0
134
Kapitel VIIII. Der abstrakte K¨ orperbegriff
Es gibt daher ein i mit σ p = σ b(i) . Hieraus folgt ζ p = ζ b(i) und damit f (ζ p ) = 0. Damit ist die Irreduzibilit¨ at von Φn bewiesen. Da Φn irreduzibel ist, definiert Φn , um mit Weber zu reden, einen Congruenzk¨ orper, den wir mit Qn bezeichnen und n-ten Kreisteilungsk¨ orper nennen. Er hat den Grad ϕ(n) u ¨ ber Q. F¨ ur ihn gilt: allungsk¨ orper von Φn . Die Automorphismengruppe von Qn Satz 5. Qn ist der Zerf¨ ist isomorph zur Einheitengruppe des Ringes Z/nZ. Beweis. Auf Grund von Satz 1 von Abschnitt 1 hat Φn eine Nullstelle ζ in Qn . Weil alle n-ten Einheitszurzeln (sic) Potenzen von ζ sind, liegen sie alle in Qn . Insbesondere liegen dann auch alle primitiven Einheitswurzeln in n, so dass Qn in der Tat der Zerf¨ allungsk¨ orper von Φn ist. Bezeichnet man mit Q[ζ] das Bild des Polynomrings Q[x] in der Unbestimmten x unter dem Einsetzungshomomorphismus f → f (ζ), so ist Qn = Q[ζ]. Ist η eine zweite primitive n-te Einheitswurzel, so gibt es eine zu n teilerfremde nat¨ urliche Zahl i mit η = ζ i . Mittels Satz 2 von Abschnitt 1 folgt die Existenz eines Automorphismus σi von Qn = Q[ζ] auf Qn = Q[ζ i ] mit ζ σi = ζ i . Ist j eine zweite zu n teilerfremde Zahl, so folgt ζ σi σj = (ζ j )i = ζ ji = ζ ij = ζ σij . Hieraus folgt, weil alle Elemente von Q unter den σk festbleiben, dass σi σj = σij ist. Folglich ist σ ein Homomorphismus und, weil σ offensichtlich injektiv ist, dann auch ein Monomorphismus der Einheitengruppe von Z/nZ in die Automorphisasst α mengruppe von Qn . Es sei nun α ein Automorphismus von Qn . Dann l¨ alle Elemente von Q invariant und bildet offenkundig auch primitive n-te Einheitswurzeln auf ebensolche ab. Es gibt also eine zu n teilerfremde nat¨ urliche Zahl i mit ζ α = ζ i . Es folgt α = σi , so dass σ auch surjektiv ist. Damit ist alles bewiesen. Wie berechnet man Kreisteilungspolynome? Eine nicht sehr attraktive M¨oglichkeit ist die folgende. Satz 6. Es ist Φn =
n (x d − 1)μ(d) , d|n
wobei μ wieder die M¨ obiusfunktion bezeichne. Beweis. Es ist n μ(d) μ(d) (x d − 1)μ(d) = Φf = Φf d|n f | n d
d|n
=
f |n
d| n f
df |n
μ(d) Φf
=
f |n
ΦSf ,
3. Die Kreisteilungspolynome
135
wobei S :=
μ(d)
d| n f
gesetzt wurde. Es folgt nach Korollar 0 zur m¨ obiusschen Umkehrformel 1, falls n = f , S= 0, falls n > f . Daher ist in der Tat
n (x d − 1)μ(d) = Φn . d|n
Beispiel: Φ10 =
(x10 − 1)(x − 1) = x4 − x3 + x2 − x + 1. (x5 − 1)(x2 − 1)
Es gibt bessere M¨oglichkeiten, die Kreisteilungspolynome zu berechnen. Der erste Schritt auf diesem Wege ist die folgende Bemerkung. Satz 7. F¨ ur m, n ∈ N ist Φmn Teiler von Φn (xm ). Beweis. Es sei α eine Nullstelle von Φmn . Dann ist α eine primitive (mn)-te Einheitswurzel, so dass αm eine primitive n-te Einheitswurzel ist. Also ist Φn (αm ) = 0. Somit sind alle Nullstellen von Φmn Nullstellen von Φn (xm ). Weil Φmn nur einfache Nullstellen hat, ist daher Φmn Teiler von Φn (xm ). Satz 8. Sind m, n ∈ N und ist jeder Primteiler von m auch Primteiler von n, so ist Φmn = Φn (xm ). Beweis. Weil die Menge der Primteiler von mn auf Grund unserer Annahme gleich der Menge der Primteiler von n ist, folgt mit dem Korollar 2 zur m¨ obiusschen Umkehrformel (Abschnitt 2), dass ϕ(mn) = mϕ(n) ist. Daher ist Grad(Φmn ) = Grad(Φn (xm )). Weil die Leitkoeffizienten beider Polynome 1 sind, folgt die behauptete Gleichheit auf Grund von Satz 7. Ist n ∈ N, so bezeichnen wir mit σ(n) das Produkt u ¨ber alle Primteiler von n. Der Buchstabe σ soll an Sockel erinnern. Korollar 1. Ist n ∈ N und ist n = mσ(n), so ist Φn = Φσ(n) (xm ).
136
Kapitel VIIII. Der abstrakte K¨ orperbegriff
Ist p eine Primzahl, so ist Φp =
p−1 i:=0
xi . Also gilt:
Korollar 2. Ist p eine Primzahl, so ist p−1
Φpn =
n−1
xip
.
i:=0
Wegen Φ2 = x + 1 ist also Φ4 = x2 + 1, Φ8 = x4 + 1, usw. Satz 9. Sind m und n teilerfremde nat¨ urliche Zahlen, ist n > 1, falls m = 2 ist, und ist W die Menge der primitiven m-ten Einheitswurzeln, so ist Φn (ζx). Φmn = ζ∈W
Beweis. Dies ist gewiss richtig, falls m = 1 ist. Es sei also m > 1. Es ist Φn (ζx) = ϕ(m)ϕ(n) = ϕ(mn) = Grad(Φmn ), Grad ζ∈W
da m und n ja teilerfremd sind. Der Leitkoeffizient von Φn (ζx) ζ∈W
ist gleich
ζ∈W
ζ
ϕ(n)
ϕ(n) = ζ . ζ∈W
−1
¨ ist ζ −1 ∈ W . Daher ist in diesem Falle das Ist m > 2, so ist ζ = ζ . Uberdies Produkt auf der rechten Seite gleich 1. Dann ist aber auch das Produkt auf der linken Seite, dh., der Leitkoeffizient von ζ∈W Φn (ζx) gleich 1. Ist m = 2, so ist n ungerade und wegen n ≥ 2 gilt sogar n ≥ 3. Somit ist ϕ(n) gerade. Ferner ist W = {−1} und folglich ζ ϕ(n) = (−1)ϕ(n) = 1. ζ∈W
Also ist der Leitkoeffizient des fraglichen Polynoms in jedem Fall gleich 1. Es sei ξ eine primitive (mn)-te Einheitswurzel. Dann ist σ := ξ n eine primitive m-te Einheitswurzel. Weil m und n teilerfremd sind, gibt es ein a ∈ N mit an + mZ = −1 + mZ. Hieraus folgt, dass a und m teilerfremd sind, so dass auch ζ := σ a eine primitive m-te Einheitswurzel ist. Es folgt (ζξ)n = σ an ξ n = σ −1 σ = 1.
3. Die Kreisteilungspolynome
137
Ist k = o(ζξ), so ist also k Teiler von n. Andererseits ist ζ k ξ k = 1. Hieraus folgt weiter 1 = ζ km ξ km = ξ km , so dass o(ξ) = mn Teiler von km ist. Folglich ist k = n, so dass ζξ eine primitive n-te Einheitswurzel ist. Wegen ζ ∈ W , ist daher ξ Nullstelle von
Φn (ηx).
η∈W
Da dies f¨ ur alle Nullstellen ξ von Φmn gilt und da Φmn nur einfache Nullstellen hat, ist Φmn Teiler von η∈W Φn (ηx). Weil Grade und Leitkoeffizienten beider Polynome der beiden Polynome u ¨ bereinstimmen, folgt schließlich die Gleichheit der beiden Polynome. Wichtigster Spezialfall ist Satz 10. Ist n eine ungerade nat¨ urliche Zahl und ist n ≥ 3, so ist Φ2n = Φn (−x).
Ist p eine ungerade Primzahl und sind a und b nat¨ urliche Zahlen, so ist also Φ2a pb =
p−1
a−1 b−1
(−1)i xi2
p
.
i:=0
Die n¨achsten beiden S¨ atze besagen, dass man alle Koeffizienten von Φn kennt, wenn man nur die H¨ alfte von ihnen berechnet hat. Satz 11. Ist 2 ≤ n ∈ N, so ist Φn = xϕ(n) Φn (x−1 ). Beweis. Offenbar ist f := xϕ(n) Φn (x−1 ) ein Polynom vom Grade ϕ(n) mit Leitkoeffizient 1, da nach Satz 1 wegen n ≥ 2 ja Φn (0) = 1 ist. Ist Φn (α) = 0, so ist auch Φn (α−1 ) = 0, so dass α Nullstelle von f ist. Aus all diesem folgt die Behauptung. ϕ(n) Satz 12. Ist n ≥ 2 und ist Φn = i:=0 ai xi , so ist ai = aϕ(n)−i f¨ ur alle i. Beweis. Nach Satz 11 ist
ϕ(n)
i:=0
ϕ(n) i
ai x =
i:=0
ϕ(n) ϕ(n)−i
ai x
=
i:=0
aϕ(n)−i xi .
138
Kapitel VIIII. Der abstrakte K¨ orperbegriff
ur alle i. Also gilt in der Tat ai = aϕ(n)−i f¨ Der n¨ achste Satz liefert die alles entscheidende Rekursion. Satz 13. Ist n ∈ N und ist p eine n nicht teilende Primzahl, so ist Φn Φnp = Φn (xp ). Beweis. Nach Satz 7 ist Φnp Teiler von Φn (xp ). Weil p kein Teiler von n ist, ist mit ζ auch ζ p eine primitive n-te Einheitswurzel. Folglich ist auch Φn Teiler von Φn (xp ). Nun sind Φn und Φnp teilerfremd, wie man unmittelbar an den Nullstellen der beiden Polynome abliest. Also ist Φn Φnp Teiler von Φn (xp ). Ferner gilt Grad(Φn Φnp ) = ϕ(n) + ϕ(np) = ϕ(n) 1 + ϕ(p) = pϕ(n) = Grad Φn (xp ) . Weil schließlich die Leitkoeffizienten der Polynome Φn Φnp und Φn (xp ) gleich 1 sind, ist Φn Φnp = Φn (xp ). Hiermit haben wir ein sehr wirkunsvolles Verfahren gewonnen, Φn zu berechnen: ur die Zun¨ achst bestimme man alle ungeraden Primteiler p1 , . . . , pt . Dies ist f¨ u ¨ berhaupt in Frage kommenden n kein Problem. Dann berechne man der Reihe nach Φp1 p2 := Φp1 (xp2 )Φ−1 p1 Φp1 p2 p3 := Φp1 p2 (xp3 )Φ−1 p1 p2 ... Φp1 ···pt := Φp1 ···pt−1 (xpt )Φ−1 p1 ···pt−1 . Dies ist v¨ ollig problemlos, da sich alle Divisionen in Z durchf¨ uhren lassen, weil die Leitkoeffizienten der Kreisteilungspolynome ja gleich 1 sind. Da man die Division am Kopf anf¨ angt, berechne man dabei nur die Koeffizienten aϕ(s) , . . . , a2−1 ϕ(s) . Nach Satz 12 kennt man dann auch die restlichen Koeffizienten. Ist n ungerade, so ist Φσ(n) = Φp1 ···pt , andernfalls Φσ(n) = Φp1 ···pt (−x). Schließlich ist Φn = Φσ(n) (xnσ(n)
−1
).
Statt erst Φσ(n) und dann erst Φn zu berechnen, kann man sich auch der Rekursion t−1 t Φm (xp )Φn = Φm (xp ) bedienen und Φn direkt berechnen. Dabei sind m und t dadurch bestimmt, dass n = pt m mit einer m nicht teilenden Primzahl p ist. Diese Rekursion findet sich in Dickson (1905).
4. Der Satz von Zsigmondy
139
4. Der Satz von Zsigmondy. Ist p eine Primzahl und ist a eine nicht durch p teilbare nat¨ urliche Zahl, so k¨ onnen wir a als Element der multiplikativen Gruppe von GF(p) auffassen. Als solches hat es eine Ordnung, die wir mit ordp (a) bezeichnen. Wir nennen ordp (a) Ordnung von a modulo p. Der Satz von Zsigmondy liest sich nun folgendermaßen. Satz von Zsigmondy. Es seien a und n von 1 verschiedene nat¨ urliche Zahlen. Es gibt dann eine Primzahl p mit ordp (a) = n, es sei denn, es ist n = 2 und a + 1 ist Potenz von 2 oder es ist a = 2 und n = 6. Gibt es eine Primzahl p mit ordp (a) = n, so heißt sie auch a-primitiver Primteiler von an − 1. F¨ ur den Satz von Zsigmondy gibt es mehrere Beweise. Der erste nat¨ urlich von Zsigmondy 1892. Weitere von Birkhoff & Vandiver 1904, Dickson 1905, Artin, 1955 Hering 1974 und L¨ uneburg 1981. Ich werde hier meinen Beweis reproduzieren. Dazu bedarf es der Vorbereitung. Wegen an − 1 = Φd (a) d|n
sind die Primzahlen, f¨ ur die ordp (a) = n gilt, unter den Primteilern von Φn (a) zu suchen. Es sind genau die Primteiler von Φn (a), die kein Φd (a) f¨ ur ein d < n teilen. Dass es fast immer solche gibt, m¨ ussen wir nun nachweisen. Satz 1. Es seien a und n von 1 verschiedene nat¨ urliche Zahlen und p sei eine Φn (a) teilende Primzahl. Ferner sei f := ordp (a). Es gibt dann eine nicht-negative ganze Zahl i mit n = f pi . Ist i > 0, so ist p die gr¨ oßte n teilende Primzahl. Ist i > 0 und ist p2 Teiler von Φn (a), so ist n = p = 2. Beweis. Weil Φn (a) Teiler von an − 1 ist, ist p Teiler von an − 1, so dass f Teiler von n ist. Es gibt also i, w ∈ N0 mit n = f pi w, so dass p kein Teiler von w ist. Setze r := f pi . Dann ist ar − 1 ≡ 0 mod p, da f ja Teiler von r ist. Wegen n = f pi w = rw folgt w w an − 1 ((ar − 1) + 1)w − 1 (ar − 1)k−1 . = = w + r r k a −1 a −1 k:=2
Dies impliziert
an − 1 ≡ w ≡ 0 mod p. ar − 1
W¨ are w > 1, so w¨are Φn (a) und damit p Teiler von an − 1 ar − 1
140
Kapitel VIIII. Der abstrakte K¨ orperbegriff
und es folgte der Widerspruch w ≡ 0 mod p. Also ist w = 1 und somit n = f pi . oßte, n Es sei i > 0. Weil f = ordp (a) Teiler von p − 1 ist, folgt, dass p die gr¨ teilende Primzahl ist. Es sei weiterhin i > 0. Setze s := f pi−1 . Weil f Teiler von s ist, ist p Teiler von s a − 1. Es folgt ((as − 1) + 1)p − 1 an − 1 = as − 1 as − 1
p p 1 s = p + p(p − 1)(a − 1) + (as − 1)k−1 . k 2 k:=3
Ist p ≥ 3, so folgt hieraus
Wegen
an − 1 ≡ p mod p2 . as − 1 an − 1 ≡ 0 mod Φn (a) as − 1
ist daher p2 in diesem Falle kein Teiler von Φn (a). Ist also p2 Teiler von Φn (a), so ist p = 2. Weil 2 die gr¨ oßte n teilende Primzahl ist, ist folglich n = 2i . Es folgt i−1
Φn (a) = a2 i−1
W¨ are i > 1, so w¨are a2 dh. n = 2.
+ 1.
≡ 1 mod 4 und somit Φn (a) ≡ 2 mod 4. Also ist i = 1,
Nach diesem Satz kann ggT(Φn (a), n) weder durch zwei verschiedene Primzahlen noch durch das Quadrat einer Primzahl teilbar sein. Es gilt somit das Korollar. Sind a und n von 1 verschiedene nat¨ urliche Zahlen und ist p = ggT(Φn (a), n) = 1, so ist p die gr¨ oßte n teilende Primzahl. Satz 2. Es seien a und n von 1 verschiedene nat¨ urliche Zahlen. Ferner sei p := ggT(Φn (a), n). F¨ ur p = 1 sei j := 0 und f¨ ur p = 1 sei pj die h¨ ochste Potenz von p, die in Φn (a) aufgeht. Schließlich sei Φ∗n (a) := p−j Φn (a). Genau dann gilt Φ∗n (a) = 1, wenn entweder n = 2 und a + 1 eine Potenz von 2 oder wenn n = 6 und a = 2 ist. Beweis. Es sei zun¨achst n = 2. Dann ist Φn (a) = a + 1. Hieraus folgt, dass genau dann Φ∗n (a) = 1 ist, wenn a + 1 Potenz von 2 ist. Es sei n ≥ 3. Wegen Φ6 = Φ3 (−x) = x2 − x + 1 ist Φ6 (2) = 3 und daher ∗ Φ6 (2) = 1.
4. Der Satz von Zsigmondy
141
Es sei schließlich Φ∗n (a) = 1 und n ≥ 3. Ist ζ eine primitive n-te Einheitswurzel, so ist |a − ζ|2 = a2 − 2Re(ζ)a + 1 > a2 − 2a + 1 = (a − 1)2 , da wegen n > 1 ja Re(ζ) < 1 ist. Also ist Φn (a) = |a − ζ| > (a − 1)ϕ(n) ζ∈PnE
und folglich Φn (a) > 1 = Φ∗n (a). Somit ist p := ggT(Φn (a), n) = 1. Wegen n ≥ 3 folgt aus Satz 1, dass Φn (a) = pΦ∗n (a) = p ist. Weil p Teiler von n ist, ist p−1 nach Korollar 2 zur m¨ obiusschen Umkehrformel (Abschnitt 2) Teiler von ϕ(n). Mittels Induktion nach n folgt Φn (a) > 0. Somit gilt p = Φn (a) = Φn (a) > (a − 1)ϕ(n) ≥ (a − 1)p−1 . Hieraus folgt a = 2. W¨ are p2 Teiler von n, so folgten wegen Φn (x) = Φ np (xp ) die Ungleichungen n
p = Φn (2) = Φ np (2p ) > (2p − 1)ϕ( p ) ≥ (2p − 1)p−1 . Dies ist aber unm¨ oglich. Also ist n = f p, wobei f Teiler von p − 1 ist. Demzufolge ist f < p und f und p sind teilerfremd. Daher ist Φf Φn = Φf Φf p = Φf (xp ). Es folgt p(2p − 1) > p(2f − 1) ≥ Φn (2)Φf (2) = Φf (2p ) > (2p − 1)ϕ(f ) . Also ist p > (2p − 1)ϕ(f )−1 und folglich ϕ(f ) = 1. Somit ist f = 1 oder f = 2 p−1 und dann n = p oder n = 2p. W¨ are n = p, so folgte p = i:=0 2i = 2p − 1, ein Widerspruch. Also ist n = 2p und daher p=
p−1
(−1)i 2i =
i:=0
2p + 1 , 2+1
was p = 3 zur Folge hat. Damit ist der Satz bewiesen. Aus Satz 1 und Satz 2 folgt nun unmittelbar der Satz von Zsigmondy, da es genau dann keinen Primteiler p von an − 1 mit ordp (a) = n gibt, wenn Φ∗n (a) = 1 ist. Ist n¨amlich p ein Primteiler von Φ∗n (a), so folgt mit Satz 1 und der Konstruktion von Φ∗n (a), dass ordp (a) = n ist. Ist n = 2 und a + 1 eine Potenz von 2, so ist auch
142
Kapitel VIIII. Der abstrakte K¨ orperbegriff
a − 1 gerade und folglich ord2 (a) = 1. Ist n = 6 und a = 2, so ist 26 − 1 = 32 · 7. Es folgt ord3 (2) = 2 und ord7 (2) = 3. Ein ber¨ uhmter Satz von Dirichlet besagt, dass es in der arithmetischen Reihe {a + nk | k ∈ N0 } unendlich viele Primzahlen gibt, falls nur ggT(a, n) = 1 ist (Dirichlet 1837). Der Beweis ist schwierig und mit den hier bereitgestellten Hilfsmitteln nicht zu schaffen. Einen Spezialfall k¨ onnen wir jedoch mit Hilfe des Satzes von Zsigmondy etablieren, wie dies auch schon Zsigmondy selbst getan hat (Zsigmondy 1892). Satz 3. Ist n eine nat¨ urliche Zahl, so enth¨ alt die arithmetische Reihe {1 + nk | k ∈ N0 } unendlich viele Primzahlen. Beweis. Zsigmondy schließt wie folgt: Es sei nk = 1 und 6. Es gibt dann, da 2 + 1 keine Potenz von 2 ist, eine Primzahl pk mit ordpk (2) = nk. Weil ordpk (2) Teiler von pk − 1 ist, gibt es ein l ∈ N mit pk = 1 + nkl. Ist k = j, so ist nk = nj und daher pk = pj . Damit ist der Satz bewiesen und gleichzeitig noch mehr gezeigt, dass man n¨ amlich t solcher Primzahlen nach sp¨atestens t + 1 Schritten erh¨ alt. Ferner gilt pt ≤ 2nt − 1. Dirichlet gibt keine Schranke f¨ ur die Primzahlen in beliebigen arithmetischen Reihen. 5. Der Satz von Wedderburn. Es wurde schon erw¨ ahnt, dass endliche K¨ orper stets kommutativ sind. F¨ ur diesen von Wedderburn stammenden Satz gibt es viele Beweise (Wedderburn 1905, Artin 1927, Witt 1931, Herstein 1961, Nagahara & Tominaga 1974, Grundh¨ ofer 1998, etc.). Wedderburn gab in seiner urspr¨ unglichen Arbeit allein drei, von denen der erste laut Artin (1927) nicht stichhaltig ist. Mir gef¨ allt der dritte sehr gut, so dass ich diesen hier vortrage. Der wittsche Beweis gilt als der o¨konomischste, er ist sicher der am h¨ aufigsten reproduzierte. Wir beginnen mit der folgenden Bemerkung: Satz 1. Es sei V ein Vektorraum der Dimension n u ¨ber GF(q). Ist 1 ≤ k ≤ n, so ist die Anzahl der k-Tupel linear unabh¨ angiger Vektoren gleich k−1
(q n − q i ).
i:=0
Beweis. Es ist ja |V | = q n , so dass die Anzahl der von null verschiedenen Vektoren von V gleich q n − 1 ist. Also ist der Satz richtig f¨ ur k = 1. Es sei k ≥ 1. angiges k-Tupel von Vektoren aus V . Dann Ferner sei u1 , . . . , uk ein linear unabh¨
5. Der Satz von Wedderburn
143
angiges (k + 1)-Tupel, wenn v nicht ist genau dann u1 , . . . , uk , v ein linear unabh¨ in dem von u1 , . . . , uk aufgespannten Unterraum liegt. Da dieser q k Elemente enth¨ alt, gibt es genau q n − q k solcher Elemente v. Da es nach Induktionsannahme k−1
(q n − q i )
i:=0
linear unabh¨ angige k-Tupel von Vektoren gibt, ist die Anzahl linear unabh¨ angiger (k + 1)-Tupel gleich k (q n − q i ). i:=0
Damit ist der Satz bewiesen. Das folgende Korollar findet sich f¨ ur den Fall, dass q eine Primzahl ist, in Jordan’s Trait´e des substitutions“ (Jordan 1870/1989, S. 97). Jordan berechnet ” zun¨ achst die Ordnung der Einheitengruppe der Gruppe aller invertierbaren (n×n)Matrizen u ¨ ber dem Ring Z/mZ und betrachtet dann den Spezialfall, dass m eine Primzahl ist. Jordan bemerkt an dieser Stelle, dass der Spezialfall von Galois ´ entdeckt und von Betti bewiesen wurde. F¨ ur Galois siehe Galois, Ecrits, S. 151. Korollar. Ist V ein Vektorraum der Dimension n u ¨ber GF(q), so gilt f¨ ur die Gruppe GL(V ) aller bijektiven linearen Abbildungen von V auf sich n GL(V ) = q 12 n(n−1) (q i − 1). i:=1
Beweis. Es sei b1 , . . . , bn eine Basis von V . Ist dann c1 , . . . , cn eine weitere Basis von V , so gibt es genau eine lineare Abbildung σ von V in sich mit bσi = ci f¨ ur alle i. Weil die c’s eine Basis bilden, ist σ ∈ GL(V ). Ist umgekehrt σ ∈ GL(V ), so ist bσ1 , . . . , bσn eine Basis von V . Daher ist |GL(V )| gleich der Anzahl der Basen von V , dh. gleich der Anzahl der linear unabh¨ angigen n-Tupel von V , so dass mit Satz 1 die Behauptung folgt. Satz 2. Ist G eine Gruppe und sind A und B zwei endliche Untergruppen von G, setzt man ferner AB := {ab | a ∈ A, b ∈ B}, so ist |AB| =
|A||B| . |A ∩ B|
Beweis. Um keine falschen Vorstellungen aufkommen zu lassen, sei gesagt, dass AB in aller Regel keine Untergruppe von G ist. Dies ist vielmehr genau dann der Fall, wenn AB = BA ist. Dies nur so nebenbei.
144
Kapitel VIIII. Der abstrakte K¨ orperbegriff
¨ Wir definieren auf A × B eine Aquivalenzrelation ∼ durch (a, b) ∼ (α, β) genau dann, wenn ab = αβ ist. Ist u ∈ A und v ∈ B und a ∈ A ∩ B, so ist ua ∈ A, a−1 v ∈ B und es gilt uaa−1 v = uv Folglich ist (ua, a−1 v) ∼ (u, v). Ist andererseits (u , v ) ∼ (u, v), so gibt es ein a ∈ A mit u = ua und ein b ∈ B mit v = bv. Es folgt uabv = u v = uv ¨ und damit b = a−1 und weiter a ∈ A ∩ B. Also ist die Aquivalenzklasse von (u, v) die Menge (ua, a−1 v) | a ∈ A ∩ B . ¨ Es folgt, dass alle Aquivalenzklassen die L¨ ange |A ∩ B| haben. Da |AB| die Anzahl ¨ der Aquivalenzklassen ist, ist |AB||A ∩ B| = |A||B|. Damit ist der Satz bewiesen. Wir ben¨ otigen noch den Begriff des Zentrums eines K¨orpers. Ist K ein K¨ orper, so ist dies die Menge Z(K) := {z | z ∈ K, zk = kz f¨ ur alle k ∈ K}. Weil diese Menge unter Addition, Subtraktion, Multiplikation und Inversenbildung abgeschlossen ist und weil die 1 dazugeh¨ ort, ist Z(K) ein Teilk¨orper von K. Hieraus folgt wiederum, dass der Primk¨ orper von K, den man im nicht-kommutativen Fall nat¨ urlich genauso hat wie im kommutativen, Teil des Zentrums ist. Ferner wird uns noch die Klassengleichung von Nutzen sein. Sei G eine Gruppe. Die Elemente g, h ∈ G heißen konjugiert in G, wenn es ein x ∈ G gibt mit x−1 gx = ¨ h. Die Relation des Konjugiertseins ist eine Aquivalenzrelation. Genau dann ist −1 −1 −1 −1 x gx = y gy, wenn yx g = gyx ist, wenn also yx−1 und g vertauschbar sind. Es bezeichne CG (g) die Menge der mit g vertauschbaren Elemente von G. Dann ist CG (g) eine Untergruppe von G. Sie wird Zentralisator von g in G genannt. Ist G endlich, so ist nach der eben gemachten Bemerkung |G|/C(g) = G : C(g) die Anzahl der Elemente in der Konjugiertenklasse, zu der g geh¨ort. Die Menge Z(G) der Elemente, deren Konjugiertenklasse nur aus einem Element besteht, nennen wir entsprechend dem Vorgang bei K¨ orpern Zentrum von G. Das Zentrum von G ist stets eine Untergruppe von G. Auf Grund der Bemerkungen, die wir machten, gilt die sogenannte Klassengleichung. Ist G eine endliche Gruppe und ist x1 , . . . , xt ein Vertretersystem der Konjugiertenklassen von G, die mindestens zwei Elemente enthalten, so ist t G : C(xi ) . |G| = Z(G) + i:=1
5. Der Satz von Wedderburn
145
Die klassische Anwendung der Klassengleichung ist die, dass bei einer endlichen p-Gruppe, p Primzahl, die linke Seite und die Summanden auf der rechten Seite durch p teilbar sind, so dass auch |Z(G)| durch p teilbar ist. Weil |Z(G)| ≥ 1 ist, ist also |Z(G)| ≥ p > 1, so dass das Zentrum einer endlichen p-Gruppe stets nicht-trivial ist. Dies ist Sylows Argument, der die Klassengleichung aber nicht explizit formuliert (Sylow 1872). Dieses Argument ist ein sch¨ ones Beipiel impliziter Gruppentheorie. Sylows Arbeit, 1872 also einundzwanzig Jahre vor Webers Arbeit publiziert, wo dieser seine abstrakte Definition einer Gruppe gab, handelt von Permutationsgruppen, wie der Titel sagt, und er benutzt im Beweise seines Satzes auch, dass die betrachteten Gruppen Permutationsgruppen sind. Erst Frobenius zeigte, dass die sylowschen S¨ atze auch f¨ ur beliebige endliche Gruppen gelten. Mehr hierzu in Abschnitt 2 von Kapitel 13. Ist K ein K¨ orper, ist a ∈ K und setzt man CK (a) := {x | x ∈ K, xa = ax}, so ist CK (a) Teilk¨ orper von K. Ist a = 0, so gilt CK ∗ (a) = CK (a) − {0}. Ist K ein endlicher K¨ orper mit pn Elementen, so hat CK (a) als endlicher K¨ orper m p Elemente und da CK (a) Teilk¨ orper von K ist, folgt mit Satz 1 von Abschnitt 2, wenn man nur K als Linksvektorraum u ¨ ber CK (a) auffasst, dass m Teiler von n ist. Satz von Wedderburn. Ist K ein endlicher K¨ orper, so ist K kommutativ. Beweis. F¨ ur 0 = a ∈ K definieren wir die Abbildungen λa und ρa von K in sich durch λa (x) := ax und
ρa (x) := xa−1 ,
so sind λ und ρ Monomorphismen der multiplikativen Gruppe von K in GL(K), wobei K als Vektorraum u ¨ber GF(p) dem Primk¨orper von K aufzufassen ist. Die Bilder dieser beiden Monomorphismen bezeichnen wir mit L und R. Dann ist |L| = |R| = |K| − 1 = pn − 1. Sind a, b ∈ K und sind a und b von null verschieden, so folgt auf Grund des Assoziativgesetzes λa ρb (x) = a(xb−1 ) = (ax)b−1 = ρb λa (x),
146
Kapitel VIIII. Der abstrakte K¨ orperbegriff
so dass λa ρb = ρb λa gilt. Daher ist LR eine Untergruppe von GL(K). Ist λa = ρb , so gilt ax = xb−1 f¨ ur alle x ∈ K. mit x = 1 folgt a = b−1 und damit a ∈ Z(K). Daher ist L ∩ R zur multiplikativen Gruppe des Zentrums von K isomorph. Somit hat L ∩ R die Ordnung pm − 1. Mit Satz 2 folgt |LR| =
(pn − 1)2 . pm − 1
Weil LR eine Untergruppe von GL(K) ist, ist |LR| Teiler von 1
g := p 2 n(n−1)
n
(pi − 1).
i:=1
Ist nun q ein p-primitiver Teiler von pn − 1 und ist q t die h¨ ochste Potenz von q, die pn − 1 teilt, so ist q t+1 kein Teiler von g, da q kein Teiler von pi − 1 ist, falls i < n ist. Daher kann q t+1 nicht Teiler von |LR| sein, so dass m = n ist. Dies heißt aber, dass Z(K) = K ist. In diesem Falle ist K also kommutativ. Ist also Z(K) = K, so gibt es keinen p-primitiven Teiler von pn − 1. Mit dem Satz von Zsigmondy folgt n = 2 (und p+ 1 ist Potenz von 2) oder n = 6 und p = 2. Ist aber n = 2, so ist die Dimension von K u ¨ ber Z(K) gleich 2. Ist b ∈ Z(K), so erzeugen Z(K) und b einen kommutativen Teilk¨orper F von K, der Z(K) echt umfasst. Es ist daher p2 ≥ |F | = ps > p. Es folgt s = 2 und damit F = K, so dass K doch kommutativ w¨ are. Also kann n nicht 2 sein. Es bleibt n = 6 und p = 2. Hier hat man f¨ ur Z(K) drei M¨ oglichkeiten: Z(K) = GF(2), GF(4) oder GF(8). In den beiden letzten F¨ allen ist die Dimension von K u ¨ ber Z(K) gleich 3 oder 2 also eine Primzahl. Dann erzeugt aber jedes Element aus K, das nicht in Z(K) liegt, zusammen mit Z(K) einen von Z(K) verschiedenen kommutativen Teilk¨ orper von K, der dann schon gleich K sein muss. Also ist Z(K) = GF(2). Dieser Fall muss nun noch ausgeschlossen werden. Es sei a ein von 0 und 1 verschiedenes Element von K. Dann ist CK (a) = GF(4) oder GF(8). Die multiplikative Gruppe von CK (a) hat demnach die Ordnung 3 oder 7. Daher ist die Anzahl der zu a konjugierten Elemente in der multiplikativen 63 Gruppe von K gleich 63 3 = 21 oder gleich 7 = 9. Die Klassengleichung besagt dann, dass es nicht-negative ganze Zahlen u und v gibt mit 3 · 21 = 63 = 1 + u21 + v9 = 1 + (u7 + v3)3 ein Widerspruch. Damit ist der Satz von Wedderburn bewiesen. Der zweite Beweis von Wedderburn benutzt ebenfalls den Satz von Zsigmondy. Ist n¨ amlich q ein p-primitiver Teiler, so gibt es ein Element a der Ordnung q in der multiplikativen Gruppe von GF(pn ). Dieses a erzeugt zusammen mit dem Primk¨ orper von GF(pn ) ganz GF(pn ), das folglich kommutativ ist. Die Sonderf¨ alle erledigen sich dann genauso wie im vorherigen Falle.
6. Endlich erzeugte Moduln
147
Dickson publizierte im gleichen Jahr wie Wedderburn ebenfalls einen Beweis des wedderburnschen Satzes, wobei er den Satz von Zsigmondy benutzt (Dickson 1905a, § 6). Was die Priorit¨ at anbelangt, so a¨ußert er sich in Fußnote 2) auf S. 379 wie folgt: First proved by Wedderburn, Trans. Amer. Math. Soc., vol. 6 (1905), pp. 349–352. Following my simpler proof above, and using the same lemma, Wedderburn consructed two further simple proofs, loc. cit. Sie hatten offenbar Kontakt hinter den Kulissen. 6. Endlich erzeugte Moduln. Bevor es Gruppentheorie gab, gab es schon einen reichen Fundus an gruppentheoretischen Schl¨ ussen und Methoden. So haben wir bei Euler gesehen, dass er typische gruppentheoretische Schl¨ usse verwendet, um zu zeigen, dass die Ordnung eines Elementes der multiplikativen Gruppe von GF(p) Teiler von p − 1 ist. Seine Schl¨ usse finden sich in den Disquisitiones von Gauß in zwei verschiedenen Situationen wieder, wobei an der zweiten Stelle auch der Namen Algorithmus auftaucht (Gauß 1801, artt. 49, 305). Dieselben Schl¨ usse benutzte Galois, um zu zeigen, dass die Ordnung eines Elementes der multiplikativen Gruppe von GF(pn ) Teiler von pn − 1 ist. Wir benutzen sie heute noch, um den Satz, den wir Satz von Lagrange nennen, zu beweisen. Galois sagt weiter, dass man wie in der Zahlentheorie beweise, dass es ein primitives Element in der multiplikativen Gruppe von GF(pn ) gebe, und der gaußsche Beweis, auf den er m¨oglicherweise anspielt, der eben zeigt, dass die multiplikative Gruppe von GF(p) zyklisch ist, liefert ebenfalls sehr viel mehr, n¨amlich eine Kennzeichung der zyklischen Gruppen unter allen endlichen Gruppen. Es ist die Zeit der impliziten Gruppentheorie, wo man den Begriff der Gruppe im heutigen Sinne noch nicht hatte, wo man aber schon typische gruppentheoretische Schl¨ usse in konkreten Situationen verwendete. Die Situationen, die man antraf, waren die symmetrischen Gruppen und ihre Untergruppen in der Gleichungstheorie, die Gruppen der Reste modulo einer nat¨ urlichen Zahl mit der Addition, sowie die Gruppen der zu einer nat¨ urlichen Zahl primen Reste mit der Multiplikation, die Gruppe der Klassen bin¨ arer quadratischer Formen, wobei hier die Betonung auch auf dem Wort Klassen“ liegt, viel mehr als ” bei den primen Resten, wo ja auch nach heutigem Verst¨ andnis Klassen miteinander multipliziert werden. Diese von Gauß eingef¨ uhrte Klassenbildung und die von ihm auf der Menge der Klassen definierte Komposition hat Dedekind sp¨ ater zu seiner Definition der Klassengruppe der Ringe ganzer algebraischer Zahlen gef¨ uhrt. Neben der Theorie der algebraischen Gleichungen und der Zahlentheorie war die Geometrie die dritte der Quellen, aus denen sich am Ende die Gruppentheorie speiste (Wußing 1969). Was wir bei den Gruppen beobachteten, haben wir auch schon in der K¨ orpertheorie bemerkt. Prominentestes Beispiel hier ist der Fundamentalsatz der Algebra, wo die Beweise von Euler-Lagrange, Laplace und Gauß mehr hergaben, als von ihren Autoren formuliert, dass n¨ amlich der algebraische Abschluss eines reell √ abgeschlossenen K¨ orpers durch Adjunktion von −1 entsteht. Die implizite Theorie der abelschen Gruppen wollen wir nun in diesem und den beiden n¨ achsten Abschnitten explizit machen. Dies heißt, dass wir endlich
148
Kapitel VIIII. Der abstrakte K¨ orperbegriff
erzeugte Moduln u ¨ ber Hauptidealbereichen studieren werden. Dies nat¨ urlich nicht ohne Grund. Unser Ziel ist zu zeigen, dass jede endliche abelsche Gruppe als Automorphismengruppe einer endlichen Erweiterung von Q vorkommt. Dazu brauchen wir, dass es zu jeder endlichen abelschen Gruppe A eine nat¨ urliche Zahl n gibt, so dass A epimorphes Bild der Einheitengruppe von Z/nZ ist. Hier passiert das, was Herstein wie folgt beschreibt (Herstein 1964, S. 314): En route to establishing ” these theorems many ideas and results, interesting in their own right, will crop up. This is characteristic of a good theorem — its proof invariably leads to side-results of almost equal interest.“ Von Hauptidealbereichen heißt es, dass sie ZPE-Bereiche seien. Um dies zu beweisen, ben¨otigt man das Auswahlaxiom, zumindest kenne ich keinen Beweis dieser Tatsache, der das Auswahlaxiom nicht benutzt. Da ich das Auswahlaxiom erst sp¨ater diskutieren m¨ ochte, werde ich in den nun folgenden S¨ atzen immer voraussetzen, dass der betrachtete Hauptidealbereich auch ein ZPE-Bereich ist, wann immer ich diese Eigenschaft ben¨ otige. Euklidische Ringe sind stets Hauptidealbereiche, die gleichzeitig ZPE-Bereiche sind. Um dies festzustellen braucht man das Auswahlaxiom nicht. Man kann sich bei den Hauptidealbereichen auch auf andere Weise eine Weile um die Benutzung des Auswahlaxioms dr¨ ucken, indem man Integrit¨ atsbereiche betrachtet, die eine Hassefunktion besitzen. Dabei heißt die Abbildung f der Menge atsbereiches R in N HasseR∗ der von null verschiedenen Elemente des Integrit¨ funktion auf R, falls gilt: Sind a, b ∈ R∗ und ist b kein Teiler von a, so gibt es m, n ∈ R mit na − mb = 0 und f (na − mb) < f (b). Dies ist, leicht abgewandelt, Hasses Definition der Funktionen, die sicherstellen, dass R ein Hauptidealbereich ist (Hasse 1928). Kann man stets n = 1 w¨ ahlen, so ist f sogar eine Euklidfunktion und R ein euklidischer Ring. Hassefunktionen sind also Verallgemeinerungen der Euklidfunktionen. Es ist daher nicht verwunderlich, dass die Existenz einer Hassefunktion auf R nach sich zieht, dass R ein ZPE-Bereich ist. Das ist das, was Hasse als Erstes zeigt. Die Abk¨ urzung ZPE findet sich u ¨brigens auch in der Hassearbeit. Hasse zeigt in der Arbeit auch, dass jeder Hauptidealbereich eine Hassefunktion besitzt. Dabei benutzt er wie selbstverst¨andlich, dass Hauptidealbereiche ZPE-Bereiche sind. Hierzu aber, so scheint mir, ben¨ otigt man das Auswahlaxiom. Das Ziel, das wir in diesem Abschnitt verfolgen, ist zu zeigen, dass jeder endlich erzeugte Modul u ¨ ber einem Hauptidealbereich die direkte Summe seines Torsionsmoduls mit einem freien Modul endlichen Ranges ist. Wir werden ferner zeigen, dass die freien Moduln durch ihren Rang bereits v¨ ollig beschrieben sind. Die Strukturtheorie der endlich erzeugten Torsionsmoduln u ¨ber Hauptidealbereichen werden wir im n¨ achsten Abschnitts abhandeln, w¨ ahrend der neunte Abschnitt schließlich die Dualit¨ atstheorie der endlich erzeugten Torsionsmoduln enth¨ alt. Dann sind wir in der Lage, den oben angek¨ undigten Satz u ¨ber die endlichen abelschen Gruppen zu beweisen.
6. Endlich erzeugte Moduln
149
Es sei M ein Modul u ¨ber dem Integrit¨ atsbereich R. Dabei verstehen wir hier und im Folgenden unter Modul stets einen Linksmodul. Bei kommutativen Ringen ist links ja so gut wie rechts. Das Element m ∈ M heißt Torsionselement von M , wenn es ein von null verschiedenes Element r ∈ R gibt mit rm = 0. Das Nullelement von M ist stets Torsionselement. Ist es das einzige, so nennt man M torsionsfrei. Die Menge aller Torsionselemente von M bezeichnet man mit T (M ) und nennt T (M ) den Torsionsmodul von M . Da R ein Integrit¨atsbereich ist, ist T (M ) wirklich ein Teilmodul von M , so dass der Name Torsionsmodul gerechtfertigt ist. Dies und noch ein bisschen mehr notieren wir als Satz 1. Ist M ein Modul u ¨ber dem Integrit¨ atsbereich R, so ist T (M ) ein Teilmodul von M und M/T (M ) ist torsionsfrei. Beweis. Den Nachweis, dass T (M ) ein Teilmodul ist, u ¨ berlassen wir dem Leser. Bei diesem Nachweis braucht man, dass R kommutativ ist und keine Nullteiler hat. Es sei nun m + T (M ) ein Torsionselement von M/T (M ). Es gibt dann ein r ∈ R mit r = 0 und r(m + T (M )) = T (M ). Hieraus folgt rm ∈ T (M ). Dies impliziert die Existenz eines s ∈ R mit s = 0 und s(rm) = 0. Es folgt, da R ja ein Integrit¨atsbereich ist, dass sr = 0 ist. Wegen (sr)m = s(rm) = 0 ist daher m ∈ T (M ), so dass M/T (M ) in der Tat torsionsfrei ist. Es sei M ein Modul u ¨ber dem Integrit¨ atsbereich R. Der Teilmodul U von M heißt rein in M , falls gilt: Ist m ∈ M und r ∈ R und gilt rm ∈ U , so gibt es ein u ∈ U mit rm = ru. Dies kann man auch so interpretieren, dass man sagt, immer dann, wenn die Gleichung rx = u ∈ U eine L¨osung in M hat, hat sie schon eine L¨osung in U . Die Teilmoduln M und {0} sind stets reine Teilmoduln von M . Pr¨ ufer hat den Begriff der Reinheit f¨ ur Untergruppen abelscher p-Gruppen eingef¨ uhrt und erfolgreich bei der Klassifizierung von abz¨ ahlbaren abelschen pGruppen eingesetzt. Er nannte reine Untergruppen u ¨brigens Servanzuntergruppen. Der Name reine Untergruppe f¨ ur Servanzuntergruppe stammt nach Kaplansky (1962, S. 14) von Braconnier. (F¨ ur den nicht des Franz¨ osischen M¨achtigen sei gesagt, dass Braconnier auf deutsch Wilddieb heißt.) Pr¨ ufer hat damit einen Teil impliziter Theorie endlicher abelscher Gruppen explizit gemacht. Schl¨ usse und S¨ atze, wie man sie in diesem Zusammenhange bei Pr¨ ufer findet, finden sich eben implizit schon in den Arbeiten von Schering 1870 und Frobenius & Stickelberger 1879. Pr¨ ufer selbst zitiert hier nicht, aber er betont, dass seine Methoden Verallgemeinerung von Methoden seien, die bei endlichen abelschen Gruppen schon seit Langem benutzt w¨ urden. Aber auch die pr¨ uferschen Definitionen, Schl¨ usse und S¨ atze sind ihrerseits implizite Modultheorie, wie wir nun sehen werden. Wichtig in diesem Zusammenhang ist der folgende Satz. Satz 2. Ist M ein Modul u ¨ber dem Integrit¨ atsbereich R, ist U ein Teilmodul von M und ist M/U torsionsfrei, so folgt aus m ∈ M und 0 = r ∈ R und rm ∈ U , dass m ∈ U ist. Insbesondere ist U also rein in M .
150
Kapitel VIIII. Der abstrakte K¨ orperbegriff
Beweis. Es sei 0 = r ∈ R und m ∈ M und es gelte rm ∈ U . Dann ist r(m+U ) = U . Weil M/U torsionsfrei ist, folgt m + U = U und daher m ∈ U . Andererseits ist 0 · m = 0 = 0 · 0, so dass man auch im Falle r = 0 die Gleichung rx = u ∈ U bereits in U nach x l¨ osen kann. (In M ist sie allemal l¨osbar.) Also ist U rein in M . Korollar. Ist M ein Modul u ¨ber dem Integrit¨ atsbereich R, so ist T (M ) rein in M . Dies folgt mit Satz 2 aus der nach Satz 1 geltenden Bemerkung, dass M/T (M ) torsionsfrei ist. Satz 3. Es sei M ein Modul u ¨ber dem Integrit¨ atsbereich R und U sei ein Teilmodul von M . Ist dann V derjenige Teilmodul von M , der U umfasst und f¨ ur den V /U = T (M/U ) gilt, so ist V rein in M . Beweis. Nach Satz 1 ist (M/U )/(V /U ) torsionsfrei. Nach dem 2. Isomorphiesatz ist daher auch M/V torsionsfrei, so dass V nach Satz 2 rein ist. Weitere Beispiele von reinen Teilmoduln eines Moduls sind die direkten Summanden. Diese sind wie folgt definiert. Ist M ein Modul u ¨ber dem Ring R und ist D ein Teilmodul von M , so heißt D direkter Summand von M , falls es einen Teilmodul C von M gibt mit M = D + C und D ∩ C = {0}. Man nennt C dann auch Komplement von D in M . Ist D direkter Summand von M und ist C ein Komplement von D, so schreibt man daf¨ ur M = D ⊕ C. Direkte Summanden haben meist viele Komplemente. Ist D direkter Summand von M , so ist D rein in M . Ist n¨ amlich M = D ⊕ C und rm ∈ D, so gibt es zun¨achst ein d ∈ D und ein c ∈ C mit m = d + c. Es folgt rd + rc = rm ∈ D und damit rc = rm − rd ∈ D ∩ C = {0}. Also ist rm = rd, so dass D rein in M ist. Die Relation des Rein-seins hat gegen¨ uber der Relation des Direkten-Summandseins den Vorteil transitiv zu sein. Ist M ein R-Linksmodul und ist m ∈ M , so setzen wir O(m) := {r | r ∈ R, rm = 0} und nennen O(m) das Ordnungsideal von m. Es ist in aller Regel nur ein Linksideal von R, es sei denn R ist kommutativ. Dann ist O(m) ein Ideal in R. Der folgende Satz formalisiert einen Schluss, der sich bei Schering findet und der von Frobenius und Stickelberger wiederholt wird. ¨ber dem Hauptidealring R und U sei ein reiner Satz 4. Es sei M ein Modul u Teilmodul von M . Es sei y + U ∈ M/U . Weil R ein Hauptidealring ist, gibt es ein r ∈ R mit O(y + U ) = rR. Dann ist ry ∈ U , so dass es ein u ∈ U gibt mit ¨ ry = ru. Ist dann x := y − u, so ist O(x) = O(y + U ). Uberdies gilt: Ist x ∈ y + U und gilt O(x) = O(y + U ), so ist U + Ry = U ⊕ Rx.
6. Endlich erzeugte Moduln
151
Beweis. Es ist x + U = y + U . Ist nun s ∈ O(x), so folgt s(y + U ) = s(x + U ) = sx + U = U, so dass s ∈ O(y + U ) ist. Also ist O(x) ⊆ O(y + U ). Andererseits ist rx = r(y − u) = ry − ru = 0 und folglich O(y + U ) = rR ⊆ O(x). Also ist O(x) = O(y + U ). Um die letzte Aussage zu beweisen, beachten wir zun¨achst, dass es ein u ∈ U gibt mit x = y − u. Hieraus folgt zun¨achst, dass U + Rx = U + Ry ist. Es sei w ∈ U ∩ Rx. Es gibt dann ein r ∈ R mit w = rx. Es folgt ry − ru = rx = w ∈ U und damit r(y + U ) = U . Also ist r ∈ O(y + U ) = O(x) und daher w = rx = 0. Folglich ist U ∩ Rx = {0}, so dass in der Tat U + Ry = U ⊕ Rx ist. Der Modul M u ¨ ber dem Ring R heißt zyklisch, wenn es ein m ∈ M gibt mit M = Rm. Die Endlichkeitsvoraussetzung des n¨ achsten Satzes dient wieder dazu, die Benutzung des Auswahlaxioms zu vermeiden. Setzt man die G¨ ultigkeit des Auswahlaxioms voraus, so gilt der Satz auch ohne die Endlichkeitsvoraussetzung, wie die Kommentare im Beweis zeigen. ¨ber dem Hauptidealbereich R. Ist U ein reiner Satz 5. Es sei M ein Modul u Teilmodul von M und ist M/U die direkte Summe von endlich vielen zyklischen Teilmoduln, so ist U direkter Summand von M . Beweis. Es gibt endlich viele Elemente A1 , . . . , At ∈ M/U mit M/U =
t
RAi .
i:=1
(Hier haben wir zum ersten Mal des Auswahlaxiom umgangen, da man die Existenz der Abbildung A mittels Induktion nachweisen kann. Im n¨ achsten Schritt umgehen wir es ein zweites Mal, da die Existenz von x wieder mittels Induktion sichergestellt werden kann.) Nach Satz 4 gibt es dann xi ∈ Ai mit O(xi ) = O(Ai ), da U ja rein ist. Setze t C := Rxi . i:=1
152
Kapitel VIIII. Der abstrakte K¨ orperbegriff
Es sei m ∈ M . Dann ist m + U ∈ M/U . Es gibt daher r1 , . . . , rt ∈ R mit m+U =
t
ri Ai =
i:=1
t
ri (xi + U ) =
i:=1
t
ri xi + U.
i:=1
Hieraus folgt die Existenz eines u ∈ U mit m = u + U + C, so dass M = U + C ist. Es sei nun u=
t
t
i:=1 ri xi .
Folglich ist m ∈
ri xi ∈ U ∩ C.
i:=1
Dann ist U = ti:=1 ri Ai und folglich ri Ai = U f¨ ur alle i, da die Summe der RAi ja direkt ist. Also ist ri ∈ O(Ai ) = O(xi ) f¨ ur alle i. Somit ist m=
t
ri xi = 0.
i:=1
Also gilt M = U ⊕ C, q. e. d. Diesen Beweis kann man nat¨ urlich unmittelbar auf endlich erzeugte Vektorr¨ aume u ¨ ber beliebigen — auch nicht kommutativen — K¨ orpern u ¨bertragen. Weil ein K¨ orper K nur die trivialen Linksideale {0} und K hat, sind Vektorr¨aume immer torsionsfrei und Satz 4 ist trivial erf¨ ullbar. Hat man dann gezeigt, dass endlich erzeugte Vektorr¨ aume immer eine Basis haben, so folgt mit dem Beweis des Satzes 5, dass alle Teilr¨aume endlicher Kodimension eines Vektorraumes stets ein Komplement besitzen, so dass insbesondere Teilr¨ aume endlich erzeugter Vektorr¨ aume immer ein Komplement haben. Warum nur findet man diesen Beweis, der K¨ unftiges vorbereitet, nur in so wenigen B¨ uchern der linearen Algebra? F¨ ur endliche zyklische Gruppen findet sich der folgende Satz bei Frobenius und Stickelberger formuliert. Er folgt bei ihnen aus dem Satz, dass der Rang einer Untergruppe einer endlichen abelschen Gruppe nicht gr¨ oßer ist als der Rang der Ausgangsgruppe. Satz 6. Ist M ein zyklischer Modul u ¨ber dem Hauptidealbereich R, so ist jeder Teilmodul von M zyklisch. Beweis. Weil M zyklisch ist, gibt es ein m ∈ R mit M = Rm. Definiere die Abbildung ϕ durch ϕ(r) := rm. Dann ist ϕ ein Epimorphismus von R auf M , wobei R als Modul u ¨ ber sich aufzufassen ist. Es ist Kern(ϕ) = O(m). Nach dem ersten Isomorphiesatz sind daher R/O(m) und M als Moduln isomorph. Es gen¨ ugt daher zu zeigen, dass alle Teilmoduln von R/O(m) zyklisch sind. Sei X ein Teilmodul von R/O(m). Setzt man Y := y | y ∈ R, y + O(m) ∈ X ,
6. Endlich erzeugte Moduln
153
so ist Y ein Teilmodul, also ein Linksideal von R. Weil R kommutativ ist ist Y sogar ein Ideal von R. Es gibt also ein r ∈ R mit Y = Rr, da R ja ein Hauptidealbereich ist. Folglich ist Y und dann auch X zyklisch. Satz 7. Ist M ein endlich erzeugter torsionsfreier Modul u ¨ber dem Hauptidealbereich R, so ist M die direkte Summe von endlich vielen zyklischen R-Moduln. Beweis. Es sei M das Erzeugnis der a1 , . . . , an . Ist n = 1, so ist M = Ra1 zyklisch. Es sei also n > 1 und der Satz gelte f¨ ur n−1. Es sei U/Ran = T (M/Ran ). ¨ Nach Satz 3 ist U rein in M . Uberdies ist M/U torsionsfrei nach Satz 1 und dem zweiten Isomorphiesatz. Ferner wird M/U wegen an ∈ U von a1 + U , . . . , an−1 + U erzeugt. Nach Induktionsannahme ist M/U die direkte Summe von endlich vielen zyklischen R-Moduln. Nach Satz 5 ist U direkter Summand von M . Es gibt also einen Teilmodul V von M mit M = U ⊕ V . Wegen V ∼ = M/U , gibt es zyklische t Teilmoduln C2 , . . . , Ct mit V = i:=2 Ci . Weil andererseits U ∼ = M/V ist, ist auch U endlich erzeugt. Es sei nun b1 , . . . , bk ein Erzeugendensystem von U . Wegen U/Ran = T (M/Ran ) gibt es Elemente r1 , . . . , rk , s1 , . . . , sk ∈ R − {0} mit ri bi = si an f¨ ur i := 1, . . . , k. Setze r :=
k
ri .
i:=1
Dann ist r = 0 und r ist durch alle ri teilbar. Ist x ∈ U , so gibt es f1 , . . . , fk ∈ R mit x=
k
fi bi .
i:=1
Man definiere gi ∈ R durch fi r = gi ri . Dies ist m¨oglich, da r ja durch ri teilbar ist. Es folgt rx =
k i:=1
rfi bi =
k i:=1
gi ri bi =
k i:=1
g i si an =
k
g i si a n .
i:=1
Die Abbildung x → rx ist also ein Homomorphismus von U in Ran und dann auch ein Monomorphismus, da U als Teilmodul von M torsionsfrei ist. Weil Ran aber zyklisch ist, ist nach Satz 6 jeder Teilmodul von Ran zyklisch. Folglich ist auch U zyklisch, da U ja einem Teilmodul von Ran isomorph ist. Setzt man dann C1 := U , so folgt t M := Ci i:=1
mit zyklischen Moduln C1 , . . . , Ct . Damit ist der Satz bewiesen.
154
Kapitel VIIII. Der abstrakte K¨ orperbegriff
Es sei R ein Ring mit 1. Dann ist R als R-Modul betrachtet zyklisch, da ja R = R · 1 ist. Wir setzen im Folgenden stets voraus, dass R ein Ring mit 1 ist. Ist also R ein Ring und ist M ein R-Modul, so heißt M frei u ¨ber R, wenn M die direkte Summe von zu R isomorphen zyklischen Moduln ist. Ist die Anzahl der zyklischen direkten Summanden endlich, so nennen wir M auch frei endlichen Ranges. Freie Moduln u ¨ber Integrit¨ atsbereichen sind stets torsionsfrei. Ist R ein Hauptidealbereich und ist M ein endlich erzeugter torsionsfreier Modul u ¨ber R, so ist M nach Satz 7 frei u ¨ber R, denn die zyklischen Moduln Ci sind wegen der Torsionsfreiheit von M alle zu R isomorph. Ist R ein ZPE-Bereich und ist 0 = a ∈ R, so gibt es oberhalb aR nur endlich viele Hauptideale: Ist a eine Einheit von R, so ist nat¨ urlich aR = R,so dass die Aussage richtig ist. Ist aR ⊆ bR, so ist b Teiler von a. Ist nun a = ti:=1 pi mit Primelementen p i , so gibt es eine Teilmenge T von {i, . . . , t} und eine Einheit e von R mit b = e i∈T pi . Dann ist aber bR =
pi eR = pi R.
i∈T
i∈T
Hat ein Hauptidealbereich R also die Eigenschaft ein ZPE-Bereich zu sein, so enth¨ alt jede Menge von Idealen von R ein maximales Ideal. Insbesondere enth¨ alt R maximale Ideale und die maximalen Ideale sind genau die von {0} verschiedenen Primideale von R. Satz 8. Es sei R ein Hauptidealbereich, der gleichzeitig ein ZPE-Bereich sei. Es seien ferner M und N freie Moduln endlichen Ranges u ¨ber R. Ist dann M = m n i:=1 Ci und N = j:=1 Dj mit zu R isomorphen zyklischen Moduln Ci und Dj , so sind M und N genau dann isomorph, wenn m = n ist. und Dj = Ryj . Ist dann m = n, so gibt es zu v ∈ M Beweis. Es sei Ci = Rxi m Elemente ri ∈ R mit v = i:=1 ri xi . Die ri sind auf Grund der Torsionsfreiheit freier Moduln eindeutig durch v bestimmt. Definiert man dann σ durch σ
v :=
m
ri yi ,
i:=1
so ist σ ein Isomorphismus von M auf N . Es seien umgekehrt M und N isomorph und es sei σ ein Isomorphismus von N auf M . Dann ist n M= Ryiσ , i:=1
so dass wir annehmen d¨ urfen, dass M = N ist. Es sei nun p ein Primelement von R. Ein solches gibt es, da wir R als ZPE-Bereich angenommen haben. Dann ist pR ein maximales Ideal in R, so dass R/pR ein K¨ orper ist. Wir betrachten M/pM .
6. Endlich erzeugte Moduln
155
Dies k¨ onnen wir als Modul u ¨ber R/pR auffassen, so dass M/pM ein Vektorraum u ¨ ber R/pR ist, da R/pR ja ein K¨ orper ist. Offenbar ist {xi + pM | i := 1, . . . , m} ein Erzeugendensystem von M/pM . Wir zeigen, dass diese Menge sogar eine Basis ist. Dazu sei m (ri + pR)(xi + pM ). pM = i:=1
Dann ist pM =
m
ri xi + pM.
i:=1
m Es gibt i:=1 ri xi . Es gibt andererseits si ∈ R mit malso ein u ∈ M mit pu = u = i:=1 si xi . Es folgt m m psi xi = ri xi i:=1
i:=1
und damit psi = ri f¨ ur alle i. Also ist ri + pR = psi + pR = pR, so dass die xi + pM in der Tat linear unabh¨ angig sind. Ebenso folgt, dass auch {yi + pM | i := 1, . . . , n} eine Basis von M/pM . Daher ist m = n, da Basen ein und desselben Vektorraumes ja gleichm¨achtig sind. Die eindeutig bestimmte Zahl m heißt Rang von M . Satz 9. Es sei M ein endlich erzeugter Modul u ¨ber dem Hauptidealbereich R. ¨ Dann ist M = T (M ) ⊕ F mit einem freien Modul F endlichen Ranges. Uberdies ist auch T (M ) endlich erzeugt. Beweis. Da M endlich erzeugt ist, ist auch M/T (M ) als epimorphes Bild von M endlich erzeugt. Nach Satz 1 ist M/T (M ) torsionsfrei und daher frei endlichen Ranges nach Satz 7. Da T (M ) nach dem Korollar zu Satz 2 rein in M ist, ist T (M ) nach Satz 5 ein direkter Summand von M . Es gibt also ein Komplement F von T (M ) in M . Wegen F ∼ = M/T (M ) ist F frei endlichen Ranges. Es folgt weiter, dass T (M ) ∼ = M/F ist, so dass auch T (M ) als epimorphes Bild von M endlich erzeugt ist. Korollar. Es seien M und N endlich erzeugte Moduln u ¨ber dem Hauptidealbereich R. Genau dann sind M und N isomorph, wenn M/T (M ) und N/T (N ) sowie T (M ) und T (N ) isomorph sind. Beweis. Ist σ ein Isomorphismus von M auf N , so ist die Einschr¨ ankung von σ auf T (M ) banalerweise ein Isomorphismus von T (M ) auf T (N ). Dann induziert σ aber auch einen Isomorphismus von M/T (M ) auf N/T (N ).
156
Kapitel VIIII. Der abstrakte K¨ orperbegriff
Es seien umgekehrt T (M ) und T (N ) sowie M/T (M ) und N/T (N ) isomorph. Weil M und N endlich erzeugt sind, gibt es freie Moduln F und G mit M = T (M ) ⊕ F und N = T (N ) ⊕ G. Weil F zu M/T (M ) und G zu N/T (N ) isomorph ist, gibt es folglich einen Isomorphismus τ von F auf G. Ferner gibt es einen Isomorphismus σ von T (M ) auf T (N ). Ist nun v ∈ M , so gibt es genau ein t ∈ T (M ) und genau ein f ∈ F mit v = t + f . Setzt man nun v ρ := tσ + f τ , so ist ρ ein Isomorphismus von M auf N , wie einfache Rechnungen zeigen. 7. Torsionsmoduln. Sind M und N endlich erzeugte Moduln u ¨ber einem euklidischen Ring, so sind M und N genau dann isomorph, wenn M/T (M ) und N/T (N ) sowie T (M ) und T (N ) isomorph sind. Dies haben wir im letzten Abschnitt gesehen, wie auch, dass M/T (M ) und N/T (N ) genau dann isomorph sind, wenn ihre R¨ ange gleich sind. Es geht also nun noch darum, Kriterien f¨ ur die Isomorphie von T (M ) und T (N ) zu suchen. Damit sind wir fast bei unserem eigentlichen Thema, den endlichen abelschen Gruppen, da diese gerade die endlich erzeugten Torsionsmoduln u ¨ ber Z sind, wie man durch Induktion nach der Anzahl der Erzeugenden schnell best¨ atigt. Andererseits ist der Rahmen immer noch sehr viel weiter gesteckt, da auch die folgende Situation mit erfasst wird. Ist K ein kommutativer K¨ orper und ist V ein Vektorraum u ¨ ber K, so ist der Polynomring K[x] in der Unbestimmten x u ¨ ber K ein euklidischer Ring. Ist ferner σ ∈ EndK (V ), so wird V zu einem K[x]-Modul durch die Vorschrift f v := f (σ)(v) f¨ ur alle f ∈ K[x] und alle v ∈ V . Ist V endlich-dimensional, so ist V auch als K[x]-Modul endlich erzeugt und dar¨ uber hinaus ein Torsionsmodul, da von den Vektoren, v, σ(v), σ 2 (v), . . . , nur endlich viele linear unabh¨ angig sein k¨ onnen, so dass O(v) = {0} ist. Ist n¨amlich σ m (v) ∈
m−1
Kσ i (v),
i:=0
so gibt es also k0 , . . . , km−1 ∈ K mit σ m (v) = −
m−1
ki σ i (v).
i:=0
Es folgt 0 = xm +
m−1 i:=0
ki xi ∈ O(v),
7. Torsionsmoduln
157
so dass in der Tat O(v) = {0} ist. Im Folgenden ben¨ otigen wir den chinesischen Restsatz, f¨ ur den Bachet als erster einen Beweis gab (Bachet 1624), wenn auch nur f¨ ur nat¨ urliche Zahlen. In diesem Falle geht es darum, zu paarweise teilerfremden nat¨ urlichen Zahlen n1 , . . . , nt und weiteren nicht-negativen ganzen Zahlen b1 , . . . , bt eine nat¨ urliche Zahl x zu finden mit x ≡ bi mod ni f¨ ur i := 1, . . . , t. Ich formuliere den chinesischen Restsatz hier in der Version, wie ich ihn in Kaplanskys Vorlesung Commutative Rings“ gelernt habe, die er ” im akademischen Jahr 1965/66 am Queen Mary College in London gehalten hat (s. a. Kaplansky 1970). Wie Bachet den chinesischen Restsatz bewies, werden wir weiter unten kommentieren. Satz 1. Es sei R ein Ring mit 1 und I1 , . . . , It , J seien Ideale von R. Gilt ur alle k := 1, . . . , t, so ist Ik + J = R f¨ I1 · · · It + J = I1 ∩ . . . ∩ It + J = R. Beweis. Da I1 · · · It ⊆ I1 ∩ . . . ∩ It gilt, gen¨ ugt es zu zeigen, dass I1 · · · It + J = R ist. Nach Voraussetzung ist I1 + J = R. Es sei 1 ≤ k < t und es gelte I1 · · · Ik + J = R. Es gibt dann ein x ∈ I1 · · · Ik und ein u ∈ J mit 1 = x + u. Ebenso gibt es ein y ∈ Ik+1 und ein v ∈ J mit 1 = y + v. Es folgt 1 = (x + u)(y + v) = xy + (xv + uy + uv) ∈ I1 . . . Ik+1 + J. Daher gilt auch I1 · · · Ik+1 + J = R, so dass Satz 1 bewiesen ist. Chinesischer Restsatz. Es sei R ein Ring mit 1 und I1 , . . . , It seien Ideale von R. Ist σ die durch σ(x) := (x + I1 , . . . , x + It ) t definierte Abbildung von R in k:=1 R/Ik , so ist σ eine Homomorphismus mit !t dem Kern k:=1 Ik . Genau dann ist σ surjektiv, wenn
Ik + Il = R ist f¨ ur alle k, l ∈ {1, . . . , t} mit k = l. In diesem Falle gilt, falls nur R kommutativ ist, t t " Ik = Ik . k:=1
k:=1
Beweis. Dass σ ein Homomorphismus ist und dass der Schnitt der fraglichen Ideale der Kern dieses Homomorphismus ist, ist trivial.
158
Kapitel VIIII. Der abstrakte K¨ orperbegriff
Es sei σ surjektiv. Ferner seien k, l ∈ {1, . . . , t} und k = l. Dann ist auch die durch ρ(x) := (x + Ik , x + Il ) definierte Abbildung ρ surjektiv. Ist nun x ∈ R, so gibt es also ein u ∈ R mit (x + Ik , Il ) = ρ(u) = (u + Ik , u + Il ). Es folgt x − u ∈ Ik und u ∈ Il . Daher ist x = x − u + u ∈ Ik + Il und folglich R ⊆ Ik + Il , so dass in der Tat R = Ik + Il gilt. ur alle k und l mit k = l. Nach Satz 1 ist dann Es gelte umgekehrt Ik + Il = R f¨ I1 ∩ . . . ∩ Ik + Ik+1 = R f¨ ur k := 1, . . . , t − 1. Es seien b1 , . . . , bt ∈ R. Es gibt dann ein x1 ∈ R mit x1 − b1 ∈ I1 etwa x1 = b1 . Es sei xk ∈ R und es gelte xk − bl ∈ Il f¨ ur l := 1, . . . , k. Ferner sei k < t. Nach Satz 1 ist I1 ∩ . . . ∩ Ik + Ik+1 = R. Es gibt daher ein u ∈ I1 ∩ . . . ∩ Ik und ein v ∈ Ik+1 mit 1 = u + v. Setze xk+1 := ubk+1 + vxk . Dann ist xk+1 − bk+1 = (u − 1)bk+1 + vxk = v(xk − bk+1 ) ∈ Ik+1 . Andererseits ist xk+1 − bl = ubk+1 + vxk − bl = ubk+1 + (1 − u)xk − bl = u(bk+1 − xk ) + xk − bl ∈ Il f¨ ur l := 1, . . . , k. Diese Induktion zeigt, dass xt das Verlangte leistet. Die letzte Aussage gilt f¨ ur t = 1. Es sei t > 1 und sie gelte f¨ ur t − 1. Setzt man J := I1 · · · It−1 , so folgt mit Satz 10 t "
Ik = J ∩ It = (J ∩ It )R = (J ∩ It )(J + It )
k:=1
⊆ (J ∩ It )J + (J ∩ It )It ⊆ It J + JIt = JIt .
7. Torsionsmoduln
159
Dabei haben wir erst ganz !t zum Schluss die Kommutativit¨at benutzt. Da trivialerweise JIt = I1 · · · It ⊆ k:=1 Ik gilt, ist t "
I1 · · · It =
Ik ,
k:=1
wie behauptet. Dieser bemerkenswerte Satz bedarf des Kommentars. Zun¨achst sei bemerkt, dass Interpolation ein Spezialfall des chinesischen Restsatzes ist. Dies scheint Lagrange nicht bewusst gewesen zu sein und auch Gauß stellt keinen Zusammenhang her. Soll n¨ amlich ein Polynom f bestimmt werden, so dass es an den Stellen a0 , . . . , an die Werte b0 , . . . , bn annimmt, so berechne man nach dem Verfahren des Beweises des chinesischen Restsatzes f so, dass f ≡ bi mod (x − ai ) ist f¨ ur alle i. Dann ist also f = (x − ai )gi + bi und folglich f (ai ) = (ai − ai )gi (ai ) + bi = bi f¨ ur alle i. Dieses Verfahren ist das newtonsche Interpolationsverfahren. Es hat den Vorteil, dass man immer neue St¨ utzstellen hinzunehmen kann, ohne die fr¨ uheren Rechnungen wiederholen zu m¨ ussen. Hat man an immer den gleichen St¨ utzstellen mit immer neuen b’s zu interpolieren, so kann man sich mit Vorteil des lagrangeschen Interpolationsverfahrens bedienen. Ins Allgemeine gewendet verschafft man sich zun¨achst — z. B. mit dem newtonschen Verfahren — Elemente g1 , . . . , gt mit gk ∈ Ij f¨ ur j = k und gk − 1 ∈ Ik . Setzt man dann x :=
t
gj bj ,
j:=1
so folgt x − bk = (gk − 1)bk +
gj bj ∈ Ik
j=k
f¨ ur alle k, so dass x das gegebene Resteproblem l¨ost. Im Falle des Interpolationsverfahrens selbst verschafft man sich zun¨achst Polynome gi mit 0, falls i = j, gi (aj ) = 1, falls i = j. Ist dann f :=
n i:=0
bi gi ,
160
Kapitel VIIII. Der abstrakte K¨ orperbegriff
so ist f (aj ) =
n
bi gi (aj ) = bj
i:=0
f¨ ur alle j. In diesem Falle sind die gi unabh¨ angig von den bj , k¨ onnen also immer wieder verwendet werden. Ben¨otigt man aber eine weitere St¨ utzstelle, so muss man alle gi neu berechnen. Bachet hat dieses zweite Verfahren zur L¨osung des chinesischen Resteproblems verwandt (Bachet 1624, Proposition XX und Probleme sixiesme). Er ging so vor, dass er zu paarweise teilerfremden nat¨ urlichen Zahlen a0 , a1 , . . . , an jeweils ein xi nach dem von uns in Kap. 2, Absch. 2 schon vorgestellten Verfahren bestimmte mit a0 · · · ai−1 ai+1 · · · an xi ≡ 1 mod ai . Dann setzte er gi := a0 · · · ai−1 ai+1 · · · an xi und x=
n
bi gi .
i:=0
ur alle i. Dann ist x ≡ bi mod ai f¨ F¨ ur weitere Kommentare zum chinesischen Resteproblem sei auf L¨ uneburg 1993 verwiesen. Weil es so sch¨on ist und weil ich noch dazugelernt habe, komme ich hier noch einmal auf die Bedeutung von interpolare zur¨ uck. Gewebe muss gewalkt werden, um zu Tuch zu werden. Gewebt wurde im Rom der Antike zu Hause — gemeint ist das Haus des Großgrundbesitzers, der auch die Wolle zum Weben hatte und die Sklaven, die Webst¨ uhle zu bedienen —, doch zum Walken wurde das Gewebe dem Walker gegeben, der das Walken berufsm¨ aßig betrieb. Das Walken war eine sehr unappetitliche Sache, wurde dem Stoff doch verfaulter Urin zugesetzt, bevor er gewalkt wurde. War eines R¨omers Toga nun abgewetzt und fadenscheinig geworden, gab er sie ein ander Mal dem Walker, damit er sie durch erneutes Walken wieder auffrische. Dieses zweite Walken hieß interpolare. Im u ¨ bertragenen Sinne hieß interpolare dann auch betr¨ ugen (Marquart 1980, Bd. 2, S. 529, Georges 1983). Um dem Bedarf an Tuch gerecht zu werden, reichte nun der Urin nicht, der in der Werkstatt des Walkers anfiel. Sie stellten daher, wie u ¨ brigens auch die Gerber, ¨ in der Offentlichkeit Gef¨ aße auf, damit die Vorbeigehenden sich ihrer bedienten (Neuburger 1919, S. 179, Grassnick 1992, S. 5). Diese sparten so noch das As, das sie sonst h¨atten entrichten m¨ ussen, h¨atten sie eine ¨offentliche Bed¨ urfnisanstalt besucht (Grassnick loc. cit.). Es war also beiden gedient, dem Walker und dem, der es nicht mehr bis nach Hause schaffte. In meinem Lesevergn¨ ugen“ habe ich mich u ¨ ber die W¨ orter publicus und pri” vatus ausgelassen. Privatus ist das dem Gemeinwesen von Rechts wegen Entzogene und publicus ist das, was sich von herrschaftlicher Gewalt herleitet. Privatus
7. Torsionsmoduln
161
nimmt dann auch die Bedeutungen von zur¨ uckgezogen und heimlich an. Im Latein der Kl¨ oster bedeutete privatae die Latrinen (L¨ uneburg 1993, S. 21). Im heutigen Portugiesisch steht privada immer noch f¨ ur Abort. Demzufolge gibt es in dieser Sprache dann auch privadas publicas, o¨ffentliche Bed¨ urfnisanstalten also. Damit ist der Zusammenhang mit den Walkern hergestellt. Das Spanische, das Franz¨ osische und das Italienische bedienen sich anderer W¨ orter. Es war der im verfaulten Urin enthaltene Ammoniak, der eine teilweise Verseifung des in der Wolle enthaltenen Fettes bewirkte und so zur Reinigung des Gewebes beitrug. Das Walken selbst bewirkte eine Verfilzung des Stoffes, so dass aus dem lockeren Gewebe ein dichtes Tuch wurde. Nach dem Walken wurde das Tuch gewaschen und nach dem Trocknen u. a. durch Kratzen mit Disteln weiter veredelt. Die Wollfasern, die sich beim Kratzen l¨ osten, wurden gesammelt und zum Stopfen von Kissen verwendet (Neuburger, loc. cit.). Ist T ein Torsionsmodul u ¨ ber dem ZPE-Hauptidealbereich R und ist P = pR ein maximales Ideal von R, so setzen wir TP := x | x ∈ T, es gibt ein n ∈ N0 mit O(x) = pn R . Diese Definition h¨ angt nur von P ab, da aus P = qR folgt, dass p und q assoziiert sind, sich also nur um eine Einheit unterscheiden. Dann ist aber auch pn R = q n R. Weil p Primelement, bzw., weil P Primideal ist, heißen die von {0} verschiedenen TP Prim¨ arkomponenten von T . Einfache Rechnungen zeigen, dass die Prim¨ arkomponenten eines Torsionsmoduls Teilmoduln sind. Der folgende Satz hat als Vorl¨ aufer den Satz von Gauß, dass sich die Gruppe der Klassen quadratischer Formen gegebener Diskriminante in ihre Prim¨ arkomponenten zerlegen l¨ aßt. Dieser Satz und sein Beweis, die in das Jahr 1801 datiert werden, wurden erst 1863, also neun Jahre vor der einschl¨ agigen sylowschen Arbeit, im zweiten Band seiner Werke publiziert. Bei der Herausgabe dieses Bandes war E. Schering beteiligt, der die fragliche Arbeit dann auch zitiert (Schering 1870). Er selbst geht, wie er betont, in seiner Arbeit einen anderen Weg der Zerlegung der Klassengruppe, auf den wir gleich zu sprechen kommen. Wie Schering in seiner Note sagt (Schering loc. cit. S. 5), stammen seine Resultate schon aus dem Jahre 1855. Frobenius und Stickelberger kombinieren die Zerlegung von Gauß mit der von Schering und fassen dar¨ uber hinaus den Begriff der endlichen abelschen Gruppe weiter als Gauß und Schering (Frobenius & Stickelberger 1879). F¨ ur sie ist endliche abelsche Gruppe stets Untergruppe der Einheitengruppe von Z/nZ. Sie bestimmen f¨ ur jede endliche abelsche Gruppe ein vollst¨ andiges Invariantensystem und zeigen schließlich, dass jeder Kandidat f¨ ur ein solches Invariantensystem auch tats¨achlich ein Invariantensystem einer endlichen abelschen Gruppe ist. Um dies zu beweisen, ben¨otigen sie den Satz von Dirichlet u ¨ ber Primzahlen in arithmetischen Progressionen (Dirichlet 1837). Auch hierauf werden wir noch detailliert zur¨ uckkommen. Insbesondere werden wir sehen, dass wir nicht den vollen Satz von Dirichlet ben¨ otigen, vielmehr mit der bewiesenen Version auskommen, dass es in der arithmetischen Reihe {1 + qn | n ∈ N0 } stets unendlich viele Primzahlen gibt.
162
Kapitel VIIII. Der abstrakte K¨ orperbegriff
Satz 2. Es sei R ein Hauptidealbereich, der gleichzeitig ZPE-Bereich sei. Ist T ein Torsionsmodul u ¨ber R, so ist TP . T = P
Dabei ist die Summation u ¨ber alle maximalen Ideale P von R zu erstrecken. Ist T ein zweiter Torsionsmodul u ¨ber R, so sind T und T genau dann isomorph, wenn TP und TP f¨ ur alle maximalen Ideale P von R isomorph sind. Beweis. Es sei x ∈ T . Dann ist O(x) = rR. Weil x Torsionselement ist, ist r = 0. Weil R ein ZPE-Bereich ist, gibt es paarweise nicht assoziierte Primelemente p1 , urliche Zahlen a1 , . . . , at sowie eine Einheit e mit . . . , pt und nat¨ r=e
t
pai i .
i:=1
Es sei ri definiert durch
eri pai i
= r. Ferner sei
r1 R + . . . + rt R = dR. ur alle i, so dass d Teiler aller ri ist. Es sei p Primteiler von d. Dann ist ri ∈ dR f¨ Dann ist p auch Primteiler aller ri . Da R ZPE-Bereich ist, gibt es, weil p Teiler von r1 ist, eine Einheit e1 und ein i ∈ {2, 3, . . . , t} mit p = e1 pi . Nun ist p auch Teiler von ri . Es gibt also eine weitere Einheit e2 und ein j ∈ {1, . . . , t} − {i} mit p = e2 pj . Also ist e1 pi = e2 pj im Widerspruch zu der Voraussetzung, dass pi und pj f¨ ur i = j nicht assoziiert sind. Es gibt also keinen Primteiler von d, so dass d folglich Einheit ist. Daher ist r1 R + . . . + rt R = R. Es gibt somit s1 , . . . , st ∈ R mit t
ri si = 1.
i:=1
Setze xi := ri si x. Dann ist x=
t
xi
i:=1
und
pai i xi = pai i ri si x = e−1 rsi x = 0.
Hieraus folgt pai i ∈ O(xi ) = uR. Dann ist u aber Teiler von pai i also, von Einheiten abgesehen, Potenz von pi . Folglich ist xi ∈ Tpi R .
7. Torsionsmoduln
163
Damit ist gezeigt, dass T =
TP
P
ist. Es seien P1 , . . . , Pt endlich viele maximale Ideale von R. Ist k = l, so gilt auf Grund der Maximalit¨ at der P ’s die Gleichung Pk + Pl = R. Es sei xi ∈ TPi f¨ ur alle i und es gelte t xi = 0. i:=1
Es sei ferner Pi = pi R. Dann ist O(xi ) = pei i R. Mit Satz 1 folgt pekk R + pel l R = R, falls nur k = l ist. Man kann hier also den chinesischen Restsatz anwenden. Es sei i ∈ {1, . . . , t}. Auf Grund eben dieses chinesischen Restsatzes gibt es ein r ∈ R mit r ∈ Pj f¨ ur alle j, die von i verschieden sind, und r − 1 ∈ Pi . Es folgt t
0=r
xj =
j:=1
t
rxj = xi .
j:=1
Daher gilt sogar, wie behauptet, T =
TP .
P
Die Isomorphieaussage ist trivial. Nicht ganz! Will man n¨amlich zeigen, dass aus der Isomorphie von TP und TP f¨ ur alle P die Isomorphie von T und T folgt, ben¨ otigt man das Auswahlaxiom, es sei denn, man setzt wieder voraus, dass M amlich nur endlich viele und M endlich erzeugt sind. Dann haben M und M n¨ Prim¨ arkomponenten, so dass die Existenz von Auswahlfunktionen mittels Induktion sichergestellt werden kann. Es erhebt sich die Frage, f¨ ur welche maximalen Ideale P die Prim¨ arkomponente TP nicht-trivial ist. Dies ist nicht immer zu entscheiden. Um Klarheit zu bekommen, definieren wir das Annihilatorideal ann(M ) eines Moduls M u ¨ ber einem Ring R durch ann(M ) := {r | r ∈ R, rm = 0 f¨ ur alle m ∈ M }. Dann ist ann(M ) wirklich stets ein Ideal unabh¨ angig davon, ob R kommutativ ist oder nicht. Ist R ein Integrit¨atsbereich, so ist ann(M ) ⊆ O(x) f¨ ur alle x ∈ M , so dass M sicher dann ein Torsionsmodul ist, wenn ann(M ) = {0} ist. Es ist jedoch nicht schwer, sich Beispiele von Torsionsmoduln zu verschaffen,
164
Kapitel VIIII. Der abstrakte K¨ orperbegriff
f¨ ur die ann(M ) = {0} gilt. Man nehme etwa die direkte Summe aller endlichen zyklischen Gruppen Z/nZ n∈N
oder die Gruppe Q/Z, deren Prim¨ arkomponenten die sogenannten Pr¨ ufergruppen Z(p∞ ) sind (Pr¨ ufer 1923, S. 41). Deren echte Untergruppen sind alle zyklisch und f¨ ur jedes n ∈ N0 gibt es genau eine Untergruppe der Ordnung pn in Z(p∞ ). Schon f¨ ur diese Gruppen gilt, dass ihr Annihilator nur aus der Null besteht. Ist also ann(M ) = {0}, so kann man, auch wenn man weiß, dass M Torsionsmodul ist, nichts u ¨ ber die Prim¨ arkomponenten sagen, solange man nicht zus¨ atzliche Informationen u ¨ber den Modul hat. Trivial aber n¨ utzlich ist der folgende Satz. Satz 3. Es sei M ein Modul u ¨ber dem Integrit¨ atsbereich R. Ist E ein Erzeugendensystem von M , so ist " O(e). ann(M ) = e∈E
Satz 4. Es sei T ein Torsionsmodul u ¨ber dem Hauptidealbereich R und R sei gleichzeitig ein ZPE-Ring. Ferner gelte ann(T ) = {0}. Ist P ein maximales Ideal ¨ von R, so gilt genau dann TP = {0}, wenn ann(T ) ⊆ P gilt. Uberdies gilt ann(T ) =
"
ann(TP ).
ann(T )⊆P
Insbesondere hat T nur endlich viele von {0} verschiedene Prim¨ arkomponenten. Beweis. Es sei P ein maximales Ideal von R und es gelte TP = {0}. Ist dann 0 = x ∈ TP , so folgt ann(T ) ⊆ O(x) ⊆ P. Dies beweist die eine Richtung. Weil R ein Hauptidealring ist, gibt es ein a ∈ R mit ann(T ) = aR. Es sei P = pR ein maximales Ideal und es gelte ann(T ) ⊆ P . Nach Satz 3 ist ann(T ) =
"
O(x).
x∈T
Wegen ann(T ) = {0} gibt es, weil R ein ZPE-Bereich ist, oberhalb von ann(T ) nur endlich viele Ideale. Es gibt daher endliche viele x1 , . . . , xt ∈ M mit ann(T ) =
t " i:=1
O(xi ).
7. Torsionsmoduln
165
Es gibt weiter bi ∈ R mit O(xi ) = bi R. Es folgt ann(T ) =
t "
bi R = kgV(b1 , . . . , bt )R.
i:=1
Wegen ann(T ) ⊆ P = pR ist p ein Primelement, welches a teilt. Dann teilt p auch kgV(b1 , . . . , bt ) und dann auch oBdA b1 . Es folgt O
b1 x1 p
und damit 0 =
= pR
b1 x1 ∈ TP , p
so dass TP = {0} ist. Da die prim¨aren Elemente auf Grund von Satz 2 den Modul M erzeugen, folgt mittels Satz 3 auch noch die vorletzte Behauptung. Die letzte folgt aus der schon gemachten Bemerkung, dass es oberhalb ann(T ) nur endlich viele Ideale gibt. Die Zerlegung endlicher abelscher Gruppen in ihre Prim¨ arkomponenten geht, wie schon erw¨ahnt, auf Gauß zur¨ uck. Frobenius und Stickelberger beweisen die Existenz und Einzigkeit dieser Zerlegung in ihrer Arbeit ein zweites Mal. Nachdem dies geschehen ist, lassen sie diesen Faden zun¨achst liegen und beweisen mit den gleichen Methoden wie Schering und unter Bezug auf ihn, dass sich jede endliche abelsche Gruppe als direkte Summe zyklischer Gruppen C1 , . . . , Ct darstellen l¨ asst, f¨ ur die |Ci | ≡ 0 mod |Ci+1 | ¨ gilt f¨ ur i := 1, . . . , t − 1. Uber Schering hinausgehend zeigen sie weiter, dass die Ordnungen dieser zyklischen Gruppen ein vollst¨ andiges Invariantensystem der gegebenen Gruppe ist, eine Aussage, die wir bald pr¨azisieren werden. Frobenius und Stickelberger zeigen ferner, dass jeder Kandidat eines solchen Invariantensystems, also ein System von nat¨ urlichen Zahlen m1 , . . . , mt mit mt > 1 und der Eigenschaft, dass mi+1 Teiler von mi ist, auch Invariantensystem einer endlichen abelschen Gruppe in ihrem Sinne ist, dh., dass es stets m¨oglich ist, eine nat¨ urliche Zahl n zu finden und eine Untergruppe der Einheitengruppe von Z/nZ, die die gegebenen Zahlen als Invariantensystem hat (Frobenius und Stickelberger 1879, S. 256). Die von ihnen noch einmal hergeleiteten und um die Isomorphieaussage erweiterten scheringschen Ergebnisse wenden Frobenius und Stickelberger dann auf die Prim¨ arkomponenten an, um auf diese Weise eine Zerlegung der gegebenen abelschen Gruppe in irreduzible direkte Summanden zu erreichen. Dar¨ uberhinaus formulieren und beweisen sie auch die hierher geh¨orenden Isomorphieaussagen.
166
Kapitel VIIII. Der abstrakte K¨ orperbegriff
Das Verfahren, die gegebene abelsche Gruppe erst in ihre Prim¨arkomponenten zu zerlegen und sich dann um die Invarianten der Prim¨ arkomponenten zu k¨ ummern, hat einen schwer wiegenden Nachteil. Man muss hierzu n¨amlich zuerst die Gruppenordnung faktorisieren und das Faktorisieren von nat¨ urlichen Zahlen ist sehr m¨ uhsam. Das scheringsche Verfahren vermeidet dies, wie es zun¨ achst scheint. Schering und dann auch Frobenius und Stickelberger bei ihrer Darstellung des scheringschen Verfahrens benutzen jedoch die Zerlegung von nat¨ urlichen Zahlen in Primfaktoren, indem sie das gaußsche Verfahren anwenden, um zu nat¨ urlichen Zahlen a und b zwei teilerfremde nat¨ urliche α und β zu konstruieren, so dass α Teiler von a und β Teiler von b ist und αβ = kgV(a, b) gilt. Gauß benutzt hierzu die Primfaktorzerlegung von a und b. Dass man dies vermeiden kann und mit ggT-Berechnungen auskommt, habe erst ich gezeigt (L¨ uneburg 1986). Wir schließen uns hier Schering an, wobei wir seinen Beweis in moderne Sprache kleiden und unsere S¨ atze auch allgemeiner, n¨ amlich f¨ ur endlich erzeugte Torsionsmoduln u ¨ ber Hauptidealbereichen, die gleichzeitig ZPE-Bereiche sind, formulieren und beweisen. Dass sein Invariantensystem die Isomorphietypen klassifiziert, werden wir ebenfalls zeigen. Um diese Frage k¨ ummert sich Schering nicht. Bei alldem werden wir die rechnerische Seite stets im Auge behalten, ohne sie jedoch explizit zu machen. Daf¨ ur sei auf L¨ uneburg 1987a und 1993a verwiesen. In Abschnitt 3 von Kapitel 2 hatten wir zu a, b ∈ N die Zahl r(a, b) definiert als den gr¨ oßten zu b teilerfremden Teiler von a. Dieses Konzept kann man nat¨ urlich verallgemeinern auf beliebige Hauptidealbereiche, die gleichzeitig ZPE-Bereiche sind. Da hier r(a, b) nur bis auf Einheiten definiert sein wird, ist es besser das Konzept u ¨ ber die Ideale zu definieren. Es seien also A und B zwei vom Nullideal verschiedene Ideale des Hauptidealbereiches R. Wir betrachten dann die Menge ΦA,B := {I | I ist Ideal von R, A ⊆ I, I + B = R}. Sind dann I, J ∈ ΦA,B , so ist A ⊆ I ∩ J und nach Satz 1 auch I ∩ J + B = R, so dass I ∩ J ∈ ΦA,B gilt. Wegen A = {0} gibt es oberhalb A nur endlich viele ¨ ber alle Ideale, so dass die Menge ΦA,B endlich ist. Daher ist der Schnitt M u Elemente von ΦA,B wieder ein Element von ΦA,B , also das kleinste Element dieser Menge. Sind nun a und b von null verschiedene Elemente von R, ist A = aR und B = bR, ist ferner M das kleinste Element von ΦA,B , so gibt es ein r(a, b) ∈ R mit M = r(a, b)R. Dieses r(a, b) ist bis auf Einheiten eindeutig bestimmt. Wegen aR ⊆ r(a, b)R ist r(a, b) Teiler von a, wegen r(a, b)R + bR = R sind b und r(a, b) teilerfremd. Ist schließlich c Teiler von a und sind b und c teilerfremd, so ist aR ⊆ cR und cR + bR = R, so dass r(a, b)R ⊆ cR ist. Somit ist c Teiler von r(a, b), so dass r(a, b) der gr¨ oßte zu b teilerfremde Teiler von a ist. So ger¨ ustet, d¨ urfte es f¨ ur den Leser nicht schwer sein zu verifizieren, dass die S¨atze 10 und 11 von Abschnitt 3 des Kapitels 2 f¨ ur beliebige ZPE-Hauptidealbereiche gelten, so dass man mit Satz 10 insbesondere auch die Berechnung von r(a, b) beherrscht, solange man nur die Arithmetik in R beherrscht. Allenfalls notwendige Induktionen mache man u ¨ ber die Anzahl der Teiler bzw. Primteiler der betrachteten Elemente.
7. Torsionsmoduln
167
Manche finden das, was ich hier mache, vom didaktischen Standpunkt aus hervorragend, zwingt es doch den Leser aktiv zu werden. Ich bin mir dieser didaktischen Methode jedoch nicht so sicher. Man stelle sich nur vor, man bekommt in einer Vorlesung u ¨ ber lineare Algebra den Rn mit all seinen Matrizen vorgestellt und dann heißt es: Und nun machen wir lineare Algebra u ¨ber beliebigen K¨ orpern. ” Da geht alles ganz genauso“ und weiter nichts. Aber es werden ja auch konfuse Vorstellungsvortr¨ age bei Berufungen als didaktisch wertvoll gepriesen, da sie die Studenten zum Nachdenken zw¨ angen. Es ist schon erstaunlich, zu welchen Argumenten manche greifen, wenn sie eine feste Vorstellung von der Besetzung einer Stelle haben. Ich denke mir, dass die Methode zu sagen, da gehe alles genauso, nur den wirklich erfreut, der sich in der Sache auskennt. Der, der zum ersten Male in der Gegend ist, muss erst einmal die aktuelle Diskussion unterbrechen, und sehen, ob in der neuen Situation wirklich alles genauso geht. Das ist l¨ astig. Der Leser1 , der zum ersten Male hier in der Gegend ist, verzeihe mir. Der n¨achste Satz ist der Schl¨ ussel f¨ ur alles Weitere. Wie f¨ ur so vieles finden sich auch f¨ ur ihn Vorl¨ aufer in den Disquisitiones von Gauß, der in art. 73 aus zwei zu einer Primzahl p primen Reste a und b der Ordnungen t und u ein Element konstruiert, dessen Ordnung gleich dem kgV(t, u) ist. Sein Element entspricht unserem v des folgenden Satzes. Die Zahlen, die wir A und B nennen, konstruiert er mit Hilfe der Primfaktorzerlegung von t und u (art. 73). Das Ganze dient dazu, ein primitives Element von GF(p) zu finden. Die gleiche Konstruktion macht Gauß auch in art. 306, um zu zwei Klassen von bin¨aren quadratischen Formen eine dritte zu finden, deren Periode, dh. Ordnung, gleich dem kgV der Perioden der gegebenen Klassen ist. Diese Artikel werden von Schering 1870 und Frobenius & Stickelberger 1879 zitiert, wobei jener art. 306 und diese art. 73 zitieren. Satz 5. Es sei M ein Modul u ¨ber dem Hauptidealbereich R, der gleichzeitig ein ZPE-Bereich sei, und m und n seien Torsionselemente von M . Ferner sei O(m) = aR und O(n) = bR. Definiert man A, B, B ∈ R durch b A := r a, ggT(a, b) B := r b,
und
sowie B := schließlich
B ggT(A,B) ,
a ggT(a, b)
so gibt es Elemente α und β ∈ R mit 1 = v :=
a Aβ
−
b B α.
Ist
b a m+ n A B
1 Die grammatisch masculinen Formen gelten als pauschale Bezeichnungen f¨ ur Damen und Herren. Dies die Fußnote des Briefes der Akademie der Wissenschaften und Literatur in Mainz vom 6. April 1999, in dem zu den Colloquia Academica 1999 eingeladen wurde. Sie findet sich mittlerweile auch in unseren Pr¨ ufungsordnungen.
168
Kapitel VIIII. Der abstrakte K¨ orperbegriff
und w := αm + βn, so ist Rm + Rn = Rv + Rw und O(v) = kgV(a, b)R = O(m) ∩ O(n). Beweis. Nach Kap. 2, Absch. 3, Satz 11 c) sind A und B teilerfremd, so dass es in der Tat Elemente α und β in R mit der verlangten Eigenschaft gibt. Auf Grund ihrer Definition liegen v und w in Rm + Rn, so dass Rv + Rw ⊆ Rm + Rn gilt. Andererseits ist βv −
b B w
= m und −αv +
a Aw
= n, so dass auch
Rm + Rn ⊆ Rv + Rw gilt. Also ist Rm + Rn = Rv + Rw. Es ist AB v = B am + Abn = 0 und folglich AB ∈ O(v). Es sei r ∈ O(v). Dann ist 0 = rv = r
b a m + r n. A B
Multiplikation mit B ergibt 0 = Br
a a m + rbn = B r m. A A
a ∈ O(m) = aR. Es gibt also ein g ∈ R mit Hieraus folgt B r A
Br
a = ga. A
Weil a = 0 ist, folgt weiter B r = gA und wegen der Teilerfremdheit von B und A schließlich r ≡ 0 mod A. Multipliziert man die Gleichung, von der wir ausgegangen sind, statt mit B mit A, so folgt r ≡ 0 mod A. Wegen der Teilerfremdheit von A und B gilt also r ≡ 0 mod AB . Damit ist gezeigt, dass O(v) = AB R ist. Nach Satz 11 von Abschnitt 3 des Kapitels 2 ist aber AB = kgV(a, b). Damit ist alles gezeigt.
7. Torsionsmoduln
169
Satz 6. Es sei R ein ZPE-Hauptidealbereich und M sei ein Modul u ¨ber R. Ist ann(M ) = {0}, so gibt es ein m ∈ M mit O(m) = ann(M ). Beweis. Weil ann(M ) = {0} ist, gibt es nur endlich viele Ideale oberhalb ann(M ), da R ja ein ZPE-Hauptidealbereich ist. Wegen ann(M ) ⊆ O(x) f¨ ur alle x ∈ M gibt es daher ein m ∈ M mit der Eigenschaft, dass aus m ∈ M und O(m ) ⊆ O(m) folgt, dass O(m ) = O(m) ist. Es sei nun y ∈ M . Nach Satz 5 gibt es ein z ∈ M mit O(z) = O(m) ∩ O(y). Auf Grund der Minimalit¨ at von O(m) ist wegen O(z) ⊆ O(m) dann O(z) = O(m). Es folgt O(m) ⊆ O(y). Daher gilt O(m) =
"
O(y) = ann(M ).
y∈M
Ist der Modul M durch ein endliches Erzeugendensystem gegeben, so kann man ein Verfahren angeben, um ein y zu berechnen, f¨ ur das O(y) = ann(M ) gilt. Satz 7. Es sei R ein ZPE-Hauptidealbereich und es sei e1 , . . . , en ein endliches Erzeugendensystem des Torsionsmoduls M u ¨ber R. Es gelte O(ei ) = ai R f¨ ur i := 1, . . . , n. Setze f1 := e1 . Es sei 1 ≤ s < n und es seien f1 , . . . , fs−1 , fs bereits definiert, so dass gilt: a) Es ist s−1
Rfi + Rfs =
i:=1
s
Rei .
i:=1
b) Es ist O(fs ) = kgV(a1 , . . . , as )R. Setze bs := kgV(a1 , . . . , as ) sowie A := r bs , und
Setze ferner B :=
as+1 ggT(bs , as+1 )
B := r as+1 , B ggT(A,B)
bs . ggT(bs , as+1 )
und bestimme α, β ∈ R mit 1=
b a β − α. A B
Schließlich werden fs und fs+1 durch
fs := αfs + βes+1
170
Kapitel VIIII. Der abstrakte K¨ orperbegriff
und := fs+1
a b fs + es+1 A B
definiert. Dann gilt: a ) Es ist s
Rfi + Rfs+1 =
i:=1
s+1
Rei .
i:=1
b ) Es ist O(fs+1 ) = kgV(a1 , . . . , as+1 )R. Insbesondere gilt, falls man fn := fn setzt, dass n i:=1
Rfi =
n
Rei
i:=1
und dass O(fn ) = ann(M ) ist. Beweis. Nach Satz 5 gilt Rfs + Res+1 = Rfs + Rfs+1
und
O(fs+1 ) = kgV(as+1 , bs ),
so dass b ) wegen der G¨ ultigkeit bs = kgV(a1 , . . . , as ) erf¨ ullt ist. Ferner gilt a ) wegen s+1 s−1 s Rei = Rfi + Rfs + Res+1 = Rfi + Rfs+1 . i:=1
i:=1
i:=1
Aus all dem folgt mittels Satz 3 auch noch die letzte Aussage. Der gerade bewiesene Satz besagt, dass man ein endliches Erzeugendensystem eines Torsionsmoduls u ¨ ber einem Hauptidealbereich, der gleichzeitig ein ZPEBereich ist, durch ein Erzeugendensystem ersetzen kann, das ebenso viele Elemente enth¨ alt, wie das urspr¨ ungliche, und das dar¨ uber hinaus ein Element enth¨ alt, dessen Ordnungsideal gleich dem Annihilatorideal des Moduls ist. Ist M der Modul und ist m dasjenige Element, f¨ ur das O(m) = ann(M ) gilt, so wird M/Rm von weniger Elementen erzeugt als M , so dass man Induktion machen kann. Im Falle, dass M ein Vektorraum u ¨ ber dem kommutativen K¨orper K ist, der verm¨oge eines Endomorphismusses σ zu einem K[x]-Modul gemacht wurde, wird das Kleinerwerden von Faktormoduln durch die Dimension kontrolliert, so dass man in diesem Falle nicht so viel zu rechnen braucht, wie es nach dem gerade bewiesenen Satz den Anschein hat. Dies werden wir nicht weiter verfolgen. Der an diesen Dingen interessierte Leser sei an L¨ uneburg 1987a und 1993a verwiesen. Wir erw¨ ahnten schon die Transitivit¨ at der Relation des Reinseins. Was darunter genau zu verstehen ist, sagt der n¨achste Satz.
7. Torsionsmoduln
171
Satz 8. Es sei M ein Modul u ¨ber dem Integrit¨ atsbereich R. Ist U ein reiner Teilmodul von M und V /U ein reiner Teilmodul von M/U , so ist V ein reiner Teilmodul von M . Beweis. Es sei m ∈ M und r ∈ R und es gelte rm ∈ V . Dann ist r(m + U ) = rm + U ∈ V /U, so dass es wegen der Reinheit von V /U in M/U ein v ∈ V gibt mit r(m + U ) = r(v + U ). Es folgt r(m − v) = rm − rv ∈ U . Weil U in M rein ist, gibt es ein u ∈ U mit r(m − v) = ru. Es folgt rm = r(v + u) und v + u ∈ V + U = V . Damit ist der Satz bewiesen. Satz 9. Es sei M ein Modul u ¨ber dem ZPE-Hauptidealbereich R und es gelte ann(M ) = {0}. Ist dann u ∈ M und gilt O(u) = ann(M ), so ist Ru rein in M . Beweis. Es sei r ∈ R und m ∈ M und es gelte rm ∈ Ru. Es gibt dann ein s ∈ R mit rm = su. Es sei ann(M ) = aR. Dann ist a = 0. Setze t := ggT(r, a). Dann ist t als Teiler von a ebenfalls ungleich 0. Es folgt a r a su = rm = a m = 0. t t t Also ist
a s ∈ O(u) = ann(M ) = aR. t
Es gibt demnach ein k ∈ R mit
a s = ak. t
Weil a = 0 ist, folgt weiter s = kt = kggT(r, a). Weil R euklidisch ist, gibt es α, β ∈ R mit t = ggT(r, a) = rα + aβ. Daher ist rm = su = ktu = k(rα + aβ)u = r(kαu) + kaβu = r(kαu). Wegen kαu ∈ Ru ist Ru daher rein.
172
Kapitel VIIII. Der abstrakte K¨ orperbegriff
Satz 10. Es sei M ein Modul u ¨ber dem ZPE-Hauptidealbereich R und i es gelte ann(M ) = {0}. Es seien e1 , . . . , es ∈ M . Setze U0 := {0} und Ui := j:=1 Rej . Es gelte ann(M/Ui−1 ) = O(ei ) = O(ei + Ui−1 ) f¨ ur i := 1, . . . , s. Dann gilt a) Ui ist rein in M f¨ ur i := 1, . . . s. s b) Es ist Us = i:=1 Rei . c) Ist O(ei ) = di R, so ist di ≡ 0 mod di+1 f¨ ur i := 1, . . . , s − 1. Beweis. Wegen ann(M/Ui−1 ) = O(ei + Ui−1 ) = O(ei ) = di R ist di M ⊆ Ui−1 ⊆ Ui , so dass di ∈ ann(M/Ui ) = di+1 R ist. Daher gilt c). F¨ ur s = 1 gilt b) trivialerweise. Ferner ist O(e1 ) = ann(M/U0 ) = ann(M ), so dass a) in diesem Falle auf Grund von Satz 9 gilt. Es sei s > 1 und der Satz gelte f¨ ur s − 1. Es ist O(es ) = ann(M/Us−1 ) = O(es + Us−1 ). Wegen Us /Us−1 = R(es + Us−1 ) und ann(M/Us−1 ) = O(es + Us−1 ) ist Us /Us−1 nach Satz 9 rein in M/Us−1 . Folglich ist Us nach Satz 8 rein in M . Damit ist a) bewiesen. Mit Satz 4 von Abschnitt 6 folgt schließlich, dass Us = Us−1 ⊕ Res ist. Damit ist auch b) bewiesen. Satz 11. Es sei M ein Modul u ¨ber dem ZPE-Hauptidealbereich R und s es gelte ann(M ) = {0}. Es seien e1 , . . . , es ∈ M . Setze U0 := {0} und Ui := j:=1 Rej . ur alle i := 1, Ferner sei y ∈ M und O(y + Us ) = aR. Dann ist a Teiler von di f¨ . . . , s. Ist ferner s ay = yi ei , i:=1
so ist a Teiler aller yi . Außerdem gilt mit u :=
s yi ei , a i:=1
dass O(y − u) = aR und Us + Ry = Us ⊕ R(y − u) ist.
7. Torsionsmoduln
173
Beweis. Es ist di y ∈ Ui−1 ⊆ Us . Daher ist di ∈ O(y + Us ) = aR, so dass a Teiler von di ist. Es folgt weiter di y =
s di di ay = yj ej . a a j:=1
Wegen di y ∈ Ui−1 und Us = Ui−1 ⊕ Rei ⊕ . . . ⊕ Res ist daher
di a yj ej
= 0 f¨ ur j := i, . . . , s. Insbesondere folgt di yi ∈ O(ei ) = di R. a
Weil di nicht null ist, folgt hieraus, dass yi durch a teilbar ist. Nun ist u=
s yi ei ∈ Us a i:=1
und ay = au. Daher folgt mit Satz 4 von Abschnitt 6 auch die letzte Behauptung. Satz 12. Es sei R ein ZPE-Hauptidealbereich und M sei ein Torsionsmodul u ¨ber R, der von f1 , . . . , fs , es+1 , . . . , en erzeugt werde. Setze U0 := {0} und Ui := i ur i := 1, . . . , s. Es gelte j:=1 Rfj f¨ ann(M/Ui−1 ) = O(fi ) = O(fi + Ui−1 ) f¨ ur i := 1, . . . , s. Dann wird M/Us von es+1 + Us , . . . , en + Us erzeugt. Nach Satz 7 gibt es dann Elemente gs+1 , . . . , gn ∈ M , so dass M/Us von gs+1 + Us , . . . , gn + Us erzeugt wird und u ¨berdies O(gs+1 + Us ) = ann(M/Us ) ist. Es sei ann(M/Us ) = ds+1 R und ds+1 gs+1 = Teiler von yi f¨ ur alle i := 1, . . . , s. Setze fs+1 := gs+1 −
s i:=1
s yi fi d i:=1 s+1
und Us+1 := Us + Rfs+1 .
yi fi . Nach Satz 11 ist ds+1
174
Kapitel VIIII. Der abstrakte K¨ orperbegriff
Dann gilt: a) Es ist Us+1 =
s+1 i:=1
Rfi .
b) Us+1 ist rein in M . c) M/Us+1 wird von gs+2 + Us+1 , . . . , gn + Us+1 erzeugt. Beweis. a) Es sind die Voraussetzungen der S¨ atze 10 und 11 sind erf¨ ullt, so dass s Us = i:=1 Rfi und Us+1 = Us ⊕ Rfs+1 ist. Folglich gilt a). b) folgt mittels Satz 10. c) ist banal. Satz 13. Es sei R ein ZPE-Hauptidealbereich und M sei ein endlich erzeugter Torsionsmodul u ¨ber R, der von {0} verschieden ist. Es gibt dann b1 , . . . , bt ∈ M mit den Eigenschaften: a) Es ist M =
t i:=1
Rbi .
b) Es ist O(bi ) = R f¨ ur i := 1, . . . , t. ur i := 1, . . . , t − 1. c) Ist O(bi ) = ai R, so ist ai ≡ 0 mod ai+1 f¨ Beweis. Dies folgt unmittelbar aus den S¨ atzen 10 und 12. Dies ist die Zerlegung, die Schering f¨ ur die Klassengruppe der bin¨ aren quadratischen Formen gegebener Diskriminante hergeleitet hat. Die bis auf Einheiten eindeutig bestimmten Elemente a1 , . . . at heißen Elementarteiler des Moduls M . Dass die Elementarteiler ein vollst¨andiges Invariantensystem bilden, werden wir gleich sehen. Dieser Frage ist Schering nicht nachgegangen. Seine Beweise sind im ¨ Ubrigen den unsrigen a¨hnlich und benutzen insbesondere nicht die spezielle Natur der Elemente der Klassengruppen und ihrer Komposition, so dass sie sich m¨ uhelos auf den vorliegenden Fall u ¨bertragen lassen. Dies ist also ein weiteres Beispiel impliziter Gruppentheorie. Der Name Elementarteiler stammt von Weierstraß, der ihn im Zusammenhang ¨ mit Ahnlichkeitsklassen von Matrizen u ¨ber C eingef¨ uhrt hat. Seine Elementarteiler sind jedoch die Elementarteiler — in unserem Sinne — der Prim¨ arkomponenten des C[x]-Moduls, den man mittels der zu studierenden Matrix erh¨ alt. Frobenius (1879) nennt sie einfache Elementarteiler und benutzt das Wort Elementarteiler ohne das Adjektiv einfach“ so wie wir. Weierstraß hat in seiner Arbeit das, was ” heute jordansche Normalform genannt wird. Dies zwei Jahre vor Jordan, der diese Normalform f¨ ur Matrizen u ¨ ber endlichen K¨ orpern beschrieben hat im Gegensatz zu Weierstraß, der sie f¨ ur Matrizen u ¨ ber C definierte (Weierstraß 1868, Jordan 1870). Satz 14. Es sei R ein ZPE-Hauptidealbereich und M und N seien endlich erzeugte s t Torsionsmoduln u ¨ber R. Ferner sei M = i:=1 Rbi und N = i:=1 Rci . Ist O(bi ) = ui R und O(ci ) = vi R, so dass u1 , . . . , us Elementarteiler von M und v1 , . . . , vt Elementarteiler von N sind, so sind M und N genau dann isomorph, wenn s = t ist und f¨ ur i := 1, . . . , s die Elemente ui und vi assoziiert sind.
7. Torsionsmoduln
175
ur alle i zu vi assoziiert. Dann ist Beweis. Es sei zun¨achst s = t und ui sei f¨ O(bi ) = ui R = vi R = O(ci ) f¨ ur i:= 1, . . . , s. Ist a ∈ M , so gibt es fi ∈ R mit a = s a = i:=1 gi bi , so ist s (fi − gi )bi . 0=
s i:=1
fi bi . Ist auch
i:=1
ur alle i. Es folgt weiter Hieraus folgt (fi − gi )bi = 0 f¨ fi − gi ∈ O(bi ) = O(ci ). Also ist auch
s
f i ci =
i:=1
s
g i ci .
i:=1
Daher wird durch ϕ(a) :=
s
f i ci
i:=1
eine Abbildung ϕ von M in N definiert, die offensichtlich ein Homomorphismus ist. Wegen s = t ist ϕ surjektiv. Ist 0 = ϕ(a) =
s
f i ci ,
i:=1
so ist fi ∈ O(ci ) = O(bi ) und daher fi bi = 0 f¨ ur alle i, so dass a = 0 ist. Daher ist ϕ auch injektiv. In diesem Falle gibt es also einen Isomorphismus von M auf N , z. B. ϕ. Es sei umgekehrt ein Isomorphismus ϕ von M auf N gegeben. Dann ist ϕ−1 ein Isomorphismus von N auf M und es gilt M=
t
Rϕ−1 (ci )
i:=1
und O(ϕ−1 (ci )) = vi R. Wir d¨ urfen und werden daher annehmen, dass M = N ist. Wegen us R = R ist us keine Einheit. Es gibt daher einen Primteiler p von us . Dieser teilt dann auch alle u ¨ brigen ui , weil die ui ja Elementarteiler sind. Wir s betrachten pM . Ist a ∈ pM , so gibt es ein b ∈ M mit a = pm. Es ist b = i:=1 fi bi und daher s a= fi pbi . i:=1
176
Kapitel VIIII. Der abstrakte K¨ orperbegriff
Somit ist pM ⊆
s i:=1
R(pbi ). Andererseits ist pM =
s
s i:=1
R(pbi ) ⊆ pM . Folglich ist
R(pbi ).
i:=1
Weil R Hauptidealbereich ist und weil p ein Primelement von R ist, ist K := R/pR ein K¨ orper. Ferner ist M/pM ein K-Modul, dh. ein K-Vektorraum. Die Elemente b1 + pM , . . . , bs + pM erzeugen M/pM . Wir zeigen, dass sie sogar eine Basis bilden. Dazu sei pM =
s
(fi + pR)(bi + pM ).
i:=1
Es gibt dann ein c ∈ M mit
Nun ist c =
s
i:=1 gi bi ,
s
fi bi = pc.
i:=1
so dass s
(fi − pgi )bi = 0
i:=1
ist. Es folgt wieder fi − pgi ∈ O(bi ) = ui R, so dass ui und damit p Teiler von fi − pgi ist. Somit ist p Teiler von fi . Also ist fi + pR = pR f¨ ur alle i, so dass die b1 + pM , . . . , bs + pM linear unabh¨ angig sind und folglich eine Basis von M/pM bilden. Also ist dimK (M/pM ) = s. Es sei α die gr¨ oßte nicht-negative ganze Zahl, f¨ ur die p Teiler von vα ist. Dann ur alle i ≤ α und kein Teiler von vi f¨ ur alle i > α. Es gibt daher ist p Teiler von vi f¨ Elemente qj ∈ R mit qj p ≡ 1 mod vj f¨ ur j := α + 1, . . . , t. Es folgt qj pcj = cj und damit cj ∈ pM f¨ ur alle j > α. Es folgt, dass die c1 + pM , . . . , cα + pM bereits M/pM erzeugen. Daher gilt t ≥ α ≥ dimK (M/pM ), so dass insbesondere t ≥ s gilt. Aus Symmetriegr¨ unden gilt dann auch s ≥ t, so dass s = t ist. Dann ist aber auch α = t, so dass p alle vi teilt.
7. Torsionsmoduln
177
Wie schon bewiesen gilt pM =
s
R(pbi ).
i:=1
Aus Symmetriegr¨ unden gilt dann aber auch pM =
s
R(pci ).
i:=1
Ferner gilt O(pbi ) = upi R und O(pci ) = vpi R. Ist δ(r) die Anzahl der Primteiler des von null verschiedenen Elementes r ∈ R, so ist
u1 us ··· δ p p Mittels Induktion folgt daher, dass auch ui zu vi assoziiert.
ui p
< δ(u1 · · · us ). zu
vi p
assoziiert ist. Da p = 0 ist, ist dann
Satz 15. Ist M ein endlich erzeugter Modul u ¨ber dem ZPE-Hauptidealbereich R und ist U ein reiner Teilmodul von M , so ist U direkter Summand von M . Beweis. Setze N := M/U . Dann ist auch N endlich erzeugt, so dass N = T (N ) ⊕ F mit einem freien Modul F endlichen Ranges ist. Es ist auch T (N ) endlich erzeugt, so dass auch T (N ) direkte Summe von endlich vielen zyklischer Moduln ist. Folglich ist N direkte Summe von endlich vielen zyklischen Moduln, so dass U direkter Summand ist. Ist M nicht endlich erzeugt, so gilt im Allgemeinen nicht mehr, dass reine Teilmoduln direkte Summanden sind. Beispiele, die dies belegen findet man in Kaplansky 1962, Aufg. 33, S. 32. Satz 16. Es sei M ein endlich erzeugter Torsionsmodul u ¨ber dem ZPE-Hauptidealbereich R. a) Ist U ein zu M isomorpher Teilmodul von M , so ist M = U . b) Ist U ein Teilmodul von M und sind M und M/U isomorph, so ist U = {0}. Beweis. — a) Es seien v1 , . . . , vt die Elementarteiler von M . Dann sind v1 , . . . , vt auch die Elementarteiler von U . Es gibt daher ein Element c1 ∈ U mit O(c1 ) = v1 R = ann(M ) = ann(U ). Nach Satz 9 ist Rc1 rein in M und auch in U und nach Satz 15 daher ein direkter Summand von M wie auch von U . Ist t = 1, so ist also U ein direkter Summand von M , so dass es ein C gibt mit M = U ⊕ C. Weil aber M und U die gleichen Elementarteiler haben, ist C = {0}. Es sei t > 1. Dann sind v2 , . . . , vt die Elementarteiler von M/Rc1 wie auch von U/Rc1 . Somit sind U/Rc1 und
178
Kapitel VIIII. Der abstrakte K¨ orperbegriff
M/Rc1 isomorph. Wegen U/Rc1 ⊆ M/Rc1 folgt durch Induktion nach t, dass U/Rc1 = M/Rc1 ist. Dann ist aber auch U = M . b) Es seien v1 , . . . , vt die Elementarteiler von M . Dann sind v1 , . . . , vt auch die Elementarteiler von M/U . Es gibt ein Element c1 ∈ M mit O(c1 + U ) = v1 R = ann(M ). Es folgt ann(M ) ⊆ O(c1 ) ⊆ O(c1 + U ) = ann(M ). Also ist O(c1 ) = O(c1 + U ). Hieraus folgt Rc1 ∩ U = {0}. Nach Satz 9 ist Rc1 rein in M und daher nach Satz 15 ein direkter Summand von M . Es ist aber auch (Rc1 + U )/U = R(c1 + U ) aus dem gleichen Grunde ein direkter Summand von M/U . Es gibt also einen Teilmodul C von M mit M/U = (Rc1 + U )/U ⊕ C/U. Es folgt M = Rc1 + U + C = Rc1 + C und (Rc1 + U ) ∩ C = U . Auf Grund des modularen Gesetzes gilt U = U + (Rc1 ∩ C) und daher Rc1 ∩ C ⊆ U ∩ Rc1 = {0}. Also ist M = Rc1 ⊕ C und U ⊆ C. Es folgt, dass C die Elementarteiler v2 , . . . , vt hat. Ebenso hat auch C/U die Elementarteiler v2 , . . . , vt . Nach Induktionsannahme ist daher U = {0}. Damit ist auch b) bewiesen. Diese S¨ atze sind der Situation angepasst, dass man ein endliches Erzeugendensystem eines Moduls M gegeben hat, von dem man a priori weiß, dass er ein Torsionsmodul ist, und von dem man außerdem annimmt, dass man die Ordnungsideale seiner Elemente berechnen kann. Dies ist z. B. dann der Fall, wenn man einen endlich-dimensionalen Vektorraum V u ¨ ber einem kommutativen K¨ orper K mittels eines σ ∈ EndK (V ) zu einem K[x]-Modul macht, wie oben beschrieben. ur i := 0, . . . , n nicht lineIst dann n¨ amlich v ∈ V , so k¨ onnen die Vektoren σ i (v) f¨ ar unabh¨ angig sein, wenn n die Dimension von V ist. Es gibt also ein k ∈ N mit k ≤ n, so dass die Vektoren σ i (v) f¨ ur i ≤ k − 1 linear unabh¨ angig sind, dass σ k (v) aber von den fr¨ uheren Vektoren abh¨angt. Dieses k zu finden ist ein Kinderspiel mit dem gaußschen Algorithmus. Der Algorithmus liefert gleichzeitig Elemente ri ∈ K mit k−1 σ k (v) = − ri σ i (v). i:=0
Dann ist O(v) = (xk +
k−1 i:=0
ri xi )K[x] = {0}.
7. Torsionsmoduln
179
Dies zeigt einerseits, dass V ein Torsionsmodul ist, und zum anderen, dass die Polynome, die Ordnungsideale erzeugen, einen Grad haben, der von der Dimension von V beschr¨ankt ist. Beginnt man nun mit einer Basis b1 , . . . , bn von V , so ist es ein Leichtes, die Ordnungsideale der bi zu berechnen sowie ein v ∈ V mit O(v) = ann(V ) = O(b1 ) ∩ . . . ∩ O(bn ) = μK[x]. Dieses μ, man nehme das mit Leitkoeffizient 1, ist das Minimalpolynom von σ. Da es das Ordnungsideal von v erzeugt, folgt sofort, dass der Grad von μ h¨ ochstens gleich n ist. Das Minimalpolynom ist also einer der Elementarteiler. Das Produkt aller Elementarteiler ist das charakteristische Polynom von σ. F¨ ur Einzelheiten sei der Leser auf L¨ uneburg 1987a, wo der Algorithmus zum ersten Male vorgestellt wurde, oder auf L¨ uneburg 1993a verwiesen. Behandelt man die rationale Normalform von Endomorphismen von Vektorr¨ aumen, wie gerade angedeutet, bevor man von Eigenwerten und Eigenvektoren redet, und definiert man dann, dass v Eigenvektor zum Eigenwert λ heißt, wenn O(v) = (x − λ)K[x] ist — ich habe das zweimal in Vorlesungen u ¨ ber lineare Algebra getan —, so bekommt man alle S¨atze u ¨ ber Eigenwerte und Eigenvektoren geschenkt. Es spart Zeit und macht manches viel klarer (L¨ uneburg 1993a). Hat man einen beliebigen endlich erzeugten Modul M u ¨ ber einem ZPE-Hauptidealbereich R, so stellt man sich vor, dass man Erzeugende e1 , . . . , en gegeben hat, sowie eine (m × n)-Matrix a, so dass n
aij ej = 0
j:=1 n
gilt f¨ ur i := 1, . . . , m. Ist nun F := i:=1 Rbi ein freier Modul vom Rang n u ¨ ber R, so gibt es einen Epimorphismus π von F auf M mit π(bj ) = ej f¨ ur j := 1, . . . , n. Die Vektoren n aij bj vi := j:=1
mit i := 1 . . . , m liegen dann alle im Kern von π. Man stellt sich nun vor, dass alle außer den explizit genannten noch existierenden Relationen zwischen Elementen von M Folgerelationen sind, dass also Kern(π) =
m
Rvi
i:=1
gilt. Dann hat man in dieser Situation den Satz, der unter dem Namen smithsche ” Normalform von Matrizen“ bekannt ist, da sein Beweis u ¨ber die Manipulation von a mittels unimodularer Matrizen verl¨ auft. Die folgende Formulierung kaschiert dieses Manipulieren von Matrizen v¨ ollig.
180
Kapitel VIIII. Der abstrakte K¨ orperbegriff
Es sei R ein ZPE-Hauptidealbereich und b1 , . . . , bn sei eine Basis des freien RModuls F . Ferner seien v1 , . . . , vm Elemente von F und es gelte vi =
n
aij bj .
j:=1
Es gibt dann eine Basis B1 , . . . , Bn von F und Elemente d1 , . . . , dn ∈ R mit ur i := 1, . . . , n − 1. a) Es ist di+1 ≡ 0 mod di f¨ m n b) Es ist i:=1 Rvi = i:=1 R(di Bi ). onnen einige gleich null sein. Ist di gleich null, so auch di+1 und Von den di ’s k¨ dann alle weiteren mit einem Index oberhalb i. Dieser Fall tritt ein, wenn M kein Torsionsmodul ist. Die di heißen wieder Elementarteiler und stimmen im Torsionsfall mit obigen Elementarteilern u ¨ berein, nur dass sie in umgekehrter Reihenfolge nummeriert sind. Wie man die Bi und di anhand der gegebenen Daten unter Benutzung von Algorithmus r berechnen kann, findet man in L¨ uneburg 1988. Auf die Funktion r kam ich, wie schon fr¨ uher erw¨ahnt, durch das Studium der Arbeit Helmer 1943, in der der entsprechende Satz f¨ ur B´ezoutbereiche bewiesen wird, die eine Funktion r gestatten. Was Helmer dort macht, habe ich der Rechenpraxis zug¨ anglich gemacht. Das Original dieses Satzes stammt von Smith 1861, der ihn f¨ ur Matrizen u ¨ ber Z formuliert. Das Manipulieren von Matrizen ist bei ihm voll entwickelt. Ihm geht es darum, Gleichungssysteme mit ganzzahligen Koeffizienten ganzzahlig zu l¨ osen. Darum geht es auch Frobenius (1879). Zu Beginn dieser Arbeit schreibt er, dass er erst nach ihrer Fertigstellung die Arbeit von Smith zu Gesicht bekommen h¨ atte. Frobenius macht auch klar, dass seine Methoden sich auf Matrizen u ¨bertragen ließen, deren Koeffizienten Polynome seien und dass man auf diese Weise zu den weierstraßschen Ergebnissen gelange. Dabei sind die weierstraßschen Ergebnisse ¨ die u ¨ ber die Ahnlichkeitsklassen von Matrizen u ¨ber C, die er, wie wir heute sagen, mittels ihrer jordanschen Normalform klassifiziert. Also auch hier: Implizite Modultheorie. Wer machte dann den Schritt, statt der vielen Sonderf¨ alle allgemein Moduln u ¨ber Hauptidealbereichen zu betrachten? Ich weiß es nicht. 8. Der duale Modul. Permutationen wurden schon fr¨ uh durch ihre Hintereinanderausf¨ uhrung miteinander verkn¨ upft (Ruffini 1799 (s. Wußing 1984, S. 81f.)), wodurch man die symmetrische Gruppe erhielt. Dennoch erscheint es mir ein weiterer Abstraktionsschritt zu sein, Abbildungen endlicher abelscher Gruppen in die multiplikative Gruppe von C dadurch zu verkn¨ upfen, dass man sie punktweise miteinander multipliziert. Dies findet sich, wenn auch nicht w¨ ortlich so, in Weber 1882 und 1899, S. 49ff. Ob die zu einer endlichen abelschen Gruppe duale Gruppe schon in der ersten Auflage von Webers Algebra“ studiert wurde, weiß ich nicht, ” ich denke aber, dass ja. Hat man eine endliche abelsche Gruppe A und ist χ ein Homomorphismus von A in C∗ , ein Charakter , wie Weber einen solchen Homomorphismus nennt, so folgt
8. Der duale Modul
181
mit an = 1, dass χ(a)n = χ(an ) = χ(1) = 1 ist. Somit liegt das Bild von A unter χ in der Gruppe der |A|-ten Einheitswurzeln. Die Gruppe aller Einheitswurzeln ist aber isomorph zur Gruppe Q/Z. Daher kann man die Situation verallgemeinern, wie wir gleich sehen werden, wobei ich der Frage nicht nachgegangen bin, wo und ob sich diese Verallgemeinerung in der Literatur findet. Sie ist so naheliegend. Was man ohne Schwierigkeit in der Literatur findet, ist die folgende Definition des dualen Moduls eines R-Linksmoduls M , der ja auch abelsche Gruppe ist, n¨ amlich M ∗ := HomZ (M, Q/Z), wobei M ∗ durch die Vorschrift (f r)m = f (rm) zu einem R-Rechtsmodul wird. N¨ aheres hierzu findet der Leser etwa in Lambek 1966, S. 89f. Im Folgenden ben¨ otigen wir, dass der Quotientenk¨ orper Q eines Hauptidealbereiches R als Modul u ¨ ber R lokal zyklisch ist, dh., dass jeder endlich erzeugte ¨ Teilmodul von Q zyklisch ist. Dies gilt im Ubrigen immer dann, wenn Q der Quotientenk¨ orper eines Integrit¨atsbereiches R ist, in dem jedes endlich erzeugte Ideal Hauptideal ist. Es gibt Ringe, die diese Eigenschaft haben, ohne Hauptidealbereiche zu sein, z. B. der Ring aller u ¨ ber Z ganzen algebraischen Zahlen (s. etwa Kaplansky 1970). Ringe, die diese Eigenschaft haben, heißen B´ezoutbereiche. Wer sie so nannte und warum, weiß ich nicht. Keiner der von mir befragten Experten wusste es. Sind a, b ∈ R und ist R ein B´ezoutbereich, so haben a und b einen gr¨ oßten gemeinsamen Teiler und es gibt Elemente r, s ∈ R mit ggT(a, b) = ra + sb. Es gibt ja ein Element g ∈ R mit gR = aR + bR, da aR + bR nach Voraussetzung ein Hauptideal ist. Offenbar ist g ein gr¨ oßter gemeinsamer Teiler von a und b, der sich aus a und b linear kombinieren l¨ asst. Da die gr¨oßten gemeinsamen Teiler von a und b alle assoziert sind, lassen sie sich alle linear aus a und b kombinieren. B´ezoutbereiche sind also ggT-Bereiche. Es gilt demnach f¨ ur a, b ∈ R, so sie nicht beide null sind, b a , = 1. ggT ggT(a, b) ggT(a, b) Daher kann man sich die Darstellung eines Elementes aus dem Quotientenk¨ orper eines B´ezoutbereiches stets gek¨ urzt vorstellen, wenn dies bequem erscheint. Der folgende Satz findet sich in L¨ uneburg 1976. Der Fall, dass R der Ring der ganzen Zahlen ist, wird in Hasse 1969 abgehandelt. Hasse benutzt f¨ ur seine Beweise, dass Z ein ZPE-Ring ist. Dies versagt im Falle der B´ezoutbereiche. Satz 1. Es sei R ein B´ezoutbereich und Q sei sein Quotientenk¨ orper. Sind a, b ∈ Q, sind ferner u, v, x, y ∈ R und gilt a = ux sowie b = yv und ggT(x, u) = 1 = ggT(y, v), so ist ggT(x, y)ggT(u, v) . Ra + Rb = R · uv
182
Kapitel VIIII. Der abstrakte K¨ orperbegriff
Beweis. Ist a = 0, so ist x = 0 und wegen ggT(x, u) = 1 ist u eine Einheit. Wir d¨ urfen daher u = 1 annehmen. Es folgt ggT(0, y)ggT(1, v) y ggT(x, y)ggT(u, v) = = = b. uv v v Wegen Ra + Rb = Rb gilt die Behauptung in diesem Falle. Genauso schließt man, wenn b = 0 ist. Wir d¨ urfen daher annehmen, dass a und b beide nicht null sind. Wir setzen ggT(x, y)ggT(u, v) g := uv und xv m := ggT(x, y)ggT(u, v) sowie n :=
yu . ggT(x, y)ggT(u, v)
Dann sind m, n ∈ R und es gilt mg =
x u
= a und ng =
y v
= b. Hieraus folgt
aR + bR ⊆ gR. Weil R ein ggT-Bereich ist, gilt, wie schon bemerkt, ggT
x y , ggT(x, y) ggT(x, y)
= 1.
Aus ggT(x, u) = 1 folgt trivialerweise ggT
x u , ggT(x, y) ggT(u, v)
= 1.
Mit Satz 1 c) von Abschnitt 1 des Kapitels 7 folgt weiter ggT Ebenso folgt
ggT
x ,n ggT(x, y) v ,n ggT(u, v)
= 1. = 1.
Mit Satz 1 c) von Abschnitt 1 des Kapitels 7 folgt dann schließlich ggT(m, n) = 1. Es gibt also m , n ∈ R mit mm + nn = 1. Es folgt g = gmm + gnn = am + bn ∈ Ra + Rb,
8. Der duale Modul
183
so dass Rg ⊆ Ra + Rb ist. Folglich ist Rg = Ra + Rb, wie behauptet. Korollar. Endlich erzeugte Teilmoduln des R-Moduls Q sind zyklisch. Dies folgt mit Induktion aus Satz 1. Da Hauptidealbereiche stets B´ezoutbereiche sind, gilt Satz 1 insbesondere auch f¨ ur Hauptidealbereiche. Ist R ein solcher und ist Q sein Quotientenk¨ orper, so ist Q ein torsionsfreier R-Modul, dessen s¨amtliche endlich erzeugten Teilmoduln zyklisch sind. Es folgt, dass Q nicht frei ist. Als freier Modul m¨ usste er n¨ amlich zyklisch sein, was offensichtlich nicht der Fall ist. Dies zeigt, dass man in Satz 7 von Abschnitt 6 auf das Endlich-erzeugt-sein von M nicht verzichten kann. Es sei R ein Integrit¨atsbereich und Q sei sein Quotientenk¨orper. Wir setzen W := Q/R, wobei Q bzw. R als Moduln u ¨ber R aufzufassen sind. Dann ist W ein Torsionsmodul, da f¨ ur ab ∈ Q ja a
b +R a
=b+R =R
ist. Satz 2. Es sei R ein ZPE-Hauptidealbereich und Q sei sein Quotientenk¨ orper. Ist W := Q/R, so sind die endlich erzeugten Teilmoduln von W zyklisch. Ist 0 = a ∈ R, so gibt es genau einen zyklischen Teilmodul U von W mit ann(U ) = aR. Beweis. Weil W epimorphes Bild von Q ist, folgt mit Satz 1, dass alle endlich erzeugten Teilmoduln von W zyklisch sind. Es sei 0 = a ∈ R. Dann ist 1 +R = aR, ann R · a so dass die Existenz von U sichergestellt ist. Es sei V ein zweiter zyklischer Teilmodul von W mit ann(V ) = aR. Es gibt dann ein erzeugendes Element u von U und ein erzeugendes Element v von V . Es folgt, dass Ru + Rv endlich erzeugt und damit zyklisch ist. Es sei Ru + Rv = Rw. Dann ist ann(Rw) = O(w) = bR mit einem b ∈ R. Weil W ein Torsionsmodul ist, ist b = 0. Es folgt bR = O(w) = ann(Rw) = O(u) ∩ O(v) = aR ∩ aR = aR. Nach Satz 9 von Abschnitt 6 ist Ru rein in Rw und folglich nach Satz 15 des gleichen Abschnitts ein direkter Summand. Es sei C ein Komplement von Ru in W . Dann ist also Rw = Ru ⊕ C. Der einzige Elementarteiler von Rw ist O(w). Folglich ist C = {0} nach Satz 14, da ja O(u) = O(w) ist. Es folgt Rw = Ru und damit Rv ⊆ Ru. Spielt man das
184
Kapitel VIIII. Der abstrakte K¨ orperbegriff
gleiche Spiel statt mit u mit v, so folgt Ru ⊆ Rv und damit Ru = Rv. Damit ist die Einzigkeit von U gezeigt und der Satz komplett bewiesen. Ist nun M ein Torsionsmodul u ¨ ber R, so setzen wir M ∗ := HomR (M, W ). Sind f , g ∈ M ∗ und ist r ∈ R, so definieren wir f + g und rf durch (f + g)(m) := f (m) + g(m) und (rf )(m) := rf (m) f¨ ur alle m ∈ M . Um nachzuweisen, dass rf ∈ M ∗ gilt, ben¨ otigt man die Kommutativit¨ at von R. Ich tue also hier das, was ich bei vielen Autoren von B¨ uchern zur linearen Algebra so heftig kritisiere, dass sie n¨ amlich lineare Algebra nur u ¨ber kommutativen K¨ orper betreiben und dabei so tun, als ginge u ¨ber nicht-kommutativen K¨ orpern alles genauso. Dies ist aber nicht der Fall, was ich im Einzelnen hier nicht noch einmal belegen m¨ochte. Ich m¨ochte nur betonen, dass man den dualen Raum eines Linksvektorraumes auf nat¨ urliche Weise nur zu einem Rechtsvektorraum machen kann und zu einem Linksvektorraum nur dann, wenn der zu Grunde liegende K¨orper einen Antiautomorphismus gestattet. Bei kommutativen K¨ orpern ist aber die Identit¨ at ein solcher. Hat der zu Grunde gelegte K¨ orper keinen Antiautomorphismus, so sind die Unterraumverb¨ ande von V und V ∗ nicht isomorph, wie man in der projektiven Geometrie lernt. Daher kann man aus V ∗ keinen Linksvektorraum machen (Baer 1952). Mit den soeben definierten Verkn¨ upfungen ist M ∗ ein R-Modul, der zu M duale Modul . Es gilt nun Satz 3. Ist M ein endlich erzeugter Torsionsmodul u ¨ber dem ZPE-Hauptidealbereich R, so sind M und M ∗ isomorph. Beweis. Der Modul M ist die direkte Summe von zyklischen Moduln Rc1 , . . . , Rct , so dass f¨ ur die Ordnungsideale O(ci ) = ni R gilt, dass ni+1 Teiler von ni ist. F¨ ur i := 1, . . . , t setzen wir 1 γi := + R. ni t Dann gilt auch O(γi ) = ni R = O(ci ). Ist nun m = i:=1 ri ci ∈ M , so setzen wir χj (m) := rj γj . t
ur Gilt auch m = i:=1 si ci , so ist si − ri ∈ O(ci ) = O(γi ) und folglich si γi = ri γi f¨ alle i, so dass χj wohldefiniert ist. Es ist χi ∈ M ∗ . Außerdem gilt O(χj ) = nj R. t Ist nun y = i:=1 si ci ∈ M , so setzen wir y σ :=
t i:=1
s i χi .
8. Der duale Modul
185
Wegen O(χi ) = O(ci ) ist σ wohldefiniert. Ferner ist klar, dass (y + z)σ = y σ + z σ und (ry)σ = ry σ ist. Es sei y σ = 0. Dann ist 0=
t
s i χi .
i:=1
Hiermit folgt 0=
t
si χi (cj ) = sj γj
i:=1
und weiter sj ∈ O(γj ) = O(cj ) f¨ ur j := 1, . . . , t. Also ist y = 0, so dass σ injektiv ist. Es sei χ ∈ M ∗ . Dann ist ni χ(ci ) = χ(ni ci ) = 0. Nach Satz 2 liegt χ(ci ) daher in Rγi . Es gibt also ein ri ∈ R mit χ(ci ) = ri γi . Setze y :=
t
ri ci .
i:=1
Dann ist y σ (cj ) =
t
ri χi (cj ) = rj χj (cj ) = rj γj = χ(cj )
i:=1
f¨ ur alle j und folglich y σ = χ. Somit ist σ auch surjektiv. Damit ist der Satz bewiesen. Betrachtet man nun den bidualen Modul M ∗∗ von M , dh., den zu M ∗ dualen Modul, so ist dieser nat¨ urlich ebenfalls zu M isomorph. In diesem Fall gibt es aber einen Isomorphismus, dessen Definition basisunabh¨ angig ist, wie der n¨ achste Satz zeigt. Satz 4. Es sei M ein endlich erzeugter Torsionsmodul u ¨ber dem ZPE-Hauptidealbereich R. F¨ ur m ∈ M definieren wir die Abbildung mτ von M ∗ in W durch mτ (χ) := χ(m). Dann ist τ ein Isomorphismus von M auf M ∗∗ . Beweis. Es ist mτ (χ + ψ) = (χ + ψ)(m) = χ(m) + ψ(m) = mτ (χ) + mτ (ψ) und mτ (rχ) = (rχ)(m) = r(χ(m)) = rmτ (χ),
186
Kapitel VIIII. Der abstrakte K¨ orperbegriff
so dass mτ ein Homomorphismus von M ∗ in W ist. Es ist (m + n)τ (χ) = χ(m + n) = χ(m) + χ(n) = mτ (χ) + nτ (χ) = (mτ + nτ )(χ) und folglich (m + n)τ = mτ + nτ . Weiter gilt (rm)τ (χ) = χ(rm) = rχ(m) = rmτ (χ) und damit (rm)τ = rmτ . Dies zeigt, dass τ ein Homomorphismus von M in M ∗∗ ist. τ Es sei m ∈ M und t m = 0. Mit den Bezeichnungen des Beweises von Satz 3 gilt zun¨ achst m = i:=1 ri ci und damit τ
0 = m (χj ) = χj (m) =
t
ri χj (ci ) = rj γj .
i:=1
ur alle j und damit m = 0, so dass τ injektiv ist. Also ist rj ∈ O(γj ) = O(cj ) f¨ Es sei f ∈ M ∗∗ und f (χi ) = yi γi . Solche yi gibt es nach Satz 2, da ja O(χi ) = O(γi ) ist. Setze t y i ci . y := i:=1
Dann ist y τ (χj ) =
t
yi χj (ci ) = yj γj = f (χj )
i:=1
f¨ ur alle j. Es folgt y τ = f , so dass τ auch surjektiv ist. Damit ist der Satz bewiesen. Es sei M ein endlich erzeugter Torsionsmodul u ¨ ber dem ZPE-Hauptidealbereich R. Ist U ein Teilmodul von M , so setzen wir U ⊥ := {χ | χ ∈ M ∗ , U ⊆ Kern(χ)}. Dann ist U ⊥ ein Teilmodul von M ∗ . Ist V ein Teilmodul von M ∗ , so setzen wir " Kern(χ). V := χ∈V
Es gilt Satz 5. Ist M ein endlich erzeugter Torsionsmodul u ¨ber dem ZPE-Hauptidealbereich R, so gilt: a) Sind U und V Teilmoduln von M und ist U ⊆ V , so ist V ⊥ ⊆ U ⊥ . b) Sind U und V Teilmoduln von M ∗ und ist U ⊆ V , so ist V ⊆ U .
8. Der duale Modul
187
c) Ist U Teilmodul von M , so ist U ⊆ U ⊥ . d) Ist U Teilmodul von M ∗ , so ist U ⊆ U ⊥ . e) Es ist ⊥ = ⊥⊥ und = ⊥. Beweis. a) Es sei χ ∈ V ⊥ . Dann ist U ⊆ V ⊆ Kern(χ) und folglich χ ∈ U ⊥ . Dies beweist a). b) Wegen U ⊆ V gilt " " Kern(χ) ⊆ Kern(χ) = U . V = χ∈V
c) Es ist U⊆
χ∈U
"
Kern(χ) = U ⊥ .
χ∈U ⊥
d) Es ist
U ⊆ Kern(χ)
f¨ ur alle χ ∈ U . Daher gilt d). e) Es sei U Teilmodul von M . Dann ist U ⊆ U ⊥ nach c). Mit a) folgt U ⊥ ⊇ U (⊥ )⊥ . Weil U ⊥ Teilmodul von M ∗ ist, folgt mit b) U ⊥ ⊆ U ⊥( ⊥) . Weil aber (⊥)⊥ = ⊥(⊥) ist, folgt U ⊥ = U ⊥ ⊥ und damit die erste Behauptung von e). Die zweite beweist sich entsprechend. Satz 6. Ist M ein endlich erzeugter Torsionsmodul u ¨ber dem ZPE-Hauptidealbereich R, ist U ein Teilmodul von M und definiert man f¨ ur χ ∈ U ⊥ die Abbildung σ χ durch χσ (a + U ) := χ(a), so ist σ ein Isomorphismus von U ⊥ auf (M/U )∗ . Beweis. Ist χ ∈ U ⊥ und ist a + U = b + U , so gibt es ein u ∈ U mit a = b + u. Es folgt χ(a) = χ(b + u) = χ(b) + χ(u) = χ(b). Folglich ist χσ wohl definiert. Dass σ ein Homomorphismus von U ⊥ in (M/U )∗ ist, ist schnell nachgerechnet. Ist χσ = 0, so ist χ(m) = 0 f¨ ur alle m ∈ M und daher χ = 0, so dass σ injektiv ist. Ist schließlich α ∈ (M/U )∗ und definiert man χ durch χ(m) := α(m + U ), so ist χ ∈ U ⊥ und χσ = α. Somit ist σ auch surjektiv und damit ein Isomorphismus von U ⊥ auf (M/U )∗ . Satz 7. Ist M ein endlich erzeugter Torsionsmodul u ¨ber dem ZPE-Hauptidealbereich R und ist U Teilmodul von M , so ist U = U ⊥ .
188
Kapitel VIIII. Der abstrakte K¨ orperbegriff
Beweis. Nach Satz 5 c) gilt U ⊆ U ⊥ . Nach Satz 6 sind U ⊥ und (M/U )∗ isomorph. Nach dem gleichen Satz sind auch U (⊥ )⊥ und (M/U ⊥ )∗ isomorph. Nach Satz 5 e) ist aber U ⊥ ⊥ = U ⊥ , so dass (M/U )∗ und (M/U ⊥ )∗ isomorph sind. Mit Satz 3 folgt die Isomorphie von M/U und M/U ⊥ . Mit Hilfe des 2. Isomorphiesatzes folgt, dass M/U ⊥ und (M/U )/(U ⊥ /U ) isomorph sind. Daher sind auch M/U und (M/U )/(U ⊥ /U ) isomorph. Mit Satz 16 b) des letzten Abschnittes folgt hieraus U ⊥ = U , was zu beweisen war. Satz 8. Ist M ein endlich erzeugter Torsionsmodul u ¨ber dem ZPE-Hauptidealbereich R und ist V ein Teilmodul von M ∗ und definiert man aρ f¨ ur a ∈ V
durch aρ (χ + V ) := χ(a) f¨ ur alle χ ∈ M ∗ , so ist ρ ein Isomorphismus von V auf (M ∗ /V )∗ . Beweis. Ist χ + V = χ + V , so ist χ − χ ∈ V und daher (χ − χ )(a) = 0. Es folgt χ(a) = χ (a), so dass aρ wohldefiniert ist. Wie immer zeigen nun Routinerechnungen, dass ρ ein Homomorphismus von V in (M ∗ /V )∗ ist. Es sei aρ = 0. Dann ist, wenn τ den Isomorphismus von M auf M ∗∗ aus Satz 4 bezeichnet, 0 = aρ (χ + V ) = χ(a) = aτ (χ) f¨ ur alle χ ∈ M ∗ . Also ist aτ = 0 und damit a = 0. Somit ist ρ injektiv. Um zu zeigen, dass ρ auch surjektiv ist, sei f ∈ (M ∗ /V )∗ . Dann definieren wir λ ∈ M ∗∗ durch die Vorschrift λ(χ) := f (χ + V ). Weil τ ein Isomorphismus von M auf M ∗∗ ist, gibt es ein a ∈ M mit aτ = λ. Es folgt aρ (χ + V ) = χ(a) = aτ (χ) = λ(χ) = f (χ + V ) f¨ ur alle χ ∈ M ∗ . Also ist aρ = f , so dass ρ auch surjektiv ist. Damit ist der Satz bewiesen. Satz 9 folgt nun mit Hilfe von Satz 8 wie Satz 7 mit Satz 6. Satz 9. Ist M ein endlich erzeugter Torsionsmodul u ¨ber dem ZPE-Hauptidealbereich R und ist V Teilmodul von M ∗ , so ist V = V ⊥ . Beweis. Es ist V ⊆ V ⊥ . Nach Satz 8 sind V und (M ∗ /V )∗ isomorph. Mit Satz 3 folgt, dass V zu M ∗ /V isomorph ist. Ersetzt man in diesem Argument V durch V ⊥ , so sieht man, dass auch V ⊥ und M ∗ /V ⊥ isomorph sind. Nach Satz 5 e) ist aber V = V ⊥ . Daher sind M ∗ /V und M ∗ /V ⊥ isomorph, so dass wegen V ⊆ V ⊥ mittels Satz 16 b) von Abschnitt 7 die Gleichheit von V und V ⊥ folgt. Korollar. Ist M ein endlich erzeugter Torsionsmodul u ¨ber dem ZPE-Hauptidealbereich R, so ist ⊥ eine Bijektion der Menge der Teilmoduln von M auf die uberhinaus gilt, dass ⊥ Menge der Teilmoduln von M ∗ und es gilt ⊥−1 = . Dar¨
9. Endliche abelsche Gruppen sind galoissche Gruppen
189
eine Dualit¨ at ist, das heißt, dass f¨ ur Teilmoduln U und V von M genau dann U ⊆ V gilt, wenn V ⊥ ⊆ U ⊥ ist. Satz 10. Es sei M ein endlich erzeugter Torsionsmodul u ¨ber dem ZPE-Hauptidealbereich R. Ist U ein Teilmodul von M , so gibt es einen Teilmodul D von M , so dass M/D zu U isomorph ist. alt M ∗ einen Teilmodul Beweis. Nach Satz 3 sind M und M ∗ isomorph. Also enth¨ X, der zu U isomorph ist. Wegen der Surjektivit¨ at von ⊥, gibt es einen Teilmodul D von M mit D⊥ = X, so dass D⊥ zu U isomorph ist. Nach Satz 6 ist D⊥ zu (M/D)∗ und nach Satz 3 dann auch zu M/D isomorph. Also ist auch U zu M/D isomorph. 9. Endliche abelsche Gruppen sind galoissche Gruppen. Als Frobenius und Stickelberger im Jahre 1879 ihre Arbeit publizierten, gab es noch nicht die abstrakte Definition einer Gruppe, die erst Weber im Jahre 1893 gab. F¨ ur Frobenius und Stickelberger war der Begriff der endlichen abelsche Gruppe, wie oben schon erw¨ahnt, gleichbedeutend mit Untergruppe der Einheitengruppe des Ringes Z/nZ. F¨ ur sie war also die Existenz einer endlichen abelschen Gruppe mit gegebenen Elementarteilern nicht so einfach zu zeigen wie f¨ ur uns, die wir einfach mit den entsprechenden zyklischen Gruppen bzw. Moduln die a¨ußere direkte Summe bilden, um das gew¨ unschte Ziel zu erreichen. Sie mussten vielmehr noch zeigen, dass es zu gegebenen Invarianten stets auch ein n gibt und eine Untergruppe der Einheitengruppe von Z/nZ, die die gegebenen Invarianten hat. Um dies zu beweisen, benutzten sie, wie schon gesagt, den Satz von Dirichlet u ¨ ber Primzahlen in arithmetischen Reihen. Wie auch schon gesagt, braucht man nicht die volle Aussage des dirichletschen Satzes, sondern nur, dass es in arithmetischen Reihen der Form {1 + qn | n ∈ N0 } stets unendlich viele Primzahlen gibt. Dies zu beweisen ist viel einfacher. Einen Beweis dieser Tatsache, der sich des Satzes von Zsigmondy bediente, haben wir oben gesehen. Die Existenzaussage von Frobenius und Stickelberger ist einmal f¨ ur sich gesehen schon hoch interessant und wird zum anderen ben¨ otigt, um zu zeigen, dass es zu jeder endlichen abelschen Gruppe eine Erweiterung L von Q gibt, so dass die Automorphismengruppe des K¨ orpers L zur gegebenen Gruppe isomorph ist. Satz 1. Es sei A eine endliche abelsche Gruppe. Es gibt dann eine nat¨ urliche Zahl n, so dass A zu einer Untergruppe der Einheitengruppe von Z/nZ isomorph ist. Beweis. Indem wir das, was wir f¨ ur Moduln gemacht haben, nun f¨ ur die multiplikativ geschriebene Gruppe A interpretieren, finden wir zyklische Untergruppen C1 , . . . , Ct von A, so dass A = C1 × . . . × Ct ist und u ¨ berdies |Ci | ≡ 0 mod |Ci+1 | gilt f¨ ur i := 1, . . . , t − 1. Nach Satz 3 von Abschnitt 4 gibt es Primzahlen p1 , . . . , pt mit pi ≡ 1 mod |A| f¨ ur alle i. Weil |Ci | Teiler von |A| ist, gilt pi − 1 ≡ 0 mod |Ci |
190
Kapitel VIIII. Der abstrakte K¨ orperbegriff
f¨ ur i := 1, . . . , t. Setze n := ti:=1 pi . Weil die pi paarweise teilerfremd sind, t gilt nach dem chinesischen Restsatz, dass Z/nZ und i:=1 Z/pi Z isomorph sind. Bezeichnet man mit G(R) die Einheitengruppe des Ringes R, so folgt G(Z/nZ) ∼ = G(Z/p1 Z) × . . . × G(Z/pt Z). Weil pi Primzahl ist, ist G(Z/pi Z) eine zyklische Gruppe der Ordnung pi − 1. Weil |Ci | Teiler von pi − 1 ist, gibt es eine Untergruppe Di von G(Z/pi Z) mit |Di | = |Ci |, so dass Di und Ci isomorph sind. Dann ist aber D1 × . . . × Dt eine zu A = C1 × . . . × Ct isomorphe Untergruppe von G(Z/p1 Z) × . . . × G(Z/pt Z). Folglich enth¨ alt auch G(Z/nZ) eine zu A isomorphe Untergruppe. Nun sind wir in der Lage, den schon angek¨ undigten Satz u ¨ber endliche abelsche Gruppen als Automorphismengruppen endlicher Erweiterungen von Q zu beweisen. Dieser Satz findet sich in Webers Lehrbuch der Algebra (Weber 1899, S. 86 ff.). Ob er schon vorher bekannt war, weiß ich nicht. Satz 2. Ist A eine endliche abelsche Gruppe, so gibt es eine Erweiterung L von Q mit [L : Q] = |A|, so dass A die Automorphismengruppe von L ist. Beweis. Nach Satz 1 gibt es eine nat¨ urliche Zahl n, so dass A zu einer Untergruppe der Einheitengruppe E von Z/nZ isomorph ist. Nach Satz 5 von Abschnitt 3 ist E isomorph zur Automorphismengruppe G des n-ten Kreisteilungsk¨ orpers alt auch diese Gruppe eine zu A isomorphe Untergruppe. Nach Satz Qn . Also enth¨ 10 von Abschnitt 8 gibt es daher eine Untergruppe D von G, so dass auch A und G/D isomorph sind. Wir setzen M := Qn . Wir setzen ferner ur alle α ∈ D}. L := {l | l ∈ M, lα = l f¨ Dann ist L ein Teilk¨ orper von M , der nat¨ urlich den Primk¨ orper Q umfasst. Es sei γ ∈ G und l ∈ L. Dann ist, da G abelsch ist, (lγ )α = lγα = lαγ = (lα )γ = lγ f¨ ur alle α ∈ D, so dass lγ ∈ L ist. Hieraus folgt Lγ = L, so dass γ einen Automorphismus γ ρ in L induziert. Offenbar ist ρ ein Homomorphismus von G in die Automorphismengruppe von L und es gilt D ⊆ Kern(ρ).
9. Endliche abelsche Gruppen sind galoissche Gruppen
191
Wir wollen zeigen, dass D = Kern(ρ) gilt und dass Gρ die volle Automorphismengruppe von L ist. Dazu sei ζ eine primitive n-te Einheitswurzel von L. Dann ist M = Q[ζ] ⊆ L[ζ] ⊆ M und folglich L[ζ] = M . Setze f :=
(x − ζ δ ).
δ∈D
ur alle γ ∈ D, so dass f ∈ L[x] ist. Dann ist Grad(f ) = |D|. Ferner gilt f γ = f f¨ Außerdem ist f irreduzibel u ¨ ber L. Ist n¨amlich f = gh mit g, h ∈ L[x] und ist ur alle γ ∈ D, so dass Grad(g) = Grad(f ) ist. oBdA g(ζ) = 0, so folgt g(ζ γ ) = 0 f¨ Somit ist f in der Tat irreduzibel. Daher ist f das Minimalpolynom von ζ u ¨ ber L und es folgt [M : L] = Grad(f ) = |D|. Daher ist (Wir benutzen hier die Dimensionsformel, die wir erst im n¨ achsten Kapitel beweisen werden. Satz 2 von Abschnitt 3 des Kapitels 10.) |D|[L : Q] = [M : L][L : Q] = [M : Q] = |G| = |G/D| |D| = |A| |D| und weiter [L : Q] = |A|. Es sei nun F := {γ | γ ∈ G, lγ = l f¨ ur alle l ∈ L}. Dann ist D ⊆ F . Ist β ∈ F , so ist f β = f . Es gibt daher ein δ ∈ D mit ζ β = ζ δ . Wegen M = L[ζ] folgt hieraus β = δ, so dass D = F gilt. Dies zeigt, dass A isomorph ist zu einer Untergruppe der Automorphismengruppe von L. Es sei schließlich α ein Automorphismus von L. Dann ist f α ein Teiler von orper Q elementweise festl¨asst. Weil α ein AuΦα n = Φn . Letzteres, weil α den K¨ tomorphismus von L ist, ist u ¨ berdies f α ∈ L[x]. Weil Φn in M vollst¨andig in Linearfaktoren zerf¨ allt, zerf¨ allt auch f α in M in Linearfaktoren. Es gibt also eine α Nullstelle ξ von f in M . Dann ist ξ aber auch eine Nullstelle von Φn und somit eine primitive n-te Einheitswurzel. Mittels Satz 2 von Abschnitt 1 folgt, dass sich α zu einem Isomorphismus λ von M fortsetzen l¨asst. Dann ist aber λ ∈ G und λ|L = α. Damit ist gezeigt, dass G/D zur Automorphismengruppe von L isomorph ist. Die hier gemachten Schl¨ usse sind typisch f¨ ur die galoissche Theorie, so wie sie von Galois selbst und den Mathematikern des 19. Jahrhunderts betrieben wurde, dass man n¨amlich die zu f¨ uhrenden Beweise an einem sog. primitiven Element des Zerf¨allungsk¨ orpers des zu untersuchenden Polynoms aufhing. Dabei ist ein primitives Element der Erweiterung L : K ein Element π ∈ L mit L = K[π]. Dar¨ uber werden wir noch zu berichten haben wie auch dar¨ uber, wann es ein solches primitives Element gibt. Es gibt es immer, wenn der K¨ orper die Charakteristik 0 hat. Ist K = GF(p) und L = GF(pn ), so gibt es ebenfalls ein solches Element,
192
Kapitel VIIII. Der abstrakte K¨ orperbegriff
da die multiplikative Gruppe von L ja zyklisch ist. Es gibt aber nicht immer ein primitives Element. Bei unseren Untersuchungen war ζ das fragliche primitive Element. Man beachte, dass sich hier pl¨otzlich die Fragestellung ge¨andert hat. Es geht bei dem letzten Satz nicht mehr prim¨ ar um das L¨ osen von Gleichungen, das ja Galois mit Gruppen in Verbindung gebracht hat. Die Gruppen, die bei Galois auftreten, sind zwar stets die Automorphismengruppe des Zerf¨ allungsk¨ orpers des untersuchten Polynoms, doch die interessierende Frage ist, ob das gegebene Polynom sich algebraisch l¨osen l¨asst. Hier wird nun direkt danach gefragt, ob eine gegebene Gruppe Automorphismengruppe einer algebraischen Erweiterung von Q ist. Dies bereitet den Boden f¨ ur die artinsche Version der galoisschen Theorie, wo die Gruppen im Vordergrund stehen und die Gleichungen ganz in den Hintergrund gedr¨ angt werden.
X. Steinitz 1. Die p-adischen Zahlen. Hensel, Sch¨ uler von Kronecker, wurde durch seine zahlentheoretischen Untersuchungen auf die p-adischen Zahlen gef¨ uhrt, deren Konstruktion er 1904 und dann in Buchform 1908 ver¨ offentlichte. Steinitz wurde von ihnen zu seiner großen Arbeit inspiriert, zu deren Beginn er bemerkte, dass ¨ sie v¨ollig aus dem Rahmen des bislang Ublichen herausfielen. Sie seien keine Funktionenk¨ orper und auch keine algebraischen Erweiterungen von Q. Ich f¨ uge hinzu: Ihre Charakteristik ist 0, so dass sie zumindest an der Oberfl¨ ache auch nichts mit Galoisfeldern zu tun haben. Dies sind f¨ urwahr triftige Gr¨ unde, sie dem Leser hier vorzustellen. Anschließend werden wir dann endlich damit beginnen, die steinitzsche Arbeit zu kommentieren. Das Vorgehen hier ist nun wieder ganz und gar nicht philologisch. Ich lernte vor Jahren aus Kaplansky 1962, dass der Endomorphismenring der Pr¨ ufergruppen Z(p∞ ) zum Ring der ganzen henselschen p-adischen Zahlen isomorph sei. Das brachte mich auf die Idee, die henselschen p-adischen Zahlen auf diesem Weg zu konstruieren. Diesem Weg bin ich dann in einer Anf¨ angervorlesung hier in Kaiserslautern gegangen. Wiedergegeben ist diese Konstruktion in L¨ uneburg 1973. ¨ In diesem Algebrabuch findet sich auch eine Serie von Ubungsaufgaben, wo diese Konstruktion auf euklidische Ringe verallgemeinert wird (loc. cit. S. 145 ff.). F¨ ur den kundigen Leser wurde darauf hingewiesen, dass diese Konstruktion sich auch mit Hauptidealbereichen durchf¨ uhren ließe. Diesen Hinweis m¨ochte ich nun explizit machen. Die Aufgabenserie hat eine Geschichte, die ich dem Leser nicht vorenthalten m¨ochte. Sie spielt im akademischen Jahr 1970/71, dem Jahr 1 des Bestehens unserer noch immer jungen Universit¨at, die mittlerweile zur technischen Universit¨ at mutiert ist. ¨ Wir waren bei der Diskussion der Diplompr¨ ufungsordnung, die im Ubrigen bis 1 heute nicht abgerissen ist . Eines der studentischen Mitglieder des Fachbereichsrates, Gert Schneider, sp¨ ater zu makabrer Ber¨ uhmtheit gelangt, verlangte, die Pr¨ aambel in der Pr¨ ufungsordnung ersatzlos zu streichen. In dieser Pr¨ aambel stand n¨ amlich und stand noch Jahre danach, dass es Zweck der Pr¨ ufungsordnung sei festzustellen, ob der Kandidat nach wissenschaftlichen Grunds¨atzen zu arbeiten gelernt habe. Schneider meinte zur Begr¨ undung seines Verlangens, es garantiere ja niemand, dass Studenten w¨ ahrend ihres Studiums auch wirklich die M¨ oglichkeit 1
Mittlerweile im Gefolge von Bologna nun doch.
194
Kapitel X. Steinitz
h¨ atten, dies zu lernen. Dies traf mich zutiefst in meiner Berufsehre. Voller Zorn ver¨ fasste ich daraufhin eine Serie von drei Ubungsbl¨ attern mit eben jenen Aufgaben, wobei ich auf dem ersten Blatt verschiedene M¨ oglichkeiten des wissenschaftlichen Arbeitens erl¨auterte, darunter die M¨ oglichkeit des Verallgemeinerns bekannter Resultate. Im vorliegenden Falle hatte ich n¨ amlich die fraglichen Resultate, wie schon erw¨ahnt, f¨ ur den Fall Z vorgerechnet. Diese Aufgabe war also f¨ ur die damaligen Studenten eine fr¨ uhe — nicht die erste — Anleitung zum wissenschaftlichen Arbeiten. Rosemarie Rink und Manfred Dugas, dem mathematischen Publikum durch sch¨ one Arbeiten bekannt, haben damals schon durch die L¨ osung dieser Aufgaben ihr Talent bewiesen. Im Jahre 2005 ist die Pr¨ aambel dann doch verschwunden. Gehen wir daran, diese Aufgaben zu l¨ osen. Es sei R ein Hauptidealbereich, der gleichzeitig ein ZPE-Bereich sei. Wir bezeichnen mit Q(R) den Quotientenk¨ orper von R. Dann ist Q(R) insbesondere ein R-Modul und R ist ein Teilmodul von Q(R). Wir betrachten wieder den Faktormodul Q(R)/R. Dieser ist ein Torsionsmodul, wie wir schon wissen. Ist p ein Primelement von R, so bezeichnen wir ufermodul zum mit R(p∞ ) die p-Komponente von Q(R)/R und nennen sie den Pr¨ Primelement p u ¨ ber R. Es sei X ∈ R(p∞ ). Es gibt dann a, b ∈ R und ein n ∈ N0 mit b = 0, ggT(a, b) = 1, X = ab + R und pn X = R. Es folgt s := pn
a ∈ R. b
Hieraus folgt pn a = sb. Da b zu a teilerfremd ist, ist b Teiler von pn . Es gibt daher eine Einheit e in R und eine nicht-negative ganze Zahl i ≤ n mit b = epi . Es folgt X=
ae−1 + R. pi
Dies zeigt, dass R(p∞ ) genau aus den Elementen der Form a +R pn mit a ∈ R und n ∈ N0 besteht. Wir setzen Rp := EndR (R(p∞ )). Ist R = Z, so heißt Rp Ring der ganzen henselschen p-adischen Zahlen. Statt mit Zp bezeichnen wir ihn, Hensel zu ehren, mit Hp . Satz 1. Es sei R ein ZPE-Hauptidealbereich und R(p∞ ) sei der Pr¨ ufermodul zum Primelement p u ¨ber R. F¨ ur i ∈ N0 setzen wir Ui := a | a ∈ R(p∞ ), pi a = 0 .
1. Die p-adischen Zahlen
195
Dann gilt ur alle i ∈ N0 . a) Es ist Ui ⊆ Ui+1 f¨ #∞ b) Es ist i=0 Ui = R(p∞ ). c) Es ist Ui = ( p1i + R)R f¨ ur alle i. d) Ist V ein Teilmodul von R(p∞ ), so ist entweder V = R(p∞ ) oder es gibt ein i ∈ N0 mit V = Ui . Beweis. a) und b) sind trivial. Um c) zu beweisen, beachten wir zun¨achst, dass a + R ∈ Ui ist f¨ ur alle a ∈ R. Es sei paj + R ∈ Ui und p sei kein Teiler von a. Dann i p ist a pi j ∈ R. p Es gibt also ein s ∈ R mit pi a = spj . Weil p kein Teiler von a ist, ist pj Teiler von pi . Daher ist j ≤ i und es folgt a 1 i−j + R = ap + R . pj pi Also gilt c). Es sei V = R(p∞ ). Es gibt dann ein a ∈ R und ein n ∈ N0 , so dass p kein Teiler von a ist und u ¨ berdies a + R ∈ V pn gilt. Dann ist wegen
1 a n +R p auch
=
a +R pn
1 + R ∈ V. pn
Es sei n minimal mit der Eigenschaft, dass p1n + R kein Element von V sei. Ist V , da andernfalls n ≤ m, so ist auch p1m + R ∈ 1 1 m−n +R=p +R ∈V pn pm w¨are. Es sei nun pbm + R ∈ V und p sei kein Teiler von b. Weil p ein Primelelement ist, sind b und pm teilerfremd. Es gibt also u, v ∈ R mit 1 = ub + vpm . Es folgt b b 1 + R = u + v + R = u + R ∈ V. pm pm pm 1 Also ist m < n und folglich V ⊆ Un−1 . Andererseits ist pn−1 + R auf Grund der Minimalit¨ at von n ein Element von V . Also ist Un−1 ⊆ V und damit Un−1 = V .
196
Kapitel X. Steinitz
Damit ist auch d) bewiesen. Satz 2. Es sei R ein ZPE-Hauptidealbereich und p sei ein Primelement von R. Ist α ein Element des Endomorphismenrings Rp von R(p∞ ), so gilt α(Ui ) ⊆ Ui f¨ ur alle i ∈ N0 . Beweis. Es sei x ∈ Ui . Dann ist pi α(x) = α(pi x) = 0. Also ist α(x) ∈ Ui . Satz 3. Es sei R ein ZPE-Hauptidealbereich und p sei ein Primelement von R. Ist dann Rp der Endomorphismenring von R(p∞ ), so ist Rp kommutativ. Beweis. F¨ ur i ∈ N setzen wir ai :=
1 + R. pi
Dann ist Ui = ai R f¨ ur alle i. Wegen Satz 1 b) sind die ai ein Erzeugendensystem von R(p∞ ). Sind nun α, β ∈ Rp , so gibt es nach Satz 2 Elemente r, s ∈ R mit α(ai ) = rai und β(ai ) = sai . Es folgt αβ(ai ) = α(sai ) = sα(ai ) = srai = rsai = rβ(ai ) = β(rai ) = βα(ai ). ur alle i. Weil die ai den Modul R(p∞ ) erzeugen, ist Es gilt also αβ(ai ) = βα(ai ) f¨ daher αβ = βα, so dass Rp in der Tat kommutativ ist. Satz 4. Es sei R ein ZPE-Hauptidealbereich und p sei ein Primelement von R. Ferner sei wieder 1 ai := i + R. p Dann ist pai+1 = ai f¨ ur alle i ∈ N und die Menge {ai | i ≥ n} ur alle n ∈ N. erzeugt R(p∞ ) f¨ Beweis. Die erste Aussage folgt unmittelbar aus der Definition der ai . Aus ihr folgt wiederum, dass {pn−1 ai | i ≥ n} = {aj | j ∈ N} ist. Da die Menge rechter Hand, wie schon bemerkt, den Modul R(p∞ ) erzeugt, erzeugt auch die Menge {ai | i ≥ n} diesen Modul. Satz 5. Es sei R ein ZPE-Hauptidealbereich und p sei ein Primelement von R. Ist 0 = α ∈ Rp , so ist α surjektiv.
1. Die p-adischen Zahlen
197
Beweis. Wegen α = 0 ist Kern(α) = R(p∞ ). Nach Satz 1 gibt es also ein n ∈ N0 mit Kern(α) = Un . Es ist an+1 ∈ Un und daher α(an+1 ) = 0. Andererseits ist pan+1 = an und folglich pα(an+1 ) = α(pan+1 ) = α(an ) = 0. Folglich ist 0 = α(an+1 ) ∈ U1 . Daher ist nach Satz 1 α(Un+1 ) = U1 . are Es sei α(Un+i ) = Ui . Dann ist Ui = α(Un+i ) ⊆ α(Un+i+1 ). W¨ Ui = α(Un+i+1 ), so w¨are 0 = pi α(an+i+1 ) = α(pi an+i+1 ) = α(an+1 ) = 0. Dieser Widerspruch zeigt, dass Ui = α(Un+i+1 ) ist. Nach Satz 1 ist daher Ui+1 ⊆ α(Un+i+1 ). Nun ist aber pi+1 α(an+i+1 ) = α(pi+1 an+i+1 ) = α(an ) = 0. Daher ist α(Un+i+1 ) ⊆ Ui+1 und folglich α(Un+i+1 ) = Ui+1 . Also gilt α(Un+i ) = Ui f¨ ur alle i ∈ N. Daher ist α nach Satz 1 b) surjektiv. Satz 6. Ist R ein ZPE-Hauptidealbereich und ist p ein Primelement von R, so ist Rp nullteilerfrei. Beweis. Es seien 0 = α, β ∈ Rp . Nach Satz 5 sind α und β surjektiv. Also ist auch αβ surjektiv und damit nicht null. Satz 7. Es sei R ein ZPE-Hauptidealbereich und p sei ein Primelement von R. Ist G(Rp ) die Einheitengruppe von Rp , so ist P := R − GR ein Ideal von Rp . Dieses Ideal enth¨ alt alle echten Ideale von Rp . Beweis. Es ist 0 ∈ P , so dass P nicht leer ist. Sind α, β ∈ P , so sind α und β keine Einheiten, dh., keine Automorphismen von R(p∞ ). Ist α oder β gleich 0, so ist α + β ∈ P . Sind sie beide nicht 0, so sind sie nicht injektiv, da sie nach Satz 5 ja surjektiv sind. Daher ist U1 ⊆ Kern(α), Kern(β) und folglich α(a1 ) = 0 = β(a1 ). Dann ist aber auch (α + β)(a1 ) = α(a1 ) + β(a1 ) = 0.
198
Kapitel X. Steinitz
Also ist auch in diesem Falle α + β ∈ P . Ist α ∈ P und ρ ∈ Rp , so ist αρ(a1 ) = ρα(a1 ) = ρ(0) = 0. Folglich ist auch αρ, ρα ∈ P , so dass P ein Ideal ist. alt I eine Einheit, Ist I ein Ideal von Rp , welches nicht in P enthalten ist, so enth¨ ist also gleich Rp . Will man Genaueres u ¨ ber die Struktur von Rp wissen, muss man sich die Wirkung eines Elementes aus Rp auf die ai genauer ansehen. Da entsteht nun eine eigent¨ umliche Schwierigkeit. Ist α ∈ Rp , so gibt es ein r ∈ R mit α(ai ) = rai . Ist dann s ∈ R, so ist (r + spi )ai = rai + spi ai = rai = α(ai ). Es gibt also nicht nur ein r, sondern eine ganze Restklasse mod pi R von Elementen, ussen die die Wirkung von α auf ai beschreiben. Um α in den Griff zu bekommen, m¨ ur alle i wir die Wirkung von α auf die ai mittels Elementen aus R simultan f¨ beschreiben. Das ist kein Problem, falls R = Z ist. Dann w¨ahlt man in r + pi Z das kleinste nicht-negative Element. Ist R = K[x] der Polynomring in der Unbestimmten x u ¨ ber K, so nimmt man in r + pi K[x] das Element kleinsten Grades, bzw. die 0, falls r = 0 sein sollte. Ist R abz¨ ahlbar, so betrachte man eine Abz¨ahlung von R und nehme als Vertreter f¨ ur r + pi das in dieser Menge liegende Element mit dem kleinsten Index. Dies ist ein Trick, den man in der Analysis immer wieder benutzt, um Teilfolgen von Folgen auszuw¨ ahlen, die ja eo ipso mit nat¨ urlichen Zahlen indiziert sind. Wir werden dieser Schwierigkeit im allgemeinen Fall noch eine Weile aus dem Wege gehen und zun¨achst noch zwei weitere Ringe Fp und Sp studieren. Die Elemente von Fp sind alle Abbildungen f von N in R, f¨ ur die gilt, dass fi+1 ≡ fi mod pi ist f¨ ur alle i ∈ N. Offenbar geh¨ oren alle konstanten Folgen zu Fp , so dass Fp nicht uhrt dies leer ist. Definiert man die Addition von Folgen aus Fp punktweise, so f¨ nicht aus Fp heraus. Die Multiplikation definieren wir ebenfalls punktweise. Dann ist wegen (f g)i+1 − (f g)i = fi+1 (gi+1 − gi ) + (fi+1 − fi )gi auch f g ∈ Fp . Satz 8. Es sei R ein ZPE-Hauptidealbereich und p sei ein Primelement von R. Es gibt dann einen Homomorphismus α von Fp in Rp mit α(f )(ai ) = fi ai f¨ ur alle f ∈ Fp .
1. Die p-adischen Zahlen
199
ur alle i. Mittels Induktion Beweis. Es sei f ∈ Fp . Dann ist fi ≡ fi+1 mod pi f¨ folgt fi ≡ fi+k mod pi f¨ ur alle i, k ∈ N. Wir definieren eine bin¨ are Relation α(f ) auf R(p∞ ) verm¨ oge (u, v) ∈ α(f ) genau dann, wenn es ein x ∈ R und ein i ∈ N gibt mit u = xai und v = xfi ai . Wir zeigen, dass α(f ) eine Abbildung von R(p∞ ) in sich ist. Es seien (u, v), (u, w) ∈ α(f ). Dann ist u = xai , v = xfi ai und u = yak , w = yfk ak f¨ ur passende x, y ∈ R und passende i, k ∈ N. Es sei oBdA i ≤ k. Dann ist xpk−i ak = xai = u = yak und daher y ≡ xpk−i mod pk . Andererseits ist fk ≡ fi mod pi und daher fk pk−i ≡ fi pk−i mod pk . Folglich ist yfk ≡ xpk−i fk ≡ xpk−i fi mod pk . Hiermit folgt v = xfi ai = xfi pk−i ak = yfk ak = w. Ist andererseits u ∈ R(p∞ ), so gibt es nach Satz 1 ein x ∈ R und ein i ∈ N mit u = xai . Dann ist (u, xfi ai ) ∈ α(f ), so dass α(f ) in der Tat eine Abbildung von R(p∞ ) ist. Als n¨achstes zeigen wir, dass α(f ) ∈ Rp ist. Dazu seien u, v ∈ R(p∞ ). Es gibt dann x, y ∈ R und i, k ∈ N mit u = xai und v = yak . Es sei wieder oBdA i ≤ k. Dann ist α(f )(u + v) = α(f ) (xpk−i + y)ak = (xpk−i + y)fk ak = xfk ai + yfk ak . Wegen fi ≡ fk mod pi folgt hieraus α(f )(u + v) = xfi ai + yfk ak = α(f )(u) + α(f )(v), so dass α(f ) additiv ist. Ist r ∈ R, so folgt auch noch α(f )(ru) = rxfi ai = rα(f )(u), so dass α(f ) in der Tat ein Endomorphismus von R(p∞ ) ist. Ganz banal nachzuweisen ist schließlich, dass α ein Homomorphismus von Fp in Rp ist.
200
Kapitel X. Steinitz
Wir bezeichnen mit Sp das Bild von Fp unter α. Satz 9. Es sei R ein ZPE-Hauptidealbereich und p sei ein Primelement von R. ∞ ur alle Wir definieren π ∈ Sp durch π(x) := px f¨ ! x ∈ R(p ). Ist dann Q ein von {0} verschiedenes Ideal von Sp und ist V := α∈Q Kern(α), so ist V = Un mit einem n ∈ N0 und Q = π n R. Beweis. Weil V ein Teilmodul von R(p∞ ) ist, ist nach Satz 1 entweder V = R(p∞ ) oder V = Un mit einem passenden n. Weil Q = {0} ist, kann der erste Fall nicht eintreten. Also ist V = Un . Es sei 0 = α ∈ Q und Um sei der Kern von α. Dann ist n ≤ m. Auf Grund der Definition von Sp gibt es ein f ∈ Fp mit α(ai ) = fi ai f¨ ur alle i. Dann ist fm ≡ 0 mod pm und daher fm+i ≡ 0 mod pi f¨ ur alle i ∈ N0 . Andererseits ist fm+i f¨ ur kein i ∈ N durch pm+1 teilbar, da sonst wegen fm+i ≡ fm+1 mod pm+1 das Element am+1 im Kern von α l¨ age. Es gibt daher zu jedem i ∈ N ein ri ∈ R mit fm+i = ri pm und dieses ri ist nicht durch p teilbar. Es folgt ri+1 pm = fm+i+1 ≡ fm+i = ri pm mod pm+i , was die Kongruenz ri+1 ≡ ri mod pi nach sich zieht. Folglich ist r ∈ Fp , so dass durch ρ(ai ) := ri ai gem¨aß Satz 8 ein ρ ∈ Sp definiert wird. Ist nun i ≤ m, so folgt ρπ m (ai ) = ρ(pm ai ) = 0 = α(ai ). Andererseits ist ρπ m (am+i ) = ρ(ai ) = ri ai = ri pm am+i = α(am+i ) f¨ ur alle i ∈ N. Also ist ρπ m = α. W¨ are nun ρ keine Einheit, so w¨ are ρ(a1 ) = 0, was wegen r1 ≡ 0 mod p nicht der Fall ist. Weil Q ein Ideal ist, ist daher π m = ρ−1 α ∈ Q.
1. Die p-adischen Zahlen
201
ur die π m ∈ Q gilt. Dann folgt Es sei nun k die kleinste unter allen m ∈ N0 , f¨ α = ρπ m = (ρπ m−k )π k ∈ π k Sp . Also ist Q ⊆ π k Sp ⊆ Q. Folglich ist Q = π k Rp . Dann ist aber Un = Kern(π k ) und damit k = n. Damit ist alles bewiesen. Der Beweis von Satz 9 liefert auch noch den folgenden Satz, wenn man nur beachtet, dass π ein Primelement ist, da ja πSp ein maximales Ideal in Sp ist. Satz 10. Es sei R ein ZPE-Hauptidealbereich und p sei ein Primelement. Ist 0 = α ∈ Sp , so gibt es eine Einheit ρ ∈ Sp und ein n ∈ N0 mit α = ρπ n . Insbesondere ist auch Sp ein ZPE-Hauptidealbereich. Die Frage, die vorhin kurz angesprochen wurde, ist, unter welchen Bedingunultigkeit des gen Sp = Rp ist. Die Antwort lautet, sicherlich dann, wenn die G¨ Auswahlaxioms vorausgesetzt wird. Um dieses zu formulieren, definieren wir zun¨ achst das cartesische Produkt irgendwelcher Mengen. Ist (Mi | i ∈ I) eine Familie von Mengen, so bezeichnen wir mit carti∈I Mi # die Menge aller Abbildungen von I in i∈I Mi mit fi ∈ Mi f¨ ur alle i ∈ I. Man nennt carti∈I Mi das cartesische Produkt der Mi . Ist I endlich, so beweist man durch Induktion nach der L¨ ange von I, dass wenn alle M nicht leer sind. Dies stimmt auch, wenn carti∈I Mi nicht leer ist, i # I = ∅ ist. Dann ist ja i∈I Mi = ∅ und folglich carti∈I Mi = {∅}, da ∅ ja eine und zwar die einzige Abbildung von ∅ in ∅ ist, die außerdem mangels Masse sogar eine Auswahlfunktion ist. Ist I nicht endlich, so besagt einer der H¨ ohepunkte der mathematischen Forschung des 20. Jahrhunderts, dass das Auswahlaxiom von den u ¨brigen Axiomen der Mengenlehre unabh¨ angig ist, dass man also Modelle der Mengenlehre hat, in denen das Auswahlaxiom gilt (G¨ odel 1938. G¨ odel gibt nur eine grobe Skizze f¨ ur den Beweis seiner Behauptung), wie auch Modelle, in denen es nicht gilt (Fraenkel 1922). Dies ist relativ zu den u ¨ brigen Axiomen der Mengenlehre zu verstehen. Man kann das Auswahlaxiom zu den u ¨brigen Axiomen hinzunehmen oder auch seine Verneinung. Ergibt sich ein Widerspruch, so ist er schon Folge der u ¨ brigen Axiome. Das Auswahlaxiom aber besagt: Auswahlaxiom. Ist (Mi | i ∈ I) eine Familie nicht-leerer Mengen, so ist carti∈I Mi = ∅.
202
Kapitel X. Steinitz
Das Auswahlaxiom wurde von Zermelo eingef¨ uhrt und dazu benutzt zu zeigen, dass jede Menge wohlgeordnet werden kann (Zermelo 1904). Dabei heißt eine Menge M bez¨ uglich ≤ wohlgeordnet , wenn jede nicht-leere Teilmenge von M ein bez¨ uglich ≤ kleinstes Element enth¨alt. Da dann auch jede Teilmenge aus zwei ¨ Elementen ein kleinstes Element enth¨alt, sind Wohlordnungen immer linear. Uber den zermeloschen Wohlordnungssatz und weitere zum Auswahlaxiom a¨quivalente Prinzipien der Mengenlehre werden wir im n¨ achsten Kapitel berichten. Wir werden dort auch mehr u ¨ ber die Geschichte des Ausw¨ahlens aus Mengen erfahren und dabei wieder Rodolfo Bettazzi begegnen, dessen Teoria delle grandezze schon in ersten Kapitel eine Rolle spielte. Satz 11. Es sei R ein ZPE-Hauptidealbereich und p sei ein Primelement von R. Gilt das Auswahlaxiom, so ist der in Satz 8 beschriebene Homomorphismus α surjektiv, dh., es ist Sp = Rp . Beweis. Es sei β ∈ Rp . Dann ist die Menge Mi der r ∈ R mit β(ai ) = rai nicht leer. Auf Grund des Auswahlaxioms gibt es eine Abbildung f von N in R mit ussen zeigen, dass f ∈ Fp ist. Es ist β(ai ) = fi ai . wir m¨ pfi ai+1 = fi ai = β(ai ) = β(pai+1 ) = pβ(ai+1 ) = pfi+1 ai+1 . Es folgt pfi ≡ pfi+1 mod pi+1 und weiter fi ≡ fi+1 mod pi . Damit ist alles gezeigt. Ist R = Z oder R = K[x] der Polynomring in der Unbestimmten x u ¨ ber dem K¨ orper K oder ist R abz¨ ahlbar, so ben¨otigt man das Auswahlaxiom nicht, um die Gleichheit von Sp und Rp zu beweisen, da man sich in diesen F¨allen, wie oben gezeigt, auf anderem Wege eine Auswahlfunktion f der verlangten Art verschaffen kann. atsbereich, wie wir feststellten. Daher existiert Der Ring Rp ist ein Integrit¨ sein Quotientenk¨ orper Q(Rp ). Ist R = Z, so schreibt man dann auch Qp f¨ ur diesen K¨ orper und nennt ihn K¨ orper der henselschen p-adischen Zahlen. Ganz entsprechend existiert auch der Quotientenk¨ orper Q(Sp ) von Sp . Satz 12. Es sei R ein ZPE-Hauptidealbereich und p sei ein Primelement von R. Ist σ ∈ Sp und wird σ durch f ∈ Fp dargestellt, so wird durch ψ(σ) := fi + pi R ein Epimorphismus von Sp auf R/pi R definiert. Es gilt Kern(ψ) = π i Sp , so dass Sp /π i Sp und R/pi R isomorph sind. Beweis. Wird σ auch durch g ∈ Fp dargestellt, so ist fi ≡ gi mod pi , so dass ψ wohldefiniert ist. Dann ist aber klar, dass ψ ein Homomorphismus ist.
1. Die p-adischen Zahlen
203
ur alle x ∈ R(p∞ ). Dann Ist r ∈ R, so definieren wir ρ ∈ Sp durch ρ(x) := rx f¨ i ist ψ(ρ) = r + p R, so dass ψ surjektiv ist. Es sei schließlich ψ(σ) = 0. Dann ist fi ≡ 0 mod pi . Ist σ = 0, so gibt es nach Satz 10 eine Einheit τ in Sp und eine m ∈ N0 mit σ = τ π m . Wird τ durch t ∈ Fp dargestellt, so ist fi ≡ ti pm mod pi . Weil τ eine Einheit ist, ist ti nicht durch p teilbar. Andererseits ist fi durch pi teilbar. Also ist pm durch pi teilbar und folglich i ≤ m, womit alles bewiesen ist. Am Ende dieses Kapitels werden wir noch einmal auf die p-adischen Zahlen zur¨ uckkommen. Dort werden wir dann ganz wesentlich benutzen, dass Hp = Sp gilt, dass es also zu jedem α ∈ Hp genau eine Folge f auf N0 gibt mit 0 ≤ fi < pi und α(ai ) = fi ai f¨ ur alle i ∈ N0 . F¨ ur diese fi gilt ferner fi+1 ≡ fi mod pi wiederum f¨ ur alle i ∈ N. Eine weitere Bemerkung ist die, dass sich jedes δ ∈ Qp in der Form δ=
α πn
mit α ∈ Hp und n ∈ N0 darstellen l¨ asst. Es ist je zun¨ achst δ = βγ mit β, γ ∈ Hp und γ = 0. Nach Satz 10 gibt es eine Einheit von Hp und ein n ∈ N0 mit γ = π n . Setzt man α := β −1 , so ist in der Tat δ = απ −1 . Ist δ = 0, so ist auch α = 0. Es ist dann α = π m η mit einer Einheit η von Hp . Es folgt δ = π m−n η, so dass sich also jedes von 0 verschiedene δ ∈ Qp in der Form π z η nit z ∈ Z und einer Einheit η darstellen l¨ asst. Wir wollen nun noch zeigen, dass die K¨ orper der henselschen p-adischen bzw. q-adischen Zahlen nicht isomorph sind, es sei denn es ist q = p. In den meisten F¨ allen folgt dies schon daraus, dass die Torsionsgruppen ihrer multiplikativen Gruppen nicht isomorph sind. Bestimmen wir also zun¨ achst die Torsionsgruppen ihrer multiplikativen Gruppen. Satz 13. Es sei p eine Primzahl. Ist Ep die Torsionsgruppe der multiplikativen Gruppe von Qp , so ist Ep ⊆ Hp . Ist p > 2, so ist |Ep | = p−1. Ferner gilt |E2 | = 2. Beweis. Es sei δ ∈ Ep . Wir setzen m := o(δ) Es gibt dann, wie gerade gesehen, ein n ∈ N0 und ein α ∈ Hp mit α δ = n. π
204
Kapitel X. Steinitz
Hieraus folgt αm = δ m π nm = π nm . Nach Satz 10 ist Hp ein ZPE-Bereich. Daher folgt aus vorstehender Gleichung, dass π n Teiler von α ist. Folglich ist δ ∈ Hp , so dass in der Tat Ep ⊆ Hp gilt. Es sei δ ∈ Ep ein Element von Primzahlordnung q. Wir zeigen, dass entweder q Teiler von p − 1 oder dass q = p = 2 ist. Dazu nehmen wir an, dass q nicht in p − 1 aufgeht. Es gibt dann eine Folge z von nicht-negativen ganzen Zahlen mit zi < pi und δ(ai ) = zi ai . Weil δ = 1 ist, gibt es ein i mit zi = 1. Hieraus und aus ziq ≡ 1 mod pi folgt, dass o(zi + pi Z) = q ist. Folglich ist q Teiler von ϕ(pi ) = pi−1 (p − 1). Weil q kein Teiler von p − 1 ist, ist daher q Teiler von pi−1 , so dass q = p gilt, weil q ja ebenfalls Primzahl ist. Es folgt ferner, dass i ≥ 2 ist. Es sei k die kleinste nicht negative ganze Zahl mit zk+1 = 1. Dann ist also k ≥ 1. Wegen zk+2 ≡ zk+1 mod pk+1 gibt es ein v ∈ Z mit zk+2 = zk+1 + vpk+1 . Es folgt weiter p p p−j j (k+1)j p p zk+2 = (zk+1 + vpk+1 )p = zk+1 + z v p j k+1 j:=1 p ≡ zk+1 mod pk+2 . p ≡ 1 mod pk+2 . Es gibt wieder ein u ∈ Z mit zk+1 = zk + upk . Wegen Also ist zk+1 zk = 1 ist daher p p j kj p k p 1 ≡ zk+1 = (1 + up ) = 1 + u p mod pk+2 . j j:=1
W¨ are k ≥ 2, so folgte hieraus 0 ≡ pupk mod pk+2 , da ja dann pkj ≡ 0 mod pk+2 f¨ ur j ≥ 2 w¨are. Hieraus folgte, dass p Teiler von u w¨are, so dass zk+1 = 1 + upk ≡ 1 mod pk+1 g¨ alte. Dies z¨oge wegen 1 ≤ zk+1 < pk+1 den Widerspruch zk+1 = 1 nach sich. Also ist k = 1. Dies impliziert die Kongruenz p p 2 2 1 0≡ up + u p mod p3 = up2 + (p − 1)u2 p3 mod p3 . 1 2 2 W¨ are p ungerade, so folgte 0 ≡ up2 mod p3 , woraus wieder der Widerspruch u ≡ 0 mod p folgte. Also ist p = 2. Damit ist gezeigt, dass q = p = 2 ist, wenn q kein Teiler von p − 1 ist.
1. Die p-adischen Zahlen
205
Es sei p > 2 Ist dann 1 = δ ∈ Ep , so ist also jeder Primteiler von o(δ) Teiler von p − 1. Es sei wieder δ(ai ) = zi ai . Setze m := o(δ). Dann ist ai = δ m (ai ) = zim (ai ) f¨ ur alle i. Folglich ist zim ≡ 1 mod pi . Setzt man ni := o(zi + pi Z), so ist also ni Teiler von m, so dass jeder Primteiler von ni Teiler von p − 1 ist. Nun ist ni Teiler von ϕ(pi ) = pi−1 (p − 1). Dies kann aber nur sein, wenn ni Teiler von p − 1 ist. Folglich ist zip−1 ≡ 1 mod pi f¨ ur alle i. Dann ist aber δ p−1 = 1, so dass m Teiler von p − 1 ist. alt E2 wenigstens zwei Es sei schließlich p = 2. Wegen 1 = −1 ∈ Q2 enth¨ Elemente. Es sei δ ∈ E2 . Dann ist o(δ) = 2r . Es sei δ = 1, −1. Dann ist r ≥ 2, da r−2 aus δ 2 = 1 ja δ = 1 oder −1 folgte. Setze ζ := δ 2 . Dann ist o(ζ) = 4. Wegen 1 = ζ 2 und 1 = (ζ 2 )2 ist ζ 2 = −1. Es sei ζ(ai ) = zi ai . Wegen ζ 2 = −1 ist dann zi2 ≡ −1 mod 2i . Dies kann aber nicht sein, da −1 kein Quadrat modulo 4 ist. Also ist |E2 | = 2. Es bleibt zu zeigen, dass |Ep | = p − 1 ist, falls p > 2 ist. Weil xp−1 − 1 in Qp h¨ ochstens p−1 Nullstellen hat, folgt nach dem bereits Bewiesenen, dass |Ep | ≤ p−1 ist. Es sei 1 ≤ z1 < p. Dann ist z1p−1 ≡ 1 mod p. Es sei i ≥ 1 und es seien bereits Zahlen z1 , . . . , zi gefunden mit zjp−1 ≡ 1 mod pj f¨ ur j := 1, . . . , i und zj+1 ≡ zj mod pj f¨ ur j := 1, . . . , p − 1. Es sei zip−1 = 1 + kpi . Weil p kein Teiler von zi ist, gibt es eine nicht-negative ganze Zahl u unterhalb p, so dass (p − 1)zip−2 u ≡ −k mod p ist. Es folgt (p − 1)zip−2 upi + kpi ≡ 0 mod pi+1 . Setze zi+1 := zi + upi . Dann ist zi+1 ≡ zi mod pi und weiter p−1 ≡ 1 + kpi + (p − 1)zip−2 upi ≡ 1 mod pi+1 . zi+1
Es gibt also eine Folge z ganzer Zahlen mit zi+1 ≡ zi mod pi und zip−1 ≡ 1 mod pi f¨ ur alle i ∈ N. Dabei kann man z1 beliebig zwischen 1 und p − 1 w¨ahlen. Definiert ur alle i, so ist offenbar δ(z1 ) ∈ Ep . man dann δ(z1 ) durch δ(z1 )(ai ) := zi ai f¨
206
Kapitel X. Steinitz
Ferner ist δ(z1 ) = δ(z1 ), falls z1 = z1 ist. Also ist |Ep | ≥ p − 1. Damit ist der Satz bewiesen. Satz 14. Sind p und q zwei verschiedene Primzahlen, so sind Qp und Qq nicht isomorph. Beweis. Dies ist auf Grund des vorigen Satzes sicher richtig, wenn {p, q} = {2, 3} ist, da nur in diesem Falle |Ep | = |Eq | ist. Es sei also p = 2 und q = 3. Setze z1 := 1. Dann ist z13 + z1 + 1 ≡ 0 mod 3. ur j := 1, Es seien bereits ganze Zahlen z1 , . . . , zi gefunden mit zj+1 ≡ zj mod pj f¨ . . . , i − 1 und zj3 + zj + 1 ≡ 0 mod 3j f¨ ur j := 1, . . . , i. Es sei zi3 + zi + 1 = k3i . Setze zi+1 := zi − k3i . Dann ist zi+1 ≡ zi mod 3i und 3 = zi3 − 3zi2 k3i + 3zi k 2 32i − k 3 33i ≡ zi3 mod 3i+1 . zi+1
Es folgt 3 + zi+1 + 1 ≡ zi3 + zi − k3i + 1 = 0 mod 3i+1 . zi+1
Es gibt nun ein δ ∈ H3 mit δ(ai ) = zi ai . Dann ist aber δ 3 + δ + 1 = 0, so dass das Polynom x3 + x + 1 in Qp eine Nullstelle hat. abe es ein δ ∈ H2 und ein W¨ are η ∈ Q2 eine Nullstelle von x3 + x + 1, so g¨ urften annehmen, dass η und π n teilerfremd w¨ aren. n ∈ N0 mit η = δπ −n . Wir d¨ Es folgte δ 3 + δπ 2n + π 3n = 0. Weil H2 ein ZPE-Bereich ist, folgte aus der Teilerfremdheit von δ und π n , dass n = 0 w¨ are. Die Nullstelle η von x3 + x + 1 l¨ age also in H2 . Nach Satz 12 gibt atte x3 + x + 1 auch eine es einen Epimorphismus von H2 auf GF(2). Daher h¨ Nullstelle in GF(2). Dies ist aber nicht der Fall. Also hat x3 + x + 1 auch keine Nullstelle in Q2 . Damit sind auch Q2 und Q3 als nicht isomorph erkannt. Man k¨ onnte auch in weiteren F¨allen noch sehr viel mehr sagen. Ist etwa R = K[x] und ist die Charakteristik von K eine Primzahl, so ist Rp zum Ring der formalen Laurentreihen u ¨ber K[x]/pK[x] isomorph (p bezeichnet hier ein irreduzibles Polynom und nicht die Charakteristik). Mehr an Einzelheiten f¨ uhrten uns jedoch zu weit von unserem Thema ab. Der Leser experimentiere selbst! ¨ber dem p-adisch bewerteten K¨orper Man kann Qp auch mittels Cauchyfolgen u Q der rationalen Zahlen konstruieren. Dies findet sich z. B. in L¨ uneburg 1981a und 1993a durchgef¨ uhrt.
2. Einfache Erweiterungen
207
Zum Schluss dieses Abschnitts noch ein Wort dar¨ uber, wie Hensel die p-adischen Zahlen einf¨ uhrte (Hensel 1904, 1908. In Hensel 1904 findet sich viel weniger an Motivation). Er bezieht sich einmal auf die Funktionentheorie und ihre Ergebnisse u ¨ ber Laurentreihen, die er immer wieder als Vorbild f¨ ur seine Konstruktionen nimmt und kn¨ upft zum andern an die bekannte Tatsache an, dass sich jede nat¨ urliche Zahl n bez¨ uglich einer Primzahl p in der Form n=
t
ai p i
i:=0
darstellen l¨ asst, wobei f¨ ur alle i die Ungleichungen 0 ≤ ai < p gelten. Hat man m und n auf diese Weise dargestellt, so zeigt er, wie man die entsprechende Darstellung f¨ ur m + n und mn findet. Ist m > n, so l¨asst sich auch die Darstellung f¨ ur m − n finden. Ist m < n, so findet sich immerhin noch eine Folge a ganzer Zahlen ur alle i ∈ N0 und mit 0 ≤ ai < p f¨ m−n≡
t
ai pi mod pt+1
i:=0
f¨ ur alle t ∈ N0 . Man kann daher m − n mit (H)
∞
ai p i
i:=0
identifizieren. Dann geht er noch einen Schritt weiter und betrachtet alle Ausdr¨ ucke der Form (H), wobei a obigen Nebenbedingungen gen¨ ugt. Er definiert Addition und Multiplikation solcher Ausdr¨ ucke und weist nach, dass er einen Integrit¨atsbereich erh¨alt, dessen Quotientenk¨orper er dann ad hoc konstruiert. Mit Hilfe dessen, was heute henselsches Lemma heißt, beweist er die Existenz aller (p − 1)-sten Einheitswurzeln in Qp . Er hat alle Mittel in der Hand, um die Nicht-Isomorphie der K¨ orper Qp zu beweisen, stellt die Frage nach ihrer Nicht-Isomorphie aber nicht, so weit ich sehe. Wir werden auf die p-adischen Zahlen sp¨ ater noch einmal zur¨ uckkommen. 2. Einfache Erweiterungen. Wohin sind wir geraten? Wir haben mit der bei Euklid stehenden Bemerkung begonnen, dass in jedem Quadrat die Seite zur Diagonale linear inkommensurabel ist. Nach heutiger Interpretation heißt das, dass das Polynom x2 − 2 keine Nullstelle in Q hat. Mathematiker des Morgen- und Abendlandes gew¨ohnten sich im Mittelalter ohere √ daran, auch Quadrat-, Kubik- und h¨ Wurzeln, insbesondere also auch 2 als√Zahlen anzusehen, und in der Renaissance schluckten sie auch noch die Kr¨ote −1, womit sie dann endlich in der Lage waren, neben den quadratischen Gleichungen auch kubische und biquadratische Gleichungen mittels Radikale zu l¨ osen.
208
Kapitel X. Steinitz
Die Gleichungen vom f¨ unften und h¨ oheren Grade widersetzten sich hartn¨ ackig dem Versuch, sie mittels Radikalausdr¨ ucken zu l¨ osen. Man wich folglich aus und stellte andere Fragen. Hat eine algebraische Gleichung immer L¨ osungen? Reell sicher nicht. Wieviele reelle L¨osungen hat sie? Wieviele davon sind positiv? Die cartesische Zeichenregel, u ¨ ber die wir in Abschnitt 1 von Kapitel 6 berichtet haben, gibt teilweise Anwort auf diese Fragen. Mit Hilfe der sturmschen Ketten werden wir die Frage nach der Anzahl aller reellen L¨ osungen zu beantworten lernen. Ferner wusste man bald, dass eine algebraische Gleichung ungeraden Grades stets eine reelle L¨osung hat. Dieser Typus Fragen kulminierte schließlich in dem Satz von d’Alembert, Euler-Lagrange, Laplace, Gauß, Cauchy und anderen, dass C algebraisch abgeschlossen ist, dass also jede algebraische Gleichung u ¨ ber C, deren Grad mindestens 1 ist, eine Nullstelle in C hat. Dieser sogenannte Fundamentalsatz der Algebra ist ein reiner Existenzsatz, der u. a. die Frage nach der L¨ osbarkeit durch Radikalausdr¨ ucke v¨ ollig offen l¨ asst. Dem urspr¨ unglichen Problem der Aufl¨ osung algebraischer Gleichungen ging man jedoch auch weiterhin nach. Man lernte rasch, dass es wichtig ist zu fixieren, wo die Koeffizienten der algebraischen Gleichungen herstammen, insbesondere auch deswegen, weil man durch Iteration an die L¨ osungen heranzukommen suchte, indem man die schon gefundenen L¨ osungen den zu Grunde liegenden Bereichen adjungierte. Das f¨ uhrte zum K¨orperbegriff, wie wir gesehen haben. Auch die Zahlentheorie lieferte in GF(p) Beispiele f¨ ur K¨ orper und selbst die Analysis lieferte Beispiele (Dedekind & Weber 1882). Schließlich kamen noch die henselschen Beispiele hinzu, die wir im ersten Abschnitt studiert haben. All dies ließ Steinitz die Frage stellen, wie sich K¨orper aus einfacheren K¨ orpern aufbauen. Bei seiner Antwort auf diese Frage, spielen Polynome nur noch die Rolle zu entscheiden, ob ein Element u ¨ber einem K¨orper algebraisch ist oder nicht. Algebraisch heißt es n¨amlich genau dann, wenn es Nullstelle eines Polynoms mit Koeffizienten in dem gegebenen K¨ orper ist. Alle nicht algebraischen Elemente heißen transzendent. Steinitz’ Antwort wird uns nun eine Weile besch¨ aftigen. Ernst Steinitz wurde 1871 in Laurah¨ utte geboren, das heute in Polen liegt. Er studierte in Breslau, das heute ebenfalls zu Polen geh¨ort, und in Berlin und promovierte 1894 in Breslau. Drei Jahre sp¨ ater habilitierte er sich an der Techn. Hochschule Berlin-Charlottenburg. Im Jahre 1910 wurde er Extraordinarius an der Techn. Hochschule in Breslau und von 1920 an bis zu seinem Tode im Jahre 1928 wirkte er in Kiel als Ordinarius an der dortigen Universit¨ at. Neben der Algebra besch¨aftigte ihn viele Jahre auch die Theorie der Polyeder. Sein Buch zu diesem Gegenstand Vorlesungen u ¨ ber die Theorie der Polyeder unter Einschluß ” der Elemente der Topologie“ erschien erst postum. Nicht zu u ¨ bersehen ist Steinitz’ Einfluss auf das heutige Erscheinungsbild der Algebra. Die Resultate seiner großen Arbeit von 1910, die ich nun vorstellen werde, sind insbesondere durch van der Waerdens Moderne Algebra“, die dann zur ” Algebra“ wurde, dem mathematischen Pulikum vertraut geworden. Dieses Buch ” diente ja so mancher Generation von Mathematikern als Einf¨ uhrung in die Algebra. Wenn Sie also, lieber Leser, so wie ich, nicht mehr ganz der J¨ ungste sind,
2. Einfache Erweiterungen
209
werden Sie im Folgenden vieles Vertraute wiederfinden. Ich werde mich, so wie dies van der Waerden tat, sehr eng an die steinitzsche Vorlage halten. Steinitz beginnt seine Arbeit mit der Definition des K¨ orpers, wobei er, wie er ausdr¨ ucklich betont, Weber (1893) folgt. Im Gegensatz zu Weber vergisst er aber nicht, die Assoziativit¨ at der Multiplikation zu fordern. Nachdem er den K¨ orperbegriff definiert hat, betont er, dass zu den S¨ atzen u ¨ ber K¨ orpern, deren Beweis nur auf den Forderungen an einen K¨ orper beruhen, alle S¨ atze aus der Determinantentheorie geh¨ oren. Er erw¨ ahnt explizit die S¨ atze, dass n lineare Gleichungen mit n Unbekannten genau eine L¨ osung haben, wenn ihre Determinante ungleich null ist, und dass n homogene lineare Gleichungen mit n + 1 Unbekannten, stets eine nicht triviale L¨osung besitzen. Diese S¨atze benutzt er immer wieder einmal. Er betont auch, dass es endliche K¨ orper gibt. Hier ist zu sagen, dass es die lineare Algebra als Teildisziplin der Mathematik noch nicht gab. Die grassmannschen B¨ ucher u ¨ ber seine Ausdehnungslehre wurden vom mathematischen Publikum ja nicht gelesen. Sie wurde erst vor allem u ¨ ber den Umweg u ¨ ber die Funktionalanalysis zu einer eigenst¨ andigen Disziplin, wobei auch die Physik ihren Beitrag hierzu leistete (s. Scholz 1990, Kap. 13, 15.4). Dabei ist interessant zu bemerken, dass Steinitz darauf hinweist, dass Hamel als einer der Ersten den zermeloschen Wohlordnungssatz auf ein arithmetisches Problem anwandte. Was Hamel bewies, war der Satz, dass R als Vektorraum u ¨ber Q eine Basis hat. Er benutzte dann eine solche Basis, um alle unstetigen Abbildungen α von R in sich zu bestimmen, die der Funktionalgleichung α(x + y) = α(x) + α(y) gen¨ ugen. Dar¨ uber haben wir im ersten Kapitel schon berichtet. Es ist weiterhin interessant zu bemerken, dass Steinitz in seiner Arbeit auch Mengen u ¨ ber einem K¨orper K algebraisch unabh¨ angiger Elemente eines K umfassenden K¨orpers L untersucht, aber mit keinem Wort darauf eingeht, dass hier die gleichen Verh¨altnisse herrschen wie bei den linear unabh¨ angigen Teilmengen eines Vektorraums. Es ist unklar, ob er es u ¨berhaupt bemerkte. Erst vierundzwanzig Jahre sp¨ ater n¨ amlich bewies und publizierte L¨ owig die einschl¨ agigen S¨ atze f¨ ur Vektorr¨ aume (L¨ owig 1934). Damals haben aber einige schon den Zusammenhang gesehen (Otto Haupt, Bartel L. van der Waerden), wie im n¨achsten Kapitel berichtet wird. Es geht weiter mit den Begriffen Teilk¨ orper, Erweiterung und Adjunktion. Schnitte von Teilk¨ orpern sind Teilk¨ orper. Hat man eine Menge Φ orpern # von Teilk¨ und gibt es zu X, Y ∈ Φ stets ein Z ∈ Φ mit X, Y ⊆ Z, so ist X∈Φ X ebenfalls ein Teilk¨ orper, der aber nicht notwendig zu Φ geh¨ ort. Ist K ein Teilk¨ orper von L, dh. L eine Erweiterung von K und ist S eine Teilmenge von L, so bezeichne K(S) den Schnitt u ¨ber alle Teilk¨ orper von L, die K und S umfassen. Dann ist K(S) ein Teilk¨orper, der Teilk¨ orper, der aus K durch Adjunktion von S entsteht. Bezeichnet Φ die Menge aller endlichen Teilmengen von S, so ist $ K(T ). K(S) = T ∈Φ
210
Kapitel X. Steinitz
Denn mit T1 , T2 ∈ Φ ist ja auch T1 ∪ T2 ∈ Φ und es gilt K(T1 ), K(T2 ) ⊆ K(T1 ∪ T2 ). Jedes Element von K(S) liegt also in einem Teilk¨ orper von K(S), der durch Adjunktion von endlich vielen Elementen zu K entsteht. Bei Integrit¨ atsbereichen verlangt Steinitz, dass sie eine 1 haben und dass 1 = 0 ist. Was f¨ ur Teilk¨ orper g¨ alte, g¨alte mutatis mutandis auch f¨ ur Teilbereiche von Integrit¨ atsbereichen. Hier bezeichnet er die Adjunktion von S zu R mit R[S] und betont, dass man im K¨ orperfall zwischen K(S) und K[S] unterscheiden m¨ usse. Auch hier wird zun¨ achst angenommen, dass S Teil eines Integrit¨atsbereiches ist, der R umfasst. Dann konstruiert Steinitz zu einem Integrit¨ atsbereich R den Quotientenk¨ orper Q(R). Jeder K¨orper K enth¨ alt einen Primk¨ orper und die Primk¨ orper sind, wie wir schon wissen (Kap. 6, Absch. 8), Q und die GF(p)’s. Ist Q der Primk¨ orper von K, so heißt 0 die Charakteristik von K im zweiten Fall p. Eine von 0 verschiedene Charakteristik ist immer Primzahl. Integrit¨ atsbereiche haben die Charakteristik ihres Quotientenk¨ orpers. Alle Teilk¨orper eines K¨orpers haben die gleiche Charakteristik, da sie ja alle den gleichen Primk¨orper haben. aquivalent , wenn es einen Zwei Erweiterungen L und L eines K¨orpers K heißen ¨ ur alle k ∈ K. ErweiterunIsomorphismus α von L auf L gibt mit k α = k f¨ gen k¨ onnen isomorph sein ohne a¨quivalent zu sein. Der Leser u ¨ berlege sich, dass 1 1 ur dieses Ph¨ anomen sind. Dabei bezeichne K(x) K(x)[x 2 ] und K(x)[x 3 ] Beispiele f¨ den Quotientenk¨ orper des Polynomrings in der Unbestimmten x u ¨ ber K. Dieses Beispiel geben Baer und Hasse in ihren Erl¨ auterungen zur steinitzschen Arbeit (Anm. 26). Die einfachsten Erweiterungen sind die, die sich durch Adjunktion eines Elementes erreichen lassen. In L = K(x) liegt stets auch K[x]. Dabei ist x hier nicht als Unbestimmte zu interpretieren, sondern als ein Element von L. Ist L = K(x), so heißt L einfache Erweiterung von K und x heißt primitives Element von L. Es sind nun zwei F¨ alle zu unterscheiden, n¨ amlich, ob die Menge der 1, x, x2 , . . . linear abh¨ angig ist oder nicht. Im ersten Falle heißt die Erweiterung algebraisch, im zweiten transzendent. Entsprechend heißt auch das Element x algebraisch bzw. transzendent. In diesem Zusammenhang f¨ uhrt Steinitz die Begriffe linear abh¨ angig bzw. linear unabh¨ angig in Bezug auf K ein. Steinitz betrachtet nun zun¨ achst einfach transzendente Erweiterungen K(x) eines K¨orpers K. Das erste, was Steinitz feststellt, ist, dass jeder K¨ orper eine einfach transzendente Erweiterung besitzt. Dazu definiert er zun¨ achst Polynome als formale Ausdr¨ ucke ck xk mit ck ∈ K, wobei von den ck h¨ ochstens endlich viele von null verschieden sind. Zwei solcher Ausdr¨ ucke heißen gleich, wenn sie koeffizientenweise u ¨ bereinstimmen. Die Addition wird punktweise definiert und die Multiplikation durch die Faltung. Dann ist K[x] ein Integrit¨ atsbereich und sein Quotientenk¨ orper K(x) ist eine einfach transzendente Erweiterung von K. Alle einfach transzendenten Erweiterungen eines K¨orpers sind a¨quivalent. Denn zun¨ achst gibt es ja einen Isomorphismus α
2. Einfache Erweiterungen
211
ur alle k ∈ K und xα = y und dieser Isomorphisvon K[x] auf K[y], mit k α = k f¨ mus l¨asst sich zu einem Isomorphismus von K(x) auf K(y) fortsetzen. Er bemerkt ferner, dass man in K[x] Division mit Rest hat und dass man dem zu Folge zu zwei Polynomen mit Hilfe des eulerschen Algorithmus, wie er sagt, den gr¨oßten gemeinsamen Teiler zweier Polynome ausrechnen und linear aus den gegebenen Polynomen kombinieren kann. Er sagt ferner, dass man mittels des eulerschen Algorithmus in bekannter Weise zu den Aussagen gelange (er schreibt f (x), wo wir f schreiben): Ist f (x) zu g(x) teilerfremd, f (x) · h(x) durch g(x) teilbar, so ist h(x) durch g(x) teilbar. Sind f (x) und h(x) zu g(x) teilerfremd, so ist auch f (x)·h(x) zu g(x) teilerfremd. Ist ξ ∈ K(x), so gibt es eindeutig bestimmte teilerfremde Polynome f (x) und g(x), so dass der Leitkoeffizient von g(x) eins ist und ξ=
f (x) g(x)
gilt. Diese Darstellung von ξ heißt reduziert. Und nun kommt endlich etwas, was wir noch nicht vorweggenommen haben. Satz 1. Ist K ein K¨ orper und ist K(x) der K¨ orper der rationalen Funktionen in der Unbestimmten x u ¨ber K, so sind alle Elemente außer denen von K selbst in Bezug auf K transzendent. Beweis. Es sei 0 = ξ ∈ K(x) und es gebe c0 , . . . , cn ∈ K, die nicht alle null sind, mit n ci ξ i = 0. i:=0
urzeren Relation Wir d¨ urfen annehmen, dass c0 , cn = 0 ist, da wir sonst zu einer k¨ u ¨ bergehen k¨ onnen. Es sei ferner ξ = fg und diese Darstellung von ξ sei reduziert. Es folgt n 0= ci f i g n−i i:=0
und damit f n ≡ 0 mod g. Weil f und g teilerfremd sind und der Leitkoeffizient von g gleich 1 ist, folgt g = 1. Andererseits folgt auch g n ≡ 0 mod f, so dass auch f ∈ K gilt. Also ist ξ ∈ K, wie behauptet. Die Polynome aus K[x] nennt man im Zusammenhang mit K(x) auch ganzrationale Funktionen, w¨ahrend die Elemente von K(x) auch rationale Funktionen
212
Kapitel X. Steinitz
genannt werden. Ganz-rational zu sein h¨ angt vom primitiven Element x von K(x) ab. W¨ ahlt man ein anderes primitives Element, so erh¨alt man in aller Regel andere ganz-rationale Funktionen. Vom primitiven Element unabh¨ angig aber ist der Grad eines Elementes. Dieser wird von Steinitz wie folgt definiert. Ist 0 = ξ = fg und ist dies die reduzierte Form von ξ, so ist Grad(ξ) := max(Grad(f ), Grad(g)) der Grad von ξ. Die 0 hat keinen Grad. Satz 2. Eine rationale Funktion n-ten Grades von einer rationalen Funktion ν-ten Grades (n > 0, ν > 0) ist eine Funktion vom Grade n · ν. ϕ rationale Funktionen in x u ¨ ber dem K¨ orper Beweis. Es seien R := fg und S := ψ K. Die Grade von R und S seien n, bzw. ν. Es sei
f = a0 xn + . . . + an , g = b0 xn + . . . + bn , ϕ = c0 xν + . . . + cν , ψ = d0 xν + . . . + dν . Weil f und g teilerfremd sind, gibt es Polynome f1 und g1 mit Grad(f1 ) < Grad(f ) und Grad(g1 ) < Grad(g) sowie f g1 + gf1 = 1. Setze γ := a0 cn0 + a1 cn−1 d0 + . . . + an dn0 0 und δ := b0 cn0 + b1 cn−1 d0 + . . . + bn dn0 . 0 Ist d0 = 0, so ist
c0 n γ=f d d0 0
c0 n δ=g d . d0 0
und
Folglich ist in diesem Falle γg1
c0 d0
+ δf1
c0 d0
= dn0 = 0.
Daher sind γ und δ nicht zugleich 0. Ist d0 = 0, so ist c0 = 0, da der Grad von S ja ν ist. Ferner ist γ = a0 cn0 und δ = b0 cn0 . Weil wegen Grad(R) = n die Koeffizienten a0 und b0 nicht gleichzeitig 0 sein k¨ onnen, gilt auch hier, dass γ und δ nicht gleichzeitig 0 sind.
2. Einfache Erweiterungen
213
Setze σ := a0 ϕn + a1 ϕn−1 ψ + . . . + an ψ n und τ := b0 ϕn + b1 ϕn−1 ψ + . . . + bn ψ n . Dann sind γ und δ die Koeffizienten von xnν in σ bzw. τ . Daher hat wenigstens eines dieser beiden Polynome den Grad nν. Ferner ist σ = f (S)ψ n und τ = g(S)ψ n und damit σ R(S) = . τ Es bleibt zu zeigen, dass σ und τ teilerfremd sind. Es gilt ϕ ϕ σg1 ψ n−1 + τ f1 ψ n−1 = ψ 2n−1 . ψ ψ Es sei t := ggT(σ, τ ). Ferner sei u := ggT(t, ψ). Dann geht u in σ, τ und ψ auf. Auf Grund der Definition von σ geht u dann auch in ϕ auf. Weil ϕ und ψ teilerfremd sind, folgt u = 1. Somit ist t zu ψ und dann auch zu ψ 2n−1 teilerfremd. Weil aber t in σ und τ aufgeht und ψ 2n−1 sich mittels Polynomen aus σ und τ linear darstellen l¨ asst, ist t Teiler von ψ 2n−1 . Daher ist t = 1, so dass σ und τ in der Tat teilerfremd sind. Somit ist n · ν der Grad von R(S). Aus dem Vorstehenden folgt, dass f¨ ur y ∈ K(x) − K jedes Element aus K(y) als rationale Funktion in x einen Grad hat, der durch den Grad von y teilbar ist. Dies bemerkt Steinitz en passant , um damit weiter zu schließen, dass y den Grad 1 hat, falls y ein primitives Element von K(x) ist. Das ist die H¨alfte des Beweises des folgenden Satzes. Satz 3. Es sei K(x) der Funktionenk¨ orper in der Unbestimmten x u ¨ber K. Genau dann ist y ∈ K(x) ein primitives Element von K(x), wenn y den Grad 1 hat. Beweis. Wir m¨ ussen nur noch zeigen, dass y ein primitives Element ist, wenn y den Grad 1 hat. Es sei ax + b y= . cx + d W¨ are ad − bc = 0, so w¨aren die beiden Paare (a, b) und (c, d) linear abh¨ angig und folglich y ∈ K, so dass der Grad von y nicht 1 w¨ are. Dann ist aber x=
dy − b , −cy + a
so dass x ∈ K(y) ist. Eine unmittelbare Folgerung aus den S¨ atzen 2 und 3 ist das folgende, schon erw¨ahnte Resultat. Satz 4. Ist K(x) der Funktionenk¨ orper in der Unbestimmten x u ¨ber K, so hat jedes von 0 verschiedene Element von K(x) einen Grad, der von der Wahl eines primitiven Elementes von K(x) unabh¨ angig ist.
214
Kapitel X. Steinitz
Da wir schon Polynomringe in einer beliebigen Menge von Unbestimmten definiert haben, formulieren wir den n¨ achsten Satz etwas anders als Steinitz dies tat. orper und x1 , . . . , xn seien Elemente, die nacheinanSatz 5. Es sei K = K0 ein K¨ der dem K¨ orper K adjungiert, die K¨ orper K(x1 ) = K1 , K1 (x2 ) = K2 , . . . , Kn−1 (xn ) = Kn ergeben. Ferner sei xi f¨ ur alle i in Bezug auf Ki−1 transzendent. Sind dann y1 , ¨ber K, so gibt es einen Isomorphismus von K(y1 , . . . , yn ) . . . , yn Unbestimmte u auf Kn , der alle Elemente von K festl¨ asst und yi f¨ ur alle i auf xi abbildet. Beweis. Dies ist f¨ ur n = 1 richtig. Es sei also n > 1 und der Satz gelte f¨ ur n − 1. Es gibt dann einen Isomorphismus σ von K(y1 , . . . , yn−1 ) ur i := 1, . . . , n − 1 auf xi abbildet. auf Kn−1 , der K elementweise festl¨asst und yi f¨ Es ist klar, dass sich σ zu einem Isomorphismus von K(y1 , . . . , yn−1 )(yn ) auf Kn fortsetzen l¨asst, der auch noch yn auf xn abbildet. Der Polynomring K[y1 , . . . , yn−1 ][yn ] ist in L := K(y1 , . . . , yn−1 )(yn ) enthalten. Folglich ist auch der Quotientenk¨ orper Q diese Polynomrings in L enthalten. Andererseits ist klar, dass auch L ⊆ Q gilt. Also ist Q = L. Nach Fr¨ uherem wissen wir, dass es einen Isomorphismus τ von K[y1 , . . . , yn ] auf K[y1 , . . . , yn−1 ][yn ] gibt, der die Elemente von K festl¨asst und yi auf yi abbildet. Dieser Isomorphismus l¨ asst sich wiederum zu einem Isomorphismus von K(y1 , . . . , yn ) auf Q fortsetzen. Dann aber leistet στ das Verlangte. ¨ Uber die einfach transzendenten Erweiterungen weiß man nun im Groben Bescheid. Steinitz wendet sich daher den einfachen, algebraischen Erweiterungen zu und definiert auf die u ¨bliche Art, wann ein Polynom irreduzibel heißt. Er studiert den Restklassenk¨orper nach einem solchen Polynom und beweist, was wir im letzten Kapitel schon bewiesen haben, dass jedes irreduzible Polynom f in seinem Restklassenk¨ orper eine Nullstelle hat. 3. Algebraische Erweiterungen. Eine Erweiterung L von K heißt algebraisch u ¨ ber K, wenn jedes Element von L algebraisch u ¨ber K ist. Es wird festgestellt, dass eine endliche Erweiterung L von K stets algebraisch ist. Ist n¨amlich n der Grad von L u ¨ ber K und ist l ∈ L, so sind die Elemente 1, l, l2 , . . . , ln linear
3. Algebraische Erweiterungen
215
abh¨ angig, so dass l Nullstelle eines von null verschiedenen Polynoms u ¨ ber K und folglich algebraisch u ¨ber K ist. Der Grund legende Satz hier, ist Satz 1 von Abschnitt 1 des Kapitels 9, der sich mehr oder minder explizit schon bei Weber findet und den er weidlich ausn¨ utzt. Er besagt, dass jedes irreduzible Polynom g ∈ K[x] Anlass gibt zu einer algebraischen Erweiterung L = K[x]/gK[x] mit [L : K] = Grad(g) und dass x + gK[x] Nullstelle von g in L ist. Dieser K¨orper wird durch den folgenden Satz charakterisiert. Satz 1. Ist K ein K¨ orper und ist g ∈ K[x] ein u ¨ber K irreduzibles Polynom, ist M eine Erweiterung von K, hat g in M eine Nullstelle a, jedoch keine Nullstelle in einem echten Teilk¨ orper von K, so gibt es einen Isomorphismus σ von K[x]/gK[x] ur alle k ∈ K und (x + gK[x])σ = a. auf M mit k σ = k f¨ Beweis. Es sei τ der durch f τ := f (a) definierte Einsetzungshomomorphismus von K[x] in M . Wegen g τ = g(a) = 0 ist g ∈ Kern(τ ). Weil K[x] ein Hauptidealring ist, ist Kern(τ ) = GK[x] mit einem Polynom G. Es folgt, dass G Teiler von g ist. Weil g irreduzibel und weil τ nicht die Nullabbildung ist, folgt GK[x] = gK[x]. Auf Grund des ersten Isomorphiesatzes gibt es also einen Monomorphismus σ von K[x]/gK[x] in M mit σ f + gK[x] = f τ . at von σ Hieraus folgt k σ = k τ = k und (x + gK[x])σ = xτ = a. Die Surjektivit¨ folgt schließlich aus der Minimalit¨ at von M . Wir ziehen hier eine Folgerung aus Satz 1, die wir am Ende dieses Kapitels ben¨ otigen werden. Korollar. Es sei K ein K¨ orper und f ∈ K[x] sei irreduzibel. Ist L eine Erweiterung von K und zerf¨ allt f in L[x] in lauter Linearfaktoren, so ist die Anzahl der K-linearen Monomorphismen von K[x]/f K[x] in L gleich der Anzahl der verschiedenen Nullstellen von f in L. Beweis. Es sei m die Anzahl der verschiedenen Nullstellen von f in L. Dass die Anzahl der fraglichen Monomorphismen mindestens gleich m ist, folgt aus Satz 1. Es sei nun σ ein K-linearer Monomorphismus von K[x]/f K[x] in L. Dann ist, da σ ja K-linear ist, σ f (x + f K[x])σ = f σ (x + f K[x])σ = f (x + f K[x]) = 0. Also ist (x + f K[x])σ eine der m Nullstellen von f in L. Da die Wirkung von σ wegen seiner K-Linearit¨at durch die Wirkung auf x + f K[x] bereits festliegt, ist σ einer der schon bekannten m Monomorphismen. Bei Steinitz folgen nun einige Bemerkungen u ¨ber linear unabh¨ angige Elemente und Basen, die wir heute zur linearen Algebra z¨ ahlen. Dann ein weiterer wichtiger Satz, der u. A. die Dimensionsformel beinhaltet. Die Dimensionsformel hatte zu diesem Zeitpunkt schon eine lange Geschichte. Hierzu mehr in Abschnitt 8 von Kapitel 13.
216
Kapitel X. Steinitz
Satz 2. Es sei M ein K¨ orper, L sei ein Teilk¨ orper von M und K sei ein Teilk¨ orper von L. Genau dann ist M endlich u ¨ber K, wenn M endlich u ¨ber L und L endlich u ¨ber K ist. Ist M endlich u ¨ber K, so gilt [M : K] = [M : L][L : K].
Beweis. Es sei M endlich u ¨ber K. Da jede K-Basis von M ein Erzeugendensystem des L-Vektorraumes M ist, ist M endlich u ¨ber L. Da Teilr¨ aume endlich erzeugter Vektorr¨ aume endlich erzeugt sind, ist auch L endlich u ¨ber K. Steinitz schließt hier umst¨ andlicher. Die lineare Algebra war noch nicht so weit entwickelt wie heutzutage, doch u ¨ ber ihre Geschichte berichte ich hier nichts, es sei denn zuf¨allig. Um die Umkehrung zu beweisen sei b1 , . . . , bm eine K-Basis von L und c1 , . . . , cn eine L-Basis von M . Wir setzen dij := bi cj . Es sei x ∈ M . Es gibt dann l1 , . . . , ln ∈ L mit n l j cj . x= j:=1
Es gibt ferner kij ∈ K mit lj =
m
kij bi .
i:=1
Es folgt x=
m n
kij bi cj =
j:=1 i:=1
n m
kij dij .
i:=1 j:=1
Folglich bilden die d’s ein Erzeugendensystem des K-Vektorraumes M , so dass M endlich u ¨ber K ist. Um die letzte Aussage zu beweisen, m¨ ussen wir nur noch zeigen, dass die d’s sogar eine Basis bilden. Dazu ist nur noch zu zeigen, dass sie linear unabh¨angig sind. Es sei also n m kij dij . 0= i:=1 j:=1
Dann folgt 0=
n m j:=1
kij bi cj .
i:=1
Weil die c’s eine L-Basis von M sind, folgt 0=
m i:=1
kij bi
3. Algebraische Erweiterungen
217
ur alle i f¨ ur alle j. Weil schließlich die b’s eine K-Basis von L sind, folgt kij = 0 f¨ und alle j. Damit ist alles bewiesen. Satz 3. Es sei K ein K¨ orper und f sei ein Polynom des Grades n u ¨ber K. Es gibt dann eine endliche Erweiterung L von K mit [L : K] ≤ n!, so dass f als Polynom von L[x] vollst¨ andig in Linearfaktoren zerf¨ allt. Beweis. Hat f den Grad 0 oder 1, so tut’s L := K. Es sei also n > 1. Ferner sei g ein irreduzibles Polynom, welches f teilt. Dann ist Grad(g) ≤ Grad(f ) = n. Nach Satz 1 gibt es eine Erweiterung M von K vom Grade Grad(g), in der g und damit f eine Nullstelle a hat. Es folgt f = (x − a)h mit einem h ∈ M [x]. Es folgt Grad(h) = n − 1, so dass es nach Induktionsannahme eine Erweiterung L von M allt. Daher gibt mit [L : M ] ≤ (n − 1)!, in der h vollst¨andig in Linearfaktoren zerf¨ zerf¨allt auch f in L vollst¨andig in Linearfaktoren. Nach Satz 3 ist L eine endliche Erweiterung von K und es gilt [L : K] = [L : M ][M : K] ≤ (n − 1)!Grad(g) ≤ (n − 1)!n = n! Damit ist der Satz bewiesen. Ist L eine Erweiterung von K und ist der Grad von L u ¨ ber K minimal bez¨ uglich der Eigenschaft, dass das Polynom f ∈ K[x] u ¨ ber L vollst¨andig in Linearfaktoren zerf¨allt, so nennen wir L, wie schon zuvor, Zerf¨ allungsk¨ orper von f . Auf Grund des gerade bewiesenen Satzes hat also jedes Polynom einen Zerf¨allungsk¨ orper, unabh¨ angig davon, ob seine Diskrimante 0 ist oder nicht. Es sei hier noch einmal betont, dass Kronecker den Satz u ¨ber die Existenz des Zerf¨allungsk¨ orpers nicht in dieser Allgemeinheit hatte. Kroneckers zerf¨allende K¨ orper haben alle ein primitives Element. Es gibt aber Polynome bei K¨ orpern von Primzahlcharakteristik, deren Zerf¨ allungsk¨ orper keine primitiven Elemente haben. Aber an K¨ orpern von Primzahlcharakteristik scheint Kronecker nicht interessiert gewesen zu sein. Jedenfalls haben seine Rationalit¨atsbereiche in den Arbeiten, die ich gesehen habe, alle die Charakteristik 0. orper und ist σ ein Isomorphismus von K auf K , so induziert Sind K und K K¨ σ einen ebenfalls mit σ bezeichneten Isomorphismus von K[x] auf K [x] durch die Vorschrift σ n n i fi x := fiσ xi . i:=0
i:=0
orper. Ferner sei f ∈ K[x] und σ sei ein IsomorSatz 4. Es seien K und K K¨ allungsk¨ orper von f u ¨ber K und L ein phismus von K auf K . Ist L ein Zerf¨
218
Kapitel X. Steinitz
¨ber K , so l¨ asst sich σ fortsetzen zu einem IsomorphisZerf¨ allungsk¨ orper von f σ u mus τ von L auf L . Beweis. Es sei n die Anzahl der Nullstellen von f , die nicht in K liegen. Ist n = 0, so zerf¨allt f in K[x] vollst¨andig in Linearfaktoren. Daher ist K = L. Es folgt weiter, dass auch f σ in K [x] vollst¨andig in Linearfaktoren zerf¨ allt. Also ist auch K = L . Setzt man nun τ := σ, so leistet τ das Verlangte. Es sei n > 0. Ferner sei a eine Nullstelle von f , die nicht in K liegt. Es sei g das Minimalpolynom von a u ¨ ber K, dh. das Polynom kleinsten Grades mit Leitkoeffizient 1 in K[x] mit g(a) = 0. Dann ist g irreduzibel. Nach Satz 1 gibt es ur alle k ∈ K folglich einen Monomorphismus μ von K[x]/gK[x] in L mit k μ = k f¨ und (x + gK[x])μ = a. Es seien a = a1 , . . . , am die Nullstellen von f in L. Dann ist f =s
m
(x − ai ).
i:=1
Es folgt f σ = sσ
m
(x − bi )
i:=1
mit bi ∈ L . Wegen g(a) = 0 ist x − a Teiler von g. Daher sind f und g nicht teilerfremd. Weil g irreduzibel ist, ist g daher Teiler von f . Es gibt somit ein h ∈ K[x] mit f = gh. Also ist g σ h σ = f σ = sσ
m
(x − bi ),
i:=1
so dass wenigstens eines der x − bi Teiler von g σ ist. Wir d¨ urfen daher annehmen, dass x − b1 Teiler von g σ ist. Es folgt g σ (b1 ) = 0. Daher wird f¨ ur A ∈ K[x] durch Aρ := Aσ (b1 ) ein Homomorphismus von K[x] in L definiert, dessen Kern das Ideal gK[x] ist. Wegen g ρ = g σ (b1 ) = 0 ist n¨ amlich g ∈ Kern(ρ). Weil aber ρ nicht der Nullhomomorphismus ist, folgt mit der Irreduzibilit¨ at von g, dass Kern(ρ) = gK[x] ist. Mittels des ersten Isomorphiesatzes folgt die Existenz eines Monomorphismus ν von K[x]/gK[x] in L mit ν A + gK[x] = Aσ (b1 ). Setzt man nun π := μ−1 ν, so ist π ein Monomorphismus von M := (K[x]/g[x])μ in L mit k π = k σ f¨ ur alle k ∈ K und aπ1 = b1 . Wegen a1 ∈ M hat f h¨ ochstens n − 1 Nullstellen in L, die nicht zu M geh¨oren. Außerdem ist L auch Zerf¨ allungsk¨ orper
3. Algebraische Erweiterungen
219
orper von f σ u ¨ ber M := M π . Nach Indukvon f u ¨ ber M und L ist Zerf¨allungsk¨ tionsannahme gibt es also eine Isomorphismus τ von L auf L mit k τ = k π f¨ ur alle k ∈ M . Es folgt k τ = k π = k σ f¨ ur alle k ∈ K. Damit ist alles bewiesen. Wir haben in diesem Beweise den Schluss benutzt, dass das irreduzible Polynom g Teiler von f ist, da f und g die gemeinsame Nullstelle a haben. Bei Galois liest ´ sich das so (Galois, Ecrits, S. 47): Lemme I. Une ´equation irr´eductible ne peut avoir aucune racine commune avec une ´equation rationelle sans la diviser. Car le plus grand commun diviseur entre l’´equation irr´eductible propos´ee et l’autre ´equation sera encore rationnel; donc, etc. Das Etc. ist Teil des Zitates. Die hier zitierte Stelle stammt aus dem ersten M´emoire, das wir schon einmal erw¨ ahnten (Kapitel 9, Ende von Abschnitt 1) und mit dem wir uns in Kapitel 13 noch ausf¨ uhrlich besch¨ aftigen werden. allungsk¨ orper des Polynoms f u ¨ber dem K¨ orper K, Korollar. Sind L und L Zerf¨ so gibt es einen Isomorphismus τ von L auf L mit k τ = k f¨ ur alle k ∈ K. Dies folgt mit K = K und σ = 1 aus Satz 4. Als n¨achstens zeigen wir — nicht Steinitz —, dass die Absch¨ atzung n! f¨ ur den Grad des Zerf¨allungsk¨ orpers bestm¨oglich ist. Dazu betrachten wir den K¨ orper ¨ ber K der rationalen Funktionen F := K(x1 , . . . , xn ) in den Unbestimmten xi u und den darin enthaltenen Teilk¨ orper S := SymK (x1 , . . . , xn ) der symmetrischen Funktionen. Dann ist K(x1 , . . . , xn ) : SymK (x1 , . . . , xn ) = n! nach Satz 7 von Abschnitt 4 des Kapitels 6. Ferner ist xn Nullstelle des Polynoms pn (y) :=
n
(−1)i λi (n)y n−i .
i:=0
Nach den S¨ atzen 5 und 7 von Kapitel 6, Abschnitt 4 sind 1, xn , x2n , . . . , xn−1 n u ¨ ber S linear unabh¨ angig. Folglich ist pn das Minimalpolynom von xn u ¨ ber S, so dass dieses Polynom u ¨ ber S irreduzibel ist. Es sei S[xn ] der von S und xn erzeugte Teilk¨ orper von F . Dann gilt im Polynomring in der Unbestimmten y u ¨ ber S[xn ] die Gleichung pn (y) = (y − xn )pn−1 (y). atzen 5 und 7 von Kapitel 6, Es gilt pn−1 (xn−1 ) = 0. Ferner gilt nach den S¨ Abschnitt 4, dass die xin−1 xjn mit 0 ≤ i ≤ n − 2 und 0 ≤ j ≤ n − 1 u ¨ ber S linear unabh¨ angig sind. Folglich sind 1, xn−1 , x2n−1 , . . . , xn−2 linear unabh¨ angig u ¨ ber n−1 ¨ ber S[xn ] und es gilt S[xn ]. Folglich ist pn−1 das Minimalpolynom von xn−1 u
S[xn ][xn−1 ] : S = n(n − 1).
220
Kapitel X. Steinitz
alSo fortfahrend sieht man, dass erst F das Polynom pn zerf¨allt, also der Zerf¨ lungsk¨ orper dieses Polynoms ist. Und nun weiter mit der Steinitzarbeit. Nennt man Grad eines Elementes den Grad seines Minimalpolynoms, so folgert Steinitz aus Satz 2 die G¨ ultigkeit von Satz 5. Es sei L eine endliche Erweiterung des K¨ orpers K. Ist ξ ein Element von L, so ist der Grad von ξ u ¨ber K Teiler von [L : K]. Beweis. Der Grad von ξ ist ja gleich [K[ξ] : K] und es gilt [L : K] = L : K[ξ] · K[ξ] : K . Klar ist auch Satz 6. Eine Erweiterung des K¨ orpers K ist genau dann endlich, wenn sie durch Adjunktion einer endlichen Anzahl u ¨ber K algebraischer Elemente erhalten werden kann. Satz 7. Ist L = K(S) und sind alle Elemente von S algebraisch u ¨ber K, so ist L algebraisch u ¨ber K. Beweis. Ist n¨amlich Φ die Menge der endlichen Teilmengen von S, so ist, wie im letzten Abschnitt gesehen, L=
$
K(T )
T ∈Φ
und alle K(T ) sind nach Satz 6 algebraisch u ¨ber K. Satz 8. Ist L eine Erweiterung des K¨ orpers K und ist M die Menge aller u ¨ber K algebraischen Elemente von L, so ist M ein Teilk¨ orper von L. Beweis. Nach Satz 7 ist K(M ) algebraisch u ¨ ber K. Folglich ist K(M ) ⊆ M und damit K(M ) = M . Satz 9. Ist L eine algebraische Erweiterung von K und M eine algebraische Erweiterung von L, so ist M algebraische Erweiterung von K. Beweis. Es sei β ∈ M und der Grad von β u ¨ ber L sei n. Es gibt dann a0 , . . . , an−1 ∈ L mit n−1 βn + ai β i = 0. i:=0
Setze K := K(a0 , . . . , an−1 ). Dann ist K (β) endlich u ¨ ber K und K ist nach ¨ber K. Folglich Satz 6 endlich u ¨ber K. Also ist auch K (β) nach Satz 2 endlich u ist β algebraisch u ¨ber K. Eine genauere Analyse der Zerf¨ allungsk¨ orper f¨ uhrte Steinitz zu den von ihm so genannten normalen Erweiterungen. Eine algebraische Erweiterung N des K¨orpers
3. Algebraische Erweiterungen
221
K heißt normal u ¨ ber K, wenn jedes u ¨ ber K irreduzible Polynom, welches in N eine Nullstelle hat, u ¨ ber N vollst¨andig in Linearfaktoren zerf¨ allt. Satz 10. Ist N normale Erweiterung des K¨ orpers K und ist L ein Zwischenk¨ orper von N : K, so ist N auch normal u ¨ber L. Beweis. Es sei ϕ ein irreduzibles Polynom aus L[x], welches in N eine Nullstelle j haben m¨ oge. Es sei ferner f das Minimalpolynom von j u ¨ ber K. Da N normal u ¨ ber K ist, zerf¨allt f u ¨ ber N in Linearfaktoren. Nun ist f aber auch Polynom ¨ u ¨ ber L, da ja K ⊆ L ist. Uberdies hat f mit dem u ¨ ber L irreduziblen Polynom ϕ in N die Nullstelle j gemein. Nach Lemme I von Galois ist daher ϕ Teiler von f , zerf¨allt also ebenfalls u ¨ ber N in lauter Linearfaktoren. orper, so heißt das Polynom f ∈ K[x] normal , wenn f irreduzIst K ein K¨ ibel und der K¨ orper K[x]/f K[x] normal ist. Ist f normal, so ist K[x]/f K[x] der Zerf¨allungsk¨ orper von f , wie unmittelbar aus der Definition hervorgeht, da f ja eine Nullstelle in diesem K¨orper hat. Von diesem Sachverhalt gilt auch die Umkehrung. Bei ihrem Beweis benutzt Steinitz den waringschen Satz, wie wir gleich sehen werden. Satz 11. Es sei K ein K¨ orper. Ist f ∈ K[x] irreduzibel, so ist f genau dann normal, wenn K[x]/f K[x] der Zerf¨ allungsk¨ orper von f ist. Beweis. Es ist nur noch zu zeigen, dass L := K[x]/f K[x] normal ist, wenn L der Zerf¨allungsk¨ orper von f ist. Es sei j eine Nullstelle von f in L. Dann ist nach Voraussetzung f = (x − j)(x − j1 ) · · · (x − jn−1 ) mit Elementen jk ∈ L. Es sei g ein u ¨ ber K irreduzibles Polynom und g habe eine Nullstelle α in L. Es gibt dann ein Polynom ϕ u ¨ ber K mit α = ϕ(j). Setze h(x) := x − ϕ(j) x − ϕ(j1 ) · · · x − ϕ(jn−1 ) . Steinitz sagt an dieser Stelle, man schließe nun in bekannter Weise, dass die Koeffizienten von h symmetrische Funktionen in j, j1 , . . . , jn−1 , also Elemente von K w¨aren. Er kommt also auch nicht ohne den waringschen Satz aus, den wir in Kapitel 6 bewiesen haben. Die Polynome h, g ∈ K[x] haben die Nullstelle α in L gemein. Weil g u ¨ ber K irreduzibel ist, ist nach dem galoisschen Lemma daher g Teiler von h, so dass g u ¨ ber L vollst¨andig in Linearfaktoren zerf¨ allt. Satz 12. Es sei f ein u ¨ber dem K¨ orper K normales Polynom. Ist L eine Erweiterung von K und ist g ∈ L[x] ein irreduzibler Faktor von f , so ist g normal u ¨ber L. Beweis. Es sei j eine Nullstelle von g in der Erweiterung L(j) von L. Dann ist K(j) ⊆ L(j), so dass f auf Grund seiner Normalit¨ at u ¨ ber K(j) und damit u ¨ber L(j) vollst¨andig in Linearfaktoren zerf¨ allt. Als Teiler von f zerf¨allt dann auch g u ¨ ber L(j) vollst¨andig in Linearfaktoren, so dass g nach Satz 11 normal ist.
222
Kapitel X. Steinitz
Satz 13. Es sei f ein Polynom u ¨ber dem K¨ orper K. Ist N der Zerf¨ allungsk¨ orper von f , so ist N normale Erweiterung von K. Beweis. Es sei f = (x − j1 ) · · · (x − jn ) und es sei g ∈ K[x] irreduzibel. Ferner sei β ein Nullstelle von g in N . Wegen N = K[j1 , . . . , jn ] gibt es ein ψ ∈ K[x1 , . . . , xn ] mit β = ψ(j1 , . . . , jn ). F¨ ur σ ∈ Sn definieren wir βσ durch βσ := ψ(jσ(1) , . . . , jσ(n) ) und setzen ϕ :=
(x − βσ ).
σ∈Sn
Dann ist ϕ symmetrisch in den βj , so dass nach dem waringschen Satz ϕ ∈ K[x] gilt. Nun ist x − β1 = x − β Faktor von ϕ und g in N [x]. Weil g in K[x] irreduzibel ist, ist daher g nach dem galoisschen Lemma Teiler von ϕ. Weil ϕ in N [x] vollst¨andig in Linearfaktoren zerf¨ allt, tut dies auch g. Folglich ist N normal. 4. Separable und inseparable Erweiterungen. Irreduzible Polynome u ¨ber K¨ orpern der Charakteristik 0 haben stets nur einfache Nullstellen. Bei K¨ orpern von Primzahlcharakteristik ist das nicht immer der Fall. Diesen Sachverhalt gilt es nun zu untersuchen. Gauß benutzt bei seinem zweiten Beweis des Fundamentalsatzes immer wieder auch die Ableitung eines Polynoms. Das war dort nicht problematisch, da die Polynome, die er betrachtete, Polynome u ¨ber R oder C waren, so dass ihm die Ergebnisse der Analysis u ¨ ber das Ableiten von Funktionen zur Verf¨ ugung standen. Bei Steinitz ist das nun anders. Er betrachtet ja Polynome u ¨ber beliebigen K¨ orpern und kann daher nicht mehr die Ableitung eines Polynoms mittels irgendwelcher Grenzprozesse definieren. Da die Ableitung eines Polynoms im Reellen wie im Komplexen ein sehr einfach zu beschreibender Ausdruck ist, ist es nahe liegend, die Ableitung eines Polynoms nach diesem Vorbild rein formal, wie er sagt, zu definieren. Ist also f = a0 + a1 x + . . . + an xn , so ist die Ableitung f von f definiert durch f := a1 + 2a2 x + . . . + nan xn−1 .
4. Separable und inseparable Erweiterungen
223
Es ist einfach nachzurechnen, dass (f + g) = f + g und
(f g) = f g + f g
ist. Auch die Kettenregel
f (g) = f (g)g
ist nicht schwer zu verifizieren. Steinitz verifiziert von diesen drei Regeln, die das Rechnen mit Ableitungen von Polynomen beherrschen, nur die mittlere. Ist R ∈ K(x), so gibt es Polynome u und v mit R = uv . Sind w und z weitere Polynome mit R = wz , so ist (1.)
uz = vw
und daher
u z + uz = v w + vw .
Es folgt u z − vw = v w − uz .
(2.)
Multipliziert man dies mit vz, so folgt (3.)
u vz 2 − v 2 w z = vz(v w − uz ).
Multipliziert man (1.) mit vz + v z, so erh¨alt man uzvz + uz 2 v = v 2 wz + vwv z und damit (4.)
z 2 uv − v 2 wz = vz(v w − uz ).
Mit (3.) und (4.) folgt nun z 2 (uv − u v) = v 2 (w z − wz ) und dann auch (5.)
uv − u v zw − z w = . v2 z2
Dies zeigt, dass man die Ableitung R von R durch R :=
uv − u v v2
224
Kapitel X. Steinitz
definieren kann. Es gelten dann auch f¨ ur rationale Funktionen die u ¨blichen Rechenregeln: die Produktregel, die Quotientenregel, die Kettenregel. Steinitz formuliert sie alle, u ¨ berl¨ asst ihre Beweise aber dem Leser. Satz 1. Es sei K ein K¨ orper und K(x), sei der Funktionenk¨ orper in der Unbestimmten x u ¨ber K. Ist R ∈ K(x), so ist genau dann R = 0, wenn entweder R ∈ K ist, oder aber, wenn die Charakteristik von K eine Primzahl p ist und es ein S ∈ K(x) gibt mit R = S(xp ). Ist R ∈ K[x] und R = 0, so findet man S mit R = S(xp ) bereits in K[x]. Beweis. Es sei R =
u v
reduziert. Dann ist uv − u v . v2
R =
Nun ist genau dann R = 0, wenn uv = u v ist. Weil u und v teilerfremd sind, folgt hieraus, dass v Teiler von v und u Teiler von u ist. Weil der Grad von v nicht kleiner oder gleich dem Grade von v sein kann, folgt daher v = 0 und ebenso u = 0. Sind andererseits u = 0 und v = 0, so ist R = 0. Es ist also die Frage, wann die Ableitung n eines Polynoms 0 ist. Es sei f = i:=0 ai xi ∈ K[x] und es gelte an = 0 und 0 = f =
n
iai xi−1 .
i:=1
Dann ist iai = 0 f¨ ur i := 1, . . . , n. Ist Char(K) = 0, so ist also ai = 0 f¨ ur i := 1, . . . , n, so dass f ∈ K gilt. Ist f ∈ K, so ist die Charakteristik p von K eine Primzahl. Es folgt ai = 0, falls i nicht durch p teilbar ist. Da an = 0 ist, ist p Teiler von n und mit m := np−1 folgt, dass f=
m
api xpi = g(xp )
i:=0
ist, wenn man nur g :=
m
api xi
i:=0
setzt. Ist umgekehrt f = g(xp ) mit einem g ∈ K[x], so ist f = g (xp )pxp−1 = 0. Zur¨ uck zu R. Es ist genau dann R = 0, wenn u = 0 und v = 0 ist. Dies ist genau dann der Fall, wenn einer der folgenden vier F¨ alle vorliegt: 1) Es ist u, v ∈ K. Dann ist R ∈ K.
4. Separable und inseparable Erweiterungen
225
2) Es ist u ∈ K und es gibt ein g ∈ K[x] mit v = g(xp ). In diesem Falle setzen wir f := u und S := fg . Dann ist S(xp ) =
u f (xp ) = = R. p g(x ) v
3) Es ist v ∈ K und es gibt ein f ∈ K[x] mit u = f (xp ). Hier setzen wir g := v und S := fg , womit wir das gew¨ unschte Ergebnis erhalten. 4) Es gibt f , g ∈ K[x] mit u = f (xp ) und v = g(xp ). Auch hier leistet S := das Verlangte.
f g
Wir weichen nun von der steinitzschen Arbeit ab, indem wir die folgenden S¨ atze statt f¨ ur Linearfaktoren f¨ ur beliebige irreduzible Faktoren beweisen. Satz 2. Es sei K ein K¨ orper. Ferner sei 0 = f ∈ K[x] und g sei ein u ¨ber K irreduzibles Polynom, welches f teilt. Schließlich sei f = g m h mit einem nicht durch g teilbaren Polynom h ∈ K[x]. Dann ist g m−1 Teiler von ggT(f, f ). Genau dann ist g m Teiler von ggT(f, f ), wenn die Charakteristik von K eine Primzahl p und dar¨ uber hinaus p Teiler von m oder aber g = 0 ist. Beweis. Es ist f = g m−1 (mg h + gh ), so dass in jedem Falle g m−1 Teiler von ggT(f, f ) ist. Weil g kein Teiler von h ist, ist genau dann g m Teiler von f , wenn g Teiler von mg . Dies ist aber genau dann der Fall, wenn mg = 0 ist. Hieraus folgt die Behauptung. Wir notieren als Korollar 1, was Steinitz an Stelle von Satz 2 formuliert hat. Korollar 1. Es sei K ein K¨ orper und f ∈ K[x] ein Polynom u ¨ber K. Ferner sei f = (x − a)m g mit a ∈ K und einem nicht durch x − a teilbaren Polynom g. Dann ist (x − a)m−1 Teiler von f . Genau dann ist (x − a)m Teiler von f , wenn die Charakteristik von K eine Primzahl p ist und m von p geteilt wird. Beweis. Dies folgt aus Satz 2, wenn man nur beachtet, dass die Ableitung des Polynoms x − a gleich 1 ist. Korollar 2. Es sei K ein K¨ orper. Ist dann 0 = f ∈ K[x], so ist f ggT(f, f ), falls die Charakteristik von K gleich 0 ist, das Produkt u ¨ber alle irreduziblen Faktoren von f und, falls die Charakteristik von K gleich p > 0 ist, gleich dem Produkt u ¨ber alle die Primfaktoren von f , deren Vielfachheit nicht durch p teilbar und deren Ableitung nicht 0 ist.
226
Kapitel X. Steinitz
Es bezeichne wieder r(a, b) den gr¨ oßten zu b teilerfremden Teiler von a. Das n¨ achste Korollar ist nur f¨ ur von 0 verschiedene Charakteristik interessant. Korollar 3. Es sei K ein K¨ orper der Charakteristik p > 0. Ferner sei 0 = f ∈ K[x]. Dann ist f r ggT(f, f ), ggT(f, f ) das Produkt u ¨ber alle g m mit den folgenden Eigenschaften: ochste Potenz von g, die in f aufgeht. a) g ist irreduzibel und g m ist die h¨ b) Es ist m ≡ 0 mod p oder g = 0. Betrachte den Funktionenk¨ orper K(x) in der Unbestimmten x u ¨ ber K. Dies ist der Quotientenk¨ orper von K[x]. Das Element x ist prim in K[x]. Nach dem sch¨onemannschen Irreduzibilit¨ atskriterium ist daher das Polynom g := y p − x irreduzibel u ¨ ber K(x). Ist nun p die Charakteristik von K, so ist g = py p−1 = 0. Es gibt also irreduzible Polynome, deren Ableitung 0 ist. Das Folgende ist wieder aus der steinitzschen Arbeit, wenn auch immer wieder etwas modifiziert, ohne dass dies explizit gemacht wird. Die Methoden sind aber die steinitzschen. Satz 3. Es sei K ein K¨ orper der Charakteristik p > 0. Ist f ein Polynom u ¨ber dem K¨ orper K, so gibt es genau dann eine endliche Erweiterung L von K und ein g ∈ L[x] mit f = g p , wenn es ein h ∈ K[x] gibt mit f = h(xp ). n Beweis. Es sei f = i:=0 ai xip mit ai ∈ K. Es gibt dann einen K¨ orper L, in urfen L = K[b0 , . . . , bn ] dem die Polynome xp − ai eine Nullstelle bi haben. Wir d¨ annehmen. Dann ist L eine endliche Erweiterung von K und es gilt f=
n
p i
bi x
,
i:=0
da ja das Potenzieren mit p ein Endomorphismus ist. Es sei umgekehrt L eine endliche Erweiterung von K und es gelte f = g(x)p n mit einem g ∈ L[x]. Ist g = i:=0 bi xi , so folgt f=
n
bpi xip .
i:=0
Es folgt ai := bpi ∈ K. Setzt man dann h := f = h(xp ).
n i:=0
ai xi , so ist h ∈ K[x] und
Es sei K ein kommutativer K¨ orper und f sei ein Polynom u ¨ ber K. Wir nennen f separabel u ¨ ber K, falls ggT(f, f ) = 1 ist, andernfalls inseparabel. Ist f irreduzibel, so ist f genau dann separabel, wenn f = 0 ist. Dies impliziert, dass irreduzible Polynome u ¨ ber K¨ orpern der Charakteristik 0 stets separabel sind.
4. Separable und inseparable Erweiterungen
227
Steinitz definiert Separabilit¨ at von irreduziblen Polynomen — und nur von solchen — u ¨ ber die Vielfachheiten der Nullstellen dieser Polynome in Erweite¨ rungsk¨ orpern von K. Er nennt im Ubrigen separable, irreduzible Polynome ganze Funktionen erster Art und inseparable, irreduzible Polynome ganze Funktionen zweiter Art , wie er u ¨ berhaupt von Polynomen als von ganzen Funktionen spricht. Die Namen separabel“ und inseparabel“ in diesem Zusammenhang gehen auf ” ” van der Waerden zur¨ uck (van der Waerden 1930, S. 114, Fußn. 2). Es sei weiterhin K ein K¨ orper der Charakteristik p > 0 und f sei ein irreduzibles Polynom u ¨ber K. Mittels Satz 3 erschließt man die Existenz von e ∈ N0 und e e+1 g ∈ K[y] mit f = g(xp ) und f = h(xp ) f¨ ur alle h ∈ K[y]. Wir nennen mit Steinitz e den Exponenten und Grad(g) den reduzierten Grad von f . Es gilt dann Grad(f ) = pe Grad(g). ¨ Uberdies ist g irreduzibel und g = 0. Wir bezeichnen den Exponenten von f auch mit exp(f ) und den reduzierten Grad mit redGrad(f ). Satz 4. Es sei K ein K¨ orper der Charakteristik p > 0 und es sei f ∈ K[x] irreduzibel. Ist L eine Erweiterung von K und ist a eine Nullstelle von f in L, so allt L das Polynom f , so ist der reduzierte ist pexp(f ) die Vielfachheit von a. Zerf¨ Grad von f die Anzahl der verschiedenen Nullstellen von f in L. Beweis. Setze e := exp(f ) und m := redGrad(f ). Ferner sei g ∈ K[y] und e f = g(xp ). Dann ist m = Grad(g). Ferner ist e
0 = f (a) = g(ap ), e
so dass ap Nullstelle von g ist. Es folgt die Existenz eines h ∈ K[y] mit g = e (y − ap )h. Es folgt weiter e
e
e
e
e
e
f = g(xp ) = (xp − ap )h(xp ) = (x − a)p h(xp ). e
Somit ist (x − a)p Teiler von f . Es sei M der Zerf¨allungsk¨ orper von g u ¨ ber L. Dann hat g wegen g = 0 lauter verschiedene Nullstellen in M . Diese seien b1 , . . . , bm . Es sei schließlich N der Zerf¨ allungsk¨ orper von e
e
e
(xp − b1 )(xp − b2 ) · · · (xp − bm ) e
u ¨ ber M . Es gibt dann c1 , . . . , cm ∈ N mit cpi = bi f¨ ur alle i. Weil die bi paarweise verschieden sind, sind es auch die ci . Ferner folgt e
f (ci ) = g(cpi ) = g(bi ) = 0. Mit der eingangs gemachten Bemerkung folgt e
e
f = (x − c1 )p · · · (x − cm )p t
228
Kapitel X. Steinitz
mit t ∈ N [x]. Wegen Grad(f ) = pe m folgt t ∈ N . Also haben die ci alle die Vielfachheit pe . Nun ist aber e
e
0 = f (a) = (a − c1 )p · · · (a − cm )p t, so dass es ein j gibt mit a = cj . Also hat a, wie behauptet, die Vielfachheit pe . Zerf¨ allt schließlich L das Polynom L, so folgt ci ∈ L f¨ ur alle i, so dass f in diesem Falle genau m Nullstellen in L hat. Es sei L eine Erweiterung des K¨ orpers K. Ferner sei a ∈ L algebraisch u ¨ber K. Ist das Minimalpolynom μa von a u ¨ ber K separabel, so heißt a separabel u ¨ ber K, andernfalls inseparabel . Der Exponent von μa heißt auch Exponent von a. Genau dann ist a separabel, wenn der Exponent von a gleich 0 ist. Die algebraische Erweiterung L von K heißt separabel u ¨ ber K, falls alle a ∈ L u ¨ ber K separabel sind, andernfalls inseparabel . Der K¨orper K heißt vollkommen, falls jede algebraische Erweiterung von K separabel u ¨ ber K ist, andernfalls unvollkommen. Ist K algebraisch abgeschlossen, so ist K vollkommen, da alle u ¨ ber K irreduziblen Polynome den Grad 1 haben, so dass ihre Ableitungen nicht null sind. Hat K die Charakteristik 0, so ist jedes u ¨ber K irreduzible Polynom separabel, wie wir schon bemerkten. Daher sind K¨ orper der Charakteristik 0 stets vollkommen. F¨ ur K¨ orper der Charakteristik p > 0 gilt: Satz 5. Es sei K ein K¨ orper der Charakteristik p > 0. Genau dann ist K vollkommen, wenn die Abbildung k → k p surjektiv ist. Beweis. Die Abbildung k → k p sei surjektiv. Ferner sei f ∈ K[x] und f = 0. Nach Satz 1 gibt es dann g0 , . . . , am ∈ K mit f=
n
ai xip .
i:=0
Es gibt weiter b0 , . . . , bm ∈ K mit bpi = ai f¨ ur alle i. Es folgt f=
m
bpi xpi =
i:=0
m
p bi xi
,
i:=0
so dass f nicht irreduzibel ist. Die Abbildung k → k p sei nicht surjektiv. Es gibt dann ein a ∈ K − K p . Setze f := xp − a. Es sei L der Zerf¨allungsk¨ orper von f u ¨ ber K. Es gibt dann ein b ∈ L ¨ ber K. Dann ist μ nach dem mit bp = a. Es sei μ das Minimalpolynom von b u galoisschen Lemma Teiler von f . In L[x] gilt f = xp − bp = (x − b)p und folglich μ = (x − b)i . Es folgt μ = (x − b)i =
i j:=0
(−1)i−j
i i−j j b x . j
4. Separable und inseparable Erweiterungen
229
Hieraus folgt insbesondere ib ∈ K. W¨ are i ≡ 0 mod p, so folgte b ∈ K und weiter a = bp ∈ K p . Also ist doch i ≡ 0 mod p und daher i = p. Es folgt f = μ, so dass f irreduzibel ist. Ferner ist f = pxp−1 = 0, so dass L u ¨ ber K inseparabel ist. Folglich ist K unvollkommen. Der Beweis von Satz 5 zeigt auch die G¨ ultigkeit des folgenden Korollars. Korollar. Ist K ein K¨ orper der Charakteristik p > 0 und ist a ∈ K − K p , so ist p das Polynom x − a irreduzibel. Dass es sowohl vollkommene wie unvollkommene K¨orper von Primzahlcharakteristik gibt, zeigt der n¨ achste Satz. Satz 6. a) Galoisfelder sind vollkommen. b) Ist K ein K¨ orper der Charakteristik p > 0 und ist x eine Unbestimmte u ¨ber K, so ist K(x) unvollkommen. Beweis. a) Die Abbildung k → k p ist injektiv und daher bei Galoisfeldern auch surjektiv. b) Wie wir nach dem Korollar 3 zu Satz 2 bemerkten, ist das Polynom yp − x irreduzibel u ¨ ber K(x) und die Ableitung dieses Polynoms ist null. Daher ist K(x) unvollkommen. Eine zentrale Rolle spielt in der Galoistheorie der folgende Satz, den Steinitz in zwei Etappen beweist, zuerst nur f¨ ur separable Erweiterungen und sp¨ ater dann f¨ ur den Fall, dass eines der erzeugenden Elemente inseparabel ist. Es ist der Satz vom primitiven Element. Satz 7. Der K¨ orper L entstehe aus dem K¨ orper K durch Adjunktion der alge¨ber K, so gibt es ein braischen Elemente a1 , . . . , at . Sind a2 , . . . , at separabel u ϑ ∈ L mit L = K[ϑ]. Beweis. Ist K endlich, so ist auch L endlich. Da die multiplikativen Gruppen endlicher K¨ orper zyklisch sind, gibt es in diesem Falle ein solches ϑ. Es sei also K unendlich. Der nun folgende Beweisteil scheint auf Hasse zur¨ uckzugehen. Jedenfalls ist er in den Anmerkungen der von Hasse und Baer besorgten Ausgabe der steinitzschen Arbeit angegeben (Anm. 78), wobei auf den zweiten Band des hasseschen Algebrabuches von 1926 verwiesen wird. Ist t = 1, so ist nichts zu beweisen. Es sei also t > 1 und der Satz gelte f¨ ur t − 1. Es gibt dann ein a ∈ L mit K[a1 , . . . , at−1 ] = K[a]. Setzt man b := at , so ist also L = K[a1 , . . . , at ] = K[a, b]. Es sei f das Minimalpolynom von a und g das Minimalpolynom von b u ¨ ber K. Nach Voraussetzung ist g separabel, hat also nur einfache Nullstellen in seinem Zerf¨ allungsk¨ orper. Es seien a = u1 , u2 , . . . , um die verschiedenen Nullstellen von
230
Kapitel X. Steinitz
f und b = v1 , v2 , . . . , vn die Nullstellen von g in einem f und g zerf¨allenden K¨ orper M oberhalb von L. Ist (i, k) = (s, t) und ist ui + cvk = us + cvt , so ist k = t, da andernfalls ui = us und damit i = s folgte. Dann ist aber c=
ui − us . vt − vk
Weil es nur endlich viele Elemente der Form ui − us vt − vk gibt, gibt es ein c ∈ K mit der Eigenschaft, dass aus ui + cvk = us + cvt folgt, dass i = s und k = t ist. Wir setzen ϑ := a + cb. Dann ist b Nullstelle von g und auch von f (ϑ − cx). Es sei nun vi eine Nullstelle von f (ϑ − cx). Dann ist u1 + cv1 − cvi = ϑ − cvi = uk f¨ ur ein passendes k, da die Nullstellen von f ja gerade die uj sind. Auf Grund der Wahl von c folgt i = 1 = k. Somit ist b die einzige gemeinsame Nullstelle von g und f (ϑ − cx). Der gr¨ oßte gemeinsame Teiler dieser beiden Polynome in K[ϑ][x] hat also die Form l(x − b) mit einem von null verschiedenen l ∈ K[ϑ]. Es folgt lb ∈ K[ϑ] und damit b ∈ K[ϑ]. Dann ist aber auch a = ϑ − cb ∈ K[ϑ], so dass K[a, b] ⊆ K[ϑ] ist. Trivialerweise gilt auch K[ϑ] = K[a + cb] ⊆ K[a, b], so dass in der Tat K[a, b] = K[ϑ] gilt. Wie ich schon sagte, beweist Steinitz diesen Satz zun¨achst nur f¨ ur separable a1 , . . . , at und sein Beweis nutzt dies aus, so dass der hassesche Beweis mehr liefert. Doch auch der steinitzsche Beweis liefert noch etwas, was der hassesche wiederum nicht tut, dass n¨ amlich auch ϑ separabel ist, wenn nur a1 , . . . , at es sind. Dies ist sehr wichtig, so dass es sich lohnt, diesen Satz eigens zu formulieren und zu beweisen. Satz 8. Der K¨ orper L entstehe aus K durch Adjunktion der u ¨ber K separablen ¨ber K separables Element ϑ mit L = K[ϑ]. Elemente a1 , . . . , at . Es gibt dann ein u Beweis. Weil endliche K¨orper vollkommen sind, sind alle u ¨ber einem endlichen K¨ orper algebraischen Elemente separabel, so dass wir uns in diesem Falle auf Satz 7 berufen k¨onnen. Es sei also K unendlich. Die gleiche Induktion wie beim Beweise von Satz 7 zeigt, dass wir annehmen d¨ urfen, dass t = 2 ist. Wir setzen wieder a := a1 und
4. Separable und inseparable Erweiterungen
231
ogen f , g, ui , vi , c und ϑ die gleiche Bedeutung haben wie beim b := a2 . Ferner m¨ Beweise von Satz 7. Es gen¨ ugt dann zu zeigen, dass ϑ separabel ist, da wir ja schon wissen, dass K[a, b] = K[ϑ] ist. Wegen der Separabilit¨ at von a und b ist f= g=
m
(x − ui ),
i:=1 n
(x − vi ).
i:=1
Daher sind die elementarsymmetrischen Funktionen in den ui und auch die elementarsymmetrischen Funktionen in den vj Elemente aus K. Wir setzen n m (x − ui − cvj ). h := i:=1 j:=1
Dann hat h auf Grund der Wahl von c lauter einfache Nullstellen und da h in den ui und den vj symmetrisch ist, ist h ∈ K[x]. Weil ϑ = u1 + cv1 Nullstelle von h ist, ist μϑ Teiler von h. Weil h nur einfache Nullstellen hat, hat dann auch μϑ nur einfache Nullstellen, so dass ϑ separabel ist. Was nun interessiert, ist, ob die Erweiterung K[ϑ] u ¨ ber K separabel ist, wenn ϑ es ist. Dies ist richtig, wie wir bald sehen werden. Satz 9. Es sei K ein K¨ orper der Charakteristik p > 0 und es sei L eine Erweiterung von K. Ferner sei a ∈ L algebraisch u ¨ber K und vom Exponenten e > 0. ¨ ist [K[a] : K[ap ]] = p. Dann ist ap vom Exponenten e − 1 in Bezug auf K. Uberdies e
e−1
Beweis. Es gibt ein Polynom g u ¨ ber K mit μa = g(xp ). Setze h := g(xp Dann ist e h(ap ) = g(ap ) = μa (a) = 0.
).
Wegen μa = h(xp ) und der Irreduzibilit¨ at von μa ist auch h irreduzibel. Also ist ¨ ber den Exponenten von ap . Ferner folgt h = μap . Dies beweist die Aussage u K[a] : K = npe , K[ap ] : K = npe−1 und hiermit
K[a] : K[ap ] = p.
Damit ist alles bewiesen. n F¨ ur Polynome f = i:=0 fi xi u ¨ ber einem K¨orper K der Charakteristik p > 0 definieren wir f ϕ durch n f ϕ := fip xi . i:=0
232
Kapitel X. Steinitz
ur alle Dann ist ϕ ein injektiver Endomorphismus von K[x]. Es gilt f ϕ (xp ) = f p f¨ f ∈ K[x]. Satz 10. Ist K ein K¨ orper der Charakteristik p > 0 und ist f ein separables, irreduzibles Polynom u ¨ber K, so ist auch f ϕ separabel und irreduzibel. Beweis. Es sei L eine Erweiterung von K, in der f eine Nullstelle a hat. Dann ¨ ber K Teiler ist f ϕ (ap ) = f (a)p = 0, so dass das Minimalpolynom μ von ap u von f ϕ ist. Dann ist μ(xp ) Teiler von f ϕ (xp ) = f p . Weil f irreduzibel ist, folgt μ(xp ) = f r mit 1 ≤ r ≤ p. Es folgt f¨ ur die Ableitung rf r−1 f = μ (xp )pxp−1 = 0. Weil f separabel ist, ist f = 0 und folglich auch f r−1 f = 0. Daher ist r durch p teilbar, so dass r = p ist. Also ist μ(xp ) = f p = f ϕ (xp ) und folglich μ = f ϕ , so dass f ϕ , wie behauptet, irreduzibel ist. Ist f inseparabel, so ist f = g(xp ). Es folgt f ϕ = g ϕ (xp ) = g p , so dass f ϕ nicht irreduzibel ist. Satz 11. Es sei K ein K¨ orper der Charakteristik p > 0 und L sei eine Erweiterung von K. Ist a ∈ L algebraisch u ¨ber K, so ist a genau dann separabel, wenn K[a] = K[ap ] ist. Beweis. Ist a inseparabel, so ist K[a] = K[ap ] nach Satz 9. Es sei a separabel und f sei das Minimalpolynom von a u ¨ ber K. Dann ist f separabel und irreduzibel. Nach Satz 10 ist dann auch f ϕ separabel und irreduzibel. Wegen seiner Irreduzibilit¨ at ist f ϕ das Minimalpolynom von ap u ¨ ber K. Hieraus folgt K[a] : K = Grad(f ) = Grad(f ϕ ) = K[ap ] : K und wegen K[ap ] ⊆ K[a] dann auch K[a] = K[ap ]. Satz 12. Es sei K ein K¨ orper und L sei eine algebraische Erweiterung von K und es gelte L = K[ϑ] mit einem ϑ ∈ L. Ist ϑ separabel, so ist L separabel u ¨ber K. Beweis. Es sei a ∈ L. Dann ist
L : K[a] K[a] : K = [L : K] = L : K[ap ] K[ap ] : K .
Nach Satz 11 ist L = K[ϑ] = K[ϑp ] und daher L : K[ap ] = K[ϑp ] : K[ap ] = K[ϑ] : K[a] = L : K[a] .
4. Separable und inseparable Erweiterungen
233
Hieraus folgt [K[a] : K] = [K[ap ] : K] und weiter K[a] = K[ap ], so dass a nach Satz 11 separabel ist. Satz 13. Es sei L Erweiterung des K¨ orpers K. Ist L0 die Menge der u ¨ber K orper von L. Ist l ∈ L − L0 algebraisch separablen Elemente von L, so ist L0 Teilk¨ e u ¨ber K und ist e der Exponent von l u ¨ber K, so ist e > 0 und lp ∈ L0 sowie i lp ∈ L0 f¨ ur i := 0, . . . , e − 1. Beweis. Wegen K ⊆ L0 ist L0 nicht leer. Es seien a, b ∈ L0 . Es gibt dann ein ¨ ber K separabel ist, ist K[a, b] ⊆ L0 nach ϑ ∈ L0 mit K[a, b] = K[ϑ]. Weil ϑ u Satz 11. Folglich sind a − b, ab und, falls a = 0 ist, a−1 als Elemente von K[a, b] separabel, geh¨oren also zu L0 . Somit ist L0 Teilk¨ orper von L. Dass l inseparabel u ¨ ber K ist, besagt die Definition von L0 . daher ist e > 0. i Mit Satz 9 folgt, dass der Exponent von lp gleich e − i ist. Damit folgt auch die G¨ ultigkeit der letzten Aussage des Satzes. Der K¨orper L ist in Bezug auf L0 das, was Steinitz einen Wurzelk¨ orper nennt, weil alle Elemente von L die Eigenschaft haben, dass eine pe -te Potenz von ihnen in L0 liegt. Dabei ist auch e = 0 zugelassen. Satz 14. Es sei L algebraische Erweiterung des K¨ orpers K und M algebraische Erweiterung von L. Ist M separabel u ¨ber K, so ist M auch separabel u ¨ber L. Beweis. Es sei a ∈ M . Ferner sei μa,K das Minimalpolynom von a u ¨ ber K und μa,L das Minimalpolynom von a u ¨ ber L. Dann ist μa,L in L[x] Teiler von μa,K . Weil μa,K in seinem Zerf¨allungsk¨ orper nur einfache Nullstellen hat, hat auch μa,L in diesem K¨ orper nur einfache Nullstellen, ist also separabel. Satz 15. Es sei L eine algebraische Erweiterung des K¨ orpers K und M algebraische Erweiterung von L. Ist L separabel u ¨ber K und M separabel u ¨ber L, so ist M separabel u ¨ber K. Beweis. Ist die Charakteristik von K gleich 0, so ist nichts zu beweisen. Es sei ¨ ber also Char(K) = p > 0. Es sei ferner M0 die Menge der Elemente von M , die u K separabel sind. Dann ist L ⊆ M0 . Weil M u ¨ ber L separabel ist, ist M nach Satz 14 auch separabel u ¨ber M0 . Es sei nun a ∈ M und es sei e der Exponent von e i au ¨ ber K. Dann ist ap ∈ M0 nach Satz 13. Weil ap f¨ ur alle i u ¨ ber M0 separabel ist, folgt mit Satz 10 die G¨ ultigkeit von 2
e
M0 [a] = M0 [ap ] = M0 [ap ] = . . . = M0 [ap ] = M0 . Somit ist a ∈ M0 und folglich M = M0 . Satz 16. Ist L eine algebraische Erweiterung des vollkommenen K¨ orpers K, so ist L vollkommen. Beweis. Es sei M eine algebraische Erweiterung von L. Dann ist M eine algebraische Erweiterung von K und demzufolge separabel. Nach Satz 14 ist M dann auch separabel u ¨ ber L, so dass L vollkommen ist.
234
Kapitel X. Steinitz
5. Einfache algebraische Erweiterungen. Ziel dieses Abschnitts ist vor allem zu zeigen, dass die einfachen algebraischen Erweiterungen genau diejenigen Erweiterungen sind, die nur endlich viele Zwischenk¨ orper besitzen. Dabei werden wir die nicht separablen Erweiterungen unter ihnen noch ein bisschen genauer untersuchen, wobei wir in unserer Darstellung wieder von der steinitzschen abweichen. Satz 1. Es sei L eine Erweiterung des K¨ orpers K. Genau dann gibt es zwischen K und L nur endlich viele Zwischenk¨ orper, wenn L endlich u ¨ber K ist und es ein ϑ ∈ L gibt mit L = K[ϑ]. Beweis. Enth¨alt L ein u ¨ ber K transzendentes Element τ , so sind K(τ n ) f¨ ur n ∈ N paarweise verschiedene Zwischenk¨ orper zwischen K und L, so dass L u ¨ ber K algebraisch ist, falls es nur endlich viele Zwischenk¨ orper gibt. Ist K endlich und ist L eine einfache algebraische Erweiterung von K, so ist auch L endlich und es gibt nur endlich viele Zwischenk¨ orper zwischen K und L. Es sei K weiterhin endlich und es gebe nur endlich viele Zwischenk¨ orper zwischen K und L. Dann ist L algebraisch u ¨ber K, wie wir eingangs sahen. Setze Φ := X | X = K[a], a ∈ L . Dann ist Φ endlich. # Weil jedes a ∈ L algebraisch ist, ist auch jedes X ∈ Φ endlich. ur alle a ∈ L ist L ⊆ M und Folglich ist M := X∈Φ X endlich. Wegen a ∈ K[a] f¨ daher auch L endlich. Dann ist aber L∗ zyklisch, so dass L einfache Erweiterung von K ist. Es sei K unendlich. Das folgende Argument lernte ich aus Artin 1968, der den Satz selbst etwas anders formulierte, indem er von vorneherein voraussetzt, dass L endliche Erweiterung von K sei. Es gebe nur endlich viele Zwischenk¨ orper zwischen K und L. Dann gibt es unter den endlich erzeugten Zwischenk¨orpern einen maximalen. Es sei M ein solcher. Ist a ∈ L, so ist auch M [a] endlich erzeugt und daher M = M [a]. Dies zeigt, dass L = M ist, so dass L endlich erzeugt ist. Es gibt also u1 , . . . , ut ∈ L mit L = K[u1 , . . . , ut ]. Ist t = 1, so sind wir fertig. Es sei also t > 1. Es gibt dann ein a ∈ L mit K[u1 , . . . , ut−1 ] = K[a]. Setze b := ut . Dann ist L = K[a, b]. Weil es nur endlich viele Zwischenk¨ orper gibt, K aber unendlich viele Elemente enth¨ alt, gibt es c, d ∈ K mit c = d und K[a + cb] = K[a + db]. Wir nennen diesen K¨ orper M . Dann ist (c − d)b ∈ M . Wegen c − d = 0 und c − d ∈ K ⊆ M ist b ∈ M . Dann ist aber auch a = a + cb − cb ∈ M und folglich L ⊆ M . Folglich ist L = M = K[a + cb]. Es sei umgekehrt L algebraisch u ¨ber K und L = K[a] mit einem a ∈ L. Es ¨ ber K. Ist M ein Zwischenk¨ orper zwischen sei μK das Minimalpolynom von a u
5. Einfache algebraische Erweiterungen
235
¨ ber M . Dann ist μM K und L, so bezeichne μM das Minimalpolynom von a u in L[x] Teiler von μK , wobei wir noch beachten, dass die Koeffizienten von μM sogar in M liegen. Mit Φ bezeichnen wir die Menge aller Teiler von μK in L[x], deren Leitkoeffizient gleich 1 ist. Dann ist Φ endlich und die Abbildung M → μM ist eine Abbildung der Menge der Zwischenk¨ orper in Φ. Es sei M0 der von den ¨ ber K erzeugte Zwischenk¨orper zwischen K und L. Weil Koeffizienten von μM u die Koeffizienten von μM in M liegen, ist K ⊆ M0 ⊆ M . Ferner ist μM ∈ M0 [x] ⊆ M [x] ¨ber M0 . Daher gilt wegen und μM ist auch irreduzibel u L = K[a] ⊆ M0 [a] ⊆ M [a] ⊆ L die Gleichung L = M0 [a] = M [a]. Es folgt [L : M ] = Grad(μM ) = [L : M0 ] und damit M = M0 , so dass die Abbildung M → μM injektiv ist. Weil Φ endlich ist, gibt es also auch nur endlich viele Zwischenk¨ orper. Damit ist alles bewiesen. Korollar 1. Ist L eine endliche, einfache Erweiterung von K, so ist auch jeder Zwischenk¨ orper zwischen K und L einfach u ¨ber K. Beweis. Ist M ein Zwischenk¨ orper zwischen K und L, so ist jeder Zwischenk¨ orper zwischen K und M auch ein solcher zwischen K und L. Es gibt also nur endlich viele Zwischenk¨ orper zwischen K und M , so dass M nach Satz 1 einfach u ¨ ber K ist. Weil endliche separable Erweiterungen stets einfach sind, gilt auch das folgende Korollar. Korollar 2. Ist L eine endliche, separable Erweiterung von K, so gibt es zwischen K und L nur endlich viele Zwischenk¨ orper. Satz 2. Es sei K ein K¨ orper der Charakteristik p > 0 und L sei eine algebraische Erweiterung von K. Ist e ∈ N0 , so setzen wir Le := a | a ∈ L, exp(a) ≤ e orper von L und es gilt Le ⊆ Le+1 f¨ ur alle e ∈ N0 . Insbesondere Dann ist Le Teilk¨ ist ∞ $ L= Le . e:=0 e
Beweis. Die erste Aussage folgt aus der Bemerkung, dass ap nach Satz 9 von Abschnitt 4 f¨ ur alle a ∈ Le in L0 liegt, dass das Potenzieren mit pe ein Endoorper ist. Die morphismus ist und dass L0 nach Satz 13 von Abschnitt 4 ein K¨
236
Kapitel X. Steinitz
zweite Aussage versteht sich von selbst und die letzte folgt daraus, dass L u ¨ ber K algebraisch ist, so dass jedes Element aus L einen Exponenten bzg. K hat. Gibt es ein e mit L = Le , so gibt es ein kleinstes solches e. Dieses e heißt dann Exponent von L u ¨ ber K. Gibt es kein solches e, so sagen wir L sei von unendlichem Exponenten u ¨ ber K. Ist L endliche Erweiterung von K, so hat L einen endlichen Exponenten u ¨ber K. Satz 3. Es sei K ein K¨ orper der Charakteristik p > 0. Ferner sei L eine algebraische Erweiterung vom Exponenten e und es gelte 1 ≤ e Ist dann i < e und ist orper. [Li+1 : Li ] > p, so gibt es zwischen Li und Li+1 unendlich viele Zwischenk¨ Beweis. Es sei a ∈ Li+1 − Li . Mit dem Korollar zu Satz 5 von Abschnitt 2 folgt, dass das Polynom xp − ap u ¨ ber Li irreduzibel ist, da es in K¨ orpern der Charakteristik p stets h¨ochstens eine p-te Wurzel gibt, a aber nicht in Li liegt. G¨ abe es nun nur endlich viele Zwischenk¨ orper zwischen Li+1 und Li , so g¨abe es ein ϑ ∈ Li+1 mit Li+1 = Li [ϑ]. Es folgte μϑ = xp − ϑp und damit der Widerspruch [Li+1 : Li ] = p. Dass es die in Satz 3 beschriebene Situation tats¨ achlich gibt, zeigt folgendes orper der Charakteristik p > 0. Ferner sei L der FunkBeispiel. Es sei K0 ein K¨ tionenk¨ orper K0 (x, y) in den Unbestimmten x und y u ¨ ber K0 . Schließlich sei K = K0 (xp , y p ). Dann ist L1 = L und L0 = K. Ferner ist K = K0 (xp , y p ) ⊆ K0 (xp , y) ⊆ L. Wegen K0 (xp , y p ) = K0 (xp )(y p ) und K0 (xp , y) = K0 (xp )(y) folgt durch Gradvergleich, dass y ∈ K(xp , y p ) ist. Entsprechend folgt x ∈ K(xp , y). Damit folgt [L1 : L0 ] = L1 : K0 (xp , y) K0 (xp , y) : L0 = p2 > p. orper. Nach Satz 3 liegen daher zwischen Li und Li+1 unendlich viele Zwischenk¨ Satz 4. Es sei K ein K¨ orper der Charakteristik p > 0 und L sei eine endliche Erweiterung von K. Genau dann ist L einfach u ¨ber K, wenn [Li+1 : Li ] = p ist f¨ ur alle i := 0, . . . , e − 1. Dabei bezeichne e den Exponenten von L u ¨ber K. Beweis. Da e der Exponent ist, ist [Li+1 : Li ] ≥ p f¨ ur alle i < e. Ist L einfach, so gibt es nur endlich viele Zwischenk¨ orper zwischen K und L. Mit Satz 3 folgt daher [Li+1 : Li ] ≤ p f¨ ur alle i. ur i := 0, . . . , e − 1. Ferner sei b ∈ Le − Le−1 . Nach Satz Es sei [Li+1 : Li ] = p f¨ 9 von Abschnitt 4 ist dann i
bp ∈ Le−i − Le−i−1 i
f¨ ur i := 0, . . . , e − 1. Daher ist Le−i = Le−i−1 [bp ], da ja der Grad von Le−i u ¨ ber Le−i−1 gleich p ist, so dass es keinen echten Zwischenk¨orper zwischen diesen beiden ¨ ber K separabel und u ¨ berdies K¨ orpern gibt. Dann ist aber L = L0 [b]. Weil L0 u
6. Der Satz von L¨ uroth
237
endlich ist, gibt es ein a ∈ L0 mit L0 = K[a]. Es folgt L = K[a, b] = K[b, a]. Weil a u ¨ ber K separabel ist, gibt es nach Satz 7 von Abschnitt 4 ein ϑ ∈ L mit L = K[ϑ]. Damit ist alles beweisen. Bei Steinitz folgt nun ein Abschnitt u ¨ber Galoisfelder. Seine Konstruktion der n Galoisfelder benutzt, dass sie die Zerf¨ allungsk¨ orper von xp −x sind. Er zeigt nicht, dass die multiplikative Gruppe eines endlichen K¨ orpers zyklisch ist. Die Existenz primitiver Elemente erh¨alt er auf andere Weise. F¨ ur uns geschieht dort sonst nichts Neues. 6. Der Satz von L¨ uroth. Wir hatten im letzten Abschnitt gesehen, dass bei einer einfachen algebraischen Erweiterung auch jeder Zwischenk¨ orper eine einfache Erweiterung des Grundk¨ orpers ist. Dieser Satz gilt auch f¨ ur einfach transzendente Erweiterungen, wie als erster L¨ uroth f¨ ur einen schlecht zu identifizierenden Spezialfall und dann auch nicht in voller Allgemeinheit gezeigt hat. Er schreibt (L¨ uroth 1875): Wenn die Coordinaten einer Curve sich darstellen lassen als rationale Func” tionen eines Parameters λ, so entspricht stets jedem Werth von λ nur ein Punkt der Curve, dagegen braucht nicht immer jedem Punkt der Curve nur ein Werth zu entsprechen, wie das Beispiel der Gleichungen x = λ2 , y = λ12 zeigt. Wenn nun jedem Punkt einer rationalen Curve n Werthe von λ entsprechen, so kann man stets f¨ ur λ eine neue Variable so einf¨ uhren, dass deren Werthe und die Punkte der Curve sich gegenseitig eindeutig entsprechen.“ Wenn man den Beweis dieses Satzes analysiert, so sieht man, dass er in Wirklichkeit Folgendes liefert: Ist K ein K¨ orper der Charakteristik 0, ist K(x) der K¨ orper der rationalen Funktionen in der Unbestimmten x u ¨ ber K und sind a1 , . . . , at ∈ K(x), so gibt es ein b ∈ K(x) mit K(a1 , . . . , at ) = K(b). Dass die Charakteristik 0 ist, wird an einer Stelle des Beweises wesentlich benutzt, n¨ amlich bei dem Schluss, dass aus f ∈ K(x) und f = 0 folgt, dass f ∈ K ist, was bei Charakteristik p > 0 nicht mehr richtig ist, wie wir wissen. Auch der nettosche Beweis dieses Satzes benutzt, dass die Charakteristik 0 ist, da er sich des arithmetischen Mittels bedient und folglich durch n dividiert, wobei f¨ ur n alle nat¨ urlichen Zahlen in Frage kommen (Netto 1896). Erst Steinitz bewies den heute so genannten Satz von L¨ uroth in voller Allgemeinheit. Wir reproduzieren hier seinen Beweis. Um nicht sp¨ater Beweisteile zitieren zu m¨ ussen, strukturieren wir ihn etwas auff¨ alliger als dies Steinitz tat. Satz 1. Es sei K ein K¨ orper und t und y seien Unbestimmte u ¨ber K. Sind f , g ∈ K[t] teilerfremd, so ist das Polynom f − yg irreduzibel. Beweis. Es sei f − yg = uv mit u, v ∈ K[t, y]. Weil f − yg in y den Grad 1 hat und K[t, y] = K[t][y] ist, ist oBdA u ∈ K[t]. Dann ist u aber gemeinsamer Teiler von f und g, so dass u Einheit ist, also in K liegt. Damit ist der Satz bewiesen.
238
Kapitel X. Steinitz
Korollar. Es sei K ein K¨ orper und f und g seien von 0 verschiedene, teilerfremde / K. Dann ist vom Leitkoeffizienten abgesehen, Polynome aus K[x] und es gelte fg ∈ der nicht notwendig gleich 1 ist, μ := f (t) −
f (x) g(t) g(x)
das Minimalpolynom von x u ¨ber K( fg ). Außerdem gilt % & f K : K = max Grad(f ), Grad(g) . g Beweis. Es ist μ = 0 und μ(x) = 0. Weil x u ¨ ber K nicht algebraisch ist, ist (x) transzendent u ¨ ber K. Daher folgt mit Satz 1 die Irreduzibilit¨ at von μ, daher fg(x) wenn man dort y durch
f (x) g(x)
ersetzt. Hieraus folgt alles Weitere.
Satz 2. Es sei K ein K¨ orper und x und t seien Unbestimmte u ¨ber K. Sind f , g ∈ K[x] teilerfremd und hat wenigstens eines der beiden Polynome einen Grad gr¨ oßer als 0, so ist das Polynom g(x)f (t) − f (x)g(t) in x und auch in t primitiv. m n Beweis. Es sei f (x) = i=0 ai xi und g = i:=0 bi xi . Indem wir nicht darauf bestehen, dass Leitkoeffizienten ungleich null sind, d¨ urfen wir annehmen, dass m = n ist. Dann ist g(x)f (t) − f (x)g(t) =
n n ai g(x) − bi f (x) ti = c i ti . i:=0
i:=0
Jeder gemeinsame Teiler v der ci teilt auch alle ci bk − ck bi = ai g(x) − bi f (x) bk − ak g(x) − bk f (x) bi = (ai bk − ak bi )g(x) und
ci ak − ck ai = ai g(x) − bi f (x) ak − ak g(x) − bk f (x) ai = (ai bk − ak bi )f (x).
Weil f und g teilerfremd und weil die Grade von f und g nicht beide 0 sind, sind die Koeffizientenfolgen von f und g nicht linear abh¨ angig. Daher gibt es i und k, so dass ai bk − ak bi = 0 ist. Somit teilt v auch f und g, ist also eine Einheit. Dies
6. Der Satz von L¨ uroth
239
zeigt, dass g(x)f (t) − f (x)g(t) in x primitiv ist. Wegen der Symmetrie in x und t ist dieses Polynom dann auch in t primitiv. Bei diesem Beweis haben wir auf ein Ergebnis der linearen Algebra zur¨ uckgegriffen. Steinitz erw¨ ahnt hier nichts, sagt vielmehr bloß, dass es i und k g¨abe, so dass ai bk −ak bi = 0 ist. Am Anfang seiner Arbeit sagt er jedoch, dass alle S¨atze der Determinantentheorie nur auf den von ihm angegebenen K¨ orperaxiomen basieren, also f¨ ur alle K¨ orper g¨ ultig seien, wobei er die zwei grundlegenden S¨ atze aus der Gleichungslehre ausdr¨ ucklich formuliert. Satz von L¨ uroth. Ist K ein K¨ orper und ist K(x) der Funktionenk¨ orper in der Unbestimmten x u ¨ber K, so gibt es zu jedem Zwischenk¨ orper L zwischen K und K(x) ein u ∈ L mit L = K(u). Beweis. Es sei L ein K¨ orper zwischen K und K(x). Ist L = K, so ist L = K(1). Es sei also L = K. Es gibt dann ein y ∈ L − K. Es folgt K(x) = K(y)(x). ϕ eine Darstellung von y mit teilerfremden ϕ und ψ. Wegen y ∈ K Es sei y = ψ ist m := Grad(y) ≥ 1. Es sei t eine Unbestimmte u ¨ ber K(y). Wir betrachten das Polynom G(t) := ϕ(t) − yψ(t) ∈ K(y)[t].
Dann ist G in t vom Grad m. Weil y u ¨ ber K transzendent ist, ist G nach Satz 1 irreduzibel u ¨ ber K(y). Ferner ist G(x) = ϕ(x) − yψ(x) = ϕ(x) −
ϕ(x) ψ(x) = 0, ψ(x)
so dass x u ¨ ber K(y) algebraisch ist. Somit ist K(x) = K(y)[x]. Weil G irreduzibel ist, folgt weiter [K(x) : K(y)] = m. Wegen K(y) ⊆ L ist auch K(x) endlich u ¨ber L. Setze n := K(x) : L . Es sei μ ∈ L[t] das Minimalpolynom von x u ¨ ber L. Dann ist n = Grad(μ). Weil x u ¨ ber K transzendent ist, gibt es einen Koeffizienten u von μ, der nicht in K liegt. Es sei m der Grad von u. Ferner sei n
μ=t +
n−1
c i ti .
i:=0
Es gibt dann ein in x primitives Polynom π(t) =
n i:=0
ai (x)ti ∈ K[x, t]
240
Kapitel X. Steinitz
mit an (x)μ(t) = π(t). Es gibt weiter ein i mit 0 ≤ i < n und u = aani (x) ur den Grad in x dieses (x) . Also gilt f¨ Polynoms die Ungleichung Gradx (π) ≥ m. Es sei u = von
f g
eine Darstellung von u mit teilerfremden f und g. Dann ist x Nullstelle H(t) := f (t) − ug(t) ∈ L[t].
Dieses Polynom ist also durch μ teilbar. Es folgt, dass das nach Satz 2 in x primitive Polynom g(x)H(t) = g(x)f (t) − f (x)g(t) durch π teilbar ist. Auf Grund des gaußschen Lemmas gibt es also ein in x primitives Polynom ψ mit g(x)f (t) − f (x)g(t) = πψ. Nun ist die linke Seite vom Grade m in x, w¨ ahrend π in x mindestens den Grad m hat. Also hat π in x den Grad m und ψ hat in x den Grad 0. Also ist ψ ∈ K[t]. Weil die linke Seite in t primitiv ist, folgt weiter ψ ∈ K. Die linke Seite der letzten Gleichung hat in t ebenfalls den Grad m, so dass auch π in t den Grad m hat. Andererseits hat π in t den Grad n. Also ist m = n. Es folgt K(x) : L = Grad(μ) = n = m = Grad f (t) − ug(t) = K(x) : K(u) und weiter L = K(u). Damit ist der l¨ urothsche Satz bewiesen. Der ursp¨ ungliche l¨ urothsche Beweis wie auch der nettosche lieferten nur, dass endlich erzeugte Zwischenk¨ orper einfache Erweiterungen von K sind. Der steinitzsche Beweis zeigt implizit, dass man sich darauf in der Tat beschr¨anken kann. Es ist ja K(x) = K(u)[x] eine einfache Erweiterung von K(u), so dass nach Korollar 1 zu Satz 1 von Abschnitt 5 der Zwischenk¨ orper L eine einfache Erweiterung von K(u) ist. Es gibt daher ein v ∈ L mit L = K(u)[v] = K(u, v). Jeder Zwischenk¨ orper ist also endlich erzeugt. Auf diese Bemerkung werden wir noch einmal zur¨ uckkommen. Der steinitzsche Beweis ist n¨amlich ein reiner Existenzbeweis. Er gibt keinerlei Hinweise, wie man das Minimalpolynom von x u ¨ ber L berechnen kann. Die urspr¨ unglichen Beweise von L¨ uroth und Netto sind dagegen konstruktiv, machen aber davon Gebrauch, dass die Charakteristik 0 ist. Wir werden in Kapitel 14 noch einen konstruktiven Beweis von Karst (Karst 1991) vorf¨ uhren, der mit Hilfe der galoisschen Theorie die Klippe der Charakteristik umschifft (Kap. 14, Absch. 3).
7. Der petersonsche Algorithmus
241
7. Der petersonsche Algorithmus. Wir unterbrechen unsere Beschreibung der steinitzschen Arbeit f¨ ur einen kurzen Augenblick und wenden uns noch einmal einem Thema zu, das wir in Abschnitt 8 des Kapitels 6 schon behandelt haben. Dort haben wir gezeigt, dass ein Polynom in einer Unbestimmten u ¨ber einem vollkommenen K¨ orper Produkt von Polynomen ist, deren Diskriminante nicht null ist (Korollar zu Satz 3). K¨ orper der Charakteristik null sind allesamt vollkommen, so dass alle Polynome u ¨ ber einem solchen K¨ orper Produkte von Polynomen mit nicht verschwindender Diskriminante sind. Dies haben wir bei dem zweiten gaußschen Beweise des Fundamentalsatzes der Algebra benutzt. Der Beweis dieses Sachverhaltes dort war ein reiner Existenzbeweis. Im Falle eines K¨ orpers der Charakteristik null l¨ asst sich eine solche Zerlegung stets konstruktiv angeben, vorausgesetzt man beherrscht die Arithmetik in dem zu Grunde liegenden K¨ orper. Eine auf Satz 4 von Abschnitt 2 basierende Konstruktion, die sich in dem schon fr¨ uher erw¨ahnten Algebrabuch von Julius Petersen findet (Petersen 1878, S. 25–27), sei hier wiedergegeben. Es sei f ein Polynom u ¨ber einem K¨orper der Charakteristik null. Ferner sei Pi das Produkt u ¨ber alle irreduziblen Teiler von f , die f mit der Vielfachheit i teilen. Gibt es keinen solchen Teiler, so ist nat¨ urlich Pi = 1. Dann gilt, wenn n der Grad von f ist, f = P1 P22 P33 · · · Pnn und die Pi sind paarweise teilerfremd. Nach Satz 2 von Abschnitt 4 ist, da die Charakteristik von K gleich null ist, f1 := ggT(f, f ) = P21 P32 · · · Pnn−1 und weiter g1 := Setzt man
f = P1 P2 · · · Pn . f1
f2 := ggT(f1 , f1 ) = P31 P42 · · · Pnn−2
und g2 :=
f1 = P2 P3 · · · Pn , f2
so ist P1 =
g1 . g2
Petersen treibt dieses Verfahren noch einen Schritt weiter und berechnet P2 , um dann zu sagen: Fortsetzung des Verfahrens liefert nach und nach die Glei” ur die damalige Zeit typische chungen P1 = 0, P2 = 0, P3 = 0, . . . “. Diese f¨ P¨ unktchenrekursion formulieren wir heute so. Input: Ein Polynom f mit Grad(f ) > 0 u ¨ber einem K¨ orper der Charakteristik 0. Output: Eine nat¨ urliche Zahl r und paarweise teilerfremde und quadratfreie Polynome Q1 , . . . , Qr mit f = Q1 Q22 · · · Qrr .
242
Kapitel X. Steinitz
Bemerkungen. Mit den oben definierten Polynomen gilt P1 = Q1 , . . . , Pr = Qr , Pr+1 = 1, . . . , Pn = 1. Von der Bedingung, dass f einen von 0 verschiedenen Grad hat, kann man sich leicht befreien, indem man in diesem Fall Q1 := f setzt und die while-Schleife u ¨berspringt. begin n := Grad(f ); m := 0; i := 1; f1 := f ; % Um f zu retten. % f1 = P11 P22 · · · Pnn . f2 := ggT(f1 , f1 ); g1 := ff12 ; % g1 = P1 P2 · · · Pn . while m < n do i := i + 1; % g1 = Pi−1 Pi · · · Pn . f1 := f2 ; 2 % f1 = Pi Pi+1 · · · Pnn−i+1 . f2 := ggT(f1 , f1 ); 2 % f2 = Pi+1 Pi+2 · · · Pnn−i . f1 g2 := f2 ; % g2 = Pi Pi+1 · · · Pn . Qi−1 := gg12 ; % Qi−1 = Pi−1 . m := m + (i − 1)Grad(Qi−1 ); % m = Grad(Q1 Q22 · · · Qi−1 i−1 ). g1 := g2 % g1 = Pi Pi+1 · · · Pn . endwhile; r := i − 1; % n = m = Grad(Q1 Q22 · · · Qrr ) % Q1 = P1 , Q2 = P2 , . . . , Qr = Pr , Pr+1 = 1, . . . , Pn = 1. % f = Q1 Q22 · · · Qrr . end; Algorithmen, die ein Polynom f in das Produkt Q1 Q22 · · · Qrr der im petersenschen Algorithmus beschriebenen Art zerlegten, standen in den 70er und 80er Jahren des 20. Jahrhunderts auf der Tagesordnung der Computer-Algebra. In keiner der Arbeiten, die ich mir ansah, wurde Petersen erw¨ ahnt. Ich h¨ atte ihn auch u ¨ bersehen, h¨atte Kollege Vollrath mir nicht sein Exemplar der petersenschen Algebra f¨ ur eine Weile u ¨ berlassen. Der an den damals vorgeschlagenen Algorithmen interessierte Leser sei an die Arbeiten Horowitz 1971, Kaltofen 1982, Musser 1975 und Wang & Trager 1979 verwiesen.
XI. Transfinite Methoden 1. Auswahlaxiom und Wohlordnungsprinzip. Unser n¨ achstes Ziel ist, den von Steinitz stammenden Satz zu beweisen, dass jeder kommutative K¨orper einen algebraischen Abschluss hat. Das geht nun nicht mehr alleine mit den bislang be¨ nutzten Hilfsmitteln der Mengenlehre, deren Axiome wir im Ubrigen nicht explizit formuliert haben und auch im weiteren Verlauf nicht explizit machen werden, es bedarf hierzu vielmehr transfiniter Hilfsmittel, die wir zun¨ achst bereitstellen und diskutieren werden. Im 19. Jahrhundert kamen zu den wenigen, seit Jahrhunderten untersuchten Strukturen viele weitere hinzu, die die Aufmerksamkeit der Mathematiker auf sich zogen. Sie f¨ uhrten zwangsl¨ aufig, so scheint es mir, auf den Mengenbegriff, zumal noch anderes hinzukam. Fourier untersuchte in seinem Buch Th´eorie analytique de la chaleur , das seine bis ins Jahr 1808 zur¨ uckgehenden Publikationen zur W¨ armeleitung zusammenfasste, die Differenzialgleichung ∂2ϕ ∂2ϕ + = 0, ∂x2 ∂y 2 wobei ϕ noch die Randbedingungen π π ϕ x, − = 0 = ϕ x, 2 2 f¨ ur alle x ≥ 0 und ϕ(0, y) = 1 −π 2
π 2
< y < erf¨ ullen sollte (Fourier 1822/1988, Chap. III, S. 159ff.). f¨ ur alle y mit Fourier sucht zun¨ achst nach m¨ oglichst einfachen L¨ osungen der Differenzialgleichung und setzt dazu an, dass ϕ(x, y) = F (x)f (y) sei. Er erh¨alt Differenzialgleichungen f¨ ur F und f , die auf F (x) = e−mx und f (y) = cos my f¨ uhren, wobei die physikalischen Gegebenheiten erzwingen, dass m eine positive reelle Zahl ist. Nun sind noch die Randbedingungen zu erf¨ ullen. Zu diesem Zweck kombiniert Fourier einige der speziellen L¨ osungen, indem er — auf Einzelheiten seiner Argumentation sei hier verzichtet — ϕ(x, y) :=
∞ 4 (−1)n e−(2n+1)x cos(2n + 1)y π n:=0
244
Kapitel XI. Transfinite Methoden
setzt. Und das Wunder geschieht, dass ϕ das Problem l¨ ost. Insbesondere gilt ∞ π = (−1)n cos(2n + 1)y 4 n:=0
urzt man die rechte Seite mit f (y) ab, so gilt, dass f¨ ur alle y mit − π2 < y < π2 . K¨ f (y) f¨ ur alle y konvergiert. Ferner gilt f (y + 2π) = f (y) f¨ ur alle y sowie π π f − =0=f 2 2 und f (y) = −
π 4
f¨ ur alle y mit π2 < y < 3π 2 . Alle diese Ergebnisse finden sich bei Fourier. Hier geschieht nun Erstaunliches. Die Reihe ∞
(−1)n cos(2n + 1)y
n:=0
stellt eine Funktion dar, die die Mathematiker des 18. Jahrhunderts wohl nur unter dem Zwang der Beweislage als Funktion angesehen h¨atten. Sie ist an den Stellen π 2 +zπ gleich 0 und auf den offenen Intervallen zwischen diesen Stellen abwechselnd gleich π4 und − π4 . Fourier bleibt nicht bei dieser Funktion stehen. Er will beliebige Funktionen“ ” (fonctions arbitraires) in Reihen nach sin nx oder cos nx entwickeln. Dazu beginnt er mit Funktionen, die sich in Potenzreihen entwickeln lassen. Will er diese nun in Reihen nach sin nx entwickeln, muss er abz¨ahlbar viele lineare Gleichungen in abz¨ ahlbar vielen Unbekannten l¨ osen. Dies nachzuvollziehen ist ein Genuss, f¨ uhrte uns hier aber zu weit von unserem Ziel hinweg. Nachdem dies gemacht ist, bemerkt er, dass man die Koeffizienten der trigonometrischen Reihen auch mittels der Integrale ' π
f (x) cos nx dx 0
bzw.
'
π
f (x) sin nx dx 0
berechnen kann. Dies ist nat¨ urlich ein Gewinn. Es gen¨ ugt n¨ amlich nun vorauszusetzen, dass f auf dem Intervall 0 bis π integrierbar ist. Er sagt dies zwar, k¨ ummert sich aber weiter nicht um Integrierbarkeitsfragen. Er entwickelt dann eine Reihe von f¨ ur die damalige Zeit ungew¨ ohnliche Funktionen in Fourierreihen“. Hier einige ” Beispiele: c f¨ ur 0 ≤ x ≤ α f (x) := 0 f¨ ur α < x ≤ π
1. Auswahlaxiom und Wohlordnungsprinzip
oder f (x) :=
oder f (x) := oder
( f (x) :=
sin x 0
f¨ ur 0 ≤ x ≤ α f¨ ur α < x ≤ π
( π2 )2 − x2 0 x α π−x
245
f¨ ur 0 ≤ x ≤ α f¨ ur α < x ≤ π
f¨ ur 0 ≤ x ≤ α f¨ ur α < x ≤ π − α f¨ ur π − α < x ≤ π.
Im letzten Fall besteht der Graph aus drei Seiten eines Trapezes. Bei all diesen Definitionen wird f aus Teilen anderer Funktionen zusammengest¨ uckelt. Demzufolge kommentiert Fourier: On voit par-l` a qu’il est n´ecessaire d’admettre dans l’analyse des fonctions qui ” ont des valeurs ´egales, toutes les fois que la variable re¸coit des valeurs quelconques comprises entre deux limites donn´ees, tandis qu’en substituant dans ces deux fonctions, au lieu de la variable, un nombre compris dans un autre intervalle les r´esultats des deux substitutions ne sont point les mˆemes (Fourier 1822/1988, S. 250).“ Man musste sich also Gedanken u ¨ ber den Funktionsbegriff machen und diesen neu definieren. Auch Begriffe wie Stetigkeit, Differenzier- und Integrierbarkeit mussten im Lichte des neuen Funktionsbegriffs pr¨ azise gefasst werden. Dies wiederum Zwang dazu, sich u ¨ ber den Begriff der reellen Zahl ins Reine zu kommen. All dies wurde im 19. Jahrhundert in Angriff genommen und auch f¨ ur uns noch befriedigend gel¨ost. Einiges davon haben wir in diesem Buche gesehen. Worauf Fourier u ¨berhaupt nicht eingeht, ist die Frage, ob die fouriersche Reihe f¨ ur f , deren Koeffizienten er mittels obiger Integrale berechnet hat, u ¨ berhaupt konvergiert, und, wenn ja, ob sie gegen den entsprechenden Funktionswert konvergiert. Ferner, was passiert, wenn ∞ ∞ b b0 + (an sin nx + bn cos nx) = 0 + (an sin nx + bn cos nx) 2 2 n:=1 n:=1
f¨ ur alle x zwischen 0 und 2π gilt und beide Reihen f¨ ur alle diese x konvergieren. Erst G. Cantor zeigte, dass diese Voraussetzungen zur Folge haben, dass ai = ai ist f¨ ur alle i ∈ N und bi = bi f¨ ur alle i ∈ N0 (Cantor, G. 1870). Zwei Jahre sp¨ ater publizierte er eine bemerkenswerte Arbeit zum gleichen Thema, die ihn zu dem Begriff der transfiniten Ordinalzahl f¨ uhrte. Dort definiert er: Unter einem Grenzpunkt einer Punktmenge P verstehe ich einen Punkt der ” Geraden von solcher Lage, dass in jeder Umgebung desselben unendlich viele Punkte aus P sich befinden, wobei es vorkommen kann, dass er ausserdem selbst zu der Menge geh¨ ort. Unter Umgebung eines Punktes sei aber hier ein jedes Intervall verstanden, welches den Punkt in seinem Innern hat. Darnach ist es leicht zu
246
Kapitel XI. Transfinite Methoden
beweisen, dass eine aus einer unendlichen Anzahl von Punkten bestehende Punktmenge stets zum Wenigsten einen Grenzpunkt hat. Es ist nun ein bestimmtes Verhalten eines jeden Punktes der Geraden zu einer gegebenen Menge P , entweder ein Grenzpunkt derselben oder kein solcher zu sein, und es ist daher mit der Punktmenge P die Menge ihrer Grenzpunkte begrifflich mit gegeben, welche ich mit P bezeichnen und die erste abgeleitete Punktmenge von P nennen will“ (Cantor 1872, S. 129). Hier ist die Sprache der Mengenlehre schon weit entwickelt. Cantor wiederholt diese Konstruktion und definiert die n-te Ableitung als P (n) = (P (n−1) ) . Er verallgemeinert dann seinen obigen Satz indem er beweist, dass ai = ai und bi = bi f¨ ur alle in Frage kommenden i ist, wenn nur obige Gleichung f¨ ur alle x ∈ [0, 2π]−P gilt und beide Reihen f¨ ur alle diese x konvergieren, wenn P eine Teilmenge von [0, 2π] ist, f¨ ur die es ein n gibt mit P (n) = ∅. In sp¨ ateren Arbeiten greift er das Thema der Ableitung einer Menge wieder auf (Cantor Es kann ja sein, dass keins der P (n) leer ist. Dann bildet er !∞ 1880). (∞) (n) P := n:=1 P und f¨ ahrt fort: Die erste Ableitung von P (∞) werde mit P (∞+1) , die nte Ableitung von P (∞) ” (∞+n) mit P bezeichnet; P (∞) wird aber auch eine, im Allgemeinen von O verschiedene Ableitung von der Ordnung ∞ haben, wir nennen sie P (2∞) . Durch Fortsetzung dieser Begriffsconstructionen kommt man zu Ableitungen, die consequenterweise durch: P (n0 ∞+n1 ) zu bezeichnen sind, wo n0 und n1 positive ganze Zahlen sind. Wir kommen auch dar¨ uber hinaus, indem wir: D P (∞) , P (2∞) , P (3∞) , . . . 2
bilden und daf¨ ur das Zeichen P (∞ ) festsetzen. Hieraus ergibt sich durch Wiederholung derselben Operation der allgemeinere Begriff: 2 P (n0 ∞ +n1 ∞+n2 ) , usw.“ Der Buchstabe D steht hier f¨ ur (Durch-)Schnitt. Cantor gewinnt also in den Polynomen in ∞ mit Koeffizienten aus N0 das, was er sp¨ater Ordinalzahlen nennt. Er ¨ zeigt im Ubrigen, wie man sich eine Menge P von reellen Zahlen verschaffen kann, ahrt fort, dass man so dass P (∞) aus einem vorgegebenen Punkt p besteht, und f¨ sich mit Leichtigkeit Punktmengen P verschaffe, so dass P (n0 ∞
ν
+n1 ∞ν−1 +...nν )
aus einem vorgeschriebenen Punkt p bestehe.
1. Auswahlaxiom und Wohlordnungsprinzip
247
Hier geschah also wieder einmal das, was immer wieder zu beobachten ist, dass der mit Fantasie begabte Mathematiker, nachdem er ein Problem gel¨ost hat, den Faden weiterspinnt und in Neuland vordringt. Diese transfiniten Ordinalzahlen, die Cantor schuf, und die zugeh¨ origen Wohlordnungen sollten eine Weile eine große Rolle in der Mathematik spielen, bis sie von anderen transfiniten Werkzeugen abgel¨ ost wurden. So benutzte Steinitz sie noch, um zu zeigen, dass jeder K¨ orper einen algebraischen Abschluss hat. Die transfiniten Ordinalzahlen entstanden als freie Sch¨ opfungen des menschli” chen Geistes“, um einen Spruch Dedekinds abzuwandeln. Das simultane Ausw¨ ahlen von Elementen aus einer unendlichen Familie von Mengen war andererseits ein Problem, das sich im allt¨ aglichen Leben des Mathematikers aufdr¨ angte. Auch dies machte sich am Fr¨ uhesten in der Analysis bemerkbar. Doch wir beginnen mit einem anderen Problem, dass fast gleichzeitig bemerkt wurde. Dedekind nennt eine Menge unendlich, wenn sie eine injektive Abbildung auf eine echte Teilmenge besitzt (Dedekind 1888, § 5, No 64). Mengen, die nicht in diesem Sinne unendlich sind, nennt er endlich. Der unbedarfte Mensch stellt sich unter einer endlichen Menge eine Menge vor, deren Elemente er abz¨ahlen kann, die also eine Bijektion auf eine Menge der Art Zn := {1, . . . , n} gestattet. Dedekind will nun zeigen, dass die Mengen, die in seinem Sinne endlich sind, genau die im naiven Sinne endlichen Mengen sind. Dazu muss er zeigen, dass eine Menge M in seinem Sinne unendlich ist, wenn es zu jedem n ∈ N eine injektive Abbildung von Zn in M gibt. Er formuliert also den folgenden Satz. Genau dann ist die Menge M unendlich, wenn es f¨ ur alle n ∈ N eine injektive Abbildung von Zn in M gibt (Dedekind 1888, § 14, No 159). Es ist unkritisch zu zeigen, dass eine unendliche Menge diese Eigenschaft hat. Kritisch ist die Umkehrung. Skizzieren wir, wie Dedekind vorgeht. Es sei M eine Menge und zu jedem n ∈ N gebe es eine injektive Abbildung αn von Zn in M . Dedekind sagt dann: Aus der Existenz einer solchen, als gegeben ” anzusehenden Reihe von Abbildungen αn , u ¨ ber die aber weiter nichts vorausgesetzt wird, leiten wir zun¨ achst mit H¨ ulfe des Satzes 126 die Existenz einer neuen Reihe von eben solchen Abbildungen ψn ab, welche die besondere Eigenschaft besitzt, daß jedesmal, wenn m ≤ n, also (nach 100) Zm ⊆ Zn ist, die Abbildung ψm des Theiles Zm in der Abbildung ψn von Zn enthalten ist (21), d. h. daß die Abbildungen ψm und ψn f¨ ur alle in Zm enthaltenen Zahlen g¨ anzlich mit einander u ¨ bereinstimmen, also auch stets ψm (m) = ψn (m) wird.“ Bei der Konstruktion von ψ geht er ¨außerst sorgf¨ altig vor. Er argumentiert wie folgt, wenn auch nicht mit den gleichen Bezeichnungen und dem gleichen Vokabular. #∞ Es sei An die Menge der injektiven Abbildungen von Zn in M und Ω := n:=1 An . Ferner sei β ∈ Ω. Es gibt dann ein n mit β ∈ An . Dann ist, wie aus seinen S¨ atzen u ¨ ber endliche Mengen folgt, αn+1 (Zn+1 ) ⊆ β(Zn ).
248
Kapitel XI. Transfinite Methoden
Es gibt also ein p ∈ Zn+1 mit αn+1 (p) ∈ β(Zn ). Dann schließt er penibel weiter: von diesen Zahlen w¨ahlen wir — nur um etwas ” Bestimmtes festzuhalten — immer die kleinste k . . . “ Dann definiert er γ durch γ(m) := β(m) f¨ ur m ∈ Zn und γ(n + 1) := αn+1 (k). Dann ist γ ∈ Ω. Der Deutlichkeit halber beschreibe ich diese Konstruktion durch γ := R(β). Dann ist R eine Abbildung von Ω in sich mit β ⊆ R(β). Nach dem dedekindschen Rekursionssatz, den Dedekind hier zitiert, gibt es eine Abbildung ψ von N in Ω mit ψ1 = α1 und ψn+1 = R(ψn ). Wegen ψn ⊆ ψn+1 ist dann χ :=
∞ $
ψn
n:=1
eine injektive Abbildung von N in M . Mit Hilfe von χ(N) findet man nun leicht eine injektive Abbildung von M in sich, die nicht surjektiv ist. Problematisch an diesem Beweis ist die Existenz von α und es ist erstaunlich, dass Dedekind dies nicht sieht, wo er andererseits bei der Konstruktion von ψ in ahnlicher Situation so sorgf¨ ¨ altig vorgeht: von diesen Zahlen w¨ ahlen wir — nur ” um etwas Bestimmtes festzuhalten — immer die kleinste.“ Es haben wohl mehrere Leute den Finger in die Wunde gelegt. Darauf deutet das Vorwort zur zweiten Auflage seines Was sind und was sollen die Zahlen“ hin, das auf den 24. August ” 1893 datiert ist, wie auch das Vorwort zur dritten Auflage, welches das Datum des 30. September 1911 tr¨ agt (Dedekind 1911). Von einem weiß ich es ausdr¨ ucklich. In seiner Arbeit Gruppi finiti ed infiniti di enti schreibt Rodolfo Bettazzi in der Fußnote, die die Arbeit beendet, nachdem er schon in der Einleitung zu dieser Arbeit auf die L¨ ucke in Dedekinds Beweis hingewiesen hat: Il Dedekind (l. c. N. 159) tenta di dimostrare questa reciproca. La sua di” mostrazione esige che si stabiliscano corrispondenze fra tutte le possibili Z di un gruppo qualunque finito ed il gruppo Σ proposto (di potenza maggiore di qualunque gruppo finito) e che si costruisca un gruppo prendendo una corrispondenza fra ogni Z e Σ. Ma siccome di tali corrispondenze ve n’`e pi` u di una fra ogni Z e Σ, e il Dedekind non determina una speciale fra esse, cos`ı devesene prendere una qualunque ad arbitrio, e ci`o fare per ciascun gruppo di corrispondenze fra ogni Z e Σ, cio`e si deve scegliere ad arbitrio un ente (corrispondenza) in ciascuno di infiniti gruppi, il che non pare rigoroso; a meno che non si voglia ammettere per postulato che tale scelta possa farsi, la qual cosa peraltro ci sembrerebbe inopportuna (Bettazzi 1895/96, S. 512).“ ¨ Bevor ich meine Ubersetzung wiedergebe, sei gesagt, dass Bettazzi mit dem Wort gruppo“ das meint, was wir Menge nennen. In diesem Zusammenhang ”
1. Auswahlaxiom und Wohlordnungsprinzip
249
bedeutet ente“ dann Element“. Mein italienisches W¨ orterbuch aus dem 19. ” ” Jahrhundert hat f¨ ur das Wort infinito nicht nur die Bedeutung unendlich“, son” dern auch die Bedeutung unz¨ ahlig“, w¨ ahrend der moderne Langenscheidt nur die ” Bedeutung unendlich“ kennt. Ich habe mich an das alte W¨ orterbuch gehalten ” und infinito mit unendlich viele“ wiedergegeben, da nur dies einen Sinn ergab. ¨ ” Hier nun die Ubersetzung: Dedekind versucht diese Umkehrung zu beweisen. Sein Beweis erfordert, eine ” Korrespondenz herzustellen zwischen allen m¨ oglichen Z von gewissen endlichen Mengen und der gegebenen Menge Σ (die von gr¨ oßerer M¨ achtigkeit ist als jegliche endliche Menge) und dass man eine Menge konstruiert, indem man eine Korrespondenz zwischen jedem Z und Σ nimmt. Aber da es von solchen Korrespondenzen zwischen jedem Z und Σ mehr als eine gibt, und Dedekind keine spezielle zwischen ihnen bestimmt, so muss man von ihnen willk¨ urlich eine beliebige nehmen, und so f¨ ur jede der Korrespondenzmengen zwischen jedem Z und Σ verfahren, dh., man muss willk¨ urlich ein Element (Korrespondenz) in jeder von unendlich vielen Mengen w¨ahlen. Das scheint nicht [mathematischer] Strenge zu gen¨ ugen, es sei denn, man wolle es als Postulat zulassen, dass solche Wahl m¨oglich ist, eine Sache, die allerdings hier nicht opportun erscheint.“ Das il che non pare rigoroso habe ich nur zu u ¨bersetzen gewusst, indem ich das Wort mathematisch“ einschmuggelte. ” Hier wird von Bettazzi zurecht kritisiert, dass Dedekind im Beweise seines Satzes die Existenz eines α ∈ cart∞ n:=1 An vorraussetzt, ohne zu sagen, wie er dazu kommt. Man muss hier also, so Bettazzi, ein bestimmtes α angeben oder aber seine Existenz postulieren. Letzteres erscheint ihm aber als nicht angemessen. Warum nicht angemessen, sagt er nicht. Interessant ist auch Bettazzis Formulierung cio`e si deve scegliere un ente (cor” rispondenza)“, dass er also nicht direkt sagt, dass man eine Korrespondenz w¨ahlen m¨ usse, dass er vielmehr sagt, dass man ein Element w¨ahlen m¨ usse und dies durch das in Klammern gesetzte Wort Korrespondenz“ erl¨ autert. Er weist hier also auf ” die allgemeine Situation hin, in der die Existenz von Auswahlfunktionen nicht sicher ist. Und in der Tat hat er sich auch schon in einer fr¨ uheren Arbeit zu dieser Problematik ge¨außert. So schreibt er in Bettazzi 1892, S. 176: Dato un gruppo di punti pu` o prendersi ad arbitrio un punto in esso, od in ” una sua parte, od in un numero finito di sue parti. Ma quando occorre considerare infiniti sottogruppi di esso e costruire un gruppo formato scegliendo in ciascuno di quei sottogruppi un punto qualunque senz’altra condizione (come sar` a il caso in quello che segue) non basta dire che si forma questo gruppo prendendo un punto ad arbitrio per ciascuno di quei sottogruppi, non potendosi ritenere come determinato un numero infinito di enti scelti ad arbitrio tutti in date classi. Ci`o risulta chiaro quando si pensi che il darli ad arbitrio equivale a definirli separamente uno ad uno, senza che la definizione di uno o di un numero finito qualunque di essi possa servire a determinare uno dei restanti — il che `e possibile solo quando sono in
250
Kapitel XI. Transfinite Methoden
numero finito. In casi consimili conviene dunque prendere, se si vuole, ad arbitrio alcuni di quei punti, ma in numero finito, e per gli infiniti altri assegnare una legge constante, la quale applicata ad uno qualunque di quei sottogruppi permetta di definire in esso un punto che sar` a quello che prenderemo in quel sottogruppo — legge la quale non `e assoggettata a nessuna condizione, essendo sufficiente che definisca un punto determinato di ciascun sottogruppo, qualunque del resto esso si sia. Perch`e dato un gruppo arbitrario G si potesse formare un gruppo costituito da un punto, qualunque sia, per ciascuno di infiniti determinati sottogruppi di G, occorrerebbe aver risoluta la questione: Dato un gruppo di punti, indicare una legge applicando la quale al gruppo, ne venga determinato un punto, e ci` o qualunque sia il gruppo dato. — Nello stato attuale della teoria dei gruppi, di questo problema non si conosce la soluzione in generale: se dunque diciamo legge di scelta una legge colla quale in un gruppo si determini un punto (del resto qualunque) in ciascuno ` dei sottogruppi, pu` o dirsi che non per tutti i gruppi `e nota una legge di scelta. E chiaro per altro che se per un gruppo `e nota una legge di scelta, cos`ı `e per ogni suo sottogruppo.“ ¨ Und hier meine Ubersetzung: Ist eine Menge von Punkten gegeben, so kann man einen beliebigen Punkt ” aus ihr herausnehmen, oder aus einer ihrer Teilmengen oder aus einer endlichen Zahl ihrer Teilmengen. Wenn es aber vorkommt, dass man unendlich viele ihrer Teilmengen zu betrachten und eine Menge zu konstruieren hat, die gebildet wird, indem man in jeder von jenen Teilmengen einen beliebigen Punkt ohne irgendeine weitere Bedingung ausw¨ahlt (wie es im Folgenden der Fall sein wird), so gen¨ ugt es nicht zu sagen, dass man diese Menge bildet, indem man willk¨ urlich einen Punkt aus jeder dieser Teilmengen nimmt. Man kann ja nicht eine unendliche Zahl von in allen gegebenen Mengen (classi) willk¨ urlich gew¨ahlten Punkten als bestimmt ansehen. Dies ergibt klar, wenn man es bedenkt, dass ihr Willk¨ urlich-gegebensein gleichbedeutend damit ist, sie separat einen nach dem andern zu definieren, ohne dass die Definition von einem oder einer endlichen Anzahl von ihnen dazu dienen k¨ onne, einen von den restlichen zu bestimmen — was nur m¨ oglich ist, wenn sie in endlicher Zahl sind. In a¨hnlicher Lage lohnt es sich also, wenn man will, irgendwelche von jenen Punkten willk¨ urlich zu nehmen, jedoch in endlicher Zahl , und f¨ ur die unendlich vielen anderen ein festes Gesetz zu bestimmen, welches auf irgendeine der Teilmengen angewandt gestattet, in ihr einen Punkt zu definieren, der dann jener sein wird, den wir aus dieser Teilmenge nehmen werden — ein Gesetz , welches keiner weiteren Bedingung unterworfen ist. Es gen¨ ugt, wenn es ¨ einen bestimmten Punkt in jeder Teilmenge definiert, welcher er im Ubrigen auch immer sei. Damit man, wenn eine beliebige Menge G gegeben ist, eine Menge bilden kann, die f¨ ur jede von unendlich vielen bestimmten Teilmengen von G genau einen ihrer alt, m¨ usste man die Frage gel¨ost haben: Punkte [und sonst keine Punkte] enth¨ Gegeben sei eine Menge von Punkten. Es ist ein Gesetz aufzuzeigen, welches, wenn
1. Auswahlaxiom und Wohlordnungsprinzip
251
auf diese Menge angewandt, einen Punkt von ihr bestimmt, und das, gleichg¨ ultig, welche Menge gegeben ist . — Im augenblicklichen Zustand der Mengenlehre kennt man noch keine allgemeine L¨osung dieses Problems: Wir nennen also Auswahlgesetz ein Gesetz, mit dem man in einer Menge einen (beliebigen) Punkt in einer jeden ihrer Teilmengen bestimmt. Man kann sagen, dass nicht f¨ ur alle Mengen ein Auswahlgesetz bekannt ist. Es ist andererseits klar, dass, wenn f¨ ur eine Menge ein Auswahlgesetz bekannt ist, auch f¨ ur jede ihrer Teilmengen ein solches bekannt ist.“ Hieran anschließend sagt Bettazzi, dass jede abz¨ ahlbare Menge ein Auswahlgesetz besitzt. Man nehme n¨amlich eine Abz¨ahlung dieser Menge und w¨ ahle aus jeder Teilmenge dasjenige ihrer Elemente aus, welches den kleinsten Index hat. Bettazzi gibt auch ein sch¨ ones Beispiel daf¨ ur, dass eine Teilmenge der Potenzmenge einer Menge ein Auswahlgesetz hat, ohne dass man ein solches f¨ ur die Potenzmenge kennt, n¨ amlich die Menge der abgeschlossenen und beschr¨ ankten Teilmengen von ¨ R. Hier ordnet er einer solchen Menge ihr Infimum oder Supremum zu. Im Ubrigen formuliert er die S¨ atze dieser Arbeit so, dass er im Satze bemerkt, dass er richtig sei, wenn es ein Auswahlgesetz g¨abe, wenn er ein solches im Beweise ben¨otigt. Das bettazzische Beispiel, dass es f¨ ur Mengen von beschr¨ ankten und abgeschlossenen Teilmengen von R stets Auswahlfunktionen gibt, n¨ amlich die Funktion, die jeder solchen Menge ihr Infimum zuordnet, bzw. die Funktion, die jeder solchen Menge ihr Supremum zuordnet, spielte schon zwei Jahre zuvor in einer Arbeit von Peano eine Rolle (Peano 1890). In dieser Arbeit geht es um die Existenz und Eindeutigkeit von L¨ osungen von Systemen von Differenzialgleichungen der Form dxi = ϕi (t, x1 , . . . , xn ) dt f¨ ur i := 1, . . . , n, wobei ϕ1 , . . . , ϕn stetige Funktionen sind. Dort muss er aus einer abz¨ ahlbaren Menge von abgeschlossenen Mengen simultan Elemente ausw¨ahlen. Er kommentiert dies auf S. 210: Mais comme on ne peut pas appliquer une infinit´e ” de fois une lois arbitraire avec laquelle `a une classe a on fait correspondre un individu de cette classe, on a form´e ici une lois d´etermin´ee avec laquelle `a chaque classe a, sous des hypoth`eses convenables, on fait correspondre un individu de cette classe:“ Und das festgelegte Gesetz, das er anwendet, ist dann dies, dass er den zuvor konstruierten abgeschlossenen Mengen jeweils ihr Supremum zuordnet. Diese von Peano gemachte Bemerkung scheint das fr¨ uheste literarische Zeugnis u ¨ ber das Ausw¨ahlen von Elementen in unendlichen Familien von Mengen zu sein. ¨ Bettazzi, der sich kurz darauf dazu a¨ußerte, war im Ubrigen Mitarbeiter von Peano. W¨ ahrend die peanosche Bemerkung immer wieder zitiert wird — meist ohne Seitenangabe, so dass man große Schwierigkeiten hat sie zu finden —, haben die bettazzischen Arbeiten keine Beachtung gefunden. Einzig Burali-Forti ging auf sie ein (Burali-Forti 1896/97). Woran es m¨ oglicher Weise lag, dass Bettazzi so wenig Beachtung fand, dar¨ uber werde ich im letzten Abschnitt dieses Kapitels berichten. Wie recht Bettazzi hatte mit seiner Kritik, sieht man daran, dass die L¨ ucke in Dedekinds Beweis sich nicht stopfen l¨asst, wie bei Felgner 1971, S. 101 nachzulesen.
252
Kapitel XI. Transfinite Methoden
Dort findet sich n¨ amlich der Satz, dass, wenn ZF, d. i. das zermelo-fraenkelsche Axiomensystem, konsistent ist, auch ZF zuz¨ uglich der Annahme konsistent ist, dass es eine nicht endliche Menge gibt, die im dedekindschen Sinne endlich ist. Dabei sind endliche Mengen dadurch definiert, dass sie eine Bijektion auf ein Zn gestatten. F¨ ur weitere Hinweise sei auf Felscher III, 1979 verwiesen. Wir haben das Auswahlaxiom schon im letzten Kapitel formuliert und erw¨ ahnt, dass es von den u ¨ brigen Axiomen der Mengenlehre unabh¨ angig ist. Wir wieder¨ holen hier seine Formulierung und zeigen seine Aquivalenz mit dem zermeloschen Wohlordnungssatz. Auswahlaxiom. Ist (Mi | i ∈ I) eine nicht-leere Familie nicht-leerer Mengen, so ist carti∈I Mi = ∅. Das Auswahlaxiom wurde von Zermelo eingef¨ uhrt. Er machte also wahr, was Bettazzi als M¨oglichkeit offen ließ. Er benutzte dieses Axiom um zu beweisen, dass unter seiner Annahme sich jede Menge wohlordnen l¨ asst (Zermelo 1904). Dabei heißt eine Menge M bez¨ uglich ≤ wohlgeordnet , wenn jede nicht-leere Teilmenge von M ein bez¨ uglich ≤ kleinstes Element enth¨alt. Da dann auch jedei Teilmenge aus zwei Elementen ein kleinstes Element enth¨alt, sind Wohlordnungen immer linear. Wir bringen hier den zermeloschen Beweis f¨ ur seinen Satz. Zun¨achst noch ein wenig an Vorbereitung. Zermelosches Lemma. Es sei (M, ≤) eine wohlgeordnete Menge. Ist f ein injektiver Homomorphismus von (M, ≤) in sich, so ist x ≤ f (x) f¨ ur alle x ∈ M Beweis. Es sei W := {w | w ∈ M, f (w) < w}. Ist W nicht leer, so gibt es in W ein kleinstes Element k. Es folgt f (k) < k und damit, da f ein injektiver Homomorphismus ist, f (f (k)) < f (k). at von k. Es ist also f (k) ∈ W im Widerspruch zur Minimalit¨ Hieraus folgt sehr rasch Satz 1. Sind (M, ≤) und (M , ≤ ) zwei wohlgeordnete Mengen, so gibt es h¨ ochstens einen Isomorphismus von (M, ≤) auf (M , ≤ ). Beweis. Es seien f und g Isomorphismen von (M, ≤) auf (M , ≤ ). Dann sind −1 g f und f −1 g Monomorphismen von M in sich. Nach dem zermeloschen Lemma gilt daher x ≤ g −1 f (x) wie auch x ≤ f −1 g(x) f¨ ur alle x ∈ M und daher g(x) ≤ f (x) ≤ g(x). Also ist f = g wie behauptet. Die zermelosche Note aus dem Jahre 1904 ist ein Auszug aus einem Briefe Zermelos an Hilbert. Er benutzt dort bei seinem Beweise, dass aus dem Auswahlprinzip folgt, dass sich jede Menge wohlordnen l¨asst, den folgenden Satz, ohne
1. Auswahlaxiom und Wohlordnungsprinzip
253
ihn zu begr¨ unden. Ich weiß nicht, ob er damals schon zur Folklore geh¨ orte. Er ist jedenfalls einfach zu beweisen. Satz 2. Sind (M, ≤) und (M , ≤ ) wohlgeordnete Mengen, so gibt es genau einen Monomorphismus von (M, ≤) auf einen Anfang von (M , ≤ ) oder einen Monomorphismus von (M , ≤ ) auf einen Anfang von (M, ≤). Beweis. Es seien σ und τ zwei Monomorphismen von (M, ≤) auf Anf¨ ange von (M , ≤ ). Es sei weiter W := x | x ∈ M, σ(x) = τ (x) . Ist W = ∅, so enth¨ alt W ein kleinstes Element w. Wegen σ(w) = τ (w) d¨ urfen wir σ(w) 1, so ist Hl = Mcl−1 ∪ Hl−1 , % andernfalls ist Hl = Mn . % v1 , . . . , vn−1 ist ein Vertretersystem f¨ ur % M1 , . . . , Mn−1 und z ∈ {v1 , . . . , vn−1 }. endwhile; % v1 , . . . , vn−1 ist ein Vertretersystem von % M1 , . . . , Mn−1 . % Ferner gilt z ∈ {v1 , . . . , vn−1 } und z ∈ Mn vn := z
269
270
Kapitel XI. Transfinite Methoden
% v1 , . . . , vn ist ein Vertretersystem von M1 , . . . , Mn endif until (n = t) or noTrans end; % Heiratsvermittler Dieser Algorithmus liefert einen weiteren Beweis f¨ ur die finite Form des Heiratssatzes. 4. Unabh¨ angigkeitsstrukturen. Betreibt man Mathematik, begegnet man dem Ph¨ anomen der linearen Unabh¨ angigkeit. Dies haben wir schon bemerkt, als wir das zehnte Buch der Elemente beschrieben (Kap. 3, Absch. 5). Bei Galois’ Abz¨ ahlung seiner allgemeinen Ausdr¨ ucke der Form (GF) spielte er im Hintergrund seine Rolle (Kap. 9, Absch. 2). Voll entwickelt ist der Begriff in dem im 19. Jahrhundert wenig beachteten Buch Graßmann 1862. So findet sich in diesem Buch auf S. 9f. der heute so genannte steinitzsche Austauschsatz f¨ ur endlich-dimensionale Vektorr¨ aume u ¨ ber dem K¨ orper der reellen Zahlen mit all den u ¨blichen Konsequenzen. Moore hat den Begriff f¨ ur elementarabelsche p-Gruppen, wie wir gesehen haben, wie vor ihm schon Jordan in seinem Trait´e (Jordan 1870/1989, S. 115). Dedekind nennt Elemente einer Erweiterung L des K¨orpers K reduzibel in Bezug auf K, oder eben auch abh¨ angig, wenn sie nach unserem Verst¨andnis linear abh¨ angig sind. Entsprechend nennt er sie irreduzibel bzw. unabh¨ angig, wenn wir von linear unabh¨ angigen Elementen spr¨ achen. (Dirichlet 1871, S. 428 und 1894, S. 466). Steinitz sagt von Hamel, dass er der erste gewesen sei, der den Wohlordnungssatz auf ein algebraisches Problem anwendete, indem er die Existenz einer Basis f¨ ur den Q-Vektorraum R nachwies. Hamel sagt nichts u ¨ ber die gleiche M¨ achtigkeit solcher Basen (Hamel 1905). Steinitz definiert in § 5 seiner Arbeit die lineare Abh¨ angigkeit bzw. Unabh¨ angigkeit von zun¨ achst endlich vielen Elementen einer Erweiterung L von K und sagt dann, dass eine beliebige Menge linear unabh¨ angig heiße, wenn jede endliche Teilmenge linear unabh¨ angig sei. Im Falle, dass L eine endliche Erweiterung von K ist, zeigt Steinitz die Gleichm¨achigkeit der Basen des K-Vektorraumes L. Im unendlichen Falle interessieren ihn Basen dieser Art aber nicht. Sie helfen ja auch nicht bei der Klassifizierung der K¨ orpererweiterungen. Wichtig ist hier jedoch der von Steinitz eingef¨ uhrte Begriff der algebraischen Unabh¨ angigkeit. Dieser erfreut sich auch der beiden Eigenschaften, denen man bei der linearen Unabh¨ angigkeit begegnet, dass n¨ amlich die Menge der algebraisch unabh¨ angigen Teilmengen einer K¨ orpererweiterung von endlichem Charakter ist und dass f¨ ur sie der steinitzsche Austauschsatz gilt. Diese Gemeinsamkeit wird von Steinitz nicht herausgehoben, ja nicht einmal erw¨ ahnt. Auch nicht in der Arbeit Steinitz 1913, wo er u. a. die lineare Unabh¨ angigkeit f¨ ur endlich-dimensionale Vektorr¨ aume u ¨ ber R studiert, aber auch darauf hinweist, dass die einschl¨ agigen S¨ atze auch u ¨ ber beliebigen K¨ orpern g¨ alten. Es dauerte weitere einundzwanzig Jahre, bis die Gleichm¨ achtigkeit von Basen auch f¨ ur beliebige Vektorr¨ aume u ¨ ber den reellen und komplexen Zahlen bewiesen wurde, n¨ amlich in der Arbeit L¨ owig 1934. L¨owigs Beweise sind von der Struktur
4. Unabh¨ angigkeitsstrukturen
271
von R und C unabh¨ angig und gelten daher f¨ ur Vektorr¨ aume u ¨ ber beliebigen, auch nicht kommutativen K¨ orpern. Es dauerte noch ein weiteres Jahr, bis die erste Arbeit mit der abstrakten Definition einer Unabh¨ angigkeitsstruktur erschien (Whitney 1935). Hasserl Whitney nahm als Motivation f¨ ur seine Definition die Menge der Spalten einer (m × n)Matrix u ¨ber einem K¨ orper. Von dieser Menge sind manche Teilmengen linear unabh¨ angig und manche nicht. Eine Teilmenge einer linear unabh¨ angigen Teilmenge von Spalten ist wieder eine solche und es gilt der steinitzche Austauschsatz. Da Matrizen der Ausgangspunkt sind, nennt er das, was wir gleich Unabh¨ angigkeitsstruktur nennen werden, Matroid . Er beeilt sich zu sagen, dass die Menge der W¨alder genannten Teilgraphen eines endlichen Graphen ein Matroid sei und dass die Ergebnisse seiner Arbeit Whitney 1932 sich in dem neuen Rahmen der Matroide einfacher beweisen ließen. In dieser Arbeit findet sich auch die am¨ usante Definition: A forest is a graph containing no circuit. A tree is a connected forest.“ ” Van der Waerden schreibt in der zweiten Auflage seines Buches Moderne Alge” bra“ das Folgende: F¨ ur den Begriff der linearen Abh¨ angigkeit gilt eine Reihe von ” S¨ atzen, die im folgenden in ,Grunds¨ atze‘ und ,Folges¨ atze‘ geteilt erscheinen. Die Grunds¨ atze werden unmittelbar aus der Definition des Begriffes hergeleitet. Die Folges¨ atze dagegen werden aus den Grunds¨ atzen ohne nochmalige Benutzung der Definition, also ohne R¨ ucksicht auf die Bedeutung des Begriffes ,lineare Abh¨ angigkeit‘ abgeleitet. Dieses Verfahren (man kann es eine Axiomatisierung des Begriffes der linearen Abh¨ angigkeit nennen) ist n¨ utzlich in Hinblick auf ein sp¨ ateres Kapitel (Kap. 8, § 64), in dem der Begriff der ,algebraischen Abh¨ angigkeit‘ eingef¨ uhrt wird, f¨ ur den die gleichen Grunds¨ atze und daher auch dieselben Folges¨atze gelten wie f¨ ur den Begriff der linearen Abh¨ angigkeit.“ (van der Waerden 1937, S. 105). Van der Waerden formuliert alles nur f¨ ur endlich erzeugte Vektorr¨ aume und auch bei der algebraischen Unabh¨ angigkeit verweist er f¨ ur den transfiniten Fall auf die Arbeit von Steinitz. Er erw¨ ahnt keine weiteren Unabh¨ angigkeitsstrukturen, auch nicht in der vierten Auflage seines Werkes, das nun Algebra“ heißt. Er erw¨ ahnt ” auch nicht die Arbeit von Hasserl Whitney. Schon in der ersten Auflage seines Buches Moderne Algebra“ — der erste Band ” erschien 1930 — weist van der Waerden in Abschnitt 62 u ¨ber den Transzendenzgrad darauf hin, dass die f¨ unf Eigenschaften dieses Begriffes, die er in Abschnitt 61 eingef¨ uhrt habe, auch f¨ ur die lineare Abh¨ angigkeit gelten, die er in Abschnitt 28 untersucht habe. Man k¨ onne also alle Beweise w¨ortlich u ¨bertragen. Dies wird von ihm aber hier noch nicht so sorgf¨ altig ausgearbeitet, wie er es dann in der ¨ zweiten Auflage tut. Im Ubrigen verweist er auch schon hier f¨ ur einen Beweis der Gleichm¨achtigkeit von Transzendenzbasen im transfiniten Fall auf die steinitzsche Arbeit. Im Gegensatz zur zweiten Auflage seines Buches verweist er in der ersten Auflage in diesem Zusammenhang noch auf das Algebrabuch von Haupt (Haupt 1929, II.23,6). Schl¨ agt man dort nach, so findet man auf S. 589 oben: Die f¨ ur ” uns wichtigen Eigenschaften solcher algebr. abh. Systeme lassen sich bereits aus den Entwicklungen u ¨ber linear abh. Systeme ablesen (9, 1 bis 9, 3 ). Der Grund liegt darin, daß sowohl das transitive Gesetz (9, 3 ; Satz 1) als das Verfahren der
272
Kapitel XI. Transfinite Methoden
schrittweisen Elimination (9, 1 ) auch f¨ ur algebr. Abh¨ angigkeit gilt, und daß im wesentlichen auf diesen beiden Tatsachen alle S¨ atze von 9, 2 und 9, 3 beruhen.“ Dass lineare Abh¨ angigkeit und algebraische Abh¨ angigkeit strukturell dasselbe sind, findet sich also schon vor van der Waerdens Buch Moderne Algebra“ in der Lite” ratur und man findet dies, wenn man van der Waerdens Zitaten folgt. Wir haben in Abschnitt 3 von Kapitel 6 schon bemerkt, dass O. Haupt in seinem Algebrabuch eine abstrakte Definition euklidischer Ringe gibt. Jetzt sehen wir, dass er, was die Unabh¨ angigkeitsstrukturen anbelangt, van der Waerden auch einen Schritt voraus ist. Haupt war also wirklich auf der H¨ ohe der Zeit. Wieso ist van der Waerdens Algebrabuch dennoch soviel erfolgreicher geworden? Haupts Buch hat in den f¨ unfziger Jahren des 20. Jahrhunderts eine zweite Auflage erlebt und der erste Band 1956 noch eine dritte. Der erste Band von van der Waerdens Algebra“ hat neun Auflagen erlebt, die letzte 1993. In diesem Jahr erschien auch ” die letzte, die sechste Auflage des zweiten Bandes. Diese Informationen entnahm ich dem Zentralblatt der Mathematik. Die hervorragende Eigenschaft von Basen endlich dimensionaler Vektorr¨ aume ist, dass zwei Basen eines solchen Vektorraumes stets die gleiche L¨ange haben. Schon der Physiker Gustav Kirchhoff bewies, wenn auch nicht in der Sprache der Graphentheorie, dass aufspannende B¨ aume eines zusammenh¨angenden Graphen stets die gleiche Kantenzahl haben (Kirchhoff 1847). Und Steinitz bewies, dass Transzendenzbasen, wie die maximalen algebraisch unabh¨angigen Teilmengen einer K¨ orpererweiterung genannt werden, ebenfalls gleichm¨ achtig sind. Er benutzte zu diesem Beweis den Wohlordnungssatz, den wir hier aber nach heutiger Gepflogenheit vermeiden werden. Wir werden uns der Werkzeuge bedienen, die wir hier entwickelt haben, insbesondere des Heiratssatzes, wenn wir den entsprechenden Satz f¨ ur Unabh¨ angigkeitsstrukturen beweisen werden. Es sei V eine Menge und I sei eine nicht leere Teilmenge der Potenzmenge von V . Wir nennen I eine Unabh¨ angigkeitsstruktur auf V , falls I den folgenden Bedingungen gen¨ ugt. 1) I ist von endlichem Charakter. 2) Sind A und B endliche Teilmengen von V , sind A, B ∈ I und gilt |B| = |A|+1, so gibt es ein b ∈ B − A mit A ∪ {b} ∈ I. Die Bedingung 2) kennt man unter dem Namen steinitzscher Austauschsatz , obwohl dieser Satz, wie erw¨ahnt, schon von H. Grassmann in seiner Ausdehnungslehre formuliert wurde. Ist I eine Unabh¨ angigkeitsstruktur auf V und ist B ein maximales Element von (I, ⊆), so heißt B eine I-Basis von V . Auf Grund des Lemmas von Teichm¨ uller und Tukey gilt: Satz 1. Es sei I eine Unabh¨ angigkeitsstruktur auf der Menge V . Ist X ∈ I, so gibt es eine I-Basis B von V mit X ⊆ B. Es sei I eine Unabh¨ angigkeitsstruktur auf V . Weil I nicht leer ist, gibt es ein Y ∈ I. Weil I von endlichem Charakter ist, ist ∅ als endliche Teilmenge von Y
4. Unabh¨ angigkeitsstrukturen
273
Element von I. Ist nun X eine Teilmenge von V , so ist also ∅ ∈ IX := P (X) ∩ I. angigkeitsstruktur auf X, so dass X eine IX -Basis besitzt. Daher ist IX eine Unabh¨ Statt von IX -Basen werden wir von I-Basen, bzw. auch nur von Basen von X reden. Ziel dieses Abschnitts ist zu zeigen, dass zwei Basen von X stets gleichm¨achtig sind. Grundlegend f¨ ur das Weitere ist der folgende Satz. Satz 2. Es sei I eine Unabh¨ angigkeitsstruktur auf V . Ist X ∈ P (V ) und sind A und B Basen von X, so gilt: Ist A endlich, so ist auch B endlich und es gilt |A| = |B|. Beweis. Es sei C eine Teilmenge von B und es gelte |C| = |A| + 1. Setze Y := C ∪ A. Dann ist Y ⊆ X und folglich IY ⊆ IX . Daher ist A auch Basis von Y . Mit dem steinitzschen Austauschsatz folgt die Existenz eines c ∈ C, so dass A ∪ {c} ∈ IY ist. Dies widerspricht der Maximalit¨ at von A in IY . Daher besitzt B keine Teilmenge der L¨ange |A| + 1. Folglich ist B endlich und es gilt |B| ≤ |A|. Weil B als endlich erkannt ist, k¨ onnen wir die Rollen von A und B vertauschen und erhalten |A| ≤ |B|. Also ist in der Tat |A| = |B|. Es sei I eine Unabh¨ angigkeitsstruktur auf V . Es sei ferner x ∈ V und A ⊆ V . Wir nennen x abh¨ angig von A, wenn entweder x ∈ A ist oder es ein B ∈ IA gibt mit B ∪ {x} ∈ I. Ist x abh¨ angig von A so schreiben wir daf¨ ur x α A. Satz 3. Es sei I eine Unabh¨ angigkeitsstruktur auf V . Ferner sei x ∈ V und A, B ⊆ V . Ist a α A und A ⊆ B, so ist x α B. Beweis. Wir d¨ urfen annehmen, dass x ∈ B ist. Dann ist x ∈ A. Es gibt daher ein C ∈ IA mit C ∪ {x} ∈ I. Wegen IA ⊆ IB ist daher x α B. Man erinnere sich, E(M ) ist die Menge der endlichen Teilmengen von M . Satz 4. Es sei I eine Unabh¨ angigkeitsstruktur auf V . Ist x ∈ V und A ⊆ V , so gilt genau dann x α A, wenn es ein B ∈ E(A) gibt mit x α B. Beweis. Ist B ∈ E(A) und gilt x α B, so gilt auch x α A nach Satz 3. Es sei x α A. Ist x ∈ A, so ist {x} ∈ E(A) und x α {x}. Es sei also x ∈ A. Es gibt dann ein C ∈ IA mit {x} ∪ C ∈ I. Weil I von endlichem Charakter ist, gibt es eine endliche Teilmenge D von {x} ∪ C mit D ∈ I. Wegen C ∈ I kann nicht D ⊆ C gelten. Also ist x ∈ D. Setze B := D − {x}. Dann ist B eine endliche Teilmenge von C und es gilt somit B ∈ IA . Ferner ist B ∪ {x} = D ∈ I. Also ist x α B. Damit ist alles bewiesen. Satz 5. Es sei I eine Unabh¨ angigkeitsstruktur auf V . Ferner sei A ⊆ V und B sei eine endliche I-Basis von A. Ist x ∈ V und x α A, so ist x α B. Beweis. Angenommen x hinge nicht von B ab. Wegen B ∈ IB ist dann {x}∪B ∈ I. Weil B Basis von A ist, folgt x ∈ A. Wegen x α A gibt es ein C ∈ IA mit
274
Kapitel XI. Transfinite Methoden
{x} ∪ C ∈ I. Nach Satz 1 gibt es eine Basis B von A mit C ⊆ B . Weil B endlich ist, ist nach Satz 2 auch B endlich und es gilt |B| = |B |. Daher ist B ∪ {x} = |B| + 1 = |B | + 1. Wegen B ∪ {x} ∈ I folgt aus dem steinitzschen Austauschsatz die Existenz eines y ∈ B ∪ {x} mit {y} ∪ B ∈ I und y ∈ B . Weil B eine Basis von A ist, folgt y ∈ A und damit y = x. Folglich ist {x} ∪ B ∈ I. Weil C eine endliche Teilmenge von B ist, erhalten wir schließlich den Widerspruch {x} ∪ C ∈ I. Also ist doch x α B, wie behauptet. Sind A und B zwei Teilmengen einer Menge mit Unabh¨angigkeitsstruktur, so setzen wir genau dann A α B, wenn x α B gilt f¨ ur alle x ∈ A. Satz 6. Es sei I eine Unabh¨ angigkeitsstruktur auf V . Ist x ∈ V , sind A, B ⊆ V und gilt x α A und A α B, so ist x α B. Beweis. Wir nehmen zun¨achst an, dass A und B endlich seien. Es sei Y eine Basis von B. Dann ist Y endlich und folglich A α Y nach Satz 5. Folglich ist Y Basis von A ∪ B. Mit Satz 3 folgt x α A ∪ B und mit Satz 5 dann weiter x α Y . Mit Satz 3 folgt schließlich x α B. Nun seien A und B beliebig. Nach Satz 4 gibt es eine endliche Teilmenge Z von A mit x α Z. F¨ ur jedes a ∈ Z gibt es eine endliche Teilmenge Ga von B mit a α Ga . Setze $ Ga . C := a∈Z
Dann ist a α C f¨ ur alle a ∈ Z nach Satz 3. Somit ist Z α C. Weil Z und C endlich sind, ist x α C. Dann ist aber x α B nach Satz 3. Satz 7. Es sei I eine Unabh¨ angigkeitsstruktur auf V . Sind A, B ∈ I, sind A und B endlich und ist A α B, so ist |A| ≤ |B|. Beweis. Angenommen es w¨are |A| > |B|. Dann g¨ abe es ein C ⊆ A mit |C| = |B| + 1. Es g¨ abe folglich ein c ∈ C − B mit {c} ∪ B ∈ I. Hieraus folgte, dass c nicht von B abhinge. Andererseits w¨ are c ∈ A. Wegen A α B folgte der Widerspruch c α B nach Satz 6. Also ist doch |A| ≤ |B|. Wir nennen die Mengen A und B gleichm¨ achtig, wenn es eine Bijektion von A auf B gibt. Um dies auszudr¨ ucken, schreiben wir auch |A| = |B|. Satz 8. Es sei I eine Unabh¨ angigkeitsstruktur auf V . Sind A und B Basen von X ∈ P (V ), so ist |A| = |B|. Insbesondere sind alle Basen von V gleichm¨ achtig. Beweis. Es sei a ∈ A. Dann ist a ∈ X, so dass a α B gilt. Nach Satz 4 gibt es eine endliche Teilmenge Ba von B mit a α Ba . Mittels des Auswahlaxioms erh¨ alt ur alle a ∈ A. Es sei nun X eine endliche Teilmenge man ein solches Ba simultan f¨ # von A. Dann ist X abh¨ angig von a∈X Ba . Mit Satz 7 folgt $ B a ≥ |X|. a∈X
5. Transzendenzbasen
275
Somit erf¨ ullt die Familie (Ba | a ∈ A) die hallsche Bedingung. Auf Grund des Heiratssatzes gibt es daher eine injektive Auswahlfunktion f dieser Familie. Dann ist f aber eine injektive Abbildung von A in B. Vertauscht man die Rollen von A und B, so folgt, dass es auch eine injektive Abbildung von B in A gibt. Nach dem Satz von Cantor & Bernstein gibt es also eine Bijektion von A auf B. Damit ist der Satz bewiesen. Hier ist noch ein weiteres Beispiel einer Unabh¨angigkeitsstruktur. Es sei V ein Rechtsvektorraum u ¨ ber dem K¨ orper K. Die Teilmenge X von V heiße genau dann affin unabh¨ angig, wenn f¨ ur alle endlichen Teilmengen Y von X gilt: Ist f eine Abbildung von Y in K und gilt
yfy = 0
und
y∈Y
fy = 0,
y∈Y
so ist fy = 0 f¨ ur alle y ∈ Y . Dann ist die Menge der affin unabh¨ angigen Teilmengen von V eine Unabh¨ angigkeitsstruktur auf V . Ist V endlich-dimensional als Vektorraum, und ist n diese Dimension, so hat eine affine Basis die L¨ange n + 1. Ist B eine affine Basis von V und ist v ∈ V , so gibt es eine endliche Teilmenge Y von B und eine Abbildung f von Y in K mit v=
y∈Y
yfy
und
fy = 1.
y∈Y
Die fy sind die baryzentrischen Koordinaten von v. 5. Transzendenzbasen. Nun kehren wir zur steinitzschen Arbeit zur¨ uck, wobei wir uns die Freiheit erlauben, andere als die steinitzschen Beweise f¨ ur die steinitzschen S¨ atze zu liefern. Dabei werden wir in diesem Abschnitt die steinitzschen Begriffe der algebraischen Abh¨ angigkeit und Unabh¨ angigkeit studieren und im n¨ achsten dann sehen, dass jeder K¨ orper einen und bis auf Isomorphie auch nur einen algebraischen Abschluss hat. Es sei K ein K¨ orper und L sei eine Erweiterung von K. Ist S eine Teilmenge von L und ist a ∈ L, so heißt a algebraisch abh¨ angig von S, wenn a algebraisch ist in Bezug auf K(S). Ist a nicht algebraisch in Bezug auf K(S), so heißt a algebraisch unabh¨ angig von S. Die Menge S heißt algebraisch unabh¨ angig, wenn jedes a ∈ S von S − {a} algebraisch unabh¨ angig ist. Die Menge der in Bezug auf K algebraisch unabh¨ angigen Teilmengen von L bezeichnen wir mit U(L : K). Satz 1. Es sei L eine Erweiterung des K¨ orpers K. Ferner sei S ∈ U(L : K). Setze xs := (x, s) und X := {xs | s ∈ S}. Ist dann K(X) der Funktionenk¨ orper in den Unbestimmten aus X, so gibt es genau einen Isomorphismus ρ von K(X) auf K(S) mit xρs = s.
276
Kapitel XI. Transfinite Methoden
Beweis. Nach Altbekanntem gibt es einen Epimorphismus ρ von K[X] auf K[S] mit xρs = s. Es sei f ∈ Kern(ρ). Es gibt dann eine endliche Teilmenge T von S und eine endliche Menge E von Abbildungen von T in N0 mit e(t) ae xt , f= e∈E
t∈T
ur alle e ∈ E. Ist w ∈ T und ordnet man f nach Potenzen von wobei ae ∈ K ist f¨ xw , so ist n f= bi xiw i:=0
mit bi ∈ K[T − {xw }] f¨ ur alle i. Es folgt 0 = fρ =
n
bρi wi .
i:=0
Weil T algebraisch unabh¨ angig ist, folgt bρi = 0 f¨ ur alle i. W¨ are nun f nicht 0, so w¨aren nicht alle bi null und man k¨ onnte das gleiche Spiel mit einem bk und T −{w} weiterspielen. Das geht aber nur endlich oft, da T endlich ist. Also ist doch f = 0, so dass ρ injektiv ist. Dann l¨ asst sich ρ aber zu einem Monomorphismus von K(X) in L fortsetzen, dessen Bild in L offenbar K(S) ist. Satz 2. Es sei L eine Erweiterung des K¨ orpers K und S sei eine Teilmenge von L. Genau dann h¨ angt b ∈ L von S algebraisch ab, wenn es eine endliche Teilmenge T von S gibt, von der b algebraisch abh¨ angt. Beweis. Es h¨ange b von S algebraisch ab. Es gibt dann ein von 0 verschiedenes Polynom μ u ¨ ber K(S) mit μ(b) = 0. Ist dann T die Menge der Elemente von S, die in den Koeffizienten von μ vorkommen, so ist T endlich und b ist algebraisch u ¨ ber K(T ), also algebraisch abh¨ angig von T . H¨angt umgekehrt b von der endlichen Teilmenge T von S algebraisch ab, so angt b wegen K(T ) ⊆ K(S) auch von S algebraisch ab. h¨ Korollar. Ist L eine Erweiterung des K¨ orpers K, so ist U(L : K) von endlichem Charakter. Beweis. Es sei A ∈ U(L : K) und T sei eine endliche Teilmenge von A. Ist T nicht algebraisch unabh¨ angig, so gibt es ein t ∈ T , so dass t von T −{t} algebraisch abh¨ angt. Dann h¨ angt t aber auch von A − {t} ab: ein Widerspruch. Es sei umgekehrt jede endliche Teilmenge von A algebraisch unabh¨ angig. W¨ are A nicht algebraisch unabh¨ angig, so g¨ abe es ein t ∈ A, so dass t von A − {t} algebraisch abhinge. Nach Satz 2 g¨ abe es eine endliche Teilmenge T von A − {t}, von der t algebraisch abhinge. Dann w¨ are aber T := T ∪ {t} eine endliche Teilmenge von A, die nicht algebraisch unabh¨ angig w¨ are: ein Widerspruch. Satz 3. Es sei L eine Erweiterung des K¨ orpers K. Es seien ferner {b}, A ∈ U(L : K). Ist {b} ∪ A nicht algebraisch unabh¨ angig, so h¨ angt b von A algebraisch ab.
5. Transzendenzbasen
277
Beweis. Nach dem Korollar zu Satz 2 gibt es eine endliche Teilmenge T von {b} ∪ A, die nicht algebraisch unabh¨ angig ist. Nach dem gleichen Korollar sind die endlichen Teilmengen von A aber allesamt algebraisch unabh¨ angig. Also ist are b algebraisch unabh¨ angig von a1 , . . . , an , b ∈ T . Es sei T = {a1 , . . . , an , b}. W¨ so w¨are b transzendent u ¨ ber K[a1 , . . . , an ] und K[a1 , . . . , an ][b] nach Satz 1 folg¨ ber lich isomorph zu dem Polynomring K[a1 , . . . , an ][y] in der Unbestimmten y u dem Ring K[a1 , . . . , an ]. Nach Satz 1 k¨ onnen wir die ai ebenfalls als Unbestimmte auffassen. Mit Satz 7 von Abschnitt 3 des Kapitels 6 folgt die Isomorphie der Ringe K[a1 , . . . , an ][y] und K[a1 , . . . , an , y] und damit die Isomorphie der Ringe K[a1 , . . . , an ][b] und K[a1 , . . . , an , y], wobei es sogar einen Isomorphismus gibt, der ai auf ai und b auf y abbildet. Es folgt T ∈ U(L : K): ein Widerspruch. Also h¨ angt b doch von {a1 , . . . , an } und damit von A ab. Satz 4. Es sei L eine Erweiterung des K¨ orpers K. Es sei ferner {b}, A ∈ U(L : K) und b sei algebraisch abh¨ angig von A. Es gibt dann eine nicht leere, endliche Teilmenge T von A mit den Eigenschaften: 1) Das Element b h¨ angt von T algebraisch ab. 2) Ist S ⊆ A und h¨ angt b von S algebraisch ab, so ist T ⊆ S. 3) Ist t ∈ T , so ist (T − {t}) ∪ {b} ∈ U(L : K) und t ist von (T − {t}) ∪ {b} algebraisch abh¨ angig. Beweis. Man nehme f¨ ur μ im Beweise von Satz 2 das Minimalpolynom von b u ¨ ber K(A) und f¨ ur T die Menge der a ∈ A, die in Koeffizienten von A vorkommen, und keine weiteren. Als Minimalpolynom von b u ¨ ber K(A) ist μ insbesondere irreduzibel. 1) T ist endlich, wie beim Beweise von Satz 2 gesehen. 2) Es sei S ⊆ A und b h¨ ange von S algebraisch ab. Es gibt dann ein Polynom ρ u ¨ ber K(S) mit ρ(b) = 0. Wegen S ⊆ A ist ρ auch ein Polynom u ¨ber K(A). Dieses hat mit dem irreduziblen Polynom die gemeinsame Nullstelle b. Folglich ist μ Teiler von ρ. Hieraus folgt T ⊆ S. 3) Es sei t ∈ T . Sortieren von f nach Potenzen von t ergibt f=
m
uj (x)tj
j:=0
mit Koeffizienten uj (x) ∈ K[(T −{t})∪{x}] und um (x) = 0. Weil t in f vorkommt, ist m ≥ 1. Es folgt m 0 = f (b) = uj (b)tj . j:=0
W¨ are um (b) = 0, so w¨are um (x) in K(A)[x] durch μb teilbar. Weil um (x) in x aber h¨ ochstens vom Grade Grad(f ) ist, g¨ abe es folglich ein l ∈ K(A) mit um (x) = lμb . Hieraus folgte weiter um (x) = lkf.
278 Es sei lk =
Kapitel XI. Transfinite Methoden η ϑ
mit η, ϑ ∈ K[A]. Ist ferner um (x) = cont um (x) g
mit einem primitiven g ∈ K[A][x], so folgte ϑcont um (x) g = ηf. Nach Satz 2 von Abschnitt 1 des Kapitel 6 g¨ abe es ein e ∈ K ∗ mit g = ef . Hieraus folgte, dass t in keinem der Koeffizienten von f vork¨ ame, da t in g ja nicht vorkommt. Dieser Widerspruch zeigt, dass um (b) = 0 ist. Also ist doch g=
m
uj (b)y j = 0.
j:=0
Wegen g(t) = 0 folgt, dass t von (A − {t}) ∪ {b} algebraisch abh¨ angt. Also gilt auch 3). Satz 5. Ist L eine Erweiterung des K¨ orpers K, so ist U(L : K) eine Unabh¨ angigkeitsstruktur. Beweis. Wir wissen schon, dass U(L : K) von endlichem Charakter ist (Korollar zu Satz 2). Um zu zeigen, dass auch der steinitzsche Austauschsatz gilt, seien A, B endliche Teilmengen von L und es gelte A, B ∈ U(L : K) sowie |B| = |A| + 1. Wir m¨ ussen zeigen, dass es ein b ∈ B gibt, welches von A nicht algebraisch abh¨ angt. Wir nehmen an, dass es kein solches b gibt. Dann ist b von A algebraisch abh¨ angig f¨ ur alle b ∈ B. Wir zeigen nun: Ist k ≤ |A| und ist D eine k-Teilmenge von B, so gibt es eine k-Teilmenge C angt und A ∈ U(L : K) von A, so dass B von A := (A − C) ∪ D algebraisch abh¨ gilt. Dies ist richtig f¨ ur k = 0. Es sei also 0 ≤ k < |A| und die Aussage gelte f¨ ur k. Es sei D eine (k + 1)-Teilmenge von B, es sei b ∈ D und D := D − {b}. Dann ist D eine k-Teilmenge von B. Nach Induktionsannahme gibt es eine k-Teilmenge C von A, so dass B von A := (A − C) ∪ D algebraisch abh¨ angt und dass A ∈ U(L : K) ist. Es ist b ∈ D nach Konstruktion von D. Ferner ist {b} ∈ U(L : K), da {b} ja Teilmenge von B ist. Ferner h¨angt b als Element von B von A algebraisch ab. Nach Satz 4 gibt es also eine nicht leere, endliche Teilmenge T von A mit den Eigenschaften 1) b h¨ angt von T algebraisch ab. angt b von S algebraisch ab, so ist T ⊆ S. 2) Ist S ⊆ A und h¨ 3) Ist t ∈ T , so ist (T − {t}) ∪ {b} ∈ U(L : K) und t ist algebraisch abh¨ angig von (T − {t}) ∪ {b}. W¨ are T ⊆ D, so w¨are T ⊆ B − {b}. Weil b von T abh¨ angt, hinge b von B − {b} ab im Widerspruch zur Unabh¨ angigkeit von B. Also ist T ⊆ D. Es gibt folglich
6. Der algebraische Abschluss eines K¨ orpers
279
ein t ∈ T mit t ∈ D. Setze C := C ∪ {t} und A := (A − C ) ∪ D . Wegen t ∈ A = (A − C) ∪ D und t ∈ D ist t ∈ A − C und folglich t ∈ C. Also ist |C | = |C| + 1 = k + 1 = |D |. Wegen D = D ∪ {b} folgt A = A − {t} ∪ {b}. Wegen
T − {t} ∪ {b} ⊆ A
h¨ angt t von A ab. Dann h¨ angt aber auch A von A ab. Weil B von A abh¨ angt, h¨ angt schließlich auch B von A ab. Wir m¨ ussen noch zeigen, dass A ∈ U(L : K) ist. W¨ are dies nicht der Fall, so hinge b nach Satz 3 von A − {t} ab. Mit 2) folgte der Widerspruch t ∈ T ⊆ A − {t}. Also ist doch A ∈ U(L : K). Mit k = n folgt nun, dass jedes Element von B (eines gen¨ ugte f¨ ur den Widerspruch) von den u ¨brigen abh¨ angt im Widerspruch zur algebraischen Unabh¨ angigkeit von B. Damit ist der Satz bewiesen. Ist B ein maximales Element von U(L : K), so heißt B Transzendenzbasis von L u ¨ ber K. Nach Satz 8 von Abschnitt 4 sind je zwei Transzendenzbasen von L u ¨ ber K gleichm¨achtig. Die entsprechende M¨achtigkeit wird u ¨ blicherweise Transzendenzgrad von L u ¨ ber K genannt. Satz 4. Es sei L eine Erweiterung des K¨ orpers K. Ist B eine Transzendenzbasis von L u ¨ber K, so ist L algebraisch u ¨ber K(B). Beweis. Wegen der Maximalit¨ at von B ist jedes l ∈ L algebraisch abh¨ angig von B. 6. Der algebraische Abschluss eines K¨ orpers. Der K¨ orper C der komplexen Zahlen ist algebraisch abgeschlossen, wie wir schon lange wissen. Das heißt, dass die u ¨ ber C irreduziblen Polynome alle vom Grade 1 sind. Dies ist gleichbedeutend damit, dass jedes Polynom positiven Grades mit Koeffizienten in C eine Nullstelle in C hat. Wir werden nun sehen, dass sich jeder K¨ orper in einen algebraisch abgeschlossenen K¨orper einbetten l¨ asst. Dies ist vor allem ein mengentheoretisches Problem, wie sich zeigen wird, das Steinitz mit Hilfe des zermeloschen Wohlordnungssatzes l¨ oste, dass wir jedoch eingedenk der zermeloschen Kritik auf andere Weise l¨ osen werden. Vervollst¨andigen wir also unser mengentheoretisches R¨ ustzeug. Der Beweis des ersten Satzes zeigt ein sch¨ones Zusammenspiel von Auswahlaxiom und dedekindschem Rekursionssatz.
280
Kapitel XI. Transfinite Methoden
Satz 1. Ist X eine unendliche Menge und ist T eine endliche Teilmenge der L¨ ange n von X, so gibt es eine injektive Abbildung μ von N in X mit μ {1, . . . , n} = T. Beweis. Es sei E(X) die Menge der endlichen Teilmengen von X. Ist Y ∈ E(X), so ist X − Y = ∅, da X nicht endlich ist. Es gibt also eine Auswahlfunktion f ∈ cartY ∈E(X) (X − Y ). Wir definieren die Abbildung R von E(X) in E(X) durch R(Y ) := Y ∪ f (Y ) . Nach dem dedekindschen Rekursionssatz (s. Kap. 2, Absch. 2) gibt es eine Abbildung g von N0 in E(X) mit g(0) = T und g(n + 1) = R g(n) = g(n) ∪ f (g(n)) . Man beachte, dass g(n) ⊆ g(n + 1) ist, so dass die g(i) eine Kette bilden. Es sei nun h eine Bijektion von {1, . . . , n} auf T . Definiere μ durch μ(i) :=
h(i) (f g)(i − n)
f¨ ur i ≤ n f¨ ur i > n.
Dann ist μ eine Abbildung von N in X mit μ({1, . . . , n}) = T . Dar¨ uberhinaus gilt, dass μ injektiv ist. Dies folgt aus der Injektivit¨ at von h und daraus, dass μ(n + i − 1) ∈ g(i) und μ(n + i) ∈ g(i) ist f¨ ur alle i ∈ N. Korollar 1. Ist X eine unendliche Menge, so gibt es eine injektive Abbildung von N in X. Dies folgt mit T = ∅ aus Satz 1. Korollar 2. Ist X eine unendliche Menge und ist T eine endliche Teilmenge von X, so gibt es eine Bijektion von X auf X − T . Beweis. Setze n := |T |. Nach Satz 1 gibt es eine injektive Abbildung f von N in X mit f ({1, . . . , n}) = T . Definiere β durch β(x) :=
f (i + n), falls x = f (i) ist, x, falls x = f (i) ist f¨ ur alle i.
6. Der algebraische Abschluss eines K¨ orpers
281
Dann leistet β das Verlangte. Satz 2. Es sei M eine Menge und f sei eine Abbildung von M in die Potenzmenge P (M ) von M . Ist dann W := x x ∈ f (x) , so liegt W nicht im Bild von f . Es gibt insbesondere keine surjektive Abbildung von M auf P (M ). Beweis. Es sei w ∈ M und f (w) = W . W¨ are w ∈ W , so folgte aus der Definition von W , dass w ∈ f (w) = W w¨are. W¨are w ∈ W = f (w), so folgte w ∈ W . Es kann also kein w ∈ M mit f (w) = W geben. Satz 3. Die durch f (a) := (a MOD n) + 1, (a DIV n) + 1 definierte Abbildung f ist eine Bijektion von N auf {1, . . . , n} × N. Beweis. Banal. Satz 4. Die durch f (i, k) :=
(k − 1)2 + i i2 − k + 1
f¨ ur 1 ≤ i ≤ k f¨ ur k < i
definierte Abbildung f ist eine Bijektion von N × N auf N. Beweis. Setze Cn := {1, . . . , n}×{1, ankung # . . . , n} und fn#bezeichne die Einschr¨ von f auf Cn . Dann ist N × N = n∈N Cn und f = n∈N fn . Es gen¨ ugt daher zu zeigen, dass fn f¨ ur alle n eine Bijektion von Cn auf {1, . . . , n2 } ist. Dies ist richtig f¨ ur n = 1. Es sei n ≥ 1 und der Satz gelte f¨ ur n. Es ist Cn+1 = Cn ∪ (i, n + 1) 1 ≤ i ≤ n + 1 ∪ (n + 1, i) 1 ≤ i < n + 1 . Nun ist f (i, n + 1) = n2 + i und f (n + 1, i) = (n + 1)2 − i + 1. Somit trifft fn+1 alle Werte in {n2 + 1, . . . , (n + 1)2 }. Weil fn auch die Einschr¨ ankung von fn+1 auf Cn ist, folgt, dass fn+1 eine surjektive Abbildung von Cn+1 auf {1, . . . , (n + 1)2 } ist. Weil beide Mengen gleichm¨achtig sind, ist fn+1 bijektiv. Der Beweis liefert mehr, als im Satz gesagt wurde. Die S¨atze 3 und 4 lassen sich verallgemeinern. Der resultierende Satz ben¨otigt zu seinem Beweise das Auswahlaxiom, so dass seine Aussage nur noch eine Existenzaussage ist. Satz 5. Ist M eine unendliche Menge und ist U = {1, . . . , n} oder U = N, so sind M und U × M gleichm¨ achtig. Beweis. Es sei Φ die Menge aller Paare (X, f ) mit X ⊆ M und einer Bijektion f von X auf U × X. Weil M als unendliche Menge nach dem Korollar 1 zu Satz 1 eine abz¨ahlbare Teilmenge enth¨ alt, ist Φ nach den S¨atzen 3 und 4 nicht leer.
282
Kapitel XI. Transfinite Methoden
Wir definieren auf Φ eine Teilordnung ≤ durch (X, f ) ≤ (Y, g), wenn X ⊆ Y und f ⊆ g ist. Auf Grund des hausdorffschen Maximumprinzips gibt es in (Φ, ≤) eine maximale Kette Γ. Setze $ $ X und f0 := f. X0 := (X,f )∈Γ
(X,f )∈Γ
Dann ist (X0 , f0 ) ∈ Φ. W¨ are nun M − X0 unendlich, so enthielte M − X0 eine abz¨ahlbare Teilmenge W . Nach den S¨ atzen 3 und 4 g¨ abe es eine Bijektion g von W auf U × W . Es w¨ are U × (X0 ∪ W ) = (U × X0 ) ∪ (U × W ) und (U × X0 ) ∩ (U × W ) = ∅. Es folgte (X0 ∪ W, f0 ∪ g) ∈ Φ. Andererseits w¨are (X, f ) ≤ (X0 ∪ W, f0 ∪ g) f¨ ur alle (X, f ) ∈ Γ. Aus der Maximalit¨ at von Γ folgte schließlich der Widerspruch X0 ∪ W ⊆ X0 . Damit ist gezeigt, dass M − X0 endlich ist. Nach dem Korollar 2 zu Satz 1 gibt es eine Bijektion β von M auf X0 . Dann ist f0 β eine Bijektion von M auf U × X0 . Definiert man schließlich γ durch γ(u, x) := u, β −1 (x) , so ist γ eine Bijektion von U × X0 auf U × M . Daher ist γf0 β eine Bijektion von M auf U × M . Damit ist der Satz bewiesen. Satz 6. Ist M eine unendliche Menge und ist U = {1, . . . , n} oder U = N, so gibt ur alle i ∈ U . es eine Partition {Ai | i ∈ U } von M mit |Ai | = |M | f¨ Beweis. Nach Satz 5 gibt es eine Bijektion f von U × M auf M . Setze Ai := {f (i, m) | m ∈ M }. Dann leistet {Ai | i ∈ U } das Verlangte. Satz 7. Es sei M eine unendliche Menge und T sei eine Teilmenge von M . Gibt es keine injektive Abbildung von T in M − T , so sind M und T gleichm¨ achtig. Beweis. W¨are T endlich, so g¨ abe es nach dem Korollar 2 zu Satz 1 eine bijektive Abbildung von M auf M − T . Ihre Einschr¨ ankung auf T w¨are dann eine injektive Abbildung von T in M − T . Das widerspricht aber unserer Voraussetzung. Also ist T unendlich. Nach Satz 6 gibt es daher eine Partition T1 , T2 von T mit |T | = |T1 | = |T2 |. Weil es keine injektive Abbildung von T in M − T gibt, gibt es nach Satz 5 von Abschnitt 1 eine injektive Abbildung von M − T in T . Folglich gibt es auch eine injektive Abbildung von M − T in T2 . Es gibt dann auch eine injektive Abbildung von M = T ∪(S −T ) in T1 ∪T2 = T . Trivialerweise gibt es eine injektive
6. Der algebraische Abschluss eines K¨ orpers
283
Abbildung von T in M . Nach dem Satz von Cantor & Bernstein gibt es dann auch eine bijektive Abbildung von T auf M , so dass T und M gleichm¨achtig sind. Satz 8. Ist M eine unendliche Menge, so sind M und M × M gleichm¨ achtig. Beweis. Es sei Φ die Menge aller Paare (X, f ), wobei X eine unendliche Teilmenge von M und f eine Bijektion von X auf X × X ist. Weil X eine abz¨ahlbare Teilmenge enth¨ alt, ist Φ nach Satz 4 nicht leer. Wir ordnen Φ wieder durch die Vorschrift: Genau dann ist (X, f ) ≤ (Y, g), wenn X ⊆ Y und f ⊆ g gilt. Nach dem hausdorffschen Maximumprinzip gibt es eine maximale Kette Γ in (Φ, ≤). Wir setzen $ $ X und f0 := f. X0 := (X,f )∈Γ
(X,f )∈Γ
¨ Dann ist (X0 , f0 ) ∈ Φ. Uberdies ist X0 unendlich. Wir nehmen an, es g¨ abe eine injektive Abbildung von X0 in M − X0 . Dann g¨abe es also eine Teilmenge W von M − X0 mit |W | = |X0 |. Wegen (X0 , f0 ) ∈ Φ folgte |W × X0 | = |X0 × W | = |W × W | = |W |. Nach Satz 5 g¨ abe es eine Partition W1 , W2 , W3 von W mit |Wi | = |W | f¨ ur alle i. Es g¨abe dann Bijektionen von W1 auf X0 × W , von W2 auf W × X0 und von W3 auf W × W . Es g¨abe dann folglich eine Bijektion g von X0 ∪ W1 ∪ W2 ∪ W3 = X0 ∪ W auf (X0 × X0 ) ∪ (X0 × W ) ∪ (W × X0 ) ∪ (W × W ) = (X0 ∪ W ) × (X0 ∪ W ) are (X, h) < (X0 ∪ W, g) f¨ ur alle (X, h) ∈ Γ im Widerspruch zur mit f0 ⊆ g. Es w¨ Maximalit¨ at von Γ. Da es also keine injektive Abbildung von X0 in M − X0 gibt, folgt mit Satz 7, dass X0 und M gleichm¨achtig sind. Also ist |M × M | = |X0 × X0 | = |X0 | = |M |, was zu beweisen war. Satz 9. Es sei M eine unendliche Menge und I sei eine nicht leere Teilmenge von ur alle M . Ist dann (F #i | i ∈ I) eine Familie von Mengen und und gilt |Fi | = |M | f¨ i ∈ I, so ist | i∈I Fi | = |M |. Beweis. Es gibt eine injektive Abbildung von I × M in M × M . nach Satz 8 gibt es eine bijektive Abbildung von M × M auf M . Also gibt es eine injektive Abildung von I × M in M . Weil I nicht leer ist, gibt es eine injektive Abbildung
284
Kapitel XI. Transfinite Methoden
von M in I × M . Nach dem Satz von Cantor & Bernstein gibt es folglich eine Bijektion f von I × M auf M . F¨ ur i ∈ I setzen wir Mi := f (i, m) m ∈ M . Dann ist die Menge der Mi eine Partition von M und es gilt |Mi | = |M | f¨ ur alle i ∈ I. Es gibt folglich zu jedem i ∈ I eine Bijektion von Mi auf Fi . Auf Grund des Auswahlaxioms gibt es daher ein g, so dass gi f¨ ur alle i eine Bijektion von Mi auf Fi ist. Insbesondere ist gi eine surjektive Abbildung von Mi auf Fi . Ist x ∈ M , so definieren wir h(x) durch h(x) := gi (x), falls x ∈ Mi #ist. Weil die Mi eine Partition von M bilden, ist h eine Abbildung von M auf i∈I # Fi . Nach Satz 12 von Abschnitt 1 gibt es folglich eine injektive Abbildung von i∈I #Fi in M . Weil I nicht leer ist, gibt es auch eine injektive Abbildung von M in i∈I Fi , so dass die Behauptung des Satzes schließlich mittels des Satzes von Cantor & Bernstein folgt. Satz 10. Ist I eine unendliche Menge und ist (F#i | i ∈ I) eine Familie endlicher Mengen, so gibt es eine injektive Abbildung von i∈I Fi in I. Beweis. # Wir setzen Ai := Fi × {i}. Dann ist Ai ∩ Aj = ∅, falls nur i = j ist. Ist x ∈ i∈I Ai , so gibt es genau ein i ∈ I mit x ∈ Ai . Es gibt folglich genau ein y ∈ F#i mit x = (y, #i). Wir setzen f (x) := y. Dann ist f eine surjektive Abbildung von i∈I Ai auf i∈I Fi . Mittels des Auswahlaxioms # # erschließt man hieraus die Existenz einer injektive Abbildung von i∈I Fi in i∈I Ai . Wie wir beim Beweis von Satz 9 gesehen haben, gibt es eine Partition {Mi | ur alle i ∈ I. Weil I unendlich ist, gibt es f¨ ur jedes i ∈ I} von I mit |Mi | = |I| f¨ i eine injektive Abbildung von Ai in Mi . Weil die Ai wie auch die Mi paarweise disjunkt # mittels des Auswahlaxioms, dass es eine injektive Abbildung # sind, folgt A in von i∈I i i∈I Mi = I gibt. Also gibt es auch eine injektive Abbildung von # F in I. i∈I i Satz 11. Es sei K ein K¨ orper und L sei eine algebraische Erweiterung von K. Ist K endlich, so ist L endlich oder abz¨ ahlbar. Ist K unendlich, so ist |L| = |K|. ¨ ber K mit Beweis. F¨ ur n ∈ N sei Φn die Menge der Polynome vom Grade n u Leitkoeffizient 1. Ist f ∈ Φn , so ist also f = xn +
n−1
ai xi .
i:=0
Dies zeigt, dass Φn dem n-fachen cartesischen Produkt von n Kopien von K gleichm¨achtig ist. Ist f ∈ K[x], so bezeichnen wir mit # Wf die Menge der Wurzeln von f in L. Weil L algebraisch ist, ist dann L = f ∈K[x] Wf . Es sei zun¨achst K unendlich. Mittels Induktion folgt dann aus Satz 8, dass ahlbare Teilmenge von K. |Φn | = |K| ist. Weil M unendlich ist, gibt es eine abz¨
6. Der algebraische Abschluss eines K¨ orpers
285
# Wegen K[x] = ∞ n:=0 Φn folgt daher aus Satz 9, dass auch |K[x]| = |K| ist. Weil die Wf endlich sind, folgt mit Satz 10 dann, dass es eine injektive Abbildung von L in K gibt. Da es andererseits eine injektive Abbildung von K in L gibt, folgt nach dem Satz von Cantor & Bernstein, dass |K| = |L| ist. Ist schließlich K endlich, so sagt Satz 10, dass es eine injektive Abbildung von ahlbar. Damit ist alles bewiesen. von L in N0 gibt. Folglich ist L endlich oder abz¨ Ist K ein K¨ orper und ist L eine Erweiterung von K, so heißt L algebraischer Abschluss von K, wenn L algebraisch abgeschlossen und u ¨ berdies algebraisch u ¨ber K ist. Will man nun zeigen, dass jeder K¨ orper einen algebraischen Abschluss hat, so ist das Problem, eine Menge zu finden, die groß genug ist, dass man auf ihr einen K¨ orper definieren kann, der sich dann als algebraischer Abschluss des gegebenen K¨ orpers erzeigen wird. Um nun herauszufinden, wie groß diese Menge zu sein hat, bedient man sich des Satzes 11, der Aussagen u ¨ber die Gr¨ oße von algebraischen Erweiterungen von K macht. Die Art unseres Beweises verlangt dar¨ uber hinaus, dass die Menge, auf der wir operieren, von keiner noch so gearteten maximalen algebraischen Erweiterung von K ausgesch¨opft werden darf. Dies erreicht man im Falle, dass K endlich ist, dadurch, dass man mit einer Menge beginnt, die u ¨ berabz¨ahlbar ist, und im Falle, dass K unendlich ist, mit einer Menge, auf die sich K nicht surjektiv abbilden l¨ asst. Satz 12. Ist K ein K¨ orper, so besitzt K einen algebraischen Abschluss. Beweis. Ist K endlich, so sei M := P (N). Ist K unendlich, so sei M := P (K). Dann ist im Falle, dass K endlich ist, auf Grund von Satz 2 jede abz¨ ahlbare Teilmenge von M eine echte Teilmenge von M . Ist K unendlich, so folgt ebenfalls mit Satz 2, dass jede zu K gleichm¨achtige Teilmenge von M eine echte Teilmenge von M ist. In beiden F¨ allen gibt es eine injektive Abbildung von K in M . Transportiert man mit dieser Abbildung auch die auf K definierte Addition und Multiplikation nach M , so sieht man, dass man K mit einer Teilmenge von M identifizieren darf. Wir betrachten nun die Menge Φ aller Tripel (X, +X , ·X ), so dass gilt: Es ist K ⊆ X und + ⊆ +X sowie · ⊆ ·X . Auf Φ definieren wir eine Teilordnung, indem wir die Tripel von Φ komponentenweise mittels der Inklusion vergleichen. Ist dann # # Λ eine Kette von Φ, so setze man C := (X,+X ,·X )∈Λ X, +C := (X,+X ,·X )∈Λ +X # und ·C := (X,+X ,·X )∈Λ ·X . Man sieht unmittelbar, dass (C, +C , ·C ) zu Φ geh¨ort und dass (C, +C , ·C ) eine obere Schranke von Λ ist. Auf Grund des zornschen Lemmas gibt es also in Φ ein maximales Element (L, +, ·). Auf Grund von Satz 10 und der Wahl von M ist L eine echte Teilmenge von M . Ist L endlich, so folgt ferner, dass M − L und M gleichm¨achtig sind. Ist L unendlich, so l¨ asst sich L auch noch in M − L injektiv abbilden. Es sei nun f ein u ¨ ber L irreduzibles Polynom. Dann ist der K¨ orper W := L[x]/f L[x] entweder endlich oder er hat die gleiche M¨ achtigkeit wie L. In jedem Fall findet man eine Abbildung ρ, die W in M hinein abbildet und auf L die Identit¨ at induziert. Transportiert man die in W gegebene Addition und Multiplikation mittels ρ ebenfalls nach M , so ist ρ(W ) mit dieser Addidition
286
Kapitel XI. Transfinite Methoden
und Multiplikation eine algebraische Erweiterung von L, weil L algebraische Erweiterung von K ist, ist dann aber auch ρ(W ) algebraische Erweiterung von K. Aus der Maximalit¨ at von L folgt dann ρ(W ) = L und damit W = L. Folglich hat f den Grad 1, so dass L algebraisch abgeschlossssen ist. Satz 13. Es sei K ein K¨ orper und L sei eine algebraisch abgeschlossene Erweiterung von K. Ist M eine algebraische Erweiterung von K, so gibt es einen K-linearen Monomorphismus von M in L. Beweis. Es sei Φ die Menge der Paare (X, ξ), wobei X ein K umfassender Teilk¨ orper von M und ξ ein K-linearer Monomorphismus von X in L ist. Ist ι die Inklusionsabbildung von K in L, so ist (K, ι) ∈ Φ, so dass Φ nicht leer ist. F¨ ur (X, ξ), (Y, η) ∈ Φ setzen wir (X, ξ) ≤ (Y, η) genau dann, wenn X ⊆ Y und ξ ⊆ η ist. Ist Γ eine Kette von Φ, so setzen wir G :=
$
X
und
γ :=
(X,ξ)∈Φ
$
ξ.
(X,ξ)
Dann ist (G, γ) eine ober Schranke von Γ in Φ. Auf Grund des zornschen Lemmas enth¨ alt Φ daher ein maximales Element (N, σ). Wir zeigen, dass N = M ist. Weil M u ¨ ber K algebraisch ist, ist M erst recht u ¨ ber N algebraisch. Es sei a ∈ M . Dann hat a also ein Minimalpolynom μ u ¨ ber N . Dieses ist irreduzibel. Weil L uherem algebraisch abgeschlossen ist, hat f σ eine Nullstelle a in L. Es gibt nach Fr¨ einen Monomorphismus τ von N [a] auf N σ [a ] mit nτ = nσ f¨ ur alle n ∈ N . Dann ist τ insbesondere K-linear, so dass (N [a], τ ) ∈ Φ ist. Ferner ist (N, σ) ≤ (N [a], τ ). Aus der Maximalit¨ at von (N, σ) folgt daher N = N [a] und weiter a ∈ N . Also ist M ⊆ N und folglich M = N , womit alles bewiesen ist. Korollar. Ist K ein K¨ orper, so hat K bis auf Isomorphie genau einen algebraischen Abschluss. Beweis. Es ist nur noch die Isomorphie zweier algebraischer Abschl¨ usse L und L von K zu beweisen. Nach Satz 13 gibt es einen K-linearen Monomorphismus σ von L in L . Dann ist K ⊆ Lσ ⊆ L . ¨ber Lσ algebraisch ist und Lσ andererseits algebraisch abgeschlossen Weil L dann u σ ist, folgt L = L . Der n¨ achste Satz findet sich nicht bei Steinitz. Satz 14. Es sei K ein K¨ orper und L sei eine algebraisch abgeschlossene Erweiterung von K. Es sei ferner B eine Transzendenzbasis von L u ¨ber K. Ist dann ρ eine bijektive Abbildung von B auf sich, so gibt es einen K-linearen Automorur alle b ∈ B. phismus σ von L mit bσ = bρ f¨ Beweis. Nach Satz 1 von Abschnitt 5 d¨ urfen wir K(B) mit dem Funktionenk¨ orper in den Unbestimmten aus B identifizieren. Dann l¨ asst sich ρ aber
7. Formal reelle K¨ orper
287
bekanntlich zu einem Automorphismus von K[B] und dann weiter zu einem Automorphismus von K(B) fortsetzen, der ebenfalls ρ heißen m¨oge. Nun schließe man weiter wie beim Beweise von Satz 13, indem man K[B] die Rolle von K und ρ die Rolle der Identit¨ at spielen l¨ asst. Aus Satz 11 folgt, dass der algebraische Abschluss von Q abz¨ ahlbar ist, da Q es ist. Weil C die M¨ achtigkeit des Kontinuums hat, kann C nicht der algebraische Abschluss von Q sein. Somit ist C eine transzendente Erweiterung von Q. Es folgt weiter, dass der Transzendenzgrad von C u ¨ ber Q gleich dem Kontinuum ist. Zusammen mit Satz 14 ergibt das, das C sehr, sehr viele Automorphismen hat, was gelegentlich selbst Funktionentheoretiker u ¨ berrascht, wie ich bei einem Kolloquiumsvortrag einmal erlebte. Von all diesen Automorphismen sind aber nur zweie stetig. Dass der K¨orper aller u ¨ ber Q algebraischen reellen Zahlen abz¨ ahlbar ist, hat zuerst G. Cantor bemerkt (Cantor 1874). Mit seinem Argument kann man genauso gut die Abz¨ ahlbarkeit des algebraischen Abschlusses von Q beweisen. Hierzu ben¨ otigt man nicht das Auswahlaxiom. Wir werden dies sp¨ ater noch sehen, wenn wir mit Steinitz zeigen werden, dass sich der algebraische Abschluss von Qp ebenfalls konstruieren l¨ asst, ohne das Auswahlaxiom zu benutzen. Diesem Thema werden wir uns zuwenden, wenn wir die galoissche Theorie abgehandelt haben, da diese uns dann n¨ utzlich sein wird. Zun¨ achst aber werden wir uns noch einmal den angeordneten K¨ orpern zuwenden. 7. Formal reelle K¨ orper. Weber hat es in seiner Annalenarbeit von 1893 noch mit algebraischen Gleichungen zu tun. Er sucht und findet zumindest im Falle, dass die Diskriminante nicht null ist, den Zerf¨ allungsk¨ orper und auch die Gruppe der Gleichung. Bei Steinitz ist es dann ganz anders. Bei ihm dienen Polynome nur noch dem Zweck zu entscheiden, ob ein Element eines Erweiterungsk¨ orpers von K u ¨ ber K algebraisch ist oder nicht. Bei seinen Untersuchungen kommt aber auch heraus, dass jeder K¨ orper K einen algebraischen Abschluss hat, dass es also einen K¨ orper gibt, u ¨ber dem insbesondere jedes Polynom u ¨ber K vollst¨andig in Linearfaktoren zerf¨allt. F¨ ur den urspr¨ unglich alleine interessierenden Fall der Polynome u ¨ ber Q oder R hatten wir in C schon einen solchen K¨ orper gefunden. Die Frage nach der L¨osbarkeit von algebraischen Gleichungen durch Radikale ist mit all dem aber immer noch nicht beantwortet. Es gab da auch die Frage nach den reellen Nullstellen von Polynomen u ¨ ber Q oder R, nach ihrer Anzahl und dem ungef¨ ahren Ort, wo sie zu finden seien. Die cartesische Zeichenregel gab ein partielle Antwort auf sie und wir k¨ undigten an, dass die sturmschen Ketten eine vollst¨andige L¨ osung des Problems lieferten. Die hier anstehenden Fragen haben alle mit der Anordnung von Q, bzw. R zu tun. Es ist daher nicht verwunderlich, dass nach der steinitzschen Arbeit nun auch die Frage auftauchte, angeordnete K¨ orper auf algebraischem Wege zu beschreiben. Man wollte, um es pr¨aziser auszudr¨ ucken, die Frage der Anordenbarkeit eines K¨ orpers auf Fragen u ¨ber Addition und Multiplikation zur¨ uckf¨ uhren, wobei die
288
Kapitel XI. Transfinite Methoden
Mengenlehre den Rahmen abgab. Letzteres wurde aber nicht ausdr¨ ucklich betont. Die hier anstehenden Fragen wurden von Artin und Schreier aufgeworfen und in ihrer ebenfalls ber¨ uhmten Arbeit in den Hamburger Abhandlungen gel¨ ost (Artin & Schreier 1927). Um diese Arbeit wird es hier nun gehen und in ihr werden wir den Rahmen finden, auch die sturmschen Ketten abzuhandeln, so dass wir am Ende dieses Kapitels dann doch wieder bei den Polynomen landen. Berichten wir, wenn auch nur auszugsweise, u ¨ ber die Arbeit von Artin und Schreier. Das Auffallende an angeordneten K¨ orpern ist, dass Quadrate stets nicht negativ sind und dass die Summe von positiven Elementen stets positiv ist. In einem angeordneten K¨ orper folgt also aus ni:=1 ki2 = 0, dass alle ki gleich 0 sind. Dies ist gleichbedeutend damit, dass −1 nicht Summe von Quadraten ist. Mit dieser Bemerkung beginnen die Untersuchungen Artin und Schreiers und sie fahren fort mit der Definition Ein K¨ orper heiße reell“, wenn in ihm −1 nicht als Summe von Quadraten ” darstellbar ist. Statt reell“ werden wir heutigem Sprachgebrauch folgend formal reell sagen. ” Es folgt die Definition des angeordneten K¨ orpers, die wir schon in Abschnitt 6 von Kapitel 6 zitierten und die wir hier nicht wiederholen werden. Ebenso nicht die einfachsten Eigenschaften angeordneter K¨ orper und die Definition des zugeh¨ origen Absolutbetrages. Dies alles lese man in Abschnitt 6 von Kapitel 6 nach. Ein K¨ orper K heißt reell abgeschlossen, wenn K formal reell, aber jede echte algebraische Erweiterung von K nicht formal reell ist. Prototypen reell abgeschlossener K¨ orper sind nat¨ urlich R und auch der K¨ orper der reellen algebraischen Zahlen. Artin und Schreier sagen nun in ihrem Satz 1, dass ein reell abgeschlossener K¨ orper genau eine Anordnung besitzt. Das gilt aber auch f¨ ur Q. Was sie jedoch beweisen, ist sehr viel mehr, n¨amlich dass die von 0 verschiedenen Quadrate eines solchen K¨orpers einen Positivbereich bilden. Das ist im Folgenden immer wieder wichtig, so dass wir den Satz entsprechend formulieren werden. Satz 1. Ist K ein reell abgeschlossener K¨ orper, so bilden die von 0 verschiedenen Quadrate von K einen Positivbereich. R kann also auf eine und nur eine Weise geordnet werden. Beweis. Es sei c ∈ K und c sei kein Quadrat in K. Dann ist x2 − c irreduzibel, so dass es eine quadratische Erweiterung L von K gibt, in der dieses Polynom eine Nullstelle γ hat. Weil L nicht formal reell ist, gibt es ai und bi in K mit −1 =
n
(ai γ + bi )2 .
i:=1
Es folgt −1 = c
n i:=1
a2i +
n i:=1
b2i + 2γ
n i:=1
ai b i .
7. Formal reelle K¨ orper
289
Die dritte Summe auf der rechten Seite ist null, da γ nicht zu K geh¨ort. Also ist −1 = c
n
a2i +
i:=1
n
b2i .
i:=1
Hieraus folgt, dass c nicht Summe von Quadraten ist, da andernfalls −1 Summe von Quadraten w¨ are. Folglich ist die Summe von Quadraten stets wieder ein Quadrat. n Ebenso ist i:=1 a2i = 0, da −1 nicht Summe von Quadraten ist. Also ist n 1 + i:=1 b2i −c = n 2 . i:=1 ai Da nach der gerade gemachten Bemerkung Z¨ahler und Nenner Quadrate sind, ist −c ein Quadrat. Damit ist gezeigt, dass die von 0 verschiedenen Quadrate von K einen Positivbereich bilden. Also tr¨ agt K eine Anordnung. Da von 0 verschiedene Quadrate stets positiv sind, folgt auch die Einzigkeitsaussage des Satzes. Reell abgeschlossene K¨orper sind also stets angeordnet. Ihre Charakteristik ist folglich 0. Der n¨ achste Satz liefert den Anschluss an die Entwicklungen von Kapitel 6. Satz 2. In jedem reell abgeschlossenen K¨ orper besitzt jedes Polynom ungeraden Grades mindestens eine Nullstelle. Beweis. Es sei f ein Polynom ungeraden Grades n u ¨ ber dem reell abgeschlossenen K¨ orper K. Ist n = 1, so hat f eine Nullstelle in K. Es sei also n > 1 und der Satz sei f¨ ur Polynome kleineren Grades bereits bewiesen. Ist f reduzibel, so hat f einen echten Faktor ungeraden Grades, der dann in K eine Nullstelle hat. Damit hat auch f eine Nullstelle in K. Wir nehmen daher an, f sei irreduzibel. Es gibt dann eine Erweiterung L von K vom Grade n, in der f eine Nullstelle α hat. Da ochstens n − 1 L nicht formal reell ist, gibt es Polynome wi ∈ K[x], deren Grad h¨ ist, mit r 2 −1 = wi (α) . i:=1
Dies impliziert wiederum die Existenz eines g ∈ K[x] mit −1 =
r
wi2 + f g.
i:=1
Die Leitkoeffizienten der wi2 sind Quadrate, sie sind also positiv. Sie k¨ onnen sich daher in der Summe nicht weg heben. Daher ist der Grad der Summe gerade. ¨ Uberdies ist dieser Grad h¨ochstens gleich 2n − 2. Dieser Grad ist andererseits gleich Grad(f ) + Grad(g) = n + Grad(g),
290
Kapitel XI. Transfinite Methoden
da die linke Seite ja den Grad 0 hat. Daher ist der Grad von g ebenfalls ungerade und h¨ ochstens gleich n − 2. Es folgt, dass g eine Nullstelle β in K hat. Hieraus folgt schließlich der Widerspruch r 2 −1 = wi (β) . i:=1
Also ist f doch nicht irreduzibel und hat demnach eine Nullstelle in K. Satz 3. Ist der K¨ orper K reell abgeschlossen, so ist K[x]/(x2 + 1)K[x] algebraisch abgeschlossen. Beweis. Weil alle positiven Elemente von K Quadrate sind, folgt dies mit Satz 2 aus Satz 1 des Abschnitts 7 von Kapitel 6. Dieser Satz firmiert bei Artin und Schreier als Satz 3a. Da wir nicht alles aus der Arbeit von Artin und Schreier vortragen und die Reihenfolge dessen, was wir vortragen, auch ver¨andern, a¨ndern sich nun die Nummern der S¨ atze. Satz 4. Ist K ein formal reeller K¨ orper, so ist der Funktionenk¨ orper K(x) in der Unbestimmten x u ¨ber K ebenfalls formal reell. Beweis. Angenommen K(x) sei nicht formal reell. Es gibt dann ri ∈ K(x) mit −1 =
n
ri2 .
i:=1
Hieraus folgt die Existenz von teilerfremden Polynomen a, b1 , . . . , bn ∈ K[x] mit −a2 =
n
b2i .
i:=1
Hieraus folgt −a(0)2 =
n
bi (0)2
i:=1
und daher, weil K formal reell ist, a(0) = 0 = bi (0) f¨ ur alle i. Somit sind die Polynome a, b1 , . . . , bn durch x teilbar im Widerspruch zu ihrer Teilerfremdheit. Der n¨ achste Satz macht eine Existenzaussage. Satz 5. Es sei K ein formal reeller K¨ orper und L sei eine Erweiterung von K, die algebraisch abgeschlossen sei. Es gibt dann einen reell abgeschlossenen Teilk¨ orper R von L, der K umfasst und f¨ ur den L = R[i] gilt, wobei i Nullstelle von x2 + 1 ist. Beweis. Artin und Schreier schließen hier mit dem zermeloschen Wohlordnungssatz, w¨ahrend wir wieder das zornsche Lemma ben¨ utzen werden.
7. Formal reelle K¨ orper
291
Es sei Φ die Menge der formal reellen Zwischenk¨orper zwischen # K und L. Dann ist K ∈ Φ, so dass Φ nicht leer ist. Ist Ψ eine Kette von Φ, so ist X∈Ψ X ebenfalls ein formal reeller Teilk¨ orper von L, der K umfasst, also zu Φ geh¨ort. Somit gibt es in Φ einen maximalen formal reellen Teilk¨orper R. Ist m ∈ L, so kann m u ¨ ber R nicht transzendent sein, da sonst R(m) nach Satz 4 formal reell w¨ are im Widerspruch zur Maximalit¨ at von R. Also ist m und damit L algebraisch u ¨ber R. Folglich ist L der algebraische Abschluss von R. Ist S irgendeine algebraische Erweiterung von R, so gibt es nach Satz 13 von Abschnitt 6 einen R-linearen Monomorphismus μ von S in L. Aus der Maximalit¨ at von R folgt dann, dass S μ und damit S nicht formal reell ist. Also ist R reell abgeschlossen. Weil L algebraisch abgeschlossen ist, gibt es ein i ∈ L mit i2 + 1 = 0. Nach Satz 3 ist dann R[i] der algebraische Abschluss von R, so dass in der Tat R[i] = L ist. Korollar 1. Ist K ein formal reeller K¨ orper, so gibt es eine reell abgeschlossene, algebraische Erweiterung von K. Beweis. Dies folgt unmittelbar aus Satz 6, wenn man dort f¨ ur L den algebraischen Abschluss von K nimmt. Korollar 2. Jeder formal reelle K¨ orper tr¨ agt wenigstens eine Anordnung. Beweis. Korollar 1 und Satz 1. Korollar 3 Jeder algebraisch abgeschlossene K¨ orper L der Charakteristik 0 enth¨ alt einen reell abgeschlossenen K¨ orper R mit L = R[i], wobei i wieder Nullstelle von x2 + 1 ist. Beweis. Dies folgt mit K = Q aus Satz 5. Satz 6. Es sei K ein angeordneter K¨ orper und L sei der K¨ orper, der aus K durch Adjunktion aller Quadratwurzeln aus positiven Elementen von K entstehe. Dann ist L formal reell. Beweis. Wir zeigen, dass es in L keine Gleichung der Form (A)
−1 =
n
ci ξi2
i:=1
mit positiven ci aus K und ξi ∈ L existiert. Dann existiert auch keine Gleichung der Form n −1 = ξi2 i:=1
mit ξi ∈ L, so dass L in der Tat formal reell ist. Angenommen es gelte doch eine Gleichung der Form (A). In den ξi kommen √ √ dann nur endlich viele Elemente a1 , . . . , ar mit positiven aj ∈ K vor. Unter allen Gleichungen der Form (A) gibt es dann auch eine mit kleinstem r. Eine solche betrachten wir nun. F¨ ur jedes i gibt es dann √ √ ηi , ζi ∈ K[ a1 , . . . , ar−1 ]
292
Kapitel XI. Transfinite Methoden
√ mit ξi = ηi + ζi ar . Es folgt −1 =
n
ci ηi2 +
i:=1
n i:=1
√ ci ar ζi2 + 2 ar ci ηi ζi . n
i:=1
W¨ are die letzte Summe gleich 0, so h¨atten wir eine Gleichung der Form (A) mit r−1 Quadratwurzeln aus positiven Elementen von K im Widerspruch zur Minimalit¨ at von r. Ist die letzte Summe nicht gleich 0, so folgt √
√ √ ar ∈ K[ a1 , . . . , ar−1 ],
was ebenfalls der Minimalit¨ at von r widerspricht. Damit ist der Satz bewiesen. Satz 7. Ist K ein angeordneter K¨ orper, so gibt es eine algebraische, reell abgeschlossene Erweiterung R von K, deren Anordnung die Anordnung von K fortsetzt. Beweis. Es sei L wieder der K¨ orper, der aus K durch Adjunktion der Quadratwurzeln aus den positiven Elementen von K entsteht. Dann ist L nach Satz 6 formal reell. Nach Korollar 3 zu Satz 5 gibt es eine algebraische, reell abgeschlossene Erweiterung R von L. Diese ist dann auch eine reell abgeschlossene Erweiterung von K, die auch u ¨ ber K algebraisch ist, da ja L u ¨ ber K algebraisch und das Algebraisch-sein transitiv ist. Ist nun a ∈ K positiv, so ist a in L ein Quadrat und daher auch in R. Folglich ist a in R positiv. Hieraus folgt, dass die Anordnung von R die Anordnung von K fortsetzt. Satz 7 kann noch versch¨ arft werden. Es gibt n¨ amlich bis auf Isomorphie nur einen u ¨ ber K algebraischen, reell abgeschlossenen K¨orper, dessen Anordnung die von K fortsetzt. Um dies zu beweisen, ben¨otigen wir die sturmschen Ketten, deren Studium wir uns im u ¨bern¨ achsten Abschnitt zuwenden werden. 8. Reelle Algebra. Artin und Schreier formulieren in ihrer Arbeit als Satz 6, dass in einem reell abgeschlossenen K¨orper die S¨ atze der reellen Algebra g¨ alten, wobei sie einige dieser S¨ atze erw¨ahnen, darunter den Satz von Sturm u ¨ber die Anzahl der reellen Nullstellen eines reellen Polynoms in einem Intervall. Der Grund, dass dies so sei, l¨age darin, dass die Beweise nur davon Gebrauch machten, dass ein Polynom in einem Intervall sicher dann eine Nullstelle habe, falls es an den Intervallenden Werte verschiedenen Vorzeichens ann¨ahme. F¨ ur die Beweise verweisen sie auf Webers Lehrbuch der Algebra. Bevor wir diesen Grund legenden Satz beweisen und Folgerungen aus ihm ziehen, beweisen wir noch einen anderen Satz u ¨ ber reine Gleichungen, der zu seinem Beweis ben¨otigt, dass ein Polynom ungeraden Grades u ¨ ber einem reell abgeschlossenen K¨orper stets eine Nullstelle in diesem K¨ orper hat. Eine a¨hnliche Situation, wenn auch mit anderer Zielsetzung, hatte schon Cauchy studiert (s. Kap. 6, Absch. 2). Vom Methodischen ist zu bemerken, dass die eigentlichen S¨ atze u ¨ ber reell abgeschlossene K¨orper nicht vom Auswahlaxiom Gebrauch machen. Es sind die
8. Reelle Algebra
293
Existenzs¨ atze des letzten Abschnitts, die transfinites Werkzeug erfordern. Was wir in diesem Abschnitt machen, ist also vom Auswahlaxiom unabh¨ angig, wie auch die Ergebnisse des n¨ achsten Abschnitts. Dass das Ganze funktioniert, liegt an den √ geschickt gew¨ahlten Definitionen und dem Satz, dass K[ −1] algebraisch abgeschlossen ist, falls K reell abgeschlossen ist. Satz 1. Ist K ein reell abgeschlossener K¨ orper, ist n ∈ N und ist 0 < a ∈ K, so gibt es genau eine positive Nullstelle von xn − a in K. Beweis. F¨ ur n = 1 ist dies klar. Es sei also n > 1. Setze f := xn − a. Es t sei n = m2 mit ungeradem m. Ist t = 0, so hat f eine Nullstelle in R, die notwendig positiv ist, da a positiv und n ungerade ist. Es sei also t > 0. Weil K reell abgeschlossen ist, sind alle positiven Elemente von K Quadrate (Satz 1, Abschnitt 6). Es gibt also ein b ∈ K mit b > 0 und b2 = a. Nach der implizit gemachten Induktionsannahme gibt es ein u ∈ K mit u > 0 und t−1
um2
= b.
es folgt t
un = um2 = b2 = a, so dass u Nullstelle von f ist. Ist v eine zweite positive Nullstelle von f , so folgt 0 = a − a = un − v n = (u − v)
n−1
ui v n−i−1 .
i:=0
Da die Summe positiv ist, folgt hieraus u = v. Der folgende Satz aus der artin-schreierschen Arbeit ist nach dem eingangs Bemerkten Grund legend. Wir formulieren ihn wieder so, dass auch das Mehr, das der Beweis liefert, in ihm wiedergegeben wird. Dieses Mehr wird sp¨ater ben¨ otigt werden. Auch diesem Satz sind wir im Zusammenhang mit Cauchys Exercices de math´ematiques schon begegnet (Kap. 6, Absch. 2). Lagrange nennt ihn im u ¨brigen seit Langem bekannt“. Man bewiese ihn immer mit Hilfe der Kurventheorie, man ” k¨ onne ihn aber auch direkt mittels der Theorie der Gleichungen beweisen. Zum Beweise zerlegt er das gegebene Polynom in Linearfaktoren, wobei nicht so ganz klar wird, wie sich die komplexen Nullstellen verhalten, falls das Polynom solche hat. Doch dar¨ uber geht er mit einem Argument hinweg, dass ich nicht nachvollziehen kann. Es betrifft die Anordnung von R und die Einbettung von R in C, eine Situation, die offenbar noch nicht verstanden war. Seine Idee aber f¨ uhrt zum Ziele, wie wir jetzt sehen werden, und nicht nur das, sie tr¨ agt noch sehr viel weiter, als urspr¨ unglich vorgesehen (Lagrange 1769, Œuvres Bd. 2, S. 341). Satz 2. Es sei K reell abgeschlossen und f sei ein Polynom u ¨ber K. Ferner seien a, b ∈ K und es gelte f (a)f (b) < 0. Sind dann ξ1 , . . . , ξt die Nullstellen t von f zwischen a und b und sind v(1), . . . , v(t) ihre Vielfachheiten, so ist i:=1 v(i) ungerade. Insbesondere hat f eine Nullstelle zwischen a und b.
294
Kapitel XI. Transfinite Methoden
Beweis. Wir d¨ urfen annehmen, dass f den Leitkoeffizienten 1 hat. Es seien η1 , . . . , ηs die Nullstellen von f , die nicht zwischen a und b liegen, und w(1), . . . , w(s) seien ihre Vielfachheiten. Es gilt dann (a − ηi )(b − ηi ) > 0 f¨ ur alle i := 1, . . . , s und (a − ξi )(b − ξi ) < 0 f¨ ur alle i := 1, . . . , t. Auf Grund von Satz 3 von Abschnitt 7 gibt es schließlich irreduzible Polynome p1 , . . . , pr vom Grade 2 mit Leitkoeffizient 1, so dass f=
t
(x − ξi )v(i)
i:=1
s
(x − ηj )w(j)
j:=1
r
pk
k:=1
ist. Ist nun pj = x2 + ux + v, so ist 2 u u2 +v− . pj = x + 2 4 2
Weil pj irreduzibel ist, ist u4 − v kein Quadrat in K. Weil K reell abgeschlossen 2 2 ist, ist daher v − u4 ein solches. Also ist v − u4 > 0, so dass auch pj (x) > 0 ist f¨ ur alle x ∈ K. Daher ist pj (a)pj (b) > 0. Nun ist f (a)f (b) =
s t v(i) w(j) (a − ξi )(b − ξi ) (a − ηj )(b − ηj ) i:=1
j:=1 r
pk (a)pk (b).
k:=1
Bildet man nun die K-Werte auf 1 oder −1 ab, je nachdem sie positiv oder negativ sind, so folgt −1 = (−1)
t
i:=1
v(i)
,
womit der Satz bewiesen ist. Der gerade gef¨ uhrte Beweis liefert nat¨ urlich noch mehr als im Satz formuliert und dieses Mehr formulieren wir jetzt noch. Dass ich aus den beiden S¨ atzen nicht einen Satz gemacht habe, liegt daran, dass ich den historischen Hintergrund deutlich machen wollte. Lagrange beweist den folgenden Satz nur f¨ ur eine einzige, einfache Nullstelle zwischen a und b (Lagrange loc. cit.). Satz 3. Es sei K reell abgeschlossen und f sei ein Polynom u ¨ber K. Ferner seien a, b ∈ K und es sei a = b. Sind dann ξ1 , . . . , ξt die Nullstellen von f zwischen a und b und sind v(1), . . . , v(t) ihre Vielfachheiten, ist ferner t i:=1
v(i)
8. Reelle Algebra
295
ungerade, so ist f (a)f (b) < 0. Am Ende von Abschnitt 1 des Kapitels 6 haben wir im Anschluss an die cartesische Zeichenregel schon diskutiert, dass es die in Satz 2 ausgesprochene Eigenschaft ist, dass das Polynom f eine Nullstelle zwischen a und b hat, wenn f (a)f (b) < 0 ist, die die cartesische Zeichenregel nach sich zieht. Die cartesische Zeichenregel gilt also auch f¨ ur Polynome u ¨ ber reell abgeschlossenen K¨orpern. Wir formulieren sie hier noch einmal, ohne jedoch ihren Beweis zu wiederholen. Cartesische Zeichenregel. Es sei K ein reell abgeschlossener K¨ orper. Ist f eine Polynomfunktion u ¨ber K, so ist die Anzahl der positiven Nullstellen von f — Vielfachheiten mitgez¨ ahlt — h¨ ochstens so groß wie die Anzahl der Zeichenwechsel von f . Die Differenz dieser beiden Zahlen ist gerade Eine weitere Folgerung aus Satz 2 ist der Zwischenwertsatz. Zwischenwertsatz. Es sei K ein reell abgeschlossener K¨ orper und f sei ein Polynom u ¨ber K. Sind a, b, t ∈ K und gilt f (a) < t < f (b), so gibt es ein c zwischen a und b mit f (c) = t. Beweis. Setze g := f − t. Dann ist g(a) < 0 < g(b), so dass es nach Satz 2 ein c zwischen a und b gibt mit g(c) = 0. Dann ist aber f (c) = t. Als Satz von Rolle wird eigentlich nur der Zusatz des folgenden Satzes bezeichnet. Rolle teilte diesen Satz in seinem Trait´e d’alg`ebre mit, den er 1690 publizierte. Mehr habe ich zu diesem Satz in der Literatur nicht gefunden. Michel Rolle lebte von 1652 bis 1719. Satz von Rolle. Es sei K ein reell abgeschlossener K¨ orper. Ferner seien a, b ∈ K zwei verschiedenei Nullstellen von f in K und f habe keine Nullstellen zwischen a Ableitung und b. Sind dann c1 , . . . , ct die von a und b verschiedenen Nullstellen der f von f zwischen a und b und ist v(i) die Vielfachheit von ci , so ist ti:=1 v(i) ungerade. Insbesondere gibt es zwischen a und b eine von a und b verschiedene Nullstelle c von f . Beweis. Es habe a die Vielfachheit m und b die Vielfachheit n. Dann ist f = (x − a)m (x − b)n g und es gilt g(a), g(b) = 0. Ferner ist f = (x − a)m−1 (x − b)n−1 h mit einem Polynom h. Dabei ist h = m(x − b)g + n(x − a)g + (x − a)(x − b)g .
296
Kapitel XI. Transfinite Methoden
Es folgt h(a)h(b) = m(a − b)n(b − a) = −mn(a − b)2 < 0. Da die ci die Nullstellen von h zwischen a und b sind, und diese Nullstellen auch als Nullstellen von h die Vielfachheit v(i) haben, folgt mit Satz 2 die Behauptung. Bei Weber findet sich als Anwendung des Satzes von Rolle das folgende Korollar, nat¨ urlich nur f¨ ur R formuliert (Weber 1898, § 114). Korollar. Es sei K ein reell abgeschlossener K¨ orper und f sei ein Polynom u ¨ber ¨ber K in LinearfakK. Zerf¨ allt f u ¨ber K in Linearfaktoren, so zerf¨ allt auch f u toren. Die von den Nullstellen von f verschiedenen Nullstellen von f sind alle einfach und werden von den Nullstellen von f getrennt. Beweis. Wir d¨ urfen annehmen, dass f den Leitkoeffizienten 1 hat. Es seien a1 , . . . , at die Nullstellen von f und ihre Vielfachheiten seien v1 , . . . , vt . Ferner gelte a1 < a2 < . . . < at . Dann ist f=
t
(x − ai )vi .
i:=1
Es folgt
f = Mit n :=
t
i:=1 vi
t
vi −1
(x − ai )
g.
i:=1
folgt weiter n − 1 = Grad(f ) = n − t + Grad(g),
so dass der Grad von g gleich t − 1 ist. Nach dem Satz von Rolle hat aber f und damit g zwischen ai und ai+1 f¨ ur alle i := 1, . . . , t − 1 wenigstens eine Nullstelle. Da g in K aber nur h¨ ochstens t − 1 Nullstellen hat, folgt die Behauptung. Ein weiteres Korollar zum Satz von Rolle ist der Mittelwertsatz. Mittelwertsatz. Es sei K ein reell abgeschlossener K¨ orper und f sei ein Polynom u ¨ber K. Sind a und b verschiedene Elemente aus K, so gibt es ein c zwischen a und b mit f (b) = f (a) + f (c)(b − a). Beweis. Setze
f (b) − f (a) (x − a). b−a Dann ist g(a) = 0 = g(b). Nach dem Satz von Rolle gibt es also ein c zwischen a und b mit g (c) = 0. Nun ist aber g := f − f (a) −
g = f −
f (b) − f (a) b−a
8. Reelle Algebra
297
und folglich f (c)(b − a) = f (b) − f (a). Ist K reell abgeschlossen, so hat K eine Anordnung und damit einen Absolutbetrag. Diesen kann man auf K[i] fortsetzen, so wie das auch mit dem gew¨ohnlichen Absolutbetrag auf R m¨oglich war. Bei seiner Fortsetzung von R auf C spielte ja nur eine Rolle, dass man aus jedem positiven Element von R die Quadratwurzel ziehen kann (Kapitel 6, Abschnitt 2). Der n¨achste Satz — f¨ ur R formuliert — steht ebenfalls schon bei Lagrange (Lagrange 1769, Werke, S. 545). Satz 4. Es sei K ein reell abgeschlossener K¨ orper. Ferner sei f := xn + ρ1 xn−1 + . . . + ρm xn−m − ρm+1 xn−m−1 − . . . − ρn−1 x − ρn ein Polynom u ¨ber K. Es gelte m < n und ρi ≥ 0 f¨ ur alle i sowie ρn > 0. Dann hat f genau eine positive Nullstelle. Beweis. Dies folgt, direkt aus der cartesischen Zeichenregel, da w(f ) = 1 ist. Interessant ist der Spezialfall m = 0. Dass seine Formulierung syntaktisch korrekt ist, garantiert Satz 1. Satz 5. Es sei f (x) := xn − ρ1 xn−1 − ρ2 xn−2 − . . . − ρn eine Polynomfunktion u ¨ber einem formal reellen K¨ orper mit ρi ≥ 0 f¨ ur alle i und ρn > 0. Ist r die nach Satz 2 existierende positive Wurzel von f , so ist r < 1 + max ρi | i := 1, . . . , n , wie auch √ √ min n nρi | i := 1, . . . , n ≤ r ≤ max n nρi | i := 1, . . . , n . Beweis. Die erste Ungleichung gilt, falls r ≤ 1 ist. Es sei also r > 1. Setze ρ := max(ρi | i := 1, . . . , n). Dann ist rn = ρ1 rn−1 + ρ2 + . . . + ρn ≤ ρ Da r > 1 ist, folgt weiter r−1≤ρ Damit ist die erste Aussage bewiesen.
rn − 1 < ρ. rn
rn − 1 . r−1
298
Kapitel XI. Transfinite Methoden
Um die zweite Aussage zu beweisen, sei die Annahme, dass r > 1 sei, wieder aufgehoben. Es ist ρ2 ρ1 ρn + 2 + ...+ n. 1= r r r Die Summanden auf der rechten Seite sind dann alle gleich gr¨ oßer und einige sind kleiner als n1 . Es folgt, dass die Zahlen
1 n
oder einige sind
nρn nρ1 nρ2 , , ..., n r r2 r alle gleich 1 oder einige gr¨oßer, einige kleiner als 1 sind. Es folgt, dass einige der Zahlen √ √ n nρ nρ2 nρ1 n , , ... r r r kleiner oder gleich 1 und einige gr¨ oßer oder gleich 1 sind. Es gibt also i und j mit √ √ i nρ j nρ j i ≤1≤ . r r Hieraus folgt die zweite Aussage. Die Nullstellen von Polynomen u ¨ ber reell abgeschlossenen K¨orpern lassen sich ebenso absch¨atzen wie die Nullstellen reeller Polynome. Satz 6. Es sei K ein reell abgeschlossener K¨ orper und f := xn + A1 xn−1 + A2 xn−2 + . . . + An−1 x + An √ sei ein Polynom K[ −1]. Ist dann λ eine Nullstelle von f , so ist |λ| < 1 + max |Ai | | i := 1, . . . , n und auch
|λ| ≤ max i n|Ai | | i := 1, . . . , n .
ur alle i und r := |λ|. Dann folgt mit Hilfe der DreieckBeweis. Setze ρi := |Ai | f¨ sungleichung und der ebenfalls generell geltenden Ungleichung ||a| − |b|| ≤ |a + b| zun¨ achst |A1 λn−1 + . . . + An | ≤ ρ1 rn−1 + . . . + ρn und damit dann rn − ρ1 rn−1 − . . . − ρn ≤ rn − |A1 λn−1 + . . . + An | ≤ |λn + A1 λn−1 + . . . + An | = f (λ) = 0.
8. Reelle Algebra
299
Also ist rn ≤ ρ1 rn−1 + . . . + ρn . Der Ausdruck y n − ρ1 y n−1 − . . . − ρn hat genau eine positive Nullstelle ν. Ist y > ν, so kann wegen Satz 1, da ν die einzige positive Nullstelle ist, nicht y n − ρ1 y n−1 − . . . − ρn ≤ 0 gelten. Da diese Ungleichung aber mit r anstelle von y gilt, ist r ≤ ν, so dass mit Satz 5 die Behauptung folgt. Korollar. Es sei K ein reell abgeschlossener K¨ orper und f := xn + A1 xn−1 + . . . + An−1 x + An √ sei eine Polynomfunktion u ¨ber K[ −1]. Dann ist |x|n − |A1 ||x|n−1 − . . . − |An−1 ||x| − |An | ≤ f (x) f¨ ur alle x ∈ C. Insbesondere gilt: Ist 0 < C ∈ K, so gibt es ein D ∈ K mit D > 0, so dass f (x) > K ist f¨ ur alle x mit |x| > L. Beweis. Die erste Ungleichung wurde im Beweis von Satz 6 hergeleitet. Um die zweite Aussage zu beweisen, beachte man, dass der Ausdruck auf der linken Seite der Ungleichung f¨ ur x = 0 gleich |An | |A1 | |A2 | |x|n 1 − − − . . . − |x| |x|2 |x|n ist und dass der Ausdruck in der Klammer f¨ ur große |x| nahe bei 1 liegt. Den folgenden Satz werden wir gleich zu Beginn des n¨ achsten Abschnitts kommentieren. Er findet sich f¨ ur R formuliert in Cauchy 1821, Note III. Der hier vorgef¨ uhrte Beweis ist der cauchysche, wenn er ihn auch etwas umst¨andlicher formuliert. Satz orper und f sei ein Polynom u ¨ber √ 7. Es sei K ein reell abgeschlossener K¨ K[ −1] mit Leitkoeffizient 1 und lauter einfachen Nullstellen. Ist C eine Schranke f¨ ur die Nullstellen von f und sind ξ und η zwei dieser Nullstellen, so ist |Dis(f )| |ξ − η| > . m(m−1) (2C) 2 −1
300
Kapitel XI. Transfinite Methoden
Beweis. Es ist |ξ − η| ≤ |ξ| + |η| < 2C. Hieraus folgt |Dis(f )| < (2C)2(
m(m−1) −1) 2
|ξ − η|2
und damit die Behauptung. Sind die Koeffizienten von f ganze Zahlen, so ist auch Dis(f ) eine ganze Zahl, so dass man sich die Berechnung von Dis(f ) ersparen kann, indem man |Dis(f )| durch 1 ersetzt. Dann wird die Ungleichung allerdings schlechter. 9. Sturmsche Ketten. Man fand keine L¨ osung durch Radikale f¨ ur algebraische Gleichungen von f¨ unftem und h¨ oherem Grade. Andererseits glaubte man, dass die L¨ osungen algebraischer Gleichungen u ¨ ber R in C zu finden seien. Man arbeitete also schon lange mit C auch wenn noch nicht v¨ ollig erh¨ artet war, dass C tats¨achlich algebraisch abgeschlossen ist. Da man in der Radikalenfrage nicht weiter kam, suchte man insbesondere die Frage zu beantworten, wieviele der L¨osungen einer algebraischen Gleichung n-ten Grades u ¨ ber R reell seien. Dies ist wichtig zu wissen, wenn man versucht, sie zu approximieren, damit man sieht, dass man nicht v¨ollig ins Ungewisse l¨auft. Dazu ist auch wichtig zu wissen, wo ungef¨ ahr man anzusetzen hat. Man wusste nat¨ urlich, dass komplexe L¨ osungen stets paarweise auftreten. Man wusste auch, dass die Nullstellen von f mit den Nullstellen von f ggT(f, f ) u ¨ bereinstimmen, dass letzteres Polynom aber nur einfache Nullstellen hat. Außerdem wusste man den Quotienten sowie den ggT zweier Polynome rational zu berechnen. Man konnte sich also in der Frage der Nullstellenlokalisierung auf die Untersuchung von Polynomen mit nur einfachen Nullstellen beschr¨ anken und tat dies auch. Man beobachtete, dass beim Durchgehen durch eine Nullstelle der Vielfachheit 1 die Polynomfunktion ihr Vorzeichen wechselte. Man versuchte daher, ein Intervall so in Teilintervalle zu zerlegen, dass die Polynomfunktion an den Enden eines Teilintervalls unterschiedliche Vorzeichen annahm. Dass besagt dann zun¨ achst nur, dass in diesem Intervall eine ungerade Anzahl von Nullstellen liegt. Die Frage war, die Unterteilung so fein zu machen, dass in einem solchen Intervall nur eine Nullstelle liegen konnte. Mir scheint, dass alle Autoren der damaligen Zeit sich zu dem Thema der Suche nach den reellen Nullstellen ¨außerten. Hier ist die Liste der Namen, die ich bei Lagrange und Cauchy erw¨ ahnt fand. Bei Lagrange sind es Vi`ete, Harriot, Oughtred, Pell, Newton, MacLaurin, der Astronom Halley und Rolle und bei Cauchy sind es Newton, de Hall´e, Euler, Lagrange, Budan und Legendre. Wir wollen nicht vers¨ aumen auch Descartes zu erw¨ahnen, mit dessen Zeichenregel alles begann.
9. Sturmsche Ketten
301
MacLaurin gab nach dem Zeugnis Lagrangens untere und obere Schranken f¨ ur die reellen Nullstellen einer algebraischen Gleichung u ¨ber R. Diese gaben das Intervall, das es zu unterteilen galt. H¨ atte man nun eine untere Schranke f¨ ur den Abstand zweier Nullstellen, so w¨ usste man, ein solch feines Netz zu kn¨ upfen, dass beim Unterteilen dieses Intervalls keine Nullstelle durch die Maschen ginge. Hier gelang nun Lagrange der Fortschritt. Er fand n¨ amlich eine algebraische Gleichung, deren Nullstellen die Quadrate der Differenzen der verschiedenen Nullstellen der gegebenen Gleichung sind. Hiermit konnte er weiter schließen (Lagrange 1769). Cauchy sah, dass es gen¨ uge, dass Absolutglied von Lagrangens Hilfsgleichung zu kennen, und bewies f¨ ur R den Satz, dessen Verallgemeinerung wir als Satz 7 des letzten Abschnittes notierten. Dies war der Stand der Dinge, den Sturm vorfand. Wenden wir uns also der sturmschen Arbeit zu, die nichts von ihrer Aktualit¨ at ¨ eingeb¨ ußt hat (Sturm 1835). Sturm hat seinen Satz im Ubrigen schon 1829 der Acad´emie des Sciences in Paris vorgetragen und im gleichen Jahr in Ferussacs Bulletin des sciences math´ematiques publiziert (Sturm 1829). Diese Arbeit habe ich nicht gesehen. Die sturmschen Argumente behalten ihre G¨ ultigkeit auch f¨ ur reell abgeschlossene K¨orper. Daher werden wir Sturms Resultate hier im Rahmen dieser Theorie abhandeln. Dabei ben¨ otigen wir auch hier nicht das Auswahlaxiom. Sturm beginnt mit einem Polynom V mit reellen Koeffizienten und seiner Ableitung V , die er V1 nennt. Dann bestimmt er mittels Division mit Rest weitere Polynome V2 , . . . , Vr , so dass einmal die Gleichungen V = V1 Q1 − V2 V1 = V2 Q2 − V3 V2 = V3 Q3 − V4 ... ... ... Vr−2 = Vr−1 Qr−1 − Vr erf¨ ullt sind und außerdem Vr Teiler von Vr−1 ist. Er benutzt also den euklidischen Algorithmus f¨ ur Polynome, wobei er jedoch u ¨ ber die Vorzeichen der Reste in anderer Weise als u ¨ blich verf¨ ugt. Der Grund f¨ ur die Wahl des Vorzeichens ist der zu erreichen, dass Vi (a) = −Vi+2 (a) ist, wenn a eine Nullstelle von Vi+1 ist. Mit diesen Polynomen arbeitet er dann weiter. Dieses Vorgehen ist f¨ ur theoretische Zwecke v¨ ollig ausreichend, so dass es nicht verwunderlich ist, es in vielen Algebrab¨ uchern wiedergegeben zu finden, ohne dass eine Verallgemeinerung angestrebt wird. In Anwendungen jedoch hat man immer wieder einmal ein Polynom V1 gegeben, dass sich so verh¨ alt“, als w¨ are es die Ableitung von V . Dass man dann immer ” noch die gleichen Schl¨ usse ziehen kann, die Sturm zog, wird von Autoren von B¨ uchern zur Numerik, wenn u ¨berhaupt, dann nur im Aufgabenteil ihrer B¨ ucher erw¨ahnt. Das war meine leidvolle Erfahrung, als ich einmal u ¨ber die Numerik der linearen Algebra las. Es gibt eine Ausnahme: D¨orrie 1955. Dieses Buch handelt auch nur von Polynomen u ¨ber R, doch seine Definition der sturmschen Ketten
302
Kapitel XI. Transfinite Methoden
kann man f¨ ur den Fall der reell abgeschlosssenen K¨ orper u ¨bernehmen. Auf die eigentlichen sturmschen Ketten, denen wir den Namen Standardketten beilegen werden, werden wir nat¨ urlich auch zu sprechen kommen. Es sei K ein angeordneter K¨ orper. Sind a, b ∈ K und ist a < b, so setzen wir [a, b] := {u | u ∈ K, a ≤ u ≤ b} und nennen dies das abgeschlossene Intervall mit den Endpunkten a und b. Entsprechend heißt (a, b) := {u | u ∈ K, a < u < b} das offene Intervall mit den Endpunkten a und b. Die halboffenen Intervalle [a, b) und (a, b] werden analog definiert. Es sei K ein reell abgeschlossener K¨orper und [a, b] sei ein abgeschlossenes Intervall von K. Ferner seien V , V1 , . . . , Vr ∈ K[x]. Man nenne V , V1 , . . . , Vr sturmsche Kette zu V auf dem Intervall [a, b], falls die folgenden Bedingungen erf¨ ullt sind. 1) Sind α1 , . . . , αt die Nullstellen von V in [a, b], so gibt es positive 1 , . . . , t mit: a) F¨ ur i := 1, . . . , t ist V (β)V (γ) < 0 f¨ ur alle β und γ mit αi − i ≤ β < αi < γ ≤ αi + i . b) F¨ ur i := 1, . . . , t hat V1 in [αi − i , αi + i ] keine Nullstelle. c) Es ist V (αi − i )V1 (αi − i ) < 0 f¨ ur alle i := 1, . . . , t oder ur alle i := 1, . . . , t. c ) Es ist V (αi − i )V1 (αi − i ) > 0 f¨ 2) Ist 0 < j < r und α ∈ [a, b] und gilt Vj (α) = 0, so ist Vj−1 (α) · Vj+1 (α) < 0, wobei V0 als V zu interpretieren ist. 3) Es ist Vr (u) = 0 f¨ ur alle u ∈ [a, b]. Teil a) von Bedingung 1) besagt, dass die Nullstellen von V in [a, b] allesamt ungerade Vielfachheit haben. In den Anwendungen ist die Vielfachheit meist 1. Die Bedingung b) besagt, dass V1 in einer gewissen Umgebung von αi stets positiv ur alle i kurz oder stets negativ ist. Die Bedingungen c) und c ) besagen, dass V1 f¨ vor Eintritt in die Nullstelle αi , das entgegenbesetzte Vorzeichen wie V , bzw., f¨ ur alle i das gleiche Vorzeichen wie V hat. Mit Satz 2 von Abschnitt 8 folgt, dass Vr (u) auf [a, b] einerlei Vorzeichen hat. Die nun folgende Definition der Zeichenfolge σ(a) wird in der mir bekannten Literatur stets so getroffen, dass man es dem Leser, dh. dem Zufall, u ¨berl¨ asst, uhrt dann dazu, dass σi (a) := 1, −1 oder 0 zu setzen, wenn Vi (a) = 0 ist. Dies f¨ man auf Stetigkeitsargumente zur¨ uckgreift, um mit Ausnahmesituationen fertig zu werden. Das ist ganz und gar unn¨ otig, wenn man σ(a) wie folgt definiert. Ist V = V0 , V1 , . . . , Vr eine sturmsche Kette zu V , ist a ∈ K und ist i ∈ {0, . . . , r}, so setzen wir ⎧ falls Vi (a) < 0 ⎨ −1, falls Vi (a) > 0 σi (a) := 1, ⎩ σi+1 (a), falls Vi (a) = 0.
9. Sturmsche Ketten
303
Bei dem dritten Fall dieser Zuweisung ist zu beachten, dass Vi (a) = 0 wegen 3) impliziert, dass i < r ist. Daher ist Vi+1 in jedem Fall definiert und wegen 2) gilt Vi+1 (a) = 0. Wir setzen ferner w(a) := i | i ∈ {0, . . . , r − 1}, σi (a) = σi+1 (a) . Dann ist w(a) die Anzahl der Zeichenwechsel in der Folge σ(a). Satz 1. Es sei K ein reell abgeschlossener K¨ orper und a und b seien Elemente von K mit a < b. Ferner sei V ∈ K[x] und V (a)V (b) = 0. Ist dann V = V0 , V1 , . . . , Vr eine sturmsche Kette zu V auf [a, b], so ist |w(a) − w(b)| die Anzahl der Nullstellen von V in [a, b]. r Beweis. Es seien β1 , . . . , βt die Nullstellen von i:=0 Vi in [a, b] und es gelte β1 < β2 < . . . < βt . (A) Sind u, v ∈ [a, b] − {β1 , . . . , βt }, ist u < v und w(u) = w(v), so gibt es ein i ∈ {1, . . . , t} mit u < βi < v. Mit andern Worten: Die Funktion w ist auf den Intervallen [a, β1 ), (β1 , β2 ), . . . , (βt−1 , βt ), (βt , b] konstant. Aus w(u) = w(v) folgt σ(u) = σ(v). Es gibt also ein j mit σj (u) = σj (v). Hieraus folgt nach Satz 2 von Abschnitt 8, dass Vj eine Nullstelle in (u, v) hat, da u und v ja keine Nullstellen von Vj sind. Damit ist (A) beweisen. Setze Xi := j | j ∈ {0, . . . , r}, Vj (βi ) = 0 f¨ ur i := 1, . . . , t. ur 1 ≤ j ≤ r den Wert von F¨ ur u ∈ [a, b] setzen wir wr (u) := 0 und definieren f¨ wj−1 (u) durch wj−1 :=
wj (u) + 1, falls σj−1 (u) = σj (u), falls σj−1 (u) = σj (u). wj (u),
Dann ist w0 (u) = w(u). (B) Sind u, v ∈ [a, b], gilt u < v und gibt es genau ein i mit u ≤ βi ≤ v, so ist ur alle k ∈ Xi . wk (u) = wk (v) f¨ Wegen Bedingung 3) ist r ∈ Xi . Ferner ist wr (u) = 0 = wr (v). Es sei 1 ≤ k ≤ r ussen zeigen, dass f¨ ur den n¨ achst und k ∈ Xi ferner gelte wk (u) = wk (v). Wir m¨ kleineren Index j ∈ Xi ebenfalls die Gleichung wj (u) = wj (v) gilt. Wegen k ∈ Xi hat Vk , da von den β’s nur βi zwischen u und v liegt, in [u, v] keine Nullstelle. Nach Satz 2 von Abschnitt 8 ist daher σk (u) = σk (v). Ist nun k−1 ∈ Xi , so gilt aus dem gleichen Grunde σk−1 (u) = σk−1 (v) und daher wk−1 (u) = wk−1 (v). Es sei also k − 1 ∈ Xi . Ist k = 1, so gibt es keinen kleineren Index als k, der nicht in Xi liegt. Es sei also k > 1. Mit Bedingung 2) folgt Vk−2 (βi )Vk (βi ) < 0 und damit k − 2 ∈ Xi . Setze := σk−2 (u). Dann folgt σk−2 (βi ) = = σk−2 (v). Ferner folgt σk (βi ) = − auf Grund von 2) und dann auf Grund der Definition
304
Kapitel XI. Transfinite Methoden
σk−1 (βi ) = − . Weiter gilt σk (u) = σk (v) = − , da ja k ∈ Xi ist. Also haben wir die Situation u
βi
v
σk−2
σk−1
γ
−
δ
− − −
σk
wobei γ, δ ∈ { , − } sind. An diesem Schema liest man unmittelbar ab, dass wk−2 (u) = wk (u) + 1 = wk (v) + 1 = wk−2 (v) ist. Damit ist (B) bewiesen. (C) Es seien u, v ∈ [a, b] − {β1, . . . , βt } und es gebe genau ein i mit u < βi < v. Ist 0 ∈ Xi , so ist w(u) = w(v). Ist 0 ∈ Xi , so gilt im Falle c) die Gleichung w(u) = w(v) + 1 und im Falle c ) die Gleichung w(u) = w(v) − 1. Ist 0 ∈ Xi , so folgt mit (B), dass w(u) = w0 (u) = w0 (v) = w(v) ist. Es sei also 0 ∈ Xi . Dann folgt mit 1 b), dass 1 ∈ Xi ist. Nach (B) ist dann w1 (u) = w1 (v). Setze γ := σ0 (u). Nach 1 a) ist dann σ0 (v) = γ. Setzt man := σ1 (u), so ist σ1 (v) = . Gilt c), so ist γ < 0 und daher = −γ. Also haben wir die Situation u v σ0
γ
−γ
σ1
−γ
−γ
Dies zeigt, dass w(v) = w0 (v) = w1 (v) = w1 (u) und daher, dass w(u) = w0 (u) = w1 (u) + 1 = w(v) + 1 ist. Gilt c ), so ist γ > 1 und folglich = γ. Hier haben wir die Situation u
v
σ0
γ
−γ
σ1
γ
γ
und daher w(u) = w(v) − 1. Sind nun α1 , . . . , αs die Nullstellen von V in [a, b] und gilt α1 < . . . < αs , so folgt nach (C) wegen V (a)V (b) = 0, dass die Funktion w auf den Intervallen [a, α1 ), (α1 , α2 ), . . . , (αs , b]
9. Sturmsche Ketten
305
konstant ist. Mittels (C) folgt weiter, dass w von Intervall zu Intervall um 1 w¨ achst, falls c) gilt, und um 1 f¨ allt, falls c ) gilt. Daraus folgt die Behauptung des Satzes. Korollar Die Voraussetungen seien wie bei Satz 1. Gilt c), so ist w(a) ≥ w(b), und gilt c ), so ist w(a) ≤ w(b). Satz 2. Es sei K ein reell abgeschlossener K¨ orper. Ferner sei V ∈ K[x] und V = V0 , V1 , . . . , Vr sei eine sturmsche Kette zu V auf dem Intervall [a, b]. Schließlich sei α ∈ (a, b) eine Nullstelle von V . a) Gilt c, so ist w(α) − w(b) die Anzahl der Nullstellen von V in (α, b] und w(a) − w(α) die Anzahl der Nullstellen von V in [a, α]. b) Gilt c , so ist w(b) − w(α) die Anzahl der Nullstellen von V in [α, b] und w(α) − w(a) die Anzahl der Nullstellen von V in [a, α). Beweis. Es gibt u, v ∈ [a, b] mit u < α < v, so dass zwischen u und v keine weiteren Nullstellen von V liegen. Es ist |w(u) − w(b)i| die Anzahl der Nullstellen von V in [u, b]. a) In diesem Falle ist w(u) > w(b). Ferner gilt u
α
v
σ0
γ
−γ
−γ
σ1
−γ
−γ
−γ
Es folgt w(u) = w1 (u) + 1 = w1 (α) + 1 = w0 (α) + 1 = w(α) + 1. Weil w(u) − w(b) die Anzahl der Nullstellen von V in [u, b] ist und in [u, α] nur die Nullstelle α von V liegt, ist w(u) − w(b) − 1 = w(α) − w(b) die Anzahl der Nullstellen von V in (α, b]. b) In diesem Falle ist w(b) > w(u). Ferner gilt u
α
v
σ0
γ
γ
−γ
σ1
γ
γ
γ
Also ist w(u) = w(α), so dass w(b) − w(α) die Anzahl der Nullstellen in [α, b] ist. Damit ist alles bewiesen. Satz 3. Es sei K ein reell abgeschlossener K¨ orper und es seien V , V1 ∈ K[x]. Es seien α1 < . . . < αt die Nullstellen von V in dem abgeschlossenen Intervall [a, b] ur und alle diese Nullstellen m¨ ogen ungerade Vielfachheiten haben. Ist V1 (αi ) = 0 f¨
306
Kapitel XI. Transfinite Methoden
alle i und ist f¨ ur i := 1, . . . , t−1 die Summe der Vielfachheiten der Nullstellen von ullen V und V1 die Bedingungen 1) f¨ ur sturmsche V1 in [αi , αi+1 ] ungerade, so erf¨ Ketten. Beweis. Weil die αi allesamt ungerade Vielfachheit haben, kann man zu jedem i ein i finden, so dass V (β)V (γ) < 0 ist f¨ ur alle β und γ mit αi − i ≤ β < αi < γ ≤ αi + i . Daher ist 1 a) erf¨ ullt. Verkleinert man die i gegebenenfalls, so kann auch noch erreichen, dass V1 in [αi − i , αi + i ] keine Nullstelle hat, da ja αi keine Nullstelle ullt. von V1 ist. Dann ist auch 1 b) erf¨ Setze λ := sgn(V (α1 − 1 )V1 (α1 − 1 )). Es sei 1 ≤ i < t und es gelte λ = sgn V (αi − i )V1 (αi − i ) . Dann ist, da g in [αi − i , αi + i ] keine Nullstelle hat, sgn V (αi + i )V1 (αi + i ) = sgn V (αi + i ) sgn V1 (αi + i ) = −sgn V (αi − i ) sgn V1 (αi − i ) = −λ. Nun ist
sgn V (αi+1 − i+1 ) = sgn V (αi + i ) ,
da V keine Nullstelle in (αi , αi+1 ) hat. Andererseits ist nach Satz 3 von Abschnitt 8 auf Grund der Voraussetzungen an die Nullstellen von V1 , die zwischen αi und αi+1 und dann sogar zwischen αi + i und αi+1 − i+1 liegen, sgn V1 (αi+1 − i+1 ) = −sgn V1 (αi + i ) . Hieraus folgt sgn V (αi+1 − i+1 )V1 (αi+1 − i+1 ) = −sgn V (αi + i )V1 (αi + i ) = λ. Daher gilt auch 1 c) bzw. 1 c ). Satz 4. Es sei K ein reell abgeschlossener K¨ orper. Ferner sei [a, b] ein abge¨ber K, die die schlossenes Intervall von K und V = V0 und V1 seien Polynome u Voraussetzungen 1) f¨ ur sturmsche Ketten erf¨ ullen. Eine Variante des euklidischen Algorithmus liefert Polynome V2 , . . . , Vr mit Vi = Qi+1 Vi+1 − Vi+2 f¨ ur i := 0, . . . , r − 2 und Vr−1 = Qr Vr
9. Sturmsche Ketten
307
mit Vr = 0 und Grad(Vi+2 ) < Grad(Vi+1 ). Hat dann Vr keine Nulstelle in [a, b], so ist V , V1 , . . . , Vr eine sturmsche Kette zu V auf [a, b]. Beweis. Die Bedingungen 1) und 3) sind gerade Inhalt unserer Voraussetzungen. Es ist also nur 2) zu beweisen. Wir bemerken zun¨ achst, dass es kein α ∈ [a, b] gibt mit Vi (α) = 0 = Vi+1 (α). Sonst folgte n¨ amlich Vi+2 (α) = Qi+1 (α)Vi+1 (α) − Vi (α) = 0 und dann mit Induktion Vr (α) = 0 im Widerspruch zu unserer Voraussetzung. Ist nun 0 ≤ i < r − 1 und ist Vi+1 (α) = 0, so folgt Vi+2 (α) = 0 und Vi (α) = Qi+1 (α)Vi+1 (α) − Vi+2 (α) = −Vi+2 (α). Daher ist Vi (α)Vi+2 (α) = −Vi+2 (α)2 < 0, so dass auch Bedingung 2) nachgewiesen ist. Satz 5. Es sei K ein reell abgeschlossener K¨ orper und es sei 0 = f ∈ K[x]. Ferner ur alle ξ mit sei α ∈ K und f (α) = 0. Es gibt dann ein > 0 mit f (ξ)f (ξ) < 0 f¨ α − ≤ ξ < α und f (ξ)f (ξ) > 0 f¨ ur alle ξ mit α < ξ ≤ α + . Beweis. Es sei n die Vielfachheit von α als Nullstelle von f . Dann ist n ≥ 1. Ferner ist f = (x − α)n g und g(α) = 0. Es folgt f = (x − α)n−1 ng + (x − α)g . Es folgt
ggT(f, f ) = (x − α)n−1 h
und h(α) = 0, da ja (x − α)n kein Teiler von f ist. Nun ist aber h Teiler von f = (x − α)n g, so dass h Teiler von g ist. Andererseits ist h auch Teiler von f und damit von ng + (x − α)g . Weil h aber schon als Teiler von g erkannt ist, folgt, dass h auch Teiler von g ist. Es sei g = Gh und g = Hh. Setze ϕ := f /ggT(f, f ) und ψ := f /ggT(f, f ). Dann ist (x − α)n Gh = (x − α)G, (x − α)n−1 h (x − α)n−1 (nGh + (x − α)Hh) = nG + (x − α)H. ψ= (x − α)n−1 h ϕ=
Es gibt ein > 0 mit g(ξ) = 0 = ψ(ξ) f¨ ur alle ξ mit α − ≤ ξ ≤ α + . Somit gibt es δ, η ∈ {1, −1}, so dass f¨ ur alle diese ξ gilt, dass sgn(G(ξ)) = δ und sgn(ψ(ξ)) = η ist. Wegen ψ(α) = nG(α) ist δ = η. Daher ist ϕ(ξ)ψ(ξ) = (ξ − α)G(ξ)ψ(ξ) < 0
308
Kapitel XI. Transfinite Methoden
f¨ ur alle ξ mit α − ≤ ξ < α und ϕ(ξ)ψ(ξ) = (ξ − α)G(ξ)ψ(ξ) > 0 f¨ ur alle ξ mit α < ξ ≤ α + . Nun ist 2 f (ξ)f (ξ) = ϕ(ξ)ψ(ξ) ggT(f, f ) . Hieraus folgt die Behauptung, da ggT(f, f ) in [α − , α) ∪ (α, α + ] keine Nullstelle hat. Satz 6. Es sei K ein reell abgeschlossener K¨ orper und es sei 0 = f ∈ K[x]. Setze V :=
f ggT(f, f )
V1 :=
f . ggT(f, f )
und
Dann erf¨ ullen V und V1 die Bedingungen 1) f¨ ur sturmsche Ketten. Beweis. Dies folgt mit Satz 5, da V nur einfache Nullstellen hat. Es sei K reell abgeschlossen. Ist 0 = f ∈ K[x], so setzen wir f0 := f und f1 := f . Mittels des modifizierten euklidischen Algorithmus erhalten wir f2 , . . . , fr mit fi−2 = qi−1 fi−1 − fi f¨ ur i := 2, . . . , r und fr−1 = qr fr sowie fr = 0 und Grad(fi ) < Grad(fi−1 ). Wir nennen f0 , f1 , . . . , fr die Standardkette zu f . Dies ist die Kette, die Sturm untersuchte. F¨ ur die Standardkette definieren wir σ(a) und w(a) genauso wie f¨ ur sturmsche Ketten. Dann gilt der Satz, den Sturm f¨ ur R bewies (Sturm 1835 und auch schon fr¨ uher): Satz 7. Es sei K ein reell abgeschlossener K¨ orper und f sei ein von 0 verschiedenes Polynom u ¨ber K und f0 , . . . , fr sei die Standardkette zu f . Sind a, b ∈ K, ist a < b und ist f (a)f (b) = 0, so ist w(a) − w(b) die Anzahl der Nullstellen von f in [a, b], wobei Vielfachheiten nicht gez¨ ahlt werden. Beweis. Setze Vi := fi /ggT(f, f ). Nach Satz 6 erf¨ ullen dann V0 und V1 die Bedingungen 1) f¨ ur sturmsche Ketten. Ferer ist Grad(Vr ) = 0, so dass auch die Bedingung 3) erf¨ ullt ist. Wegen Vi−2 = qi Vi−1 − Vi
9. Sturmsche Ketten
309
ist aber auch 2 erf¨ ullt. Somit ist V0 , V1 , . . . , Vr eine sturmsche Kette zu V0 . Nach Satz 1 ist daher |wV (a) − wV (b)| die Anzahl der Nullstellen von V0 in [a, b]. Weil die Nullstellen von V0 genau die Nullstellen von f sind, ist |wV (a) − wV (b)| auch die Anzahl der Nullstellen von f in [a, b]. Nun ist aber fi (a) = Vi (a)ggT(f, f )(a) und
fi (b) = Vi (b)ggT(f, f )(b)
f¨ ur alle i. Also ist wV = w, das heißt, wV (a) − wV (b) = w(a) − w(b). Weil schließlich nach Satz 5 die Bedingung 2 c) gilt, ist w(a) ≥ w(b). Damit ist alles bewiesen. Korollar. Es sei K ein reell abgeschlossener K¨ orper. Ist 0 = r ∈ K[x] und ist f quadratfrei, so ist die Standardkette zu f eine sturmsche Kette zu f . Beweis. Da f quadratfrei ist, ist ggT(f, f ) = 1. Also ist Vi = fi . Hier ist im Wortlaut das dritte Beispiel, das Sturm zu seinem Satz durchrechnet. Es steht auf den Seiten 299ff. seiner Arbeit. 3e EXEMPLE. On verra, dans l’exemple suivant, comment on peut calculer deux racines dont la diff´erence est tr`es petite. Soit l’´equation x3 + 11x2 − 102x + 181 = 0. On a
V = x3 + 11x2 − 102x + 181, V1 = 3x2 + 22x − 102, V2 = 854x − 2751, V3 = +441.
On voit d’abord, d’apr`es la proposition du n◦ 14, que l’´equation a ses trois racines r´eelles. Pour trouver les racines positives, on substitue a` la place de x les nombres 0, 1, 2, 3, 4, . . . dans les fonctions V , V1 , V2 , V3 , et l’on ´ecrit les signes des r´esultats; on trouve ⎫ V V1 V2 V3 ⎪ ⎪ pour x = 0 + − − + 2 variations, ⎪ ⎪ ⎪ ⎪ ⎪ ⎬ x = 1 + − − + (a) x = 2 + − − + ⎪ ⎪ x = 3 + − − + 2 variations, ⎪ ⎪ ⎪ ⎪ ⎪ x = 4 + + + + 0 ⎭ x = +∞ + + + + 0
310
Kapitel XI. Transfinite Methoden
Ce tableau montre que l’´equation a deux racines positive et qu’elle sont comprises entre 3 et 4. D´eterminons la valeur de ces racines `a un dixi`eme pr`es. Pour rendre le calcul plus facile, on fera x = 3 + y, et l’on remplacera x par 3 + y, non-seulement dans V , mais aussi dans V1 et V2 , parce qu’on voit dans le tableau pr´ec´edent que chacune de ces fonctions V1 , V2 , change de signe pour une valeur de x comprise entre 3 et 4. Les fonctions V , V1 , . . . , deviendront par cette transformation V = y 3 + 20y 2 − 9y + 1, V1 = 3y 2 + 40y − 9, V2 = 854y − 189, V3 = + . On fera successivement y = 0, y = 0, 1, y = 0, 2 . . . ; jusqu’` a ce que la suite des signes des fonctions V , V1 , V2 , V3 , perde les deux variations qu’elle a pour y = 0 (qui r´epond a` x = 3), ou jusqu’` a ce que V change de signe. y y y y
V V1 V2 =0 donne + − − = 0, 1 + − − = 0, 2 + − − = 0, 3 + + +
V3 + + + +
On a donc V = 0 pour deux valeurs de y comprises entre 0, 2 et 0, 3, et par cons´equent pour deux valeurs de x comprises entre 3,2 et 3,3. On d´eterminera le chiffre des centi`emes de chaque racine, en substituant a` la place de y, dans les mˆeme fonctions, les nombres 0, 20 . . . 0, 21 . . . 0, 22 . . . jusqu’` a ce que la suite de leurs signes perde deux variations, ou jusqu’` a ce que V change de signe. On trouvera V V1 V2 V3 pour y = 0, 20 + − − + y = 0, 21 + − − + V = +0, 001261 y = 0, 22 − V = −0, 001352. On voit par le changement de signe de V , que l’une des deux valeurs cherch´ees de y tombe entre 0, 21 et 0, 22, et que l’autre doit ˆetre plus grande que 0, 22; de sorte que les deux racines sont maintenant s´epar´ees. D`es lors on n’a plus besoin des fonctions auxiliaires V1 , V2 , V3 . On substitue 0, 23 `a la place de y dans la seule fonction V : on trouve le r´esultat positif +0, 000167; d’o` u il suit que la seconde valeur cherch´ee de y tombe entre 0, 22 et 0, 23. Hier sind die Nullstellen separiert. Die bislang benutzte Methode liefert noch eine weiter Dezimale und dann rechnet er — nicht mehr explizit — mit dem newtonschen Verfahren weiter, dass er als bekannt annimmt.
9. Sturmsche Ketten
311
Par de nouvelles substitutions faites dans V , on trouvera que le chiffre des milli`emes est 3 pour la plus petite racine; et 9 pour l’autre. Ainsi les deux racines positives de l’´equation propos´ee x3 + 11x2 − 102x + 181 = 0, sont 3, 213 et 3, 229 `a une milli`eme pr`es. On obtiendra trois chiffres d´ecimaux de plus pour chacune, en applicant la r`egle de Newton `a cette ´equation ou a` sa transform´ee en y. On trouvera les valeurs 3, 213128 et 3, 229521, exactes `a une millioni`eme pr`es. Dann rechnet er das gleiche Beispiel noch einmal, indem er die Nullstellen durch Kettenbr¨ uche approximiert. Hier kombiniert er also die M¨ oglichkeit, die seine Methode bietet, die Nullstellen zu separieren, mit der lagrangeschen der Approximation der Nullstellen durch Kettenbr¨ uche (Lagrange 1769). Wie schon gesagt, ist auch Lagrange in der Lage, die reellen Nullstellen eines Polynoms zu separieren, doch sein Verfahren ist viel umst¨andlicher. Will man die Nullstellen eines Polynoms f u ¨ ber einem reell abgeschlossenen K¨ orper K mittels des sturmschen Satzes separieren, so ermittele man etwa nach Satz 6 des vorigen Abschnitts eine untere und eine obere Schranke U bzw. O f¨ ur die Nullstellen von f . Der sturmsche Satz liefert dann die Anzahl der Nullstellen von f in [U, O]. Dann halbiere man das Intervall [U, O] und berechne die Anzahl der Nullstellen in den beiden H¨ alften. Die Teilintervalle, die mindestens zwei Nullstellen enthalten, halbiere man wieder. So fortfahrend, findet man schließlich Intervalle, die nur jeweils eine Nullstelle enthalten, wenn, ja wenn die Folge i → 1/2i eine Nullfolge ist. Dies ist genau dann der Fall, wenn K archimedisch angeordnet ist. Ist K nicht archimedisch angeordnet, so hat man keine Garantie, dass das Verfahren abbricht, und man kann sich Beispiele u ¨berlegen, dass es nicht abbricht. Zum Schluss noch der angek¨ undigte Einzigkeitssatz u ¨ ber die Einbettung von angeordneten K¨ orpern in reell abgeschlossene K¨orper (Artin und Schreier 1927, Satz 8). Satz 8. Es sei K ein angeordneter K¨ orper und L und M seien reell abgeschlossene, algebraische Erweiterungen von K. Setzen die Anordnungen von L und M die Anordnung von K fort, so gibt es genau einen K-linearen Isomorphismus von L auf M . Beweis. Es sei f ∈ K[x]. Es gibt dann nach Satz 6 von Abschnitt 8 ein C ∈ K, so dass die Nullstellen von f in L und auch in M in [−C, C] liegen. Wertet man die Standardkette zu f an den Stellen −C und C aus, so liegen die berechneten Werte alle in K. Man sieht daran, dass man bereits in K entscheiden kann, wieviel Nullstellen f in L und in M hat. Insbesondere folgt, dass f in L genauso viele Nullstellen hat wie in M . Es sei f ∈ K[x] ein beliebiges Polynom und a1 , . . . , at seien die Nullstellen von f in L. Nach Fr¨ uherem gibt es dann ein ξ ∈ L mit K[ξ] = K[a1 , . . . , at ].
312
Kapitel XI. Transfinite Methoden
Es sei μ ∈ K[x] das Minimalpolynom von ξ u ¨ ber K. Dann hat μ nach unserer Vorbemerkung auch eine Nullstelle η ∈ M . Es gibt einen K-linearen Isomorphismus von K[ξ] auf K[η], der ξ auf η abbildet. Es folgt, dass f¨ ur die t Nullstellen β1 , . . . , βt von f in M die Gleichung K[η] = K[β1 , . . . , βt gilt. Dies zeigt, dass es einen K-linearen Isomorphismus von K[α1 , . . . , αt ] auf K[β1 , . . . , βt ] gibt. Nach diesen zwei Vorbemerkungen definieren wir nun auf folgende Weise eine Abbildung σ von L in M . Es sei a ∈ L und μ sei das Minimalpolynom von a u ¨ ber K. Es seien α1 < . . . < αt die Nullstellen von μ in L. Dann ist also t ≥ 1. Es seien ferner β1 < . . . < βt die Nullstellen von μ in M . Es gibt dann ein k mit a = αk . Wir setzen σ(a) := βk . Wenn es u ¨ berhaupt einen Isomorphismus der verlangten Art gibt, muss σ dieser Isomorphismus sein. Es ist also nur noch zu zeigen, dass σ ein Isomorphismus ist. Klar ist, dass σ bijektiv ist und auf K die Identit¨ at induziert. Es sei f ∈ K[x] und α1 , . . . , αt seien die Nullstellen von f in L und β1 , . . . , βt seien die Nullstellen von f in M . Ist αk > αl , so gibt es δkl ∈ L mit 2 αk − αl = δkl .
¨ ber K und ζ1 , . . . , ζs seien Es sei g das Produkt der Minimalpolynome der δkl u die Nullstellen von g in L und η1 , . . . , ηs seien die Nullstellen von g in M . Es gibt dann einen K-linearen Automorhismus τ von K[α1 , . . . , αt , ζ1 , . . . , ζs ] auf K[β1 , . . . , βt , η1 , . . . , ηs ], der die α’s auf die β’s und die ζ’s auf die η’s abbildet. Wir d¨ urfen annehmen, dass ατk = βk und ζlτ = ηl ist. Ist nun αi > αj , so gibt es ein k mit αi − αj = δij = ζk2 . Es folgt βi − βj = (αi − αj )τ = (ζk2 )τ = ηk2 , so dass βi > βj ist. Dies zeigt, dass τ die Anordnung der αi respektiert. Da dies auch f¨ ur die Minimalpolynome der αi gilt, folgt ατi = ασi f¨ ur alle i := 1, . . . , t. Es seien nun a, b ∈ L. Ist dann f das Produkt der Minimalpolynome von a, b, a + b und ab u ¨ ber K, so folgt mit der gerade gemachten Bemerkung, dass (a + b)σ = aσ + bσ und (ab)σ = aσ bσ ist. Damit ist alles gezeigt. 10. Rodolfo Bettazzi. An Rodolfo Bettazzi erinnert man sich erst in j¨ ungster Zeit wieder. Ich fand ihn zum ersten Male in Felschers Buch Naive Mengen und ” abstrakte Zahlen“ erw¨ ahnt, in dem Felscher von Bettazzis Ergebnissen u ¨ ber die reellen Zahlen berichtet. Felscher hatte den Hinweis auf Bettazzis Teoria delle grandezze aus der Enzyklop¨ adie der Mathematik“, wie er mir einmal sagte. Wir ”
10. Rodolfo Bettazzi
313
hatten also Bettazzis Buch und darin den Hinweis, dass er mit dieser Arbeit einen Preis der Regia Accademia dei Lincei gewonnen hatte, wie das Opera premiata dalla R. Accademia dei Lincei auf dem Titelblatt des Buches meist interpretiert wird. Das waren unsere Kenntnisse bis 1999. Im Fr¨ uhjahr dieses Jahres diskutierten wir die Kategorizit¨ at der reellen Zahlen in der von Julio Gonzalez Cabillon geleiteten Diskussionsgruppe Historia matematica auf dem Internet. Dabei fiel auch der Name Bettazzis. In seinem Beitrag vom 1. Mai gab Alfred Ross einen Hinweis auf die Webadresse von Mathesis, einer italienischen mathematischen Gesellschaft von Lehrern und Hochschullehrern zur F¨ orderung des mathematischen Unterrichts an den Schulen, und einen Hinweis auf eine Arbeit von Jean Cassinet (Cassinet 1984). In dieser gab es Hinweise auf Arbeiten von Bettazzi, von denen die meisten Hinweise so miserabel waren, dass die Fernleihe außer Stande war, sie zu besorgen. Als ich im September 2001 in Rom war, machte ich mich in der Bibliothek des mathematischen Institutes selbst auf die Suche und wurde f¨ undig. Dabei fand ich auch einen Nachruf von A. Natucci auf Rodolfo Bettazzi (Natucci 1941). Dieser Nachruf enth¨ alt die folgende Information: Bettazzi wurde am 14. November 1861 in Florenz geboren und starb am 26. Januar 1941 in Turin. Er studierte Mathematik und Physik an dem Reale Istituto tecnico in Florenz — einer Institution, die nicht den Rang einer Universit¨ at hatte, — bevor er nach Pisa ging. An der Universit¨ at von Pisa erwarb er am 30. Juni 1882 das Laureat“, das ihn berechtigte, den Titel Dottore zu f¨ uhren. Was dieser ” Titel im Vergleich zu unserem Doktortitel wert ist, weiß ich nicht zu beurteilen. Er diente kurze Zeit beim Milit¨ ar. Anschließend war er Lehrer an Gymnasien in Foggia, Lucca und in Pisa. In der Zeit als Lehrer in Pisa war er gleichzeitig Assistent von Ulisse Dini. Man erinnere sich: Ulisse Dini hat 1878 in Turin ein Analysisbuch publiziert, in dem von dedekindschen Schnitten die Rede war (Kap. 1, Absch. 2). Seit 1891 lehrte er bis zu seiner Verabschiedung im Jahre 1931 in den Ruhestand am Reale Liceo Cavour in Turin. In der Zeit von 1892 bis 1922 lehrte er parallel zu seiner T¨atigkeit an diesem Gymnasium regelm¨aßig den Kurs Calcolo infinitesimale an der Reale Accademia militare di Torino. In diesen Jahren war er auch in der Gruppe um Giuseppe Peano aktiv, wo er den Abschnitt u ¨ber Grenzwerte im Formulaire schrieb (Peano 1895. Sektion VII. Limites. S. 75–82). Aus anderer Quelle erfuhr ich pr¨ aziser, dass er von 1892/93 bis 1911/12 an der Universit¨ at von Turin als Privatdozent u ¨ber Infinitesimalrechnung und Funktionentheorie las (C. L. Roero 1999, S. 515ff.). Laut Natucci war es Bettazzis Idee, die Gesellschaft Mathesis zu gr¨ unden. Er schrieb zusammen mit Aurelio Lugli und Francesco Giudice ihre Statuten. Gegr¨ undet wurde sie am 15. Oktober 1895 in Rom. Bettazzi war ihr Pr¨ asident von 1895 bis 1900 und dann ein zweites Mal von 1902 bis 1904. Die Hundertjahrfeier dieser Gesellschaft gab, so scheint es, den Anlass, sich ihres ersten Pr¨ asidenten zu erinnern. So wurde von Clara Silvia Roero eine Liste der mathematischen Publikationen Bettazzis kompiliert, die mir von Julio Gonzalez Cabillon zug¨anglich gemacht wurde, nachdem ich schon 20 dieser Arbeiten selbst gefunden hatte. Diese
314
Kapitel XI. Transfinite Methoden
Liste wurde in Roero 1999, S. 217ff. publiziert. Nach Natucci ist Bettazzis Teoria delle grandezze sein wichtigstes Werk. Das wird niemand bestreiten. Mit ihm h¨ atte er einen Preis der Regia Accademia dei Lincei gewonnen. Das ist nicht ganz richtig. Gewonnen hat er 1889 einen Preis des Ministeriums (Premio del Ministero). Die Regia Accademia dei Lincei hat nur die Durchf¨ uhrung der Ausschreibung des Preises und die Beurteilung der eingereichten Arbeiten durchgef¨ uhrt. Als Gutachter waren t¨ atig: Enrico Betti (Pisa), Eugenio Beltrami (Pavia), Luigi Cremona (Roma), Giuseppe Battaglini (Napoli), Ulisse Dini (Pisa), Felice Casorati (Pavia), lauter illustre Leute. Wer die anderen Wettbewerber waren, weiß ich nicht, da ich in Rom nur die Akten von Bettazzi gesehen habe. Wer von den Gutachtern die bettazzische Arbeit begutachtet hat, ist auf den ersten Blick nicht zu erkennen, da die Gutachten nicht unterschrieben sind. Da sie aber handschriftlich vorliegen, m¨ usste ein Vergleich der Handschriften die Urheberschaft kl¨ aren. Die handschriftliche Fassung der Teoria delle grandezze liegt heute im Archiv der Accademia Nazionale dei Lincei unter der Nummer B26–F83–SF5. Sie ist datiert: Pisa, Agosto 1887. Was Natucci nicht erw¨ahnt, ist, dass Bettazzi im Jahre 1895 einen weiteren Preis des Ministeriums gewonnen hat. Die preisgekr¨onte Arbeit hat den Titel Fondamenti per una teoria generale dei gruppi. Auch das Manuskript — wirklich das manu scriptum — dieser Arbeit ist in den Archiven der Akademie B45–F156–SF2. Bettazzis Handschrift ist sehr angenehm zu lesen. Das f¨ ur uns Wesentliche aus Bettazzis Teoria delle grandezze habe ich in Kapitel 1 vorgetragen und auf seine Kritik an der dedekindschen Definition endlicher Mengen kamen wir zu Beginn des vorliegenden Kapitels zu sprechen, so dass wir hier nicht mehr darauf eingehen m¨ ussen. Laut Natucci war Bettazzi ein sehr religi¨oser Mensch, der durch Schriften und die Organisation von Konferenzen und Kongressen best¨andig und couragiert f¨ ur den Schutz der Moralit¨ at (moralit` a ) eintrat. Liest man dann Titel wie Il casto talamo : al giovine sposo cristiano, Torino · Roma 1933, so erkennt man, wie zeitabh¨angig Moralit¨ at doch ist. — Diesen Titel und noch weitere verdanke ich Enrico Pasini (Turin). Es war also vor allem die Schule, die das berufliche Leben Bettazzis bestimmte. Dies und dass er seine mathematischen Arbeiten auf Italienisch in italienischen Zeitschriften pubizierte, ist wohl schuld daran, dass er und seine mathematischen Leistungen erst jetzt die geb¨ uhrende W¨ urdigung erfahren. Die Fernleihe wurde nach knapp einem Jahr im M¨ arz 2002 dann doch noch f¨ undig. Alle Achtung! Da war dieser Abschnitt schon aufgeschrieben.
XII. Geometrie lebt von der Algebra 1. Gauß und Vandermonde. Was die L¨osbarkeit von algebraischen Gleichungen durch Radikale anbelangt, so sind wir noch nicht wesentlich u ¨ber das hinausgekommen, was Mitte des 16. Jahrhunderts bekannt war. Auch die Anstrengungen von Lagrange haben nicht zu einer Entscheidung gef¨ uhrt. Immerhin war er in der Lage zu zeigen, dass die Nullstellen der Kreisteilungspolynome Φn , bei denen n nur durch Primzahlen aus der Menge {2, 3, 5, 7} teilbar ist, sich auf die L¨osung von Gleichungen des Grades 2 und 3 und das Ausziehen einer p-ten Wurzel aus einer q-ten Einheitswurzel zur¨ uckf¨ uhren lassen, wobei pq Teiler von n ist. Dies haben wir in Abschnitt 1 von Kapitel 8 gesehen. Gleichzeitig mit Lagrange arbeitete Vandermonde an dieser Frage. Seine Arbeit, die er im Jahre 1770 der Acad´emie royale des sciences in Paris vortrug und 1774 in deren Histoire des Jahres 1771 publizierte, werden wir sp¨ ater kommentieren. Hier aber sei schon erw¨ahnt, dass er die L¨osung der Gleichung Φ11 = 0 zur¨ uckf¨ uhrt auf das L¨osen von f¨ unf quadratischen Gleichungen der Form x2 − ax + 1 = 0, deren Koeffizienten a die L¨ osungen der Gleichung 5. Grades x5 − x4 − 4x3 + 3x2 + 3x − 1 = 0 sind, die uns in Abschnitt 1 von Kapitel 8 schon begegnet ist (Korollar 4 zu Satz 2). F¨ ur diese Gleichung liefert seine Theorie aber die L¨ osung x = 15 [1 + Δ + Δ + Δ + Δiv ], wobei
Δ = Δ = Δ = Δiv =
5
11 4 (89 11 4 (89 5 11 4 (89 5 11 4 (89
5
√ √ √ √ √ + 25 5 − 5 −5 + 2 5 + 45 −5 − 2 5) √ √ √ √ √ + 25 5 + 5 −5 + 2 5 − 45 −5 − 2 5) √ √ √ √ √ − 25 5 − 5 −5 + 2 5 − 45 −5 − 2 5) √ √ √ √ √ − 25 5 + 5 −5 + 2 5 + 45 −5 − 2 5)
ist (Vandermonde 1774, S. 415f.). Um alle L¨osungen dieser Gleichung 5. Grades zu bekommen, muss man nat¨ urlich auch noch die f¨ unften Einheitswurzeln ins Spiel bringen. Sie zu bestimmen f¨ uhrt wiederum auf Gleichungen zweiten Grades. Bei dieser Gleichung f¨ unften Grades wird klar, was auch schon bei den Gleichungen dritten Grades offenbar wurde, dass bei der L¨ osung von Gleichungen durch Radikale die n-ten Einheitswurzeln eine Sonderrolle spielen. Bei den Gleichungen
316
Kapitel XII. Geometrie lebt von der Algebra
zweiten und vierten Grades wurde dies nicht so deutlich, da dort nur die zweiten Einheitswurzeln ins Spiel kamen, die als Vorzeichen nicht sonderlich auffallen. Die n-ten Einheitswurzeln verdienen also eine Sonderbehandlung. Gauß motiviert seine Untersuchungen der Kreisteilungspolynome in seinen Disquisitiones arithmeticae aber nicht mit dieser Sonderrolle der n-ten Einheitswurzeln, die ja erst im Nachhinein klar wird, sondern mit der Kreisteilung. Dazu bemerkt er zun¨achst, dass es gen¨ uge, die regul¨ aren ai -Ecke zu haben, um daraus dann das regul¨ are n-Eck zu konstruieren, wenn n = a1 a2 · · · at ist mit paarweise teilerfremden ai . In diesem Fall gibt es n¨ amlich ganze Zahlen b1 , . . . , bt mit m · 2π = n
b1 bt + ...+ a1 at
· 2π.
Um die Existenz der bi zu beweisen, konstruiere man etwa mittels des bachetschen Algorithmus (Kapitel 2, Abschnitt 2) ganze Zahlen x und y mit xa2 · · · at + ya1 = 1. Setzt man b1 := xm und m := ym, so folgt m m b1 + = . a1 a2 · · · at n Induktion nach t liefert die Behauptung (Gauß 1801, Artikel 310, der sich aber nicht auf Bachet bezieht). Was die L¨ osung von Kongruenzen der Form ax ≡ 1 mod n anbelangt, so zitiert Gauß in Artikel 28 Euler als denjenigen, der als Erster ein Verfahren angegeben h¨ atte, x zu finden. In den Anmerkungen zu den Disquisitiones stellt er dann fest, dass Bachet die Priorit¨at zukomme. Er sei durch Lagrangens Zus¨atze zur franz¨ osischen Ausgabe von Eulers Vollst¨andige Anleitung zur Algebra“ darauf ” aufmerksam gemacht worden, h¨ atte aber nur die erste Auflage von Bachets Problemes plaisans einsehen k¨ onnen, wo das fragliche Resultat nur angek¨ undigt werde. Liest man obige Gleichung modulo 2π, so kann man annehmen, dass 0 ≤ bi < ai ist f¨ ur alle i := 1, . . . , t. Diese bi sind durch diese Nebenbedingung eindeutig bestimmt. Man erh¨ alt dann, ausgehend von der Ecke E0 , auf dem Einheitskreis aren n-Ecks, indem man sukzessive b1 -mal den Bogen 2π die Ecke Em des regul¨ a1 , 2π dann sukzessive b2 -mal den Bogen a2 , usw. abtr¨ agt. Weil jede nat¨ urliche Zahl ein Produkt aus Primzahlpotenzen ist, gen¨ ugt es also, die Konstruierbarkeit von regul¨ aren pn -Ecken zu untersuchen. Der Fall p = 2 ist trivial, da das regul¨ are 2n+1 -Eck aus dem regul¨aren 2n -Eck durch Halbieren von Winkeln entsteht. Es sei also p > 2. Die von 1 verschiedenen p-ten Einheitswurzeln erf¨ ullen die Gleichung xp−1 + . . . + x + 1
1. Gauß und Vandermonde
317
vom Grade p − 1. Weil p − 1 in aller Regel faktorisierbar ist, hat man hier eine Chance, das Problem auf Gleichungen kleineren Grades zu reduzieren. Ist n = 2 und hat man schon eine nicht triviale p-te Einheitswurzel, so muss man noch eine Gleichung p-ten Grades l¨osen, um eine primitive p2 -te Einheitswurzel zu erhalten. Bei p3 kommt noch eine weitere Gleichungen p-ten Grades hinzu. Bei pn muss man insgesamt n− 1 weitere Gleichungen vom Grad p l¨ osen. Daran f¨ uhre kein Weg vorbei, so Gauß, ohne dass er dies beweist. Weiß man, dass die Kreisteilungspolynome Φn irreduzibel sind — und wir haben dies schon bewiesen —, so ist dies leicht einzusehen. Ist n¨ amlich η eine primitive pn -te Einheitswurzel, so ist eine Nullstelle ζ von xp − η eine primitive pn+1 -ste Einheitswurzel. Dieses Polynom ist aber u ¨ ber Qpn irreduzibel. Es ist ja Qpn+1 = Qpn [ζ] und
pn (p − 1) = [Qpn+1 : Q] = [Qpn+1 : Qpn ][Qpn : Q] = [Qpn+1 : Qpn ]pn−1 (p − 1).
at von xp − η u ¨ ber Qpn . Hieraus folgt [Qpn+1 : Qpn ] = p und damit die Irreduzibilit¨ Hat man also die p-ten Einheitswurzeln, so erh¨ alt man die pn -ten Einheitswurzeln durch (n − 1)-maliges Ausziehen von p-ten Wurzeln. Wegen der Irreduzibilit¨ at der Gleichung xp − η kann man die Gleichungen p-ten Grades nicht umgehen. Es bleibt, die p-ten Einheitswurzeln zu untersuchen, wenn p eine ungerade Primzahl ist. Gauß erl¨ autert in Artikel 342 das Ziel. Ist n¨ amlich p − 1 das Produkt der Zahlen α, β, γ, usw. f¨ ur die man Primzahlen nehmen k¨ onne, so zerlege man Φp in α Faktoren vom Grade p−1 , wobei die Koeffizienten dieser Gleichungen mittels einer α Gleichung vom Grade α bestimmt werden. Diese Faktoren werden dann wieder in jeweils β Faktoren vom Grade p−1 αβ zerlegt, deren Koeffizienten mittels Gleichungen vom Grade β bestimmt werden, usw. Bei dieser Zerlegung spielt die Zyklizit¨at der Einheitengruppe modulo p eine wesentliche Rolle wie auch, dass die Summe der primitiven p-ten Einheitswurzeln ungleich 0 ist. Zuvor in Art. 336 hatte Gauß gesagt, dass man die nachfolgende Theorie auch onne. Das ist aber nicht so ohne Weiteres m¨oglich. Die auf den Fall pn ausdehnen k¨ ur alle Primzahlen p > 2 zyklisch, wie Gauß Einheitengruppe modulo pn ist zwar f¨ bewiesen hat (Art. 89), doch die Summe der primitiven pn -ten Einheitswurzeln ist ¨ 0, falls n > 1 ist. Das macht die direkte Ubertragung seiner Methoden unm¨ oglich. Um bequemer als Gauß sprechen zu k¨onnen, f¨ uhren wir zun¨ achst den Begriff der Operatorgruppe ein und beweisen einen ersten Satz u ¨ ber solche Gruppen, den wir aber hier noch nicht ben¨ otigen. Es sei M eine Menge und G eine Gruppe. Es heißt G Operatorgruppe auf M , wenn es eine Abbildung von M × G in M gibt, die (m, γ) auf mγ abbildet, so dass gilt
318
Kapitel XII. Geometrie lebt von der Algebra
ur alle m ∈ M und alle γ, δ ∈ G. 1) Es ist mγδ = (mγ )δ f¨ 1 ur alle m ∈ M . 2) Es ist m = m f¨ −1
−1
Jedes γ ∈ G induziert auf M eine Abbildung, die wegen (mγ )γ = mγγ = −1 −1 m1 = m und (mγ )γ = mγ γ = m1 = m bijektiv ist. Dies zeigt, dass der Begriff Operatorgruppe eine Verallgemeinerung des Begriffs Permutationsgruppe ist. Ist G eine Operatorgruppe auf M , so definieren wir die Relation ∼ = auf M durch die Vorschrift m ∼ = n genau dann, wenn es ein γ ∈ G gibt mit mγ = n. Die ¨ ¨ Relation ∼ Ihre Aquivalenzklassen heißen Bahnen der = ist eine Aquivalenzrelation. Operatorgruppe G auf der Menge M . Ist G eine Operatorgruppe auf der Menge M und ist m ∈ M , so setzen wir Gm := {γ | γ ∈ G, mγ = m}. Dann ist Gm eine Untergruppe von G, der Stabilisator von m in G. Satz 1. Ist G eine endliche Operatorgruppe auf der Menge M , ist m ∈ M und ist B die Bahn von G mit m ∈ B, so ist |G| = |B||Gm |. Beweis. Wir definieren eine Relation ∼ auf G durch die Vorschrift γ ∼ δ genau ¨ Ferner gilt γ ∼ δ dann, wenn mγ = mδ ist. Dann ist ∼ eine Aquivalenzrelation. ¨ genau dann, wenn γδ −1 ∈ Gm ist. Hieraus folgt, dass die Aquivalenzklassen alle ¨ aber ist |B|. Damit ist die L¨ ange |Gm | haben. Die Anzahl der Aquivalenzklassen der Satz bewiesen. Es sei p eine von 2 verschiedene Primzahl. Das p-te Kreisteilungspolynom Φp =
p−1
xi
i:=0
ist irreduzibel, wie wir schon wissen (Disq., Art. 341). Es sei ζ eine von 1 verschiedene p-te Einheitswurzel. Weil p eine Primzahl ist, besteht Ω := {ζ, ζ 2 , . . . , ζ p−1 } aus den Nullstellen von Φp . Daher gilt p, falls p Teiler von λ ist, Φp (ζ λ ) = 0, falls p kein Teiler von λ ist. Ist λ eine zu p teilerfremde nat¨ urliche Zahl, so ist Ωλ = {ζ λ , ζ 2λ , . . . , ζ (p−1)λ } = Ω.
1. Gauß und Vandermonde
319
Auf diese Weise wird die zyklische Gruppe Zp−1 der Ordnung p − 1 zur Operatorgruppe auf Ω. Es sei f Teiler von p − 1. Dann enth¨ alt Zp−1 genau eine Untergruppe Uf der Ordnung f (Kap. 9, Absch. 2, Satz 5). Diese Untergruppe zerlegt die Menge Ω in Bahnen. Es sei wieder ζ eine von 1 verschiedene p-te Einheitswurzel und λ eine nicht durch p teilbare nat¨ urliche Zahl. Wir bezeichnen mit (f, λ) die Bahn von alt. Den Fall, dass λ durch p teilbar ist, kann man Uf , die das Element ζ λ enth¨ ebenfalls subsumieren, indem man (f, 0) := {1} setzt. Gauß nennt die Mengen (f, λ) Perioden. Die Bahn (f, λ) h¨ angt nat¨ urlich von der Wahl von ζ ab. Wir setzen ζ λu . σ(f, λ) := u∈Uf
Dann ist σ(f, 0) = f . Satz 2. Es sei p > 2 eine Primzahl. Ist p − 1 = ef und ist v1 , . . . , ve ein Vertretersystem von Zp−1 /Uf , so ist e
σ(f, vi ) = −1.
i:=1
Ausschreiben liefert e i:=1
σ(f, vi ) =
e
ζ vi u =
i:=1 u∈Uf
p−1
ζ i = −1.
i:=1
Satz 3. Es sei p > 2 eine Primzahl und λ und μ seien nicht negative ganze Zahlen. Es sei ferner f Teiler von p − 1 und Uf sei die Untergruppe der Ordnung f von Zp−1 . Dann ist σ(f, λv + μ). σ(f, λ)σ(f, μ) = v∈Uf
Beweis. Es ist σ(f, λ) = σ(f, λw) f¨ ur alle w ∈ Uf . Es folgt σ(f, λ)σ(f, μ) = σ(f, λ)ζ μw w∈Uf
=
σ(f, λw)ζ μw
w∈Uf
=
ζ λwv ζ μw
w∈Uf v∈Uf
=
ζ (λv+μ)w
v∈Uf w∈Uf
=
v∈Uf
σ(f, λv + μ)
320
Kapitel XII. Geometrie lebt von der Algebra
und damit die Behauptung. Satz 4. Es sei p > 2 eine Primzahl. Ferner seien e, f ∈ N und es gelte p − 1 = ef . Es sei Uf die Untergruppe der Ordnung f von Zp−1 und v1 , . . . , ve sei ein Vertretersystem von Zp−1 /Uf . Schließlich sei Π ∈ Z[x1 , . . . , xn ] ein Polynom in ¨ber Z. Sind dann λ1 , . . . , λn nicht negative ganze den Unbestimmten x1 , . . . , xn u Zahlen, so gibt es genau ein e-Tupel a1 , . . . , ae ganzer Zahlen mit Π σ(f, λ1 ), . . . , σ(f, λn ) = a1 σ(f, v1 ) + . . . + ae σ(f, ve ).
Beweis. Wir betrachten zun¨achst das Polynom x1 x2 . Nach Satz 3 ist dann σ(f, λ1 )σ(f, λ2 ) =
σ(f, λ1 v + λ2 ).
v∈Uf
Ist p kein Teiler von λ1 v + λ2 , so gibt es ein i mit (f, λ1 v + λ2 ) = (f, vi ). Dann ist auch σ(f, λ1 v + λ2 ) = σ(f, vi ). Ist p Teiler von λ1 v + λ2 , so ist σ(f, λ1 v + λ2 ) = f . Also gibt es ganze Zahlen b0 , . . . , be mit σ(f, λ1 )σ(f, λ2 ) = b0 f +
e
bi σ(f, vi ).
i:=1
Nach Satz 2 ist aber −1 =
e
σ(f, vi )
i:=1
und folglich b0 f = −b0 f
e
σ(f, vi ).
i:=1
Daher gilt σ(f, λ1 )σ(f, λ2 ) =
e
(bi − b0 f )σ(f, vi ).
i:=1
Hieraus folgt nun mittels Induktion die Existenz der Darstellung. Um die Einzigkeit zu beweisen, gen¨ ugt es zu zeigen, dass sich die Null nur trivial darstellen l¨ asst. Es sei also 0 = a1 σ(f, v1 ) + . . . + ae σ(f, ve ). Weil {(f, vi ) | i := 1, . . . , e} eine Partition von Ω ist, ist daher ζ Nullstelle eines Polynoms der Form A1 x + A2 x2 + . . . + Ap−1 xp−1 ,
1. Gauß und Vandermonde
321
wobei jedes Ai gleich einem aj und auch jedes aj gleich einem Ai ist. Dann ist aber A1 + A2 ζ + . . . + Ap−1 ζ p−2 = 0, at Teiler von A1 + A2 x + . . . + Ap−1 xp−2 ist. so dass Φp wegen seiner Irreduzibilit¨ Hieraus folgt Ai = 0 f¨ ur alle i und damit auch aj = 0 f¨ ur alle j. Satz 5. Es sei p > 2 eine Primzahl und f sei Teiler von p − 1. Es sei ϕ ein ¨ber Z und λ1 , . . . , λn seien nicht Polynom in den n Unbestimmten x1 , . . . , xn u negative ganze Zahlen. Ist m eine nicht durch p teilbare nat¨ urliche Zahl, so ist genau dann ϕ σ(f, λ1 ), . . . , σ(f, λn ) = 0, wenn
ϕ σ(f, mλ1 ), . . . , σ(f, mλn ) = 0
ist. Beweis. Man ersetze in ϕ σ(f, λ1 ), . . . , σ(f, λn ) die Einheitswurzel ζ durch die Unbestimmte x. Dann erh¨ alt man ein Polynom π in x mit der Nullstelle ζ. Daher ist Φp , weil irreduzibel, Teiler von π. Folglich ist auch ζ m Nullstelle von π. Es folgt ϕ σ(f, mλ1 ), . . . , σ(f, mλn ) = π(ζ m ) = 0. Mit dem bereits Bewiesenen folgt auch die Umkehrung, wenn man nur beachtet, dass es ein m gibt mit m m ≡ 1 mod p. Satz 6. Es sei p > 2 eine Primzahl und p − 1 = ef . Ferner sei Φ ein Polynom in den n Unbestimmten x1 , . . . , xn und ϕ ein Polynom in den Unbestimmten y1 , . . . , ye u ¨ber Z. Schließlich sei v1 , . . . , ve ein Vertretersystem von Zp−1 /Uf . Ist m eine zu p teilerfremde nat¨ urliche Zahl und sind λ1 , . . . , λn nicht negative ganze Zahlen, so ist genau dann Φ σ(f, λ1 ), . . . , σ(f, λn ) = ϕ σ(f, v1 ), . . . , σ(f, ve ) , wenn
Φ σ(f, mλ1 ), . . . , σ(f, mλn ) = ϕ σ(f, mv1 ), . . . , σ(f, mve )
ist. Dies folgt mittels Satz 5 angewandt auf das Polynom Φ − ϕ, wobei die Rolle der Unbestimmten x1 , . . . , xn von Satz 5 hier von den Unbestimmten x1 , . . . , xn , y1 , . . . , ye gespielt wird.
322
Kapitel XII. Geometrie lebt von der Algebra
Satz 7. Es sei p > 2 eine Primzahl und p − 1 = ef . Es sei weiterhin v1 , . . . , ve ein Vertretersystem von Zp−1 /Uf . Ist Φ=
p−2
ai xi
i:=0
ein Polynom in der Unbestimmten x u ¨ber Z und ist Φ(ζ) = Φ(ζ λ ) f¨ ur alle λ ∈ Uf , so gibt es ganze Zahlen b1 , . . . , be mit Φ(ζ) =
e
bi σ(f, vi ).
i:=1
Beweis. Wegen Φ(ζ) = Φ(ζ λ ) ist f Φ(ζ) = Φ(ζ λ ) λ∈Uf
=
p−2
aj ζ λj =
λ∈Uf j:=0
= a0 σ(f, 0) +
p−2 j:=0
p−2
aj
ζ λj =
j:=1
aj σ(f, j)
j:=0
λ∈Uf
aj σ(f, j) = f a0 +
p−2
p−2
aj σ(f, j)
j:=1
Nun gibt es zu jedem j > 0 ein vi mit σ(f, j) = σ(f, vi ). Hieraus folgt wiederum die Existenz ganzer Zahlen B1 , . . . , Be mit f Φ(ζ) = f a0 +
e
Bi σ(f, vi ).
i:=1
Weil {(f, vi ) | i := 1, . . . , e} eine Partition von Ω ist, gibt es wieder ganze Zahlen c0 , . . . , cp−1 mit p−1 cj ζ j f Φ(ζ) = f a0 + j:=1
und {c1 , . . . , cp−1 } = {B1 , . . . , Be }. Nun ist ζ p−1 = −
p−2
ζj .
j:=0
Daher ist f Φ(ζ) = f a0 − cp−1 +
p−2
(cj − cp−1 )ζ j .
j:=1
1. Gauß und Vandermonde
323
Andererseits ist f Φ(ζ) =
p−2
f aj ζ j .
j:=0
ur j := 1, . . . , p − 2. Also ist Es folgt f a0 = f a0 − cp−1 und cj − cp−1 = f aj f¨ cp−1 = 0 und alle ci sind durch f teilbar. Also sind auch alle Bi durch f teilbar. Setzt man nun d0 := a0 und di := Bi f −1 f¨ ur i > 0, so folgt Φ(ζ) = d0 +
e
di σ(f, vi )
i:=1 e
=
.
(di − 1)σ(f, vi )
i:=1
Satz 8. Es sei p > 2 eine Primzahl und es sei p − 1 = ef . Ferner sei v1 , . . . , ve ein Vertretersystem von Zp−1 /Uf . Ist dann μf,1 :=
e
x − σ(f, vi ) .
i:=1
so ist μf,1 ∈ Z[x] und μf,1 ist irreduzibel. Beweis. Es sei g eine Primitivwurzel modulo p. Wir d¨ urfen dann annehmen, dass vi = g i ist. Es sei zun¨achst S ein symmetrisches Polynom in e Unbestimmten u ¨ ber Z. Nach Satz 7 gibt es ganze Zahlen a1 , . . . , ae mit e 2 e S σ(f, g), σ(f, g ), . . . , σ(f, g ) = ai σ(f, g i ). i:=1
Es folgt
e i:=1
ai σ(f, g i ) = S σ(f, g), σ(f, g 2 ), . . . , σ(f, g e ) = S σ(f, g 2 ), σ(f, g 3 ), . . . , σ(f, g e+1 ) e = ai σ(f, g i+1 ). i:=1
Mit Satz 4 folgt ai = ai+1 , wobei ae+1 als a1 zu lesen ist. Mit Satz 2 folgt dann schließlich e S σ(f, g), σ(f, g 2 ), . . . , σ(f, g e ) = a1 σ(f, g i ) = −a1 ∈ Z. i:=1
324
Kapitel XII. Geometrie lebt von der Algebra
¨ber Z ist, da die KoefMit dieser Vorbemerkung folgt, dass μf,1 ein Polynom u fizienten von μf,1 symmetrische Funktionen in den σ(f, ai ) sind. Es sei ψ ein nicht trivialer Faktor von μf,1 . Es gibt dann ein i mit 1 ≤ i ≤ e und ψ σ(f, g i ) = 0. Wir definieren das Polynom Ψ durch Ψ := ψ
gi v
x
.
v∈Uf
Dann ist
Ψ(ζ) = ψ σ(f, g i ) = 0,
so dass Ψ durch Φp teilbar ist. Folglich ist i+1 0 = Ψ(ζ g ) = ψ ζ g v = ψ σ(f, g i+1 ) . v∈Uf
Damit ist gezeigt, dass ψ die gleichen Nullstellen wie μf,1 hat, so dass μf,1 in der Tat irreduzibel ist. Satz 9. Es sei p > 2 eine Primzahl und es sei p − 1 = ef . Sind dann λ und μ zwei nicht durch p teilbare nat¨ urliche Zahlen, so gibt es rationale Zahlen a0 , . . . , ae−1 mit e−1 ai σ(f, λ)i . σ(f, μ) = i:=0
Beweis. Ist (f, μ) = (f, λ), so ist σ(f, μ) = σ(f, λ) und folglich nichts zu beweisen. Es sei also (f, μ) = (f, λ). Es sei ferner v1 = μ, v2 = λ, v3 , . . . , ve ein Vertretersystem von Zp−1 /Uf . Wir setzen ξi := σ(f, vi ). Nach Satz 4 gibt es hi , ki und aij mit e ξ1i = hi ξ1 + ki ξ2 + aij ξj j:=3
f¨ ur i := 2, . . . , e − 1. Setzt man noch h1 := −1 und k1 := −1 sowie a1,j := −1 f¨ ur j := 3, . . . , e, so gilt auch noch 1 = h1 ξ1 + k1 ξ2 +
e
a1,j ξj .
j:=3
Die Matrix a ist eine ((e − 1) × (e − 2))-Matrix. Es gibt daher rationale Zahlen r1 , . . . , re−1 , die nicht alle null sind, mit e−1 i:=1
ai,j ri = 0
1. Gauß und Vandermonde
325
f¨ ur j := 3, . . . , e. Multipliziert man nun die Gleichung f¨ ur 1 mit r1 und die Gleichung f¨ ur ξ1i mit ri und addiert sie alle miteinander, so erh¨ alt man r1 + r2 ξ12 + . . . + re−1 ξ1e−1 =
e−1
e−1 ri hi ξ1 + ri ki ξ2 .
i:=1
i:=1
Es gibt also rationale Zahlen K und s0 , s1 , . . . , se−1 , von denen die si nicht alle null sind, mit Kξ2 = s0 + s1 ξ1 + . . . + se−1 ξ1e−1 . W¨ are nun K = 0, so w¨are ζ Nullstelle eines Polynomes vom Grade h¨ochstens e − 1 im Widerspruch zur Irreduzibilit¨ at von Φp , da ja e − 1 < e ≤ p − 1 = Grad(Φp ) ist. Also ist K = 0 und daher σ(f, μ) =
e−1 si σ(f, λ)i . K i:=0
Damit ist der Satz bewiesen. Ist p eine ungerade Primzahl und ist f Teiler von p − 1, so bezeichnen wir mit Kf das Bild von Q[x] unter dem Einsetzungshomomorphismus π → π σ(f, λ) von Q[x] in Qn . Satz 10. Es sei p > 2 eine Primzahl. Ferner sei p − 1 = ef . Dann ist Kf ein zu orper. Es ist [Kf : Q] = e und σ(f, μ) ∈ Kf f¨ ur alle Q[x]/μf,1 Q[x] isomorpher K¨ nicht durch p teilbaren μ. orper Beweis. Nach Satz 8 ist μf,1 irreduzibel vom Grade e. Daher ist Kf ein K¨ vom Grad e u ¨ ber Q. Die letzte noch offene Aussage folgt mit Satz 9. Satz 11. Es sei p > 2 eine Primzahl und es sei p − 1 = ef . Ist f = e f , so ist Kf ⊆ Kf und
[Kf : Kf ] = e .
Beweis. Weil das Teilersein transitiv ist, ist f auch Teiler von p − 1. Daher enth¨ alt die Einheitengruppe modulo p auch eine Untergruppe Uf der Ordnung f . urlich auch Andererseits enth¨alt auch Uf eine Untergruppe der Ordnung f , die nat¨
326
Kapitel XII. Geometrie lebt von der Algebra
eine Untergruppe der Ordnung f der Einheitengruppe modulo p ist. Weil zyklische Gruppen aber immer nur eine Untergruppe gegebener Ordnung enthalten, ist Uf ⊆ Uf , so dass die f -Perioden ihrerseits in f -Perioden zerfallen. Da dann jedes σ(f, λ) Summe von e Elementen der Form σ(f , λ ) ist, folgt Kf ⊆ Kf . Ferner gilt [Kf : Q] = e und [Kf : Q] = e e und daher e e = [Kf : Q] = [Kf : Kf ][Kf : Q] = [Kf : Kf ]e, so dass [Kf : Kf ] = e ist. ¨ Mit diesem Satz gewinnen wir einen Uberblick u ¨ ber die Feinstruktur von Qp . Satz 12. Es sei p > 2 eine Primzahl und es gelte p − 1 = e1 e2 · · · et mit gewissen nat¨ urlichen Zahlen ei . Ferner sei fi := ei+1 · · · et f¨ ur i := 0, 1, . . . , t, wobei ft als 1 zu interpretieren ist. Dann ist fi−1 = ei fi und
Kfi = Kfi−1 σ(fi , 1) sowie [Kfi : Kfi−1 ] = ei
f¨ ur i := 1, . . . , t. Insbesondere ist Q = Kf0 ⊆ Kf1 ⊆ . . . ⊆ Kft = Qp . Ferner gilt σ(fi , λ) ∈ Kfi f¨ ur i := 1, . . . , t und λ := 1, . . . , p − 1. Dieser Satz folgt unmittelbar aus Satz 11. F¨ ur die ei wird man in aller Regel die Primteiler von p − 1 w¨ahlen, wobei ihre Reihenfolge durchaus willk¨ urlich ist. ¨ ber Kfi−1 sind irreduzibel vom Grade ei . Die Minimalpolynome der σ(fi , λ) u Wie sie zu finden sind, ist v¨ ollig offen. Gauß berechnet sie in den beiden F¨ allen p = 19, 18 = 3 · 3 · 2 und p = 17, 16 = 2 · 2 · 2 · 2. Er sagt dazu, dass man sich bei diesen Rechnungen vielerlei Tricks bedienen k¨ onne. osen l¨asst, Was ebenfalls nach wie vor offen ist, ist, ob sich Φp durch Radikale l¨ wobei wir bisher noch keine pr¨ azise Definition getroffen haben, was das heißen soll. Naiv wird man dies bejahen verf¨ uhrt durch den Namen p-te Einheitswurzel. Doch die Gleichung xp − 1 = 0 ist nicht irreduzibel. Immer noch informell fragen wir, ob
1. Gauß und Vandermonde
327
sich Kfi aus Kfi−1 durch Adjunktion einer ei -ten Wurzel erhalten l¨asst. (Eine k-te Wurzel ist L¨osung einer Gleichung der Form xk −a = 0. Solche Gleichungen nannte schon Gauß reine Gleichungen, equationes purae (Sing.: equatio pura (Disq. Art. 359)). Das ist nur der Fall, wenn ei = 2, wie wir noch sehen werden. Die Frage ist also zu naiv gestellt. Haben wir u ¨berhaupt schon etwas gewonnen? Oh ja, das Siebzehneck l¨ asst sich mit Zirkel und Lineal konstruieren! Mehr noch. Satz 13. Ist n = 2a p1 p2 · · · ps mit paarweise verschiedenen ungeraden Primzahlen p1 , . . . , pr und ist pi − 1 f¨ ur alle i eine Potenz von 2, so ist das regul¨ are n-Eck mit Zirkel und Lineal konstruierbar. Beweis. Ist p = 2t + 1 eine Primzahl, so kann man alle ei = 2 w¨ahlen. Dann ¨ ber Kfi−1 , ist also mit Zirkel und gen¨ ugt σ(fi , 1) einer Gleichung zweiten Grades u Lineal konstruierbar. Da dies f¨ ur alle i gilt, folgt die Behauptung. Gauß behauptet, dass die Bedingungen an n auch notwendig seien, beweist dies aber nicht. Geometrische Konstruktionen der Nullstellen von quadratischen√Gleichungen finden sich in D¨orrie 1943, S. 25–29, geometrische Konstruktion von ab, dh., der mittleren Proportionalen von a und b schon bei Euklid (Elemente VI.8. Siehe auch Kap.1, Absch. 4). Hat man diese, so kann man alle quadratischen Gleichungen mit Zirkel und Lineal l¨ osen, wenn auch nicht optimal. Das mathematische Werk Vandermondes ist recht schmal. Es umfasst ganze vier Arbeiten. Je zwei von ihnen erschienen in den Jahren 1774 und 1775 in der Histoire des Jahres 1771 und der des Jahres 1772 der Acad´emie royale in Paris. Von der Vandermondedeterminante findet sich in ihnen keine Spur (Lebesgue 1955. Diese Arbeit gibt einen Vortrag wieder, den Lebesgue 1937 in Utrecht gehalten hat). Von wem die Vandermondedeterminante stammt, sagt Lebesgue nicht. Ich weiß es auch nicht. Vandermondes Namen ist also in aller Munde wegen einer Sache, die nicht von ihm stammt. Sein eigentliches Werk aber ist vergessen, insbesondere auch die Arbeit, deretwegen er ber¨ uhmt sein sollte. Es ist die Arbeit M´emoire sur la r´esolution des ´equations, die er im November des Jahres 1770 der Akademie vortrug, die aber erst in den Histoire des Jahres 1771 erschien, da er 1770 noch nicht de l’Acad´emie war, wie er in der Fußnote auf S. 365 seiner Arbeit schreibt. Diese Arbeit ist gleichzeitig mit der großen Arbeit Lagrangens entstanden, ohne dass die beiden Autoren von einander wussten, was er ebenfalls in der gerade erw¨ahnten Fußnote notiert. Henri Lebesgue nun ist der Meinung, dass Gauß intime Kenntnis der vandermondeschen Arbeit hatte und dass er die dortigen Ideen bei der Abfassung des siebten Kapitels der Disquisitiones weidlich benutzte. Er kommt zu dem Schluss durch Analyse der beiden Arbeiten und durch einen Hinweis des Physikers Clerk Maxwell, der auf eine Notiz Gaußens hingewiesen habe, aus der hervorgeht, dass er, Gauß, den Band der Histoire von 1771 in der Hand gehabt hatte. Diese Notiz
328
Kapitel XII. Geometrie lebt von der Algebra
findet sich in einem Heft mit Notizen zur Elektrodynamik, das sich in Gaußens Nachlass fand. Die Notiz stammt vom 22. Januar 1833 und lautet (Werke, Band 5, S. 605): Von der Geometria Situs, die LEIBNITZ ahnte und in die nur einem Paar Ge” onnt ometern (EULER und VANDERMONDE) einen schwachen Blick zu thun verg¨ war, wissen und haben wir nach anderthalbhundert Jahren noch nicht viel mehr wie nichts.“ Die Arbeit Vandermondes, auf die hier angespielt wird, tr¨ agt den Titel Remarque sur les probl`emes de situation. Sie findet sich ebenfalls im Bande der Histoire von 1771. Hat Gauß diese Arbeit gesehen, dann hat er auch von der hier in Frage stehenden Arbeit Notiz nehmen m¨ ussen. Warum hat er sie nie erw¨ahnt? Darauf werden wir gleich zur¨ uckkommen. Zun¨ achst aber sei Lebesgue zitiert. Certes le travail de Gauss est un chef-d’œuvre; chef-d’œuvre d’exposition ” ´el´egante, rigoureuse et compl`ete, chef-d’œvre de compr´ehension et d’intelligence mais o` u la part d’invention personnelle est en r´ealit´e fort mince. Gauss expose la r´esolution de deux fa¸con: m ´etant premier, m − 1 est compos´e et Gauss, utilisant les formules III , calcule d’abord ces sommes de racines que nous avons rencontr´ees et qu’il appelle les valeurs des p´eriodes; d’o` u ensuite les racines elles-mˆemes par des formules ´equivalentes `a IV. Ensuite Gauss, pour r´esumer et conclure nettement, reprend la r´esolution sans parler des p´eriodes, il utilise alors I et son expos´e est identique `a celui que je viens de vous faire. Ainsi Gauss, dans l’un ou l’autre de ses calculs, suit pas `a pas Vandermonde; mais, bien entendu, il le perfectionne beaucoup. Par exemple, la m´ethode de Vandermonde conduit aux p´eriodes, mais Vandermonde ne parle pas des p´eriodes; de Vandermonde est la m´ethode, de Gauss sont les r´esultats. Par exemple encore, Vandermonde obtenait des valeurs parasites parce qu’il utilisait plusieurs extractions de racines m − 1es , Gauss les ram`ene toutes `a une seule et n’a plus de valeurs parasites. Il ne s’agit pas de diminuer Gauss, mais de rendre justice `a Vandermonde“ (Lebesgue 1955, S. 217). Lebesgue nennt Gaußens De aequationibus circuli sectiones definientibus (Kap. 7 der Disquisitiones) also in vieler Hinsicht ein Meisterwerk, aber arm an eigener Erfindung. Er belegt das mit Verweisen auf das schon Vorgetragene, was ich nicht wiedergegeben habe. Gauß folge bei seinen Rechnungen den Rechnungen Vandermondes zum Teil Schritt f¨ ur Schritt. Vandermonde geh¨ ore die Methode, Gauß aber die Resultate. Die Fernleihe besorgte mir die Arbeit Vandermondes: Benutzung nur im Lesesaal, Kopierverbot. Ich schrieb die 52 Seiten also ab, wobei die Reinschrift alle meine nicht geringen TEXnisierungsk¨ unste erforderte. Die Arbeit zu lesen ist ein Graus. Dem Setzer wird es auch gegraut haben. Ich vermute, dass auch der damalige Leser sehr gefordert war, obwohl er im Rechnen ge¨ ubter war, als wir es heute sind. Vandermonde gibt immer nur die Ergebnisse seiner Rechnungen an, komplizierte Ausdr¨ ucke, die er zu verifizieren dem Leser u ¨ berl¨ asst. Hinzukommt, dass er nur algebraische Gleichungen der Grade 2 bis 10 betrachtet. An Hand dieser Beispiele muss man das Vorgehen im Allgemeinen erkennen, wobei wir heute wissen, dass man im Allgemeinen nicht zum Ziele gelangt.
1. Gauß und Vandermonde
329
Was bei Vandermonde anders ist als bei seinen Zeitgenossen, ist, dass er neben den symmetrischen Funktionen auch noch partiell symmetrische Funktionen ins Spiel bringt. Das sind Summen von Monomen, die aus einem Monom αa β b γ c · · · dadurch entstehen, dass man s¨ amtliche Potenzen einer gegebenen Permutation der α, β, γ, . . . auf das gegebene Monom anwendet, wobei mehrfach vorkommende Monome — sie kommen nat¨ urlich alle gleich oft vor — nur einmal als Summand genommen werden. Diese Summen von Monomen sind die Verbindung zu Gauß. Sie f¨ uhrten am Ende bei den Kreisteilungspolynomen ans Ziel. Wenn man nun darauf wartet, dass Vandermonde endlich etwas zu den Kreisteilungspolynomen sagt, so wird man lange auf die Folter gespannt. Erst auf der vorletzten Seite seiner langen Arbeit zeigt er am Beispiel der Gleichung x11 −1 = 0, dass sein Verfahren zu ihrer L¨ osung f¨ uhrt. Er endet die Arbeit damit zu sagen, dass sein Verfahren gestatte, alle Gleichungen der Form xp − 1 = 0 zu l¨osen, bei denen p eine Primzahl sei. Lebesgue glaubt nicht, dass Gauß alles noch einmal gefunden habe, daf¨ ur seien ¨ die Ubereinstimmungen zu groß. Er glaubt auch nicht an einen geistigen Diebstahl. Er glaubt vielmehr, dass Gauß in gutem Glauben gehandelt habe, weil er, Gauß, wohl der Ansicht war, dass der Beweis mehr z¨ahle als der Einfall und die Beweise und die gute Organisation sind nun mal von Gauß. Das sieht auch Lebesgue so. Interessant ist, was Lebesgue u ¨ ber das Verh¨ altnis von Einfall und Beweis sagt. Hier der Text im Wortlaut (Lebesgue 1955, S. 218f.): Cette impartialit´e dans la s´ev´erit´e prouverait la bonne foi de Gauss si l’on ” songeait `a la mettre en doute; il a ´et´e de bonne foi, mais il s’est tromp´e en n’attachant de l’importance qu’` a l’ach`evement de la d´emonstration. Certes, au point de vue de la stricte logique, une d´emonstration est inexistante si elle n’est par achev´ee et enti`erement rigoureuse; il est certain aussi qu’un fait math´ematique n’est acqui que lorsqu’il est d´emontr´e. Pourtant aucune d´ecouverte n’a jamais ´et´e faite en math´ematique, comme ailleurs du reste, par un effort de logique d´eductive; elle r´esulte toujours d’un travail de cr´eation de l’imagination qui bˆ atit ce qui lui semble devoir ˆetre la v´erit´e, guid´ee parfois par les analogies, parfois par un id´eal esth´etique, mais qui ne bˆatit nullement sur de solides bases logiques. La d´ecouverte faite, la logique intervient ensuite pour contrˆ ole; c’est elle qui, finalement, d´ecide s’il s’agissait bien d’une vraie d´ecouverte et non d’une d´ecouverte illusoire; son rˆ ole est donc considerable, il n’est pourtant que secondaire. L’imagination intervient d’ailleurs encore pour d´ecouvrir les voies dans lesquelles doit s’engager la d´emonstration logique. Et celle-ci n’est acquise le plus souvent qu’apr`es quelques essais infructueux et grˆace pr´ecis´ement `a l’emploi simultan´e des id´ees qui avaient pr´esid´e `a l’´elaboration de preuves insuffisantes.“ F¨ ur Lebesgue ist also der Einfall das Entscheidende, die Sicherung des Ergebnisses durch Beweis und Logik sekund¨ar, wenn sie auch notwendig ist, wahre Entdeckung von Illusion zu scheiden. Ja selbst beim Beweisen sei h¨ aufig genug der Einfall noch vonn¨ oten. Hier t¨ ausche sich Gauß aber, wenn er nur den Beweis gelten ließe. uhrt Als weiteren Beweis f¨ ur seine These, dass f¨ ur Gauß nur der Beweis z¨ahlt, f¨
330
Kapitel XII. Geometrie lebt von der Algebra
er Gaußens Kritik an Eulers misslungenem Beweis f¨ ur die Existenz von Primitivwurzeln modulo p an, dessen Ideen er andererseits bei seinem Beweis benutzt, ohne dies zu erw¨ahnen. Das liest sich bei Lebesgue so (Lebesgue 1955, S. 219. S. auch Kap. 9, Absch. 2 f¨ ur n¨ ahere Informationen zum eulerschen Beweis.): Aussi Gauss a-t-il ´et´e doublement injuste en ne tenant jamais compte, dans ” ses Disquisitiones, du vrai moment de la d´ecouverte, et en critiquant aˆprement les d´emonstrations de ses devanciers sans dire, le plus souvent, quels sont les points de ces d´emonstrations qu’il a utilis´es. Ainsi, on ne douterait gu`ere, `a lire le no 56 que j’ai reproduit plus haut, qu’il y a des liens ´etroits entre la premi`ere d´emonstration qu’a donn´ees Gauss pour l’existence des racines primitives des nombres premiers et la d´emonstrations d’Euler que Gauss critique justement.“ Die gaußsche Notiz tr¨ agt das Datum des 22. Januars 1833, wurde also zweiunddreißig Jahre nach dem Erscheinen der Disquisitiones geschrieben. Wenn nun Gauß wirklich bei der Niederschrift der Disquisitiones von Vandermondes Arbeit nichts gewusst haben sollte, so h¨atte Gauß immer noch Gelegenheit gehabt, auf seinen Vorl¨ aufer hinzuweisen. Er hat es nicht getan. Warum haben andere ihm nicht Gerechtigkeit widerfahren lassen? Montucla, Lalande, Lacroix und Delambre, gleich ihm Mitglieder der Akademie? Sie zitieren Gauß wegen seiner Arbeit u ¨ ber die Kreisteilung, ohne Vandermonde zu erw¨ ahnen. Da war Vandermonde noch keine f¨ unf Jahre tot. Dies schreibt Lebesgue. Er f¨ uhrt dies vor allem auf Vandermondes Bescheidenheit zur¨ uck, der nicht viel Aufhebens von seiner Arbeit machte. Ferner auch darauf, dass der junge Mann im Schatten des großen Lagrange stand und dass seine Arbeit mit einiger Versp¨atung erschien, er war ja noch nicht de l’acad´emie, als er die Arbeit vortrug. Aber auch darauf, dass er offensichtlich den Wert seiner Arbeit nicht erkannte und nicht ihren Zusammenhang mit der Konstruktion des regul¨ aren Siebzehnecks sah. Diese Entdeckung machte rund dreißig Jahre sp¨ater der junge Gauß. Laut Lebesgues Zeugnis hat Kronecker die Arbeit Vandermondes sehr gelobt. Sein vages Zitat konnte ich nicht verifizieren. Waring kennt die Arbeit Vandermondes, wie aus dem Vorwort zur dritten Auflage seiner Meditationes algebraicae hervorgeht (Waring 1782, Ss. iv und xxiv). Schließen wir diesen Abschnitt mit einem Leckerbissen aus Vandermondes Arbeit (Vandermonde 1774, S. 380). Nachdem er verschiedene Relationen zwischen dritten bzw. f¨ unften Einheitswurzeln erl¨ autert hat, schreibt er: XI. Ce proced´e est uniforme, & pour un nombre premier n quelconque, r , r , r √ . . . ´etant les valeurs imaginaire de n 1, on aura toujours un syst`eme d’´equations analogue aux pr´ec´edens, en supposant les (n − 1) ´equations 1 + r + r + r + . . . = 0 r r = 1, r riv = 1, rv rvi = 1, rvii rviii = 1, &c. r r = r , riv rv = r , rvi rvii = r , &c. qui donneront toutes les autres. Ce syst`eme suffira pour ´elever sans embarras les puissances indiqu´ees, & satisfaire par cons´equent ` a l’objet qui nous occupe ici,
1. Gauß und Vandermonde
331
puisque les valeurs rigoureuses de toutes les racines de l’unit´e sont faciles a ` obtenir successivement, comme on le verra. Auch hier bringt er keinen Beweis. Bevor wir ihn bringen, sei auf den Aus√ aufig benutzt, und den Ausdruck les druck les valeurs imaginaire de n 1, den er h¨ racines de l’unit´e hingewiesen. Der letztere kommt als les diff´erentes racines de l’unit´e auf S. 385 noch einmal vor. Dies ist das fr¨ uheste Auftreten des Ausdrucks Einheitswurzel“, das ich kenne. ” Es gilt Satz 14. Es sei r ∈ C. Genau dann ist r eine (2m+1)-ste Einheitswurzel ungleich 1, wenn es r1 , . . . , r2m ∈ C gibt, so dass gilt r = r1 und 1 + r1 + r2 + . . . + r2m = 0, sowie r2i−1 r2i = 1 f¨ ur i := 1, . . . m und r2i r2i+1 = r1 f¨ ur i := 1, . . . , m − 1. Ist dies der Fall, so ist r2i−1 = ri und r2i = r2m+1−i f¨ ur i := 1, . . . , m. Beweis. Angenommen es gebe solche rj . Dann ist r2i−1 = r1i f¨ ur i := 1, . . . , m. Dies ist richtig f¨ ur i = 1. Es sei 1 ≤ i < m und die Behauptung gelte f¨ ur i. Dann ist r2i+1 = (r2i−1 r2i )r2i+1 = r2i−1 (r2i r2i+1 ) = r1i r1 = r1i+1 . Damit ist die erste Aussage bewiesen. Es folgt weiter −1 r2i = r2i−1 = r1−i
und dies impliziert wiederum 2m
0=1+
rk = 1 +
m
(r1i + r1−i ).
i:=1
k:=1
Mutipliziert man diese Gleichung mit r1m , so erh¨alt man 0 = r1m +
m
(r1m+i + r1m−i ) =
i:=1
2m
r1k .
k:=0
Wegen 2m + 1 = 0 folgt hieraus r1 = 1 und ferner, wenn man die Gleichung mit r1 − 1 multipliziert, auch noch r12m+1 = 1. Damit folgt dann schließlich, dass r2i = r12m+1−i ist. Wegen r = r1 ist r also eine von 1 verschiedene (2m + 1)-ste Einheitswurzel. Es sei umgekehrt r eine von 1 verschiedene (2m + 1)-ste Einheitswurzel. Setzt ur i := 1, . . . , m, so folgen die Gleichunman dann r2i−1 := ri und r2i := r2m+1−i f¨ gen r2i−1 r2i = 1 und r2i r2i+1 = r1 f¨ ur alle passenden i. Weil r von 1 verschieden ist, folgt schließlich auch noch die G¨ ultigkeit der Gleichung 1 + r1 + r2 + . . . + r2m = 0.
332
Kapitel XII. Geometrie lebt von der Algebra
Zum Schluss sei noch erw¨ahnt, dass Vandermonde auch einmal das Wort Al” gorithmus“ benutzt, wobei seine Bedeutung vage bleibt. Es heißt wohl nicht mehr als Rechenverfahren“ (Vandermonde 1774, S. 392). ” 2. Wantzel. In Satz 13 des letzten Abschnitts formulierten wir Gaußens hinreichende Bedingung an n f¨ ur die Konstruierbarkeit des regul¨ aren n-Ecks mit Zirkel und Lineal. Wir erw¨ ahnten ferner, dass Gauß sagte, dass diese Bedingung auch notwendig sei, dass er aber keinen Beweis dieser Tatsache gab. Diesen gab erst der junge Franzose Pierre Laurent Wantzel im Jahre 1837, der damals noch Student ´ des Ingenieurwesens an der Ecole Polytechnique war. In der gleichen Arbeit bewies er auch die Unm¨ oglichkeit der Verdoppelung des W¨ urfels mittels Zirkel und Lineal und die Unm¨ oglichkeit der Winkeldreiteilung mit den gleichen Hilfsmitteln, womit diese uralten Fragen endlich eine Antwort fanden. Dar¨ uber m¨ ochte ich hier berichten, wobei ich mich aber heutiger Hilfsmittel bediene und dann sp¨ ater n¨ aher auf die wantzelsche Arbeit eingehe (Wantzel 1837). Wiederholen wir die Definition aus Abschnitt 6 von Kapitel 6. Euklidisch heißt ein K¨ orper, dessen Quadrate einen Positivbereich bilden. Es sind also genau die K¨ orper K mit den Eigenschaften: a) Es ist −1 kein Quadrat in K. b) Ist k ∈ K, so ist k oder −k ein Quadrat in K. c) Sind k, l ∈ K, so ist k 2 + l2 ein Quadrat in K. Euklidische K¨ orper werden von anderen Autoren auch platonisch genannt, was zumindest mich verwirrt (Schreiber 1975). Der K¨ orper R der reellen Zahlen ist euklidisch. Wir werden hier den kleinsten in R enthaltenen euklidischen K¨ orper studieren, wobei es auf das W¨ ortchen kleinst“ ” nicht ankommt. Satz 1. Es sei L der K¨ orper aller u ¨ber Q algebraischen Elemente von R. Ferner sei Φ die Menge aller euklidischen Teilk¨ orper von L. Ist dann E :=
"
X,
X∈Φ
so ist E ein euklidischer K¨ orper. Beweis. Wir zeigen zun¨achst, dass L ∈ Φ ist. Sicherlich ist −1 kein Quadrat in L, weil L ja Teilk¨orper von R ist. Es sei k ∈ L. Ist k ≥ 0, so gibt es ein l ∈ R mit l2 = k. Dann ist l algebraisch u ¨ ber L und damit algebraisch u ¨ber Q. Also ist l ∈ L, so dass k Quadrat in L ist. Ist k < 0, so ist −k > 0, so dass −k nach dem gerade Bewiesenen Quadrat in L ist. Es seien schließlich k, l ∈ L. Dann ist k 2 + l2 ≥ 0. Wie gerade gesehen, gibt es ein m ∈ L mit m2 = k 2 + l2 . Damit ist L als euklidisch erkannt. Also ist L ∈ Φ und Φ folglich nicht leer. Die Definition von E bereitet also kein Kopfzerbrechen
2. Wantzel
333
Weil E Teilk¨ orper von R ist, ist −1 kein Quadrat in E. Es sei 0 < k ∈ E. Es gibt dann ein l ∈ L mit l > 0 und l2 = k. Es sei X ∈ Φ. Dann ist k ∈ X, so dass es ein m ∈ X gibt mit m > 0 und m2 = k. Es folgt m2 = l2 . Wegen l + m > 0 und (l + m)(l − m) = l2 − m2 = 0 gilt daher m = l. Also ist l ∈ X f¨ ur alle X ∈ Φ. Somit ist l ∈ E. Es seien k, l ∈ E. Es gibt dann ein m ∈ L mit m > 0 und m2 = k 2 + l2 . Wie eben folgt wieder m ∈ X f¨ ur alle X ∈ Φ und damit m ∈ E. Damit ist gezeigt, dass E euklidisch ist. Wenn man beachtet, dass der Schnitt zweier euklidischer K¨ orper euklidisch ist, sieht man auch, dass E der kleinste euklidische K¨ orper ist, der in R enthalten ist. Es ist der Raum mit dem Koordinatenk¨ orper L, den Dedekind an der zu Beginn des Abschnitts 1 von Kapitel 3 zitierten Stelle gemeint hat. Es sei angemerkt, dass sich jeder angeordnete K¨orper ordnungstreu in in einen euklidischen K¨ orper einbetten l¨ asst. Es sei n¨amlich K ein angeordneter K¨ orper. Nach Satz 7 aus Abschnitt 7 des Kapitels 11 gibt es eine reell abgeschlossene, algebraische Erweiterung L von K, deren Anordnung die von K fortsetzt. Bezeichnet man mit Φ(K) die Menge aller K umfassenden euklidischen Teilk¨orper von L, so ist " X E(K) := X∈Φ(K)
ein euklidischer K¨ orper, der K umfasst. Der Beweis dieser Aussage f¨ uhrt sich entsprechend dem Beweise des Satzes 1. — Es gibt also auch nicht-archimedisch angeordnete euklidische K¨ orper. F¨ ur das Folgende ist es bequem, den K¨orper E noch auf andere Weise zu beschreiben, wie dies im n¨ achsten Satz geschieht. Satz 2. Es sei wieder L der K¨ orper aller u ¨ber Q algebraischen Elemente von R. Ist K ein Teilk¨ orper von L, so setzen wir SK := {s | s ∈ L, s ∈ K, s2 ∈ K}. Ferner setzen wir R(K) := K[SK ]. Auf Grund des Rekursionssatzes (Kap. 2, Absch. 7) gibt es eine Folge Φ von ur alle n ∈ N0 . Dann ist Teilk¨ orpern von L mit Φ0 = Q und Φn+1 = R(Φn ) f¨ E=
∞ $ i:=0
Φn .
334
Kapitel XII. Geometrie lebt von der Algebra
Beweis. Es ist Φ0 = Q ⊆ E. Es sei Φn ⊆ E. Ist t ∈ SΦn , so gibt es ein s ∈ Φn mit t2 = s. Es folgt s > 0, so dass es ein l ∈ E gibt mit l > 0 und l2 = s. Es folgt t2 = l2 und weiter t = l ∈ E. Es folgt Φn+1 = Φn [SΦn ] ⊆ E. ur alle n und somit Also gilt Φn ⊆ E f¨ ∞ $
Φn ⊆ E.
i:=0
Weil alle Elemente von K :=
∞ $
Φn
i:=0
u ¨ ber Q algebraisch sind, ist K nicht nur ein Ring, sondern sogar ein K¨ orper. Wir zeigen, dass K euklidisch ist. Dazu gen¨ ugt es zu zeigen, dass jedes positive Element von K Quadrat in K ist. Es sei also 0 < k ∈ K. Es gibt dann ein n mit k ∈ Φn . Ist k Quadrat in Φn , so ist nichts mehr zu beweisen. Ist k kein Quadrat in Φn , uher schon gesehen, folgt, l ∈ L und so gibt es doch ein l ∈ R mit l2 = k. Wie fr¨ damit l ∈ Φn+1 ⊆ K. Also ist K euklidisch. Auf Grund der Definition von E folgt hieraus E ⊆ K. Also ist in der Tat E=K=
∞ $
Φn .
i:=0
Wir a¨ndern die Bezeichnungen von Satz 2, indem wir Sn := SΦn setzen. Es seien m, n ∈ N0 und es gelte m < n. Dann ist Sm ⊆ Φm+1 ⊆ Φn und Sn ∩ Φn = ∅. Es folgt Sm ∩ Sn = ∅ f¨ ur alle m, n ∈ N0 mit m = n. Mit E(Sn ) bezeichnen wir die Menge der endlichen Teilmengen von Sn . Dann ist $ Sn = X X∈E(Sn )
2. Wantzel
335
und Φn+1 =
$
Φn [X].
X∈E(Sn )
# Satz 3. Ist k ∈ E, so gibt es t1 , . . . , tm ∈ ∞ n:=0 Sn mit k ∈ Q[t1 , . . . , tm ]. Beweis. Es gibt ein n ∈ N0 mit k ∈ Φn+1 . Wegen $ Φn [X] Φn+1 = X∈E(Sn )
gibt es eine endliche Teilmenge X von Sn mit k ∈ Φn [X]. Weil X algebraisch u ¨ber Φn ist, ist k ein Polynom in X mit Koeffizienten in Φn . Da in diesem Polynom nur endlich viele Koeffizienten vorkommen, f¨ uhrt Induktion nach n zum Ziele. Satz 4. Ist K ⊆ E eine endliche Erweiterung von Q, so gibt es ein a ∈ N0 mit [K : Q] = 2a . Beweis. Wir zeigen zun¨achst: Sind t1 , . . . , tu ∈ Sn , ist M ein Teilk¨ orper von Φn−1 und gilt t2i ∈ M f¨ ur alle i, so ist M [t1 , . . . , tu ] : M = 2u mit u ≤ u. Es ist ja t2u ∈ M und daher M [t1 , . . . , tu ] : M [t1 , . . . , tu−1 ] ≤ 2. Wegen
M [t1 , . . . , tu ] : M = M [t1 , . . . , tu ] : M [t1 , . . . , tu−1 ] M [t1 , . . . , tu−1 ] : M ]
folgt mittels Induktion die Behauptung. Es sei nun K eine endliche Erweiterung von #nQ. Es gibt dann ein n mit K ⊆ Φn . Nach Satz 3 gibt es ferner s1 , . . . , sU in i:=1 Si (es ist wirkich ein großes U gemeint) mit K ⊆ Q[s1 , . . . , sU ]. Ist nun n = 1, so folgt mit dem gerade Bewiesenen, dass der Grad von Q[s1 , . . . , sU ] u ¨ ber Q eine Potenz von 2 ist. Der Grad von K u ¨ ber Q ist aber ein Teiler jenes Grades und folglich ebenfalls eine Potenz von 2. Es sei n > 1. Dann zerlegen wir {s1 , . . . , sU } in zwei disjunkte Teilmengen {r1 , . . . rv } und {t1 , . . . tu }, wobei die erste Teilmenge in S1 ∪ . . . ∪ Sn−1 und die zweite in Sn enthalten sei. Wir setzen M := Q[r1 , . . . , rv , t21 , . . . , t2u ].
336
Kapitel XII. Geometrie lebt von der Algebra
Dann ist M eine endliche Erweiterung von Q, die in Φn−1 enthalten ist. Nach Induktionsannahme ist daher [M : Q] Potenz von 2. Nach unserer Vorbemerkung ist M [t1 , . . . , tu ] : M Potenz von 2, so dass auch
M [t1 , . . . , tu ] : Q
Potenz von 2 ist. Nun ist aber K ⊆ Q[r1 , . . . , rv , t1 , . . . tu ] = Q[r1 , . . . , rv , t21 , . . . , t2u , t1 , . . . , tu ] = M [t1 , . . . , tu ], so dass auch [K : Q] Potenz von 2 ist. Wenden wir uns der Geometrie zu. Ziel ist, die durch E koordinatisierte affine Ebene zu kennzeichnen. Sie ist Modell einer Ebene, in der die euklidischen Postulate gelten. Die Charakterisierung zeigt gleichzeitig, dass diese Ebene in allen Ebenen enthalten ist, in denen die euklidischen Postulate gelten. Darauf werden wir aber nicht n¨ aher eingehen. Der Leser wird sich dies ohne M¨ uhe selber u ¨ berlegen k¨ onnen. Euklid postuliert in seinen Elementen, dass man mit jedem Mittelpunkt und ¨ Abstand den Kreis zeichnen kann (thaersche Ubersetzung. Den griechischen Text kenne ich nicht). Das klingt vertraut in unseren Ohren. Er benutzt dieses Postulat aber anfangs nur in der Weise, dass es die Existenz eines Kreises in dem Fall sichert, dass A der Mittelpunkt des Kreises und die Strecke AB sein Radius ist. Der euklidische Zirkel funktioniert also anders als unser Zirkel. Man sticht ihn bei A ein, offnet ihn bis B und reißt den Kreis um A mit dem Radius AB. Sobald der Zirkel ¨ vom Papier genomnen wird, klappt er zusammen. Er erinnert, sich also nicht mehr an den gerade benutzten Radius im Gegensatz zu unserem Zirkel, den wir ja auch ¨ zum Ubertragen von Strecken benutzen. Euklid kann mit seinem Zirkel aber auch Strecken u ¨bertragen, wie wir gleich sehen werden. F¨ ur die folgende Definition ist es bequem, sich des euklidischen Zirkels zu bedienen. Daher seine Erkl¨ arung hier. Um jedoch keine Missverst¨ andnisse aufkommen zu lassen, sei ausdr¨ ucklich erw¨ ahnt, dass das mit dem Wort Zirkel“ bezeichnete Ger¨ at bei Euklid nicht vorkommt. ” Wir betrachten im Folgenden die affine Ebene A u ¨ ber dem K¨ orper R der reellen Zahlen, deren Punkte durch die Paare (x, y) von reellen Zahlen gegeben sind. F¨ ur eine endliche Menge X von Punkten von A definieren wir die Menge R(X) von Punkten von A wie folgt: Ist P ein Punkt von A, so gilt genau dann P ∈ R(X), wenn P wenigstens eine der folgenden Bedingungen erf¨ ullt. 1) Es ist P ∈ X. 2) Der Punkt P ist Schnitt zweier verschiedener Geraden, die beide mindestens zwei Punkte aus X tragen.
2. Wantzel
337
3) Der Punkt P liegt im Schnitt einer Geraden, die zwei verschiedene Punkte aus X tr¨ agt, mit einem Kreis, dessen Zentrum ein Punkt von X ist und dessen Peripherie einen Punkt von X tr¨ agt. 4) Der Punkt P liegt im Schnitt zweier verschiedener Kreise, deren Zentren Punkte von X sind und deren Peripherie jeweils mindestens einen Punkt von X tr¨ agt. Da X endlich ist und durch zwei verschiedene Punkte von A genau eine Gerade geht, gibt es nur endlich viele Geraden, die mindestens zwei Punkte von X tragen. Ebenso ist ein Kreis durch sein Zentrum und einen auf seiner Peripherie liegenden Punkt eindeutig festgelegt. Also gibt es auch nur endlich viele Kreise, deren Zentrum zu X geh¨ort und die einen Punkt von X auf ihrer Peripherie tragen. Da schießlich eine Gerade einen Kreis in h¨ ochsten zwei Punkten trifft und zwei verschiedene Kreise ebenfalls h¨ochstens zwei Punkte gemeinsam haben, folgt, dass auch R(X) endlich ist. Ist nun U eine endliche Menge von Punkten von A, so gibt es nach dem dedekindschen Rekursionssatz eine Folge X von endlichen Mengen von Punkten ur alle n ∈ N0 . Wir setzen von A mit X0 = U und Xn+1 = R(Xn ) f¨ Π(U ) :=
∞ $
Xn .
n:=0
Dann ist Π(U ) die Menge der Punkte von A, die sich aus U durch Konstruktion mit dem euklidischen Zirkel und dem Lineal erreichen lassen. Diese Definition findet sich — nicht ganz so formal. Er kannte ja noch nicht den dedekindschen Rekursionssatz — in Wantzel 1837. Hier eine im Grunde selbstverst¨andliche Bemerkung. Ist Y eine endliche Teilmenge von Π(U ), so ist Π(Y ) ⊆ Π(U ). Es sei Z die Folge mit Z0 = Y und Zn+1 = R(Zn ). Weil Y endlich ist, gibt es ein n mit Y ⊆ Xn , dh., mit Z0 ⊆ Xn . Mittels Induktion folgt Zm ⊆ Rn+m und damit dann Π(Y ) =
∞ $ m:=0
Zm ⊆
∞ $
Xi = Π(U ).
i:=n
Diese Bemerkung werden wir im Folgenden stillschweigend benutzen. L¨osen wir sogleich die Aufgabe, die bei Euklid unter I.2 formuliert ist. Es seien A, B und C drei Punkte. Im Punkte A sei eine zu BC kongruente Strecke abzutragen. Ich f¨ uge hinzu: Diese Aufgabe l¨ asst sich in Π({A, B, C}) l¨ osen. Sind A und B Punkte, so bezeichnen wir mit AB den Kreis um A durch B. Man zeichne die Kreise AB und BA . Einen der beiden Schnittpunkte der beiden Kreise nenne man D. Dann ist D ∈ Π({A, B, C}). Dann zeichne man BC . Diesen Kreis bringe man mit der Verl¨ angerung von DB u ¨ ber B hinaus zum Schnitt. Der Schnittpunkt werde mit G bezeichnet. Dies ist wiederum ein Punkt von Π({A, B, C}) und es gilt BC ∼ achstes werde DG gezeichnet und mit = BG. Als N¨
338
Kapitel XII. Geometrie lebt von der Algebra
der Verl¨ angerung von DA u ¨ ber A hinaus zum Schnitt gebracht. Der Schnittpunkt heiße L. Auch L ist ein Punkt von Π({A, B, C}). Es folgt DG ∼ = DL. Außerdem
C
D A
L
B
G
ist DA ∼ = DB. Wegen DG = DB + BG und DL = DA + AL und DB ∼ = DA folgt ∼ AL = BG ∼ unschte Strecke gefunden. = BC. Damit ist in AL die gew¨ Um zu zeigen, dass W¨ urfelverdopplung und Winkeldreiteilung mit Zirkel und Lineal nicht m¨ oglich ist, gen¨ ugt es, wie gleich herauskommen wird, die Menge der Punkte Π({(0, 0), (1, 0)}) zu betrachten. Um bequem sprechen zu k¨onnen, nenne wir die Punkte dieser Menge e-Punkte. Auf Grund unserer Vorbemerkung u ¨ber den euklidschen Zirkel, d¨ urfen im Folgenden auch von Kreisen der Form Ar reden, wobei A ein e-Punkt ist und der Radius r durch irgendeine Strecke repr¨ asentiert wird, deren Endpunkte e-Punkte sind. Das wollen wir gleich ausnutzen. Ist g eine Gerade und sind P und Q zwei verschiedene e-Punkte auf g, und ist R ein weiterer e-Punkt, so tr¨ agt die Parallele h durch R zu g einen weiteren e-Punkt. Ist n¨ amlich S der Schnittpunkt von h mit der Parallelen von P R durch Q, so ist S im Schnitt der Kreise RP Q und QP R . Die Mittelsenkrechte der Strecke P Q tr¨ agt zwei e-Punkte und der Mittelpunkt von P Q ist ein e-Punkt. Die beiden Punkte im Schnitt von PQ mit QP liegen auf der Mittelsenkrechten. Ihr Schnitt mit P Q ist folglich ein e-Punkt. Ist schon bewiesen, dass (0, 0), (1, 0), . . . , (n, 0) e-Punkte sind, so steche man den Zirkel in (n, 0) ein, o¨ffne ihn bis (n − 1, 0). Ziehen des entsprechenden Kreises, das ist der Kreis mit der Gleichung (x − n)2 + y 2 = 1, liefert, dass auch (n + 1, 0) ein e-Punkt ist. Die Kreise mit Zentrum (0, 0), die durch (n, 0) gehen, liefern dann, dass auch die Punkte (−n, 0) e-Punkte sind. Der Kreis mit dem Zentrum (1, 0) durch den Punkt (−1, 0) hat die Gleichung (x − 1)2 + y 2 = 22
2. Wantzel
339
und der Kreis mit dem Zentrum (−1, 0) durch den Punkt (1, 0) hat die Gleichung (x + 1)2 + y 2 = 22 . √ √ Die beiden Kreise schneiden sich in den Punkten (0, 3) und (0, − 3). Dies sind also auch e-Punkte. Hieraus folgt, dass (0, k) genau dann ein e-Punkt ist, wenn (k, 0) ein e-Punkt ist. Dies ist wiederum genau dann der Fall, wenn (−k, 0) ein e-Punkt ist. Ferner gilt, dass (k, l) genau dann ein e-Punkt ist, wenn (k, 0) und (0, l) e-Punkte sind, denn (k, l) liegt ja auf den beiden Kreisen mit den Gleichungen (x − k)2 + y 2 = l2 , x2 + (y − l)2 = k 2 . Satz 5. Genau dann ist (k, l) ein e-Punkt, wenn k, l ∈ E ist. Beweis. Nach unseren Vorbemerkungen d¨ urfen wir annehmen, dass l = 0 ist. Wir setzen K := k | k ∈ R, (k, 0) ist e-Punkt . Wir zeigen, dass K ein euklidischer K¨ orper ist. Ist k ∈ K, so ist (k, 0) und damit (−k, 0) ein e-Punkt. Also ist −k ∈ K. Es seien k, l ∈ K. Dann sind (k, 0) und (l, 0) e-Punkte. Die L¨ ange der Strecke (0, 0)(l, 0) ist l. Der Kreis um (k, 0) mit Radius l hat die Gleichung (x − k)2 + y 2 = l2 . Auf diesem Kreis liegt der Punkt (k + l, 0). Dieser ist also ein e-Punkt, da die xAchse, ja die beiden Ausgangs-e-Punkte (0, 0) und (1, 0) tr¨ agt. Folglich ist k + l ∈ K. Damit ist K bez¨ uglich der Addition eine Untergruppe der additiven Gruppe von R. Es seien k, l ∈ K. Die Gerade durch die e-Punkte (0, 1) und (l, 0) hat die Gleichung 1 y = − x + 1. l Die Gerade mit der Gleichung 1 y = − x+k l tr¨ agt den Punkt (0, k) und ist parallel zu (0, 1)(l, 0). Der Punkt (0, k) ist wegen k ∈ K ein e-Punkt. Daher tr¨agt diese Gerade einen zweiten e-Punkt. Folglich ist ihr Schnitt mit der x-Achse ein e-Punkt. Dieser Punkt ist aber der Punkt (kl, 0). Also ist kl ∈ K.
340
Kapitel XII. Geometrie lebt von der Algebra
Es sei 0 = k ∈ K. Die Gerade durch die beiden e-Punkte (0, 1) und (k, 0) hat die Gleichung 1 y = − x + 1. k Die Parallele zu ihr durch den Punkt (1, 0) hat die Gleichung 1 1 y =− x+ . k k Diese tr¨ agt einen weiteren e-Punkt. Also ist ihr Schnittpunkt mit der y-Achse ein e-Punkt. Der Schnittpunkt ist aber (0, k1 ), so dass k −1 ∈ K ist. Damit ist gezeigt, dass K ein K¨ orper ist. Um zu zeigen, dass K euklidisch ist, gen¨ ugt es wieder zu zeigen, dass die positiven Elemente von K Quadrate sind. Dazu sei 0 < k ∈ K. Die Punkte P := (0, 0), Q := (1, 0) und R := (k + 1, 0) sind e-Punkte. Der Mittelpunkt ( k+1 2 , 0) von P R hat die ist ein e-Punkt. Der Kreis um diesen Mittelpunkt mit dem Radius k+1 2 Gleichung (A)
2 2 k+1 k+1 2 x− +y = . 2 2
Die Parallele zur Mittelsenkrechten dieser Strecke durch den e-Punkt (1, 0) tr¨ agt wieder einen zweiten e-Punkt. Daher sind die beiden Schnittpunkte dieser Geraden mit√dem Kreis mit √ der Gleichung √ (A) e-Punkte. Es sind dies aber die Punkte (1, k) und (1, − k). Also ist k ∈ K. Damit ist gezeigt, dass K ein euklidischer K¨ orper ist. Auf Grund der Definition von E folgt, dass E ⊆ K ist. Es bleibt zu zeigen, dass K ⊆ E ist. Ist P = (u, v) ein e-Punkt, so ist zu zeigen, dass u, v ∈ E ist. Es gibt eine Folge P1 , P2 , . . . , Pn von e-Punkten mit Pn = P , so dass P1 , . . . , Pi f¨ ur alle i < n eine definierende Kette f¨ ur Pi+1 ist. Ist n = 1 oder 2, so ist Pn = (0, 0) oder (1, 0), so dass hier u, v ∈ E gilt. Es sei n > 2 und die Aussage gelte f¨ ur alle entsprechenden Ketten kleinerer L¨ ange. Dann geh¨ oren die Koordinaten von P1 , . . . , Pn−1 alle zu E. Einfache Rechnungen zeigen nun, dass auf Grund der Bedingungen die Koordinaten von Pn rationale Funktionen in den Koordinaten der P1 , . . . , Pn−1 und in Quadratwurzeln aus solchen Funktionen sind. Da Quadratwurzeln aus positiven Elementen von E wieder zu E geh¨oren, sind auch die Koordinaten von Pn Elemente von E. Damit ist Satz 5 bewiesen. (Sind Quadratwurzeln aus negativen Zahlen zu ziehen, so heißt das, dass es keine Schnittpunkte in der betrachteten Ebene gibt.) Wir sind nun in der Lage zu zeigen, dass die beiden ber¨ uhmten Probleme der W¨ urfelverdopplung und der Winkeldreiteilung unl¨ osbar sind. Der Ruhm, dies gezeigt zu haben, geb¨ uhrt Pierre Laurent Wantzel. Das Werkzeug, dies zu zeigen, haben schon Andere vor ihm gehabt. Sie haben es aber nicht gesehen, so wie es auch Vandermonde entging, dass er den Schl¨ ussel zur Konstruktion des Siebzehnecks in der Hand hatte.
2. Wantzel
341
Satz 6. Ist ein W¨ urfel der Seitenl¨ ange a gegeben, so ist es nicht m¨ oglich mit dem Zirkel und Lineal alleine die Seite des W¨ urfels des Volumens 2a3 zu konstruieren. Beweis. Da alle W¨ urfel a¨hnlich sind, darf man annehmen, dass a = 1 ist. Das Polynom x3 −2 ist auf Grund des sch¨ onemannschen Irreduzibilit¨ atskriteriums bzw. seines Korollars (Kap. 7, Absch. 1) irreduzibel. Seine Nullstellen liegen also auf Grund von Satz 4 nicht in E. Also gibt es in der Geometrie u ¨ ber E keinen W¨ urfel mit dem Volumen 2. Um die entsprechende Aussage f¨ ur die Winkeldreiteilung zu beweisen, ben¨ otigen wir den folgenden Hilfssatz. ur alle Hilfssatz. Es gilt sin 3ϕ = 3 sin ϕ − 4 sin3 ϕ und cos 3ϕ = 4 cos3 ϕ − 3 cos ϕ f¨ ϕ ∈ R. Beweis. Es ist cos 3ϕ + i sin 3ϕ = ei3ϕ = (eiϕ )3 = (cos ϕ + i sin ϕ)3 = cos3 ϕ − 3 cos ϕ sin2 ϕ + i(3 cos2 ϕ sin ϕ − sin3 ϕ) Hieraus folgt sin 3ϕ = 3 cos2 ϕ sin ϕ − sin3 ϕ = 3(1 − sin2 ϕ) sin ϕ − sin3 ϕ = 3 sin ϕ − 4 sin3 ϕ und
cos 3ϕ = cos3 ϕ − 3 cos ϕ sin2 ϕ = cos3 ϕ − 3 cos ϕ(1 − cos2 ϕ = 4 cos3 ϕ − 3 cos ϕ.
Damit ist der Hilfssatz bewiesen. Wer f¨ ur diesen Hilfssatz einen Beweis sehen m¨ochte, der nur von elementargeometrischen Dingen Gebrauch macht, sei auf D¨ orrie 1950, S. 32f. verwiesen. Wir haben in Abschnitt 10 von Kapitel 1 bemerkt, dass sich die Winkel, die Vielfache von 45 sind, mittels Zirkel und Lineal konstruieren lassen. Demnach lassen sich alle Winkel mit Zirkel und Lineal dritteln, die Vielfache von 2◦ 15 sind. Es lassen sich also viele Winkel mit Zirkel und Lineal dritteln, aber eben nicht alle. Dies ist die Aussage des n¨ achsten Satzes, der, wie gesagt, auch von Wantzel stammt (Wantzel 1837). Satz 7. Es gibt Winkel, die sich nicht mit Zirkel und Lineal dritteln lassen. Beweis. Es sei ψ der Winkel, der zu dritteln sei. Seine Spitze liege im Nullpunkt und ein Schenkel falle in den positiven Teil der x-Achse. Es sei ϕ der dritte Teil des Winkels ψ. Der Schenkel von ψ der in die x-Achse f¨allt, sei auch Schenkel von ϕ. Der andere Schenkel von ϕ schneide den Einheitskreis im Punkte (x, y). Dann
342
Kapitel XII. Geometrie lebt von der Algebra
ist x = cos ϕ und y = sin ϕ. Setzt man a := sin 3ϕ und b = cos 3ϕ, so folgen auf Grund des Hilfssatzes die Gleichungen x3 −
1 3 x− b=0 4 4
und
1 3 y + a = 0. 4 4 Wantzel sagt an dieser Stelle, dass die Winkeldreiteilung von der zweiten dieser beiden Gleichungen abhinge und dass diese Gleichung irreduzibel sei, wenn sie keine Wurzel habe, die rational von a abhinge. Das tr¨afe zu, wenn a algebraisch sei. Dabei sagt er nicht, was er unter algebraisch versteht. Ist diese Gleichung aber irreduzibel, so k¨ onne der Winkel nicht mit Zirkel und Lineal zu dritteln sein, da der Grad der Gleichung keine Potenz von 2 sei. Also k¨ onne das Problem im Allgemeinen nicht l¨ osbar sein. Woher er die Gleichung dritten Grades hat, sagt er nicht. asst und Wir weisen hier nur nach, dass sich ein Winkel von 60◦ nicht dritteln l¨ benutzen dazu die erste der Gleichungen. F¨ ur diesen Winkel ist ja b = cos ψ = 12 . ¨ber dem K¨orper E vor. Nach Satz 5 Der Winkel von 60◦ kommt in der Ebene u w¨aren x und y Elemente von E. Es ist aber y3 −
1 1 3 x3 − x − · = 0. 4 4 2 Multipliziert man diese Gleichung mit 8 und ersetzt 2x durch x, so erh¨ alt man die Gleichung x3 − 3x − 1 = 0. H¨ atte diese Gleichung eine rationale L¨osung, so w¨are diese ganzrational und Teiler von 1. Aber 1 und −1 sind nicht L¨ osung dieser Gleichung. Folglich ist x3 − 3x − 1 irreduzibel u ¨ ber Q. Dann ist aber auch das Polynom x3 − 34 x − 14 · 12 irreduzibel. Mit Satz 4 folgte dann aber der Widerspruch x ∈ E. Wantzel untersucht in seiner Arbeit Aufgaben, bei denen man ausgehend von einer Ausgangskonstellation — unsere Punktmenge U — durch Konstruktionen, wie sie unter 1), 2), 3) und 4) beschrieben sind, zur L¨ osung des Problems gelangt. Die Ausgangskonstellation ist durch gewisse Gr¨ oßen p, q, r, . . . gegeben, die wir Parameter nennen wollen. Die weiteren Schritte zur L¨ osung f¨ uhren auf quadratische Gleichungen der folgenden Art: x21 + Ax1 + B = 0, x22 + A1 x2 + B1 = 0, . . . , xn + An−1 x + Bn−1 = 0, wobei A und B rationale Funktionen in den Parametern p, q, r, . . . und Ai und Bi rationale Funktionen in den Parametern p, q, r, . . . und den Wurzeln x1 , . . . , xi sind. Er nimmt an, dass n minimal sei.
2. Wantzel
343
Die beiden L¨ osungen f¨ ur xn−1 der vorletzten Gleichung liefern zwei Gleichungen zweiten Grades f¨ ur xn . Multipliziert man die linken Seiten dieser beiden Gleichungen miteinander, so erh¨ alt man ein Polynom vierten Grades in xn , das in den beiden Nullstellen von x2 +An−2 x+Bn−2 symmetrisch ist. Also sind die Koeffizienten dieses Polynoms vierten Grades rationale Funktionen in den Parametern p, q, r, . . . und den Wurzeln x1 , x2 , . . . , xn−2 . Spielt man dieses Spiel nun mit der gerade gewonnen Gleichung vierten Grades f¨ ur xn und der quadratischen Gleichung f¨ ur xn−2 , so erh¨alt man eine Gleichung achten Grades f¨ ur xn , deren Koeffizienten rationale Funktionen in den Parametern p, q, r, . . . und den Wurzeln x1 , . . . , xn−3 sind. So fortfahrend erh¨ alt man schließlich eine Gleichung des Grades 2n f¨ ur xn , deren Koeffizienten rationale Funktionen in den Parametern p, q, r, . . . sind. Die Minimalit¨ at von n erzwingt, dass diese Gleichung irreduzibel ist, wobei dies nat¨ urlich heißt, dass das Polynom, das die linke Seite der Gleichung repr¨ asentiert, u ¨ ber Q[p, q, r, . . .] irreduzibel ist. Damit haben wir den Anschluss an das gewonnen, was wir zuvor in heutiger Sprache gemacht haben, insbesondere an Satz 4. Was nun die Kreisteilung anbelangt, so bemerkt Wantzel, dass die von Gauß angegebenen hinreichenden Bedingungen f¨ ur die Konstruierbarkeit des pn -Ecks auch notwendig seien. Dies folge aus der Irreduzibilit¨ at der Gleichung Φpn , die sich ¨ mit leichten Anderungen so bewies, wie Gauß die Irreduzibilit¨ at von Φp in seinen Disquisitiones arithmeticae etablierte. Ist dann aber das pn -Eck konstruierbar, so ist (p − 1)pn−1 eine Potenz von 2, so dass entweder p = 2 ist oder aber n = 1 und p = 2t + 1. Hier erheben sich wiederum zahlentheoretische Fragen, die man unter dem Stichwort fermatsche Primzahlen“ in B¨ uchern zur Zahlentheorie behandelt ” findet. Was die Irreduzibilit¨ at von Φpn anbelangt, so sei zum Abschluss dieses Abschnitts noch gezeigt, dass die gaußschen Methoden (Gauß 1801) tats¨ achlich ausreichen, auch die Irreduzibilit¨ at dieses Kreisteilungspolynoms zu beweisen. Es sei p eine ungerade Primzahl und n eine nat¨ urliche Zahl. Wir zeigen, dass Φpn irreduzibel ist. Dazu nehmen wir an, dass Φpn = P Q sei mit Polynomen P und Q u ¨ ber Q, deren Leitkoeffizienten gleich 1 seien. Auf Grund des gaußschen Lemmas sind P und Q dann sogar Polynome u ¨ber Z. Es sei P = xλ + Axλ−1 + . . . + Kx + L. Es sei ferner U die Menge der Nullstellen von P und V die Menge der Nullstellen von Q. Ist Ω die Menge der Nullstellen von Φpn , so ist Ω = U ∪ V und U ∩ V = ∅. ur alle von 1 verschiedenen pn -ten EinheitsWir beachten, dass ζ = ζ −1 ist f¨ wurzeln, da p ja ungerade ist. Es sei X := {ζ −1 | ζ ∈ U } und Y := {ζ −1 | ζ ∈ V }. Dann ist auch Ω = X ∪ Y und X ∩ Y = ∅. Wir setzen ferner (x − ζ) R := ζ∈X
344
Kapitel XII. Geometrie lebt von der Algebra
und S :=
(x − ζ).
ζ∈Y
Wir nehmen an, dass U ∩ X = ∅ = V ∩ Y ist. Dann ist X = X ∩ Ω = X ∩ (U ∪ V ) = (X ∩ U ) ∪ (X ∩ V ) = X ∩ V. Es folgt X ⊆ V . Andererseits ist V = V ∩ Ω = V ∩ (X ∪ Y ) = (V ∩ X) ∪ (V ∩ Y ) = V ∩ X, so dass auch V ⊆ X gilt. Also ist V = X. Hieraus folgt wiederum Q=
(x − ζ) =
ζ∈V
(x − ζ) =
ζ∈X
(x − ζ −1 )
ζ∈U
1 K A = xλ + xλ−1 + . . . + x + . L L L Die Koeffizienten von Q sind aber allesamt ganz. Daher ist L = 1 oder L = −1. n−1 Wegen Φpn = Φp (xp ) (Kap. 9, Kor. 2 von Satz 8) folgt A 1 K p = Φpn (1) = (1 + A + . . . + K + L) 1 + + ...+ + L L L und weiter pL = (1 + A + . . . + K + L)2 . Dies impliziert, dass L also gleich 1 und dass die Primzahl p ein Quadrat ist. Dieser Widerspruch zeigt, dass U ∩ X = ∅ oder dass V ∩ Y = ∅ ist. Wegen der Symmetrie in P und Q d¨ urfen wir annehmen, dass U ∩ X = ∅ ist. Ist η ∈ U ∩ X, so gibt es wegen η ∈ X ein ζ ∈ U mit ζ −1 = η. Wegen η ∈ U folgt ζ = η −1 ∈ X, so dass ζ ∈ U ∩ X ist. Setzt man nun T :=
(x − η),
η∈U∩X
so ist T der gr¨ oßte gemeinsame Teiler von P und R. Da der Leitkoeffizient von T gleich 1 ist, sind die Koeffizienten von T ganze Zahlen, wie wir wissen. Wir k¨ onnen also U durch U ∩ X und P durch T ersetzen, dh., wir k¨ onnen des Weiteren annehmen, dass U = X ist. Den weiteren Argumenten Gaußens konnte ich an einer Stelle nicht folgen, womit ich nichts u ¨ ber ihre Korrektheit gesagt haben m¨ ochte. Ich habe seine Argumentationskette also ein wenig abgewandelt. Methodisch ist aber nichts hinzugekommen. Das Wort Gruppe“ l¨ asst sich vermeiden. ”
2. Wantzel
345
Wir nehmen an, dass λ minimal ist bez¨ uglich der Eigenschaft U = X und dass λ < ϕ(pn ) ist. Dann ist insbesondere U = Ω. Es gibt also ein ζ ∈ U und eine zu pn teilerfremde Zahl e, so dass ζ e ∈ U ist. Das durch P :=
(x − η e )
η∈U
definierte Polynom P ist also verschieden von P . Da die Koeffizienten von P symmetrische Funktionen der Nullstellen von P sind, sind die Koeffizienten von P Polynome in den elementarsymmetrischen Funktionen der Nullstellen von P , ¨ber Z. also Polynome in den Koeffizienten von P . Daher ist auch P ein Polynom u Es sei Φpn = P Q . Dann ist auch Q ein Polynom u ¨ber Z. Dieses Polynom hat aber eine Nullstelle mit P gemein. Es sei M die Menge der gemeinsamen Nullstellen von P und Q . Dann ist G := (x − κ) κ∈M
gr¨ oßter gemeinsame Teiler von P und Q . Sein Leitkoeffizient ist 1. Also ist auch G ein Polynom u ¨ber Z. Es sei κ ∈ M . Dann ist einmal κ ∈ U und dann auch κ−1 ∈ U . Zum Andern gibt es ein η ∈ U mit η e = κ. Dann ist auch η −1 ∈ U und folglich κ−1 = η −e eine Nullstelle von Q . Folglich ist auch κ−1 ∈ M . Wegen der Minimalit¨ at von λ folgt hieraus, dass G = P , das heißt, dass P Teiler von Q ist. Anders formuliert: Ist η ∈ U , ist e nicht durch p teilbar und ist η e ∈ U , so ist U = {ζ e | ζ ∈ U }. Dies hat zur Folge, dass die Menge der nicht durch p teilbaren primen Reste e modulo pn , f¨ ur die η e ∈ U gilt, eine Untergruppe A der Ordnung λ in der Einheitengruppe E von Z/pn Z beschreiben. (Die Elemente von A sind die e+pn Z.) Es sei e1 = 1, . . . , eμ ein Vertretersystem von E/A. Dann ist λμ = ϕ(pn ). Wir setzen Pi := (x − ζ ei ) ζ∈U
f¨ ur i := 1, . . . , μ. Dann ist P1 = P und Φpn =
μ
Pi .
i:=1
Die Koeffizienten von Pi sind symmetrische Polynome in den Elementen von U . Daher sind sie Polynome in den elementarsymmetrischen Funktionen in diesen Elemente. Diese elementarsymmetrischen Funktionen sind aber die Koeffizienten ¨ ber Z. von P , liegen also alle in Z. Somit sind die Pi allesamt Polynome u Es sei ζ eine Nullstelle von Pi . Es gibt dann ein η ∈ U mit η ei . Es folgt η −1 ∈ U . Daher ist auch ζ −1 = η −ei eine Nullstelle von Pi . Die Nullstellen von Pi treten
346
Kapitel XII. Geometrie lebt von der Algebra
¨ ber R in also in Paaren auf, so dass λ gerade ist. Ferner folgt hieraus, dass Pi u Faktoren der Form
λ 2
x2 − 2x cos ω + 1 = (x − cos ω)2 + sin2 ω zerf¨allt. Dies zeigt, dass Pi (r) > 0 ist f¨ ur alle r ∈ R. Insbesondere ist Pi (1) daher eine nat¨ urliche Zahl. n−1 Es ist Φpn = Φp (xp ). Daher ist p = Φp (1) = Φpn (1) =
μ
Pi (1).
i:=1
Weil Pi (1) eine nat¨ urliche Zahl ist, ist also Pi (1) gleich 1 oder gleich p und Letzteres kommt f¨ ur wenigstens ein i auch vor. Wir d¨ urfen daher annehmen, dass P1 (1) = p ist. Nun ist (1 − ζ ei ) Pi (1) = ζ∈U
=
(1 − ζ)(1 + ζ + . . . + ζ ei −1 )
ζ∈U
= P1 (1) =p
(1 + ζ + . . . + ζ ei −1 )
ζ∈U
(1 + ζ + . . . + ζ ei −1 ).
ζ∈U
Nun ist aber
(1 + ζ + . . . + ζ ei −1 )
ζ∈U
wieder ein symmetrisches Polynom in den Nullstellen von P1 und folglich ein Polynom in den Koeffizienten von P1 . Somit ist diese Produkt eine ganze Zahl, so dass ur alle i. Es folgt p Teiler von Pi (1) ist. Daher ist Pi (1) = p f¨ p = pμ , so dass μ = 1 und damit doch λ = ϕ(pn ) ist. Dieser Widerspruch zeigt, dass Φpn irreduzibel ist. 3. Pythagoreische K¨ orper. Hilbert untersuchte in seiner Schrift Grundlagen ” der Geometrie“ (Hilbert 1899) Teilbereiche der euklidischen Ebene u ¨ ber den reellen Zahlen, in denen Konstruktionen mit Lineal und Strecken¨ ubertrager, bzw. mit Zirkel und Lineal unbeschr¨ ankt ausf¨ uhrbar sind. Den zweiten Fall haben wir im letzten Abschnitt ausf¨ uhrlich untersucht. Von dem ersten Fall werden wir
3. Pythagoreische K¨ orper
347
hier diskutieren, was algebraisch dabei herauskommt, n¨ amlich, dass der Koordinatenk¨ orper einer solchen Geometrie pythagoreisch ist. Solche K¨orper sind nicht immer euklidisch, woher unser Interesse an solchen K¨ orpern r¨ uhrt, da wir ja an der Feinstruktur von R interessiert sind. Koordinatenbereiche geben also Auskunft dar¨ uber, ob man geometrische Probleme durch Konstruktionen mit Zirkel und Lineal oder mit Lineal und Streckenu ¨ bertrager ausf¨ uhren kann. Auf das gleiche Ph¨ anomen wird man gef¨ uhrt, wenn man in papposschen affinen Ebenen mit einer von 2 verschiedenen Charakteristik die Frage nach der Existenz von Winkelhalbierenden stellt. Es gibt sie genau dann f¨ ur alle Paare von sich schneidenen Geraden, wenn der Koordinatenk¨ orper pythagoreisch ist (L¨ uneburg 1999, S. 144). Definiert man in einer papposschen projektiven Ebene mit von 2 verschiedener Charakteristik ¨außere Punkte eines Kegelschnittes als solche Punkte, durch die zwei Tangenten an den Kegelschnitt gehen und nennt man einen Punkt inneren Punkt, wenn alle Geraden durch ihn Sekanten sind, so ist genau dann jeder von einem ¨außeren Punkt verschiedene Punkt, der nicht auf dem Kegelschnitt liegt, ein innerer Punkt, wenn der Koordinatenk¨ orper euklidisch ist (L¨ uneburg 1999, S. 153). Euklidische K¨ orper sind stets auch pythagoreisch. Wir wollen hier zeigen, dass jedoch schon der einfachste pythagoreische K¨orper nicht euklidisch ist. Das Beispiel steht in Hilberts Grundlagen“. ” Wiederholen wir die Definition des pythagoreischen K¨ orpers aus Abschnitt 6 von Kapitel 6. Pythagoreisch heißt ein K¨ orper, der die folgenden Bedingungen erf¨ ullt a) Es ist −1 kein Quadrat in K. b) Sind k, l ∈ K, so ist k 2 + l2 ein Quadrat in K. Pythagoreische K¨orper lassen sich anordnen. Mittels b) folgt ja, dass −1 nicht Summe von Quadraten ist, so dass jeder pythagoreische K¨ orper formal reell ist. Als solcher l¨asst er sich aber anordnen, wie wir wissen (hier steht das Auswahlaxiom im Hintergrund). Der pythagoreische K¨ orper, den Hilbert betrachtete, ist Teilk¨ orper von R, so dass er von daher schon eine Anordnung tr¨ agt. Im Gegensatz zu Satz 1 des letzten Abschnitts und der Abwechslung und der Rechtfertigung des Plurals im Titel dieses Abschnitts halber formulieren wir den n¨ achsten Satz in voller Allgemeinheit. Satz 1. Es sei K ein angeordneter K¨ orper und < sei eine Anordnung von K. Ferner sei L der u ¨ber K algebraische, reell abgeschlossene K¨ orper, dessen Anordnung die Anordnung < von K fortsetzt (Kap. 11, Absch. 6, Satz 7). Schließlich sei Φ(K) die Menge aller pythagoreischen Teilk¨ orper von L, die K umfassen. Dann ist " X Ω(K) := X∈Φ(K)
ein pythagoreischer Teilk¨ orper von L.
348
Kapitel XII. Geometrie lebt von der Algebra
Beweis. Weil L reell abgeschlossen ist, ist −1 kein Quadrat in L und, weil Ω(K) Teilk¨ orper von L ist, auch nicht in Ω(K). Es seien k, l ∈ L. Weil L reell abgeschlosssen ist, bilden die Quadrate von L einen Positivbereich. Es gibt also ein m ∈ L mit m2 = k 2 + l2 . Folglich ist L ∈ Φ(K), so dass Φ(K) nicht leer ist. Es seien k, l ∈ Ω(K). Wegen L ∈ Φ(K) gibt es ein m ∈ L mit m2 = k 2 + l 2 . urfen wir annehmen, dass m > 0 ist. Wegen (−m)2 = m2 d¨ Es sei X ∈ Φ(K). Wegen k, l ∈ Ω(K) ⊆ X gibt es ein n ∈ X mit n > 0 und n2 = k 2 + l2 . Es folgt m2 = n2 und weiter (m − n)(m + n) = 0. Wegen m, n > 0 folgt m + n > 0 und damit schließlich m − n = 0, so dass m = n ∈ X ist. Somit ist m∈
"
X = Ω(K),
X∈Φ(K)
so dass Ω(K) pythagoreisch ist, wie behauptet. Hilbert konstruiert den K¨ orper Ω(Q) in Abschnitt 9 seiner Schrift. Dabei bedient er sich nicht der H¨ ullenbildung wie wir, sondern konstruiert ihn extensional. Diese Konstruktion imitieren wir im n¨ achsten Satz. Satz 2. Es sei K ein angeordneter K¨ orper und L sei der die Anordnung von K fortsetzende, u ¨ber K algebraische, reell abgeschlossene K¨ orper. Ist A ein Teilk¨ orper von L, der K enth¨ alt, so setzen wir SA := {s | s = a2 + b2 mit a, b ∈ A, aber s kein Quadrat in A}. Ferner setzen wir ur ein s ∈ SA } TA := {t | 0 < t ∈ L mit t2 = s f¨ und R(A) := A[TA ]. Auf Grund des Rekursionssatzes gibt es eine Folge Φ von Teilk¨ orpern von L mit Φ0 = K und Φn+1 = R(Φn ) f¨ ur alle n ∈ N0 . Dann ist Ω(K) =
∞ $ i:=0
Φn .
3. Pythagoreische K¨ orper
349
Beweis. Es ist Φ0 = K ⊆ Ω(K). Es sei Φn ⊆ Ω(K). Ist t ∈ TΦn , so gibt es k, l ∈ Φn mit t2 = k 2 +l2 . Es gibt aber auch ein a ∈ Ω(K) mit a > 0 und a2 = k 2 +l2 . Es folgt t = a ∈ Ω. Also ist TΦn ⊆ Ω(K) und daher auch Φn+1 ⊆ Ω(K). Daher ist ∞ $
Φn ⊆ Ω(K).
i:=0
Wegen Φn ⊆ Φn+1 ist
∞ $
Φn
i:=0
#∞ ein K¨ orper. Sind k, l ∈ i:=0 Φn , so gibt es ein n mit k, l ∈ Φn . Ist k 2 + l2 kein Quadrat in Φn , so gibt es ein t ∈ Φn+1 mit t2 = k 2 + l2 . Also ist ∞ $
Φn
i:=0
pythagoreisch. Es folgt Ω(K) ⊆
#∞ i:=0
Φn . Damit ist alles bewiesen.
Wir a¨ndern die Bezeichnungen von Satz 2, indem wir Tn := TΦn setzen. Mit E(Tn ) bezeichnen wir die Menge der endlichen Teilmengen von Tn . Dann ist $ Tn = X X∈E(Tn )
und Φn+1 =
$
Φn [X].
X∈E(Tn )
Satz #3. Es sei K ein angeordneter K¨ orper. Ist k ∈ Ω(K), so gibt es t1 , . . . , ∞ tm ∈ n:=0 Tn mit k ∈ K[t1 , . . . , tm ]. Beweis. Es gibt ein n ∈ N0 mit k ∈ Φn+1 . Wegen Φn+1 =
$
Φn [X]
X∈E(Tn )
¨ber gibt es eine endliche Teilmenge X von Tn mit k ∈ Φn [X]. Weil X algebraisch u Φn ist, ist k ein Polynom in X mit Koeffizienten in Φn . Da in diesem Polynom nur endlich viele Koeffizienten vorkommen, f¨ uhrt Induktion nach n zum Ziele. Es geht nun darum, K¨ orpererweiterungen der Form K[t] mit t2 = k 2 + l2 und k, l ∈ K zu untersuchen. Zun¨ achst jedoch beweisen wir
350
Kapitel XII. Geometrie lebt von der Algebra
Satz 4. Es sei K ein angeordneter, kommutativer orper. Es sei 0 < d ∈ K √ K¨ d genau dann eine Summe von kein Quadrat in √ K. Sind a, b ∈ K, so ist a + b √ √ Quadraten in K[ d], wenn a − b d eine Summe von Quadraten in K[ d] ist. √ √ t Beweis. Es sei a + b d = i:=1 (ui + vi d)2 . Dann ist t t √ √ (u2i + vi2 d) + 2 ui vi d. a+b d= i:=1
Weil 1 und
i:=1
√ du ¨ ber K linear unabh¨ angig sind, ist a=
t
(u2i + vi2 d),
i:=1 t
b=2
ui vi .
i:=1
Also ist t t t √ √ √ a−b d = (u2i + vi2 d) − 2 ui vi d. = (ui − vi d)2 . i:=1
i:=1
i:=1
Ersetzt man in diesem Argument b durch −b, so erh¨ alt man auch die Umkehrung. Satz 5. Es seien K0 ⊆ K1 ⊆ . . . ⊆ Kn K¨ orper. Ferner seien t1 ∈ K1 , . . . , tn ∈ Kn und a1 , b1 ∈ K0 , . . . , an , bn ∈ Kn−1 und es gelte ur i := 1, . . . , n, a) t2i = a2i + b2i f¨ ur i := 1, . . . , n. b) Ki = Ki−1 [ti ] f¨ Ist dann s ∈ K0 Summe von Quadraten in Kn , so ist s Summe von Quadraten in K0 . Beweis. Der Satz gilt mangels Masse f¨ ur n = 0. Es sei n > 0 und der Satz gelte f¨ ur n − 1. Nach Voraussetzung gibt es kj ∈ Kn mit s=
N
kj2 .
j:=1
Ist Kn = Kn−1 , so sind wir fertig auf Grund der Induktionsannahme. Es sei also Kn = Kn−1 . Dann sind 1 und tn u ¨ ber Kn−1 linear unabh¨ angig. Es gibt uj , ur alle j. Hiermit folgt vj ∈ Kn−1 mit kj = uj + vj tn f¨ s = s + 0tn =
N j:=1
(uj + vj tn )2 =
N j:=1
(u2j + vj2 t2n ) + 2
N j:=1
uj vj tn .
4. Reine Gleichungen
351
¨ ber Kn−1 linear unabh¨ angig sind, folgt zusammen mit a) Weil 1 und tn u s=
N j:=1
(u2j + vj2 t2n ) =
N 2 uj + vj2 (a2n + b2n ) . j:=1
Dies zeigt, dass s eine Summe von Quadraten in Kn−1 ist, so dass Induktion zum Ziele f¨ uhrt. Der n¨ achste Satz stammt von Hilbert (Hilbert 1899, § 37). Um ihn zu beweisen, sagt er, dass es leicht zu sehen sei, dass die algebraischen Konjugierten eines Elementes aus Ω(Q) allesamt zu Ω(Q) geh¨oren. In der bislang in diesem Buch bereit gestellten Terminologie heißt das, dass die Nullstellen des Minimalpolynoms u ¨ber Q eines Elementes aus Ω(Q) allesamt in Ω(Q) liegen. Dann schließt er weiter mit √ der Zahl −1 + 2, die zu Ω(Q) und E geh¨ort, so dass auch √ √ −2 + 2 2 = 12 + 12 −1 + 2 √ √ zu E geh¨ort. Ihre Konjugierte −2 − 2 2 ist aber nicht reell, so dass −2 + 2 2 nicht zu Ω(Q) geh¨ ort. Der hier beschrittene Weg, diesen Satz von Hilbert zu beweisen, folgt im Wesentlichen dem Weg, wie er in Martin 1998, Ss. 88–92 gegangen wird. Satz 6. Ist Ω(Q) der oben definierte pythagoreische und E der in Abschnitt 2 definierte euklidische K¨ orper, so ist Ω(Q) = E. √ √ 2 −1 + 2 ∈ Beweis. Es ist 2 = 1 + 12 und daher 2 ∈ Ω(Q). Dann ist aber auch √ √ Ω(Q) ⊆ E. Es folgt −1 + 2 ∈ E. Angenommen es w¨are −1 + 2 ∈ Ω(Q). #∞ Nach Satz 3 gibt es dann t1 , . . . , tm ∈ n:=0 Tn mit √ −1 + 2 ∈ Q[t1 , . . . , tm ]. √ √ Wir setzen A := Q[ 2] und B := A[t √ 1 , . . . , tm ]. Dann ist −1 + 2 ein Quadrat √ in B. Auf Grund von Satz 5 ist −1 +√ 2 eine Summe von Quadraten in A = Q[ 2]. √ Nach Satz 5 ist dann auch −1√− 2 eine Summe von Quadraten in Q[ 5]. Das aber kann nicht sein, da −1 − 2 < 0 ist. 4. Reine Gleichungen. Nach diesem geometrisch-algebraischen Intermezzo wenden wir uns wieder der Algebra zu. Lagrange hat sich vergeblich bem¨ uht, zu entscheiden, ob es stets m¨ oglich ist, eine algebraische Gleichung mittels Radikale zu l¨ osen, wie das bei Gleichungen des zweiten, dritten und vierten Grades m¨ oglich ist. Bevor nun Abel und Galois zeigten, dass dies nicht immer geht, haben Gauß und Vandermonde klar gemacht, dass dies zumindest f¨ ur die Kreisteilungsgleiachsten beiden chungen Φn = 0 zu bejahen ist. Dass dies richtig ist, soll in den n¨ Abschnitten gezeigt werden. Dabei kommt es mir darauf an, m¨ oglichst nahe bei
352
Kapitel XII. Geometrie lebt von der Algebra
den Methoden zu bleiben, die schon Gauß zur Verf¨ ugung standen. Die Sprache, die ich benutze, ist die heutige. Was sachlich u ¨ ber das hinaus geht, was zu Gaußens Zeiten bekannt war, ist die Irreduzibilit¨ at der Kreisteilungspolynome, die erst von Kronecker bewiesen wurde. Die hier vorgetragenen S¨ atze sind auch f¨ ur sich gesehen sehr interessant, so dass ihnen ein eigener Abschnitt gewidmet ist. Ich fand sie in Haupts Algebrabuch (Haupt 1929, Teil 1, S. 309ff.). Er gibt nur f¨ ur Satz 2 einen Autor, der ebenfalls den Urheber von Satz 1 und seinem Korollar verschweigt. Dedekind hat den Satz 3 und damit Satz 1 schon Mitte des 19. Jahrhunderts gekannt, wie aus Dedekind 1981, Satz I, S. 98 hervorgeht. Ob dieser Satz aber vor 1900 schon publiziert wurde, weiß ich nicht. Satz 1. Es sei p eine Primzahl und K sei ein K¨ orper der Charakteristik 0, der eine primitive p-te Einheitswurzel enthalte. Ist a ∈ K, so ist xp − a genau dann reduzibel u ¨ber K, wenn xp − a eine Nullstelle in K hat. Beweis. Hat xp − a eine Nullstelle in K, so ist xp − a nat¨ urlich reduzibel. Es sei umgekehrt xp − a reduzibel u ¨ ber K. Ferner sei u eine Nullstelle von xp − a in einem geeigneten Erweiterungsk¨orper und μ sei das Minimalpolynom von u u ¨ ber K. Weil μ irreduzibel ist, ist μ Teiler von xp − a und der Grad t von μ ist kleiner als p. Es sei η eine nach Voraussetzung existierende primitive p-te Einheitswurzel in K. Dann sind uη i mit i := 0, . . . , p − 1 die s¨amtlichen Wurzeln von xp − a. Weil μ Teiler von xp − a ist, gibt es nicht-negative ganze Zahlen s1 , . . . , st mit μ=
t
(x − uη si ).
i:=1
t Es folgt i:=1 uη si ∈ K. Wegen η ∈ K folgt weiter ut ∈ K. Weil t kleiner als p ist, sind t und p teilerfremd. Es gibt also ganze Zahlen c und d mit 1 = tc + pd. Hieraus folgt u = utc+pd = utc upd = (ut )c ad ∈ K. Damit ist der Satz bewiesen. Da u beim Beweise von Satz 1 eine beliebige Wurzel von xp − a war, gilt auch das folgende Korollar. ¨ber K, Korollar. Die Voraussetzungen seien wie in Satz 1. Ist xp − a reduzibel u so zerf¨ allt xp − a u ¨ber K in Linearfaktoren. Der n¨ achste Satz, von dem Satz 1 ein Spezialfall ist, findet sich in Wendt 1900. Satz 2. Es sei n eine nat¨ urliche Zahl und K sei ein K¨ orper der Charakteristik 0, der eine primitive n-te Einheitswurzel η enthalte. Ist 0 = a ∈ K, so ist xn − a genau dann reduzibel, falls eine der folgenden Bedingungen gilt: orper von K, so gibt es a) Ist u Nullstelle von xn − a in einem Erweiterungsk¨ ein k ∈ K und ein Polynom F ∈ Q[x] mit u = kF (η).
4. Reine Gleichungen
353
b) Es gibt einen von 1 und n verschiedenen Teiler t von n, so dass das Polynom xt − a reduzibel ist. Beweis. Gilt a), so liegen alle Nullstellen von xn − a in K, so dass xn − a u ¨ ber K in Linearfaktoren zerf¨ allt, also reduzibel ist. Gilt b) und ist n = mt, so folgt aus xn − a = (xm )t − a, dass auch xn − a reduzibel ist, wenn xt − a reduzibel ist. Es sei umgekehrt xn − a reduzibel u ¨ ber K und es sei u eine Nullstelle von xn − a in einer geeigneten Erweiterung von K. Dann ist n
xn − a =
(x − uη i ).
i:=1
Es sei c ein u ¨ ber K irreduzibles Polynom, welches xn − a teilt und r sei der Grad von c. Dann ist 1 ≤ r < n. Weil c Teiler von xn − a ist, ist c=
r
(x − uη si )
i:=1
mit geeigneten ganzen Zahlen si . Es sei c = xr +
r
(−1)i ci xr−i .
i:=1
Wegen a = 0 ist cr = 0. Es seien ci1 , . . . , cil mit i1 < i2 < . . . < il genau die von null verschiedenen unter den ci . Dann ist il = r. Schließlich sei d := ggT(n, i1 , . . . , il ). Wegen il = r ist d Teiler von r. Es gelte n = td und r = sd. Da d gemeinsamer Teiler der ij ist, gilt c = xr + bd xr−d + . . . + b(s−1)d xr−(s−1)d + (−1)r ar . Dabei stimmen die bjd bis ggf. auf die Vorzeichen mit den von null verschiedenen aij , u ¨ berein. Dieses Polynom c ist dann wiederum ein Polynom f in xd , weil d ja Teiler von r ist. Wegen n = td ist xn − a = (xd )t − a ebenfalls ein Polynom in xd . Weil c Teiler von xn − a ist gibt es ein Polynom g mit (xd )t − a = xn − a = cg = f (xd )g. Hieraus folgt, dass es ein Polynom h gibt mit g = h(xd ). Es folgt xt − a = f h.
354
Kapitel XII. Geometrie lebt von der Algebra
Koeffizientenvergleich in den zwei verschiedenen Darstellungen f¨ ur c liefert die Existenz von Polynomen Fi ∈ Q[x] mit ci = ui Fi (η) f¨ ur i := 1, . . . , r. F¨ ur die ciλ folgt uiλ = ciλ Giλ (η) mit Giλ ∈ Q[x], da ja Q(η) eine endliche Erweiterung von Q, also Q(η) = Q[η] ist. Wegen d = ggT(n, i1 , . . . , il ) gibt es ganze Zahlen y, v1 , . . . , vl mit d = yn + v1 i1 + . . . + vl r. Es folgt ud = uyn uv1 i1 · · · uvs r F (η) = ay cvi11 · · · cvrl F (η) mit F ∈ Q[x]. Setze k := ay cvi11 · · · cvrl . Dann ist k ∈ K. Ist nun d = 1, so ist u = kF (η) mit k ∈ K und F ∈ Q[x]. Ist d > 1, so ist d als Teiler von r kleiner als n, da ja r kleiner als n ist. Also ist auch t von 1 und n verschieden. Wie oben gesehen ist xt − a = f h und f ist ein Polynom von Grade s, wobei r = sd ist. Also ist s ≥ 1. Andererseits ist t = s + Grad(h). Nun ist sd = r < n = td und folglich s < t. Also ist Grad(h) ≥ 1. Folglich ist f g = xt − a eine nicht triviale Faktorisierung von xt − a. Damit ist alles bewiesen. Satz 3. Es sei K ein K¨ orper der Charakteristik 0, der eine primitive n-te Einheitswurzel enthalte. Ist a ∈ K, so gibt es b1 , . . . , bs ∈ K und ein t ∈ N mit n = st und s xn − a = (xt − bi ), i:=1
wobei alle xt − bi irreduzibel sind. Beweis. Ist xn − a irreduzibel, so ist nichts zu beweisen. Ist xn − a reduzibel, so zerf¨allt xn − a nach Satz 2 entweder u ¨ ber K in Linearfaktoren oder es gibt einen Teiler t von n, der von 1 und n verschieden ist, so dass xt − a reduzibel ist. Im uglich ersten Fall ist nichts mehr zu beweisen. Im zweiten Fall sei t1 minimal bez¨ der beiden fraglichen Eigenschaften. Es sei n = s1 t1 . Dann ist η s1 eine primitive at von t1 zerf¨allt xt1 − a nach Satz 2 t1 -te Einheitswurzel. Wegen der Minimalit¨ u ¨ ber K in Linearfaktoren. Es gibt also b1 , . . . , bt1 ∈ K mit xt1 − a =
t1 i:=1
(x − bi ).
5. Die Kreisteilungsgleichung
355
Dabei d¨ urfen wir annehmen, dass die bi so nummeriert sind, dass bi = b1 η s1 i ist. Es folgt t1 xn − a = (xs1 )t1 − a = (xs1 − bi ). i:=1
Ist eines der xs1 − bi irreduzibel, so sind sie alle irreduzibel. Ist etwa xs1 − b1 reduzibel, so liefert Induktion einen Teiler t von s1 und Elemente e1 , . . . , es ∈ K mit s (xt − ei ), xs1 − b1 = i:=1
so dass x − ei f¨ ur alle i irreduzibel ist. Als Teiler von s1 ist t auch Teiler von n. Es sei n = st. Dann ist η t eine primitive s-te Einheitswurzel. Es folgt t
xn − a =
s−1
(xt − e1 η ti ),
i:=0
wobei mit xt − e1 auch alle u ¨ brigen Faktoren irreduzibel sind. Damit ist alles bewiesen. 5. Die Kreisteilungsgleichung. Wie im letzten Abschnitt schon gesagt, ist es osbar Ziel dieses Abschnitts zu zeigen, dass die Gleichung Φn = 0 mittels Radikale l¨ ist. Satz 1. Sind m und n teilerfremde nat¨ urliche Zahlen, so ist das m-te Kreisteilungspolynom Φm irreduzibel u ¨ber dem n-ten Kreisteilungsk¨ orper Qn . Beweis. Weil m und n teilerfremd sind, ist ϕ(mn) = ϕ(m)ϕ(n). Also ist ϕ(m)ϕ(n) = [Qmn : Q] = [Qmn : Qn ][Qn : Q] = [Qmn : Qn ]ϕ(n) und folglich [Qmn : Qn ] = ϕ(m). Ist ζ eine primitive m-te Einheitswurzel, so gibt es auf Grund von Satz 5 von Abschnitt 7 des Kapitels 9 in Qn [ζ] eine primitive (mn)-te Einheitswurzel. Folglich ist Qmn = Qn [ζ]. Das Minimalpolynom von ζ u ¨ ber Qn hat also den Grad ϕ(m). Da es auch Teiler von Φm ist, folgt, dass es gleich Φm ist. Also ist Φm irreduzibel u ¨ ber Qn . Die S¨atze 2 bis 5 finden sich — sogar etwas allgemeiner — bei Gauß (Disquisitiones, Art. 360). Ihre Beweise sind aber nur skizziert, insbesondere der Beweis von Satz 3 ist vollst¨andig unterdr¨ uckt, da sehr weitschweifig, wie Gauß bemerkt. Diese S¨atze sind die wesentlichen Hilfsmittel beim Beweise der Aufl¨ osbarkeit der Kreisteilungsgleichungen durch Radikale, wie wir sehen werden. Dieser Satz wird von Gauß aber nur f¨ ur Φp mit einer Primzahl p formuliert, wobei er die (p − 1)sten Einheitswurzeln ins Spiel bringt, ohne auch nur zu erw¨ ahnen, dass sie mittels Radikale darstellbar sind. Dies sind wohl alles Gr¨ unde, die Lebesgue veranlassten
356
Kapitel XII. Geometrie lebt von der Algebra
zu sagen, dass das Kapitel u ¨ ber die Kreisteilung in Gaußens Disquisitiones offenbar u ¨berst¨ urzt und wie von anderer Hand als die u ¨brigen Kapitel geschrieben erscheine (Lebesgue 1955, S. 219). Es sei p eine Primzahl. Ist ω eine (p − 1)-ste und ζ eine primitive p-te Einheitswurzel und ist g eine Primitivwurzel modulo p, so setzen wir f (ω, ζ; g) :=
p−1
j
ω j−1 ζ g .
j:=1
Satz 2. Es sei p eine Primzahl und K sei ein K¨ orper der Charakteristik 0, der eine primitive (p − 1)-ste Einheitswurzel enthalte. Ist ω eine (p − 1)-ste und ζ eine primitive p-te Einheitswurzel und ist g eine Primitivwurzel modulo p, so gilt k f (ω, ζ; g) = ω k f (ω, ζ g ; g). Beweis. Es ist ja k
ω k f (ω, ζ g ; g) = ω k
p−1
k
j
ω j−1 (ζ g )g =
j:=1
p−1
ω k+j−1 ζ g
k+j
j:=1
= f (ω, ζ; g). Satz 3. Es sei p eine Primzahl und K sei ein K¨ orper der Charakteristik 0 der eine primitive (p − 1)-ste Einheitswurzel enthalte. Ist ω eine (p − 1)-ste und ζ eine primitive p-te Einheitswurzel und ist g eine Primitivwurzel modulo p, so ist f (ω, ζ; g) = 0. Beweis. W¨are f (ω, ζ; g) = 0, so folgte 0=
p−1
j
ω j−1 ζ g = ζ
j:=1
p−1
ω j−1 ζ g
j
−1
j:=1
und damit 0=
p−1
ω j−1 ζ g
j
−1
.
j:=1
Ist η eine primitive (p − 1)-te Einheitswurzel, so folgte, da man die g j ja modulo p reduzieren kann, dass das Minimalpolynom von ζ u ¨ ber Q[η] = Qp−1 einen Grad kleiner als p − 1 h¨ atte. Das widerspr¨ ache aber Satz 1, da p und p − 1 teilerfremd sind. Satz 4. Es sei p eine Primzahl und K sei ein K¨ orper der Charakteristik 0, der eine primitive (p − 1)-ste Einheitswurzel η enthalte. Ist ω eine (p − 1)-ste und ζ eine primitive p-te Einheitswurzel und ist g eine Primitivwurzel modulo p, ist ferner p−1 1 gi p−1 f (ω, ζ ; g) A := , p − 1 i:=1
5. Die Kreisteilungsgleichung
357 k
so ist A ∈ Q[η] ⊆ K und f (ω, ζ g ; g) ist Nullstelle von xp−1 − A f¨ ur alle k := 1, . . . , p − 1. Beweis. Nach Satz 2 ist k
k
f (ω, ζ; g)p−1 = ω k(p−1) f (ω, ζ g ; g)p−1 = f (ω, ζ g ; g)p−1 f¨ ur alle k. Setzt man B := f (ω, ζ; g)p−1 , so ist B unter Permutation der ζ g invariant, also ein Element von Q[η], da ω ja Potenz von η ist. Es folgt weiter (p − 1)B =
p−1
k
k
f (ω, ζ g ; g)p−1 = (p − 1)A
k:=1 k
und damit A = B ∈ Q[η]. Wegen f (ω, ζ g ; g)p−1 = A gilt auch die letzte Behauptung. Satz 5. Es sei p eine Primzahl und η sei eine primitive (p − 1)-ste und ζ eine primitive p-te Einheitswurzel. Ferner sei g eine Primitivwurzel modulo p. Dann ist Q(p−1)p = Qp−1 f (η, ζ; g) . Ferner ist xp−1 − f (η, ζ; g)p−1 ∈ Qp−1 [x] und dieses Polynom ist irreduzibel u ¨ber Qp−1 . Beweis. Satz 2 besagt, dass k
f (η, ζ; g) = η k f (η, ζ g ; g) ist. Da f (η, ζ; g) nach Satz 3 nicht 0 ist, kann vorstehende Gleichung in die (−r)-te Potenz erhoben werden. Es folgt f (η, ζ; g)−r = η −kr f (η, ζ g ; g)−r . k
Mit ω = η r folgt aus Satz 2 k
f (η r , ζ; g) = η rk f (η r , ζ g ; g). Aus diesen beiden Gleichungen folgt f (η, ζ; g)−r f (η r , ζ; g) = f (η, ζ g ; g)−r f (η r , ζ g ; g). k
k
Hieraus folgt, dass f (η, ζ; g)−r f (η r , ζ, g) bei Permutation der primitiven p-ten Einheitswurzeln invariant bleibt. Setzt man c := f (η, ζ; g)−r f (η r , ζ; g),
358
Kapitel XII. Geometrie lebt von der Algebra
so ist also c ∈ Qp−1 . Es folgt f (η r , ζ; g) = cf (η, ζ; g)r ∈ Qp−1 f (η, ζ; g) f¨ ur alle r. Da η eine primitive (p − 1)-ste Einheitswurzel ist, ist also f (ω, ζ; g) ∈ ur alle (p − 1)-sten Einheitswurzeln ω. Nun ist aber Qp−1 [f (η, ζ; g)] f¨ p−1
j
ω j−1 ζ g = f (ω, ζ; g),
j:=1
wobei ω die Menge der (p − 1)-sten Einheitswurzeln durchlaufe, ein lineares Gleij chungssystem mit Vandermondedeterminante, die ungleich 0 ist. Daher folgt ζ g ∈ Qp−1 [f (η, ζ; g] f¨ ur alle j. Hieraus folgt Q(p−1)p = Qp−1 [f (η, ζ; g)]. Nach Satz 4 ist xp−1 − f (η, ζ; g)p−1 ∈ Qp−1 [x] und dieses Polynom wird vom Minimalpolynom von f (η, ζ; g) geteilt. Da dessen Grad [Q(p−1)p : Qp−1 ] = p − 1 ist, folgt auch noch die letzte noch offene Behauptung. Um diesen Satz und das Folgende ins rechte Licht zu r¨ ucken, sei hier bemerkt, dass es u ¨ ber einem echten Teilk¨ orper von Qp kein irreduzibles Polynom der Form xk − a gibt mit einem Teiler k von p − 1, welches eine Nullstelle in Qp hat, es sei denn, es ist k = 1 oder 2. Ein solches Polynom zerf¨ allt n¨ amlich nach einem im n¨ achsten Kapitel zu beweisenden Satz in Qp in lauter Linearfaktoren, da Qp galoissch ist. Dann enth¨ alt Qp aber alle k-ten Einheitswurzeln. Es folgt, dass Qp auch eine primitive (pk)-te Einheitswurzel enth¨alt, weil p und k ja teilerfremd sind. Es folgt Qpk ⊆ Qp und damit (p − 1)ϕ(k) = ϕ(p)ϕ(k) = ϕ(pk) ≤ ϕ(p) = p − 1. Hieraus folgt ϕ(k) = 1, was k = 1 oder k = 2 zur Folge hat. F¨ ur Satz 5 ist es also unabdingbar, die (p − 1)-sten Einheitswurzeln ins Spiel zu bringen. Es sei L eine Erweiterung des K¨ orpers K. Wir nennen L Radikalerweiterung von K, wenn es eine aufsteigende Kette K = K0 ⊆ K1 ⊆ . . . ⊆ Kt = L von K¨ orpern gibt, so dass gilt: F¨ ur alle i ≥ 1 ist Ki = Ki−1 [ai ], wobei ai Nullstelle eines irreduziblen Polynoms der Form xni − bi ∈ Ki−1 [x] ist. Ist f ∈ K[x] irreduzibel, so heißt die Gleichung f = 0 bzg. K durch Radikale l¨ osbar , wenn es eine Radikalerweiterung L von K gibt, in der f eine Nullstelle hat. Satz 6. Die n-te Kreisteilungsgleichung Φn = 0 ist f¨ ur alle n ∈ N bzg. Q durch Radikale l¨ osbar. Dieser Satz folgt unmittelbar aus dem n¨ achsten.
5. Die Kreisteilungsgleichung
359
Satz 7. Ist n ∈ N, so gibt es eine Radikalerweiterung R von Qn und ein a ∈ N mit R ⊆ Qa , so dass Φn in R vollst¨ andig in Linearfaktoren zerf¨ allt und dass f¨ ur alle Primteiler a von ϕ(a) die Ungleichung p ≤ ϕ(n) gilt. Beweis. Wir machen Induktion nach n. Der Satz ist richtig f¨ ur n = 1, 2 und 3 ur alle t, wie schon gesehen. In diesen F¨allen ist Qn = Qa und auch f¨ ur n = 2t f¨ schon selbst eine Radikalerweiterung von Q. Es sei also n ≥ 5 und der Satz gelte f¨ ur alle m < n. Wir d¨ urfen annehmen, dass n einen ungeraden Primteiler p hat. Es sei n = mp. 1. Fall: p teilt m. Nach Satz 8 von Kap. 9, Absch. 3 ist dann Φn = Φm (xp ). Nach Induktionsannahme gibt es eine Radikalerweiterung R von Q, die in einem allt und f¨ ur die gilt, Kreisteilungsk¨ orper Qa liegt, in der Φm in Linearfaktoren zerf¨ dass jeder Primteiler von ϕ(a) kleiner oder gleich ϕ(m) ist. Dann enth¨ alt R eine primitive m-te Einheitswurzel α und, da p Teiler von m ist, auch eine primitive p-te Einheitswurzel. Nach Satz 1 von Abschnitt 4 ist xp − α daher irreduzibel u ¨ ber R oder xp − α zerf¨allt u ¨ber R in Linearfaktoren. Die Nullstellen von xp − α sind n-te Einheitswurzeln. Es sei ζ eine solche. Dann ist im ersten Fall R[ζ] eine allt, da mit ζ ja alle Radikalerweiterung von Q, die Φn in Linearfaktoren zerf¨ primitiven n-ten Einheitswurzeln in R[ζ] liegen. Im zweiten Fall ist ζ ∈ R, so dass ¨ ber R zerf¨allt. In beiden F¨ allen gilt R[ζ] ⊆ Qap . Weil Φn schon u Qm ⊆ R ⊆ Qa gilt und weil p Teiler von m ist und p > 2 gilt, ist p Teiler von a. Es folgt ϕ(ap) = pϕ(a). Aus dem gleichen Grund ist ϕ(n) = pϕ(m). Es folgt, dass jeder Primteiler von ϕ(ap) h¨ ochstens so groß wie ϕ(n) ist. 2. Fall: p teilt nicht m. Es ist m(p − 1) < mp. Nach Induktionsannahme gibt es eine Radikalerweiterung R von Q, die Φm(p−1) zerf¨allt und die in einem ur den gilt, dass jeder Primteiler von ϕ(a) Kreisteilungsk¨ orper Qa enthalten ist, f¨ h¨ ochstens so groß wie ϕ(m(p − 1)) ist. Es sei a minimal gew¨ahlt. R enth¨ alt dann eine primitive (m(p−1))-ste Einheitswurzel und folglich auch eine primitive (p−1)ste solche. Ist nun ζ eine primitive p-te Einheitswurzel, so ist ζ nach Satz 4 des vorliegenden und Satz 3 des vierten Abschnitts Nullstelle eines irreduziblen Polynoms der Form xt − b ∈ R[x], wobei t Teiler von p − 1 ist. Es folgt, dass R[ζ] eine Radikalerweiterung von Q ist. Da R aber auch eine primitive m-te Einheitswurzel enth¨ alt und p und m teilerfremd sind, enth¨ alt R[ζ] eine primitive (mp)-te Einheitswurzel. Daher zerf¨allt R[ζ] das Polynom Φmp = Φn . Schließlich gilt R[ζ] ⊆ Qa [ζ] ⊆ Qap . Es ist ϕ(n) = ϕ(m)ϕ(p) = (p − 1)ϕ(m),
360
Kapitel XII. Geometrie lebt von der Algebra
da p ja kein Teiler von m ist. Ist q ein Teiler von ϕ(ap) und ist q > ϕ(n) = (p − 1)ϕ(m), so ist q kein Teiler von ϕ(a) und auch kein Teiler von p − 1. Es folgt, dass p Teiler von a ist, da ja sonst ϕ(ap) = ϕ(a)(p − 1) w¨are. Es folgt ϕ(ap) = pϕ(a) und damit p = q. Es ist also p > (p − 1)ϕ(m), was m = 1 oder 2 zur Folge hat. Wegen der Minimalit¨ at von a ist daher a = 1. Somit ist p Teiler von ϕ(ap) = ϕ(p) = p − 1, ein Widerspruch. Damit ist der Satz bewiesen. 6. Kreisteilungsk¨ orper. In diesem Abschnitt seien noch einige Aussagen u ¨ ber die gegenseitige Lage der Kreisteilungsk¨ oper versammelt, da sie in den Zusammenhang ¨ die Historie der S¨atze weiß ich nichts zu sagen. passen. Uber Ist M ein K¨ orper und sind K und L Teilk¨ orper von M , so bezeichnen wir mit KL den Schnitt u ¨ ber alle Teilk¨orper von M , die K und L umfassen. Man nennt KL das Kompositum der beiden K¨ orper K und L. Satz 1. Es seien m und n nat¨ urliche Zahlen. Dann gilt f¨ ur die beiden Kreisteilungsk¨ orper Qm und Qn die Gleichung Qm Qn = QkgV(m,n) . Beweis. Es gilt Qm , Qn ⊆ QkgV(m,n) und damit Qm Qn ⊆ QkgV(m,n) , da ja alle m-ten und alle n-ten Einheitswurzeln auch kgV(m, n)-te Einheitswurzeln sind. Andererseits enth¨ alt Qm Qn eine primitive m-te und eine primitive n-te Einheitswurzel. Nach Satz 5 von Abschnitt 7 des Kapitels 9 gibt es in Qm Qn auch eine primitive kgV(m, n)-te Einheitswurzel. Hieraus folgt QkgV(m,n) ⊆ Qm Qn und damit die Behauptung. Satz 2. Ist ϕ die eulersche Totientenfunktion, so ist ϕ(m)ϕ(n) = ϕ kgV(m, n) ϕ ggT(mn) .
Beweis. F¨ ur x ∈ N bezeichne π(x) die Menge der Primteiler von x. Dann ist nach Korollar 2 zur m¨ obiusschen Umkehrformel (Kap. 9, Absch. 3) ϕ(m)ϕ(n) = mn
(1 − p−1 )
p∈π(m)
= mn
(1 − p−1 )
p∈π(n)
(1 − p−1 )
p∈π(m)∪π(n)
(1 − p−1 ).
p∈π(m)∩π(n)
Nun ist π(kgV(m, n)) = π(m) ∪ π(n) und π(ggT(m, n)) = π(m) ∩ π(n) sowie mn = kgV(m, n)ggT(m, n). Daraus folgt schließlich die Behauptung. Satz 3. Es seien m und n nat¨ urliche Zahlen. Genau dann ist Qm ⊆ Qn , wenn m Teiler von n oder wenn n ungerade und m Teiler von 2n ist.
6. Kreisteilungsk¨ orper
361
Beweis. Ist m Teiler von n und ist n = tm, so ist ζ t eine primitive m-te Einheitswurzel, wenn ζ eine primitive n-te Einheitswurzel ist. Dann ist Qm = Q[ζ t ] ⊆ Q[ζ] = Qn . Es sei n ungerade und m Teiler von 2n. Dann ist Qm ⊆ Q2n , wie gerade gesehen. Ist ζ eine primitive n-te Einheitswurzel, so ist −ζ eine primitive (2n)-te Einheitswurzel, da n ja ungerade ist. Daher ist Qn = Q[ζ] = Q[−ζ] = Q2n . Also ist auch in diesem Falle Qm ⊆ Qn . Es sei umgekehrt Qm ⊆ Qn . Ferner sei ζ eine primitive m-te und η eine primitive n-te Einheitswurzel. Nach Satz 5 von Kapitel 9, Abschnitt 7 gibt es dann in der von ζ und η erzeugten Untergruppe der multiplikativen Gruppe von Qn eine primitive kgV(m, n)-te Einheitswurzel. Es folgt QkgV(m,n) ⊆ Qn und damit QkgV(m,n) = Qn . Hieraus folgt ϕ kgV(m, n) = ϕ(n). Mit Satz 2 folgt ϕ ggT(m, n) ϕ kgV(m, n) = ϕ(m)ϕ(n) = ϕ(m)ϕ kgV(m, n) . Also ist ϕ(m) = ϕ(ggT(m, n)). Es sei m = ggT(m, n)ab, wobei jeder Primteiler von a Teiler von ggT(m, n) und b zu ggT(m, n) teilerfremd sei. Dann ist ϕ ggT(m, n) = ϕ(m) = aϕ ggT(m, n) ϕ(b). Es folgt a = ϕ(b) = 1. Also ist b = 1 oder b = 2. Ist b = 1, so ist m = ggT(m, n), so dass m Teiler von n ist. Es sei also b = 2. Dann ist m = 2ggT(m, n), so dass m gerade und Teiler von 2n ist. W¨are n gerade, so teilte 2 und damit b den gr¨ oßten gemeinsamen Teiler von m und n im Widerspruch zur Herkunft von b. Damit ist der Satz bewiesen. Nun kommen auch Gruppen ins Spiel. Hier eine erste Aussage u ¨ber Untergruppen endlicher Gruppen, die wir gleich ben¨ otigen werden, wenn wir Qm ∩ Qn bestimmen wollen. Satz 4. Es sei G eine endliche Gruppe und A und B seien Untergruppen von G. Ist AB := {x | Es gibt a ∈ A und b ∈ B mit x = ab}, so ist |AB| =
|A||B| . |A ∩ B|
362
Kapitel XII. Geometrie lebt von der Algebra
¨ Beweis. Wir definieren auf A × B eine Aquivalenzrelation ∼ durch (a, b) ∼ (c, d) ¨ genau dann, wenn ab = cd ist. Dann ist |AB| die Anzahl der Aquivalenzklassen. Es sei (a, b) ∈ A × B. Ist x ∈ A ∩ B, so ist axx−1 b = ab und daher (ax, x−1 b) ∼ (a, b). Daher ist die durch xf := (ax, x−1 b) definierte Abbildung f eine injektive ¨ Abbildung von A ∩ B in die Aquivalenzklasse von (a, b). Ist andererseits (a, b) ∼ (c, d), so ist ab = cd. Hieraus folgt c−1 a = db−1 ∈ A ∩ B. Setze x := a−1 c. Dann ist x ∈ A ∩ B und c = ax sowie x−1 b = c−1 ab = c−1 cd = d. ¨ Folglich ist f auch surjektiv. Daher haben alle Aquivalenzklassen die L¨ ange |A∩B|. Folglich ist |A × B| = |AB||A ∩ B|, was zu beweisen war. Satz 5. Es seien m und n nat¨ urliche Zahlen und m sei Teiler von n. Ist A die Automorphismengruppe von Qn und ist H := {η | η ∈ A, xη = x f¨ ur alle x ∈ Qm }, so ist A/H zur Automorphismengruppe von Qm isomorph und [Qn : Qm ] = |H|. Beweis. Ist α ∈ A und ist ζ eine m-te Einheitswurzel, so ist auch ζ α eine m-te ∗ Einheitswurzel. Folglich ist Qα ankung von α auf Qm , m = Qm . Ist α die Einschr¨ so ist ∗ also ein Homomorphismus von A in die Automorphismengruppe von Qm und H ist der Kern dieses Homomorphismus. Hieraus folgt mit Satz 5 von Kapitel 9, Abschnitt 3, dass |A/H| ≤ ϕ(n) ist. Es sei σ eine primitive n-te Einheitswurzel. Dann ist Qn = Q[σ] ⊆ Qm [σ] ⊆ Qn und daher Qn = Qm [σ]. Ist f das Minimalpolynom von σ u ¨ ber Qm , so ist ur alle η ∈ H. Daher Grad(f ) = [Qn : Qm ]. Nun ist σ η eine Nullstelle von f f¨ gilt |H| ≤ Grad(f ). Es folgt ϕ(n) = |A/H||H| ≤ ϕ(m)[Qn : Qm ] = [Qn : Qm ][Qm : Q] = [Qn : Q] = ϕ(n). Folglich ist |A/H| = ϕ(m) und |H| = [Qn : Qm ]. Damit ist alles bewiesen. Satz 6. Sind m, n ∈ N, so ist Qm ∩ Qn = QggT (m, n).
6. Kreisteilungsk¨ orper
363
Beweis. Nach Satz 1 ist [Qm , Qn ] = QkgV(m,n) . Es sei G die Automorphismengruppe von QkgV(m,n) und F := {f | f ∈ G, xf = x f¨ ur alle x ∈ Qm } und ur alle x ∈ Qn }. H := {h | h ∈ G, xh = x f¨ Nach Satz 5 ist dann |F | =
ϕ(kgV(m, n)) ϕ(m)
und |H| =
ϕ(kgV(m, n)) . ϕ(n)
Ist g ∈ F ∩ H, so l¨asst g sowohl Qm als auch Qn und damit [Qm , Qn ] = QkgV(m,n) elementweise fest. Also ist g = 1. Nach Satz 4 ist daher |F H| = |F ||H| =
ϕ(kgV(m, n)) ϕ(kgV(m, n))2 = . ϕ(m)ϕ(n) ϕ(ggT(m, n))
Es sei I := {i | i ∈ G, xi = x f¨ ur alle x ∈ QggT(m,n) }. Sicherlich ist QggT(m,n) ⊆ Qm ∩ Qn . Hieraus folgt F H ⊆ I. Nach Satz 5 ist |I| = ϕ(kgV(m, n))ϕ(ggT(m, n))−1 und folglich I = F H. Es sei ur alle i ∈ I}. K := {x | x ∈ QkgV(m,n , xi = x f¨ Dann ist K ein K¨ orper, der wegen I = F H den Schnitt Qm ∩ Qn umfasst. Ist ζ eine primitive kgV(m, n)-te Einheitswurzel, so ist QkgV(m,n) = K[ζ], da ja Q ⊆ K ist. Ist f das Minimalpolynom von ζ u ¨ ber K, so ist |I| ≤ Grad(f ) = [QkgV(m,n) : K]. Also ist ϕ kgV(m, n) = ϕ ggT(m, n) |I| ≤ [QggT(m,n) : Q][QkgV(m,n) : K] ≤ [QkgV(m,n) : K][K : Q] = ϕ kgV(m, n) . Hieraus folgt [K : Q] = [QggT(m,n) : Q] und wegen QggT(m,n) ⊆ Qm ∩ Qn ⊆ K dann auch QggT(m,n) = Qm ∩ Qn , was zu beweisen war.
XIII. Galois 1. Cauchy 1815 und 1844. Wir sind ein ganzes St¨ uck weiter gekommen in der Frage, ob Gleichungen durch Radikale l¨ osbar sind, indem wir von einer ganzen Klasse von Gleichungen, den Kreisteilungsgleichungen n¨ amlich, nachwiesen, dass sie es sind. Dies hatten Gauß und Vandermonde herausgefunden, wobei Vandermondes Herangehen skizzenhaft ist und auch die gaußschen Beweise nicht v¨ollig zufrieden stellen. Die endg¨ ultige Antwort auf die Frage, ob Gleichungen durch Radikale l¨ osbar seien, fanden dann schließlich Niels Henrik Abel und Evariste Galois. Es gab einen Vorl¨ aufer. Im Jahre 1799 publizierte Paolo Ruffini, Arzt, wie seinerzeit Girolamo Cardano, sein Buch Teoria generale delle Equazioni, in cui si dimostra impossibile la soluzione algebraica (sic) delle equazioni generali di grado superiore al quarto. In diesem Buche behauptet er, dass die allgemeine Gleichung 5. Grades nicht mittels Radikale l¨ osbar sei. Seinen Kritikern antwortete er mit insgesamt f¨ unf weiteren Publikationen zu diesem Thema, worinnen er seine Beweise verbesserte und erg¨ anzte. Was bei ihm neu war, ist, dass er die Untergruppen der S5 auflistete (die Liste war nicht komplett), um u ¨ ber die Indizes der Untergruppen Aussagen u ¨ ber die Grade der Minimalpolynome (Resolventen) der Elemente von ¨ ber Q(a1 , a2 , a3 , a4 , a5 ) zu bekommen, wobei die ai vom Q(x1 , x2 , x3 , x4 , x5 ) u Vorzeichen abgesehen die elementarsymmetrischen Funktionen in den xi sind. Ruffinis Arbeiten haben das Ziel noch nicht erreicht, dennoch sind sie wegweisend, da sie nun die symmetrischen Gruppen und ihre Untergruppen zu Werkzeugen der Theorie machen. Er kennt die Zyklenzerlegung von Permutationen und hat die Begriffe der intransitiven, transitiven imprimitiven und transitiven primitiven Untergruppen der symmetrischen Gruppe, wobei er jedoch noch nicht diese Namen benutzte (s. Toti-Rigatelli 1989, S. 28). Ich werde die Arbeiten Ruffinis nicht weiter verfolgen. Sie finden sich sehr detailliert in Burkhardt 1892 beschrieben. Diese Arbeit scheint immer noch das letzte Wort zu Ruffini zu sein (s. a. Kiernan 1971 und zu dieser Arbeit van der Waerden 1972). Ruffinis Werke sind von Ettore Bortolotti herausgegeben worden (s. Literaturverzeichnis). Abel zeigte in einer im Jahre 1824 in Christiania erschienen Schrift, dass die allgemeine Gleichung 5-ten Grades nicht durch Radikale l¨ osbar ist (Abel 1824). Sehr viel ausf¨ uhrlicher nimmt er zu diesem Thema in einer Arbeit im Journal f¨ ur die reine und angewandte Mathematik Stellung (Abel 1826). W¨ ahrend er in
366
Kapitel XIII. Galois
der ersten Arbeit nur den Fall der allgemeinen Gleichung f¨ unften Grades erledigt und dann sagt, dass daraus unmittelbar auch die Unl¨ osbarkeit der Gleichungen h¨ oheren Grades durch Radikale folge, geht er in der zweiten Arbeit auf alle Details ein. Dieses Ergebnis, dass die allgemeine Gleichung des Grades n ≥ 5 nicht durch Radikale l¨ osbar ist, ist ein Juwel, ein Glanzlicht in der an herausragenden Ergebnissen nicht armen Geschichte der Mathematik. Mit diesem Ergebnis ist aber immer noch nicht die Frage beantwortet, ob algebraische Gleichungen u ¨ ber Q durch Radikale l¨ osbar sind. Die allgemeine Gleichung hat ja Unbestimmte als Koeffizienten und nicht rationale Zahlen und die Kreisteilungspolynome sind Polynome, die durch Radikale l¨ osbar sind. Dies war auch Abel bewusst, wie aus seiner postum publizierten Abhandlung Sur la r´esolution alg´ebriques des ´equations hervorgeht. Es heißt dort zusammenfassend: En g´en´eral, il y a deux cas diff´erens ” selon que les coefficiens contiendrons des quantit´es variables, ou non.“ (Werke, Bd. 2, S. 219. Man beachte, dass Abel sich noch der vorrevolution¨ aren franz¨osischen Orthografie bedient: diff´erens, coefficiens). Der Ruhm, die Antwort auf die Frage nach der L¨ osbarkeit von Gleichungen u ¨ber Q durch Radikale gefunden zu haben, geb¨ uhrt Evariste Galois. Er fand notwendige und hinreichende Bedingungen daf¨ ur, dass eine gegebene Gleichung durch Radikale l¨ osbar ist. Mit diesen Kriterien war es dann einfach, sich Beispiele solcher Gleichungen u ¨ ber Q zu verschaffen, die nicht durch Radikale l¨ osbar sind. Mit Galois’ Satz werden wir dann auch Abels Resultat beweisen, dass die allgemeine Gleichung des Grades n ≥ 5 nicht durch Radikale l¨ osbar ist. Noch vor Abel und Galois griff Cauchy das Thema auf, das von Lagrange, Vandermonde und Ruffini, wie er sagte, angestoßen worden sei (Cauchy 1815a). In dieser Arbeit bewies er den Satz, dass f¨ ur die Anzahl r der Bilder von f ∈ Q(x1 , . . . , xn ) unter der Sn gilt, dass r = 1 oder 2 sei oder aber dass die Ungleichung r ≥ p gelte, wobei p der gr¨ oßte Primteiler von n! ist. Ruffini h¨ atte dies f¨ ur n = p = 5 bewiesen. Cauchy erkl¨ art das Symbol, das wir heute noch benutzen, an dem Beispiel der Permutation 1.2.4.3 . 2.4.3.1 Dieses Symbol repr¨ asentiert die Substitution (substitution) 1 durch 2, 2 durch 4, 4 durch 3 und 3 durch 1. Er liest dieses Symbol also von oben nach unten. Die Spalten dieses Symbols k¨ onnen beliebig permutiert werden. Die dargestellte Substitution a¨ndert sich dadurch nicht. Die beiden Zeilen des Symbols k¨ urzt er h¨aufig mit großen Buchstaben ab, also etwa mit A1 . A2 Bei der expliziten Form l¨ asst er, wenn nicht ausdr¨ ucklich ben¨ otigt, die Spalten weg, in denen oben und unten das gleiche Element steht. Die nicht explizit auftretenden Elemente sind also Fixelemente der Abbildung.
1. Cauchy 1815 und 1844
367
Bei Vandermonde findet sich dieses Symbol auch schon, wobei Vandermonde es aber von unten nach oben liest (Vandermonde 1774), was Cauchy in der gleich zu besprechenden Arbeit von 1844 ebenfalls tut. Wir bleiben aber dabei, es von oben nach unten zu lesen. (Es wird gleich noch etwas u ¨ber die Datierung der Arbeit gesagt.) 2 1 die beiden Eintr¨ age, so erh¨alt man mit A Invertiert“ man in A A A1 die zur 2 ” ersten Permutation inverse Permutation, die auch von Cauchy l’inverse genannt 1 wird. Sie so zu benennen, sei nat¨ urlich, weil A1 und A2 in dem Symbol A A2 invertiert w¨ urden (Cauchy 1844). Das Produkt einer Permutation mit ihrer Inversen ergibt die Identit¨ at. Er nennt sie unit´e und bezeichnet sie mit 1, wobei die 1 als Bezeichnung f¨ ur die Identit¨ at in den Arbeiten von 1815 noch nicht auftaucht. Ist f ∈ Q(x1 , . . . , xn ), so nennt Cauchy die Zahl r der Bilder von f unter der Sn den Index von f (Cauchy 1815a). Der Index einer Funktion ist ja auch der Index ihres Stabilisators in der Sn . Ob sich von daher der Name Index“ f¨ ur den Quotienten von Gruppenordnung durch ” Untergruppenordnung herleitet, weiß ich nicht. Um seinen Satz zu beweisen, nimmt Cauchy an, er habe ein f , dessen Index r kleiner als p sei. Am Kreis erkl¨art Cauchy die p-Zyklen. Es sind dies die Abbildungen a1 → a2 → . . . → ap → a1 , wobei die restlichen Elemente festgelassen werden. Er hat hier das Beispiel, bei dem die Konvention zum Zuge kommt, dass nicht aufgef¨ uhrte Ziffern Fixziffern sind: α β γ δ ... ζ η . β γ δ ... η α Dann beweist er, dass alle p-Zyklen f invariant lassen. Cauchys Beweis, der erste Beweis dieser Tatsache, dauert eine Weile. Wir sehen das heute sofort, auch Dank Cauchy. Es g¨ abe ja sonst einen p-Zyklus, der nicht im Stabilisator von f l¨ age. Dann h¨ atte aber die von diesem Zyklus erzeugte Untergruppe mit dem Stabilisator einen trivialen Schnitt, da p eine Primzahl ist. Usw. Alle 3-Zyklen lassen f invariant. F¨ ur den 3-Zyklus αβγ γαβ gilt ja die Gleichung α β γ δ ... ζ η β γ δ ... η α αβγ = . β γ δ ... η α γ α β δ ... ζ η γαβ Sind die Faktoren des Produktes auf der linken Seite insbesondere p-Zyklen, so lassen sie und damit auch ihr Produkt f invariant. (Cauchy benutzt in diesem Zusammenhang ebenfalls die W¨ orter facteur und produit.)
368
Kapitel XIII. Galois
Es ist nun interessant, wie Cauchy den Beweis zum Abschluss bringt, ohne die alternierende Gruppe ins Spiel zu bringen. Was er stillschweigend unterstellt, ist, dass die Sn von Transpositionen erzeugt wird. Dies ist aber sp¨atestens seit Lagrange klar, wie ich dort schon erw¨ ahnte. Es seien α, β, γ, δ vier der Indizes. Dann ist zun¨achst αβγ αβ βγ = . γαβ βα γβ Weil f von 3-Zyklen invariant gelassen wird und weil ihre eigenen Transpositionen β mit (α, β) abk¨ urzt, was Inversen sind, folgt, wenn man die Transposition α β α schon Cauchy tut, ohne jedoch die folgende Notation zu benutzen, f (α,β) = f (β,γ). Entsprechend folgt f (β,γ) = f (γ,δ) und damit f (α,β) = f (γ,δ) . Hieraus folgt dann schließlich, dass f unter der Sn h¨ ochstens zwei verschiedene Bilder hat, da die Sn ja von Transpositionen erzeugt wird. Aus Cauchys Beweis seines Satzes kann man das Folgende herausholen. Ist U eine Untergruppe der Sn und gilt f¨ ur den Index [Sn : U ] von U in Sn die oßte, n! teilende Primzahl ist, so ist Ungleichung [Sn : U ] < p, wobei p die gr¨ [Sn : U ] ≤ 2 und U enth¨ alt alle 3-Zyklen. Unmittelbar im Anschluss an die gerade besprochene Arbeit erschien auch die ´ nun zu besprechende Arbeit im Journal de l’Ecole Polytechnique. Auch sie enth¨ alt Schl¨ usse, die es auch heute noch wert sind, gewusst zu werden (Cauchy 1815b). Cauchy erkl¨ art am Kreis die Zyklenzerlegung einer Permutation, die ja schon Ruffini kannte, indem er die zu permutierenden Elemente im Uhrzeigersinn (er sagt nicht Uhrzeigersinn“) auftr¨ agt und dann Bild und Urbild mit einer Strecke ” verbindet, wobei der Uhrzeigersinn vorgibt, welche Ziffer Bild und welche Urbild ist. Dann zerf¨allt der gerichtete Graph, der so entsteht, in disjunkte Zyklen. Er f¨ uhrt ein Beispiel vor. Die Zyklenschreibweise benutzt er noch nicht. Sie findet sich aber in der Arbeit Cauchy 1844. Wir wollen hier etwas penibler vorgehen. Es sei X eine endliche Menge und SX sei die symmetrische Gruppe auf X. Es sei p ∈ X und π ∈ SX . Dann ist die Menge i
{pπ | i ∈ N0 } i
j
i−j
= p. endlich. Es gibt daher i, j ∈ N0 mit i > j und pπ = pπ . Es folgt pπ πl Wegen i − j ∈ N gibt es also eine kleinste, positive ganze Zahl l mit p = p. Dann 2 l−1 paarweise verschiedene Elemente von X. Man nennt sind p, pπ , pπ , . . . , pπ (p, pπ , . . . , pπ
l−1
)
1. Cauchy 1815 und 1844
369
einen Zyklus der L¨ ange l von π. Ein Zyklus ist dann so zu lesen, dass jedes vom letzten Element verschiedene Element auf seinen rechten Nachbarn, das letzte Element aber auf das erste abgebildet wird. Die Fixelemente von π bilden Zyklen der L¨ange 1. Sie werden meist nicht eigens aufgef¨ uhrt. Die Menge {p, pπ , . . . , pπ
l−1
}
ist offenbar eine Bahn der von π erzeugten Untergruppe π der SX . Hat man daher m−1 ¨ einen zweiten Zyklus (q, q π , . . . , q π ), so ist, weil Bahnen ja Aquivalenzklassen sind, entweder {p, pπ , . . . , pπ
l−1
} = {q, q π , . . . , q π
m−1
}
oder {p, pπ , . . . , pπ
l−1
} ∩ {q, q π , . . . , q π
m−1
} = ∅.
Die Reihenfolge der Elemente eines Zyklus ist nicht eindeutig festgelegt, kann man doch jedes seiner Elemente als erstes Element verwenden. Eine Permutation heißt zyklisch, falls sie nur einen nicht trivialen Zyklus besitzt. Transpositionen sind zyklische Permutationen. ager von π Ist π ∈ SX , so nennen wir die Menge {x | x ∈ X, xπ = x} den Tr¨ und bezeichnen ihn mit Tr¨ a(π). Zwei Permutationen heißen disjunkt, wenn ihre Tr¨ ager disjunkt sind. Dann gilt also, dass jede Permutation Produkt von paarweise disjunkten zyklischen Permutationen ist. Satz 1. Sind γ und δ disjunkte Permutationen auf X, so ist γδ = δγ. Beweis. Es sei x ∈ X. a(γ) und folglich xδ = x und 1. Fall: Es ist x ∈ Tr¨ a(γ). Dann ist auch xγ ∈ Tr¨ γδ γ x = x , da Tr¨ a(γ) ∩ Tr¨ a(δ) = ∅ ist. Aus der ersten Gleichung folgt xδγ = xγ , so δγ γδ dass x = x ist. 2. Fall: Es ist x ∈ Tr¨ a(δ). Dann folgt entsprechend dem ersten Fall xγδ = xδγ . 3. Fall: Es ist x ∈ Tr¨ a(γ) ∪ Tr¨ a(δ). Dann ist xγδ = xδ = x = xγ = xδγ . Also ist γδ δγ in jedem Falle x = x und damit γδ = δγ. Nachdem Cauchy die Zerlegung einer Permutation in Zyklen eingef¨ uhrt hat, beweist er den folgenden, grundlegenden Satz. Satz 2. Es sei X eine endliche Menge und es sei π ∈ SX . Ist g die Anzahl der Zyklen von π, die Zyklen der L¨ ange 1 mitgez¨ ahlt, und ist (α, β) eine Transposition aus der SX , so ist die Anzahl der Zyklen von π(α, β) gleich g − 1 oder g + 1. Beweis. Da alle Zyklen von π im Spiele sind, kommen α und β in den Zyklen von π vor. Wir nehmen zun¨ achst an, dass sie in verschiedenen Zyklen vorkommen. Weil die Zyklen nach Satz 1 paarweise vertauschbar sind, erreichen wir, dass die beiden Zyklen, in denen α und β vorkommen, unmittelbar links neben der Transposition
370
Kapitel XIII. Galois
(α, β) stehen. Dann ergibt sich, da wir ja auch u ¨ber die Position von α und β in ihren jeweiligen Zyklen frei verf¨ ugen k¨onnen, π(α, β) = . . . (α, γ, . . . , δ)(β, , . . . , ζ)(α, β) = . . . (α, γ, . . . , δ, β, , . . . , ζ, ). In diesem Fall werden die beiden Zyklen, die α und β enthalten, miteinander verschmolzen, die Anzahl der Zyklen also um 1 vermindert. Liegen α und β im gleichen Zyklus, so k¨onnen wir auf Grund von Satz 1 wieder annehmen, dass dieser Zyklus unmittelbar links neben (α, β) steht. Dann ist nach dem bereits Bewiesenen π(α, β) = . . . (α, γ, . . . , δ, β, , . . . , ζ)(α, β) = . . . (α, γ, . . . , δ)(β, , . . . , ζ)(αβ)(αβ) = . . . (α, γ, . . . , δ)(β, , . . . , ζ). Hier wird also der Zyklus, der α und β enth¨ alt, in zwei Zyklen zerlegt, so dass die Anzahl der Zyklen um 1 steigt. Damit ist der Satz bewiesen. Dann ordnet Cauchy jeder Permutation π die Zahl n−g zu, wobei n = |X| und g die Anzahl aller Zyklen von π ist. Mit Hilfe dieser Zahl zerlegt er die Permutationen ur die n − g gerade ist, und die in zwei Klassen, die Klasse der Permutationen, f¨ Klasse der Permutationen, f¨ ur die n− g ungerade ist. Er beweist, dass das Produkt zweier Elemente aus der gleichen Klasse ein Element der ersten Klasse ist und dass das Produkt zweier Elemente aus verschiedenen Klassen ein Element der zweiten Klasse ist. Wir erkennen hier das Rechnen mit Vertretern der Elemente der Faktorgruppe SX /AX , wobei AX die alternierende Gruppe auf X ist. Dies in heutiger Sprache darzustellen, steht nun auf dem Programm. Cauchys Argumente stehen und fallen mit der Eigenschaft der symmetrischen Gruppe, dass jede Permutation Produkt von Transpositionen ist. Dies sieht man mit den bislang bereit gestellten Hilfsmitteln sehr rasch. Wie beim Beweis von Satz 2 gesehen, ist (c0 , . . . , cr ) = (c0 , . . . , cr−1 )(cr )(c0 , cr ) = (c0 , . . . , cr−1 )(c0 , cr ). Hieraus folgt mit Induktion die Behauptung. Ist π ∈ SX , ist n = |X| und ist g die Anzahl der Zyklen von π, die Zyklen der L¨ange 1 mitgez¨ahlt, so setzen wir sgn(π) := (−1)n−g und nennen sgn(π) das Signum von π. F¨ ur das Signum von π ist der Grad der Sn , also das n, nur bedingt wichtig. Signifikant ist nur die Anzahl der bewegten Ziffern und die Anzahl der nichttrivialen Zyklen. Es gilt n¨ amlich: Ist t die Anzahl der nicht trivialen Zyklen von π angen, so ist und sind z1 , z2 , . . . , zt ihre L¨ t sgn(π) = (−1) i:=1 zi −t .
1. Cauchy 1815 und 1844
371
Dies folgt daraus, dass n gleich der Summe der zi plus der Anzahl der Fixziffern und dass g gleich t plus der Anzahl der Fixziffern ist. Satz 3. Es sei X eine endliche Menge. Sind π, ρ ∈ SX , so ist sgn(πρ) = sgn(π)sgn(ρ). Ist τ eine Transposition, so ist sgn(τ ) = −1. Beweis. Es seien g, g und g die Anzahlen aller Zyklen von πρ, π, bzw. ρ. Die Permutationen π und ρ sind Produkte von Transpositionen. Es sei r die Anzahl der Transpositionen in einem Produkt, das gleich π sei, und r die Anzahl der Transpositionen in einem solchen Produkt, das gleich ρ sei. Da die Anzahl der Zyklen der Identit¨ at gleich n ist, folgen mit Satz 2 die Kongruenzen n ≡ g + r mod 2 n ≡ g + r mod 2 n ≡ g + r + r mod 2. Es folgt
sgn(πρ) = (−1)n−g = (−1)r +r = (−1)r (−1)r
= (−1)n−g (−1)n−g = sgn(π)sgn(ρ). Ist τ eine Transposition, so ist g = n − 1 und daher sgn(τ ) = −1. Den Kern von sgn bezeichnen wir mit AX . Es ist die alternierende Gruppe vom Grade n, wobei n die L¨ ange von X bezeichne. Statt AX schreiben wir auch An . Weil sgn surjektiv ist, ist der Index der An in der Sn gleich 2. Also ist |An | = 12 n! Es gibt noch mehr Publikationen Cauchys, in denen er von Permutationen handelt, wichtig f¨ ur uns ist aber erst wieder die Arbeit Cauchy 1844. Diese Arbeit ist erschienen im dritten Band der Exercices d’analyse et de physique math´ematique, der als Erscheinungsjahr das Jahr 1844 angibt. In Wirklichkeit ist er in mehreren Lieferungen erschienen, die sich bis in das Jahr 1846 erstreckten. Peter Neumann macht nun klar, dass die Arbeit Cauchys wohl erst im Jahre 1845 entstanden und fr¨ uhestens in diesem Jahr, wahrscheinlich aber erst das Jahr darauf erschienen ist (Neumann 1989). Da ich aber weder eine Aussage machen will, von wann bis wann sich Cauchy mit Permutationsgruppen besch¨ aftigte, noch Vorw¨ urfe gegen J. Bertrand erhebe, dass er die cauchysche Arbeit nicht gelesen h¨atte, kommt es hier nicht darauf an, in welchem Jahr die Arbeit erschienen ist. Wenn man sie in Bibliotheken sucht, muss man sich an die Jahreszahl 1844 halten. In Cauchys Arbeit geht es um die symmetrischen Gruppen um ihrer selbst A f¨ ur Permutationen erkl¨ art hat, die willen. Nachdem er wieder die Bezeichnung B er nun von unten nach oben XXXX und deren Produkt er von rechts nach links liest, zeigt er als Erstes, dass die Multiplikation in der Sn nicht kommutativ ist, wenn nur n ≥ 3 ist. Es ist ja — wir lesen weiterhin Permutationen von oben nach unten und ihre Produkte von links nach rechts — yz xy xyz = zy yx yzx
372 und
Kapitel XIII. Galois xy yz xyz = . yx zy zxy
Er spricht von Potenzen (puissances) von Permutationen. Er definiert die Ordnung (ordre) von π als die kleinste nat¨ urliche Zahl i, f¨ ur die π i = 1 gilt. Ferner zeigt k er, dass π = 1 genau dann gilt, wenn k durch i teilbar ist. Er benutzt auch negative Exponenten, deren Gebrauch er ausf¨ uhrlich erkl¨ art. Insbesondere ist π −1 −1 −1 −1 die Inverse zu π. Er merkt an, dass (πρ) = ρ π ist. Er erkl¨ art die Zyklenzerlegung einer Permutation, so wie er das auch schon in der Arbeit 1815b getan hat, wobei er nun aber auch die Zyklenschreibweise einf¨ uhrt, die wir schon benutzt haben. Dann beweist er den folgenden Satz, wobei die Struktur des Beweises die Struktur des hier wiedergegebenen Beweises ist. Wir sind nur ein wenig konziser. Satz 4. Es sei X eine endliche Menge. Ferner sei 1 = π ∈ SX . Sind z1 , . . . , zt die L¨ angen der nicht trivialen Zyklen von π, so ist o(π) = kgV(z1 , . . . , zt ). Beweis. Man beachte, dass ein Zyklus der L¨ ange z die Ordnung z hat. Es sei γi die zyklische Permutation, deren einziger nicht trivialer Zyklus der i-te Zyklus von ange von γi ist. π ist. Dabei sei die Nummerierung so eingerichtet, dass zi die L¨ Dann ist π = γ1 · · · γt und die γi sind nach Satz 1 paarweise vertauschbar. Also ist o(π)
1 = π o(π) = γ1
o(π)
· · · γt
.
Weil die γi paarweise disjunkt sind, folgt hieraus o(π)
γi
=1
f¨ ur alle i. Daher ist zi = o(γi ) Teiler von o(π) f¨ ur alle i. Es folgt, dass kgV(z1 , . . . , zt ) Teiler von o(π) ist. Setzt man g := kgV(z1 , . . . , zt ), so folgt andererseits π g = γ1g · · · γtg = 1 · · · 1 = 1, so dass o(π) Teiler von g = kgV(z1 , . . . , zt ) ist. Damit ist der Satz bewiesen. Cauchy erkennt auch an Hand der Zyklenzerlegung, wann zwei Permutationen konjugiert sind. Dies sei f¨ ur sp¨atere Verwendung hier notiert Satz 5. Es sei γ = (c1 , . . . , ct ) ∈ Sn eine zyklische Permutation. Dann ist π −1 γπ = (cπ1 , . . . , cπt ) f¨ ur alle π ∈ Sn .
1. Cauchy 1815 und 1844
373
ur alle i, so ist xγ = x. Es folgt Beweis. Ist x = ci f¨ xππ
−1
γπ
= xγπ = xπ ,
so dass xπ Fixpunkt von π −1 γπ ist. Ist x = ci , so folgt ciππ
−1
γπ
π = cγπ i = ci+1 ,
wobei t + 1 als 1 zu interpretieren ist. Damit ist alles bewiesen. Es sei G eine Operatorgruppe auf der Menge X. Man nennt G t-fach transitiv auf X, wenn es zu paarweise verschiedenen x1 , . . . , xt ∈ X und paarweise verur alle i. Die Sn ist schiedenen y1 , . . . , yt ∈ X stets ein γ ∈ G gibt mit xγi = yi f¨ n-fach transitiv und damit auch t-fach transitiv auf {1, . . . , n} f¨ ur alle t ≤ n. angen t bzw. t . Genau Korollar. Es seien γ, δ ∈ Sn zyklische Permutationen der L¨ dann sind γ und δ konjugiert in Sn , wenn t = t ist. Beweis. Trivial, da Sn ja t-fach transitiv ist. Ist π ∈ Sn und l ∈ N, so bezeichnen wir mit a(π, l) die Anzahl der Zyklen der L¨ange l von π. Satz 6. Es seien α, β ∈ Sn . Genau dann sind α und β konjugiert in Sn , wenn a(α, l) = a(β, l) gilt f¨ ur l := 1, . . . , n. Beweis. Es sei α = γ1 · · · γs mit disjunkten zyklischen Permutationen γi . Dann ist π −1 απ = π −1 γ1 ππ −1 γ2 π · · · π −1 γs π. ur l := 1, . . . , Ist β = π −1 απ, so folgt mit Satz 5 hieraus, dass a(α, l) = a(β, l) ist f¨ n. Es gelte a(α, l) = a(β, l) f¨ ur alle fraglichen l. Ferner sei neben α = γ1 · · · γs auch β in disjunkte zyklische Permutationen δ1 , . . . , δs zerlegt. Wir d¨ urfen annehmen, ur alle i die gleiche L¨ange haben, da disjunkte Permutationen ja dass γi und δi f¨ vertauschbar sind. Es sei γi = (ci,1 , . . . , ci,r(i) ) und δi = (di,1 , . . . , di,r(i) ) f¨ ur i := 1, . . . , s. Weil Sn eine n-fach transitive Gruppe ist, gibt es ein π ∈ Sn mit ur alle i und j. Mit Satz 5 folgt π −1 γi π = δi . Hieraus folgt schließlich cπij = dij f¨ π −1 απ = β. Hat Cauchy eine oder mehrere Permutationen, so nennt er die Produkte, die er aus ihnen bilden kann, abgeleitete Permutationen. Die gegebenen Permutationen
374
Kapitel XIII. Galois
zusammen mit den abgeleiteten nennt er System von konjugierten Permutationen. Die Ordnung eines solchen Systems ist die Anzahl seiner Elemente. Wir sprechen heute von Untergruppen. Er bemerkt ausdr¨ ucklich, dass alle Permutationen zusammengenommen eine Untergruppe bilden. Dabei ist ihm nicht die Sprache im Wege, da sein Begriff syst`eme de permutations conjugu´ees nicht das irritierende unter“ enth¨ alt. ” Er bemerkt ferner, dass f¨ ur Untergruppen P und Q der Sn genau dann P Q eine Untergruppe ist, wenn P Q = QP ist. Er beweist mit den Standardbeweisen, dass die Ordnung einer Untergruppe der Sn Teiler von n! ist. Er beweist auch, dass die Ordnung einer Untergruppe von den Ordnungen ihrer Elemente geteilt wird. Was er nicht erw¨ ahnt, ist, dass die Ordnung einer Untergruppe auch von allen Ordnungen ihrer Untergruppen geteilt wird. Seit Ruffini weiß man, dass nicht alle Teiler von n! auch Ordnungen von Untergruppen der Sn sind. So ist es nicht verwunderlich, dass Cauchy in seiner Arbeit auch verschiedene Konstruktionsm¨oglichkeiten f¨ ur Untergruppen angibt. Die spektakul¨ arste Konstruktion ist die der p-Sylowgruppen. Dieser Konstruktion wollen wir uns nun zuwenden. ochste Potenz Ist G eine endliche Gruppe, ist p eine Primzahl und ist pr die h¨ von p, die in |G| aufgeht, so heißt jede Untergruppe P von G, deren Ordnung pr ist, eine p-Sylowgruppe von G. Wir werden sehen, dass jede Gruppe p-Sylowgruppen enth¨ alt. Zun¨ achst aber zeigen wir das f¨ ur die symmetrischen Gruppen. Der Name Sylowgruppe“ wird im n¨ achsten Abschnitt klar werden. ” Ist x ∈ R, so bezeichne wieder x die ganze Zahl mit x ≤ x < x + 1. Der n¨ achste Satz stammt laut Dickson von Legendre, wobei Dickson die zweite Auflage des Essai sur la th´eorie des nombres (Paris 1808, S. 8) zitiert (Dickson 1919, Bd. I). In der ersten Auflage, der einzigen, die ich eingesehen habe, findet sich der Satz nicht. Cauchy beweist ihn in einer langen Fußnote, ohne auf Legendre zu verweisen (Werke auf den Seiten 220/221). ochste Satz 7. Ist n eine nat¨ urliche Zahl, ist p eine Primzahl und ist pf die h¨ Potenz von p, die n! teilt, so ist f=
1 ∞ 0 n i:=1
pi
.
∞ ur alle i ∈ N und daher i:=1 pni = 0. Beweis. Ist n < p, so ist pni = 0 f¨ Es ist aber auch f = 0, da aus p teilt n! ja folgt, dass p einen der Faktoren des n Produktes i:=1 i teilt. Dann ist aber p ≤ n. Es sei nun p ≤ n und der Satz gelte f¨ ur alle m < n. Dann gilt er insbesondere f¨ ur m := np . Dann sind 1p, 2p, 3p, . . . , mp die s¨amtlichen durch p teilbaren n ochste Potenz von p ist, die in m! · Faktoren von i:=1 i. Es folgt, dass pf die h¨ ochste Potenz von p, die in m! aufgeht. Nach pm aufgeht. Somit ist pf −m die h¨
1. Cauchy 1815 und 1844
375
Induktionsannahme ist f −m=
1 ∞ 0 m i:=1
pi
.
n ist f¨ ur alle Mit dem Satz aus Abschnitt 8 des Kapitels 1 folgt, dass pmi = pi+1 i. Daher ist 0 1 1 1 ∞ 0 ∞ 0 n n n f= = . + p pi+1 pi i:=1 i:=1
Hier noch eine Definition. Es sei p eine Primzahl. Eine abelsche Gruppe heißt elementarabelsche p-Gruppe, wenn f¨ ur alle ihre Elemente ap = 1 gilt. Elementarabelsche p-Gruppen sind nichts Anderes als Vektorr¨ aume u ¨ ber GF(p). Der Leser lasse sich nicht dadurch irritieren, dass die Verkn¨ upfung hier multiplikativ geschrieben und der K¨ orper GF(p) nicht unmittelbar zu sehen ist. Der n¨achste Satz gibt Cauchy Anlass, die P¨ unktcheninduktion zu pflegen. Sie zeigt hier ihre Grenzen. Der Klarheit wegen benutze ich deshalb Induktion in der Form, wie wir sie heute in unserem Studium lernen. Satz 8. Es sei p eine Primzahl und h und n seien nat¨ urliche Zahlen mit hp ≤ n. Es sei ferner ϕ eine injektive Abbildung von {1, . . . , h} × {1, . . . , p} in {1, . . . , n}. Wir definieren p-Zyklen Pi durch Pi := (ϕi,1 , ϕi,2 , . . . , ϕi,p ) ur alle i und j. Ferner gilt f¨ ur i := 1, . . . , h. Dann gilt Pi Pj = Pj Pi f¨ P1l1 P2l2 · · · Phlh = 1 genau dann, wenn l1 ≡ l2 ≡ . . . ≡ lh ≡ 0 mod p ist. Ist E := P1 , . . . , Ph , so ist E eine elementarabelsche p-Gruppe der Ordnung ph . Es sei U eine Untergruppe von Sh . Ist λ ∈ U und ist x ∈ {1, . . . , n}, so ¯ definieren wir xλ wie folgt: Ist x = ϕi,j , so setzen wir ¯
xλ := ϕiλ,j . ¯ ¯ ein MonomorIst x nicht von dieser Form, so setzen wir xλ = x. Dann ist λ → λ phismus von U in Sn . Das Bild von U unter diesem Monomorphismus bezeichnen ¯ . F¨ wir mit U ur λ ∈ U gilt ¯ = Piλ ¯ −1 Pi λ λ
¯ = {1} und f¨ ur i := 1, . . . , h. Es ist E ∩ U ¯ = ph |U |. |E U|
376
Kapitel XIII. Galois
¯ /E und U isomorph. Schließlich sind E U Beweis. Da Pi und Pj f¨ ur i = j disjunkt sind, gilt Pi Pj = Pj Pi f¨ ur alle i und j (nat¨ urlich auch f¨ ur i = j). Es ist o(Pi ) = p und daher P1l1 · · · Phlh = 1, wenn alle li durch p teilbar sind. Es sei P1l1 · · · Phlh = 1. Dann ist P
l1
ϕi,j = ϕi,j1
l
···Phh
P
li
= ϕi,ji
f¨ ur alle i und alle j. Es folgt Pili = 1 f¨ ur alle i und damit li ≡ 0 mod p f¨ ur alle i. ur alle i und j, so ist Es seien λ, μ ∈ U . Ist x = ϕi,j f¨ ¯
¯
xλμ = x = (xλ )μ¯ = xλ¯μ . Es sei x = ϕi,j . Dann ist ¯
¯
¯ μ λ¯ μ xλμ = ϕiλμ,j = ϕμiλ,j = ϕλ¯ i,j = x .
¯ μ. Also ist λμ = λ¯ ¯ ¯ Ist λ = 1, so ist ϕi,j = ϕλi,j = ϕiλ,j f¨ ur alle i und j. Weil ϕ injektiv ist, folgt i = iλ f¨ ur alle i und damit λ = 1, so dass das Queren ein Monomorphismus von Sh in Sn ist. Ist x = ϕi,j f¨ ur alle i und j, so ist ¯ −1 Pi λ ¯
xλ
= x = xPiλ .
Es sei x = ϕk,j . Ist k = iλ, so ist i = kλ−1 und daher ¯ −1
xλ
¯ −1
¯
λ Piλ iλ −1 = ϕP . kλ−1 ,j = ϕkλ−1 ,j = ϕkλ λ,j = x = x
Ist k = iλ, so folgt ¯ −1 Pi λ ¯
xλ
¯
¯
Piλ Piλ λ Piλ iλ = ϕP . iλλ−1 = ϕi,j+1 = ϕiλ,j+1 = ϕiλ,j = ϕk,j = x
Damit ist gezeigt, dass
¯ −1 Pi λ ¯ = Piλ λ
ist. E l¨ asst alle Mengen {ϕi,1 , . . . , ϕi,p } fest, w¨ahrend jedes von 1 verschiedene E¯ wenigstens eine dieser Mengen auf eine andere abbildet. Also ist lement aus U ¯ normalisiert wird, wie gerade gesehen, ¯ E ∩ U = {1}. Weil die Menge der Pi von U
1. Cauchy 1815 und 1844
377
¯ normalisiert. Also ist E U ¯ eine Gruppe und E ist Normalteiler wird auch E von U ¯ . Schließlich ist in E U ¯ /E ∼ ¯ /(U ¯ ∩ E) = U ¯ /{1} ∼ ¯∼ EU =U =U = U. Damit ist alles bewiesen. Korollar. W¨ ahlt man in Satz 8 f¨ ur h die Zahl np und f¨ ur U eine p-Sylowgruppe von Sh , so ist ¯ Π := E U eine p-Sylowgruppe von Sn . Ferner ist E ein elementarabelscher Normalteiler von ¯ = {1}. Π und es gilt E ∩ U Genau dann ist Π abelsch, wenn n < p2 ist. Beweis. Nach Satz 8 und Satz 7 ist ¯ | = ph |U | |Π| = ph |U und |U | = pg mit g =
∞
h i:=1 pi .
h+g =
Nach Satz 1 ist dann
1 1 0 1 ∞ 0 ∞ 0 n n n = . + p pi+1 pi i:=1 i:=1
Nach Satz 7 ist Π daher eine p-Sylowgruppe von Sn . ¯ die Gruppe E zentralisiert, dh., elementweise Genau dann ist Π abelsch, wenn U mit den Elementen von E vertauschbar ist. Dies ist genau dann der Fall, wenn U = {1} ist, dh., wenn p2 > n ist. Kommentar. Die Konstruktion der p-Sylowgruppe von Sn zeigt das Folgende: alt Π einen elementaraIst Π eine p-Sylowgruppe von Sn und ist m = np , so enth¨ belschen Normalteiler N der Ordnung pm und eine Untergruppe U mit Π = N U , N ∩ U = {1} und U ist isomorph der p-Sylowgruppe von Sm . n Hieraus folgt wiederum: Ist t dadurch bestimmt, dass 0 = pnt und 0 = pt+1 ist, so enth¨ alt Π eine Folge {1} = N0 , N1 , N2 , . . . , Nt = Π von Normalteilern mit N1 ⊆ N2 ⊆ . . . ⊆ Nt , so dass Ni+1 /Ni eine elementarabelsche p-Gruppe der Ordnung p
n pi+1
ist f¨ ur i := 0, . . . , t − 1. Die cauchysche Arbeit endet mit einem Abschnitt, der noch einen weiteren H¨ ohepunkt enth¨ alt, n¨ amlich den Satz, dass eine Untergruppe der Sn , deren Ordnung durch eine Primzahl p teilbar ist, ein Element der Ordnung p enth¨ alt. Der
378
Kapitel XIII. Galois
Hauptsatz in diesem Abschnitt lautet — etwas bequemer in heutiger Sprache formuliert — Satz 9. Es seien P und Q Untergruppen der Sn . Ist I die Anzahl der ρ ∈ Sn mit ρP ∩ Qρ = {ρ}, so ist I ≡ n! mod |P ||Q|. Beweis. Der Beweis benutzt Doppelnebenklassen. Es sei Σ die Menge der σ mit σP ∩ Qσ = {σ}. Dann ist |Σ| = n! − I. Wir zeigen zun¨ achst, dass |QσP | = |P ||Q| ist. Dazu seien π, π ∈ Q und ρ, ρ ∈ P und es gelte πσρ = π σρ . Dann ist σρρ−1 = π −1 π σ. Ferner ist ρρ−1 ∈ P und π −1 π ∈ Q. Wegen σP ∩ Qσ = {σ} ist also ρρ−1 = 1 = π −1 π und damit ρ = ρ und π = π . Also ist in der Tat |QσP | = |P ||Q|. Es seien σ, τ ∈ Σ und es gelte QσP ∩ Qτ P = ∅. Es gibt dann π, π ∈ Q und ρ, ρ ∈ P mit πσρ = π τ ρ . Es folgt τ = π −1 πσρρ−1 ∈ QσP . Es folgt weiter Qτ P ⊆ QσP und damit Qτ P = QσP . Wegen σ = 1σ1 ∈ QσP gilt $ QσP. Σ⊆ σ∈Σ
Ist andererseits τ = πσρ mit σ ∈ Σ, so folgt aus ξ ∈ τ P ∩ Qτ die Existenz von π ∈ Q und ρ ∈ P mit ξ = τ ρ = π τ . Es ist also πσρρ = π πσρ. Es folgt σρρ ρ−1 = π −1 π πσ = σ. Also ist ρ = π = 1. Somit ist τ ∈ Σ. Es gilt also $ Σ= QσP. σ∈Σ
Aus all diesem folgt, dass |Σ| durch |P ||Q| teilbar ist. Das ist aber gleichbedeutend damit, dass I ≡ n! mod |P ||Q|
2. Die sylowschen S¨ atze
379
ist. Satz 10. Es sei p eine Primzahl und U sei eine Untergruppe der Sn , deren Ordnung durch p teilbar sei. Dann enth¨ alt U ein Element der Ordnung p. Beweis. Es sei P eine nach Satz 6 existierende p-Sylowgruppe der Sn . Dann ist |P ||U | durch p|P | teilbar, n! aber nicht. Folglich kann das I aus Satz 9 nicht 0 sein. Es gibt also ein ρ ∈ Sn mit ρP ∩ U ρ = {ρ}. Es gibt also ein τ ∈ ρP ∩ U ρ, welches von ρ verschieden ist. Es folgt 1 = τ ρ−1 ∈ τ P τ −1 ∩ U. Somit ist τ ρ−1 ein von 1 verschiedenes Element von U , dessen Ordnung als Teiler von |τ P τ −1 | = |P | eine Potenz von p ist. Hieraus folgt die Behauptung. Satz 10 wird von Gruppentheoretikern gemeinhin Satz von Cauchy“ genannt. ” Der sch¨onste Beweis f¨ ur ihn findet sich in McKay 1959. Er ist reproduziert in L¨ uneburg 1999a, S. 52. 2. Die sylowschen S¨ atze. Der cauchysche Satz, dass jede Permutationsgruppe, deren Ordnung durch die Primzahl p teilbar ist, ein Element der Ordnung p enth¨ alt, l¨ asst sich auch so interpretieren, dass eine solche Gruppe eine Untergruppe der Ordnung p enth¨ alt. So interpretierte P. Sylow diesen Satz und verallgemeinerte ihn in der Weise, dass er zeigte, dass jede Permutationsgruppe G eine Untergruppe alt, wenn pa eine in |G| aufgehende Potenz einer Primzahl p der Ordnung pa enth¨ ist (Sylow 1872). Ist pa die h¨ ochste Potenz von p, die in |G| aufgeht, so heißen die Untergruppen der Ordnung pa heute p-Sylowgruppen, wie schon gesagt. Die Menge aller p-Sylowgruppen der Gruppe G bezeichnen wir mit Sylp (G). Sylow zeigte nicht nur, dass Sylp (G) nicht leer ist, sondern auch, dass alle p-Sylowgruppen konjugiert sind und dass ihre Anzahl kongruent 1 modulo p ist. Um diese S¨atze wird es hier nun gehen. Sylow benutzte bei seinem Beweis, dass G eine Permutationsgruppe ist. Ist ur n¨ amlich G ⊆ Sn , so gibt es ein f ∈ Q[x1 , . . . , xn ] mit der Eigenschaft, dass f¨ alle σ ∈ Sn genau dann f σ = f gilt, wenn σ ∈ G ist. Diesen Sachverhalt benutzt er an verschiedenen Stellen seines Beweises. Er zitiert in diesem Zusammenhang nichts, verweist vielmehr zu Beginn seiner Arbeit auf Jordans Trait´e, dessen Bezeichnungen und Ergebnisse er u ¨bernehme. Der fragliche Satz folgt unmittelbar aus dem galoisschen Lemme II, das wir in Abschnitt 6 samt der erw¨ahnten Folgerung kennen lernen werden. Dieses Lemma steht bei Jordan auf S. 254. Auch Netto benutzt solche zu Gruppen passenden Funktionen kommentarlos bei seinem Nachweis der Existenz von Sylowgruppen, wobei er im Gegensatz zu Sylow nicht benutzt, dass eine Gruppe G, deren Ordnung durch die Primzahl p teilbar ist, ein Element der Ordnung p enth¨ alt. Die Sylowgruppen der Sn braucht er aber auch zu seinem Beweis (Netto 1878). Frobenius missfiel, dass Sylow und Netto die symmetrische Gruppe bei ihren Beweisen ins Spiel brachten, die doch mit dem Resultat nichts zu tun h¨ atte. Er gibt
380
Kapitel XIII. Galois
einen Beweis, bei der G eine abstrakte, endliche Gruppe ist. Diesen Beweis, der im hundertsten Band des Crelle-Journals erschien, werde ich gleich vortragen. Zuvor jedoch m¨ochte ich einiges aus der Arbeit von Frobenius erz¨ ahlen, die im darauf folgenden Band des Crelle-Journals erschien. Dort untersucht er systematisch die von Cauchy, Sylow und Netto benutzten Methoden und beweist mit ihnen die sylowschen S¨atze, wobei er bei diesen Beweisen die Existenz der p-Sylowgruppen der Sn benutzt. Bei meiner Darstellung dieser seiner Beweise benutze ich heutige Terminologie. Frobenius untersucht zun¨ achst Doppelnebenklassen nach zwei Untergruppen einer gegeben Gruppe. Es seien U und V Untergruppen der Gruppe G. Wir lassen ihr direktes Produkt U × V auf G als Operatorgruppe wirken verm¨ oge g (u,v) := u−1 gv. Die Bahnen von U × V bei dieser Wirkung sind die Mengen U gV . Man nennt sie Doppelnebenklassen nach den Untergruppen U und V . ur alle x, g ∈ G. Das Potenzieren Ist G eine Gruppe, so setzen wir xg = g −1 xg f¨ mit g ist also das Konjugieren mit g in G. Die Informationen der S¨ atze 1 und 2 sind u ¨ ber den ganzen ersten Abschnitt von Frobenius 1887b verstreut. Zu Beginn des dritten werden sie noch einmal zusammengefasst. Satz 1. Es sei G eine endliche Gruppe und U und V seien Untergruppen von G. Ist g ∈ G, so ist |U ||V | . |U gV | = g |U ∩ V | Beweis. Es ist ugv → g −1 ugv eine Bijektion von U gV auf g −1 U gV . Daher ist nach Satz 4 von Abschnitt 6 des Kapitels 12 |U gV | = |g −1 U gV | =
|U ||V | |U g ||V | = g . |U g ∩ V | |U ∩ V |
Satz 2. Es seien U und V Untergruppen der endlichen Gruppe G. Sind x1 , . . . , xt Vertreter der Doppelnebenklassen von G nach U und V , so ist |G| =
t
|U ||V | . |U xi ∩ V | i:=1
Beweis. Dies folgt mit Satz 1 und der Bemerkung, dass die Doppelnebenklassen nach zwei Untergruppen paarweise disjunkt sind. Der n¨achste Satz sagt u. A., dass jede Untergruppe der endlichen Gruppe G eine p-Sylowgruppe hat, wenn nur G eine hat.
2. Die sylowschen S¨ atze
381
Satz 3. Es sei G eine endliche Gruppe und V sei eine Untergruppe von G. Ferner sei p eine Primzahl und P ∈ Sylp (G). Es gibt dann ein g ∈ G, so dass P g ∩ V eine p-Sylowgruppe von V ist. Beweis. Es sei x1 , . . . , xt ein Vertretersystem der Doppelnebenklassen nach P und V . Nach Satz 2 ist dann |G| = |P |
t
|V | . xi ∩ V | |P i:=1
Weil |P | die h¨ ochste Potenz von p ist, die in |G| aufgeht, k¨ onnen nicht alle |V | |P xi ∩ V | ochste Potenz von p durch p teilbar sein. Es gibt also ein i, so dass |P xi ∩ V | die h¨ ist, die in |V | aufgeht. Also ist P xi ∩ V ∈ Sylp (V ). Erster Satz von Sylow. Ist G eine endliche Gruppe und ist p eine Primzahl, die |G| teilt, so enth¨ alt G eine p-Sylowgruppe. Beweis. Man bette G verm¨ oge der Wirkung x → xg in SG ein Nach dem Korollar zu Satz 6 des letzten Abschnitts hat S|G| und damit auch SG eine p-Sylowgruppe. Mit Satz 3 folgt dann, dass auch G eine p-Sylowgruppe hat. Frobenius sagt bei seinem Beweise nur, dass man jede Gruppe als Permutationsgruppe auffassen k¨ onne, und schließt dann weiter, wie gesehen. Explizit findet sich dieser Trick, G verm¨ oge der Wirkung x → xg in SG einzubetten, schon in Frobenius & Stickelberger 1879, S. 230 und Frobenius weist in seiner Arbeit 1887a, S. 179, ausdr¨ ucklich auf diese Stelle hin und darauf, dass man mit Hilfe dieses Tricks den sylowschen Satz f¨ ur alle endlichen Gruppen beweisen k¨ onne, was er dann in 1887b tut. Diese Einbettung von G in SG findet sich auch in Burnside 1911/ 1955, S. 22. Burnside verweist dort in einer Fußnote auf Jordans Trait´e S. 60/61. Dort findet sich diese Einbettung aber nicht. Jordan beweist dort vielmehr, dass transitive Untergruppen der Ordnung n der Sn stets in Paaren sich gegenseitig zentralisierender Gruppen auftreten. Dies entspricht den beiden Wirkungen x → xg bzw. x → gx von G auf sich, die bei abelschen Gruppen nat¨ urlich identisch sind. Dass diese beiden Wirkungen sich zentralisieren, liegt an der G¨ ultigkeit des Assoziativgesetzes. Diese Einbettung von G in SG als Satz formuliert, heißt in der Literatur auch Satz von Cayley (Zassenhaus 1958, S. 6, M. Hall 1962, S. 9). Beide Autoren geben kein Zitat. Ich weiß auch keines. Korollar. Es sei G eine endliche Gruppe und p sei eine Primzahl. Ist Q eine p-Untergruppe von G, so gibt es ein P ∈ Sylp (G) mit Q ⊆ P . Beweis. Nach dem ersten Satz von Sylow gibt es ein P ∈ Sylp (G). Mit V = Q folgt aus Satz 3 die Existenz eines g ∈ G, so dass P g ∩ Q eine p-Sylowgruppe
382
Kapitel XIII. Galois
von Q ist. Weil Q eine p-Gruppe ist, ist also Q = P g ∩ Q ⊆ P g , so dass P g eine p-Sylowgruppe ist, die Q enth¨ alt. Auch dieses Korollar findet sich schon bei Sylow. Zweiter Satz von Sylow. Ist G eine endliche Gruppe, so sind alle p-Sylowgruppen von G konjugiert. Beweis. Dies folgt mit V ∈ Sylp (G) aus Satz 3. Dritter Satz von Sylow. Ist G eine endliche Gruppe und ist p eine Primzahl, die |G| teilt, so ist Sylp (G) ≡ 1 mod p. Beweis. Es sei P ∈ Sylp (G) Wir lassen P mittels des Konjugierens als Operatorgruppe auf Sylp (G) wirken. Dann l¨ asst P nat¨ urlich sich selbst fest. Ist Q ∈ Sylp (G) und normalisiert P die Gruppe Q, so ist P Q eine Untergruppe von G. Es gilt |P | ≤ |P Q| = |P |
|Q| . |P ∩ Q|
Weil die Zahl rechts eine Potenz von p ist, folgt |Q| = |P ∩ Q| und damit P = Q. Dies zeigt, dass P genau eine Bahn der L¨ ange 1 hat, n¨ amlich {P }. Die L¨ angen aller Bahnen sind nach Satz 1 von Abschnitt 1 des Kapitels 12 Teiler von |P | und daher Potenzen von p. Es folgt, dass die L¨ angen der von {P } verschiedenen Bahnen alle durch p teilbar sind. Daraus folgt die Behauptung, da |Sylp (G)| ja die Summe aller dieser L¨ angen ist. Wie schon gesagt, will Frobenius den sylowschen Satz f¨ ur abstrakte Gruppen beweisen. Dazu ist zu sagen, dass sich schon vor der Fassung des abstrakten Gruppenbegriffs durch Weber im Jahre 1893 einiges getan hatte. In einer Publikation von 1870 gab Kronecker eine abstrakte Beschreibung endlicher abelscher Gruppen. Seine Begr¨ undung f¨ ur dieses Unterfangen liest sich wie ein Programm f¨ ur die Entwicklung und Umstrukturierung der Mathematik in den k¨ unftigen Jahrzehnten, die mit Nicolas Bourbaki im 20. Jahrhundert ihren H¨ ohepunkt erreichte. Die u ¨ beraus einfachen Principien, auf denen die Gauss’sche Methode beruht, ” finden nicht blos an der bezeichneten Stelle, sondern auch sonst vielfach und zwar schon in den elementarsten Theilen der Zahlentheorie Anwendung. Dieser Umstand deutet darauf hin, und es ist leicht sich davon zu u ¨berzeugen, dass die erw¨ ahnten Principien einer allgemeineren, abstrakteren Ideeensph¨are (sic) angeh¨ oren. Deshalb erscheint es angemessen, die Entwickelung derselben von allen unwesentlichen Beschr¨ankungen zu befreien, so dass man alsdann einer Wiederholung derselben Schlussweise in den verschiedenen F¨ allen des Gebrauchs u ¨berhoben wird. Dieser Vortheil kommt sogar schon bei der Entwickelung selbst zur Geltung und die Darstellung gewinnt dadurch, wenn sie in der zul¨ assig allgemeinsten Weise gegeben wird, zugleich an Einfachheit und durch das deutliche Hervortreten des allein ¨ Wesentlichen auch an Ubersichtlichkeit.“
2. Die sylowschen S¨ atze
383
Es geht weiter mit der Beschreibung der Einzelheiten: Es seien ” θ , θ , θ , . . . Elemente in endlicher Anzahl und so beschaffen, dass sich aus je zweien derselben mittels eines bestimmbaren Verfahrens ein drittes ableiten l¨asst. Demnach soll, wenn das Resultat dieses Verfahrens durch f angedeutet wird, f¨ ur zwei beliebige Elemente θ und θ , welche auch mit einander identisch sein k¨onnen, ein θ existiert, welches gleich: f (θ , θ ) ist. Ueberdies soll: f (θ , θ ) = f (θ , θ ) f θ , f (θ , θ ) = f f (θ θ ), θ und aber, sobald θ und θ von einander verschieden sind, auch: f (θ , θ ) nicht identisch f (θ , θ ) sein. Dies vorausgesetzt, kann die mit f (θ , θ ) angedeutete Operation durch die Multiplikation der Elemente θ θ ersetzt werden, wenn man dabei an Stelle der vollkommenen Gleichheit eine blosse Aequivalenz einf¨ uhrt.“ In einer Fußnote verweist er darauf, dass man die Verkn¨ upfung auch additiv schreiben k¨ onne, wie es Gauß bei seiner Komposition von quadratischen Formen aus naheliegenden Gr¨ unden getan habe. In Kroneckers Beschreibung der endlichen abelschen Gruppen kommen das bzg. der Komposition neutrale Element und die Inversen nicht ausdr¨ ucklich vor. Ihre Existenz folgt aus der postulierten G¨ ultigkeit der K¨ urzungsregel und der Endlichkeit des Systems, wie Kronecker zeigt. Zw¨olf Jahre sp¨ ater verzichtet Heinrich Weber auf die Kommutativit¨ at der Verkn¨ upfung und definiert (Weber 1882): Ein System G von h Elementen irgend welcher Art, Θ1 , . . . Θh heisst eine ” Gruppe vom Grade h, wenn es den folgenden Bedingungen gen¨ ugt: I. Durch irgendeine Vorschrift, welche als Composition oder Multiplikation bezeichnet wird, leitet man aus zwei Elementen des Systems ein neues Element des Systems her. In Zeichen Θr Θs = Θt . II. Es ist stets (Θr Θs )Θt = Θr (Θs Θt ). III. Aus ΘΘr = ΘΘs und aus Θr Θ = Θs Θ folgt Θr = Θs . Die Existenz von Einselement und Inversem wird wieder aus III und der Endlichkeit des Systems gefolgert. F¨ ur die Definition der endlichen Gruppe verweist Frobenius in seiner Arbeit von 1887a auf die Arbeiten von Kronecker und Weber und wiederholt das webersche Axiomensystem. Dann beweist er den folgenden Satz. Ist G eine endliche Gruppe,
384
Kapitel XIII. Galois
alt G eine Untergruppe ist p eine Primzahl und teilt pn die Ordnung von G, so enth¨ der Ordnung pn . Der Leser beachte, dass der nun folgende, makellose Induktionsbeweis a¨lter ist als Dedekinds Was sind und was sollen die Zahlen“. ” Frobenius nimmt an, dass der Satz richtig sei f¨ ur alle Gruppen, deren Ordnung kleiner ist als die Ordnung von G. Die Verankerung bei |G| = p ist trivial und wird nicht weiter erw¨ahnt. Es sei Z(G) das Zentrum von G, f¨ ur das er keinen Namen verwendet. Es sei p Teiler von |Z(G)|. Will man sich nicht auf Cauchy berufen — und Frobenius will das ausdr¨ ucklich nicht —, so muss man hier nachweisen, dass Z(G) ein Element der Ordnung p enth¨ alt. Frobenius geht folgendermaßen vor. Er bezeichnet mit A, B, C, . . . die Elemente von Z(G) und mit a, b, c, . . . ihre Ordnungen. Ferner betrachtet er alle formalen Ausdr¨ ucke der Form Aα B β C γ . . . mit 0 ≤ α ≤ a − 1, 0 ≤ β ≤ b − 1, 0 ≤ γ ≤ c − 1, . . . Das sind abc . . . St¨ uck. Jedes Element von Z(G) l¨ asst sich als solch einen Ausdruck darstellen und jedes Element l¨asst sich gleich oft darstellen, n¨amlich sooft, wie sich die 1 darstellen l¨ asst. Dies sieht man, wenn man die Elemente X und XAα B β C γ . . . miteinander vergleicht. Also ist die Anzahl abc . . . dieser Ausdr¨ ucke durch |Z(G)| und damit durch p teilbar. aDann ist aber auch einer der Faktoren, etwa a, durch p teilbar. Damit ist in A p ein Element der Ordnung p in Z(G) gefunden. Insbesondere enth¨ alt Z(G) eine Untergruppe P der Ordnung p. Die Ordnung der Faktorgruppe alt daher eine Untergruppe Q/P der Ordnung G/P ist durch pn−1 teilbar. Sie enth¨ pn−1 , so dass Q eine Untergruppe der Ordnung pn von G ist. Es sei nun p kein Teiler von |Z(G)|. Es sei x1 , . . . , xt ein Vertretersystem der Konjugiertenklassen von G, die mehr als ein Element enthalten. Dann gilt die Klassengleichung (Kap. 9, Absch. 5) t |G| = Z(G) +
|G| . |C G (xi )| i:=1
Weil |G| durch p teilbar ist, |Z(G)| aber nicht, gibt es ein i, so dass |G| |CG (xi )| nicht durch p teilbar ist. Es folgt, dass pn Teiler von |CG (xi )| ist. Andererseits ist |G| ≥2 |CG (xi )| und folglich |CG (xi )| < |G|. Nach Induktionsannahme enth¨ alt dann CG (xi ) und dann auch G eine Untergruppe der Ordnung pn .
3. Au߬ osbare Gruppen
385
Frobenius sagt zu seinem Beweis, dass er Methoden ben¨ utze, die Sylow entwickelt habe. Damit meint er die Klassengleichung, die er noch nicht so nennt. Was das Rechnen mit Faktorgruppen anbelangt, so ist es Frobenius auch noch nicht so gel¨aufig wie uns. Er zitiert als Vorbilder obige Arbeit von Kronecker und eine Arbeit von Camille Jordan aus dem ersten Band des Bulletin de la soci´et´e math´ematique de France. Das Erscheinungsjahr verschweigt er. Es ist das Jahr 1873. 3. Aufl¨ osbare Gruppen. Als P. Sylow seine Arbeit schrieb, war der von Galois entdeckte Zusammenhang zwischen algebraischen Gleichungen und endlichen Gruppen schon bekannt. Dedekind hatte ja schon die galoissche Theorie in seinen G¨ ottinger Vorlesungen von 1856/57 und 1857/58 vorgetragen und C. Jordan ihr in seinem Trait´e breiten Raum einger¨aumt. Jordan nennt die Gruppe einer Gleichung aufl¨ osbar , wenn die Gleichung durch Radikale l¨ osbar ist (Jordan 1870, Nr. 517, S. 385). Er folgert, dass solche Gruppen eine Kette von Untergruppen {1} = Nt ⊆ Nt−1 ⊆ . . . ⊆ N1 ⊆ N0 = G besitzen, so dass f¨ ur i := 0, . . . , t − 1 die Gruppe Ni+1 in Ni normal ist und dass der Index von Ni+1 in Ni eine Primzahl ist (Jordan, Nr. 530, S. 387). Jordan kannte zu diesem Zeitpunkt noch nicht den Begriff der Faktorgruppe. Wir nennen im Folgenden, orientiert an dieser Eigenschaft der im jordanschen Sinne aufl¨ osbaren Gruppen, eine endliche Gruppe G aufl¨ osbar , wenn sie eine bei {1} endende Kette von Untergruppen Ni besitzt, so dass Ni+1 in Ni normal ist und dass Ni /Ni+1 eine zyklische Gruppe von Primzahlordnung ist. Es erhebt sich dann die Frage, ob Gruppen, die in diesem Sinne aufl¨ osbar sind, stets auch Gruppen von Gleichungen u ¨ber Q sind, die dann, wie die Theorie sagt, durch Radikale l¨ osbar ˇ ˇ sind. Sie sind es, wie Safareviˇ c zeigte (Safareviˇ c 1954). Was das Umkehrproblem der galoisschen Theorie anbelangt, ob n¨amlich jede endliche Gruppe die Gruppe einer Gleichung u ¨ber Q ist, so belassen wir es in diesem Buche bei dieser Bemerkung und bei dem, was wir in Abschnitt 9 von Kapitel 9 u ¨ber die endlichen abelschen Gruppen gesagt haben. Den Stand der Dinge im Jahre 1979 schildert Jehne (Jehne 1979). Neueren Datums ist das Buch von Malle und Matzat zu diesem Gegenstand, das 1999 erschienen ist. Zyklische Gruppen sind aufl¨ osbar, wovon schon Gauß bei seinen Untersuchungen der Kreisteilungsgleichungen profitierte. Allgemeiner gilt, dass auch endliche abelsche Gruppen aufl¨ osbar sind, wie leicht durch Induktion zu beweisen ist. Denkt man einen Augenblick u ¨ ber den n¨ achsten Satz nach, der ebenfalls in der sylowschen Arbeit steht, so sieht man, dass er u. A. besagt, dass auch endliche p-Gruppen aufl¨ osbar sind. Satz 1. Es sei p eine Primzahl und G sei eine endliche Gruppe der Ordnung pt . Es gibt dann Elemente θ1 , . . . , θt ∈ G, so dass gilt: a) F¨ ur i := 1, . . . , t gibt es k1 , . . . , ki−1 ∈ N0 mit k
i−1 θip = θ1k1 θ2k2 . . . θi−1 .
386
Kapitel XIII. Galois
Dabei ist f¨ ur i = 1 die rechte Seite als 1 zu interpretieren. b) Ist ϑ ∈ G, so gibt es i1 , . . . it ∈ N0 mit 0 ≤ ik < p und ϑ = θ1i1 θ2i2 θ3i3 . . . θtit . c) Ist ϑ ∈ G und 1 ≤ i ≤ t, so gibt es α1 , . . . αi−1 ∈ N0 mit i−1 ϑ−1 θi ϑ = θ1α1 . . . θi−1 θi .
α
α
i−1 (F¨ ur i = 1 ist θ1α1 . . . θi−1 als 1 zu interpretieren.) Beweis. Sylow l¨asst G verm¨oge Konjugation auf sich als Operatorgruppe wirken, wobei er ausdr¨ ucklich darauf hinweist, dass man auf diese Weise wegen der Identit¨ at h−1 g −1 xgh = (gh)−1 x(gh)
eine Gruppe von Permutationen erhielte. Die L¨ ange der Bahnen bei dieser Wirkung sind alle von der Form pa mit a ∈ N0 . Die Identit¨ at bildet eine Bahn der L¨ ange 1. Also erh¨ alt man eine Gleichung der Form pt = 1 + pa + pb + . . . Hieraus folgt, dass wenigstens p − 1 der Exponenten a, b, . . . null sind. Es ist also |Z(G)| ≥ p. Es gibt also ein θ1 der Ordnung p in Z(G). Es sei P die von θ1 erzeugte Untergruppe von G. Dann ist P als Untergruppe des Zentrums ein Normalteiler von G und die Gruppe G/P hat die Ordnung pt−1 , so dass Induktion zum Ziele f¨ uhrt. Dies ist die Struktur von Sylows Beweis, wenn er auch umst¨ andlicher argumentiert. Dies liegt vor allem daran, dass seine Gruppen, auch die nicht explizit eingef¨ uhrten Faktorgruppen, stets Permutationsgruppen sein m¨ ussen. Er konstruiert auch nur die Elemente θ1 , θ2 , θ3 und sagt dann: So fortfahrend beweist man ” den folgenden Satz“. Seine Induktion ist also eine P¨ unktcheninduktion. Und mitten in diesem Beweis die Klassengleichung mit ihrer typischen Anwendung. ur i ≥ 1, so ist Ni Ist N0 := {1} und ist Ni das Erzeugnis von θ1 , . . . , θi f¨ Normalteiler der Gruppe G. Ferner ist Ni /Ni−1 eine Untergruppe der Ordnung p von Z(G/Ni−1 ). Insbesondere gilt also Korollar. Endliche p-Gruppen sind aufl¨ osbar. Sylow formuliert das so, dass Gleichungen, deren Gruppen p-Gruppen sind, durch Radikale l¨ osbar sind. Studieren wir aufl¨ osbare Gruppen etwas systematischer! Sind a und b Elemente der Gruppe G, so setzen wir [a, b] := a−1 b−1 ab und nennen [a, b] den Kommutator von a und b. Dieser Name wurde von Dedekind eingef¨ uhrt (Dedekind 1897). Im Titel dieser Arbeit kommt der Begriff Normalteiler“ vor. Diesen Namen h¨ atte ” Weber in seinem Algebrabuch von 1895 statt der bis dahin u ¨blichen Namen ausgezeichneter oder invarianter oder eigentlicher Teiler eingef¨ uhrt (Band I, S. 511.
3. Au߬ osbare Gruppen
387
Zitiert nach Dedekind 1897). Siehe hierzu Abschnitt 8 dieses Kapitels. Stichwort Normalk¨orper“. ” G. A. Miller reagierte sofort auf die dedekindsche Arbeit (Miller 1898). Er definierte die Kommutatorgruppe G der Gruppe G als das Erzeugnis der Kommutatoren [a, b] mit a, b ∈ G. Dies ist eine charakteristische Untergruppe von G, wobei eine Untergruppe charakteristisch heißt, wenn sie unter allen Automorphismen von G invariant bleibt. F¨ ur den Begriff der charakteristischen Untergruppe zitiert er Frobenius, Sitzungsberichte der Berliner Akademie, 1895, p. 183. Charakteristische Untergruppen sind stets auch Normalteiler. Ferner gilt: Ist U charakteristisch in G und V charakteristisch in U , so ist V charakteristisch in G, und ist U normal in G und V charakteristisch in U , so ist V normal in G. Miller stellt nun fest, dass G der Normalteiler von G mit gr¨oßter abelscher Faktorgruppe ist. Wir formulieren diesen Satz etwas anders. Satz 2. Es sei G eine Gruppe und U sei eine Untergruppe von G. Genau dann ist U ein Normalteiler von G mit abelscher Faktorgruppe, wenn G ⊆ U ist. Beweis. Es sei U ein Normalteiler von G und G/U sei abelsch. Sind g, h ∈ G, so ist ghU = gU hU = hU gU = hgU und damit [g, h] ∈ U . Hieraus folgt G ⊆ U . Es sei umgekehrt G ⊆ U . Ferner sei u ∈ U und g ∈ G. Es folgt ug = g −1 ug = u[u, g] ∈ U G = U. Also ist U normal in G. Wegen [g, h] ∈ G ⊆ U ist gU hU = ghU = hgg −1 h−1 ghU = hg[g, h]U = hgU = hU gU. Also ist G/U abelsch. Mit Miller definieren wir weiter die Gruppe G(n) rekursiv durch G(0) := G und G(n+1) := G(n) . Die Reihe G(0) , G(1) , . . . heißt die Kommutatorreihe der Gruppe G. Die G(i) sind allesamt charakteristische Untergruppen von G. Miller charakterisiert nun die aufl¨ osbaren Gruppen mittels ihrer Kommutatorreihe. Satz 3. Es sei G eine endliche Gruppe. Genau dann ist G aufl¨ osbar, wenn es ein t ∈ N gibt mit G(t) = {1}. Beweis. Miller zitiert Jordans Trait´e bei seinem Beweis, wobei er dem Leser noch ein paar eigenst¨andige Schritte abverlangt. Wir argumentieren wie folgt. Es sei G aufl¨ osbar. Es gibt dann eine Kette {1} = Nt ⊆ Nt−1 ⊆ . . . ⊆ N1 ⊆ N0 = G
388
Kapitel XIII. Galois
von Untergruppen Ni von G, so dass Ni+1 in Ni normal und Ni /Ni+1 eine zyklische Gruppe ist. Mit Satz 2 folgt G ⊆ N1 . Es sei G(i) ⊆ Ni . Dann folgt mit Satz 2 G(i+1) = (G(i) ) ⊆ Ni ⊆ Ni+1 . Also gilt G(i) ⊆ Ni f¨ ur alle i und damit G(t) ⊆ Nt = {1}. Also ist G(t) = {1}. Es gebe umgekehrt ein t mit G(t) = {1}. Die Gruppen G(i) /Gi+1 sind allesamt endliche abelsche Gruppen. Endliche abelsche Gruppen sind aber aufl¨ osbar, wie schon bemerkt. Daher l¨ asst sich die Kommutatorreihe zu einer Kette von Untergruppen verfeinern, in der der Nachfolger normal im Vorg¨ anger ist und bei der die entsprechenden Faktorgruppen zyklisch von Primzahlordnung sind. Damit ist G als aufl¨ osbar erkannt. Diese von Miller stammende Charakterisierung der aufl¨ osbaren Gruppen wird heute als Definition der aufl¨ osbaren Gruppen genommen. Mit ihr l¨ asst sich bequem Arbeiten, wie wir gleich sehen werden. Der Kenner wird sich hier an den Satz von Jordan-H¨ older erinnern, der bei meiner Darstellung im Hintergrund bleibt, dessen jordanscher Teil von Miller aber zitiert wird. Um ihn formulieren zu k¨ onnen, ben¨ otigt man den Begriff der Kompositionsreihe. Dies ist eine Kette von Untergruppen {1} = Nt ⊆ Nt−1 ⊆ . . . ⊆ N1 ⊆ N0 = G, so dass Ni+1 in Ni normal und die Faktorgruppe Ni /Ni+1 einfach ist, dh., nur die beiden trivialen Normalteiler {Ni } und Ni /Ni+1 hat. Dann lautet der Satz von Jordan-H¨ older: Ist G eine endliche Gruppe und sind {1} = Ms ⊆ Ms−1 ⊆ . . . ⊆ M1 ⊆ M0 = G und {1} = Nt ⊆ Nt−1 ⊆ . . . ⊆ N1 ⊆ N0 = G zwei Kompositionsreihen von G, so ist s = t und es gibt ein σ ∈ St , so dass Mi /Mi+1 und Nσ(i) /Nσ(i)+1 f¨ ur alle i isomorph sind . Der jordansche Anteil an diesem Satz ist der, dass die Zahlen |Mi |/|Mi+1 | und |Nσ(i) |/|Nσ(i)+1 | gleich sind (Jordan 1870, Nr. 54 und 55, S. 41 und H¨ older 1889). Diesen Satz werden wir nicht beweisen, da wir ihn im Folgenden nicht ben¨ otigen werden. Er ist hier nur der Vollst¨andigkeit halber erw¨ ahnt. Ist X Teilmenge der Gruppe G, so bezeichnen wir mit X die von X erzeugte Untergruppe von G, dh., den Schnitt u ¨ber alle Untergruppen von G, die X enthalten. Satz 4. Es sei G eine Gruppe und N sei ein Normalteiler von G. Dann ist (G/N )(i) = G(i) N/N
3. Au߬ osbare Gruppen
389
f¨ ur alle i ∈ N . Beweis. Es ist 3 3 2 2 (G/N ) = [gN, hN ] g, h ∈ G = [g, h]N g, h ∈ G = G N/N. Es gelte (G/N )(i) = G(i) N/N . Dann ist (G/N )(i+1) = (G(i) N/N ) = (G(i) N ) N/N ⊇ G(i+1) N/N. Andererseits gilt (G(i) N/N )/(G(i+1) N/N ) ∼ = G(i) N/G(i+1) N = G(i) G(i+1) N/G(i+1) N ∼ G(i) /(G(i) ∩ G(i+1) N ). = Wegen (G(i) ) = G(i+1) ⊆ G(i) ∩ G(i+1) N ist G(i) /(G(i) ∩ G(i+1) N ) nach Satz 2 abelsch. Also ist (G/N )(i+1) = (G(i) N/N ) ⊆ G(i+1) N/N. Hieraus folgt die Behauptung. Satz 5. Es sei G eine endliche Gruppe. Ist die Gruppe G aufl¨ osbar, so ist auch jede Untergruppe und jedes epimorphe Bild von G aufl¨ osbar. Beweis. Ist U Untergruppe von G, so folgt U (k) ⊆ G(k) f¨ ur alle k und insbesondere U (n) ⊆ G(n) = {1}, so dass U nach Satz 3 aufl¨ osbar ist. Es sei N ein Normalteiler von G. Ferner sei G(n) = {1}. Mit Satz 4 folgt (G/N )(n) = G(n) N/N = {N }. Also ist G/N nach Satz 3 aufl¨ osbar. Satz 6. Sind G und H aufl¨ osbare endliche Gruppen, so ist auch ihr direktes Produkt G × H aufl¨ osbar. Beweis. Es ist (G × H)(i) = G(i) × H (i) f¨ ur alle i, usw. Satz 7. Es sei G eine endliche Gruppe und M und N seien Normalteiler von G. Wir definieren die Abbildung ϕ von G in das direkte Produkt G/M × G/N durch g ϕ := (gM, gN ). Dann ist ϕ ein Homomorphismus von G in G/M × G/N mit dem Kern M ∩ N . Beweis. Trivial.
390
Kapitel XIII. Galois
Satz 8. Sind M und N Normalteiler der endlichen Gruppe G und sind G/M und G/N aufl¨ osbar, so ist auch G/(M ∩ N ) aufl¨ osbar. Beweis. Nach Satz 7 ist G/(M ∩ N ) isomorph einer Untergruppe von G/M × G/N . Also ist G/(M ∩ N ) nach Satz 6 und Satz 5 aufl¨ osbar. Der n¨achste Satz steht in Frobenius 1893. Ob dort zum ersten Male, weiß ich nicht. Satz 9. Ist N Normalteiler der endlichen Gruppe G und sind G/N und N aufl¨ osbar, so ist G aufl¨ osbar. Beweis. Es gibt ein k ∈ N mit {N } = (G/N )(k) = G(k) N/N. ur alle i. Weil auch N aufl¨ osbar ist, Folglich ist G(k) ⊆ N . Es folgt G(k+i) ⊆ N (i) f¨ gibt es ein m ∈ N mit G(k+m) ⊆ N (m) = {1}. Also ist auch G aufl¨ osbar. Satz 10. Es sei G eine endliche Gruppe. Genau dann ist G aufl¨ osbar, wenn jedes von {1} verschiedene epimorphe Bild von G einen von {1} verschiedenen abelschen Normalteiler hat. Beweis. Jedes von G verschiedene epimorphe Bild ist nach Satz 5 aufl¨osbar, falls G aufl¨ osbar ist. Es gen¨ ugt daher f¨ ur aufl¨ osbare Gruppen = {1} zu zeigen, dass sie einen nicht trivialen abelschen Normalteiler haben. Es sei also H = {1} aufl¨ osbar. Es gibt dann ein n ∈ N mit H (n) = {1} = H (n−1) . Nun ist H (n−1) normal in H und wegen H (n) = (H (n−1) ) ist H (n−1) auch abelsch. Es sei nun G eine von {1} verschiedene endliche Gruppe und jedes nicht triviale epimorphe Bild von G habe einen nicht trivialen abelschen Normalteiler. Dann hat G selbst einen solchen, da G ja epimorphes Bild von sich ist. Dieser Normalteiler heiße N . Ferner sei κ der kanonische Epimorphismus von G auf G/N . Ist dann ϕ ein Epimorphismus von G/N auf H = {1}, so ist κϕ ein Epimorphismus von G auf H, so dass auch H einen nicht trivialen abelschen Normalteiler hat. Also hat jedes nicht triviale epimorphe Bild von G/N einen solchen. Wegen |G/N | < |G| ist G/N daher aufl¨ osbar. Als abelsche Gruppe ist auch N aufl¨ osbar, so dass G nach Satz 6 aufl¨ osbar ist. Der n¨ achste Satz wurde unabh¨angig von einander von Frobenius und Burnside gefunden. Dies entnehme ich Burnside 1911, S. 122, wo er die beiden Arbeiten Frobenius, Ueber endliche Gruppen. Berliner Sitzungsberichte 1895, S. 173“ und ” Burnside, Notes on the theory of groups of finite order. Proc. LMS 26, S. 209, ” 1895“ zitiert. Die in diesem Satz formulierte Eigenschaft der endlichen p-Gruppen, dass ihre echten Untergruppen echt in ihren Normalisatoren enthalten sind, charakterisiert die endlichen nilpotenten Gruppen, von denen hier aber nicht weiter die Rede sein wird.
3. Au߬ osbare Gruppen
391
Satz 11. Ist p eine Primzahl und G eine endliche p-Gruppe, ist ferner U eine echte Untergruppe von G, so ist U = NG (U ). Dabei ist NG (U ) die Menge der g ∈ G mit U g = U . Beweis. Ist |G| = p, so ist U = {1} und folglich NG (U ) = G = U . Es sei also |G| > p. Weil G eine p-Gruppe ist, ist Z(G) = {1}. Ist Z(G) ⊆ U , so ist U = Z(G)U ⊆ NG (U ). Es sei schließlich Z(G) ⊆ U . Dann ist U/Z(G) eine echte Untergruppe von G/Z(G). Wegen Z(G) = {1} ist |G/Z(G)| < |G|. Nach Induktionsannahme ist daher U/Z(G) = NG/Z(G) U/Z(G) . Es gibt eine Untergruppe V in G mit NG/Z(G) U/Z(G) = V /Z(G). Es folgt U = V ⊆ NG (U ). Damit ist der Satz bewiesen. Korollar. Es sei p eine Primzahl. Ist G eine p-Gruppe und ist U eine maximale Untergruppe von G, so ist U normal in G und es ist [G : U ] = p. at Beweis. Nach Satz 11 ist U echt in NG (U ) enthalten. Wegen der Maximalit¨ von U ist daher NG (U ) = G, so dass U in G normal ist. Es gibt ein gU der Ordnung p in G/U . Es folgt, dass U g eine Untergruppe der Ordnung p|U | ist. Wiederum wegen der Maximalit¨ at von U folgt G = U g und damit [G : U ] = p. Bei p-Gruppen entscheidet alleine die Tatsache, dass sie p-Gruppen sind, ihre Aufl¨ osbarkeit. Der spektakul¨ arste Satz in dieser Hinsicht ist der Satz von Feit und Thompson, dass Gruppen ungerader Ordnung aufl¨ osbar sind (Feit & Thompson 1963). Noch im 19. Jahrhundert hat Frobenius gezeigt, dass Gruppen, deren Ordnung quadratfrei ist, aufl¨ osbar sind (Frobenius 1893). In dieser Arbeit k¨ undigt er auch den folgenden Satz 12 an, den er dann in Frobenius 1895 bewies. Burnside verallgemeinerte diesen Satz und bewies, dass Gruppen der Ordnung osbar sind, wenn p und q Primzahlen sind (Burnside 1904). Unsere Hilfspα q β aufl¨ mittel reichen, den von Frobenius stammenden Spezialfall dieses Satzes zu beweisen. Satz 12. Es seien p und q Primzahlen. Ferner sei n ∈ N. Ist G eine Gruppe der osbar. Ordnung pn q, so ist G aufl¨ Beweis. Ist p = q, so ist G eine p-Gruppe, also nach dem Korollar zu Satz 1 aufl¨ osbar. Es sei also p = q. Es sei P ∈ Sylp (G). Ist P normal in G, so ist G/P eine zyklische Gruppe der Ordnung q. Daher ist G/P aufl¨ osbar. Als p-Gruppe Gruppe ist auch P aufl¨ osbar. Nach Satz 9 ist also auch G aufl¨ osbar.
392
Kapitel XIII. Galois
Es sei also P nicht normal in G. Wegen P ⊆ NG (P ) ⊆ G und [G : P ] = q ist dann P = NG (P ). Es folgt, dass q die Anzahl der p-Sylowgruppen von G ist. Es seien P1 und P2 in Sylp (G), so gew¨ahlt, dass D := P1 ∩ P2 maximal ist. 1. Fall: Es ist D = {1}. Dann haben je zwei p-Sylowgruppen nur die 1 gemein. Daher enth¨ alt die Vereinigung der p-Sylowgruppen genau 1 + q(pn − 1) = pn q − (q − 1) = |G| − (q − 1) Elemente. Es verbleiben genau q − 1 Elemente, deren Ordnung keine Potenz von p ist. Folglich gibt es nur eine q-Sylowgruppe Q. Es folgt, dass Q ein Normalteiler osbar. Somit ist von G ist. Wegen |Q| = q und |G/Q| = pn sind Q und G/Q aufl¨ auch G aufl¨ osbar. 2. Fall. Es ist D = {1}. Setze Vi := NPi (D). Weil D eine echte Untergruppe der p-Gruppe Pi ist, schließen wir mit Satz 11, dass D = Vi ist f¨ ur i = 1 und 2. Setze are T eine p-Gruppe, T := V1 , V2 . Dann ist also D normal in T und D = T . W¨ so g¨abe es eine p-Sylowgruppe P3 mit T ⊆ P3 . Es folgte D ⊆ V1 = V1 ∩ T ⊆ P1 ∩ T ⊆ P1 ∩ P3 . at von D folgte P1 = P3 . Mit P2 an Stelle von Wegen D = V1 und der Maximalit¨ P1 erhielte man P3 = P2 und damit P1 = P2 . Dieser Widerspruch zeigt, dass T keine p-Gruppe ist. Also ist |T | = pt q mit t ∈ N. Es sei Q ∈ Sylq (T ). Dann ist |QP1 | = qpn = |G| und folglich QP1 = G. Setze K := Dg | g ∈ G. Dann ist D ⊆ K und K normal in G. Es sei g ∈ G. Wegen G = QP1 gibt es γ ∈ Q und δ ∈ P1 mit g = γδ. Dann ist Dg = Dγδ = Dδ ⊆ P1 . Also ist K ⊆ P1 ⊆ G und osbar und wegen |G/K| < |G| P1 = G. Ferner ist {1} = K. Als p-Gruppe ist K aufl¨ ist auch G/K nach Induktionsannahme aufl¨ osbar. Also ist G aufl¨ osbar. Damit ist der Satz bewiesen. Es sei p eine Primzahl. Wir bezeichnen mit A(1, p) die Gruppe aller affinen Abbildungen x → ax + b mit a, b ∈ GF(p) und a = 0. Der folgende Satz ist der Schl¨ ussel zu zeigen, dass es Gleichungen u ¨ ber Q gibt, ´ die nicht durch Radikale l¨ osbar sind. Er stammt von Galois (Galois, Ecrits S. 65ff.). Bis wir zeigen k¨onnen, dass es solche Gleichungen gibt, wird aber noch eine Weile vergehen. Satz 13. Es sei p eine Primzahl und G sei eine aufl¨ osbare, transitive Untergruppe von Sp . Dann ist G zu einer Untergruppe von A(1, p) konjugiert. Beweis. Da G aufl¨ osbar ist, enth¨ alt G einen abelschen Normalteiler N = {1}. Es sei B eine nicht triviale Bahn von N . Ist dann a ∈ B und b irgendeine der
3. Au߬ osbare Gruppen
393
permutierten Ziffern, so gibt es wegen der Transitivit¨ at von G ein γ ∈ G mit aγ = b. Es folgt, dass b in der Bahn B γ von N γ = N liegt. Also haben alle Bahnen von N die L¨ ange |B|, so dass |B| Teiler von p ist. Weil p eine Primzahl ist, folgt |B| = p. Folglich operiert N transitiv auf der Menge {0, 1, . . . , p − 1}. ur Weil N abelsch ist, ist N ⊆ CG (N ). Es sei γ ∈ CG (N ) und es gelte aγ = a f¨ ein a ∈ B. Es folgt aνγ = aγν = aν f¨ ur alle ν ∈ N . Weil N transitiv operiert, folgt hieraus, dass γ alle x ∈ B festl¨asst. Es folgt N = CG (N ) und |N | = p. Es folgt, dass N von einem p-Zyklus erzeugt urfen wir annehmen, dass wird. Weil alle p-Zyklen in Sp konjugiert sind, d¨ 2 3 N = (0, 1, 2, . . . , p − 1) ist. Weil N = CG (N ) gilt, folgt, dass G/N zu einer Untergruppe der Automorphismengruppe von N isomorph ist. Insbesondere ist G/N also zyklisch. Ist G0 der Stabilisator von 0 in G, so ist G = N G0 , da N transitiv ist. Ferner ist G0 ∼ = G/N , da G0 ∩ N = {1} ist. Also ist G0 zyklisch. Es sei G0 = α. Ist τ := (0, 1, 2, . . . , p − 1), so ist also xτ = x + 1. Ferner ist 0α = 0 und 1α =: a. −1 Ferner ist α−1 τ α = τ i , dh. xα τ α = x + i. Es folgt −1
xα + i = xαα
τα
= xτ α = (x + 1)α .
Mit x = 0 folgt i = 1α = a und damit xα + a = (x + 1)α . Nun ist 0α = 0 = a0. Ist xα = ax, so folgt a(x + 1) = xα + a = (x + 1)α . ur alle x ∈ GF(p). Wegen G = N G0 und Also ist xα = ax f¨ i
xα
τj
= ai x + j,
ist dann die Ausgangsgruppe G tats¨achlich zu einer Untergruppe von A(1, p) konjugiert. Der n¨ achste Satz steht ohne Beweis bei Jordan (Jordan 1870, Nr. 80, S. 63). Satz 14. Die An wird von den 3-Zyklen erzeugt. Beweis. Dies ist mangels Masse richtig f¨ ur n = 2. Es sei n > 2 und der Satz gelte f¨ ur n − 1. Es sei G das Erzeugnis aller 3-Zyklen aus der Sn . Dann ist G ⊆ An . Es bezeichne Gn den Stabilisator der Ziffer n. Nach Induktionsannahme ist dann Gn isomorph zur An−1 . Die von Gn und (1, 2, n) erzeugte Untergruppe der An
394
Kapitel XIII. Galois
operiert transitiv auf {1, 2, . . . , n}. Nach Satz 1 von Abschnitt 1 des Kapitels 12 ist daher |G| = n|Gn | = n · 12 · (n − 1)! = |An |. Folglich ist G = An . Auch der folgende Satz steht samt dem hier wiedergegebenen Beweis bei Jordan (Jordan 1870, Nr. 81, S. 63/64). Satz 15. Es sei 5 ≤ n ∈ N. Ist N ein von {1} verschiedener Normalteiler von Sn , so ist An ⊆ N . Beweis. Es sei 1 = σ ∈ N und es sei σ = ζ1 ζ2 . . . ζs die Zerlegung von σ in disjunkte zyklische Permutationen. 1. Fall. Ein Zyklus von σ enth¨ alt wenigstens drei Ziffern. Weil die ζi paarweise vertauschbar sind, d¨ urfen wir annehmen, dass ζ1 ein solcher Zylus ist. Es sei ζ1 = (a1 a2 a3 a4 a5 . . . at ). Setze
ζ1 := (a2 a3 a1 at . . . a5 a4 )
und
τ := ζ1 ζ2−1 . . . ζs−1 .
Nach Satz 6 von Abschnitt 1 sind σ und τ konjugiert. Also ist τ ∈ N . Foglich ist auch στ ∈ N . Ferner ist στ = ζ1 ζ1 = (a1 a3 a2 ) und damit (a1 a3 a2 ) ∈ N . Weil alle 3-Zyklen nach Satz 6 von Abschnitt 1 konjugiert sind, enth¨ alt N alle 3-Zyklen. Nach Satz 14 ist daher An ⊆ N . 2. Fall. Alle ζi sind Transpositionen. Ist s = 1, so enth¨ alt N als Normalteiler alle Transpositionen, so dass N = Sn gilt. Es sei also s ≥ 2 und ζ1 = (a, b) und ζ2 = (c, d). Dann enth¨ alt N auch das Element τ = (ac)(bd)ζ3 . . . ζs und dann auch das Element στ = (a, b)(c, d)(a, c)(b, d) = (a, d)(b, c). Wegen n ≥ 5 gibt es eine f¨ unfte Ziffer e. Dann ist auch das Element (a, e)(b, c) in N . Es folgt (a, d, e) = (a, e)(b, c)(a, d)(b, c) ∈ N, so dass auch in diesem Falle An ⊆ N gilt.
4. Kongruenzrelationen und Faktorstrukturen
395
F¨ ur n ≥ 4 ist An nicht abelsch. Es ist ja (a, b, c)(a, b, d) = (a, d)(b, c) und (a, b, d)(a, b, c) = (a, c)(b, d). Also hat Sn keinen abelschen Normalteiler ungleich {1}, ist also nicht aufl¨ osbar. Dann ist aber auch An nicht aufl¨ osbar. osbar. Korollar. Ist n ≥ 5, so sind die Gruppen An und Sn nicht aufl¨ Jordan behauptet, dass die An einfach sei (Jordan, Nr. 85, S. 66). Dies ist zwar richtig. Sein Beweis geht aber v¨ ollig daneben. Er beruft sich bei seinem Beweis auf einen Satz des Inhalts, dass ein Normalteiler einer t-fach transitiven Gruppe, usste nach (t − 1)-fach transitiv sei. Das ist falsch, wie schon die An zeigt. Diese m¨ diesem Satz (n − 1)-fach transitiv sein, was Jordan auch so benutzt, doch eine Untergruppe der Sn die (n − 1)-fach transitiv ist, ist auch n-fach transitiv, stimmt ¨ berein. Jordan gibt in einer sp¨ ateren Arbeit einen stichhaltigen also mit der Sn u Beweis. Ich finde die Arbeit nicht mehr. 4. Kongruenzrelationen und Faktorstrukturen. Bei den Darstellungen der letzten drei Abschnitte habe ich mich heutiger Sprache und Symbolik bedient. Doch, da Begriffe wie Homomorphismus, Isomorphismus, Normalteiler, Faktorgruppe, Restklasse, erst im Laufe des 19. Jahrhunderts entstanden, wenn auch nicht immer gleich mit diesen Namen, ist es angebracht, hier noch etwas zur urspr¨ unglichen Darstellung der in den letzten drei Abschnitten vorgef¨ uhrten S¨ atze zu sagen und sie noch in einen etwas weiteren Rahmen zu spannen. Ich hatte schon erl¨ autert, dass Cauchy in seiner Arbeit 1815b jeder Permutation σ ∈ Sn die Zahl n − g zuordnet, wobei g die Anzahl der Zyklen von σ ist, die Zyklen der L¨ ange 1 mitgez¨ahlt. Wir nennen f¨ ur den Augenblick die Permutation σ gerade, wenn n − g gerade ist, andernfalls ungerade. Er zeigt, dass das Produkt στ gerade ist, wenn σ und τ beide gerade oder beide ungerade sind. Haben σ und τ unterschiedliche Parit¨ at, so ist στ ungerade. Setzt man σ ≡ τ genau dann, wenn σ und τ von gleicher Parit¨ at sind, so ist ≡ ¨ eine Aquivalenzrelation und es gilt στ ≡ σ τ , wenn σ ≡ σ und τ ≡ τ ist. Die Relation ≡ ist also mit der Hintereinanderausf¨ uhrung von Permutationen vertr¨ aglich und folglich das, was man heute eine Kongruenzrelation nennt. Cauchy arbeitet hier also mit dieser Kongruenzrelation und mit den einzelnen Elementen der Sn , nicht aber mit der An und ihren Restklassen. Um es noch einmal mit anderen Worten zu sagen: Er arbeitet hier mit einem explizit gegeben Homomorphismus einer explizit gegebenen Gruppe und den Elementen der Gruppe selbst. Eine andere Kongruenzrelation war schon fest etabliert, die Kongruenzrelation, die allen anderen Kongruenzrelationen diesen Namen gab, n¨ amlich die Relation a ≡ b mod n f¨ ur ganze Zahlen a, b und n, die dadurch definiert ist, dass sie genau dann gilt, wenn a−b durch n teilbar ist. Diese Kongruenzrelation ist sowohl mit der Addition
396
Kapitel XIII. Galois
als auch mit der Multiplikation vertr¨ aglich. Sie ist also eine Kongruenzrelation des Ringes Z der ganzen Zahlen. Mit ihr und den individuellen Zahlen zu rechnen, ist heute noch u ¨blich, wenn auch immer wieder, je nach Kontext, mit Z/nZ gerechnet wird. Auch hier rechnet man mit einem konkreten Objekt, das noch die zus¨ atzliche Eigenschaft hat, dass jede Restklasse einen Standardvertreter hat, n¨ amlich den kleinsten in ihr enthaltenen nicht negativen Rest. Kronecker gibt in seiner Arbeit 1870 nicht nur eine abstrakte Definition endlicher abelscher Gruppen, er beweist f¨ ur sie auch einen Struktursatz, der zuvor schon von Schering f¨ ur den Spezialfall der Gruppen aus Klassen quadratischer Formen bewiesen wurde (Schering 1870. Kronecker zitiert Schering 1868. Das ist das Jahr, in dem Scherings Arbeit zur Publikation eingereicht wurde). Nachdem er die endlichen abelschen Gruppen definiert hat, definiert er die Ordnung eines Elementes, die er Exponent nennt. Dann formuliert er die u ¨ blichen Resultate u ¨ ber Ordnungen und beweist insbesondere, dass es ein Element gibt, dessen Ordnung das kleinste gemeinsame Vielfache aller Ordnungen der in der Gruppe vorkommenden Elemente ist. Diese Zahl nennen wir heute den Exponenten der Gruppe. Bei seinem Beweise benutzt er die Primfaktorzerlegung des Exponenten. Es sei nun G eine endliche abelsche Gruppe, n1 ihr Exponent und θ1 ein Element von G mit der Ordnung n1 . Er nennt dann zwei Elemente θ , θ ∈ G relativ aquivalent, wenn es ein k ∈ Z gibt mit ¨ θ θ1k ∼ θ , wobei wir statt des ∼ ein = schrieben. Dann schreibt er: Sondert man nun aus ” s¨ammtlichen Elementen θ ein vollst¨andiges System solcher aus, die untereinander nicht relativ a¨quivalent sind, so gen¨ ugt dasselbe den f¨ ur das System s¨ ammtlicher Elemente θ oben aufgestellten Bedingungen und besitzt daher auch alle daraus abgeleiteten Eigenschaften. Es existiert also namentlich eine der Zahl n1 entsprechende Zahl n2 , welche so beschaffen ist, dass die nte 2 Potenz eines jeden θ relativ ur welche keine niedrigere aquivalent Eins ist, und es existiren ferner Elemente θ , f¨ ¨ als die nte Potenz der Einheit relativ a ¨ quivalent wird. Da f¨ ur jedes Element θ die 2 Aequivalenz: θn1 ∼ 1 stattfindet und also a fortiori θn1 auch relativ ¨aquivalent Eins ist, so muss nach I. die Zahl n1 ein Vielfaches von n2 sein. Ist nun θn2 ∼ θ1k , und erhebt man die Ausdr¨ ucke auf beiden Seiten zur Potenz k wenn n2 = m gesetzt wird, die Aequivalenz
n1 n2 ,
so erh¨alt man,
θ1mn1 ∼ 1, aus welcher, da θ1 zum Exponenten n1 geh¨ort (da θ1 die Ordnung n1 hat. Anm. H. L.), unmittelbar folgt, dass m ganz und also k ein Vielfaches von n2 sein muss. Es gibt demnach ein Element θ2 , definirt durch die Aequivalenz: θ2 · θ1m ∼ θ ,
4. Kongruenzrelationen und Faktorstrukturen
397
dessen nte 2 Potenz nicht blos relativ, d. h. im weiteren Sinne, sondern auch im engeren Sinne der Einheit a¨quivalent ist und welches (im zwiefachen Sinne des Wortes) zum Exponenten n2 geh¨ort. ur Indem man nunmehr je zwei Elemente θ , θ als relativ a¨quivalent ansieht, f¨ welche: θ · θ1h · θ2k ∼ θ ist, so gelangt man zu einem dem Element θ2 entsprechenden θ3 , welches zum ort u. s. f. und man erh¨ alt auf diese Weise Exponenten n3 , einem Theiler von n2 , geh¨ ein Fundamentalsystem“ von Elementen θ1 , θ2 , θ3 , . . . , welches die Eigenschaft ” hat, dass der Ausdruck: θ1h1 θ2h2 θ3h3 · · ·
(hi = 1, 2, 3, . . . ni )
im Sinne der Aequivalenz s¨ ammtliche Elemente θ und zwar jedes nur ein Mal darstellt. Dabei sind die Zahlen n1 , n2 , n3 , . . . , zu denen resp. die θ1 , θ2 , θ3 , . . . geh¨oren, so beschaffen, dass jede derselben durch jede folgende theilbar ist, das Produkt n1 n2 n3 · · · ist gleich der mit n bezeichneten Anzahl s¨ammtlicher Elemente θ, und die Zahl n enth¨ alt demnach keine anderen Primfactoren als diejenigen, welche auch in n1 enthalten sind.“ Es folgt noch einmal ein Hinweis auf Schering. Ich habe dieses Kroneckerzitat deshalb so ausf¨ uhrlich aufgeschrieben, weil hier wirklich etwas fundamental Neues geschieht, was Kronecker mit seiner u ¨ blichen Pr¨ azision aufschreibt. Er hat hier ein Problem. Nachdem er die Existenz eines Elementes θ1 sichergestellt hat, dessen Ordnung gleich dem Exponenten der Gruppe G ¨ ist, definiert er eine Aquivalenzrelation modulo der von θ1 erzeugten Gruppe U und schreibt dann: Sondert man nun aus s¨ ammtlichen Elementen θ ein vollst¨andiges ” System solcher aus, die untereinander nicht relativ a¨quivalent sind, so gen¨ ugt dasselbe den f¨ ur das System s¨ ammtlicher Elemente θ oben aufgestellten Bedingungen und besitzt daher auch alle daraus abgeleiteten Eigenschaften.“ Dass aber ein Vertretersystem der Restklassen modulo U seinerseits eine Untergruppe ist, ist in aller Regel falsch, selbst wenn U ein Komplement besitzt, was aber auch nur dann der Fall ist, wenn U eine reine Untergruppe ist, wie wir fr¨ uher gesehen haben (Satz 15, Kap. 9, Absch. 7). Dass U im vorliegenden Fall ein Komplement hat, folgt erst ganz am Ende. Das Dilemma ist hier, dass er nicht die Restklassen als solche als Elemente einer neuen Gruppe nimmt, der Faktorgruppe G/U n¨ amlich, bzw. nicht erkl¨ art, wie die Verkn¨ upfung zweier Vertreter definiert ist. Letzteres zu definieren, w¨ are nat¨ urlich unangenehm, da in dieser abstrakten Situation keine Standardvertreter zu haben sind. Das gleiche Problem stellt sich in noch sch¨arferer Form im n¨ achsten Schritt, wenn es um die Existenz von θ3 und n3 geht. Um herauszufinden, dass n3 Teiler von n2 ist, muss er in der Gruppe (G/U )/(V /U )
398
Kapitel XIII. Galois
unktcheninduktion rechnen, wobei V das Erzeugnis von θ1 und θ2 ist. Seine P¨ verschleiert diese Subtilit¨ aten. Was mir an Kroneckers Beweis auch nicht gef¨allt, ist die Einf¨ uhrung der Zahl m = nk2 , noch bevor man weiß, dass n2 Teiler von k ist. Solange ich das nicht weiß, ist θ1m nicht definiert. Wie dem auch sei. In dieser Arbeit ist Neues geschehen und dass das Neue nicht gleich perfekt dargestellt ist, muss man in Kauf nehmen. Bei seinem Beweis des Satzes u ¨ ber die Struktur von p-Gruppen (Satz 1 von Abschnitt 3) steht Sylow vor einem a¨hnlichen Problem wie Kronecker, dass er n¨ amlich Induktion nach der Gruppenordnung macht und dabei im Laufe seines Beweises zu epimorphen Bildern kleinerer Ordnung u ¨ bergehen muss (Sylow 1872). Da sein Abstraktionsgrad geringer ist als der Kroneckers — seine Gruppen sind allesamt Permutationsgruppen —, hat er weniger Schwierigkeiten als Kronecker. Er hat also eine Gruppe G von Permutationen der Ordnung pt und er weiß, dass es im Zentrum von G ein Element θ1 der Ordnung p gibt. Wir nennen die von θ1 erzeugte Untergruppe U . Dann ist U als Untergruppe von Z(G) normal in G. Es agt, gibt nun eine Funktion y0 in so vielen Unbestimmten, wie der Grad von G betr¨ deren Stabilisator U ist. Es seien y0 , y1 , y2 , . . . die Bilder von y0 unter G. Dann asst U als Normalteiler von G alle yi fest. ist pt−1 = |G| |U| die Anzahl der yi . Ferner l¨ Es folgt, dass G auf der Menge der yi eine Gruppe der Ordnung pt−1 induziert. In dieser induzierten Gruppe gibt es dann wieder ein Zentrumselement der Ordnung p. Folglich gibt es in G ein Element θ2 , welches modulo U die Ordnung p hat. Dies alles wird von Sylow notiert. Dann geht es weiter mit der von θ1 und θ2 erzeugten Gruppe, die wieder ein Normalteiler von G ist, um θ3 zu finden. In dieser Situation sind die Gruppen kleinerer Ordnung, die man f¨ ur die Induktion braucht, wiederum Permutationsgruppen, also unmittelbar zu sehen. Die Situation hier ist gegen¨ uber der bei Kronecker auch deswegen einfacher, otigt wird, dass seine Ordnung modulo U gleich p ist. Die weil von θ2 nur ben¨ Ordnung von θ2 als Element von G spielt keine Rolle. Entsprechendes gilt f¨ ur θ3 , usw. Daher ist in dieser Situation P¨ unktcheninduktion u ¨berzeugend. Wenden wir uns Jordan und seiner Arbeit aus dem Jahre 1873 zu. F¨ ur ihn sind Gruppen stets Permutationsgruppen. Statt Permutation sagt er Substitution (substitution). Dieses Wort werden wir hier auch benutzen. Zwei Substitutionen s und t, die eine Gruppe H normalisieren, heißen kongruent modulo H, wenn es ein h ∈ H gibt mit s = th. Sind s und t kongruent modulo H, so schreibt Jordan daf¨ ur s ≡ t mod H in Analogie zur gew¨ ohnlichen Kongruenz, wie er ausdr¨ ucklich feststellt (on peut exprimer cette relation par une formule analogue a ` celle des congruences ordinaires.) ¨ Jordan zeigt nicht, dass die Kongruenz modulo H eine Aquivalenzrelation ist. Hierzu braucht man nicht, dass s und t die Gruppe H normalisieren. Es gen¨ ugt zu
4. Kongruenzrelationen und Faktorstrukturen
399
wissen, dass H eine Gruppe ist. Er zeigt aber, dass die Kongruenz modulo H mit der Hintereinanderausf¨ uhrung von Permutationen vertr¨ aglich ist. Normalisieren n¨ amlich s, t, s und t die Gruppe H und gilt s ≡ t mod H s ≡ t mod H, so gibt es h, h ∈ H mit s = th und s = t h . Es folgt ss = tht h = tt t−1 ht h . Weil H von t normalisiert wird, folgt t−1 ht ∈ H. Folglich gilt ss ≡ tt mod H. Dies ist eine typische Situation impliziter Gruppentheorie, da man bei diesem Beweise nicht bemerkt, dass s, t, s , t Substitutionen sind. Eine Folge s1 , s2 , . . . von Substitutionen, die H normalisieren, heißt eine Gruppe modulo H, wenn es zu allen Werten von α und β ein γ gibt mit sα sβ ≡ sγ mod H. Die Ordnung einer Gruppe modulo H ist per definitionem die Anzahl der verschiedenen Substitutionen, die modulo H inkongruent sind. Man beachte, dass nicht verlangt wird, dass die sα paarweise inkongruent modulo H sind. Andererseits brauchen die sα keine Gruppe von Substitutionen zu sein. Eine Gruppe modulo H ist keine Permutationsgruppe mehr. Sie ist etwas Neues. Der Begriff bleibt aber insofern vage, als nicht recht klar ist, was ihre Elemente sind. Die Ordnung z¨ ahlt jedenfalls nicht die betrachteten Elemente, sondern die ¨ Aquivalenzklassen, zu denen sie geh¨oren. G Ist G die von den sα erzeugte Gruppe, so bezeichnet Jordan mit H die durch G definierte Gruppe modulo H. Dies ist sinnvoll, da mit den sα auch G die Gruppe H normalisiert. Diese Bezeichnung weicht von der unseren G/H vor allem dadurch ab, dass Jordan nicht voraussetzt und unter den gegebenen Umst¨anden auch nicht annehmen kann, dass H ⊆ G ist. Er beweist, dass |G| = |G/H||G ∩ H| ist. Zum Beweise bedient er sich der Restklassen von G ∩ H in G, doch die Faktorgruppe G/(G ∩ H) sieht er nicht. Auch Frobenius muss in einem Fall bei seinem Beweise des ersten Satzes von Sylow zu einer Faktorgruppe u ¨bergehen. Es ist der Fall, wo die Ordnung des Zentrums der Gruppe H von p geteilt wird. Er zeigt dort, dass das Zentrum ein Element P der Ordnung p enth¨ alt, und f¨ ahrt dann fort: Betrachtet man jetzt (vgl. Kro” necker , l. c. S. 884; Camille Jordan, Bull. de la soc Math. de France, tom. I page
400
Kapitel XIII. Galois
46) zwei Elemente von H als (relativ) gleich, wenn sie sich nur durch eine Potenz von P unterscheiden, so sind auch f¨ ur diese weitere Fassung des Gleichheitsbegriffes die Bedingungen I–IV erf¨ ullt, weil jede Potenz von P mit jedem Element von H vertauschbar ist (dh., weil die von P erzeugte Untergruppe normal in H ist. Anm. H. L.), und die relativ verschiedenen Elemente bilden eine Gruppe, deren Ordnung hp < h ist und folglich nach der gemachten Voraussetzung eine Untergruppe der Ordnung pν−1 enth¨ alt. Durchl¨ auft Q die Elemente dieser Untergruppe und λ die Werthe von 0 bis p−1, so sind die pν Elemente P λ Q absolut voneinander verschieden und bilden eine in H enthaltene Gruppe der Ordnung pν .“ Hier stellt sich die Frage, wie und die relativ verschiedenen Elemente bilden eine Gruppe“ ” zu interpretieren ist und auch das Durchl¨ auft Q die Elemente dieser Untergruppe ” . . . “ ist nicht koscher und bedarf der Interpretation (Frobenius 1887a). Bei Walther Dyck gibt es Neues. Er fragt nach der allgemeinsten Gruppe“, die ” sich von m Elementen erzeugen l¨asst. Er schreibt (Dyck 1882, S. 5f.): Seien A1 , ” at), A2 , A3 , . . . , Am irgendwelche m Operationen, welche auf ein Objekt J (Identit¨ das wir in der Folge stets als 1 bezeichnen, angewandt werden k¨ onnen, so lassen sich diese Ai stets als die erzeugenden“ Operationen einer Gruppe auffassen, die wir ” erhalten, wenn wir auf unser Objekt J Operationen in Iteration und Combination anwenden. Die allgemeinste Gruppe aus m erzeugenden Operationen entsteht dann, wenn wir voraussetzen, dass unsere Operationen Ai keine Perioden besitzen und ausserdem gegenseitig durch keine Relation verbunden sind. Wir wollen dabei auch die den Operationen Ai entgegengesetzten Operationen in die Betrachtung ziehen, die wir in der u ¨blichen Weise durch A−1 bezeichnen. Dann erhalten wir die unendlich i vielen Substitutionen, welche unserer Gruppe G angeh¨ oren, wenn wir auf die Iden−1 , A , A , . . . , Am , A−1 tit¨ at zun¨ achst die Operationen A1 , A−1 2 m anwenden, je auf 1 2 die so entstandenen Substitutionen die gleichen Operationen u. s. f. Da wir zwischen den erzeugenden Operationen keine Relationen angenommen haben, so sind die so entstandenen Substitutionen s¨ ammtlich von einander verschieden und es kann jede nur auf einem ganz bestimmten Wege aus den erzeugenden Substitutionen erlangt werden, den die Formel Aμ1 1 Aμ2 2 · · · Aν11 Aν22 · · · · · · (die wir stets von links nach rechts lesen wollen) angiebt. In der That ist die Forderung, dass alle Substitutionen einer Gruppe nur auf einem Wege aus den erzeugenden Substitutionen erlangt werden, die nothwendige und hinreichende Bedingung daf¨ ur, dass zwischen den letzteren keine Relationen bestehen und die folgenden Entwickelungen besch¨ aftigen sich gerade mit der Frage, wie nun der Umstand, dass gewisse Substitutionen einer Gruppe auf mehrfache Weise aus den zu Grunde gelegten erzeugenden Substitutionen erhalten werden k¨ onnen, dass also gewisse Relationen zwischen den erzeugenden Substitutionen bestehen, zur Definition jeder speciellen Gruppe dient.“ Dyck scheint keine Zweifel zu haben, dass es freie Gruppen in m Erzeugenden gibt. Er sagt jedenfalls nichts zu ihrer Konstruktion. Woher hat er die Gewissheit,
4. Kongruenzrelationen und Faktorstrukturen
401
dass es sie gibt? Die Konstruktion einer solchen Gruppe ist nicht ganz ohne, wie wir noch sehen werden. Auch schon die Definition der allgemeinsten Gruppe ist unscharf, da sich die nicht klar erkennen l¨ asst. Da er aber sagt, dass sich alle RelatioRolle der A−1 i nen zwischen den Erzeugenden A1 , . . . , Am in die Gestalt S(A1 , . . . , Am ) = 1 u ¨ berf¨ uhren lassen, wobei S(A1 , . . . , Am ) ein Ausdruck der Gestalt Aμ1 1 Aμ2 2 · · · Aν11 Aν22 · · · · · · ist, spielen die Inversen der Ai die gleiche Rolle wie die Ai selbst. Ist G die allgemeinste Gruppe in den Erzeugenden A1 , . . . , Am und wird die Gruppe H von den Elementen A¯1 , . . . , A¯m erzeugt, so behauptet Dyck, dass es einen Epimorphismus von G auf H gibt, der Ai auf A¯i abbildet: Man ordne dem alt Element S(A1 , . . . , Am ) das Element S(A¯1 , . . . , A¯m ) zu. Diese Abbildung erh¨ bei ihm keinen Namen und er beweist auch nicht, dass sie multiplikativ ist. Was er aber beweist, ist, dass jedes Bild entweder genau ein oder aber unendlich viele Urbilder hat. Er bemerkt ferner, dass die Urbilder der 1 einen Normalteiler von G bilden. Die Faktorgruppe von G nach diesem Normalteiler kommt nicht vor. Nun m¨ ochte er Gruppen durch Erzeugende und Relationen definieren. Dazu wird das bisher Gezeigte uminterpretiert. Er schreibt: Legen wir den Substitutio” nen A1 , A2 , . . . , Am unserer allgemeinsten Gruppe G die Bedingung auf, dass: (1)
F1 (A1 , A2 , . . . , Am ) = 1
¯ 1 der Substitutiosei, so wird die Gruppe dadurch eingeschr¨ ankt auf die Gruppe G nen, welche mit Ber¨ ucksichtigung der Bedingung (1) noch verschieden ausfallen. F¨ ugen wir die weitere Bedingung (2)
F2 (A1 , A2 , . . . , Am ) = 1
¯ 1,2 der Substitutionen zur ersten hinzu, so wird dadurch die engere Gruppe G definirt, welche nach Zuziehung der beiden Relationen noch von einander verschieden sind u. s. f.“ ¯ 1,2 wird unterstellt. Es ist also keine Rede ¯ 1 und G Die Existenz der Gruppen G davon, dass man den von F1 (A1 , A2 , . . . , Am ) erzeugten Normalteiler nehme und ¯ 1 sei, und dass die Faktorgruppe von G nach diesem Normalteiler die Gruppe G ¯ entsprechend f¨ ur G1,2 . Er bemerkt auch das Folgende. Haben H und H jeweils m Erzeugende. Erf¨ ullen beide die Relationen F1 = 1, . . . , Fs = 1 und sind diese f¨ ur H definierend, erf¨ ullt uber hinaus auch noch die Relationen Fs+1 = 1, . . . , Ft = 1, so ist H H dar¨ epimorphes Bild von H. Hier erwartete man den Einsatz des Satzes, dass G/V und (G/U )/(V /U ) isomorph sind, wenn U und V Normalteiler von G sind mit U ⊆ V . Doch nichts dergleichen. Was bei Dyck noch fehlt, ist eine pr¨ azise Fassung des Gruppenbegriffs und folglich auch der Begriff der Faktorgruppe und die damit zusammenh¨ angenden
402
Kapitel XIII. Galois
Isomorphies¨ atze. Homomorphismen und ihre Kerne kommen zwar vor, es gibt aber nicht die Kongruenz nach einem Normalteiler. Die Existenz der durch Erzeugende und Relationen definierten Gruppen bleibt folglich ungekl¨ art, wie auch schon die Existenz der freien Gruppen selber. Bei Veronese haben wir das auch beobachtet, dass er die Existenz seiner nicht-archimedischen Geometrien nicht problematisiert (Kap. 6, Absch. 6). Wird die Existenz unterstellt, solange sich keine Widerspr¨ uche ergeben? Ansonsten ein großartiges, sehr detailliertes Programm. Faktorgruppen kommen endlich in der Arbeit H¨ older 1889 vor, in der er auch auf die gerade besprochene Arbeit von Dyck verweist. H¨older beginnt seine Arbeit mit der Definition endlicher Gruppen und der Definition eines Normalteilers, den er ausgezeichnete Untergruppe nennt. Das ist Wiederholung von Bekanntem. Dann geht er auf den Satz von Jordan ein, den er verallgemeinern will. Dazu ben¨ otigt er die Faktorgruppe, die er im vierten Abschnitt beschreibt. Da dieser Begriff so grundlegend ist, sei dieser Abschnitt im Wortlaut wiedergegeben. Wenn die Symbole ” B, B1 , B2 , . . . die Operationen irgend einer Untergruppe H bedeuten, so kann man die s¨ ammtlichen Operationen der Gesammtgruppe G in dem Schema B2 , B, B1 , S1 B, S1 B1 , S1 B2 , S2 B, S2 B1 , S2 B2 , ... ... ... Sn−1 B, Sn−1 B1 , Sn−1 B2 ,
... ... ... ... ...
darstellen, wo die Operationen S1 , S2 , . . . Sn−1 passend aus der Gesammtheit ausgew¨ahlt sind. Dieses Schema findet sich schon bei Cauchy (es folgt Zitat). Dasselbe dient zum Beweis daf¨ ur, dass die Anzahl m der Operationen B, d. h. die Ordnung der Untergruppe, stets ein Theiler von der Gesammtzahl der Operationen, d. h. von der Ordnung der Gesammtgruppe ist. Wenn nun die Untergruppe eine ausgezeichnete ist, so gilt der Satz, dass zwei beliebige Operationen aus zwei bestimmten Horizontalreihen des gegebenen Schemas in bestimmter Aufeinanderfolge zusammengesetzt eine Operation einer v¨ ollig bestimmten Horizontalreihe geben m¨ ussen. Wenn n¨amlich μ, ν, ρ, σ vier beliebige Indizes bedeuten, so ist immer Sν Bρ Sμ Bσ = Sν Sμ Bρ Bσ = Sκ Bτ Bρ Bσ , wo der Index κ nur von μ und ν abh¨ angig ist.
4. Kongruenzrelationen und Faktorstrukturen
403
Damit ist eine Zusammensetzung der Horizontalreihen definirt. Man erh¨ alt so neue Operationen, welche gleichfalls eine Gruppe bilden. Diese vollst¨ andig bestimmte Gruppe ist es, welche in die Betrachtung eingef¨ uhrt werden soll. Man k¨ onnte sie den Quotienten der Gruppen G und H nennen, dieselbe soll im Folgenden mit G|H bezeichnet werden.“ Hier zeigt sich deutlich der Vorteil hoher Abstraktion. Es werden geschickt gew¨ahlte Teilmengen einer Gruppe miteinander verkn¨ upft, so dass die Menge dieser Teilmengen mit dieser Verkn¨ upfung die Bedingungen erf¨ ullt, die eine Gruppe definieren. Ohne die abstrakte Definition einer endlichen Gruppe gibt es keine Faktorgruppe. Das wird hier ganz deutlich. Im n¨ achsten Abschnitt, dem f¨ unften, interpretiert H¨ older die Faktorgruppe auf etwas andere Weise. Er hat eine Gruppe G und einen Normalteiler H von G. Er nennt dann zwei Elemente von G ¨ aquivalent , wenn sie durch Multiplikation mit einem Element aus H in einander u ¨bergef¨ uhrt werden k¨ onnen. Er beeilt sich zu sagen, dass es nicht darauf ank¨ ame, ob man dieses Element von links oder von rechts heranmultipliziere, da H normal sei. Dann sagt er, dass aus demselben Grunde folge, dass Aequivalentes mit Aequivalentem multiplicirt Aequivalentes ” ¨ giebt.“ Das sei der Grund, weshalb man auf der Menge G/H der Aquivalenzklassen verm¨oge der Komplexmultiplikation eine Gruppenstruktur bekomme. Er bemerkt ferner, dass g → gH ein Epimorphismus (meroedrischer Isomorphismus sagt er) von G auf G/H ist. Mit Hilfe dieses Epimorphismus’ erschließt er, dass G/H genau dann einfach ist, wenn H ein maximaler Normalteiler von G ist. Damit ist H¨older nun in der Lage, den Satz zu formulieren und zu beweisen, der heute Satz von Jordan-H¨ older heißt. Ich sagte eben, dass es ohne die abstrakte Definition einer endlichen Gruppe keine Faktorgruppe g¨ abe. Es gibt sie doch. In Dedekinds Nachschrift zu seinen Vorlesungen vom WS 1856/57 und WS 1857/58 findet sich in Artikel 6 von § 1 das Folgende, das ich in heutiger Sprache notiere (Dedekind 1981). Ist K ein Normalteiler ur alle a, b ∈ G die Gleichung KaKb = Kab. der Permutationsgruppe G, so gilt f¨ Es gilt ferner das Assoziativgesetz f¨ ur diese Verkn¨ upfung und aus der G¨ ultigkeit von je zweien der drei Gleichungen Ka = Kc, Kb = Kd und KaKb = KcKd folgt jeweils die dritte. Das seien aber die wesentlichen Eigenschaften einer Permutationsgruppe, so dass alle Eigenschaften, die eine Permutationsgruppe habe, auch der gerade definierten Struktur zuk¨ amen. Dedekind hatte schon in Abschnitt 2 von § 2 die beiden wesentlichen Eigenschaften von Permutationsgruppen bewiesen, dass n¨ amlich f¨ ur die Hintereinanderausf¨ uhrung von Permutationen das Assoziativgesetz gilt und dass aus je zweien der drei Gleichungen α = γ, β = δ, αβ = γδ die dritte folgt. In unserer Sprache heißt das, dass die beiden K¨ urzungsregeln gelten. Er bemerkt dann, dass er die weiteren Untersuchungen u ¨ ber Permutationsgruppen nur auf diese beiden Eigenschaften st¨ utzen werde. Daher g¨alten die Folgerungen auch f¨ ur all die zahlreichen
404
Kapitel XIII. Galois
anderen Beispiele aus Algebra und Zahlentheorie, die diese beiden Eigenschaften h¨ atten. Scharlau gibt einen Beleg, der es wahrscheinlich macht, dass Dedekind den Begriff der Faktorgruppe zum Zeitpunkt der Vorlesungen noch nicht hatte (Dedekind 1981, S. 102). Die H¨ orer seiner Vorlesung konnten diesen Begriff also nicht nach außen tragen. Keine Anekdotenbildung! (S. Kap. I, Abschn. 1) Dedekind hatte in diesen Vorlesungen nur vier H¨ orer, von denen einer, Paul Bachmann, sp¨ater selbst auf das Thema galoissche Theorie“ zur¨ uckkam (Bach” mann 1881). Die Arbeit ist nicht sehr aufregend. Der Begriff der Faktorgruppe scheint sich im Anschluss an die h¨ oldersche Publikation schnell eingeb¨ urgert zu haben, spricht doch Frobenius in seiner Arbeit ¨ Uber aufl¨ osbare Gruppen aus dem Jahre 1893 immer wieder von Faktorgruppen, ohne auf ihre Definition einzugehen oder ein Zitat anzugeben. Was noch fehlt, sind die Isomorphies¨ atze. Sie erscheinen in der Arbeit Frobenius 1895. Frobenius kommentiert sie: Der Begriff der Faktorgruppe H/G macht den ” des meroedrischen oder eines noch allgemeineren Isomorphismus u ¨ berfl¨ ussig. Statt diese Begriffe einzuf¨ uhren, hat man die S¨ atze aufzustellen:“ Es folgen die drei Isomorphies¨ atze, wobei der dritte Isomorphiesatz, dass G/V und (G/U )/(V /U ) isomorph sind, wenn U und V Normalteiler von G sind mit U ⊆ V , nur mit M¨ uhe zu erkennen ist. Frobenius sieht also klar, dass man bis auf Isomorphie alle epimorphen Bilder einer Gruppe kennt, wenn man ihre Normalteiler kennt. Obwohl f¨ ur uns seit den Arbeiten Cauchys von 1815 st¨andig zu sehen, dauerte es bis 1889, bis der Begriff der Faktorgruppe durch H¨olders Arbeit dem mathematischen Publikum bekannt wurde. Dabei waren den Akteuren die gaußschen ¨ Beispiele endlicher abelscher Gruppen bekannt, deren Elemente Aquivalenzklassen quadratischer Formen gleicher Diskriminante sind. Es sind typische Beispiele von Faktorstrukturen, wenn auch nicht Beispiele von Faktorgruppen. Das Ganze ist sehr kompliziert, so dass ich auf Details verzichte, da quadratische Formen nicht unser Thema sind. Diese Faktorstrukturen sind seit dem Jahre 1801 in der Diskussion und es ist interessant, wie Schering mit ihnen hantiert. Bei ihm ist nicht mehr zu sehen, dass die Elemente Mengen sind. Er handelt nur von den Elementen und ihren grundlegenden Eigenschaften, die er Gaußens Disquisitiones entnimmt. Aus diesen Eigenschaften leitet er weitere Eigenschaften her. Er benutzt also nie Vertreter von Klassen, um Aussagen u ¨ber die Gruppen zu gewinnen. Statt der Gruppen aus Klassen von quadratischen Formen kann man jede endliche abelsche Gruppe nehmen. Die S¨ atze, die er beweist, gelten alle auch f¨ ur sie. Sie liefern am Ende dann wiederum Aussagen u ¨ ber quadratische Formen. Ganz anders Dedekind, der 1871 in der zweiten Auflage von Dirichlets Zah” lentheorie“ im zehnten Supplement die gaußschen Gruppen aus Klassen quadratischer Formen uminterpretiert und verallgemeinert. Die von Gauß betrachteten quadratischen Formen h¨ angen zusammen mit Idealen von gewissen Ringen ganzer algebraischer Zahlen und die Klassengruppen der Formen finden sich wieder als Klassengruppen endlicher algebraischer Erweiterungen von Q. Dazu ist zu sagen, dass der Begriff des Ideals Dedekinds Erfindung ist und
4. Kongruenzrelationen und Faktorstrukturen
405
in diesem Supplement zum ersten Male auftaucht. Dedekind schreibt (DirichletDedekind 1871, S. 452): Wir gr¨ unden die Theorie der in O enthaltenen Zahlen, d. h. aller ganzen alge” braischen Zahlen des K¨ orpers Ω, auf den folgenden neuen Begriff. 1. Ein System A von unendlich vielen in O enthaltenen Zahlen soll ein Ideal heißen, wenn es den beiden folgenden Bedingungen gen¨ ugt: I. Die Summe und die Differenz je zweier Zahlen in A sind wieder Zahlen in A. II. Jedes Produkt aus einer Zahl in A und einer Zahl in O ist wieder eine Zahl in A.“ F¨ ur ω, ω ∈ O definiert er die Kongruenz modulo dem Ideal A durch ω ≡ ω mod A ur Mogenau dann, wenn ω − ω ∈ A ist. Diesen Begriff hatte er schon zuvor f¨ duln eingef¨ uhrt, das sind solche Teilmengen von O, die I. erf¨ ullen. Bei Moduln ist die Kongruenz mit der Addition vertr¨ aglich, bei Idealen auch noch mit der Multiplikation, wie Dedekind feststellt. Die Anzahl der Klassen einer Kongruenz nach einem Modul ist in aller Regel nicht endlich. Zuvor bewiesene S¨ atze, wann die Klassenzahl endlich ist, zeigen sehr rasch, dass Ideale stets nur endlich viele Klassen haben (man beachte, dass das Nullideal kein Ideal im Sinne Dedekinds ist, jedenfalls nicht in der zweiten Auflage der Zahlentheorie“). Die Anzahl der ” Klassen modulo A nennt Dedekind die Norm von A, in Zeichen N (A). Er beweist S¨ atze u ¨ ber Normen, er definiert Primideale als die maximalen Ideale von O und er charakterisiert sie mittels der Eigenschaft, die heute zu ihrer Definition dient: Ist P ein von O verschiedenes Ideal, so ist P genau dann ein Primideal, wenn f¨ ur alle a, b ∈ O aus ab ∈ P folgt, dass a ∈ P oder b ∈ P ist. ur Ist P ein Primideal, so gibt es eine Primzahl p ∈ P und es gilt N (P ) = pf f¨ ein passendes f ∈ N. Es gilt dann f¨ ur jedes ω ∈ O die Kongruenz f
ω p ≡ ω mod P. Hieraus folgere man ohne Schwierigkeit die G¨ ultigkeit der S¨ atze der §§ 26, 27, 29, 30, 31 auch im vorliegenden Fall. Die fraglichen S¨ atze sind nach unserem Verst¨andnis S¨ atze u ¨ ber die multiplikative Struktur von und u ¨ber Polynome u ¨ ber Z/pZ, wie z. B. der Satz u ¨ ber die Zyklizit¨ at der multiplikativen Gruppe von Z/pZ und der Satz, dass ein Polynom vom Grade n u ¨ ber Z/pZ h¨ ochstens n Nullstellen hat. Er formuliert das alles aber im Sinne der Kongruenzrelation und seine Beweise lesen sich entsprechend. Die Faktorstruktur O/P , die zu GF(pf ) isomorph ist, steht nicht im Vordergrund. Er gibt auch keinen Hinweis auf Galois oder auf Galoisfelder. Dedekind definiert weiter eine Multiplikation auf der Menge der Ideale. Sind A und B Ideale von O, so ist AB die Menge der endlichen Summen der Form n a i:=1 i bi mit ai ∈ A und bi ∈ B. Es ist klar, dass AB ein Ideal ist. Zwei Ideale heißen ¨ aquivalent , in Zeichen A ≡ B, wenn es von null verschiedene r und s
406
Kapitel XIII. Galois
in O gibt mit rA = sB. Weil O ein Integrit¨atsbereich ist, ist diese Relation eine ¨ Aquivalenzrelation, die u ¨berdies mit der Multiplikation von Idealen vertr¨ aglich ist. Bezeichnet I die Menge der (vom Nullideal verschiedenen) Ideale von O, so erbt I/≡ von I eine Multiplikation. Die Klasse der Hauptideale spielt die Rolle eines Einselementes dieser Struktur, wie unmittelbar zu sehen. Man muss sehr viel mehr tun, um zu sehen, dass I/≡ eine endliche abelsche Gruppe ist, die Klassengruppe des K¨orpers Ω. Eine Folgerung hieraus, die Dedekind sofort bemerkt, ist, dass es zu jedem Ideal A eine nat¨ urliche Zahl n gibt, so dass An ein Hauptideal ist. Es ist auffallend, dass bei den durch Ideale definierten Kongruenzrelationen auf Ringen, die wir bislang betrachtet haben, nie die zugeh¨ orige Faktorstruktur im Vordergrund stand. Dies ist auch so in der Arbeit Cauchy 1847, in der Cauchy eine neue Interpretation der komplexen Zahlen gibt. Er untersucht dort generell die durch ein Polynom gegebene Kongruenz auf dem Polynomring in einer Unbestimmten u ¨ ber R, um dann dieses Polynom zu x2 + 1 zu spezialisieren. Auch Weber operiert bei seinen Congruenzk¨orpern immer mit der durch das irreduzible Polynom f ∈ K[x] definierten Kongruenzrelation (Weber 1893), w¨ ahrend ich dem Vorbilde Steinitz folgend bei der Darstellung der weberschen Resultate in Abschnitt 1 von Kapitel 9 immer von K[x]/f K[x] sprach (Steinitz 1910). Dem Leser wird aufgefallen sein, dass die erste Konstruktion der komplexen Zahlen durch Cauchy und die Konstruktion der Galoisfelder durch Galois bislang nicht erw¨ ahnt wurden. Das liegt daran, dass diese Konstruktionen nicht in den hier betrachteten Rahmen passen. Bei diesen Konstruktionen geht es im Prinzip zwar auch um die Kongruenz nach einem irreduziblen Polynom, aber es werden die Standardvertreter der Restklassen als Elemente von C bzw. GF(pt ) genommen. Die Summe zweier Standardvertreter ist wieder ein Standardvertreter, w¨ ahrend das Produkt zweier Standardvertreter sofort modulo dem in Frage stehenden irreduziblen Polynom reduziert wird. Dann hat man einiges zu tun, um die u ¨ blichen Rechengesetze nachzuweisen, worum sich Cauchy und auch Galois dr¨ ucken. Bei den Gruppen spielen die Faktorstrukturen h¨ aufig eine andere Rolle als bei den Ringen. Sie werden hier zwar auch zur Konstruktion von Beispielen benutzt, wie implizit bei Dyck und den durch Erzeugende und Relationen gegebene Gruppen. Bei den endlichen Gruppen treten sie aber auch in nat¨ urlicher Weise bei Induktionsbeweisen auf, wie klar bei obigen Analysen zu sehen. Die dort untersuchten Beweise werden sofort unanfechtbar, wenn man an passender Stelle von Faktorgruppen redet und noch zwei, drei Worte hinzuf¨ ugt. Es war also wirklich nur eine Frage der Zeit, dass sie entdeckt wurden. Hinzu kommt, dass in Gaußens Gruppen aus Klassen quadratischer Formen und den dedekindschen Klassengruppen der Ringe ganzer algebraischer Zahlen Vorbilder von Gruppen geschaffen waren, deren Elemente Mengen waren. Mengen. Wir haben schon bemerkt, dass das Studium der Fourierreihen G. Cantor zu seinen Untersuchungen von Mengen und ihren Beziehungen zueinander und zu seiner Theorie der transfiniten Zahlen inspirierten. Hier sehen wir, dass die Autoren, die u ¨ ber Permutationsgruppen schreiben, v¨ ollig selbstverst¨andlich von Mengen und Abbildungen reden, was ja auch nicht problematisch ist, solange diese
4. Kongruenzrelationen und Faktorstrukturen
407
endlich sind. Dedekind jedoch bediente sich im zehnten Supplement mit großer K¨ uhnheit der Mengen bei seinen Begriffen K¨ orper, Ringe ganzer algebraischer Zahlen (Ordnungen nennt er sie), Moduln und Ideale als Teilmengen solcher Ringe. Seine Art, u ¨ ber diese Dinge zu sprechen, ist im Wesentlichen auch noch die unsere. Weitere Faktorstrukturen, an die man nur selten denkt, da sie uns seit Jahrhunderten vertraut sind, sind die Menge Q≥ der nicht-negativen rationalen Zahlen und die Menge der positiven und negativen Zahlen zuz¨ uglich der Null. Bei den positiven rationalen Zahlen geht man von der Menge M der Zeichen ab mit a ∈ N0 und b ∈ N aus und definiert zun¨ achst auf M eine Addition und eine Multiplikation durch ad + bc a c + := b d bd und ac a c · := . b d bd Diese beiden Verkn¨ upfungen sind assoziativ und kommutativ. Er gelten aber nicht die Distributivgesetze. Dann definiert man die Relation ≡ durch a c ≡ b d ¨ genau dann, wenn ad = bc ist, und weist nach, dass diese Relation eine Aquivalenzrelation ist, die mit der auf M definierten Addition und Multiplikation vertr¨ aglich ¨ von ≡, so erbt sie auf ist. Ist dann Q≥ := M/≡ die Menge der Aquivalenzklassen Grund der Vertr¨ aglichkeit von + und · mit ≡ eine Addition und eine Multiplikation, usw. Das Rechnen in Q≥ geschieht mittels der Vertreter aus M , wobei jedoch das Gleichheitszeichen nicht die Gleichheit in M bezeichnet, sondern im Sinne von ≡ interpretiert wird, w¨ ahrend das Zeichen ≡ selber jedoch nicht auftaucht. Ganz a¨hnlich ist die Situation, wenn man mit N beginnend Z bzw. mit Q≥ beginnend Q konstruiert. Der Leser bl¨ attere zur¨ uck zu den S¨ atzen 9 und 10 von Kap. 1, Absch. 6. Das Geschilderte zeigt, dass Kongruenzrelationen und die mit ihnen zusammenh¨ angenden Faktorstrukturen sich in den Vordergrund dr¨ angten. Mittlerweile kann man die Isomorphies¨atze f¨ ur Gruppen, Ringe und andere Strukturen unter einen Hut bringen. Sie alle haben einen mengentheoretischen ¨ Kern. Das erste, was man beobachtet, ist, dass zu jeder Aquivalenzrelation auf ¨ einer Menge eine Partition dieser Menge geh¨ ort, n¨ amlich die Menge ihrer Aquivalenzklassen. Umgekehrt definiert jede Partition einer Menge, deren Komponenten ¨ ¨ allesamt nicht leer sind, eine Aquivalenzrelation auf der Menge, deren Aquivalenzklassen gerade die Komponenten der Partition sind. Partitionen mit lauter nicht¨ leeren Komponenten und Aquivalenzrelationen entsprechen also einander. Ist M ¨ eine nicht-leere Menge und ist ≡ eine Aquivalenzrelation auf M , so bezeichne M/≡ ¨ die Menge der Aquivalenzklassen von ≡. Definiert man dann κ≡ durch κ≡ (x) := {y | y ∈ M, x ≡ y},
408
Kapitel XIII. Galois
so ist κ≡ eine Abbildung von M auf M/≡. Man nennt κ≡ den kanonischen Epimorphismus von M auf M/≡. Ist σ eine Abbildung von M in eine andere Menge, so definieren wir die Relation kern(σ) durch x kern(σ) y ¨ genau dann, wenn σ(x) = σ(y) ist. Dann ist kern(σ) eine Aquivalenzrelation. ¨ Umgekehrt ist auch jede Aquivalenzrelation Kern einer Abbildung. Ist n¨ amlich ≡ ¨ eine Aquivalenzrelation auf der Menge M und ist κ der kanonische Epimorphismus von M auf M/≡, so ist kern(κ) = ≡. Der Kern (sic) aller Isomorphies¨ atze ist dann der folgende Satz 1. Es seien M und N Mengen und σ sei eine Abbildung von M in N . Es gibt dann genau eine Bijektion τ von M/kern(σ) auf σ(M ) mit σ = τ κkern(σ) . Beweis. Wir definieren die Relation τ durch: Ist X ∈ M/kern(σ) und y ∈ N , so ist genau dann (X, y) ∈ τ , wenn es ein x ∈ X gibt mit σ(x) = y. Wir zeigen, dass τ eine Abbildung ist. Ist X ∈ M/kern(σ), so gibt es ein x ∈ X. Es folgt (X, σ(x)) ∈ τ . Ist weiterhin X ∈ M/kern(σ) und sind y, y ∈ N und gilt (X, y), (X, y ) ∈ τ , so gibt es x, x ∈ X mit σ(x) = y und σ(x ) = y . Es folgt x kern(σ) x und damit y = σ(x) = σ(x ) = y . Dies zeigt, dass τ eine Abbildung ist. Es sei y ∈ σ(M ). Es gibt dann ein x ∈ M mit y = σ(x). Es folgt τ κkern(σ) (x) = σ(x) = y und damit τ κkern(σ) = σ. Folglich ist τ eine Abbildung von M/kern(σ) auf σ(M ). Es seien X, Y ∈ M/kern(σ) und es gelte τ (X) = τ (Y ). Es gibt dann ein x ∈ X und ein y ∈ Y mit τ (X) = σ(x) und τ (Y ) = σ(y). Es folgt σ(x) = σ(y), dh., x kern(σ) y und damit X = Y . Also ist τ auch injektiv. Es sei ρ eine zweite Abbildung von M/kern(σ) in N mit σ = ρκkern(σ) . Ist dann X ∈ M/kern(σ), so folgt mit x ∈ X, dass τ (X) = τ κkern(σ) (x) = σ(x) = ρκkern(σ) (x) = ρ(X) ist. Folglich ist τ = ρ. Damit ist der Satz bewiesen. Satz 1 ist die mengentheoretische Version des ersten Isomorphiesatzes, den wir in der Version, wie ihn die universelle Algebra formuliert und beweist, gleich noch formulieren und beweisen werden. Satz 1 ist andererseits der Spezialfall A = kern(σ) von Satz 2. Um den Zusammenhang mit dem ersten Isomorphiesatz herzustellen, habe ich Satz 1 hier der Klarheit halber dennoch gesondert formuliert und bewiesen.
4. Kongruenzrelationen und Faktorstrukturen
409
Satz 2. Es seien M und N Mengen und σ sei eine Abbildung von M in N . Ist ¨ A eine Aquivalenzrelation auf M und gilt A ⊆ kern(σ), so gibt es genau eine Abbildung τ von M/A in N mit σ = τ κA . Beweis. Wir definieren die Relation τ durch: Ist X ∈ M/A und y ∈ N , so ist genau dann (X, y) ∈ τ , wenn es ein x ∈ X gibt mit σ(x) = y. Wir zeigen, dass τ eine Abbildung ist. Ist X ∈ M/A, so gibt es ein x ∈ X und es folgt (X, σ(x)) ∈ τ . Sind dar¨ uber hinaus y, y ∈ N und gilt (X, y), (X, y ) ∈ τ , so gibt es x, x ∈ X mit σ(x) = y und σ(x ) = y . Es folgt x A x und wegen A ⊆ kern(σ) dann auch x kern(σ) x . Also ist y = σ(x) = σ(x ) = y . Dies zeigt, dass τ eine Abbildung ist. Es sei y ∈ σ(M ). Es gibt dann ein x ∈ M mit y = σ(x). Es folgt τ κA (x) = σ(x) = y und damit τ κA = σ. Folglich ist τ eine Abbildung von M/A auf σ(M ). Es sei ρ eine zweite Abbildung von M/A in N mit σ = ρκA . Ist dann X ∈ M/A, so folgt mit x ∈ X, dass τ (X) = τ κA (x) = σ(x) = ρκA (x) = ρ(X). Folglich ist τ = ρ. Damit ist der Satz bewiesen. Der n¨ achste Satz ist die mengentheoretische Version des dritten Isomorphiesatzes. ¨ Satz 3. Es sei M eine Menge und A und B seien Aquivalenzrelationen auf M . Ist A ⊆ B, so gibt es genau eine Abbildung σ von M/A auf M/B mit κB = σκA . Definiert man B/A durch B/A := kern(σ), so gibt es genau eine Abbildung τ von (M/A)/(B/A) auf M/B mit σ = τ κB/A Beweis. Die Existenz und Eindeutigkeit von σ folgt mit Satz 2 angewandt auf M , N = M/B und κB , wenn man nur beachtet, dass kern(κB ) = B ist. Die Existenz und Eindeutigkeit von τ folgt mit Satz 1. Ist Ω eine Menge und ist A eine Abbildung von Ω in N0 , so nennen wir Ω Operatorenbereich, ohne A explizit zu erw¨ahnen. Ist v ∈ Ω, so heißt A(v) die Arit¨ at von v. Ist n die Arit¨ at von v, so heißt v auch n-¨ arer Operator . Ist n ∈ N0 , so bezeichne Ω(n) die Menge aller n-¨aren Operatoren in Ω. Ist M eine Menge und ist Ω ein Operatorenbereich, so nennen wir (M, Ω) eine Ω-Algebra, wenn es zu jedem n-¨aren Operator v ∈ Ω eine Abbildung des n-fachen cartesischen Produktes von M mit sich selbst in M gibt, die wir wieder mit v bezeichnen. Diese Abbildung nennen wir n-¨ are Operation auf M . Das nullfache cartesische Produkt von M mit sich selbst enth¨alt nur das Element ∅, also genau ein Element. Die null¨ aren Operationen picken also aus M nur ein Element heraus. Daher heißen diese Operationen auch Konstante. Typische Konstante sind 0 und 1.
410
Kapitel XIII. Galois
ur alle i und ist v ∈ Ω Ist (M, Ω) eine Ω-Algebra, ist x ein n-Tupel mit xi ∈ M f¨ eine n-¨are Operation auf M , so bezeichnen wir das Bild von x unter v mit xv. Diese Bezeichnung stammt von dem polnischen Mathematiker L ukasiewicz, der sie systematisch in der Logik benutzte (Lukasiewicz 1929). Diese Notation heißt daher polnische Notation. Sie hat den Vorteil, dass man keine Klammern bei der Bildung von Termen braucht. Ich brauche wohl nicht zu definieren, was Ω-Unteralgebren von Ω-Algebren sind. Ebenso nicht, was Homomorphismen, Isomorphismen, usw. sind. ¨ Es sei (M, Ω) eine Ω-Algebra und A sei eine Aquivalenzrelation auf M . Ist v ∈ Ω(n), so heißt v vertr¨ aglich mit A, wenn f¨ ur alle n-Tupel x und y u ¨ ber M gilt: ur alle i, so ist xv A yv. Ist A mit allen v ∈ Ω vertr¨ aglich, so heißt A Ist xi A yi f¨ Kongruenzrelation auf M . Dem Leser wird es keine M¨ uhe machen nachzuweisen, dass der Kern eines Homomorphismus einer Ω-Algebra in eine andere eine Kongruenzrelation ist. Ebenso leicht weist man nach, dass sich auf M/A eine Ω-Algebrenstruktur definieren l¨ asst, so dass κA zu einem Ω-Homomorphismus wird, wenn nur A eine Kongruenzrelation der Ω-Algebra M ist. Diese Strukturen heißen u ¨ blicherweise Faktorstrukturen bzw. Quotientenstrukturen. Erster Isomorphiesatz. Es seien (M, Ω) und (N, Ω) zwei Ω-Algebren. Ist σ ein Homomorphismus von M in N , so gibt es genau einen Isomorphismus τ von M/kern(σ) auf σ(M ) mit σ = τ κkern(σ) . Beweis. Auf Grund von Satz 1 ist die Existenz und Einzigkeit der Abbildung τ gesichert. Es bleibt nur zu zeigen, dass sie sich mit den Operationen vertr¨ agt, die durch Ω definiert sind. Es sei v ∈ Ω(n) und es seien X1 , . . . , Xn ∈ M/kern(σ). Ferner sei yi ∈ Xi . Dann ist, da σ und κkern(σ) ja Homomorphismen sind, τ (Xv) = τ κkern(σ) (y1 ) . . . κkern(σ) (yn )v = τ κkern(σ) (yv) = (τ κkern(σ) )(yv) = σ(yv) = σ(y1 ) . . . σ(yn )v = τ κkern(σ) (y1 ) . . . τ κkern(σ) (yn )v = τ (X1 ) . . . τ (Xn )v. Damit ist der Satz bewiesen. Zweiter Isomorphiesatz. Es sei M eine Ω-Algebra und N sei eine Teilalgebra von M . Ferner sei A eine Kongruenz auf M . Wir setzen $ A := A ∩ (N × N ) und A(N ) := κA (x). x∈N
Dann ist A eine Kongruenz auf N und A(N ) ist eine Teilalgebra von M . Die ¨ Teilalgebra A(N ) ist Vereinigung von Aquivalenzklassen von A, so dass die Menge
5. Freie Gruppen
411
¨ dieser Aquivalenzklassen auf A(N ) eine Kongruenzrelation definiert, die wir ebenfalls mit A bezeichnen. Die Einschr¨ ankung ϕ von κA auf N ist ein Epimorphismus von N auf A(N )/A und es gilt kern(ϕ) = A . Insbesondere sind die Faktorstrukturen N/A und A(N )/A isomorph. Beweis. Es sei v ∈ Ω(n) und a1 , . . . , an ∈ A(N ). Nach der Definition von A(N ) gibt es b1 , . . . , bn ∈ N mit ai A bi f¨ ur alle i. Folglich gilt a1 . . . an v A b1 . . . bn v. Weil N eine Teilalgebra ist, ist b1 . . . bn v ∈ N und folglich a1 . . . an ∈ A(N ). Also ist A(N ) eine Teilalgebra von M . Die Einschr¨ ankung ϕ von κA auf N ist ein Homomorphismus von N in A(N )/A. Weil es aber zu jedem a ∈ A(N ) ein b ∈ N gibt mit a A b, ist ϕ surjektiv. Dass A der Kern von ϕ ist, ist banal. Die letzte Aussage folgt dann aus dem ersten Isomorphiesatz. Dem Leser sollte es nun nicht mehr schwer fallen, auch noch den dritten Isomorphiesatz zu beweisen. Die Hauptarbeit ist bereits getan. Dritter Isomorphiesatz. Es sei M eine Ω-Algebra und A und B seien Kongruenzrelationen auf M mit A ⊆ B. Dann gibt es genau einen Epimorphismus σ von M/A auf M/B mit κB = σκA . Setzt man B/A := kern(σ), so gibt es genau einen Isomorphismus τ von (M/A)/(B/A) auf M/B mit σ = τ κB/A . Der Leser sollte die vorstehenden Isomorphies¨ atze mit denen vergleichen, die u ¨ blicherweise f¨ ur Gruppen bzw. Ringe formuliert werden. Dort ist die Situation etwas einfacher als im allgemeinen Fall, da dort die Kerne, so wie wir sie definiert ¨ haben, bereits durch eine einzige ihrer Aquivalenzklassen v¨ ollig festgelegt sind. ¨ Man nimmt dort u ¨blicherweise die Aquivalenzklasse der 1 bzw. der 0, um die Faktorstruktur zu beschreiben, und nennt diese den Kern der Abbildung. Im Allgemeinen gibt es jedoch nichts, was den Normalteilern bzw. den Idealen entspricht. Dem Leser sei als Aufgabe empfohlen, alle Kongruenzrelationen eines Dedekindtripels (Definition in Abschnitt 7 von Kapitel II) zu bestimmen. Es gibt abz¨ ahlbar viele. Die entsprechenden Faktorstrukturen sind paarweise nicht isomorph. Sie alle gestatten Induktion, aber nur eine auch Rekursion. Mehr m¨ochte ich zu den Faktorstrukturen und den Isomorphies¨ atzen nicht sagen. Der Leser, der an weiteren Einzelheiten interessiert ist, sei an Cohn 1965 oder L¨ uneburg 1989 verwiesen. Eines sei nur noch erw¨ ahnt, dass die Isomorphies¨ atze in dem Buch Whitehead 1898, dem ersten Buch u ¨ ber universelle Algebra u ¨ berhaupt, noch nicht vorkommen. 5. Freie Gruppen. In diesem Abschnitt sei die Existenz freier Gruppen sichergestellt. Wir werden sie im Folgenden zwar nicht ben¨ otigen, dennoch sei der Existenzbeweis hier gef¨ uhrt, da freie Gruppen Beispiele von nicht allt¨ aglichen Faktorstrukturen sind. Es sei A eine Menge, die wir Alphabet nennen. Wir definieren die Menge A∗ der W¨ orter u ¨ ber dem Alphabet A rekursiv wie folgt: 1) Es ist ∅ ∈ A∗ . 2) Ist w ∈ A∗ und a ∈ A, so ist wa ∈ A∗ . Dabei ist ∅a als a zu interpretieren.
412
Kapitel XIII. Galois
3) Keine anderen W¨ orter als die unter 1) und 2) konstruierten geh¨ oren zu A∗ . ∗ Wir definieren die L¨ ange l(w) des Wortes w ∈ A rekursiv durch 0, falls w = ∅ l(w) := l(w ) + 1, falls w = w a mit w ∈ A∗ und a ∈ A. Dann ist l(w) die Anzahl der Buchstaben, die in w vorkommen, Vielfachheiten mitgez¨ahlt. Sind v, w ∈ A∗ so definieren wir vw rekursiv wie folgt: ⎧ falls w = ∅, ⎨ v, vw := w, falls v = ∅, ⎩ (vw )a, falls w = w a mit w ∈ A∗ und a ∈ A. Diese Verkn¨ upfung heißt Konkatenation. Satz 1. Die auf A∗ definierte Konkatenation ist assoziativ. Beweis. Es seien u, v, w ∈ A∗ . Ist w = ∅, so ist (uv)w = uv = u(vw). Es sei w nicht leer. Es gibt dann ein w ∈ A∗ und ein a ∈ A mit w = w a. Es folgt (uv)w = (uv)w a = u(vw ) a = u (vw )a = u(vw). Damit ist der Satz bewiesen. Es sei w ∈ A∗ und t := l(w) > 0. Es gibt dann ein w ∈ A∗ und ein at ∈ A mit w = w at . Nach der nicht ausgesprochenen Induktionsannahme gibt es at der a1 , . . . , at−1 ∈ A mit w = a1 . . . at−1 , wobei wir wegen der Assoziativit¨ Konkatenation keine Klammern zu setzen brauchen. Es folgt w = a1 . . . at−1 at . Diese M¨ oglichkeit, W¨ orter zu schreiben, werden wir sogleich ausnutzen. Es sei X eine nicht-leere Menge. Wir setzen X1 := {(x, 1) | x ∈ X} und X−1 := {(x, −1) | x ∈ X}. Ferner setzen wir A := X1 ∪ X−1 . Schließlich sei A∗ die Menge aller W¨orter u ¨ ber dem Alphabet A. Ist w = a1 . . . at ∈ A∗ , so setzen wir alt(w) := i | 1 ≤ i < t, es gibt ein x ∈ X und ein e ∈ {1, −1} mit ai = (x, e), ai+1 = (x, −e) . und definieren wred rekursiv durch w, wenn alt(w) = ∅ wred := wred , sonst. Dabei ist w = a1 . . . ai−1 ai+2 . . . at und i ist der kleinste Index in alt(w). Weil w k¨ urzere L¨ange hat als w kommt die Rekursion zum stehen. Offensichtlich gilt alt(wred ) = ∅ und folglich wred red = wred .
5. Freie Gruppen
413
Hilfssatz 1. Sind w, w ∈ A∗ , so ist (ww )red = (wred w )red . Dies folgt unmittelbar aus der Definition von red. Hilfssatz 2. Sind w, w ∈ A∗ , ist x ∈ X und e ∈ {1, −1}, so ist (ww )red = w(x, e)(x, −e)w red . Beweis. Nach Hilfssatz 1 ist w(x, e)(x, −e)w red = (w(x, e)(x, −e))red w red = (wred (x, e)(x, −e))red w red . Es sei wred = a1 . . . an und an = (y, f ). 1. Fall. Es ist y = x oder f = −e. Dann ist alt(wred (x, e)(x, −e)) = {n + 1}. Folglich ist wred (x, e)(x, −e) red = wred . Mit Hilfssatz 1 folgt dann wiederum w(x, e)(x, −e)w red = (wred w )red = (ww )red . 2. Fall. Es ist y = x und f = −e. Dann ist
wred (x, e)(x, −e) red = a1 . . . an−1 (x, −e)(x, e)(x, −e) red = a1 . . . an−1 (x, −e) = wred .
Also gilt in allen F¨ allen w(x, e)(x, −e)w red = (wred w )red = (ww )red . Damit ist der Hilfssatz bewiesen. Zwei W¨orter w, w ∈ A∗ heißen benachbart , wenn es u, v ∈ A∗ und ein (x, e) ∈ A gibt mit w = uv und w = u(x, e)(x, −e)v oder mit w = u(x, e)(x, −e)v und w = uv. Zwei W¨orter w, w ∈ A∗ heißen kongruent, in Zeichen w ≡ w , wenn entweder w = w ist oder es W¨orter v0 , . . . , vt gibt mit v0 = w und vt = w , so dass vi und vi+1 f¨ ur i := 0, . . . , t − 1 benachbart sind. Die Relation ≡ ist eine ¨ Aquivalenzrelation. Satz 2. Sind w, w ∈ A∗ , so ist genau dann w ≡ w , wenn wred = wred ist. Beweis. Auf Grund der Definition von red sind w und wred und auch w und wred kongruent. Dann sind aber auch w und w kongruent, wenn wred und wred gleich sind.
414
Kapitel XIII. Galois
Sind andererseits w und w kongruent, so folgt mit Hilfssatz 2, dass wred = wred ist.
¨ Dieser Satz besagt, dass die Aquivalenzklassen von ≡ einen Standardvertreter haben. Mit dessen Hilfe ist die Kongruenz zweier W¨ orter rasch festzustellen. Satz 3. Sind v, v , w, w ∈ A∗ und ist v ≡ v und w ≡ w , so ist auch vw ≡ v w . Beweis. Es seien v0 , . . . , vs W¨ orter mit v = v0 und v = vs , so dass vi und vi+1 benachbart sind. Ferner seien w0 , . . . , wt W¨ orter mit w0 = w und wt = w , so dass wj und wj+1 benachbart sind. Dann ist v0 w0 = vw und vs wt = v w . Ferner ist v0 w0 , . . . , vs w0 , vs w1 . . . , vs wt eine Folge von W¨ ortern, von denen je zwei aufeinander folgende benachbart sind. Also ist vw ≡ v w . Satz 4. Mit der von der Konkatenation induzierten bin¨ aren Verkn¨ upfung wird FX := A∗ /≡ zu einer Gruppe. Beweis. Auf Grund von Satz 1 ist die von der Konkatenation induzierte Ver¨ kn¨ upfung assoziativ. Außerdem ist die Aquivalenzklasse des leeren Wortes ein Einselement von A∗ /≡. Es bleibt zu zeigen, dass jedes Element von A∗ /≡ ein Inverses hat. Es sei a ∈ A. Dann gibt es ein x ∈ X und ein e ∈ {1, −1} mit a = (x, e). Setze ¨ von b := (x, −e). Dann ist ab ∈ A∗ und ab ≡ ∅ ≡ ba. Also hat die Aquivalenzklasse ¨ ¨ amlich die Aquivalenzklasse von b. Die Aquivalenzklasse des a ein Inverses in FX , n¨ ¨ Wortes w ∈ A∗ habe ein Inverses in FX , etwa die Aquivalenzklasse von u. Dann hat ¨ ¨ amlich die Aquivalenzklasse auch die Aquivalenzklasse von wa ein Inverses in FX , n¨ von bu. Damit ist alles bewiesen. Es sei X eine Menge, F eine Gruppe und f eine Abbildung von X in F . Die Gruppe F heißt frei u ¨ber (X, f ) genau dann, wenn gilt: Ist G eine Gruppe und ist g eine Abbildung von X in G, so gibt es genau einen Homomorphismus h von F in G mit g = f h (erst f dann h). Satz 5. Es sei X eine Menge und F und G seien Gruppen. Ist F frei u ¨ber (X, f ) und G frei u ¨ber (X, g), so gibt es genau einen Isomorphismus i von F auf G mit g = f i. Beweis. Auf Grund der Definition der freien Gruppe gibt es genau einen Homomorphismus i von F in G mit g = f i und genau einen Homomorphismus j von G in F mit f = gj. Es folgt f 1F = f = gj = f ij und g1G = g = f i = gji. Hieraus folgt 1F = ij und 1G = ji. Das besagt aber, dass i bijektiv und dass j die Inverse von i ist.
6. Galois’ M´emoire I
415
Satz 6. Es sei X eine nicht-leere Menge und X1 , X−1 , A, A∗ , ≡ und FX haben weiterhin die bisherigen Bedeutungen. Ist dann f die durch xf := w | w ∈ Y ∗ , w ≡ (x, 1) erkl¨ arte Abbildung, so ist die Gruppe FX frei u ¨ber (X, f ). Beweis. Es sei G eine Gruppe und g sei eine Abbildung von X in G. Wir definieren eine Abbildung η von A∗ in G wie folgt. Es sei ∅η := 1, (x, 1)η := xg , (x, −1)η := (xg )−1 . Es sei w ∈ A∗ , l(w) ≥ 1 und wη sei bereits definiert. Ist dann a ∈ A, so setzen wir (wa)η := wη aη . Dann ist η eine Abbildung von A∗ in G. Wir zeigen, dass η multiplikativ ist. Es seien v, w ∈ A∗ . Ist w = ∅, so ist wη = 1 und folglich (vw)η = v η = v η wη . Es sei w = ∅. Es gibt dann ein w ∈ A∗ und ein a ∈ A mit w = w a. Es folgt η η (vw)η = v(w a) = (vw )a = (vw )η aη = (v η wη )aη = v η (wη aη ) = v η wη . Schließlich zeigen wir, dass η mit ≡ vertr¨ aglich ist. Dazu seien v, w ∈ A∗ , x ∈ X und e ∈ {1, −1}. Dann ist η v(x, e)(x, −e) = v η (x, e)η (x, −e)η wη = v η (xf )e (xf )−e wη = v η wη = (vw)η . Auf Grund der Definition von ≡ folgt hieraus die Behauptung. ur alle v, w ∈ α, dass v η = wη ist. Daher Ist nun α ∈ FX , so gilt also f¨ h η wird durch α := v eine Abbildung von FX in G definiert, die offenbar alle gew¨ unschten Eigenschaften hat, wobei die Einzigkeit von h daraus folgt, dass FX ¨ von den Aquivalenzklassen der (x, 1) erzeugt wird. Nachdem die Existenz freier Gruppen sichergestellt ist, ist es nun nicht mehr schwer, die Existenz von Gruppen nachzuweisen, die durch Erzeugende und Relationen gegeben sind. Andeutungen hierzu habe ich im letzten Abschnitt gemacht. Wir wollen das hier nicht weiter verfolgen. 6. Galois’ M´ emoire I. Vor dem Duell sortierte Galois seine Notizen und auch schon publizierte Arbeiten und gruppierte sie in M´emoire I, II und III. Auf diese Nummern bezieht er sich dann in seinem Brief an seinen Freund Auguste Chevalier,
416
Kapitel XIII. Galois
den er in der Nacht vor dem Duell verfasste und in dem er diese M´emoires n¨aher erl¨auterte. F¨ ur uns ist vor allem M´emoire I wichtig, das ich nun vorstellen m¨ ochte. Dieses M´emoire ist 1830/31 (erg¨anzt 1832) entstanden — die Einleitung ist mit dem 16. Januar 1831 datiert —, aber erst 1846 in Liouvilles Journal erschienen ´ (Galois, Ecrits, S. 39–71). Aus seinem Discours pr´eliminaire geht hervor, dass es sich um eine Neufassung der der Akademie der Wissenschaften von Paris eingereichten Arbeit handelt, die von Mitgliedern der Akademie, die sie referieren sollten, verschlampt (´egar´e ) wurde. Galois sagt in diesem Discours aber vor allem, worum es in der Arbeit geht. Er schreibt: ´ Etant donn´ee une ´equation alg´ebrique a` coefficients quelconques, num´eriques ” ou litt´eraux, reconnaˆıtre si les racines ne peuvent s’exprimer en radicaux, telle est la question dont nous offrons une solution compl`ete.“ Das muss man sich auf der Zunge zergehen lassen: Er gebe eine vollst¨andige L¨osung der Frage, ob eine gegebene algebraische Gleichung, habe sie Zahlen oder Unbestimmte (coefficients litt´eraux ) als Koeffizienten, durch Radikale l¨ osbar sei oder nicht. Dies ist ein Paukenschlag, eine Fanfare, doch ich m¨ ochte zun¨ achst auf eine Kleinigkeit hinweisen. Diese Stelle ist die erste mir bekannte f¨ ur das Auftreten des Begriffs algebraische Gleichung“ in dem Sinne, wie wir ihn heute verwenden, ” w¨ahrend bei Lagrange algebraische Gleichungen Unbestimmte als Koeffizienten hatten, alle anderen in unserem Sinne ebenfalls algebraische Gleichungen aber numerische Gleichungen genannt wurden. Galois’ neue Interpretation des Begriffs algebraische Gleichung schließt nicht aus, dass er diesen Begriff nicht auch noch im lagrangeschen Sinne benutzt. So auf S. 51 in der Bemerkung nach Proposition I. Galois f¨ ahrt fort: Si maintenant vous me donnez une ´equation a` votre gr´e, et ” que vous d´esiriez connaˆıtre si elle est ou non r´esoluble par radicaux, je n’aurai rien a y faire que de vous indiquer le moyen de r´epondre a` votre question, sans vouloir ` charger ni moi ni personne, de la faire. En un mot les calculs sont impraticables.“ Das ist nun etwas, was ganz und gar nicht dem Zeitgeist entsprach, wo man doch mit großer Fertigkeit rechnete, rechnete, rechnete. Galois gibt ein Verfahren, das entscheidet, ob eine gegebene Gleichung durch Radikale l¨ osbar ist, und sagt im gleichen Atemzug, dass die Rechnungen nicht praktikabel seien. Es schiene, als seien keine Fr¨ uchte zu ernten. Doch dem sei nicht so. Es gebe Klassen von Gleichungen, bei denen man alles in der Hand habe, um die gestellte Frage zu beantworten. Er erw¨ ahnt hier die Gleichungen, die bei der Teilung der elliptischen Funktionen auftr¨ aten und die der ber¨ uhmte Abel behandelt h¨ atte, und die Modulargleichungen. Hier bricht der Discours pr´eliminaire mitten im Satz ab und es folgt die eigentliche Arbeit. Die etwas eingeschr¨ ankte Frage Galois’, ob eine Gleichung mit rationalen Koankung — durch Radikale l¨ osbar ist, l¨ asst sich effizienten — das ist die Einschr¨ heute in polynomialer Zeit beantworten (Landau und Miller 1983). Galois beginnt seine Arbeit mit der Erkl¨ arung dessen, worauf es bei ihr besonders ankommt.
6. Galois’ M´emoire I
417
Eine Gleichung heiße reduzibel, wenn sie einen rationalen Teiler habe, andernfalls irreduzibel. Hier sei das Wort rational“ zu erkl¨ aren. ” Wenn die Gleichung rationale Zahlen als Koeffizienten habe, so bedeute re” duzibel“, dass die Gleichung sich in Faktoren zerlegen lasse, deren Koeffizienten ebenfalls rationale Zahlen seien. Sind die Koeffizienten nicht alle rational, so bedeute rational“, dass die Koeffizienten der Faktoren rationale Funktionen in den ” Koeffizienten der Ausgangsgleichung seien. Er geht aber noch dar¨ uber hinaus, indem er f¨ ur die Faktoren auch Koeffizienten zul¨ asst, die rationale Funktionen in den Koeffizienten der Ausgangsgleichung und weiteren Zahlen — in der Regel Nullstellen von Hilfsgleichungen, z. B. Einheitswurzeln — sind. Diese Zahlen adjungiert er der Gleichung, wie er sagt. Galois macht darauf aufmerksam, dass das Verhalten einer Gleichung vom Koeffizientenbereich abh¨angt. Als Beispiel w¨ ahlt er die Gleichung xn − 1 =0 x−1 mit primem n. Adjungiere man dieser Gleichung eine Wurzel einer der gaußschen Hilfsgleichungen, so werde sie reduzibel. ¨ Das ist also eines der wesentlichen Dinge dieser Arbeit, den Uberblick u ¨ber die Koeffizientenbereiche zu wahren. Diese sind immer Teilk¨orper von C. Dies ist aus dem Kontext zu erschließen, da Galois dies nicht ausdr¨ ucklich erw¨ ahnt, gab es doch dazu damals noch keinen Anlass. Es wird auch nicht wirklich von Teilk¨ orpern geredet — das tut erst Dedekind —, sondern immer nur von Koeffizienten, die sich rational durch schon bekannte Koeffizienten ausdr¨ ucken lassen. C dient nur als unersch¨opfliche Quelle f¨ ur Hilfsgr¨ oßen und garantiert, dass die Charakteristik 0 ist, so dass man durch von 0 verschiedene ganze Zahlen stets dividieren kann. Dass u ¨ ber C jedes Polynom in Linearfaktoren zerf¨ allt, erw¨ ahnt er ebenfalls nicht. Nach heutigen Vorstellungen schwebt alles ein wenig im Ungewissen. Es folgen eine Reihe von Resultaten, von denen er sagt, sie seien bekannt. Es ist alles sehr knapp aufgeschrieben. Ich werde daher versuchen, es mit Dedekinds Augen zu sehen, der die galoisschen Resultate ja in seinen G¨ ottinger Vorlesungen von 1856/57 und 1857/58 vorgetragen hat. Galois’ Lemma I haben wir in Kapitel 10, Abschnitt 3 schon vorgetragen. Es besagt, dass ein irreduzibles Polynom, welches mit einem weiteren Polynom eine Nullstelle gemeinsam hat, dieses Polynom teilt. Das zweite Lemma lautet: ´ Lemme II. Etant donn´ee une ´equation quelconque, qui n’a pas de racines ´egales, dont les racines sont a, b, c, . . . , on peut toujours former une fonction V des racines, telles qu’aucune des valeurs que l’on obtient en permutant dans cette fonction les racines de toutes mani`eres ne soient ´egales. Par exemple, on peut prendre V = Aa + Bb + Cc + . . . , A, B, C, . . . ´etant des nombres entiers convenablement choisis.
418
Kapitel XIII. Galois
Galois gibt keinen Beweis f¨ ur dieses Lemma. Um es zu beweisen, folgen wir, wie angek¨ undigt, Dedekind. Er beweist zuerst ein Lemma I, das ich verallgemeinere und Lemma A nenne, indem ich von einem beliebigen K¨ orper ausgehe, der nur eine unendliche Teilmenge X enthalten muss. Dedekind arbeitet mit Teilk¨ orpern von C und nimmt f¨ ur X die ganzen Zahlen. Was die Teilk¨orper von C anbelangt, so gilt f¨ ur Dedekind das Gleiche wie bei Galois, dass n¨amlich aus heutiger Sicht alles ein wenig im Ungewissen bleibt. Lemma A. Es sei K ein K¨ orper und X sei eine Teilmenge von K mit un¨ber K und ist 0 = f ∈ endlich vielen Elementen. Sind x1 , . . . , xn Unbestimmte u K[x1 , . . . , xn ], so gibt es k1 , . . . , kn ∈ X mit f (k1 , . . . , kn ) = 0. Beweis. Ist n = 0, so ist dies richtig. Es sei also n ≥ 0 und der Satz gelte f¨ ur n. Es sei ferner f ∈ K[x1 , . . . , xn+1 ]. Dann ist f=
m
gi xin+1
i:=0
mit gi ∈ K[x1 , . . . , xn ] f¨ ur alle i. Wir d¨ urfen annehmen, dass m der Grad von f in xn+1 ist. Dann ist also gm = 0. Nach Induktionsannahme gibt es k1 , . . . , kn ∈ X mit gm (k1 , . . . , kn ) = 0. Setzt man F :=
m
gi (k1 , . . . , kn )xin+1 ,
i:=0
so ist F = 0, so dass F h¨ ochstens endlich viele Nullstellen in K und damit in X hat. Es gibt also ein kn+1 ∈ X mit F (kn+1 ) = 0. Es folgt f (k1 , . . . , kn+1 ) = 0. Dies ist Dedekinds Beweis, eine saubere Induktion. Sind α1 , . . . , αm und r1 , . . . , rm Elemente eines K¨orpers K und ist σ ∈ Sm , so definieren wir ρσ (α, r) durch ρσ (α, r) :=
m
αi rσ(i)
i:=1
Von dem n¨ achsten Lemma gilt wieder das Gleiche wie zuvor, dass Dedekind es nur f¨ ur reelle oder komplexe ri formuliert und dass sein X gleich Z ist. Sein Argument liefert aber mehr. Lemma B. Es sei K ein K¨ orper und X sei eine unendliche Teilmenge von K. Sind r1 , . . . , rm verschiedene Elemente von K, so gibt es α1 , . . . , αm ∈ X, so dass die ρσ (α, r) mit σ ∈ Sm paarweise verschieden sind. Ist die Charakteristik von K gleich 0, so kann man f¨ ur X die Mengen Z oder N w¨ ahlen.
6. Galois’ M´emoire I
419
Beweis. Auch hier folgen wir Dedekinds Argument. Wir ersetzen die αi durch Unbestimmte ai . Ferner seien σ und τ zwei verschiedene Permutationen aus Sm . Dann ist m ρσ (a, r) − ρτ (a, r) = ai rσ(i) − rτ (i) . i:=1
Weil σ und τ verschieden sind, gibt es ein j mit σ(j) = τ (j). Dann ist rσ(j) −rτ (j) = 0, da die ri ja paarweise verschieden sind. Weil die ai Unbestimmte sind, folgt hieraus, dass ρσ (a, r) − ρτ (a, r) = 0 ist. Dann ist aber auch das Polynom
p(a1 , . . . , am ) :=
ρσ (a, r) − ρτ (a, r)
σ,τ ∈Sm ; σ=τ
ungleich null. Daher gibt es nach Lemma A Elemente α1 , . . . , αm ∈ X mit p(α1 , . . . , αm ) = 0. Hieraus folgt die Behauptung, wenn man nur noch beachtet, dass Z und N unendliche Teilmengen von K sind, falls Char(K) = 0 ist. Dedekind beweist noch ein drittes Lemma und auch dessen Beweis liefert mehr als in ihm formuliert. Lemma C. Es sei G eine Untergruppe der Sm und X sei eine unendliche Teilmenge des K¨ orpers K. Sind r1 , . . . , rm verschiedene Elemente von K, sind k1 , . . . , km nach Lemma B existierende Elemente aus X, so dass die ρσ (k, r) mit σ ∈ Sm paarweise verschieden sind, und definiert man das Polynom g durch x − ργ (k, r) , g := γ∈G
so gibt es ein u ∈ X, so dass g σ (u) = g(u) genau dann gilt, wenn σ ∈ G ist. Beweis. Es ist klar, dass g γ = g ist f¨ ur alle γ ∈ G. Dann ist aber auch g γ (v) = g(v) f¨ ur alle γ ∈ G und alle v ∈ X. Ist 1, σ1 , . . . , σt ein Vertretersystem der Rechtsrestklassen von G in Sm , so sind die Polynome g, g σ1 , . . . , g σt paarweise verschieden, weil die ργσi paarweise verschieden sind. Folglich ist das Polynom F :=
t
(g − g σi )
i:=1
ungleich 0. Weil F als Polynom in x nur endliche viele Nullstellen hat, gibt es ein u ∈ X mit F (u) = 0. Hieraus folgt g(u) = g σi (u) f¨ ur i := 1, . . . , t und damit die Behauptung.
420
Kapitel XIII. Galois
Das n¨achste Lemma sei von Abel in seiner postum erschienen Arbeit u ¨ ber elliptische Funktionen ohne Beweis zitiert worden. Es ist die Arbeit Abel 1829. Dort in der zweiten H¨ alfte der Seite 261. Lemme III. La fonction V ´etant choisi comme il est indiqu´e dans l’article pr´ec´edent, elle jouira de cette propri´et´e que toutes les racines de l’´equation propos´ee s’exprimeront rationellement en fonction de V. Nachdem Galois dieses Lemma bewiesen hat, kommentiert er es. Es sei bemerkenswert, dass dieses Lemma besage, dass jede Gleichung von einer Hilfsgleichung abhinge, deren L¨ osungen rationale Funktionen einer jeglichen von ihnen ¨ seien. Im Ubrigen sei diese Bemerkung aber rein kurios, da die Hilfsgleichung in aller Regel nicht einfacher zu l¨ osen sei als die Ausgangsgleichung. Dass dieses Lemma aber nur eine Kuriosit¨ at sei, kann nicht ganz ernst gemeint sein, da es ihm die Gruppe der gegebenen Gleichung in die Hand gibt. Bevor wir daran gehen, sei der Satz modern formuliert und mittels des dedekindschen Argumentes bewiesen. Die Hilfsmittel zum Beweise finden sich bei Lagrange, wie wir gleich sehen. Man beachte, dass im folgenden Satz nicht vorausgesetzt wird, dass das Polynom f irreduzibel sei. Die Einfachheit der Nullstellen ist das, was z¨ ahlt. Polynome mit nur einfachen Nullstellen nannten wir fr¨ uher auch schon separabel (Kap. 10, Absch. 4). Hier tun wir dies nicht, um n¨ aher an den Quellen zu bleiben. Der Leser erinnere sich aber daran. Der Leser erinnere sich auch daran, dass bei einem Polynom f u ¨ ber einem K¨ orper der Charakteristik 0 das Polynom g :=
f ggT(f, f )
das Produkt u ¨ber alle irreduziblen Polynome ist, die f teilen, so dass alle Nullenstellen von f auch Nullstellen von g sind. Bei Charakteristik 0 ist das L¨osen von algebraischen Gleichungen also gleichbedeutend mit dem L¨ osen von Gleichungen, die nur einfache Nullstellen haben. Ist die Vielfachheit gefragt, so ist diese einfach zu bestimmen. Satz 1. Es sei K ein K¨ orper, der unendlich viele Elemente enthalte, und f sei ein Polynom u ¨ber K mit lauter einfachen Nullstellen. Sind r1 , . . . , rm die Nullstellen von f in einem f zerf¨ allenden K¨ orper und sind α1 , . . . , αm nach Lemma B existierende Elemente von K, so dass die ρσ (α, r) mit σ ∈ Sm paarweise verschieden sind, so ist K[r1 , . . . , rm ] = K ρσ (α, r) f¨ ur alle σ ∈ Sm . Die ρσ (α, r) sind also primitive Elemente von K[r1 , . . . , rm ]. Beweis. Auch dieser Beweis folgt Dedekind. Wir ersetzen die ri durch Unbestimmte xi . Dann sind auch die Polynome ρσ (α, x) paarweise verschieden, so dass der Zentralisator eines jeden dieser Polynome gleich {1} ist. F¨ ur i := 1, . . . , m setzen wir wie schon fr¨ uher ai := (−1)i λi (m, x), wobei λi (m, x) das i-te elementarsymmetrische Polynom in den xj ist. Nach dem Korollar
6. Galois’ M´emoire I
421
zu Satz 3 aus Abschnitt 6 des Kapitel 8 — das ist Lagrangens Beitrag — gibt es dann zu jedem xi ein Polynom Gi ∈ K[a1 , . . . , am ][y], so dass μρσ (α,x) ρσ (α, x) xi = Gi ρσ (α, x) ¨ ber K(a1 , . . . , am ). Erist. Dabei ist μρσ (α,x) das Minimalpolynom von ρσ (α, x) u setzt man die xj wieder durch rj , so erh¨alt man (das stehen gebliebene ρσ (α, x) ist Index!) μρσ (α,x) ρσ (α, r) ri = Gi ρσ (α, r) . Bei der Ersetzung der xi durch die ri sind aus den Polynomen μ und Gi Polynome u ¨ ber K geworden, da ja die ai (r1 , . . . , rm ) die Koeffizienten von f sind, also zu K geh¨oren. Wir wollen zeigen, dass μρσ (α,x) (ρσ (α, r)) = 0 ist. Das Minimalpolynom von ρσ (α, x) ist Teiler von y − ρτ (α, x) , τ ∈Sm
hat also nur einfache Nullstellen. Bezeichnet man der Deutlichkeit halber f¨ ur den Augenblick mit μ ¯ρσ (α,x) das Bild des Minimalpolynoms nach der Ersetzung, so hat auch μ ¯ρσ (α,x) nur einfache Nullstellen, n¨ amlich gewisse der ρτ (α, r). Hieraus folgt, dass keine dieser Nullstellen Nullstelle von μ ¯ρσ (α,x) ist. Folglich ist μ ¯ρσ (α,x) ρσ (α, r) = 0. Nun ist aber
μ ρσ (α,x) = μ ¯ρσ (α,x) .
Daher ist, wobei die Querstriche wieder weggelassen sind, da beide Interpretationen das gleiche Ergebnis liefern, ri =
Gi (ρσ (α, r)) . μρσ (α,x) (ρσ (α, r))
Dies zeigt, dass ri ∈ K[ρσ (α, r)] ist. Da dies f¨ ur alle i gilt, folgt weiter K[r1 , . . . , rm ] ⊆ K[ρσ (α, r)]. Trivialerweise gilt ρσ (α, r) ∈ K[r1 , . . . , rm ]. Also gilt die Behauptung des Satzes. In Dirichlet 1871 gibt Dedekind in einer Fußnote auf den Seiten 427/428 einen anderen Beweis f¨ ur die Existenz eines primitiven Elementes in einer beliebigen endlichen, in C enthaltenen Erweiterung von Q. Satz 2 ist im Wesentlichen das, was Galois in Lemma IV formuliert, wobei jedoch das genau“ nicht vorkommt. Wir bedienen uns f¨ ur seinen Beweis des ersten ” Isomorphiesatzes, der Galois und Dedekind noch nicht zur Verf¨ ugung stand, der
422
Kapitel XIII. Galois
uns aber langes Nachdenken erspart. Lemma IV geh¨ort auch zu den Dingen, die Galois bekannt nennt. Satz 2. Es sei K ein K¨ orper, der unendlich viele Elemente enthalte, und f sei ein Polynom u ¨ber K mit lauter einfachen Nullstellen. Es seien r1 , . . . , rm die Nullstellen von f in einem f zerf¨ allenden K¨ orper und α1 , . . . , αm seien nach Lemma B existierende Elemente von K, so dass die ρσ (α, r) mit σ ∈ Sm paarweise verschieden sind. Ferner sei η eines der ρσ (α, r). Ist dann μ das Minimalpolynom von η u ¨ber K, so ist μ Teiler von x − ρσ (α, r) . σ∈Sm
Ist ξ eine Nullstelle von μ, so gibt es genau einen Automorphismus des K¨ orpers K[r1 , . . . , rm ], der K elementweise fest l¨ asst und der η auf ξ abbildet. Beweis. Das Einsetzen von η in die Polynome aus K[x] ergibt einen Epimorphismus von K[x] auf K[η], dessen Kern gleich μK[x] ist. Nach dem ersten Isomorphiesatz gibt es daher einen Isomorphismus von K[x]/μK[x] auf K[η], der K elementweise festl¨asst und x + μK[x] auf η abbildet. Ebenso gibt es einen Isomorphismus von K[x]/μK[x] auf K[ξ], der K elementweise festl¨asst und x + μK[x] auf ξ abbildet. Weil nach Satz 1 die Gleichungen K[η] = K[r1 , . . . , rm ] = K[ξ] gelten, gibt es einen Automorphismus von K[r1 , . . . , rm ], der η auf ξ abbildet. Die Einzigkeit dieses Automorphismus folgt daraus, dass ein Automorphismus, der η festl¨asst und auf K die Identit¨ at induziert, die Identit¨ at ist. Satz 3. Die Voraussetzungen seien wie bei Satz 2. Es bezeichne γξ den in Satz 2 beschriebenen Automorphismus von K[r1 , . . . , rm ], der η auf ξ abbildet. Dann ist G := γξ | ξ ∈ K[r1 , . . . , rm ], μ(ξ) = 0 eine Gruppe, die auf der Menge der Nullstellen von μ transitiv operiert. Ist δ ein Automorphismus von K[r1 , . . . , rm ], der K elementweise fest l¨ asst, so ist δ ∈ G. Insbesondere gilt |G| = Grad(μ) = K[r1 , . . . , rm ] : K . Beweis. Dass G auf der Menge der Nullstellen von μ transitiv operiert, steht schon in Satz 2. Es sei δ ein Automorphismus von K[r1 , . . . , rm ], der K elementweise fest l¨asst. Setze ξ := η δ . Weil δ auf K die Identit¨ at induziert, folgt μ(ξ) = μ(η δ ) = μ(η)δ = 0. Mit Satz 2 folgt hieraus δ = γξ ∈ G.
6. Galois’ M´emoire I
423
Weil die Gesamtheit aller Automorphismen von K[r1 , . . . , rm ], die auf K die Identit¨ at induzieren, eine Gruppe bilden, folgt hieraus alles Weitere. Die Gruppe G nennen wir die Gruppe oder auch die Galoisgruppe von f bez¨ uglich K. Galois gibt f¨ ur diesen Satz zwei Beispiele. Als erstes erw¨ahnt er die algebra” ischen Gleichungen“, deren Gruppe die symmetrische sei, da ja (puisce que) in diesem Falle die symmetrischen Funktionen die einzigen rational bekannten seien. Als zweites die p-te Kreisteilungsgleichung mit der zyklischen Gruppe der Ordnung p − 1. In diesem Fall ist die Ordnung der Gruppe gleich dem Grad der Gleichung. Das sei immer so, wenn von den Wurzeln einer Gleichung sich jede als rationale Funktion einer jeden anderen darstellen lasse. Satz 3 besagt auch, dass die Gruppe G nicht von der speziellen Wahl von η abh¨ angt. Darauf weist Dedekind hin. Satz 4. Es sei K ein K¨ orper der Charakteristik 0 und f sei ein Polynom u ¨ber K mit lauter einfachen Nullstellen r1 , . . . , rm in einer geeigneten Erweiterung von K. Es sei η ein nach Satz 2 existierendes primitives Element von K[r1 , . . . , rm ]. Ist dann G die Gruppe von f bez¨ uglich K, das ist die Gruppe aller Automorur alle a ∈ phismen von K[r1 , . . . , rm ], die K elementweise fest lassen, so gilt f¨ K[r1 , . . . , rm ], dass genau dann a ∈ K ist, wenn aγ = a ist f¨ ur alle γ ∈ G. Beweis. Ist a ∈ K, so ist nat¨ urlich aγ = a f¨ ur alle γ ∈ G. Es sei umgekehrt γ ur alle γ ∈ G. Es gibt ein Polynom f ∈ K[x] mit a = f (η), wobei η wieder a = a f¨ die Bedeutung aus Satz 2 habe. Es folgt a = aγ = f (η)γ = f (η γ ) f¨ ur alle γ ∈ G und weiter, da die Charakteristik von K gleich null ist, 1 a= f (η γ ). |G| γ∈G
Der Ausdruck rechts ist symmetrisch in den Nullstellen von μ. Daher ist a ein ganzzahliges Polynom in den Koeffizienten von μ und folglich ein Element von K. Satz 5. Es sei K ein K¨ orper der Charakteristik 0 und f sei ein Polynom u ¨ber K mit lauter einfachen Nullstellen r1 , . . . , rm . Es sei η ein nach Satz 2 existierendes primitives Element von K[r1 , . . . , rm ] und es sei G die Gruppe des Polynoms f . Ferner sei p eine Primzahl und g ein u ¨ber K irreduzibles Polynom des Grades p. Schließlich sei s eine Nullstelle von g in einer geeigneten Erweiterung von K. Ist dann μ das Minimalpolynom von η u ¨ber K, so gilt eine der beiden Aussagen: ¨ber K[s] irreduzibel und G ist 1) Es ist s ∈ K[r1 , . . . , rm ], das Polynom μ ist u auch die Gruppe von f u ¨ber K[s]. allt u ¨ber K[s] in p Polynome 2) Es ist s ∈ K[r1 , . . . , rm ]. Das Polynom μ zerf¨ des Grades Grad(μ) . p
424
Kapitel XIII. Galois
Das Polynom g zerf¨ allt in K[r1 , . . . , rm ] in Linearfaktoren. Sind s1 = s, s2 , . . . , sp die Nullstellen von g in K[r1 , . . . , rm ], so sind die Stabilisatoren Gs1 , . . . , Gsp konjugiert in G. Sie alle haben den Index p in G. Die Gruppe von f bzg. K[s] ist Gs . Beweis. Wir zeigen zun¨achst, dass entweder K[r1 , . . . , rm ] ∩ K[s] = K oder aber K[s] ⊆ K[r1 , . . . , rm ] ist. Galois argumentiert hier mittels Elimination, die wir nicht sonderlich beherrschen, w¨ ahrend wir uns eines Argumentes bedienen, das Galois noch nicht zur Verf¨ u gung stand. Es ist ja K[s] : K = Grad(g) = p und p = K[s] : K = K[s] : (K[r1 , . . . , rm ] ∩ K[s]) (K[r1 , . . . , rm ] ∩ K[s]) : K . Weil p eine Primzahl ist, folgt die Zwischenbehauptung. urlich 1). Ist nun s ∈ K[r1 , . . . , rm ], so gilt nat¨ Es sei also s ∈ K[r1 , . . . , rm ]. Weil g u ¨ ber K irreduzibel ist, ist s ∈ K. Mit Satz 4 folgt, dass der Stabilisator Gs von s in G von G verschieden ist. Die Bilder von s unter G sind allesamt Nullstellen von g. Diese seien s1 = s, s2 , . . . , st . Dann ist also t > 1. Wir betrachten das Polynom h :=
t
(x − si ).
i:=1
Es bleibt unter allen Automorphismen von G invariant. Also sind die Koeffizienten von h nach Satz 4 Elemente von K. Andererseits ist h Teiler von g. Also ist h = g, weil g ja irreduzibel und weil Grad(h) = t > 1 ist. Insbesondere ist t = p, so ¨ ber dass alle Nullstellen von g Elemente von K[r1 , . . . , rm ] sind. Die Aussagen u die Indizes und die Konjugiertheit der Gsi folgen aus der Transitivit¨ at von G auf der Menge der si . Es sei H die Gruppe von f bzg. K[s]. Dann ist Gs ⊆ H. Ferner gilt mit n := [K[r1 , . . . , rm ] : K], dass n n = |Gs | ≤ |H| = p p ist. Also ist Gs = H. Damit ist alles bewiesen. Galois kehrt die Konjugiertheit der Gsi als besonders bemerkenswert heraus. Satz 6. Es sei K ein K¨ orper der Charakteristik 0 und f sei ein Polynom u ¨ber K mit lauter einfachen Nullstellen r1 , . . . , rm und es sei G die Gruppe des Polynoms f . Es sei A ∈ K und p sei eine Primzahl und das Polynom xp − A sei irreduzibel u ¨ber K. Ferner enthalte K eine primitive p-te Einheitswurzel. Ist dann s eine
6. Galois’ M´emoire I
425
Nullstelle von xp − A in K[r1 , . . . , rm ], so ist Gs ein Normalteiler vom Index p in G. Beweis. Es sei α eine nach Voraussetzung existierende primitive p-te Einheitswurzel in K. Dann sind s, αs, α2 s, . . . , αp−1 s die s¨amtlichen Nullstellen von xp −A. Diese bilden eine Bahn von G, wie gerade beim Beweise von Satz 5 gesehen. Es seien γ, δ ∈ G. Es gibt dann nicht-negative ganze Zahlen i und j mit sγ = αi s und sδ = αj s. Dann ist sγδ = (αi s)δ = αi sδ = αi+j s = αj+i s = αj sγ = (αj s)γ = sδγ . Hieraus folgt γδγ −1 δ −1 ∈ Gs . Nach Satz 2 von Abschnitt 3 ist Gs daher ein Normalteiler mit abelscher Faktorgruppe. Dass Gs in G den Index p hat, steht schon in Satz 5. Galois merkt beim Beweise des im folgenden Satz ausgesprochenen Sachverhaltes, dass er ein Polynom θ in m Unbestimmten braucht, welches unter den Permutationen und nur den Permutationen einer gegebenen Untergruppe der Sm festbleibt. Er gibt in einer Anmerkung auf dem Rande einen Hinweis, wie ein ´ solches Polynom zu finden sei (Ecrits S. 60). Dedekind hat dies bei seinem systematischen Aufbau rechtzeitig untergebracht (Lemma C). Satz 7. Es sei K ein K¨ orper der Charakteristik 0. Es sei p eine Primzahl und K enthalte eine primitive p-te Einheitswurzel α. Es sei f ein Polynom u ¨ber K mit lauter einfachen Nullstellen r1 , . . . , rm und G sei die Gruppe von f . Die Gruppe G enthalte einen Normalteiler N vom Index p und θ sei ein nach Lemma C existierendes Polynom in r1 , . . . , rm , welches unter den und nur den Elementen aus N invariant bleibt. Ist dann γ ∈ G und γ ∈ N , so setzen wir 2
s := θ + αθγ + α2 θγ + . . . + αp−1 θγ
p−1
und A := sp . Dann ist A ∈ K und das Polynom xp − A ist irreduzibel u ¨ber K. Ferner ist Gs = N . p Beweis. Weil der Index von N in G gleich p ist, ist γ p ∈ N und folglich θγ = θ. Daher ist 2
sγ = αp sγ = αp (θγ + αθγ + . . . + αp−2 θγ 2
= αp−1 (αθγ + α2 θγ + . . . + αp−1 θγ
p−1
p−1
p
+ αp−1 θγ )
+ θ) = αp−1 s.
Hieraus folgt Aγ = A. Ist δ ∈ G, so gibt es ein ν ∈ N und ein i ∈ N0 mit δ = νγ i . Es folgt Aδ = A. Mit Satz 4 folgt daher, dass A ∈ K ist. Somit ist xp − A ein Polynom u ¨ ber K. Weil s eine Nullstelle von xp − A ist, die wegen sγ = αp−1 s = s nicht in K liegt, ist xp − A nach Satz 1 aus Abschnitt 4 des Kapitels 12 und seinem Korollar irreduzibel.
426
Kapitel XIII. Galois
Es ist N ⊆ Gs und Gs = G. Weil N in G den Index p hat und p eine Primzahl ist, folgt N = Gs . Damit ist alles bewiesen. Wir gehen nun der Frage nach, wann eine Gleichung durch Radikale l¨ osbar ist. Es wird sich herausstellen, dass dies genau dann der Fall ist, wenn ihre Gruppe aufl¨ osbar ist. Galois Beweis ist an einer Stelle besonders grobmaschig und zwar bei dem Teil des Beweises, wo die Aufl¨osbarkeit der Gruppe angenommen wird, um dann auf die Aufl¨ osbarkeit der Gleichung zu schließen. Dort adjungiert er Einheitswurzeln, ohne dies zu rechtfertigen, was er bei der anderen Richtung L¨osbarkeit ” durch Radikale impliziert Aufl¨ osbarkeit der Gruppen“ sehr sorgf¨ altig tut. In Dedekinds Notizen findet sich nur, dass die Einheitswurzeln im Vorfeld der Theorie abgehandelt werden m¨ ussten. Er nimmt dann an, dass die ben¨ otigten Einheitswurzeln stets in dem zu Grunde liegenden Koeffizientenbereich enthalten sind, dh., er ist noch weniger sorgf¨ altig als Galois. Dann behandelt er noch reine Gleichungen, worauf die Notizen versanden. Dedekind ist hier also keine Hilfe, wir m¨ ussen selbst arbeiten. Dabei versuche ich m¨oglichst nahe bei den damaligen Methoden — nicht der Sprache — zu bleiben. Es sei L eine Erweiterung von K und M und N seien Zwischenk¨orper dieser Erweiterung. Dann bezeichnen wir wieder mit M N das Kompositum von M und N , dh., den Schnitt u ¨ber alle Teilk¨orper von L, die sowohl M als auch N enthalten. Ist L algebraisch u ¨ber K, so besteht M N aus allen Summen der Form t
mi n i
i:=1
mit mi ∈ M und ni ∈ N . Diese Summen bilden ja offensichtlich einen Ring, der in M N enthalten ist. Ist nun 0 = x = ti:=1 mi ni , so ist x ∈ K[m1 , . . . , mt , n1 , . . . , nt ]. Weil Letzteres ein K¨orper ist, ist x−1 ∈ K[m1 , . . . , mt , n1 , . . . , nt ]. Folglich ist x−1 ein Polynom in m1 , . . . , mt , n1 , . . . , nt . Weil aber Potenzen der mi zu M und Potenzen der ni zu N geh¨oren, folgt x−1 =
s
mi ni .
i:=1
Der nun folgende Translationssatz findet sich in Artin 1942, S. 55. Seinen Namen ¨ scheint er erst in der deutschen Ubersetzung dieser Schrift bekommen zu haben (Artin 1968). In Artin 1938 findet er sich noch nicht. Van der Waerden, kurz vor seinem Tode von Dr. Petra Meyer nach der Geschichte dieses Satzes gefragt, schrieb ihr, dass auch er vermute, dass dieser Satz von Artin stamme. Ich danke Frau Meyer f¨ ur diese Mitteilung. Translationssatz. Es sei K ein K¨ orper und f sei ein Polynom u ¨ber K mit lauter einfachen Nullstellen. Ferner sei L eine algebraische Erweiterung von K
6. Galois’ M´emoire I
427
und der Zwischenk¨ orper M der Erweiterung L von K sei Zerf¨ allungsk¨ orper von f u ¨ber K. Ist N irgendein Zwischenk¨ orper der Erweiterung L : K, so ist M N der Zerf¨ allungsk¨ orper von f u ¨ber N . Ist G die Gruppe von f u ¨ber K und H die Gruppe von f u ¨ber N , so ist H isomorph zu einer Untergruppe von G. Beweis. Es seien r1 , . . . , rm die Nullstellen von f in L. Dann ist M = K[r1 , . . . , rm ]. Es folgt M N = N [r1 , . . . , rm ], da ja K ⊆ N ist. Also ist M N Zerf¨ allungsk¨ orper von f u ¨ ber N . Weil f nur einfache Nullstellen hat, existieren die beiden Gruppen G und H. Es sei η ∈ H. Wegen K ⊆ N l¨ asst η den K¨ orper K elementweise fest. Weil asst η auch M fest. Also induziert η einen η die ri untereinander permutiert, l¨ Automorphismus η aus G. Es sei insbesondere η = 1. Dann l¨ asst η alle Elemente von M und damit alle Elemente von N [r1 , . . . , rm ] = M N fest. Also ist η = 1. Daher ist die Abbildung η → η ein Monomorphismus, so dass H in der Tat zu einer Untergruppe von G isomorph ist. urlich Untergruppe der Gruppe U aller Elemente aus G, Die Gruppe H ist nat¨ die M ∩ N elementweise fest lassen. Dass die beiden Gruppen gleich sind, folgt mit dem Hauptsatz der galoisschen Theorie, den wir bislang noch nicht haben. Wir hatten in Abschnitt 5 von Kapitel 12 nur f¨ ur irreduzible Gleichungen definiert, was es heißt, durch Radikale l¨ osbar zu sein. Dabei wurde dort nur verlangt, dass es eine Radikalerweiterung gebe, in der die Gleichung eine L¨ osung habe. Weil die Gruppe einer Gleichung im Falle der Irreduzibilit¨ at der Gleichung ¨ auf der Menge der L¨ osungen transitiv operiert (Ubungsaufgabe! Bei einem unserer Beweise schon einmal bewiesen.), ist sie in diesem Falle mit der galoisschen Definition gleichwertig. Galois verlangt n¨ amlich, in unserer Sprache formuliert, dass alle L¨ osungen einer Gleichung in einer Radikalerweiterung liegen. Das sind f¨ ur reduzible Gleichungen also zwei verschiedene Begriffe. Um dies zu sehen, braucht man ja nur das Produkt zweier Polynome zu betrachten, wobei die Gruppe des einen Polynoms aufl¨ osbar, die Gruppe des andern Polynoms aber nicht aufl¨ osbar ist. Wir definieren hier nun mit Galois: Ist f ein Polynom u ¨ber K, so heißt die Gleichung f = 0 u ¨ber K durch Radikale l¨ osbar , wenn es eine Radikalerweiterung L von K gibt, in der f vollst¨andig in Linearfaktoren zerf¨ allt. Satz 8. Es sei K ein K¨ orper der Charakteristik 0 und es sei f ein Polynom u ¨ber K mit lauter einfachen Nullstellen r1 , . . . , rm . Es sei ferner G die Gruppe von f bzg. K. Genau dann ist f durch Radikale l¨ osbar, wenn die Gruppe G aufl¨ osbar ist. Beweis. Es sei G aufl¨ osbar. Nach Satz 6 von Abschnitt 5 des Kapitels 12 gibt es eine Radikalerweiterung N von K, so dass N eine primitive σ(|G|)-te Einheitswurzel enth¨ alt, wobei σ(|G|) der Sockel von |G|, dh., das Produkt u ¨ber alle Primteiler von |G| ist (Kap. 9, Absch. 3). Nach dem Translationssatz ist dann orper von f u ¨ ber N . Die Gruppe H von f bzg. N N [r1 , . . . , rm ] der Zerf¨allungsk¨
428
Kapitel XIII. Galois
ist nach dem Translationssatz isomorph zu einer Untergruppe von G. Mit Satz 5 von Abschnitt 3 folgt, dass H aufl¨ osbar ist. Ist H = {1}, so ist N = N [r1 , . . . , rm ] nach Satz 4. Damit ist in N eine Radikalerweiterung von K gefunden, die f vollst¨andig zerf¨ allt. Es sei H = {1}. Weil H aufl¨ osbar ist, enth¨alt H dann einen Normalteiler P , dessen Index p in H eine Primzahl ist. Weil p als Teiler von |H| auch Teiler von |G| ist und weil N eine primitive σ(|G|)-te Einheitswurzel enth¨alt, enth¨ alt N auch eine primitive p-te Einheitswurzel. Nach Satz 7 enth¨ alt N [r1 , . . . , rm ] dann ein Element s, so dass A := sp ∈ N gilt und dass xp − A u ¨ ber N irreduzibel ist. Daher ist N [s] eine Radikalerweiterung von N und damit auch eine von K, da das Radikalerweiterung-sein transitiv ist. Nach Satz 7 ist P die Gruppe von f bzg. N [s] und P ist als Untergruppe der aufl¨ osbaren Gruppe H ebenfalls aufl¨osbar. Wegen |P | < |H| ≤ |G| folgt mit Induktion, dass es eine Radikalerweiterung R von N [s] gibt, die f zerf¨allt. Weil R dann auch eine Radikalerweiterung von K ist, ist f durch Radikale l¨ osbar. Es sei umgekehrt f durch Radikale l¨ osbar. Wir wollen zeigen, dass G aufl¨ osbar ist. Das ist sehr subtil, da wir nichts u ¨ ber die Existenz von Einheitswurzeln in K vorausgesetzt haben, das Adjungieren von Einheitswurzeln aber die Gruppe G ver¨ andern kann. Ich folge hier Galois’ Argument, der zeigt, dass man ben¨ otigte Einheitswurzeln so adjungieren kann, dass G nicht ver¨ andert wird. Galois’ Argumentieren ist so neu, so modern, dass ich es hier im Wortlaut wiederhole und dann kommentiere, auf diese Weise den Beweis von Satz 8 zu Ende f¨ uhrend. Cela pos´e, cherchons `a quelle condition doit satisfaire le groupe d’une ´equation, ” pour qu’il puisse s’abaisser ainsi par l’adjonction de quantit´es radicales. Suivons la marche des op´erations possibles dans cette solution, en consid´erant comme op´erations distinctes, l’extraction de chaque racine de degr´e premier. Adjoignons a` l’´equation le premier radical extrait dans la solution; il pourra arriver deux cas: ou bien par l’adjonction de ce radical, le groupe des permutations de l’´equation sera diminu´e; ou bien, cette extraction de racine n’´etant q’une simple pr´eparation, le groupe reste le mˆeme. Toujours sera-t-il qu’apr`es un certain nombre FINI d’extractions de racines, le groupe devra se trouver diminuer, sans quoi l’´equation ne sera pas soluble. Si arriv´e `a ce point, il y avait plusieurs mani`eres de diminuer le groupe de l’´equation propos´ee par une simple extraction de racine, il faudrait, pour ce que nous allons dire, consid´erer seulement un radical du degr´e le moins haut possible parmi tous les simples radicaux qui sont tels, que la connaissance de chacun d’eux diminue le groupe de l’´equation. Soit donc p le nombre premier qui repr´esente ce degr´e minimum en sorte que par une extraction de racine de degr´e p, on diminue le groupe de l’´equation. Nous pouvons toujours supposer, du moins pour ce qui est relatif au groupe de l’´equation, que parmi les quantit´es adjointes pr´ec´edemment `a l’´equation se
6. Galois’ M´emoire I
429
trouve une racine pi`eme de l’unit´e α. Car comme cette expression s’obtient par des extractions de racines de degr´e inf´erieur `a p, sa connaissance n’alt´erera en rien le groupe de l’´equation.“ Galois sucht also nach Bedingungen, die die Gruppe einer Gleichung erf¨ ullen muss, damit sie durch Adjunktion von Wurzeln verkleinert werden kann. Folgen wir dem Gang der m¨ oglichen Operationen, wobei wir das Ausziehen ” einer p-ten Wurzel, p Primzahl, (f¨ ur verschiedene Primzahlen) als verschiedene Operationen ansehen.“ Es ist klar, dass man sich auf das Ausziehen von p-ten Wurzeln beschr¨ anken kann, bei denen p eine Primzahl ist, da ja 1
1
1
s ab = (s a ) b
gilt. Abz¨ ahlbar viele Operationen neben den schon vorhandenen der Addition, Multiplikation, Subtraktion und Division! Hier taucht, so scheint es mir, am Horizont die universelle Algebra und die Modelltheorie auf. Er stellt sich vor, er h¨ atte die L¨osung gefunden, und betrachtet die erste Wurzel, die der Gleichung hinzugef¨ ugt wurde. Es g¨ abe zwei M¨oglichkeiten. An der Gruppe h¨ atte sich nichts ge¨andert oder aber die Gruppe sei verkleinert worden. Im ersten Falle diene die Adjunktion der Wurzel der Vorbereitung. Der zweite Fall tr¨ ate aber nach einer ENDLICHEN (Auszeichnung von Galois) Anzahl von Schritten ein, da die Gruppe verkleinert werden m¨ usse, da andernfalls die Gleichung nicht durch Radikale l¨ osbar w¨are. Ich sehe das schneller, wenn ich zun¨achst nicht auf die Gruppe schaue, sondern auf f . Dieses Polynom zerf¨ allt nach Annahme in einer Radikalerweiterung in Linearfaktoren. Also muss nach endlich vielen Schritten ein erstes, weiteres Zerfallen und damit eine Verkleinerung der Gruppe erreicht werden. — Weiteres Zerfallen dann, wenn das gegebene f nicht irreduzibel ist. Die Argumentation ist bis hierher schon bemerkenswert. Es geht aber weiter. Es gibt m¨ oglicherweise verschiedene Verfahren, die Wurzeln zu berechnen, und damit auch verschiedene M¨ oglichkeiten, zum ersten Mal eine p-te Wurzel zu adjungieren, die f zerf¨allt, bzw. G verkleinert. Unter diesen Primzahlen w¨ahle man die kleinste. Diese heiße p. Man k¨ onne nun annehmen, dass sich unter den schon adjungierten Gr¨ oßen auch eine primitive p-te Einheitswurzel α bef¨ ande. Diesen Ausdruck erhielte man ja durch Adjunktion von q-ten Wurzeln, wobei q Primzahl sei, die der Ungleichung q < p gen¨ uge. Die Kenntnis von α ¨ andere also nichts an der Gruppe der Gleichung. Das Wort connaissance, das ich mit Kenntnis“ u ¨ bersetzt habe, hat hier technische ” Bedeutung. Es bedeutet, dass man α dem Vorrat, der bekannten“ Koeffizienten, ” also dem Vorrat der Gr¨ oßen, mit denen man rechnen kann, hinzugef¨ ugt hat. osbar ist und bei ihrer L¨ osung nur Dass die Gleichung Φp = 0 durch Radikale l¨ solche q-ten Wurzeln adjungiert werden, f¨ ur die q kleiner als p ist, entnimmt Galois den gaußschen Disquisitiones. Wir berufen uns hier auf Satz 7 von Abschnitt 5 des Kapitels 12, wobei die Disquisitiones auch hier den Untergrund abgeben.
430
Kapitel XIII. Galois
Damit ist gezeigt, dass man, wenn α noch nicht dem K¨ orper K angeh¨ ort, eine Radikalerweiterung N von K finden kann, die α enth¨ alt, so dass G auch die Gruppe von f u ¨ ber N ist. Es gibt ferner ein A ∈ K ⊆ N , so dass xp −A eine Nullstelle s hat, so dass f u ¨ ber N [s] (weiter) zerf¨ allt, die Gruppe Gs also eine echte Untergruppe von G ist. Es folgt, dass s ∈ N ist. Daher ist xp − A irreduzibel u ¨ ber N (Kap. 12, Absch. 4, Satz 1 und sein Korollar). Mit Satz 6 folgt nun, dass Gs ein Normalteiler von G ist, und mit Satz 5 folgt, dass Gs die Gruppe von f bez¨ uglich N [s] ist. Mit Induktion folgt schließlich, dass Gs aufl¨ osbar ist. Als Gruppe der Ordnung p osbar, so dass G aufl¨ osbar ist. Damit ist Satz 8 bewiesen. — ist auch G/Gs aufl¨ Zauberhaft! Wunderbar! Der abelsche Satz, dass die allgemeine Gleichung f¨ unften und h¨ oheren Grades nicht durch Radikale l¨ osbar ist, ist nun eine einfache Folgerung, die sich in Galois’ Papieren aber nicht findet. Satz 9. Es sei m eine nat¨ urliche Zahl mit m ≥ 5. Ferner sei K ein K¨ orper orper in den Unbesder Charakteristik 0 und K(x1 , . . . , xm ) sei der Funktionenk¨ ur i := 0, . . . , m, wobei λi (m) timmten x1 , . . . , xm . Ist dann ai := (−1)i λi (m) f¨ die i-te elementarsymmetrische Funktion in den m Unbestimmten x1 , . . . , xm ist, so ist die Gleichung m ai xi = 0 i:=0
osbar. u ¨ber K(a1 , . . . , am ) nicht durch Radikale l¨ Beweis. Die Gruppe der Gleichung ist die Sm und die ist f¨ ur m ≥ 5 nicht aufl¨ osbar (Korollar zu Satz 15, Abschnitt 3). Nun sind wir in der Lage, die Frage zu beantworten, ob es auch u ¨ber Q Gleichungen gibt, die nicht durch Radikale l¨ osbar sind. Dies geschehe im n¨ achsten Abschnitt. 7. Irreduzible Gleichungen von Primzahlgrad. Als Anwendung seiner The´ orie beweist Galois den folgenden Satz (Ecrits, S. 57f.). Satz 1. Es sei K ein K¨ orper der Charakteristik 0 und f ∈ K[x] sei irreduzibel vom Grade p mit einer Primzahl p. Ferner sei L der Zerf¨ allungsk¨ orper von f u ¨ber K. Genau dann ist die Galoisgruppe G von f aufl¨ osbar, wenn f¨ ur alle Paare a und b von verschiedenen Nullstellen von f gilt, dass L = K[a, b] ist. Beweis. Als irreduzibles Polynom u ¨ ber einem K¨ orper der Charakteristik 0 hat f nur einfache Nullstellen. Es seien r0 , . . . , rp−1 diese Nullstellen. Weil f irreduzibel ist, operiert G transitiv auf der Menge der ri . Ist γ ∈ G, so gibt es ein ρ ∈ Sp mit riγ = riρ . Die Abbildung γ → ρ ist ein Isomorphismus von G auf eine Untergruppe U von Sp und U operiert transitiv auf {0, . . . , p − 1}.
7. Irreduzible Gleichungen von Primzahlgrad
431
Es sei G aufl¨ osbar. Dann ist auch U aufl¨ osbar und nach Satz 13 von Abschnitt 3 konjugiert zu einer Untergruppe der A(1, p). Dieser Satz wurde von Galois in diesem Zusammenhang bewiesen. Man kann die ri also so nummerieren, dass es zu γ ∈ G Elemente u, v ∈ GF(p) gibt mit u = 0 und riγ = rui+v . Weil a und b bei γ festbleiben, gibt es verschiedene i und j ∈ GF(p) mit ri = a = aγ = rui+v , rj = b = bγ = ruj+v . Es ist also i = ui + v und j = uj + v. Hieraus folgt v = 0 und u = 1 und damit γ = 1. Also ist Ga,b = {1}. Nach Satz 5 von Abschnitt 6 ist Ga,b die Gruppe von f bez¨ uglich K[a, b] und nach Satz 3 von Abschnitt 6 gilt L : K[a, b] = |Ga,b |. Daher ist [L : K[a, b]] = 1 und folglich L = K[a, b]. Wir nehmen nun an, dass f¨ ur verschiedene Nullstellen a und b von f stets K[a, b] = L ist. Dann ist Ga,b = {1} f¨ ur alle diese a und b. Weil G auf der Menge der ri transitiv operiert, ist p Teiler von |G|. Es folgt, dass |G| = p|Ga | ist. Weil die von 1 verschiedenen Elemente von Ga nur den Fixpunkt a haben, folgt, dass |Ga | Teiler von p−1 ist. Also ist |G| ≤ p(p−1). Nach Cauchy enth¨ alt G eine Untergruppe P der Ordnung p. H¨atte G eine zweite Untergruppe Q der Ordnung p, so enthielte G wenigstens |P Q| = p2 Elemente, was nicht der Fall ist. Also ist P normal in G. Weil P die Ordnung p hat, ist P abelsch, und weil P transitiv operiert, folgt P = CG (P ). Somit ist Ga zu einer Untergruppe der Automorphismengruppe von P isomorph. Diese aber ist zyklisch. Daher sind P und G/P abelsch und damit aufl¨ osbar. Also ist auch G aufl¨ osbar. Das ist Galois’ Beweis, wobei er nat¨ urlich nicht Cauchy (1844) zitiert, was ich getan habe, und sich auch eines anderen Vokabulars bedient. Er bel¨ asst es bei diesem Satz, zeigt also nicht, dass man mit seiner Hilfe nachweisen kann, dass es Polynome u ¨ ber Q gibt, die nicht durch Radikale l¨ osbar sind. Holen wir das nach! Korollar. Es sei K ein Teilk¨ orper von R. Ist f ∈ K[x] irreduzibel von Primzahlgrad, ist die Galoisgruppe von f aufl¨ osbar und hat f zwei reelle Nullstellen, so sind alle Nullstellen von f reell. Beweis. Sind a und b die beiden reellen Nullstellen, so ist nach dem gerade bewiesenen Satz L = K[a, b] ⊆ R. Da L alle Nullstellen von f enth¨ alt, ist der Satz bewiesen. Und jetzt schließlich der Nachweis, dass es auch u ¨ ber Q Polynome gibt, die nicht durch Radikale l¨ osbar sind.
432
Kapitel XIII. Galois
Beispiel. Ist p eine Primzahl gr¨ oßer oder gleich 5, so ist das Polynom f := xp − 4x + 2 u ¨ber Q nicht durch Radikale l¨ osbar. Beweis. Nach dem sch¨onemannschen Irreduzibilit¨ atskriterium ist dieses Polynom irreduzibel. Es ist f (−2) < 0,
f (0) > 0,
f (1) < 0,
f (2) > 0.
Also hat f mindestens drei reelle Nullstellen. Es ist f = pxp−1 −4. Dieses Polynom hat genau zwei reelle Nullstellen. Also hat f nach dem Satz von Rolle (Kap. 11, Absch. 8) genau drei reelle Nullstellen. Nach dem Korollar ist die Galoisgruppe von f nicht aufl¨ osbar, da f ja p − 3 ≥ 2 komplexe Nullstellen hat. Also ist f u ¨ ber Q nicht durch Radikale l¨ osbar. Wie schon gesagt, a¨ußert sich Galois hier nicht u ¨ber eventuelle Beispiele. In seinem Brief an Auguste Chevalier tauchen dann aber Beispiele nicht aufl¨ osbarer Galoisgruppen auf. Die kleinste Ordnung einer solchen Gruppe sei 5.4.3. Dies ist nat¨ urlich die Ordnung der A5 . Dann wendet er sich aber erst einmal den primitiven, durch Radikale l¨ osbaren Gleichungen zu. Eine auf der Menge M transitiv operierende Permutationsgruppe G heiße primitiv , falls Folgendes gilt: Ist ∅ = B ⊆ M und gilt f¨ ur alle γ ∈ G, dass aus B∩B γ = ∅ γ folgt, dass B = B ist, so ist |B| = 1 oder |M |. Zentral ist der folgende Satz u ¨ ber Normalteiler primitiver Gruppen. Satz 2. Ist G eine auf M primitiv operierende Permutationsgruppe und ist N ein von {1} verschiedener Normalteiler von G, so operiert N transitiv auf M . Beweis. Weil N nicht trivial ist, gibt es eine Bahn B von N , die wenigstens zwei Elemente enth¨alt. Ist nun γ ∈ G, so ist auch B γ eine Bahn von N , weil N ja normal in G ist. Daher folgt aus B ∩ B γ = ∅, dass B = B γ ist. Weil G primitiv operiert und B mehr als ein Element enth¨alt, folgt B = M . Also ist N transitiv auf M . Ist K ein K¨ orper der Charakteristik 0, ist f ∈ K[x] und hat f nur einfache Nullstellen, so nennen wir f primitiv , falls die Gruppe von f auf der Menge der Nullstellen von f primitiv operiert. Das ist nicht die urspr¨ ungliche Definition des Begriffs primitives Polynom“, doch darauf kommt es hier nicht an. Weil primitiv ” operierende Gruppen insbesondere auch transitiv operieren, sind primitive Polynome stets irreduzibel. Es sei G eine auf M primitiv operierende aufl¨ osbare Permutationsgruppe. Dann enth¨ alt G einen nicht trivialen, abelschen Normalteiler N , der nach dem gerade Bewiesenen auf M transitiv operiert. Transitiv operierende abelsche Gruppen operieren aber scharf transitiv und sind gleich ihrem Zentralisator. Daraus folgt, dass G/N zu einer Untergruppe der Automorphismengruppe von N isomorph ist.
7. Irreduzible Gleichungen von Primzahlgrad
433
¨ Uber N kann man noch mehr sagen. Es sei p ein Primteiler von |N |. Dann ist P := {γ | γ ∈ N, γ p = 1} eine nicht triviale charakteristische Untergruppe von N , die folglich in G normal ist. Also operiert auch P auf M transitiv, woraus folgt, dass P = N ist. Somit ist N eine elementarabelsche p-Gruppe, dh., ein Vektorraum u ¨ber GF(p). Es folgt achsten Zeilen belegen. |M | = |N | = pn . Dies alles war Galois vertraut, wie die n¨ Es folgt insbesondere, dass der Grad einer durch Radikale l¨ osbaren primitiven Gleichung Potenz einer Primzahl ist. Dies steht in Galois 1830 und wird im Brief an Auguste Chevalier wiederholt. Die Permutationen einer primitiven, durch Radikale l¨ osbaren Gleichung seien alle von der Form xk.l.m... /xak+bl+cm+...+f.a1 k+b1 l+c1 m+...+g. ... . Dabei seien k, l, m, . . . Indizes, n St¨ uck insgesamt, von denen jeder p Werte modulo p annehme und die die pn Wurzeln der Gleichungen indizierten. Das muss man sich wieder auf der Zunge zergehen lassen. Er nimmt alle nTupel mit Werten in GF(p) als Indizes f¨ ur die Nullstellen der primitiven, durch Radikale l¨ osbaren Gleichungen und mit ihrer Hilfe beschreibt er die Elemente der Galoisgruppen dieser Gleichungen. Die Gruppe aller dieser Permutationen habe die Ordnung pn (pn − 1)(pn − p) . . . (pn − pn−1 ). Die Gruppe, um die es sich hier handelt, ist die Gruppe aller Abbildungen der Form v → v γ + b, wobei v und b aus einem n-dimensionalen Vektorraum V u ¨ ber GF(p) stammen und γ ∈ GL(n, p) gilt. Dabei bezeichne GL(n, p) die Gruppe aller linearen Abbildungen von V auf sich, deren Determinante ungleich 0 ist. Zur Indizierung hat er schon in seiner Arbeit von 1830 Stellung genommen. Hier das, was er dort dazu sagt: C’est surtout dans la th´eorie des permutations, o` u l’on a sans cesse besoin de ” varier la forme des indices, que la consid´eration des racines imaginaires des congruences paraˆıt indispensable. Elle donne un moyen simple et facile de reconnaˆıtre dans quel cas une ´equation primitive est soluble par radicaux, comme je vais essayer d’en donner en deux mots une id´ee.“ In dieser Arbeit nimmt er als Indizes f¨ ur die Wurzeln einer durch Radikale l¨ osbaren, primitiven Gleichung die Elemente von GF(pn ) und betrachtet die Gruppe, die auf den Indizes durch die Vorschrift r
x → axp + b
434
Kapitel XIII. Galois
wirkt. Dabei sind a, b ∈ GF(pn ) mit a = 0 und 0 ≤ r < n. Diese Gruppe ist aufl¨ osbar. Die Aussage, die er in diesem Zusammenhang nun macht, habe ich nicht verstanden. Mein Nicht-verstehen h¨ atte ich wohl mit einem Er behauptet, ” dass diese Gruppe f¨ ur die Situation typisch sei“ kaschieren k¨ onnen. Er sagt von dieser Aussage aber in seinem Brief an Chevalier, dass sie zu scharf sei, dass es abe, hatte er schon in der Ausnahmen g¨abe. Dass es solche f¨ ur pn = 9 und 25 g¨ urspr¨ unglichen Arbeit erw¨ ahnt. Ich habe mich also nicht weiter ums Verstehen bem¨ uht. Mehr Information u ¨ ber primitive aufl¨ osbare Gruppen findet der Leser in Huppert 1957 und Foulser 1964. Bei den Modulargleichungen der Theorie der elliptischen Funktionen tauchten bekanntlich, so Galois, die Gruppen auf, die wir heute PGL(2, p) und PSL(2, p) nennen. Die erste Gruppe ist isomorph zur Gruppe GL(2, p)/Z(GL(2, p)) und die zweite Gruppe zur Gruppe SL(2, p)/Z(SL(2, p)). Dabei ist SL(2, p) die Gruppe aller γ ∈ GL(2, p) mit det(γ) = 1. Hier notiert er, dass die PSL(2, p) einfach ist, also nur die beiden trivialen Normalteiler hat, falls p ≥ 5 ist. Diese Gruppen sind also nicht aufl¨ osbar, was Galois aber nicht ausdr¨ ucklich erw¨ ahnt. Galois interpretiert diese beiden Gruppen als Gruppen von gebrochen linearen Transformationen, also als Abbildungen der Form x→
ax + b , cx + d
wobei er im ersten Falle verlangt, dass ad − bc = 0 sei, und im zweiten, dass ad − bc ein Quadrat sei. Diese Gruppen operieren auf der Menge {0, . . . , p − 1, ∞}. Diese Menge dient ihm dann wieder als Indexmenge f¨ ur die Nullstellen der Modulargleichung. Galois beobachtet ferner, dass der Index einer Untergruppe der PSL(2, p) mindestens gleich p ist. Gleich p k¨ ame aber nur bei p = 5, 7 und 11 vor. Die F¨ alle p = 2 und 3 scheinen ihn nicht zu interessieren. Die fraglichen Gruppen sind ja auch aufl¨ osbar. Bei allen anderen Beispielen ist p + 1 der kleinste Index, der vorkommt. Einen Beweis dieses Satzes publizierte erst Enrico Betti 1853, wie ich Gierster 1881 entnehme. In dieser Arbeit bestimmte Gierster alle Untergruppen der PSL(2, p) f¨ ur Primzahlen p. Die Gruppen PGL(2, p) und PSL(2, p) nennt Galois bekannt. Ich weiß nicht, wo sie zum ersten Mal auftauchen. Legendre? Abel? Die Aussage u ¨ ber die Indizes geh¨ort Galois. Es ist zu vermerken, dass die ersten der so genannten klassischen Gruppen, die doch eigentlich Gruppen der Geometrie sind, in Analysis und Algebra auftauchten und dazu noch in endlicher Version. osbar ist, Die Aussage, dass die Gleichung xp − 4x + 2 = 0 nicht durch Radikale l¨ ist insofern unbefriedigend, als die Gruppe dieser Gleichung nicht explizit bestimmt
8. Es steht alles schon bei Dedekind
435
wird. Wer Gruppen ausgerechnet sehen m¨ochte und wer sehen m¨ ochte, dass auch die symmetrischen Gruppen als Gruppen von Gleichungen u ¨ber Q vorkommen, sei an I. Schur 1930 verwiesen. Dort bewies er, dass die galoissche Gruppe der Laguerrepolynome i n n x (−1)i Ln = i i! i:=0 ucken die symmetrische Gruppe Sn ist. Von den Anfangsst¨ En =
n xi i! i:=0
der Reihe f¨ ur die Exponentialfunktion bewies er in der gleichen Arbeit, dass die galoissche Gruppe von En die alternierende Gruppe An ist, falls n durch 4 teilbar ist, andernfalls die Sn . In den B¨ anden II und III der Werke Issai Schurs finden sich weitere Arbeiten zu diesem Thema (Schur 1973). Das Stichwort lautet Gleichungen ” ohne Affekt“. So nannte Kronecker Gleichungen, deren Galoisgruppe die symmetrische Gruppe ist. In Schurs Arbeiten finden sich viele Literaturhinweise, insbesondere auch ein Hinweis auf die Arbeit Hilbert 1892, in der Hilbert neben vielem Anderen beweist, ur alle n Gruppen von Gleichungen des Grades n u ¨ ber dass die Sn und die An f¨ Q sind. Hilberts Aussagen sind reine Existenzaussagen, w¨ahrend die schurschen Beispiele konkrete Beispiele sind, was Schur betont. Damit sind wir doch noch einmal auf das Umkehrproblem zu sprechen gekommen, wobei ich noch den weiteren Hinweis auf van der Waerden 1972 geben m¨ochte. 8. Es steht alles schon bei Dedekind. Es ließe sich noch einiges zu Galois’ M´emoire I sagen, so insbesondere, dass er betont, dass es etwas Anderes sei, nur eine Wurzel einer Gleichung zu adjungieren oder alle ihre Wurzeln. Letzteres gibt nach heutigem Verst¨andnis eine normale Erweiterung, wie wir in Kapitel 10 gesehen haben (Satz 13, Abschnitt 3 dieses Kapitels). Doch wir belassen es bei dem Gesagten und wenden uns dem zu, was Dedekind und Artin daraus machten. Was die unmittelbare Rezeptionsgeschichte der galoisschen Ideen anbelangt, so sei auf die Literatur verwiesen: Toti-Rigatelli 1989, Kiernan 1971, van der Waerden 1972, Scholz 1990. Ist f ein Polynom mit lauter einfachen Nullstellen u ¨ber dem K¨ orper K und allungsk¨ orper, so ist die Gruppe G von f u ¨ ber ist L = K[r1 , . . . , rm ] sein Zerf¨ K unabh¨ angig von dem primitiven Element s von L, das zu ihrer Konstruktion verwendet wurde. Das haben wir schon nach Satz 3 von Abschnitt 6 bemerkt und auch gesagt, dass auch Dedekind darauf hinweist. Man kann das dahingehend ¨ ber K ist, pr¨ azisieren, dass G auch die Gruppe des Minimalpolynoms μs von s u so dass G nicht nur die Gruppe eines, sondern vieler Polynome u ¨ber K ist. Dies zeigt, dass G in Wirklichkeit zu der Erweiterung L des K¨orpers K geh¨ort und dann nat¨ urlich auch etwas mit den Polynomen u ¨ber K zu tun hat. Es ist also folgerichtig,
436
Kapitel XIII. Galois
dass man von algebraischen Gleichungen absieht und die Situation betrachtet, dass man einen K¨ orper L hat und eine endliche Gruppe von Automorphismen dieses K¨ orpers, wobei K der K¨ orper ist, der von allen Automorphismen dieser Gruppe elementweise festgelassen wird. Das ist Artins Ausgangspunkt. Schon vorher, in der vierten Auflage von Dirichlets Zahlentheorie, nicht in den fr¨ uheren, hatte Dedekind die Untersuchung der Monomorphismen in den Vordergrund gestellt. Er sagt dazu: F¨ ur die genaue Untersuchung der Verwandtschaft ” zwischen den verschiedenen K¨ orpern — und hierin besteht der eigentliche Gegenstand der heutigen Algebra — bildet der folgende Begriff die allgemeinste und zugleich einfachste Grundlage:“ und es folgt die Definition der linearen Abh¨ angigkeit und Unabh¨ angigkeit. (Hier zitiert er Dirichlet, Berliner Monatsberichte, April 1842. Darauf werden wir in Kap. 15, Absch. 4 zur¨ uckkommen.) Die Untersuchung der Verwandtschaft zwischen den verschiedenen K¨ orpern ist seiner Ansicht nach der eigentliche Gegenstand der Algebra. Er studiert nun in den Abschnitten 160 bis 167 des elften Supplements, das mit Abschnitt 159 bginnt, die folgende Situation. Gegeben seien zwei Teilk¨ orper K und L von C, so dass das Kompositum KL von K und L endlich u ¨ ber K ist. Was sind die Monomorphismen von KL in C, die einen gegebenen Monomorphismus von K in C fortsetzen? Analysiert man seinen grundlegenden Satz und dessen Beweis, so erh¨alt man den gleich zu formulierenden Satz 1 samt seinem Beweis. Bei diesem Satz ist von vornherein angenommen, dass K ⊆ L, also KL = L ist, was Dedekind nicht annimmt. Die Voraussetzungen an die u ¨ ber K algebraischen Elemente von M und an die u ¨ber K irreduziblen Polynome sind im Fall M = C automatisch erf¨ ullt. Bevor Dedekind diesen Satz in Abschnitt 165 formuliert und beweist, definiert er den Begriff des K¨ orpers, was er auch schon in der zweiten Auflage der dirichletschen Zahlentheorie getan hat, wobei er nun darauf verzichtet zu verlangen, dass er eine unendliche Teilmenge von C hat, die unter Addition, Subtraktion, Multiplikation und Division abgeschlossen ist. Hier verlangt er nur noch, dass die fragliche Menge ein von 0 verschiedenes Element enth¨ alt. Dies wurde fr¨ uher schon erw¨ ahnt (Kap. 9, Absch. 1). alt K ein Element a = 0. Es folgte 1 = aa ∈ Ist K ein Teilk¨ orper von C, so enth¨ K. Mit Induktion folgte N ⊆ K und weiter Z ⊆ K und schließlich Q ⊆ K. Der K¨ orper der rationalen Zahlen sei also in allen Teilk¨ orpern von C enthalten, er sei der kleinste dieser K¨orper. Ist K ein Teilk¨ orper von C und S eine Teilmenge, so definiert er K(S) als den Schnitt u ¨ ber alle Teilk¨ orper von C, die K und S umfassen. Diese Menge charakterisiert er dann als die Menge der rationalen Ausdr¨ ucke in S mit Koeffizienten in K. Hier begegnet uns zum zweiten Male in diesem Buch eine H¨ ullenoperation und auch dieses Mal bei Dedekind. Er definiert K-lineare Abh¨ angigkeit und Unabh¨ angigkeit von Elementen einer Erweiterung L von K und beweist die Gleichm¨achtigkeit von Basen, falls L eine
8. Es steht alles schon bei Dedekind
437
endliche Erweiterung von K ist. Ferner beweist er die Dimensionsformel [M : K] = [M : L][L : K], falls K ⊆ L ⊆ M ist. Diese Formel stammt, wie es scheint, von Dedekind. Er dokumentiert jedenfalls immer sorgf¨altig in seinen Schriften, wann er was schon gemacht hat. So sagt er im Zusammenhang mit dem K¨ orperbegriff, dass er diesen schon, wenn auch unter anderem Namen, in seinen G¨ottinger Vorlesungen von 1856–58 benutzt habe. Hier bei der Dimensionsformel verweist er auf seine Besprechung des Buches von Bachmann Die Lehre von der Kreistheilung und ihre Beziehungen zur Zahlentheorie“ ” (Dedekind 1873). Dort findet sich die Formel — ohne Beweis — auf S. 21. In dieser Besprechung schreibt er auf Seite 15, dass der Begriff des irreduziblen Polynoms auf Gauß zur¨ uckginge, der ihn in seinen Disquisitiones eingef¨ uhrt h¨ atte. Zur¨ uck zum Supplementum 13. Dedekind definiert dort ferner den Begriff des Monomorphismus — er nennt ihn Permutation — und betont, dass die Einschr¨ankung α|K des Monomorphismus α auf K von α wohl zu unterscheiden sei, wenn α ein Monomorphismus der Erweiterung L von K ist. Das waren alles Sachen, die 1894 noch nicht selbstverst¨ andlich waren. Im Folgenden schreibe ich Abbildungen meist in der Form f (x), da mir der Text in diesem Zusammenhang so besser zu lesen scheint. Satz 1. Es seien K, L und M K¨ orper. L sei eine endliche Erweiterung von K und M sei eine Erweiterung von L mit der Eigenschaft, dass alle u ¨ber K algebraischen Elemente von M u ¨ber K separabel sind. Ferner gelte, dass irreduzible Polynome u andig in Linearfaktoren ¨ber K, welche in M eine Nullstelle haben, in M vollst¨ zerfallen. Ist dann ϕ ein Monomorphismus von L in M , und gilt f¨ ur jedes u ¨ber K irreduzible Polynom f , das u ¨ber M in Linearfaktoren zerf¨ allt, dass auch ϕ(f ) u ¨ber M in Linearfaktoren zerf¨ allt — das ist sicherlich dann der Fall, wenn ϕ = 1 oder wenn M algebraisch abgeschlossen ist —, so gibt es genau [L : K] Monomorphismen π von L in M mit π|K = ϕ. Dabei bezeichne π|K die Einschr¨ ankung von π auf K. Ist Π die Menge dieser Monomorphismen, so ist ur alle π, π ∈ Π . K = a | a ∈ L, π(a) = π (a) f¨
Beweis. Der Satz ist richtig, falls [L : K] = 1 ist. Ist N ein Zwischenk¨ orper von L und K mit N = K und L, so folgt [L : K] = [L : N ][N : K] und [N : K], [L : N ] < [L : K]. Nach der nicht explizit ausgesprochenen Induktionsannahme gibt es genau [N : K] verschiedene Monomorphismen σ1 , . . . , σ[N :K] von N in M , die ϕ fortsetzen. Zu jedem σi gibt es dann genau [L : N ]
438
Kapitel XIII. Galois
Monomorphismen τij von L in M , die σi fortsetzen. Dann sind die τij genau [L : N ][N : K] = [L : K] Monomorphismen von L in K, die ϕ fortsetzen. Ist α irgendein Monomorphismus von L in M , der ϕ fortsetzt, so ist β := α|N ein Monomorphismus von N in M , der ϕ fortsetzt. Nach Induktionsannahme ist ur eines der i. Da dann α ein Monomorphismus von L in M ist, der also β = σi f¨ σi fortsetzt, gibt es ein j mit α = τij . Damit ist in diesem Falle bewiesen, dass es genau [L : K] Monomorphismen von L in M gibt, die ϕ fortsetzen. Es gebe keinen Zwischenk¨ orper zwischen L und K. Ist dann u ∈ L und u ∈ K, so ist L = K[u]. Es sei μu das Minimalpolynom von u u ¨ ber K. Dieses ist allt μu in M in Linearfaktoren. Dann ist auch irreduzibel. Wegen μu (u) = 0 zerf¨ ϕ(μu ) irreduzibel u ¨ ber ϕ(K) und nach Voraussetzung zerf¨ allt ϕ(μu ) u ¨ ber M in Linearfaktoren. Es seien u1 , u2 , . . . , un die Nullstellen von ϕ(μu ) in M . Sie sind paarweise verschieden, weil alle u ¨ ber K algebraischen Elemente von M u ¨ ber K separabel sind. Die Abbildung f → ϕ(f )(ui ) ist ein Epimorphismus von K[x] auf ϕ(K)[ui ], der auf K die Abbildung ϕ induziert. Der Kern dieser Abbildung ist μu K[x]. Es gibt also nach dem ersten Isomorphiesatz einen Monomorphismus von K[x]/μu K[x] auf ϕ(K)[ui ], der x + μu K[x] auf ui abbildet und auf K die Abbildung ϕ induziert. Ebenso gibt es einen Monomorphismus von K[x]/μu K[x] auf K[u] = L, der x + μu K[x] auf u abbildet und auf K die Identit¨ at induziert. Also gibt es einen Monomorphismus π von L auf ϕ(K)[ui ], der u auf ui abbildet und der ϕ fortsetzt. Damit sind n Monomorphismen gefunden, die ϕ fortsetzen. Ist ρ ein weiterer solcher Monomorphismus, so ist 0 = ρ μu (u) = ρ(μu ) ρ(u) = ϕ(μu ) ρ(u) . Es gibt also ein i mit ρ(u) = ui , so dass ρ sich schon unter den bereits gefundenen Abbildungen findet. Damit ist die Aussage u ¨ber die Anzahl der Monomorphismen bewiesen. Es sei B := a | a ∈ L, π(a) = π (a) f¨ ur alle π, π ∈ Π . Dann ist K ⊆ B und es folgt [L : K] = [L : B][B : K]. Die Elemente aus Π induzieren alle auf B den gleichen Monomorphismus von L in M . Nach dem bereits Bewiesenen ist also [L : B] ≥ |Π| = [L : K], da [L : B] ja die Gesamtzahl aller Monomorphismen von L in M ist, die einen gegebenen Monomorphismus von B in M fortsetzen. Also ist [L : K] = [L : B] und [B : K] = 1. Also ist B = K, womit alles bewiesen ist.
8. Es steht alles schon bei Dedekind
439
An der Stelle, wo wir den ersten Isomorphiesatz benutzen, tut sich Dedekind etwas schwer. Van der Waerden benutzt noch in den ersten vier Auflagen seiner Algebra“ — und wohl auch in den sp¨ ateren — Dedekinds Argument, ohne jedoch ” auf Einzelheiten einzugehen, was Dedekind aber tut. Noch bevor Dedekind diesen Satz — f¨ ur M = C versteht sich — formulierte, hat er gezeigt, dass es zu n Monomorphismen σ1 , . . . , σn eines K¨orpers L nach C stets unendlich viele a ∈ L gibt, so dass die σi (a) paarweise verschieden sind. Dabei erhielt er als Korollar, dass es a1 , . . . , an ∈ L gibt, so dass die Determinante der Matrix (σi (aj )) von 0 verschieden ist. Diesen Sachverhalt hat Artin elegant umformuliert und verallgemeinert, so dass er f¨ ur beliebige K¨ orper jeglicher Charakteristik gilt, auch f¨ ur endliche K¨ orper (Artin 1942, S. 27). Das ber¨ uhmte artinsche B¨ uchlein u ¨ ber Galoistheorie, das 1942 erschien, ist Nachschrift einer Vorlesung, die Artin an der Universit¨ at von Notre Dame gehalten hat. Schon vier Jahre vorher war eine Nachschrift einer Vorlesung erschiene, die er an der Universit¨ at von New York (New York University) gehalten hat. Dort ist das Lemma von Artin-Dedekind zwar noch nicht ausdr¨ ucklich formuliert, es wird aber im Beweis eines Satzes mitbewiesen, der sich mit der ersten Aussage des gleich zu formulierenden Satzes 2 deckt (Artin 1938). Als Artin 1926 seine Vorlesung hielt, die Grundlage f¨ ur van der Waerdens Moderne Algebra“ wurde, hatte er dieses Lemma offensichtlich noch nicht, da ” es in diesem Buche nicht vorkommt. Van der Waerden sagt n¨ amlich in van der Waerden 1972 auf S. 241, dass er in seinem Buch, was die galoissche Theorie anbelangt, genau die Darstellung“ gegeben habe, die Artin selbst in seiner Vorlesung ” ” 1926 gegeben hatte.“ Im Lemma von Artin-Dedekind fassen wir die Menge aller Abbildungen der Menge G in den K¨ orper K auf als Linksvektorraum u ¨ ber diesem K¨ orper, wobei die Addition und Skalarmultiplikation punktweise definiert sind. Lemma von Artin-Dedekind. Es sei K ein K¨ orper und G sei eine Gruppe. Sind σ1 , . . . , σn paarweise verschiedene Homomorphismen von G in die multiplikative angig u ¨ber K. Gruppe von K, so sind σ1 , . . . , σn linear unabh¨ Beweis. Es seien k1 , . . . , kn ∈ K und es gelte n
ki σi = 0.
i:=1
Es ist zu zeigen, dass ki = 0 ist f¨ ur alle i. Wir machen Induktion nach n. Ist n = 1, so ist k1 σ1 = 0. Hieraus folgt insbesondere 0 = k1 σ1 (1) = k1 · 1 = k1 , so dass der Satz in diesem Falle richtig ist. Es sei n > 1 und der Satz gelte f¨ ur n−1. Weil σ1 und σn von einander verschieden sind, gibt es ein a ∈ G mit σ1 (a) = σn (a).
440
Kapitel XIII. Galois
Es folgt 0= =
n
ki σi (ax) =
i:=1 n
n
ki σi (a)σi (x)
i:=1
ki σi (a)σi (x)
i:=1
f¨ ur alle x ∈ G. Daher ist 0=
n
ki σi (a)σi .
i:=1
Trivialerweise gilt 0=
n
ki σ1 (a)σi .
i:=1
Folglich gilt 0=
n
ki σi (a) − σ1 (a) σi .
i:=2
ur alle i ≥ 2. Wegen σ1 (a) = Nach Induktionsannahme ist ki (σi (a) − σ1 (a)) = 0 f¨ σn (a) folgt kn = 0. Dann ist aber n−1
ki σi = 0,
i:=1
so dass nach Induktionsannahme auch k1 = . . . = kn−1 = 0 ist. Satz 2. Es sei L ein K¨ orper und G sei eine endliche Gruppe von Automorphismen von L. Setzt man K := k | k ∈ L, σ(k) = k f¨ ur alle σ ∈ G , so ist L eine endliche separable Erweiterung von K und es gilt [L : K] = |G|. Ist f ein u ¨ber K irreduzibles Polynom, welches in L eine Nullstelle hat, so zerf¨ allt f u ¨ber L in Linearfaktoren. L ist also eine normale, separable Erweiterung von K. Ist γ ein Automorphismus von L, der K elementweise fest l¨ asst, so ist γ ∈ G. Beweis. Wir wenden das Lemma von Artin-Dedekind in folgender Situation an: Das dortige G ist hier die multiplikative Gruppe von L. Die σ1 , . . . , σn sind die Elemente der hiesigen Gruppe G. Da sie Automorphismen von L sind, lassen sie sich ja auch als Homomorphismen von L∗ in L∗ interpretieren. Nach dem Lemma
8. Es steht alles schon bei Dedekind
441
von Artin-Dedekind sind sie also linear unabh¨ angig u ¨ ber L und damit erst recht u ¨ ber K. n Wir betrachten die Abbildung Sp := i:=1 σi . Dann ist Sp, Spurabbildung genannt, eine Abbildung von L in K, da ja η Sp = Sp ist f¨ ur alle η ∈ G. Weil die angig sind, ist Sp = 0. Es gibt also ein a ∈ L mit Sp(a) = 0. σi linear unabh¨ ¨ ber Setze n := |G|. Es seien u1 , . . . , un+1 Elemente aus L. Wir zeigen, dass sie u K linear abh¨ angig sind. Dazu betrachten wir das Gleichungssystem n+1
xi σj−1 (ui ) = 0
i:=1
f¨ ur j := 1, . . . , n. Dieses hat eine nicht-triviale L¨osung, da es mehr Unbekannte als Gleichungen enth¨ alt. Wir d¨ urfen also annehmen, dass x1 = 0 ist. Multipliziert man alle Gleichungen mit ax−1 1 , so sieht man, dass man x1 = a annehmen darf. Wendet man auf die j-ste Gleichung den Automorphismus σj an, so erh¨ alt man n+1
σj (xi )(ui ) = 0
i:=1
f¨ ur j := 1, . . . , n. Summiert man schließlich u ¨ber j, so erh¨alt man n+1
Sp(xi )(ui ) = 0.
i:=1
Wegen Sp(x1 ) = Sp(a) = 0 und Sp(xi ) ∈ K f¨ ur alle i, folgt, dass die ui u ¨ ber K linear abh¨ angig sind. Hieraus folgt, dass L als Vektorraum u ¨ber K endlich erzeugt ist und dass [L : K] ≤ n gilt. Das ist Artins Argument. Der Rest des Beweises ist von Dedekind inspiriert. Als N¨achstes zeigen wir, dass L u ¨ ber K separabel ist. Dazu sei u ∈ L und B sei die Bahn von u unter der Wirkung von G. Dann ist μu :=
(x − v)
v∈B
das Minimalpolynom von u u ¨ ber K, da die Koeffizienten von μu ja alle bei G festbleiben. Es folgt, dass u separabel ist, da die Nullstellen von μu alle die Vielfachheit 1 haben. Es sei f ein u ¨ ber K irreduzibles Polynom mit Leitkoeffizient 1 und f habe eine ¨ ber K, so ist Nullstelle u in L. Ist dann wieder μu das Minimalpolynom von u u μu Teiler von f und damit gleich f . Setzen wir schließlich noch M := L, so haben wir f¨ ur ϕ = 1 alle Voraussetzungen des Satzes 1 erf¨ ullt. Es folgt [L : K] ≥ n. Also ist [L : K] = n. Die letzte Aussage folgt wegen |G| = [L : K] aus Satz 1.
442
Kapitel XIII. Galois
Wenn man sich diesen Beweis anschaut, so sieht man, dass aus den Voraussetzungen folgt — auch wenn man noch nicht weiß, dass n + 1 Elemente von L stets linear abh¨ angig sind —, dass jedes Element von L u ¨ ber K algebraisch ist und dass sein Grad durch n beschr¨ankt ist. Diese Situation wird von Dedekind auch diskutiert. Er behauptet, dass es leicht zu zeigen sei, dass in dieser Situation L eine endliche Erweiterung von K sei. Es bed¨ urfe aber noch einiger Hilfss¨ atze, um dies wirklich zu beweisen. Er verzichte daher darauf. In diesem Zusammenhang, sagt er auch, dass L genau dann endlich u ¨ber K sei, wenn die Erweiterung L : K nur endlich viele Zwischenk¨ orper habe. Hier zeigt er nur, dass L : K nur endlich viele Zwischenk¨ orper hat, wenn der Grad von L u ¨ ber K endlich ist (Dirichlet-Dedekind 1894, § 165). Denkt man an Satz 1 des Abschnitts 5 von Kapitel 10, so wird klar, dass auch Steinitz von Dedekind inspiriert war. Ist L ein K¨ orper und G eine Gruppe von Automorphismen von L, so definieren wir die Abbildungen fix und stab wie folgt: Ist U eine Untergruppe von G, so setzen wir fix(U ) := a | a ∈ L, γ(a) = a f¨ ur alle γ ∈ U . Ist M ein Teilk¨ orper von L, so setzen wir ur alle a ∈ M }. stab(M ) := γ | γ ∈ G, γ(a) = a f¨ Dann gilt: Hauptsatz der galoisschen Theorie. Es sei L ein K¨ orper und G sei eine endliche Gruppe von Automorphismen von L. Setzt man K := fix(G), so ist fix eine Bijektion der Menge der Untergruppen von G auf die Menge der Zwischenk¨ orper der Erweiterung L : K und stab ist eine Bijektion der Menge dieser Zwischenk¨ orper auf die Menge der Untergruppen von G. Ferner ist fix−1 = stab. Sind Z und Z Zwischenk¨ orper der Erweiterung L u ¨ber K, so ist genau dann Z ⊆ Z , wenn stab(Z ) ⊆ stab(Z) ist. Sind U und U Untergruppen von G, so ist genau dann U ⊆ U , wenn fix(U ) ⊆ fix(U ) ist. Beweis. Es seien Z und Z Zwischenk¨ orper der Erweiterung L : K und es gelte asst γ auch Z elementweise fest. Also ist Z ⊆ Z . Ist dann γ ∈ stab(Z ), so l¨ γ ∈ stab(Z), dh., es ist stab(Z ) ⊆ stab(Z). Entsprechend zeigt man, dass aus U ⊆ U folgt, dass fix(U ) ⊆ fix(U ) ist. Es sei Z ein Zwischenk¨ orper von L : K. Dann gilt nat¨ urlich Z ⊆ fix stab(Z). Hieraus folgt zusammen mit Satz 2 [L : Z] ≥ L : fix stab(Z) = stab(Z). Nach Satz 2 ist L eine normale, separable Erweiterung von K, so dass L nach Satz 10 von Abschnitt 3 des Kapitels 10 auch normale Erweiterung von Z ist. Nach
8. Es steht alles schon bei Dedekind
443
Satz 14 von Abschnitt 4 des Kapitels 10 ist L separabel u ¨ ber Z. Also gibt es nach Satz 1 genau [L : Z] Automorphismen von L, die auf Z die Identit¨ at induzieren. Wegen K ⊆ Z folgt mit Satz 2 wiederum, dass alle diese Automorphismen in G und damit in stab(Z) liegen. Also ist [L : Z] = stab(Z) = L : fix stab(Z) und damit Z = fix stab(Z). Es sei U eine Untergruppe von G. Mit Satz 2 angewandt auf L und U folgt [L : fix(U )] = |U |. Es ist weiter U ⊆ stab fix(U ). Mit Satz 1 folgt stab fix(U ) ≤ L : fix(U ) = |U |. Zusammen mit U ⊆ stab fix(U ) ergibt das U = stab fix(U ). Damit ist gezeigt, dass stab und fix zueinander inverse Bijektionen sind. Sind schließlich U und U Untergruppen von G und gilt fix(U ) ⊆ fix(U ), so folgt U = stab fix(U ) ⊆ stab fix(U ) = U . Sind Z und Z Zwischenk¨ orper und gilt stab(Z ) ⊆ stab(Z), so folgt Z = fix stab(Z) ⊆ fix stab(Z ) = Z . Damit ist alles bewiesen. Ist L eine endliche Erweiterung von K, so nennen wir L galoissch u ¨ber K, wenn die Gruppe G der K-linearen Automorphismen von L die Ordnung [L : K] hat. Was wir hier galoissch nennen, nennt Artin normal. Wie der n¨ achste Satz zeigt, sind galoissche Erweiterungen immer separabel, so dass der artinsche Begriff von Normalit¨ at auch die Separabilit¨ at beinhaltet, was unser Begriff von Normalit¨at nicht tut. Es gilt der Satz (Artin 1942, S. 33): Satz 3. Ist L eine endliche Erweiterung von K, so sind die folgenden Bedingungen aquivalent: ¨ a) L ist galoissch u ¨ber K. b) L ist normal und separabel u ¨ber K. c) L ist Zerf¨ allungsk¨ orper eines u ¨ber K separablen Polynoms f ∈ K[x]. Beweis. a) impliziert b): Es sei L galoissch u ¨ ber K. Dann ist L nach Satz 2 normal und separabel u ¨ ber K. b) impliziert a): Es sei L normal und separabel u ¨ ber K. Mit M = L und ϕ = 1, folgt aus Satz 1, dass L u ¨ ber K galoissch ist. b) impliziert c): Weil L eine u ¨ ber K endliche und separable Erweiterung ist, gibt es nach Satz 7 von Kap. 10, Absch. 4 ein ζ mit L = K[ζ]. Ist dann μζ das ¨ ber L in Linearfaktoren. Minimalpolynom von ζ u ¨ ber K, so zerf¨allt μζ u
444
Kapitel XIII. Galois
c) impliziert b): Weil L Zerf¨ allungsk¨ orper eines Polynoms f u ¨ ber K ist, ist L nach Satz 13 von Kapitel 10, Abschnitt 3 normale Erweiterung von K. Dass L auch separabel ist, folgt mit den S¨atzen 8 und 12 von Abschnitt 4 des Kapitels 10. orper der ErSatz 4. Es sei L galoissch u ¨ber K und Z und Z seien Zwischenk¨ weiterung L : K. Genau dann gibt es einen K-linearen Isomorphismus von Z auf Z , wenn die Gruppen stab(Z) und stab(Z ) in der galoisschen Gruppe G von L : K konjugiert sind. Beweis. Nach Satz 1 gibt es genau dann einen K-linearen Isomorphismus von Z auf Z , wenn es ein γ ∈ G gibt mit γ(Z) = Z . Ist γ ∈ G und gilt γ(Z) = Z , so folgt, dass γstab(Z)γ −1 ⊆ stab(Z ) ist. Wegen γ −1 (Z ) = Z gilt dann auch γ −1 stab(Z )γ ⊆ stab(Z). Dies impliziert stab(Z ) ⊆ γstab(Z)γ −1 und damit γstab(Z)γ −1 = stab(Z ), so dass stab(Z) und stab(Z ) konjugiert sind. Sind stab(Z) und stab(Z ) konjugiert, so gibt es ein γ ∈ G mit γstab(Z)γ −1 = stab(Z ). Wie gerade gesehen, ist γstab(Z)γ −1 = stab γ(Z) . Also ist stab(γ(Z)) = stab(Z ). Mit dem Hauptsatz der galoisschen Theorie folgt γ(Z) = fix stab γ(Z) = fix stab(Z ) = Z . Damit ist alles bewiesen. Satz 5. Es sei L eine galoissche Erweiterung von K und Z sei ein Zwischenk¨ orper dieser Erweiterung. Dann ist L auch galoissch u ¨ber Z und stab(Z) ist die Galoisgruppe dieser Erweiterung. Genau dann ist Z galoissch u ¨ber K, wenn stab(Z) ein Normalteiler der galoisschen Gruppe G von L : K ist. Ist stab(Z) normal in G, so ist G/stab(Z) zur Galoisgruppe von Z : K isomorph. Beweis. Wegen |stab(Z)| = [L : Z] ist L galoissch u ¨ ber Z und stab(Z) ist die Galoisgruppe dieser Erweiterung. Es sei stab(Z) normal in G. Mit Satz 4 folgt, dass γ(Z) = Z ist f¨ ur alle γ ∈ G. Dies impliziert, dass G/stab(Z) zu einer Gruppe von K-linearen Automorphismen von Z isomorph ist. Nun ist G/stab(Z)stab(Z) = |G| = [L : K] = [L : Z][Z : K] = stab(Z)[Z : K]
8. Es steht alles schon bei Dedekind
445
und daher |G/stab(Z)| = [Z : K]. Folglich ist Z galoissch u ¨ ber K. Es sei umgekehrt Z galoissch u ¨ ber K und H sei die galoissche Gruppe von Z : K. Auf Grund von Satz 1 (hier L, L, Z an Stelle von M , L, K dort) werden alle η ∈ H von Elementen aus G induziert. Hieraus folgt γ(Z) = Z f¨ ur alle γ ∈ G. Wegen stab(Z) = [L : Z] und H = [Z : K] folgt mit Satz 4, dass γ(stab(Z))γ −1 = stab(Z) ist f¨ ur alle γ ∈ G. Folglich ist stab(Z) in G normal und G/stab(Z) ist isomorph zur Galoisgruppe von Z. Als Zwischenk¨ orper der separablen Erweiterung L von K ist Z ebenfalls separabel u ¨ ber K. Wir h¨ atten daher statt Genau dann ist Z galoissch u ¨ ber K, ” . . . “ auch Genau dann ist Z normal u ¨ ber K, . . . “ schreiben k¨ onnen. Tut man ” dies, so wird klar, weshalb Weber auf die Idee kam, die ausgezeichneten Teiler“ ” einer Gruppe fortan Normalteiler“ zu nennen. Dabei ist zu bemerken, dass Un” tergruppen damals auch Teiler“ der Gruppe genannt wurden. — Man beachte ” die Bemerkung nach dem Korollar zu Satz 1 des Abschnitts 3 dieses Kapitels. Emmy Noether hatte recht. Es steht alles schon bei Dedekind.
XIIII. Miszellen 1. Normalbasen. Eisenstein publizierte im 39. Bande des crelleschen Journals eine kurze Note mit dem Titel Lehrs¨atze“. Der dritte Abschnitt dieser Note sei ” in G¨ anze wiedergegeben (Eisenstein 1850): ¨ 3. Uber irreductible Congruenzen. Wenn nach der Bezeichnung von Schoene” mann f (x) ≡ 0 (mod. p) eine irreductible Congruenz nten Grades, und α eine Wurzel der Gleichung f (x) = 0 bedeutet, so l¨ aßt sich immer ein geeigneter Ausdruck β von α finden, von der Art, daß jeder Ausdruck von der Form (1.)
a0 + a1 α + a2 α2 + . . . + an−1 αn−1 (mod. p, α),
dessen Coeffizienten a0 , a1 , . . . ganze Zahlen sind, auf eine und nur eine Weise in die Form (2.)
2
n−1
b0 β + b1 β p + b2 β p + . . . + bn−1 β p
(mod. p, α)
gebracht werden kann, wobei die Co¨efficienten b0 , b1 , . . . ebenfalls ganze Zahlen sind. L¨ aßt man dann in (2.) alle Co¨effizienten die Werthe 0, 1, 2, . . . p − 1 durchlaufen, so constituieren die daraus hervorgehenden pn Zahlen von der Form (2.) ein vollst¨andiges Restensystem (mod. p, α). — Ist ω eine primitive nte Wurzel der 2 n−1 Einheit, und setzt man α + ω λ αp + ω 2λ αp + . . . + ω (n−1)λ αp = ϕ(λ), so ist das Produkt ϕ(λ)ϕ(λ )ϕ(λ ) . . . ≡ einem von α unabh¨ angigen Ausdrucke, jedesmal, wenn die Summe der Exponenten λ + λ + λ + . . . durch n teilbar ist.“ Es sind hier also ohne jeglichen Kommentar und ohne Beweise zwei S¨atze angegeben. Der zweite wird wohl aus dem ersten folgen, doch nicht einmal das wird gesagt. Die andern beiden Abschnitte handeln von v¨ ollig andern Dingen. Das Ganze ist sehr geheimnisvoll. Es ist der erste Satz, der auch heute noch die Aufmerksamkeit erregt. Sch¨onemann publizierte noch im gleichen Jahr einen Beweis f¨ ur den Fall, dass p kein Teiler von n ist (Sch¨onemann 1850). Einen Beweis des allgemeinen Falles lieferte erst Hensel (Hensel 1888). Der Satz besagt in heutiger Sprache, dass es eine Basis ¨ ber GF(p) gibt, die gleichzeitig Bahn der Galoisgruppe dieser Ervon GF(pn ) u weiterung ist. Dieser Satz l¨asst sich mit heutigen Mittel leicht beweisen. Ich fand den Beweis, den ich hier vortrage, in Jacobson 1964, S. 61. Es sei V ein Vektorraum u ¨ ber dem kommutativen K¨orper K. Ferner sei ϕ ∈ EndK (V ). Wie schon zu Beginn des Abschnitts 7 von Kapitel 9 machen wir aus V einen K[x]-Modul, den wir mit Vϕ bezeichnen, durch die Vorschrift f v := f (ϕ)(v).
448
Kapitel XIIII. Miszellen
Da K[x] ein euklidischer Ring ist, k¨ onnen wir die S¨ atze jenes Abschnittes anwenden. Satz 1. Es sei L : K eine galoissche Erweiterung mit zyklischer Galoisgruppe G. Ist ϕ eine Erzeugende von G, so ist Lϕ ein zyklischer K[x]-Modul. Beweis. Setze n := [L : K]. Dann ist ϕn = 1, so dass das Minimalpolynom μ von ϕ Teiler von xn − 1 ist. Die Automorphismen 1, ϕ, . . . , ϕn−1 sind paarweise verschieden. Fasst man sie auf als Homomorphismen der multiplikativen Gruppe von L in L, so sind sie nach dem Lemma von Artin-Dedekind (Kap. 13, Absch. 8) u ¨ber L linear unabh¨ angig. Dann sind sie aber auch u ¨ ber K linear unabh¨ angig. Folglich ist der Grad von μ mindestens gleich n. Weil μ aber Teiler von xn − 1 ist, folgt, dass μ = xn − 1 ist. Damit ist gezeigt, dass der Annihilator des K[x]-Moduls Lϕ gleich (xn − 1)K[x] ist. Nach Satz 6 von Abschnitt 7 des Kapitels 9 gibt es ein b ∈ L mit O(b) = (xn − 1)K[x]. Es folgt Lϕ = K[x]b. Also ist Lϕ ein zyklischer K[x]-Modul. Es sei L : K eine galoissche Erweiterung und G sei ihre Gruppe. Ist B eine Basis dieser Erweiterung, so heißt B eine Normalbasis von L u ¨ ber K, wenn B eine Bahn von G ist. Korollar. Es sei L eine galoissche Erweiterung des K¨ orpers K. Ist die Galoisgruppe dieser Erweiterung zyklisch, so besitzt L eine Normalbasis u ¨ber K. Beweis. Ist ϕ eine Erzeugende der Galoisgruppe von L : K, so gibt es nach dem gerade bewiesenen Satz ein b ∈ L mit Lϕ = K[x]b. Es ist dann 2
{b, bϕ, bϕ , . . . , bϕ
n−1
}
eine Normalbasis von L u ¨ ber K. Weil die Automorphismengruppen von Galoisfeldern zyklisch sind, ist mit diesem Korollar auch der Satz von Eisenstein bewiesen. Hat man ein irreduzibles Polynom vom Grade n u ¨ ber GF(p), so zeigen die Entwicklungen von Abschnitt 7 des Kapitels 9, wie man eine Normalbasis von ¨ ber GF(p) berechnen kann. Es sei GF(pn ) u i ϕ (b) | i := 0, . . . , n − 1 eine solche. Dabei sei ϕ der durch ϕ(u) := up definierte Frobeniusautomorphismus von GF(pn ). Ist n−1 u= ai ϕi (b), i:=0
1. Normalbasen
449
so ist ϕ(u) =
n−1 i:=0
ai ϕi+1 (b) =
n−1
ai−1 ϕi (b),
i:=0
wobei a−1 als an−1 zu interpretieren ist. Der Frobeniusautomorphismus induziert also auf der Menge der W¨ orter der L¨ange n u ¨ ber dem Alphabet GF(p) die Permutation ψ, die durch ψ(a0 a1 . . . an−1 ) = an−1 a0 . . . an−2 beschrieben ist. Das Element u hat unter der Galoisgruppe genau dann n Bilder, wenn das Wort a0 a1 . . . an unter der von ψ erzeugten Gruppe n Bilder hat. Wir ordnen die W¨ orter der L¨ange n lexikalisch durch die Vorschrift: Genau dann ist a0 a1 . . . an−1 < b0 b1 . . . bn−1 , ur j < i und ai < bi . Das Wort b0 b1 . . . bn−1 heißt wenn es ein i gibt mit aj = bj f¨ regul¨ ar , wenn f¨ ur alle i mit 1 ≤ i < n − 1 die Ungleichung ψ i (b0 b1 . . . bn−1 ) < b0 b1 . . . bn−1 gilt. Hat nun u unter der Galoisgruppe n Bilder, so enth¨ alt die Menge der entsprechenden Koordinatenw¨ orter genau ein regul¨ ares Wort. Gilt umgekehrt, dass die orenden Koordinatenw¨ orter ein regul¨ ares Wort enth¨ alt, Menge der zu den ϕi (u) geh¨ so hat u genau n Bilder unter der Galoisgruppe. Hieraus folgt, dass man alle irreduziblen Polynome vom Grade n und mit Leitkoeffizient 1 u ¨ ber GF(p) erh¨ alt, wenn man alle regul¨ aren W¨orter b0 b1 . . . bn−1 erzeugt und jeweils das Minimalpolyi nom von u := n−1 i:=0 bi ϕ (b) berechnet. Wie man das im Einzelnen bewerkstelligen kann, findet der Leser in L¨ uneburg 1987a. Der Begriff Normalbasis ist von Hilbert gepr¨ agt worden (Hilbert 1894/95, S. 351f.). Er erw¨ ahnt jedenfalls in diesem Zusammenhang niemanden sonst in seinem Bericht. Er formuliert ihn jedoch nur f¨ ur Zahlk¨ orper K : k mit abelscher Galoisgruppe, wobei er noch zus¨ atzlich verlangt, dass das erzeugende Element der Normalbasis eine ganz-algebraische Zahl ist. Er beweist, dass es in dieser Situation stets Normalbasen in seinem Sinne gibt. F¨ ur nicht notwendig abelsche galoissche Erweiterungen K : k von algebraischen Zahlk¨ orpern und ohne die Einschr¨ ankung, dass das erzeugende Element ganzalgebraisch ist, findet sich der Begriff in Noether 1932. Sie beweist auch den Satz, dass es dann stets Ganzheitsbasen gibt (Noether 1932, Satz 3). Ihr Beweis funktioniert immer dann, wenn k unendlich ist. Zusammen mit dem Korollar zu Satz 1 ergibt das, dass jede galoissche Erweiterung eine Normalbasis besitzt. Wir gehen nun daran, dies zu beweisen. Der folgende Satz steht cum grano salis schon bei Dedekind (Dirichlet 1894, Suppl. X, § 165, S. 479f.).
450
Kapitel XIIII. Miszellen
Satz 2. Es sei L eine galoissche Erweiterung von K und Z sei ein Zwischenk¨ orper dieser Erweiterung. Setze n := [Z : K]. Sind γ1 , . . . , γn die K-linearen Monomorphismen von Z in L und sind b1 , . . . , bn ∈ Z, so bilden b1 , . . . , bn genau dann eine K-Basis von Z, wenn det((γj (bi )) = 0 ist. Beweis. Zur Abk¨ urzung definieren wir die Matrix a durch aij := γj (bi ). Dann ist a eine Matrix mit Koeffizienten in L. angig und damit eine K-Basis von L. Es seien Es seien b1 , . . . , bn linear unabh¨ ferner u1 , . . . , un ∈ L und f¨ ur alle i gelte 0=
n
uj aij =
j:=1
n
uj γj (bi ).
j:=1
n Es sei v ∈ Z. Dann ist v = i:=1 ki bi mit k1 , . . . , kn ∈ K. Es folgt ki = γj (ki ) und daher n n ki uj γj (bi ) 0= =
i:=1 n
j:=1
uj γj
j:=1
n
ki bi
i:=1
=
n
uj γj (v).
j:=1
n Hieraus folgt 0 = j:=1 uj γj . Mit dem Lemma von Artin-Dedekind (Kap. 13, angig, Absch. 8) folgt u1 = . . . = un = 0. Also sind die Spalten von a linear unabh¨ so dass, wie behauptet, det(a) = 0 ist. Es seien b1 , . . . , bn linear abh¨ angig. Es gibt dann k1 , . . . , kn ∈ K, die nicht alle 0 sind und f¨ ur die n ki bi 0= i:=1
gilt. Es folgt 0 = γj
n
ki bi
i:=1
=
n
ki γj (bi )
i:=1
f¨ ur j := 1, . . . , n. Hieraus folgt, wie bekannt, dass det(a) = 0 ist, da die ki ja nicht alle 0 sind. Damit ist der Satz bewiesen. Um zu zeigen, dass die galoissche Erweiterung L : K eine Normalbasis besitzt, muss man nach Satz 2 also zeigen, dass es ein b ∈ L gibt, so dass det(γj γi (b)) = 0 ist, wenn γ1 , . . . , γn die Elemente der Galoisgruppe von L : K sind. Satz 3. Es sei K ein K¨ orper mit unendlich vielen Elementen und L sei eine endliche Erweiterung von K. Ist f ein Polynom in n Unbestimmten u ¨ber L und gilt f (k1 , . . . , kn ) = 0 f¨ ur alle k1 , . . . , kn ∈ K, so ist f = 0. ¨ ber K. Dann gibt es Polynome f1 , Beweis. Es sei b1 , . . . , bm eine Basis von L u . . . , fm ∈ K[x1 , . . . , xn ] mit m fi bi . f= i:=1
1. Normalbasen
451
Es folgt
m
0 = f (k1 , . . . , kn ) =
fi (k1 , . . . , kn )bi
i:=1
f¨ ur alle k1 , . . . , kn ∈ K. Weil die bi linear unabh¨ angig sind, folgt fi (k1 , . . . , kn ) = 0 f¨ ur alle kj ∈ K und alle i. Mit Lemma A von Kapitel 13, Abschnitt 6 folgt fi = 0 f¨ ur alle i und damit die Behauptung. Es sei L eine Erweiterung des K¨ orpers K und M eine Erweiterung von L. ¨ berdies K-linear sind, so Sind γ1 , . . . , γn Monomorphismen von L in M , die u heißen diese Monomorphismen algebraisch unabh¨ angig u ¨ber M , wenn aus f ∈ M [x1 , . . . , xn ] und der G¨ ultigkeit von f γ1 (u), γ2 (u), . . . , γn (u) = 0 f¨ ur alle u ∈ L folgt, dass f = 0 ist. Satz 4. Es sei K ein K¨ orper mit unendlich vielen Elementen und L sei eine galoissche Erweiterung von K. Ferner sei Z ein Zwischenk¨ orper zwischen L und K. amtlichen Ist M irgendeine endliche Erweiterung von L und sind γ1 , . . . , γn die s¨ K-linearen Monomorphismen von Z in L, so sind die γi algebraisch unabh¨ angig u ¨ber M . Beweis. Nach dem Hauptsatz der galoisschen Theorie ist n = [Z : K]. Es sei b1 , . . . , bn eine Basis von Z : K. Wir definieren die Matrix a wieder durch aij := γj (bi ). Es sei M [x1 , . . . , xn ] der Polynomring in den Unbestimmten x1 , . . . , xn u ¨ ber M . Ist f ∈ M [x1 , . . . , xn ] so setzen wir f a := f (x1 , . . . , xn )a . Dann ist die Abbildung f → f a ein Automorphismus von M [x1 , . . . , xn ], da nach Satz 2 ja det(a) = 0 ist und folglich a−1 existiert. Es sei insbesondere f ∈ M [x1 , . . . , xn ] und es gelte f γ1 (v), . . . , γn (v) = 0 n f¨ ur alle v ∈ Z. Es seien ferner k1 , . . . , kn ∈ K. Setzt man v := i:=1 ki bi , so folgt n n f a (k1 , . . . , kn ) = f ki γ1 (bi ), . . . , ki γn (bi ) i:=1
i:=1
n n = f γ1 ki bi , . . . , γn ki bi i:=1
= f γ1 (v), . . . , γn (v) = 0.
i:=1
452
Kapitel XIIII. Miszellen
Nach Satz 3 ist daher f a = 0. Weil die Abbildung g → g a ein Automorphismus ist, folgt, dass auch f = 0 ist, q. e. d. Satz 5. Ist L eine galoissche Erweiterung von K, so besitzt L eine Normalbasis u ¨ber K. Beweis. Ist K endlich, so ist L als endliche Erweiterung von K ebenfalls endlich. Also sind L und K Galoisfelder, so dass die Galoisgruppe von L : K zyklisch ist. Also besitzt L nach dem Korollar zu Satz 1 eine Normalbasis u ¨ ber K. Es sei K unendlich. Ferner sei n = [L : K] und γ1 , . . . , γn seien die Elemente der Galoisgruppe von L : K. Wie oben schon bemerkt, suchen wir ein b ∈ L, so dass det(γj γi (b)) = 0 ist. ¨ ber L. Wir definieren die Matrix a durch Es seien x1 , . . . xn Unbestimmte u ai,j := xk , wenn γj γi = γk ist. Dann steht in jeder Zeile und in jeder Spalte eine Permutation der x1 , . . . , xn . Wir betrachten das Polynom f := det(a). Dann ist f (1, 0, . . . , 0) = ±1, da in jeder Zeile und in jeder Spalte von a die Unbestimmte x1 genau einmal vorkommt. Es folgt f = 0. Weil die γi nach Satz 4 algebraisch unabh¨ angig sind, gibt es ein b ∈ L mit f (γ1 (b), . . . , γn (b)) = 0. Es folgt det γj γi (b) = f γ1 (b), . . . , γn (b) = 0, q. o. o. Dabei ist q. o. o. als quod opportebat ostendere zu lesen. Die Aufteilung des Beweises in die F¨alle, dass K endlich bzw. unendlich ist, ist nicht zwingend erforderlich. Max Deuring gibt einen Beweis, der diese Fallunterscheidung nicht macht (Deuring 1932). Um zu erfahren, was aus dem Ganzen geworden ist, konsultiere der Leser P. Meyer 1998. Dort weitere Literaturangaben. 2. Der Fundamentalsatz der Algebra. Ich komme hier noch einmal auf den Fundamentalsatz der Algebra zur¨ uck. Der Grund ist der, dass sich in der Arbeit Artin-Schreier 1927 ein sehr sch¨oner Beweis f¨ ur ihn findet, den ich dem Leser nicht verschweigen m¨ochte. Dieser Beweis umgeht die Benutzung der symmetrischen Funktionen, die wir bei den fr¨ uheren Beweisen benutzt haben. Er benutzt stattdessen S¨atze der galoisschen Theorie. Wir sind bei unserer Darstellung der galoisschen Theorie nicht der reinen Lehre Artins gefolgt. Es kann also durchaus sein, dass bei der Herleitung der S¨ atze, die hier beim Beweise des Fundamentalsatzes benutzt werden, die symmetrischen Funktionen und insbesondere auch der waringsche Satz benutzt wurden. Dass man aber wirklich ohne sie auskommt, sieht man am schnellsten, wenn man sich Artins
2. Der Fundamentalsatz der Algebra
453
¨ Schrift ansieht (Artin 1942). Er benutzt im Ubrigen die galoissche Theorie, um den waringschen Satz zu beweisen. Wir betrachten in diesem Abschnitt reell abgeschlossene K¨orper R. Diese haben die Eigenschaft, dass positive Elemente stets Quadrate sind und dass Polynome ungeraden Grades in R[x] stets eine Nullstelle in R haben (S¨ atze 1 und 2 von Kapitel 11, Abschnitt 7). — Um nicht Teile fr¨ uherer Beweise zitieren zu m¨ ussen, bin ich hier etwas ausf¨ uhrlicher als n¨ otig. √ Satz 1. orper und ist k ∈ R[ −1], so gibt es ein √ Ist R ein2 reell abgeschlossener K¨ l ∈ R[ −1] mit l = k. Beweis. Es sei k = a + ib mit a, b ∈ R und i2 = −1. Dann ist √ √ −a ≤ a2 ≤ a2 + b2 und a ≤ a2 ≤ a2 + b2 . √ √ Folglich sind 12 (a + a2 + b2 ) und 12 (−a + a2 + b2 ) nicht negativ. Es gibt also u, v ∈ R mit u2 =
1 (a + a2 + b2 ) 2
und
v2 =
1 (−a + a2 + b2 ). 2
Daher ist u2 − v 2 = a und u2 v 2 =
1 1 (−a2 + a2 + b2 ) = b2 . 4 4
¨ man ggf. das Vorzeichen von u, so kann man Somit ist uv ∈ { 21 b, − 21 b}. Andert 1 erreichen, dass uv = 2 b ist, ohne die Gleichung u2 − v 2 = a zu verletzen. Also ist (u + iv)2 = u2 − v 2 + 2iuv = a + ib. Damit ist der Satz bewiesen. Satz 2. Es sei R ein reell abgeschlossener K¨ orper. Ist L eine quadratische Er√ weiterung von R, so ist L ∼ = R[ −1]. Beweis. Es sei L := R[ϑ]. Ist μϑ das Minimalpolynom von ϑ, so ist μϑ = x2 + ax + b =
2 2 a a −b . x+ − 2 4
√ 2 Auf Grund von Satz 1 gibt es ein η ∈ R[ −1] mit η 2 = a4 − b. Setze λ := − a2 + η. Dann ist 2 2 a a a μϑ (λ) = − + η + − b = 0. − 2 2 4 √ α Es gibt folglich √ einen R-Monomorphismus α von L = R[ϑ] in R[ −1] mit ϑ = λ. Wegen [R[ −1] : R] = 2 und R[λ] = R ist α surjektiv.
454
Kapitel XIIII. Miszellen
Fundamentalsatz der Algebra. Ist R ein reell abgeschlossener K¨ orper, so ist √ R[ −1] algebraisch abgeschlossen. Beweis. Es sei f ∈ R[x] irreduzibel und es sei Grad(f ) ≥ 2. Es sei ferner L der Zerf¨ allungsk¨ orper von f und [L : R] = 2t m mit ungeradem m. Weil L Zerf¨ allungsk¨ orper eines u ¨ ber R irreduziblen Polynoms ist und weil die betrachteten K¨ orper als K¨ orper der Charakteristik 0 allesamt separabel sind, ist L nach Satz 3 von Kapitel 13, Abschnitt 8 galoissch u ¨ ber R. Es sei G die Galoisgruppe von L : R. Es sei S ∈ Syl2 (G) und M := fix(S). Nach dem Hauptsatz der galoisschen Theorie (Kap. 13, Absch. 8) ist [M : R] = |G : S| = m. Weil algebraische Erweiterungen bei Charakteristik 0 separabel sind, gibt es ein α mit M = R[α]. Dann ist Grad(μα ) = m. Weil m ungerade ist, ist m = 1. Also ist 2 ≤ [L : R] = 2t . Es folgt G = S und t ≥ 1. Es sei t ≥ 2. Weil G eine 2-Gruppe ist, ist G nach dem Korollar zu Satz 1 von Kapitel 11, Abschnitt 3 aufl¨ osbar. Es gibt also zwei Untergruppen U und V von G mit V ⊆ U und |G : U | = 2 = |U : V |. Setze M := fix(U ) und N := fix(V ). Nach dem Hauptsatz der galoisschen Theorie ist M ⊆ N und [M : R] = 2 und √ [N : M ] = 2. Nach Satz 2 ist M ∼ = R[ −1]. Wegen [N : M ] = 2 gibt es ein irreduzibles Polynom vom Grade 2 u ¨ber M . Dies widerspricht aber Satz 1. Also ist doch t = 1. Damit ist gezeigt, dass u ¨ ber R irreduzible Polynome den Grad 1 oder 2 haben. √ n Es sei nun f ∈ R[ −1][x] und f = i:=0 fi xi . Setze f¯ :=
n
f¯i xi .
i:=0
t Dann ist f f¯ ∈ R[x]. Es folgt f f¯ = j:=1 pj mit Polynomen pj vom Grade 1 oder √ 2 u ¨ ber R. Weil reelle Polynome vom Grade 2 u ¨ ber R nach Satz 2 u ¨ ber R[ −1] √ √ s zerfallen, ist f f¯ = k:=1 λk mit linearen λk ∈ R[ −1][x]. Weil in R[ −1][x] √ der Satz von der eindeutigen Primfaktorzerlegung gilt, zerf¨allt auch f u ¨ ber R[ −1] in ein Produkt von Linearfaktoren. Damit ist alles gezeigt. 3. Der Satz von L¨ uroth. Wie in Abschnitt 6 von Kapitel 10 versprochen, komme ich hier noch einmal auf den Satz von L¨ uroth zur¨ uck. Der steinitzsche Beweis dieses Satzes ist im Zeitalter des Computers nur noch als Orientierungshilfe akzeptabel. Er umgeht zwar elegant die Schwierigkeiten bei Charakteristik p > 0, gibt aber keinerlei Hinweis, wie man die Situation rechnerisch in den Griff bekommt. Ich
3. Der Satz von L¨ uroth
455
m¨ochte hier nun nach dem Vorgang von Andreas Karst zeigen, dass man die rechnerische Seite dieses Problems auch bei Charakteristik p beherrscht. Es ist der Hauptsatz der galoisschen Theorie, der es gestattet, das arithmetische Mittel und damit die Division durch ein beliebiges n ∈ N zu umgehen, die der nettosche Beweis erforderte (Karst 1991). Das ist also ein weiteres Beispiel daf¨ ur, dass die galoissche Theorie hilft, die symmetrischen Funktionen zu umgehen. Das arithmetische Mittel lieferte n¨ amlich eine symmetrische Funktion, mit der man dann weiter argumentierte. Die Ausgangssituation ist die, dass ein kommutativer K¨ orper K und vier Polynome f1 , g1 , f2 , g2 ∈ K[x] gegeben sind. Gesucht sind u, v ∈ K[x] mit u f1 f2 , K . =K v g1 g2 Es stellt sich heraus, dass das Polynom ggT f1 (x)g1 (y) − f1 (y)g1 (x), f2 (x)g2 (y) − f2 (y)g2 (x) die entscheidende Rolle spielt. Es geht also im Folgenden darum, die Koeffizienten dieses Polynoms sorgf¨altig zu studieren. Satz 1. Es sei K ein kommutativer K¨ orper. Ferner seien f , g ∈ K[x] mit g = 0 und y sei eine weitere Unbestimmte. Dann sind die folgenden Aussagen ¨ aquivalent. f (x) f (y) a) Es ist = . g(x) g(y) b) Es ist f (x)g(y) − f (y)g(x) = 0. f c) Es ist ∈ K. g Beweis. a) und b) sind nat¨ urlich a¨quivalent. Gilt c), so gibt es ein k ∈ K mit f = kg. Dann ist aber auch f (y) = kg(y). Hieraus folgt a). Es gelte a). Es sei g(y) = y t h(y) und h(0) = 0. Wegen f (x)g(y) = f (y)g(x) und g = 0 und weil K[x, y] ein ZPE-Bereich ist, folgt, dass y t Teiler von f (y) ist. Wir d¨ urfen daher annehmen, dass t = 0 ist. Dann ist g(0) = 0 und es folgt f (0) f (x) = ∈ K. g(x) g(0) Damit ist alles bewiesen. Sind f , g ∈ K[x], so setzen wir L¨ ur(f, g) := f (x)g(y) − f (y)g(x) und nennen L¨ ur(f, g) das L¨ urothpolynom zu f und g. Es gilt
456
Kapitel XIIII. Miszellen
Satz 2. Ist K ein kommutativer K¨ orper, sind f , g, h ∈ K[x] und ist k ∈ K, so gilt: a) Es ist L¨ ur(f, f ) = 0. b) Es ist L¨ ur(f, g)(x, x) = 0, das heißt, y − x teilt L¨ ur(f, g). c) Es ist L¨ ur(f, g) = −L¨ ur(g, f ) = −L¨ ur(f, g)(y, x). d) Es ist L¨ ur(kf, g) = kL¨ ur(f, g) = L¨ ur(f, kg). e) Es ist L¨ ur(f + g, h) = L¨ ur(f, h) + L¨ ur(g, h). f ) Es ist L¨ ur(f, g + h) = L¨ ur(f, g) + L¨ ur(f, h). g) Ist Grad(f ) = Grad(g) = n, so gilt fn ur(f, g) L¨ ur f − g, g = L¨ gn und f −
fn gn g
= 0 oder Grad(f −
fn gn g)
< n.
Beweis. Trivial. Wegen L¨ ur(f, g) = −L¨ ur(g, f ) d¨ urfen wir, wenn es bequem erscheint, annehmen, dass Grad(f ) ≤ Grad(g) ist. Wegen g) d¨ urfen wir dann sogar annehmen, das Grad(f ) < Grad(g) ist. Ist f ∈ K[x, y], so bezeichne Gradx (f ) den Grad von f aufgefasst als Polynom in x. Entsprechendes gelte f¨ ur Grady (f ). Satz 3. Es sei K ein kommutativer K¨ orper und es seien f , g ∈ K[x] mit f , g = 0 und ggT(f, g) = 1. Ferner sei wenigstens einer der beiden Grade Grad(f ) und Grad(g) gr¨ oßer als 0. Dann ist ur(f, g) = Gradx L¨ ur(f, g) = max Grad(f ), Grad(g) . Grady L¨ ¨ Uberdies ist L¨ ur(f, g) sowohl als Polynom u ¨ber K[x] als auch als Polynom u ¨ber K[y] primitiv. Beweis. Setze und n := Grad(g). Wir d¨ urfen m ≤ n annehmen. m m := Grad(f ) n Es sei f = i:=0 ai xi und g = i:=0 bi xi . Dann ist L¨ ur(f, g) =
m n f (x)bi − g(x)ai y i + f (x)bi y i . i:=0
i:=m+1
W¨ are g Teiler von f , so w¨are g ∈ K, da ja ggT(f, g) = 1 ist. Es folgte f ∈ K und damit m = n = 0, ein Widerspruch. Also ist g kein Teiler von f . Nach Satz 2 g) d¨ urfen wir daher annehmen, dass m < n ist. Dann ist aber Grady (L¨ ur(f, g)) = n. ur(f, g)) = n. Wegen L¨ ur(f, g) = −L¨ ur(f, g)(y, x) ist auch Gradx (L¨ Der letzte Teil des Satzes ist schon Inhalt des Satzes 2 von Abschnitt 6 des Kapitels 10. Hier ein anderer Beweis f¨ ur diese Aussage.
3. Der Satz von L¨ uroth
457
Es sei d ∈ K[x] ein gemeinsamer Teiler aller in K[x] liegenden Koeffizienten von L¨ ur(f, g). Dann ist d Teiler von f (x)bn und damit von f (x). Ferner ist d auch Teiler von f (x)bm − g(x)am und damit von g(x). Also ist d Teiler von f und von g und damit von ggT(f, g) = 1. Folglich ist d ∈ K. Damit ist alles bewiesen. Satz 4. Es sei K ein kommutativer K¨ orper und f , g seien von 0 verschiedene Polynome aus K[x] mit ggT(f, g) = 1. Ferner sei fg ∈ / K. Ist ∂L¨ ur(f, g) (y, y) = 0, ∂y so hat L¨ ur(f, g) in seinem Zerf¨ allungsk¨ orper u ¨ber K(x) nur einfache Nullstellen. Beweis. Wir setzen F := L¨ ur(f, g) und F := ∂F ∂y . Es sei p ein in K[x, y] gelegener irreduzibler Teiler von F und F . Dann ist p Teiler von g (y)F − g(y)F = g (y) f (x)g(y) − f (y)g(x) − g(y) f (x)g (y) − f (y)g(x) = −g (y)f (y)g(x) + g(y)f (y)g(x) = g(x) g(y)f (y) − g (y)f (y) = −g(x)F (y, y). Weil p irreduzibel ist, ist p Teiler von g(x) oder von F (y, y). Ist p Teiler von F (y, y), so ist p ∈ K[y]. Weil F aber als Polynom in x u ¨ ber K(y) primitiv ist (Satz 3), folgt p ∈ K. Also ist in jedem Falle p ∈ K[x]. Folglich gilt in K(x)[y], dass ggT(F, F ) = 1 ist. Also hat F , wie behauptet, nur einfache Nullstellen. Satz 5. Es sei K ein kommutativer K¨ orper und f , g seien von 0 verschiedene Polynome aus K[x] mit ggT(f, g) = 1 und fg ∈ K. Dann sind die folgenden Bedingungen a ¨quivalent: ∂L¨ ur(f, g) (x, y) = 0. a) Es ist ∂y b) Es ist f = 0 = g . ∂L¨ ur(f, g) (y, y) = 0. c) Es ist ∂y Beweis. Es sei wieder F := L¨ ur(f, g) und F := ∂F ∂y . a) impliziert b): Aus F (x, y) = 0 folgt f (x)g (y) = f (y)g(x). Es folgt, dass g(x) Teiler von f (x)g (y) ist. Weil f und g teilerfremd sind, ist g(x) Teiler von g (y). W¨ are g = 0, so folgte g ∈ K und damit doch g = 0. Also ist g = 0. Ebenso folgt f = 0. b) impliziert c): Es ist ja F (y, y) = f (y)g (y) − f (y)g(y) = 0.
458
Kapitel XIIII. Miszellen
c) impliziert a): Aus F (y, y) = 0 folgt f (y)g (y) = f (y)g(y). Weil f und g teilerfremd sind, folgt, dass f Teiler von f und g Teiler von g ist. Es folgt f = 0 = g . Daher ist F (x, y) = f (x)g (y) − f (y)g(x) = 0. Satz 6. Es sei K ein kommutativer K¨ orper und f , g seien von 0 verschiedene Polynome u ¨ber K mit ggT(f, g) = 1 und fg ∈ / K. Dann gilt a) Ist Char(K) = 0, so ist ∂L¨ ur(f, g) (y, y) = 0. ∂y b) Ist Char(K) = p > 0, so ist genau dann ∂L¨ ur(f, g) (y, y) = 0, ∂y wenn f und g Polynome in xp sind. Beweis. Nach Satz 5 ist genau dann ∂L¨ ur(f, g) (y, y) = 0, ∂y wenn f = g = 0 ist. Ist Char(K) = 0, so ist dies genau dann der Fall, wenn / K aber nicht der Fall. Dies beweist Grad(f ) = Grad(g) = 0 ist. Das ist wegen fg ∈ a). Im Falle der Char(K) = p > 0 ist genau dann f = 0 = g , wenn f und g Polynome in xp sind, wie fr¨ uher schon gesehen. Somit gilt auch b) (Satz 1, Kap. 10, Absch. 4). Der n¨ achste Satz ist etwas allgemeiner als Satz 8c). Deshalb steht er hier. Satz 7. Es sei K ein kommutativer K¨ orper und f1 , g1 , f2 , g2 seien Polynome in K[x]. Ist ur(f2 , g2 ) , F := ggT L¨ ur(f1 , g1 ), L¨ so ist Gradx (F ) = Grady (F ). Beweis. Die Vertauschung von x mit y definiert einen Automorphismus des Ringes K[x, y]. Daher ist F (y, x) = ggT L¨ ur(f1 , g1 )(y, x), L¨ ur(f2 , g2 )(y, x) . Wegen L¨ ur(fi , gi )(y, x) = −L¨ ur(fi , gi ) ist F (y, x) auch ein ggT von L¨ ur(f1 , g1 ) und L¨ ur(f2 , g2 ). Somit ist F (y, x) zu F (x, y) assoziiert. Es gibt also ein k ∈ K ∗ mit F (y, x) = kF (x, y). Hieraus folgt Gradx F (x, y) = Grady F (y, x) = Grady kF (x, y) = Grady F (x, y) ,
3. Der Satz von L¨ uroth
459
was zu beweisen war. / K Im Folgenden seien stets f1 , g1 , f2 , g2 ∈ K[x] gegeben und es gelte fgii ∈ und ggT(fi , gi ) = 1 f¨ ur i := 1, 2. Mittels des euklidischen Algorithmus’ seien in K(x)[y] die Folgen h3 , . . . , hr und q2 , . . . , qr berechnet mit L¨ ur(f1 , g1 ) = q2 L¨ ur(f2 , g2 ) + h3 L¨ ur(f2 , g2 ) = q3 h3 + h4 .. . hr−2 = qr−1 hr−1 + hr hr−1 = qr hr . Es sei a das kgV der Nenner der in K(x) liegenden Koeffizienten von hr und d der ggT der in K[x] liegenden Koeffizienten von ahr . Wir setzen D :=
a hr . d
Ferner sei D = c0 (x)y n + c1 (x)y n−1 + . . . + cn (x). Dann gilt Satz 8. Die Voraussetzungen und Bezeichnungen seien wie verabredet. Dann gilt. a) b) c) d)
Es ist n ≥ 1. D ist ein ggT von L¨ ur(f1 , g1 ) und L¨ ur(f2 , g2 ) in K[x, y]. Es ist Gradx (D) = Grady (D) = n. Es ist Grad(ci ) ≤ n f¨ ur i := 0, . . . , n.
Beweis. a) Mit Satz 1 folgt, dass L¨ ur(fi , gi ) = 0 ist. Also ist D = 0. Mit Satz 2b) folgt, dass y − x Teiler von L¨ ur(fi , gi ) ist. Daher ist y − x Teiler von D und folglich n ≥ 1. b) D ist auf Grund seiner Konstruktion assoziiert zu einem ggT von L¨ ur(f1 , g1 ) und L¨ ur(f2 , g2 ). Also ist D ein ggT dieser beiden Polynome, der in K[x, y] liegt. Die Kofaktoren von D in L¨ ur(fi , gi ) liegen ebenfalls in K[x, y], wie mit Satz 2 aus Kapitel 7, Abschnitt 1 und dem sich ebenfalls dort befindlichen gaußschen Lemma folgt. c) Dies folgt mit Satz 7. d) Dies folgt mit c). Es seien z1 und z2 zwei weitere Unbestimmte. Damit definieren wir die Polynome Gj (z1 , z2 , y) ∈ K(z1 , z2 )[y] f¨ ur j := 1, 2 durch Gj (z1 , z2 , y) := zj gj (y) − fj (y).
460
Kapitel XIIII. Miszellen
Der euklidische Algorithmus liefert G3 , . . . , Gs und Q2 , . . . , Qs in K(z1 , z2 )[y] mit G1 = Q2 G2 + G3 G2 = Q3 G3 + G4 .. . Gs−2 = Qs−1 Gs−1 + Gs Gs−1 = Qs Gs . Die Gi h¨ angen nat¨ urlich von f1 , g1 , f2 und g2 ab, was nach außen nicht in Erscheinung tritt. Man sollte es in Erinnerung behalten. Satz 9. Die Voraussetzungen und Bezeichnungen seien wie verabredet. Setzt man ur(f1 , g1 ) und h2 := L¨ ur(f2 , g2 ), so gilt s ≥ r und noch h1 := L¨ ( hi =
f1
, f2 , y , gf11 gf22 g1 (x)Gi g1 , g2 , y ,
g2 (x)Gi
falls i gerade falls i ungerade
f¨ ur i := 1, . . . , r sowie (g qi =
f1 1 (x) g2 (x) Qi g1 , f1 g2 (x) g1 (x) Qi g1 ,
f2 g2 , y , f2 g2 , y ,
falls i gerade falls i ungerade
f¨ ur i := 2, . . . , r − 1. Insbesondere gibt es ein μ ∈ {1, 2} mit hr = gμ (x)Gr
f1 f2 , ,y . g1 g2
Beweis. Es ist r, s ≥ 2. Ferner ist h1 = L¨ ur(f1 , g1 ) = f1 (x)g1 (y) − f1 (y)g1 (x) f1 (x) f1 f2 = g1 (x) g1 (y) − f1 (y) = g1 (x)G1 , ,y . g1 (x) g1 g2 Ebenso zeigt man, dass h2 = g2 (x)G2 ( fg11 , fg22 , y) ist. Ist r = 2 so ist nichts weiter zu beweisen. Es sei also r > 2. Im Folgenden schreiben wir nur Gi anstelle von Gi ( fg11 , fg22 , y), usw. Als N¨achstes geht es darum, die qi anzubinden. W¨ are s = 2, so folgte h1 = g1 G1 = g1 q2 G2 =
g1 q2 h2 , g2
3. Der Satz von L¨ uroth
461
so dass h2 in K(x)[y] Teiler von h1 w¨are im Widerspruch zu r > 2. Es ist also auch s > 2. Es folgt h1 = g1 G1 = g1 (Q2 G2 + G3 ) = Hieraus folgt
g1 h2 Q2 + g1 G3 . g2
g1 h1 − g1 G3 Q2 = g2 h2
und damit g1 g1 h2 q2 − Q2 + h3 − g1 G3 = h2 q2 + h3 − h2 Q2 + g1 G3 g2 g2 = h1 − h1 = 0. Auf Grund ihrer Herkunft gilt Grady (h2 ) > Grady (h3 ). Ebenso gilt Grady (h2 ) = Grady (g2 G2 ) = Grady (G2 ) > Grady (G3 ) = Grady (g1 G3 ). Weil, wie gerade gesehen, g1 h2 q2 − Q2 + h3 − g1 G3 = 0 g2 ist, folgt q2 −
g1 Q2 = 0, g2
dh. q2 =
g1 Q2 g2
und dann auch h3 = g1 G3 . Ist r = 3, so ist nichts mehr zu beweisen. Es sei also r > 3. W¨ are s = 3, so folgte a¨hnlich wie eben, dass h3 Teiler von h2 w¨are im Widerspruch zu r > 3. Also ist auch s > 3. Setze m := min(r, s). Dann ist m ≥ 4. Es sei 2 ≤ α ≤ m − 2 und es gelte g2 Gi , falls i gerade hi = g1 Gi falls i ungerade f¨ ur i := 1, . . . , α + 1 sowie g1 qi =
g2 Qi , g2 g1 Qi ,
falls i gerade falls i ungerade
462
Kapitel XIIII. Miszellen
f¨ ur i := 2, . . . , α. Es sei zun¨achst α gerade. Wegen α ≤ m − 2 existieren Gα+1 , Gα+2 und hα+1 , hα+2 . Es gilt hα = g2 Gα = g2 Qα+1 Gα+1 + g2 Gα+2 g2 = g1 Gα+1 Qα+1 + g2 Gα+2 g1 g2 = hα+1 Qα+1 + g2 Gα+2 . g1 Hiermit folgt hα+1
g2 qα+1 − Qα+1 g1
+ hα+2 − g2 Gα+2 g2 = hα+1 qα+1 + hα+2 − hα+1 Qα+1 + g2 Gα+2 g1 = hα − hα = 0.
Wegen Grady (hα+1 ) > Grady (hα+2 ) und Grady (hα+1 ) = Grady (g1 Gα+1 ) = Grady (Gα+1 ) > Grady (Gα+2 ) = Grady (g2 Gα+2 ) folgt qα+1 = gg21 Qα+1 und hα+2 = g2 Gα+2 . Ist α ungerade, so vertausche man im vorstehenden Argument die Rollen von unschten Ergebnis zu kommen. g1 und g2 , um zum gew¨ W¨ are s < r, so folgte, wie a¨hnlich schon fr¨ uher gesehen, dass hs Teiler von hs−1 w¨are im Widerspruch zur Definition von r. Also ist doch s ≥ r. Damit ist der Satz bewiesen. Satz 10. Es sei K ein kommutativer K¨ orper und f1 , g1 , f2 , g2 seien von 0 verschiedene Polynome aus K[x] mit fg11 , fg22 ∈ / K. Ferner gelte ggT(f1 , g1 ) = 1 = ggT(f2 , g2 ). Ist dann n D := ci (x)y n−i i:=0
der ggT von L¨ ur(f1 , g1 ) und L¨ ur(f2 , g2 ) in K[x, y], wobei n gleich Grady (D) sei, so ist f1 f2 ci (x) ∈K , c0 (x) g1 g2 f¨ ur alle i. Beweis. Mit den bisher eingef¨ uhrten Bezeichnungen gilt D=
a hr , d
3. Der Satz von L¨ uroth
463
wobei a das kgV der Nenner der Koeffizienten von hr und d der ggT der Koeffizienten von ahr ist, wobei hr und ahr als Polynome in K(x)[y] bzw. in K[x][y] aufgefasst sind. Nach Satz 9 gibt es ein μ ∈ {1, 2} mit Gr =
n 1 d d hr = ci y n−i . D= gμ gμ a gμ a i:=0
Nun steht Gr kurz f¨ ur Gr ( fg11 , fg22 , y). Also ist f1 f2 dci ∈K , . gμ a g1 g2 Also ist ci = c0
dci gμ a dc0 gμ a
∈K
f1 f2 , , g1 g2
q. e. d. Satz 11. Es sei K ein kommutativer K¨ orper und f , g seien von 0 verschiedene, / K. Ist dann α eine Nullstelle von teilerfremde Polynome aus K[x] mit fg ∈ L¨ ur(f, g) in einer Erweiterung von K(x), so ist α transzendent u ¨ber K. Beweis. Es ist f (x)g(α)−f (α)g(x) = 0. Wegen f , g = 0 ist genau dann f (α) = 0, wenn g(α) = 0 ist. Wegen ggT(f, g) = 1 haben f und g aber keine gemeinsame Nullstelle. Also ist f (α), g(α) = 0. B A Es sei f = i:=0 fi xi und g = i:=0 gi xi , wobei A und B die Grade der beiden Polynome sind. Setze F := L¨ ur(f, g). 1. Fall: Es ist A < B. Dann ist 0 = F (x, α) =
A B g(α)ai − f (α)bi xi − f (α)bi xi . i:=0
i:=A+1
¨ ber K(α) algebraisch ist. Dann ist aber α Wegen f (α)bB = 0 heißt das, dass x u transzendent u ¨ ber K, da sonst x algebraisch u ¨ber K w¨are. 2. Fall: Es ist A > B. Hier folgt die Behauptung wegen L¨ ur(f, g) = −L¨ ur(g, f ) aus dem soeben Bewiesenen. 3. Fall: Es ist A = B. Hier ist 0=
A g(α)ai − f (α)bi xi . i:=0
W¨ are g(α)ai − f (α)bi = 0 f¨ ur alle i, so folgte wegen f (α), g(α) = 0, dass f (α) ai = ∈K g(α) bi
464
Kapitel XIIII. Miszellen
ist f¨ ur alle die i, f¨ ur die bi = 0 ist. Weil g = 0 ist, gibt es wenigstens ein solches i. Es gibt also ein λ ∈ K mit f (α) = λg(α). Es folgt 0 = f (α)ai − λf (α)bi f¨ ur alle i und wegen f (α) = 0 dann auch 0 = ai − λbi f¨ ur alle i. Es folgt f = λg und damit der Widerspruch fg ∈ K. Also ist auch in diesem Falle x algebraisch u ¨ber K(α), woraus wiederum folgt, dass α transzendent u ¨ ber K ist. Damit ist der Satz bewiesen. Korollar. Die Voraussetzungen und Bezeichnungen seien wie bei Satz 10. Ist dann α eine Nullstelle von D in einer Erweiterung von K(x), so ist α transzendent u ¨ber K. ur(f1 , g1 ), Beweis. Weil D Teiler von L¨ ur(f1 , g1 ) ist, ist α auch Nullstelle von L¨ so dass mit Satz 11 folgt, dass α u ¨ ber K transzendent ist. Satz von L¨ uroth. Es sei K ein kommutativer K¨ orper. Ferner seien f1 , g1 , f2 , g2 ∈ K[x] und es gelte fg11 , fg22 ∈ / K, sowie ggT(f1 , g1 ) = 1 = ggT(f2 , g2 ). Es sei ur(f2 , g2 ) in K[x, y] und es gelte wieder D der ggT von L¨ ur(f1 , g1 ) und L¨ D=
n
ci (x)y n−i .
i:=0
Es gibt dann ein i ∈ {0, . . . , n} mit K
ci c0
ci c0
∈ / K. Ist
=K
ci c0
∈ / K, so ist
f1 f2 , . g1 g2
Beweis. Satz 10 besagt, dass f1 f2 1 D∈K , c0 g1 g2 ist. Nach Satz 2b) sind alle L¨ urothpolynome durch y − x teilbar. Folglich ist auch D durch y − x teilbar, so dass D(x, x) = 0 ist. Weil x u ¨ ber K transzendent ist, folgt, dass nicht alle cc0i in K liegen. c Es sei j so gew¨ahlt, dass cj0 ∈ / K ist. Es ist K
cj c0
⊆K
f1 f2 , . g1 g2
3. Der Satz von L¨ uroth
465
Wir nehmen zun¨ achst an, dass ∂L¨ ur(f1 , g1 ) = 0 ∂y
oder
∂L¨ ur(f2 , g2 ) = 0 ∂y
ist. Nach Satz 4 hat dann wenigstens eines der Polynome L¨ ur(f1 , g1 ) und L¨ ur(f2 , g2 ) in seinem Zerf¨allungsk¨ orper u ¨ ber K(x) nur einfache Nullstellen. Dann hat aber orper L u ¨ ber K( fg11 , fg22 ) nur einfache Nullstellen. Es auch cD0 in seinem Zerf¨allungsk¨ seien z1 = x, z2 , . . . , zn diese Nullstellen. Nach dem Korollar zu Satz 11 sind die zi allesamt transzendent u ¨ ber K, so dass c0 (zi ) = 0 ist f¨ ur alle i. In L[y] gilt n n ci n−i D y = = (y − zi ) c c0 i:=0 0 i:=1 =
n
(−1)i λi (z1 , . . . , zn )y n−i ,
i:=0
wobei λi das i-te elementarsymmetrische Polynom in n Unbestimmten ist. Es folgt ci (x) = (−1)i λi (z1 , . . . , zn ) c0 (x) f¨ ur alle i. Vertauscht man hierin z1 = x mit zk , so folgt ci (zk ) = (−1)i λi (zk , z2 , . . . , zk−1 , z1 , zk+1 , . . . , zn ) c0 (zk ) = (−1)i λi (z1 , . . . , zn ) ci (x) = c0 (x) f¨ ur alle k. Insbesondere gilt cj (x) cj (zk ) = c0 (x) c0 (zk ) f¨ ur alle k. Hieraus folgt L¨ ur(cj , c0 )(x, zk ) = 0 1 c0 D
f¨ ur alle k. Daher ist Teiler von L¨ ur(cj , c0 ) aufgefasst als Polynom u ¨ber K(x). Es gibt also ein P ∈ K(x)[y] mit L¨ ur(cj , c0 ) =
P D. c0
Weil nach Satz 1 gilt, dass L¨ ur(cj , c0 ) = 0 ist, ist P = 0. Nach Satz 8 ist c /K Gradx (D) = Grady (D) = n. Hieraus folgt Grad(cj ), Grad(c0 ) ≤ n. Wegen c0j ∈ folgt mit Satz 3, dass ur(cj , c0 ) = Grady L¨ ur(cj , c0 ) ≤ n. Gradx L¨
466
Kapitel XIIII. Miszellen
gilt. Aus all diesem folgt schließlich, dass 0 =
P ∈K c0
ist. Wir halten fest Die Polynome L¨ ur(cj , c0 ) und D unterscheiden sich nur um einen Faktor aus c K ∗ , falls c0j ∈ / K ist. Ferner ist cj D ∈K [y]. c0 c0 Es sei Z der Zerf¨allungsk¨ orper von
cj K⊆K c0
D c0
c
u ¨ ber K( c0j ). Wegen x ∈ Z ist dann
f1 f2 , ⊆K g1 g2
⊆ K(x) ⊆ Z.
c
Weil cD0 separabel ist, ist Z : K( c0j ) galoissch (Satz 3, Kap. 13, Absch. 8). Es sei G die Galoisgruppe dieser Erweiterung. Ist dann σ ∈ G, so ist σ(x) eine Nullstelle von D und damit von L¨ ur(f1 , g1 ) und L¨ ur(f2 , g2 ). Es folgt f1 (x) f1 (σ(x)) f1 (x) = =σ g1 (x) g1 (σ(x)) g1 (x) f2 (x) ur alle σ ∈ G gilt, gilt nach dem Hauptsatz und ebenso fg22 (x) (x) = σ( g2 (x) ). Da dies f¨ der galoisschen Theorie cj f1 f2 , ∈K . g1 g2 c0
Damit ist gezeigt, dass
cj K c0 gilt. Es sei nun
∂L¨ ur(f1 , g1 ) =0 ∂y
f1 f2 , =K g1 g2
und
∂L¨ ur(f2 , g2 ) =0 ∂y
Nach Satz 6 ist dann Char(K) = p > 0 und f1 , g1 , f2 , g2 sind Polynome in xp . Es sei e maximal mit der Eigenschaft, dass es F1 , G1 , F2 , G2 ∈ K[x] gibt mit e e fi = Fi (xp ) und gi = Gi (xp ). Dann ist ∂L¨ ur(F1 , G1 ) = 0 oder ∂y
∂L¨ ur(F2 , G2 ) = 0. ∂y
3. Der Satz von L¨ uroth
467
N −i der ggT von L¨ ur(F1 , G1 ) und L¨ ur(F2 , G2 ) in K[x, y]. Es sei Δ = N i:=0 Ci y e e Ist u ∈ K[x, y], so setzen wir ϕ(u(x, y)) := u(xp , y p ). Dann ist ϕ ein Monomorphismus von K[x, y] in sich, der sich auf K(x, y) fortsetzen l¨asst. Es ist ur(f1 , g1 ) ϕ L¨ ur(F1 , G1 ) = L¨ ur(f2 , g2 ) ϕ L¨ ur(F2 , G2 ) = L¨ und folglich — bis auf einen unwesentlichen Faktor k ∈ K ∗ — auch ϕ(Δ) = D. Es folgt n = N pe und ϕ(Ci ) = cipe . Ist i nicht durch pe teilbar, so ist ci = Cl 0. Insbesondere ist j = lpe und es folgt, dass C ∈ / K ist. Nach dem bereits 0 Bewiesenen ist also Cl F1 F2 , K =K . C0 G1 G2 Hieraus folgt schließlich
cj K c0
ϕ(Cl ) F1 F2 Cl , =K =ϕ K =ϕ K ϕ(C0 ) C0 G1 G2 f1 f2 =K , . g1 g2
Damit ist der Satz von L¨ uroth bewiesen. Mitbewiesen wurde auch Korollar 1. Die Voraussetzungen und Bezeichnungen seien wie in Satz 12. Dann ur(f2 , g2 ) ein L¨ urothpoist der ggT der beiden L¨ urothpolynome L¨ ur(f1 , g1 ) und L¨ lynom. Korollar 2. Die Voraussetzungen und Bezeichnungen seien wie in Satz 12. Dann ¨ber K( fg11 , fg22 ). ist cD0 das Minimalpolynom von x u Beweis. Dies folgt mit dem Satz von L¨ uroth aus dem Korollar zu Satz 1 von Kapitel 10, Abschnitt 6. Der Leser beachte noch einmal die Bemerkung des vorletzten Absatzes von Abschnitt 6 des Kapitels 10. F¨ ur die Rechenpraxis ist auch der folgende Satz interessant. Satz 12. Es sei K ein kommutativer K¨ orper. Ferner seien f1 , g1 , f2 , g2 ∈ K[x] und es gelte fg11 , fg22 ∈ K, sowie ggT(f1 , g1 ) = 1 = ggT(f2 , g2 ). Genau dann ist f2 f1 ∈K , g1 g2 ur(f1 , g1 ) ist. wenn L¨ ur(f2 , g2 ) Teiler von L¨
468
Kapitel XIIII. Miszellen
ur(f1 , g1 ). Dann ist der ggT dieser beiden Beweis. Es sei L¨ ur(f2 , g2 ) Teiler von L¨ L¨ urothpolynome gleich L¨ ur(f2 , g2 ), so dass mit Satz 12 folgt, dass f2 f1 f2 K , =K g2 g1 g2 ist. Hieraus folgt
f1 g1
Es sei umgekehrt
∈ K( gf22 ). f1 g1
∈ K( fg22 ). Dann ist K
f2 g2
=K
f1 f2 , . g1 g2
Nach dem Korollar zu Satz 1 aus Abschnitt 6 des Kapitels 10 ist L¨ ur(f2 , g2 ) zum Minimalpolynom von x u ¨ ber K( gf22 ) assoziiert. Nach Korollar 2 ist andererseits ur(f2 , g2 ) zum Minimalpolynom von x u ¨ ber K( gf11 , fg22 ) assoziggT L¨ ur(f1 , g1 ), L¨ iert. Aus der Gleichheit dieser beiden K¨ orper folgt schließlich, dass L¨ ur(f2 , g2 ) Teiler von L¨ ur(f1 , g1 ) ist. Korollar. Die Voraussetzungen seien wie in Satz 13. Genau dann ist K( fg11 ) = K( fg22 ), wenn es ein k ∈ K ∗ gibt mit L¨ ur(f1 , g1 ) = kL¨ ur(f2 , g2 ).
Was die Rechenpraxis selbst anbelangt, so konsultiere der Leser Karst 1991. 4. Ganzzahlige Polynome. Steinitz hat in seiner großen Arbeit darauf hingewiesen und auch einen Beweis daf¨ ur skizziert, dass man den algebraischen Abschluss der henselschen p-adischen Zahlen konstruieren kann, ohne das Auswahlaxiom zu verwenden. Eine solche Konstruktion durchzuf¨ uhren ist das n¨ achste Ziel dieses Kapitels. Um dieses Ziel zu erreichen, muss man einiges u ¨ ber die henselschen p-adischen Zahlen und ihre algebraischen Erweiterungen wissen. Die wesentliche Eigenschaft wird sein, dass jede endliche algebraische Erweiterung von Qp ein primitives Element hat, das Nullstelle eines ganzzahligen Polynoms mit Leitkoeffizient 1 ist. Um diese bemerkenswerte Eigenschaft zu beweisen, m¨ ussen wir einiges zur Topologie der henselschen p-adischen Zahlen sagen. Dies wird in den n¨ achsten Abschnitten geschehen. Hat man dies, so muss man weiterhin wissen, dass der Polynomring Z[x] oder doch zumindest seine Teilmenge der Polynome mit Leitkoeffizient 1 abz¨ahlbar ist. Dies werden wir als Erstes beweisen. Dabei spielen die Binomialkoeffizienten eine prominente Rolle. Was ich zu ihrer Geschichte zu sagen weiß, habe ich in Abschnitt 3 von Kapitel 4 schon erz¨ ahlt. Wir beginnen mit einer simplen Bemerkung. Satz 1. Sind k, n ∈ N0 und ist 1 ≤ k ≤ n + 1, so ist nk < n+1 k . n Beweis. Wegen n + 1 ≥ k ≥ 1 ist k−1 ≥ 1. Folglich ist n+1 n n n = + > . k k k−1 k
4. Ganzzahlige Polynome
469
Satz 2. Ist k ∈ N und ist r eine nicht negative reelle Zahl, so gibt es genau ein n ∈ N0 mit nk ≤ r < n+1 k . k−1 Beweis. Es ist 0 = k und 1 = kk . Ist i + 1 ≤ k+i k , so folgt mit Satz 1 k+i k+i+1 i+1≤ < k k und somit, da Binomialkoeffizienten ganzzahlig sind, i+2 ≤ k+i+1 . Es gibt daher k n n+1 ein n ∈ N0 mit k ≤ r < k . m+1 . Offenbar ist m + 1 ≥ k und Es sei m ∈ N0 und es gelte auch m k ≤r < k n + 1 ≥ k. W¨ are nun n < m, so w¨are n + 1 ≤ m und daher n+1 m r< ≤ ≤ r. k k Dieser Widerspruch zeigt, dass m ≤ n ist. Ebenso folgt n ≤ m, so dass n = m ist. Damit ist der Satz bewiesen. k n−i = i:=0 k−i . Satz 3. Sind k, n ∈ N0 und ist k ≤ n, so ist n+1 k Beweis. Dies ist richtig f¨ ur k = 0. Es sei also k > 0. Dann ist k−1 n − 1 − i n+1 n n n . = + = + k−1−i k k k−1 k i:=0 Ersetzt man hierin i + 1 durch i, so folgt die Behauptung. Satz 4. Es sei k ∈ N. Ist N ∈ N0, so gibt es genau ein k-Tupel a1 , . . . , ak ∈ N0 k mit a1 < . . . < ak und N = i:=1 aii . Beweis. Wir zeigen zun¨achst die Existenz der ai . Ist k = 1, so ist N = N1 . Es sei also k > 1. Nach Satz 2 gibt es ein ak ∈ N0 mit ak ak + 1 ≤N < . k k Nach Induktionsannahme gibt es a1 , . . . , ak−1 mit a1 < . . . < ak−1 und N−
k−1 ai ak = . k i i:=1
Es ist noch zeigen, dass aakk−1 < ak ist. zu und daher Es ist akk = akk+1 − k−1 a1 ak + 1 ak−1 ak ak + 1 + ... + − + >N = . 1 k−1 k−1 k k
470 Somit ist
Kapitel XIIII. Miszellen
ak−1 k−1
≤
a1 ak−1 ak + ... + < 1 k−1 k−1
und damit ak−1 < ak . Damit ist die Existenzaussage bewiesen. Um die Eindeutigkeitsaussage zu beweisen, sei k ≤ A ∈ N. Ferner sei N < A k . Nach dem bereits Gezeigten gibt es a1 , . . . , ak ∈ N0 mit a1 < . . . < ak und N=
k ai . i i:=1
Mit Satz 1 folgt ak < A. Es sei umgekehrt a1 < . . . < ak < A. Dann ist ak−i ≤ A − 1 − i f¨ ur i := 0, . . . , k − 1 und nach Satz 3 folglich N :=
k−1 i:=0
ak−i k−i
≤
k−1 i:=0
A−1−i A = − 1. k−i k
Schr¨ ankt man also die durch ϕk (a1 , . . . , ak ) :=
k ai i:=1
i
definierte Abbildung ϕk ein auf die Menge der k-Tupel a1 , . . . , ak mit a1 < . . . < ak < A, so bildet diese Einschr¨ ankung diese Menge auf die Menge der Zahlen {0, 1, . . . , A − 1} ab. Weil beide Mengen die gleiche, endliche M¨achtigkeit haben, k folgt, dass ϕk auch injektiv ist. Damit ist der Satz bewiesen. Mitbewiesen wurde auch das folgende Korollar 1. Definiert man die Abbildung ϕk durch ϕk (a1 , . . . , ak ) :=
k ai , i i:=1
so ist ϕk eine Bijektion der Menge der k-Tupel a1 , . . . , ak ∈ N0 mit a1 < . . . < ak auf N0 . Weil man die k-Teilmengen von N0 auch als die in Korollar 1 beschriebenen k-Tupel ansehen kann, gilt auch ahlbar. Korollar 2. Die Menge der k-Teilmengen von N0 ist abz¨ ahlMit Korollar 2 folgt, dass die Menge aller endlichen Teilmengen von N0 abz¨ bar ist. Dies sieht man aber noch schneller und einfacher mit Hilfe der Abbildung 2y . (X) := y∈X
4. Ganzzahlige Polynome
471
Satz 5. Es sei ϕk die in Korollar 1 definierte Abbildung. Definiert man die Abbildung ϑk durch ϑk (a1 , . . . , ak ) := ϕk (a1 , a1 + a2 + 1, a1 + a2 + a3 + 2, . . . , a1 + . . . + ak + k − 1), f¨ ur a1 , . . . , ak ∈ N0 , so ist ϑk eine Bijektion der Menge aller k-Tupel u ¨ber N0 auf N0 . Beweis. Die durch ψk (a1 , . . . , ak ) := (a1 , a1 + a2 + 1, . . . , a1 + . . . + ak + k − 1) definierte Abbildung ψk ist eine Bijektion der Menge aller k-Tupel u ¨ ber N0 auf die Menge aller k-Tupel b1 , . . . , bk mit bi ∈ N0 und b1 < . . . < bk , wie unschwer zu sehen. Weil ϕk bijektiv ist, ist wegen ϑk = ϕk ψk auch ϑk bijektiv. Satz 6. F¨ ur z ∈ Z definieren wir δ(z) durch 2z, falls z ≥ 0 δ(z) := 2|z| − 1, falls z < 0. Ferner setzen wir
χk (z1 , . . . , zk ) := δ(z1 ), . . . , δ(zk ) .
Dann ist χk eine Bijektion der Menge aller k-Tupel u ¨ber Z auf die Menge aller k-Tupel u ¨ber N0 . Insbesondere ist ϑk χk eine Bijektion der Menge aller k-Tupel u ¨ber Z auf N0 . Beweis. Trivial. n−1 Satz 7. Ist f = xn + i:=0 ai xi ∈ Z[x] und ist n ≥ 2, so setzen wir α(f ) := ϑ2 ϑn χn (a0 , . . . , an−1 ), n − 2 . Dann ist α eine Bijektion der Menge aller ganzzahligen Polynome mit Leitkoeffizient 1 und einem Grad n ≥ 2 auf N0 . Beweis. Klar. Satz 8. Ist X eine nicht endliche Teilmenge von N0 , so gibt es eine Bijektion a von N0 auf X, so dass genau dann ai < aj gilt, wenn i < j ist. Insbesondere ist X abz¨ ahlbar. Beweis. Ist E eine endliche Teilmenge von X, so ist X − E nicht leer, da X nicht endlich ist. Weil N0 wohlgeordnet ist, gibt es ein kleinstes Element k in X − E. Wir setzen R(E) := E ∪ {k}. Dann ist auch R(E) eine endliche Teilmenge von X und es gilt |R(E)| = |E| + 1. Nach dem dedekindschen Rekursionssatz gibt es eine Abbildung von N0 in die Menge der endlichen Teilmengen von X mit 0 = R(∅) und n+1 = R( n ).
472
Kapitel XIIII. Miszellen
Wir definieren die Abbildung a durch 0 = {a0 } und n+1 = n ∪ {an+1 }. Dann ist a streng monoton steigend, insbesondere also injektiv und unbeschr¨ ankt. Ferner ist ∞ $ i = {ai | i ∈ N0 }. i:=0
W¨ are dies nicht die Menge X, so g¨abe es ein w∈X−
∞ $
i .
i:=0
Es folgte an < w f¨ ur alle n im Widerspruch zur Unbeschr¨ anktheit von a. Also ist doch X = {ai | i ∈ N0 }, womit der Satz bewiesen ist. Satz 9. Ist X eine nicht endliche Menge und ist f eine surjektive Abbildung von N0 auf X, so ist X abz¨ ahlbar. Ist X u ¨berdies angeordnet und folgt aus m < n stets fm ≤ fn , so gibt es eine Abz¨ ahlung a von X mit ai < aj , genau dann, wenn i < j ist. Beweis. Ist y ∈ X, so ist M (y) := {x | x ∈ N0 , fx = y} nicht leer, da f ja surjektiv ist. Ist dann gy das kleinste Element von M (y), so ist ahlung b g eine injektive Abbildung von X in N0 . Nach Satz 8 gibt es eine Abz¨ von {gy | y ∈ X}, so dass genau dann bi < bj gilt, wenn i < j ist. Wir setzen nun ai = y genau dann, wenn bi = gy ist. Dann ist a eine Bijektion von N0 auf X. Es sei nun X angeordnet und es gelte fm ≤ fn , falls m < n ist. Wir setzen y := ai und z := aj . Dann ist bi = gy = fy und bj = gz = fz . Es sei i < j. Dann ist bi < bj , das heißt fy < fz und folglich y < z, das heißt a i < aj . Ist umgekehrt ai < aj , so ist fy < fz und folglich bi < bj und damit i < j. Damit ist alles bewiesen. Mit Hilfe der bislang bewiesenen S¨ atze ist es ein Leichtes zu zeigen, dass auch Z[x] abz¨ ahlbar ist. Da wir diesen Satz aber nicht ben¨otigen, sei dies nachzuweisen ¨ dem Leser als Ubungsaufgabe u ¨berlassen. 5. Topologische R¨ aume. Da wir vor allem an Algebra interessiert sind, ist die Topologie des K¨ orpers der reellen Zahlen bislang allenfalls beil¨ aufig erw¨ ahnt worden. Sie kommt erst richtig in der Analysis zum Tragen, wo sie meines Erachtens schon ausf¨ uhrlich im Anf¨ angerunterricht er¨ ortet werden sollte, ausf¨ uhrlicher als allgemein u ¨ blich. Wenn man sich am Anfang die Zeit nimmt, Grunds¨ atzliches u ¨ ber
5. Topologische R¨ aume
473
Topologie zu erz¨ahlen, gewinnt man am Ende viel an Einsicht wie auch an Bequemlichkeit. Ein m¨ogliches Programm f¨ ur eine solche Vorlesung findet der Leser in meinem Analysisbuch aufgezeichnet (L¨ uneburg 1981a). Bei den p-adischen Zahlen ist das anders. Sie sind topologische K¨ orper wie die reellen Zahlen und ihre Topologie wird in der Zahlentheorie, der Schwester der Algebra, mit Vorteil benutzt. Wir werden uns ihrer bedienen, wenn wir nach dem Vorgang von Steinitz ohne Benutzung des Auswahlaxioms zeigen, dass die henselschen p-adischen Zahlen einen algebraischen Abschluss haben. Das gibt uns also Gelegenheit, ein wenig u ¨ber topologische K¨ orper und topologische Vektorr¨ aume zu reden. Zun¨achst aber m¨ ussen wir u ¨ ber topologische R¨aume schlechthin sprechen. Was der Anlass war, topologische R¨aume einzuf¨ uhren und zu untersuchen, weiß ich nicht. Einer von wahrscheinlich mehreren scheint gewesen zu sein, den Begriff des Limes abstrakt zu untersuchen. Hausdorff nennt hier Fr´echet 1906 (Hausdorff 1914, S. 456). Ein anderer der, abstrakte Eigenschaften der Metrik euklidischer R¨ aume zu untersuchen, was zu den metrischen R¨aumen f¨ uhrt. Zwischen diesen beiden Theorien l¨age seine Theorie der topologischen R¨aume. (Die W¨ orter Topologie“ und topologischer Raum“ kommen bei ihm nicht vor.) Diese h¨ atte er ” ” schon im SS 1912 in Bonn in einer Vorlesung u ¨ ber Mengenlehre vorgetragen (Hausdorff 1914, Ss. 211, 457). Weshalb sich Hausdorff f¨ ur den mittleren Weg entschied, entnimmt man den folgenden Zeilen (Hausdorff 1914, S. 211). Welchen der drei oben genannten Grundbegriffe Entfernung, Limes, Umge” bung man zur Basis der Betrachtung w¨ahlen will, ist bis zu einem gewissen Grade Geschmackssache. Mit Hilfe von Entfernungen kann man, wie gesagt, Umgebungen und Limites definieren, mit Hilfe von Umgebungen Limites, aber im allgemeinen nicht Entfernungen, mit Hilfe von Limites im allgemeinen weder Umgebungen noch Entfernungen. Danach erscheint die Entfernungstheorie die speziellste, die Limestheorie die allgemeinste zu sein; auf der andern Seite bringt der Limesbegriff sofort eine Beziehung zum Abz¨ahlbaren (zu Elementfolgen) in die Theorie hinein, worauf die Umgebungstheorie verzichtet. Wir ziehen aus verschiedenen Gr¨ unden vor, die grundlegenden Betrachtungen dieses Kapitels auf die Umgebungen zu st¨ utzen und die beiden anderen Begriffe erst sp¨ater zur Mitwirkung heranzuziehen; um aber dem Leser sogleich ein konkretes Bild zu erwecken, beginnen wir mit den speziellen Umgebungen, die durch Entfernungen definiert sind.“ Wir folgen hier Hausdorff, was jedoch nicht zu w¨ ortlich zu nehmen ist. Statt mit Umgebungen fangen wir mit den offen Mengen an, die bei Hausdorff Gebiete heißen, wobei er diesen Namen aus der Funktionentheorie u ¨bernimmt, aber ausdr¨ ucklich nicht verlangt, dass Gebiete zusammenh¨ angend sind, wie dies Weierstraß t¨ate (Hausdorff 1914, S. 215, Anm. 1). Wir sind auch allgemeiner als Hausdorff, da wir auf sein Trennungsaxiom verzichten, das wir gleich noch kommentieren werden. Wir folgen hier also den Spuren Hausdorffs. Es ist aber in unserem Rahmen nicht m¨oglich, Hausdorffs Buch Grundz¨ uge der Mengenlehre“ geb¨ uhrend zu w¨ urdigen. ” Es ist das erste Lehrbuch der mengentheoretischen Topologie. Es fasst zusammen,
474
Kapitel XIIII. Miszellen
was bis dahin erzielt wurde, und bringt manch Neues. Es ist ein Buch, das die Mathematik des 20. Jahrhunderts wesentlich beeinflusst hat. F¨ ur eine W¨ urdigung dieses Buches sei der Leser an die Einleitung verwiesen, die Walter Purkert f¨ ur den zweiten Band der Werke Hausdorffs geschrieben hat (Hausdorff 2002, S. 1–89). Es sei M eine Menge und O sei eine Teilmenge der Potenzmenge von M . Das Paar (M, O) heißt topologischer Raum und O eine Topologie auf M , wenn Folgendes gilt. 1) Es ist ∅, M ∈ O. # 2) Ist X ⊆ O, so ist Y ∈X Y ∈ O. 3) Sind X, Y ∈ O, so ist X ∩ Y ∈ O. Die Elemente von O heißen die O-offenen Mengen von (M, O). Sind keine Verwechslungen zu bef¨ urchten, so sprechen wir nur kurz von den offenen Teilmengen von M . Induktion zeigt, dass der Schnitt von endlich vielen offenen Mengen offen ist. Es sei (M, O) ein topologischer Raum. Ist y ∈ X ⊆ M , so heißt X genau dann Umgebung von y, wenn es ein U ∈ O gibt mit y ∈ U ⊆ X, wenn also X eine offene Teilmenge U enth¨ alt, die wiederum y enth¨ alt. Die Menge der Umgebungen von y bezeichnen wir mit U(y). Satz 1. Es sei (M, O) ein topologischer Raum und X sei eine Teilmenge von M . Genau dann ist X ∈ O, wenn X ∈ U(y) ist f¨ ur alle y ∈ X. ur alle y ∈ X. Es sei umgekehrt X ∈ U(y) Beweis. Ist X ∈ O, so ist X ∈ U(y) f¨ f¨ ur alle y ∈ X. Es sei Y die Vereinigung u ¨ ber alle offenen Teilmengen von X. Dann ist Y ∈ O auf Grund der Eigenschaft 2) der Definition offener Mengen und es gilt nat¨ urlich Y ⊆ X. Es sei y ∈ X. Weil X Umgebung von y ist, gibt es ein U ∈ O mit y ∈ U ⊆ X. Es folgt y ∈ U ⊆ Y . Dies hat X ⊆ Y zur Folge. Also ist X = Y ∈ O. Satz 2. Es sei (M, O) ein topologischer Raum. Ist y ∈ M , so gilt: a) Ist X ∈ U(y) und X ⊆ Y ⊆ M , so ist Y ∈ U(y). b) Sind X, Y ∈ U(y), so ist X ∩ Y ∈ U(y). Beweis. a) Es gibt ein U ∈ O mit y ∈ U ⊆ X. Es folgt U ⊆ Y und damit Y ∈ U(y). b) Es gibt U , V ∈ O mit y ∈ U ⊆ X und y ∈ V ⊆ Y . Es folgt y ∈ U ∩V ⊆ X ∩Y . Weil U ∩ V offen ist, ist X ∩ Y ∈ U(y). Ist X Teilmenge des topologischen Raumes (M, O), so setzen wir Inn(X) := y | y ∈ X, X ∈ U(y) und nennen Inn(X) das Innere von X. Es gilt Satz 3. Es sei (M, O) ein topologischer Raum. Ist X Teilmenge von M , so ist Inn(X) offen. Ist Y ⊆ X und ist Y offen, so ist Y ⊆ Inn(X). Beweis. Es sei Y ⊆ X und Y sei offen. Dann ist Y ∈ U(z) f¨ ur alle z ∈ Y (Satz 1). Weil Y Teilmenge von X ist, ist X ∈ U(z) f¨ ur alle z ∈ Y (Satz 2). Also ist Y ⊆ Inn(X).
5. Topologische R¨ aume
475
Es sei nun a ∈ Inn(X). Dann ist X ∈ U(a). Es gibt folglich eine offene Teilmenge Y mit a ∈ Y ⊆ X. Nach dem, was wir bereits gezeigt haben, folgt Y ⊆ Inn(X). Daher ist Inn(X) Vereinigung von offenen Teilmengen, also selbst offen. Korollar. Die Teilmenge X des topologischen Raumes (M, O) ist genau dann offen, wenn X = Inn(X) ist. Beweis. Ist X offen, so gilt nach Satz 3, dass X ⊆ Inn(X) ist. Also ist X = Inn(X). Ist X = Inn(X), so ist X nach Satz 3 offen. Die gew¨ohnliche Topologie auf R wird mit Hilfe der -Umgebungen definiert. Diesen Mechanismus wollen wir etwas allgemeiner untersuchen. Es sei (M, O) ein topologischer Raum. Die Teilmenge B von O heißt Basis von O, wenn es zu jedem x ∈ M und jedem U ∈ U(x) ein B ∈ B gibt mit x ∈ B ⊆ U . Satz 4. Es sei M eine Menge und B sei Teilmenge der Potenzmenge von M . Genau dann ist B Basis einer Topologie O auf M , wenn es zu B, C ∈ B und x ∈ B # ∩ C stets ein D ∈ B gibt mit x ∈ D ⊆ B ∩ C und wenn außerdem M = X∈B X gilt. Ist B Basis der Topologie O von M , so ist jedes Element von O Vereinigung von Elementen von B. Beweis. Es sei B Basis der Topologie O. Es sei X ∈ O. Dann ist X ∈ U(y) f¨ ur alle y ∈ X (Satz 1). Es gibt daher zu jedem y ∈ X ein B ∈ B mit y ∈ B ⊆ X. Also ist X Vereinigung von Mengen aus B. Damit ist die letzte Aussage des Satzes bewiesen Es sei weiterhin B Basis # der Topologie O. Wegen M ∈ O gilt nach dem gerade Bewiesenen, dass M = B∈B B ist. Es seien B, C ∈ B. Ferner sei y ∈ B ∩ C. Weil B und C offen sind — B ist ja Teilmenge von O —, ist auch B ∩ C offen, also nach Satz 1 Umgebung von y. Es gibt daher ein D ∈ B mit y ∈ D ⊆ B ∩ C. Es erf¨ ulle B die Bedingungen des Satzes. Es sei ferner O die Menge aller Teilmengen von M , die Vereinigung von Mengen # aus B sind. Dann ist M ∈ O auf Grund der Voraussetzung an B. Wegen ∅ = X∈∅ X ist auch ∅ ∈ O. Es ist ferner klar, dass Vereinigungen von Mengen, die zu O geh¨oren, ebenfalls zu O geh¨oren. Es seien schließlich X, Y ∈ O und es sei y ∈ X ∩ Y . Es gibt dann B, C ∈ B mit y ∈ B ⊆ X und y ∈ C ⊆ Y . Es gibt dann ein D ∈ B mit y ∈ D ⊆ C ∩ D ⊆ X ∩ Y . Hieraus folgt, dass X ∩ Y Vereinigung von Elementen aus B ist, also zu O geh¨ort. Folglich ist O eine Topologie auf M . Auf Grund der Konstruktion von O ist klar, dass B Basis von O ist. Damit ist alles bewiesen. An dieser Stelle beginnt Hausdorff, indem er den Begriff der Umgebung axiomatisiert. Er geht aus von einer Familie (Bx | x ∈ M ) von Mengen von Teilmengen von M , so dass Folgendes gilt: 1) Keins der Bx ist leer. Ist B ∈ Bx , so ist x ∈ Bx .
476
Kapitel XIIII. Miszellen
2) Sind U , V ∈ Bx , so gibt es ein W ∈ Bx mit W ⊆ U ∩ V . 3) Ist y ∈ U ∈ Bx , so gibt es ein V ∈ By mit V ⊆ U . 4) Sind x, y zwei verschiedene Elemente aus M , so gibt es ein U ∈ Bx und ein V ∈ By mit U ∩ V = ∅. # Die Forderungen 1), 2), 3) besagen, dass B = x∈M Bx eine Basis ist. Die Forderung 4) ist das oben erw¨ ahnte Trennungsaxiom. Es sondert die heute so genannten hausdorffschen Topologien von den restlichen Topologien. Der Begriff hausdorffscher Raum“ wurde von Fr´echet gepr¨ agt. Er taucht zum ersten Male in ” einer Arbeit von ihm aus dem Jahre 1925 auf (Purkert in Hausdorff 2002, S. 62. Dort auch Zitat der fr´echetschen Arbeit). Es sei (M, O) ein topologischer Raum. Die nicht-leere Teilmenge S der Potenzmenge von M heißt Subbasis von O, falls die Menge B aller der Teilmengen von M , die Schnitte von endlich vielen, mindestens aber einer Menge aus S sind, eine Basis von O bilden. Es gilt dann S ⊆ B ⊆ O, so dass die Elemente einer Subbasis stets offene Mengen sind. Jede Basis ist gleichzeitig Subbasis. Satz 5. Es sei S eine nicht-leere Teilmenge der Potenzmenge der Menge M . # Genau dann ist S Subbasis einer Topologie O von M , wenn S∈S S = M ist. Beweis. Es sei S Subbasis der Topologie O und # B sei die Basis aus den Schnitten endlich vieler Elemente von S. Dann ist M = B∈B B. Es sei y ∈ M . Es gibt dann also ein B ∈ B mit y ∈ B. Weil B Schnitt von mindestens einem Element S aus S ist, gibt es ein S ∈ S mit y ∈ S. Hieraus folgt, dass M die Vereinigung u ¨ber alle S ∈ S ist. Es sei umgekehrt M die Vereinigung u ¨ber alle S ∈ S und B sei die Menge der nicht-leeren Schnitte u ¨ ber endlich viele Elemente aus S. Dann ist M die Vereinigung u ¨ ber alle Elemente von B, da ja S ⊆ B ist. Der Schnitt von zwei Elementen von B geh¨ort sogar selbst zu B, so dass B nach Satz 3 Basis einer Topologie ist. Die Komplemente offener Mengen sind so wichtig, dass sie einen eigenen Namen verdienen. Es sei (M, O) ein topologischer Raum. Ist A ⊆ M , so heißt A genau dann Oabgeschlossen, wenn M −A eine O-offene Menge ist. Wie schon bei offenen Mengen vereinbart, werden wir auch bei O-abgeschlossenen Mengen nur von abgeschlossenen Mengen reden, das O also unterdr¨ ucken, wenn keine Verwechslungen zu bef¨ urchten sind. Der Begriff der abgeschlossenen Menge und sein heutiger Name kommen schon bei Hausdorff vor. Er definiert sie mit Hilfe ihrer H¨ aufungspunkte und hat dann die gerade vorgetragene Definition als charakterisierenden Satz. Seine Definition findet sich hier als Satz 7 (Hausdorff 1914, S. 228). Satz 6. Ist (M, O) ein topologischer Raum und ist A die Menge der abgeschlossenen Teilmengen von M , so gilt: 1) Es ist ∅, M ∈ A. 2) Ist X offen, so ist!M − X abgeschlossen. 3) Ist Y ⊆ A, so ist X∈Y X ∈ A.
5. Topologische R¨ aume
477
# 4) Sind X1 , . . . , Xn ∈ A, so ist ni:=1 Xi ∈ A. Beweis. 1) Wegen ∅, M ∈ O und ∅ = M − M bzw. M = M − ∅ sind M , ∅ ∈ A. 2) Ist X offen, so folgt aus X = M − (M − X), dass M − X abgeschlossen ist. 3) Es ist " $ X=M− (M − X). X∈Y
X∈Y
Weil X abgeschlossen ist, ist M −X offen und folglich auch die Menge ! Daher ist X∈Y X nach 2) abgeschlossen. 4) Es ist M − Xi ∈ O und daher n $
Xi = M −
i:=1
da
!n
i:=1 (M
n "
# X∈Y
(MX ).
(M − Xi ) ∈ A,
i:=1
− Xi ) ja offen ist.
Es sei (M, O) ein topologischer Raum und es sei X ⊆ M . Ist y ∈ M , so heißt y H¨ aufungspunkt von X, wenn f¨ ur alle U ∈ U(x) gilt, dass X ∩ (U − {y}) = ∅ ist, wenn also jede Umgebung von y noch einen von y verschiedenen Punkt von X enth¨ alt. Wir bezeichnen mit X die Menge der H¨aufungspunkte von X und nennen X die Ableitung von X. Der n¨achste Satz besagt, dass unsere Definition der abgeschlossenen Mengen, die gleichen Mengen erfasst wie die hausdorffsche Definition (Hausdorff loc. cit.) Satz 7. Es sei (M, O) ein topologischer Raum. Ist X ⊆ M , so ist X genau dann abgeschlossen, wenn X ⊆ X ist. Beweis. Es sei X abgeschlossen. Dann ist Y := M − X offen. Nach Satz 1 ist Y ∈ U(y) f¨ ur alle y ∈ Y . Wegen Y ∩ X = ∅ ist y kein H¨ aufungsspunkt von X f¨ ur alle y ∈ Y . Folglich ist X ⊆ X. Es sei X ⊆ X. Ist y ∈ M − X, so gibt es ein U ∈ U(y) mit U ⊆ M − X, da y ja kein H¨ aufungspunkt von X ist. Es gibt daher eine offen Teilmenge V von U mit y ∈ V . Wegen V ⊆ U ⊆ M − X ist M − X daher Vereinigung von offenen Mengen, also selbst offen. Somit ist X abgeschlossen. Satz 8. Ist (M, O) ein topologischer Raum mit der Eigenschaft, dass es zu zwei ur verschiedenen Punkten x, y ∈ M stets ein U ∈ U(x) gibt mit y ∈ / U , so ist X f¨ alle X ⊆ M abgeschlossen. Beweis. Nach Satz 7 gen¨ ugt es zu zeigen, dass X ⊆ X ist. Es sei also y ∈ X und V sei eine Umgebung von y. Es gibt dann eine offene Teilmenge W von V mit y ∈ W . Nach Definition ist W ∈ U(y). Weil y H¨aufungspunkt von X ist, gibt es ein x ∈ X ∩ (W − {y}). Weil W offen ist, gilt W ∈ U(x). Nach Voraussetzung gibt es ein U ∈ U(x) mit y ∈ U . Nach Satz 2 ist U ∩ W ∈ U(x). Weil x ein H¨ aufungspunkt von X ist, gibt es ein z ∈ U ∩ W ∩ X. Wegen y ∈ U folgt z ∈ W − {y} ⊆ V − {y}.
478
Kapitel XIIII. Miszellen
Also ist y ein H¨aufungspunkt von X. Also ist X ⊆ X , so dass X abgeschlossen ist. Weil hausdorffsche R¨aume eine noch sch¨arfere Trennungseigenschaft besitzen, als die in Satz 8 geforderte, gilt: Korollar. Ist (M, O) ein topologischer Raum und ist die Topologie O hausdorffsch, so ist X f¨ ur alle X ⊆ M abgeschlossen. Satz 9. Ist (M, O) ein topologischer Raum und ist X ⊆ M , so ist X ∪ X abgeschlossen. Beweis. Es sei y ∈ M −(X ∪X ). Es gibt dann ein U ∈ U(y) mit X ∩(U −{y}) = ∅. Wegen y ∈ X ist dann auch X ∩ U = ∅. Wir d¨ urfen annehmen, dass U offen ist. Dann ist auch U ∩ X = ∅, da U als offene Menge Umgebung jedes ihrer Punkte ist und somit einen Punkt von X enthielte, wenn sie einen H¨ aufungspunkt von X enthielte. Also ist y ∈ U ⊆ M − (X ∪ X ). Es folgt, dass M − (X ∪ X ) Vereinigung offener Mengen ist. Also ist M − (X ∪ X ) offen und X ∪ X damit abgeschlossen. Es sei (M, O) ein topologischer Raum. Die Teilmenge X von M heißt kom¨ pakt , wenn es zu jeder Uberdeckung Φ von X mit offenen Mengen einen endlichen Teil von Φ gibt, der X u ¨ berdeckt. Wir werden uns der u ¨blichen Namen offene ” ¨ Uberdeckung“ und endliche Teil¨ uberdeckung“ bedienen. ” Was Hausdorff zu den kompakten Mengen schreibt, werden wir Abschnitt 10 im Zusammenhang mit dem Satz von Heine-Borel kommentieren. Satz 10. Es sei (M, O) ein topologischer Raum und X sei eine Teilmenge von M . Genau dann ist X kompakt, wenn Folgendes gilt: Ist A eine Familie von abgeschlossenen Teilmengen von M und gilt X∩
"
A = ∅
A∈B
f¨ ur alle endlichen Teilfamilien B von A, so ist X∩
"
A = ∅.
A∈A
Beweis. Es sei X kompakt ! und A sei eine Familie von abgeschlossenen Teilmengen von M und es gelte X ∩ A∈A A = ∅. Wegen X∩
" A∈A
A=
"
(X ∩ A)
A∈A
5. Topologische R¨ aume
479
ist dann X =X−
"
$ X − (X ∩ A)
(X ∩ A) =
A∈A
A∈A
$ X ∩ (M − A) . = A∈A
¨ Dies zeigt, dass {M − A | A ∈ A} eine offene Uberdeckung von X ist. Weil X kompakt ist, gibt es eine endliche Teil¨ uberdeckung M − A1 , . . . , M − An von X. Es folgt n n $ $ X= X ∩ (M − Ai ) = X − (X ∩ Ai ) i:=1
=X−
i:=1 n "
(X ∩ Ai )
i:=1
!n !n und damit ∅ = i:=1 (X ∩ Ai ) = X ∩ i:=1 Ai . ¨ Um die Umkehrung zu beweisen, sei U eine offene Uberdeckung von X. Dann ist {M − U | U ∈ U} eine Familie von abgeschlossenen Teilmengen von M mit " " " X ∩ (M − U ) = X − (X ∩ U ) (M − U ) = X∩ U∈U
U∈U
=X−
$
U∈U
(X ∩ U ) = X − X = ∅.
U∈U
Also gibt es U1 , . . . , Un ∈ U, so dass X∩
n "
(M − Ui ) = ∅
i:=1
ist. Folglich ist n n " " X=X− X∩ (M − Ui ) = X − X ∩ (M − Ui ) i:=1
i:=1
n n " $ =X− X − (X ∩ Ui ) = X − X − (X ∩ Ui ) . i:=1
i:=1
#n
uberdeckung Es folgt X = i:=1 (X ∩ Ui ), so dass {U1 , . . . , Un } eine endliche Teil¨ von X ist. Somit ist X kompakt. Satz 11. Es sei (M, O) ein topologischer Raum und X sei eine kompakte Teilmenge von M . Ist Y eine Teilmenge von X und ist Y abgeschlossen, so ist Y kompakt. Beweis. Es sei A eine Familie von abgeschlossenen Mengen mit der Eigenschaft, dass jede endliche Teilfamilie von A einen nicht-leeren Schnitt mit Y habe. Dann
480
Kapitel XIIII. Miszellen
ist, weil Y abgeschlossen ist, B := {A ∩ Y | A ∈ A} eine Familie von abgeschlossenen Teilmengen von M mit der Eigenschaft, dass jede endliche Teilfamilie von B mit X einen nicht-leeren Schnitt hat. Folglich hat B nach Satz 9 einen nicht-leeren Schnitt mit X, da X ja kompakt ist. Dann hat aber A einen nicht-leeren Schnitt mit Y , so dass Y nach Satz 10 kompakt ist. Satz 12. Es sei (M, O) ein hausdorffscher Raum. Ist X eine kompakte Teilmenge von M , so ist X abgeschlossen. Beweis. Es sei z ∈ M − X. Ferner sei U die Menge der offenen Teilmengen U von M mit U ∩ X = ∅ und z ∈ Inn(M − U ). Es sei y ∈ X. Weil M hausdorffsch ist, gibt es Umgebungen U und V von y und z mit U ∩ V = ∅. Wir d¨ urfen annehmen, dass U und V offen sind. Dann ist z ∈ V ⊆ M − U und dann sogar z ∈ Inn(M − U ) (Satz 3). Also ist U ∈ U. Dies ¨ zeigt, dass U eine offene #nUberdeckung von X ist. Weil X kompakt ist, gibt es U1 , . . . , Un ∈ U mit X ⊆ i:=1 Ui . Es ist z ∈ Y :=
n "
Inn(M − Ui )
i:=1
und Y ist offen. Ferner ist z∈Y ⊆
n " i:=1
(M − Ui ) = M −
n $
Ui ⊆ M − X.
i:=1
Somit ist M − X Vereinigung offener Mengen, also selbst offen. Daher ist X abgeschlossen, Stetigkeit von Abbildungen ist eine lokale Angelegenheit. Hausdorff fasst ihre Definition nach dem Vorbild des -δ-Mechanismus, wie er zur Definition der Stetigkeit reellwertiger Funktionen benutzt wird. Dies vermerkt er ausdr¨ ucklich (Hausdorff 1914, S. 359). Es seien also (M, O) und (M , O ) zwei topologische R¨aume und f sei eine Abbildung von M in M . Ist a ∈ M , so heißt f genau dann bei a stetig, wenn es zu jedem U ∈ U(f (a)) ein V ∈ U(a) gibt mit f (V ) ⊆ U . Die Abbildung f von M in M heißt stetig auf M , wenn f in allen Punkten von M stetig ist. Der n¨ achste Satz folgt unmittelbar aus der Definition der Stetigkeit. Satz 13. Ist f eine bei a stetige Abbildung von (M, O) in (M , O ) und g eine bei f (a) stetige Abbildung von (M , O ) in (M , O ), so ist gf eine bei a stetige Abbildung von (M, O) in (M , O ). Sind f und g stetige Abbildungen von M in M bzw. von M in M , so ist gf eine stetige Abbildung von M in M . Der n¨ achste Satz steht ebenfalls schon bei Hausdorff (Hausdorff 1914, S. 361).
5. Topologische R¨ aume
481
aume. Ferner sei f eine Satz 14. Es seien (M, O) und (M , O ) topologische R¨ Abbildung von M in M und f −1 sei die durch f −1 (X) := y | y ∈ M, f (y) ∈ X definierte Abbildung der Potenzmenge von M in die von M . Dann sind die folgenden Aussagen ¨ aquivalent: 1) Die Abbildung f ist stetig. 2) F¨ ur alle X ∈ O ist f −1 (X) ∈ O. 3) F¨ ur alle X ∈ A ist f −1 (X) ∈ A. Beweis. 1) impliziert 2): Es sei f stetig auf M und X sei eine offene Teilmenge von M . Ferner sei y ∈ f −1 (X). Weil X offen ist, ist X nach Satz 1 eine Umgebung von f (y). Es gibt daher eine Umgebung U ∈ U(y) mit f (U ) ⊆ X. Es gibt dann aber auch eine offene Teilmenge V von U mit y ∈ V . Es folgt V ⊆ f −1 (X). Daher ist f −1 (X) Vereinigung offener Mengen, also selbst offen. 2) impliziert 3): Es sei X eine abgeschlossene Teilmenge von M . Dann ist M − X offen in M . Somit ist f −1 (M − X) offen in M . Wegen M − f −1 (X) = f −1 (M − X) ist f −1 (X) abgeschlossen in M . 3) impliziert 1): Es sei a ∈ M und V ∈ U(f (a). Dann enth¨ alt V eine offene Umgebung U von f (a). Dann ist M −U abgeschlossen und folglich auch f −1 (M − U ) = M − f −1 (U ). Daher ist f −1 (U ) offen in M . Wegen x ∈ f −1 (U ) ist f −1 (U ) eine Umgebung von x. Wegen f (f −1 (U )) = U ⊆ V ist f daher stetig bei a und damit stetig schlechthin. Mit Hilfe dieses Satzes beweist man sehr rasch den folgenden Satz. Satz 15. Es seien (M, O) und (M , O ) topologische R¨ aume. Ist X eine kompakte Teilmenge von M und ist f eine stetige Abbildung von M in M , so ist f (X) kompakt. ¨ Beweis. Es sei U eine offene Uberdeckung von f (X). Weil f stetig ist, folgt mit Satz 14, dass U := f −1 (V ) | V ∈ U , ¨ eine offene Uberdeckung von X ist. U besitz also eine endliche Teil¨ uberdeckung {U1 , . . . , Um } von X, da X ja kompakt ist. Dann ist aber {f (U1 ), . . . , f (Um )} ein ¨ berdeckt. Also ist auch f (X) kompakt. endlicher Teil von U der f (X) u Sehr n¨ utzlich ist der folgende Satz. Satz 16. Es seien (M, O) und (M , O ) topologische R¨ aume und S sei eine Subbasis von O . Ist f eine Abbildung von M in M so ist f genau dann stetig, wenn f −1 (S) ∈ O ist f¨ ur alle S ∈ S. Beweis. Es sei f stetig. Dann ist f −1 (S) offen in M f¨ ur alle S ∈ S, da S ja offen in M ist.
482
Kapitel XIIII. Miszellen
ur alle S ∈ S. Es seien S1 , . . . , Sn ∈ S Es sei umgekehrt f −1 (S) offen in M f¨ !n und B := i:=1 Si . Dabei sei n ≥ 1. Die Menge aller dieser B’s bilden eine Basis B von O . Es gilt, dass n " f −1 (Si ) f −1 (B) = i:=1 −1
ist, so dass f (B) als Schnitt endlich vieler offener Mengen offen # ist. Es sei nun V eine offene Menge von M . Es gibt dann ein X ⊆ B mit V = B∈X B. Es folgt $ f −1 (V ) = f −1 (B), B∈X
so dass auch f −1 (V ) offen ist. Also ist f stetig. Es sei M eine Menge und ((Mi , Oi ) | i ∈ I) sei eine Familie von topologischen R¨aumen. Ferner sei zu jedem i ∈ I eine nicht leere Menge Fi von Abbildungen von M in Mi gegeben. # Es stellt sich die Frage, ob es eine Topologie O von M gibt, so dass jedes f ∈ i∈I Fi stetig ist. Eine solche Topologie ist schnell gefunden, n¨ amlich die so genannte diskrete Topologie O := P(M ), in der alle Mengen offen sind. Kann man weniger verschwenderisch vorgehen? Man kann. Oi . Wegen Mi ∈ Oi ist Es sei S die Menge der f −1 (X) mit f ∈ Fi und X ∈ # dann M ∈ O, da Fi nicht leer ist. Hieraus folgt, dass M = S∈S S ist. Nach Satz 4 ist S daher Subbasis einer Topologie O auf M . Alle anderen Topologien auf M , in # denen alle Abildungen aus i∈I Fi stetig sind, umfassen dieses O. Sparsamer als mit diesem O geht es also nicht. Diese Idee nutzen wir nun, um den Produktraum topologischer R¨ aume zu definieren. Zuvor noch eine Definition. ober als O und Sind O und O zwei Topologien auf der Menge M , so heißt O gr¨ O feiner als O, wenn O ⊆ O ist. Es sei ((Mi , Oi ) | i ∈ I) eine nicht leere Familie von nicht leeren topologischen R¨aumen. Ferner sei M := carti∈I Mi das cartesische Produkt der Mi . Gilt das Auswahlaxiom, so ist M nicht leer. Wir werden sp¨ ater nur endliche Indexmengen betrachten, wo man durch Induktion zeigen kann, dass das cartesische Produkt nicht leer ist. Unsere sp¨ ateren S¨atze werden daher nicht davon ber¨ uhrt, ob wir die G¨ ultigkeit des Auswahlaxiom voraussetzen oder nicht. Wir nehmen hier also an, dass es gilt. F¨ ur i ∈ I definieren wir die Projektion πi von M auf den i-ten Koordinatenraum Mi durch πi (f ) := fi f¨ ur alle f ∈ M . Ist dann O die gr¨ obste Topologie, in der alle πi stetig sind, so heißt O die Produkttopologie auf M und (M, O) ist der Produktraum der Familie ((Mi , Oi ) | i ∈ I). Ist I = {1, . . . , n}, so besteht die Subbasis, die die Produkttopologie erzeugt, aus den Mengen der Form M1 × . . . × Mi−1 × Xi × Mi+1 × . . . × Mn mit Xi ∈ Oi . Die zugeh¨ orige Basis besteht aus allen Mengen der Form X1 × . . . × Xn
5. Topologische R¨ aume
483
ur alle i. mit Xi ∈ Oi f¨ Auf Produktr¨ aume werden wir gleich zur¨ uckkommen. Es sei M eine Menge und μ sei eine Abbildung von M × M in R. Man nennt μ eine Metrik auf M , falls gilt: 1) 2) 3) 4)
Es Es Es Es
ist ist ist ist
μ(x, x) = 0 f¨ ur alle x ∈ M . μ(x, y) > 0 f¨ ur alle x, y ∈ M mit x = y. μ(x, y) = μ(y, x) f¨ ur alle x, y ∈ M . μ(x, y) ≤ μ(x, z) + μ(z, y) f¨ ur alle x, y, z ∈ M .
Die Ungleichung 4) wird Dreiecksungleichung genannt. Es sei (M, μ) ein metrischer Raum. Ist 0 < ∈ R und x ∈ M , so setzen wir U (x) := y | y ∈ M, μ(x, y) < und nennen U (x) eine -Umgebung von x. Wegen μ(x, x) = 0 gilt stets x ∈ U (x). Satz 17. Ist (M, μ) ein metrischer Raum, so ist B := U (x) | x ∈ M, 0 < ∈ R Basis einer hausdorffschen Topologie Oμ auf M . # Beweis. Wegen x ∈ U (x) gilt M = B∈B B. Es seien X, Y ∈ B und es sei z ∈ X ∩ Y . Es gibt dann x, y ∈ M und positive reelle Zahlen und mit X = U (x) und Y = U (y). Setze η := min( −μ(x, z), − μ(z, y)). Dann ist η > 0, da ja μ(x, z) < und μ(z, y) < ist. Ist w ∈ Uη (z), so folgt mit Hilfe der Dreiecksungleichung μ(w, x) ≤ μ(w, z) + μ(z, x) < η + μ(z, x) ≤ , μ(w, y) ≤ μ(w, z) + μ(z, y) < η + μ(z, y) ≤ . Also ist w ∈ U (x) ∩ U (y) = X ∩ Y , dh., es gilt z ∈ Uη (z) ⊆ X ∩ Y . Mit Satz 4 folgt, dass B Basis einer Topologie O ist. Es seien x und y zwei verschiedene Elemente aus M . Ist := μ(x, y), so ist > 0. Mit Hilfe der Dreiecksungleichung folgt U/2 (x) ∩ U/2 (y) = ∅. Damit ist alles bewiesen. Die u ¨ bliche Topologie auf R ist die, die verm¨oge Satz 16 und der durch μ(x, y) := |x − y| definierten Metrik definiert wird. Satz 18. Ist (M, μ) ein metrischer Raum, so ist μ(a, b) − μ(b, c) ≤ μ(a, c)
484
Kapitel XIIII. Miszellen
f¨ ur alle a, b, c ∈ M . Beweis. Auf Grund der Dreiecksungleichung und der Symmetrie von Metriken gilt μ(a, b) ≤ μ(a, c) + μ(c, b) = μ(a, c) + μ(b, c) und μ(b, c) ≤ μ(b, a) + μ(a, c) = μ(a, b) + μ(a, c). Hieraus folgt die Behauptung. Satz 19. Ist (M, μ) ein metrischer Raum und versieht man M × M mit der Produkttopologie von Oμ mit Oμ , so ist μ eine stetige Abbildung von M × M in R. Beweis. Es sei X eine offene Teilmenge von R. Ferner sei Y := μ−1 (X). Wir m¨ ussen zeigen, dass Y offen ist. Dazu sei (a, b) ∈ Y . Weil X offen ist, gibt es eine -Umgebung U (μ(a, b)), die in X enthalten ist. Es folgt μ−1 U (μ(a, b)) ⊆ Y. Wir setzen U := U/2 (a) und V := U/2 (b). Dann ist U × V = (U × M ) ∩ (M × V ), so dass U × V offen in der Produkttopologie von M × M ist, da ja U × M und M × V Elemente der Subbasis sind, die die Produkttopologie erzeugt. Es sei (x, y) ∈ U × V . Dann folgt auf Grund der Dreiecksungleichung und wegen Satz 18, dass μ(x, y) − μ(a, b) ≤ μ(x, y) − μ(y, a) + μ(y, a) − μ(a, b) ≤ μ(x, a) + μ(y, b) < ist. Also ist μ(x, y) ∈ U (μ((a, b))) Es folgt (a, b) ∈ U × V ⊆ μ−1 U (μ(a, b)) ⊆ Y. Dies zeigt, dass die Menge Y Umgebung jedes ihrer Punkte ist. Nach Satz 1 ist Y daher offen, q. e. d. Es sei (M, O) ein topologischer Raum und X sei eine Teilmenge von M . Wir setzen OX := {Y | Y ⊆ X, es gibt ein Y ∈ O mit Y = Y ∩ X}. Dann heißt OX die von O auf X hervorgerufene Relativtopologie Es ist schnell gesehen, dass OX eine Topologie ist: Wegen X = X ∩ M und ∅ = ∅ ∩ X und M , ∅ ∈ O sind X, ∅ ∈ OX .
5. Topologische R¨ aume
485
Sind Y , Z ∈ OX , so gibt es Y , Z ∈ O mit Y = Y ∩ X und Z = Z ∩ X. Es folgt Y ∩ Z ∈ O und damit Y ∩ Z = (Y ∩ X) ∩ (Z ∩ X) = X ∩ (Y ∩ Z ) ∈ OX . Schließlich sei T ⊆ OX und T die Menge der Y ∈ O, zu denen es ein Y ∈ OX gibt mit Y = X ∩ Y . Dann ist $ $ $ X∩ Y = (X ∩ Y ) ⊆ Y. Y ∈T
Y ∈T
Y ∈T
Ist Y ∈ T , so gibt es nat¨ urlich ein Y ∈ O mit Y = X ∩ Y . Es folgt Y ∈ T und damit $ $ $ X∩ Y = (X ∩ Y ) ⊇ Y. #
Y ∈T
Y ∈T
Y ∈T
Dies zeigt, dass auch Y ∈T Y ∈ OX ist. Damit ist gezeigt, dass OX tats¨achlich eine Topologie auf X ist. Wie schon gesagt, kommen die W¨orter Topologie“ und topologischer Raum“ ” ” in Hausdorffs Buch nicht vor und offene Mengen heißen bei ihm Gebiete. Es gibt aber bei ihm den Begriff des Relativgebiets. Das sind, wie auch bei uns, die Schnitte von Gebieten mit Teilmengen von M (Hausdorff 1914, S. 240). Wenn es auch nicht alle Termini gibt, die wir kennen und benutzen, die Sache ist da. aume und f sei eine stetige Satz 20. Es seien (M, O) und (M , O ) topologische R¨ ankung Abbildung von M in M . Ist X eine Teilmenge von M und ist g die Einschr¨ von f auf X, so ist g eine stetige Abbildung von (X, OX ) in (M , O ). Beweis. Es sei U ∈ O . Dann ist g −1 (U ) = X ∩ f −1 (U ). Weil f stetig ist, ist f (U ) ∈ O. Also ist g −1 (U ) ∈ OX . aumen. Satz 21. Es sei ((Mi , μi ) | i := 1, . . . , n) eine Familie von metrischen R¨ oge Ist M := cartni:=1 Mi und definiert man die Abbildung μ von M × M in R verm¨ μ(x, y) := max μi (xi yi ) | i := 1, . . . , n , so ist μ eine Metrik auf M und Oμ ist die Produkttopologie auf M . Beweis. Wir zeigen zun¨achst, dass μ eine Metrik ist. Es ist μ(x, x) = 0i f¨ ur alle x ∈ M , da ja μi (xi , xi ) = 0 ist f¨ ur alle i und alle xi ∈ Mi . Ist x = y, so gibt es ein i mit xi = yi . Es folgt μ(x, y) > μi (xi , yi ) > 0. Wegen der Symmetrie der μi ist auch μ symmetrisch. Schließlich gilt μ(x, z) + μ(z, y) = maxi μi (xi , zi ) + maxj μj (zj , yj ) ≥ maxi μi (xi , zi ) + μi (zi , y, ) ≥ maxi μi (xi , yi ) = μ(x, y).
486
Kapitel XIIII. Miszellen
Also ist μ eine Metrik. Es sei O die Produkttopologie auf M und B sei die Basis von O, die aus den Elementen der Form X1 × . . . × Xn mit Xi ∈ Oμi besteht. Ist nun X ∈ O und y ∈ X, so gibt es x1 , . . . , xn mit Xi ∈ Oμi und y ∈ X1 × . . . × Xn ⊆ X. Es gibt dann positive i mit Ui (yi ) ⊆ Xi . Setze := min( 1 , . . . , n ). Dann ist > 0 und es folgt U (yi ) ⊆ Xi und damit U (y) = U (y1 ) × . . . × U (yn ) ⊆ X1 × . . . × Xn ⊆ X. Also ist X ∈ Oμ und damit O ⊆ Oμ . Es sei umgekehrt X ∈ Oμ und y ∈ X. Es gibt dann ein > 0 mit U (y) ⊆ X. Wegen U (y) = U (y1 ) × . . . × U (yn ) ist U (y) ein Element der Basis, die O erzeugt. Hieraus folgt X ∈ O, da y ja ein beliebiges Element von X war. Also gilt auch Om u ⊆ O, so dass O = Oμ ist, q. o. o. Im n¨achsten Satz notieren wir noch drei lokale Eigenschaften stetiger Abbildungen von topologischen R¨ aumen in R oder C. Satz 22. Es sei M ein topologischer Raum und K = R oder K = C. Ist die Abbildung f von M in K stetig bei a ∈ M so gilt: a) Es gibt ein S ∈ R und ein U ∈ U(a) mit |f (y)| ≤ S f¨ ur alle y ∈ U . b) Ist f (a) = 0, so gibt es ein U ∈ U(a) und ein η > 0 mit |f (y)| ≥ η f¨ ur alle y ∈ U. c) Ist K = R und f (a) > 0, so gibt es ein U ∈ U(a) und ein η > 0 mit f (y) ≥ η f¨ ur alle y ∈ U . ur alle Beweis. Es sei > 0. Es gibt dann ein U ∈ U(a) mit f (y) ∈ U (f (a)) f¨ y ∈ U , da f ja bei a stetig ist. Es folgt |f (y)| − |f (a)| ≤ f (y) − f (a) < (∗) f¨ ur alle y ∈ U . a) Setzt man S := + |f (a)|, so folgt f (y) ≤ + f (a) = S f¨ ur alle y ∈ U . b) Hier w¨ ahlen wir :=
f (a) 2 .
−
Wegen (∗) gilt dann
|f (a)| ≤ f (y) − f (a) 2
6. Topologische Vektorr¨ aume und daher |f (y)| ≥
|f (a)| 2
c) Hier setze man := f¨ ur alle y ∈ U .
487
f¨ ur alle y ∈ U . f (a) 2 .
Wegen − f (a) 2 ≤ f (y) − f (a) ist daher f (y) ≥
f (a) 2
6. Topologische Vektorr¨ aume. Es sei K ein K¨ orper und O sei eine Topologie auf K. Ferner seien A und M die durch A(x, y) := x + y und M (x, y) := xy definierten Abbildungen von K ×K in K und I sei die durch I(x) := x−1 definierte orper , falls Abbildung von K ∗ in sich. Genau dann heißt (K, O) topologischer K¨ die Abbildungen A und M in der Produkttopologie auf K × K und I in der Relativtopologie auf K ∗ stetig sind. Dass R und C topologische K¨ orper sind, werden wir im n¨ achsten Abschnitt zeigen, wenn wir auch zeigen, dass die henselschen p-adischen Zahlen topologische K¨ orper sind. Hier k¨ ummern wir uns um topologische Vektorr¨ aume, wenn dies auch zun¨ achst blutleere Theorie ist. Das wird sich ¨andern. Der Grund, weshalb ich mit den Vektorr¨ aumen beginne, ist der, das, was ich hier vortrage, von allem Metrischen freizuhalten. Es sei K ein topologischer K¨ orper und V sei ein Vektorraum u ¨ ber K, der gleichzeitig eine Topologie trage. V ×V und K ×V seien jeweils mit der Produkttopologie versehen. Wir nennen V einen topologischen Vektorraum u ¨ ber K, wenn die beiden Abbildungen (x, y) → x + y und (k, x) → kx in den jeweiligen Topologien stetig sind. Satz 1. Es sei V ein topologischer Vektorraum u ¨ber dem topologischen K¨ orper K. Ferner sei a ∈ V und k ∈ K. Dann gilt: 1) Die Abbildung x → x + a von V auf sich ist stetig. 2) Die Abbildung x → kx von V in sich ist stetig. 3) Die Abbildung ξ → ξa von K in V ist stetig. Beweis. 1) Die Abbildung x → (x, a) ist eine stetige Abbildung von V in V ×{a} (Beweis!). Die Abbildung (x, a) → x + a ist als Einschr¨ankung der stetigen Abbildung (x, y) → x + y auf V × {a} nach Satz 20 des vorigen Abschnitts ebenfalls stetig. Daher ist auch die aus diesen beiden Abbildungen zusamengesetzte Abbildung nach Satz 13 des vorigen Abschnitts stetig. 2) Die Abbildungen x → (k, x) und (k, x) → kx sind stetig. Also ist auch x → kx stetig. 3) Die Abbildungen ξ → (ξ, a) und (ξ, a) → ξa sind stetig. Also ist auch die Abbildung ξ → ξa stetig. Korollar 1. Es sei V ein topologischer Vektorraum u ¨ber dem topologischen K¨ orper K. Ferner sei a ∈ V und k ∈ K ∗ . Ist U eine nicht leere offene Teilmenge von V , so sind auch die Teilmengen U + a und kU offen. Beweis. Die Abbildung x → x − a und x → k −1 x sind stetig nach dem gerade bewiesenen Satz. Die Urbilder der offenen Menge U unter diesen Abbildungen, das sind die Mengen U + a und kU , sind also offen.
488
Kapitel XIIII. Miszellen
Hier beobachtet man das Ph¨ anomen, dass es stetige Abbildungen gibt, die die Eigenschaft haben, offene Mengen auf offene Mengen abzubilden. Dieses Ph¨anomen gibt Anlass zu folgender Definition. Eine Abbildung f von M in N heißt offen, wenn es zu jeder offenen Menge X von M eine offene Menge Y von N gibt, so dass f (X) = Y ∩ f (M ) ∈ Of (M) ist. Stetige Abbildungen sind in aller Regel nicht auch offen. Eine stetige Abbildung ist aber sicher dann offen, wenn sie, so wie eben, ein stetiges Inverses hat. Weitere Beispiele offener Abbildungen sind die Projektionen topologischer Vektorr¨aume, das sind die linearen Abbildungen π mit π 2 = π. Korollar 2. Ist U eine nicht leere offene Teilmenge des topologischen Vektorraums V und ist X eine beliebige, nicht leere Teilmenge von V , so ist U + X offen. # Beweis. Dies folgt mit U + X = a∈X (U + a) aus Korollar 1. Vektorraumes V und ist Korollar 3. Sind x1 , . . . , xt Elemente t des topologischen t ur i := 1, . . . , t, so ist i:=1 Ui ∈ U( i:=1 xi ). Ui ∈ U(xi ) f¨ Beweis. Es gibt eine offene Umgebung U ∈ U(x1 ) mit U ⊆ U1 . Es folgt t
xi ∈ U +
i:=1
t
Ui ⊆
i:=2
und damit die Behauptung, da U +
t i:=2
t
Ui
i:=1
Ui ja offen ist.
Satz 2.Es sei V ein topologischer Vektorraum. Sind x1 , . . . , xt ∈ V und ist U ∈ U( ti:=1 xi ), so gibt es Ui ∈ U(xi ) mit ti:=1 Ui ⊆ U . Beweis. Wir machen Induktion nach t. Es sei zun¨achst t = 2. Weil V ein topologischer Vektorraum ist, gibt es wegen der Stetigkeit der Abbildung (x, y) → x + y ur alle (x, y) ∈ X. eine Umgebung X von (x1 , x2 ) in V × V mit x + y ∈ U f¨ Auf Grund der Definition der Produkttopologie gibt es ein U1 ∈ U(x1 ) und ein U2 ∈ U(x2 ) mit U1 × U2 ⊆ X. Es folgt U1 + U2 ⊆ U . Es sei t > 2. Nach dem gerade Gezeigten gibt es eine Umgebung W von x1 + . . . + xt−1 und eine Umgebung Ut von xt , so dass W + Ut eine Umgebung von t i:=1 xi ist. Mit Induktion folgt dann die Behauptung. Es sei V ein Vektorraum u ¨ ber dem topologischen K¨ orper K und b1 , . . . , bn sei eine Basis von V . Wir definieren die Abbildungen πi von V in K durch πi
n
kj bj
:= ki .
j:=1
Ist dann O die gr¨ obste Topologie auf V , in der alle πi stetig sind, so nennen wir O eine Produkttopologie auf V . Es sieht so aus, als tr¨ uge V viele Produkttopologien, da ja jede Basis Anlass zu einer Produkttopologie gibt. Wir werden jedoch gleich
6. Topologische Vektorr¨ aume
489
sehen, dass endlich-dimensionale Vektorr¨aume u ¨ ber K genau eine Produkttopologie tragen. Satz 3. Es sei K ein topologischer K¨ orper und V sei ein endlich-dimensionaler Vektorraum u ¨ber K. Es sei O∗ eine Topologie auf V , so dass (V, O∗ ) ein topologischer Vektorraum u ¨ber K ist, und O∗∗ sei eine Topologie auf V , in der alle linearen Abbildungen von V in K stetig sind. Ist dann O eine Produkttopologie auf V , so ist O∗ ⊆ O ⊆ O∗∗ . Beweis. Es sei b1 , . . . , bn die Basis von V , mit deren Hilfe O konstruiert wurde. Die zugeh¨origen Abbildungen πi sind dann lineare Abbildungen von V in K, so obste Topologie ist, in der die πi dass sie allesamt in O∗∗ stetig sind. Weil O die gr¨ stetig sind, gilt O ⊆ O∗∗ . n Es sei U ∈ O∗ und x ∈ U . Ferner sei x = i:=1 ki bi . Weil (V, O∗ ) ein topologischer Vektorraum u ¨ ber K ist, gibt es nach Satz 2 Umgebungen Ui ∈ U(ki bi ) mit n U ⊆ U , da U ja als offene Menge Umgebung von x ist (Satz 1, Absch. 5). i i:=1 Die Abbildung ξ → ξbi ist stetig, wie wir wissen. Es gibt also ein Wi ∈ U(ki ) mit ξbi ∈ Ui f¨ ur alle ξ ∈ Wi . Es folgt x∈
n " i:=1
πi−1 (Wi ) ⊆
n
Ui ⊆ U.
i:=1
!n Weil i:=1 πi−1 (Wi ) eine O-offene Menge ist, ist U Vereinigung von O-offen Mengen also selbst O-offen. Also ist O∗ ⊆ O. Damit ist der Satz bewiesen. Satz 4. Es sei M ein topologischer Raum und V sei ein topologischer Vektorraum u ¨ber dem topologischen K¨ orper K. Ist C(M, V ) die Menge der stetigen Abbildungen von M in W und definiert man f¨ ur k ∈ K und f , g ∈ C(M, V ) die Abbildungen f + g und kf durch (f + g)(x) := f (x) + g(x) und (kf )(x) := k(f (x)) f¨ ur alle x ∈ M , so ist f + g, kf ∈ C(M, V ). Beweis. Es sei U ∈ U((f + g)(x)). Nach Satz 2 gibt es ein U ∈ U(f (x)) und ein U ∈ U(g(x)) mit U + U ⊆ U , da ja (f + g)(x) = f (x) + g(x) ist. Wegen der Stetigkeit von f und g gibt es X , X ∈ U(x) mit f (X ) ⊆ U und g(X ) ∈ U . Nun ist X ∩ X ∈ U(x) und (f + g)(X ∩ X ) ⊆ f (X ∩ X ) + g(X ∩ X ) ⊆ f (X ) + g(X ) ⊆ U + U ⊆ U. Also ist f + g stetig. Ist k = 0, so ist kf = 0, so dass kf stetig ist. Es sei also k = 0. Ferner sei U ∈ U(kf (x)). Mit Korollar 1 von Satz 1 folgt, dass k −1 U ∈ U(f (x)) ist. Wegen der Stetigkeit von f gibt es ein X ∈ U(x) mit f (X) ⊆ k −1 U . Es folgt kf (X) ⊆ U und damit die Stetigkeit von kf . Damit ist alles bewiesen. Satz 5. Es sei K ein topologischer K¨ orper und V sei ein endlich-dimensionaler Vektorraum u ¨ber K. Ist O eine Produkttopologie auf V , so ist (V, O) ein topologischer Vektorraum und alle linearen Abbildungen von V in K sind stetig.
490
Kapitel XIIII. Miszellen
Beweis. Es sei b1 , . . . , bn die Basis von V , mit deren Hilfe O konstruiert wurde. Ferner seien πi wieder die durch πi
n
kj bj
:= ki
j:=1
definierten Abbildungen. Diese πi sind allesamt stetig. Es sei x ∈ V und λ sei eine lineare Abbildung von V in K. Dann ist x=
n
πi (x)bi
i:=1
und daher λ(x) =
n
πi (x)λ(bi ).
i:=1
Hieraus folgt wiederum λ=
n
λ(bi )πi ,
i:=1
so dass λ auf Grund von Satz 4 stetig ist. Es bleibt zu zeigen, dass (V, O) ein topologischer Vektorraum u ¨ ber K ist. Es sei (a, b) ∈ V × V und U ∈ U(a + b). Auf Grund der Definition der Produkttopologie auf V gibt es dann Ui ∈ U(πi (a + b)) mit n "
πi−1 (Ui ) ⊆ U.
i:=1
Weil K ein topologischer K¨ orper ist, ist K insbesondere ein topologischer Vektorraum u ¨ ber sich selbst. Wegen πi (a + b) = πi (a) + πi (b) gibt es nach Satz 2 ein Xi ∈ U(πi (a)) und ein Yi ∈ U(πi (b)) mit Xi + Yi ⊆ Ui . ist x ∈ πi−1 (Xi ) und y ∈ πi−1 (Yi ), so ist πi (x + y) = πi (x) + πi (y) ∈ Xi + Yi ⊆ Ui . Daher ist πi−1 (Xi ) + πi−1 (Yi ) ⊆ πi−1 (Ui ). Nun ist A :=
n "
πi−1 (Xi ) ×
i:=1
n "
πi−1 (Yi ) ∈ U(a, b).
i:=1
Ist (x, y) ∈ A, so ist also (x, y) ∈
n " i:=1
πi−1 (Xi ) +
n " i:=1
πi−1 (Yi ) ⊆
n " i:=1
πi−1 (Ui ) ⊆ U,
6. Topologische Vektorr¨ aume
491
so dass die Abbildung (x, y) → x + y stetig ist. Es sei schließlich (k, a) ∈ K ×V und U ∈ U(ka). Es gibt dann ein Ui ∈ U(πi (ka)) mit n " πl−1 (Ui ) ⊆ U. i:=1
orper ist, gibt es ein Xi ∈ U(k) Nun ist πi (ka) = kπi (a). Weil K ein topologischer K¨ und ein Yi ∈ U(πi (a)) mit ξη ∈ Ui f¨ ur alle (ξ, η) ∈ Xi × Yi . Es ist X :=
n "
Xi ∈ U(k).
i:=1
Daher ist B := X ×
n "
πi−1 (Xi ) ⊆ U(k, a).
i:=1
Ist (ξ, x) ∈ B, so ist ξx ∈
n " i:=1
Xπi−1 (Xi ) =
n $ i:=1
π −1 (XXi ) ⊆
n "
π −1 (Ui ) ⊆ U.
i:=1
Also ist auch die Abbildung (ξ, x) → ξx stetig. Damit ist alles bewiesen. Der n¨achste Satz geh¨ort der mathematischen Folklore an. Das best¨ atigten mir verschiedene Leute, die ich danach fragte. F¨ ur den Fall, dass K = R ist, fand ich ihn in Greub 1967, S. 38. Den gleichen Sachverhalt f¨ ur den K¨ orper der komplexen ¨ Zahlen zu beweisen, findet sich dort als Ubungsaufgabe. F¨ ur komplette K¨ orper mit Absolutbetrag findet sich der Satz bei Lang formuliert und bewiesen (Lang 1965, Prop. 3, S. 288). F¨ ur K¨ orper mit Absolutbetrag trug ich ihn in meiner Analysisvorlesung des WS 1978/79 vor. Als ich dann das Buch schrieb, bestand die so fr¨ uh verstorbene Rosemarie Rink darauf — sie war damals Mitarbeiterin hier in Kaiserslautern und die erste Frau, die sich an der hiesigen Universit¨ at habilitierte —, dass ich den Satz in voller Allgemeinheit aufnehme. So scheint mein Analysisbuch ein einsames schriftliches Zeugnis f¨ ur diesen Satz zu sein (L¨ uneburg 1981a, S. 135). Satz 6. Es sei K ein topologischer K¨ orper. Ist V ein endlich-dimensionaler Vektorraum u ¨ber K, so besitzt V genau eine Topologie O mit den beiden Eigenschaften: 1) (V, O) ist ein topologischer Vektorraum u ¨ber K. 2) Jede lineare Abbildung von V in K ist O-stetig. Beweis. Es sei O eine Produkttopologie auf V . Dann besitzt O nach Satz 5 diese beiden Eigenschaften. Ist O∗ eine zweite Topologie mit diesen beiden Eigenschaften, so folgt mit Satz 3 auf Grund von Eigenschaft 1) die Inklusion O∗ ⊆ O und wegen Eigenschaft 2) die Inklusion O ⊆ O∗ . Also ist O = O∗ , wie behauptet.
492
Kapitel XIIII. Miszellen
Die in Satz 6 beschriebene Topologie nennen wir die nat¨ urliche Topologie auf V und bezeichnen sie mit Onat . Satz 6 gilt nicht mehr f¨ ur unendlich-dimensionale R¨ aume. Davon lebt die Funktionalanalysis. 7. Das henselsche Lemma. Um die endlichen Erweiterungen der henselschen p-adischen Zahlen zu studieren und insbesondere den schon von Hensel bewiesenen Satz zu etablieren, dass der Zerf¨ allungsk¨ orper eines Polynoms u ¨ ber Qp sich schon als Zerf¨ allungsk¨ orper u ¨ ber Qp eines Polynoms mit Koeffizienten in Z erhalten l¨ asst, ist es bequem, sich des topologischen Werkzeugs zu bedienen, das wir in den letzten beiden Abschnitten bereitgestellt haben. Dazu m¨ ussen wir zun¨achst zeigen, dass orper ist. Dies liegt daran, dass Qp einen Absolutbetrag Qp ein topologischer K¨ achst besitzt. Das hat Qp mit R und C gemeinsam. Wir befassen uns hier daher zun¨ etwas allgemeiner mit K¨ orpern mit Absolutbetrag. Es sei K ein K¨ orper und α sei eine Abbildung von K in R. Wir nennen α einen Absolutbetrag auf K, wenn gilt: 1) 2) 3) 4)
Es Es Es Es
ist α(0) = 0 und α(k) > 0 f¨ ur alle k ∈ K ∗ . ist α(kl) = α(k)α(l) f¨ ur alle k, l ∈ K. ist α(k + l) ≤ α(k) + α(l) f¨ ur alle k, l ∈ K. gibt ein k ∈ K mit α(k) = 0, 1.
Die Ungleichung 3) heißt bekanntlich Dreiecksungleichung. Die Bedingung 4) dient dazu, Entartungsf¨ alle auszuschließen. Typische Beispiele f¨ ur K¨ orper mit Absolutbetrag sind R und C. Dem Leser wird es nicht schwer fallen, den folgenden Satz zu beweisen. Satz 1. Es sei α ein Absolutbetrag auf dem K¨ orper K. Dann gilt: 1) 2) 3) 4)
Es Es Es Es
ist ist ist ist
α(1) = 1. α(k) = α(−k) f¨ ur alle k ∈ K. α(k −1 ) = α(k)−1 f¨ ur alle k ∈ K ∗ . |α(k) − α(l)| ≤ min(α(k + l), α(k − l)) f¨ ur alle k, l ∈ K.
Ist K ein K¨ orper mit Absolutbetrag α, so wird durch μ(k, l) := α(k − l) eine Metrik auf K definiert. Statt Oμ schreiben wir in diesem Zusammenhang Oα f¨ ur die von μ und damit von α induzierte Topologie auf K. Satz 2. Ist α ein Absolutbetrag auf dem K¨ orper K, so ist (K, Oα ) ein topologischer K¨ orper. Beweis. Nach 4) von Satz 1 gilt |α(x) − α(y)| ≤ α(x − y). Hieraus folgt, dass α stetig ist. Wir definieren die Abbildung μ von K × K in R verm¨oge μ (x, y), (a, b) := max α(x − a), α(y − b) . Dann ist μ nach Satz 21 von Abschnitt 5 eine Metrik auf K × K und die von μ hervorgerufene Topologie ist die Produkttopologie.
7. Das henselsche Lemma
493
Es seien wieder A, M und I die durch A(x, y) := x + y, M (x, y) := xy und I(x) := x−1 definierten Abbildungen. Es sei (a, b) ∈ K × K und es sei > 0 und (x, y) ∈ U/2 (a, b). Dann ist max α(x − a), α(y − b) = μ (x, y), (a, b) < 2 und folglich α(x − a) < 2 und α(y − b) < 2 . Es folgt α A(x, y) − A(a, b) = α(x + y − a − b) ≤ α(x − a) + α(y − b) < , so dass A bei (a, b) stetig ist. Weil (a, b) beliebig gew¨ ahlt war, ist A also stetig schlechthin. Es sei weiterhin (a, b) ∈ K × K und > 0. Weil α stetig ist, gibt es nach Satz 22 a) von Abschnitt 5 ein S ∈ R mit S > 0 und eine Umgebung U von a mit α(x) ≤ S f¨ ur alle x ∈ U . Setze T := max(S, α(b)). Wegen S > 0 ist T > 0. Setze δ := 2T und V := (U × K) ∩ Uδ (a, b). Weil U als Umgebung von a eine offene Umgebung von a enth¨ alt, enth¨ alt V auf Grund der Definition der Produkttopologie eine offene Ungebung von (a, b). Also ist V eine Umgebung von (a, b). Es sei nun (x, y) ∈ V . Dann ist (x, y) ∈ Uδ (a, b) und folglich α(x − a) < δ und α(y − b) < δ. Wegen x ∈ U ist ferner α(x) ≤ T . Daher ist α(xy − ab) = α(xy − xb + xb − ab) ≤ α(x)α(y − b) + α(b)α(x − a) < 2T δ = . Folglich ist auch M stetig. Es sei schließlich a ∈ L∗ . Wegen α(xa) − α(ya) = α(x − y)α(a) ist die Abbildung x → α(xa) stetig. Wegen α(a2 ) > 0 gibt es nach Satz 13 c) von Abschnitt 5 ein U ∈ U(a) und ein η > 0 mit α(xa) ≥ η f¨ ur alle x ∈ U . Es sei > 0 und V := U ∩ Uη (a). Ist dann x ∈ V , so ist α(x−1 − a−1 ) = α(xa)−1 α(a − x) < η −1 η = , so dass auch I stetig ist. Also ist (K, Oα ) ein topologischer K¨ orper. orper Es bezeichne Qp und Hp , wie in Abschnitt 1 von Kapitel 10, den K¨ der henselschen p-adischen Zahlen, bzw., den Ring der ganzen henselschen padischen Zahlen. Diesen Ring hatten wir definiert als den Endomorphismenring der Pr¨ ufergruppe Z(p∞ ). Wir hatten dort gesehen, dass es zu α ∈ Hp stets genau eine Folge f mit Werten in N0 gibt mit 0 ≤ fi < pi und α(ai ) = fi ai
494
Kapitel XIIII. Miszellen
f¨ ur alle i ∈ N, wobei ai =
1 +Z pi
gesetzt war. F¨ ur diese Folge f gilt außerdem fi+1 ≡ fi mod pi f¨ ur alle i ∈ N. Stellt man die fi in der Basis p, also p-adisch dar, so folgt auf Grund dieser Kongruenzen die Existenz einer Folge ϕ auf {0, . . . , p − 1} mit fi =
i−1
ϕj pj
j:=0
f¨ ur alle i ∈ N. Daher sind die fi die Partialsummen der Reihe ∞
ϕj pj .
j:=0
Da diese Reihe durch α v¨ ollig fest gelegt wird und ihrerseits ∞ α eindeutig bestimmt, kann man α mit dieser Reihe identifizieren, also α = j:=0 ϕj pj schreiben, wie auch dem Ausdruck α = limi→∞ fi einen Sinn unterlegen, auch ohne dass man explizit eine Topologie gegeben hat und folglich von Konvergenz im Sinne dieser Topologie reden kann. Wir werden uns des Hilfsmittels der Topologie aber nicht begeben. Hensel definiert seine p-adischen Zahlen mittels dieser formalen Ausdr¨ ucke. Wir identifizieren im Folgenden das Element z ∈ Z mit dem Element z · 1 ∈ Hp . Dann wird insbesondere p mit dem Primelement π von Hp identifiziert, welches wir in Kap. 10, Absch. 1 definiert haben. Ist 0 = b ∈ Qp , so gibt es dann ein n ∈ Z und eine Einheit e in Hp mit b = pn e. Wir setzen n 1 αp (b) := p und außerdem αp (0) := 0. Statt 1p k¨ onnte man f¨ ur das Folgende jede andere Zahl zwischen 0 und 1 nehmen. Unsere Wahl hat f¨ ur die Zahlentheorie Vorteile, insbesondere, wenn man mehrer der Hp ’s nebeneinander untersucht. Worin der Vorteil besteht, bleibe hier offen. Satz 3. Es gilt: 1) Es ist αp (0) = 0 und αp (b) > 0, falls b = 0 ist. ur alle b, c ∈ Qp . 2) Es ist αp (bc) = αp (b)αp (c) f¨
7. Das henselsche Lemma
495
ur alle b, c ∈ Qp . Ist αp (b) = αp (c), so 3) Es ist αp (b + c) ≤ max(αp (b), αp (c)) f¨ ist αp (b + c) = max(αp (b), αp (c)). 4) Es ist αp (p) = p1 . 5) Ist a ∈ Qp , so ist genau dann a ∈ Hp , wenn αp (a) ≤ 1 ist. 6) Ist a ∈ Qp , so ist genau dann a ∈ pHp , wenn αp (a) < 1 ist. Beweis. 1) ist trivial. 2) folgt aus der Bemerkung, dass das Produkt zweier Einheiten von Hp wieder eine Einheit von Hp ist. 4) ist ebenfalls trivial und 5) und 6) folgen unmittelbar aus der Definition des Absolutbetrags. Bleibt also 3) zu beweisen. Ist b = 0 oder c = 0 oder auch b + c = 0, so ist die Ungleichung erf¨ ullt. Es seien also b, c und b + c von 0 verschieden. Ferner sei b = pm e und c = pn f mit Einheiten e und f . Es sei außerdem ohne Beschr¨ankung der Allgemeinheit m ≤ n. Dann ist b + c = pm (e + pn−m f ). Ist n − m > 0, so ist e + pn−m f ∈ pHp und folglich eine Einheit in Hp . Also ist m 1 = max αp (b), α(c) . αp (b + c) = p Ist n = m, so ist e + f ∈ Hp . Es gibt daher ein q ∈ N0 und eine Einheit g ∈ Hp mit e + f = pq g. Es folgt m+q m 1 1 ≤ = max αp (b), αp (c) . αp (b + c) = p p Damit ist alles bewiesen. Die Ungleichung 3) heißt ultrametrische Ungleichung und wegen max αp (b), αp (c) ≤ αp (b) + αp (c) nennt man sie auch die versch¨ arfte Dreiecksungleichung. Insbesondere ist αp also ein Absolutbetrag auf Qp . Als Absolutbetrag definiert αp auf Qp eine hausdorffsche Topologie. Die Menge der Ideale pi Hp bilden eine Umgebungsbasis der Null dieser Topologie. Die Einschr¨ ankung von αp auf Q liefert den sogenannten p-adischen Absolutbetrag auf Q. Bei Hensel wird das alles nicht so explizit ausgesprochen — Hausdorffs Grundz¨ uge der Mengenlehre“ erschien erst 1914 —, dennoch spricht ” er von Grenzwerten und operiert mit ihnen. Wir notieren eine Besonderheit von Absolutbetr¨ agen, die der ultrametrischen Ungleichung gen¨ ugen. Satz 4. Es sei K ein K¨ orper mit dem Absolutbetrag α. Erf¨ ullt α die ultrametrische Ungleichung, so gilt f¨ ur alle a, b ∈ K, dass α(a + b) = max(α(a), α(b)) ist, falls nur α(a) = α(b) ist.
496
Kapitel XIIII. Miszellen
Beweis. Es sei oBdA α(b) < α(a). Dann ist α(b) < α(a) = α(a + b − b) ≤ max α(a + b), α(b) . Hieraus folgt α(a) ≤ α(a + b). Andererseits ist α(a + b) ≤ max α(a), α(b) = α(a). Also ist α(a + b) = α(a) = max(α(a), α(b)), q. o. o. Da wir sp¨ater auch algebraische Erweiterungen von Qp betrachten, die wiederum Absolutbetr¨ age haben, die den Absolutbetrag αp fortsetzen, fassen wir uns in dem nun Folgenden allgemeiner als bisher. Es sei K ein K¨ orper und α sei ein Absolutbetrag auf K. Man kann nun, den entsprechenden Begriffen der Analysis nachgebildet, beschr¨ankte Folgen, Cauchyfolgen und Konvergenz von Folgen bzg. dieses Absolutbetrags definieren. Um deutlich zu machen, dass sich dies auf α bezieht, werden wir von α-beschr¨ ankten Folgen, von α-Cauchyfolgen und α-konvergenten Folgen reden. Addiert und multipliziert man Folgen u ¨ ber K punktweise, so wird die Menge dieser Folgen zu einem Ring. Die Mengen der α-beschr¨ ankten Folgen, der α-Cauchyfolgen und der α-konvergenten Folgen sind dann Teilringe des Ringes aller Folgen, von denen der n¨ achstfolgende stets im vorhergehenden enthalten ist. Dies beweist man ganz analog den entsprechenden Aussagen bez¨ uglich des gew¨ohnlichen Absolutbetrages auf Q bzw. R. Jede α-Cauchyfolge ist also α-beschr¨ ankt und jede α-konvergente Folge ist eine α-Cauchyfolge. Es sollte auch klar sein, was eine α-Nullfolge ist. Den Grenzwert der konvergenten Folge f bezeichnen wir mit limα f . Notieren wir gleich eine Besonderheit der Absolutbetr¨ age, die der ultrametrischen Ungleichung gen¨ ugen. Satz 5. Es sei K ein K¨ orper mit Absolutbetrag α. Gen¨ ugt α der ultrametrischen Ungleichung, so ist die Folge f auf K genau dann eine α-Cauchyfolge, wenn die durch gn := fn+1 − fn definierte Folge g eine α-Nullfolge ist. Beweis. Ist f eine Cauchyfolge, so ist g nat¨ urlich eine Nullfolge. Es sei umgekehrt g eine Nullfolge. Es sei > 0. Es gibt dann ein N ∈ N0 , so dass f¨ ur alle n ≥ N gilt, dass α(gn ) < ist. Sind dann m, n ∈ N und ist n ≥ N , so folgt α(fn+m − fn ) ≤ max α(gn ), . . . , α(gn+m−1 ) < , so dass f eine α-Cauchyfolge ist. Dass bei den allgemeinen S¨ atzen alles genauso vonstatten geht, wie im Falle der Analysis, sei an folgendem Satz exemplifiziert. Satz 6. Es sei K ein K¨ orper mit dem Absolutbetrag α. Ist f eine α-Cauchyfolge u ¨ber K, aber keine α-Nullfolge, so gibt es ein > 0 und ein M ∈ N mit α(fi ) ≥
7. Das henselsche Lemma
497
f¨ ur alle i ≥ M . Beweis. Wir nehmen an, der Satz sei falsch. Dann gibt es eine α-Cauchyfolge w, die keine α-Nullfolge ist, so dass es zu jedem > 0 und zu jedem M ∈ N ein i > M gibt mit α(wi ) < . Es sei nun > 0. Weil w eine α-Cauchyfolge ist, gibt es ein M ∈ N0 mit α(wm − wn )
M mit α(wi ) < 2 . Daher ist α(wm ) = α(wm − wi + wi ) ≤ α(wm − wi ) + α(wi ) < + = 2 2 f¨ ur alle m ≥ M . Dies besagt aber, dass w im Widerspruch zur Annahme eine Nullfolge ist. Unsere Annahme ist also zu verwerfen, so dass der Satz bewiesen ist. Der n¨ achste Satz notiert eine Merkw¨ urdigkeit der α-Cauchyfolgen f¨ ur Absolutbetr¨ age, die der ultrametrischen Ungleichung gen¨ ugen Satz 7. Es sei K ein K¨ orper und α sei ein Absolutbetrag auf K, der der ultrametrischen Ungleichung gen¨ ugt. Es sei ferner f eine α-Cauchyfolge auf Qp . Ist f keine α-Nullfolge, so gibt es ein N ∈ N0 mit α(fN ) = α(fN +i ) f¨ ur alle i ∈ N0 . Beweis. Nach Satz 5 gibt es ein > 0 und ein A ∈ N mit α(fi ) ≥ f¨ ur alle i ≥ A. Weil f eine α-Cauchyfolge ist, gibt es ein B ∈ N mit α(fi − fj ) < f¨ ur ur alle alle i, j ≥ B. Setzt man nun N := max(A, B), so folgt α(fN ) = α(fN +j ) f¨ j ∈ N0 . W¨ are dem nicht so, so folgte mit der ultrametrischen Ungleichung der Widerspruch ≤ max α(fN ), α(fj ) = α(fN − fj ) < f¨ ur wenigstens ein j ≥ N . Wir kehren zu den henselschen p-adischen Zahlen zur¨ uck und beweisen einen Satz, den wir sp¨ ater verallgemeinern werden. ankung der AbSatz 8. Jede αp -Cauchyfolge auf Qp konvergiert und die Einschr¨ bildung limp auf den Ring der αp -Cauchyfolgen u ¨ber Q ist ein Homomorphismus dieses Ringes auf Qp . Ihr Kern ist das Ideal der Nullfolgen. Beweis. Wir zeigen zun¨achst, dass jedes Element von Qp ein αp -Grenzwert einer Folge auf Q ist. Dazu sei a ∈ Qp . Es gibt dann ein n ∈ Z und eine Einheit e von
498
Kapitel XIIII. Miszellen
Hp mit a = pn e. Nach den Entwicklungen von Abschnitt 1 des Kapitels 10 gibt es eine Folge f auf N0 mit 0 ≤ fi < pi+1 und e − fi ∈ pi+1 Hp . Es folgt n+i+1 1 , αp (a − p fi ) = p n
so dass a = limp (pn f ) gilt. ¨ber Qp . Da Nullfolgen konvergieren, d¨ urfen wir Es sei f eine αp -Cauchyfolge u annehmen, dass f keine Nullfolge ist. Nach Satz 6 gibt es daher ein N ∈ N0 mit ur alle j ∈ N0 . Es gibt also ein m ∈ Z und zu jedem j ∈ N0 αp (fN ) = αp (fN +j ) f¨ eine Einheit ej in Hp mit fN +j = pm ej . Es folgt, dass auch e eine Cauchyfolge ist. Zu jedem j gibt es wiederum genau eine Folge j mit 0 ≤ jk < p und ej =
∞
jk pk .
k:=0
Dass e eine Cauchfolge ist, l¨ asst sich nun so fassen, dass es zu n ∈ N0 stets ein M ∈ N gibt mit ei − ej ∈ pn+1 Hp f¨ ur alle i, j ≥ M . Dies wiederum ist gleichbedeutend damit, dass ik = jk ist f¨ ur alle i, j ≥ M und alle k := 0, . . . , n. Unter all diesen M ’s, f¨ ur die diese Aussage gilt, gibt es ein kleinstes, welches wir mit M (n) bezeichnen. Wegen pn+2 Hp ⊆ pn+1 Hp gilt dann M (n) ≤ M (n + 1) f¨ ur alle n und folglich (A)
M(n),k = M(n+1),k
f¨ ur alle n und alle k = 0, . . . , n. Wir definieren nun die Folge ϕ durch ϕn := M(n),n f¨ ur alle n ∈ N0 . Mit (A) folgt ϕk = M(n),k
7. Das henselsche Lemma
499
f¨ ur alle k ≤ n. Setzt man nun a :=
∞
ϕk pk ,
k:=0
so ist a − eM(n) = a −
n k:=0
ϕk pk −
∞
M(n),k pk ∈ pn+1 Hp .
k:=n+1
f¨ ur alle n ∈ N0 . Also ist a = limn→∞ eM(n) , wobei wir auf den Index p bei limp verzichtet haben. Damit ist gezeigt, dass e eine konvergente Teilfolge hat. Da e Cauchyfolge ist, ist dann auch e konvergent und es gilt a = limp e. Hieraus folgt schließlich, dass auch f konvergiert und dass limp f = pm a ist. ¨ber Q in Qp konvergent. Dass die EinInsbesondere ist jede αp -Cauchyfolge u schr¨ankung von limp auf den Ring der αp -Cauchyfolgen u ¨ber Q surjektiv ist, folgt dann aus dem eingangs Gezeigten. Damit ist alles bewiesen. Dieser Satz macht plausibel, dass man die henselschen p-adischen Zahlen auch ¨ber Q definieren kann. Man muss im Wesentlichen mittels der αp -Cauchyfolgen u nur zeigen, dass das Ideal der αp -Nullfolgen im Ring der αp -Cauchyfolgen maximal ist. Dies zeigt man mittels des Satzes 4. F¨ ur Einzelheiten sei auf L¨ uneburg 1981a verwiesen. Das henselsche Lemma in Hensel 1908, S. 79. Henselsches Lemma. Es sei 0 = f ∈ Hp [x] und π sei der kanonische Epimorphismus von Hp auf Hp /pHp . Dieser werde wie u ¨blich zu einem Epimorphismus von Hp [x] auf (Hp /pHp )[x] fortgesetzt. Gibt es dann teilerfremde Polynome γ und η u ¨ber Hp /pHp mit f π = γη, so gibt es Polynome g, h ∈ Hp [x] mit f = gh, π g = γ, hπ = η und Grad(g) = Grad(γ). Beweis. Um n als Index f¨ ur unsere Rekursion freizuhalten, setzen wir m := Grad(f ). Ferner sei s := Grad(γ). Es gibt g0 , h0 ∈ Hp [x] mit g0 , h0 ∈ Hp [x] mit g0π = γ, hπ0 = η und Grad(g0 ) = s. Es folgt f ≡ g0 h0 mod p, wobei die Kongruenz koeffizientenweise zu lesen ist. Wegen Grad(g0 ) = Grad(g0π ) ist der Leitkoeffizient von g0 nicht durch p teilbar und folglich eine Einheit in Hp . Da γ und η teilerfremd sind, gibt es u, v ∈ Hp [x] mit uh0 + vg0 ≡ 1 mod p.
500
Kapitel XIIII. Miszellen
ur i := 1, . . . , n, so dass f¨ ur Es sei n ≥ 0 und es gebe ai , bi ∈ Hp [x] f¨ gn := g0 + a1 p + . . . + an pn und hn := h0 + b1 p + . . . + bn pn gilt: Grad(ai ) < s und
Grad(bi ) ≤ m − s
f¨ ur i := 1, . . . , n und f ≡ gn hn mod pn+1 . Es sei dn+1 das durch pn+1 dn+1 = f −gn hn definierte Polynom. Dann ist dn+1 = 0 oder Grad(dn+1 ) ≤ m. Wir setzen an+1 := udn+1 und bn+1 := vdn+1 . Es folgt gn bn+1 + bn an+1 ≡ g0 vdn+1 + b0 udn+1 ≡ dn+1 mod p. Der Leitkoeffizient von gn ist gleich dem Leitkoeffizienten von g0 , da die ai ja alle uhrt Division kleineren Grad als s haben. Er ist also eine Einheit in Hp . Folglich f¨ mit Rest durch gn nicht aus Hp [x] heraus. Es gibt also q, an+1 ∈ Hp [x] mit an+1 = qgn + an+1 und an+1 = 0 oder Grad(an+1 ) < Grad(gn ) = s. Schließlich definieren wir das alt, wenn man in dem Polynom bn+1 + Polynom bn+1 als das Polynom, das man erh¨ hn q alle durch p teilbaren Koeffizienten durch 0 ersetzt. Dann ist bn+1 ≡ bn+1 + hn q mod p. Es folgt dn+1 ≡ gn bn+1 + hn an+1 = gn (bn+1 + hn g) + hn an+1 ≡ gn bn+1 + hn an+1 mod p. Also ist gn bn+1 + hn an+1 = dn+1 + pλ mit einem λ ∈ Hp [x]. Ferner folgt gnπ bπn+1 + hπn aπn+1 = dπn+1 und damit m ≥ Grad(dπn+1 ) ≥ Grad(gnπ bπn+1 ) = Grad(gnπ ) + Grad(bπn+1 ). Weil der Leitkoeffizient von gn eine Einheit ist und weil die von 0 verschiedenen Koeffizienten von bn+1 nicht durch p teilbar, also ebenfalls Einheiten sind, folgt, dass ihre Grade durch π nicht verkleinert werden. Also ist m ≥ Grad(gn ) + Grad(bn+1 ) = Grad(g0 ) + Grad(bn+1 ) = s + Grad(bn+1 ).
7. Das henselsche Lemma
501
Also ist Grad(bn+1 ) ≤ m − s. Wir setzen nun gn+1 := gn + an+1 pn+1
und hn+1 := hn + bn+1 pn+2 .
Dann ist — die Kongruenzen werden modulo pn+2 gelesen — gn+1 hn+1 ≡ gn hn + gn bn+1 pn+1 + hn an+1 pn+1 = gn hn + (dn+1 + pλ)pn+1 ≡ gn hn + dn+1 pn+1 = gn hn + (f − gn hn ) = f mod pn+2 . Dies zeigt, dass es Folgen a, b, g und h von Polynomen in Hp [x] gibt, so dass gilt: ur alle n ∈ N0 . 1) Es ist Grad(gn ) = s und Grad(hn ) ≤ m − s f¨ 2) Es ist gn+1 = gn + an+1 pn+1 und hn+1 = hn + bn+1 pn+1 f¨ ur alle n ∈ N0 . ur alle n ∈ N0 . 3) Es ist f ≡ gn hn mod pn+1 f¨ Auf Grund von 1) und 2) definiert die Folge g f¨ ur jede der Potenzen 1, x, . . . , xs aus deren Koeffizienten eine Cauchyfolge u ¨ber Hp und die Folge h f¨ ur jede der Potenzen 1, x, . . . , xm−s ebenfalls eine solche Cauchyfolge. Nach Satz 6 konvergieren alle diese Cauchyfolgen und definieren Polynome g und h, die wir durch ∞ g = g0 + an p n n:=1
und
∞
h = h0 +
b n pn
n:=1
darstellen. Mit 3) folgt schließlich, dass f = gh ist. Dass g π = γ und hπ = η ist, ist unmittelbar zu sehen. Damit ist das henselsche Lemma bewiesen. Das folgende Korollar steht auch schon bei Hensel (Hensel 1908, S. 74), ist dort aber anders bewiesen. Das henselsche Lemma kommt bei ihm sp¨ater. n Korollar. Es sei f = i:=0 fi xi ∈ Qp [x] und fn = 0. Ist f irreduzibel, so ist αp (fi ) ≤ max(αp (f0 ), αp (fn )) f¨ ur i := 0, . . . , n. Beweis. Indem man mit einer passenden Potenz von p multipliziert, sieht man, dass man annehmen darf, dass alle fi in Hp liegen und dass eines der fi eine Einheit dieses Ringes ist, dass f¨ ur dieses i also α(fi ) = 1 ist. Es sei s das gr¨oßte dieser i. Weil alle fj in Hp liegen, ist αp (fj ) ≤ 1 = αp (fs ). Ist nun π wieder der kanonische Epimorphismus von Hp auf Hp /pHp , so ist π
f =
s i:=0
fiπ xi
1π .
502
Kapitel XIIII. Miszellen
Auf Grund des henselschen Lemmas hat f daher einen Faktor des Grades s. Wegen der Irreduzibilit¨ at von f folgt s = 0 oder s = n. Damit ist das Korollar bewiesen. Es sei L eine endliche, separable Erweiterung von K. Es gibt dann ein ϑ ∈ L mit L = K[ϑ]. Ist f das Minimalpolynom von ϑ und ist n dessen Grad, so ist n = [L : K]. Ist M der Zerf¨allungsk¨ orper von f u ¨ ber K, so gibt es nach Satz 1 von Kapitel 13, Abschnitt 8 genau n Monomorphismen von L in M , die K-linear sind. Es sei H die Menge dieser Monomorphismen. Ist nun a ∈ L, so setzen wir aσ NL:K (a) := σ∈H
und nennen NL:K (a) die Norm von a u ¨ ber K. Die Norm findet sich bei Dedekind (Dirichlet-Dedekind 1871, S. 428). Er nennt sie dort sogenannt“, so dass sie of” fenbar schon vorher bekannt war. Die Norm hat die folgenden Eigenschaften. 1) Es ist NL:K (a) ∈ K f¨ ur alle a ∈ L. 2) Es ist genau dann NL:K (a) = 0, wenn a = 0 ist. 3) Es ist NL:K (ab) = NL:K (a)NL:K (b) f¨ ur alle a, b ∈ L. 4) Ist k ∈ K und b ∈ L, so ist NL:K (kb) = k [L:K] NL:K (b). 5) Ist a ∈ L, so ist NL:K (a) = NK[a]:K (a)[L:K(a)] . Die erste Eigenschaft folgt daraus, dass NL:K (a) ein Fixelement der galoisschen Gruppe von L : K ist. Die restlichen Eigenschaften sind unmittelbar einsichtig. Satz 9. Es sei K := Qp und L sei eine Erweiterung des Grades n von K. Definiert man βp durch 1 βp (a) := αp NL:K (a) n , so ist βp ein Absolutbetrag auf L, der αp fortsetzt und der die ultrametrische Ungleichung erf¨ ullt, und L ist ein topologischer Vektorraum u ¨ber K. Ist k ∈ K und b ∈ L, so ist βp (kb) = αp (k)βp (b). Beweis. Ist a ∈ K, so ist βp (a) = αp
a
σ
n1
1
= αp (an ) n = αp (a).
σ∈H
Dies zeigt, dass βp eine Fortsetzung von αp ist. Es gibt daher schon ein k ∈ K mit βp (k) = 0, 1. ur alle l ∈ L. Die MultiplikaTrivial ist, dass βp (0) = 0 und βp (l) > 0 ist f¨ tivit¨ at von β folgt aus der Multiplikativit¨ at der drei Funktionen, aus denen βp zusammengesetzt ist. Es bleibt, die G¨ ultigkeit der ultrametrischen Ungleichung zu beweisen. Dazu sei zun¨ achst a ∈ L und es gelte βp (a) ≤ 1. Wir zeigen, dass βp (a + 1) ≤ 1 ist. Es sei μa := xm + am−1 xm−1 + . . . + a0
8. Algebraische Erweiterungen von Qp
503
das Minimalpolynom von a u ¨ ber K. Dann ist NK[a]:K (a) = ±a0 und folglich n
NL:K (a) = ±a0m auf Grund der Eigenschaft 5) der Norm. Es folgt 1 1 βp (a) = αp NL:K (a) n = α(a0 ) m . Wegen βp (a) ≤ 1 ist daher auch αp (a0 ) ≤ 1. Weil μa irreduzibel ist, folgt mit dem Korollar zum henselschen Lemma, dass αp (ai ) ≤ max 1, αp (a0 ) = 1 ist f¨ ur alle i. Dies besagt, dass μa ein Polynom u ¨ber Hp ist. Wegen μa+1 = μa (x − 1) gilt dies auch f¨ ur μa+1 . Ist b0 das Absolutglied dieses Polynoms, so ist also αp (b0 ) ≤ 1. Hieraus folgt 1 1 βp (a + 1) = αp NL:K (a + 1) n = αp (b0 ) m ≤ 1, wie behauptet. Es seien nun a, b ∈ L und oBdA βp (a) ≤ βp (b). Ist b = 0, so ist auch a = 0 und es ist nichts zu beweisen. Es sei also b = 0. Dann ist a βp (a) ≤ 1. βp = b βp (b) Es folgt
βp
und weiter
a +1 b
≤1
βp (a + b) ≤ βp (b) = max βp (a), βp (b) .
Damit ist gezeigt, dass βp ein Absolutbetrag auf L ist, der αp fortsetzt. orper macht. βp induziert auf L eine Topologie, die L zu einem topologischen K¨ Die Addition ist also stetig. Ebenso die Multiplikation. Schr¨ ankt man diese auf upfung stetig, so dass L in der Tat ein topoloHp × L ein, so ist auch diese Verkn¨ gischer Vektorraum u ¨ ber Hp ist. Die letzte Aussage folgt wieder unmittelbar aus der Definition von βp . Die Konstruktion von βp folgt dem gleichen Muster wie die Konstruktion des gew¨ohnlichen Absolutbetrages auf C, ist doch x2 + y 2 die Norm der komplexen Zahl x + iy. achst endliche, 8. Algebraische Erweiterungen von Qp . Wir studieren zun¨ algebraische Erweiterungen von Qp .
504
Kapitel XIIII. Miszellen
Satz 1. Es sei L eine endliche Erweiterung von Qp und βp sei der im letzten Abschnitt definierte Absolutbetrag auf L. Ist dann R := ξ | ξ ∈ L, βp (ξ) ≤ 1 und
P := ξ | ξ ∈ L, βp (ξ) < 1 ,
so ist R ein Ring — der Bewertungsring von L — und P ist ein Ideal von R — das Bewertungsideal von R bzw. von L —. Ferner gilt, dass R−P die Einheitengruppe von R ist. Ist 0 = a ∈ L, so ist a ∈ R oder a−1 ∈ R. Beweis. Sind ξ, η ∈ R, so ist, da βp ultrametrisch ist, βp (ξ + η) ≤ max βp (ξ), βp (η) ≤ 1 und folglich ξ + η ∈ R. Entsprechend zeigt man, dass P additiv abgeschlossen ist. R und P sind auch beide nicht leer, da sie 0 enthalten. Es sei ρ ∈ R und ξ ∈ P . Dann ist βp (ρξ) = βp (ρ)βp (ξ) ≤ βp (ξ) < 1, so dass ρξ ∈ P ist. Folglich ist P ein Ideal. Ein fast identischer Schluss zeigt, dass R multiplikativ abgeschlossen ist. Es ist 1 ∈ R − P . Es sei e ∈ R − P . Dann ist βp (e) = 1. Es folgt 1 = βp (ee−1 ) = βp (e)βp (e−1 ) = βp (e−1 ) und damit e−1 ∈ R. Ist a ∈ R, so ist βp (a) > 1. Es folgt 1 = βp (aa−1 ) = βp (a)βp (a−1 ) > βp (a−1 ) und damit sogar a−1 ∈ P . Damit ist alles gezeigt. Satz 2. Es sei L eine endliche Erweiterung von Qp . Ist R der Bewertungsring von L, so ist R ein Hauptidealring. Genauer: Es gibt ein Element π ∈ R, so dass gilt: Ist I ein von {0} verschiedenes Ideal von R, so gibt es ein n ∈ N0 mit I = π n R. Insbesondere ist P = πR. Beweis. Dem Absolutbetrag βp sieht man nicht an, dass sein Wertebereich nur einen H¨ aufungspunkt hat n¨ amlich 0, und dass folglich jede seiner nicht-leeren, beschr¨ankten Teilmengen ein gr¨oßtes Element enth¨alt. Werfen wir also einen Blick ur die Norm von hinter die Kulissen. Dazu setzen wir K := Qp . Ist ξ ∈ L, so gilt f¨ ξ — mit Hilfe der Normfunktion wurde βp definiert —, dass NL:K (ξ) ∈ Qp ist. Ist 0 = ξ, so gibt es ein wp (ξ) ∈ Z und eine Einheit e ∈ Hp mit NL:K (ξ) = pwp (ξ) e. Setzt man noch wp (0) := ∞. So zeigt die Definition von βp , dass R := ξ | ξ ∈ L, wp (ξ) ∈ N0 ∪ {∞}
8. Algebraische Erweiterungen von Qp und
505
P := ξ | ξ ∈ L, wp (ξ) ∈ N ∪ {∞}
ist. Ferner sieht man, dass wp (ξη) = wp (ξ) + wp (η) ist. Es gibt also ein π ∈ P , so dass wp (π) unter allen wp (ξ) mit ξ ∈ P minimal ist. Dann ist nat¨ urlich πR ⊆ P . Es sei ξ ∈ P . Dann ist ξ = (ξπ −1 )π und
wp (π) ≤ wp (ξ) = wp (ξπ −1 ) + wp (π).
Also ist wp (ξπ −1 ) ≥ 0 und folglich ξπ −1 ∈ R. Also ist ξ ∈ πR. Folglich ist P = πR. Wir betrachten die Ideale Pn := π n R. Dann ist P1 = P . Es ist ∞ "
Pn = {0}.
n:=1
! Ist n¨amlich ξ ∈ ∞ ur alle n. Hieraus folgt ξ = 0, wie n:=1 Pn , so ist wp (ξ) ≥ n f¨ behauptet. Es sei nun I ein von {0} und R verschiedenes Ideal. Weil R!− P die Gruppe der ∞ Einheiten von R ist (Satz 1), ist dann I ⊆ P = P1 . Wegen n:=1 Pn = {0} = I gibt es dann ein n mit I ⊆ Pn und I ⊆ Pn+1 . Es gibt folglich ein a ∈ I, das nicht durch π n+1 teilbar ist. Es ist aber durch π n teilbar. Also gibt es ein e ∈ R, so dass a = pn e ist. Weil e nicht durch π teilbar ist, ist e kein Element von P und folglich eine Einheit. Es folgt π n = ae−1 ∈ I und damit I = π n R = Pn . Korollar. Die Voraussetzungen seien wie in Satz 2. Ist dann 0 = a ∈ L, so gibt es genau ein n ∈ Z und eine Einheit e von R mit a = π n e. Beweis. Es sei zun¨achst a ∈ R. Dann gibt es ein n ∈ N0 mit aR = π n R. Hieraus folgt in diesem Fall die Behauptung. Es sei also a ∈ R. Dann ist a−1 ∈ R (Satz 1) und folglich a−1 = π n e mit n ∈ N0 und einer Einheit e von R. Es folgt a = π −n e−1 , womit das Korollar bewiesen ist. Satz 3. Es sei L eine endliche Erweiterung von K := Qp . Ist R der Bewertungsring und P das Bewertungsideal von L, so ist R/P ein endlicher K¨ orper. Beweis. Weil P ein maximales Ideal ist (Satz 1), ist R/P ein K¨ orper. Es ist βp (p) = αp (p) = p1 < 1 und folglich p ∈ P . Somit ist p die Charakteristik von R/P . Ist a ∈ R/P , so ist der Grad des Minimalpolynoms von a u ¨ ber dem Primk¨ orper von R/P durch [L : K] beschr¨ankt. Da es u ¨ ber GF(p) aber nur endlich viele Polynome gibt, deren Grad eine gegebene Schranke nicht u ¨bersteigt, gibt es in R/P nur endlich viele Elemente.
506
Kapitel XIIII. Miszellen
Satz 4. Es sei L eine endliche Erweiterung von K := Qp und R sei der Bewertungsring und P das Bewertungsideal von L. Ferner sei V ein Vertretersystem von R/P mit 0 ∈ V . Ist P = πR und ist 0 = a ∈ L, so gibt es genau ein n ∈ Z und genau eine Folge f auf V mit a=
∞
fi π i
i:=n
und fi = 0 f¨ ur i < n sowie fn = 0. Wegen der Endlichkeit von R/P ist die Existenz von V unproblematisch. Beweis. Wegen a = 0 gibt es nach Satz 2 genau ein n ∈ Z und genau eine Einheit e von R mit a = π n e. Weil e nicht durch π teilbar ist, gibt es ein e0 ∈ V mit e0 = 0 und e ≡ e0 mod π. Es sei k ≥ 0 und es seien e0 , . . . , ek ∈ V bereits gefunden, so dass k e≡ ei π i mod π k+1 i:=0
gelte. Dann ist also e=
k
ei π i + hπ k+1
i:=0
mit einem h ∈ R. Es folgt h = ek+1 + h π mit eindeutig bestimmten ek+1 ∈ V und h ∈ R. Es folgt k+1 ei π i mod π k+2 . e≡ i:=0
Damit ist gezeigt, dass es eine Folge ei gibt mit e=
∞
ei π i
i:=0
Setzt man fn+i := ei , so folgt a=
∞
fi π i .
i:=n
Damit ist die Existenz der Folge f gezeigt. Die Einzigkeit von f und n ist ebenso einfach zu zeigen. Der n¨ achste Satz beweist sich wortw¨ortlich wie Satz 7 von Abschnitt 7. Satz 5. Es sei L eine endliche Erweiterung von K := Qp und βp sei der im letzten Abschnitt definierte Absolutbetrag auf L. Dann konvergiert jede βp -Cauchyfolge von L.
8. Algebraische Erweiterungen von Qp
507
Beweis. Es sei R der Bewertungsring und P das Bewertungsideal von L. Ferner sei P = πR und V sei ein Vertretersystem von R/P . urfen wir Es sei f eine βp -Cauchyfolge auf L. Da Nullfolgen konvergieren, d¨ annehmen, dass f keine Nullfolge ist. Nach Satz 5 von Abschnitt 7 gibt es daher ur alle j ∈ N0 . Es gibt also ein m ∈ Z und ein N ∈ N0 mit βp (fN ) = βp (fN +j ) f¨ zu jedem j ∈ N0 genau eine Einheit ej in R mit fN +j = π m ej . Es folgt, dass auch e eine Cauchyfolge ist. Zu jedem j gibt es wiederum genau eine Folge j mit jk ∈ V und ∞ ej = jk π k . k:=0
Dass e eine Cauchfolge ist, l¨ asst sich nun so fassen, dass es zu n ∈ N0 stets ein M ∈ N gibt mit ei − ej ∈ π n+1 R f¨ ur alle i, j ≥ M . Dies wiederum ist gleichbedeutend damit, dass ik = jk ist f¨ ur alle i, j ≥ M und alle k := 0, . . . , n. Unter all diesen M ’s, f¨ ur die diese Aussage gilt, gibt es ein kleinstes, welches wir mit M (n) bezeichnen. Wegen π n+2 R ⊆ π n+1 R gilt dann M (n) ≤ M (n + 1) f¨ ur alle n und folglich M(n),k = M(n+1),k
(A)
f¨ ur alle n und alle k = 0, . . . , n. Wir definieren nun die Folge ϕ durch ϕn := M(n),n f¨ ur alle n ∈ N0 . Mit (A) folgt ϕk = M(n),k ∞ f¨ ur alle k ≤ n. Setzt man nun a := k:=0 ϕk π k , so ist a − eM(n) = a −
n k:=0
ϕk π k −
∞
M(n),k π k ∈ π n+1 R.
k:=n+1
f¨ ur alle n ∈ N0 . Also ist a = limβp , n→∞ eM(n) ,
508
Kapitel XIIII. Miszellen
Damit ist gezeigt, dass e eine konvergente Teilfolge hat. Da e Cauchyfolge ist, ist dann auch e konvergent und es gilt a = limβp e. Hieraus folgt schließlich, dass auch f konvergiert und dass limβp f = π m a ist. Damit ist der Satz bewiesen. Im Falle des Bewertungsringes einer endlichen Erweiterung von Qp kann man noch mehr sagen als in dem Korollar zu Satz 5 aus Abschnitt 4 des Kapitels 7. Hensel formuliert und beweist den n¨ achsten Satz nur f¨ ur Qp (Hensel 1908, S. 63). Er ben¨ otigt ihn aber in der Allgemeinheit, wie er hier formuliert ist, ohne dass das ausdr¨ ucklich klar wird. Das liegt daran, dass sein Buch zwei Motivationsschichten hat. Zun¨ achst motiviert er sein Vorgehen, dass ja wirklich neu ist, mittels den aus der Funktionentheorie bekannten Laurentreihen. Dann f¨ uhrt er die p-adischen Zahlen ein und beweist eine Reihe von S¨ atzen u ¨ ber sie, die er sp¨ ater auf endliche ¨ bertr¨ agt. Dabei sagt er h¨aufig, dass sich diese genauso Erweiterungen von Qp u bewiesen wie jene. Bei einem dieser nicht durchgef¨ uhrten Beweise ben¨otigt man die fragliche Verallgemeinerung. Ich formuliere den Satz gleich so, wie wir ihn brauchen. Satz 6. Es sei L eine endliche Erweiterung von Hp und R sei der Bewertungsring und P das Bewertungsideal von L. Das Element π habe die Eigenschaft, dass P = πR ist. Es seien g, h ∈ R[x] zwei Polynome der Grade a bzw. b. Ferner sei Res(g, h) = 0. Wegen Res(g, h) ∈ R gibt es auf Grund von Satz 2 ein ρ ∈ N0 und eine Einheit e von R mit Res(g, h) = π ρ e. Ist dann f = π r F0 ein Polynom in R[x] mit r ≥ ρ, dessen Grad h¨ ochstens gleich a + b − 1 ist, so gibt es genau zwei Polynome γ, η ∈ R[x] mit f = gη + hγ ¨ und Grad(γ) < Grad(g) und Grad(η) < Grad(h). Uberdies gilt, dass π r−ρ sowohl γ als auch η teilt. Beweis. Es sei g = g0 xa + . . . + ga h = h0 xb + . . . + hb f = f0 xa+b−1 + . . . + fa+b−1 . Genau dann gilt f¨ ur die Polynome γ = γ0 xa−1 + . . . + γa−1 η = η0 xb−1 + . . . + ηb−1 die Gleichung f = gη + hγ, wenn f¨ ur die Koeffizienten von γ und η das folgende Gleichungssystem gilt: g0 η0
+ h0 γ0
= f0
g1 η0 + g0 η1 + h1 γ0 + h0 γ1 = f1 ... ... ... = ...
8. Algebraische Erweiterungen von Qp
509
Die Determinante dieses Systems ist Res(g, h), die nach Voraussetzung von 0 verschieden ist. Daher ist die Existenz und Einzigkeit von γ und η gesichert, wobei zun¨ achst aber nur klar ist, dass γ und η Polynome u ¨ ber L sind. Die cramersche Regel zeigt, dass die Koeffizienten von γ und η alle den Nenner ahler homogene, lineare Polynome u ¨ ber R in den Koefπ ρ e haben und dass die Z¨ fizienten von f sind. Wegen f = π r F0 sind also alle fi durch π r teilbar. Wegen r ≥ ρ folgt daher, dass die Koeffizienten von γ und η alle in R liegen und dass π r−ρ Teiler von γ und auch von η ist. Damit ist der Satz bewiesen. Dies ist die subtilste Anwendung der cramerschen Regel, die ich kenne. Der n¨ achste Satz kommt bei Hensel wieder zweimal vor, einmal f¨ ur Qp und einmal f¨ ur endliche algebraische Erweiterungen von Qp (Hensel 1908, S. 68, bzw. 155). Beim zweiten Vorkommen sagt er wieder, dass der Satz sich genauso bewiese wie der Spezialfall. Er formuliert den Satz jedoch etwas anders als hier wiedergegeben, da er nicht verlangt, dass der Leitkoeffizient des zu untersuchenden Polynoms gleich 1 ist. Seinen Beweis nun kann ich an einer Stelle nicht nachvollziehen. Ich werde im Beweis auf die Stelle hinweisen und sp¨ater dann kommentieren. Der Beweis hier ist der, der sich aus seinem Beweis ergibt, wenn man eben voraussetzt, dass der Leitkoeffizient 1 ist. Wenn Sie in Hensels Buch schauen, so beachten Sie, dass Hensel die Diskriminante anders als u ¨ blich definiert. Er setzt n¨ amlich Dis(f ) := Res(f, f ), w¨ahrend wir haben — der u ¨blichen Gepflogenheit folgend —, dass Res(f, f ) = (−1)
n(n−1) 2
a0 Dis(f )
ist, wenn a0 der Leitkoeffizient von f ist (Kap. 7, Absch. 2, Satz 5). Die Formel Dis(f g) = ±Dis(f )Dis(g)Res(f, g), die wir gleich benutzen werden, gilt aber auch f¨ ur seine Diskriminante, wie unschwer zu sehen, da ja das Produkt der Leitkoeffizienten von f und g der Leitkoeffizient von f g ist. Seine Resultante ist auch die unsere. Satz 7. Es sei L eine endliche Erweiterung von K := Qp und R sei der Bewertungsring von L und π sei ein erzeugendes Element des zugeh¨ origen Bewertungsideals. Ferner sei f ∈ R[x] und der Leitkoeffizient von f sei gleich 1. Es ist Dis(f ) ∈ R[x]. Es gelte Dis(f ) = 0 und folglich Dis(f ) = π δ e mit δ ∈ N0 und einer Einheit e von R. Es sei ϕ der kanonische Epimorphismus von R auf S := R/π δ+1 R. Dieser werde, wie u ¨blich, zu einem Epimorphismus von R[x] auf S[x] fortgesetzt. Ist dann f ϕ = γη eine nicht-triviale Zerlegung von f ϕ mit Polynomen γ, η ∈ S[x], so gibt es Polynome g, h ∈ R[x] mit f = gh und g ϕ = γ und hϕ = η sowie Grad(g) = Grad(γ) und Grad(h) = Grad(η). Beweis. Weil der Leitkoeffizient von f gleich 1 ist, ist Grad(f ϕ ) = Grad(f ). Sind u und v die Leitkoeffizienten von γ und η, so folgt 1 = 1ϕ = uv. Ersetzt man γ und η durch vγ und uη, so sieht man, dass man annehmen darf, dass die
510
Kapitel XIIII. Miszellen
Leitkoeffizienten von γ und η ebenfalls gleich 1 sind. (Hier ist ein Loch in Hensels Beweis. Dies wird gleich kommentiert.) Wir setzen n := Grad(f ), a := Grad(γ) und b := Grad(η). Weil ϕ surjektiv ist, gibt es g0 , h0 ∈ R[x], deren Leitkoefizienten gleich 1 sind, so dass g0ϕ = γ und hϕ 0 = η ist. Weil die Leitkoeffizienten von g0 und h0 gleich 1 sind, folgt Grad(g0 ) = a und Grad(h0 ) = b. Setze G0 := g0 und H0 := h0 . Dann gilt 1) Es ist G0 , H0 ∈ R[x]. 2) Es ist f ≡ G0 H0 mod π δ+1 . 3) Es ist Grad(G0 ) = a und Grad(H0 ) = b. 4) Die Leitkoeffizienten von G0 und H0 sind 1. 5) Es ist Dis(f ) ≡ Dis(G0 H0 ) ≡ 0 mod π δ+1 . Es sei s ∈ N0 und es seien g0 , . . . , gs und h0 , . . . , hs bereits gefunden, so dass, setzt man noch s s i Gs := π gi und Hs := π i hi i:=0
i:=0
und r := δ + s, gilt: 1) Es ist Gs , Hs ∈ R[x]. 2) Es ist f ≡ Gs Hs mod π r+1 . 3) Es ist Grad(Gs ) = a und Grad(Hs ) = b. 4) Die Leitkoeffizienten von Gs und Hs sind 1. 5) Es ist Dis(f ) ≡ Dis(Gs Hs ) ≡ 0 mod π r+1 . Mit 5) folgt, dass Dis(Gs Hs ) = 0 ist. Nach Satz 6 von Kapitel 7, Abschnitt 6 ist Dis(Gs Hs ) = ±Dis(Gs )Dis(Hs )Res(Gs , Hs )2 . Also ist Res(Gs , Hs ) = 0. Es sei π ρ die h¨ ochste Potenz von π, die in Res(Gs , Hs ) aufgeht. Dann folgt mit vorstehender Gleichung, dass 2ρ ≤ δ ist, da ja die Diskriminanten und Res(Gs , Hs ) in R liegen. Wegen 2) gibt es ein Q ∈ R[x] mit f − Gs Hs = π r+1 Q. Weil die Leitkoeffizienten von f , Gs und Hs allesamt gleich 1 sind, ist Grad(Q) ≤ a + b − 1. Nach Satz 3 gibt es also eindeutig bestimmte gs+1 , hs+1 ∈ R(x) mit Gs hs+1 + Hs gs+1 = pδ Q und Grad(gs+1 ) ≤ a − 1 und Grad(hs+1 ) ≤ b − 1. Setze Gs+1 := Gs + π s+1 gs+1 und Hs+1 := Hs + π s+1 hs+1 . Dann gelten 1), 3) und 4) auch f¨ ur s + 1. Es ist Gs+1 Hs+1 = (Gs + π s+1 gs+1 )(Hs + π s+1 hs+1 ) = Gs Hs + π s+1 (gs+1 Hs + Gs hs+1 ) + π 2(s+1) gs+1 hs+1 = Gs Hs + π δ+s+1 Q + π 2(δ+1) gs+1 hs+1 = Gs Hs + π r+1 Q + π 2(δ+1) gs+1 hs+1 = f + π 2(s+1) gs+1 hs+1 .
8. Algebraische Erweiterungen von Qp
511
Nach Satz 6 sind die Polynome gs+1 und hs+1 durch π δ−ρ teilbar. Also ist das Produnkt π 2(s+1) gs+1 hs+1 durch π 2(s+1)+2(δ−ρ) teilbar. Ferner ist 2ρ ≤ δ, wie gesehen. Also ist 2(s + 1) + 2δ − 2ρ ≥ 2(s + 1) + δ = r + 2 + s ≥ r + 2. Somit gilt f ≡ Gs+1 Hs+1 mod π r+2 , dh., es gilt 2) auch f¨ ur s+1. Daraus folgt, dass auch die Eigenschaft 5) f¨ ur s+1 gilt. Die G¨ ultigkeit von 1), 3) und 4) f¨ yr s + 1 haben wir schon festgestellt. Damit ist also die Existenz zweier Folgen g und h auf R[x] gezeigt, so dass f¨ ur die Polynome Gs :=
s
π i gi
und Hs :=
i:=0
s
π i hi
i:=0
die Gleichungen 1) bis 5) gelten, wobei r = δ + s ist. Außerdem gilt noch ur alle s ∈ N0 . 6) Es ist