184 73 2MB
German Pages 323 Year 2010
Jürgen Wolfart Einführung in die Zahlentheorie und Algebra
Aus den Programmen
Aufbaukurs Mathematik Herausgegeben von Martin Aigner, Peter Gritzmann, Volker Mehrmann und Gisbert Wüstholz
Walter Alt Nichtlineare Optimierung
Helmut Koch Zahlentheorie
Martin Aigner Diskrete Mathematik
Ulrich Krengel Einführung in die Wahrscheinlichkeitstheorie und Statistik
Albrecht Beutelspacher und Ute Rosenbaum Projektive Geometrie Gerd Fischer Ebene algebraische Kurven Wolfgang Fischer/Ingo Lieb Funktionentheorie Otto Forster Analysis 3 Klaus Hulek Elementare Algebraische Geometrie Michael Joswig und Thorsten Theobald Algorithmische Geometrie Horst Knörrer Geometrie
Wolfgang Kühnel Differentialgeometrie Ernst Kunz Einführung in die algebraische Geometrie Wolfgang Lück Algebraische Topologie Werner Lütkebohmert Codierungstheorie Reinhold Meise und Dietmar Vogt Einführung in die Funktionalanalysis Gisbert Wüstholz Algebra
Grundkurs Mathematik Berater: Martin Aigner, Peter Gritzmann, Volker Mehrmann und Gisbert Wüstholz
Gerd Fischer Lineare Algebra
Hannes Stoppel und Birgit Griese Übungsbuch zur Linearen Algebra
Gerd Fischer Analytische Geometrie
Otto Forster Analysis 1
Otto Forster und Rüdiger Wessoly Übungsbuch zur Analysis 1
Otto Forster Analysis 2
Gerhard Opfer Numerische Mathematik für Anfänger
Otto Forster Übungsbuch zur Analysis 2 Matthias Bollhöfer und Volker Mehrmann Numerische Mathematik
www.viewegteubner.de
Jürgen Wolfart
Einführung in die Zahlentheorie und Algebra 2., überarbeitete und erweiterte Auflage STUDIUM
Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über abrufbar.
Prof. Dr. Jürgen Wolfart Johann Wolfgang Goethe-Universität Frankfurt FB 12 Mathematik 60054 Frankfurt [email protected]
1. Auflage 1996 2., überarbeitete und erweiterte Auflage 2011 Alle Rechte vorbehalten © Vieweg+Teubner Verlag | Springer Fachmedien Wiesbaden GmbH 2011 Lektorat: Ulrike Schmickler-Hirzebruch Vieweg+Teubner Verlag ist eine Marke von Springer Fachmedien. Springer Fachmedien ist Teil der Fachverlagsgruppe Springer Science+Business Media. www.viewegteubner.de Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlags unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Umschlaggestaltung: KünkelLopka Medienentwicklung, Heidelberg Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier Printed in Germany ISBN 978-3-8348-1461-6
v
Vorwort zur ersten Auflage Die Zahlentheorie befasst sich urspr¨ unglich mit Eigenschaften der nat¨ urlichen Zahlen wie Teilbarkeit, Primfaktorzerlegung, Primzahlverteilung, Darstellbarkeit von Zahlen als Summe von n Quadraten, L¨ osbarkeit von Gleichungen durch nat¨ urliche Zahlen u.s.w. Im Lauf der Geschichte, die sich bis in die babylonische Mathematik zur¨ uckverfolgen l¨asst, hat sich das Blickfeld erweitert auf ganze und rationale Zahlen, auf algebraische Zahlen (Nullstellen von Polynomen mit rationalen Koeffizienten), und schließlich auch auf solche, die zwar f¨ ur Geometrie und Analysis von zentraler Bedeutung sind wie π und e , aber von allen diesen Erweiterungsschritten nicht erfasst werden, also den transzendenten Zahlen. Im Lauf dieser Geschichte hat sich die Zahlentheorie vieler Methoden aus allen m¨ oglichen anderen Teilen der Mathematik bedient, vorrangig der Algebra und der Analysis; durch ihre konkreten Fragestellungen hat sie andererseits auch die Weiterentwicklung dieser Methoden vorangetrieben. Sie ist also ein Teil der Mathematik, der sich ¨ahnlich wie Gebiete der angewandten Mathematik eher durch ihre Probleme als ihre Methoden beschreiben l¨asst, deren Entwicklung aber mehr durch die menschliche Neugier als Triebfeder bestimmt wurde als durch Bed¨ urfnisse des Wissenstransfers“, um ein Modewort zu gebrauchen. Eine interessante moderne ” Pointe ist es, dass gerade diese Erkenntnisse aus dem Elfenbeinturm nun eifrig genutzt werden (f¨ ur ein Beispiel vgl. Kap. 5), und das sollte allen Verfechtern einer raschen Verwertbarkeit von Wissenschaft zu denken geben. Dieser letzte Punkt trifft genauso f¨ ur die Algebra zu und ist f¨ ur sie sogar noch fr¨ uher zutage getreten als in der Zahlentheorie (die Verwendbarkeit der Gruppenund Darstellungstheorie in der Quantenmechanik, eines der vielen hier nicht behandelten Themen), im u ¨brigen ist die heutige Algebra aber ein Teilgebiet der Mathematik von anderem Typ als die Zahlentheorie. Auch sie war noch vor 300 Jahren ein problemorientiertes Gebiet der Mathematik, befasst vor allem mit dem L¨osen von Gleichungen; die Algebra auf der Schule ist davon immer noch gepr¨agt. Seit den ersten Jahrzehnten des 19. Jahrhunderts hat sich die Algebra mehr und mehr zur systematischen und strukturorientierten Wissenschaft entwickelt, deren abstrakteste Aspekte (Kategorien und Funktoren) hier nicht einmal erw¨ahnt werden. Dass der systematische und abstrakte Aufbau der Algebra auf dem Weg der Gruppen, Ringe und K¨orper auch aus der Sicht der konkreten alten Probleme erfolgreich ist, mag der Leser gerade an der Aufkl¨ arung alter Fragen aus Algebra und Geometrie im Rahmen der Galoistheorie ablesen, die ja eigentlich algebraische K¨orpererweiterungen mit Hilfe ihrer Automorphismen studiert (z.B. Abschnitt 7.6: Lassen sich Winkel mit Zirkel und Lineal in drei gleiche Teile teilen?). Algebraische Methoden werden heute weit u ¨ber die Algebra hinaus mit gr¨oßtem Erfolg verwendet — man denke z.B. an Automorphismengruppen anderer mathematischer Strukturen oder an Gruppenoperationen aller Art (Abschnitte 2.6 und 7.9). Diese universelle Verwendbarkeit ist nicht zuletzt dem großen Abstraktionsgrad der Algebra zu verdanken.
vi Algebra und Zahlentheorie sind also trotz aller Verwandtschaft Teilgebiete der Mathematik mit etwas gegenl¨aufigen Tendenzen. Die Idee, dennoch in einer zweisemestrigen Vorlesung Algebra und Zahlentheorie zu kombinieren, stammt von meinem hochgesch¨atzten Frankfurter Kollegen Helmut Behr, der dies mit etwas anderer Stoffauswahl vor ein paar Jahren erfolgreich erprobt hat. Das Konzept hat mir sofort eingeleuchtet: • Eine reine Algebravorlesung macht Studenten (etwa des dritten Semesters) große Probleme, weil die Schlussweisen im einzelnen zwar eher leichter sind als die der Analysis, aber ungleich mehr neue Begriffe von zumeist viel h¨oherem Abstraktionsgrad einge¨ ubt werden m¨ ussen. • Eine reine Zahlentheorievorlesung leidet daran, dass n¨ utzliche Begriffe und Techniken aus der Algebra noch nicht vorausgesetzt werden k¨ onnen. Es besteht darum die Hoffnung, dass von einer geeigneten Mischung beide profitieren; das Erlernen der Algebra sollte durch das Beispielmaterial und die Motivationen aus der Zahlentheorie erleichtert und konkretisiert werden, und viele Sachverhalte aus der Zahlentheorie werden mit algebraischem Hintergrundwissen erheblich durchsichtiger. Ein weiterer methodischer Vorzug der Mischung von Zahlentheorie und Algebra besteht darin, dass sich elementare Teile besser an den Anfang, schwierigere Teile besser in die zweite H¨ alfte verlagern lassen. Einen kleinen Nachteil muss man in Kauf nehmen: Naturgem¨ aß wird die Themenauswahl so ausfallen, dass die behandelten Gegenst¨ande der Zahlentheorie eher algebraisch orientiert sind (interessante Fragen der analytischen Zahlentheorie werden nur am Rande gestreift) und Gegenst¨ande der Algebra vorgezogen werden, die Anwendung in der Zahlentheorie haben; so liegt der Schwerpunkt der Algebra-Teile eher bei den Ringen mit eindeutiger Primfaktorzerlegung und der klassischen Galoistheorie. Ein oberfl¨achlicher Blick auf die Kapitel¨ uberschriften k¨ onnte den Eindruck erwecken, dass die Algebra stark dominiert. Dieser Eindruck t¨ auscht, denn viele Themen der Zahlentheorie sind den Algebra-Kapiteln da beigemischt, wo es ¨okonomisch erschien: der Fermatsche Satz in der Gruppentheorie, Diophantische Gleichungen in der Ringtheorie, Gaußsche Summen und der Satz von Lindemann-Weierstraß in die Galoistheorie, um nur ein paar Beispiele zu nennen. Voraussetzungen. Der vorliegende Text ist eine um etwa 20% erweiterte Fassung des Skriptums einer Vorlesung Algebra und Zahlentheorie, die ich im Wintersemester 1993/94 und im Sommersemester 1994 an der Universit¨ at Frankfurt f¨ ur Studierende der Mathematik und der Informatik gehalten habe. Da in Frankfurt auch im Sommersemester die Vorlesungen Analysis I und Lineare Algebra I gehalten, aber im darauffolgenden Winter nicht beide fortgesetzt werden, habe ich nach Kr¨aften versucht, die erste H¨alfte meines Kurses auch f¨ ur Studierende des zweiten Studiensemesters zug¨anglich zu halten. Vorausgesetzt werden eigentlich nur eine gewisse Erfahrung mit mathematischen Grundtechniken. Es wird also nicht mehr besonders erl¨autert, was eine Abbildung, ein Widerspruchsbeweis, eine
vii ¨ Aquivalenzrelation oder etwa eine reelle Zahl ist. Wie in allen B¨ uchern so u ¨blich, wird der Stil mit wachsender Seitenzahl kondensierter; ich hoffe aber, dass sich das Buch trotzdem auch zum Selbststudium eignet. Ziele. 200 Seiten k¨onnen keinesfalls ein Lehrbuch der Zahlentheorie plus ein Lehrbuch der Algebra ersetzen, aber vielleicht erreichen, • dass dem Leser eine solide Grundbildung in Zahlentheorie und Algebra vermittelt wird, gerade auch dann, wenn er sich sp¨ ater auf andere Gebiete spezialisieren will, • ihm Appetit darauf zu machen, tiefer einzudringen und vielleicht bei der Arithmetik im weitesten Sinne zu bleiben. Gerade aus dem letzteren Grund habe ich versucht, die Gegenst¨ ande dieses Buchs nicht etwa als abgeschlossenes und abgehaktes Wissen darzustellen, sondern an vielen Stellen Hinweise auf Weiterentwicklungen, offene Fragen, alte und neuere Probleme einzubauen. Im Literaturverzeichnis wird auf viele M¨ oglichkeiten der Vertiefung verwiesen. Vielleicht sind das schon bald nur noch sehr theoretische M¨ oglichkeiten, denn die mathematischen Fachbereiche in Deutschland sind gegenw¨artig unter großem Druck durch ¨offentliche Meinung und Politik bis hinab zu Rektoren und Pr¨asidenten, das Studium und die Diplomarbeit zu verk¨ urzen und zu normieren. Es steht zu bef¨ urchten, dass dann in einer Light-Version des Mathematikstudiums unser Fach kaum noch als lebendige Wissenschaft zu vermitteln ist; alle Hinweise darauf, dass sich auch jenseits einer solchen Einf¨ uhrung noch eine große Welt auftut, sind dann vielleicht nur noch eine Erinnerung an das, was verlorengegangen ist. Einige technische Vorbemerkungen. Das Buch ist in sieben Kapitel gegliedert, und wenn auf Formeln wie (3.3) (immer in runden Klammern), S¨ atze, Hilfss¨ atze, Folgerungen oder ganze Abschnitte oder Unterabschnitte verwiesen wird (z.B. 2.9, immer ohne runde Klammern), so bezeichnet die erste Zahl immer die Kapitelnummer.— Wichtige Begriffe, die der Leser m¨ oglichst schnell verarbeiten sollte, habe ich fett gesetzt, h¨aufig ohne den betreffenden Satz mit Definition:“ zu be” ginnen. Andere Begriffe, die f¨ ur die Mathematik zwar wichtig sind, aber in diesem Buch weiter keine Rolle spielen oder erst sp¨ ater ausf¨ uhrlich besprochen werden, sind kursiv gesetzt.— Das Beweisende ist durch 2“ markiert, Buchstaben in ” eckigen Klammern wie [Gra] verweisen auf das Literaturverzeichnis.— Am Ende ¨ jedes Kapitels habe ich einen Abschnitt mit Ubungsaufgaben angef¨ ugt. Es ist fast u ussig zu sagen, dass die aktive und nicht nur rezeptive Besch¨ aftigung ¨berfl¨ mit dem Stoff der wichtigste Teil des Mathematikstudiums ist. Auf besondere L¨osungshinweise zu den Aufgaben habe ich meist verzichtet: In der Regel sind die Aufgaben einfach, und manchmal (eigentlich immer noch viel zu selten) weichen sie vom u ¨blichem Schema Man beweise diese oder jene feststehende Aussage“ ” ur Ausprobieren und eigenes Ererheblich ab; ich habe versucht, Raum zu lassen f¨ forschen, und gelegentlich dazu ermutigt, Vermutungen zu formulieren. Vielleicht
viii wird dadurch besser sichtbar, wie Mathematik wirklich entsteht. H¨ aufig sind die Aufgaben eine Prop¨adeutik f¨ ur sp¨atere Kapitel; bei aufmerksamer Lekt¨ ure der folgenden Abschnitte wird sich manche L¨osung als Spezialfall allgemeinerer Sachverhalte erweisen. Der Autor pflegt nat¨ urlich alle Teile seines Buchs f¨ ur wissenswert und wichtig zu halten. Trotzdem ist die Frage nach einem konsistenten Teilprogramm v¨ ollig legitim, denn selten wird ein Gebiet der Mathematik dadurch gelernt, dass man ein Buch einfach einmal von A bis Z durchliest. Als vern¨ unftiges Kurzprogramm etwa f¨ ur eine erste Lekt¨ ure oder als Stoff f¨ ur eineinhalb Vorlesungen k¨ onnte ich mir vorstellen, die Abschnitte 1.4 , 2.7 , 2.9 , 3.5 , 4.5 , 4.6 ,
Kapitel 5 , 6.5 , 7.4 − 7.10
zun¨achst wegzulassen. Wer sich allerdings gerade f¨ ur Kapitel 5 (Primzahltests und Primfaktorzerlegung) interessiert, darf die Abschnitte 1.4 und 4.5 nicht u ¨bergehen. Den H¨orern meiner Vorlesung verdanke ich eine Reihe von Korrekturen und Verbesserungsvorschl¨agen, meinen Kollegen H.Behr, J.Sander, W.Schwarz und U.Zannier wichtige Literaturhinweise, und Dr.R.Tschiersch sowie Dipl.Math. Peter Bauer haben mir freundlicherweise im Kampf mit LATEX beigestanden. Frankfurt, im Sommer 1996, J¨ urgen Wolfart
ix
Vorwort zur zweiten Auflage Seit der freundlich aufgenommenen ersten Auflage sind einige weitere Lehrb¨ ucher mit ¨ahnlichem Konzept erschienen, allen voran das Buch von Leutbecher [Le] und neuerdings jenes von Schulze-Pillot [S-P]. Ein Vergleich der Inhalte zeigt die große Vielfalt der m¨oglichen Themen, die man dabei ausw¨ ahlen kann. Der Durchschnitt des vorliegenden Bandes mit jedem anderen Lehrbuch ist vergleichsweise klein, erst recht wenn sie sich auf Algebra oder Zahlentheorie alleine beschr¨anken; deswegen mag eine Neuauflage gerechtfertigt sein. Ich habe viele Korrekturen vorgenommen, die ich aufmerksamen Studierenden ¨ verdanke, und nat¨ urlich Aktualisierungen; die Ubungsaufgaben habe ich u ¨berarbeitet und, soweit n¨otig, am Ende des Buchs mit L¨ osungshinweisen versehen. ¨ Die gr¨oßte Anderung besteht allerdings in einem umfangreichen neuen Kapitel zum Thema ,,Gitter”, Br¨ uckenschlag einerseits zur algebraischen Zahlentheorie, andererseits zu vielen sch¨onen Anwendungen von Algebra und Zahlentheorie in der Diskreten Mathematik. Auch diesen Teil habe ich zweimal in Vorlesungen erpobt; wertvolle Hinweise dazu gaben Dr. Sabine Lauer, geb. Ricker, Prof. Dr. J¨ orn Steuding und Dr. Manfred Streit. LATEX-Unterst¨ utzung hatte ich diesmal von Dr. J¨ org Lehnert und Dipl.-Math. Benjamin M¨ uhlbauer. ¨ Die sich schon vor 14 Jahren abzeichnende Anderung der Studienordnungen ist eingetreten, und wir werden f¨ ur einige Jahre mit dem neuen System leben m¨ ussen. Wie f¨ ugt sich das vorliegende Buch in Bachelor und Master ein? Nach meiner Erfahrung eignen sich die Kapitel 1 bis 4 f¨ ur eine 4-st¨ undige Vorlesung in den ersten beiden Studienjahren, und im Anschluss daran mag man aus den sp¨ ateren Kapiteln eine freie Auswahl treffen f¨ ur Veranstaltungen des Bachelor-Hauptstudiums oder f¨ ur den Beginn des Masterstudiums; einzige Nebenbedingung: Kapitel 7 baut auf Kapitel 6 auf. Frankfurt, im Sommer 2010, J¨ urgen Wolfart
xi
Inhaltsverzeichnis
Inhaltsverzeichnis 1 Ganze Zahlen, Teilbarkeit 1.1 Nat¨ urliche und ganze Zahlen . . . . . . 1.2 Gr¨oßter gemeinsamer Teiler, euklidischer 1.3 Primfaktorzerlegung . . . . . . . . . . . 1.4 Primzahlen . . . . . . . . . . . . . . . . 1.5 Kongruenzen und Reste . . . . . . . . . 1.6 Aufgaben . . . . . . . . . . . . . . . . .
. . . . . . . . Algorithmus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2 Gruppen 2.1 Definition, Beispiele, elementare Eigenschaften 2.2 Untergruppen und Homomorphismen . . . . . . 2.3 Index und Ordnung . . . . . . . . . . . . . . . . 2.4 Normalteiler und Faktorgruppen . . . . . . . . 2.5 Isomorphies¨atze . . . . . . . . . . . . . . . . . . 2.6 Operation von Gruppen auf Mengen . . . . . . 2.7 Sylowuntergruppen . . . . . . . . . . . . . . . . 2.8 Produkte und universelle Eigenschaften . . . . 2.9 Endliche abelsche Gruppen . . . . . . . . . . . 2.10 Aufgaben . . . . . . . . . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
1 . 1 . 3 . 6 . 9 . 15 . 21
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
25 25 31 36 38 40 42 46 51 54 57
3 Ringe 3.1 Grundbegriffe . . . . . . . . . . . . . . . . . . . . 3.2 Ideale und Restklassenringe . . . . . . . . . . . . 3.3 Polynome . . . . . . . . . . . . . . . . . . . . . . 3.4 Euklidische und faktorielle Ringe . . . . . . . . . 3.5 Diophantische Fragen zu Zahlen und Polynomen 3.6 Aufgaben . . . . . . . . . . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
61 61 66 71 75 84 89
4 Arithmetik modulo n 4.1 Multiplikative zahlentheoretische Funktionen 4.2 Die Struktur der primen Restklassengruppe . 4.3 Quadratische Reste . . . . . . . . . . . . . . . 4.4 Das quadratische Reziprozit¨atsgesetz . . . . . 4.5 Das Jacobisymbol . . . . . . . . . . . . . . . 4.6 Verzweigung von Primzahlen . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
91 91 96 103 106 108 111
. . . . . .
. . . . . .
xii
Inhaltsverzeichnis
4.7
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
5 Primzahltests und Primfaktorzerlegung 5.1 Das RSA-Schema . . . . . . . . . . . . . . . . . . . . . . . . 5.2 Der Kleine Fermatsche Satz als Primzahltest . . . . . . . . 5.3 Riemannsche Vermutung und probabilistische Primzahltests 5.4 Faktorisierungsverfahren . . . . . . . . . . . . . . . . . . . . 5.5 Ein Ausblick auf elliptische Kurven . . . . . . . . . . . . . . 5.6 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
117 117 119 124 131 137 142
6 K¨ orper und K¨ orpererweiterungen 6.1 Grundbegriffe . . . . . . . . . . . . . 6.2 Algebraische K¨orpererweiterungen . 6.3 Der algebraische Abschluss . . . . . 6.4 Normalit¨at und Separabilit¨at . . . . 6.5 Transzendente K¨orpererweiterungen 6.6 Aufgaben . . . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
145 145 148 154 157 162 166
7 Galoistheorie 7.1 Der Hauptsatz der Galoistheorie . . . . . . . . . . . . . 7.2 Kreisteilungsk¨orper . . . . . . . . . . . . . . . . . . . . . 7.3 Endliche K¨orper . . . . . . . . . . . . . . . . . . . . . . 7.4 Quadratische Gaußsche Summen . . . . . . . . . . . . . 7.5 Nochmals das quadratische Reziprozit¨ atsgesetz . . . . . 7.6 Konstruktionen mit Zirkel und Lineal . . . . . . . . . . 7.7 Kummer-Theorie. Aufl¨osung algebraischer Gleichungen 7.8 Einfache Gruppen . . . . . . . . . . . . . . . . . . . . . 7.9 Einfache lineare Gruppen . . . . . . . . . . . . . . . . . 7.10 Arithmetik der Werte der e-Funktion . . . . . . . . . . . 7.11 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
169 169 174 181 183 188 190 194 204 208 215 224
8 Gitter 8.1 Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . 8.2 Untergitter und Elementarteiler . . . . . . . . . . . . . . . 8.3 Der Minkowskische Gitterpunktsatz . . . . . . . . . . . . 8.4 Anwendungen des Gitterpunktsatzes . . . . . . . . . . . . 8.5 Das Kreis- und Kugelproblem . . . . . . . . . . . . . . . . 8.6 Der Satz von Minkowski-Hlawka . . . . . . . . . . . . 8.7 Packungsdichte . . . . . . . . . . . . . . . . . . . . . . . . 8.8 Packungsdichte und Codierungstheorie . . . . . . . . . . . 8.9 Golay-Code und Leech-Gitter . . . . . . . . . . . . . . . . 8.10 Reduktionstheorie . . . . . . . . . . . . . . . . . . . . . . 8.11 Bin¨are quadratische Formen: Reduktion und Klassenzahl .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
227 227 230 235 239 242 245 251 258 264 267 273
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
Inhaltsverzeichnis
xiii
8.12 Der LLL-Algorithmus . . . . . . . . . . . . . . . . . . . . . . . . . 279 8.13 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 284 L¨ osungshinweise zu den Aufgaben
287
Literaturverzeichnis
295
Index
300
1
1 Ganze Zahlen, Teilbarkeit
1 Ganze Zahlen, Teilbarkeit 1.1 Nat¨ urliche und ganze Zahlen 1.1.1 Die Peanoaxiome Die Menge der nat¨ urlichen Zahlen 1, 2, 3,... werden wir stets mit N bezeichnen. Sie l¨asst sich axiomatisch beschreiben durch die Peanoaxiome (benannt nach dem Mengentheoretiker und Logiker Giuseppe Peano 1858 – 1932): • N enth¨alt eine Zahl namens 1 (ist also insbesondere nichtleer) • Jede Zahl n ∈ N besitzt einen Nachfolger N (n) ∈ N (sp¨ ater n + 1 genannt) • Es gibt keine Zahl n ∈ N mit dem Nachfolger 1 = N (n) • Die Nachfolgerfunktion N ist injektiv, d.h. N (n) = N (m)
⇒
n=m
• Das Prinzip der vollst¨ andigen Induktion : Jede Menge von nat¨ urlichen Zahlen, welche die 1 enth¨alt, und welche zu jeder Zahl n auch deren Nachfolger N (n) enth¨alt, enth¨alt alle nat¨ urlichen Zahlen. Bekanntlich l¨asst sich das Prinzip der vollst¨ andigen Induktion auch zum Aufbau induktiver oder rekursiver Definitionen verwenden, z.B. l¨ asst sich die Addition auf N durch n + 1 := N (n) m + N (n) := N (m + n) definieren und die Multiplikation durch m · 1 := m m · N (n) := m · n + m. ¨ Als Ubungsaufgabe definiere man die Anordnung der nat¨ urlichen Zahlen und leite die u ¨blichen Vertr¨aglichkeitsbedingungen der Anordnung mit Addition und Multiplikation her. Eine vielgebrauchte Variante des letzten Axioms lautet dann: Eine Eigenschaft E trifft auf alle nat¨ urlichen Zahlen zu, wenn E(1) richtig ist und wenn man aus der Richtigkeit von E(m) f¨ ur alle nat¨ urlichen m < n auf die ¨ von E(n) schließen kann. Ahnlich wichtig ist die Folgerung J. Wolfart, Einführung in die Zahlentheorie und Algebra, DOI 10.1007/978-3-8349-6498-4_1, © Vieweg+Teubner Verlag | Springer Fachmedien Wiesbaden GmbH 2011
2
1.1 Nat¨ urliche und ganze Zahlen
Satz 1.1 Jede nichtleere Menge nat¨ urlicher Zahlen besitzt ein kleinstes Element. Zum Beweis definiere man M als die Menge nat¨ urlicher Zahlen mit der folgenden Eigenschaft: n ∈ M genau dann, wenn jede Untermenge nat¨ urlicher Zahlen, welche n enth¨alt, auch ein kleinstes Element besitzt.
1.1.2 Ganze Zahlen Die Menge Z der ganzen oder ganzrationalen Zahlen . . .−2, −1, 0, 1, 2, . . . l¨ asst ¨ sich mit Hilfe von Paaren nat¨ urlicher Zahlen erzeugen, wenn man zu Aquivalenz¨ klassen bez¨ uglich der Aquivalenzrelation (a, b) ∼ (c, d) : ⇐⇒ a + d = b + c u ¨bergeht. Wir setzen im folgenden die u ¨blichen Rechenregeln der Addition und Multiplikation in Z als bekannt voraus (insbesondere sind die Ringaxiome“ in Z ” g¨ ultig, vgl. Kap.3), auch den Umgang mit Anordnung und Absolutbetr¨ agen. Definition. Die Zahl n ∈ Z teilt die Zahl m ∈ Z bzw. heißt Teiler von m, wenn ein x ∈ Z existiert mit m = n · x, geschrieben n | m. Die Zahl m heißt dann Vielfaches von n. Wenn keine Missverst¨andnisse zu erwarten sind, werden wir im Folgenden den Multiplikationspunkt weglassen. F¨ ur die Teilbarkeit gelten die folgenden einfachen Regeln: Satz 1.2 F¨ ur alle ganzen Zahlen a, b, c, d, x, y gilt 1. d | a
⇒
d | ab
2. d | c und c | a
⇒
d|a
3. d | a und d | b
⇒
d | xa + yb
4. d | c
⇒
c = 0 oder |d| ≤ |c|
5. d | c und c | d
⇔
c = ±d.
Klar, dass die dritte Aussage auch f¨ ur Linearkombinationen von mehr als zwei Vielfachen von d richtig bleibt. Wenn a und b ∈ Z sind, b = 0, dann enth¨ alt die Menge { a−bq | q ∈ Z } nat¨ urliche Zahlen, nach Satz 1.1 also eine kleinste. Wenn b kein Teiler von a ist, geschrieben b a, muss diese notwendig zwischen 1 und |b| − 1 liegen. Damit erhalten wir den Satz 1.3 (Division mit Rest) Seien a, b ∈ Z, b = 0, dann existieren ein q ∈ Z und ein Rest r ∈ {0, . . . , |b| − 1} mit a = bq + r.
3
1 Ganze Zahlen, Teilbarkeit
1.2 Gr¨ oßter gemeinsamer Teiler, euklidischer Algorithmus 1.2.1 ggT und kgV Da eine ganze Zahl = 0 nur endlich viele Teiler besitzt, haben zwei ganze Zahlen a, b, nicht beide = 0, einen gr¨ oßten gemeinsamen Teiler d ∈ N, kurz ggT(a, b) oder einfach (a, b) genannt. Im Fall a = b = 0 definieren wir (aus Gr¨ unden, die aus einer nat¨ urlichen Verallgemeinerung des Begriffs in der Ringtheorie verst¨ andlich werden, vgl. Kap. 3) (0, 0) := 0. Wenn (a, b) = 1, wenn also a und b nur die trivialen gemeinsamen Teiler 1 und −1 besitzen, heißen a und b teilerfremd. Da zwei ganze Zahlen = 0 gemeinsame nat¨ urliche Vielfache besitzen, z.B. |a| · |b|, gibt es auch ein kleinstes gemeinsames Vielfaches kgV(a, b) ∈ N, kurz [a, b] geschrieben. Ist eine der beiden Zahlen = 0, so ist nat¨ urlich [a, b] := 0. Der gr¨oßte gemeinsame Teiler macht eine Aussage u osbarkeit linearer ¨ber die L¨ diophantischer Gleichungen, d.h. Gleichungen, f¨ ur die ganzzahlige L¨ osungen gesucht werden: Satz 1.4 Seien a, b ∈ Z, nicht beide = 0, und sei d := (a, b). Dann ist aZ + bZ := {xa + yb | x, y ∈ Z} = dZ := {md | m ∈ Z}. d ist also die kleinste nat¨ urliche Zahl, die sich als ganzzahlige Linearkombination von a und b schreiben l¨asst. Wenn insbesondere a und b teilerfremd sind, hat die Gleichung xa + yb = 1 (1.1) eine ganzzahlige L¨osung. Beweis: Sei m die kleinste nat¨ urliche Zahl in der Menge L := {xa + yb | x, y ∈ Z} der ganzzahligen Linearkombinationen von a und b . Nach Satz 1.2.3 teilt d jede Zahl in L , also gilt L ⊆ dZ , insbesondere d | m . Andererseits ist m | a, denn a ∈ L, alle Vielfachen qm ∈ L f¨ ur alle q ∈ Z, also auch a − qm ∈ L . Division mit Rest von a durch m kann aber keinen Rest = 0 ergeben, weil m ∈ L ∩ N minimal gew¨ahlt war, also muss m ein Teiler von a sein. Mit dem gleichen Argument zeigt man m | b, also m ≤ d. Mit d | m folgt daraus nach Satz 1.2.5 d = m . Da alle Vielfachen davon in L liegen, gilt auch dZ ⊆ L . 2 Teilbarkeit definiert auch eine (Teil-)Ordnung auf den nat¨ urlichen Zahlen, und auch bez¨ uglich dieser Ordnung ist der ggT das maximale Element unter den gemeinsamen Teilern von a und b:
4
1.2 Gr¨ oßter gemeinsamer Teiler, euklidischer Algorithmus
Folgerung 1.5 Seien a, b ∈ Z, nicht beide = 0, ferner c, t ∈ N, t ein gemeinsamer Teiler von a und b. Dann gelten (ca, cb) = c(a, b)
,
t | (a, b)
und
(a, b) a b ( , ) = t t t
.
F¨ ur das kgV gelten entsprechende Eigenschaften: [a, b]Z = aZ ∩ bZ , jedes gemeinsame Vielfache v ∈ N von a und b erf¨ ullt [a, b] | v , und ggT und kgV lassen sich auseinander berechnen verm¨ oge [a, b]Z = aZ ∩ bZ ,
[a, b] =
|ab| . (a, b)
1.2.2 Der euklidische Algorithmus Die explizite — und hoffentlich m¨oglichst effektive — Bestimmung des ggT oder der L¨osungen der Gleichung (1.1) ist mit dem Existenzsatz 1.4 noch nicht automatisch gesichert. Die Verwendung der eindeutigen Primfaktorzerlegung (Abschnitt 1.3) oder gar von Probierverfahren w¨are zwar m¨ oglich, aber ¨ außerst m¨ uhsam, um z.B. (288, 168) = 24 zu zeigen. Sukzessive Anwendung der Division mit Rest f¨ uhrt dagegen sehr schnell zum Ziel: 288 = 1 · 168 + 120 168 = 1 · 120 + 48 120 = 2 · 48 + 24 48 = 2 · 24 Liest man das Gleichungssystem von unten nach oben, so sieht man sofort, dass 24 gemeinsamer Teiler von 288 und 168 ist. Von oben nach unten gelesen ergibt sich 24 als ganzzahlige Linearkombination von 288 und 168 (welche?), also muss 24 nach Satz 1.4 ein Vielfaches des ggT sein; damit ist die Behauptung bewiesen. ¨ Die gleiche Uberlegung l¨asst sich unmittelbar verallgemeinern: Satz 1.6 (Euklidischer Algorithmus) Seien a und b ∈ Z , beide = 0 . Wenn nicht schon b | a ist (also d = |b| ), ergibt sich d = (a, b) als der letzte nicht
5
1 Ganze Zahlen, Teilbarkeit
verschwindende Rest rn des folgenden Schemas von Divisionen mit Rest: a = q 1 b + r1 b = q2 r1 + r2 r1 = q3 r2 + r3 .. .. .. . . . rn−2 = qn rn−1 + rn rn−1 = qn+1 rn Die rk bilden eine monoton fallende Folge, daher muss in der Tat die Folge der Gleichungen bei einer Division mit Rest 0 enden. 2
1.2.3 Eine Laufzeitbetrachtung. Fibonaccizahlen Wieviele Divisionen sind erforderlich, um nach diesem Verfahren den ggT von a und b zu bestimmen? Es ist leicht zu sehen, dass wir uns auf den Fall positiver a ≥ b beschr¨anken k¨onnen. Wir formulieren die Frage um: Wie groß muss b mindestens sein, damit im euklidischen Algorithmus n + 1 Divisionen mit Rest erforderlich sind? Von unten gelesen ergibt das Gleichungssystem aus Satz 1.6 rn−1 = qn+1 rn rn−2 = (qn qn+1 + 1)rn .. .. .. . . . Induktion u ur b genau dann erreicht ¨ber n zeigt, dass der kleinstm¨ogliche Wert f¨ wird, wenn rn und alle qj = 1 sind, wenn also b = φn+1 (und a = φn+2 ) in der Folge (φn )n∈N = (1, 1, 2, 3, 5, 8, 13, 21, 34, . . .) der sogenannten Fibonaccizahlen ist (zuerst untersucht durch Leonardo von Pisa, ca. 1180 – 1250, genannt Fibonacci), die rekursiv durch φ1 = φ2 := 1
und
φn+1 := φn + φn−1
(1.2)
definiert werden. Durch Induktion l¨asst sich zeigen, dass n √ √ n 5+1 1 1− 5 . (1.3) φn = √ − 2 2 5 √ n 5−1 Wegen φn+1 ≤ b und weil stets zwischen 0 und 1 liegt, gilt die Unglei2 chung n+1 √ √ 5+1 < 5b + 1 2
6
1.3 Primfaktorzerlegung
(f¨ ur große b > b0 (ε) sogar
1 und p nur die trivialen Teiler ±1 und ±p besitzt. Hilfssatz 1.8 Jede nat¨ urliche Zahl l¨ asst sich als Produkt von Primzahlen schreiben. Sei dazu n die kleinste nat¨ urliche Zahl, f¨ ur die wir dies noch nicht wissen. Dann ist n = 1 (leeres Produkt von Primzahlen) oder eine Primzahl oder nichttriviales Produkt von kleineren nat¨ urlichen Zahlen, f¨ ur die die Aussage bereits bekannt ist. Dann ist die Aussage auch f¨ ur n gesichert. 2
7
1 Ganze Zahlen, Teilbarkeit
1.3.2 Eindeutigkeit Es ist wesentlich weniger trivial, die Eindeutigkeit der Primfaktorzerlegung zu zeigen, wie man sich anhand des folgenden Beispiels u ¨berzeugt: In √ R := {n + m −26 | n, m ∈ Z} ⊂ C gelten f¨ ur Addition und Multiplikation ¨ahnliche Gesetze wie in Z (die Ringaxiome, vgl. Kap. 3); insbesondere lassen sich ganz analog Teilbarkeit und Primzahlen – hier besser irreduzible Elemente genannt, vgl. √ Abschnitt 3.4 – definieren. Es ist leicht zu zeigen, dass die Zahlen 3 und 1 ± −26 irreduzibel sind, d.h. h¨ ochstens trivial in Produkte zerlegbar sind, dass aber √ √ 27 = 3 · 3 · 3 = (1 + −26) · (1 − −26) gilt, dass also diese Primfaktorzerlegung nicht eindeutig ist. Wie dieser Abschnitt zeigen wird, sind wir in Z in einer sehr viel besseren Situation. Hilfssatz 1.9 Seien a, b, c ∈ Z und (a, b) = 1 . Aus a | bc folgt a | c . Zum Beweis multipliziere man die Gleichung (1.1) mit c: Beide Summanden von acx + bcy = c sind nach Voraussetzung durch a teilbar, also auch c. 2 Folgerung 1.10 Seien b, c ∈ Z und p eine Primzahl mit p | bc. Dann gilt p | b oder p | c. Entsprechendes gilt f¨ ur Produkte aus mehr als zwei Faktoren. Satz 1.11 (eindeutige Primfaktorzerlegung) Jede nat¨ urliche Zahl n l¨asst sich als Produkt von Primzahlen schreiben. Dessen Faktoren, die Primfaktoren von n, sind bis auf die Reihenfolge eindeutig bestimmt. W¨are der Satz falsch, so g¨abe es ein kleinstes n ∈ N (die Suche nach dem ” kleinsten Verbrecher“) mit zwei wesentlich verschiedenen Primfaktorzerlegungen q1 q2 . . . qk = p1 p2 . . . pm . Wesentlich verschieden“ heißt hier, dass die Menge der Primzahlen qi disjunkt ” von der Menge der Primzahlen pj ist; andernfalls k¨ onnte man n per Division durch einen Primfaktor verkleinern. Jedes qi teilt n, nach Folgerung 1.10 also eines der pj , also m¨ ussen doch Gleichungen qi = pj gelten im Widerspruch zu unserer Annahme, der Satz ist also richtig. 2
8
1.3 Primfaktorzerlegung
1.3.3 Anwendungen der eindeutigen Primfaktorzerlegung Fasst man gleiche Primfaktoren zu Primpotenzen zusammen, so kann man jedes a ∈ Z − {0} in der Form m νp (a) pj j a = ± j=1
schreiben, wobei νp (a) die Multiplizit¨at angibt, mit der die Primzahl p in der Primfaktorzerlegung von |a| vorkommt. Sie wird auch als die p-Ordnung von a bezeichnet und ordp (a) geschrieben. Es liegt nahe, νp (a) := 0 zu setzen, wenn p kein Teiler von a ist. Bezeichnet man die Menge aller Primzahlen mit P, so l¨ asst sich die Primfaktorzerlegung von a als formal unendliches Produkt pνp (a) a = ± P
schreiben. Definiert man erg¨anzend noch νp (0) := ∞, so erh¨ alt man folgende neue Beschreibung von ggT und kgV: Satz 1.12 Seien a, b ∈ Z und p eine Primzahl. Dann gelten νp ((a, b)) = min{νp (a), νp (b)}
und
νp ([a, b]) = max{νp (a), νp (b)}.
Die p-Ordnungen sind mit Addition und Multiplikation vertr¨ aglich. Bevor wir diese Gesetze pr¨azise formulieren, wollen wir die Definition von νp noch in naheliegender Weise auf die Menge Q der rationalen Zahlen durch a := νp (a) − νp (b) νp f¨ ur alle a, b ∈ Z , b = 0 b ausdehnen (wohldefiniert, weil Erweiterung des Bruchs die p-Ordnung nicht ¨ andert). Dann best¨atigt man leicht, dass folgende Aussagen richtig sind: Satz 1.13 Seien a, b ∈ Q und p eine Primzahl. Dann gilt νp (a + b) ≥ min{νp (a), νp (b)}
(1.4)
νp (ab) = νp (a) + νp (b) a νp = νp (a) − ν(b) , b
(1.5) wenn
b = 0.
(1.6)
Nach (1.5) gilt insbesondere νp (r2 ) = 2νp (r) f¨ ur jedes r ∈ Q. Da ν2 (2) = 1 und νp (2) = 0 f¨ ur alle Primzahlen p = 2 ist, kann 2 auch in Q keine Quadratzahl sein. Demnach gilt √ 2 ist irrational. ur alle d ∈ N , die nicht bereits Satz 1.14 √ Allgemeiner ist f¨ in N Quadratzahlen sind, d ∈ / Q.
9
1 Ganze Zahlen, Teilbarkeit
1.4 Primzahlen 1.4.1 Unendlichkeit der Primzahlmenge Satz 1.15 Die Menge P = {2, 3, 5, 7, 11, 13, 17, 19, . . .} der Primzahlen ist unendlich. Dieser Satz ist seit der Antike bekannt, und man verf¨ ugt u ¨ber verschiedene Beweise. Der bekannteste und wahrscheinlich elementarste stammt von Euklid (etwa um 300 vor Chr.): W¨are P endlich = {p1 , p2 , . . . , pn }, so k¨ onnte die Zahl N := p1 p2 · . . . · pn + 1 ∈ N keines der p1 , . . . , pn als Primteiler besitzen. Nach dem Satz u ¨ber die eindeutige Primfaktorzerlegung muss es also weitere Primzahlen geben. 2 Ein weiterer einfacher Beweis stammt von Leonhard Euler (1707 – 1783): W¨are P endlich, so ließe sich das endliche Produkt absolut konvergenter unendlicher Reihen ∞
1 −1 −ν = p 1− p p∈P p∈P ν=0 1 gliedweise ausmultiplizieren zu einer konvergenten Reihe n , in der jedes Potenzprodukt n der p ∈ P genau einmal vorkommt. Nach dem Satz u ¨ber die eindeutige Primfaktorzerlegung handelt es sich also gerade um die harmonische Reihe, welche bekanntlich divergiert. 2 Die explizite Auflistung der Primzahlmenge erfolgt auch heute noch am einfachsten mit dem Sieb des Eratosthenes (um 276 – 196 v. Chr.): Kennt man √ √ bereits alle p ≤ x, so streiche man alle ihre Vielfachen zwischen x und x. √ Die u urlichen Zahlen sind die Primzahlen zwischen x und ¨briggebliebenen nat¨ x (warum?).
1.4.2 Primzahlverteilung Mit Euklids Beweis kann man bereits eine – allerdings sehr schlechte – untere Absch¨atzung f¨ ur die Primzahlfunktion π(x) := #{p ∈ P | p ≤ x} = 1 p∈P, p≤x
¨ geben. Ahnlich l¨asst sich Eulers Beweis ausbauen zu einem Beweis, dass p−1 p∈P
10
1.4 Primzahlen
divergiert, dass also — grob gesprochen — mehr Primzahlen als Quadratzahlen in N existieren. Numerische Rechnungen lassen erwarten, dass π(x) sogar bei wei√ tem gr¨oßer ist als x : x 103 104 105 106 107
π(x)
x/ log(x) ≈
168 1229 9592 78498 664579
145 1086 8686 72382 620421
π(x) · log(x)/x
li(x) ≈
π(x)/li(x)
1, 16 1, 132 1, 104 1, 084 1, 071
178 1246 9630 78628 664918
0, 94 0, 986 0, 996 0, 9983 0, 9995
(F¨ ur weitergehende Resultate siehe z.B. [Gra], [Rie], [Ri2].) Die Tabelle suggeriert einen hier nicht bewiesenen Satz: Satz 1.16 (Primzahlsatz (I)) lim
x→∞
π(x) x log x
=
1
Carl Friedrich Gauß (1777 – 1855) hat diesen Satz bereits in der Form
x dt π(x) ∼ li(x) := 2 log t vermutet. Die Verwendung des Integrallogarithmus li(x) hat den Vorzug, dass der Primzahlsatz die folgende heuristisch-anschauliche Interpretation bekommt: log1 n gibt die Wahrscheinlichkeit an, dass n ∈ N eine Primzahl ist. f (x) ∼ g(x) soll daf (x) bei bedeuten, dass limx→∞ g(x) = 1 ist. Ein weiterer Vorzug der Verwendung von li(x) anstelle von logx x besteht im besseren Restglied f¨ ur die genaueren Versionen des Primzahlsatzes (s.u.). Beide Funktionen k¨ onnen im Satz 1.16 gleichermaßen verwendet werden, da sie li(x) ∼ logx x erf¨ ullen, genauer
x x +O , li(x) = log x log2 x wenn wir den Fehler mit dem Landauschen Symbol O bezeichnen; O(g(x)) ist eine Funktion f (x), f¨ ur die eine positive Konstante C existiert mit |f (x)| ≤ C · g(x). Ein Beweis des Primzahlsatzes gelang erst 1896, und zwar gleichzeitig durch Ha´e-Poussin nach Vorarbeiten von Bernhard Riedamard und de la Valle mann (1826 – 1866). Dieser hat die Riemannsche Zetafunktion 1 ζ(s) := ns n∈N
1 Ganze Zahlen, Teilbarkeit
11
in die Primzahltheorie eingef¨ uhrt, bis in die f¨ unfziger Jahre unseres Jahrhunderts ein unentbehrliches Hilfsmittel zum Beweis von Satz 1.16. Erst dann wurden auch elementare“ Beweise des Primzahlsatzes gefunden (Selberg nach Vorarbeiten ” von Erd¨ os). Auch diese Beweise sind alles andere als einfach und erbringen bis heute kein so gutes Restglied wie die Verwendung der Riemannschen Zetafunktion in C. Die beste heute beweisbare Version des Satzes stammt von I.M. Vinogradov und Korobov: Satz 1.17 (Primzahlsatz (II)) F¨ ur eine geeignete Konstante c > 0 ist π(x) = li(x) + O{x · exp −c log3/5 x(log log x)−1/5 }.
1.4.3 Vermutungen u ¨ber Primzahlen Man vermutet, dass π(x) noch n¨aher an li(x) verl¨ auft, dass n¨ amlich der Primzahlsatz (III):
√ π(x) = li(x) + O( x log x)
richtig ist. Diese Version des Primzahlsatzes w¨ urde folgen aus der Riemannschen Vermutung: Die Zetafunktion (die sich als meromorphe Funktion in die komplexe Zahlenebene C fortsetzen l¨ asst) hat im Streifen 0 < Re s < 1 keine Nullstellen außerhalb der kritischen Geraden Re s = 1/2. Diese Vermutungen wie die nun folgenden werden durch immer weiter gehende Computer-gest¨ utzte Rechnungen nahegelegt, aber von einem Beweis scheint man sehr weit entfernt zu sein. Einige Popularit¨ at genießt auch die sogenannte Goldbachsche Vermutung: Jede gerade nat¨ urliche Zahl > 2 ist Summe von zwei Primzahlen. Es fehlen hier leider Platz und mathematische Voraussetzungen, n¨ aher auf die Methoden (in diesem Falle Siebmethoden) einzugehen, mit denen diese offenen Probleme angegangen werden, oder auf die Fortschritte, die auf diesem Wege bisher erzielt wurden. Dazu sei auf Vorlesungen und Literatur u ¨ber analytische Zahlentheorie verwiesen. Ich beschließe diesen Abschnitt darum mit der Vermutung u ¨ ber Primzahlzwillinge: Es gibt unendlich viele Primzahlpaare p, p + 2 ∈ P wie z.B. 11, 13 oder 71, 73 oder 65516468355 × 2333333 ± 1 (laut
12
1.4 Primzahlen
Wikipedia vom 25.8.2010; mehr und ¨altere Beispiele in [Ri2]). Genauer erwartet man sogar, dass die Anzahl der Primzahlzwillinge ≤ x
1 x 1− ·2 π2 (x) ∼ (p − 1)2 log2 x p∈P,p>2
erf¨ ullt. Analoge Vermutungen hat man f¨ ur Primzahltripel p, p + 2, p + 6 (warum nicht p, p + 2, p + 4 ?) oder allgemeiner f¨ ur k-Tupel aus Primzahlen. Gute numerische Best¨atigung, wie sie auch hier vorliegt, darf aber nicht zu ernst genommen werden. Z.B. wurde lange Zeit angenommen, gest¨ utzt auf experimentelle Erfahrung, dass f¨ ur alle x und y ≥ 2 π(x + y) ≤ π(x) + π(y) richtig sei. Es hat sich herausgestellt, dass diese Vermutung im Widerspruch steht zur Primzahl-k-Tupel-Vermutung ([HR]), die in weit h¨ oherem Maß plausibel ist. Arbeiten von Helmut Maier und anderen haben in den letzten Jahren neues Licht auf M¨oglichkeiten und Grenzen solcher plausibler Vermutungen u ¨ber Prim¨ zahlen geworfen. Man vergleiche hierzu den Ubersichtsartikel von Granville [Gra].
1.4.4 Primzahlen in arithmetischen Progressionen Als Variante der Primzahl-k-Tupel-Vermutung kann man auch die Frage ansehen, wie lang arithmetische Progressionen p , p + n , p + 2n , . . . werden k¨ onnen, die nur aus Primzahlen bestehen. Das Beispiel 7
37
67
97
127
157
endet hier wegen 187 = 11 · 17 . Es ist klar, dass die L¨ ange dieser arithmetischen Progression immer nur endlich sein kann, sonst w¨ urde die Primzahlfunktion linear mit x wachsen, und mit Ideen des n¨achsten Abschnitts 1.5 kann man leicht einsehen, dass f¨ ur jedes feste n die L¨ange einer solchen Progression beschr¨ ankt sein muss durch eine Gr¨oße, die nur von den Primteilern von n abh¨ angt, vgl. Aufgabe 1.26. Die l¨angste gegenw¨artig (August 2010) bekannte arithmetische Progression besteht aus 26 Primzahlen. Die Frage, ob es eine absolute Maximall¨ ange f¨ ur arithmetische Progressionen aus Primzahlen gibt, erscheint darum ebensowenig aussichtsreich wie die oben beschriebenen Vermutungen. Im neuen Jahrtausend hat es aber unerwartete Fortschritte gegeben: Mit innovativen Ideen, inspiriert von ganz anderen Teilen der Mathematik wie Kombinatorik und Wahrscheinlichkeitstheorie — und leider außerhalb des Horizonts des vorliegenden Buchs, haben Terence Tao und Ben Green in [GT] bewiesen: Satz Es gibt beliebig lange arithmetische Progressionen, die nur aus Primzahlen bestehen.
13
1 Ganze Zahlen, Teilbarkeit
1.4.5 Der Satz von Tschebyscheff Nach bloßem Bericht und viel Spekulation soll nun wenigstens gezeigt werden, dass der Primzahlsatz die richtige Gr¨oßenordnung f¨ ur π(x) gibt: F¨ ur alle n ∈ N, n ≥ 4, ist
Satz 1.18 (Tschebyscheff 1852)
n 1 n ≤ π(n) ≤ 6 4 log n log n
.
Der Beweis beruht darauf, dass man f¨ ur den Binomialkoeffizienten 2n n einerseits hinreichend genaue Gr¨oßenabsch¨atzungen hat, andererseits viele Informationen u ¨ber seine Primfaktorzerlegung, z.B. kommen alle Primzahlen zwischen n und 2n genau einmal darin vor. Es wird sich herausstellen, dass diese Informationen f¨ ur eine grobe Anzahlaussage bereits gen¨ ugen. Im einzelnen folgt aus
2n 2n 2n > 4n = (1 + 1)2n = n k k=0
die rechte Ungleichung in
2
n
<
2n n
< 4n
,
(1.7)
die linke beweist man leicht mit vollst¨andiger Induktion f¨ ur alle n > 1. Wenn wie u oßte ganze Zahl ≤ r ∈ R bezeichnet ¨blich mit der Gaußklammer [r] die gr¨ wird, so l¨asst sich (Aufgabe 12 in Abschnitt 1.6) die Multiplizit¨ at von p ∈ P in der Primfaktorzerlegung von n! ausdr¨ ucken durch n νp (n!) = . (1.8) pm m≥1
[ pnm ]
= 0 f¨ ur alle m mit pm > n l¨auft die Summe jeweils nur von 1 bis 2n (2n)! n [ log alt man aus (1.7) log p ]. Durch Logarithmieren von n = (n!)2 erh¨ Wegen
n log 2 < log(2n)! − 2 log n! < 2n log 2 , und aus (1.8) folgt 2n [ log ]
log p 2n n − 2 log p . log(2n)! − 2 log n! = pm pm
p≤2n m=1
Die Glieder der inneren Summe sind 0 oder 1, denn 0 wenn x − [x] < [2x] − 2[x] = 1 wenn x − [x] ≥
1 2 1 2
.
(1.9)
14
1.4 Primzahlen
Ersetzt man also die innere Summe einfach durch die Anzahl ihrer Glieder, so erh¨alt man log 2n log p ≤ π(2n) log 2n . (1.10) n log 2 < log p p≤2n
F¨ ur gerade n folgt daraus schon die linke Ungleichung des Satzes, denn π(2n) >
n log 2 1 2n > log 2n 4 log 2n
wegen log 2 > 12 . Daraus folgt auch f¨ ur ungerade Argumente π(2n + 1) ≥ π(2n) >
2n + 1 1 4 log(2n + 1)
log 2 > 14 f¨ ur alle n ≥ 2. Die rechte Ungleichung des Satzes erh¨ alt man wegen n2n+1 u ¨ber den Umweg einer oberen Absch¨atzung der Funktion ϑ(x) := log p : p∈P,p≤x n [ 2n p ] − 2[ p ]
F¨ ur alle Primzahlen n < p < 2n ist = 1, also erh¨ alt man aus (1.7) und (1.9) log p ≤ log(2n)! − 2 log n! < 2n log 2 . ϑ(2n) − ϑ(n) = n 2
1 1− (p − 1)2 gegen einen Limes = 0 konvergiert. 12. Verifizieren Sie, dass f¨ ur die p-Ordnungen der Fakult¨ aten die Formel n n n νp (n!) = [ ] + [ 2 ] + [ 3 ] + . . . p p p richtig ist ( [
] die Gaußklammer). f¨ ur alle nat¨ urlichen n > 1 . 13. Man beweise 2n < 2n n 14. Analysieren und verbessern Sie den in Abschnitt 1.4.4 gegebenen Beweis des Satzes von Tschebyscheff. Durch sorgf¨ altigere Absch¨ atzungen sollten Sie erreichen, dass f¨ ur alle großen n > n0 c
n n ≤ π(n) ≤ d log n log n
gilt mit Konstanten c, d , welche m¨oglichst nahe an 1 liegen. n0 darf von c und d abh¨angen. 15. W¨ahlen Sie eine Primzahl p , eine beliebiges a ∈ Z und berechnen Sie die pten Potenzen [a]pp . Wiederholen Sie das Experiment, bis Sie eine Vermutung formulieren k¨onnen.
23
1 Ganze Zahlen, Teilbarkeit
16. Zeigen Sie, dass das u ¨ber alle Primzahlen erstreckte Produkt gegen ∞ konvergiert.
(1 − 1p )−1
17. Seien m ∈ N und k ∈ Z . Zeigen Sie, dass n =
m (m, k)
die kleinste nat¨ urliche Zahl mit der Eigenschaft m | nk ist. 18. W¨ahlen Sie sich drei verschiedene Primzahlen p zwischen 10 und 100 und berechnen Sie die Menge { [x]2p | [x]p ∈ Z/pZ } aller Quadrate mod p f¨ ur diese Primzahlen. Formulieren Sie eine Vermutung u ¨ber die Anzahl dieser Quadrate! 19. Welche Primzahlen < 100 lassen sich als die Summe von zwei Quadraten nat¨ urlicher Zahlen schreiben? Erkennen Sie eine Gesetzm¨ aßigkeit? 20. 17 chinesische Piraten erbeuten eine Truhe voller Goldst¨ ucke. Beim Versuch, diese gleichm¨aßig zu verteilen, bleiben 7 Goldst¨ ucke u ¨brig. Um diese entbrennt ein heftiger Streit, bei dem einer der Piraten das Leben l¨ asst. Die verbleibenden 16 versuchen erneut, die Goldst¨ ucke gerecht zu verteilen und behalten 11 M¨ unzen u ¨brig. Bei der Auseinandersetzung um diese geht ¨ erneut einer der Streitenden u gelingt dann ¨ber Bord. Den 15 Uberlebenden die Teilung. Wieviele Goldst¨ ucke m¨ ussen es mindestens gewesen sein? 21. Zeigen Sie durch eine Kongruenzbetrachtung, dass die diophantische Gleichung 7 x3 + 2 = y 3 keine ganzzahlige L¨osung besitzt. 22. Man zeige f¨ ur die Eulersche Phi-Funktion lim inf
ϕ(n) = 0 n
und
lim sup
ϕ(n) = 1. n
¨ 23. n ∈ N sei das Produkt zweier Primzahlen p, q . Uberlegen Sie sich, dass man p und q aus n und ϕ(n) berechnen kann. 24. Man zeige: Wenn p, p + 2, p + 6, p + 8, p + 14 gleichzeitig Primzahlen sind, so ist p = 5 . 25. Mit log sei die Logarithmusfunktion zu einer beliebigen reellen Basis a > 1 bezeichnet, und p1 , . . . , pn seien paarweise verschiedene Primzahlen. Fassen Sie R als Q-Vektorraum auf und beweisen Sie: log p1 , . . . , log pn sind linear unabh¨angig.
24 26. Sei q die kleinste Primzahl, welche n ∈ N nicht teilt, und die arithmetische Progression p , p + n , p + 2n , . . . , p + kn bestehe nur aus Primzahlen. Man zeige: Dann ist k < 2q − 1 . Wenn q nicht selbst in dieser Progression vorkommt, gilt sogar k < q − 1 .
25
2 Gruppen
2 Gruppen 2.1 Definition, Beispiele, elementare Eigenschaften 2.1.1 Gruppenaxiome Eine Menge G heißt eine (multiplikative) Gruppe, wenn 1. in G eine innere Verkn¨ upfung existiert, d.h. eine Abbildung G×G→G
:
(a, b) −→ a · b = ab ∈ G
∀ a, b ∈ G ,
2. diese Verkn¨ upfung (Multiplikation) assoziativ ist, d.h. wenn gilt (ab)c = a(bc)
∀ a, b, c ∈ G ,
3. ein Einselement oder neutrales Element e ∈ G existiert mit der Eigenschaft ae = a ∀ a ∈ G und f¨ ur jedes solche Einselement e (wir werden sp¨ ater sehen, dass es eindeutig bestimmt ist), und wenn 4. f¨ ur alle a ∈ G ein inverses Element a−1 ∈ G existiert mit der Eigenschaft a · a−1 = e . Wie von Zahlen und Restklassen her gewohnt, lassen wir in der Regel den Multiplikationspunkt weg. Gruppenverkn¨ upfungen sind aber keineswegs immer nur als Multiplikationen zu denken, wie die Beispiele des folgenden Abschnitts zeigen werden. Insbesondere gilt das in folgendem Fall: Wir nennen eine Gruppe abelsch oder kommutativ, wenn das Kommutativgesetz gilt, d.h. wenn ab = ba
∀ a, b ∈ G .
In diesem Fall wird die Verkn¨ upfung h¨aufig nicht als ab oder a · b geschrieben, sondern als Addition in der Form a+b. J. Wolfart, Einführung in die Zahlentheorie und Algebra, DOI 10.1007/978-3-8349-6498-4_2, © Vieweg+Teubner Verlag | Springer Fachmedien Wiesbaden GmbH 2011
26
2.1 Definition, Beispiele, elementare Eigenschaften
Zur besseren Unterscheidung wird manchmal das Verkn¨ upfungssymbol extra mit angef¨ uhrt, z.B. in der Form (G, +) f¨ ur eine (additiv geschriebene) abelsche Gruppe im Gegensatz zu einer multiplikativ geschriebenen Gruppe (G, ·) (die freilich auch kommutativ sein kann). Assoziativgesetz und Kommutativgesetz lassen sich induktiv auf eine beliebige Anzahl von Faktoren bzw. Summanden verallgemeinern. Das Assoziativgesetz garantiert, dass dabei Klammern weggelassen werden k¨ onnen, und das Kommutativgesetz, dass es auf die Reihenfolge nicht ankommt. Wenn letzteres gilt, schreiben wir f¨ ur l¨angere Produkte bzw. Summen a1 a2 · . . . · an =:
n
ai
bzw.
a1 + a2 + . . . + an =:
i=1
n
ai .
i=1
Potenzen von Elementen multiplikativer Gruppen werden wie bei Zahlen oder Restklassen durch Induktion u urlichen) Exponenten definiert, und ¨ber die (nat¨ auf ganzzahlige Exponenten dehnt man die Definition aus verm¨ oge a0 := e
und a−n := (a−1 )n
∀n ∈ N .
Man beachte, dass es auf die Reihenfolge der Faktoren hier niemals ankommt, denn in jeder Gruppe kommutieren a-Potenzen stets miteinander (Induktion, vgl. auch Satz 2.1.3). In additiv geschriebenen Gruppen schreibt man anstelle urlich −a und na anstelle von an , f¨ ur das neutrale Element e wird von a−1 nat¨ dann u ur e ¨blicherweise 0 geschrieben. In multiplikativen Gruppen werden wir f¨ h¨aufig 1 schreiben. Das dritte Axiom garantiert, dass Gruppen nichtleer sind. Die Anzahl der Elemente von G nennt man die Ordnung von G, geschrieben ord G . Diese kann eine nat¨ urliche Zahl oder unendlich sein (beides tritt auf, wie wir gleich sehen werden).
2.1.2 Beispiele 1.) Additive (abelsche) Gruppen sind R , Q , C , alle mit der u ¨blichen Addition versehen, ebenso alle Vektorr¨aume (mit der Vektoraddition als Verkn¨ upfung). Auch die Menge Z der ganzen Zahlen ist bez¨ uglich der Addition eine Gruppe, nicht aber bez¨ uglich der Multiplikation (warum?). Auch (N, +) ist keine Gruppe, da neutrales Element und Inverse fehlen. 2.) Multiplikative abelsche Gruppen sind z.B. alle K ∗ := K − {0}
f¨ ur K = R , C , Q .
27
2 Gruppen
3.) Alle bisher erw¨ahnten Beispiele sind Gruppen unendlicher Ordnung. Beispiele (von zentraler Bedeutung, wie wir noch sehen werden) f¨ ur Gruppen der Ordnung m ∈ N sind die Restklassenmengen Z/mZ mit der in Abschnitt 1.5.1 eingef¨ uhrten Restklassenaddition; f¨ ur die G¨ ultigkeit der Gruppenaxiome vgl. (1.11) bis (1.13). (1.14) sagt, dass es sich auch hier um eine kommutative Gruppe handelt. 4.) Etwas weniger trivial ist die Tatsache, dass alle (Z/mZ)∗ , m ∈ N, (abelsche) Gruppen bez¨ uglich der Restklassenmultiplikation sind, vgl. dazu (1.15), (1.17), (1.18) und vor allem Satz 1.23. Diese Gruppen haben die Ordnung ϕ(m) und werden prime Restklassengruppen mod m genannt. 5.) Unter den eben genannten Gruppen kommt mehrfach die triviale Gruppe vor, die nur aus dem neutralen Element besteht, n¨ amlich als Z/1Z , (Z/1Z)∗ und als (Z/2Z)∗ . 6.) Nichtkommutative Gruppen, die der Leser bereits aus den Anf¨ angervorlesungen kennt, sind die Gruppen GLn K der invertierbaren n×n-Matrizen mit Koeffizienten in (beispielsweise) K = R , C , Q , nat¨ urlich mit der Matrixmultiplikation als Verkn¨ upfung (kommutativ nur f¨ ur n = 1). Darin enthalten sind die Gruppen SLn K der Matrizen mit Determinante 1; der Determinantenmultiplikationssatz garantiert n¨amlich, dass die G¨ ultigkeit der Gruppenaxiome f¨ ur SLn K direkt aus der f¨ ur GLn K folgt. 7.) GLn und SLn kann man auch als Gruppen von Vektorraumautomorphismen ansehen mit der Hintereinanderausf¨ uhrung als Verkn¨ upfung. Dies l¨ asst sich leicht verallgemeinern auf die Menge SM aller Bijektionen M → M einer beliebigen nichtleeren Menge M auf sich. Verkn¨ upfung ist dann das Hintereinanderschalten dieser Abbildungen, neutrales Element ist die identische Abbildung e = id : M → M : a → a
∀a∈M ,
inverses Element ist die inverse Abbildung, und das Assoziativgesetz gilt f¨ ur alle Zusammensetzungen von Abbildungen, also auch hier. 8.) Ebenso wie GLn und SLn nicht aus allen Bijektionen des Vektorraums bestehen, sondern nur aus solchen, die Vektorraumverkn¨ upfungen bzw. sogar das Volumen erhalten, kann man an die Elemente von SM auch andere einschr¨ ankende Forderungen stellen, um neue Gruppen zu konstruieren. Z.B. kann man verlangen, dass die Elemente von GLn R zus¨atzlich ein Skalarprodukt invariant lassen, und erh¨alt durch diese Einschr¨ankung die orthogonale Gruppe dieses Skalarprodukts. Historisch ist auch der umgekehrte Weg versucht worden: Felix Kleins Erlanger Programm (1872) wollte Gruppen von Transformationen zugrunde legen und Geometrie beschreiben als die Invarianten dieser Transformationsgruppen.
28
2.1 Definition, Beispiele, elementare Eigenschaften
9.) Man u ¨berlege sich z.B., dass die (L¨angen-erhaltenden) Bewegungen der euklidischen Ebene, die ein regelm¨aßiges F¨ unfeck in sich u uhren, eine nicht¨berf¨ kommutative Gruppe der Ordnung 10 bilden. Wer komplexe Zahlen kennt, beschreibt die Ecken des F¨ unfecks am besten als die f¨ unften Einheitswurzeln e
2πik 5
,
k = 0, 1, 2, 3, 4 ,
in der komplexen Zahlenebene. Die gesuchte Symmetriegruppe des regelm¨ aßigen F¨ unfecks l¨asst sich dann in C beschreiben mittels Multiplikation mit f¨ unften Einheitswurzeln und komplexer Konjugation. 10.) Allgemein bedeutet der anschauliche Begriff Symmetrie bei einer geometrischen Figur oder Struktur stets das Vorhandensein einer Gruppe von Bewegungen des umgebenden Raumes, die diese Figur oder Struktur in sich u uhren. ¨berf¨ Eines der fr¨ uhesten Beispiele daf¨ ur sind die kristallographischen Gruppen, mit denen man Kristallformen nach ihren Symmetriegruppen klassifiziert. Heute spielen Symmetriegruppen sogar f¨ ur die Elementarteilchenphysik eine große Rolle.
2.1.3 Einfache Eigenschaften von Gruppen Satz 2.1 Sei G eine (multiplikativ geschriebene) Gruppe. 1. ea = ae = a
∀ a ∈ G , d.h. Rechtseins ist auch Linkseins.
2. Das Einselement e ist eindeutig bestimmt. 3. a−1 a = aa−1 = e
∀ a ∈ G , d.h. Rechtsinverses ist auch Linksinverses.
4. F¨ ur alle a ∈ G ist das inverse Element eindeutig bestimmt. 5. (ab)−1 = b−1 a−1 6. (a−1 )−1 = a
∀ a, b ∈ G .
∀a ∈ G .
7. ax = b und ya = b haben eindeutige L¨osungen f¨ ur alle a, b ∈ G , und zwar x = a−1 b , y = ba−1 . 8. In G gilt die Ku ¨ rzungsregel ab = ac
⇒
b=c
⇐
ba = ca .
Wir beginnen mit dem Beweis von 3.: Aus a−1 aa−1 = a−1 e = a−1 folgt durch Multiplikation mit (a−1 )−1 von rechts die Behauptung a−1 a = a−1 ae = a−1 (a−1 )−1 = e .
29
2 Gruppen
Daraus folgt 1. verm¨oge ea = aa−1 a = ae = a . W¨are e¯ ein zweites Einselement, so m¨ usste demnach e¯ = e¯e = e sein, also ist 2. richtig. Ganz analog beweist man die Eindeutigkeit des Inversen und ebenso leicht den Rest des Satzes. 2
2.1.4 Die symmetrische Gruppe Die symmetrische Gruppe Sn , n ∈ N , ist die Gruppe der Bijektionen oder Permutationen SM einer n-elementigen Menge M auf sich, vgl. Beispiel 7 im Abschnitt 2.1.2. Auf die Bezeichnung der Elemente von M kommt es nat¨ urlich nicht an, man kann darum o.B.d.A. M = {1, 2, . . . , n} annehmen, die Elemente von Sn also als Permutationen der Zahlen 1, . . . , n beschreiben. Diese Beschreibung erfolgt durch explizite Angabe von Urbild und Bild z.B. in Form einer zweizeiligen und n-spaltigen Matrix, in der oben die Urbilder und unten die zugeh¨origen Bilder aufgeschrieben werden. Das Element
1234567 ∈ S7 σ = 3245176 ist also jene Permutation, die 1 auf 3 , 2 auf 2 etc. abbildet bis hin zu σ(7) = 6. Wir werden im folgenden eine k¨ urzere Notation, die Zykelschreibweise verwenden: Jede Permutation wird durch ein oder mehrere Klammerausdr¨ ucke (a1 a2 . . . ak ) beschrieben, die ausdr¨ ucken, dass sie auf die aj ∈ M folgende Wirkung hat: a1 → a2 → . . . → ak → a1 In Zykelschreibweise hat das oben gew¨ahlte Beispiel also die Form σ = (1 3 4 5)(6 7) . Man beachte, dass Elemente, die unter der Permutation festgelassen werden, in dieser Notation gar nicht auftauchen (wie hier die 2), mit einer Ausnahme: Das neutrale Element von Sn , also die identische Abbildung, die jedes a ∈ M festl¨ asst, wird als (1) geschrieben. S1 ist (wieder einmal) die triviale Gruppe {(1)}, die Gruppe S2 besteht aus (1) und (12), ist kommutativ (und isomorph zu Z/2Z, was wir im kommenden Abschnitt pr¨azisieren werden). F¨ ur n > 2 sind die symmetrischen Gruppen nicht
30
2.1 Definition, Beispiele, elementare Eigenschaften
mehr kommutativ, wie wir an folgendem Beispiel sehen (man beachte, dass Produkte von Permutationen wie allgemein bei Abbildungen immer so zu lesen sind, dass die rechts stehende Permutation zuerst auszuf¨ uhren ist!): (1 2 3)(1 2) = (1 3) ,
aber
(1 2)(1 2 3) = (2 3)
Durch Induktion u ¨ber n zeigt man, dass es insgesamt n! Permutationen von M gibt, und dass jede Permutation durch Hintereinanderschalten von paarweise Vertauschungen gewonnen werden kann. In der Zykelschreibweise sind diese Elemente von der Form (a1 a2 ) und werden Transpositionen genannt. Beispiele sind etwa (1 2 3) = (1 3)(1 2) = (1 2)(2 3) σ = (1 3 4 5)(6 7) = (1 5)(1 4)(1 3)(6 7) . Wir fassen einige einfache Eigenschaften zusammen (die letzten drei Aussagen ¨ seien dem Leser als Ubungsaufgabe u ¨berlassen) in folgendem Satz 2.2 F¨ ur die symmetrische Gruppe Sn gilt: 1.
ord Sn = n!
ur n > 2 . 2. Sn ist nicht kommutativ f¨ 3. Sn wird von Transpositionen erzeugt, d.h. jedes σ ∈ Sn l¨asst sich als Produkt geeigneter (ai aj ) schreiben. 4. F¨ ur jeden Zykel gilt (a1 a2 . . . ak )−1 = (ak ak−1 . . . a2 a1 ) , insbesondere gilt f¨ ur Transpositionen (ai aj )−1 = (ai aj ) bzw. (ai aj )2 = (1) . ur die also keine Gleich5. Zwei disjunkte Zykeln (a1 . . . ak ) und (b1 . . . bm ) (f¨ heit ai = bj auftritt) kommutieren miteinander. 6. Bei Konjugation durch σ ∈ Sn , d.h. bei Abbildungen Sn → Sn :
τ → στ σ −1
transformieren sich Zykeln verm¨oge σ(a1 . . . ak )σ −1 = (σ(a1 ) . . . σ(ak )) . Wie praktisch Permutationsgruppen sind, l¨asst sich an der Symmetriegruppe des gleichseitigen Dreiecks erl¨autern: Numeriert man die Ecken mit 1, 2, 3, so lassen sich die Symmetriebewegungen des Dreiecks als Permutation der Eckpunkte lesen, und zwar entsprechen
31
2 Gruppen
• (1) , (1 2 3) , (1 3 2)
den Drehungen des Dreiecks,
• (1 2) , (2 3) , (1 3) den Spiegelungen des Dreiecks an den Winkelhalbierenden. Insgesamt erh¨alt man also gerade wieder die symmetrische Gruppe S3 . Auch allgemeiner ist die Vorstellung n¨ utzlich, dass Permutationen auch andere Mengen als nur Mengen von Zahlen permutieren k¨onnen. Numeriert man die Ecken des regelm¨aßigen F¨ unfecks mit 1, 2, 3, 4, 5 (vgl. Beispiel 9 in 2.1.2), so bewirken die zehn Elemente der Symmetriegruppe die Permutationen • (1) , (1 2 3 4 5) , (1 3 5 2 4) , (1 4 2 5 3) , (1 5 4 3 2)
als Drehungen,
• (1 4)(2 3) , (2 5)(3 4) , (1 3)(4 5) , (2 4)(1 5) , (1 2)(3 5)
als Spiegelungen.
Wie genau sich Geometrie und Gruppentheorie hier entsprechen, sieht man z.B. daran, dass ullen • die Spiegelungen σ involutorisch sind, d.h. σ = (1) , aber σ 2 = (1) erf¨ ¨ — in Ubereinstimmung mit Satz 2.2.4, • die Drehungen alle Potenzen eines Elements sind, geometrisch also durch onnen, sukzessive Drehung um den Winkel 2π 5 erzeugt werden k¨ • Konjugation einer Drehung mit einer Spiegelung gerade die inverse Drehung ergibt; das mache sich der Leser sowohl geometrisch wie anhand der Permutationen mit Hilfe von Satz 2.2.4 und 2.2.6 klar. Die genannten Permutationen bilden im Fall des F¨ unfecks nat¨ urlich nicht mehr die volle symmetrische Gruppe S5 , aber sie bilden immer noch eine Untergruppe, also eine in S5 enthaltene Gruppe. Dieses Konzept werden wir im kommenden Abschnitt systematisch entwickeln. Es wird sich herausstellen, dass man alle endlichen Gruppen mit geeigneten Gruppen von Permutationen identifizieren kann (auch das ist zu pr¨azisieren!) und dass es auch f¨ ur das Verst¨ andnis der Gruppenstruktur selbst n¨ utzlich ist, Operationen von Gruppen auf anderen Mengen zu betrachten, d.h. sie als Gruppen von Bijektionen aufzufassen, vgl. dazu Abschnitt 2.6.
2.2 Untergruppen und Homomorphismen 2.2.1 Untergruppen Sei (G, ·) eine Gruppe. Eine Untermenge U ⊆ G heißt Untergruppe von G, wenn sie bez¨ uglich der in G definierten Verkn¨ upfung selbst ebenfalls die Gruppenaxiome erf¨ ullt, m.a.W. wenn • f¨ ur alle a, b ∈ U auch ab ∈ U ist, • das neutrale Element e ∈ U ist,
32
2.2 Untergruppen und Homomorphismen
• f¨ ur alle a ∈ U auch das Inverse a−1 ∈ U ist. Man beachte, dass das Assoziativgesetz automatisch erf¨ ullt ist, weil es in G gilt. Die Bedingungen der Definition lassen sich formal vereinfachen, indem man nur verlangt: U = ∅ und ∀ a, b ∈ U ist auch ab−1 ∈ U . Um einzusehen, dass diese Definition ¨aquivalent ist zu der oben gegebenen, ersetze man nacheinander b durch a , a durch e und b durch b−1 . Beispiele f¨ ur Untergruppen sind zun¨achst einmal immer die trivialen Untergruppen U = G und U = {e}, außerdem etwa die folgende Kette ineinandergeschachtelter abelscher (additiv geschriebener) Gruppen {0} ⊂ mZ ⊂ Z ⊂ Q ⊂ R ⊂ C oder die Kette multiplikativ geschriebener Gruppen {1} ⊂ {1, −1} ⊂ Q∗ ⊂ R∗ ⊂ C∗ . Bei den nichtkommutativen Gruppen f¨allt uns sofort das Beispiel SLn K ⊂ GLn K ein. Die kleinste endliche nichtabelsche Gruppe ist — das werden wir sp¨ ater sehen — die symmetrische Gruppe S3 . Außer sich selbst und der trivialen Untergruppe {(1)} hat sie noch vier nichttriviale Untergruppen, n¨ amlich • die Drehgruppe {(1) , (1 2 3) , (1 3 2)} und • die Spiegelungsgruppen {(1) , (1 2)} , {(1) , (1 3)} , {(1) , (2 3)} . Die Bezeichnung kommt nat¨ urlich von der geometrischen Interpretation als Symmetriegruppe des gleichseitigen Dreiecks. Der Leser u achst als ¨berlege sich zun¨ ¨ Ubungsaufgabe, warum es keine weiteren Untergruppen der S3 geben kann; mit etwas mehr Theoriekenntnis werden wir sp¨ater einfache Begr¨ undungen daf¨ ur finden. Eine analoge Rechnung f¨ ur die Symmetriegruppe des regelm¨ aßigen F¨ unfecks ergibt außer den trivialen Untergruppen eine Untergruppe der Ordnung 5 und f¨ unf Untergruppen der Ordnung 2. Man mag schon einmal dar¨ uber spekulieren, was die Ordnungen der Untergruppen wohl mit der Ordnung der Gruppe zu tun haben.
2.2.2 Homomorphismen und zyklische Gruppen Die Abbildung h : G → H der Gruppe G in die Gruppe H (beide multiplikativ) heißt ein Gruppenhomomorphismus oder kurz Homomorphismus, wenn h(ab) = h(a)h(b)
f¨ ur alle a, b ∈ G .
33
2 Gruppen
Links ist nat¨ urlich die Multiplikation in G, rechts die in H gemeint. h heißt Injektion oder Einbettung, wenn h injektive Abbildung ist. Beispiele f¨ ur Injektionen sind die nat¨ urlichen Einbettungen der additiven Gruppen (man beachte die Schreibweise, die wir nur f¨ ur Einbettungen verwenden wollen) {0} → Z → Q → R → C . Beispiele f¨ ur nicht injektive Homomorphismen sind die Restklassenabbildungen Z → Z/mZ : x → [x]m . Die Homomorphie ergibt sich daraus, dass die Restklassenaddition repr¨ asentantenweise definiert ist. Weitere einfache Beispiele f¨ ur Homomorphismen sind die triviale Abbildung G → {e} : a → e ∀ a ∈ G , die f¨ ur jede Gruppe existiert, oder die Abbildung von S3 (oder einer anderen Symmetriegruppe eines regelm¨aßigen n-Ecks), welche den Drehungen die 1 und den Spiegelungen die −1 in der multiplikativen Gruppe {1, −1} zuordnet. Einige einfache Eigenschaften von Homomorphismen sammeln wir in folgendem Satz 2.3 (und Definition) Sei h : G → H ein Gruppenhomomorphismus. Dann gilt (wenn man f¨ ur Inversenbildung und neutrales Element die gleiche Bezeichnung in G wie in H w¨ ahlt) 1.
h(e) = e
2.
h(a−1 ) = h(a)−1
∀a∈G
3. F¨ ur jede Untergruppe U ⊆ G ist das Bild h(U ) eine Untergruppe von H. 4. F¨ ur jede Untergruppe V ⊆ H ist das Urbild h−1 (V ) eine Untergruppe von G . 5. Insbesondere ist das Urbild h−1 (e) des Einselements eine Untergruppe von G, der Kern von h, geschrieben ker(h) . 6. h ist genau dann injektiv, wenn ker(h) = {e} ist. Der Satz ist so leicht zu beweisen, dass wir uns auf den letzten Teil beschr¨ anken, der ganz analog zum entsprechenden Satz f¨ ur Vektorraumhomomorphismen einzusehen ist: Wenn einerseits ker(h) nicht nur aus e besteht, kann h nicht injektiv sein. Andererseits gilt, wenn ker(h) = {e} , f¨ ur alle a, b ∈ G h(a) = h(b) ⇒ h(ab−1 ) = h(a)h(b)−1 = e ⇒ ab−1 = e ⇒ a = b , also ist h injektiv. 2
34
2.2 Untergruppen und Homomorphismen
Dem Homomorphismus h nennt man einen Isomorphismus, wenn h bijektiv ist und auch h−1 Homomorphismus ist, und die Gruppen G und H nennt man dann isomorph, wenn zwischen ihnen ein solcher Isomorphismus existiert, geschrieben ussig, denn G∼ ¨berfl¨ ¨ber h−1 ist dabei sogar u = H . Die Zusatzvoraussetzung u Satz 2.4 Wenn h : G → H ein bijektiver Gruppenhomomorphismus ist, dann auch die Umkehrabbildung. (sehr im Gegensatz etwa zu stetigen bijektiven Abbildungen topologischer R¨ aume!) Zum Beweis beachte, dass zwei beliebige Elemente von H nach Voraussetzung von der Form h(a), h(b) sind mit a, b ∈ G . Dann ist aber h−1 (h(a)h(b)) = h−1 (h(ab)) = ab = h−1 h(a)h−1 h(b) . 2 Wenn h injektiv ist, so beschreibt h immerhin noch einen Isomorphismus zwischen G und der Bildgruppe h(G) ⊆ H . Diese Tatsache k¨ onnen wir ausn¨ utzen, die Rolle der Permutationsgruppen besser zu verstehen: Satz 2.5 Jede endliche Gruppe G der Ordnung n ist isomorph zu einer Untergruppe der symmetrischen Gruppe Sn . Zum Beweis haben wir nach dem oben gesagten nur eine Einbettung von G in Sn zu konstruieren. Sei G = {a1 , . . . , an } und a ∈ G . Die Multiplikation mit a von links bewirkt nach der K¨ urzungsregel eine Permutation von G , m.a.W. aaj = aσ(j)
∀j ∈ {1, . . . , n} mit einem
σ ∈ Sn ,
das nat¨ urlich von a abh¨angt und das wir darum mit σa bezeichnen. Man rechnet sofort nach, dass f¨ ur alle a, b ∈ G σab = σa σb richtig ist, dass also a → σa einen Homomorphismus G → Sn definiert, dessen Kern nach der K¨ urzungsregel nur aus e bestehen kann. Damit ist auch die Injektivit¨at gesichert. 2 Definition (und Bemerkungen dazu): Eine Gruppe G heißt zyklisch, wenn ein x ∈ G so existiert, dass G ausschließlich aus Potenzen von x besteht (mit Exponenten in Z ). x heißt dann erzeugendes Element von G , und man schreibt h¨aufig G = . Wir werden allerdings gleich sehen, dass das erzeugende Element meistens nicht eindeutig bestimmt ist. In einer additiv geschriebenen Gruppe sind die Potenzen nat¨ urlich als Vielfache zu schreiben. In einer beliebigen (multiplikativ geschriebenen Gruppe) G versteht man unter < x > die Menge aller Potenzen des Elements x ∈ G . Diese bilden eine zyklische Untergruppe von G . Beispiele zyklischer Gruppen sind
35
2 Gruppen
• (Z, +) mit ±1 als (einzigen) erzeugenden Elementen und • Z/mZ f¨ ur beliebige m ∈ N mit der Restklassenaddition als Verkn¨ upfung. Erzeugende Elemente sind hier neben der Restklasse [1]m auch alle anderen primen Restklassen mod m (und nur diese, vgl. die Folgerungen 1.24 und 1.25). Das Repertoire an zyklischen Gruppen ist damit bereits ersch¨ opft, denn es gilt der folgende Satz 2.6 Jede zyklische Gruppe < x > ist entweder zu Z oder zu einer Restklassengruppe Z/mZ , m ∈ N , isomorph. Zum Beweis machen wir folgende Fallunterscheidung: A) Alle x-Potenzen sind paarweise verschieden. Dann definiert die Abbildung Z → < x > : n → xn einen injektiven und surjektiven Gruppenhomomorphismus, also eine Isomorphie. B) Seien k = n ∈ Z mit xk = xn . Dann ist die angegebene Abbildung immer noch ein surjektiver Gruppenhomomorphismus, aber nicht mehr injektiv. Der Kern besteht nicht nur aus 0 und muss darum ein kleinstes positives m ∈ N enthalten: Beachte, dass der Kern eine Gruppe ist, also mit jedem r auch −r enth¨alt, sowie Satz 1.1. Dann m¨ ussen aber alle xj , j = 0, . . . , m − 1 , paarweise verschieden sein, sonst g¨abe es i < j unter diesen Exponenten mit xi = xj
⇒
xj−i = e
⇒
j − i ∈ ker
im Widerspruch zur Wahl von m . Andererseits ist xm = e , also xn = xn+km f¨ ur alle k ∈ Z , das Bild des Homomorphismus h¨ angt also nur von der Restklasse n mod m ab. Da die Restklassenaddition repr¨ asentantenweise definiert ist, k¨onnen wir somit einen Gruppenhomomorphismus Z/mZ →< x > : [n]m → xn definieren. Nach dem oben gesagten handelt es sich sogar um einen Isomorphismus. (Wem diese Konstruktion m¨ uhsam vorkommt, der sei auf Abschnitt 2.5 vertr¨ostet; dort werden allgemeinere Prinzipien bei der Definition solcher Isomorphismen behandelt.) 2 Definition: Sei G eine (multiplikativ geschriebene) Gruppe und x ∈ G . Dann sei die Ordnung von x • ord x := ∞ , wenn < x > ∼ = Z, • ord x := m , wenn < x > ∼ = Z/mZ , wenn also m die kleinste nat¨ urliche Zahl ist mit xm = e . Mit anderen Worten:
ord x := ord < x >
36
2.3 Index und Ordnung
Als Beispiel u ur die symmetrische Gruppe G = Sn folgen¨berlege man sich, dass f¨ de Behauptung zutrifft: Ein Zykel (a1 . . . , am ) hat die Ordnung m ; wenn σ ∈ Sn aus (disjunkten) Zykeln der L¨angen m1 , . . . , mk besteht, so ist ord σ das kgV von m1 , . . . , mk . Im n¨achsten Abschnitt wird sich folgender einfache Sachverhalt als wichtig erweisen, den man direkt aus der Isomorphie zwischen < x > und Z/mZ abliest (wenn m = ord x endlich ist): Hilfssatz 2.7 Sei G (multiplikative) Gruppe und x ∈ G . Wenn xn = e f¨ ur ein n ∈ Z , n = 0 , so ist n ein Vielfaches von ord x .
2.3 Index und Ordnung 2.3.1 Restklassen Sei G eine (multiplikativ geschriebene) Gruppe, H eine Untergruppe von G . F¨ ur alle a , b ∈ G definieren wir a∼b
: ⇐⇒
ab−1 ∈ H
⇐⇒
a ∈ Hb := {hb | h ∈ H} .
¨ Man sieht sofort, dass es sich dabei um eine Aquivalenzrelation handelt; die ¨ Aquivalenzklassen sind die Untermengen Hb und werden Rechtsrestklassen alt man ebenfalls genannt. Durch Verwendung von b−1 a anstelle von ab−1 erh¨ ¨ eine Aquivalenzrelation, die zur Bildung von Linksrestklassen bH f¨ uhrt. F¨ ur abelsche Gruppen stimmen beide nat¨ urlich u ¨berein. Als Beispiele kennen wir bereits die m Restklassen der additiven Gruppe Z nach den Untergruppen mZ . In ur der symmetrischen Gruppe S3 erhalten wir z.B. f¨ • H = {(1) , (1 2 3) , (1 3 2)} zwei Restklassen, repr¨ asentiert durch (1) und (1 2) , • H = {(1) , (1 2)} drei Restklassen, repr¨ asentiert durch (1) , (1 3) , (2 3) . Im zweiten Fall sind die entstehenden Rechts- und Linksrestklassen verschieden, nicht aber ihre Gesamtanzahl. Das liegt daran, dass die Inversenbildung Hb → (Hb)−1 = b−1 H eine Bijektion herstellt zwischen der Menge der Rechts- und der Menge der Linksrestklassen. Bezeichnet man ihre Anzahl mit (G : H) , dem Index von H in G (bei unendlichen Gruppen darf dieser nat¨ urlich auch ∞ sein), und beachtet man, dass Bijektionen h → hb bzw. bh existieren von H auf die durch b repr¨asentierten Restklassen, so erh¨ alt man folgenden
37
2 Gruppen
Satz 2.8 (Lagrange (1736 – 1813)) Sei G eine Gruppe mit Untergruppe H . Dann ist ord G = (G : H) ord H . Bei richtiger Interpretation der Multiplikation beh¨ alt dieser Satz nat¨ urlich auch seinen Sinn f¨ ur unendliche Ordnungen bzw. Indizes.
2.3.2 Die S¨ atze von Fermat und Euler Satz 2.9 (Euler) Sei G eine endliche Gruppe und x ∈ G . Dann ist ord x ein Teiler von ord G . Insbesondere gilt stets xord G = e . Zum Beweis w¨ahle einfach H = < x > und wende den Satz von Lagrange an.2 Speziell f¨ ur prime Restklassengruppen ergeben sich zahlentheoretische Konsequenzen: Folgerung 2.10 Sei m ∈ N und a ∈ Z , (a, m) = 1 . Dann ist aϕ(m) ≡ 1 mod m . Folgerung 2.11 (Fermat 1640) Sei p Primzahl und p a ∈ Z . Dann ist ap−1 ≡ 1 mod p . F¨ ur alle a ∈ Z ist ap ≡ a mod p .
2.3.3 Einfache Klassifikationss¨ atze Ein begreifliches (und bis heute unerreichtes) Fernziel ist es nat¨ urlich, alle Gruppen zu kennen, m.a.W. diese zu klassifizieren. Isomorphe Gruppen sollen dabei nicht als verschieden angesehen werden. Dann ist aus kombinatorischen Gr¨ unden klar, dass es f¨ ur jede endliche Ordnung — bis auf Isomorphie — nur endlich viele verschiedene Gruppen geben kann. F¨ ur Primzahlordnungen liegen die Verh¨ altnisse besonders einfach, und wir k¨onnen schon mit den jetzt verf¨ ugbaren Mitteln beweisen: Satz 2.12 Jede Gruppe der Ordnung p ∈ P ist isomorph zur additiven Gruppe Z/pZ .
38
2.4 Normalteiler und Faktorgruppen
Nach dem Eulerschen Satz kann jedes Element x = e nur die Ordnung p haben, also ist dann < x > schon die ganze Gruppe. F¨ ur diese zyklische Gruppe kennen wir bereits einen Isomorphismus auf Z/pZ . 2 Nun k¨onnen wir auch eine sehr einfache Begr¨ undung daf¨ ur angeben, warum die S3 keine anderen nichttrivialen Untergruppen haben kann als die schon in Abschnitt 2.2.1 gefundenen: Wegen ord S3 = 6 k¨ onnen solche Untergruppen nur die Ordnungen 2 oder 3 haben, m¨ ussen also zyklisch sein. Alle Gruppenelemente = (1) erzeugen aber schon eine der Untergruppen, die wir bereits aufgelistet haben. In Richtung auf eine Klassifikation l¨ asst sich sogar noch mehr zeigen: S3 und Z/6Z sind bis auf Isomorphie die einzigen Gruppen der Ordnung 6. Diese Aussage l¨asst sich durch umst¨andliche Rechnungen, z.B. das Aufstellen von Gruppentafeln, beweisen; mit weiter entwickelter Theorie (Abschnitt 2.7) wird es uns jedoch sehr viel leichter fallen.
2.4 Normalteiler und Faktorgruppen 2.4.1 Konjugationsinvarianz Sei G eine (multiplikative) Gruppe und H eine Untergruppe. F¨ ur alle g ∈ G kann man die zu H konjugierte Untergruppe H g := gHg −1 = {ghg −1 | h ∈ H} definieren, die nat¨ urlich f¨ ur abelsche Gruppen stets mit H u ur ¨bereinstimmt. F¨ g nicht-kommutative Gruppen kann ebenfalls H = H sein wie im Fall der Untergruppe der Drehungen in S3 oder im Fall H = SLn K ⊂ G = GLn K , aber in der Regel darf man nicht H = H g erwarten: Man nehme zum Beispiel die Untergruppe H = {(1) , (1 2)} und g = (1 3) oder etwa die Untergruppe
1t | t ∈ K ⊂ G := SL2 K H := 01 und z.B. g =
0 1 −1 0
.
Definition: H heißt Normalteiler oder invariante Untergruppe von G , geschrieben H G,
39
2 Gruppen
¨ wenn H = H g f¨ ur alle g ∈ G gilt. Aquivalent dazu sind die Bedingungen Hg = gH
oder
∀h ∈ H
∃ k ∈ H : ghg −1 = k ,
m.a.W.: F¨ ur Normalteiler stimmen Rechts- und Linksrestklassen u ¨berein. Es −1 gen¨ ugt nat¨ urlich, H g ⊆ H f¨ ur alle g zu verlangen, da H g ⊆ H ⇒ H ⊆ H g . Satz 2.13 Sei f : U → V ein Gruppenhomomorphismus, N ein Normalteiler von V . Dann ist das Urbild f −1 (N ) ein Normalteiler von U ; insbesondere ist ker f U , weil {e} V . Der Beweis erfolgt einfach durch Nachrechnen: F¨ ur alle g ∈ U ist f (h) ∈ N ⇒ f (ghg −1 ) = f (g)f (h)f (g)−1 ∈ f (g)N f (g)−1 = N . 2 Im n¨achsten Abschnitt werden wir sehen, dass alle Normalteiler von der Bauart ker f sind.
2.4.2 Faktorgruppen Die Normalteiler sind unter allen Untergruppen deswegen ausgezeichnet, weil die Restklassen von Normalteilern ebenso wie die Restklassen von mZ in Z durch Definition einer Restklassenverkn¨ upfung zu einer Gruppe gemacht werden k¨onnen, der Faktorgruppe: Satz 2.14 Sei H ein Normalteiler in der (multiplikativen) Gruppe G . Dann ist die Menge G/H der Restklassen Hg , g ∈ G , eine Gruppe bez¨ uglich der repr¨ asentantenweise definierten Multiplikation Hg · Hh := Hgh . Die kanonische Projektion π : G → G/H : g → Hg ist ein surjektiver Gruppenhomomorphismus mit ker π = H , und es ist ord G/H = (G : H) . Der Beweis ist fast evident und erfordert vor allem den Nachweis, dass die Multiplikation wohldefiniert ist: Hg = Ha und Hh = Hb ⇒ gH = aH ⇒ a−1 g , hb−1 ∈ H ⇒ ⇒ a−1 ghb−1 ∈ H ⇒ ghb−1 a−1 ∈ H a = H ⇒ Hgh = Hab Klar, dass He = H das neutrale Element von G/H und Ha−1 das zu Ha inverse Element ist. 2
40
2.5 Isomorphies¨ atze
2.5 Isomorphies¨ atze 2.5.1 Der Homomorphiesatz Satz 2.15 Seien G und B Gruppen, f : G → B ein surjektiver Gruppenhomomorphismus. Dann ist B isomorph zur Faktorgruppe G/ ker f , und zwar wird die Isomorphie gegeben durch die Abbildung i : G/ ker f → B : (ker f )g → f (g) . F¨ ur die kanonische Projektion π von G auf G/ ker f ist also f = i ◦ π . Zum Beweis ist wieder einmal zu zeigen, dass i wohldefiniert ist: (ker f )g = (ker f )h ⇒ gh−1 ∈ ker f ⇒ f (g) = f (h) ⇒ i ((ker f )g) = i ((ker f )h) Nat¨ urlich ist i ein Homomorphismus. Nach Konstruktion ist i surjektiv, und ker i = (ker f ) , also das neutrale Element der Faktorgruppe; demnach ist i auch injektiv.2 Beispiel: Sei G = GLn K . Nach dem Determinantenmultiplikationssatz ist die Determinantenfunktion ein Gruppenhomomorphismus von G auf K ∗ (warum surjektiv?) mit genauem Kern SLn K . Hier sagt der Homomorphiesatz also GLn K/SLn K ∼ = K∗ .
2.5.2 Schachtelung von Untergruppen Hilfssatz 2.16 Sei G eine Gruppe mit Untergruppen H, H1 , H2 Normalteiler N . Dann gilt:
und einem
1. Auch H1 ∩ H2 ist Untergruppe von G . 2. N ∩ H ist Normalteiler von H . 3. Aus H2 ⊆ H1 folgt (G : H2 ) = (G : H1 ) · (H1 : H2 ) . 4. Auch HN := {hg | h ∈ H , g ∈ N } ist Untergruppe von G und besitzt H als Untergruppe und N als Normalteiler. Die ersten beiden Punkte folgen unmittelbar aus der Definition von Untergruppen bzw. Normalteilern. Zum Beweis des dritten w¨ ahle man zun¨ achst ein vollst¨ andiges Repr¨asentantensystem {hi } der Rechtsrestklassen von H1 mod H2 und ein vollst¨andiges Repr¨asentantensystem {gj } von G mod H1 und verifiziere dann,
41
2 Gruppen
dass die Produkte hi gj genau alle Rechtsrestklassen von G mod H2 durchlaufen. Die Indexmengen bzw. die Gruppenindizes m¨ ussen dabei nicht endlich sein. Zum Beweis des vierten Punktes beachte man, dass in h1 g1 h2 g2 = h1 h2 h−1 2 g1 h 2 g2 das Element h−1 2 g1 h2 in N liegt, wenn h1 , h2 ∈ H , g1 , g2 ∈ N , dass also Produkte aus HN wieder zu HN geh¨oren. F¨ ur Inverse argumentiert man analog. 2
2.5.3 Die Isomorphies¨ atze Satz 2.17 (1. Isomorphiesatz) Sei G eine Gruppe mit Untergruppe U und Normalteiler N . Dann ist U/(U ∩ N ) ∼ = U N/N . Beweis: π sei der kanonische Homomorphismus U N → U N/N , f seine Restriktion auf U . Diese ist immer noch surjektiv und hat den Kern U ∩ N . Aus dem Homomorphiesatz folgt die Behauptung. 2 Satz 2.18 (2. Isomorphiesatz) Sei f : G → G ein surjektiver Gruppenhomomorphismus mit Kern K . G → f (G) = G Dann gibt es zwischen der Menge der Untergruppen H ⊇ K von G und der Menge der UnterH → f (H) = H gruppen H ⊆ G eine Bijektion, gegeben durch H = f (H)
, H = f −1 (H ) .
Diese Bijektion bildet Normalteiler auf Normalteiler ab, und f¨ ur Normalteiler K N G gilt G/N ∼ = (G/K) (N/K) .
N → f (N ) = N K → f (K) = {e} {e}
Da alle Untergruppen H ⊆ G ein Urbild H ⊇ K unter f besitzen, stiftet f eine surjektive Abbildung {Untergruppen H ⊇ K} → {Untergruppen H } . Injektivit¨at: G¨abe es ein H ⊇ K mit f (H) = H , aber H f −1 (H ) , so auch Elemente g ∈ / H , h ∈ H mit f (g) = f (h) , also gh−1 ∈ ker(f ) = K . Dann ist aber doch g ∈ Kh ⊆ H , Widerspruch. Dass f¨ ur alle Normalteiler N ⊆ G das Urbild auch Normalteiler in G ist, wissen
42
2.6 Operation von Gruppen auf Mengen
wir schon. Umkehrung: Sei K N G und a ∈ G gegeben. Dann existiert ein a ∈ G mit a = f (a) , darum ist a
−1
f (N )a = f (a)−1 f (N )f (a) = f (a−1 N a) = f (N ) ,
also auch f (N ) Normalteiler in G . Schließlich sagt der Homomorphiesatz G ∼ = G/K
,
N = f (N ) ∼ = N/K ,
und wenn wir die kanonische Projektion G → G /N mit κ bezeichnen, so hat der surjektive Homomorphismus κ ◦ f : G → G /N ∼ = (G/K) (N/K) den Kern N , nach dem Homomorphiesatz ist G/N also zur Bildgruppe isomorph. 2
2.6 Operation von Gruppen auf Mengen 2.6.1 Definition und einfache Eigenschaften Die (multiplikativ geschriebene) Gruppe G operiert auf der Menge M , wenn eine Abbildung G × M → M : (x, s) → xs definiert ist, die folgende Eigenschaften besitzt: • (xy)s = x(ys) ∀x, y ∈ G ∀s ∈ M , • es = s
∀s ∈ M .
M wird dann auch eine G-Menge genannt. Die Abbildungen s → xs geh¨ oren zur Gruppe SM der Bijektionen von M auf sich, denn sie lassen sich durch Operation von x−1 umkehren: x−1 (xs) = s . Jedes x definiert also eine Translation Tx : s → xs auf M mit den Eigenschaften Te = id ,
Txy = Tx Ty ,
Tx−1 = (Tx )−1 .
Anders gesagt: Die Abbildung x → Tx definiert einen Gruppenhomomorphismus G → SM . F¨ ur alle s ∈ M heißt Gs := {xs ∈ M | x ∈ G}
43
2 Gruppen
die Bahn oder der Orbit von s (bez¨ uglich G) und Gs := {x ∈ G | xs = s} die Isotropiegruppe, Fixgruppe oder der Stabilisator von s ∈ M . Man rechnet sofort nach, dass es sich tats¨achlich um eine Untergruppe von G handelt. G operiert transitiv auf M , wenn es ein s ∈ M gibt mit Gs = M (das ist dann sogar f¨ ur alle s richtig, warum?).
2.6.2 Beispiele 1.) Die aus der linearen Algebra bekannte Operation von GLn K oder SLn K auf dem Vektorraum K n . ur n = 3 die Isotropie2.) Die Operation von Sn auf {1, . . . , n} : Hier ist z.B. f¨ gruppe von 1 die uns schon bekannte Untergruppe G1 = {(1) , (2 3)} vom Index 3 in S3 . 3.) Eine beliebige Gruppe G operiert stets auf sich selbst durch Translation: G × G → G : (x, y) → xy ; alle Isotropiegruppen sind trivial. 4.) Jede Gruppe G operiert auf sich selbst durch Konjugation G × G → G : (x, y) → xyx−1 . (Hier w¨are die in der Definition gew¨ahlte Schreibweise (x, s) → xs nat¨ urlich sehr missverst¨andlich!) Die zugeh¨origen Tx nennen wir hier σx : y → xyx−1 . Es handelt sich hierbei um Gruppenautomorphismen, d.h. Isomorphismen von G auf sich (diese sind nat¨ urlich alle = id , wenn die Gruppe abelsch ist). Die Fixgruppe von s Gs = {x ∈ G | σx (s) = s , also xs = sx} =: CG (s) nennt man hier den Zentralisator von s . Entsprechend nennt man das Zentrum CG = Z der Gruppe G die Untergruppe CG := {x ∈ G | xs = sx ∀s ∈ G} , also den Durchschnitt aller Zentralisatoren. 5.) Auch auf der Menge ihrer Untergruppen (oder sogar Untermengen) kann man G durch Konjugation U → xU x−1 = U x operieren lassen. Dabei ist U ein Fixpunkt dieser Operation, d.h. wird von allen x festgelassen, wenn U Normalteiler von G ist. F¨ ur diese Operation ist die Isotropiegruppe GU der Normalisator NG (U ) , das ist die maximale Untergruppe von G , welche U als Normalteiler enth¨alt. Die Bahn von U bei dieser Operation besteht aus allen zu U konjugierten Untergruppen.
44
2.6 Operation von Gruppen auf Mengen
2.6.3 Bahnenl¨ ange und Indizes Hilfssatz 2.19 Die Gruppe G operiere auf der Menge M . Dann gilt: ¨ 1. Die Einteilung in Bahnen ist eine Einteilung in Aquivalenzklassen f¨ ur die ¨ Aquivalenzrelation s ∼ t :⇔ ∃ x ∈ G : t = xs . 2. Innerhalb einer Bahn ist t = xs = ys ⇔ y −1 xs = s ⇔ y−1 x ∈ Gs ⇔ x ∈ yGs ⇔ x und y liegen in der gleichen Linksrestklasse von Gs . 3. Es gibt eine Bijektion Linksrestklassen
mod Gs
↔
Elemente der Bahn
Gs .
4. Die L¨ ange |Gs| ( = Anzahl der Elemente) der Bahn Gs ist der Index (G : Gs ) . 5. F¨ ur alle t = xs aus der Bahn Gs ist die Isotropiegruppe Gt = {y ∈ G | yxs = xs , also x−1 yx ∈ Gs } = xGs x−1 . 6. Die Isotropiegruppe Gs ist genau dann Normalteiler in G , wenn sie gleichzeitig Isotropiegruppe aller anderen t aus der Bahn Gs ist. Demnach ist die Anzahl der zu U konjugierten Untergruppen in G gerade der ur die KonjuIndex (G : NG (U )) . Eine entsprechende Anzahlformel ergibt sich f¨ gation einzelner Elemente. Allgemeiner erh¨ alt man ebenso den Satz 2.20 (Klassenformel) Sei R ein Repr¨asentantensystem der Bahnen f¨ ur die Operation der Gruppe G auf der Menge M . Dann ist M die disjunkte Vereinigung aller Gs , s ∈ R , also |M | = (G : Gs ) . s∈R
Im speziellen Fall der Konjugationsoperation von G auf G heißt das ord G = (G : Gs ) = (G : CG (s)) . s∈R
s∈R
Hier besteht eine Bahn aus nur einem Element s genau dann, wenn Gs = CG (s) = G bzw. wenn s ∈ Z = CG , bzw. wenn s zum Zentrum von G geh¨ ort.
45
2 Gruppen
2.6.4 Alternierende Gruppen Die symmetrische Gruppe Sn , n > 2 , operiere wie u ¨blich auf der Menge {1, . . . , n} , hier aufgefasst als Indexmenge f¨ ur die Variablen x1 , . . . , xn . Man betrachte insbesondere die (zweielementige) Menge der beiden Polynome ±
(xj − xi )
(i = 1, . . . , n − 1, j = 2, . . . , n) .
i ist die gesuchte Untergruppe. 2
2.7.2 Existenz von Sylowuntergruppen Der Satz von Lagrange, dass Ordnungen von Untergruppen stets Teiler der Gruppenordnung sind, wirft die Frage auf, ob es zu jedem Teiler von ord G auch eine zugeh¨orige Untergruppe gibt. Wir werden sp¨ ater sehen, dass das f¨ ur endliche abelsche Gruppen richtig ist, im allgemeinen aber falsch. Immerhin ist es richtig f¨ ur die maximalen Primpotenzteiler: Satz 2.24 Sei G endliche Gruppe und p ein Primteiler von ord G . Dann existiert eine p-Sylowuntergruppe von G .
47
2 Gruppen
Der Beweis wird durch Induktion u uhrt: F¨ ur ord G = p ist die ¨ber ord G gef¨ Behauptung trivial. Sei also G gegeben und der Satz f¨ ur alle Gruppen kleinerer Ordnung bewiesen. 1. Fall: Es existiere eine echte Untergruppe H von G mit p (G : H) . Nach Induktionsannahme gibt es dann eine p-Sylowuntergruppe S von H . Diese ist auch p-Sylowuntergruppe von G , da ord S auch maximale p-Potenz in ord G = (G : H)ord H ist. 2. Fall: F¨ ur alle echten Untergruppen H von G sei p | (G : H) . Nach der Klassenformel (Satz 2.20) ist ord G = ord Z +
(G : CG (s)) ,
s∈R
uglich der Konjugationsopewobei R ein Repr¨asentantensystem der Bahnen (bez¨ ration von G auf sich) von L¨ange > 1 bezeichnen soll; die anderen Bahnen bestehen aus den Elementen des Zentrums Z . Nach Voraussetzung ist p | (G : CG (s)) f¨ ur alle s ∈ R und p | ord G , also auch p | ord Z . Nach Hilfssatz 2.23 hat Z eine Untergruppe K der Ordnung p . Als Untergruppe des Zentrums ist K Normalteiler in G , folglich gibt es eine Faktorgruppe G/K . F¨ ur die Multiplizit¨ at des Primteilers p in den Gruppenordnungen gilt nach dem Satz von Lagrange νp (ord G) = n
⇒
νp (ord G/K) = n − 1 .
Nach Induktionsannahme existiert in G/K also eine p-Sylowuntergruppe S der Ordnung pn−1 . Nach dem 2. Isomorphiesatz gibt es also ein Urbild S von S unter der kanonischen Projektion π : G → G/K , ullt und damit welches S/K ∼ = S erf¨ ord S = (S : K) · ord K = ord S · ord K = pn . S ist die gesuchte p-Sylowuntergruppe. 2
2.7.3 p-Untergruppen und p-Sylowgruppen Satz 2.25 Sei G eine endliche Gruppe, p ein Primteiler von ord G . Dann gilt: 1. Jede p-Untergruppe H von G ist in einer p-Sylowuntergruppe S von G enthalten. 2. Alle p-Sylowuntergruppen von G sind konjugiert. 3. Die Zahl der p-Sylowuntergruppen von G ist ≡ 1 mod p . 4. Die Zahl der p-Sylowuntergruppen von G ist Teiler von ord G .
48
2.7 Sylowuntergruppen
Beweis: Durch Konjugation operiert G auf der Menge S aller p-Sylowuntergruppen von G . Sei GS Isotropiegruppe von S ∈ S , dann ist GS ⊇ S , also (G : GS ) (Bahnenl¨ange von S ) teilerfremd zu p . Sei S0 die G-Bahn von S , d.h. also S0 = {xSx−1 = S x | x ∈ G} ⊆ S und H = {e} eine p-Untergruppe von G . Auch H operiert auf S0 , und S0 zerfalle in H-Bahnen S1 , . . . , Sk . Da in der rechten Summe von p |S0 | =
k
|Si | =
i=1
(H : HSi )
Si ∈Si
nur p-Potenzen stehen, muss mindestens eine davon = 1 sein. Es gibt also ein S ∈ S0 mit H = HS . Dieses S ist demnach H-invariant, m.a.W. H ist im Normalisator NG (S ) enthalten. Nach 2.16.4 ist HS Untergruppe von G und enth¨alt S als Normalteiler. Der 1. Isomorphiesatz sagt nun HS /S ∼ = H/(H ∩ S ) . H , (H ∩ S ) und S sind p-Gruppen, also muss auch HS eine p-Gruppe sein. Andererseits ist S maximale p-Untergruppe von G , daher ist HS = S , also H ⊆ S . Die erste Behauptung ist damit gezeigt. Zum Beweis der zweiten Behauptung w¨ahlen wir H selbst als p-Sylowuntergruppe ort also zur von G . Der eben gef¨ uhrte Beweis ergibt dann H = S ∈ S0 . H geh¨ G-Bahn von S und ist damit zu S konjugiert. Zum Beweis der dritten Behauptung w¨ahlen wir schließlich H = S selbst. Wir wissen bereits, dass die Anzahl der p-Sylowuntergruppen von G gleich |S| = |S0 | =
k
(H : HSi )
i=1
ist (Klassenformel). Rechts stehen nur p-Potenzen, und zwar kommt einmal die ullen 1 vor f¨ ur (o.B.d.A.) S1 = H , alle anderen Si sind echt konjugiert zu S1 , erf¨ also HSi H , darum (H : HSi ) ≡ 0 mod p . Damit ist auch die dritte Behauptung bewiesen. Der letzte Punkt folgt schließlich aus Hilfssatz 2.19.4, weil S eine G-Bahn ist. 2
2.7.4 Folgerungen aus den Sylowschen S¨ atzen Folgerung 2.26 Sei G eine (endliche) p-Gruppe = {e} . Dann hat G ein nichttriviales Zentrum Z = {e} .
49
2 Gruppen
Beweis: Die Klassenformel f¨ ur die Konjugationsoperation sagt (G : CG (s)) , ord G = ord Z + R
wobei R ein Repr¨asentantensystem der nicht einelementigen Bahnen durchl¨ auft. Diese Summe hat nur Summanden > 1 , also echte p-Potenzen, darum muss auch p | ord Z sein. Folgerung 2.27 Gruppen der Ordnung p2 , p ∈ P , sind kommutativ. Beweis: Das Zentrum der Gruppe kann nur die Ordnung p2 oder p haben. Im ersten Fall ist sowieso alles klar; im zweiten Fall ist das Zentrum Z zyklisch = < x > von der Ordnung p . F¨ ur jedes y ∈ G − Z ist die ganze Gruppe G erzeugt von x , y , d.h. besteht nur aus Potenzprodukten von x und y (warum?). Da aber x und y miteinander kommutieren, kommutieren auch alle ihre Potenzprodukte.2 Nebenbei bemerkt, ist eine solche Gruppe entweder isomorph zu Z/p2 Z (wenn ein Element der Ordnung p2 existiert) oder isomorph zum direkten Produkt (Z/pZ)2 , das wir im n¨achsten Abschnitt ausf¨ uhrlich kennenlernen werden. Jedenfalls wissen wir nun, dass aus ord G < 6 automatisch folgt, dass G abelsch ist, dass also die S3 in der Tat die kleinste nichtkommutative Gruppe ist. Dass sie dadurch und durch ihre Ordnung bis auf Isomorphie eindeutig bestimmt ist, werden wir weiter unten sehen. Folgerung 2.28 Jede (endliche) p-Gruppe G ist aufl¨ osbar, d.h. es gibt eine Kette von Untergruppen {e} = G0 G1 . . . Gn−1 Gn = G dabei jedes Gi Normalteiler in Gi+1 mit zyklischer Faktorgruppe Gi+1 /Gi . Zum Beweis nehme man Induktion u ¨ber die Ordnung vor und verwende das (nichttriviale!) Zentrum Z als eine Station in der Untergruppenkette. Z ist abelsch, also l¨asst sich die Behauptung f¨ ur Z leicht mit Hilfe von 2.23 verifizieren. Die Behauptung f¨ ur die Faktorgruppe G/Z folgt aus der Induktionsannahme. Mit Hilfe des 2. Isomorphiesatzes, angewandt auf die kanonische Projektion G → G/Z , lassen sich beide Teilaussagen zur Folgerung zusammensetzen. 2 Folgerung 2.29 Sei p > 2 Primzahl und G eine Gruppe der Ordnung 2p . Dann ist G entweder • zyklisch, d.h. ∼ = Z/2pZ oder
50
2.7 Sylowuntergruppen
• Diedererweiterung einer zyklischen Gruppe < x > der Ordnung p , d.h. alle y ∈ G − < x > haben Ordnung 2 und erf¨ ullen yxy −1 = x−1 . (Diese Diedergruppen kann man sich als die Symmetriegruppen des regelm¨ aßigen p-Ecks vorstellen mit < x > als Drehgruppe und y als Spiegelung.) Beweis: G hat eine p-Sylowuntergruppe, und diese muss zyklisch = < x > sein. G¨ abe es mehr als eine p-Sylowgruppe in G , so m¨ usste es mindestens p+1 davon geben; da diese alle nur das Einselement gemeinsam haben, h¨ atte G dann mehr als 2p Elemente, also ist < x > eindeutig bestimmt und muss Normalteiler in G sein. Gibt es in G Elemente der Ordnung 2p , so ist der erste Fall eingetreten. Andernfalls k¨ onnen alle y ∈ G − < x > nur die Ordnung 2 haben. Nun gibt es zwei M¨ oglichkeiten: 1.) yxy−1 = x . Dann kommutieren x und y , und ord xy = 2p , zyklischer Fall. 2.) yxy−1 = x . Dann ist die Konjugation mit y ein nichttrivialer Automorphismus des Normalteilers < x > , und zwar ein Automorphismus der Ordnung 2 , weil y 2 = 2 . Nun m¨ ussen wir ein Resultat einschieben, das wir allgemein erst mit Kenntnissen u orpern beweisen k¨ onnen, das man ¨ber Polynome in endlichen K¨ aber f¨ ur p = 3 oder 5 direkt verifizieren kann: Hilfssatz 2.30 Der einzige Automorphismus σ der Gruppe Z/pZ mit Ordnung 2 ist σ : Z/pZ → Z/pZ : [n]p → −[n]p . F¨ ur die multiplikativ geschriebene Gruppe < x > und unseren Konjugationsautomorphismus bedeutet das yxn y −1 = x−n , und mit n = 1 erhalten wir die Behauptung der Folgerung 2.29. 2 Mit diesen S¨atzen sowie mit 2.12 l¨asst sich f¨ ur viele Ordnungen bereits eine vollst¨andige Klassifikation der zugeh¨origen Gruppen erreichen. Der Leser u ¨berlege ¨ sich, dass wir schon bis zur Ordnung 11 eine vollst¨ andige Ubersicht u ¨ber alle Gruppen besitzen — modulo der noch zu behandelnden direkten Produkte und bis auf die Ordnung 8; f¨ ur diese gibt es bis auf Isomorphie genau f¨ unf verschiedene Gruppen, n¨amlich die abelschen Gruppen Z/8Z ,
Z/4Z × Z/2Z und
(Z/2Z)3 ,
die Diedererweiterung der Gruppe Z/4Z und die Quaternionengruppe mit zwei Erzeugenden x, y der Ordnung 4 und den Relationen x2 = y 2 , yxy−1 = x−1 . Den Beweis kann man ganz ¨ahnlich wie den der letzten Folgerung f¨ uhren, erg¨ anzt ¨ durch die folgenden drei Uberlegungen (vgl. die Aufgaben):
51
2 Gruppen
• Eine Gruppe, die außer e nur Elemente der Ordnung 2 besitzt, ist abelsch. • Eine Untergruppe vom Index 2 ist notwendig Normalteiler. • Auch ein Element der Ordnung 4 kann per Konjugation als Involution operieren.
2.8 Produkte und universelle Eigenschaften 2.8.1 Direkte Produkte von Gruppen Seien U und V (multiplikativ geschriebene) Gruppen. Das mengentheoretische Produkt U × V = {(u, v) | u ∈ U , v ∈ V } l¨asst sich in naheliegender Weise mit einer Gruppenverkn¨ upfung versehen, n¨ amlich durch die komponentenweise Multiplikation (u1 , v1 ) · (u2 , v2 ) := (u1 u2 , v1 v2 ) . Klar, dass (e, e) das Einselement wird (wenn wir — etwas missbr¨ auchlich — die neutralen Elemente von U und V beide mit e bezeichnen), und dass die Inversenbildung ebenfalls komponentenweise vorgenommen wird. Die entstehende Gruppe nennen wir das (direkte) Produkt von U und V . Im Falle U = V schreiben urlich kann man entsprechende Produkte bzw. Potenwir daf¨ ur einfach U 2 . Nat¨ zen auch f¨ ur mehr als zwei Faktoren konstruieren; die meisten Eigenschaften, die wir in diesem Abschnitt entwickeln werden, gelten sogar f¨ ur unendliche Produkte (falls nicht, werden wir das besonders vermerken), der Einfachheit halber werden wir uns aber meist auf Eigenschaften von Produkten zweier Faktoren beschr¨anken. Beispiele f¨ ur Produkte bzw. Potenzen von Gruppen kennt der Leser bereits aus der linearen Algebra: Als additive Gruppe ist der Rn direktes Produkt von n Faktoren R . Ein paar einfache Eigenschaften des Produkts sind unmittelbar einsichtig: Hilfssatz 2.31 Sei G = U × V direktes Produkt der Gruppen U und V . Dann gilt: 1.
ord G = ord U · ord V
2. G enth¨alt Normalteiler U := {(u, e) | u ∈ U }
und
V := {(e, v) | v ∈ V } ,
isomorph zu U bzw. V . Diese erf¨ ullen U ∩ V = {(e, e)} . 3. U und V kommutieren elementweise miteinander, d.h. u v = v u
∀ u ∈ U , v ∈ V .
52
2.8 Produkte und universelle Eigenschaften
4. G wird von U und V erzeugt, genauer sogar: G = U V . (Diese Eigenschaft l¨ asst sich nicht auf Produkte unendlich vieler Faktoren u ¨bertragen.) 5. Die nat¨ urlichen Projektionen pU , pV auf die Komponenten, also (u, v) → u bzw. v , sind Gruppenhomomorphismen.
2.8.2 Universelle Eigenschaften Die Projektionen auf die Faktoren spielen eine zentrale Rolle, wie wir an folgendem Lemma sehen: Hilfssatz 2.32 Sei G das direkte Produkt der Gruppen U und V , dazu seien pU und pV die nat¨ urlichen Projektionen. F¨ ur alle Gruppen H mit zwei Homomorphismen hU : H → U ,
U
hV : H → V ,
hU
↑ pU
existiert ein eindeutig bestimmter Homomorphismus H h :H→G,
h
→ G=U ×V hV
↓ pV
der pU ◦ h = hU , pV ◦ h = hV erf¨ ullt, d.h. das Diagramm rechts kommutativ macht (heißt: ∀x ∈ H h¨ angt das Bild in U bzw. V nicht von dem im Diagramm gew¨ ahlten Abbildungsweg ab).
V
Beweis: h(x) = (hU (x), hV (x)) ist der gesuchte Homomorphismus, und es gibt keine andere M¨oglichkeit, das Diagramm kommutativ zu machen. 2 Die Bedeutung dieses Hilfssatzes liegt vor allem darin, dass seine Aussage die Gruppe G bereits eindeutig bis auf Isomorphie charakterisiert, und zwar unabh¨angig von der vorgenommenen Konstruktion. Man spricht darum von einer universellen Eigenschaft des direkten Produkts von Gruppen. Hier die genaue Formulierung dieser Eindeutigkeitsaussage: Satz 2.33 Sei G eine zweite Gruppe mit Homomorphismen p U und p V in die Gruppen U und V , f¨ ur die die Aussage von Hilfssatz 2.32 zutrifft. Dann ist G ∼ =U ×V . U Genauer gibt es einen Isomorphismus pU ↑ pU h : G → G , h G → G=U ×V ullt, d.h. das der pU ◦ h = p U , pV ◦ h = p V erf¨ Diagramm rechts kommutativ macht.
pV
↓ pV V
53
2 Gruppen
Die Existenz eines Homomorphismus h , der dieses Diagramm kommutativ macht, folgt unmittelbar aus dem Hilfssatz, wenn man H = G setzt und hU = p U , hV = p V . Bleibt also nur zu zeigen, dass es sich bei h um einen Isomorphismus handelt. Nun gilt nach Voraussetzung die Existenz- und Eindeutigkeitsaussage des Hilfssatzes auch f¨ ur G anstelle von G , man erh¨ alt also mit vertauschten Rollen von G und G genauso ein Diagramm mit einem Homomorphismus h : G → G . Setzt man h und h zu h ◦ h zusammen, so erh¨alt man ein neues kommutatives U Diagramm wie rechts beschrieben. Auch dieses ist pU ein Spezialfall des Diagramms aus Hilfssatz 2.32, ↑ pU n¨amlich f¨ ur H = G , hU = pU , hV = pV und h◦h G → G=U ×V h ◦ h anstelle von h . Man kennt aber bereits einen pV Homomorphismus G → G , der dieses Diagramm ↓ pV kommutativ macht: die Identit¨at. Die EindeutigV keitsaussage in 2.32 sagt also h ◦ h = id . Vertauscht man die Rollen von G und G , so erh¨ alt man analog h ◦ h = id . Demnach m¨ ussen h und h zu einander inverse Isomorphismen sein. 2 Eine andere universelle Eigenschaft von U × V wird in Hilfssatz 2.31, 2. bis 4., ausgedr¨ uckt: Satz 2.34 Die Gruppe G enthalte zwei Normalteiler U und V mit folgenden Eigenschaften: 1.
U ∩ V = {e}
2.
G = UV
3.
U und V kommutieren elementweise miteinander.
Dann ist G zum direkten Produkt U × V isomorph. (Diese Eigenschaft ist nicht auf Produkte mit unendlich vielen Faktoren u ¨bertragbar.) Jedes x ∈ G hat n¨amlich nach 2. eine Darstellung als Produkt uv , u ∈ U , v ∈ V . Diese ist sogar eindeutig, denn aus 1. folgt uv = u v ⇐⇒ u
−1
u = v v−1 ⇐⇒ u
−1
u = e = v v −1 ⇐⇒ u = u , v = v .
Schließlich rechnet man mit Hilfe von 3. nach, dass die Bijektion U × V → G : (u, v) → uv = x ein Gruppenhomomorphismus ist. Nach Satz 2.4 gen¨ ugt das zum Beweis. 2 Will man diesen Satz auf unendlich viele Faktoren u ¨bertragen, so wird man notwendig auf einen neuen Begriff gef¨ uhrt, die direkte Summe von Gruppen; sie
54
2.9 Endliche abelsche Gruppen
unterscheidet sich vom Produkt dadurch, dass immer nur endlich viele Komponenten eines Elements = e sind. Bei endlich vielen Faktoren l¨ auft Summen- und Produktbildung nat¨ urlich auf dasselbe hinaus.
2.8.3 Direkte Produkte von Restklassengruppen Wir k¨onnen jetzt der Folgerung 1.28 aus Abschnitt 1.5.4 mehr mathematische Struktur geben: Satz 2.35 Seien m und n teilerfremde nat¨ urliche Zahlen. Dann ist ∼ Z/mZ × Z/nZ 1. Z/mnZ = 2.
(Z/mnZ)∗ ∼ = (Z/mZ)∗ × (Z/nZ)∗ .
Nachdem wir nun viele Eigenschaften von Produkten kennen, k¨ onnen wir diverse Beweisvarianten f¨ ur diesen Satz finden, die im Kern aber alle den chinesischen Restsatz enthalten. Am einfachsten d¨ urfte folgende sein: Die in Folgerung 1.28 gefundene Bijektion [x]mn → ([x]m , [x]n ) ist (f¨ ur beide Gruppen) offensichtlich ein Gruppenhomomorphismus, also sogar ein Isomorphismus. 2 Im n¨achsten Kapitel werden die beiden Teile des Satzes einen gemeinsamen ¨ Uberbau erhalten.— Jedenfalls ist jetzt schon klar, dass man die Zahlentheorie der Restklassengruppen f¨ ur viele Zwecke reduzieren kann auf die genaue Kenntnis des Rechnens modulo Primzahlpotenzen.
2.9 Endliche abelsche Gruppen 2.9.1 Zyklische Untergruppen maximaler Ordnung Das Ziel der Klassifikation l¨asst sich verh¨altnism¨ aßig einfach f¨ ur endliche abelsche Gruppen ausf¨ uhren. Das wesentliche Hilfsmittel ist dabei die im letzten Abschnitt eingef¨ uhrte Produktzerlegung. Die Abspaltung von Faktoren wird erm¨ oglicht durch Hilfssatz 2.36 Sei A eine endliche abelsche Gruppe, Z = < a > eine zyklische Untergruppe maximaler Ordnung n = ord a in A . Sei U/Z eine zyklische Untergruppe der Faktorgruppe A/Z . Dann besitzt U/Z ein erzeugendes Element b mod Z mit einem Repr¨asentanten b ∈ A der Ordnung ord b = ord (b mod Z) .
55
2 Gruppen
Beweis: Sei ord U/Z = m und c mod Z , c ∈ A , ein erzeugendes Element von U/Z . Wegen cm ∈ Z gibt es ein s ∈ N mit cm = as . Division mit Rest von s durch m gibt s = qm + r , q ∈ Z
und r ∈ {0, . . . , m − 1} .
Darum repr¨asentiert auch b := ca−q ein Erzeugendes von U/Z , und zwar mit bm = ar (hier geht die Kommutativit¨at der Gruppe ein). Behauptung: r = 0 , also t := ord b = m , dieses b ist also das gesuchte. Wegen der Isomorphie der endlichen zyklischen Gruppe Z zu der additiven Restklassengruppe Z/nZ ist ¨ n¨amlich (Ubungsaufgabe zum 1. Kapitel) ord ar =
n , (n, r)
andererseits ord (b mod Z) | ord b , also m | t und ord bm = t/m . Zusammen ergibt sich daraus m n = t (n, r) , was wegen t ≤ n (Maximalit¨at von Z ) nur erf¨ ullt sein kann f¨ ur m ≤ (n, r) . Mit r < m folgt daraus r = 0 , (n, r) = n und m = t . 2
2.9.2 Zerlegung in zyklische Gruppen Satz 2.37 Jede endliche abelsche Gruppe ist direktes Produkt zyklischer Untergruppen. Beweis durch Induktion u ¨ber die Gruppenordnung: Der Induktionsanfang ist trivial. Sei also A eine abelsche Gruppe endlicher Ordnung, und sei bereits bewiesen, dass alle abelschen Gruppen kleinerer Ordnung direkte Produkte zyklischer Untergruppen sind. Sei ferner Z eine zyklische Untergruppe in A von maximaler Ordnung. Dann ist A/Z nach Induktionsvoraussetzung ein direktes Produkt zyklischer Unterguppen r < bν mod Z > , ν=1
und nach dem Hilfssatz d¨ urfen wir annehmen, dass die Repr¨ asentanten bν ∈ A uber hinaus die gleiche Ordnung wie die Restklassen bν mod Z in A/Z haben. Dar¨ zeigen wir erstens, dass U :=
r ν
< bν >
∼ =
r
< bν mod Z > ,
ν=1
tν tν = e mod also ein direktes Produkt ist: aus ν bν ∈ Z folgt ν (bν mod Z) Z , was wegen der direkten Produktzerlegung von A/Z nur m¨ oglich ist, wenn
56
2.9 Endliche abelsche Gruppen
alle tν Vielfache der ord (bν mod Z) = ord bν sind, wenn also das Produkt das Einselement darstellt. Zweitens folgt daraus U ∩ Z = {e} . Drittens kommutieren U und Z elementweise miteinander, sie erzeugen also nach Satz 2.34 ein direktes Produkt U Z ∼ = U × Z . Aus Hilfssatz 2.31.1 und dem Satz von Lagrange folgt schließlich ord U × Z = ord U Z = ord U ord Z = ord A/Z ord Z = ord A , also die Behauptung in der Form A = U Z ∼ =U ×Z. 2
2.9.3 Klassifikation Aus Satz 2.6 wissen wir bereits, dass alle endlichen zyklischen Gruppen zu den additiven Restklassengruppen Z/mZ isomorph sind. Damit hat man bequem zug¨angliche Repr¨asentanten f¨ ur die eben gefundenen direkten Produkte. Eine feste endliche abelsche Gruppe kann allerdings mehrere solche Produktzerlegungen besitzen, wie schon das Beispiel Z/6Z ∼ = Z/2Z × Z/3Z lehrt. Der chinesische Restsatz kann bei der Ab¨ anderung solcher Zerlegungen in zwei Richtungen benutzt werden: Zum einen k¨ onnen alle zyklischen Faktoren in Produkte zyklischer Gruppen von Primzahlpotenzordnung zerlegt werden, was dann ein Produkt mit einer großen Anzahl verh¨ altnism¨ aßig kleiner Faktoren ergibt. Umgekehrt kann man je zwei zyklische Faktoren teilerfremder Ordnung zu einem zyklischen Faktor zusammenfassen. Verf¨ ahrt man so mit allen Faktoren maximaler Primpotenzordnung, dann mit den Faktoren n¨ achstgr¨ oßerer Primpotenzordnung u.s.w., so findet man die folgenden Darstellungen. Satz 2.38 Jede endliche abelsche Gruppe A ist isomorph zu 1. einem direkten Produkt Z/qZ ,
alle
q
Primzahlpotenzen,
2. einem direkten Produkt Z/d1 Z × . . . × Z/dr Z , alle dν ∈ N mit 1 < d1 | d2 | . . . | dr . (F¨ ur die einelementige Gruppe erh¨alt man jeweils das leere Produkt). Sowohl die Menge und Multiplizit¨at der Primpotenzen q wie die Folge der dν sind jeweils eindeutig durch A bestimmt.
57
2 Gruppen
Die dν nennt man auch die Elementarteiler von A . Die Eindeutigkeitsaussage kann man z.B. folgendermaßen einsehen: dr ist die maximale Ordnung der Eleur ein ar ∈ A . Dann ist dr−1 die maximale mente von A , etwa dr = ord ar f¨ Elementordnung in A / < ar > (wenn nicht schon A = < ar > ) u.s.w. Die Primpotenzzerlegung der dν ergibt die Menge und Multiplizit¨ at der q aus der ersten Zerlegung. 2 Die Eindeutigkeitsaussage darf u ¨brigens nicht so verstanden werden, dass die entsprechenden zyklischen Untergruppen von A eindeutig bestimmt w¨ aren: Z/2Z × Z/2Z l¨asst sich auf sehr verschiedene Weise als Produkt von zwei zyklischen Untergruppen der Ordnung 2 schreiben. Zu nicht-isomorphen endlichen abelschen Gruppen geh¨ oren echt verschiedene Elementarteilerfolgen; das gibt die M¨oglichkeit, die Anzahl der nicht-isomorphen ¨ abelschen Gruppen gegebener Ordnung zu berechnen, vgl. die Ubungsaufgaben hier und zum Kap. 4.
2.10 Aufgaben 1. p sei eine Primzahl. Konstruieren Sie Gruppen GL2 (Z/pZ) und SL2 (Z/pZ) , indem Sie 2 × 2-Matrizen aus Restklassen mod p bilden und Matrixmultiplikation verwenden. Man zeige ord GL2 (Z/pZ) = (p−1)2 p (p+1)
und
ord SL2 (Z/pZ) = (p−1) p (p+1) .
2. Man bestimme alle Untergruppen von (Z/12Z, +) und ((Z/7Z)∗ , ·) . 3. Welche Untergruppen besitzt die Symmetriegruppe des regelm¨ aßigen F¨ unfecks? 4. Ermitteln Sie alle Gruppenhomomorphismen S3 → S3 . 5. Sei G eine Gruppe und Aut G := { f : G → G
Gruppenisomorphismus } .
ur Zeigen Sie, dass Aut G eine Untergruppe von SG ist, und beweisen Sie f¨ alle m ∈ N die Isomorphie Aut (Z/mZ, +) ∼ = (Z/mZ)∗ . 6. Man beweise, dass die additive Gruppe der reellen Zahlen isomorph ist zur multiplikativen Gruppe aller positiven reellen Zahlen, nicht aber zur multiplikativen Gruppe aller reellen Zahlen = 0 . 7. Sei G eine Gruppe und H eine Untergruppe von G vom Index 2 . Zeige, dass H ein Normalteiler in G ist.
58
2.10 Aufgaben
8. Man beweise, dass jede Untergruppe einer zyklischen Gruppe wieder zyklisch ist. 9. Gibt es nat¨ urliche Zahlen n , die keine Primzahlen sind und trotzdem die Fermatsche Kongruenz an ≡ a mod n
f¨ ur alle a ∈ Z
mit
(a, n) = 1
erf¨ ullen? Versuchen Sie, den chinesischen Restsatz zu benutzen und Bedingungen an die Primfaktorzerlegung von n aufzustellen. 10. p sei eine Primzahl. Man beweise pk − 1 | pn − 1
⇐⇒
k|n.
11. Bestimmen Sie in der symmetrischen Gruppe S4 eine Kette von Untergruppen {(1)} = H0 H1 H2 H3 H4 = S4 , jeweils Hi Normalteiler in Hi+1 , mit Faktorgruppe Hi+1 /Hi ∼ = Z/2Z oder Z/3Z . 12. G sei multiplikative Gruppe und K die Menge aller Produkte aus Kommutatoren von G , d.h. Elementen [x, y] := xyx−1 y −1 mit x, y ∈ G . Man zeige: K ist Normalteiler in G mit abelscher Faktorgruppe. K heißt Kommutatoruntergruppe von G . 13. Man verifiziere die folgende universelle Eigenschaft der Kommutatoruntergruppe K von G : Sei h : G → H surjektiver Gruppenhomomorphismus; H ist genau dann abelsch, wenn K ⊆ ker h . 14. Lassen Sie die symmetrische Gruppe S3 durch Konjugation auf sich selbst und auf der Menge aller Untergruppen von S3 operieren. Geben Sie jeweils alle Bahnen und alle Isotropiegruppen an. 15. Sei K ein K¨orper (f¨ ur die Definition vgl. Abschnitt 3.1.2). Beweisen Sie, dass SL2 K auf K := K ∪ {∞} transitiv operiert verm¨ oge der Vorschrift ⎧ ∞ f¨ ur z = ∞ und c=0 ⎪ ⎪
⎨ ab a/c f¨ ur z = ∞ und c = 0 z = ∞ f¨ u r z = ∞ und cz +d=0 ⎪ cd ⎪ ⎩ (az + b)/(cz + d) sonst. 16. Sei G = SL2 C mit der eben definierten Operation. Bestimmen Sie die Isotropiegruppen G0 und G∞ und beweisen Sie, dass G0 ∩ G∞ immer noch transitiv auf C − {0, ∞} operiert. Von den Eigenschaften des K¨ orpers der komplexen Zahlen wird dabei verwendet, dass jedes z ∈ C eine Quadratwurzel besitzt (vgl. z.B. Abschnitt 6.3.2).
59 17. Geben Sie eine 5-Sylowuntergruppe der symmetrischen Gruppe S6 an. Wieviele 5-Sylowuntergruppen gibt es? 18. Finden Sie eine p-Sylowuntergruppe der Gruppe SL2 (Z/pZ) (vgl. Aufg. 1). Wieviele dazu konjugierte Untergruppen gibt es? 19. p < q seien zwei Primzahlen, p kein Teiler von q − 1 . Zeigen Sie, dass jede Gruppe der Ordnung pq abelsch ist, und zwar isomorph zu Z/pqZ . 20. G sei eine Gruppe, die außer dem Einselement nur Elemente der Ordnung 2 besitzt. Zeigen Sie, dass G abelsch ist. 21. Konstruieren Sie m¨oglichst viele nicht-isomorphe Gruppen der Ordnung 12 . 22. A sei eine abelsche Gruppe. Man beweise, dass die Elemente endlicher Ordnung in A eine Untergruppe T (die Torsionsuntergruppe) bilden. 23. Beweisen Sie, dass eine zyklische Gruppe von Primzahlpotenzordnung nicht als direktes Produkt echter Untergruppen geschrieben werden kann. 24. Wieviele nicht-isomorphe abelsche Gruppen der Ordnung 36 gibt es? 25. Zeige, dass jede endliche abelsche Gruppe direktes Produkt ihrer p-Sylowuntergruppen ist.
61
3 Ringe
3 Ringe 3.1 Grundbegriffe 3.1.1 Ringaxiome Wir nennen eine Menge R einen Ring, wenn • R zwei innere Verkn¨ upfungen (Addition und Multiplikation) besitzt, und zwar R × R → R : (a, b) → a + b , R × R → R : (a, b) → a · b , • (R, +) eine abelsche Gruppe ist, insbesondere also eine 0 existiert, • die Multiplikation assoziativ ist, d.h. wenn a(bc) = (ab)c ∀ a, b, c ∈ R , • die Distributivgesetze gelten, d.h. a(b + c) = ab + ac , (b + c)a = ba + ca ∀ a, b, c ∈ R . Wie immer lassen wir den Multiplikationspunkt meistens weg und f¨ uhren — soweit keine Klammern gesetzt sind — Multiplikation vor Addition aus. Beispiele sind etwa Q , C , Z und etwa die Restklassenringe Z/mZ — man vergleiche dazu die Formeln (1.11) bis (1.18) —, aber auch nicht-kommutative Ringe wie die n×nMatrizen mit Eintr¨agen in Z , R u.s.w.; es gibt auch Ringe ohne Einselement wie 2Z oder nZ . Wir wollen uns aber hier auf kommutative Ringe mit Eins beschr¨anken und verlangen zu den bisherigen Axiomen außerdem: • Die Multiplikation soll kommutativ sein. • Es existiere ein Element 1 ∈ R , so dass 1·a=a·1=a
∀a∈R.
J. Wolfart, Einführung in die Zahlentheorie und Algebra, DOI 10.1007/978-3-8349-6498-4_3, © Vieweg+Teubner Verlag | Springer Fachmedien Wiesbaden GmbH 2011
62
3.1 Grundbegriffe
3.1.2 Einfache Eigenschaften und noch mehr Grundbegriffe In allen Ringen gelten die folgenden Rechenregeln: 0 = 0a − 0a = (0 + 0)a − 0a = 0a + 0a − 0a = 0a + 0 = 0a und ebenso 0 = a0 , (−a)b = a(−b) = −ab , (−a)(−b) = ab , a(b − c) = ab − ac ,
(b − c)a = ba − ca .
Das Einselement ist eindeutig bestimmt (warum?); wie das Beispiel der Restklassenringe zeigt, muss aber nicht immer 0 = 1 sein (Z/1Z = {[0]} = {[1]}), und es kann durchaus vorkommen, dass a, b ∈ R existieren mit a = 0 = b , aber ab = 0 . Solche a, b nennt man Nullteiler. atsbereich, wenn Definition: Ein kommutativer Ring R mit Eins heißt Integrit¨ R = {0} ist und keine Nullteiler besitzt. R heißt (kommutativer) K¨ orper, wenn R − {0} eine abelsche Gruppe bez¨ uglich der Multiplikation ist. Ein K¨orper ist automatisch ein Integrit¨atsbereich, aber nicht umgekehrt (Beispiel Z ). Die Nullteilerfreiheit bedeutet, dass aus ab = 0 folgt a = 0 oder b = 0 . ¨ Aquivalent dazu (Distributivgesetz!) ist die Ku ur alle a, b, c ∈ R ¨ rzungsregel: F¨ ist ab = ac ⇒ a = 0 oder b = c . In kommutativen Ringen mit Eins k¨onnen wir wie in Z einen Teilbarkeitsbegriff einf¨ uhren: Definition: a teilt b , geschrieben a | b , wenn ein c ∈ R existiert mit ac = b . a ∈ R heißt Einheit, geschrieben a ∈ R∗ , wenn a | 1 . a ist eine Einheit genau dann, wenn ein a−1 ∈ R existiert mit aa−1 = a−1 a = 1 . Soweit diese Elemente existieren, werden wir wie bei rationalen Zahlen ab anstelle von ab−1 schreiben. Die Konstruktion der primen Restklassengruppen im Ring Z/mZ kann man mit Hilfe des zweiten und dritten Punkts des folgenden S¨atzchens verallgemeinern: Satz 3.1 Sei R = {0} ein kommutativer Ring mit Eins. Dann gilt 1. 2.
1 = 0 , R∗
enth¨ alt keine Nullteiler,
3. R∗ ist eine multiplikative abelsche Gruppe, 4. zwei nicht-Nullteiler a, b ∈ R teilen sich gegenseitig ⇐⇒ a ∈ bR∗ ⇐⇒ ∃ c ∈ R∗ a und b heißen dann assoziiert.
mit
a = bc , b = c−1 a .
63
3 Ringe
Zum Beweis von 1. sei a = 0 . Dann ist a = 1 · a = 0 · a = 0 . 2. Sei a ∈ R∗ . Dann beachte 0 = ab = a−1 ab = 1 · b = b . 3. ist sehr leicht, und 4. folgt daraus, dass f¨ ur nicht-Nullteiler die K¨ urzungsregel gilt: a = bc , b = da ⇒ a = cda ⇒ (1 − cd)a = 0 ⇒ cd = 1 . 2 Schließlich sei erw¨ahnt, dass in endlichen Integrit¨ atsbereichen R f¨ ur a = 0 die Produkte ax , x ∈ R aus Anzahlgr¨ unden und wegen der K¨ urzungsregel alle Elemente von R durchlaufen; dazu geh¨ort insbesondere auch 1 , also ist a ∈ R∗ , m.a.W. Satz 3.2 (und Definition) Endliche Integrit¨atsbereiche sind K¨orper. Restklassenringe Z/mZ sind genau dann K¨ orper, wenn m = p Primzahl ist und werden dann Primk¨orper Fp der Charakteristik p genannt, vgl. dazu Satz 6.1.
3.1.3 Homomorphismen Ein Ringhomomorphismus ist eine Abbildung f : R → S eines Rings R in einen andern Ring S, die mit Addition und Multiplikation vertr¨ aglich ist, d.h. f (a + b) = f (a) + f (b)
und f (ab) = f (a)f (b) ∀ a, b ∈ R
erf¨ ullt. Wie schon bei Gruppenhomomorphismen folgt daraus f (0) = 0 und f (−a) = −f (a) ; da die triviale Abbildung f ≡ 0 auch ein Ringhomomorphismus ist, gilt allerdings auch f¨ ur Ringe mit Eins nicht notwendig f (1) = 1 . F¨ ur K¨ orperhomomorphismen wollen wir darum zus¨ atzlich f (1) = 1 verlangen. Isomorphismen sind (f¨ ur Ringe wie f¨ ur K¨ orper) bijektive Homomorphismen, und ebenso wie bei Gruppen beweist man auch hier den Satz 3.3 F¨ ur einen bijektiven Ring- oder K¨orperhomomorphismus ist auch die Umkehrabbildung ein Homomorphismus. Wie bei Gruppen nennen wir R und S dann isomorph, geschrieben R ∼ = S. Wenn f ein K¨orperhomomorphismus ist und c ∈ R , c = 0 , dann folgt aus f (c)f (c−1 ) = f (1) = 1 , dass f (c) = 0 . Demnach induziert f auf der multiplikativen Gruppe R∗ einen Homomorphismus in die multiplikative Gruppe S ∗ . Außerdem hat f als Homomorphismus additiver Gruppen einen trivialen Kern, nach Satz 2.3.6 gilt also der Satz 3.4 K¨orperhomomorphismen sind stets injektiv. Beispiele f¨ ur Ringhomomorphismen kennen wir bereits aus dem 1. Kapitel, denn nach Konstruktion sind f¨ ur alle m ∈ N die kanonischen Projektionen Z → Z/mZ : n → [n]m
64
3.1 Grundbegriffe
nicht nur Gruppen-, sondern sogar Ringhomomorphismen. Eine andere wichtige Klasse von Ringhomomorphismen sind die Auswertungsabbildungen, die uns in einem sp¨ateren Paragraphen u ¨ber Polynomringe und einem Kapitel u ¨ber K¨ orpererweiterungen noch eingehend besch¨aftigen werden. Im Vorgriff darauf sei folgendes erw¨ahnt: Alle Polynome an xn + an−1 xn−1 + . . . + a1 x + a0 mit rationalen (bzw. ganzzahligen) Koeffizienten aj bilden einen Ring, genannt Q[x] (bzw. Z[x]), wenn man Addition und Multiplikation von Polynomen so ausf¨ uhrt wie aus der Analysis gewohnt; sp¨ater werden wir sehen, dass man Polynome nicht einfach als Funktionen ansehen sollte, aber f¨ ur den Moment gen¨ ugt diese Vorstellung. Beim Einsetzen bestimmter Werte α ∈ C f¨ ur die Variable x in die Polynome p(x) entsteht ein Ringhomomorphismus p(x) → p(α) : Q[x] → Q[α] ⊆ C in den Unterring von C , der gerade von den Werten p(α) gebildet wird (entsprechend f¨ ur Z anstelle von Q). Z.B. erh¨alt man f¨ ur α = 0 jenen Homomorphismus, √ der jedes p(x) auf sein konstantes Glied abbildet. F¨ ur α = i = −1 ist Q[i] sogar ein K¨orper, der Gaußsche Zahlk¨ orper mit dem Unterring Z[i] der ganzen Gaußschen Zahlen. Der Einsetzungshomomorphismus ist in beiden F¨ allen nichttrivial und enth¨alt im Kern z.B. das Polynom x2 +1 . Entsprechende K¨ orper und Ringe enth¨alt man auch f¨ ur andere Quadratwurzeln: Satz 3.5 (und Definition) Sei d ∈ Z , = 0 , = 1 und quadratfrei, d.h. νp (d) = 0 oder 1 f¨ ur alle p ∈ P , und sei √ √ 1+ d f¨ ur d ≡ 1 mod 4 . ur d ≡ 2 , 3 mod 4 , α := α := d f¨ 2 Dann gilt: Q[α] = {r + sα | r, s ∈ Q}
ist ein K¨orper.
Z[α] = {m + nα | m, n ∈ Z}
ist ein Ring.
Diese K¨orper nennt man quadratische Zahlk¨ orper und die Ringe ihre Ringe ganzer Zahlen Od . √ Dass Q[α] = Q[ d] K¨orper ist, sieht man an
√ √ −1 u−v d (u + v d) : = 2 u − v2d
Wenn n¨amlich u, v ∈ Q nicht beide = 0 sind, ist u2 −v 2 d = 0 , weil d quadratfrei ist. 2
65
3 Ringe
3.1.4 Produkte Wie bei Gruppen lassen sich auch Produkte R × S := {(r, s) | r ∈ R , s ∈ S} von Ringen R und S mit komponentenweiser Addition und Multiplikation definieren. Besitzen beide ein Einselement, so ist die Eins des Produkts das Element (1, 1) . Was bei Gruppen u ¨ber Projektionen und universelle Eigenschaften gesagt wurde, l¨ asst sich im wesentlichen auf Ringe u ¨bertragen. Es sei nur vor einem m¨oglichen Missverst¨andnis gewarnt: Weil nat¨ urlich (1, 0)(0, 1) = (0, 0) ist, sind nichttriviale Produkte von Integrit¨ atsbereichen niemals wieder Integrit¨atsbereiche. Es hat daher auch nicht viel Sinn, etwa direkte Produkte von K¨orpern einzuf¨ uhren.— Immerhin k¨onnen wir nun dem chinesischen Restsatz eine endg¨ ultige Form geben: Satz 3.6 Seien m und n teilerfremde nat¨ urliche Zahlen. Dann ist Z/mnZ ∼ = Z/mZ × Z/nZ . Mit Hilfe der Primfaktorzerlegung von m ∈ N erh¨alt man also Z/pνp (m) Z . Z/mZ ∼ = p|m
3.1.5 Quotientenk¨ orper Genau wie man Q aus dem Ring Z der ganzrationalen Zahlen konstruiert, kann man jeden Integrit¨atsbereich in einen zugeh¨ origen Quotientenk¨ orper einbetten: Satz 3.7 Zu jedem Integrit¨atsbereich R gibt es einen Quotientenk¨orper K und einen (injektiven) Einbettungshomomorphismus i : R → K , so dass K der kleinste K¨orper ist, der i(R) enth¨alt. K ist bis auf Isomorphie eindeutig bestimmt durch die folgende universelle Eigenschaft: F¨ ur alle injektiven Ringhomomorphismen j : R→L
in einen K¨orper
L
existiert genau ein K¨orperhomomorphismus k : K→L
mit
j =k◦i.
L j
↑k i
R → K
Zum Beweis definiere man auf der Menge {(a, b) ∈ R × R | b = 0} ¨ Aquivalenzrelation (a, b) ∼ (c, d) : ⇐⇒ ad = bc ,
die
66
3.2 Ideale und Restklassenringe
¨ bezeichne die Aquivalenzklassen mit ae a e · = b f bf
,
a b
=
c d
und definiere
a e af + eb + = . b f bf
¨ Dann ist leicht nachzurechnen, dass die Aquivalenzklassen einen K¨ orper bilden; aK −1 0 b 0 := b und 1 := b sind leicht zu finden, das multiplikative Inverse b = ab existiert f¨ ur a = 0 . Die Einbettung des Integrit¨ atsbereichs R in K erfolgt durch i(a) := a1 . Da f¨ ur alle b ∈ R , b = 0 , die Quotienten a a 1 · = 1 b b den ganzen K¨orper K durchlaufen, ist K in der Tat der kleinstm¨ ogliche Quotientenk¨orper f¨ ur R. Aus dem gleichen Grund gibt es f¨ ur andere Ringhomomorphismen j : R → L nur eine M¨oglichkeit, k so zu definieren, dass das Diagramm kommutativ wird, n¨amlich
i(a) j(a) := . k i(b) j(b) i(a) · i(b)−1 =
Dass K schließlich durch die angegebene Eigenschaft bis auf Isomorphie eindeutig bestimmt ist — unabh¨angig von der konkreten Konstruktion —, kann man wieder ganz ¨ahnlich wie beim direkten Produkt von Gruppen zeigen und soll hier nicht n¨aher ausgef¨ uhrt werden. 2 Die Einbettung i wollen wir in Zukunft einfach als identische Abbildung schreiben, d.h. R als Unterring seines Quotientenk¨ orpers auffassen. Als Beispiel kann etwa der K¨orper der rationalen Funktionen Q(x) := {
p(x) | p, q ∈ Q[x] , q ≡ 0} q(x)
dienen, der Quotientenk¨orper des Polynomrings Q[x] . Auch f¨ ur rationale Funktionen lassen sich durch Auswertungsabbildungen K¨ orper konstruieren, indem man die Variable x durch (z.B.) komplexe Zahlen α ersetzt, soweit der Nenner an der Stelle α nicht verschwindet. Die entstehenden Unterk¨ orper Q(α) von C sind nat¨ urlich nicht immer neu; f¨ ur die quadratischen Irrationalzahlen α , die im letzten Abschnitt diskutiert wurden, ist z.B. Q(α) = Q[α] . Nebenbei bemerkt, sind dies die Quotientenk¨orper der Ringe Od .
3.2 Ideale und Restklassenringe 3.2.1 Grundbegriffe. Homomorphiesatz Sei R ein kommutativer Ring mit 1. Dann nennt man die Untermenge I ⊆ R ein Ideal in R , wenn
67
3 Ringe
• I bez¨ uglich +“ eine abelsche Gruppe ist und ” • xI ⊆ I f¨ ur alle x ∈ R ist. Beispiele f¨ ur Ideale sind etwa < 2 > := 2Z ⊂ Z ,
{0} ⊆ R ,
R⊆R,
{p(x) ∈ Q[x] | p(1) = p(−1) = 0} ⊂ Q[x] , {p(x, y) ∈ Q[x, y] | p(0, 0) = 0} ⊂ Q[x, y] (Ring der Polynome in zwei Variablen x , y mit rationalen Koeffizienten). F¨ ur jeden Ringhomomorphismus f : R → S ist ker f := {r ∈ R | f (r) = 0} , der Kern von f , ein Ideal in R . Wie bei Gruppen ist f injektiv genau dann, wenn ker f = 0 ist. Wenn 1 in einem Ideal enthalten ist, dann muss dieses bereits der ganze Ring sein. K¨orper K haben nur {0} und K als Ideale. Satz 3.8 (und Definition) Sei I ein Ideal des kommutativen Rings R und x ≡ y mod I
: ⇐⇒ x − y ∈ I ⇐⇒ x ∈ I + y
¨ ( kongruent modulo I ). ≡“ ist eine Aquivalenzrelation, die Restklassen seien ” mit [x]I oder x mod I bezeichnet, die Menge der Restklassen mit R/I . Auf R/I werden Addition und Multiplikation durch [x]I + [y]I [x]I · [y]I
:= [x + y]I := [xy]I
(wohl-)definiert und R/I dadurch zum Restklassenring gemacht mit [0]I und [1]I als 0 und 1. Die kanonische Projektion κ : R → R/I : x → [x]I ist ein Ringhomomorphismus mit ker κ = I . Satz 3.9 (Homomorphiesatz fu ¨ r Ringe) Sei f : R → S ein surjektiver Ringhomomorphismus mit ker f = I . Dann ist R/I ∼ = S verm¨oge eines Isomorphismus i : R/I → S : [x]I → f (x)
mit
i◦κ=f .
Die Beweise laufen genau wie f¨ ur die Beispiele Z/mZ bzw. wie f¨ ur den Homomorphiesatz f¨ ur Gruppen.
68
3.2 Ideale und Restklassenringe
3.2.2 Erzeugung. Teilbarkeit 1.) Hauptideale < r > := {ar | a ∈ R} = rR = Rr gibt es in jedem Ring R (wie immer hier als kommutativ vorausgesetzt). Es gibt sogar Ringe, in denen jedes Ideal Hauptideal ist, sogenannte Hauptidealringe: Sei z.B. I ein beliebiges Ideal in Z . Wenn I = {0} = < 0 > , so hat I ein kleinstes positives Element m . Mit einer Schlussweise, die wir z.B. schon im Beweis von Satz 2.6 kennengelernt haben, zeigt man, dass I = ist: Jedes n ∈ I l¨asst sich mit Rest durch m teilen, und n = qm + r
⇒
r = n − qm ∈ I ,
also ist m entweder nicht minimal gew¨ahlt oder r = 0 , also n ∈ < m > . 2.) F¨ ur zwei Ideale I1 , I2 des Rings sagt man, I1 teilt I2 , geschrieben I1 | I2 , genau dann wenn I2 ⊆ I1 . Man u ¨berzeugt sich sofort, dass diese Definition bei Hauptidealen der Teilbarkeitsdefinition f¨ ur die Erzeugenden genau entspricht: < r1 > | < r2 >
⇐⇒
r1 | r2
3.) Der Durchschnitt I1 ∩ I2 zweier (oder auch beliebig vieler) Ideale ist wieder ein Ideal, das kleinste gemeinsame Vielfache oder kgV dieser Ideale, d.h. das gr¨oßte Ideal, das in allen Iν enthalten ist. 4.) Entsprechend ist der ggT zweier (oder beliebig vieler) Ideale das kleinste Ideal, urlich welches I1 und I2 (bzw. alle Iν ) umfasst, und das ist nat¨ I1 + I2 := {a + b | a ∈ I1 , b ∈ I2 } bzw. Iν := { aν | aν ∈ Iν , fast alle aν = 0 } . ν
ν
Anwendung : F¨ ur den ggT d = (a, b) von a und b ∈ Z ist < d > = < a > + < b > , d.h. es gibt x und y ∈ Z mit d = xa + yb , vergleiche Satz 1.5. Nun ist aber klar, dass der Satz nicht nur in Z , sondern f¨ ur alle Hauptidealringe richtig ist; bei der Verallgemeinerung der Primfaktorzerlegung auf Ringe wird dies eine wichtige Rolle spielen. 5.) Die Elemente aν , ν in einer Indexmenge J , heißen Erzeugende des Ideals I, wenn < aν > , anders geschrieben I = < aν | ν ∈ J > . I = J
69
3 Ringe
Dies ist besonders wichtig f¨ ur endlich erzeugte Ideale I = < a1 , . . . , an > = {
n
xν aν | xν ∈ R } .
ν=1
3.2.3 Noethersche Ringe Das Beispiel I := < 2, x > aller Polynome mit geradem konstantem Glied im Ring der Polynome Z[x] mit ganzzahligen Koeffizienten zeigt, dass keineswegs alle Ideale Hauptideale sind. Allerdings haben sehr viele kommutative Ringe (in der Tat alle, die wir hier benutzen werden) wenigstens die Eigenschaft, dass alle Ideale endlich erzeugt sind. Diese werden Noethersche Ringe genannt nach der Begr¨ underin der modernen Algebra, Emmy Noether (1882 – 1935). Die definierende Eigenschaft hat wichtige Umformulierungen: Satz 3.10 Sei R ein kommutativer Ring. Folgende Aussagen sind ¨aquivalent: 1. Alle Ideale sind endlich erzeugt. 2. Jede aufsteigende Kette von Idealen I1 ⊂ I2 ⊂ . . . bricht ab. 3. Jede nichtleere Menge M von Idealen besitzt maximale Elemente, d.h. ∃M ∈ M
mit
I ∈ M, M ⊆ I ⇒ I = M .
Zum Beweis von 1. ⇒ 2. sei I := ν∈N Iν . I ist ein Ideal, also I = < x1 , . . . , xn > . Jedes xi liegt in einem Iνi . Mit ν := max{νi | i = 1, . . . , n} ist I = Iν . Zum Beweis von 2. ⇒ 3. sei I1 ∈ M . Wenn I1 nicht selbst maximal ist, gibt es ein I2 ∈ M , welches I1 echt enth¨alt, u.s.w. Da die so konstruierte aufsteigende Kette von Idealen aus M mit einem In = M abbrechen muss, ist M ∈ M maximal. Um 3. ⇒ 1. zu beweisen, sei I ein beliebiges Ideal in R und x1 ∈ I . Wenn ahle ein < x1 > = I , w¨ahle ein x2 ∈ I − < x1 > , wenn < x1 , x2 > = I , w¨ x3 ∈ I − < x1 , x2 > usw. Man erh¨alt so eine echt aufsteigende Folge von Idealen in I . Diese muss ein maximales Element < x1 , . . . , xn > haben, und dieses muss I sein. 2
3.2.4 Primideale und maximale Ideale Ein Ideal P eines kommutativen Rings R mit Eins heißt Primideal, wenn ∀ a, b ∈ R : ab ∈ P ⇒ a oder b ∈ P . Beispiele f¨ ur Primideale sind 1. alle < p > in Z f¨ ur Primzahlen p ,
70
3.2 Ideale und Restklassenringe
2. < x > in Z[x] , 3. < p(x) > f¨ ur alle linearen Polynome in Q[x] , oder allgemeiner f¨ ur alle irreduziblen Polynome p , die in Q[x] keine echten Teiler außer den Einheiten Q∗ besitzen (vgl. Satz 3.17), 4. < x > im Ring der Polynome in zwei Variablen Q[x, y] . Maximale Ideale M in R sind solche, die = R sind und kein echtes Oberideal besitzen, d.h. außer M selbst oder R . Von den Beispielen oben sind das erste und das dritte gleichzeitig maximale Ideale: In Z ist das einzige Ideal, was < p > echt umfasst (teilt!), das Ideal Z = < 1 > selbst; die entsprechende Eigenschaft f¨ ur irreduzible Polynome in einer Variablen werden wir bald kennenlernen. Beispiele 2. und 4. sind nicht maximal: < x > ⊂ < 2, x > ⊂ Z[x] ,
< x > ⊂ < x, y > ⊂ Q[x, y]
Die Beispiele dienen gleichzeitig als Illustration f¨ ur folgenden Satz 3.11
R sei kommutativer Ring mit Eins.
1. P R Primideal
⇐⇒
R/P Integrit¨ atsbereich.
2. M R maximales Ideal
⇐⇒
3. M R maximales Ideal
=⇒
R/M K¨orper. M Primideal.
4. Jedes Ideal I R ist in einem maximalen Ideal enthalten. Beweis: 1. ist klar nach Definition. 2. Sei M maximal und x ∈ / M . Dann ist < x > + M = R , insbesondere gibt es y ∈ R , m ∈ M mit xy + m = 1
⇒
xy ≡ 1 mod M ,
d.h. [x]M hat in R/M ein multiplikatives Inverses, damit ist R/M ein K¨ orper. Die Umkehrung geht fast analog: Sei R/M ein K¨ orper und I ein Ideal mit M I ⊆ R , x ∈ I − M . Dann gibt es eine L¨ osung der Kongruenz xy ≡ 1 mod M
⇒
1∈I
⇒
I=R.
3. folgt aus 1. und 2. 4. ist eine Behauptung ganz anderen Typs und erfordert Hilfsmittel aus der Mengenlehre, die wir bisher noch nicht gebraucht haben. Jede vollst¨andig geordnete Teilmenge {Iν } von Idealen = R (als Ordnung verwenden wir die Inklusion, und vollst¨andig“ heißt, dass f¨ ur je zwei dieser Ideale Iν ⊆ Iμ oder Iμ ⊆ Iν gilt) ” hat eine obere Grenze in der Menge aller Ideale, n¨ amlich die Vereinigung Iν aller dieser Ideale. Dann sagt das Zornsche Lemma (was man als ein Axiom der Mengenlehre ansehen kann), dass jedes Element der betrachteten Menge von einem maximalen Element u ¨berboten wird, hier also: Jedes Ideal I = R ist in einem maximalen Ideal enthalten. 2
71
3 Ringe
3.3 Polynome 3.3.1 Grundbegriffe Sei R ein kommutativer Ring mit Eins. Warum kann man Polynome mit Koeffizienten in R nicht einfach wie in der Analysis als Polynomfunktionen der Form R → R : x → p(x) = an xn + an−1 xn−1 + . . . + a1 x + a0 ,
alle aj ∈ R , (3.1)
einf¨ uhren? Als Beispiel diene das Polynom R = F2 = Z/2Z ,
p(x) := x2 + x ,
welches in F2 die Nullfunktion beschreibt. Es gibt aber gute Gr¨ unde, p nicht mit dem Nullpolynom zu identifizieren: In K¨orpern, die F2 in nat¨ urlicher Weise enthalten (wir werden in Kap. 7 K¨orper mit 2n Elementen kennenlernen, die das tun), beschreibt das Polynom mit den gleichen Koeffizienten nicht die Nullfunktion. Wir definieren also den Polynomring R[x] als die Menge der formalen Summen der Gestalt (3.1), vornehmer ausgedr¨ uckt (um nicht n¨ aher erkl¨ aren zu m¨ ussen, was mit x eigentlich gemeint ist) als die Menge aller Abbildungen f : N ∪ {0} → R : j → aj , aj = 0 f¨ ur fast alle j . Addition von Polynomen wird durch punktweise Addition dieser Abbildungen definiert und die Multiplikation durch die Faltung (f ∗ g)(k) :=
k
f (j)g(k − j) .
j=0
Man u ¨berzeuge sich davon, dass diese Definition gerade die u ¨bliche Multiplikation von Polynomen ergibt. F¨ ur den praktischen Gebrauch ist diese Definition nicht immer u unftig weiter die Schreibweise (3.1) ¨bersichtlich; wir werden also k¨ verwenden, allerdings sorgf¨altig unterscheiden m¨ ussen, wann von Polynomen die Rede ist und wann von den ihnen zugeordneten Polynomfunktionen. Der Grad des Polynoms ist das Maximum der Indizes j , f¨ ur die der Koeffizient aj = 0 ist, m.a.W. der h¨ochste wirklich vorkommende Exponent von x . F¨ ur grad p = n nennt man an den fu ur das ¨ hrenden Koeffizienten von p . F¨ Nullpolynom erg¨anzen wir diese Definition durch grad 0 := −∞ . Weil bei der Multiplikation von Polynomen der f¨ uhrende Koeffizient des Produkts genau das Produkt der f¨ uhrenden Koeffizienten wird, erh¨ alt man so den
72
3.3 Polynome
Hilfssatz 3.12 Sei R ein Integrit¨ atsbereich und f, g ∈ R[x] . Dann gilt grad (f g) = grad f + grad g . Insbesondere ist auch R[x] ein Integrit¨ atsbereich. Den Polynomring in n Variablen kann man induktiv definieren als R[x1 , . . . , xn ] = (R[x1 , . . . , xn−1 ])[xn ] . In der Tat ist (R[x])[y] = (R[y])[x] , was man leicht einsieht, wenn man z.B. die oben angegebene vornehme Definition auf Polynome zweier Variablen verallgemeinert.
3.3.2 Symmetrische Polynome Sei R ein kommutativer Ring mit Eins. Ein Polynom f (x1 , . . . , xn ) ∈ R[x1 , . . . , xn ] heißt symmetrisch in x1 , . . . , xn , wenn es unter allen Permutationen der Variablen invariant bleibt, m.a.W. wenn f¨ ur alle σ ∈ Sn f (xσ(1) , . . . , xσ(n) ) = f (x1 , . . . , xn ) . Als Beispiele sind die elementarsymmetrischen Polynome s1 (x1 , . . . , xn ) := x1 + x2 + . . . + xn s2 (x1 , . . . , xn ) := x1 x2 + . . . + x1 xn + x2 x3 + . . . + x2 xn + . . . + xn−1 xn s3 (x1 , . . . , xn ) := x1 x2 x3 + . . . .. .. . . sn (x1 , . . . , xn ) := x1 x2 · . . . · xn wohlbekannt, weil sie im Vietaschen Wurzelsatz als Koeffizienten des Polynoms f (x) = (x − x1 )(x − x2 ) · . . . · (x − xn ) = = xn − s1 (x1 , . . . , xn )xn−1 ± . . . + (−1)n sn (x1 , . . . , xn )
(3.2)
auftreten; wir werden diesen Sachverhalt sowohl so benutzen, dass x1 , . . . , xn als Variable angesehen werden, also f ∈ R[x, x1 , . . . , xn ] annehmen, als auch spezielle Werte f¨ ur die xj einsetzen, d.h. also die Nullstellen von f (x) ∈ R[x] . Dass wir hier von den Nullstellen sprechen k¨ onnen (wenn R = K ein geeigneter K¨orper ist), m¨ ussen wir nat¨ urlich noch rechtfertigen.— Die elementarsymmetrischen Polynome sind aber auch deswegen so wichtig, weil sich alle symmetrischen Polynome aus diesen Grundbausteinen durch Ringoperationen konstruieren lassen:
73
3 Ringe
Satz 3.13 Sei f (x1 , . . . , xn ) ∈ R[x1 , . . . , xn ] ein symmetrisches Polynom. Dann existiert ein eindeutig bestimmtes Polynom g(t1 , . . . , tn ) ∈ R[t1 , . . . , tn ] mit der Eigenschaft f (x1 , . . . , xn ) = g( s1 (x1 , . . . , xn ) , . . . , sn (x1 , . . . , xn ) )
.
Wir verschieben den (etwas technischen) Beweis auf den n¨ achsten Abschnitt und erl¨autern den Satz zun¨achst an Beispielen: 1. x21 + x22 + x23 = (x1 + x2 + x3 )2 − 2(x1 x2 + x1 x3 + x2 x3 ) 2. x31 + x32 = (x1 + x2 )3 − 3(x21 x2 + x1 x22 ) = (x1 + x2 )3 − 3(x1 + x2 )x1 x2 3. Sei f (x) = (x − x1 )(x − x2 ) · . . . · (x − xn ) und (xj − xi )2 D(f ) := 1≤i grad a ist nichts zu zeigen, denn man kann q = 0 w¨ ahlen. Sei also a(x) = an xn + . . . ,
b(x) = bm xm + . . .
mit
an , bm = 0 und n ≥ m ,
wobei die Punkte jeweils die Summanden mit kleineren Exponenten andeuten n−m , denn offenbar sollen. Das f¨ uhrende Glied des Polynoms q ist nun an b−1 m x ist n−m b(x)) < grad a(x) , grad (a(x) − an b−1 m x und genauso kann man von dem linksstehenden Polynom weitere Vielfache von b(x) abziehen, um den Grad des Restes weiter zu vermindern, bis er schließlich < grad b ist. 2 Definition: Wir nennen ein Polynom f und allgemeiner ein Element eines Rings R irreduzibel, wenn es weder 0 noch Einheit ist, und wenn es nur von sich selbst und von Einheiten des Rings geteilt wird, genauer: wenn alle Teiler in R∗ und f R∗ liegen. Aus Hilfssatz 3.12 folgt sofort: Hilfssatz 3.16 Sei R ein Integrit¨atsbereich. Dann ist die Einheitengruppe R∗ auch die Einheitengruppe des Polynomrings R[x] . Da es bei Teilbarkeitsfragen auf Multiplikation mit Einheiten nicht ankommt, liegt es nahe, ein Repr¨asentantensystem der Bahnen auszuw¨ ahlen, wenn man die Einheitengruppe auf dem Ring durch Multiplikation operieren l¨ asst. Das legt folgende Definition nahe: Definition: Im Polynomring K[x] u orper K nennen wir ein Polynom ¨ber einem K¨ normiert, wenn es von der Form xn + an−1 xn−1 + . . . + a0 ist. Es heißt Primpolynom, wenn es normiert und irreduzibel ist. F¨ ur jeden K¨orper K sind die linearen normierten Polynome x − a , a ∈ K , Primpolynome von K[x] , aber je nach Wahl von K kann es in K[x] noch mehr Primur K = Q , nicht aber f¨ ur K = C . Diepolynome geben: x2 +1 ist Primpolynom f¨ ser Unterschied wird uns in den sp¨ateren Abschnitten u orpererweiterungen ¨ber K¨ noch eingehend besch¨aftigen.
77
3 Ringe
3.4.2 Eindeutige Primpolynomzerlegung Satz 3.17 Sei K ein K¨ orper. Im Polynomring K[x] 1. ist jedes Ideal ein Hauptideal, 2. gibt es f¨ ur je zwei Polynome a, b einen (normierten) gr¨oßten gemeinsamen Teiler, 3. der sich durch h¨ochstens n = min{grad a, grad b} Divisionen mit Rest bestimmen l¨asst, 4. gilt f¨ ur beliebige a, b ∈ K[x] und Primpolynome p ∈ K[x] p | ab
⇒
p|a
oder
p|b,
5. l¨asst sich jedes Polynom a(x) = 0 bis auf Einheiten und Reihenfolge eindeutig in ein Produkt von Primpolynomen zerlegen. Da der Beweis ganz analog zu dem in Abschnitt 1.3 gef¨ uhrten Beweis f¨ ur Z verl¨auft und ohnehin gleich noch im allgemeinerem Rahmen der euklidischen Ringe abgehandelt werden wird, sei hier als Beispiel nur der erste Punkt bewiesen: Wenn das Ideal I ⊆ K[x] nicht {0} ist, enth¨ alt es ein Polynom b kleinsten Grades. Jedes andere Polynom a ∈ I l¨asst sich mit Rest durch b teilen. Dieser Rest r = a − qb liegt aber auch in I und hat kleineren Grad als b , muss daher 0 sein. Also ist a ∈ < b > , folglich I = < b > . 2
3.4.3 Nullstellen Satz 3.18 Sei R ein Integrit¨atsbereich und a(x) ∈ R[x] ein Polynom vom Grad n. Dann hat a h¨ ochstens n Nullstellen in R . Wenn R = K ein K¨orper ist, besteht eine Bijektion xj ←→ (x − xj ) zwischen den Nullstellen xj ∈ K von a und den linearen Primpolynomteilern (x − xj ) | a(x) von a . Zum Beweis betrachten wir zuerst den Fall, dass R = K ein K¨ orper ist. Wenn (x − xj ) | a(x) , dann ist nat¨ urlich a(xj ) = 0 . Wenn umgekehrt a(xj ) = 0 , teile man a(x) durch (x − xj ) mit Rest r = a(x) − q(x)(x − xj ) ,
78
3.4 Euklidische und faktorielle Ringe
und dieser Rest muss grad r < 1 erf¨ ullen, also konstant sein. Setzt man rechts f¨ ur x den Wert xj ein, so sieht man, dass r = 0 ist, also gilt (x − xj ) | a(x) . Wegen Hilfssatz 3.12 kann a(x) h¨ochstens n Linearfaktoren haben, demnach h¨ ochstens n verschiedene Nullstellen. Diese Aussage bleibt f¨ ur Integrit¨ atsbereiche anstelle von K¨orpern richtig, weil man immer zum Quotientenk¨ orper u ¨bergehen kann und dabei die Anzahl der Nullstellen allenfalls gr¨ oßer werden kann. 2 Nat¨ urlich k¨onnen Primpolynomteiler in der Faktorzerlegung von a(x) mehrfach auftreten, und wie in der Zahlentheorie von Z kann man die Multiplizit¨ at des uhPrimpolynoms p in der Zerlegung von a als p-Ordnung ord p (a) = νp (a) einf¨ ren. Handelt es sich bei p um ein lineares Polynom (x − x0 ) , das also einer Nullstelle entspricht, so nennt man νp (a) die Nullstellenordnung von a im Punkt x0 und schreibt daf¨ ur ord x0 a . Im Fall R = R oder C steht dieser Begriff ¨ in Ubereinstimmung mit den entsprechenden Begriffen aus Analysis und Funktionentheorie. Der oben bewiesene Satz wird f¨ ur Ringe mit Nullteilern falsch: Im Ring Z/8Z hat das Polynom x2 −1 die vier Nullstellen [1], [3], [5], [7] , vgl. auch die Bemerkungen in Abschnitt 1.5.2. Schließlich sei erw¨ahnt, dass es K¨orper gibt, in deren Polynomring jedes Polynom in Linearfaktoren zerf¨allt, wo also (mit Multiplizit¨ at gez¨ ahlt) jedes Polynom ebensoviele Nullstellen besitzt, wie sein Grad angibt. Solche K¨ orper nennt man algebraisch abgeschlossen aus einem Grund, der sp¨ ater im Kapitel u ¨ber K¨orpererweiterungen klar werden wird. Es gen¨ ugt nat¨ urlich, dazu zu verlangen, dass jedes Polynom u ¨berhaupt eine Nullstelle hat: Dann kann man durch den entsprechenden Linearfaktor dividieren und die Voraussetzung auf den Quotienten anwenden, u.s.w.. Der K¨orper der komplexen Zahlen C ist ein algebraisch abgeschlossener K¨orper, wie wir im Fundamentalsatz der Algebra 6.16 sehen werden.
3.4.4 Eine Anwendung: Involutionen zyklischer Gruppen Bei unserem ersten Versuch, endliche Gruppen zu klassifizieren, sind wir auf das Problem gestossen, alle ihre Involutionen zu bestimmen, d.h. alle Automorphismen σ mit σ = id , σ 2 = id . Aus Satz 2.6 wissen wir, dass wir uns auf die additiven Gruppen Z/nZ beschr¨anken k¨onnen. Wir m¨ ussen noch beweisen: Hilfssatz 2.30 Sei p > 2 Primzahl. Z/pZ hat nur die Involution σ : Z/pZ → Z/pZ : [n] → −[n] . Zum Beweis sei σ([1]) = x ∈ Z/pZ . Da [1] die Gruppe erzeugt, ist σ durch x eindeutig bestimmt: F¨ ur alle a ∈ Z/pZ ist σ(a) = ax , wobei man ax durch Multiplikation der Repr¨asentanten ausrechnen kann, also Multiplikation im K¨ orper
79
3 Ringe
Fp = Z/pZ . Nach Voraussetzung muss nun x = 1 sein (vereinfacht f¨ ur = [1] ), 2 2 aber x = 1 . Das Polynom x − 1 hat aber nach unserem Satz im K¨ orper Fp nur die Nullstellen 1 und −1 , daher die Behauptung. 2 F¨ ur nicht-Primzahl-Ordnungen ist der Satz in dieser Form nicht richtig: Z/8Z hat drei Involutionen [n] → [3n] , [5n]
oder
[7n] ,
entsprechend der Tatsache, dass x2 − 1 im Ring Z/8Z vier Nullstellen hat. Die Zahlentheorie dieser Restklassenringe werden wir im n¨ achsten Kapitel allgemeiner und systematischer kennenlernen.
3.4.5 Eine Anwendung auf die elementare Zahlentheorie Satz 3.19 (Wilson) Sei p eine Primzahl. Dann ist (p − 1)! ≡ −1 mod p . Beweis: Links steht das Produkt u ¨ber alle Elemente der multiplikativen Gruppe des K¨orpers Fp . Da mit jedem a ∈ F∗p auch a−1 ∈ F∗p ist, lassen sich die Faktoren zu Paaren a · a−1 = 1 zusammenfassen mit Ausnahme der Elemente a ∈ F∗p , welche a2 = 1 erf¨ ullen. Da die Gleichung x2 = 1 im K¨ orper Fp genau die L¨osungen ±1 hat, folgt daraus die Behauptung. 2
3.4.6 Euklidische Ringe Ein Integrit¨atsbereich R wird euklidischer Ring genannt, wenn eine Gradfunktion g auf R existiert, die auf R − {0} nichtnegative ganzzahlige Werte annimmt und eine Division mit Rest in folgendem Sinne erlaubt: ∀ a, b ∈ R , b = 0 , ∃ q, r ∈ R
mit
a = qb + r
und r = 0 oder g(r) < g(b)
(3.5)
Wir wissen schon, dass Z und Polynomringe K[x] u orpern K Beispiele eu¨ber K¨ klidischer Ringe sind, im ersten Fall mit g(b) = |b| und im zweiten Fall mit g(b) = grad b als Gradfunktion. Weitere wichtige Beispiele werden wir bald kennenlernen. Der euklidische Algorithmus zur Bestimmung des ggT und die eindeutige Primfaktorzerlegung l¨asst sich auf alle euklidischen Ringe ganz wie f¨ ur Z und K[x] entwickeln, wir werden letzteres herleiten aus dem Satz 3.20 Euklidische Ringe sind Hauptidealringe.
80
3.4 Euklidische und faktorielle Ringe
Der Beweis verl¨auft wie schon zweimal gehabt: In einem Ideal I = {0} nehme man ein Element m = 0 kleinsten Grades. F¨ ur ein beliebiges a ∈ I wende man Division mit Rest durch m an, dann geh¨ort der Rest r ebenfalls zu I und erf¨ ullt g(r) < g(m) , also hat man r = 0 ⇒ a = qm ⇒ a ∈ < m > ⇒ I = < m > . 2
3.4.7 Faktorielle Ringe Einen Integrit¨atsbereich R nennen wir einen faktoriellen Ring, wenn jedes Element in R bis auf Einheiten und Reihenfolge eindeutig in ein Produkt von irreduziblen Elementen zerlegt werden kann; zur Defininition von irreduzibel vgl. 3.4.1. Die Einschr¨ankung kommt daher, dass – wie bei Polynomen – auch in anderen Ringen jedes p ∈ R von allen Elementen aus R∗ und aus pR∗ geteilt wird, bei irreduziblen p aber nur von diesen. Man nennt Elemente, die sich um Faktoren ur aus der Einheitengruppe R∗ unterscheiden, assoziiert (diese bilden eine Bahn f¨ ∗ die Multiplikationsoperation von R auf R ) und w¨ ahlt zweckm¨ aßigerweise unter den irreduziblen Elementen ein Repr¨asentantensystem P der Klassen assoziierter Elemente aus; in Z waren das die positiven unter den irreduziblen Zahlen, in K[x] die normierten unter den irreduziblen Polynomen. Mit diesen Bezeichnungen liegt ein faktorieller Ring genau dann vor, wenn sich jedes a ∈ R , a = 0 , bis auf die Reihenfolge eindeutig schreiben l¨asst als a = rp1 · . . . · pn
mit
r ∈ R∗ ,
alle pj ∈ P .
Satz 3.21 Sei R Integrit¨ atsbereich und Hauptidealring, z.B. also ein ein euklidischer Ring. Dann ist R faktoriell. Hilfssatz 3.22 Sei R ein Hauptidealring. Dann besitzt jede nichtleere Menge von Hauptidealen = R maximale Elemente. Insbesondere ist n¨amlich R Noethersch, und daher ist die Aussage des Hilfssatzes ein Spezialfall von Satz 3.10. 2 Dieser Hilfssatz dient zum Nachweis der Existenz einer Primfaktorzerlegung: Zu jedem Hauptideal < a0 > = R gibt es ein maximales < m > ⊇ < a0 > . Nach Abschnitt 3.2.2.2 heißt das, dass m keinen nichttrivialen Teiler haben kann, also irreduzibel ist, wir k¨onnen also o.B.d.A. m ∈ P voraussetzen. G¨ abe es also Elemente a ∈ R ohne Primfaktorzerlegung, dann k¨ onnte man die davon erzeugten Ideale < a > betrachten und ein maximales < a0 > unter diesen Idealen ausw¨ahlen. Dann w¨are das oben gefundene m ein Teiler von a0 , < a0 > < a0 m−1 > , also hat a0 m−1 eine Primfaktorzerlegung, somit auch a0 , Widerspruch.— Die Eindeutigkeit der Primfaktorzerlegung folgt aus
81
3 Ringe
Hilfssatz 3.23 Sei R Hauptidealring, p ∈ P irreduzibel in R und a, b ∈ R . Dann gilt p | ab ⇒ p | a
oder
p|b.
Zum Beweis des Hilfssatzes nehmen wir an, dass p a . Dann ist < p > < p > + < a > , also ( < p > ist maximal) < p > + < a > = R ⇒ ∃ x, y ∈ R
mit
px + ay = 1 ⇒ bpx + aby = b .
p teilt beide Summanden links, also auch b , wie behauptet. 2 Der Beweis des Satzes folgt daraus wie der von Satz 1.11: Wir wissen bereits, dass jedes a ∈ R eine Primfaktorzerlegung besitzt. W¨ are diese nicht eindeutig, so g¨abe es — nach Division durch gleiche Faktoren — zwei gleiche Produkte rq1 · . . . · qk = sp1 · . . . · pl mit r, s ∈ R∗ , alle qi und pj ∈ P , kein pj = qi . Der Hilfssatz zeigt aber, dass q1 Teiler von s (unm¨oglich) oder von einem pj sein muss. Da beide irreduzibel sind, muss < q1 > = < pj >
⇒
q 1 ∈ R ∗ pj
sein, beide also Repr¨asentanten der gleichen R∗ -Bahn, nach Konstruktion also q1 = pj , Widerspruch. 2 Eine genauere Betrachtung des Beweises zeigt, dass nicht die Eigenschaft gebraucht wurde, dass R Hauptidealring ist, sondern dass die Aussagen der beiden Hilfss¨atze gelten. Da diese umgekehrt leicht aus der Tatsache gefolgert werden ¨ k¨onnen, dass R faktoriell ist (Ubungsaufgabe), kann man einen sch¨ arferen Satz so formulieren: Satz 3.24 Der Integrit¨atsbereich R ist genau dann faktoriell, wenn 1. jede nichtleere Menge von Hauptidealen maximale Elemente besitzt, 2. f¨ ur alle a, b ∈ R und alle irreduziblen p ∈ R gilt p | ab
⇒
p|a
oder
p|b.
Dieser Satz zeigt z.B., dass auch Ringe wie Z[x] , die nicht selbst Hauptidealringe sind, faktoriell sein k¨onnen; vgl. dazu Folgerung 6.12. Auch f¨ ur andere Ringe R nennt man irreduzible Elemente p ∈ R prim, wenn sie f¨ ur alle a, b ∈ R die Implikation aus 3.24.2 erf¨ ullen.
82
3.4 Euklidische und faktorielle Ringe
3.4.8 Noch mehr euklidische Ringe Außer Z und K[x] sind noch einige Ringe Od euklidisch, die wir in Satz 3.5 eingef¨ uhrt haben. Satz √ 3.25 Die Ringe Od = Z[α] der ganzen Zahlen quadratischer Zahlk¨orper Q( d) sind euklidisch f¨ ur d = −11, −7, −3, −2, −1, 2, 3, 5, 13 . Wir erl¨autern den Beweis zun¨achst am Beispiel des Rings O−1 = Z[i] der ganzen Gaußschen Zahlen. Als Gradfunktion f¨ ur die Division mit Rest nimmt man die Norm, hier einfach das komplexe Betragsquadrat g(m + ni) = N (m + ni) := |m + ni|2 = m2 + n2 und muss zeigen, dass f¨ ur alle a, b ∈ Z[i] ein q ∈ Z[i] existiert mit der Eigenschaft N (a − qb) < N (b) . Da sich die Norm multiplikativ verh¨ alt, gen¨ ugt es, durch b a zu dividieren und zu zeigen, dass zu jedem β = b ∈ Q(i) ein ganzes q ∈ Z[i] existiert mit N (β−q) < 1 . Da N einfach das Quadrat des euklidischen Abstands zum Nullpunkt bezeichnet, muss m.a.W. gezeigt werden, dass es zu jedem β einen Punkt q des Gitters Z[i] gibt, der zu β einen Abstand < 1 hat. Da der gr¨oßte Abstand zum Gitter Z[i] f¨ ur die Punkte 12 (1 + i) + Z[i] erreicht wird und < 1 ist, ist Z[i] euklidisch. F¨ ur die anderen negativen d verl¨ auft der Beweis genauso: Jedesmal nutzt man aus, dass Od = Z[α] ein Gitter in C bildet mit kleiner Maschengr¨oße, so dass der gr¨oßte Abstand aller komplexen β zu den Gitterpunkten < 1 bleibt. F¨ ur die genannten d > 0 ist die Situation komplizierter, weil die Wahl der Gradfunktion weniger auf √ der Hand liegt als im imagin¨ arquadratischen Fall. F¨ ur √ jedes β = √ r + s d ∈ Q( d) definiert man das algebraisch konjugierte als β := r − s d und bettet Od verm¨oge β → (β, β ) = (x, y) in den R2 ein. Das Bild wird ebenfalls ein Gitter O , d.h. besteht aus den ganzzahligen Linearkombinationen zweier u angiger Vektoren, n¨ amlich ¨ber R linear unabh¨ (1, 1) (Bild von 1 ) und √ √ ( d, − d) f¨ ur d ≡ 2, 3 mod 4 , √ √ 1 ur d ≡ 1 mod 4 (1 + d, 1 − d) f¨ 2 (Bild von α ). Als Gradfunktion f¨ ur die Division mit Rest benutzt man hier den | = |xy| und wie oben muss man zeigen, dass f¨ ur Normbetrag |N (β)| := |ββ √ alle β ∈ Q( d) ein q ∈ Od existiert mit |N (β − q)| < 1 . Man u ¨berlege sich zun¨achst, dass f¨ ur alle reellen x, y |x + y| < 2
und |x − y| < 2
=⇒
|xy| < 1
83
3 Ringe
implizieren. Nach Konstruktion von N gen¨ ugt es dann, zu zeigen, dass f¨ ur alle 2 (x, y) ∈ R ein Gitterpunkt (x0 , y0 ) ∈ O existiert mit |(x − x0 ) + (y − y0 )| und |(x − x0 ) − (y − y0 )| < 2 . Das f¨ uhrt wieder auf eine geometrische Frage u amlich die auf ¨ber Gitter, ob n¨ der Spitze stehenden Quadrate mit Diagonalenl¨ ange 4 , deren Mittelpunkte die Gitterpunkte sind, die Ebene l¨ uckenlos u asst sich in den ¨berdecken. Diese Frage l¨ angegebenen vier F¨allen positiv beantworten. 2 ur die |N | eine Gradfunktion f¨ ur den euEs gibt noch mehr reellquadratische Od , f¨ klidischen Algorithmus darstellt, aber f¨ ur diese muss man den Beweis sorgf¨ altiger f¨ uhren. Aber auch ohne euklidisch zu sein, kann Od sehr wohl faktoriell sein: Man vermutet sogar, dass es unendlich viele reellquadratische Hauptidealringe Od gibt. Im Gegensatz dazu stehen die imagin¨arquadratischen Ringe ganzer Zahlen: Hier weiß man — erst seit 1966 — nach Arbeiten von A. Baker bzw. H. Stark nach Vorarbeiten von Heegner, dass man Hauptidealringe in genau neun F¨ allen hat, n¨amlich f¨ ur −d = 1 , 2 , 3 , 7 , 11 , 19 , 43 , 67 , 163 . Erinnerung: Wir haben schon in 1.3.2 gezeigt, dass O−26 nicht faktoriell ist. Im Licht unserer neueren Erkenntnisse liegt √ √ das daran, dass das irreduzible Element 3 zwar das Produkt (1 + −26)(1 − −26) teilt, aber keinen der Faktoren. Klar, dass der Ring dann auch nicht euklidisch sein kann. Es gibt noch einen wesentlichen Unterschied zwischen imagin¨ arquadratischen und reellquadratischen Ringen ganzer Zahlen zu erw¨ ahnen: Im ersten Fall ist die Einheitengruppe endlich, n¨amlich {1, −1, i, −i} {e
2πik 6
f¨ ur d = −1 ,
| k = 1, . . . , 6}
f¨ ur d = −3 ,
{1, −1} f¨ ur d < −3 . √ √ √ Im Gegensatz dazu sind 1 + 2 Einheit in O2 , 2 + 3 ∈ O3∗ , 1+2 5 ∈ O5∗ , und alle erzeugen eine unendliche Gruppe von Einheiten (warum? Nachrechnen!). Dass in jedem reellquadratischen Ring ganzer Zahlen solch eine unendliche Einheitengruppe existiert, ist aber ein nichttrivialer Satz der algebraischen Zahlentheorie. Dazu geh¨ort auch eine genauere Untersuchung der Primfaktorzerlegung und ihrer Beziehung zur Primfaktorzerlegung in Z . Im Ring der Gaußschen ganzen Zahlen beginnt die Folge der Primzahlen beispielsweise mit 1+i , 3 , 2+i , 2−i , 7 , 11 , 3+2i , 3−2i , 4+i , 4−i , 19 , 23 , 5+2i , 5−2i , 31 , . . .
84
3.5 Diophantische Fragen zu Zahlen und Polynomen
(wie geordnet?). Der Leser versuche, ¨ahnliche Primzahltafeln f¨ ur die anderen Od aufzustellen und zu einer Vermutung dar¨ uber zu kommen, was die Primzahlen in Z mit diesen zu tun haben. Mit etwas gr¨oßerem Methodenrepertoire werden wir diese Frage in Abschnitt 4.6 erneut aufrollen.
3.5 Diophantische Fragen zu Zahlen und Polynomen Diophantische Gleichungen oder Ungleichungen sind solche, bei denen ganzzahlige L¨osungen gesucht werden. Von solchen diophantischen Problemen haben wir bisher nur die Gleichung (1.1) kennengelernt. Das liegt nicht daran, dass diophantische Probleme f¨ ur die Zahlentheorie weniger wichtig w¨ aren: Als Triebfeder f¨ ur die Entwicklung von Techniken und Theorien haben sie immer eine große Rolle gespielt, wenn auch vielleicht nur deswegen, weil sie wie wenig anderes die Neugier gereizt haben. Aber von alters her sind diophantische Probleme mit so vielen verschiedenen ad-hoc-Methoden angegangen worden, dass sich eine mehr systematische Entwicklung erst in den letzten Jahrzehnten abzeichnet, die Diophantische bzw. arithmetische Geometrie. F¨ ur einen einf¨ uhrenden Kurs ist diese aber bei weitem zu schwierig. Hier soll darum nur als Exkurs an wenigen Beispielen gezeigt werden, • dass und warum diophantische Gleichungen reizvoll und schwierig sind, • dass ihr Analogon f¨ ur Ringe von Funktionen sehr viel leichter zug¨ anglich sein kann. Letzteres ist eine Erfahrung, die sich sp¨atestens seit dem Bilharzschen Beweis (1937) [Bi] des Analogons der Artinschen Vermutung (vgl. Abschnitt 4.2.1) f¨ ur Funktionenk¨orper immer wieder best¨atigt hat, die aber hier nur an einem typischen Beispiel vorgef¨ uhrt werden soll.
3.5.1 Pythagor¨ aische Zahlentripel ¨ Gesucht ist eine Ubersicht u osungen der ¨ber die Gesamtheit aller ganzzahligen L¨ Gleichung (3.6) x2 + y 2 = z 2 wie z.B. die Tripel (3, 4, 5) , (5, 12, 13) . Da mit jedem L¨ osungstripel auch alle Vielfachen L¨osungstripel sind, darf man o.B.d.A. annehmen, dass x, y, z teilerfremd sind. Da Quadrate nur ≡ 0 oder 1 mod 4 sein k¨ onnen, bleibt dann nur die M¨oglichkeit, dass z ungerade und genau eines der x, y gerade ist. O.B.d.A. darf man also 2 | x voraussetzen und nat¨ urlich, dass alle x, y, z > 0 sind: Satz 3.26 Die positiven teilerfremden L¨ osungen der Gleichung (3.6) mit 2 | x sind genau von der Form x = 2ab ,
y = a2 − b2 ,
z = a2 + b2
85
3 Ringe
mit teilerfremden ganzen a > b > 0 , von denen genau eines gerade ist. Dass jedes Paar (a, b) in der angegebenen Weise auf eine L¨ osung von (3.6) f¨ uhrt, sieht man sofort. Zum Beweis der Umkehrung beachte, dass (x, y) = 1 , (y, z) = 1 und y, z beide ungerade sein m¨ ussen. Also sind z−y z+y , ∈Z 2 2 teilerfremd und nach (3.6) x 2 2
=
z−y 2
z+y 2
.
Wegen der Eindeutigkeit der Primfaktorzerlegung m¨ ussen beide Klammern rechts Quadrate b2 und a2 nat¨ urlicher Zahlen sein, daher die Behauptung. 2
3.5.2 Das Fermatproblem Bleibt Gleichung (3.6) l¨osbar, wenn man 2 durch gr¨ oßere Exponenten ersetzt? Der franz¨osische Jurist und Verwaltungsbeamte Pierre de Fermat hat um das Jahr 1640 herum gezeigt, dass die entsprechende Gleichung f¨ ur vierte Potenzen nur triviale L¨osungen (mit x oder y = 0 ) besitzt. Man kann sogar etwas mehr zeigen, n¨amlich Satz 3.27 Die Gleichung Zahlen.
x4 + y 4 = z 2
hat keine L¨ osung durch nat¨ urliche
Zum Beweis d¨ urfen wir annehmen, wir h¨atten eine L¨ osung der Gleichung mit minimalem z ∈ N . Dann sind x und y notwendig teilerfremd und von verschiedener aisches Zahlentripel, m¨ ussen also von Parit¨at. x2 , y 2 , z bilden dann ein Pythagor¨ der Form x2 = 2ab , y2 = a2 − b2 , z = a2 + b2 sein mit a > b > 0 von verschiedener Parit¨ at. Wegen y 2 ≡ 1 mod 4 kommt nur 2 | b , 2 a in Frage, also b = 2c ,
x 2 2
= ac ,
und
(x, y) = 1 ⇒ (a, b) = 1 ⇒ (a, c) = 1 ⇒ a = d2 , c = f 2 f¨ ur teilerfremde nat¨ urliche Zahlen d und f , 2 d . Daher ist y 2 = a2 − b2 = d4 − 4f 4 ,
86
3.5 Diophantische Fragen zu Zahlen und Polynomen
was eine neue teilerfremde L¨osung der Pythagorasgleichung (2f 2 )2 + y 2 = (d2 )2 ergibt. Also existieren teilerfremde nat¨ urliche l und m mit 2f 2 = 2lm , d2 = l2 + m2 . Wie gehabt m¨ ussen dann aber auch l und m selbst Quadrate r 2 und s2 sein, man h¨atte also eine L¨osung der Ausgangsgleichung r4 + s4 = d2 mit d ≤ d2 = a ≤ a2 < z im Widerspruch zur Minimalit¨ at von z . 2 Fermat hat dar¨ uber hinaus behauptet, er k¨onne entsprechendes f¨ ur alle anderen Exponenten > 2 zeigen; h¨aufig wurde diese Behauptung als der große Fermat” sche Satz“ bezeichnet, im Gegensatz zum kleinen Fermatschen Satz“ 2.11, den er ” wirklich beweisen konnte. Was den großen“ Fermatschen Satz betrifft, so sind wir ” heute davon u ¨berzeugt, dass Fermat sich in seiner Behauptung geirrt hat, denn man hat das Problem 350 Jahre lang mit einer Vielzahl von Methoden attackiert, und es hat sich als ¨außerst widerstandsf¨ahig erwiesen. Man sollte betonen, dass das Problem eigentlich uninteressant ist: Seine L¨ osung hat keine wichtigen Konsequenzen f¨ ur die u ¨brige Mathematik. Andererseits hat es vielen mathematischen Theorien wichtige Denkanst¨oße gegeben und sich so als sehr theoriestiftend erwiesen. Hier ist zun¨achst die algebraische Zahlentheorie zu nennen. Man kann den Zusammenhang mit algebraischen Zahlen plausibel machen anhand der Gleichung x3 + y 3 = (x + ζ3 y) (x + ζ32 y) (x + y) = z 3 √
mit der dritten Einheitswurzel ζ3 = −1+2 −3 ; man wird also auf ein zahlentheoretisches Problem im Ring O−3 gef¨ uhrt, und analog kann man f¨ ur h¨ ohere Exponenten die Arithmetik der Kreisteilungsk¨orper einsetzen, von denen sp¨ ater noch die Rede sein wird. Man hat so eine Vielzahl von Kriterien f¨ ur die Behandlung des Fermatproblems entwickelt und auf diesem Wege bewiesen (Wagstaff, s. [Ri1]), dass xn + y n = z n (3.7) f¨ ur 2 < n < 125000 nur triviale ganzzahlige L¨ osungen mit x oder y = 0 besitzt. Aus der algebraischen Geometrie weiß man seit 1983 (Satz von Faltings, vormals Vermutung von Mordell, vgl. [CSi]), dass auf den algebraischen Kurven
87
3 Ringe
xn + y n = 1 f¨ ur n > 3 nur endlich viele rationale Punkte, d.h. Punkte mit rationalen Koordinaten, liegen k¨onnen. Daraus folgt, dass (3.7) f¨ ur jedes feste n > 3 h¨ochstens endlich viele ganzzahlige teilerfremde L¨ osungen (x, y, z) haben kann. Unter Verwendung eines alten Kriteriums von Sophie Germain und neuer analytischer (Sieb-) Methoden haben Adleman, Fouvry und Heath-Brown ([AHB], [Fou]) gezeigt, dass f¨ ur mehr als zwei Drittel aller Primzahlexponenten n = p ∈ P die Gleichung (3.7) h¨ochstens dann nichttriviale L¨ osungen haben kann, wenn eine der Zahlen x, y, z durch p teilbar ist (es gen¨ ugt nat¨ urlich, die Unl¨ osbarkeit von (3.7) f¨ ur n = 4 und f¨ ur Primzahlexponenten zu beweisen). Die gr¨oßte Evidenz f¨ ur die Richtigkeit der Fermatschen Behauptung hat sich aber in der Folgezeit daraus ergeben, dass sie aus weitergehenden Vermutungen folgt, die f¨ ur die Zahlentheorie sehr viel wichtiger sind als die Fermat-Vermutung selbst. Das eine ist eine Vermutung von Taniyama und Shimura u ¨ber elliptische Kurven y 2 = x3 + ax + b mit a, b ∈ Q (das kubische Polynom rechts ohne doppelte Nullstellen), die hier zu kompliziert zu erkl¨aren ist. Jedenfalls weiß man seit 1987 aus Arbeiten von Hellegouarch, Frey, Ribet, Serre, dass aus einem Beweis dieser Vermutung die L¨ osung des Fermatproblems folgt; eine L¨osungsstrategie ist 1993 von A. Wiles vorgelegt worden, reichte aber in einem wichtigen Punkt noch nicht aus. In zwei neuen Manuskripten vom Oktober 1994 ist es dann Wiles und R. Taylor gelungen, die L¨ ucke zu schließen ([Wi], [TWi]).
3.5.3 Die abc-Vermutung Die andere große Vermutung, deren L¨osung die L¨ osung des Fermatproblems im´, welche plizieren w¨ urde, ist die abc-Vermutung von Masser und Oesterle leichter zu erkl¨aren ist: Zu jedem ε > 0 sollte eine Konstante C(ε) existieren, so dass f¨ ur alle teilerfremden a, b, c ∈ Z gilt: a + b + c = 0 ⇒ max{|a|, |b|, |c|} ≤ C(ε)K 1+ε f¨ ur K := p p∈P , p|abc
Der Exponent 1 + ε ist m¨oglicherweise zu optimistisch; jedenfalls kann er nicht durch 1 ersetzt werden, wie das folgendes Beispiel zeigt: Es ist ϕ(3m ) = 2 · 3m−1 , also nach 2.10 22·3
m−1
≡ 1 mod 3m
⇒
m
43 = 3m k + 1 m
a = 1 , b = 3m k , c = −43
⇒
88
3.5 Diophantische Fragen zu Zahlen und Polynomen
erf¨ ullen die Bedingungen der abc-Vermutung mit K ≤ 6k , also |b|/K → ∞ f¨ ur 1+ε m → ∞ . Andererseits w¨ urde aber |b|/K gegen 0 gehen f¨ ur m → ∞ , wenn K in der Gr¨oßenordnung von 6k bleibt. G¨abe es nun eine nichttriviale L¨osung von (3.7), so setze man a = xn , b = y n , c = −z n . Da der quadratfreie Kern K von abc gleich dem von xyz ist, sollte nach der abc-Vermutung z n kaum schneller wachsen als xyz < z 3 . Man k¨ onnte also die Fermat-Vermutung jedenfalls f¨ ur große n (je nach der Gr¨ oße von C(ε) ) aus der abc-Vermutung ableiten. Leider ist man von einem Beweis der abc-Vermutung weit entfernt: Die besten heute bekannten Ergebnisse (Tijdeman, Stewart, Yu Kunrui nach Vorarbeiten von Waldschmidt [ST], [SY]) geh¨ oren zur Theorie der diophantischen Approximationen und besagen leider nur log max{|a|, |b|, |c|} < C(ε)K 2/3+ε .
3.5.4 abc und Fermat f¨ ur Polynome Dass es auch Pythagor¨aische Tripel in Polynomringen R[x] gibt, ist leicht zu sehen, und das Fermatproblem ist leicht zu verallgemeinern. Weniger klar ist, was eine vern¨ unftige Verallgemeinerung der abc-Vermutung sein soll. Es hat sich als zweckm¨aßig herausgestellt, den Absolutbetrag durch den Grad des Polynoms zu ersetzen und analog den quadratfreien Kern durch seinen Grad. Wir beschr¨ anken uns dabei der Einfachheit halber auf Polynome u ¨ber C, wo alle Primpolynome linear sind und die Anzahl der verschiedenen Primpolynomteiler von K daher gerade die Anzahl n0 (abc) der verschiedenen Nullstellen von abc ist, also ohne Multiplizit¨at gez¨ ahlt. R. Mason hat Diophantische Probleme f¨ ur Polynomringe und Funktionenk¨orper in großer Allgemeinheit bearbeitet [Mas]; ihm wird zumeist der folgende bemerkenswerte Satz zugeschrieben, der jedoch schon 1981 von Stothers bewiesen wurde. Die hier wiedergegebene elementare Version stammt von Serge Lang: Satz 3.28 Seien a, b, c ∈ C[x] teilerfremde Polynome mit a + b + c = 0 , nicht alle konstant. Dann gilt max{grad a, grad b, grad c} < n0 (abc) . Beweis: Die Polynome a, b, c sind sogar paarweise teilerfremd, haben also disjunkte Nullstellen bzw. Linearfaktoren in a = A (x − αi )mi , b = B (x − βj )nj , c = C (x − γk )rk .
89
3 Ringe
Sei etwa a das Polynom mit dem gr¨oßten Grad (also mi ). Mit f := gilt f g /g a = =− . f + g + 1 = 0 ⇒ f + g = 0 ⇒ b g f /f
a c
, g :=
b c
Nun sind aber g /g und f /f die aus der Analysis wohlbekannten logarithmischen Ableitungen und lassen sich daher leicht berechnen, wenn man die Produktzerlegung von f und g in Linearfaktoren kennt; mit Hilfe von Derivationen l¨ asst sich das auch rein algebraisch, d.h. u ¨ber beliebigen algebraisch abgeschlossenen Grundk¨orpern rechtfertigen: nj rk − x − βj x − γk a = − mi rk . b − x − αi x − γk Erweitert man diesen Bruch mit dem quadratfreien Kern K := (x − αi ) (x − βj ) (x − γk ) , so erh¨alt man in Z¨ahler und Nenner ein Polynom eines Grades < n0 (abc) = grad K . Da a und b teilerfremd sind, und weil die eindeutige Primpolynomzerlegung gilt, muss also gelten grad a < n0 . 2 Satz 3.29 Sei n ∈ N , n > 2 . Dann hat die Gleichung un + v n = w n nur triviale L¨osungen u, v, w ∈ C[x] , d.h. u, v, w stimmen bis auf konstante Faktoren u ¨berein. Andernfalls darf man nach Division durch gemeinsame Teiler voraussetzen, dass u, v, w teilerfremd sind (Division durch gemeinsame Teiler) und nicht alle konstant. Man setze a = un , b = v n , c = −w n ; wenn etwa u den maximalen Grad unter den drei Polynomen hat, folgt aus dem abc-Satz der Widerspruch n grad u = grad a < n0 (abc) = n0 (uvw) ≤ grad uvw ≤ 3 grad u . 2
3.6 Aufgaben 1. Sei p eine Primzahl und Z(p) := { ab ∈ Q | p b } . Man zeige, dass Z(p) ein Ring ist, und bestimmen Sie alle Ideale von Z(p) , etwa durch Angabe ¨ von Erzeugenden: Uberlegen Sie sich zuerst, dass Z(p) ein Hauptidealring ist. Beweisen Sie, dass Z(p) genau ein maximales Ideal P besitzt und dass gilt: Z(p)/P ∼ = Z/pZ = Fp
90 2. Zeigen Sie anhand des Ideals < 3 , 1 + kein Hauptidealring ist.
√
√ −26 > , dass der Ring Z[ −26]
3. Formulieren und beweisen Sie Isomorphies¨ atze f¨ ur die Ringtheorie (analog zu Abschnitt 2.5.3). 4. Schreiben Sie x41 + x42 + x43 als Polynom in elementarsymmetrischen Polynomen. 5. Benutzen Sie den kleinen Fermatschen Satz 2.11, um das Polynom xp −x ∈ Fp [x] in Primpolynome zu zerlegen. 6. Seien m, n ∈ N und d = (m, n) ihr ggT, und sei K ein K¨ orper. Zeigen Sie, d n m dass x − 1 der ggT der Polynome x − 1 und x − 1 in K[x] ist. 7. Zeige Q[x]/xQ[x] ∼ = Q. ¨ 8. Uberlegen Sie sich, dass der Restklassenring Z[i]/2Z[i] vier Elemente hat, darunter einen Nullteiler. 9. Man beweise, dass der Restklassenring F3 [x]/ < x2 + 1 > ein K¨ orper mit 9 Elementen ist. √ 10. F¨ uhren Sie den Beweis aus, dass O13 = Z[ 12 (1+ 13)] ein euklidischer Ring ist. 11. Zeigen Sie, dass O13 eine unendliche Einheitengruppe hat. √ √ 12. Man beweise: O−7 = Z[ 12 (1 + −7)] ist euklidisch, der Unterring Z[ −7] ist aber kein Hauptidealring. √ 13. Zeigen Sie, dass O−2 = Z[ −2] nur die Einheiten ±1 besitzt, und bestimmen Sie mindestens zehn (nicht-assoziierte) Primelemente von O−2 . ¨ Hinweis: Uberlegen Sie sich zun¨achst, dass eine Primzahl p ∈ N entweder Primzahl in O−2 bleibt oder das Produkt zweier komplex konjugierter Primelemente in O−2 wird. m
14. Sei 43 = 3m km +1 . Beweisen Sie: Wenn km quadratfrei ist f¨ ur alle m ≥ 0 , m m 3 die abc-Vermutung. Gen¨ ugt auch erf¨ ullen a = 1 , b = 3 km und c = −4 weniger als quadratfrei“? ” 15. Die (inzwischen durch Mihailescu [Mi] gel¨ oste) Catalansche Vermutung u urlicher Zahlen sagt u.a., dass die ¨ber die Abst¨ande reiner Potenzen nat¨ Gleichung x2 − y 3 = 1 in den nat¨ urlichen Zahlen nur die L¨osung (x, y) = (3, 2) besitzt. Man zeige: Wenn die abc-Vermutung richtig ist, kann man daraus folgern, dass die Gleichung jedenfalls nur endlich viele L¨ osungen besitzt.
91
4 Arithmetik modulo n
4 Arithmetik modulo n 4.1 Multiplikative zahlentheoretische Funktionen 4.1.1 Definition Wie wir bereits in Satz 1.29 am Beispiel der Eulerschen Phi-Funktion erw¨ ahnt haben, heißt eine Funktion f : N → C multiplikative zahlentheoretische Funktion, wenn f (1) = 1 und f (nm) = f (n)f (m) ist f¨ ur alle teilerfremden n, m ∈ N . Durch die Werte f (ps ) auf den Primzahlpotenzen ist f also eindeutig bestimmt. Erinnerung: ϕ(n) := ord (Z/nZ)∗ = |{a ∈ N | a ≤ n , (a, n) = 1}| = n
p∈P, p|n
1 (1 − ) . p
Neben der Phi-Funktion sind einige weitere multiplikative Funktionen von großer Bedeutung f¨ ur die Zahlentheorie, besonders f¨ ur dieses Kapitel.
4.1.2 Weitere Beispiele 1.) Die ε-Funktion ε
:
{
1 → 1 n → 0 ∀n≥2
.
2.) Die Identit¨at I : n → n ∀ n ∈ N und ihre Potenzen I m (n) = nm . 3.) Die Einsfunktion 1 = I 0 : n → 1 ∀ n ∈ N . 4.) Die M¨ obiussche μ-Funktion ⎧ ⎨ μ(n) =
1 (−1)l ⎩ 0
f¨ ur n = 1 f¨ ur n = p1 · . . . · pl Produkt von l verschiedenen Primzahlen f¨ ur n mit quadratischen Teilern b2 | n , b ∈ N , b > 1 ,
J. Wolfart, Einführung in die Zahlentheorie und Algebra, DOI 10.1007/978-3-8349-6498-4_4, © Vieweg+Teubner Verlag | Springer Fachmedien Wiesbaden GmbH 2011
92
4.1 Multiplikative zahlentheoretische Funktionen
eingef¨ uhrt von dem Geometer und Astronomen A.F. M¨ obius (1790–1868), dem Entdecker des M¨obiusbandes. F¨ ur die μ-Funktion ist μ(ps ) = {
−1 f¨ ur s = 1 0 f¨ ur s > 1
.
5.) Die Teilerfunktion σ0 (n) := |{d | n | d ∈ N}| . Diese erf¨ ullt at beachte (Aufgabe 1.4), σ0 (ps ) = s + 1 ∀ s ≥ 0 . Zum Beweis der Multiplikativit¨ dass f¨ ur (n, m) = 1 zu jedem d | nm genau ein d1 | n und genau ein d2 | m in N existieren mit d = d1 d2 , d.h. eine Bijektion {d | nm} ↔ {d1 | n} × {d2 | m} .
(4.1)
6.) Die Teilersummenfunktion σ1 (n) := d|n d mit σ1 (ps ) = 1 + p + . . . + ps = (ps+1 − 1)/(p − 1) . Zum Beweis der Multiplikativit¨ at benutzt man wieder die Bijektion (4.1): (n, m) = 1
⇒
σ1 (nm) = (
d1 ) (
d1 |n
d2 ) .
d2 |m
Allgemeiner kann man ganz analog f¨ ur alle k ∈ N Teilerpotenzsummenfunkk tionen σk (n) := d|n d definieren. Wegen (4.1) sind alle multiplikativ.
4.1.3 Exkurs: Vollkommene Zahlen Einige klassische Probleme der elementaren Zahlentheorie ranken sich um die vollkommenen Zahlen, d.h. solche nat¨ urlichen Zahlen n wie z.B. 6 oder 28, welche f¨ ur σ := σ1 der Gleichung σ(n) = 2n ⇐⇒ n =
d
d|n, d=n
gen¨ ugen. Man vermutet z.B., dass es keine ungeraden vollkommenen Zahlen gibt. Beweisen kann man allerdings bis heute nur, dass ungerade vollkommene Zahlen gr¨oßer als 1, 9 × 102550 sein m¨ ussten [GW] und mindestens 420 verschiedene ¨ Primfaktoren besitzen m¨ ussten. Uber gerade vollkommene Zahlen wissen wir wesentlich mehr, obwohl auch hier eine Reihe offener Probleme existieren: Man vermutet, dass es davon unendlich viele gibt; diese Vermutung l¨ asst sich auf die Vermutung zur¨ uckf¨ uhren, dass es unendlich viele Mersennesche Primzahlen gibt. Das sind Primzahlen der Form 2p − 1 , p ∈ P , benannt nach dem Minoritenpater Marin Mersenne (1588–1648), der mit vielen Mathematikern seiner Zeit in Briefwechsel stand. Die Reduktion nimmt man folgendermaßen vor:
93
4 Arithmetik modulo n
Satz 4.1 n = 2m u , m, u ∈ N , 2 u ist genau dann eine vollkommene Zahl, wenn n = 2m (2m+1 − 1) ist mit einer Primzahl 2m+1 − 1 . In diesem Fall muss notwendig auch m + 1 eine Primzahl p sein, und 2p − 1 wird dann die Mersennesche Primzahl Mp genannt. Zum Beweis beachte man, dass σ(2m ) = 2m+1 − 1 und σ(2k − 1) ≥ 2k ; das Gleichheitszeichen gilt hier genau dann, wenn 2k − 1 Primzahl ist. Damit ist die eine Richtung der Behauptung bereits klar, dass f¨ ur Mersennesche Primzahlen p−1 die Zahl 2 Mp vollkommen ist. F¨ ur die Umkehrung sei nun n = 2m u vollkommen, 2 u , also 2n = 2m+1 u = σ(n) = (2m+1 − 1) σ(u) , und daraus folgt offenbar 2m+1 − 1 | u . Zerlegt man u in Primpotenzen ps und ber¨ ucksichtigt, dass σ multiplikativ ist und ps (p − 1) ps = σ(ps ) ps+1 − 1 mit wachsendem s monoton f¨allt, so folgt daraus die erste Ungleichung in u 2m+1 − 1 2m+1 − 1 . ≤ ≤ m+1 σ(u) σ(2 − 1) 2m+1 Die zweite Ungleichung wurde bereits zu Beginn des Beweises erw¨ ahnt; wenn n vollkommen ist, gilt die Gleichheit, und diese tritt genau dann ein, wenn 2m+1 −1 prim ist, was zu zeigen war. Bleibt noch die Zusatzaussage zu beweisen, dass in diesem Fall notwendig m + 1 selbst Primzahl ist: W¨ are m + 1 = kh mit k und h > 1 , so h¨atte man die Zerlegung 2kh − 1 = (2h − 1) (2(k−1)h + 2(k−2)h + . . . + 2h + 1) . 2
4.1.4 Mersennesche Primzahlen Es gibt bis heute kein einfaches Verfahren, unendliche Folgen von Primzahlen automatisch“ zu produzieren; leider sind auch f¨ ur Primzahlen p ∈ P nicht alle ” 2p − 1 wieder Primzahlen: Das kleinste Gegenbeispiel ist 211 − 1 = 23 · 89 . Es sind also spezielle Tests erforderlich, um festzustellen, ob Mp wirklich Primzahl ist. In Kapitel 5 werden wir n¨aher auf solche Primzahltests eingehen und auf die Frage, warum große Primzahlen f¨ ur mehr gut sind als f¨ ur das Guinness’ ” Buch der Rekorde“. Primzahlrekorde sind zumeist mit Mersenneschen Primzahlen aufgestellt worden. Die Fortschritte bei der Konstruktion von Primzahltests wie bei der Konstruktion elektronischer Rechenmaschinen zeigt sich an der folgenden
94
4.1 Multiplikative zahlentheoretische Funktionen
(sehr unvollst¨andigen) Liste, wenn wir in Klammern jeweils das Entdeckungsjahr notieren: Mp ist Mersenne-Primzahl f¨ ur p = 2281
(1952) ,
3217
(1957) ,
4423
(1961) ,
11213
(1963) ,
19937 (1971) , 21701 (1978) , 86243 (1982) , 216091 (1985) , 756839 (1992) , 1398269
(1996) ,
13466917
(2001) ,
43112609
(2008) .
Ingesamt sind heute (2010) 47 Mersenne-Primzahlen bekannt, und die Vermutung, dass es unendlich viele gibt, kann einigermaßen plausibel gemacht werden.
4.1.5 Faltung Zur¨ uck zu den multiplikativen zahlentheoretischen Funktionen. F¨ ur zwei solche Funktionen f und g definieren wir eine Faltung durch n (f ∗ g)(n) := f (d) g( ) . d d|n
Die Summation wird hier immer nur u urlichen Teiler von n durch¨ber die nat¨ gef¨ uhrt; die Definition sollte nicht mit der f¨ ur Polynome in Kap. 3, Abschnitt 3.3.1 eingef¨ uhrten Faltung verwechselt werden. Hier gilt der erfreuliche Satz 4.2 Die multiplikativen zahlentheoretischen Funktionen bilden bez¨ uglich des Faltungsprodukts eine abelsche Gruppe. Zum Beweis ist zun¨achst zu zeigen, dass mit f und g auch f ∗ g multiplikativ ist. Dazu seien n und m ∈ N teilerfremd. Nach (4.1) hat jeder Teiler d von nm eine atzlich gilt dabei eindeutige Zerlegung d = d1 d2 in Teiler d1 | n , d2 | m , zus¨ (d1 , d2 ) = 1 ,
(
n m , )=1 . d1 d2
(4.2)
Darum ist (f ∗ g)(nm) =
f (d) g(
d1 |n d2 |m
d|nm
⎛ = ⎝
d1 |n
nm n m ) = f (d1 d2 ) g( · ) = d d1 d2
⎞⎛ ⎞ n ⎠ ⎝ m ⎠ f (d1 ) g( ) f (d2 ) g( ) = (f ∗ g)(n) · (f ∗ g)(m) . d1 d2 d2 |m
Zum Beweis der Assoziativit¨at beachte man, dass unabh¨ angig von der Klammersetzung (f ∗ g ∗ h)(n) = f (d1 ) g(d2 ) h(d3 ) d1 ,d2 ,d3 |n d1 d2 d3 =n
95
4 Arithmetik modulo n
ist, ebenso wie bei den n¨achsten Punkten u angig von der Multipli¨brigens unabh¨ kativit¨at der beteiligten Funktionen. Die Kommutativit¨ at folgt daraus, dass in der Summationsvorschrift d und nd austauschbar sind. Die Funktion ε spielt die Rolle des Einselements, und die Existenz des Inversen fˇ zu der multiplikativen zahlentheoretischen Funktion f zeigt man durch eine induktive Konstruktion: fˇ(1) := 1 . Sei fˇ f¨ ur alle m < n bereits definiert, dann setze
fˇ(n) := −
d|n , d>1
n f (d) fˇ( ) , d
woraus unmittelbar f ∗ fˇ = ε folgt. Die Multiplikativit¨ at von fˇ folgt ebenfalls induktiv aus der Multiplikativit¨at von f und aus (4.1), (4.2): Sei (n, m) = 1 und die Multiplikativit¨at von fˇ f¨ ur alle Produkte aus Faktoren < n , < m bereits gezeigt (trivial f¨ ur n oder m = 1 ). Dann ist fˇ(nm) = −
d1 |n , d2 |m d1 d2 >1
n m f (d1 ) f (d2 ) fˇ( ) fˇ( ) = d1 d2
⎞⎛ ⎞ ⎛ ⎞ n ⎟⎜ m ⎟ m ⎟ ⎜ ⎜ f (d1 ) fˇ( )⎠ ⎝ f (d2 ) fˇ( )⎠ − fˇ(n) ⎝ f (d2 ) fˇ( )⎠ − = − ⎝ d1 d2 d2 d |n d |m d |m ⎛
1 d1 >1
2 d2 >1
⎛
2 d2 >1
⎞ n ⎟ ⎜ − fˇ(m) ⎝ f (d1 ) fˇ( )⎠ = − fˇ(n) fˇ(m) + fˇ(n) fˇ(m) + fˇ(m) fˇ(n) .2 d1 d |n 1 d1 >1
4.1.6 Beispiele und Folgerungen 1.) Die summatorische Funktion F (n) := d|n f (d) einer multiplikativen zahlentheoretischen Funktion f ist wieder multiplikativ wegen F = f ∗1
.
2.) F¨ ur die summatorische Funktion der μ-Funktion gilt
μ(d) = {
d|n
1 f¨ ur n = 1 0 f¨ ur n > 1
,
denn f¨ ur alle Primpotenzen > 1 gilt μ(d) = μ(pν ) = 1 + (−1) = 0 . d|ps
0≤ν≤s
96
4.2 Die Struktur der primen Restklassengruppe
Anders gesagt gilt μ∗1=ε 3.) (1 ∗ 1)(n) =
d|n 1
ˇ1 = μ bzw.
bzw.
μ ˇ=1.
= σ0 (n) ⇒ 1 ∗ 1 = σ0 ⇒ σ0 ∗ μ = 1
4.) Allgemeiner: (1 ∗ I m )(n) =
d|n d
m
= σm (n) ⇒ 1 ∗ I m = σm
5.) Die Mo ur die summatorische Funktion F von f ¨biussche Umkehrformel f¨ : n f (n) = F (d) μ( ) ∀ n ∈ N , denn d d|n
F =f ∗1
⇒
f =f ∗ε=f ∗1∗μ=F ∗μ.
6.) F¨ ur die Eulersche Phi-Funktion ist die summatorische Funktion Φ := ϕ ∗ 1 = I
⇐⇒
ϕ=I ∗μ
⇐⇒
ϕ(d) = n
∀n,
d|n
weil f¨ ur Primpotenzen > 1 ϕ(ps ) = ps − ps−1 =
d|ps
I(d) μ(
ps ) = d
I(pν ) μ(ps−ν ) .
0≤ν≤s
4.2 Die Struktur der primen Restklassengruppe 4.2.1 Die multiplikative Gruppe endlicher K¨ orper. Primitivwurzeln Ziel dieses ganzen Abschnitts ist es, n¨aheres u ¨ber die (multiplikative) prime Rest∗ klassengruppe (Z/mZ) zu erfahren. Wir wissen bereits, dass es sich um ein direktes Produkt der primen Restklassengruppen zu den Primpotenzmoduln pνp (m) handelt (S¨atze 2.35 und 3.6), wir k¨onnen uns daher auf Primpotenzen m = ps beschr¨anken und beginnen mit dem einfachsten Fall m = p ∈ P . Nach Satz 3.2 ist Z/pZ dann ein K¨orper Fp mit p Elementen, und erste Experimente mit kleinen Primzahlen lassen bereits vermuten, dass F∗p zyklisch ist: F∗5 = ! [2]5 " , F∗7 = ! [3]7 " , F∗11 = ! [2]11 " , F∗13 = ! [2]13 " , F∗17 = ! [3]17 " In der Tat gilt der Satz 4.3 Die multiplikative Gruppe F∗ eines endlichen K¨orpers F ist zyklisch. Insbesondere gilt dies f¨ ur alle F∗p = (Z/pZ)∗ , p Primzahl.
97
4 Arithmetik modulo n
Eine h¨aufig gebrauchte ¨aquivalente Formulierung der zweiten Aussage sagt, dass eine Primitivwurzel mod p existiert, d.h. eine Restklasse [a]p mit der Eigenschaft (Z/pZ)∗ = {a, a2 , . . . , ap−1 ≡ 1 mod p} , oder anders gesagt mit Ordnung p − 1 in der primen Restklassengruppe. Zum Beweis u atzen von Euler und Fer¨berlegt man sich zun¨achst, dass nach den S¨ mat als Ordnungen der Elemente von F∗ nur Teiler d von N := ord F∗ in Frage kommen. Nach Satz 3.18 hat die Gleichung xd − 1 = 0 im K¨orper F h¨ochstens d L¨osungen. Gibt es nun ein Element a ∈ F∗ mit ord a = d , so hat die Gleichung wirklich d L¨osungen, n¨ amlich a, a2 , . . . , ad = 1 . Nicht alle dieser L¨osungen haben selbst die Ordnung d, sondern nur die am mit (m, d) = 1 , also insgesamt ϕ(d) Elemente; man benutze dazu die Isomorphie der zyklischen Gruppe < a > zu (Z/dZ, +) , vgl. Satz 2.6, und etwa Folgerung 1.24. Wenn wir also mit ψ(d) die Anzahl der Elemente der Ordnung d in F∗ bezeichnen, dann wissen wir jetzt •
ψ(d) = 0 f¨ ur d N ,
•
ψ(d) = 0 oder ϕ(d) f¨ ur d | N .
Daraus und aus unserer Kenntnis der summatorischen Funktion von ϕ (Abschnitt 4.1.6.6) folgt N = ψ(d) ≤ ϕ(d) = N . d|N
d|N
Demnach muss f¨ ur alle d | N die Gleichheit ψ(d) = ϕ(d) gelten, insbesondere muss es Elemente a ∈ F∗ der Ordnung N geben, was zu zeigen war. 2 Der Beweis liefert u ¨brigens keinen Hinweis darauf, wo im Fall F = Fp = Z/pZ diese Primitivwurzeln a mod p zu suchen sind. L¨ asst man einen Computer die kleinsten Primitivwurzeln k(p) auflisten (genauer: die kleinsten positiven Repr¨asentanten von Primitivwurzeln mod p ), so zeigt sich ein sehr unregelm¨ aßiges Verhalten. Einem umfangreichen Tafelwerk [WM] der britischen Royal Mathematical Society entnimmt man, dass f¨ ur Primzahlen p < 10000 weniger als ein Zehntel aller Werte k(p) > 10 sind. Die Rekordwerte in diesem Bereich, welche also die Werte an kleineren Primzahlargumenten erstmals u ¨bertreffen, sind k(7) = 3 , k(23) = 5 , k(41) = 6 , k(71) = 7 , k(191) = 19 , k(409) = 21 , k(2161) = 23 , k(5881) = 31 . Wegen der Unregelm¨aßigkeit von k w¨are man schon mit der Kenntnis einer m¨oglichst langsam wachsende Funktion f zufrieden, welche k(p) ≤ f (p) f¨ ur alle p ∈ P erf¨ ullt. Das n¨achste Kapitel wird zeigen, dass eine gute Antwort auf diese
98
4.2 Die Struktur der primen Restklassengruppe
Frage von einiger praktischer Bedeutung w¨are. Aus einer Verallgemeinerung der Riemannschen Vermutung w¨ urde f (p) = O((log p)2 σ0 (p − 1)) folgen (Wang [WY]), ohne diese Hypothese ist nur f (p) = O(p1/4+δ ) bewiesen (Burgess [Bu]). Erw¨ahnt sei in diesem Zusammenhang eine Vermutung von Emil Artin, dass es zu jeder nat¨ urlichen Zahl a , welche kein Quadrat ist, Primzahlen p gibt, f¨ ur welche a Primitivwurzel mod p ist. Auch diese Vermutung ist bis heute nur unter Annahme einer Verallgemeinerung der Riemannschen Vermutung bewiesen worden (Hooley [Hoo]).
4.2.2 Primpotenzmoduln Hilfssatz 4.4 Sei p Primzahl, s ∈ N , a, b ∈ Z . 1.
a ≡ b mod ps
⇒
ap ≡ bp mod ps+1
2.
s ≥ 2 , p = 2
⇒
(1 + ap)p
3.
p a , p = 2
4.
s>2
⇒
≡ 1 + aps−1 mod ps
ord [1 + ap]ps = ps−1 in (Z/ps Z)∗
⇒ 52
s−2
s−3
≡ 1 + 2s−1 mod 2s
⇒
ord [5]2s = 2s−2 .
Beweis: Sei a = b + kps . Da alle Binomialkoeffizienten ( pr ) , 0 < r < p , durch p teilbar sind, ist ap von der Form bp + lps+1 , und das ist die erste Behauptung. Die zweite folgt daraus durch Induktion u ¨ber s : Der Induktionsanfang s = 2 ist klar, und der Induktionsschluss zeigt (1 + ap)p
s−1
= (1 + ap)p
s−2 ·p
≡ (1 + aps−1 )p mod ps+1
(wegen des zus¨atzlichen Exponenten p darf man nach der ersten Behauptung auch den Exponenten des Moduls um 1 erh¨ohen), und nach der binomischen Formel ist (1 + aps−1 )p = 1 + aps + B mit einer Summe B, deren Glieder alle ( pr )p(s−1)r , 1 < r ≤ p enthalten, also mindestens durch ps+1 teilbar sind. Damit ist auch die zweite Behauptung bewiesen.— Aus dieser folgt (1 + ap)p
s−2 ·p
≡ (1 + aps−1 )p ≡ 1 mod ps
und somit ord [1+ap]ps | ps−1 . Eine kleinere Ordnung kommt aber nicht in Frage, s−2 ≡ 1 + aps−1 ≡ 1 mod ps ist. da nach Voraussetzung p a und daher (1 + ap)p Auch die letzte Behauptung wird ganz analog durch Induktion u ¨ber s bewiesen.2 Satz 4.5 Sei p > 2 Primzahl und s ∈ N . Dann ist die prime Restklassengruppe (Z/ps Z)∗ zyklisch.
99
4 Arithmetik modulo n
Beweis: Nach Satz 4.3 kann man ein g ∈ Z als Primitivwurzel mod p w¨ ahlen. Zu zeigen ist, dass man diese Wahl sogar so treffen kann, dass ord [g]ps = ur die Wahl von g ergeben sich folgende (p − 1)ps−1 = ord (Z/ps Z)∗ ist. F¨ M¨oglichkeiten: Wenn g p−1 ≡ 1 mod p2 , so ist g + p immer noch Primitivwurzel mod p , aber nun mit (g + p)p−1 ≡ g p−1 + (p − 1)g p−2 p ≡ 1 + ap mod p2 ,
a ≡ 0 mod p ,
onnen also o.B.d.A. annehmen, dass denn nat¨ urlich ist g p−2 ≡ 0 mod p . Wir k¨ g Primitivwurzel mod p ist mit g p−1 ≡ 1 + ap mod p2 , p a . Nach Hilfssatz 4.4.2 ist dann aber auch s−2
g (p−1)p
≡ 1 + aps−1 ≡ 1 mod ps ,
und f¨ ur alle anderen Teiler d von (p − 1)ps−1 gilt erst recht g d ≡ 1 mod ps (warum?), darum also ord [g]ps = (p − 1)ps−1 , was zu zeigen war. 2 ur s = 1 und 2 zyklisch (mit Erzeugenden [1]2 bzw. Satz 4.6 (Z/2s Z)∗ ist nur f¨ [3]4 ), f¨ ur s > 2 ist (Z/2s Z)∗ = { [(−1)b 5c ]2s | b = 0, 1 ; c = 0, 1, . . . , 2s−2 − 1 } ∼ = ∼ =
< [−1]2s > × < [5]2s > .
F¨ ur s = 1 und 2 ist der Satz klar. F¨ ur s > 2 folgt aus Hilfssatz 4.4.4, dass [5]2s die Untergruppe aller primen Restklassen ≡ 1 mod 4 erzeugt. Da diese vom Index 2 in (Z/2s Z)∗ ist und (−1) die einzige nichttriviale Restklasse repr¨ asentiert, folgt der Rest der Behauptung. 2
4.2.3 Zusammengesetzte Moduln Satz 4.7
(Z/mZ)∗ ist genau dann zyklisch, wenn m = 2 , 4 , ps
oder
2ps
ist f¨ ur eine ungerade Primzahlpotenz ps . Dass die prime Restklassengruppe in den angegebenen F¨ allen zyklisch ist, folgt unmittelbar aus den eben bewiesenen S¨atzen. Dass dies die einzigen zyklischen primen Restklassengruppen sind, folgt aus der direkten Produktzerlegung von (Z/mZ)∗ in prime Restklassengruppen nach Primpotenzmoduln und dem folgenden n¨ utzlichen und einfachen
100
4.2 Die Struktur der primen Restklassengruppe
Hilfssatz 4.8 Sei G das direkte Produkt der endlichen Gruppen Z1 , . . . , Zk und a = (a1 , . . . , ak ) , alle aj ∈ Zj , ord aj = nj ∈ N . Dann ist ord a das kleinste gemeinsame Vielfache von n1 , . . . , nk . So ein a ∈ G erzeugt G genau dann, wenn seine Ordnung die Gruppenordnung ussen dann alle ord aj = ist, also das Produkt aller ord Zj . Nach dem Hilfssatz m¨ ord Zj sein und ihr kgV mit ihrem Produkt u ¨bereinstimmen. Nach Folgerung 1.5 kann man das so formulieren: Hilfssatz 4.9 Unter den gleichen Voraussetzungen ist G zyklisch genau dann, wenn alle Zj zyklisch sind mit paarweise teilerfremden Ordnungen. Da alle Ordnungen primer Restklassengruppen gerade sind mit Ausnahme der Moduln 1 und 2, sind diese Ordnungen nicht paarweise teilerfremd mit Ausnahme der im Satz genannten F¨alle. 2
4.2.4 Potenzreste Die direkte Produktzerlegung erlaubt es, das L¨ osen von Gleichungen in Z/mZ auf das simultane L¨osen von Gleichungen modulo Primpotenzen zur¨ uckzuf¨ uhren. Hier sind die gruppentheoretischen Resultate dieses Abschnitts besonders hilfreich f¨ ur sogenannte reine Gleichungen vom Typ xn ≡ b mod ps . Sei zun¨achst s = 1 und p b ∈ Z . Wenn diese Kongruenz eine L¨ osung hat, nennt man b einen n-ten Potenzrest mod p . Zur Entscheidung, ob es sich bei b um einen n-ten Potenzrest handelt oder nicht, n¨ utzt man die Isomorphie ∗ ∼ (Z/pZ) = (Z/(p − 1)Z , +) aus Satz 4.3 bzw. 2.6 folgendermaßen aus: Sei mit a eine Primitivwurzel mod p bezeichnet und sei b ≡ az , x ≡ ay mod p . Dann ist xn ≡ b mod p ⇐⇒ ny ≡ z mod (p − 1) , und nach 1.25 ist letztere Kongruenz genau dann l¨ osbar, wenn d := (n, p−1) | z . p−1 p−1 | (n,p−1) . Dieses ist genau dann erf¨ ullt, wenn (n, p − 1) | (z, p − 1) bzw. (z,p−1) ¨ Wie im Beweis von 2.36 verwenden wir eine Ubungsaufgabe zu Kapitel 1: Da p−1 m = (z,p−1) die kleinste nat¨ urliche Zahl ist mit der Eigenschaft mz ≡ 0 mod (p − 1) , haben wir ord [b]p = also
p−1 , (z, p − 1)
also
p−1
d | z ⇐⇒ b (n,p−1) ≡ 1 mod p ,
101
4 Arithmetik modulo n
Satz 4.10
b ≡ 0 mod p ist genau dann n-ter Potenzrest mod p , wenn p−1
b (n,p−1) ≡ 1 mod p . In diesem Fall gibt es genau d = (n, p − 1) L¨osungen der Kongruenz xn ≡ b mod p in (Z/pZ)∗ . F¨ ur ungerade Primpotenzen und die meisten n gilt das gleiche Kriterium: Satz 4.11 Seien p > 2 , p b ∈ Z , p n ∈ N , s ∈ N . Dann gilt xn ≡ b mod ps
l¨osbar
⇐⇒
xn ≡ b mod p
l¨osbar
,
und zwar mit der gleichen L¨osungsanzahl in Z/pZ wie in Z/ps Z . Zum Beweis u ¨berlege man sich, dass p − 1 durch ϕ(ps ) zu ersetzen ist, und dass wegen p n (n, p − 1) = (n, (p − 1)ps−1 ) gilt. 2 Das entsprechende Resultat f¨ ur Zweierpotenzmoduln ist etwas komplizierter, weil hier ein Produkt von zwei zyklischen Gruppen vorliegt, aber der Beweis verl¨ auft v¨ollig analog: Satz 4.12 Sei 2 b ∈ Z , s ∈ N, , s > 2 . Dann gilt: 1. 2 n ⇒ xn ≡ b mod 2s eindeutig in (Z/2s Z)∗ l¨osbar. osbar, wenn b ≡ 1 mod 4 und 2. 2 | n ⇒ xn ≡ b mod 2s genau dann l¨ s−2 /d
b2
≡ 1 mod 2s
f¨ ur
d := (n, 2s−2 ) .
In diesem Fall existieren 2d L¨ osungen in (Z/2s Z)∗ . 3. Sei ν2 (n) = k , d.h. 2k | n , 2k+1 n und sei xn ≡ b mod 2k+2 l¨osbar. Dann ist auch xn ≡ b mod 2s f¨ ur alle s ≥ k + 2 l¨ osbar, und zwar mit der gleichen L¨osungsanzahl.
4.2.5 Periodische Dezimalbr¨ uche Eine Erinnerung an unsere Schulmathematik sagt uns, dass rationale Zahlen — hier o.B.d.A. als positiv vorausgesetzt und in teilerfremder Darstellung geschrieben — in periodische Dezimalbr¨ uche entwickelt werden k¨ onnen: F¨ ur alle a, b ∈ N , (a, b) = 1 gibt es n ∈ N , s, r, v ∈ N ∪ {0} mit a = s · 10−v + r · 10−kn . b k≥1
102
4.2 Die Struktur der primen Restklassengruppe
Dabei bestimmen s und v die Vorperiode, r ∈ {0, 1, . . . , 10n −2} ist die Periode — warum lassen wir r = 10n − 1 nicht zu? — und n die Periodenl¨ ange, die wir als minimal gew¨ahlt voraussetzen; im Fall r = 0 ⇒ n = 1 hat man abbrechende Dezimalbru ¨ che. Zum Beweis, dass eine solche Darstellung existiert, zerlege man den Bruch mit Hilfe von (1.1) zun¨achst in der Form s d a = + v b 10 c mit v = max{ν2 (b), ν5 (b)} und (10, c) = 1 ; eine solche Zerlegung ist sogar eindeutig, wenn man 0 ≤ d < c verlangt. Dann ist nur noch der zweite Summand in einen periodischen Dezimalbruch zu entwickeln, dessen Nenner c zu 10 teilerfremd ist. Wegen 1 10−kn = n 10 − 1 k≥1
erhalten wir f¨ ur d/c einen periodischen Dezimalbruch der (minimalen) Periodenl¨ange n genau dann, wenn c | 10n − 1 , n minimal. Diese Kongruenz 10n ≡ 1 mod c ist in der Tat l¨osbar, und zwar gilt genauer der Satz 4.13 Die positive rationale Zahl ab (in teilerfremder Darstellung) hat eine abbrechende Dezimalbruchentwicklung genau dann, wenn b nur aus den Primfaktoren 2 und 5 zusammengesetzt ist. Andernfalls hat ab eine periodische Dezimalbruchentwicklung der Periodenl¨ange n = ord [10]c
in
(Z/cZ)∗ ,
wo c der maximale zu 10 teilerfremde Teiler von b ist. Damit liegt eine nat¨ urliche Erkl¨arung daf¨ ur vor, dass f¨ ur die Nenner 3 und 9 die Periodenl¨ange 1 auftritt, f¨ ur 11 die Periodenl¨ ange 2, f¨ ur 7 und 13 die Periodenl¨ange 6 und f¨ ur 17 die Periodenl¨ange 16 . Nat¨ urlich l¨ asst sich das entsprechende Spiel f¨ ur jede andere Ziffernbasis ebenso betreiben. c ist jeweils zu ersetzen durch den maximalen Teiler von b, der zur Ziffernbasis g teilerfremd ist. Nach dem Eulerschen Satz und wegen der Multiplikativit¨ at von ϕ ist ord [g]c | ϕ(c) | ϕ(b) und somit gilt Folgerung 4.14 Die Periodenl¨ange von ab bei der Entwicklung in der Ziffernbasis g ist stets ein Teiler von ϕ(b) . Die Periodenl¨ange ist gleich ϕ(b) genau dann, wenn die Ziffernbasis g modulo b die Gruppe (Z/bZ)∗ erzeugt.
103
4 Arithmetik modulo n
4.3 Quadratische Reste 4.3.1 Das Legendresymbol Wir bleiben beim Thema Potenzreste“, spezialisieren uns allerdings auf den Fall ” n = 2 . F¨ ur (b, m) = 1 heißt b quadratischer Rest mod m , m ∈ N , m > 1 , wenn x2 ≡ b mod m eine L¨osung in (Z/mZ)∗ besitzt, andernfalls quadratischer Nichtrest. Wir wissen bereits, dass b quadratischer Rest mod m ist genau dann, wenn b quadratischer Rest modulo allen Primpotenzteilern von m ist. Aus 4.10 bis 4.12 ergeben sich die folgenden einfachen Konsequenzen: Satz 4.15 (und Definition) 1. b ist quadratischer Rest mod 4 genau dann, wenn b ≡ 1 mod 2 bzw. mod 4 .
mod 2
bzw.
2. b ist quadratischer Rest mod 2s , s > 2 , genau dann, wenn b ≡ 1 mod 8 . 3. F¨ ur s ∈ N und p > 2 prim ist b quadratischer Rest mod ps genau dann, wenn b quadratischer Rest mod p ist. 4. Die quadratischen Reste b mod p , p > 2 prim, bilden eine Untergruppe vom Index 2 in (Z/pZ)∗ , charakterisiert durch die Eigenschaft b
p−1 2
Modulo p gibt es also jeweils
≡ 1 mod p
p−1 2
.
quadratische Reste und Nichtreste.
5. F¨ ur ungerade Primzahlen p sei (nach A.-M. Legendre 1752 – 1833) das Legendresymbol definiert durch ⎧
⎨ 1 , wenn b quadratischer Rest mod p b −1 , wenn b quadratischer Nichtrest mod p . := ⎩ p 0 , wenn b ≡ 0 mod p Insbesondere gilt also das Eulersche Kriterium
p−1 b ≡ b 2 mod p . p 6. Das Legendresymbol ist eine multiplikative zahlentheoretische Funktion
b Z → {0, 1, −1} : b → . p Da der Wert aber nur von b mod p abh¨angt, definiert es ebenso einen Gruppenhomomorphismus (Z/pZ)∗ → {±1} , dessen Kern genau aus der Untergruppe der quadratischen Reste mod p besteht.
104
4.3 Quadratische Reste
4.3.2 Das erste Erg¨ anzungsgesetz“ ” Ein Spezialfall des Eulerschen Kriteriums tr¨ agt den vornehmen Namen Erstes ” Erg¨anzungsgesetz zum quadratischen Reziprozit¨ atsgesetz“ (letzteres ist ein zentrales Thema dieses ganzen Kapitels und hat wichtige Auswirkungen dar¨ uber hinaus): Satz 4.16 Sei p > 2 Primzahl. Dann ist
p−1 −1 = (−1) 2 p d.h. −1 ist quadratischer Rest mod p genau dann, wenn p ≡ 1 mod 4 ist. In der Tat kann man nicht nur f¨ ur −1 , sondern f¨ ur beliebige feste Z¨ ahler des Legendresymbols zeigen, dass sein Wert von einer Kongruenzbedingung an den Nenner abh¨angt. Zun¨achst jedoch zu einer lehrreichen Anwendung.
4.3.3 Eine Abschweifung: Primzahlverteilung in Restklassen P.L. Dirichlet (1805 – 1859) hat bewiesen, dass in jeder primen Restklasse mod m , also in jeder arithmetischen Progression n + km , (n, m) = 1 und k ∈ N , unendlich viele Primzahlen liegen (eine etwas andere Aussage als die, von der in Abschnitt 1.4.4 die Rede war). Dieser Satz geh¨ ort eigentlich in die analytische Zahlentheorie, und dort wird auch eine pr¨ azisere Version gezeigt, dass die Anzahl der Primzahlen ≤ x in jeder solchen Restklasse asymptotisch gleich x ϕ(m)·log x ist. Durch eine Variation des Beweises von Euklid (Abschnitt 1.4.1) und mit Hilfe unserer bisher gewonnenen Erkenntnisse u ¨ber quadratische Reste k¨onnen wir immerhin in Spezialf¨allen einen kleinen Teil des Dirichletschen Satzes herleiten: Satz 4.17 In jeder primen Restklasse mod 4 liegen unendlich viele Primzahlen. Beweis: a) G¨abe es nur endlich viele Primzahlen p1 , . . . , pm ≡ −1 mod 4 , so k¨onnte man n := 4p1 p2 · . . . · pm − 1 definieren. Nach Konstruktion ist n ≡ −1 mod 4 , enth¨ alt keinen der verwendeten Primteiler pj , kann aber auch nicht ausschließlich aus 2 und Primteilern ≡ 1 mod 4 zusammengesetzt sein, Widerspruch. b) Nun nehmen wir an, es g¨abe nur endlich viele Primzahlen p1 , . . . , pm ≡ 1 mod 4 ; dann w¨are n := (2p1 · . . . · pm )2 + 1 ≡ 1 mod 4 ,
105
4 Arithmetik modulo n
und −1 ≡ n − 1 mod n w¨are quadratischer Rest mod n . Daraus folgt, dass −1 quadratischer Rest modulo allen Primteilern von n ist. Nach Voraussetzung und Konstruktion hat n aber nur Primteiler ≡ −1 mod 4 , und f¨ ur diese ist −1 quadratischer Nichtrest nach dem ersten Erg¨ anzungsgesetz, Widerspruch. 2 Der erste Teil des Beweises l¨asst sich analog f¨ uhren f¨ ur Primzahlen ≡ −1 mod 6 , und es l¨asst sich entsprechend zeigen, dass es zu jedem Modul m > 2 unendlich viele Primzahlen gibt, die quadratische Nichtreste mod m sind.
4.3.4 Ein Kriterium von Gauß Satz 4.18 Sei p > 2 Primzahl, p a ∈ Z , und sei S := {1, 2, . . . ,
p−1 }, 2
−S := {−1, −2, . . . , −
p−1 } 2
( S ∪ −S bildet das absolut kleinste Restsystem, d.h. Repr¨ asentantensystem, asentanten aus −S , welche zu f¨ ur (Z/pZ)∗ ). Sei ferner μ die Anzahl der Repr¨ einem der Vielfachen a, 2a, 3a, . . . , p−1 2 a mod p kongruent sind. Dann ist
a = (−1)μ . p Zum Beweis bezeichnen wir den absolut kleinsten Rest von la mod p mit ur p l . F¨ ur 1 ≤ l = k ≤ p−1 ist ml = mk , denn aus ml = mk ±ml , ml ∈ S f¨ 2 folgt entweder la ≡ ka mod p
⇒
l ≡ k mod p
⇒
l=k
oder la ≡ −ka mod p
⇒
p | (l + k) ,
was beides unm¨ oglich ist. Es ist also {1, 2, . . . , die Multiplikation der
p−1 2
p−1 } = {m1 , m2 , . . . , m p−1 } , 2 2
Kongruenzen la ≡ ±ml mod p ergibt also
p−1 p−1 p−1 ( )! a 2 ≡ (−1)μ ( )! mod p 2 2
nach dem Kriterium von Euler. 2
⇒
a = (−1)μ p
106
4.4 Das quadratische Reziprozit¨ atsgesetz
4.3.5 Das zweite Erg¨ anzungsgesetz“ ” Satz 4.19 Sei p > 2 Primzahl. Dann ist
p2 −1 2 = (−1) 8 , p d.h. 2 ist quadratischer Rest mod p genau dann, wenn p ≡ ±1 mod 8 ist. Den Beweis f¨ uhren wir durch Anwendung des Gaußschen Kriteriums: Sei m ∈ N so bestimmt, dass 2m ≤
p−1 2
und
2(m + 1) >
p−1 ; 2
Dann ist also μ = p−1 2 − m . Die Behauptung ergibt sich somit aus folgender naheliegenden Fallunterscheidung: p p p p
≡ 1 mod8 ≡ −1 mod8 ≡ 3 mod8 ≡ −3 mod8
⇔ ⇔ ⇔ ⇔
p = 8k + 1 ⇔ p = 8k + 7 ⇔ p = 8k + 3 ⇔ p = 8k + 5 ⇔
p−1 2 p−1 2 p−1 2 p−1 2
= 4k , = 4k + 3 , = 4k + 1 , = 4k + 2 ,
m = 2k , m = 2k + 1 , m = 2k , m = 2k + 1 ,
2|μ 2|μ 2μ 2μ
= 2k = 2k + 2 = 2k + 1 = 2k + 1 .2
4.4 Das quadratische Reziprozit¨ atsgesetz In den beiden Erg¨anzungsgesetzen hat sich bereits gezeigt, dass bei festem Z¨ ahler a das Legendresymbol ( ap ) nur von der Restklasse p mod 4a abhing. In der Tat ist das nicht nur f¨ ur a = −1 oder 2 richtig, wie sich an folgendem bereits von Euler um 1745 vermuteten Sachverhalt zeigt: Satz 4.20 (Quadratisches Reziprozit¨ atsgesetz) Seien p = q Primzahlen = 2 . Dann ist
p−1 q−1 q p · = (−1) 2 2 . q p Mit anderen Worten:
p q = q p
außer f¨ ur
p ≡ q ≡ 3 mod 4 ;
im letzteren Fall sind die beiden Legendresymbole verschieden. C.F. Gauß hat als erster verschiedene Beweise f¨ ur dieses Gesetz gegeben (ab 1796), u.a. den bis heute beliebtesten sehr elementaren Beweis, der auf einer Anzahlbetrachtung f¨ ur Gitterpunkte beruht; dieser erweckt allerdings den falschen
107
4 Arithmetik modulo n
Eindruck, es handele sich bei dem Satz um ein bloß kombinatorisches Ph¨ anomen. In Wahrheit hat dieses Gesetz wichtige Auswirkungen auf die ganze Zahlentheorie, insbesondere auf die Arithmetik algebraischer Zahlk¨ orper; deswegen hat es seit Gauß’ Zeiten die Mathematiker immer wieder besch¨ aftigt — ebenso wie seine Verallgemeinerungen, die h¨oheren Potenzrestgesetze. Wir werden in Kap. 7 noch zwei weitere Beweise des Satzes kennenlernen, beginnen aber hier mit einem neueren Beweis von M. Gerstenhaber aus dem Jahr 1962, Abwandlung von Ideen von T. Kubota 1961 und G. Eisenstein 1844, nach Z¨ ahlung Gerstenhabers der 152. Beweis des quadratischen Reziprozit¨ atsgesetzes! Er beruht auf der Konstruktion nichttrivialer Relationen zwischen p-ten und q-ten Einheitswurzeln, genauer gesagt zwischen sogenannten Kreiseinheiten des pq-ten Kreisteilungsk¨orpers: 1.) Seien η := e
2πi p
und ζ := e
2πi q
oder andere p-te bzw. q-te Einheitswurzeln = 1 , die also die zyklischen Gruppen aller p-ten bzw. q-ten Einheitswurzeln erzeugen, und wie im Gaußschen Kriterium sei p−1 q−1 S := {1, 2, . . . , } , T := {1, 2, . . . , }. 2 2 Das Legendresymbol l¨asst sich dann folgendermaßen ausdr¨ ucken:
pa −pa ζ −ζ p = (4.3) q ζ a − ζ −a a∈T
Man zeigt n¨amlich wie im Beweis von Satz 4.18, dass jeder Faktor des Z¨ ahlers bis auf das Vorzeichen genau einmal als Nennerfaktor vorkommt; dieses Vorzeichen ist genau dann negativ zu w¨ahlen, wenn pa ≡ −a mod q ist f¨ ur ein a ∈ T (Man a beachte, dass ζ nur von der Restklasse a mod q abh¨ angt). Die Anzahl dieser Vorzeichenwechsel ist aber nach dem Gaußschen Kriterium gerade der Exponent μ in ( pq ) = (−1)μ . 2.) Die Identit¨at xp − x−p = (η b x − η −b x−1 ) b mod p ∗
unden, indem man auf beiden Seiten mit xp mulf¨ ur alle x ∈ C l¨asst sich begr¨ tipliziert: Beide Seiten haben dann den f¨ uhrenden Koeffizienten 1, weil p | b mod p b , und beide Seiten haben ihre 2p Nullstellen an den Punkten ±ηb . Einsetzen von x = ζ a ergibt ζ pa − ζ −pa = (η b ζ a − η −b ζ −a ) (4.4) ζ a − ζ −a 0≡b mod p
3.) Einsetzen von (4.4) in (4.3) ergibt
p = q
a∈T 0≡b mod p
(η b ζ a − η −b ζ −a ) =
108 =
4.5 Das Jacobisymbol
(η b ζ a −η −b ζ −a ) (η −b ζ a −η b ζ −a ) =
a∈T b∈S
[(ζ 2a +ζ −2a )−(η 2b +η −2b )] .
a∈T , b∈S
Vertauscht man jetzt die Rollen von p und q , so ¨ andert sich in jedem dieser p−1 q−1 Faktoren das Vorzeichen, man erh¨ alt also das gew¨ unschte Ergebnis 2 · 2
p−1 q−1 p q · 2 2 = (−1) .2 p q
4.5 Das Jacobisymbol 4.5.1 Definition und einfache Eigenschaften Sei b ∈ N ungerade mit Primfaktorzerlegung b = p1 · . . . · pm , die pi nicht notwendig verschieden. C.G.J. Jacobi (1804–1851) hat f¨ ur a ∈ Z ein neues Symbol als Produkt von Legendresymbolen
a a a a := · · ... · b p1 p2 pm definiert. Die Schreibweise des Legendresymbols wird beibehalten, da dieses Jacobisymbol mit dem Legendresymbol u ur ¨bereinstimmt, wenn b Primzahl ist. F¨ b = 1 steht rechts das leere Produkt, man definiert also zweckm¨ aßigerweise ( a1 ) := 1 . Dann hat das Jacobisymbol die folgenden Eigenschaften: Hilfssatz 4.21 Das Jacobisymbol
a
b 1. h¨angt nur von der Restklasse a mod b ab, 2. ist multiplikativ als Funktion von a ,
3. ist multiplikativ als Funktion von b , 4. ist = 0 genau dann, wenn (a, b) = 1 , 5. definiert als Funktion von [a]b einen Gruppenhomomorphismus J : (Z/bZ)∗ → {±1} . 6. J ist surjektiv genau dann, wenn b keine Quadratzahl ist. 7. Die Untergruppe der quadratischen Reste in (Z/bZ)∗ liegt im Kern von J. Anders als f¨ ur das Legendresymbol kann es aber sehr wohl vorkommen, dass a ( b ) = 1 und trotzdem a quadratischer Nichtrest mod b ist, wenn n¨ amlich a quadratischer Nichtrest f¨ ur eine gerade Anzahl von Primfaktoren von b ist.
109
4 Arithmetik modulo n
4.5.2 Das Reziprozit¨ atsgesetz f¨ ur das Jacobisymbol Hilfssatz 4.22 Seien r, s, r1 , . . . , rm ∈ Z ungerade. Dann gelten folgende Kongruenzen mod 2: rs − 1 r−1 s−1 ≡ + 2 2 2
m ri − 1 r1 r2 · . . . · rm − 1 ≡ 2 2
bzw.
i=1
r 2 − 1 s2 − 1 r 2 s2 − 1 ≡ + 8 8 8
m 2 −1 r12 r22 · . . . · rm ri2 − 1 ≡ 8 8
bzw.
i=1
Die erste Kongruenz folgt aus (r − 1)(s − 1) ≡ 0 mod 4
⇒
rs − 1 ≡ (r − 1) + (s − 1) mod 4
,
die zweite Kongruenz aus r2 − 1 ≡ s2 − 1 ≡ 0 mod 4 ⇒
⇒
(r2 − 1)(s2 − 1) ≡ 0 mod 16
⇒
r2 s2 − 1 ≡ (r2 − 1) + (s2 − 1) mod 16 . 2
Satz 4.23 Seien a, b ∈ N ungerade
−1 b
2 b a b
b a
und teilerfremd. Dann ist = (−1)
b−1 2
(4.5)
= (−1)
b2 −1 8
(4.6)
= (−1)
a−1 b−1 · 2 2
.
(4.7)
Der Beweis der ersten beiden Formeln (der Erg¨anzungsgesetze) folgt unmittelbar aus der Definition und dem Hilfssatz. Zum Beweis der dritten Formel seien b = p1 · . . . · pm und a = q1 · . . . · ql die Primfaktorzerlegungen von b und a. Dann ist m l
a b
qj −1 p −1 qj pi i = = (−1) 2 · 2 , b a pi qj i=1 j=1
i
j
und nach dem Hilfssatz gilt f¨ ur die Exponenten ⎛ ⎞ qj − 1 pi − 1 qj − 1 p i − 1 a−1 b−1 ⎠ · ≡ ⎝ ≡ · mod 2 . 2 2 2 2 2 2 2 i
j
j
i
110
4.5 Das Jacobisymbol
4.5.3 Schnelle Berechnung von Legendre- und Jacobisymbolen Die Berechnung von ( ab ) f¨ ur teilerfremde a, b ∈ N , 2 b , erfolgt nun nach folgendem naheliegenden Algorithmus (die Schritte 2 und 3 k¨ onnen auch vertauscht werden): 1. Division von a durch b mit Rest, um 0 < a < b zu erzwingen, 2. Zerlegung a = 2k a mit 2 a und Anwendung des zweiten Erg¨ anzungsgesetzes auf ( 2b ), wenn 2 k . 3. Wenn b/2 < a , verwende a b
=
−1 b
b−a b
und wende das erste Erg¨anzungsgesetz an, anschließend auf b − a wieder den zweiten Schritt, 4. wenn dann noch nicht a = 1 erreicht ist, wende das Reziprozit¨ atsgesetz an und fahre mit Schritt 1 fort. Beispiel: =
131311 151515 5036 5051
=−
=−
20204 151515
15 5051
=−
=
5051 15
5051 151515
=
11 15
=
151515 5051
=−
4 15
=
= −1 .
Da bei jedem Durchlaufen der Schritte 1 bis 4 das Minimum von a und b mindestens halbiert wird, gewinnt man mit vollst¨andiger Induktion sofort die Folgerung 4.24 F¨ ur teilerfremde ungerade a, b ∈ N l¨asst sich das Jacobisymbol ( ab ) mit Hilfe von h¨ochstens 1 + 4·
2 log(max{a, b})
Divisionen mit Rest berechnen. Man beachte dabei, dass auch die Anwendung der Erg¨ anzungsgesetze und des Reziprozit¨atsgesetzes nur jeweils Divisionen durch 4 bzw. 8 erfordert. Ohne die Verwendung des Jacobisymbols k¨onnte man das Legendresymbol nur auf sehr viel aufwendigerem Wege explizit berechnen: Ein ¨ ahnlicher Algorithmus wie eben w¨ urde st¨andig die Primfaktorzerlegung des Z¨ ahlers erfordern; wollte man das quadratische Reziprozit¨atsgesetz ganz vermeiden, m¨ usste man auf die Kriterien von Euler oder Gauss zur¨ uckgreifen, die beide rechnerisch aufwendig sind.
111
4 Arithmetik modulo n
4.5.4 Noch ein Existenzsatz f¨ ur Primzahlen Ein kleiner Schritt in Richtung auf die Artinsche Vermutung wird geleistet durch den folgenden Satz 4.25 Sei a ∈ N kein Quadrat. Dann gibt es unendlich viele Primzahlen p so, dass a quadratischer Nichtrest mod p ist. Zum Beweis darf man nat¨ urlich annehmen, dass a sogar quadratfrei ist, d.h. von der Form 2s q1 · . . . · qn mit s = 0 oder 1 und ungeraden, paarweise verschiedenen Primteilern q1 , . . . , qn . 1. Fall: Sei a = 2 und seien l1 , . . . , lk die einzigen ungeraden Primzahlen = 3 , f¨ ur die ( l2i ) = −1 . Dann sei
2 = −1 , b := 8l1 · . . . · lk + 3 ≡ 3 mod 8 , also mit b dabei ist b weder durch 3 noch durch eines der li teilbar. Es muss also einen anderen Primfaktor p von b geben, f¨ ur den 2 quadratischer Nichtrest ist. 2. Fall: a sei durch die ungeraden Primzahlen q1 , . . . , qn teilbar, n > 0 , dazu l1 , . . . , lk andere Primzahlen, disjunkt zu den qj (z.B. jene, f¨ ur die ( lai ) = −1 ). Dann sind die Kongruenzen x ≡ 1 mod li , i = 1, . . . , k x ≡ 1 mod 8 x ≡ 1 mod qj , j = 1, . . . , n − 1 x ≡ t mod qn
f¨ ur ein t ∈ N
mit
t qn
= −1
simultan l¨osbar durch ein b ∈ N mit den Eigenschaften
q b
2 j b ≡ 1 mod 8 ⇒ = 1 und = ∀j ⇒ b b qj
q b
a 2 s q b 1 n = · ... · = · ... · = −1 . b b b b q1 qn Es gibt also einen Primfaktor p von b , offenbar disjunkt von den li und den qj , f¨ ur den a quadratischer Nichtrest ist. 2
4.6 Verzweigung von Primzahlen 4.6.1 Konjugation und Norm f¨ ur quadratische Zahlk¨ orper Wie schon√in Abschnitt 3.4 erw¨ahnt und benutzt, bezeichnen wir f¨ ur √ √ β = r + s d ∈ Q( d) das algebraisch konjugierte Element mit β := r − s d
112 und mit
4.6 Verzweigung von Primzahlen
N (β) := β β = r 2 − s2 d
die Norm von β . In imagin¨arquadratischen Zahlk¨ orpern stimmt diese mit dem komplexen Betragsquadrat |β|2 u ¨berein. Wenn β, γ ∈ Od assoziiert sind, sich also nur um eine Einheit unterscheiden, schreiben wir daf¨ ur β ∼ γ . Folgende Tatsachen lassen sich leicht nachrechnen: Hilfssatz 4.26 Die Abbildung β → β ist
√ 1. ein Automorphismus des K¨orpers Q( d) (d.h. ein K¨orperisomorphismus in sich), der genau die Elemente von Q fest l¨asst,
2. ein Automorphismus des Rings Od , der genau die Elemente von Z = Od ∩ Q fest l¨asst, 3. f¨ uhrt irreduzible Elemente in irreduzible u ¨ber und Einheiten in Einheiten. ur alle Die Norm√bildet Od in Z ab und verh¨alt sich multiplikativ, d.h. f¨ β, γ ∈ Q( d) ist N (βγ) = N (β) N (γ) . Einheiten werden durch N auf ±1 abgebildet.
4.6.2 Verzweigungsverhalten rationaler Primzahlen Wir nehmen in diesem Abschnitt der Einfachheit halber an, dass der Ring Od , d ∈ Z , = 0 , = 1 und quadratfrei, ein faktorieller Ring ist wie z.B. die in 3.4 studierten euklidischen Ringe. Die algebraische Zahlentheorie erlaubt es zwar, auf diese Annahme zu verzichten, indem die eindeutige Primfaktorzerlegung durch eine eindeutige Primidealzerlegung ersetzt wird, aber der Preis ist ein Mehraufwand an Theorie, den wir hier nicht auf uns nehmen wollen: Es geht hier einstweilen nur darum, an Beispielen zu zeigen, • was die Zahlentheorie in Erweiterungsk¨ orpern von Q mit der alten“ Zah” lentheorie zu tun hat, • warum sie sogar R¨ uckwirkungen auf Fragestellungen u ¨ber ganzrationale Zahlen hat, • und welche Rolle das quadratische Reziprozit¨ atsgesetz dabei spielt. Satz 4.27 Sei p eine Primzahl aus Z . Dann besitzt p in dem faktoriellen Ring oglichen Primfaktorzerlegungen: Od eine der folgenden drei m¨ 1. p bleibt auch in Od Primzahl ( tr¨ age ). 2. p = ±ππ = ±N (π) f¨ ur zwei nicht-assoziierte, aber algebraisch konjugierte Primelemente π, π ∈ Od ( zerlegt ).
113
4 Arithmetik modulo n
3. p ∼ π 2 f¨ ur ein Primelement π ∈ Od ( verzweigt ). Jedes Primelement π von Od ist Teiler einer eindutig bestimmten rationalen Primzahl p ∈ Z . Zum Beweis der letzten Aussage beachte man, dass ππ = N (π) ∈ Z ist und nat¨ urlich = 0 oder ±1 , sonst w¨are π = 0 oder Einheit. π teilt also eine rationale Primzahl p . Zwei verschiedene Primzahlen p = q ∈ N sind teilerfremd in Z , nach (1.1) also auch teilerfremd in Od , daher die Eindeutigkeit. Die u ¨brigen Zerlegungsaussagen sieht man so ein: Wenn f¨ ur eine rationale Primzahl p in Od die Primfaktorzerlegung p ∼ π1 π2 · . . . · πk ist, so folgt daraus N (p) = p2 = ±N (π1 ) · . . . · N (πk ) , und mit N (πj ) ∈ Z , = ±1 sieht man, dass k nur 1 oder 2 sein kann. Dann ist die Fallunterscheidung evident. 2 Welcher Fall im einzelnen eintritt, h¨angt v¨ ollig von der Wahl von d ab und soll anhand zweier Beispiele erkl¨art werden.
4.6.3 Rationale und Gaußsche Primzahlen Mit π seien in diesem Abschnitt die Primzahlen des Rings Z[i] der ganzen Gaußschen Zahlen bezeichnet (vgl. die Liste am Ende von 3.4). Satz 4.28
In Z[i] ist
• 2 = (−i) (1 + i)2 = N (1 + i)
verzweigt und es sind
• alle rationalen Primzahlen p ≡ 3 mod 4 tr¨ age, • alle rationalen Primzahlen p ≡ 1 mod 4 zerlegt. Die erste Aussage ist klar. F¨ ur die anderen beachte man, dass alle anderen Normen a2 +b2 von Primelementen π = a+bi ∈ Z[i] positiv und ≡ 1 mod 4 sein m¨ ussen. Daraus folgt bereits, dass alle rationalen Primzahlen p ≡ 3 mod 4 auch in Z[i] Primzahlen bleiben m¨ ussen. Es gen¨ ugt also, zu beweisen, dass alle p ≡ 1 mod 4 eine Darstellung p = ππ , π ∼ π , besitzen. Nach dem ersten Erg¨anzungsgesetz zum quadratischen Reziprozit¨ atsgeosbar. O.B.d.A. setz ist −1 quadratischer Rest mod p , also x2 + 1 ≡ 0 mod p l¨ darf man 0 < x < p annehmen, d.h. f¨ ur γ := x + i ist N (γ) = pm
mit einem
m∈N, m 1 folgende Produktentwicklung gilt: 1 1 ζ(s) = = s n 1 − p−s N
P
2. Folgern Sie daraus, dass f¨ ur s > 1 bzw. s > 2 ζ −1 (s) =
μ(n) ns
,
ζ 2 (s) =
N
ζ(s) ζ(s − 1) =
σ0 (n) , ns N
σ1 (n) . ns N
116 3. ψ(n) bezeichne die Anzahl der nicht-isomorphen abelschen Gruppen der Ordnung n . Beweisen Sie, dass ψ eine multiplikative zahlentheoretische ur m = 0, 1, . . . , 10 . Funktion ist und berechnen Sie ψ(17m ) f¨ 4. Berechnen Sie alle Primitivwurzeln modulo 11, 13, 17, 19 . 5. Verwenden Sie die Existenz einer Primitivwurzel, um einen neuen Beweis des Wilsonschen Satzes (p − 1)! ≡ −1 mod p zu geben. 6. Beweise: Alle Primitivwurzeln sind quadratische Nichtreste. Gibt es ungerade Primzahlen, f¨ ur die alle quadratischen Nichtreste gleichzeitig Primitivwurzeln sind? 7. p sei eine Primzahl > 2 . Zeigen Sie, dass die Kongruenz x4 ≡ −1 mod p genau dann l¨osbar ist, wenn die Primzahl p ≡ 1 mod 8 ist. 8. Verallgemeinern Sie Satz 4.11 auf den Fall p | n . 9. Zeigen Sie, dass 1/97 eine Dezimalbruchentwicklung der Periodenl¨ ange 96 besitzt. 10. Mp = 2p − 1 sei eine Mersenneprimzahl. Zeigen Sie, dass 3 quadratischer Nichtrest mod Mp ist. 11. Man beweise: Wenn sich die nat¨ urliche Zahl n aus mehr als einer Primzahl ≡ 1 mod 4 zusammensetzt, besitzt n mehrere wesentlich verschiedene Darstellungen als Summe von zwei Quadraten. 12. Finden Sie die kleinste nat¨ urliche Zahl, welche zwei wesentlich verschiedene Darstellungen als Summe von zwei Qudaraten besitzt. 13. q ≡ 1 mod 4 sei Primzahl und p := 2q + 1 ebenfalls. Beweisen Sie, dass 2 eine Primitivwurzel mod p ist. Unter welchen Bedingungen an q ist auch 5 eine Primitivwurzel? 14. Seien wieder q und p Primzahlen mit p = 2q + 1 , jetzt aber mit q ≡ 3 mod 4 . Beweisen Sie 2q ≡ 1 mod p und leiten Sie daraus ab, dass 211 − 1 und 223 − 1 keine Mersenne-Primzahlen sein k¨ onnen. 15. Sei p > 3 prim, n durchlaufe alle quadratischen Reste mod p . Man zeige n ≡ 0 mod p .
117
5 Primzahltests und Primfaktorzerlegung
5 Primzahltests und Primfaktorzerlegung 5.1 Das RSA-Schema 5.1.1 Kleiner Fermatscher Satz und Verschl¨ usselung Das von Rivest, Shamir und Adleman 1978 publizierte Verschl¨ usselungsverfahren funktioniert folgendermaßen: Man nehme zwei sehr große Primzahlen p = q (geheim) und bilde ihr Produkt n = pq ; dieses darf ¨ offentlich bekannt sein. Nun schreibe man die Nachricht, die z.B. von einer Außenstelle oder einem Agenten verschl¨ usselt an die Zentrale durchgegeben werden soll, zun¨ achst nach einem einfachen Verfahren in Ziffernform, z.B. indem die Buchstaben in Form der Zahlen 1 bis 27 geschrieben werden und entsprechend Wortzwischenr¨ aume, Satzzeichen und Sonderzeichen durch andere Zahlen zwischen 28 und 99 ausgedr¨ uckt werden (dieser Teil des Verfahrens lohnt nicht, geheimgehalten zu werden). Der Sender der Nachricht erh¨alt von der Zentrale dann einen Exponenten s ∈ N , der ebenfalls ¨offentlich bekannt sein darf und von dem nur gesichert sein muss, dass s zu ϕ(n) = (p − 1)(q − 1) teilerfremd ist. Die Nachricht, also kleine nat¨ urliche Zahlen a , wird nun dadurch verschl¨ usselt, dass man zur s-ten Potenz mod n a → as mod n u ¨bergeht und diese — etwa in Form kleinster positiver Reste — u ¨bersendet. Wie wird nun die Nachricht a aus as rekonstruiert? Da s zu ϕ(n) teilerfremd ist, gibt es eine L¨osung t ∈ N der Kongruenz s t ≡ 1 mod ϕ(n) ,
d.h. ein k ∈ Z
mit
s t = k ϕ(n) + 1 .
Nach dem kleinen Fermatschen Satz 2.10 l¨asst sich also die Nachricht a aus ihrer uckgewinnen: Verschl¨ usselung as durch erneutes Potenzieren modulo n zur¨ (as )t = ast = aϕ(n)k+1 ≡ a mod n . Man u ur quadratfreie Moduln n der kleine Fermatsche ¨berzeuge sich davon, dass f¨ Satz in dieser Form auch g¨ ultig bleibt, wenn (a, n) = 1 ist. Es gen¨ ugt bei allen diesen Rechnungen, in jedem Schritt mit dem kleinsten positiven Repr¨ asentanten zu rechnen. Da a als kleine nat¨ urliche Zahl angenommen war, gewinnt man sie am Ende automatisch zur¨ uck. J. Wolfart, Einführung in die Zahlentheorie und Algebra, DOI 10.1007/978-3-8349-6498-4_5, © Vieweg+Teubner Verlag | Springer Fachmedien Wiesbaden GmbH 2011
118
5.1 Das RSA-Schema
5.1.2 Praktikabilit¨ at des Verfahrens Selbst wenn die Primzahlen p, q in der Gr¨oßenordnung von 10100 gew¨ ahlt werden, sind die erforderlichen Rechnungen schon auf kleineren Rechnern durchf¨ uhrbar: Man beachte, dass nach jedem Rechenschritt eine Reduktion mod n durchgef¨ uhrt werden kann, d.h. Division mit Rest durch n , so dass man es also h¨ ochstens 2 zu tun hat. Dazu muss man wissen, dass schnelmit Zahlen der Gr¨oßenordnung n le Algorithmen existieren (Sch¨ onhage-Strassen, vgl. [Kn]), die f¨ ur Zahlen < m Multiplikationen und Divisionen in einer Rechenzeit von O((log m)1+ ) ur Multiplikation durchf¨ uhren. F¨ ur m = n2 heißt das also, dass der Aufwand f¨ und Division nur wenig schneller als die Stellenzahl anw¨ achst. Auch f¨ ur die Potenzierung ist der Zeit- und Speicherplatzbedarf bescheiden: Nat¨ urlich kann man sich f¨ ur s und t auf Exponenten < n beschr¨ anken; entwickelt man z.B. s im Bin¨arsystem in s = s0 + s1 · 2 + . . . + sk−1 · 2k−1 + sk · 2k ,
alle sj ∈ {0, 1} , sk = 1 ,
so ist nat¨ urlich k ≤ 2 log s . Demnach l¨asst sich as mod n durch einen Algorithmus aus weniger als log s Quadrierungen, Multiplikationen und Reduktionen mod n berechnen, wobei alle beteiligten Zahlen < n2 bleiben. In jedem Fall bleibt man also mit dem Aufwand f¨ ur Rechenzeit und Speicherplatz unter einer bescheidenen Logarithmuspotenz von s bzw. n . Das gleiche gilt nat¨ urlich auch f¨ ur die Kontrolle, ob s zu ϕ(n) teilerfremd ist sowie in den sp¨ ateren Paragraphen dieses Kapitels f¨ ur die Berechnung von Jacobisymbolen. Die Primfaktoren p und q sind nicht nicht ganz so leicht zu finden, aber immer noch in realistischer Rechenzeit durch zahlentheoretische Algorithmen, von denen in den folgenden Abschnitten die Rede sein wird.
5.1.3 Sicherheit des Verfahrens Das RSA-Schema ist ein public-key-Kryptosystem, d.h. das Verschl¨ usselungsverfahren (hier also gegeben durch den Modul n , den Exponenten s und die ele¨ mentare Ubersetzung in kleine Zahlen a ) darf ¨ offentlich bekannt sein; selbst der Verschl¨ usseler kann seine eigene Nachricht aus der Verschl¨ usselung nicht mehr ohne Zusatzinformationen rekonstruieren. Diese bestehen hier aus dem zweiten Exponenten t bzw. genauer aus der Kenntnis von ϕ(n) . Diese Kenntnis ist gleichbedeutend mit der Kenntnis der Primfaktorzerlegung von n , denn man kann nat¨ urlich die Primfaktoren aus n = pq
und ϕ(n) = (p − 1)(q − 1)
rekonstruieren (Aufgabe zu Kap. 1). Die Sicherheit des Verfahrens beruht also darauf, dass Primfaktorzerlegung großer Zahlen schwer ist, jedenfalls sehr viel schwerer als Primzahltests. Bis heute ist allerdings nicht klar, ob dies von Natur
5 Primzahltests und Primfaktorzerlegung
119
aus so sein muss, oder ob dies nur daran liegt, dass den Mathematikern bisher noch nicht die richtigen Ideen f¨ ur diese Aufgabe gekommen sind. Denkbar ist also — wenn auch nicht sehr wahrscheinlich — dass ebenso schnelle Faktorisierungsalgorithmen wie Primzahltests gefunden werden k¨ onnten; dann w¨ urde das RSA-Schema sofort in den Archiven der Mathematikgeschichte verschwinden (was nat¨ urlich auch dann denkbar ist, wenn es von anderen eleganten und billigen public-key-Kryptosystemen u ¨berholt wird) und damit auch ein Großteil des ¨offentlichen Interesses an den Themen dieses ganzen Kapitels. In den vergangenen Jahrzehnten hat sich das ganze Gebiet jedenfalls rapide entwickelt, was nur zum Teil an den schnell wachsenden maschinellen M¨ oglichkeiten liegt; man findet vielmehr immer neue Algorithmen, die auf zahlentheoretischen Konzepten beruhen, welche im Prinzip lange bekannt sind. Inzwischen werden so tiefliegende Hilfsmittel eingesetzt (z.B. elliptische Kurven, abelsche Variet¨ aten), dass eine einf¨ uhrende Vorlesung den aktuellen Stand der Kunst nicht mehr wiedergeben kann, der im u are. Ich ¨brigen auch ebenso schnell wieder u ¨berholt w¨ werde mich also im folgenden darauf beschr¨ anken, anhand einiger ausgew¨ ahlter und technisch nicht zu schwieriger Verfahren arithmetische Grundprinzipien von Primzahltests und Faktorisierungsalgorithmen zu erl¨ autern. Die Umsetzung in die Praxis und/oder Maschinenfragen lasse ich ganz beiseite, und f¨ ur ausgefeiltere Algorithmen sei auf Spezialvorlesungen und die inzwischen sehr umfangreiche Literatur verwiesen (z.B. [Kn], [Coh], [Ko3], [Rie]).
5.2 Der Kleine Fermatsche Satz als Primzahltest 5.2.1 Ein naiver Ansatz In der Praxis wird man jeden Primzahltest und jeden Faktorisierungsversuch damit beginnen, dass man kontrolliert, ob die fragliche Zahl n nicht durch 2, 3, 5, 7 etc. teilbar ist. Wie weit man damit geht, h¨ angt aber ganz von den anderen zur Verf¨ ugung stehenden Verfahren ab: Um n¨amlich n etwa als Primzahl zu identi√ fizieren, m¨ usste man sonst probeweise durch alle Primzahlen p ≤ n dividieren, da der kleinste nichttriviale Primfaktor von n immerhin diese Gr¨ oße errei√ chen kann. Nach dem Primzahlsatz sind also etwa 2 n/ log n Divisionen durchzuf¨ uhren, und das w¨ urde auch die schnellsten Rechner sehr bald u ¨berfordern, ganz abgesehen davon, dass Primzahltafeln nicht in dem dazu erforderlichen Umfang √ zur Verf¨ ugung stehen. Nat¨ urlich kann man durch alle Zahlen ≤ n dividieren, was den Zeitbedarf noch um einen Faktor log n vergr¨ oßert; Zahlenfaktoren, die man durch Teilerfremdheitsbedingungen gewinnt (z.B. Dividieren nur durch Zahlen, die zu 210 = 2 · 3 · 5 · 7 teilerfremd sind) fallen dagegen f¨ ur große n wenig ins Gewicht.
120
5.2 Der Kleine Fermatsche Satz als Primzahltest
5.2.2 Pseudoprimzahlen und Carmichaelzahlen Im Prinzip l¨asst sich jeder Satz, in dessen Voraussetzungen das Wort Primzahl“ ” vorkommt, daraufhin untersuchen, ob seine Aussage umgekehrt als Primzahltest tauglich ist. Ein einfaches Beispiel dazu ist der kleine Fermatsche Satz 2.11: Hilfssatz 5.1 Sei n ∈ N . Wenn ein a ∈ N , 0 < a < n mit an−1 ≡ 1 mod n existiert, ist n keine Primzahl. Leider ist es keineswegs immer m¨oglich, n mit Hilfe dieses einfachen Hilfssatzes als zusammengesetzt zu identifizieren. Definition: n ∈ N heißt pseudoprim zur Basis a , wenn die Kongruenz an−1 ≡ 1 mod n
(5.1)
erf¨ ullt ist. Eine zusammengesetzte Zahl n heißt Carmichaelzahl, wenn (5.1) f¨ ur alle zu n teilerfremden a ∈ N erf¨ ullt ist. Die kleinste dieser — nach ihrem Entdecker R.D. Carmichael (1912) so benannten — Zahlen ist n = 561 = 3 · 11 · 17 , denn nach dem chinesischen Restsatz und dem kleinen Fermatschen Satz ist n mit der Primfaktorzerlegung n = p1 · . . . · pk genau dann Carmichaelzahl, wenn alle pj − 1 Teiler von n − 1 sind (dass Carmichaelzahlen keine quadratischen Faktoren haben k¨ onnen, ist leicht einzusehen). Erd¨ os vermutete schon seit langem, dass es sehr viele Carmichaelzahlen gibt, genauer gesagt mehr als x1− unterhalb x f¨ ur gen¨ ugend große x > x0 () ; d.h. es g¨abe danach mehr Carmichaelzahlen als Quadrate! Diese Vermutung wurde 1993 wenigstens insoweit best¨atigt, dass es asymptotisch mehr als x2/7 Carmichaelzahlen unterhalb x gibt (Alford, Granville, Pomerance [AGP]). Jedenfalls gibt es unendlich viele Carmichaelzahlen, und damit ist klar, dass der Fermatsche Satz als Primzahltest alleine nicht ausreicht.
5.2.3 Ein einfacher Test von Pollard Der kleine Fermatsche Satz ist allerdings wesentlicher Bestandteil vieler Primzahltests. Eines der einfachsten nichttrivialen Beispiele ist folgender Satz von Pollard, der eigentlich auf der Tatsache beruht, dass Carmichaelzahlen mindestens drei Primfaktoren haben m¨ ussen. Satz 5.2 Es gibt eine positive Konstante c , so dass f¨ ur alle nat¨ urlichen Zahlen n > c gilt: n ist Primzahl genau dann, wenn gleichzeitig
121
5 Primzahltests und Primfaktorzerlegung
1.
n keine Quadratzahl ist,
2.
n keinen Primteiler p ≤
3.
kn−1 ≡ 1 mod n ist f¨ ur alle nat¨ urlichen Zahlen k
c , f¨ ur die also k p−1 ≡ 1 mod p ,
aber k m ≡ 1 mod p
f¨ ur alle 0 < m < p − 1 .
Nach Bedingung 3. m¨ usste aber k n−1 ≡ 1 mod n sein, erst recht also k n−1 ≡ 1 mod p . Das geht nur, wenn (p − 1) | (n − 1) = pq − 1 = (p − 1)q + (q − 1) , wenn also p − 1 Teiler von q − 1 w¨are im Widerspruch zu p > q . 2 Es ist klar, dass der Satz von Pollard einen Primzahltest in O(n1/3 ) Schritten liefert; hierbei werden Zeitaufwand und Kosten f¨ ur die einzelnen Multiplikationen, Divisionen und Potenzierungen nicht eingerechnet. Wenn man dieses will, muss man noch mit kleinen Potenzen von log n multiplizieren. Außerdem ist sehr plausibel, dass die Idee dieses Satzes erheblich verbesserungsf¨ ahig ist. In der Tat gibt es verwandte Primzahltests mit einer Laufzeit der Gr¨ oßenordnung O(n1/8 ) , die allerdings aus verschiedenen Gr¨ unden nur von theoretischem Interesse sind; z.B. sind die zugrundeliegenden Konstanten nicht bekannt und m¨ ogen astronomisch groß sein.
5.2.4 Primzahltests f¨ ur Kandidaten spezieller Bauart Der Pollardsche Satz und seine Versch¨arfungen sind universell, d.h. f¨ ur beliebige nat¨ urliche Zahlen in gleicher Weise verwendbar. Das ist nicht immer so: Gerade die Primzahlrekorde, die von Zeit zu Zeit ihren Niederschlag sogar in der Tagespresse finden, werden h¨aufig mit Tests erzielt, die nur f¨ ur Zahlen spezieller Bauart funktionieren. Einfaches Beispiel daf¨ ur ist folgender Primzahltest von Brillhart und Selfridge:
122
5.2 Der Kleine Fermatsche Satz als Primzahltest
li Satz 5.3 Die Primfaktorzerlegung von n−1 sei bekannt, n¨ amlich pi . Dann gilt: n ist Primzahl genau dann, wenn f¨ ur alle Primteiler pi | (n − 1) ein ai ∈ N existiert, teilerfremd zu n , mit ≡ 1 mod n an−1 i
, aber
(n−1)/pi
ai
≡ 1 mod n .
Wenn n n¨amlich Primzahl ist, tut’s jede Primitivwurzel ai := a mod n . Seien umgekehrt solche ai gefunden, die die Kongruenzen des Satzes erf¨ ullen, und sei fi := ord [ai ]n in (Z/nZ)∗ . Dann ist offenbar fi | (n − 1) und fi n−1 pi , also plii | fi . Nach dem Eulerschen Satz 2.9 ist also plii | fi | ϕ(n) f¨ ur alle i , also (n − 1) | ϕ(n) ≤ n − 1
=⇒
ϕ(n) = n − 1
=⇒
n
prim . 2
Folgerung 5.4 Sei N ∈ N . Die Zahl 2N + 1 ist prim genau dann, wenn N eine Zweierpotenz 2n ist und wenn f¨ ur n > 0 32
2n
≡ 1
und
32
2n −1
n
≡ 1 mod (22 + 1)
ist .
Dass f¨ ur die Exponenten N in diesen Fermatschen Primzahlen Fn nur Zweier¨ vgl. Abschnitt potenzen 2n in Frage kommen, ist eine elementare Ubungsaufgabe, 5.6. Zum Beweis bleibt zu zeigen: Wenn Fn prim ist, ist 3 Primitivwurzel. Wenn n¨amlich Fn prim ist, hat die prime Restklassengruppe (Z/Fn Z)∗ nach dem Ben weis von Satz 4.3 insgesamt ϕ(Fn − 1) = 22 −1 Primitivwurzeln; diese m¨ ussen also mit den quadratischen Nichtresten u ¨bereinstimmen, denn quadratische Reste k¨onnen keine Primitivwurzeln sein. Es gen¨ ugt daher, zu zeigen, dass 3 quadratischer Nichtrest mod Fn ist. Aus n > 0 folgt Fn ≡ 1 mod 4
und Fn ≡ 2 mod 3 ,
aus dem quadratischen Reziprozit¨atsgesetz also
3 2 Fn = = −1 , = Fn 3 3 wie behauptet. 2 Das Interesse an Fermatschen Primzahlen hat seinen Ursprung in dem (vergeblichen) Versuch, leicht konstruierbare Serien von Primzahlen herzustellen, und in einer elementargeometrischen Frage, auf die wir im Kapitel 7 zu sprechen kommen. Fermat hatte vermutet, dass alle Fn prim sind, gest¨ utzt auf die F¨ alle n = 0, 1, 2, 3, 4 ; Euler fand jedoch f¨ ur F5 den Teiler 641, und bis heute hat man unter den Fn keine einzige weitere Primzahl gefunden. Da sie mit n enorm schnell wachsen, liegen allerdings keine umfangreichen Erfahrungen vor.— In diesem Zusammenhang sei ein witziger Beweis von Polya f¨ ur die Unendlichkeit der Primzahlmenge erw¨ahnt: P ist unendlich, weil {Fn | n ≥ 0} unendlich ist und weil je zwei verschiedene Fermatzahlen Fn , Fm teilerfremd sind: Wenn etwa n < m und p Primteiler von Fn ist, hat man 22
n
≡ −1 mod p
=⇒
22
m
≡ 1 mod p
=⇒
p Fm .
123
5 Primzahltests und Primfaktorzerlegung
5.2.5 Der Lucas-Lehmer-Test Mersennesche Primzahlen n = Mp = 2p − 1 , p ∈ P , sind uns bereits in den Abschnitten 4.1.3 und 4.1.4 begegnet. Hier ist, anders als bei Fermatzahlen, die Primfaktorzerlegung von n + 1 anstelle jener von n − 1 bekannt. Auch diese Information l¨asst sich zur Konstruktion spezieller Primzahltests verwenden, die letztlich auf dem kleinen Fermatschen bzw. Eulerschen Satz beruhen; nun wird aber nicht die Gruppe (Z/nZ)∗ verwendet, sondern eine zyklische Gruppe der Ordnung orper: Wenn n2 −1 . Solche Gruppen findet man z.B. mit Hilfe quadratischer Zahlk¨ n prim ist und in Od prim bleibt (tr¨age, vgl. Abschnitt 4.6), so kann man leicht zeigen, dass Od / < n > ein K¨orper mit n2 Elementen ist. Wir wissen nach Satz 4.3, dass die multiplikative Gruppe dieses K¨orpers zyklisch ist, hier nat¨ urlich von 2 der Ordnung n − 1 . Dann m¨ usste auch eine Untergruppe der Ordnung n + 1 existieren, auf deren Elemente sich der Eulersche Satz anwenden l¨ asst. Soviel zur Motivation des nun folgenden Beweises (Rosen [Ro], Bruce [Br]). Satz 5.5 Sei p > 2 eine Primzahl und die Folge (Sn )n∈N rekursiv durch S1 := 4
und
2 Sn := Sn−1 −2
definiert. Mp := 2p − 1 ist Primzahl genau dann, wenn Mp Teiler von Sp−1 ist. √ √ √ Beweis: Sei ω := 2+ 3 ∈ O3 = Z[ 3] . Wegen ω = 2− 3 und N (ω) = ωω = 1 ist ω Einheit in O3 , und durch Induktion u ¨ber m stellt man leicht fest, dass m−1
Sm = ω 2
+ (ω )2
m−1
ist. Mp | Sp−1 ist also gleichbedeutend mit ω2
p−2
+ (ω )2
p−2
≡ 0 mod Mp
bzw.
ω2
p−1
+ 1 ≡ 0 mod Mp .
(5.2)
Angenommen nun, Mp h¨atte einen nichttrivialen Primteiler q , dann darf man o.B.d.A. q2 ≤ Mp annehmen, und nat¨ urlich q > 2 . Der Restklassenring R := √ Z[ 3] / < q > hat genau q 2 Elemente, seine Einheitengruppe R∗ hat h¨ ochstens 2 q − 1 Elemente, darunter insbesondere −1 ≡ 1 mod < q > und ω mod < q > . Aus p−1 p ≡ −1 und folglich ω 2 ≡ 1 mod < q > ω2 erh¨alt man ord (ω mod < q >) = 2p , nach dem Eulerschen Satz 2.9 ist also 2p Teiler der Gruppenordnung. Daraus folgt der Widerspruch 2 p ≤ q 2 − 1 ≤ Mp − 1 = 2 p − 2 . ultigkeit von (5.2) zu zeigen. Sei Sei nun umgekehrt Mp Primzahl; dann ist die G¨ dazu √ √ 1− 3 1+ 3 √ √ τ := und τ := , 2 2
124
5.3 Riemannsche Vermutung und probabilistische Primzahltests
also gelten
τ 2 = ω , (τ )2 = ω , τ τ = −1 ,
und zum Beweis von (5.2) ist dann p
(5.3) τ 2 = τ Mp +1 ≡ −1 mod Mp √ √ √ zu zeigen; dies kann als Kongruenz in Z[ 3] gelesen werden oder in Z[ 3, 2] , wie wir gleich sehen√werden. Zur Vereinfachung schreiben wir hier q := Mp , √ erheben 2τ = 1 + 3 in die q-te Potenz und erhalten √ √ τ q 2(q−1)/2 2 ≡ 1 + 3(q−1)/2 3 mod q , denn die gemischten Glieder auf der rechten Seite sind wegen ihrer Binomialkoeffizienten alle durch q teilbar. Aus dem Eulerschen Kriterium f¨ ur quadratische Reste und dem Reziprozit¨atsgesetz erhalten wir
2 (q−1)/2 ≡ q ≡ −1 mod 8 ⇒ 2 ≡ 1 mod q q
q 3 (q−1)/2 ≡ − ≡ −1 mod q . q ≡ −1 mod 4 , q ≡ 1 mod 3 ⇒ 3 ≡ q 3 Daraus folgt τ q ≡ τ mod q
und
τ q+1 ≡ τ τ ≡ −1 mod q ,
also (5.3). 2 Es ist plausibel, dass diese Idee nicht nur f¨ ur Mersennezahlen verwendbar ist, und dass auch Zahlk¨orper verwendbar sind, die komplizierter als quadratisch sind (einen h¨oheren Grad haben, den wir im n¨ achsten Kapitel einf¨ uhren werden). Auf diese Weise lassen sich Primzahltests konstruieren, die gut funktionieren, wenn die Primfaktorzerlegung — oder hinreichend viele Primfaktoren — von n2 + 1 , n2 + n + 1 bzw. n2 − n + 1 bekannt sind (Williams, Judd, Holte [WJ], [WH]).
5.3 Riemannsche Vermutung und probabilistische Primzahltests Andere schnelle Primzahltests funktionieren unter anderen Typen von Nebenbedingungen; dazu geh¨oren einerseits Annahmen u ¨ber die Verteilung zahlentheoretischer Gr¨oßen wie z.B. quadratischer Nichtreste mod p . Andererseits gibt es Tests, die mit beliebig großer Wahrscheinlichkeit, nicht aber mit absoluter Sicherheit eine Zahl als Primzahl identifizieren. Typische Beispiele f¨ ur beides werden
5 Primzahltests und Primfaktorzerlegung
125
wir in diesem Abschnitt skizzieren. Zun¨achst behandeln wir einen Primzahltest, der von G.Miller 1976 entwickelt wurde und auf der Annahme der G¨ ultigkeit einer Verallgemeinerung der Riemannschen Vermutung beruht; wir halten uns dabei an eine Vereinfachung von H.W. Lenstra jr.
5.3.1 Vorbemerkungen u ¨ber quadratfreie Zahlen Hilfssatz 5.6 Sei p > 2 Primzahl. Dann gibt es eine Primzahl a < 4(log p)2 , welche ap−1 ≡ 1 mod p2 erf¨ ullt. Aus numerischen Experimenten weiß man sogar, dass f¨ ur alle p < 3 · 109 die Aussage des Hilfssatzes f¨ ur a = 2 oder 3 erf¨ ullt ist, und man darf vermuten, dass dies auch f¨ ur alle gr¨oßeren p so bleibt. Einen Beweis des Hilfssatzes f¨ ur p > 3·109 kann man folgendermaßen skizzieren: Aus einer scharfen Version des Primzahlsatzes von Rosser und Schoenfeld weiß man, dass es unterhalb der genannten ur alle Schranke A := 4(log p)2 jedenfalls M > logAA Primzahlen a gibt. Wenn f¨ diese Primzahlen ap−1 ≡ 1 mod p2 erf¨ ullt ist, dann auch f¨ ur alle Potenzprodukte b dieser Primzahlen. Insbesondere gilt das f¨ ur alle Potenzprodukte log p b = aνa , , νa ≤ 2 · log A die dann automatisch < p2 und darum mod p2 paarweise verschieden sind. Die Annahme wird durch zwei einander widersprechende Absch¨ atzungen der Anzahl B dieser Restklassen b mod p2 zum Widerspruch gef¨ uhrt: Einerseits ist die prime Restklassengruppe (Z/p2 Z)∗ zyklisch von der Ordnung (p − 1)p , erzeugt von y mod p2 , darum gibt es genau p−1 L¨osungen der Kongruenz xp−1 ≡ 1 mod p2 , n¨amlich alle ykp mod p2 , k = 1, . . . , p − 1 , also hat man B ≤ p−1. log p Wenn man die gr¨oßte ganze Zahl ≤ 2 · log A mit k bezeichnet, gibt es andererseits nach Annahme und Konstruktion mindestens
B ≥
(M + 1) · (M + 2) · . . . · (M + k) Mk > k! k!
solche Restklassen (die erste Ungleichung beweist man z.B. durch Induktion u ¨ber Mk M , die zweite ist trivial). Eine sorgf¨altige Absch¨ atzung von k! mit Hilfe der Stirlingschen Formel f¨ ur k! und der Definition von M und k zeigt schließlich B ≥ p f¨ ur alle hinreichend großen p , und f¨ ur einen Zwischenbereich muss man wieder Numerik zu Hilfe nehmen. 2 Satz 5.7 Sei n ∈ N , n > 4 , und sei an−1 ≡ 1 mod n f¨ ur jede Primzahl 2 a < (log n) . Dann ist n quadratfrei, d.h. Produkt paarweise verschiedener Primzahlen.
126
5.3 Riemannsche Vermutung und probabilistische Primzahltests
Zun¨achst ist n¨amlich n ungerade wegen (log n)2 > 2
=⇒
2n−1 ≡ 1 mod n
und damit ist auch jeder Primteiler p von n ungerade. H¨ atte n einen quadratischen 2 2 Primteiler p , so w¨are 4(log p) ≤ (log n) , jede Primzahl a < 4(log p)2 erf¨ ullt also automatisch a < (log n)2 und somit an−1 ≡ 1 mod n ,
erst recht also
an−1 ≡ 1 mod p2 .
n − 1 ist also ein Vielfaches von ord [a]p2 in (Z/p2 Z)∗ . Da aber n − 1 zu p teilerfremd ist, muss ord [a]p2 Teiler von p − 1 sein, also ap−1 ≡ 1 mod p2 , was nach dem Hilfssatz nicht f¨ ur alle a < 4(log p)2 m¨ oglich ist. 2
5.3.2 Eine Verteilungshypothese F¨ ur den Millerschen Primzahltest — zumindest in der schnellen Form, die wir hier diskutieren wollen — braucht man die folgende Hypothese (J) : Sei d ≡ 1 mod 4 Primzahl oder das Produkt zweier verschiedener Primzahlen. Es gibt eine von d unabh¨ angige Konstante c > 0 so, dass stets 2 existiert mit Jacobisymbol ein a ∈ N , a < c(log d) a = −1 . d Bemerkungen: 1.) Wegen der Multiplikativit¨ at des Jacobisymbols kann man sich auf Primzahlen a beschr¨anken. 2.) Annahmen wie diese sind h¨ochst plausibel, aber extrem schwer zu beweisen. Primzahltests beruhen manchmal auf Verteilungshypothesen, f¨ ur die es nur eine plausible Heuristik gibt. Hier ist man wenigstens insofern in einer besseren Lage, als man (J) aus Standard-Vermutungen der analytischen Zahlentheorie herleiten kann, deren Beweis freilich auch noch in den Sternen steht, vgl. dazu etwa auch die Aussagen u amlich ¨ber kleinste Primitivwurzeln in Abschnitt 4.2.1. Es gilt n¨ — im wesentlichen nach Ankeny und Montgomery — der Satz 5.8 Sei d ≡ 1 mod 4 Primzahlen. Die L-Funktion
Primzahl oder das Produkt zweier verschiedener ∞
k k−s L(s) := d k=1
konvergiert f¨ ur alle komplexen s mit Re s > 1 zu einer holomorphen Funktion und l¨asst sich meromorph auf ganz C fortsetzen. Wenn sie die verallgemeinerte
127
5 Primzahltests und Primfaktorzerlegung
Riemannsche Vermutung erf¨ ullt, dass alle Nullstellen von L im kritischen Streifen 0 < Re s < 1 auf der Geraden Re s = 12 liegen, dann existieren a ∈ N mit a = −1 . und a < 2 (log d)2 d Wir werden darum die Hypothese (J) mit der Konstanten c = 2 verwenden.
5.3.3 Der Primzahltest von G. Miller Satz 5.9 Sei n > 4 eine ungerade nat¨ urliche Zahl und sei n − 1 = 2t u ,
t, u ∈ N , 2 u .
Die Hypothese (J) sei erf¨ ullt. n ist Primzahl genau dann, wenn f¨ ur alle Primzahlen a < 2(log n)2 gilt : au ≡ 1 mod n (5.4) oder es existiert ein j ∈ Z mit 0 ≤ j < t und j ·u
a2
≡ −1 mod n .
(5.5)
Bemerkungen: 1.) Nach diesen Kongruenzen gilt in jedem Fall an−1 ≡ 1 mod n , sie k¨onnen also auch als Versch¨arfungen des Fermatschen Satzes gelten. 2.) Wie plausibel die Hypothese (J) in diesem Zusammenhang ist, welche die Beschr¨ankung auf a < 2(log n)2 erlaubt, entnimmt man einer Bemerkung aus dem Buch von Koblitz [Ko3]: Es gibt nur ein einziges zusammengesetztes n < 25 · 109 , f¨ ur das die Kongruenzen (5.4) bzw. (5.5) mit den Primzahlen a = 2, 3, 5, 7 simultan erf¨ ullt sind (n¨amlich n = 3215031751 ). 3.) Als Primzahltest ben¨otigt der Millersche Test O((log n)3 ) Potenzierungen. Die wirkliche Laufzeit ist also nur ein Polynom in log n . Besser kann es nicht gehen! Es gibt allerdings einen Primzahltest (Adleman, Rumely, Pomerance, H. Cohen, H.W. Lenstra jr. 1983/84), der eine Laufzeit O((log n)c log log log n ) besitzt und ohne unbewiesene Verteilungshypothesen auskommt. Er arbeitet mit einer Verallgemeinerung des Fermatschen Satzes auf Kreisteilungsk¨ orper und mit Gaußschen Summen, (s. Abschnitt 7.4) bzw. Jacobisummen (vgl. [IR]). Der Leser u ur alle menschlichen Zwecke die Funktion log log log n ¨berzeuge sich, dass f¨ als Konstante angesehen werden kann, obwohl sie nat¨ urlich monoton gegen ∞
128
5.3 Riemannsche Vermutung und probabilistische Primzahltests
w¨achst. In praktischer Hinsicht wird dieser Test aber schon wieder von anderen u ¨bertroffen, z.B. von Tests, welche elliptische Kurven verwenden (wo man allerdings keine ganz schl¨ ussigen Beweise f¨ ur die K¨ urze der Laufzeit hat), oder von Monte-Carlo-Tests, die das Pr¨adikat Primzahl“ nur mit einer gewissen ” Irrtumswahrscheinlichkeit vergeben k¨onnen, s.u. Die eine Richtung des Beweises ist sehr einfach: Wenn n prim ist, gilt f¨ ur alle a = 0 im K¨orper Fn an−1 = 1 und a2
ju
j−1 u
= 1 ⇒ a2
= ±1
osungen hat. Also sind f¨ ur alle j = 1, . . . , t , weil x2 = 1 im K¨orper Fn nur zwei L¨ (5.4) bzw. (5.5) erf¨ ullt. Nun nehmen wir an, n habe mindestens zwei Primteiler p und q , aber eine Kongruenz (5.4) oder (5.5) sei erf¨ ullt; diese muss dann erst recht simultan mod p und mod q erf¨ ullt sein. Nach Satz 5.7 ist n quadratfrei, also p = q , beide ungerade. O.B.d.A. d¨ urfen wir annehmen, dass p − 1 mindestens ebensooft durch 2 teilbar ist wie q − 1 , also ν2 (p − 1) ≥ ν2 (q − 1) . Wenn hier Gleichheit vorliegt, setzen wir d := pq , sonst d := p . In jedem Fall ist d ≡ 1 mod 4 , die Hypothese (J) ist also auf d anwendbar. Wegen der Multiplikativit¨at des Jacobisymbols ist (J) sogar f¨ ur eine Primzahl a < 2(log d)2 erf¨ (5.5) ist auf alle F¨ alle eines mit a a ullt, d.h. unter den a in (5.4) und b u . Da u ungerade ist, muss = −1 . Nun setzen wir b := a d d = d = −1 sein, insbesondere b ≡ 1 mod d . Die Kongruenz (5.4) scheidet somit aus, und es muss ein j , 0 ≤ j < t geben mit j
b2 ≡ −1 mod p
j
und b2 ≡ −1 mod q ,
in den multiplikativen Restklassengruppen erh¨ alt man also als Ordnungen ord [b]p = ord [b]q = 2j+1 . 1. Fall: d = p , ν2 (p − 1) > ν2 (q − 1) . Nach dem Eulerschen Satz ist 2j+1 = ord [b]q | (q − 1) =⇒
−1 =
=⇒
2j+1 |
p−1 2
b b = ≡ b(p−1)/2 ≡ 1 mod p , d p
Widerspruch. urfen wir 2. Fall: d = pq , ν2 (p − 1) = ν2 (q − 1) . Wegen −1 = db = ( pb ) ( qb ) d¨ o.B.d.A. annehmen, dass
b b = −1 und = 1 p q
129
5 Primzahltests und Primfaktorzerlegung
sind. Dass das unm¨oglich ist, sieht man so ein: b(q−1)/2 ≡ 1 mod q
=⇒
nach Voraussetzung teilt 2j+1 also auch
2j+1 = ord [b]q | p−1 2
q−1 , 2
, demnach m¨ usste auch gelten
b ≡ b(p−1)/2 ≡ 1 mod p . 2 p
5.3.4 Der Miller-Rabin-Test Millers Idee hat eine gr¨oßere praktische Bedeutung erlangt durch folgende von Rabin gefundene Variante: Satz 5.10 Wenn n ∈ N , n > 9 ungerade, keine Primzahl ist, sind die Kongruenzen (5.4), (5.5) f¨ ur h¨ochstens ein Viertel aller primen Restklassen mod n erf¨ ullt. Testet man also die G¨ ultigkeit der Kongruenzen (5.4) bzw. (5.5) anhand von N unabh¨angig zuf¨allig gew¨ahlten Basiszahlen a , so gilt: 1. Wenn f¨ ur ein a weder (5.4) noch (5.5) erf¨ ullt ist, ist n mit Sicherheit keine Primzahl. 2. Wenn f¨ ur alle a (5.4) oder (5.5) erf¨ ullt sind, ist n Primzahl mit einer Irrtumswahrscheinlichkeit ≤ 4−N . Schon bei der Wahl von 100 Zufallszahlen wird die Irrtumswahrscheinlichkeit mikroskopisch klein; nat¨ urlich hat man bei Primzahlen mit Irrtumswahrschein” lichkeit“ ein f¨ ur den Mathematiker ungewohntes Gef¨ uhl der Unsicherheit. Aber selbst bei Verwendung deterministischer Tests besteht offenbar eine gewisse — wesentlich schlechter kontrollierbare — Wahrscheinlichkeit, dass der mathematische Koprozessor nicht korrekt arbeitet oder dass ein virus inside“ vorliegt. ” Insofern kann man auch diese Monte-Carlo-Primzahltests getrost akzeptieren. Der Beweis des Satzes beruht wieder darauf, dass die Kongruenzen (5.4) und (5.5) simultan modulo allen Primpotenzteilern von n erf¨ ullt sein m¨ ussen und auf einer detaillierten Fallunterscheidung dazu, wie oft z.B. −1 gleichzeitig f¨ ur alle Primpoj tenzteiler von n ein 2 u-ter Potenzrest sein kann. Diese Fragen lassen sich mit den S¨atzen 4.10 und 4.11 angehen. Einzelheiten u aftigen ¨bergehen wir hier und besch¨ uns lieber mit einem etwas langsameren, aber leichter zu begr¨ undenden MonteCarlo-Test, der zudem noch eine andere zahlentheoretische Idee ins Spiel bringt, n¨amlich das quadratische Reziprozit¨atsgesetz.
130
5.3 Riemannsche Vermutung und probabilistische Primzahltests
5.3.5 Der Solovay-Strassen-Test Satz 5.11 Sei n eine ungerade nat¨ urliche Zahl > 2 . 1. Wenn n prim ist, erf¨ ullen alle a ∈ Z die Kongruenz a a(n−1)/2 ≡ mod n . n 2. Wenn n zusammengesetzt ist, ist diese Kongruenz f¨ ur h¨ochstens die H¨ alfte aller primen Restklassen mod n erf¨ ullt. Bemerkung: Nach Folgerung 4.24 l¨asst sich das Jacobisymbol na in O(log n) Schritten berechnen, unabh¨angig davon, ob n prim ist oder nicht, ebenso wie die ahlten nat¨ urlichen Zahlen a l¨ asst sich Potenz a(n−1)/2 mod n . Mit N zuf¨allig gew¨ also mit O(N log n) Multiplikationen und Divisionen entscheiden, ob entweder • n mit Sicherheit zusammengesetzt ist (wenn die Kongruenz f¨ ur ein a nicht erf¨ ullt ist), • oder andernfalls n mit Irrtumswahrscheinlichkeit ≤ 2−N eine Primzahl ist. Der erste Teil des Satzes ist einfach das Eulersche Kriterium 4.15.5. Der Beweis des zweiten Teils beruht darauf, dass nach den Eigenschaften des Jacobisymbols auch f¨ ur zusammengesetzte nat¨ urliche Zahlen n a U := { [a]n ∈ (Z/nZ)∗ | a(n−1)/2 ≡ mod n } n ugt also zu zeigen, dass U eieine Untergruppe von G := (Z/nZ)∗ ist. Es gen¨ ne echte Untergruppe ist, da dann der Index in G mindestens 2 ist. W¨ are nun U = G , so m¨ usste an−1 ≡ 1 mod n sein f¨ ur alle a ∈ G , n ist also Carmichaelzahl. Eine Carmichaelzahl ist quadratfrei und hat mindestens drei Primtei¨ ler (Ubungsaufgabe, vgl. auch den Beweis von Satz 5.2), wir k¨ onnen uns also o.B.d.A. auf die Voraussetzungen n = p1 · . . . · pm , m ≥ 3,
alle Primteiler pj paarweise verschieden mit
(pj − 1) | (n − 1)
beschr¨anken. Dann gibt es aber nach dem chinesischen Restsatz ein
a a ∗ a ∈ (Z/nZ) mit = −1 , =1 p1 pj f¨ ur alle 1 < j ≤ m , nach Definition des Jacobisymbols also mit na = −1 . Nach dem Eulerschen Kriterium ist dann a(p1 −1)/2 ≡ −1 mod p1 ,
a(pj −1)/2 ≡ 1 mod pj
f¨ ur j > 1
131
5 Primzahltests und Primfaktorzerlegung
und wegen
pj − 1 n − 1 | 2 2 a(n−1)/2 ≡ 1 mod pj
f¨ ur alle j > 1 ,
oren, also keinesfalls also a(n−1)/2 ≡ −1 mod n . Demnach kann a nicht zu U geh¨ ist U = G . 2
5.3.6 AKS, das ultimative Verfahren? Im Jahr 2002 haben die drei indischen Informatiker Agrawal, Kayal und Saxena einen grunds¨atzlichen Durchbruch erzielt durch Angabe des ersten Polynomzeit-Primzahltests [AKS], der in einer Laufzeit von 0(log12+ε n) deterministisch entscheiden kann, ob n prim ist oder nicht, und zwar ohne unbewiesene Verteilungsannahmen wie z.B. eine verallgemeinerte Riemannsche Vermutung. Die entscheidende neue Idee — neben tieferliegenden Hilfsmitteln, die inzwischen zur Verbesserung des Algorithmus eingesetzt wurden — besteht darin, nicht mehr nur mit Restklassen in Z , sondern mit Restklassen des Polynomrings Z[x] zu rechnen. Ausgangspunkt ist die folgende einfache Beobachtung: n ist genau dann Primzahl, wenn f¨ ur alle a ∈ Z mit (a, n) = 1 gilt (x + a)n ≡ xn + a mod n . In dieser Form ist die Aussage nat¨ urlich nicht unmittelbar in einen Test zu u ussen zu viele a ausprobiert werden, bevor auf ,,alle” ¨bersetzen, denn es m¨ geschlossen werden kann. Es erweist sich als besser, nicht im Restklassenring Z[x]/nZ[x] , sondern in Restklassenringen Z[x]/(n, xr − 1)Z[x] zu rechnen. In den folgenden Jahren ist u.a. von H.W. Lenstra, jr. und Pomerance der Algorithmus weiter verbessert worden bis auf eine Laufzeit 0(log6+ε n) . Das heißt ¨ keineswegs, dass alle weiter oben geschilderten Uberlegungen hinf¨ allig w¨ aren: F¨ ur praktische Zwecke m¨ogen Monte-Carlo-Verfahren noch f¨ ur lange Zeit u ¨berlegen bleiben, und f¨ ur Zahlen spezieller Bauart wie etwa jene aus Abschnitt 5.2.4 d¨ urften die alten Verfahren wohl immer schneller bleiben. Dennoch: ein Fortschritt mindestens von grunds¨atzlichem theoretischen Interesse.
5.4 Faktorisierungsverfahren 5.4.1 Quadratische Formen Die Primfaktorzerlegung einer großen Zahl n wird nat¨ urlich immer mit dem in Abschnitt 5.2.1 geschilderten Ansatz der probeweisen Division durch kleine Prim-
132
5.4 Faktorisierungsverfahren
√ zahlen beginnen. F¨ ur Teiler in der Gr¨oßenordnung von n kann man, einer Empfehlung Fermats folgend, versuchen, n als Differenz zweier Quadrate n = x2 − y 2 = (x + y) (x − y) √ darzustellen. Ein in O( 3 n) Schritten laufendes Faktorisierungsverfahren gewinnt man nach R.S. Lehman (1974) dadurch, dass man zun¨ achst probeweise Division √ bis zu Teilern der Gr¨oßenordnung 3 n durchf¨ uhrt und dann versucht, die Gleichung x2 − y 2 = 4 k n √ ur x und y zu l¨ osen, die von k f¨ ur k ∈ N , k < 0, 1 · 3 n in kleinen Intervallen f¨ abh¨angen und deren optimale Wahl ziemlich knifflig ist. Eine sehr viel tiefer liegende Idee, die gut ausgebaute alte Theorie der bin¨ aren quadratischen Formen f¨ ur die Faktorisierung großer n nutzbar zu machen, stammt von Shanks (1969). Sie verwendet fundamentale Resultate aus der Idealtheorie quadratischer Zahlk¨orper, auf die wir nur kurz in Abschnitt 8.11 zu sprechen kommen werden. Es sei einstweilen nur soviel gesagt, dass jedem nichttrivialen Teiler von n spezielle, sogenannte ambige quadratische Formen mit ganzzahligen Koeffizienten und Diskriminante n bzw. 4n entsprechen, und dass das Shankssche Verfahren diese ambigen quadratischen Formen systematisch erzeugt. Unter Annahme der Richtigkeit einer geeigneten Verallgemeinerung der Riemannschen Ver´, mutung ist gezeigt worden (Lagarias, Montgomery, Odlyzko, Oesterle √ uhrt. Auch f¨ ur Lenstra), dass dieses Verfahren in O( 5 n) Schritten zum Ziel f¨ dieses Verfahren gibt es inzwischen Monte-Carlo-Versionen (Schnorr, Seysen).
5.4.2 Quadratische Reste Es l¨asst sich in O(log n) Schritten testen, ob n eine reine r-te Potenz ist, darum wollen wir nun o.B.d.A. voraussetzen, dass n paarweise verschiedene Primfaktoren besitzt und ungerade ist. Aus Abschnitt 4.2 wissen wir, dass Kongruenzen x2 ≡ b mod n genau dann eine L¨osung besitzen, wenn sie modulo allen Primteilern von n l¨ osbar osungen, wo s die sind; in diesem Fall haben sie aber nicht nur 2, sondern 2s L¨ Anzahl der verschiedenen Primfaktoren von n angibt. Wenn man es also schafft, Kongruenzen x2 ≡ y 2 , x ≡ ±y mod n zu erzeugen, so erh¨alt man automatisch nichttriviale Faktoren von n in Form der leicht zu berechnenden gr¨oßten gemeinsamen Teiler (x + y, n)
,
(x − y, n) .
133
5 Primzahltests und Primfaktorzerlegung
Seit Ende der sechziger Jahre sind verschiedene Techniken entwickelt worden, auf die hier nicht n¨aher eingegangen werden soll (Monte-Carlo-Verfahren, quadratisches Sieb, Kettenbr¨ uche), mit denen man in kurzer Zeit viele quadratische Reste mod n gewinnen kann. Wie erh¨alt man nun Kongruenzen zwischen diesen 2 ≡ x mod n ? quadratischen Resten y12 ≡ x1 , . . . , ym m Man stelle die xj im kleinsten positiven Restsystem dar, d.h. durch nat¨ urliche Zahlen, und versuche, daraus Produkte in Form von Quadraten nat¨ urlicher Zahlen (5.6) x 11 x 22 · . . . · x mm = t2 , t ∈ N , alle j = 0 oder 1 zu bilden; wenn dies gelingt, hat man eine Kongruenz x2 ≡ t2 mod n
m f¨ ur x := y1 1 · . . . · ym ,
die x ≡ ±t mod n wenigstens mit Wahrscheinlichkeit 1 − 2−(s−1) erf¨ ullt und dann auf einen nichttrivialen Faktor von n f¨ uhrt. Wie findet man nun t und die j ? Man w¨ahle die H kleinsten Primzahlen p1 , . . . , pH mit pnh = 1 und versuche durch Hm Divisionen, die quadratischen Reste xj in Potenzprodukte der ph zu zerlegen; die anderen kleinen Primzahlen p mit np = −1 kommen h¨ochstens als quadratische Teiler der xj in Frage, da diese quadratische Reste mod n sind. Sei also a
a
a
xj = p1 1j p22j · . . . · pHHj · kj ,
kj ∈ N ,
alle ahj ≥ 0 ,
dann treffe man folgende Entscheidung: urlich ist auch 1. Wenn kj eine Quadratzahl ist, lasse man sie einfach weg; nat¨ xj /kj quadratischer Rest mod n ; der triviale Fall kj = 1 ist darin eingeschlossen. 2. Wenn sich kj auf Grund eines schnellen Tests als Primzahl erweist, nehme man diese unter die Faktorisierungsbasis p1 , . . . , pH mit auf. 3. In allen anderen F¨allen, wenn also kj mehrere unbekannte Primfaktoren > pH besitzt, streiche man xj aus der Liste der quadratischen Reste. Man beh¨alt also eine Liste mit quadratischen Resten u ¨brig, die (bis auf ohnehin quadratische Faktoren) vollst¨andig in die Primzahlen ph der Faktorisierungsbasis zerfallen. Die L¨osung der Gleichung (5.6) l¨auft damit auf die L¨ osung eines linearen Gleichungssystems u ur ¨ber dem K¨orper F2 in den Exponenten der ph hinaus: F¨ alle h = 1, . . . , H muss ah1 1 + ah2 2 + . . . + ahm m ≡ 0 mod 2 sein, dann bilden die j , die man o.B.d.A. als 0 oder 1 annehmen kann, eine L¨osung der Gleichung (5.6).
134
5.4 Faktorisierungsverfahren
Um eine realistische Chance auf nichttriviale L¨ osungen j dieses Gleichungssystems zu erhalten, sollte m etwas gr¨oßer als H sein. Das eigentliche Problem ist die optimale Wahl von H ; wird es zu klein gew¨ ahlt, erh¨ alt man zuwenig quadratische Reste, die sich in dieser Faktorisierungsbasis zerlegen lassen, wird es zu osen groß gew¨ahlt, werden die Kosten f¨ ur die Faktorisierungen der xj und das L¨ des Gleichungssystems zu hoch. Die mittlere Laufzeit des Verfahrens — eine deterministische Absch¨atzung ist nicht bekannt — h¨ angt also davon ab, • wie schnell man die quadratischen Reste xj erzeugen kann, • wie viele unter diesen in hinreichend kleine Primfaktoren zerfallen, • und wie schnell man lineare Gleichungssysteme l¨ osen kann. Ohne auf Details einzugehen, sei hier nur soviel berichtet, dass das optimale H bzw. m in der Gr¨oßenordnung von √ log n log log n
ec
liegt (die Konstante c f¨allt je nach Verfahren anders aus) und dass daraus f¨ ur die mittlere Laufzeit eine ¨ahnliche L¨ange (mit anderm c) folgt. Dies ist mehr als jede Logarithmuspotenz, aber immerhin weniger als jede n-Potenz.
5.4.3 Pollards Rho-Methode Ein anderes Monte-Carlo-Verfahren zur Primfaktorzerlegung großer Zahlen ist von Pollard 1975 ver¨offentlicht worden; es ist zwar asymptotisch bei weitem nicht so schnell wie die oben skizzierten Verfahren, aber es ist verbl¨ uffend einfach und hat den großen Vorzug, dass es kleine Primfaktoren p | n besonders schnell 1 entdeckt, n¨amlich im Mittel in O(p 2 + ) Schritten. Wenn n also nicht mehrere kleine Primfaktoren besitzt, muss man zur Faktorisierung von n mit einer mitt1 leren Laufzeit von n 4 + rechnen. Pollards Faktorisierungsverfahren beruht darauf, dass bei Iteration einer zuf¨ al” lig gew¨ahlten“ Abbildung einer endlichen Menge S sehr viel schneller als anschaulich erwartet Periodizit¨aten auftreten, genauer: Satz 5.12 Sei S eine endliche Menge mit r Elementen, x0 ∈ S und f :S →S,
xj+1 := f (xj )
f¨ ur alle
j.
√ Ferner sei λ reell positiv und l := 1 + [ 2λr] (Gaußklammer). Unter allen m¨ oglichen Paaren (f, x0 ) ist der Anteil derjenigen mit paarweise verschiedenen x0 , . . . , xl kleiner als e−λ .
135
5 Primzahltests und Primfaktorzerlegung
Man wird also bei zuf¨allig gew¨ahlten Abbildungen und Startwerten schon nach √ etwa r Folgengliedern mit Periodizit¨aten rechnen m¨ ussen (gleichzeitig eine Warnung an alle, die mit der Iteration m¨oglichst komplizierter Abbildungen endlicher Mengen Zufallszahlen erzeugen wollen!), und die Periodenl¨ ange wird im Mittel ebenfalls unter dieser Schranke bleiben. W¨ahlt man also z.B. f : Z/nZ → Z/nZ : x → x2 − 1 at eimit einem zuf¨allig gew¨ahlten Startwert x0 , so darf man mit einer Periodizit¨ √ ner L¨ange der Gr¨oßenordnung n rechnen. Wenn n aber einen kleinen Primfaktor p besitzt, d¨ urfte die Folge der (xj mod p) sehr viel schneller periodisch werden, und man sollte p oder andere nichttriviale Teiler von n dadurch identifizieren k¨onnen, dass man viele gr¨oßte gemeinsame Teiler (xj − xi , n)
f¨ ur i < j
berechnet. Nat¨ urlich ist es nicht ¨okonomisch, mit den Folgengliedern xj alle Difaßigerweise so vor, dass man ferenzen xj − xi zu berechnen. Man geht zweckm¨ parallel zu den xj die Folge yi :=
i
(x2j − xj ) mod n
j=1
berechnet und jeweils nach einer angemessenen Schrittzahl den ggT (yi , n) berechnet. Die einzig problematischen Punkte des Verfahrens k¨ onnten sein: • Die zur rekursiven Definition der Folge gew¨ ahlte Funktion ist nicht geeignet, weil sie zuf¨allig eine wesentlich l¨angere Periode hat. • Modulo aller Primteiler von n wird die Folge ungef¨ ahr gleichzeitig periodisch; dann wird der berechnete ggT sehr schnell n , was auch nicht weiterhilft (im oben gew¨ahlten Beispiel etwa f¨ ur x0 = 0 oder ±1 ). Beide Schwierigkeiten lassen sich verkleinern, indem man bei Misserfolg andere Funktionen bzw. Startwerte ausprobiert. Es ist allerdings ein grunds¨ atzliches Problem, inwieweit Polynomfunktionen u allig gew¨ ahlt“ angesehen ¨berhaupt als zuf¨ ” werden k¨onnen. Zum Beweis des Satzes u achst, dass man f¨ ur die Wahl ¨berlegt man sich zun¨ von (f, x0 ) insgesamt rr+1 M¨oglichkeiten hat. Verlangt man zus¨ atzlich, dass x0 , . . . , xl paarweise verschieden sind, so bleiben davon nur r r−l
l j=0
(r − j)
136
5.4 Faktorisierungsverfahren
M¨oglichkeiten; ihr relativer Anteil ist also r−l−1
l
(r − j) =
j=0
l j=1
j (1 − ) . r
Durch Logarithmieren und unter Verwendung von log(1−x) < −x f¨ ur 0 < x < 1 ergibt sich daraus
log
l j=1
l l j j j (1 − ) = log(1 − ) < − = r r r j=1
j=1
√ l2 ( 2λr)2 l(l + 1) < − < − = −λ = − 2r 2r 2r wie behauptet. 2
5.4.4 Pollards p − 1-Methode ¨ Ahnlich wie es besonders schnelle Primzahltests f¨ ur Zahlen besonderer Bauart gibt — Abschnitte 5.2.4 und 5.2.5 —, kann man auch Primfaktoren p von n besonders schnell finden, wenn p − 1 in kleine Primpotenzen ≤ B zerf¨ allt: 1. W¨ahle ein gemeinsames Vielfaches k aller Primpotenzen ≤ B . 2. W¨ahle ein a ∈ N , 1 < a < n − 1 . 3. Berechne den ggT d := (ak − 1, n) . 4. Wenn dieses d ein trivialer Teiler von n ist, versuche ein anderes a . Die Effizienz dieses Algorithmus beruht auf der folgenden einfachen Konsequenz des Fermatschen Satzes: Satz 5.13 Wenn f¨ ur den Primteiler p | n alle Primpotenzteiler q ν | (p − 1) die ν Ungleichung q ≤ B erf¨ ullen, gilt ak ≡ 1 mod p . Beweis: p − 1 ist nach Konstruktion ein Teiler von k . 2 Die praktische Bedeutung dieses Algorithmus ist weniger groß als die Fruchtbarkeit seiner Idee, die wir im n¨achsten Abschnitt an entscheidender Stelle wiederfinden werden.
137
5 Primzahltests und Primfaktorzerlegung
5.5 Ein Ausblick auf elliptische Kurven 5.5.1 Elliptische Kurven u orpern ¨ber K¨ Sei K zun¨achst ein beliebiger K¨orper; wir wollen nur der Einfachheit halber voraussetzen, dass die Charakteristik von K nicht 2 oder 3 ist (vgl. n¨ achstes Kapitel), d.h. K soll nicht F2 oder F3 als Unterk¨orper enthalten oder elementarer gesagt, es sollen 1 + 1 und 1 + 1 + 1 = 0 sein. Man nennt die L¨osungsmenge einer Gleichung y 2 = x3 + ax + b in K 2 zusammen mit dem Punkt 0 := (∞, ∞) eine elliptische Kurve E = E(a, b) ; einheitlich l¨asst sich E als die Punktmenge der projektiven Ebene u ¨ber K beschreiben, welche der Gleichung y 2 t = x3 + a x t2 + b t3 gen¨ ugen. Man setzt stets voraus, dass a, b ∈ K sind und dass das Polynom x3 + ax + b keine doppelten Nullstellen hat, dass also seine Diskriminante 4a3 + 27b2 = 0 ist (stimmt bis aufs Vorzeichen mit der in Abschnitt 3.3.2 gegebenen Definition u ar ist, d.h. dass u ¨berein). Dadurch wird garantiert, dass E nichtsingul¨ ¨berall sinnvoll Tangenten an E gelegt werden k¨onnen. Der Name elliptische Kurve“ ” kommt nicht von ihrer geometrischen Gestalt f¨ ur K = R , sondern daher, dass Funktionen, die f¨ ur K = C in nat¨ urlicher Weise auf E definierbar sind (elliptische Funktionen) eine entscheidende Rolle spielen bei der Berechnung der Bogenl¨ ange auf Ellipsen. Auf der elliptischen Kurve E l¨asst sich nun die Struktur einer additiv geschriebenen abelschen Gruppe definieren; der Punkt im Unendlichen u ¨bernimmt dabei die Rolle des neutralen Elements (daher die Bezeichnung 0 ). F¨ ur P = (x1 , y1 ) ,
Q = (x2 , y2 ) ∈ E ,
beide
definiert man P + Q := (x3 , y3 ) durch
y2 − y1 2 − x1 − x2 x2 − x1
y2 − y1 y3 := −y1 + (x1 − x3 ) , x2 − x1
x3 :=
= 0 ,
138
5.5 Ein Ausblick auf elliptische Kurven
wenn P = Q ist, andernfalls
2 3x21 + a x3 := − 2x1 2y1
2 3x1 + a (x1 − x3 ) , y3 := −y1 + 2y1
urlich als der Punkt 0 = (∞, ∞) zu interpretieren ist, ebenso was f¨ ur y1 = 0 nat¨ wie in dem Fall x1 = x2 , y1 = y2 . Der inverse Punkt −P wird dann notwendig durch die Koordinaten (x1 , −y1 ) beschrieben, und die maximal drei Punkte mit y = 0 sind zu sich selbst invers ⇐⇒ involutorisch ⇐⇒ von Ordnung 2 . Definiert man einfach P +0 = 0+P := P f¨ ur alle P ∈ E , so sind die Gruppenaxiome nicht schwer nachzurechnen bis auf das extrem komplizierte Assoziativgesetz; da wir hier auch weit wichtigere Dinge weglassen werden, unterschlagen wir diesen Beweis und verweisen auf ein gutes Dutzend B¨ ucher u ¨ber elliptische Kurven ([Si], [La1], [Ko2],... ). Es soll aber wenigstens erw¨ ahnt werden, dass die komplizierte Definition der Gruppenstruktur eine einfache geometrische Interpretation besitzt: Jede Gerade der projektiven Ebene u ¨ber K , die mit E mehr als einen Punkt gemeinsam hat, schneidet E in drei Punkten P1 , P2 , P3 , von denen bei tangentialer Lage auch zwei zusammenfallen k¨onnen. Die Addition wird gerade so eingerichtet, dass P1 + P2 + P3 = 0 ist. Insbesondere haben Parallelen zur y-Achse im Endlichen mit E keinen oder genau zwei Punkte (x, ±y) gemeinsam und gehen dann durch den Punkt 0 . Die Inversenbildung muss also gerade durch Spiegelung an der x-Achse erfolgen.
5.5.2 Elliptische Kurven u orpern ¨ber endlichen K¨ Nun setzen wir voraus, dass der K¨orper K ein endlicher K¨ orper Fn ist mit einer Primzahl n > 3 . Im n¨achsten Abschnitt wird deutlich werden, warum f¨ ur die Primzahl hier die ungew¨ohnliche Bezeichnung n gew¨ ahlt wird. Dass elliptische Kurven u ur Primzahltests beson¨ber endlichen K¨orpern zur Faktorisierung und f¨ ders gut tauglich sind, hat vier Gr¨ unde sehr unterschiedlicher Schwierigkeit: 1. Gruppenoperationen sind schnell“ oder billig“ in folgendem Sinne: Zur ” ” Addition von Punkten auf E sind rationale Operationen in Z/nZ durchzuf¨ uhren; dass Addition und Multiplikationen in einer Zeit durchf¨ uhrbar sind, die nur wie eine kleine log n -Potenz mit n w¨ achst, haben wir bereits in Abschnitt 5.1.2 erw¨ahnt. Hier kommt noch die Division durch (x2 − x1 ) bzw. 2y1 hinzu; diese l¨asst sich, wie bereits im Zusammenhang mit Satz 1.23 erw¨ahnt, durch Anwendung des euklidischen Algorithmus auf n und diese Nenner durchf¨ uhren. Wir wissen aus Satz 1.7, dass auch dessen Kosten nur mit einer log n -Potenz anwachsen. Die Bildung von Vielfachen
139
5 Primzahltests und Primfaktorzerlegung
mP eines Punktes auf E behandelt man ganz analog zur Potenzierung in 5.1.2: Man stelle m im Bin¨arsystem dar und berechne mP durch h¨ ochstens 2 log m Verdopplungen. 2. Nach einem von Artin vermuteten, von Hasse 1933 bewiesenen und sp¨ater von Weil und Deligne auf eine sehr viel gr¨ oßere Klasse von Kurven und Variet¨aten verallgemeinerten Satz liegt die Anzahl N der Punkte auf E , also die Gruppenordnung der Gruppe (E, +) in der Gr¨ oßenordnung von n + 1 , der Anzahl der Punkte auf einer projektiven Geraden u ¨ber Fn . Genauer gilt √ |N − (n + 1)| < 2 n . 3. Die genaue Berechnung der Gruppenordnung von E ist aber nur in sehr speziellen F¨allen leicht machbar (wenn sogenannte komplexe Multiplikation vorliegt). Nach H.W.Lenstra jr. (unter Benutzung wesentlicher Vorarbeiten von Deuring [Deu]) treten aber alle ganzen N im Intervall √ √ (n + 1 − 2 n, n + 1 + 2 n) als Ordnungen elliptischer Kurven u ¨ber Z/nZ auf, und in der mittleren H¨alfte dieses Intervalls sind diese Ordnungen sogar sehr gleichm¨ aßig verteilt: Bezeichnet man mit f (S) die Anzahl der nicht-isomorphen elliptischen Kurven u ¨ber Z/nZ (Isomorphie bedutet hier nicht nur Isomorphie von Gruppen; der Isomorphismus muss auch durch rationale Funktionen in (x, y) gegeben sein), deren Ordnungen zu der endlichen Menge √ √ S ⊂ N ∩ (n + 1 − n, n + 1 + n) geh¨oren, dann gibt es positive Konstanten c, d , so dass gilt √ √ n < f (S) < d |S| n (log n) (log log n)2 . c (|S| − 2) log n 4. Nun vermutet man, dass in dem fraglichen N -Intervall gen¨ ugend viele N aus kleinen Primfaktoren zusammengesetzt sind, genauer: Der Anteil der √ √ Ordnungen N im Intervall (n + 1 − n, n + 1 + n) , die sich ausschließlich aus Primfaktoren < y zusammensetzen, sollte etwa bei u−u
liegen f¨ ur u =
log n . log y
Diese Vermutung wird gest¨ utzt durch entsprechende Resultate von Canfield, Erd¨ os und Pomerance, allerdings f¨ ur das Intervall von 1 bis n < y < (log n)1− . und unter der Einschr¨ankung (log n) √ W¨ahlt man m also als gemeinsames Vielfaches aller Primpotenzen < n + 1 + n , die sich aus Primzahlen < y bilden lassen, dazu einen Punkt P einer zuf¨ allig gew¨ahlten elliptischen Kurve E u ¨ber Fn , so darf man etwa mit Wahrscheinlichkeit u−u erwarten, dass mP = 0 ist.
140
5.5 Ein Ausblick auf elliptische Kurven
5.5.3 Faktorisierung mit Hilfe elliptischer Kurven H.W. Lenstra jr. hat einen Faktorisierungsalgorithmus entworfen, der auf eben diesen Punkten beruht. Angenommen, n sei nun eine große nat¨ urliche Zahl, von der wir wissen, dass sie zu 6 teilerfremd ist, und von der wir vermuten, dass sie einen unbekannten Primfaktor p besitzt. Wie kann man in elliptischen Kurven u ¨ber Fp rechnen, ohne p zu kennen? Im Prinzip kann man alle Rechnungen mod n ausf¨ uhren, da man ja jederzeit auf die Koordinaten den Ringhomomorphismus Z/nZ → Fp : (x mod n) → (x mod p) anwenden kann. Das einzige Problem besteht darin, dass in den Additions- und Verdopplungsformeln f¨ ur die Punkte auf E durch die Nenner x1 − x2 bzw. 2y1 dividiert wird; in Z/nZ ist diese Division genau dann durchf¨ uhrbar, wenn diese Nenner zu n teilerfremd sind. Da diese Division aber ohnehin mit Hilfe des euklidischen Algorithmus durchgef¨ uhrt wird (Satz 1.23 ff.), scheitert die Berechnung von mP durch Rechnungen in Z/nZ genau dann, wenn ein ggT (x1 − x2 , n)
oder
(2y1 , n) = 1
gefunden wird. Wenn dieser nicht zuf¨allig gerade = n ist, ist man aber schon fast am Ziel, man hat n¨amlich einen nichttrivialen Faktor von n . Auf Faktor und Cofaktor wird man dann einen Primzahltest anwenden bzw. das Verfahren erneut starten. Systematisch geht man also so vor: 1.) Nachdem man festgestellt hat, dass n keine kleinen Primfaktoren besitzt, w¨ahlt man zuf¨ allig einen Punkt P = 0 auf einer zuf¨alligen elliptischen Kurve E in Form ganzer Zahlen a, b, x, y mit y 2 = x3 + a x + b und kontrolliert, ob die Diskriminante 4a3 +27b2 zu n teilerfremd ist; wenn nicht, hat man entweder schon einen echten Teiler von n gefunden oder muss eine andere Wahl treffen. 2.) Unabh¨angig von P und E w¨a√ hlt man eine von n abh¨ angende Schranke y log n log log n , s.u.) und ein gemeinsames Viel(zweckm¨aßig ist eine Potenz von e √ √ faches m aller Primpotenzen ≤ n + 2 4 n aus Primzahlen < y und berechnet mP , als ob Z/nZ ein K¨orper w¨are. Wenn n einen Primteiler p hat und wenn P in E u ¨ber Fp eine Ordnung hat, die Teiler von m ist, so wird mP = 0 ; in der Berechnung mod n ¨außert sich das darin, dass einer der auftretenden Nenner x1 − x2 oder 2y1 mit n einen ggT > 1 hat, der automatisch mit ausgerechnet wird. Dieser Fall tritt mit Sicherheit dann ein, wenn E u ¨ber Fp eine Ordnung besitzt, die in Primfaktoren < y zerf¨allt. Daf¨ ur besteht, wie wir gesehen haben, je nach Wahl von y eine mehr oder weniger große Hoffnung. 3.) Ist dieser Fall nicht eingetreten oder ist der fragliche Nenner sogar ≡ 0 mod n , wird das Verfahren mit einer neuen Wahl von E und P wiederholt.
141
5 Primzahltests und Primfaktorzerlegung
Um die mittlere Laufzeit klein zu halten, ist nat¨ urlich die Wahl von y zu optimieren. Unter Annahme der oben genannten Heuristik u ¨ber Zahlen, die in kleine Primfaktoren zerfallen, kann man die mittlere Laufzeit durch √ e (1+σ(n))(log n log log n) absch¨atzen f¨ ur eine Funktion σ , welche limn→∞ σ(n) = 0 erf¨ ullt. Eine weit ausf¨ uhrlichere Darstellung des Themas elliptische Kurven und seiner Bedeutung f¨ ur die computational number theory findet man z.B. in [We].
5.5.4 Schlussbemerkungen 1.) Der aufmerksame Leser wird die Verwandtschaft der Lenstra-Faktorisierung mit Pollards p − 1-Methode bemerkt haben: In beiden F¨ allen wird in Gruppen gerechnet, deren Ordnungen in kleine Primfaktoren zerfallen. Nun haben wir aber den großen Vorzug, eine Riesenauswahl an solchen Gruppen in Form von elliptischen Kurven u ¨ber Fp zu besitzen, wo vorher nur die prime Restklassengruppe mod p zur Verf¨ ugung stand, die i.a. die erforderliche Eigenschaft nicht besaß. 2.) Da eben diese prime Restklassengruppe auch f¨ ur Primzahltests eine zentrale Rolle gespielt hat, ist nicht weiter verwunderlich, dass sich elliptische Kurven auch mit großem Erfolg f¨ ur Primzahltests einsetzen lassen. Goldwasser, Kilian und sp¨ater Atkin haben sehr effiziente Monte-Carlo-Primzahltests mittels elliptischer Kurven konstruiert, in denen der Zufall eine ganz andere Rolle spielt als in den Abschnitten 5.3.4 und 5.3.5: Wenn der Test f¨ ur eine zuf¨ allig gew¨ ahlte elliptische Kurve E die Antwort Primzahl“ gibt, ist p mit Sicherheit eine Primzahl; die ” Unsicherheit besteht hier darin, dass sich E als ungeeignet f¨ ur den Primzahltest erweisen kann und dann keine Antwort gegeben wird. Man kann also etwa den Atkin- und den Miller-Rabin-Test parallel laufen lassen und wird auf diese Weise eine deterministische Antwort erhalten, allerdings nach einer Laufzeit, u ¨ber die nur im Mittel Aussagen gemacht werden kann. 3.) Die Lenstra-Faktorisierung ist von großer praktischer Bedeutung u.a. deswegen, weil sie ¨ahnlich wie die Rho-Methode, aber im Gegensatz zu anderen ausgefeilten Faktorisierungsmethoden, kleine Primfaktoren von n besonders schnell entdeckt. F¨ ur einige Jahre hat man vermutet, dass ihre Laufzeit eine gewisse Schallgrenze f¨ ur Faktorisierungsverfahren u ¨berhaupt darstellt, da die angegebene Funktion immer wieder auch in anderen Methoden auftauchte (vgl. die Schlussbemerkungen in der ersten Auflage von Koblitz’ Buch [Ko3] aus dem Jahr 1987). Seit 1990 ist von Pollard und anderen eine neue Methode, das Zahlk¨orpersieb, entwickelt worden, die asymptotisch f¨ ur n → ∞ schon wieder schneller ist, deren Laufzeit n¨amlich im Mittel zumindest heuristisch durch ec(log n)
1/3 (log log n)2/3
142
5.6 Aufgaben
abgesch¨atzt werden kann (mit einer Konstanten c < 2 , an deren Verbesserung heftig gearbeitet wird), und die f¨ ur sehr große n wie z.B. die Fermatzahl F9 bereits ihre praktische Verwendbarkeit unter Beweis gestellt hat [LL]. Nat¨ urlich handelt es sich auch hier um ein Monte-Carlo-Verfahren, das zus¨ atzlich auf plausiblen, aber schwierigen und unbewiesenen Annahmen der algebraischen Zahlentheorie aufbaut. 4.) Das sollte nicht zu der Annahme verleiten, elliptische Kurven seien dadurch u ussig geworden. Sie stehen ganz unabh¨ angig von den Zielen dieses Kapitels ¨berfl¨ im Schnittpunkt vieler Interessen von Zahlentheorie, Algebra und Analysis, weil sie einen ungeheuren Reichtum an mathematischer Struktur aufweisen, von dem hier nur ein winziger Teil referiert worden ist. Selbst wenn in einigen Jahren die Verfahren von Lenstra und Atkin vielleicht nur noch von historischem Interesse sein sollten, werden elliptische Kurven auf Grund ihrer vielfachen Querverbindungen zu anderen mathematischer Disziplinen (Riemannsche Fl¨ achen, automorphe Funktionen, holomorphe Differentialgleichungen, diophantische Gleichungen — vgl. Abschnitt 3.5.2 —, algebraische Gruppen,...) immer wieder Anwendungen fin¨ den (dies ist kein mathematischer Satz, aber eine wohlbegr¨ undete Uberzeugung). Vielleicht werden wir elliptische Kurven dann als wesentliche Bestandteile physikalischer Theorien wiederfinden ([NP]).
5.6 Aufgaben 1. Beweisen Sie, dass Carmichaelzahlen quadratfrei sind und mindestens drei Primteiler haben. 2. Man verifiziere, dass 2N +1 nur prim sein kann, wenn N eine Zweierpotenz ist. 3. Beweise: Die Fermatzahl F4 ist prim, F5 nicht. 4. Ist die Mersennezahl M13 prim? 5. Zeigen Sie, dass man aus M paarweise verschiedenen Primzahlen p genau (M + 1)(M + 2) · . . . · (M + k) verschiedene Potenzprodukte b = pνp k! mit νp ≤ k bilden kann. 6. Beweisen Sie die Behauptung, dass x2 ≡ 1 mod n genau 2s L¨ osungen besitzt, wenn n ungerade ist und in s paarweise verschiedene Primfaktoren zerf¨allt. 7. Bestimmen Sie alle L¨osungen von x2 ≡ 4 mod 105 . 8. Man zerlege 2047 mit Pollards Rho-Methode.
143 9. Warum sollte man in Pollards Rho-Methode kein lineares Polynom verwenden? 10. Experimentalmathematik: Wie viele der Zahlen zwischen 10n ± 20 lassen sich vollst¨andig in Primfaktoren ≤ 19 zerlegen? Man probiere dies wenigstens f¨ ur n = 2, 3, 4, 5 aus. 11. Sei n ≡ 3 mod 4 Primzahl. Man beweise, dass auf der elliptischen Kurve y 2 = x3 − x u ¨ber Fn genau n + 1 Punkte liegen. 12. Wenn n Primzahl ist, gilt in Z[x] f¨ ur alle a ∈ Z mit (a, n) = 1 (x + a)n ≡ xn + a mod n 13. Finden Sie die inverse Abbildung von (Z/451Z)∗ → (Z/451Z)∗ : a → a17 .
145
6 K¨orper und K¨orpererweiterungen
6 K¨ orper und K¨ orpererweiterungen 6.1 Grundbegriffe 6.1.1 Primk¨ orper und Charakteristik Was K¨orper sind, wissen wir bereits aus Kap. 3 : Ringe oder genauer Integrit¨atsbereiche K , in denen K−{0} eine multiplikative Gruppe ist. Wenn L ⊇ K auch ein K¨orper ist, nennt man L einen Erweiterungsk¨orper, Oberk¨orper oder eine K¨ orpererweiterung von K . Entsprechend heißt K dann Unterk¨orper von L . Satz 6.1 Jeder K¨orper L hat einen eindeutig bestimmten kleinsten Unterk¨orper k , den Primk¨ orper. Dieser ist entweder isomorph zum K¨orper der rationalen ur eine rationale Primzahl p . Die Zahlen Q oder zu einem Restklassenk¨ orper Fp f¨ Charakteristik von L definiert man durch 0 f¨ ur k ∼ = Q . car (L) := p f¨ ur k ∼ = Fp Zum Beweis u ¨berlegt man sich, dass L (und k , wenn es existiert) jedenfalls 0 und 1 enth¨alt und alle endlichen Summen ±(1 + 1 + . . . + 1) . Sind diese alle paarweise verschieden, so erh¨alt man auf diesem Wege eine Einbettung, d.h. einen eindeutig bestimmten injektiven Ringhomomorphismus von Z in L . Wegen der universellen Eigenschaft des Quotientenk¨orpers (Satz 3.7) gibt es daher auch eine eindeutige Einbettung von Q in L , wir sind somit im ersten Fall. Sind die endlichen Summen aus Einsen nicht paarweise verschieden, so gibt es eine kleinste Summe dieser Art, welche 0 ergibt (Differenzbildung!). Da L keine Nullteiler besitzt, muss die Anzahl der Summanden in dieser Summe eine Primzahl p sein, sonst k¨ onnte man nach dem Distributivgesetz diese Summe als Produkt echter Teilsummen = 0 schreiben. Somit erh¨alt man einen eindeutig bestimmten Ringhomomorphismus h : Z → L
mit
ker(h) = pZ ,
der nach dem Homomorphiesatz f¨ ur Ringe einen Isomorphismus F p = Z/pZ ∼ = h(Z) =: k ⊆ L induziert.— Abstrakter formuliert, haben wir hier eine universelle Eigenschaft des Rings Z verwendet, dass es n¨amlich f¨ ur jeden Integrit¨ atsbereich R einen eindeutig bestimmten Ringhomomorphismus Z → R gibt; in unserem Fall, weil R = L ein K¨orper ist, kann sein Kern nur ein Primideal, also {0} oder pZ sein. 2 J. Wolfart, Einführung in die Zahlentheorie und Algebra, DOI 10.1007/978-3-8349-6498-4_6, © Vieweg+Teubner Verlag | Springer Fachmedien Wiesbaden GmbH 2011
146
6.1.2
6.1 Grundbegriffe
Algebraisch“ und transzendent“ ” ”
Wie eben sei L ein Erweiterungsk¨orper von K , was oft durch die Schreibweise L/K ausgedr¨ uckt wird. Beispiele kennen wir bereits: √ 1. Q( 2)/Q √ 2. Q( 3)/Q 3.
C/R
4.
K(x)/K f¨ ur einen beliebigen K¨orper K und den K¨ orper K(x) der rationalen Funktionen mit Koeffizienten in K , d.h. dem Quotientenk¨ orper des Polynomrings K[x] 1 5. Q(e)/Q mit e := n≥0 n! , also allen reellen Zahlen, die durch Einsetzen von e in rationale Funktionen aus Q(x) entstehen. 6.
R/Q
Zwischen den Beispielen 1 bis 3 und den Beispielen 4 bis 6 besteht ein grunds¨ atzlicher Unterschied, wie wir gleich sehen werden: Ein Element a aus L heißt algebraisch u ¨ber K , wenn ein Polynom p ∈ K[x] , p = 0 existiert mit p(a) = 0 , und die ganze K¨orpererweiterung L/K heißt algebraisch, wenn jedes a ∈ L algebraisch u ¨ber K ist. Jedes a ∈ K ist automatisch algebraisch u ¨√ber K , weil 2 − 3 hat 3 zur NullNullstelle des Polynoms p(x) = x − a . Das Polynom x √ stelle, also ist 3 algebraisch u ber Q , und analog findet man zu jedem a aus ¨ √ Q( d) ein Polynom p ∈ Q[x] , p = 0 , somit √ sind die√beiden ersten Beispiele algebraische K¨orpererweiterungen. Dass Q( 2) und Q( 3) nicht gleich oder isomorph sind, ist u ¨brigens keineswegs banal; man kann es z.B. dadurch einsehen, dass das Verzweigungsverhalten rationaler Primzahlen (s. Abschnitt 4.6) in beiden K¨orpererweiterungen wesentlich verschieden ist. Einen anderen Beweis f¨ ur die Nicht-Isomorphie werden wir in Abschnitt 7.4.2 kennenlernen. Auch C/R ist ein Beispiel f¨ ur algebraische K¨orpererweiterungen: F¨ ur jedes z ∈ C hat das Polynom x2 − (z + z¯) x + z z¯ reelle Koeffizienten und die Nullstelle z .— Abstrakter k¨ onnen wir die Eigenschaft algebraisch“ so ausdr¨ ucken: ” Satz 6.2 a ∈ L ist algebraisch u ¨ber dem Unterk¨orper K ⊆ L genau dann, wenn der Einsetzungshomomorphismus K[x] → L :
p(x) → p(a)
einen nichttrivialen Kern hat. Diesen Kern werden wir im n¨achsten Abschnitt 6.2 eingehender studieren. Wenn andernfalls dieser Einsetzungshomomorphismus injektiv ist, d.h. trivialen Kern
6 K¨orper und K¨orpererweiterungen
147
hat (s. Abschnitt 3.2.1), so nennt man a transzendent u ¨ber K , also wenn f¨ ur alle Polynome p ∈ K[x] aus p = 0 auch p(a) = 0 folgt. In diesem Fall l¨asst sich der Einsetzungshomomorphismus nach Satz 3.7 zu einem (injektiven) K¨ orperhomomorphismus K(x) → K(a) ⊆ L fortsetzen. L heißt dann eine transzendente Erweiterung von K . Klar, dass der K¨orper K(x) der rationalen Funktionen selbst eine transzendente Erweiterung von K ist (Beispiel 4). Der Einbettungsisomorphismus K(x) ∼ ¨brigens = K(a) ist u ein sogenannter K-Isomorphismus, d.h. der auf K die Identit¨ at ist. F¨ ur die Zahl e (Beispiel 5, Hermite 1873) wie die meisten anderen mathematischen Naturkonstanten ist ein Beweis f¨ ur die Transzendenz keineswegs einfach; bis heute ist z.B. ungekl¨art, ob etwa e+π oder ζ(3) transzendente Zahlen sind. Aus der Transzendenz der Erweiterung Q(e)/Q folgt nat¨ urlich erst recht die von R/Q . Einfacher werden wir dies mit einem Abz¨ahlbarkeitsargument einsehen (Abschnitt 6.3). Bei den Begriffen algebraisch“ und transzendent“ l¨ asst man u ¨blicherweise den Zu” ” satz u o√rper verstanden wird. In diesem ¨ber K“ weg, wenn unter K der Primk¨ ” orper. Sinne ist also e eine transzendente Zahl und Q( 2) ein algebraischer Zahlk¨
6.1.3 Erzeugende Sei L/K eine K¨orpererweiterung und M eine Untermenge von L . Man nennt M ein Erzeugendensystem f¨ ur L/K oder sagt, dass L aus K durch Adjunktion von M entsteht, geschrieben L = K(M ) , wenn L der kleinste K¨orper ⊆ L ist, der K und M enth¨ alt. Besonders wichtig sind die endlich erzeugten K¨orpererweiterungen L/K , f¨ ur die M = {a1 , . . . , an } ist und f¨ ur die man kurz L = K(a1 , . . . , an ) schreibt und die man nat¨ urlich auch charakterisieren kann als L = {
p(a1 , . . . , an ) | p , q ∈ K[x1 , . . . , xn ] , q(a1 , . . . , an ) = 0 } . q(a1 , . . . , an )
Die oben genannten Beispiele f¨ ur K¨orpererweiterungen sind bis auf das letzte endlich erzeugt, ja sogar einfach, d.h. von einem einzigen a ∈ L erzeugt. Nur R/Q ist nicht endlich erzeugt, wie man durch ein Abz¨ ahlbarkeitsargument einsehen kann.
6.1.4 Grad einer K¨ orpererweiterung Wie immer: L/K sei eine K¨orpererweiterung. Dann ist L gleichzeitig ein K-Vektorraum. Die Dimension dieses Vektorraums nennt den Grad der K¨ orpererweiterung L/K und bezeichnet ihn mit [L : K] . Da der Polynomring K[x] als K-
148
6.2 Algebraische K¨orpererweiterungen
Vektorraum bereits unendliche Dimension hat und da bei transzendenten K¨ orpererweiterungen L/K ein injektiver Einsetzungshomomorphismus K[x] → L existiert, der gleichzeitig K-Vektorraumhomomorphismus ist, haben transzendente K¨orpererweiterungen unendlichen Grad, es gilt also der Satz 6.3 K¨ orpererweiterungen endlichen Grades sind stets algebraisch. Die ersten drei Beispiele in Abschnitt 6.1.2 haben in der Tat den Grad 2 . Der K¨orpergrad verh¨alt sich ¨ahnlich wie Gruppenindizes (was kein Zufall ist, wie wir im n¨achsten Kapitel sehen werden): Satz 6.4 M/L und L/K seien K¨orpererweiterungen. [M : K] ist endlich genau dann, wenn [M : L] und [L : K] endlich sind, und zwar ist dann [M : K] = [M : L] · [L : K] . Zum Beweis nehme man sich L-linear unabh¨ angige Elemente a1 , . . . , an ∈ M und K-linear unabh¨angige Elemente b1 , . . . , bm ∈ L bzw. jeweils eine Vektorraumbasis, wenn der Grad endlich ist. Dann sind alle nm Produkte ai bj ∈ M linear unabh¨angig u ¨ber K (bzw. eine K-Basis von M , wenn man von Basen ausgegangen ist), und daraus folgt sofort die Behauptung. 2 ahnliches Endliche K¨orper m¨ ussen als Primk¨orper einen K¨ orper Fp enthalten; ein ¨ Anzahlargument wie eben zeigt daher: Satz 6.5 Die Anzahl der Elemente eines endlichen K¨ orpers F ist eine Primzahln potenz p . Dabei ist n = [F : Fp ] . Im n¨achsten Kapitel werden wir sehen, dass diese endlichen K¨ orper durch ihren K¨orpergrad u ¨ber Fp bis auf Isomorphie bereits eindeutig bestimmt sind. Wir werden diese darum mit Fpn bezeichnen. Wenn einfach vom K¨ orpergrad von L ohne Nennung des Grundk¨ orpers K die Rede ist, versteht man darunter den Grad der K¨ orpererweiterung von L u ¨ber seinem Primk¨orper.
6.2 Algebraische K¨ orpererweiterungen 6.2.1 Restklassenk¨ orper und algebraische Erweiterungen Sei a ein u orpererweiterung ¨ber dem K¨orper K algebraisches Element irgendeiner K¨ L/K ; der Einfachheit halber k¨onnen wir L = K(a) annehmen. Da der Einsetzungshomomorphismus K[x] → K[a] ⊆ L :
x → a
6 K¨orper und K¨orpererweiterungen
149
einen nichttrivialen Kern hat (Satz 6.2) und da K[a] keine Nullteiler besitzt, muss der Kern ein Primideal P = 0 von K[x] sein, nach dem Satz 3.17 u ¨ber die eindeutige Primpolynomzerlegung darum erzeugt von einem eindeutig bestimmten Primpolynom p(x) =: pa,K (x) . In diesem Zusammenhang spricht man von dem irreduziblen Polynom des Elements a u ¨ ber K . Da dieses Primideal gleichzeitig maximales Ideal ist, wird sein Restklassenring sogar ein K¨ orper (Satz 3.11), und der Homomorphiesatz f¨ ur Ringe impliziert somit die erste Aussage im Satz 6.6 Sei a algebraisch u ¨ber dem K¨orper K und p ∈ K[x] sein irreduzibles Polynom u ¨ber K . Dann gilt 1. K(a) = K[a] ∼ = K[x]/P mit P = < p > . 2. Dieser Isomorphismus ist ein K-Isomorphismus, wobei man sich K in K[x]/P durch die nat¨ urliche Abbildung c → c mod P eingebettet denkt. 3. [K(a) : K] = grad p . Die zweite Aussage folgt daraus, dass sowohl der Einsetzungshomomorphismus K[x] → K[a] wie die kanonische Projektion K[x] → K[x]/P auf K die Identit¨ at sind. Zum Beweis der dritten Aussage sei n := grad p (nat¨ urlich > 0 ). Dann angig u sind wegen p(a) = 0 die n + 1 Elemente 1, a, . . . , an−1 , an linear abh¨ ¨ber n−1 K , aber es sind 1, a, . . . , a linear unabh¨ angig u atte ¨ber K . Andernfalls h¨ man ein Polynom q ∈ K[x] , q = 0 , kleineren Grades als n mit q(a) = 0 , also mit q ∈ P bzw. p | q , Widerspruch. Nat¨ urlich kann man rekursiv auch n−1 ausdr¨ ucken und ebenso a−1 alle h¨oheren a-Potenzen K-linear durch 1, . . . , a ¨ (Ubungsaufgabe!). 2 Die gleiche Idee l¨asst sich umgekehrt zur Konstruktion algebraischer K¨ orpererweiterungen verwenden: Wie eben in Satz 6.6.2 identifiziere man stets K in der angegebenen Weise mit einem isomorphen Unterk¨ orper von K[x]/P f¨ ur Primideale P . Dann l¨asst sich zu jedem Primpolynom aus K[x] ein Erweiterungsk¨ orper angeben, in dem p eine Nullstelle hat (die Eindeutigkeit folgt aus Satz 6.6): Satz 6.7 Sei p ∈ K[x] ein Primpolynom vom Grad n ( > 0 ). Dann gibt es eine K¨ orpererweiterung L = K[a] vom Grad n u amlich K[x] / < p > , in der ¨ber K , n¨ p eine Nullstelle besitzt, n¨ amlich a := x mod < p > . Dann ist p das irreduzible Polynom von a u ¨ber K . Bis auf K-Isomorphie ist L eindeutig bestimmt.
6.2.2 Der Zerf¨ allungsk¨ orper eines Polynoms Aus dem letzten Satz folgt ein wichtiger Schritt in Richtung auf einen algebraisch abgeschlossenen K¨orper, n¨amlich der Satz 6.8 Sei K ein K¨ orper und f ∈ K[x] ein nichtkonstantes Polynom vom Grad n . Dann gibt es eine algebraische K¨orpererweiterung Z/K von einem Grad
150
6.2 Algebraische K¨orpererweiterungen
≤ n! , die u ¨ber K von den Nullstellen von f erzeugt wird, in der f also insbesondere in ein Produkt von Linearfaktoren zerf¨ allt, d.h. n (nicht notwendig verschiedene) Nullstellen besitzt. Man nennt Z den Zerf¨ allungsk¨ orper des Polynoms f ; er ist bis auf K-Isomorphie eindeutig bestimmt. Beweis durch Induktion u ur n = 1 ist f linear und hat seine einzige ¨ber n : F¨ Nullstelle in K = Z , es ist also nichts zu zeigen. Sei nun der Satz f¨ ur kleinere Polynom- bzw. K¨orpergrade als n schon gezeigt und p ein Primteiler von f in K[x] . Wir wissen bereits, dass ein Erweiterungsk¨ orper L = K[a] von K vom Grad grad p ≤ n u ¨ber K existiert, in dem p und somit auch f mindestens die eine Nullstelle a besitzt. In L[x] gilt also f (x) = (x − a) g(x) f¨ ur ein Polynom g ∈ L[x] vom Grad n − 1 . Nach Induktionsvoraussetzung existiert also ein Zerf¨allungsk¨orper Z von g u ¨ber L vom Grad [Z : L] ≤ (n − 1)! . Gleichzeitig dient Z als Zerf¨allungsk¨orper von f u ullt nach Satz ¨ber K und erf¨ 6.4 [Z : K] ≤ n! . Nach Satz 6.3 kann Z/K nur algebraisch sein. Es bleibt noch die Eindeutigkeit von Z zu zeigen. Da Z nach Konstruktion u ¨ber K von den n Wurzeln von f erzeugt wird, also durch schrittweise einfache Erweiterungen, l¨asst sich auf jeden einzelnen dieser Erweiterungsschritte die Eindeutigkeitsaussage der S¨atze 6.6 bzw. 6.7 anwenden. Bleibt noch zu rechtfertigen, dass sich die gefundenen Isomorphismen jeweils auf die n¨ achsth¨ ohere Stufe fortsetzen lassen. Dies ist ein wichtiges Prinzip, welches wir so oft verwenden werden, dass daf¨ ur ein eigener Satz gerechtfertigt ist.
6.2.3 Fortsetzung von Isomorphismen. Exakte Sequenzen Satz 6.9 Seien k ⊂ K und l ⊂ L K¨orper, ρ : k → l K¨ orperisomorphismus, k[x] bzw. l[y] Polynomringe, a ∈ K und b ∈ L . Dann gilt: 1. ρ l¨asst sich zu einem Ringisomorphismus σ : k[x] → l[y] fortsetzen, sogar zu einem K¨orperisomorphismus σ : k(x) → l(y) , eindeutig bestimmt durch σ|k = ρ
und
σ(x) = y .
2. Es gibt genau dann eine Fortsetzung τ : k(a) → l(b)
von
ρ
mit
τ |k = ρ
und
wenn eine der beiden folgenden Bedingungen erf¨ ullt ist: • a und b sind beide transzendent u ¨ber k bzw. l .
τ (a) = b ,
151
6 K¨orper und K¨orpererweiterungen
• a und b sind beide algebraisch u ¨ber k bzw. l , und der Isomorphismus σ der Polynomringe bildet die irreduziblen Polynome von a und b aufeinander ab, d.h. erf¨ ullt σ(pa,k (x)) = pb,l (y) . Der Beweis des ersten Teils erfolgt durch direkte Angabe von σ : In jedem Polynom aus k[x] wird x durch y ersetzt und jeder Koeffizient durch sein ρ-Bild. Das ist die einzige M¨oglichkeit, die mit den Bedingungen an σ vertr¨ aglich ist, und die Fortsetzung auf k(x) erh¨alt man wieder aus Satz 3.7. Dass die Bedingungen des zweiten Teils notwendig sind, zeigt eine direkte Rechnung: Anwendung von τ auf die Gleichung pa,k (a) = 0 muss eine ebenfalls irreduzible normierte algebraische Gleichung f¨ ur b ergeben, und τ −1 leistet dasselbe f¨ ur die umgekehrte Richtung. Bleibt zu zeigen, dass die Bedingungen hinreichend sind; im Fall transzendenter a und b ist das klar, da dann k(a) ∼ = l(b) = k(x) durch σ isomorph auf l(y) ∼ abgebildet wird. Im algebraischen Fall schreiben wir kurz p := pa,k (x) ,
q := pb,l (y)
und P bzw. Q f¨ ur die davon in k[x] bzw. l[y] erzeugten Ideale. Dann ist nach Voraussetzung σ(P ) = Q und σ −1 (Q) = P . Bezeichnet man mit κ den kanonischen Einsetzungshomomorphismus l[y] → l[b] ∼ = l[y]/Q , so hat der (surjektive) zusammengesetzte Ringhomomorphismus κ ◦ σ : k[x] → l[b] den genauen Kern P . Nach dem Homomorphiesatz f¨ ur Ringe induziert dieser also einen Isomorphismus τ : k[x]/P ∼ = k[a] → l[b] . 2 In der griffigen Bildersprache der kommutativen Diagramme l¨ asst sich dieser Beweis folgendermaßen beschreiben: {0} → P → k[x] → k[a] → {0} ↓ ↓ ↓ {0} → Q → l[y] → l[b] → {0}
(6.1)
In den Zeilen dieses Diagramms stehen von links nach rechts zun¨ achst zwei Inklusionsabbildungen, dann der Einsetzungshomomorphismus und schließlich die Projektion auf den trivialen Ring {0} . Diese Zeilen sind sogenannte exakte Sequenzen, und damit ist gemeint, dass f¨ ur jeden der beteiligten Ringe das Bild des
152
6.2 Algebraische K¨orpererweiterungen
von links ankommenden Homomorphismus der Kern des nach rechts ausgehenden Homomorphismus ist. Die Exaktheit von {0} → R → S heißt also nur, dass der (Ring-) Homomorphismus R → S injektiv ist, und die Exaktheit von R → S → {0} bedeutet, dass R → S surjektiv ist. Die Exaktheit der Zeilen in (6.1) heißt nach dem Homomorphiesatz f¨ ur Ringe nichts anderes als k[a] ∼ = k[x]/P bzw. ∼ l[b] = l[y]/Q . Der mittlere vertikale Pfeil des Diagramms ist der Isomorphismus σ , der linke vertikale Pfeil seine Restriktion auf P (ebenfalls Isomorphismus), und wir haben im letzten Teil des Beweises daraus die Existenz eines dritten Isomorphismus gezeigt, der als rechter vertikaler Pfeil das ganze Diagramm kommutativ macht. Von den speziellen Eigenschaften der hier verwendeten Ringe bzw. K¨orper ist dieser Schluss unabh¨angig; was wir eigentlich gezeigt haben, ist ein sehr allgemeiner Satz u ¨ber kommutative Diagramme von Homomorphismen: Satz 6.10 Im folgenden kommutativen Diagramm aus Homomorphismen abelscher Gruppen (oder kommutativer Ringe, R und A nicht notwendig mit 1) {0} → R → S → T → {0} ↓ ↓ {0} → A → B → C → {0} seien die Zeilen exakte Sequenzen und die vertikalen Pfeile Isomorphismen. Dann l¨asst sich das Diagramm durch einen weiteren vertikalen Isomorphismus T
→
C
zu einem kommutativen Diagramm vervollst¨andigen.
6.2.4 Irreduzibilit¨ at. Reduktion modulo p Bisher kennen wir als konkrete Beispiele von K¨ orpererweiterungen endlichen Grades neben der trivialen Erweiterung K/K nur quadratische K¨ orpererweiterungen. Das liegt daran, dass wir noch kein einfaches Entscheidungsverfahren zur Verf¨ ugung haben, ob ein vorgelegtes Polynom vom Grad n > 2 irreduzibel ist oder nicht. Nat¨ urlich h¨angt die Beantwortung dieser Frage vom Grundk¨ orper ab; wir beschr¨anken uns hier auf den Grundk¨orper Q der rationalen Zahlen. Durch Multiplikation mit einer Konstanten, d.h. ohne die Nullstellen bzw. die Faktorzerlegung zu ¨andern, k¨onnen wir stets erreichen, dass das fragliche Polynom f (x) ∈ Q[x] sogar ∈ Z[x] ist und teilerfremde Koeffizienten besitzt. F¨ ur f = 0 kann man sogar erreichen, dass der f¨ uhrende Koeffizient positiv ist; solche Polynome nennt man primitiv. Nach Gauß gilt der
153
6 K¨orper und K¨orpererweiterungen
Hilfssatz 6.11 Das Produkt zweier primitiver Polynome ist primitiv. Sind n¨amlich f, g ∈ Z[x] primitiv, so ist gewiss f g ∈ Z[x] mit positivem f¨ uhrenden Koeffizienten. Angenommen, f g w¨ are nicht primitiv, so h¨ atten die Koeffizienten von f g einen echten gemeinsamen Teiler, insbesondere also einen Primteiler p . Das modulo p reduzierte Polynom ( f g mod p ) ∈ Fp [x] , welches aus f g dadurch entsteht, dass man alle Koeffizienten durch ihre Restklasse mod p ersetzt, w¨are also das Nullpolynom. Nun ist auch Fp [x] ein Integrit¨atsbereich und die Reduktion modulo p ein Ringhomomorphismus Z[x] → Fp [x] , darum ist f mod p oder g mod p das Nullpolynom, die Koeffizienten von f oder von g m¨ ussen also mindestens den gemeinsamen Teiler p haben im Widerspruch zur Annahme. 2 Folgerung 6.12 zibel.
1. Ein in Z[x] irreduzibles Polynom ist auch in Q[x] irredu-
2. Z[x] ist — obwohl kein Hauptidealring — ein faktorieller Ring. 3. In Q[x] gelte die Zerlegung f = gh , f, h ∈ Z[x] primitiv. Dann ist auch g ∈ Z[x] und primitiv. Zum Beweis von 1. darf man das in Z[x] irreduzible f o.B.d.A. als primitiv annehmen. G¨abe es f¨ ur f eine nichttriviale Zerlegung in Q[x], so darf man diese in der Form f = rgh
mit
r ∈ Q , g , h ∈ Z[x]
primitiv
ansetzen. Nach 6.11 ist gh primitiv, also = f im Widerspruch zur Annahme. 2. und 3. lassen sich ganz ¨ahnlich beweisen. 2 Satz 6.13 (Eisenstein) Das Polynom f (x) = an xn + . . . + a1 x + a0 ∈ Z[x] ist in Q[x] irreduzibel, wenn eine Primzahl p existiert, welche p an ,
p | aj ∀ j = 0, . . . , n − 1 ,
p2 a0
erf¨ ullt. Zum Beweis nehmen wir an, f sei zerlegbar in gh . Nach der Folgerung d¨ urfen wir sogar annehmen, dass g und h in Z[x] liegen. Die Reduktion modulo p zeigt g(x) h(x) ≡ an xn mod p ,
154
6.3 Der algebraische Abschluss
dass also g und h mod p von der Form bxk bzw. cxn−k sein m¨ ussen. Insbesondere sind die konstanten Glieder von g und h beide durch p teilbar, also deren Produkt a0 durch p2 teilbar, Widerspruch. 2 Damit k¨onnen wir unser Spektrum an Beispielen algebraischer Zahlk¨ orper erheblich erweitern. Es ist nun klar, dass alle Polynome xn −d in Q[x] irreduzibel sind, f¨ ur die d ∈ Z einen einfachen Primfaktor p besitzt, also mit p | d, p2 d . Nach Satz 6.6 gilt somit beispielsweise √ n [Q( 2) : Q] = n .
6.3 Der algebraische Abschluss 6.3.1 Ein Endlichkeitsprinzip Satz 6.14 Sei L/K eine K¨ orpererweiterung. Ein Element a ∈ L ist algebraisch u ¨ber K genau dann, wenn ein endlichdimensionaler K-Vektorraum V ⊆ L existiert mit aV ⊆ V , d.h. av ∈ V ∀ v ∈ V . Beweis: Wenn a algebraisch u ¨ber K ist, nehme man einfach V := K(a) . Wenn andererseits ein endlichdimensionales V mit der angegebenen Eigenschaft existiert, w¨ahle man eine K-Basis v1 , . . . , vn von V und beschreibe die Operation uglich dieser Basis: von a auf V durch eine Matrix (bij ) bez¨ a vi =
n
bij vj ,
j=1
alle bij ∈ K
=⇒
0 =
(bij − δij a) vj
∀i
=⇒
j
det(bij − δij x) ∈ K[x] vom Grad n mit Nullstelle a , also ist a algebraisch u ¨ber K . 2 Aus diesem Satz folgen viele n¨ utzliche Informationen, die wir nat¨ urlich zum Teil schon kennen (vgl. Satz 6.3): Folgerung 6.15
1. Jede K¨ orpererweiterung endlichen Grades ist algebraisch.
2. Sind a und b algebraisch u ur b = 0 auch ¨ber K , so sind a ± b, ab und f¨ u ¨ber K algebraisch.
a b
3. Ist a algebraisch u ¨ber K und b algebraisch u ¨ber K(a) , so ist b auch algebraisch u ¨ber K . 4. Ist L algebraische K¨ orpererweiterung von K und a algebraisch u ¨ber L , so ist a auch algebraisch u ¨ber K .
155
6 K¨orper und K¨orpererweiterungen
5. Wenn die K¨orpererweiterung L/K von algebraischen Elementen erzeugt wird, ist sie algebraisch. Um 2. zu begr¨ unden, w¨ahle man endlich-dimensionale Vektorr¨ aume V , W ⊂ L , die gem¨aß Satz 6.14 a-invariant bzw. b-invariant sind. Zun¨ achst u ¨berlege man sich, dass f¨ ur b = 0 aus bW ⊆ W sogar bW = W
und
b−1 W = W
folgt und dass alle Produkte vw , v ∈ V , w ∈ W , einen endlich-dimensionalen K-Vektorraum V W in L erzeugen. Dieser ist invariant unter Multiplikation mit a und b ; der Satz zeigt somit die 2. Behauptung. F¨ ur die 3. Behauptung sei W ein b-invarianter endlich-dimensionaler K(a)-Vektorraum; dann ist W auch ein endlich-dimensionaler K-Vektorraum. Bei 4. beachte man schließlich, dass a schon algebraisch u orper M von L sein muss: ¨ber einem endlich erzeugten Teilk¨ Man w¨ahle etwa M = K(a1 , . . . , an ) , wo die aj die Koeffizienten des irreduziblen Polynoms f¨ ur a u onnen wir etwa ¨ber L sind. Da alle aj algebraisch u ¨ber K sind, k¨ mit Behauptung 2 oder 3 und Induktion u ¨ber n einsehen, dass M/K endlichen Grad haben muss, also auch M (a)/K ; nach 1. ist darum a algebraisch u ¨ber K . 2
6.3.2 Der Fundamentalsatz der Algebra“ ” So wird der folgende Satz genannt, den wir schon in Abschnitt 3.4.3 erw¨ ahnt haben, und der u ¨blicherweise in der Funktionentheorie bewiesen wird. Satz 6.16 Jedes nichtkonstante Polynom p ∈ C[x] besitzt in C eine Nullstelle. Da zur Konstruktion von C topologische Methoden verwendet werden, u ¨berrascht es nicht weiter, dass rein algebraische Methoden zum Beweis nicht ausreichen. Man kann aber durchaus mit sehr bescheidenen Stetigkeitsbetrachtungen und Betragsabsch¨atzungen auskommen (z.B. Terkelsen [Te] 1976, offenbar Wiederentdeckung eines 150 Jahre ¨alteren beweises von Argand, vgl. [Z]): Angenommen, das nichtkonstante komplexe Polynom p habe keine Nullstellen, dann w¨ achst |p(z)| gleichm¨aßig gegen ∞ mit z → ∞ , nimmt also in einem Punkt z0 sein Betragsminimum an. Verm¨oge einer Translation z → z + z0 darf man o.B.d.A. annehmen, dass dieses Minimum |a| = 0 im Punkt 0 angenommen wird und dass p(x) = a + b xn + xn+1 Q(x) ,
a, b = 0 , Q ∈ C[x]
ist. Dass man in C n-te Wurzeln ziehen kann, ist elementar. Es existieren also w ∈ C und reelle t , 0 < t < 1 , mit wn = −
a b
und
t |w n+1 Q(tw)| < |a| .
156
6.3 Der algebraische Abschluss
F¨ ur diese gilt p(tw) = a (1 − tn ) + tn+1 wn+1 Q(tw) , nach der Dreiecksungleichung ist also |p(tw)| ≤ |a| (1 − tn ) + tn t |wn+1 Q(tw)| < |a| im Widerspruch zur Annahme u ¨ber das Minimum. 2 Sukzessive Division durch Linearfaktoren zeigt, dass jedes Polynom p ∈ C[x] sogar in Linearfaktoren zerf¨allt und bezeichnet darum C als einen algebraisch ¨ abgeschlossener K¨ orper. Aquivalent dazu ist, dass C keine echten algebraischen Erweiterungen besitzt, da nach Satz 6.6.3 alle einfachen algebraischen K¨orpererweiterungen von C den Grad 1 haben m¨ ussen. Anders gesagt: Jedes u ¨ber C algebraische Element liegt bereits selbst in C . Insbesondere liegt jede algebraische Zahl (d.h. hier: algebraisch u orper Q ) bereits in C , ¨ber dem Primk¨ ¯ . Dieser ist und nach 6.15.2 bilden alle diese algebraischen Zahlen einen K¨ orper Q nach Folgerung 6.15.3 selbst algebraisch abgeschlossen und wird darum auch der algebraische Abschluss von Q genannt.
6.3.3 Existenz und Eindeutigkeit des algebraischen Abschlusses ¯ , die von der Analysis unNat¨ urlich h¨atte man gern eine Konstruktion von Q abh¨angig ist, sowie eine Verallgemeinerung auf andere Grundk¨ orper. In der Tat l¨asst sich zu jedem K¨orper K eine im wesentlichen eindeutige maximale algebraische Erweiterung angeben: Satz 6.17 Jeder K¨orper K hat einen — bis auf K-Isomorphie eindeutig be¯ , d.h. einen algebraisch abgeschlossenen stimmten — algebraischen Abschluss K algebraischen Erweiterungsk¨orper von K . Im Beweis wollen wir uns auf den Fall beschr¨ anken, dass es in K[x] nur abz¨ ahlbar achsten Abschnitt werden wir sehen, viele Primpolynome pn , n ∈ N , gibt (im n¨ dass diese Voraussetzung sehr oft zutrifft). Dann konstruiert man induktiv K1 als Zerf¨allungsk¨orper von p1 u allungsk¨ orper von p2 u ¨ber K , K2 als Zerf¨ ¨ber K1 und allgemein Kn+1 als Zerf¨allungsk¨orper von pn+1 u alt so eine ¨ber Kn . Man erh¨ aufsteigende Kette K ⊆ K1 ⊆ K2 ⊆ . . . ⊆ Kn ⊆ . . . von K¨orpererweiterungen, deren Vereinigung " ¯ := Kn K n∈N
6 K¨orper und K¨orpererweiterungen
157
ein K¨orper ist, in dem s¨amtliche pn in Linearfaktoren zerfallen. Nach Konstrukti¯ genau alle Elemente, die u on enth¨alt K ¨ber K algebraisch sind, muss also ein algeallungsk¨ orper braischer Abschluss von K sein. Nach Satz 6.8 ist jedes Kn als Zerf¨ von p1 p2 · . . . · pn bis auf K-Isomorphie eindeutig bestimmt. G¨ abe es also einen zweiten algebraischen Abschluss A von K , so m¨ usste dieser ebenso Vereinigung von Zerf¨allungsk¨ orpern sein, die K-isomorph zu Kn sind; man k¨ onnte dann einen ¯ → A induktiv u K-Isomorphismus K ¨ber die K-Isomorphismen der Kn auf die entsprechenden Unterk¨orper von A definieren.— Wenn die hier angenommene Abz¨ahlbarkeitsvoraussetzung nicht zutrifft, muss man st¨ arkere mengentheoretische Gesch¨ utze wie transfinite Induktion und den Wohlordnungssatz bzw. das Auswahlaxiom verwenden, aber im u auft der Beweis a ¨brigen verl¨ ¨hnlich. 2
6.3.4 Abz¨ ahlbarkeitseigenschaften Die Anwendung des ersten Cantorschen Diagonalverfahrens, das wir von dem u ur Q her als bekannt voraussetzen, beweist sehr ¨blichen Abz¨ahlbarkeitsbeweis f¨ einfach und Schritt f¨ ur Schritt den Satz 6.18 Sei K ein abz¨ ahlbarer K¨orper. Dann sind ebenso abz¨ ahlbar 1. die Polynomringe K[x] und K[x1 , . . . , xn ] , 2. deren Quotientenk¨ orper K(x) und K(x1 , . . . , xn ) , 3. alle endlich erzeugten K¨orpererweiterungen K(a1 , . . . , an ) , 4. alle von abz¨ahlbaren Mengen M erzeugten K¨ orpererweiterungen K(M ) , ¯. 5. der algebraische Abschluss K ¯ und alle algebraischen Abschl¨ Q usse Fp der endlichen Primk¨ orper sind also abz¨ ahlbar, ebenso der K¨orper Q(x) aller algebraischen Funktionen in x mit algebraischen Koeffizienten. Da nach dem zweiten Cantorschen Diagonalverfahren R und C u ¨berabz¨ahlbar sind, folgt daraus andererseits — wie schon in Abschnitt 6.1.2 erw¨ahnt — die Existenz transzendenter Zahlen; es muss in R und C sogar u angigen Elementen geben, ¨berabz¨ahlbare Mengen von u ¨ber Q algebraisch unabh¨ vgl. Abschnitt 6.5.1
6.4 Normalit¨ at und Separabilit¨ at 6.4.1 Normale K¨ orpererweiterungen √ Aus Abschnitt 6.2.4 wissen wir, dass Q( 3 2) ein kubischer Zahlk¨ orper ist, d.h. 3 vom Grad 3 u ¨ber Q . Das irreduzible Polynom x − 2 seines erzeugenden Ele√ ments hat allerdings nur eine reelle Nullstelle, zerf¨ allt also nicht im K¨ orper Q( 3 2)
158
6.4 Normalit¨ at und Separabilit¨ at
in √ Linearfaktoren, sein Zerf¨allungsk¨orper ist erst der K¨ orper sechsten Grades 3 Q( 2, ζ3 ) . Aus vielen Gr¨ unden, die im n¨achsten Kapitel besonders deutlich werden, ist es g¨ unstig, wenn eine algebraischen K¨ orpererweiterung gleichzeitig der Zerf¨allungsk¨orper der irreduziblen Polynome ihrer Erzeugenden ist. Dieser Fall kann folgendermaßen charakterisiert werden: Satz 6.19 (mit Definition) Sei L/K eine algebraische K¨orpererweiterung end¯ . Diese heißt normal, wenn eine der folgenden ¨ lichen Grades, L ⊂ K aquivalenten Bedingungen erf¨ ullt ist: 1. Jedes irreduzible Polynom p ∈ K[x] , das in L eine Nullstelle besitzt, zerf¨ allt in L[x] vollst¨andig in Linearfaktoren. 2. L ist Zerf¨ allungk¨orper eines Polynoms aus K[x] . ¯ auf einen anderen Erweiterungsk¨ 3. Jeder K-Isomorphismus von L ⊆ K orper ¯ M ⊆ K von K ist ein Automorphismus, d.h. erf¨ ullt L = M . ¨ Beweis der Aquivalenz: 1. ⇒ 2. : Da L endlichen Grad u ¨ber K hat, ist L von endlich vielen a1 , . . . , am u ¨ber K erzeugt. Deren irreduzible Polynome p1 , . . . , pm ∈ K[x] zerfallen nach Voraussetzung in L[x] in Linearfaktoren, darum ist L Zerf¨allungsk¨orper des Polynoms p1 · . . . · pm ∈ K[x] . 2. ⇒ 3. : Sei L der Zerf¨allungsk¨orper von f ∈ K[x] und f = p1 · . . . · pm ¯ ein Kdie Primfaktorzerlegung von f in K[x] , ferner sei σ : L → M ⊂ K Isomorphismus von L , dazu a ∈ L eine Nullstelle eines der Primfaktoren pj . Wegen σ|K = id gilt pj (σ(a)) = 0 ,
also
σ(a) ∈ L ,
denn L enth¨alt alle Nullstellen von f . Da L/K von den Nullstellen von f erzeugt wird, ist σ(L) = M ⊆ L , wegen [M : K] = [L : K] sogar M = L . Eigentlich haben wir den ersten Teil des folgenden Hilfssatzes bewiesen; der zweite Teil ist noch einfacher, aber ebenso n¨ utzlich, wie wir gleich sehen werden. Hilfssatz 6.20 Sei p ∈ K[x] Primpolynom mit Nullstellen a1 , . . . , an in einem ¯ , dazu σ ein K-Isomorphismus von K¨orpererweiterunalgebraischen Abschluss K gen L → M , die beide K(a1 , . . . , an ) ⊇ K enthalten. 1. σ permutiert die a1 , . . . , an . ur j = 1, . . . , n . 2. p ist irreduzibles Polynom f¨ ur alle aj , d.h. p = paj ,K f¨ Zum Beweis von 6.19, Teil 3. ⇒ 1. , sei p ∈ K[x] ein Primpolynom mit einer Nullstelle a ∈ L und einer anderen Nullstelle b . Nach Satz 6.6 und dem zweiten Teil des Hilfssatzes ist K(a) ∼ = K(b) , = K[x] / < p > ∼
159
6 K¨orper und K¨orpererweiterungen
mit einem Isomorphismus σ : K(a) → K(b) , der σ(a) = b erf¨ ullt; dieser l¨ asst sich u ¨ber schrittweise einfache algebraische Erweiterungen mit Hilfe von Satz ¯ fortsetzen. Nach 6.9 zu einem Isomorphismus von L auf einen K¨ orper M ⊂ K Voraussetzung muss M = L sein, somit ist auch b ∈ L . 2 Bemerkungen: 1. Wenn L normale K¨orpererweiterung von K ist, dann auch von jedem Zwischenk¨orper F , K ⊆ F ⊆ L . 2. Jede K¨orpererweiterung L/K endlichen Grades ist in einer normalen K¨ orpererweiterung N/K enthalten; man adjungiere zu L s¨ amtliche Nullstellen aller irreduziblen Polynome pa,K , wenn a die (o.B.d.A. endlich vielen) erzeugenden Elemente von L/K durchl¨ auft. 3. Der Begriff Normalit¨at“ l¨asst sich auf algebraische Erweiterungen unendli” chen Grades ausdehnen: Die Eigenschaften 1. und 3. des Satzes behalten auch f¨ ur Erweiterungen unendlichen Grades ihren Sinn und sind nach wie vor ¨ aquivalent: Bei algebraischen Erweiterungsk¨orpern sind K-Isomorphismen durch alle ihre Restriktionen auf Teilk¨orper endlichen Grades u ¨ber K bereits eindeutig bestimmt. Nur die zweite Eigenschaft muss umformuliert werden; L ist dann Vereinigung von Zerf¨allungsk¨orpern.
6.4.2 Separabilit¨ at Definition: L/K sei algebraische K¨orpererweiterung, a ∈ L . 1.
a heißt separabel u ¨ber K , wenn sein irreduzibles Polynom pa,K nur ¯ hat. einfache Nullstellen in K
2.
L heißt separabel u ¨ber K , wenn L nur u ¨ber K separable Elemente besitzt.
3. K heißt vollkommener K¨ orper, wenn K nur separable algebraische Erweiterungen besitzt. Andernfalls spricht man von inseparablen Elementen bzw. K¨ orpererweiterungen. Satz 6.21 K¨orper der Charakteristik 0 sowie endliche K¨orper sind vollkommen. Der Beweis zerf¨allt wie der Satz in zwei Teile; sei zun¨ achst car (K) = 0 und f (x) = pa,K (x) das irreduzible Polynom eines u ¨ber K algebraischen Elements a , grad f = n > 0 . F¨ ur seine Derivation (s. Abschnitt 3.3.4) gilt f = 0 , denn nach (3.4) ist f (x) = xn + . . .
⇒
f (x) = n xn−1 + . . . ,
wobei hier der Koeffizient n als Summe von n Einsen in K zu lesen ist. Dieser Koeffizient ist aber = 0 wegen car (K) = 0 und grad f > 0 , also kann nicht
160
6.4 Normalit¨ at und Separabilit¨ at
f = 0 sein. H¨atte nun f mehrfache Nullstellen, so h¨ atten f und f einen Line¯ arfaktor in K[x] gemeinsam (warum?), d.h. der ggT(f, f ) w¨ are nichtkonstant. Da dieser ggT aber bereits Element von K[x] ist, h¨ atte f einen echten Teiler im Widerspruch zur Irreduzibilit¨atsvoraussetzung, also kann f keine mehrfache Nullstelle haben, K ist vollkommen. F¨ ur endliche K¨orper wissen wir, dass jedes algebraische Element in einem K¨ orper F mit pn Elementen liegt. 0 ist trivialerweise separabel, und jedes andere a ∈ F liegt in der zyklischen Gruppe F∗ (Satz 4.3), ist also Nullstelle des Polynoms f (x) = xp
n −1
− 1,
dessen pn −1 Nullstellen gerade alle Elemente von F∗ sind, demnach alle paarweise verschieden. F¨ ur alle K¨orpererweiterungen K/Fp muss das irreduzible Polynom von a u ber K ein Teiler von f sein, kann also auch nur einfache Nullstellen haben. ¨ 2 Um ein Beispiel f¨ ur eine inseparable K¨orpererweiterung L/K zu finden, muss man also unter den K¨orpern mit car (K) = p suchen, die u orper trans¨ber dem Primk¨ zendent sind. Das einfachste Beispiel daf¨ ur ist der rationale Funktionenk¨ orper K = Fp (t) . Das irreduzible Polynom f des inseparablen Elements muss zudem f = 0 erf¨ ullen (vgl. den oben gef¨ uhrten Beweis). Dies ist erf¨ ullt f¨ ur √ p f (x) = xp − t = (x − a)p , a = t ; wie im Kap. 4 schon mehrfach benutzt, gilt n¨ amlich in K¨ orpern der Charakteristik p die stark vereinfachte binomische Formel ( x + y )p = xp + y p ,
(6.2)
und weil a sicher kein Element von Fp [t] ist, kann f keinen echten Teiler in K[x] haben, ist also irreduzibel. a und L sind folglich inseparabel u ¨ber K .— Inseparable K¨orpererweiterungen haben einige Bedeutung f¨ ur die algebraische Geometrie (etwa f¨ ur den Beweis des in Abschnitt 5.5.2 erw¨ ahnten Satzes von Hasse-Weil), werden aber f¨ ur uns im folgenden keine Rolle spielen. F¨ ur sp¨ atere Zwecke n¨ utzlich ist folgender einfache Satz 6.22 L/K sei algebraische K¨orpererweiterung vom Grad n . Sie ist sepa¯ rabel genau dann, wenn n paarweise verschiedene K-Isomorphismen von L in K existieren. Zum Beweis u ¨berlege man sich zun¨achst, dass im Fall einer inseparablen Erweiterung mindestens ein erzeugendes Element a als inseparabel u ahlt wer¨ber K gew¨ den kann. Ferner gen¨ ugt es, den Satz f¨ ur einfache K¨ orpererweiterungen L = K(a)
161
6 K¨orper und K¨orpererweiterungen
zu beweisen, denn bei schrittweiser Adjunktion mehrerer Erzeugender multiplizieren sich die K¨orpergrade ebenso wie die Anzahl der Isomorphismen. Jeder K-Isomorphismus von K(a) ist aber eindeutig bestimmt durch sein Bild von a , und f¨ ur dieses Bild kommen nach Hilfssatz 6.20 genau alle Nullstellen aj (o.B.d.A. ¯ ∈ K ) in Frage. Diese Anzahl ist genau dann gleich n = grad pa,K , wenn a separabel u ¨ber K ist.2 Das gleiche Argument zeigt: Folgerung 6.23 Die algebraische K¨ orpererweiterung L von K ist genau dann separabel u ¨ber K , wenn sie von separablen Elementen erzeugt wird.
6.4.3 Der Satz vom primitiven Element Satz 6.24 Jede separable K¨orpererweiterung L/K endlichen Grades ist einfach, d.h. besitzt ein primitives Element a ∈ L mit L = K(a) . Beweis: Wenn K — und damit auch L — endlich sind, kann man a als erzeugendes Element der zyklischen Gruppe L∗ w¨ahlen (Satz 4.3). Wir setzen darum o.B.d.A. voraus, dass K und L unendliche K¨orper sind, dass L = K(a1 , a2 , . . . , ar ) ist, und f¨ uhren den Beweis durch Induktion u ur r = 1 ist nichts zu zeigen. F¨ ur ¨ber r . F¨ r > 1 d¨ urfen wir als Induktionsvoraussetzung annehmen, dass K(a1 , . . . , ar−1 ) = K(c) einfache K¨orpererweiterung ist. Mit b := ar ist also nur K(b, c) = K(a) zu beweisen, d.h. die Existenz eines primitiven Elements a f¨ ur den Fall r = 2 zu zeigen. Dazu seien f und g die irreduziblen Polynome f¨ ur b bzw. c in K[x] und Z der Zerf¨allungsk¨orper von f g u ¨ber K , in dem also f (x) = (x − b1 ) · . . . · (x − bn ) g(x) = (x − c1 ) · . . . · (x − cm ) jeweils in paarweise verschiedene Linearfaktoren zerfallen (Separabilit¨ at!); o.B.d.A. seien b = b1 , c = c1 . Da K unendlich ist und die bi , cj jeweils paarweise verschieden sind, gibt es sicher ein d ∈ K mit bi + dcj = b + dc
∀ i = 1, . . . , n , j = 2, . . . , m .
Dieses a := b + cd ist unser Kandidat f¨ ur das primitive Element: Wenn f (a − dx) = (a − dx − b1 ) · . . . · (a − dx − bn ) und g(x) einen (o.B.d.A. normierten) Linearfaktor gemeinsam haben, muss dieser von der Form (x − cj ) = (−d)−1 (a − dx − bi )
162
6.5 Transzendente K¨orpererweiterungen
sein, d.h. man hat eine Gleichheit dcj = a − bi , die nach Konstruktion von a nur f¨ ur i = j = 1 auftreten kann. Demnach ist (x − c) = ggT(f (a − dx), g(x))
in Z[x] ,
und da beide Polynome f (a − dx) und g(x) in K(a)[x] liegen, muss das auch f¨ ur diesen ggT gelten: Andernfalls w¨aren f (a − dx) und g(x) teilerfremd in K(a)[x] , dann aber auch in Z[x] , denn in beiden k¨onnte man 1 als Linearkombination von f (a − dx) und g(x) schreiben. Daher ist c ∈ K(a) ⇒ b ∈ K(a) ⇒ L = K(b, c) ⊆ K(a) ⊆ L , es muss also sogar L = K(a) sein, wie behauptet. 2
6.5 Transzendente K¨ orpererweiterungen 6.5.1 Algebraische Unabh¨ angigkeit Eine naheliegende Verallgemeinerung des Transzendenzbegriffs ist uns bereits bei den elementarsymmetrischen Polynomen in Satz 3.14 begegnet. Definition: Die Elemente a1 , a2 , . . . , an der K¨ orpererweiterung L/K heißen algebraisch unabh¨ angig u ¨ber K , wenn der Einsetzungshomomorphismus K[x1 , . . . , xn ] → L :
alle xj → aj
injektiv ist. Dann enth¨alt L einen Unterk¨orper K(a1 , . . . , an ) , der zum rationalen Funktionenk¨orper K(x1 , . . . , xn ) isomorph ist. Wenn sogar Elemente a1 , . . . , an ∈ L existieren, die u angig sind und f¨ ur die ¨ber K algebraisch unabh¨ L = K(a1 , . . . , an ) ist, heißt L eine rein transzendente Erweiterung von K . ∼ Q(x) ), w¨ ahrend R sicher keine rein tranSo ist Q(e) rein transzendent (und = szendente Erweiterung von Q ist. Ob eine gegebene endlich erzeugte Erweiterung von K rein transzendent ist oder nicht, ist h¨ aufig nicht leicht zu entscheiden: F¨ ur zwei Variable x, y u ¨ber K sind die drei Erzeugenden von √ L = K(x, y, x + y) nicht algebraisch unabh¨angig. Trotzdem ist L rein transzendent u ¨ber K , weil √ man nat¨ urlich mit y und x + y als Erzeugenden auskommt. Wenn K der Primk¨orper ist, lassen wir bei den Begriffen algebraisch unabh¨ angig“ ” und rein transzendent“ wie immer die Angabe des Grundk¨ orpers weg. Ebenso ” werden wir mit den nun einzuf¨ uhrenden Begriffen verfahren.
163
6 K¨orper und K¨orpererweiterungen
6.5.2 Transzendenzbasis und Transzendenzgrad Eine Untermenge M der K¨orpererweiterung L von K nennen wir eine Transzendenzbasis von L/K, wenn je endlich viele paarweise verschiedene a1 , . . . , an ∈ M algebraisch unabh¨angig u aquivalenten Ei¨ber K sind und M eine der folgenden ¨ genschaften besitzt: • M ist maximal. • L ist algebraische K¨orpererweiterung von K(M ) . Wie die Basen von Vektorr¨aumen sind auch Transzendenzbasen niemals eindeutig bestimmt — ausgenommen f¨ ur algebraische K¨ orpererweiterungen, wo die Transzendenzbasis nat¨ urlich leer ist —, wohl aber ihre M¨ achtigkeit, die wir als Transzendenzgrad der K¨orpererweiterung bezeichnen, kurz trg L/K . Dass trg L/K nicht von der Auswahl der Transzendenzbasis abh¨ angt, wollen wir nur f¨ ur den Fall endlichen Transzendenzgrads zeigen, und zwar ganz analog zum Steinitzschen Austauschsatz der linearen Algebra: orHilfssatz 6.25 Seien a1 , . . . , an ∈ L algebraisch unabh¨angig u ¨ber dem Unterk¨ per K ⊂ L und sei t ∈ L algebraisch u ber K(a , . . . , a ) und transzendent ¨ 1 n u ¨ber K . Dann l¨asst sich eines der aj , o.B.d.A. a1 , durch t ersetzen, so dass t, a2 , . . . , an algebraisch unabh¨angig u ¨ber K sind und a1 algebraisch u ¨ber K(t, a2 , . . . , an ) ist. Beweis. Da t transzendent u ¨ber K und algebraisch u ¨ber K(a1 , . . . , an ) ist, gibt es eine algebraische Gleichung f (a1 , . . . , an , t) = 0
(6.3)
ur f¨ ur t mit einem f = 0 , f ∈ K(x1 , . . . , xn )[y] , Polynom in der Variablen y , f¨ die dann t eingesetzt wird, und mit Koeffizienten, welche rationale Funktionen u ur die dann jeweils a1 , . . . , an einzusetzen ¨ber K in Variablen x1 , . . . , xn sind, f¨ ist. Verm¨oge Multiplikation mit dem Hauptnenner dieser Koeffizientenfunktionen darf man sogar annehmen, dass f ∈ K[x1 , . . . , xn , y] Polynom in allen diesen Variablen ist. Da t nicht algebraisch u ¨ber K ist, muss f wenigstens in einer der Variablen xj nichtkonstant sein, o.B.d.A. in x1 . Dann l¨ asst sich Gleichung (6.3) aber ber dem K¨ orper K(a2 , . . . , an , t) ebensogut als algebraische Gleichung f¨ ur a1 u ¨ lesen, was die zweite Behauptung beweist. W¨ aren nun a2 , . . . , an , t algebraisch abh¨angig, so g¨abe es daf¨ ur zwei M¨oglichkeiten: 1. Bereits a2 , . . . , an sind algebraisch abh¨ angig, Widerspruch zur algebraischen Unabh¨angigkeit von a1 , a2 , . . . , an .
164
6.5 Transzendente K¨orpererweiterungen
2. t ist algebraisch u ¨ber K(a2 , . . . , an ) . Dann ist nach Folgerung 6.15.3 auch a1 algebraisch u uhrt. 2 ¨ber K(a2 , . . . , an ) , was zum gleichen Widerspruch f¨ Benutzt man den Hilfssatz, um induktiv Transzendenzbasen gegeneinander auszutauschen, so ergibt sich Satz 6.26 Wenn eine K¨orpererweiterung L/K eine endliche Transzendenzbasis besitzt, so sind alle Transzendenzbasen endlich und gleichm¨achtig, und zwar mit trg L/K Elementen. Der K¨orper der rationalen Funktionen K(x1 , . . . , xn ) hat also den Transzendenzgrad n u ahlbaren Transzen¨ber K , der K¨orper R der reellen Zahlen hat u ¨berabz¨ denzgrad u ber Q (eine Konsequenz aus Satz 6.18.4), und f¨ u r die Zahl e ist ¨ trg Q(e)/Q = 1 , was wir aber erst am Ende des n¨achsten Kapitels beweisen werden; noch mehr als f¨ ur die Transzendenz gilt, dass Beweise f¨ ur algebraische Unabh¨ angigkeit mathematischer Naturkonstanten“ sehr schwer sind. ”
6.5.3 Linear disjunkte Erweiterungen Definition: Seien K und L zwei K¨orpererweiterungen des K¨ orpers k , beide in einem festen algebraisch abgeschlossenen K¨ orper Ω enthalten. Dann heißen K und L linear disjunkt u ¨ber k , wenn je endlich viele a1 , . . . , an ∈ K , welche u angig bleiben. ¨ber k linear unabh¨angig sind, auch u ¨ber L linear unabh¨ Scheinbar ist diese Definition asymmetrisch in K und L , darum ist zun¨ achst folgendes nachzupr¨ ufen: Hilfssatz 6.27 Seien K und L linear disjunkte K¨orpererweiterungen von k und seien b1 , . . . , bm ∈ L linear unabh¨angig u ¨ber k . Dann sind sie auch linear unabh¨angig u ¨ber K . Andernfalls g¨abe es a1 , . . . , am ∈ K , nicht alle = 0 , mit a1 b1 + . . . + am bm = 0 .
(6.4)
Dabei darf man annehmen, dass etwa a1 , . . . , an linear unabh¨ angig u ¨ber k sind und die u ¨brigen k-Linearkombinationen aj =
n i=1
cji ai ,
j = n + 1, . . . , m
165
6 K¨orper und K¨orpererweiterungen
dieser ersten n Koeffizienten. Gleichung (6.4) nimmt dann die Form 0 =
n j=1
a j bj +
m n j=n+1 i=1
cji ai bj =
n
bj +
j=1
m
cij bi
aj
i=n+1
an (Indexvertauschung in der Doppelsumme), und nach Definition m¨ ussen die Koeffizienten dieser a1 , . . . , an alle verschwinden im Widerspruch zu den Voraussetzungen u ¨ber die bj . 2 Linear disjunkte K¨orpererweiterungen weisen eine wichtige Querverbindung zur algebraischen Unabh¨angigkeit auf: Satz 6.28 K und L seien linear disjunkte K¨ orpererweiterungen von k , und b1 , . . . , bn ∈ L seien algebraisch unabh¨angig u ¨ber k . Dann sind b1 , . . . , bn auch algebraisch unabh¨angig u ¨ber K . Algebraisch unabh¨angig“ u ¨ber k heißt n¨amlich, dass außer 0 kein Polynom f ” u ber k in n Variablen existiert mit ¨ f (b1 , . . . , bn ) = 0 , bzw. dass alle Potenzprodukte der b1 , . . . , bn u angig sind. Nach ¨ber k linear unabh¨ der Disjunktheitsvoraussetzung sind diese Potenzprodukte sogar u ¨ber K linear unabh¨angig, demnach die b1 , . . . , bn algebraisch unabh¨ angig u ¨ber K . 2 F¨ ur zwei K¨orpererweiterungen K und L von k , beide in einem festen algebraisch abgeschlossenen K¨orper Ω gelegen, bezeichnen wir mit KL das Kompositum von K und L , d.h. den von L u ¨ber K (und ebenso von K u ¨ber L ) erzeugten K¨orper. Der letzte Satz hat eine offensichtliche Konsequenz: Satz 6.29 K und L seien zwei linear disjunkte K¨orpererweiterungen von k . Dann ist trg KL/k = trg K/k + trg L/k . Wenn einer der Transzendenzgrade unendlich ist, bleibt die Aussage trivialerweise richtig. Wie k¨onnte eine entsprechende Aussage f¨ ur K¨ orpergrade linear disjunkter algebraischer K¨orpererweiterungen aussehen? Zum Schluss sei noch eine analoge Aussage f¨ ur die Schachtelung transzendenter K¨ orpererweiterungen erw¨ ahnt. Satz 6.30
k ⊆ K ⊆ L seien K¨ orper. Dann gilt trg L/k = trg L/K + trg K/k .
166
6.6 Aufgaben
Der Beweis l¨asst sich auf Satz 6.29 zur¨ uckf¨ uhren, indem man eine Transzendenzbasis M f¨ ur L/K w¨ahlt und beachtet, dass K und k(M ) linear disjunkt u ¨ber k sind und trg L/K = trg k(M )/k erf¨ ullen. Eine eventuell erforderliche algebraische Erweiterung von Kk(M ) zu L ¨andert die Transzendenzgrade nicht. 2 Wenn dabei K/k algebraisch ist und somit den Transzendenzgrad 0 besitzt, ergibt sich insbesondere die Folgerung 6.31
k ⊆ K ⊆ L seien K¨ orper, K algebraisch u ¨ber k . Dann gilt trg L/k = trg L/K .
6.6 Aufgaben 1. Man zeige: √ Jede K¨orpererweiterung L/Q vom Grad 2 ist von der Form L = Q( d) mit d ∈ Z , d = 0 oder 1 . √ √ √ √ 2. Man [Q( −2, 2) : Q] = 4 . Außer Q( −2) und Q( 2) enth¨ alt √ √ beweise Q( −2, 2) noch einen weiteren quadratischen Zahlk¨ orper, n¨ amlich welchen? ¨ 3. Uberlegen Sie sich, dass alle Automorphismen eines K¨ orpers eine Gruppe bilden (mit der Hintereinanderausf¨ uhrung als Multiplikation). √ √ 4. Bestimmen √ Sie die Automorphismengruppen von Q( −2) , Q( 2) und von √ Q( −2, 2) . Welche Untergruppen H hat diese Automorphismengruppe? Welche Elemente bleiben fest bei der Operation aller Automorphismen? Welche Elemente bleiben fest bei der Operation aller Automorphismen einer Untergruppe H ? Vergleichen Sie Ihre Antworten mit Aufgabe 2 und formulieren Sie eine Vermutung! √ √ 5. Finden Sie ein Polynom f ∈ Q[x] mit Nullstelle 2 + 3 ! 6. Man f¨ uhre den Beweis von Folgerung 6.12.2. und 3. aus. 7. p sei eine Primzahl. Beweisen Sie, dass das Polynom xp−1 + xp−2 + . . . + x + 1 ∈ Q[x] irreduzibel ist. 8. Sei K ein K¨orper der Charakteristik p . Man zeige, dass x → xp einen Isomorphismus von K in sich definiert. Ist es immer ein Automorphismus? 9. K(a) sei eine einfache inseparable K¨ orpererweiterung des K¨ orpers K der Charakteristik p . Konstruieren Sie eine maximale separable K¨ orpererweiterung S von K mit K ⊆ S ⊆ K(a) n
und zeigen Sie, dass ein t ∈ S und ein n ∈ N existieren mit ap = t .
167 10. L/K sei eine algebraische K¨orpererweiterung. Man zeige, dass die Menge S aller u orper bildet. Wenn [L : K] ¨ber K separablen Elemente in L einen K¨ endlich ist, ist [L : S] eine Primpotenz. 11. Konstruieren Sie eine nicht einfache K¨ orpererweiterung endlichen Grades. 12. K sei ein K¨orper, K(x1 , . . . , xn ) der K¨ orper der rationalen Funktionen in den n Variablen xj , und s1 , . . . , sn seien die elementarsymmetrischen Funktionen in den xj . Aus Satz 3.14 wissen wir bereits, dass K(s1 , . . . , sn ) rein transzendent ist. Beweisen Sie, dass K(x1 , . . . , xn ) algebraische K¨ orpererweiterung von K(s1 , . . . , sn ) ist. 13. (Bezeichnungen wie eben) Beweise, dass die Gruppe der K(s1 , . . . , sn )Automorphismen von K(x1 , . . . , xn ) zur symmetrischen Gruppe Sn isomorph ist. 14. L und K seien linear disjunkte K¨orpererweiterungen von k . Man zeige L∩K = k . 15. L und K seien linear disjunkte algebraische K¨ orpererweiterungen von k . Man zeige [LK : K] = [L : k] , [LK : L] = [K : k] , [LK : k] = [L : k] · [K : k] . 16. L sei algebraische K¨orpererweiterung von K und R sei ein Ring mit K ⊂ R ⊂ L . Zeigen Sie, dass R ein K¨orper ist.
169
7 Galoistheorie
7 Galoistheorie 7.1 Der Hauptsatz der Galoistheorie 7.1.1 Die Galoisgruppe Sei L/K eine K¨ orpererweiterung. Die Menge der K-Isomorphismen σ : L → L von L in sich bildet eine Gruppe, die Automorphismengruppe Aut L/K der K¨ orpererweiterung, die auf L operiert (vgl. Abschnitt 2.6). F¨ ur jedes σ ∈ Aut L/K ebenso wie f¨ ur jede Untergruppe G ⊆ Aut L/K bilden Fix σ := { x ∈ L | σ(x) = x } bzw. Fix G := { x ∈ L | σ(x) = x ∀ σ ∈ G } Zwischenk¨orper zwischen K und L , die Fixk¨ orper von σ bzw. G ; man beachte, dass nach Definition der K-Isomorphismen K stets in diesen Fixk¨ orpern enthalten ist. Analog bildet f¨ ur alle Zwischenk¨orper M , K ⊆ M ⊆ L , die Menge Fix M := { σ ∈ Aut L/K | σ|M = id|M } eine Untergruppe von Aut L/K , die Fixgruppe von M . Das Ziel der Galoistheorie ist es, eine bijektive Beziehung zwischen Untergruppen von Aut L/K und Zwischenk¨orpern von L/K herzustellen und nutzbar zu machen. F¨ ur die Konstruktion von K¨orperautomorphismen werden wir systematischen Gebrauch von Satz 6.9 und Hilfssatz 6.20 machen; wie wir schon in Satz 6.22 gesehen haben, ist f¨ ur inseparable K¨orpererweiterungen L von K die Anzahl der verschiedenen ¯ kleiner als [L : K] , insbeK-Isomorphismen in den algebraischen Abschluss K sondere gilt also ord Aut L/K < [L : K] . In dem f¨ ur uns weit interessanteren Fall separabler Erweiterungen ist 6.22 gerade die erste Aussage im folgenden Satz 7.1 (mit Definition) Sei L/K eine separable K¨orpererweiterung vom Grad n = [L : K] ∈ N . Es existieren genau n K-Isomorphismen von L in einen ¯ , somit ist festgew¨ahlten algebraischen Abschluss K ord Aut L/K ≤ n . Folgende Aussagen sind ¨aquivalent: J. Wolfart, Einführung in die Zahlentheorie und Algebra, DOI 10.1007/978-3-8349-6498-4_7, © Vieweg+Teubner Verlag | Springer Fachmedien Wiesbaden GmbH 2011
170
7.1 Der Hauptsatz der Galoistheorie
1. Aut L/K hat genau n Elemente. 2. L/K ist normale K¨orpererweiterung. 3. Fix Aut L/K = K . Wenn diese Aussagen erf¨ ullt sind, nennt man die K¨orpererweiterung L/K eine Galoiserweiterung und Aut L/K ihre Galoisgruppe Gal L/K . ¯ annehmen. Dann folgt die Aquivalenz ¨ Wir d¨ urfen o.B.d.A. L ⊆ K der beiden ersten Aussagen direkt aus der Definition von normal“ (Satz 6.19) und aus der ” Angabe der Zahl der K-Isomorphismen. F¨ ur 1. ⇒ 3. nehmen wir an, es sei M := Fix Aut L/K . Dann ist offenbar Aut L/K = Aut L/M , also n ≤ [L : M ] , was aber nur f¨ ur M = K m¨ oglich ist. Zum Beweis von 3. ⇒ 2. sei G := Aut L/K und L = K(a) mit einem primitiven Element a ∈ L . Das Polynom (x − σ(a)) f (x) := σ∈G
zerf¨allt nach Konstruktion in L[x] in Linearfaktoren und hat als Koeffizienten die elementarsymmetrischen Funktionen der σ(a) . Diese sind G-invariant, liegen also nach Voraussetzung in K . Als Polynom in K[x] mit Nullstelle a ist f Vielfaches des irreduziblen Polynoms pa,K . Dieses muss dann auch in L[x] in Linearfaktoren zerfallen, L ist somit Zerf¨allungsk¨orper, daher normal. 2 Satz 7.2 L/K sei separable K¨orpererweiterung endlichen Grades und H eine Untergruppe von Aut L/K mit Fixk¨ orper M = Fix H . Dann ist die Erweiterung L/M separabel und normal mit Galoisgruppe Gal L/M = H . Zum Beweis beachte man, dass f¨ ur jedes a ∈ L das irreduzible Polynom pa,M ein Teiler von pa,K ist und darum keine mehrfachen Nullstellen haben kann; also ist L/M separabel. Die Normalit¨at erh¨ alt man a ur ein ¨hnlich wie oben: F¨ primitives Element a von L/K ist auch L = M (a) , und L ist Zerf¨ allungsk¨ orper des Polynoms (x − σ(a)) . f (x) := σ∈H
f hat H-invariante Koeffizienten, also ist sogar f ∈ M [x] . Aus pa,M | f folgt [L : M ] = grad pa,M ≤ grad f = ord H , und aus H ⊆ Aut L/M und Fix H = M folgt erst recht Fix Aut L/M = M , nach Satz 7.1 also Aut L/M = Gal L/M und ord H ≤ ord Gal L/M = [L : M ] .
171
7 Galoistheorie
Also muss u ¨berall das Gleichheitszeichen gelten, insbesondere gilt H = Gal L/M . Da der Schluss auf die Separabilit¨at von a u angig von den anderen ¨ber M unabh¨ Voraussetzungen dieser Folgerung ist, notieren wir als n¨ utzlichen Hilfssatz 7.3 Die K¨ orpererweiterung L/K sei separabel. F¨ ur jeden Zwischenk¨orper M , K ⊆ M ⊆ L , ist auch L/M separabel. Wir werden in diesem Kapitel sehen, dass die Galoisgruppe von L/K wichtige Informationen u ¨ber die K¨orpererweiterung liefert. Man bezeichnet darum L/K als abelsche bzw. zyklische bzw. aufl¨ osbare K¨ orpererweiterung, wenn sie endlichen Grades, normal und separabel ist und wenn ihre Galoisgruppe abelsch bzw. zyklisch bzw. aufl¨osbar ist (zum letzteren vgl. Folgerung 2.28).
7.1.2 Der Hauptsatz Satz 7.4 Sei L/K eine separable normale K¨orpererweiterung endlichen Es gibt eine bijektive Beziehung zwischen der Menge der Untergruppen H der Galoisgruppe G := {id} ←→ Gal L/K einerseits und der Menge der Zwi∩ schenk¨orper M , K ⊆ M ⊆ L andererseits; diese H ←→ wird gegeben durch zwei zueinander inverse inklu∩ sionsumkehrende Abbildungen N ←→ # g(M ) := Fix M = H G ←→ k(H) := Fix H = M .
Grades. L ∪ M ∪ F ∪ K
F¨ ur alle Zwischenk¨orper M ist L/M normale und separable Erweiterung mit Galoisgruppe g(M ) . F¨ ur alle σ ∈ G und alle M gilt g(σ(M )) = σ g(M ) σ −1 ,
also
k(σHσ −1 ) = σ k(H) .
Insbesondere ist eine K¨orpererweiterung F/K , F ⊆ L , genau dann normal, wenn die ihr entsprechende Untergruppe N = g(F ) Normalteiler in G ist. In diesem Fall ist die Galoisgruppe Gal F/K isomorph zur Restklassengruppe G/N . Beweis: 1. Aus dem letzten Hilfssatz und aus Abschnitt 6.4.1 wissen wir bereits, dass alle Erweiterungen L/M normal und separabel sind. 2a. Nach Definition und nach Satz 7.1 ist gerade g(M ) = Aut L/M = Gal L/M und hat M zum genauen Fixk¨orper, also gilt k(g(M )) = M . 2b. Sei andererseits H Untergruppe von G . Dann l¨ asst H alle Elemente von
172
7.1 Der Hauptsatz der Galoistheorie
Fix H = k(H) fest, also ist sicher H ⊆ g(k(H)) . Nach Satz 7.2 ist H aber sogar die Galoisgruppe von L/Fix H und erf¨ ullt darum insbesondere ord H = [L : k(H)] und macht darum nach Satz 7.1 schon die volle Gruppe g(k(H)) aus. Demnach sind k ◦ g = id
und
g ◦ k = id ,
jeweils auf dem Verband der Zwischenk¨orper von L/K bzw. der Untergruppen von G , die Abbildungen k und g m¨ ussen daher bijektiv sein. 3. Sei nun g(M ) = H und σ ∈ G ; dann ist offenbar g(σ(M )) = Fix σ(M ) ⊆ σ H σ −1 . Es muss sogar die Gleichheit gelten, weil ord H = [L : M ] = [L : K]/[M : K] ist und weil sich diese K¨orpergrade bei Anwendung des K-Isomophismus σ nicht urlich ¨andern, ebensowenig wie die Gruppenordnung bei Konjugation mit σ . Nat¨ kann man diese Aussage genausogut mit Hilfe der Abbildung k formulieren. 4. Wann ist ein Zwischenk¨orper F normale K¨ orpererweiterung von K ? Wir ¯ enthalten ist d¨ urfen o.B.d.A. annehmen, dass L im algebraischen Abschluss K ¯ und k¨onnen nach Satz 6.9 jeden Isomorphismus von F in K nach L fortsetzen. ¯ Automorphismen von L sind, geh¨ Da aber alle K-Isomorphismen von L in K oren sie zu G . F¨ ur diese σ haben wir eben gesehen, dass sie Automorphismen von F genau dann beschreiben, wenn g(F ) invariant ist unter Konjugation mit σ . Man sieht also F/K normal ⇐⇒ σ(F ) = F
∀ σ ∈ G ⇐⇒ N = g(K) Normalteiler in G .
Zur Bestimmung der Galoisgruppe dieser normalen Erweiterung F/K verwenden wir nochmals, dass jedes Element von Gal F/K Restriktion eines Automorphismus aus Gal L/K ist. Die Restriktionsabbildung Gal L/K → Gal F/K : σ → σ|F ist also ein surjektiver Gruppenhomomorphismus mit Kern N . Mit dem Homomorphiesatz der Gruppentheorie folgt daraus die letzte Behauptung. 2 Bemerkungen und Beispiele: 1. Insbesondere ist jetzt offensichtlich, dass in jeder K¨orpererweiterung endlichen Grades nur endlich viele Zwischenk¨ orper existieren und dass Gruppenordnungen und -indizes mit Graden von K¨ orpererweiterungen u ussen. Mit den Bezeichnungen und unter den Voraussetzungen ¨bereinstimmen m¨ des Hauptsatzes gilt ord H = [L : Fix H]
und
(G : H) = [Fix H : K] .
2. Die einfachsten Beispiele sind nat¨ urlich die quadratischen Zahlk¨ orper, d.h. die K¨orpererweiterungen L/Q vom Grad 2 . Aus den Aufgaben zu Kap. 6 wissen
173
7 Galoistheorie
√ wir, dass jeder quadratische Zahlk¨orper von der Form L = Q( d) ist mit einer quadratfreien ganzrationalen Zahl d = 0 , 1 . Die Galoisgruppe besteht dann aus uhrten algebraischen dem Einselement idL und aus der in Abschnitt 4.6.1 eingef¨ Konjugation β → β . 3. Der Zerf¨allungsk¨orper des Polynoms x3 − 2 , nach Abschnitt 6.4.1 also L = √ 3 Q( 2, ζ3 ) ist eine normale und separable K¨ orpererweiterung von Q vom Grad 6 und hat die Galoisgruppe Gal L/Q ∼ = S3 , wobei die symmetrische Gruppe S3 als Permutationsgruppe auf den Wurzeln von x3 −2 operiert. Es gibt vier echte Zwischenk¨ orper, n¨ amlich den (¨ uber Q normalen, quadratischen) Eisensteinschen Zahlk¨orper Q(ζ3 ) entsprechend dem Normalteiler A3 der Drehungen in S3 (s. Abschnitte 2.1.4 und 2.2.1) und die drei isomorphen nicht-normalen kubischen K¨orper √ 3 Q( 2)
,
Q(ζ3
√ 3 2) ,
Q(ζ32
√ 3 2)
entsprechend den drei zueinander konjugierten Spiegelungsuntergruppen von S3 . 4. Zwei wichtige Verallgemeinerungen des Hauptsatzes der Galoistheorie sollen wenigstens kurz erw¨ahnt werden: Wenn L/K zwar normal, aber inseparabel ist, betrachte man die Untermenge M aller u ¨ber K separablen Elemente in L . Diese ¨ bildet einen Zwischenk¨orper (Ubungsaufgabe!), den separablen Abschluss von K in L oder die maximale separable Erweiterung von K in L . Sie ist normal u ¨ber K Gal M/K . Die Erweiterung L/M ist rein inseparabel, d.h. und es gilt Aut L/K ∼ = e -ter Wurzeln von Elemenwird ausschließlich durch Adjunktion (inseparabler) p ten aus M erzeugt, p = car K , und besitzt {id} als Automorphismengruppe. 5. Schließlich gibt es eine Version des Hauptsatzes f¨ ur normale separable algebraische K¨orpererweiterungen unendlichen Grades. Die bijektive Beziehung der Zwischenk¨orper besteht dann allerdings nicht mehr zur Menge aller Untergruppen von Aut L/K , sondern nur noch zu den abgeschlossenen Untergruppen in der sogenannten Krull-Topologie auf Aut L/K . Diese Topologie wird dadurch erkl¨art, dass f¨ ur jedes σ ∈ Aut L/K die Restklassen σ Fix M
,
M
endliche normale separable Erweiterung von K
als Basis eines Umgebungssystems von σ verwendet werden. Dass dadurch tats¨ achlich eine Topologie definiert wird, in der die Gruppenoperationen in Aut L/K stetige Funktionen sind, und dass die angegebene Verallgemeinerung des Hauptsatzes richtig ist, erfordert nat¨ urlich aufwendige Beweise, die wir hier nicht wiedergeben wollen.
174
7.2 Kreisteilungsk¨ orper
7.2 Kreisteilungsk¨ orper 7.2.1 Einheitswurzeln Die Nullstellen des Polynoms xn − 1 (¨ uber einem beliebigen K¨ orper K ) heißen n-te Einheitswurzeln. Sie bilden im Zerf¨ allungsk¨ orper dieses Polynoms eine multiplikative Gruppe μn . Im Fall von car K = 0 kann man diese realisieren als ¯ ∗ ⊂ C∗ . μn = { e2πik/n | k = 0, . . . , n − 1 } ⊂ Q μn ist also eine zyklische Gruppe der Ordnung n . Wir werden hier dieses Faktum unabh¨angig von der Charakteristik und den speziellen Eigenschaften der Exponentialfunktion zu beweisen versuchen. Im Fall von car K = p ∈ P ist nach (6.2) xpn − 1 = (xn − 1)p , also μpn = μn . Damit ist klar, dass die Voraussetzung des folgenden Satzes keine echte Einschr¨ankung ist. Satz 7.5 car K sei kein Teiler von n ∈ N . Dann ist die Gruppe μn der n-ten Einheitswurzeln zyklisch von der Ordnung n . Nach Voraussetzung ist n¨amlich xn − 1 ein separables Polynom u ¨ber K , also ord μn = n . Der Rest des Beweises geht genauso wie der von Satz 4.3: μn kann nur Elemente mit Ordnungen d | n haben, etwa ψ(d) St¨ uck. Wenn es u ¨berhaupt solche Elemente gibt, sind sie Nullstellen von xd − 1 , aber davon kommen nicht alle Nullstellen in Frage, sondern nur ϕ(d) , da die anderen kleinere Ordnung haben. Nach der Summationsformel f¨ ur die Eulersche Phi-Funktion erh¨ alt man ψ(d) ≤ ϕ(d) = n . n = d|n
d|n
Es muss also u ¨berall ψ(d) = ϕ(d) sein. Insbesondere gibt es erzeugende Elemente der Ordnung n , somit muss μn zyklisch sein. 2 Diese erzeugenden Elemente nennt man primitive n-te Einheitswurzeln. Es gibt davon also ϕ(n) St¨ uck; mit ζn wird eine solche festgew¨ ahlte primitive Einheitswurzel bezeichnet. Diese Wahl ist eigentlich willk¨ urlich, im Fall komplexer Einheitswurzeln wird i.a. ζn := e2πi/n gesetzt. Die Menge der ζnk , k ∈ Z oder besser k ∈ Z/nZ , durchl¨auft ganz μn , und die primitiven Einheitswurzeln werden dabei genau durch die ζnk , k ∈ (Z/kZ)∗ , beschrieben. Weil alle Elemente endlicher Ordnung in K ∗ Einheitswurzeln sind und weil Untergruppen zyklischer Gruppen ebenfalls zyklisch sind (Aufgabe zu Kap. 2) haben wir nebenbei bewiesen: Folgerung 7.6 Endliche multiplikative Gruppen in K¨orpern sind stets zyklisch.
175
7 Galoistheorie
7.2.2 Kreisteilungspolynome Sei nun K Primk¨orper, also Q oder Fp . Dann heißt die K¨ orpererweiterung orper. Als Zerf¨ allungsk¨ orper des PoK(ζn ) = K(μn ) der n-te Kreisteilungsk¨ lynoms xn − 1 ist er normal, und nach unserer oben getroffenen Konvention car K n ist auch klar, dass er separabel ist (andere Begr¨ undung: Vollkommenn heit des Grundk¨ orpers, Satz 6.21). Nat¨ urlich ist x −1 nur f¨ ur n = 1 irreduzibel, denn es wird von allen Polynomen xd − 1 , d | n , geteilt. Dividiert man xn − 1 alt man das n-te Kreisteilungsdurch das kgV aller echten Teiler xd − 1 , so erh¨ polynom Fn (x) := ( x − ζnk ) ∈ K[x] k∈(Z/nZ)∗
vom Grade ϕ(n) . Nat¨ urlich ist xn − 1 =
Fd (x)
(7.1)
d|n
und K(ζn ) ist Zerf¨allungsk¨orper von Fn , also gilt [K(ζn ) : K] ≤ ϕ(n). Ziel dieses ganzen Abschnitts ist der Nachweis, dass hier f¨ ur K = Q Gleichheit vorliegt, und dass die Galoisgruppe eigentlich eine alte Bekannte“ ist. Kernpunkt ” ist der Beweis, dass die Fn irreduzibel in Q[x] sind. Dies ist nicht ganz einfach, da das Eisensteinsche Kriterium nicht ohne weiteres anwendbar ist; dazu einige Beispiele ( p ∈ P ): Fp (x) =
xp − 1 = xp−1 + . . . + x + 1 x−1
n
xp − 1 n−1 n−1 Fpn (x) = pn−1 = x(p−1)p + . . . + xp +1 x −1 F6 (x) =
x6 − 1 = x2 − x + 1 (x − 1)(x + 1)(x2 + x + 1)
Hilfssatz 7.7 In Q[x] sind die Kreisteilungspolynome Fn sogar primitiv, d.h. liegen in Z[x] und haben teilerfremde Koeffizienten. Beweis durch Induktion u ur F1 (x) = x − 1 . Da ¨ber n : Die Behauptung ist klar f¨ xn − 1 primitives Polynom in Z[x] ist und als Induktionsannahme vorausgesetzt werden kann, dass alle Fd ∈ Z[x] primitiv sind f¨ ur alle echten Teiler d von n, folgt aus Hilfssatz 6.12.3, dass in der Zerlegung (7.1) auch Fn ∈ Z[x] primitiv sein muss. 2
176
7.2 Kreisteilungsk¨ orper
Hilfssatz 7.8 Sei q ∈ Q[x] das irreduzible Polynom der primitiven n-ten Einheitswurzel ζ := ζn und p n prim. Dann ist auch q(ζ p ) = 0 . Beweis: Nach Konstruktion ist q | Fn . Wir ersetzen (ohne die Nullstellen und damit die Behauptung zu a¨ndern) q durch ein assoziiertes primitives Polynom f ∈ Z[x] , so dass also nun Fn (x) = f (x) h(x) ist mit einem weiteren primitiven Polynom h ∈ Z[x] (wieder nach 6.12.3). W¨ are f (ζ p ) = 0 , so m¨ usste wegen Fn (ζ p ) = 0 jedenfalls h(ζ p ) = 0 sein, es g¨ abe also ein (o.B.d.A. wieder primitives, irreduzibles) g | h mit g(ζ p ) = 0 und eine andere Zerlegung Fn (x) = g(x) k(x) mit einem primitiven k ∈ Z[x] . Auch g(xp ) ist primitiv und verschwindet auf ζ , erf¨ ullt also auch f (x) | g(xp ) . Nun betrachten wir die Reduktion aller dieser Polynome mod p , die wir durch einen zus¨atzlichen Index p kennzeichnen: Wegen p n bleibt Fn,p das n-te Kreisteilungspolynom auch in Fp [x] , hat also nach wie vor keine mehrfachen Wurzeln; alle bisher gefundenen Faktorzerlegungen bleiben f¨ ur die reduzierten Polynome g¨ ultig, nach (6.2) und dem kleinen Fermatschen Satz, angewandt auf die Koeffizienten von gp , gilt aber zus¨ atzlich fp (x) | gp (xp ) = (gp (x))p . Da weder fp noch gp mehrfache Wurzeln haben, folgt daraus fp | gp | hp . Dies ist ein Widerspruch, denn nun w¨ urde Fn,p = fp hp den Faktor fp zweimal enthalten. 2 Satz 7.9 Das Kreisteilungspolynom Fn ist in Q[x] irreduzibel. Zum Beweis sei wie eben f ∈ Z[x] ein primitiver irreduzibler Teiler von Fn , der auf ζ = ζn verschwindet. Man w¨ahle zu jedem k ∈ (Z/nZ)∗ einen positiven Repr¨asentanten, zerlege diesen in Primfaktoren pj (alle n ) und wende den letzten Hilfssatz per Induktion u ¨ber diese Primfaktorzerlegung an, um zu zeigen, dass f (ζ k ) = 0 auch f¨ ur alle k ∈ (Z/nZ)∗ . Das impliziert nat¨ urlich Fn = f , somit die Behauptung. 2
177
7 Galoistheorie
7.2.3 Die Galoisgruppen der Kreisteilungsk¨ orper Die Kreisteilungsk¨orper u orpern Fp werden wir im n¨ achsten ¨ber den endlichen K¨ Paragraphen behandeln, weil sie sich einfacher im Rahmen der Theorie beliebiger Erweiterungen endlicher K¨orper von endlichem Grad diskutieren lassen. F¨ ur den Grundk¨orper Q haben wir jetzt das Instrumentarium f¨ ur das folgende Hauptresultat zusammen: Satz 7.10 Der Kreisteilungsk¨orper Q(ζn ) ist eine normale und separable Erweiterung von Q vom Grad ϕ(n) . Die prime Restklassengruppe (Z/nZ)∗ ist isomorph zur Galoisgruppe Gal Q(ζn )/Q verm¨oge des Isomorphismus (Z/nZ)∗ → Gal Q(ζn )/Q : [k]n → σk , wobei der Automorphismus σk eindeutig bestimmt ist durch σk : ζn → ζnk . Dass Q(ζn ) normal und separabel u ¨ber Q ist, haben wir bereits in den vorigen Abschnitten eingesehen. Die Aussage u orpergrad folgt aus der Irreduzi¨ber den K¨ bilit¨at des Kreisteilungspolynoms Fn . Der Beweis der Aussage u ¨ber die Struktur der Galoisgruppe ist sehr einfach: Jedes σ ∈ Gal Q(ζn )/Q ist eindeutig bestimmt durch seine Wirkung auf die primitive Einheitswurzel ζn als erzeugendes Element der K¨orpererweiterung. σ(ζn ) kann aber wieder nur primitive Einheitswurzel des gleichen Grades sein, muss also von der Form ζnk sein, k ∈ Z teilerfremd zu n . Genauer gesagt h¨angt σ nur von der Restklasse k mod n ab. Man rechnet elementar nach, dass die so konstruierte Abbildung σ → [k]n ein injektiver Gruppenhomomorphismus ist; die Surjektivit¨at folgt aus dem Vergleich der Gruppenordnungen oder aus der Tatsache, dass die ζnk genau alle Nullstellen des irreduziblen Polynoms Fn durchlaufen. 2 Da wir aus Kapitel 1 und Kapitel 4 genaue Informationen u ¨ber die prime Restklassengruppe und ihre Untergruppen haben, k¨onnen wir diese durch Anwendung des Hauptsatzes der Galoistheorie in Informationen u orper der Kreis¨ber die Unterk¨ teilungsk¨orper u ¨bersetzen. Zur Vereinfachung der Schreibweise identifizieren wir dabei (Z/nZ)∗ mit Gal Q(ζn )/Q . Folgerung 7.11 Sei Kn := Q(ζn ) . 1. Kn ist abelsch u ur n = 4 , pm , 2pm ( p > 2 ¨ber allen Unterk¨orpern, f¨ prim, m ∈ N ) sogar zyklisch. 2. Jeder Unterk¨ orper K von Kn ist normale, abelsche K¨orpererweiterung von Q.
178
7.2 Kreisteilungsk¨ orper
3. Jedes Kn , n > 2 , enth¨alt einen reellen Unterk¨orper Rn := Q(cos 2π n ) vom Grad ϕ(n)/2 als Fixk¨ orper der Untergruppe H = {[1]n , [−1]n } . 4. Seien n, m ∈ N . Dann entspricht dem Unterk¨ orper Kn von Knm die Untergruppe Hn := { [k]nm | k ≡ 1 mod n } . Entsprechendes gilt nat¨ urlich f¨ ur Hm und Km . F¨ ur das Kompositum Kn Km = Kn (Km ) = Km (Kn ) = Q(ζn , ζm ) beider K¨orper l¨asst sich der chinesische Restsatz in den Verband der Kreisteilungsk¨orper so u ¨bersetzen: Wenn (n, m) = 1 ist, gilt Hn ∩ Hm = {[1]nm }
←→
Kn Km = Knm ,
Hn Hm = (Z/nmZ)∗
←→
Kn ∩ Km = Q ,
d.h. Kn und Km sind linear disjunkt u ¨ber Q . 5. Jeder Kreisteilungsk¨orper Kn wird erzeugt von den Kreisteilungsk¨orpern Kpν , wenn die pν gerade die maximalen Primpotenzteiler von n durchlaufen. Je zwei verschiedene Kpν haben den trivialen Schnitt Q . 6. Wenn n eine 2-Potenz ist, gibt es mit Ausnahme von K2 = Q
und
K4 = Q(i)
in der Galoisgruppe (Z/2ν Z)∗ von K2ν genau drei Untergruppen vom Index 2 . Diesen entsprechen als Fixk¨orper die quadratischen Unterk¨orper √ √ Q(i) , Q( 2) , Q( −2) ⊂ K8 ⊆ K2ν . 7. F¨ u√ r p = 2 prim enth¨ alt jedes Kpν genau einen quadratischen Zahlk¨orper Q( d) ⊆ Kp als Fixk¨ orper der Untergruppe Q der quadratischen Reste in (Z/pν Z)∗ bzw. (Z/pZ)∗ . Die genaue Bestimmung dieses quadratischen Teilk¨ orpers in Abh¨ angigkeit von p werden wir in Abschnitt 7.4 vornehmen.— Die besondere Bedeutung der Kreisteilungsk¨orper f¨ ur die Arithmetik liegt darin, dass nach einem ber¨ uhmten Resultat von Kronecker und Weber auch die Umkehrung der zweiten Folgerung richtig ist: Satz 7.12 Jede abelsche Erweiterung K des rationalen Zahlk¨ orpers Q ist in einem Kreisteilungsk¨ orper enthalten. Der Beweis wird mit Methoden der Klassenk¨ orpertheorie gef¨ uhrt und u ¨bersteigt den Rahmen dieser Einf¨ uhrung bei weitem; nur f¨ ur quadratische Zahlk¨ orper wird sich nebenbei in 7.4 eine Begr¨ undung ergeben. Es sei aber soviel gesagt, dass der
179
7 Galoistheorie
Versuch einer Verallgemeinerung dieses Satzes auf andere Grundk¨ orper als Q oder nichtabelsche Erweiterungen eines der ganz großen Themen der algebraischen Zahlentheorie seit mehr als hundert Jahren ist (Stichworte: Kroneckers Jugendtraum, die Langlands-Philosophie); die Rolle der Exponentialfunktion, deren Werte e2πi/n die Kreisteilungsk¨orper erzeugen, wird dabei z.T. von Funktionen u angt. ¨bernommen, deren Konstruktion eng mit elliptischen Kurven zusammenh¨
7.2.4 Noch einmal Primzahlverteilung in Restklassen Kreisteilungspolynome und Kreisteilungsk¨orper haben noch andere sch¨ one Eigenschaften. Wir beginnen zun¨achst mit einem Aspekt, der zur elementaren Zahlentheorie geh¨ort. Hilfssatz 7.13 Sei Fn das n-te Kreisteilungspolynom. Jeder Primteiler p eines ullt Werts Fn (k) an einem ganzzahligen Argument k ∈ Z erf¨ p|n
oder
p ≡ 1 mod n .
Zum Beweis nehmen wir p n an und erinnern an (7.1) und Hilfssatz 7.7. Diese implizieren p | (k n − 1) , also k n ≡ 1 mod p . n ist also Vielfaches der Ordnung m der Restklasse [k]p in der zyklischen Gruppe (Z/pZ)∗ . Aus (7.1) und p | (k m − 1)
folgt p | Fm (k) ,
andernfalls m¨ usste ein echter Teiler d von m existieren mit p | Fd (k) , dann h¨ atte [k]p h¨ochstens die Ordnung d . W¨are nun n = m , so folgt aus p | Fn (k)
und p | Fm (k) ,
dass [k]p eine mehrfache Nullstelle des mod p reduzierten Polynoms xn − 1 w¨are im Widerpruch zu p n . Bleibt nur die M¨ oglichkeit n = m = ord [k]p , nach dem Eulerschen Satz also n | p − 1 bzw. p ≡ 1 mod n . 2 Dieser Hilfssatz l¨asst sich dazu verwenden, einen weiteren Spezialfall des Dirichletschen Primzahlsatzes zu beweisen. Satz 7.14 Sei n eine nat¨ urliche Zahl. In der Restklasse [1]n liegen unendlich viele Primzahlen.
180
7.2 Kreisteilungsk¨ orper
Seien p1 , . . . , ps ≡ 1 mod n endlich viele Primzahlen in [1]n . Dann sei m := np1 · . . . · ps . Das Kreisteilungspolynom Fm ist nicht konstant, mit k ∈ N wachsen also auch die Werte |Fm (km)| u ¨ber alle Grenzen, es gibt demnach Primteiler p von Werten Fm (km) = 0, ±1 . Wegen p | ((km)m − 1) ist p m , nach dem Hilfssatz also p ≡ 1 mod m ,
insbesondere auch
p ≡ 1 mod n .
Wegen p m haben wir eine neue Primzahl in der Restklasse [1]n gefunden. 2
7.2.5 Das Umkehrproblem, abelscher Fall Gegeben eine endliche Gruppe G . Gibt es eine Galoiserweiterung L/K mit Galoisgruppe Gal L/K ∼ = G ? In dieser allgemeinen Form ist die Frage leicht zu beantworten: Aus Satz 2.5 wissen wir, dass jede endliche Gruppe zu einer Untergruppe einer symmetrischen Gruppe Sn isomorph ist. Nach dem Hauptsatz der Galoistheorie gen¨ ugt es daher, K¨orpererweiterungen mit Galoisgruppe Sn zu konstruieren, und das werden wir in Abschnitt 7.7.7 in wenigen Zeilen tun, allerdings f¨ ur einen sehr großen Grundk¨orper K . Bei weitem schwieriger (und bis heute nur f¨ ur viele spezielle Gruppen positiv beantwortet) ist eine von Hilbert aufgeworfene Frage, ob sich jede endliche Gruppe als Galoisgruppe mit dem Grundk¨ orper Q realisieren l¨asst. Wir werden auf das Problem an verschiedenen Stellen wieder zu sprechen kommen. Eine Teilantwort k¨onnen wir schon jetzt geben: Satz 7.15 Sei A eine endliche abelsche Gruppe. Es gibt (unendlich viele verschiedene) normale separable K¨orpererweiterungen L von Q mit Gal L/Q ∼ = A. Nach Satz 2.38 k¨onnen wir n¨amlich A durch das direkte Produkt von Restklassengruppen Z/d1 Z × . . . × Z/dr Z ersetzen, alle dν ∈ N mit 1 < d1 | d2 | . . . | dr . Nach dem Dirichletschen Primzahlsatz existieren dazu r paarweise verschiedene Primzahlen p1 ≡ 1 mod d1 , . . . , pr ≡ 1 mod dr , (die man auf unendlich viele Weisen w¨ahlen kann!) f¨ ur die jeweils dj ein Teiler der Gruppenordnung pj − 1 der zyklischen Gruppe (Z/pj Z)∗ ∼ = Gal Q(ζpj )/Q ist. F¨ ur jedes j = 1, . . . , r existiert also ein surjektiver Gruppenhomomorphismus (Z/pj Z)∗ → Z/dj Z .
181
7 Galoistheorie
Diese Homomorphismen lassen sich als Komponenten eines surjektiven Gruppenhomomorphismus h : (Z/p1 Z)∗ × . . . × (Z/pr Z)∗ → Z/d1 Z × . . . × Z/dr Z benutzen. Bis auf Isomorphie steht rechts die Gruppe A , links (nach dem chinesischen Restsatz bzw. Folgerung 7.11.4) die Galoisgruppe von Q(ζn )/Q f¨ ur n = p1 ·. . .·pr . Nach dem Homomorphiesatz der Gruppentheorie ist A daher Quotient dieser Galoisgruppe nach ker h , und nach dem Hauptsatz der Galoistheorie gibt es einen normalen Zwischenk¨orper L = Fix ker h des Kreisteilungsk¨ orpers Q(ζn ) , dessen Galoisgruppe isomorph zu A ist. 2
7.3 Endliche K¨ orper Der Verband der Erweiterungen endlichen Grades f¨ ur endliche K¨ orper ist außerordentlich einfach zu beschreiben. Insbesondere gibt es nur (normale, separable) zyklische K¨orpererweiterungen, wie sich im folgenden Satz zeigen wird; aus Bequemlichkeit seien l¨angst bekannte Aussagen (S¨ atze 4.3, 6.5, 6.21) noch einmal mit aufgef¨ uhrt. Satz 7.16 1. Zu jedem endlichen K¨orper F = Fq mit q Elementen gibt es eine Primzahl p und ein n ∈ N mit q = pn . Der K¨orper F ist separable algebraische K¨orpererweiterung seines Primk¨ orpers Fp vom Grad n . 2. F∗ ist zyklisch von der Ordnung q − 1 . 3. Zu jeder Primpotenz q = pn gibt es einen endlichen K¨orper Fq mit q Elementen; dieser ist in Fp eindeutig bestimmt. 4. Fq ist Zerf¨allungsk¨orper der Polynome xq−1 − 1
xq − x ,
bzw.
darum normale K¨orpererweiterung von Fp . 5. Die Abbildung σ : Fq → Fq : a → ap ist ein Automorphismus von Fq , der sogenannte Frobenius-Automorphismus. 6. σ erzeugt die Galoisgruppe Gal Fq /Fp als zyklische Gruppe. Es gibt einen Isomorphismus der additiven Restklassengruppe Z/nZ auf die Galoisgruppe Gal Fpn /Fp [k]n → σ k , k
σ k : a → ap .
182
7.3 Endliche K¨orper
7. Alle Unterk¨orper von Fpn sind von der Form Fpm mit m | n . Die Galoisgruppe Gal Fpn /Fpm wird von σ m : a → ap
m
erzeugt. 8. Sei nun p s ∈ N . Dann ist der Kreisteilungsk¨orper Fp (ζs ) = Fp (μs ) jener endliche K¨ orper Fpn mit s | pn − 1 , n ∈ N minimal, d.h. mit n = ord [p]s
in
(Z/sZ)∗ .
Beweis: 1. und 2. wissen wir schon. Wenn Fq existiert, besteht F∗q genau aus allen (einfachen!) Nullstellen von xq−1 −1 , daraus folgt schon die Eindeutigkeitsaussage in 3. Wenn Fq existiert, ist 4. ebenfalls klar, und damit auch die Normalit¨ at der K¨orpererweiterung Fq /Fp . Dass σ in 5. ein additiver Homomorphismus ist, haben wir schon in (6.2) gezeigt, und σ ist trivialerweise auch ein multiplikativer Homomorphismus (vgl. die Aufgaben zu Kap. 6): (ab)p = ap bp Jede Potenz von σ ist nat¨ urlich auch ein K¨orperautomorphismus jedes endlichen K¨orpers der Charakteristik p . Nun kann man die Existenz von Fq wie folgt einsehen: Bekanntlich gibt es einen Zerf¨allungsk¨ orper des Polynoms xq − x u ¨ber Fp , sagen wir etwa FpN . Dann ist aber n
Fix σ n = { a ∈ FpN | ap = a } einerseits ein K¨orper, andererseits die genaue Nullstellenmenge des Polynoms xq − x mit q = pn Elementen. Bleibt noch der Beweis der Aussagen 6 bis 8. Dass σ k ein K¨ orperautomorphismus der angegebenen Form ist, ist unmittelbar nachzurechnen, ebenso dass auf Fpn die Potenz σ n = id ist; also ist [k]n → σ k ein wohldefinierter Gruppenhomomorphismus in die Galoisgruppe. F¨ ur k ∈ N und ein erzeugendes Element a der zyklischen multiplikativen Gruppe F∗q = F∗pn ist σ k (a) = a ⇐⇒ ap
k −1
= 1 ⇐⇒ (pn − 1) | (pk − 1) ⇐⇒ n | k
(Aufgabe zu Kap. 2), also ist der Gruppenhomomorphismus injektiv. Die Surjektivit¨at folgt einfach aus n = [Fpn : Fp ] = ord Gal Fpn /Fp . Die Unterk¨ orper von Fq liefert der Hauptsatz der Galoistheorie: Die Untergruppen von Z/nZ werden gerade erzeugt von den Restklassen [m]n , m | n , und Fix σ m = Fpm haben wir oben schon hergeleitet (mit n anstelle von m ). Die letzte Aussage folgt schließlich aus F∗pn = μ(pn −1) . 2
183
7 Galoistheorie
7.4 Quadratische Gaußsche Summen 7.4.1 Grundbegriffe Vereinbarung: In diesem ganzen Abschnitt 7.4 sei p stets eine Primzahl > 2 , ¯ , und alle Summationen werden von 0 bis p − 1 gef¨ ζ := ζp := e2πi/p ∈ Q uhrt, soweit nicht ausdr¨ ucklich anders angegeben. Hilfssatz 7.17 F¨ ur alle a ∈ Z ist p at ζ = 0 t
f¨ ur f¨ ur
a ≡ 0 mod p a ≡ 0 mod p
.
ur p a steht hier eine geometrische Summe Beweis: F¨ ur p | a ist ζ a = 1 und f¨
ζ at =
t
ζ ap − 1 = 0.2 ζa − 1
Ber¨ ucksichtigt man, dass ζ-Potenzen nur von der Restklasse ihrer Exponenten mod p abh¨angen, und bezeichnet man mit δxy wie u ¨blich das Kroneckersymbol, so ergibt sich daraus die Folgerung 7.18 F¨ ur alle x, y ∈ Z/pZ ist 1 t(x−y) ζ = δxy . p t Wie in Kap. 4 bezeichne ( pt ) das Legendresymbol; wir definieren f¨ ur alle a ∈ Z/pZ ga
t
:= ζ at , p t
t
insbesondere g := g1 = ζt p t
als quadratische Gaußsche Summe. F¨ ur diese gilt der folgende fundamentale Satz 7.19
1.
ga = ( ap ) g ζt
2
2.
g =
3.
g 2 = (−1)(p−1)/2 p
t
Beweis: F¨ ur p | a ist ( ap ) = 0 , die Behauptung 1. folgt also aus der Tatsache, dass gleichviele quadratische Reste und Nichtreste existieren (Satz 4.15.4), d.h. t
= 0. (7.2) p
184
7.4 Quadratische Gaußsche Summen
F¨ ur p a ist ( ap ) = ( ap )−1 und t → x = at : Z/pZ → Z/pZ bijektiv, die Behauptung folgt also aus
at
x
a at ga = ζ = ζx = g . p p p x t Zum Beweis von 2. addiere man 0 =
ζt
t
zur definierenden Gleichung von g . Man erh¨ alt 2 ζa = ζt , g = 1+2 t
a∈Q
wenn man mit Q die Untergruppe der quadratischen Reste von (Z/pZ)∗ bezeichnet. Zum Beweis von 3. beachte man zun¨achst, dass f¨ ur p a nach Teil 1
−a a −1 g2 = g2 ga g−a = p p p ist. Daraus folgt
ga g−a = (p − 1)
a
Andererseits ist ga g−a
a
g2 .
x y
ζ a(x−y) , = p p x y
nach der Folgerung 7.18 also
−1 p
ga g−a = p
x y
δxy = p (p − 1) , p p x y
was zusammen mit dem ersten Erg¨anzungsgesetz zum quadratischen Reziprozit¨atsgesetz die Behauptung ergibt. 2
7.4.2 Kreisteilungsk¨ orper und quadratische K¨ orper Mit diesem Resultat sind Gaußsche Summen bereits eindeutig bis auf das Vorzeichen bestimmt. Dieses wird uns im n¨achsten Abschnitt noch besch¨ aftigen, aber √ es ist jetzt schon klar, dass und wann die Gaußschen Summen im K¨ orper Q( p) √ oder Q( −p) liegen. Damit lassen sich Fragen kl¨ aren, die im Abschnitt 7.2 offengeblieben sind:
185
7 Galoistheorie
Folgerung 7.20 Sei p eine ungerade Primzahl. Dann enth¨alt der Kreisteilungsk¨orper Q(ζp ) genau einen quadratischen Zahlk¨orper, n¨amlich √ f¨ ur p ≡ 1 mod 4 , Q( p) √ ur p ≡ 3 mod 4 . Q( −p) f¨ Den anderen der beiden quadratischen Zahlk¨ orper findet man dann nat¨ urlich als findet einen der drei quadratischen Unterk¨orper von Q(ζ4p ) , und entsprechend √ man f¨ ur jedes quadratfreie d ∈ Z , d = 0, 1 den K¨ orper Q( d) in Q(ζd ) oder Q(ζ4d ) wieder. Somit haben wir auch die Folgerung 7.21 Jeder quadratische Zahlk¨ orper ist in einem Kreisteilungsk¨orper enthalten. Ferner kann man nun leicht beweisen, dass zwischen verschiedenen quadratischen Zahlk¨orpern tats¨achlich nur triviale Isomorphien bestehen k¨ onnen, indem man sie in einen gemeinsamen Kreisteilungsoberk¨ orper einbettet und die zugeh¨ origen ¨ Untergruppen der Galoisgruppe betrachtet. Als Ubungsaufgabe beweise man mit Hilfe der S¨atze 7.10, 7.11 und unseren Kenntnissen u ¨ber die Struktur der primen Restklassengruppen die Folgerung 7.22 Seien d = c ∈ Z beide quadratfrei und = 0, 1 . Dann sind √ √ Q( d) und Q( c) nicht isomorph.
7.4.3 Das Vorzeichen der Gaußschen Summen Ziel dieses Abschnitts ist der Beweis von Satz 7.23
√ p g = √ −p
f¨ ur p ≡ 1 mod 4 f¨ ur p ≡ 3 mod 4
Gemeint sind dabei die positive Wurzel bzw. die Wurzel mit positivem Imagin¨arteil. Man mache sich zun¨achst klar, dass dieser Satz in bemerkenswert pr¨ aziser Weise aussagt, dass quadratische Reste und Nichtreste nicht v¨ ollig zuf¨ allig u ¨ber das Intervall zwischen 1 und p − 1 verteilt sind. Man denke sich etwa eine Primzahl in der Gr¨oßenordnung von 106 , dann liegt g nur in der N¨ ahe von 1000 , was nat¨ urlich durch K¨ urzungen der Summe (aus Gliedern vom Betrag 1 ) erkl¨ art werden kann. Das Ausmaß dieser K¨ urzungen wird also durch den Satz genau festgelegt. Neben Hilfssatz 7.17 ist der Satz ein Beispiel f¨ ur die Berechnung von Exponentialsummen ζ f (t) , f ∈ Fp [t] , t
186
7.4 Quadratische Gaußsche Summen
hier f¨ ur f (t) = t2 . F¨ ur h¨ohere Grade von f darf man sich hier aber nur mehr oder weniger gute Absch¨atzungen erwarten, ein wichtiger Gegenstand sowohl der analytischen Zahlentheorie wie der algebraischen Geometrie. Der Satz ist nicht ganz einfach und vor allem nicht mit rein algebraischen Hilfsmit√ orperautomorphismen teln zu beweisen. Das hat den Grund, dass ± p durch K¨ ineinander u uhrt werden k¨onnen, also f¨ ur die Algebra nicht ohne weiteres ¨bergef¨ zu unterscheiden sind, ebensowenig wie verschiedene primitive Einheitswurzeln der Ordnung p . In der Tat erh¨alt g das andere Vorzeichen, wenn ζ durch ζ a ersetzt wird mit einem quadratischen Nichtrest a mod p (Satz 7.19.1); entsprechend dem Hauptsatz der Galoistheorie und Folgerung 7.11.7 induzieren die √ quadratischen Nichtreste auf dem quadratischen Unterk¨ orper Q( p) gerade die √ algebraische Konjugation. Hier spielt also die Festlegung von p als der positiven Wurzel von p und von ζ als e2πi/p eine große Rolle, und aus diesem Grund wird der Beweis nicht ganz ohne Analysis zu f¨ uhren sein. Wir beginnen mit zwei Hilfss¨atzen, die an den schon in Abschnitt 4.4 gef¨ uhrten Beweis des quadratischen Reziprozit¨ atsgesetzes erinnern und die in Wirklichkeit die Primfaktorzerlegung von p in Z[ζ] wiedergeben (was aber in dieser Form weder formuliert noch gebraucht wird). Hilfssatz 7.24 p−1
2
( ζ 2k−1 − ζ −(2k−1) )2 = (−1)
p−1 2
p
k=1
Beweis: Aus Abschnitt 7.2.2 wissen wir bereits, dass das Kreisteilungspolynom Fp (x) = xp−1 + . . . + x + 1 =
p−1
(x − ζ j )
j=1
ist. Einsetzen von x = 1 ergibt p =
p−1
(1 − ζ ) = j
j=1
p−1
(1 − ζ ) = r
0 ≡ r mod p
2
p−1
(1 − ζ
4k−2
)
k=1
2
(1 − ζ −(4k−2) ) =
k=1 p−1
2 p−1 = (ζ −(2k−1) − ζ 2k−1 ) (ζ 2k−1 − ζ −(2k−1) ) = (−1) 2 (ζ 2k−1 − ζ −(2k−1) )2 .2
k
k
k=1
Hilfssatz 7.25 p−1
2
k=1
( ζ 2k−1 − ζ −(2k−1) ) =
√ p √ −p
f¨ ur p ≡ 1 mod 4 f¨ ur p ≡ 3 mod 4
( = ±g )
187
7 Galoistheorie
Zum Beweis erinnere man sich daran, dass 1 2πi 2πx x − 2πi x = e p −e p sin p 2i ist, dass sich also das Produkt dieses Hilfssatzes schreiben l¨ asst als
p−1
= i
p−1 2
2
2 sin
k=1
√
(4k − 2)π . p
Den Absolutbetrag p des Produkts kennen wir schon aus Hilfssatz 7.24, es kommt also hier auf die Vorzeichen der Faktoren an. Man weiß, dass sin
(4k − 2)π < 0 p
genau dann ist, wenn
Das Produkt hat also p−1 − 2
p+2 4
p−1
=
4 p−3 4
p+2 p−1 < k ≤ . 4 2
f¨ ur p ≡ 1 (4)
f¨ ur p ≡ 3 (4)
negative Glieder, d.h. man erh¨alt p−1 p−1 i 2 (−1) 4 = ip−1 = 1 f¨ ur p ≡ 1 (4) 1 .2 = √ p−1 p−3 p ur p ≡ 3 (4) i 2 (−1) 4 = ip−2 = i f¨
Beweis von Satz 7.23: Nach dem letzten Hilfssatz ist p−1
g = ε
2
( ζ 2k−1 − ζ −(2k−1) )
mit
ε = ±1 .
k=1
Sei
p−1 p−1
2 j j ( x2k−1 − xp−(2k−1) ) , f (x) := x − ε p
j=1
k=1
dann ist nach Wahl von ε und nach (7.2) f (ζ) = f (1) = 0 , also Fp (x) = xp−1 + . . . + x + 1 | f (x) ,
F1 (x) = x − 1 | f (x) ,
F1 (x) Fp (x) = xp − 1 | f (x) = (xp − 1) h(x) . Dabei ist h ∈ Z[x] , weil f ∈ Z[x] ist und xp − 1 primitiv. Nun ersetze man x durch ez und entwickle beide Seiten von p−1 p−1
2 j jz e − ε ( e(2k−1)z − e(p−(2k−1))z ) = (epz − 1) h(ez ) p
j=1
k=1
188
7.5 Nochmals das quadratische Reziprozit¨atsgesetz
in eine z-Potenzreihe, berechne den Koeffizienten von z (p−1)/2 : Beachtet man e(2k−1)z − e(p−(2k−1))z = (4k − 2 − p) z + . . . , so ergibt sich links als Koeffizient die Zahl p−1 p−1
2 p−1 j 2 − ε (4k − p − 2) , j p ( p−1 2 )! j=1 k=1
1
rechts eine Zahl
pA B
mit A, B ∈ Z , p B wegen
epz − 1 = pz +
p2 z 2 + ... 2
und p j!
∀ j = 1, . . . ,
p−1 . 2
Multiplikation beider Seiten mit B( p−1 2 )! ergibt eine Gleichung zwischen ganzen Zahlen und mod p eine Kongruenz ⎛ p−1 ⎞
p−1
2 p−1 j p−1 ⎝ ⎠ j 2 ≡ ε ! ≡ (4k − 2) p 2 j=1
k=1
p−1
≡ ε · 2 · 4 · . . . · (p − 1) ·
2
(2k − 1) ≡ ε (p − 1)! ≡ −ε mod p
k=1
nach dem Satz 3.19 von Wilson. Andererseits ist nach dem Eulerschen Kriterium
p−1 j j 2 ≡ mod p . p Mit ( pj )2 = 1 und −ε ≡
p−1
1 = p − 1 ≡ −1 mod p
j=1
ergibt sich die Behauptung ε = 1 . 2
7.5 Nochmals das quadratische Reziprozit¨ atsgesetz 7.5.1 Ein Beweis mit Gaußschen Summen Wir behalten die Bezeichnungen des letzten Paragraphen bei und nehmen an, dass q = p eine weitere ungerade Primzahl ist. Nach Satz 7.19 und nach dem ersten Erg¨anzungsgesetz 4.16 zum quadratischen Reziprozit¨ atsgesetz ist
p−1 −1 p∗ := (−1) 2 p = p = g2 . p
189
7 Galoistheorie
Im Ring Z[ζ] = Z[ζp ] bzw. seinem Restklassenring modulo qZ[ζ] (wie bei ganzrationalen Zahlen kurz als mod q geschrieben) kann man f¨ ur die Gaußschen Summen folgende Rechnung aufmachen: Nach dem Eulerschen Kriterium ist ∗
p q−1 2 q−1 ∗ q−1 2 2 mod q , g = (g ) = (p ) ≡ q ∗
q t q p t q t g ≡ g ≡ ζ ≡ ζ qt ≡ gq mod q . q p p Nach Satz 7.19 ist also
∗
q p g ≡ g, q p
somit
p∗ q
q p ≡ p∗ mod q . p ∗
[p∗ ]q ist Einheit in Z/qZ , darum folgt daraus sogar
∗
q p = , q p
(7.3)
was ¨aquivalent ist zum quadratischen Reziprozit¨ atsgesetz wegen
−1 q
p−1
2 q−1 p−1 q p p · = (−1) 2 2 = .2 q q p
7.5.2 Das zweite Erg¨ anzungsgesetz Zur Primzahl 2 haben wir keine Gaußsche Summe eingef¨ uhrt; als Analogon k¨ onnte man im K¨orper Q(ζ8 )√die Summe γ := ζ8 + ζ8−1 ansehen, denn mit ζ := ζ8 , ζ 2 = i , γ 2 = 2 wird γ = 2 (positive Wurzel, √ wenn ζ — wie hier vorgesehen — als 2πi/8 3 −3 e gew¨ahlt wird) und ζ + ζ = − 2 . F¨ ur ungerade Primzahlen p ist nach Euler
p−1 2 p−1 2 p−1 γ mod p , = (γ ) 2 = 2 2 ≡ p andererseits (p)
(p)
γ p = (ζ + ζ −1 )p ≡ ζ p + ζ −p ≡
γ f¨ ur p ≡ ±1 mod 8 −γ f¨ ur p ≡ ±3 mod 8
.
Aus beiden Kongruenzen zusammen folgt 2
p2 −1 γ 2 γ 2 ≡ γ p+1 ≡ ≡ (−1) 8 · 2 mod p . 2 p −γ Analog zum vorigen Abschnitt ist nun [2]p Einheit in Z/pZ , daher gilt Satz 4.19:
1 f¨ ur p ≡ ±1 mod 8 2 = 2 p −1 f¨ ur p ≡ ±3 mod 8
190
7.6 Konstruktionen mit Zirkel und Lineal
7.5.3 Ein Beweis mit endlichen K¨ orpern Da Einheitswurzeln ebenso u orpern gebildet werden k¨ onnen, ver¨ber endlichen K¨ wundert es nicht, dass man auch dort analoge Konstruktionen vornehmen kann. Seien p < q ungerade Primzahlen und n ∈ N so gew¨ ahlt (z.B. als n = p − 1 ), dass q n ≡ 1 mod p . Sei nun F := Fqn , dann ist F∗ zyklisch, erzeugt von einem Element z der Ordnung q n − 1 . Wir definieren nun ζ := z
q n −1 p
,
ga
p−1
t := ζ at , p t=0
g := g1 ,
womit ζ wieder eine primitive p-te Einheitswurzel w¨ are. Und mit dem gleichen Beweis wie f¨ ur die quadratischen Gaußschen Summen zeigt man auch hier
p−1 a ga = g und g 2 = (−1) 2 [p]q = [p∗ ]q . p p∗ ist also genau dann quadratischer Rest mod q , wenn nicht nur g 2 , sondern bereits g ∈ Fq ist, die Anwendung des Frobeniusautomorphismus in F lehrt also ∗
p = 1 ⇐⇒ g ∈ Fq ⇐⇒ q q
t
t
q q t qt ζ ζ = gq = g. = g = g = p p p t t ¨ Daraus folgt die Aquivalenz ∗
p = 1 q
⇐⇒
q = 1, p
und damit gilt das quadratische Reziprozit¨atsgesetz in der Form (7.3). 2
7.6 Konstruktionen mit Zirkel und Lineal 7.6.1 Eine Fragestellung der griechischen Mathematik Einige Probleme, die die antike griechische Mathematik u ¨ber Jahrhunderte besch¨aftigt haben und die bis ins 19. Jahrhundert fruchtbare Auswirkungen hatten, obwohl ihre praktische Bedeutung sicher gering ist, handelt von den L¨ angen, die in der ebenen Geometrie vorkommen. In unsere Sprache umformuliert lassen sie
191
7 Galoistheorie
sich h¨aufig der folgenden Frage unterordnen: Sei eine Strecke der L¨ange 1 gegeben. Welche L¨ angen lassen sich daraus mit Zirkel und Lineal konstruieren? Mit Elementargeometrie und/oder analytischer Geometrie findet man zun¨ achst den folgenden Hilfssatz; um beim Wurzelziehen nicht immer zu positiven Gr¨ oßen u ussen, ist es bequem, komplexe Zahlen als Streckenl¨ angen zuzu¨bergehen zu m¨ lassen, wenn man diese charakterisiert durch Betrag und Argument. Man beachte dabei, dass Addition und Halbierung von Winkeln (bei Multiplikation und Wurzelziehen erforderlich) mit Zirkel und Lineal m¨ oglich ist. Als Streckenl¨ angen im Sinne der Elementargeometrie treten dann genau die Betr¨ age der genannten komplexen Zahlen auf. Hilfssatz 7.26 Die aus der Streckenl¨ange 1 mit Zirkel und Lineal konstruierbaren Streckenl¨angen bilden einen K¨orper Z ⊂ C , und zwar den kleinsten Un√ alt. terk¨orper von C , der mit jedem z ∈ Z auch z enth¨ Trivialerweise kann man n¨amlich durch Aneinanderlegen von Strecken auf einer Geraden oder durch Parallelverschiebung in C Streckenl¨ angen addieren und subtrahieren. Der Strahlensatz sorgt daf¨ ur, dass man in Gleichungen des Typs a : b = x : y aus drei St¨ ucken > 0 stets das vierte bestimmen kann. Damit ist Z abgeschlossen unter Multiplikation und Division. Dass man aus jedem positiven z ∈ Z die Quadratwurzel in Z ziehen kann, folgt aus einem Satz u ohen in ¨ber die H¨ rechwinkligen Dreiecken: Die H¨ohe auf die Hypotenuse habe die L¨ ange z und teile die Hypotenuse in Streckenabschnitte der L¨ ange x und y . Dann ist x y = z2 , man kann also durch Wahl z.B. von y = 1 mit Hilfe des Satzes von Thales die Quadratwurzel aus x ziehen. Umgekehrt zeigen die Schnittformeln f¨ ur Kreise und Geraden aus der analytischen Geometrie, dass alle aus der L¨ange 1 mit Zirkel und Lineal konstruierbaren Streckenl¨angen in Z liegen m¨ ussen. 2 Satz 7.27 Jede mit Zirkel und Lineal aus der Streckenl¨ange 1 konstruierbare Strecke z liegt in einer normalen K¨orpererweiterung L/Q vom Grad 2n . Jede normale K¨orpererweiterung L/Q vom Grad 2n , n = 0, 1, . . . , ist Unterk¨ orper von Z , und Z ist gerade die Vereinigung aller dieser K¨ orpererweiterungen. Der Beweis des ersten Teils des Satzes folgt direkt aus dem Hilfssatz zusammen mit der Beobachtung, dass Quadratwurzeln entweder im K¨ orper selbst liegen oder eine K¨orpererweiterung vom Grad 2 erzeugen, und dass sich die K¨ orpergrade
192
7.6 Konstruktionen mit Zirkel und Lineal
bei sukzessiver Erweiterung multiplizieren (Satz 6.4). Die zweite Aussage l¨ asst sich mit Galoistheorie und einer Erinnerung an die Sylowschen S¨ atze und ihre Folgerungen f¨ uhren: Gal L/Q ist eine p-Gruppe, hier mit p = 2 , und darum nach Folgerung 2.28 aufl¨osbar, d.h. es gibt eine Kette von Untergruppen {e} = G0 G1 G2 . . . Gn−1 Gn = Gal L/Q , dabei jedes Gi Normalteiler in Gi+1 mit zyklischer Faktorgruppe Gi+1 /Gi . Die Ordnungen dieser Faktorgruppen k¨onnen auch nur Potenzen von 2 sein. Man kann darum solange weitere Untergruppen in diese Kette einschieben, bis alle Faktorgruppen ∼ = Z/2Z sind (in Abschnitt 7.8 werden wir solche Situationen noch ausf¨ uhrlich untersuchen). Dann entspricht diesen Untergruppen eine absteigende Folge von Unterk¨orpern L = L0 ⊃ L1 ⊃ . . . ⊃ Ln−1 ⊃ Ln = Q , jeder K¨orper quadratische Erweiterung des n¨ achsten, aus diesem also durch Adjunktion einer geeigneten Quadratwurzel zu gewinnen. Durch Induktion u ¨ber n folgt also L ⊂ Z . Nach dem Hilfssatz liegt schließlich jedes z ∈ Z in einem dieser K¨orper L , und daraus folgt die letzte Behauptung. 2 Genauso beweist man die Folgerung 7.28 Gibt man sich nicht nur die Streckenl¨ange 1 , sondern noch weitere (o.B.d.A. positive reelle) L¨angen s1 , . . . , sm vor, so l¨asst sich z aus diesen genau dann mit Zirkel und Lineal konstruieren, wenn z in einer normalen K¨ orpererweiterung L von Q(s1 , . . . , sm ) von einem Grad 2n liegt.
7.6.2 Beispiele 1.) Das Delische Problem der W¨ urfelverdoppelung: Gegeben ein W¨ urfel √ der Kantenl¨ange 1 . Kann man mit Zirkel und Lineal die Kantenl¨ ange a = 3 2 eines W¨ urfels mit doppeltem Volumen konstruieren? Wir wissen inzwischen, dass [Q(a) : Q] = 3 ist und darum a in keinem K¨orper vom Grad 2n u ¨ber Q enthalten ist. Damit ist klar, dass das Delische Problem unl¨osbar ist. 2.) Die Quadratur des Kreises: Man ersetze den Kreis von Radius 1 durch ein √ fl¨achengleiches Quadrat, dessen Kantenl¨ange π mit Zirkel und Lineal zu konstruieren ist. Seit Lindemann (1882) weiß man, dass dieses Problem unl¨ osbar ist, weil π transzendent ist. Auf den Transzendenzbeweis werden wir in Abschnitt 7.10 zu sprechen kommen.
193
7 Galoistheorie
3.) Die Winkeldreiteilung: Gegeben ein Winkel, o.B.d.A. am Einheitskreis. Ist es immer m¨oglich, diesen mit Zirkel und Lineal in drei gleiche Teile zu teilen? Hier ist die komplexe Schreibweise besonders bequem, denn man hat sich nur ein ζ ∈ C vom komplexen Betrag 1 vorzugeben und zu fragen, ob die Gleichung z3 − ζ = 0 L¨osungen in einer K¨orpererweiterung von Q(ζ) vom Grad 2n besitzt. In speziellen F¨allen wie ζ = 1 oder −1 ist das wirklich so, weil dann das Polynom reduzibel ist u ¨ber Q(ζ) . Im allgemeinen ist aber auch dieses Problem mit Zirkel und Lineal nicht l¨osbar, weil die entstehende K¨orpererweiterung vom Grad 3 ist: Man sieht osung der Gleichung, und wir das am Beispiel ζ = ζ3 , denn dann ist ζ9 eine L¨ wissen aus Abschnitt 7.2, dass [Q(ζ9 ) : Q(ζ3 )] =
[Q(ζ9 ) : Q] ϕ(9) = = 3 [Q(ζ3 ) : Q] ϕ(3)
ist. Nat¨ urlich besteht auch die M¨oglichkeit, das Problem reell anzugehen und eine entsprechende Gleichung f¨ ur die Realteile x von z und c von ζ aufzustellen (die cosinus-Werte der fraglichen Winkel). Diese lautet 4x3 − 3x − c = 0 und ist z.B. f¨ ur c = 3/4 nach dem Eisensteinschen Kriterium irreduzibel. 4.) Welche regelm¨aßigen n-Ecke lassen sich mit Zirkel und Lineal konstruieren? Da wir mit Zirkel und Lineal stets den Mittelpunkt des n-Ecks finden k¨ onnen, ist die Frage dazu ¨aquivalent, ob man in C die n-ten Einheitswurzeln mit Zirkel und Lineal konstruieren kann. Nach dem Satz und unseren Kenntnissen u ¨ber n-te Einheitswurzeln ist das regelm¨aßige n-Eck genau dann konstruierbar, wenn ϕ(n) eine Zweierpotenz ist. Da die Phi-Funktion multiplikativ ist, lautet das Resultat: Das regelm¨aßige n-Eck l¨asst sich genau dann mit Zirkel und Lineal konstruieren, wenn n Produkt einer Zweierpotenz und paarweise verschiedener Fermatscher m Primzahlen 22 + 1 ist (unseres heutigen Wissens nach also der Primzahlen 3, 5, 17, 257, 65537 ; zu den Fermatzahlen Fm vgl. Folgerung 5.4 und die daran anschließenden Bemerkungen). Das 7- und das 9-Eck sind also die ersten nicht konstruierbaren n-Ecke. Die Konstruktion des regul¨ aren 5-Ecks ist sehr alt und hat u oglicherweise eine große Rolle ¨ber den goldenen Schnitt“ seit der Antike m¨ ” in Malerei und Architektur gespielt; dass das regul¨ are 17-Eck konstruierbar ist, hat als erster C.F. Gauß gezeigt. Herrn Behr verdanke ich die Information, dass in den Archiven des G¨ottinger Mathematischen Seminars ein Manuskript u ¨ber die explizite Konstruktion des 65537-Ecks schlummert (eine unter Hilbert entstandene Doktorarbeit!).
194
7.7 Kummer-Theorie. Au߬ osung algebraischer Gleichungen
7.7 Kummer-Theorie. Aufl¨ osung algebraischer Gleichungen Neben der Behandlung von Galois-Erweiterungen besonders einfachen Typs befasst sich auch dieser Abschnitt mit einer Frage, die in erster Linie von historischem Interesse ist: Wann kann man die L¨osungen algebraischer Gleichungen mit Hilfe von sukzessivem Wurzelziehen beschreiben? Im Zeitalter ausgefeilter numerischer Methoden und schneller Computer scheint diese Frage unwichtig zu sein. Die Antwort, welche wieder einmal die Galoistheorie liefert, f¨ uhrt jedoch auf wichtige Konzepte der Gruppentheorie, die wir anschließend weiter verfolgen wollen und die auch unabh¨angig von der urspr¨ unglichen Fragestellung Bedeutung besitzen.
7.7.1 Radikale Satz 7.29 Sei K ein K¨ orper, a ∈ K , n ∈ N und car K n , ζ = ζn eine ¯ wird als primitive n-te Einheitswurzel u ¨ber K . Eine Nullstelle von xn − a in K √ n a bezeichnet (welche der Nullstellen, muss man festlegen). xn − a Radikal √ hat den Zerf¨allungsk¨orper K( n a , ζ) und zerf¨allt dort in
( x − ζj
√ n
a) .
j mod n
√ ¯ das Radikal und L der Zerf¨ Beweis: Sei r := n a ∈ K allungsk¨ orper des Polynoms. Dann gilt in L[x] xn − a = a (r−1 x)n − a = a ((r−1 x)n − 1) = a
(r−1 x − ζ j ) ,
j mod n
und daraus folgt die Behauptung. 2 Satz 7.30 Seien K ein K¨ orper, n ∈ N , car K n , a ∈ K . Die primitive n-te √ Einheitswurzel ζ liege in K . Dann ist K( n a ) eine zyklische (separable, normale) K¨orpererweiterung von K mit Galoisgruppe √ Gal K( n a )/K = < σ > , √ wobei m = [K( n a ) : K] ein Teiler von n ist und σ bestimmt durch √ √ σ( n a ) := ζ n/m · n a . √ m ist die kleinste nat¨ urliche Zahl mit ( n a )m ∈ K .
195
7 Galoistheorie
Beweis: Dass die Erweiterung separabel ist, folgt aus der Voraussetzung u ¨ber die Charakteristik. Die Normalit¨at sieht man an der Zerlegung des Polynoms xn − a √ in die Linearfaktoren x − ζ j n a . Die Galoisgruppe kann diese Linearfaktoren nur permutieren (Hilfssatz 6.20) und l¨asst alle ζ j fest, jeder Galois-Automorphismus ist also eindeutig bestimmt durch √ √ σ( n a ) = ζ jσ · n a , jσ ∈ Z/nZ . Man rechnet leicht nach, dass
√ σ → [jσ ]n : Gal K( n a )/K → Z/nZ
ein injektiver Gruppenhomomorphismus ist in die additive Restklassengruppe Z/nZ . Das Bild muss zyklisch sein, erzeugt von [d]n , d | n , und von der Ordnung √ √ m = nd = [K( n a ) : K] . Das irreduzible Polynom des Radikals n a ist √ √ √ n ( x − ζ m k n a ) = xm − ( n a )m = xm − n/m a , k mod m
und daraus folgt auch die letzte Behauptung. 2 Im Abschnitt 7.7.3 werden wir sehen, dass dieser Satz eine nat¨ urliche Umkehrung besitzt. Es ist jedoch zweckm¨aßig, dazu zun¨ achst ein einfaches Hilfsmittel einzuf¨ uhren.
7.7.2 Artins Lemma Hilfssatz 7.31 Seien L und M K¨ orper und σ1 , . . . , σn paarweise verschiedene Isomorphismen L → M . Dann sind die σi linear unabh¨ angig, d.h. wenn a1 , . . . , an ∈ M und a1 σ1 (α) + . . . + an σn (α) = 0
∀α∈L,
so ist
a1 = . . . = an = 0 .
Beweis: Andernfalls g¨abe es a1 , . . . , ar ∈ M , alle = 0 , mit der Eigenschaft a1 σ1 (α) + . . . + ar σr (α) = 0 ∀ α ∈ L .
(7.4)
Dabei d¨ urfen wir annehmen, dass r ∈ N minimal gew¨ ahlt ist. Nat¨ urlich ist r > 1 und σ1 = σr , es gibt also ein β ∈ L mit σ1 (β) = σr (β) , also a1 σ1 (βα) + . . . + ar σr (βα) = a1 σ1 (β)σ1 (α) + . . . + ar σr (β)σr (α) = 0 . (7.5) Nun multipliziere man Gleichung (7.4) mit σ1 (β) a1 σ1 (β) σ1 (α) + . . . + ar σ1 (β) σr (α) = 0 , bilde die Differenz zur Gleichung (7.5) a1 (σ1 (β) − σ1 (β)) σ1 (α) + . . . + ar (σ1 (β) − σr (β)) σr (α) = 0 ; man erh¨alt eine nichttriviale verschwindende Linearkombination der σ2 , . . . , σr kleinerer L¨ange im Widerspruch zu unserer Annahme u ¨ber r . 2
196
7.7 Kummer-Theorie. Au߬ osung algebraischer Gleichungen
7.7.3 Zyklische K¨ orpererweiterungen Satz 7.32 Der K¨ orper K enthalte die n-ten Einheitswurzeln, dabei sei car K | n ∈ N und L/K eine (separable, normale) zyklische K¨orpererweiterung vom Grad n . Dann gibt es ein a ∈ K mit √ L = K( n a ) . Beweis: Sei ζ eine primitive n-te Einheitswurzel in K und σ ein erzeugendes Element der Galoisgruppe Gal L/K . Zu einem α ∈ L definiert man die Lagrangesche Resolvente durch θ := α + ζ σ(α) + ζ 2 σ2 (α) + . . . + ζ n−1 σ n−1 (α) . Nach dem Artinschen Lemma kann man dabei α so w¨ ahlen, dass θ = 0 ist. Mit n = id , ζ n = 1 einer solchen Wahl ist wegen σ σ(θ) = σ(α) + ζ σ 2 (α) + . . . + ζ n−1 σn (α) = ζ −1 θ =⇒
σ2 (θ) = ζ −2 θ
=⇒
...
=⇒
σ j (θ) = ζ −j θ ,
θ ist also in keinem echten Zwischenk¨orper von L/K enthalten, folglich gilt L = K(θ) . Nun definiert man a := θn , dann ist σ j (a) = (σ j (θ))n = (ζ −j θ)n = θ n = a ∀ j , also muss a im Grundk¨orper K liegen, wie behauptet. 2
7.7.4 Charaktere abelscher Gruppen Um unsere Resultate u oßere Klasse ¨ber zyklische K¨orpererweiterungen auf eine gr¨ von Galoisgruppen zu verallgemeinern, ist es zweckm¨ aßig, zun¨ achst eine Erg¨ anzung zum Abschnitt 2.9 vorzunehmen. In Analogie zur Dualraumtheorie in der linearen Algebra gilt: Satz 7.33 (mit Definition) Sei A eine endliche abelsche Gruppe. 1. Die Gruppenhomomorphismen h : A → C∗ nennt man Charaktere der Gruppe A ; die Charaktere von A bilden selbst eine abelsche Gruppe Aˆ , die Charaktergruppe von A , wobei die Multiplikation durch die punktweise Multiplikation der Werte erkl¨art wird. 2. Die Werte der Charaktere sind Einheitswurzeln. 3. A ∼ = Aˆ
197
7 Galoistheorie
4. Zu jeder Untergruppe H ⊆ A geh¨ ort eine Untergruppe H 0 := { h ∈ Aˆ | h(a) = 1 ∀ a ∈ H } ⊆ Aˆ der Charaktergruppe. H 0 ist isomorph zur Charaktergruppe der Restklassengruppe A/H . Auf der Menge aller Untergruppen von A ist die Zuordnung H → H 0 bijektiv und inklusionsumkehrend. Es gilt (H 0 )0 ∼ =H. 5. Seien A und B zwei endliche abelsche Gruppen und die Abbildung β : A × B → C∗ sei in jeder Komponente ein Gruppenhomomorphismus (eine Paarung), d.h. f¨ ur alle a ∈ A und f¨ ur alle b ∈ B werden durch a → β(a, )
und
b → β( , b)
ˆ und βB : B → Aˆ definiert. Diese Homomorphismen βA : A → B βA , βB sind beide Isomorphismen genau dann, wenn die Paarung nicht entartet ist, d.h. wenn βA und βB injektiv sind. 6. Insbesondere ist
Aˆ × A : → C∗ : (h, a) → h(a)
eine nicht entartete Paarung. ˆ. 7. In jeder nicht entarteten Paarung G × A → C∗ ist G ∼ = Aˆ und A ∼ =G Der Beweis von 1. ist Routine. Zum Beweis von 2. sei n die Ordnung von a ∈ A ; ¨ f¨ ur jedes h ∈ Aˆ ist dann h(a)n = 1 . Ahnlich l¨ asst sich 3. beweisen: Wir wissen aus Satz 2.38, dass A isomorph ist zu Z/d1 Z × . . . × Z/dr Z und bezeichnen mit a1 , . . . , ar erzeugende Elemente jener Untergruppen von A , die zu den Faktoren dieses Produkts isomorph sind (also mit ord aj = dj ). Dann ist jeder Homomorphismus h ∈ Aˆ eindeutig bestimmt durch die Werte h(aj ) , diese sind frei w¨ahlbare dj -te Einheitswurzeln, also ist Aˆ ∼ = Z/d1 Z × . . . × Z/dr Z ∼ = μd1 × . . . × μdr ∼ = A. Da die Erzeugenden aj i.a. nicht eindeutig bestimmt sind, ist diese Isomorphie allerdings nicht kanonisch“, d.h. eindeutig durch A bestimmt; auch dies ist ganz ” analog zur Dualraumtheorie f¨ ur Vektorr¨aume.— In 4. ist klar, dass H 0 eine Untergruppe von Aˆ ist und dass die Zuordnung H → H 0 inklusionsumkehrend ist. Nach dem Homomorphiesatz der Gruppentheorie l¨ asst sich eine Bijektion ¯ : A/H → C∗ ) ( h : A → C∗ , h ∈ H 0 ) ←→ ( h zwischen H 0 und den Charakteren von A/H leicht angeben. Daraus folgt ord H 0 = ord A/ord H . Die inklusionsumkehrende Zuordnung H → H 0 muss darum wirklich eine Bijektion sein. Jedes a ∈ A definiert verm¨ oge a : h → h(a) : Aˆ → C∗
198
7.7 Kummer-Theorie. Au߬ osung algebraischer Gleichungen
einen Charakter auf Aˆ . Nach Definition liegen dabei Elemente a der Untergruppe H in (H 0 )0 . Wegen ord (H 0 )0 =
ord Aˆ ord H = ord H = ord A · ord H 0 ord A
gilt sogar die Gleichheit H = (H 0 )0 .— 5. und 6. sind wieder sehr leicht zu beweisen: Wenn βA und βB Isomorphismen sind, m¨ ussen sie nat¨ urlich injektiv sein. Umgekehrt folgt aus der Injektivit¨at auch die Surjektivit¨ at verm¨ oge ˆ = ord B ≤ ord Aˆ = ord A . ord A ≤ ord B 7. folgt aus 3. und 5. 2
7.7.5 Kummersche K¨ orpererweiterungen Nach E. E. Kummer (1810–1893), der sich u.a. große Verdienste um die Entwicklung der algebraischen Zahlentheorie erworben hat, sind die im folgenden Satz beschriebenen K¨orpererweiterungen benannt. Wie in der Galoistheorie beschr¨ anken wir uns dabei auf Erweiterungen endlichen Grades, obwohl eine gut ausgebaute Verallgemeinerung f¨ ur unendlichen Grad existiert und hier sogar besonders reizvoll ist: Sie erlaubt es, unter geeigneten Voraussetzungen an den Grundk¨ orper (Existenz n-ter Einheitswurzeln) alle abelschen Erweiterungen vom Exponenten n (s.u.) bereits an der Struktur der multiplikativen Gruppe des Grundk¨ orpers abzulesen (Ein sehr viel tiefer gehendes Programm wird in dieser Richtung von der Klassenk¨orpertheorie verwirklicht). Satz 7.34 Sei n ∈ N und K ein K¨ orper, der die n-ten Einheitswurzeln enth¨ alt, car K n . F¨ ur eine algebraische K¨orpererweiterung L/K sind folgende Eigenschaften ¨ aquivalent: √ √ 1. Es gibt a1 , . . . , ar ∈ K mit L = K( n a1 , . . . , n ar ) . 2. Es gibt eine Untergruppe M ⊆ K ∗ , welche die Untergruppe K ∗n aller √ nten Potenzen in K ∗ von endlichem Index enth¨ alt, so dass L = K( n M ) ist, d.h. von allen n-ten Wurzeln aus M erzeugt wird. 3. L wird u ¨ber K erzeugt von allen n-ten Wurzeln aus L∗n ∩ K ∗ , und ∗n A := (L ∩ K ∗ )/K ∗n ist eine endliche abelsche Gruppe. 4. Die K¨ orpererweiterung L/K ist normal und separabel; ihre Galoisgruppe G = Gal L/K ist abelsch vom Exponenten n“, d.h. f¨ ur alle σ ∈ G ist ” σn = 1 . Wenn diese Eigenschaften erf¨ ullt sind, existiert eine nicht ausgeartete Paarung G × A → μ n ⊂ C∗ ,
199
7 Galoistheorie
d.h. es bestehen kanonische Isomorphismen G ∼ = Aˆ
und
ˆ A ∼ = G
und eine (nicht kanonische) Isomorphie G = Gal L/K ∼ = (L∗n ∩ K ∗ )/K ∗n = A . ¨ Die Aquivalenz der ersten zwei Aussagen ist sehr leicht einzusehen: Zum Beweis von 1. ⇒ 2. w¨ahle man M als die von K ∗n und a1 , . . . , ar erzeugte Gruppe. F¨ ur ∗ 2. ⇒ 1. w¨ahle man a1 , . . . , ar ∈ K als Repr¨ asentanten von Erzeugenden von A := M/K ∗n .— 1. bzw. 2. ⇒ 4.: Aus car K n folgt bereits, dass die in 1. beschriebene Erweiterung separabel ist. Aus der Theorie zyklischer K¨ orpererweiterungen wissen wir, √ dass mit allen Erzeugenden n aj auch alle Konjugierten zu L geh¨ oren, weil K die n-ten Einheitswurzeln enth¨alt. Also folgt aus 1., dass L/K galoissch ist. Dar¨ uber √ n hinaus ist f¨ ur jedes a ∈ M der Zwischenk¨orper K( a) zyklisch, also gibt es zu jedem σ ∈ G := Gal L/K eine n-te Einheitswurzel ζ = ζ(σ, a) mit √ √ σ( n a) = ζ(σ, a) n a . Da alle diese Einheitswurzeln zum Grundk¨orper geh¨ oren, h¨ angen die ζ(σ, a) in der Tat nicht von der Auswahl der n-ten Wurzel ab, sondern nur von a selbst. Aus dem gleichen Grund gilt f¨ ur alle σ, τ ∈ G στ = τ σ
und
σn = 1 ;
da die σ ∈ G durch ihre Wirkung auf die Erzeugenden bestimmt sind.
√ n a , a ∈ M , eindeutig
4. ⇒ 1.: Da G endliche abelsche Gruppe ist, wissen wir aus Satz 2.38, dass G ∼ = Z/d1 Z × . . . × Z/dr Z ist, und nach Voraussetzung sind hier zus¨atzlich alle dj | n . Sei nun Gj jene Untergruppe von G , welche entsteht, wenn man in der j-ten Komponente der Produktzerlegung von G , also in Z/dj Z , nur das neutrale Element [0]dj ] zul¨ asst. Nach dem Hauptsatz der Galoistheorie ist dann der Fixk¨ orper Lj von Gj normal und separabel u ¨ber K mit Galoisgruppe Gal Lj /K ∼ = G/Gj ∼ = Z/dj Z , √ also eine zyklische Erweiterung K( n aj ) f¨ ur ein aj ∈ K (wegen dj | n d¨ urfen √ wir die dj -ten Wurzeln als n-te Wurzeln schreiben). Nach Konstruktion ist n aj invariant unter der Operation von Gj auf L . Darum zeigt die Produktzerlegung von G und die Operation der Komponenten auf den Erzeugenden, dass der K¨ orper √ √ K( n a1 , . . . , n ar ) ⊆ L
200
7.7 Kummer-Theorie. Au߬ osung algebraischer Gleichungen
u ¨ber K mindestens die Automorphismengruppe G besitzt. In der Ungleichungskette √ √ ord G ≤ [K( n a1 , . . . , n ar ) : K] ≤ [L : K] = ord G k¨onnen also nur Gleichheiten stehen, somit gilt 1. ¨ Bevor wir die Aquivalenz zu 3. zeigen, ist es zweckm¨ aßig, die u ¨brigen Aussagen des ∗n . Man rechnet unmittelbar Satzes vorwegzunehmen, und zwar f¨ ur A := M/K nach, dass die oben eingef¨ uhrten Einheitswurzeln ζ(σ, a) nur von der Restklasse aK ∗n abh¨angen. Wenn wir also die Funktion β : G × A = G × M/K ∗n → μn :
(σ, aK ∗n ) → ζ(σ, a)
ur einf¨ uhren, so zeigt sich — wieder unter Verwendung von μn ⊂ K ∗ —, dass f¨ alle a, b ∈ M und alle σ, τ ∈ G ζ(στ, a) = ζ(σ, a)ζ(τ, a)
und ζ(σ, ab) = ζ(σ, a)ζ(σ, b)
gilt, dass also durch β eine Paarung auf G × A definiert wird. Diese ist nicht entartet: Wenn f¨ ur ein σ ∈ G und f¨ ur alle aK ∗ , a ∈ M , der Wert β(σ, aK ∗ ) = 1 √ √ √ ist, so heißt das ζ(σ, a) = 1 oder besser σ( n a) = n a . Da n a alle Erzeugenden von L durchl¨auft, bedeutet das σ = 1 . Wenn andererseits f¨ ur alle σ ∈ G √ gilt β(σ, a) = 1 , so folgt daraus analog n a ∈ Fix G = K (Galoistheorie), also a ∈ K ∗n . Die u ¨brigen Aussagen sind eine direkte Konsequenz des im letzten Abschnitt hergeleiteten Satzes u ¨ber Charaktergruppen. Wir notieren eine einfache Konsequenz: ord A = (M : K ∗n ) = ord G = [L : K] 3. ⇒ 2. ist wieder sehr leicht einzusehen: Man nehme M := L∗n ∩ K ∗ . F¨ ur 2. ⇒ ∗n ∗ 3. beachte man, dass das M aus Eigenschaft 2. nat¨ urlich in L ∩ K liegt. W¨ are L∗n ∩ K ∗ echt gr¨oßer als M , so k¨onnte man eine echte Obergruppe M √von M finden, nach wie vor mit endlichem Index (M : K ∗n ) und mit L = K( n M ) = √ n K( M ) . Wie oben bewiesen, gilt dann (M : K ∗n ) = [L : K] = (M : K ∗n ) , demnach M = M , es muss also L∗n ∩ K ∗ = M sein. 2
7.7.6 Aufl¨ osbare Gleichungen und aufl¨ osbare Gruppen Kummersche K¨orpererweiterungen sind also dadurch ausgezeichnet, dass ihre Galoisgruppen direkte Produkte zyklischer Gruppen sind. Eine kompliziertere M¨ oglichkeit, Galoisgruppen aus zyklischen Gruppen zusammenzusetzen, werden wir nun studieren.
201
7 Galoistheorie
Satz 7.35 Sei K ein K¨ orper der Charakteristik 0 oder > n ∈ N , f (x) = an xn + . . . + a1 x + a0 ∈ K[x] ein Polynom vom Grad n mit Zerf¨allungsk¨ orper L ⊇ K . Die Gleichung f (x) = 0 ist genau dann durch Radikale aufl¨ osbar, d.h. L und insbesondere die Wurzeln von f liegen in einer von Radikalen erzeugten K¨orpererweiterung von K , wenn die Galoisgruppe Gal L/K aufl¨ osbar ist. Zum Beweis sei zun¨achst an Folgerung 2.28 erinnert, dass G = Gal L/K aufl¨ osbar heißt, wenn eine Kette von Untergruppen {e} = G0 G1 . . . Gr−1 Gr = G existiert, f¨ ur die jedes Gi Normalteiler in Gi+1 ist mit zyklischer Faktorgruppe Gi+1 /Gi . Nach dem Hauptsatz der Galoistheorie entspricht dieser Kette von Untergruppen eine Kette von Zwischenk¨orpern L = L0 ⊃ L1 ⊃ . . . ⊃ Lr−1 ⊃ Lr = K , wobei jedes Li = Fix Gi normale separable zyklische K¨ orpererweiterung von Li+1 ist mit Galoisgruppe Gi+1 /Gi . 1. Nun machen wir zun¨achst die zus¨atzliche Annahme, K enthalte schon alle m-ten Einheitswurzeln f¨ ur alle m ≤ n . Nach Voraussetzung ist car K m , also erzeugt nach Satz 7.30 die Adjunktion m-ter Wurzeln eine zyklische Erweiterung asst sich dieser Prozess iteLr−1 . Wenn die Gleichung f (x) = 0 aufl¨osbar ist, l¨ rieren, um den Zerf¨allungsk¨orper L von f u ¨ber K zu erzeugen; dabei entsteht eine Kette normaler zyklischer K¨orpererweiterungen Li /Li+1 und damit genau eine solche Kette von Untergruppen Gi = Fix Li , welche die Aufl¨ osbarkeit der Galoisgruppe G = Gal L/K beweist. 2. Unter der gleichen zus¨atzlichen Annahme sei nun die Galoisgruppe G des Zerf¨allungsk¨orpers L aufl¨osbar, die Untergruppen Gi und Zwischenk¨ orper Li = Fix Gi wie oben angegeben. Dann sagt Satz 7.32, dass jedes Li Radikalerweiterung von Li+1 ist. Induktion u ¨ber r zeigt also, dass L u ¨ber K durch schrittweise Adjunktion von Radikalen entsteht. 3. Nun muss noch die Voraussetzung u ¨ber die Einheitswurzeln beseitigt werden. Erstens ist dazu zu zeigen, dass die Galoisgruppe des Zerf¨ allungsk¨ orpers von f aufl¨osbar bleibt, wenn man den Grundk¨orper K durch eine Erweiterung K(ζ) ersetzt, ζ eine N -te Einheitswurzel. Das folgt daraus, dass Li (ζ)/Li+1 (ζ) normal und separabel bleibt, wenn Li /Li+1 normal und separabel ist (warum?), und dass die Restriktion jedes Automorphismus σ von Li (ζ)/Li+1 (ζ) auf Li in der Galoisgruppe von Li /Li+1 liegt; da ζ unter σ fest bleibt, ist σ durch diese Restriktion sogar eindeutig bestimmt, man erh¨ alt also eine nat¨ urliche Einbettung Gal Li (ζ)/Li+1 (ζ) → Gal Li /Li+1 .
202
7.7 Kummer-Theorie. Au߬ osung algebraischer Gleichungen
Da Untergruppen zyklischer Gruppen wieder zyklisch sind, bleiben alle Faktorgruppen auch bei Adjunktion von ζ zyklische Gruppen, die Galoisgruppe bleibt also aufl¨osbar. Zweitens ist durch Induktion u ¨ber m ≤ n zu zeigen, dass auch j selbst in Radikalerweiterungen von K liegen (immer die Einheitswurzeln ζm car K = 0 oder > m ): Das ist klar f¨ ur m = 1 ; sei diese Eigenschaft f¨ ur Einheitswurzeln kleinerer Ordnung bereits gezeigt, dann ist K(ζm )/K normal separabel mit Galoisgruppe Gal K(ζm )/K ⊆ (Z/mZ)∗ , also auf alle F¨alle abelsch, somit aufl¨osbar, von einer Ordnung ≤ ϕ(m) < m . Nach Induktionsannahme und dem oben gef¨ uhrten zweiten Beweisschritt l¨ asst sich K(ζm ) aus K durch schrittweise Adjunktion von Radikalen erzeugen. 2
7.7.7 Beispiele 1. Alle quadratischen K¨orpererweiterungen in Charakteristik = 2 sind Radikalerweiterungen, was man schon auf der Schule durch quadratische Erg¨ anzung“ ” quadratischer Gleichungen lernt. Es ist instruktiv,√sich hier die Lagrangesche Resolvente aus der N¨ahe anzusehen: F¨ ur α = a + b d und ζ = −1 wird √ √ √ θ = α + ζ σ(α) = a + b d − ( a − b d ) = 2 b d . 2. Seien x1 , . . . , xn algebraisch unabh¨angig u orper k , z.B. unabh¨ angige ¨ber dem K¨ Variable, s1 , . . . , sn die elementarsymmetrischen Polynome von x1 , . . . , xn , und sei K := k(s1 , . . . , sn ) , car k = 0 oder > n . Dann hat der Zerf¨ allungsk¨ orper L = k(x1 , . . . , xn ) des Polynoms f (x) := xn − s1 xn−1 + s2 xn−2 − + . . . + (−1)n sn die Galoisgruppe Gal L/K = Sn , denn jede Permutation der Wurzeln l¨ asst k und s1 , . . . , sn fest. f (x) = 0 heißt darum die allgemeine Gleichung n-ten Grades. Wir werden sehen, dass diese genau dann aufl¨ osbar ist, wenn n ≤ 4 ist. ¨ Insbesondere wird aus den Uberlegungen des n¨ achsten Abschnitts die historisch bedeutsame Erkenntnis von N.H. Abel (1824) folgen, dass algebraische Gleichungen von f¨ unftem oder h¨oherem Grad im allgemeinen nicht durch Radikale aufl¨osbar sind. 3. Zun¨achst aber zu den allgemeinen Gleichungen kleineren Grades: Nach dem Hauptsatz dieses Paragraphen haben wir zu zeigen, dass Sn aufl¨ osbar ist f¨ ur n ≤ 4 . Das ist klar f¨ ur n = 1 und 2 . F¨ ur n = 3 folgt es aus {(1)} A3 S3 ,
(7.6)
wobei A3 hier die (zyklische) Drehgruppe der Ordnung 3 ist und S3 /A3 bekanntlich von der Ordnung 2 (vgl. die Abschnitte 2.1.4 und 2.6.4). F¨ ur n = 4 erh¨ alt man eine Aufl¨ osung von S4 z.B. in der Form {(1)} {(1), (1 2)(3 4)} V A4 S4
203
7 Galoistheorie
mit der Kleinschen Vierergruppe V := {(1), (1 2)(3 4), (1 3)(2 4), (1 4)(2 3)} . Es ist leicht nachzurechnen, dass V Normalteiler in A3 ist, etwa mit Hilfe von Satz 2.2.6, und zwar mit zyklischer Restklassengruppe von der Ordnung 3 . Alle anderen fraglichen Restklassengruppen sind zyklisch von Ordnung 2 . 4. Damit ist freilich noch keine explizite Konstruktion der Wurzeln von f (x) = 0 durch Adjunktion von Radikalen gewonnen. Wie man die Wurzeln explizit erh¨ alt, sei am Beispiel der sogenannten Formel von Cardano (1545, vorher jedoch schon von Scipio del Ferro und Tartaglia gefunden) f¨ ur n = 3 erl¨ autert: Zun¨ achst kann man die Gleichung f¨ ur car K n durch die Substitution x = y + sn1 zu f (x) = y n + b2 y n−2 + . . . + b0 = 0 vereinfachen. Dann gilt im Fall n = 3 der Satz 7.36 Sei √ car K 6 . K enthalte eine primitive dritte Einheitswurzel ζ = 12 (−1 + −3) . Dann hat die Gleichung y3 + p y + q = 0 die L¨ osungen √ √ 3 3 α1 = A + B
,
α2 = ζ
√ 3
A + ζ2
√ 3 B
,
α3 = ζ 2
√ √ 3 3 A+ζ B,
# # p3 q p3 q q2 q2 + , B := − − + A := − + 2 4 27 2 4 27 √ √ 3 3 sind und A , B so normiert, dass √ √ p 3 3 A B = − . 3 wobei
Zum Beweis hat man einen Turm von K¨orpererweiterungen √ √ K( D, θ) ⊃ K( D) ⊃ K zu konstruieren, der nach dem Hauptsatz √ der Galoistheorie gerade der Untergruppenkette (7.6) entspricht. Dabei muss D eine A3 -invariante Funktion der Wurzeln sein; diese kennen wir aus Abschnitt 2.6.4 und wissen darum, dass D als ahlt werden kann (vgl. die BeispieDiskriminante −4p3 − 27q 2 des Polynoms gew¨ le zu Satz 3.13). Ferner weiß man, dass man θ als Resolvente f¨ ur eine zyklische Erweiterung vom Grad 3 w¨ahlen kann. Wenn also S3 durch √ Permutation √ der Indizes auf den Wurzeln der Gleichung operiert und Gal K( D, θ)/K( D) von der Permutation (1 2 3) erzeugt wird, kann man θ = α1 + ζ α2 + ζ 2 α3
204
7.8 Einfache Gruppen
√ annehmen und weiß dann, dass θ3 in K( D) liegen muss. Explizite Rechnung mit Hilfe der elementarsymmetrischen Funktionen 0 , p und −q der Wurzeln unseres Polynoms ergibt θ3 = −
27 3√ √ −3 D , q − 2 2
√ also θ = 3 3 B . Ganz analog erh¨alt man bei Verwendung der konjugierten dritten Einheitswurzel (oder der erzeugenden Permutation (1 3 2) ) als Resolvente √ 3 θ = α1 + ζ α3 + ζ 2 α2 = 3 A . Die Wahl dieser dritten Wurzeln in den Gleichungen f¨ ur θ und θ ist nicht unabh¨angig voneinander, denn man rechnet wie eben nach, dass θθ = −3p gelten muss. Jedenfalls ergeben die Gleichungen f¨ ur θ und θ zusammen mit α1 + α2 + α3 = 0 onnen. 2 ein lineares Gleichungssystem, aus denen die αi berechnet werden k¨
7.8 Einfache Gruppen 7.8.1 Grundbegriffe Dieser und der n¨achste Abschnitt sind eigentlich Nachtr¨ age zu 2.6 und 2.7, nun motiviert durch die Bedeutung der Aufl¨osbarkeit endlicher Gruppen, die sich via Galoistheorie im letzten Paragraphen herauskristallisiert hat. Normalreihen endlicher Gruppen G , d.h. Ketten von Untergruppen {e} = G0 G1 . . . Gr−1 Gr = G , f¨ ur die jedes Gj echter Normalteiler in Gj+1 ist, sind keineswegs eindeutig bestimmt. Wenn n¨amlich eine der Faktorgruppen Gj+1 /Gj einen echten Normalteiler N besitzt, so muss diesem nach dem zweiten Isomorphiesatz der Gruppen¯ und N ¯ /Gj ∼ ¯ von Gj+1 mit Gj N theorie ein Normalteiler N = N entsprechen. Die Normalreihe l¨asst sich also erst dann nicht mehr weiter durch Einf¨ ugen zus¨atzlicher Gruppen in die Kette verfeinern, wenn alle Faktorgruppen einfach sind; so werden Gruppen bezeichnet, welche nicht nur aus dem Einselement bestehen und keine echten Normalteiler besitzen. In diesem Fall nennt man die Normalreihe eine Kompositionsreihe von G ; dann kann man zeigen — was wir hier nicht tun wollen — dass die Kompositionsreihe zwar i.a. auch nicht eindeutig bestimmt ist, wohl aber die einfachen Faktoren Gj+1 /Gj , jedenfalls bis auf Reihenfolge und Isomorphie (Satz von Jordan-H¨ older). Umgekehrt ist G aber i.a. nicht bis auf Isomorphie eindeutig bestimmt durch diese Kompositionsfaktoren, und f¨ ur diese darf die Bezeichnung einfach“ nicht etwa als ”
7 Galoistheorie
205
unkompliziert“ missverstanden werden: Sie besagt nur, dass es sich hierbei um ” Grundbausteine der Gruppentheorie handelt. Der Traum, alle endlichen Gruppen bis auf Isomorphie zu klassifizieren, l¨asst sich also dann verwirklichen, wenn man • alle einfachen endlichen Gruppen klassifizieren kann, d.h. diese bis auf Isomorphie auflisten kann, • die Mechanismen beherrscht, wie eine endliche Gruppe aus einfachen Gruppen als Kompositionsfaktoren aufgebaut werden kann. Dieses ist ein sehr umfangreiches Programm, das nicht einmal dicke Monographien u onnen. Wir wollen hier nur ¨ber Gruppentheorie ersch¨opfend behandeln k¨ zum ersten Punkt einige wenige Beispiele kennenlernen, dies auch im Hinblick auf Galoistheorie und die Aufl¨osung algebraischer Gleichungen: Es ist u.a. zu zeigen, dass es u ¨berhaupt einfache nicht-zyklische endliche Gruppen gibt (die dann auch noch als Galoisgruppen vorkommen m¨ ussen!), wenn der Nachweis gef¨ uhrt werden soll, dass nicht alle algebraischen Gleichungen durch Radikale aufl¨ osbar sind.
7.8.2 Einfache abelsche Gruppen Satz 7.37 Eine abelsche Gruppe G ist genau dann einfach, wenn sie zyklisch von Primzahlordnung ist, d.h. isomorph zur additiven Gruppe Z/pZ . F¨ ur endliche abelsche Gruppen kann man n¨ amlich zu jedem Primteiler p der Ordnung eine Untergruppe der Ordnung p finden (Hilfssatz 2.23). Diese ist gleichzeitig Normalteiler und nur f¨ ur p = ord G kein echter Normalteiler. Dass Gruppen von Primzahlordnung zyklisch sind, wissen wir schon aus Satz 2.12. Fast trivialerweise gilt der Satz auch f¨ ur unendliche abelsche Gruppen: Jedes g ∈ G erzeugt eine zyklische Untergruppe, also einen Normalteiler. Ist dies kein echter Normalteiler und G unendlich, so muss G ∼ = Z sein, und diese Gruppe hat echte Normalteiler. 2 Damit ist auch gleichzeitig klar, dass eine einfache nichtzyklische Gruppe automatisch nichtabelsch sein wird.
7.8.3 Die alternierende Gruppe A5 Wir haben bereits im letzten Paragraphen gesehen, dass die symmetrischen Gruppen Sn und damit auch die alternierenden Gruppen An aufl¨ osbar sind f¨ ur n ≤ 4 . Der kleinstm¨ogliche Kandidat f¨ ur eine einfache nichtabelsche Gruppe unter den uns bisher pers¨onlich bekannten Gruppen ist daher die alternierende Gruppe A5 der Ordnung 60 , und dies ist in der Tat auch die kleinste einfache nichtabelsche Gruppe u ¨berhaupt (was wir hier aber nicht beweisen werden).
206
7.8 Einfache Gruppen
Satz 7.38 A5 ist einfach. Zum Beweis erinnere man sich zun¨achst an Hilfssatz 2.21: An wird erzeugt von allen Permutationen (i j)(k l) , dazu geh¨oren insbesondere auch die Dreierzykeln (i j k) = (i k)(i j) . Nat¨ urlich setzen wir dabei n ≥ 5 voraus; die Eintr¨ age in einem Zykel seien stets paarweise verschieden. Transpositionen (i j) geh¨ oren nicht zu An , und anhand der Definition rechnet man leicht aus, dass ebensowenig die Viererzykeln (i j k l) unferzykeln (i j k l m) . Nun lassen wir A5 durch zu An geh¨oren, wohl aber alle F¨ Konjugation auf sich selbst operieren und studieren die Einteilung in Bahnen: Hilfssatz 7.39 Bez¨ uglich der Konjugationsoperation zerf¨allt A5 in 1. eine Bahn {(1)} der L¨ ange 1 , 2. eine Bahn der L¨ ange 15 , bestehend aus allen Produkten (i j)(k l) disjunkter Transpositionen, 3. eine Bahn der L¨ ange 20 , bestehend aus allen Dreierzykeln (i j k) , 4. zwei Bahnen der L¨ange 12 , jeweils bestehend aus F¨ unferzykeln. Den Beweis des Hilfssatzes f¨ uhrt man nat¨ urlich u ¨ber eine Fallunterscheidung, wobei man zweckm¨aßigerweise die Konjugationsoperation von S5 auf A5 mitber¨ ucksichtigt: Z.B. sind nach Satz 2.2.6 alle 24 F¨ unferzykeln in S5 konjugiert, bilden also eine Bahn S5 · s z.B. f¨ ur das Element s = (1 2 3 4 5) . Die L¨ ange der Bahn berechnet sich dann als Index (S5 : S5,s ) von S5 nach der Fixgruppe S5,s des Elements s , hier also gerade die von s erzeugte Untergruppe von der Ordnung 5 , was uns in der Tat (S5 : S5,s ) =
ord S5 5! = 24 = ord S5,s 5
liefert. Da die Fixgruppe in A5 liegt, muss nach der gleichen Rechnung die Bahnalfte ergeben.— Genauso sind alle l¨ange f¨ ur die Operation von A5 gerade die H¨ Dreierzykeln in S5 konjugiert, und f¨ ur s = (1 2 3) ist die Fixgruppe von der Ordnung 6 , erzeugt von s selbst und von (4 5) . Hier liegt aber nicht diese ganze Fixgruppe in A5 ; die Fixgruppe A5,s f¨ ur dieses Element in A5 ist nur die von s erzeugte Untergruppe der Ordnung 3 , daher erhalten wir hier die Bahnenl¨ ange 20 .— Im Fall der Produkte zweier disjunkter Transpositionen kann man analog vorgehen: Die Fixgruppe von (1 2)(3 4) in A5 ist die schon im letzten Paragraphen in der Normalreihe von A4 aufgetretene Kleinsche Vierergruppe V und in S5 ist diese durch das zus¨atzliche erzeugende Element (1 2) zu einer Fixgruppe der Ordnung 8 zu erweitern. 2
207
7 Galoistheorie
Zum Beweis des Satzes erinnert man sich an die Klassenformel 2.20 f¨ ur die Konjugationsoperation von A5 auf sich: Die Gruppenordnung ist die Summe der Bahnenl¨angen, hier also 60 = 1 + 15 + 20 + 12 + 12 .
(7.7)
Ein Normalteiler N von A5 muss nun mit jedem Element auch alle seine A5 Konjugierten enthalten. Folglich muss ord N eine Teilsumme von (7.7) sein, andererseits aber ein Teiler von 60 . Da N das Einselement enth¨ alt, muss außerdem die Teilsumme das Glied 1 enthalten. 1 und 60 sind aber die einzigen Teilsummen von (7.7), welche diese Bedingungen erf¨ ullen, A5 kann also nur die trivialen Normalteiler {(1)} und A5 enthalten. 2
7.8.4 Konsequenzen Satz 7.40 F¨ ur alle n ≥ 5 ist die alternierende Gruppe An einfach. ur n > 5 mehrere zu A5 isomorphe UnterZum Beweis beachte man, dass An f¨ gruppen UT enth¨alt: F¨ ur jede 5-elementige Untermenge T von {1, . . . , n} sei UT jene Untergruppe von An , welche als alternierende Gruppe von Permutationen von T auf T operiert. Sei N ein Normalteiler von An . Wenn es ein T gibt mit N ∩ UT = {(1)} , so gilt sogar UT ⊆ N , denn UT ist einfach und N ∩ UT ist Normalteiler in UT . Nun sind aber alle Untergruppen UT in An zueinander konjugiert, wie man leicht mit Hilfe von Satz 2.2.6 beweisen kann; damit σ nicht nur in Sn , sondern sogar in An liegt, muss man notfalls σ noch mit einer auf T alt N also alle UT , operierenden Transposition multiplizieren. Mit einem UT enth¨ insbesondere alle Produkte (i j)(k l)
und
(i j k)
von zwei Transpositionen; diese erzeugen aber bereits die ganze Gruppe An , womit die Behauptung bewiesen w¨are. Bleibt nur noch zu zeigen, dass jeder Normalteiler N = {(1)} von An mindestens ein Element = (1) mit mindestens einer Untergruppe UT gemein hat. Andernfalls h¨atte N außer dem Einselement nur Elemente τ mit weniger als n−5 Fixpunkten, die also τ (i) = i f¨ ur mindestens sechs verschiedene i = 1, . . . , n erf¨ ullen. Nach Umnumerieren darf man annehmen, dass τ ∈ N von der Form (1 2)(3 4) · . . . ,
(1 2 3)(4 5 . . .) · . . . ,
(1 2 3 4) · . . .
oder (1 2 3 4 5 . . .) · . . .
ist. Konjugation mit σ = (1 3 4) ∈ An wirkt auf τ wie in Satz 2.2.6 beschrieben: Jeder Eintrag i in der Zykelschreibweise wird durch σ(i) ersetzt, insbesondere bleiben alle i ≥ 5 unge¨andert. Daraus folgt, dass das Produkt στ σ −1 τ −1 (der sogenannte Kommutator von σ und τ , der auch wieder in N liegt, warum?) zwar sicher = (1) ist, aber alle i ≥ 6 fest l¨asst, also in einem UT liegt. 2
208
7.9 Einfache lineare Gruppen
Folgerung 7.41 (E. Galois 1832) F¨ ur n ≥ 5 sind die symmetrischen Gruppen Sn nicht aufl¨ osbar. Dass n¨amlich keine Aufl¨osung {(1)} . . . N An Sn existieren kann, folgt aus der Einfachheit von An . Es gen¨ ugt also, zu zeigen, dass kein echter Normalteiler N = An von Sn mit zyklischer Faktorgruppe Sn /N existieren kann. So ein Normalteiler m¨ usste N ∩ An = {(1)}
und N An = Sn
erf¨ ullen, nach dem ersten Isomorphiesatz (mit U = An ) w¨ are also Sn /N = An N/N ∼ = An /(An ∩ N ) = An nicht zyklisch; mit wenig mehr Aufwand kann man dar¨ uber hinaus sogar zeigen, dass {(1)} An Sn die einzige Kompositionsreihe f¨ ur Sn ist. 2 Folgerung 7.42 Die allgemeine Gleichung n-ten Grades ist f¨ ur n ≥ 5 nicht durch Radikale aufl¨osbar. Im n¨achsten Abschnitt werden wir auf die Frage eingehen, was dieses Resultat f¨ ur das Umkehrproblem der Galoistheorie zu bedeuten hat.
7.9 Einfache lineare Gruppen Ziel dieses Abschnitts ist es vor allem, unser Repertoire an endlichen einfachen orpern zu erGruppen durch Einf¨ uhrung der Gruppen P SLn u ¨ber endlichen K¨ weitern und einen kurzen Ausblick auf die schon einmal angesprochenen Klassifikationsprobleme in Gruppentheorie und Galoistheorie zu geben.
7.9.1 Nochmals Gruppenoperationen Die Gruppe G operiere auf der Menge M . Diese Operation nennt man treu, wenn nur das Einselement e ∈ G als Identit¨ at auf M operiert, wenn also xs = s ∀ s ∈ M
=⇒
x = e
richtig ist; anders gesagt: Die Gruppenoperation definiert einen injektiven Gruppenhomomorphismus G → SM . Die Gruppenoperation von G auf M heißt zweifach transitiv, wenn auch Paare
209
7 Galoistheorie
verschiedener Punkte aus M durch Gruppenelemente aufeinander abgebildet werden k¨onnen, wenn also zu je zwei s1 = s2 und t1 = t2 ∈ M ein x ∈ G existiert mit xs1 = t1 , xs2 = t2 . Analog kann man n-fach transitive Gruppenoperationen definieren; mit Hilfe der Aufgaben 15 und 16 aus Abschnitt 2.10 l¨ asst sich z.B. zeigen, dass SL2 C dreifach transitiv auf C operiert. Die Operation von G auf M induziert nat¨ urlich eine Operation von G auf der Potenzmenge P(M ) . Sei π(M ) ⊆ P(M ) eine Partition von M , d.h. die Elemente von π(M ) sollen disjunkte Untermengen von M mit Vereinigung M sein. F¨ uhrt jedes x ∈ G diese Partition in sich u ¨ber, so nennen wir π(M ) G-stabil. Trivialerweise sind {M } und die Zerlegung von M in einelementige Teilmengen solche G-stabilen Partitionen. Wenn dies die einzigen G-stabilen Partitionen von M sind, nennt man die Operation von G auf M primitiv. Hilfssatz 7.43 Die Gruppe G operiert genau dann primitiv auf der Menge M , wenn zu jeder Untermenge A M mit mehr als einem Element ein x ∈ G existiert mit xA = A und xA ∩ A = ∅ . G¨abe es n¨amlich eine mehr als einelementige echte Untermenge A von M mit xA = A oder
xA ∩ A = ∅
∀x∈G,
so h¨atte man auch xA = yA
oder xA ∩ yA = ∅
f¨ ur alle x, y ∈ G . Dann bildet die G-Bahn von A in P(M ) zusammen mit dem Komplement von GA in M eine nichttriviale G-stabile Partition von M . Gibt es umgekehrt eine solche nichttriviale G-stabile Partition, so dient jede (mehr als einelementige) Untermenge A dieser Partition als Gegenbeispiel zu der im Hilfssatz genannten Bedingung. 2 Hilfssatz 7.44 1. Die Gruppe G operiere zweifach transitiv auf der Menge M . Dann operiert G primitiv auf M . 2. G operiere primitiv und treu auf M , und der Normalteiler H G bestehe nicht nur aus dem Einselement. Dann operiert H transitiv auf M . 3. Die Gruppe G operiere auf M , dabei operiere ihre Untergruppe H ⊆ G transitiv auf M . Sei s ∈ M und Gs die Fixgruppe von s in G . Dann ist G = H Gs . Beweis: 1. Sei A eine echte Untermenge von M mit mindestens zwei verschiedenen Elementen s = t . Da G zweifach transitiv auf M operiert, gibt es ein x ∈ G mit xs = s , xt ∈ A ; xA ist also weder = A noch disjunkt zu A . Nach dem letzten
210
7.9 Einfache lineare Gruppen
Hilfssatz operiert G primitiv auf M . 2. Es gibt ein s ∈ M so, dass A := Hs nicht nur aus s besteht, weil G treu operiert und H nicht nur das Einselement enth¨ alt. F¨ ur jedes x ∈ G hat man die folgende Alternative: Entweder geh¨ort xs zur H-Bahn A von s , dann ist ( H Normalteiler in G ) Hxs = xHs = xA , oder xA ist aus dem gleichen Grund disjunkt zu A . Da G primitiv auf M operiert, bleibt nach dem letzten Hilfssatz nur die M¨oglichkeit Hs = A = M , d.h. H operiert transitiv. 3. Nun sei H irgendeine transitive Untergruppe von G , dazu s ∈ M beliebig. Zu jedem x ∈ G gibt es ein h ∈ H mit xs = hs , also ist h−1 x ∈ Gs bzw. x ∈ HGs . 2
7.9.2 Kommutatoruntergruppen. Ein Kriterium f¨ ur Einfachheit Wir erinnern an einen Begriff, der beil¨aufig schon im Rahmen der Aufgaben 12 und 13 in Abschnitt 2.10 eingef¨ uhrt wurde: Die Kommutatoruntergruppe K = [G, G] ist das Erzeugnis aller Produkte xyx−1 y −1 mit x, y ∈ G . Konjugation von x und y mit einem beliebigen g ∈ G zeigt, dass K konjugationsinvariant ist, also Normalteiler. Jeder Homomorphismus von G in eine abelsche Gruppe enh¨alt K in seinem Kern, nach dem Homomorphiesatz der Gruppentheorie gilt also der Hilfssatz 7.45 Sei H Normalteiler der Gruppe G mit abelscher Faktorgruppe G/H. Dann enth¨alt H die Kommutatoruntergruppe [G, G] . Der Nachweis der Einfachheit der hier zu diskutierenden Gruppen erfolgt (laut [Jac] nach einer Idee von Iwasawa) mit Hilfe des folgenden Kriteriums. Hilfssatz 7.46 Die Gruppe G operiere auf einer Menge M . Sie ist einfach, wenn die folgenden Bedingungen erf¨ ullt sind: 1. Die Operation von G auf M ist treu und primitiv. 2. G = [G, G] . 3. Es gibt ein s ∈ M , dessen Fixgruppe Gs einen abelschen Normalteiler As enth¨ alt mit der Eigenschaft, dass G von allen Konjugierten xAs x−1 , x ∈ G , erzeugt wird. Beweis: Angenommen, die Bedingungen des Hilfssatzes seien erf¨ ullt und es g¨ abe einen echten Normalteiler H G . Nach Lemma 7.44 operiert H transitiv auf M , und es gilt G = HGs . Nach Hilfssatz 2.16.4 ist G∗ := HAs Untergruppe von G , und aus G = HGs folgt sogar, dass G∗ Normalteiler in G ist; G∗ enth¨ alt also jedes xAs x−1 , x ∈ G . Aus Bedingung 3 folgt G = G∗ = HAs . Nach dem ersten Isomorphiesatz ist G/H ∼ alt also die = As /(H ∩ As ) abelsch, H enth¨ Kommutatorgruppe [G, G] = G . Somit ist H = G , G ist einfach.2
211
7 Galoistheorie
7.9.3 Projektive spezielle lineare Gruppen Wir m¨ ussen nun eine Erinnerung an die lineare Algebra einschieben. Sei K ein zun¨achst beliebiger K¨orper. Auf den Vektoren = 0 des Vektorraums K n wird ¨ eine Aquivalenzrelation durch a ∼ b
∃ k ∈ K ∗ : a = kb
: ⇐⇒
¨ eingef¨ uhrt. Die Menge der Aquivalenzklassen ist der n−1-dimensionale projektive Raum Pn−1 (K) . Realisiert man K n durch Spaltenvektoren und l¨ asst GLn K ¨ durch Matrixmultiplikation auf K n operieren, so werden Aquivalenzklassen in ¨ Aquivalenzklassen u uhrt. Man erh¨alt folglich — repr¨ asentantenweise de¨bergef¨ finiert — eine wohldefinierte Operation von GLn K auf Pn−1 (K) ; das gleiche gilt nat¨ urlich f¨ ur die spezielle lineare Gruppe SLn K , d.h. die Untergruppe der Matrizen der Determinante 1 . Im Fall n = 2 l¨ asst sich P1 (K) mit dem in 2.10, Aufgabe 15, eingef¨ uhrten K identifizieren (man nehme den Quotienten der ersten durch die zweite Koordinate); die Operation von SL2 K wird dabei genau zu der dort diskutierten gebrochen-linearen Operation. Welche Matrizen operieren als Identit¨at auf Pn−1 (K) ? Diese m¨ ussen den gesamten K n als Eigenraum besitzen und sind darum genau die Vielfachen der Einheitsmatrix E . Diese Vielfachen bilden einen Normalteiler ZG := K ∗ E
ZS := (μn ∩ K)E
bzw.
von GLn K bzw. SLn K ( μn ∩ K sind die in K enthaltenen n-ten Einheitswurzeln). Die Faktorgruppen P GLn (K) := GLn K/ZG
bzw.
P SLn K := SLn K/ZS
heißen projektive lineare bzw. projektive spezielle lineare Gruppe; nach Konstruktion operieren beide treu auf Pn−1 (K) . Damit ist schon ein halber Schritt in Richtung einer Anwendung von Hilfssatz 7.46 getan. Die G¨ ultigkeit der ersten Bedingung in 7.46 folgt aus Hilfssatz 7.44.1 und Hilfssatz 7.47 Sei n > 1. Dann operiert P SLn K zweifach transitiv auf Pn−1 (K). Zum Beweis seien K ∗ x1 = K ∗ x2 und K ∗ y1 = K ∗ y2 zwei beliebige Punktepaare des Pn−1 (K) . Dann sind x1 und x2 bzw. y1 und y2 linear unabh¨ angig in K n , und es gibt (Basiserg¨anzung!) gewiss eine Matrix M ∈ GLn K mit M x1 = y1
,
M x2 = y2 .
Damit ist bereits klar, dass P GLn K zweifach transitiv auf Pn−1 (K) operiert, M ist nur noch durch eine Matrix mit Determinante 1 zu ersetzen. Das l¨ asst sich z.B. erreichen durch eine lineare Abbildung, welche x1 → (det M )−1 y1
,
x2 → y2
und x → M x auf einem Komplement von Kx1 + Kx2 in K n erf¨ ullt. 2
212
7.9 Einfache lineare Gruppen
7.9.4 Elementarmatrizen Sei stets n eine nat¨ urliche Zahl > 1 und K ein K¨ orper. Als Elementarmatrix bezeichnet man eine n × nMatrix Tij (b) , die in der Diagonale nur Einsen und in der ij-Position, d.h. in der i-ten Zeile und j-ten Spalte (i = j), den Eintrag b ∈ K und sonst nur Nullen besitzt. Es ist klar, dass alle Tij zu SLn K geh¨ oren, und dass f¨ ur feste i = j die Abbildung b → Tij (b) einen injektiven Homomorphismus der additiven Gruppe von K in SLn K definiert. Hilfssatz 7.48 Die Gruppe SLn K wird von Elementarmatrizen erzeugt. Ein Teil des Beweises wird von der linearen Algebra geliefert: Multiplikation einer n × n-Matrix M von links mit einer Elementarmatrix Tij (b) u ¨bt auf M eine erlaubte Zeilenoperation des Gaußschen Algorithmus aus, n¨ amlich Addition des b-fachen der j-ten Zeile zur i-ten Zeile, und ebenso wirkt die Multiplikation mit einer Elementarmatrix von rechts als erlaubte Spaltenoperation. Da man jedes M durch erlaubte Operationen in eine Diagonalmatrix u uhren kann, ist ¨berf¨ SLn K jedenfalls von den Elementarmatrizen und den Diagonalmatrizen erzeugt. Bleibt also zu zeigen, dass auch die in SLn K enthaltenen Diagonalmatrizen als Produkte von Elementarmatrizen geschrieben werden k¨ onnen. Eine elementare, aber etwas m¨ uhsame Rechnung — am besten mit 2 × 2-Matrizen durchzuf¨ uhren — zeigt, dass f¨ ur alle k ∈ K ∗ Tji (−1) Tij (1) Tji (−1) Tij (−k) Tji (k−1 ) Tij (−k) eine Diagonalmatrix ist, die an der i-ten und der j-ten Diagonalstelle die Eintr¨ age −1 k bzw. k besitzt und 1 an allen anderen Diagonalstellen. Durch Induktion u ¨ber n ist leicht zu sehen, dass sich jede Diagonalmatrix aus SLn K aus Matrizen dieses Typs zusammensetzen l¨asst, und daraus folgt die Behauptung. 2 Klar, dass daraus eine entsprechende Aussage auch f¨ ur die projektive Gruppe folgt. Dies gilt ebenso f¨ ur den folgenden Hilfssatz, der uns die Verifikation f¨ ur die zweite Bedingung aus Hilfssatz 7.46 liefert. Hilfssatz 7.49 Ausgenommen in dem Fall, dass n = 2 und K = F2 oder F3 ist, stimmt die Gruppe SLn K mit ihrer Kommutatorgruppe u ¨berein. Zum Beweis gen¨ ugt es, zu zeigen, dass jede Elementarmatrix ein Kommutator ist. F¨ ur n > 2 seien i, j, m paarweise verschieden. F¨ ur jedes b ∈ K ist dann Tij (b) = Tim (b) Tmj (1) Tim (−b) Tmj (−1) = Tim (b) Tmj (1) Tim (b)−1 Tmj (1)−1 . Im Fall n = 2 benutzen wir einen Kommutator der folgenden Bauart:
−1
k 0 1c 1 −c 1 c(k 2 − 1) k 0 = 01 0 k 0 1 0 1 0 k −1
213
7 Galoistheorie
Außer f¨ ur K = F2 oder F3 lassen sich k ∈ K ∗ und c ∈ K so w¨ ahlen, dass auf diese Weise jedes T12 (b) realisiert wird, und analog geht man bei den Elementarmatrizen T21 vor. 2
7.9.5 Eine neue Serie einfacher Gruppen Satz 7.50 Sei n eine nat¨ urliche Zahl > 1 und F ein endlicher K¨ orper. Mit Ausnahme von P SL2 F2 und P SL2 F3 sind alle Gruppen P SLn F einfach. Zum Beweis setzen wir G := P SLn F und wenden Hilfssatz 7.46 an. G operiert treu auf M := Pn−1 (F) und zweifach transitiv nach 7.47, also primitiv nach 7.44. Aus Hilfssatz 7.49 folgt G = [G, G] , wobei wir die Ausnahmef¨ alle außer acht lassen; die beiden ersten Bedingungen aus 7.46 sind somit erf¨ ullt. F¨ ur die letzte Bedingung haben wir die Fixgruppe Gs eines Punktes s ∈ M zu untersuchen; da G transitiv operiert, sind alle Fixgruppen zueinander konjugiert, und wir k¨ onnen ∗ o.B.d.A. s = F e1 w¨ahlen, e1 der erste Einheitsvektor des Vektorraums Fn . Offensichtlich besteht die Fixgruppe dann aus allen Matrizen (immer modulo ZS , also der Vielfachen der Einheitsmatrix) der Bauart ⎞ ⎛ a1 a2 · · · an ⎟ ⎜ 0 ⎟ ⎜ X = ⎜ . ⎟ . ⎠ ⎝ . B 0 mit einer nichtsingul¨aren (n − 1) × (n − 1)-Matrix B . Da wir modulo ZS rechnen, d¨ urfen wir wir dabei a1 = 1 und B ∈ SLn−1 F annehmen. Die Abbildung Gs → P GLn−1 F : X → F∗ · B ist dann ein Gruppenhomomorphismus, dessen Kern As genau aus den Matrizen X besteht, die Vielfache jener Matrix sind mit a1 = 1 und B = E , der (n−1)×(n−1)-Einheitsmatrix. Man rechnet sofort nach, dass dieser Kern abelsch ist, und zwar isomorph zur additiven Gruppe der Zeilenvektoren (a2 , . . . , an ) des Vektorraums F(n−1) . Insbesondere enth¨ alt er s¨ amtliche Elementarmatrizen T1i (b) f¨ ur alle i = 1 . Aus diesen kann man durch Konjugationen auch alle anderen Elementarmatrizen gewinnen. Mit Hilfssatz 7.48 ist also auch die G¨ ultigkeit der dritten Bedingung aus 7.46 verifiziert. 2
7.9.6 Bemerkungen 1.) F¨ ur die Gruppenordnung von P SLn Fq ergibt sich (q n − 1) (q n − q) · . . . · (q n − q n−2 )q n−1 /d
214
7.9 Einfache lineare Gruppen
mit der Anzahl d = (n, q −1) der in Fq enthaltenen n-ten Einheitswurzeln. Schon anhand dieser Gruppenordnungen l¨asst sich ablesen, dass die hier untersuchten Gruppen P SLn F meistens nicht isomorph zu den in Abschnitt 7.8 gefundenen einfachen alternierenden Gruppen sein werden. In der Tat kann man beweisen, dass die einzigen Ausnahmeisomorphismen innerhalb dieser beiden Serien einfacher Gruppen A5 ∼ = P SL2 F5 ∼ = P SL2 F4 und P SL2 F7 ∼ = P SL3 F2 sind. Letztere Gruppe ist die zweitkleinste nichtabelsche einfache Gruppe und hat 168 Elemente. Die oben ausgesonderten Gruppen besitzen ebenfalls Ausnahmeisomorphismen, n¨amlich P SL2 F2 ∼ = S3
und P SL2 F3 ∼ = A4 .
2.) Neben den zyklischen Gruppen von Primzahlordnung, den Gruppen An und P SLn F gibt es noch einige weitere Serien endlicher einfacher Gruppen vom Lie-Typ, d.h. welche — zumeist mit geometrischen Ideen — als Matrixgruppen u oßtenteils erst in den ¨ber endlichen K¨orpern konstruiert werden, sowie die 26 gr¨ letzten 70 Jahren gefundenen sporadischen Gruppen, welche nicht in diese Serien fallen, von der seit 1860 bekannten Mathieu-Gruppe M11 der Ordnung 7920 = 24 · 32 · 5 · 11 bis zum big monster der Ordnung 246 · 320 · 59 · 76 · 112 · 133 · 17 · 19 · 23 · 29 · 31 · 41 · 47 · 59 · 71 ≈ 8 · 1053 . ¨ ¨ Nach Uberzeugung der Gruppentheoretiker hat man damit eine vollst¨ andige Ubersicht u ber alle endlichen einfachen Gruppen, vgl. etwa [Ab2], und damit w¨ are ¨ ein wesentlicher Schritt in Richtung auf das schon in Abschnitt 2.3.3 erw¨ ahnte Klassifikationsproblem f¨ ur endliche Gruppen geleistet. Man rechnet allerdings damit, dass ein Beweis f¨ ur die Vollst¨andigkeit der Liste der bisher gefundenen sporadischen Gruppen Tausende von Druckseiten umfassen wird. Die gespannte ¨ mathematische Offentlichkeit muss hier also Geduld aufbringen. 3.) Zur¨ uck zur Galoistheorie. Das schon in Abschnitt 7.2.5 erw¨ ahnte und f¨ ur endliche abelsche Gruppen gel¨oste Umkehrproblem der Galoistheorie, ob sich jede endliche Gruppe als Galoisgruppe u asst, sollte — wenn es ¨ber Q realisieren l¨ l¨osbar ist — zun¨achst einmal f¨ ur einfache Gruppen gel¨ ost werden, und angesichts der in 2.) geschilderten Klassifikation liegt es nahe, das Problem f¨ ur einzelne Serien einfacher Gruppen separat anzugehen. Eine oft verwendete Strategie l¨ asst sich am einfachsten am Beispiel der — nat¨ urlich nicht einfachen — symmetrischen Gruppen Sn erl¨ autern: Aus Abschnitt 7.7.7 wissen wir, dass sich Sn als Galoisgruppe u asst; ¨ber dem rationalen Funktionenk¨orper Q(s1 , . . . , sn ) realisieren l¨ der Hilbertsche Irreduzibilit¨ atssatz erlaubt es, daraus eine ganze Serie von K¨orpererweiterungen von Q mit gleicher Galoisgruppe zu konstruieren, es gilt n¨amlich:
7 Galoistheorie
215
Satz 7.51 Wenn das Polynom f (s1 , . . . , sn , x) ∈ Q[s1 , . . . , sn , x] u ¨ber dem K¨ orper Q(s1 , . . . , sn ) irreduzibel ist, so existieren unendlich viele n-Tupel (r1 , . . . , rn ) ∈ Qn mit der Eigenschaft, dass auch f (r1 , . . . , rn , x) ∈ Q[x] irreduzibel ist. 4.) Es w¨ urde zu weit f¨ uhren, diesen Satz hier zu beweisen, aber es soll immerhin erw¨ahnt werden, was an seiner Verwendung typisch ist: Sehr h¨ aufig ist es einfacher, Gruppen als Galoisgruppen u orpern wie z.B. C(t) zu ¨ber Funktionenk¨ realisieren (Theorie der algebraischen Kurven bzw. der Riemannschen Fl¨achen). Die Kunst besteht dann darin, den verwendeten Konstantenk¨ orper von C auf Q zu verkleinern; dann l¨asst sich der Hilbertsche Irreduzibilit¨ atssatz anwenden. Hilbert selbst hat auf diese Weise bereits die alternierenden Gruppen An als Galoisgruppen u ¨ber Q realisiert. An vielen anderen Gruppen und Serien von Gruppen wird in dieser Richtung intensiv geforscht (vgl. [Mat], [S4]); von den in diesem Abschnitt diskutierten Gruppen weiß man z.B. durch Arbeiten von Shih, dass die Gruppen P SL2 Fp als Galoisgruppen u ¨ber Q vorkommen, wenn p eine Primzahl ist, f¨ ur die eine der Zahlen 2, 3 oder 7 quadratischer Nichtrest mod p ist.
7.10 Arithmetik der Werte der e-Funktion 7.10.1 Der Satz von Lindemann-Weierstraß Ziel dieses ganzen Abschnitts ist es vor allem, den folgenden fundamentalen Satz zu beweisen. Satz 7.52 Seien a1 , . . . , an ∈ Q algebraisch und linear unabh¨angig u ¨ber Q . Dann sind die Werte ea1 , . . . , ean der Exponentialfunktion algebraisch unabh¨angig. Es sei hier an die Folgerung 6.31 erinnert, dass wir die Aussage dieses Satzes von Lindemann-Weierstraß als algebraisch unabh¨ angig u ¨ber Q“ oder als alge” ” braisch unabh¨angig u onnen. Das Resultat geh¨ ort ¨ber Q“ lesen bzw. beweisen k¨ nat¨ urlich nicht wirklich in ein Kapitel u ¨ber Galoistheorie, sondern zum Abschnitt 6.5 u ¨ber transzendente K¨orpererweiterungen. Dass es seinen Platz hier findet, liegt daran, dass ein wesentlicher Reduktionsschritt des Beweises Galoistheorie benutzt; es ist ein sch¨ones Beispiel daf¨ ur, dass Galoistheorie weit u ¨ber die reine Algebra hinaus Bedeutung besitzt. Bevor wir in den umfangreichen Beweis einsteigen (ich halte mich an eine Version von A. Baker, eine andere findet der Leser z.B. bei [BBR]), seien zwei wichtige Spezialisierungen erw¨ ahnt.
216
7.10 Arithmetik der Werte der e-Funktion
Folgerung 7.53 (Hermite-Lindemann) F¨ ur jede algebraische Zahl a = 0 ist a e transzendent. Insbesondere ist (s. Abschnitt 6.1.2) e selbst transzendent. Da f¨ ur jede algebrailog a = a algebraisch ist, sche Zahl a = 0 und jeden Zweig des Logarithmus e speziell auch e2πi = 1 , folgt die Unm¨oglichkeit der Quadratur des Kreises: Folgerung 7.54 Sei a = 0 , 1 algebraisch. F¨ ur jeden Zweig der Logarithmusfunktion ist log a transzendent, insbesondere auch die Zahl π .
7.10.2 Reduktion der Behauptung Zum Beweis des Satzes 7.52 gen¨ ugt es, die folgende Aussage zu beweisen: Hilfssatz 7.55 Die algebraischen Zahlen c1 , . . . , cm ∈ Q seien paarweise verschieden. Dann sind die Werte der Exponentialfunktion ec1 , . . . , ecm linear unabh¨angig u ¨ber Q . Zum Beweis der Reduktion des Satzes von Lindemann-Weierstraß auf diesen Hilfssatz sei zun¨achst daran erinnert, dass nur die algebraische Unabh¨ angigkeit a j der e u ¨ber Q zu zeigen ist. G¨abe es ein Polynom P (x1 , . . . , xn ) ∈ Q[x1 , . . . , xn ] , das nicht identisch verschwindet, aber P (ea1 , . . . , ean ) = 0 erf¨ ullt, so k¨onnte man diese Relation als eine Q-lineare Abh¨ angigkeit lesen zwischen den Potenzprodukten eck := (ea1 )ν1 · . . . · (ean )νn , wobei durch k eine Numerierung der n-Tupel (ν1 , . . . , νn ) vorgenommen wird. Da die a1 , . . . , an linear unabh¨angig u ussen ¨ber Q und die νj ganzrational sind, m¨ die neuen Exponenten ck = ν1 a1 + . . . + νn an paarweise verschieden sein, 7.52 folgt also aus 7.55. 2 Der Beweis dieses Hilfssatzes l¨asst sich weiter reduzieren auf
217
7 Galoistheorie
Hilfssatz 7.56 Seien a1 , . . . , an paarweise verschiedene algebraische Zahlen, alle enthalten in einem normalen separablen Erweiterungsk¨orper K von Q endlichen Grades, und seien b1 , . . . , bn ∈ Z ganzrational, nicht alle = 0 . Die Menge {a1 , . . . , an } sei invariant unter Gal K/Q , d.h. ∀ j = 1, . . . , n ∀ σ ∈ Gal K/Q
∃ k ∈ {1, . . . , n}
mit
σ(aj ) = ak .
Zus¨atzlich gelte dann ⇒
ak = σ(aj )
bk = bj .
(7.8)
Dann ist b1 ea1 + . . . + bn ean = 0 .
(7.9)
Beweis des Hilfssatzes 7.55 mit Hilfe von 7.56: Angenommen, es g¨ abe eine nichttriviale verschwindende Linearkombination der eck mit rationalen Koeffizienten. Durch Multiplikation mit dem Hauptnenner der Koeffizienten d¨ urfen wir bereits annehmen, dass diese sogar ganzrational sind. Sei ferner K der normale Abonnen wir zu den ck alle Gal K/Qschluss des Zahlk¨orpers Q(c1 , . . . , cm ) ; dann k¨ Konjugierten hinzunehmen und diese neuen eck mit Koeffizient 0 der fraglichen Linearkombination hinzuf¨ ugen. Man darf also o.B.d.A. annehmen, da Gal K/Q auf der Menge der Exponenten der Linearkombination 0 = d k e ck k
operiert, dass alle dk ∈ Z und nicht alle = 0 sind. Um daraus eine Linearkombination (7.9) mit der in (7.8) geforderten Symmetriebedingung zu machen, definiere man dk eσ(ck ) =: bj eaj . σ∈Gal K/Q
j
k
Klar, dass das Produkt links wieder eine ganzzahlige Linearkombination von Werten der Exponentialfunktion an (o.B.d.A. paarweise verschiedenen) Stellen aj ∈ K wird. Nach Konstruktion permutiert die Operation eines beliebigen σ ∈ Gal K/Q auf den Exponenten die Faktoren des Produkts links, l¨ asst also auch die Linearkombination rechts invariant. Damit ist die Symmetrieeigenschaft (7.8) gesichert. Da in dem Produkt links zumindest der Faktor mit σ = id verschwindet, liefert die Annahme einen Widerspruch zur Aussage des Hilfssatzes 7.56; bleibt nur noch zu zeigen, dass auch die Linearkombination rechts nicht nur verschwindende Koeffizienten hat. Man definiere sich dazu eine Anordnung der komplexen Exponenten nach Real- und Imagin¨ arteil z.B. durch c1 < c2
: ⇐⇒
%c1 < %c2
oder
%c1 = %c2 , &c1 < &c2
218
7.10 Arithmetik der Werte der e-Funktion
und w¨ahle aus jedem Faktor des linksstehenden Produkts den Summanden dk eσ(ck ) = 0 mit maximalem Exponenten σ(ck ) aus; nennt man diese Summanden kurz dσ ecσ , so tritt deren Produkt in der Linearkombination rechts genau einmal als Summand auf, n¨amlich als jener mit maximalem Exponenten: bj eaj =
d σ e cσ ,
σ
also
bj =
σ
dσ
, aj =
cσ
σ
Zumindest dieses bj ist = 0 , somit sind alle Voraussetzungen von Hilfssatz 7.56 erf¨ ullt. 2
7.10.3 Ganzalgebraische Zahlen Zum Beweis von Hilfssatz 7.56, auf den wir den Satz von Lindemann-Weierstraß reduziert haben, sind zwei weitere Vorbereitungen n¨ otig. Die erste betrifft einen geeigneten Ganzheitsbegriff f¨ ur algebraische Zahlen, den wir im Spezialfall quadratischer Zahlk¨orper bereits in Satz 3.5 und Abschnitt 3.4.8 kennengelernt haben. Eigentlich geh¨ort dieses Thema in die algebraische Zahlentheorie und sollte in gr¨oßerer Allgemeinheit unter Verwendung von Moduln behandelt werden. Hilfssatz 7.57 (mit Definition) Sei K ein algebraischer Zahlk¨orper und a ∈ K . Folgende Bedingungen sind ¨ aquivalent: 1. a ist Nullstelle eines primitiven und normierten Polynoms f (x) = xm + s1 xm−1 + . . . + sm ∈ Z[x] . 2. Der Ring Z[a] ⊂ K ist eine endlich erzeugte abelsche Gruppe. 3. Es gibt eine endlich erzeugte abelsche Gruppe {0} = A ⊂ K mit aA ⊆ A . Wenn diese Bedingungen erf¨ ullt sind, nennt man a ganzalgebraisch. Zum Beweis von 1. ⇒ 2. beachte man, dass der Ring Z[a] als abelsche Gruppe von 1, a, a2 , . . . , am−1 erzeugt wird, denn am = − sm − sm−1 a − . . . − s1 am−1 , und rekursiv lassen sich daraus auch alle h¨oheren a-Potenzen als ganzzahlige Liur 2. ⇒ 3. nehme man einfach nearkombinationen von 1, . . . , am−1 darstellen. F¨ A = Z[a] . Der Beweis von 3. ⇒ 1. ist nur eine kleine Variation des Beweises von
219
7 Galoistheorie
Satz 6.14: Wenn v1 , . . . , vn Erzeugende von A sind, gibt es nach Voraussetzung ganzrationale bij mit a vi =
n
bij vj ∀ j = 1, . . . , n ,
j=1
und wie damals muss a Nullstelle des charakteristischen Polynoms det(bij − δij x) ∈ Z[x] sein. Bis auf den Faktor ±1 ist dieses normiert und darum primitiv. 2 Folgerung 7.58 1. Die ganzalgebraischen Zahlen eines algebraischen Zahlk¨ orpers K bilden einen Ring OK . 2. OK ∩ Q = Z 3. Zu jedem a ∈ K gibt es einen Nenner s ∈ N mit sa ∈ OK . Mit s sind auch alle Vielfachen von s Nenner von a . Beweis: 1. Seien a, b ∈ OK und A, B ⊂ K endlich erzeugte abelsche Gruppen mit aA ⊆ A , bB ⊆ B (gibt es nach Hilfssatz 7.57). Die Menge aller Produkte AB ⊂ K ist ebenfalls endlich erzeugte abelsche Gruppe und erf¨ ullt (a ± b) A B ⊆ A B
,
abAB ⊆ AB ,
also sind auch a ± b und ab ganzalgebraisch; im u ¨brigen sind die Ringaxiome trivialerweise erf¨ ullt. 2. Dass jede ganzrationale Zahl auch ganzalgebraisch ist, l¨asst sich mit jeder der drei definierenden Eigenschaften sofort einsehen. Wenn umgekehrt a ∈ Q nicht ∈ Z ist, kann Z[a] auch nicht endlich erzeugt sein, sonst g¨abe es einen gemeinsamen Nenner. 3. Man nehme ein irreduzibles Polynom in Q[x] mit Nullstelle a und multipliziere mit dem Hauptnenner s ∈ N der Koeffizienten. Dann ist a auch Nullstelle eines Polynoms sxm + s1 xm−1 + . . . + sm ∈ Z[x] , und sa ist Nullstelle des normierten primitiven Polynoms y m + s1 y m−1 + . . . + sm sm−1 ∈ Z[y] , das aus dem ersten durch Multiplikation mit sm−1 und Substitution y = sx hervorgeht. 2
220
7.10 Arithmetik der Werte der e-Funktion
7.10.4 Zwei Eigenschaften der e-Funktion Hilfssatz 7.59 Sei f (x) ∈ C[x] ein Polynom vom Grad m , t eine komplexe Zahl und
t et−u f (u) du I(t) := 0
mit einem beliebigen Integrationsweg zwischen 0 und t . Dann ist I(t) = et
m
f (j) (0) −
j=0
m
f (j) (t) ,
j=0
wenn mit f (j) die Ableitung von f der Ordnung j bezeichnet wird. Beweis durch Induktion u ¨ber den Grad von f mit sukzessiver partieller Integration
t n n t (j) (j) f (0) − f (t) + et−u f (n+1) (u) du . 2 I(t) = e j=0
j=0
0
Ferner brauchen wir f¨ ur I(t) eine Gr¨oßenabsch¨ atzung, die sich aus Dreiecksungleichung, Absch¨atzung unter dem Integranden und Wahl der direkten Integrationsstrecke zwischen 0 und t ergibt: Hilfssatz 7.60 Mit den gleichen Bezeichnungen wie eben sei f das Polynom, das sich aus f ergibt, wenn man alle Koeffizienten durch ihre Absolutbetr¨age ersetzt. Dann ist
|t| |I(t)| ≤ |e|t|−u f (u)| du ≤ |t| e|t| f (|t|) . 0
7.10.5 Beweis von Hilfssatz 7.56 Angenommen, der Hilfssatz 7.56 sei falsch. Dann gibt es paarweise verschiedene algebraische a1 , . . . , an , die mit jedem ai auch alle Galois-konjugierten enthalten, dazu ganzrationale b1 , . . . , bn , nicht alle = 0 , welche die Galois-Symmetrie (7.8) erf¨ ullen, nicht aber (7.9). Wir nehmen also an, es g¨ abe eine nichttriviale lineare Relation (7.10) b1 ea1 + . . . + bn ean = 0 . L ∈ N sei ein gemeinsamer Nenner f¨ ur alle ai ; wir nehmen also an, La1 , . . . , Lan seien ganzalgebraische Zahlen des u orpers K . ¨ber Q normalen, separablen Zahlk¨ Dazu sei p eine große Primzahl, u ater genauer verf¨ ugen werden. F¨ ur ¨ber die wir sp¨ jedes i = 1, . . . , n sei fi (x) := Lnp [(x − a1 ) · . . . · (x − an )]p /(x − ai ) ∈ C[x]
221
7 Galoistheorie
ein Polynom vom Grad np − 1 und Ii (t) das mit diesem Polynom gebildete Integral aus Hilfssatz 7.59, dazu Ji := b1 Ii (a1 ) + . . . + bn Ii (an ) . Aus 7.59 wissen wir bereits Ii (ak ) = eak
np−1
(j)
fi (0) −
j=0
np−1
(j)
fi (ak ) ,
j=0
und da in der ersten Summe nur der gemeinsame Exponentialfaktor von ak abh¨angt, folgt aus (7.10) Ji = −
np−1
n
(j)
bk fi (ak ) .
(7.11)
j=0 k=1
Wegen des Faktors Lnp haben alle Polynome fi ganzalgebraische Koeffizienten, (j) nach Hilfssatz 7.58 also auch alle Ableitungen der fi , sogar alle Werte fi (ak ) . Die Nullstellenordnung der fi ist p in allen ak , k = i , und p − 1 in ai . Man erh¨alt darum (p−1) fi (ai )
np
= L
(p − 1)!
n
(ai − ak )p ;
k=1 , k=i
diese Zahl ist nicht nur ganzalgebraisch, sie ist sogar durch (p−1)! teilbar, d.h. es (p−1) ist auch fi (ai )/(p − 1)! ∈ OK . Wir k¨onnen p teilerfremd zu allen L(ai − ak ) w¨ahlen (vgl. Aufgaben 23 und 24 in Abschnitt 7.11), d¨ urfen also annehmen, dass (p−1) (ai ) , i = 1, . . . , n , nicht durch p teilbar sind. Außer in diesem einen die fi Fall j = p − 1 , k = i gilt aber in OK stets die Teilbarkeit (j)
p! | fi (ak ) , da die Ableitungen verschwinden oder alle Faktoren von 1 · 2 · . . . · p enthalten. Mit dieser Wahl von p ist p Ji und somit Ji = 0 gesichert.— Nun ist noch die Galois-Symmetrie (7.8) auszunutzen: In der Summendarstellung (7.11) von Ji geh¨ort zu konjugierten Argumenten ak und σ(ak ) , σ ∈ Gal K/Q , der gleiche angig von i und j sind, Koeffizient bk , d.h. bis auf rationale Faktoren, die unabh¨ besteht die Summe (7.11) aus Teilsummen der Bauart (j) fi (σ(ak )) . σ∈Gal K/Q
Nach Konstruktion ist das Polynom (x−ai )fi (x) unabh¨ angig von i und invariant unter der Operation der Galoisgruppe Gal K/Q auf den Koeffizienten, da sie nach
222
7.10 Arithmetik der Werte der e-Funktion
den Annahmen des Hilfssatzes 7.56 nur die Wurzeln permutieren kann; es hat also rationale Koeffizienten, und das gleiche gilt f¨ ur alle Ableitungen. Folglich lassen (j) ucken sich alle Koeffizienten der abgeleiteten Polynome fi (x) als rν (ai ) ausdr¨ durch Polynome rν mit rationalen Koeffizienten, die unabh¨ angig von i sind. Jedes τ ∈ Gal K/Q mit τ (ai ) = as , τ (ak ) = at bewirkt also (j)
τ (fi (ak )) = fs(j) (at ) und
⎛ τ⎝
⎞
(j) fi (σ(ak ))⎠ =
σ∈Gal K/Q
fs(j) (σ(ak )) .
σ∈Gal K/Q
Das Produkt J1 · . . . · Jn ist darum Gal K/Q-invariant, also rational. Nach Hilfssatz 7.58 ist es sogar ganzrational und teilbar durch ((p − 1)!)n . Da die Faktoren = 0 sind, erf¨ ullt es |J1 · . . . · Jn | ≥ ((p − 1)!)n . Andererseits garantiert Hilfssatz 7.60 die Existenz einer Konstanten c , die f¨ ur alle i und p |ak bk | e|ak | fi (|ak |) ≤ cp |Ji | ≤ erf¨ ullt. Da (p − 1)! schneller w¨achst als cp , widersprechen sich diese beiden Ungleichungen bei hinreichend großer Wahl von p . Die Annahme (7.10) ist daher falsch. 2
7.10.6 Neuere Resultate. Vermutungen Als Satz u ¨ber die Werte der Exponentialfunktion an algebraischen Argumenten ist der Satz von Lindemann-Weierstraß nicht weiter verbesserungsf¨ ahig. Ganz anders ist die Situation bei Logarithmen algebraischer Zahlen. Allgemein wird vermutet, dass algebraische Relationen unter ihnen nur dann auftreten k¨ onnen, wenn sie aus der Funktionalgleichung f¨ ur log bzw. multiplikativen Relationen der Argumente folgen wie z.B. in √ 3 log 2 ; log 8 = 2 allgemeiner sollte also gelten: Vermutung: Seien a1 , . . . , an algebraisch, = 0 , und log a1 , . . . , log an linear unabh¨angig u ¨ber Q. ¨ber Q. Dann sind log a1 , . . . , log an algebraisch unabh¨angig u Nach Folgerung 7.54 ist diese Vermutung f¨ ur n = 1 richtig. Allgemein w¨ urde z.B. daraus folgen, dass f¨ ur paarweise verschiedene Primzahlen p alle Werte log p algebraisch unabh¨angig sind. F¨ ur kein n > 1 ist die Vermutung bewiesen, allerdings
223
7 Galoistheorie
sind einige — besonders f¨ ur die Theorie der diophantischen Gleichungen ungemein n¨ utzliche — Teilresultate erzielt worden. Gel’fond und Th. Schneider haben 1934 gleichzeitig und mit unterschiedlichen, aber gleichermaßen epochemachenden Methoden gezeigt: Satz 7.61 Wenn f¨ ur zwei algebraische Zahlen a und b = 0 die Logarithmen log a und log b linear unabh¨ angig u ¨ber Q sind, dann sind sie auch linear unabh¨ angig u ¨ber Q . Dieser Satz l¨ost eines der von Hilbert im Jahr 1900 formulierten großen mathematischen Probleme und l¨asst sich griffig-anschaulich so formulieren: Folgerung 7.62 Sei a = 0 , 1 algebraisch und√ b algebraisch und irrational. Dann ist ab transzendent. Insbesondere sind 2 2 und alle e2πir transzendent f¨ ur alle algebraischen irrationalen r . Eine wesentliche Verallgemeinerung des Satzes von Gel’fond-Schneider ist 1966 von A. Baker gefunden worden: Satz 7.63 Seien a1 , . . . , an algebraische Zahlen = 0 . Wenn log a1 , . . . , log an linear unabh¨ angig u ¨ber Q sind, dann auch u ¨ber Q . Unser Wissen u ¨ber algebraische Unabh¨angigkeit, auch von den Zahlen der Bauart uhen Resultaten von Gel’fond 1948 und ab , ist sehr viel bescheidener. Nach fr¨ wesentlichen Vorarbeiten von Philippon wird unser heutiger Kenntnisstand am besten durch folgendes typische Ergebnis (Guy Diaz 1987 [Di]) beschrieben. Satz 7.64 Sei a = 0 eine algebraische Zahl und b algebraisch vom Grad d > 1 . Dann gibt es unter den Zahlen 2
ab , ab , . . . , ab
d−1
mindestens [(d + 1)/2] algebraisch unabh¨angige. (Mit [ ] ist die Gaussklammer gemeint; die eigentlich erwartete Anzahl ist d−1 nat¨ urlich der vermutete Transzendenzgrad trg Q(ab , . . . , ab ) = d − 1 ). Alle Erwartungen, die man vern¨ unftigerweise an Werte der Exponentialfunktion und der Logarithmen haben kann, lassen sich zusammenfassen zu der Vermutung (Schanuel): Seien u1 , . . . , un ∈ C linear unabh¨angig u ¨ber Q . Dann ist trg Q(u1 , . . . , un , eu1 , . . . , eun ) ≥ n .
224
7.11 Aufgaben
Mit u1 = 1 , u2 = 2πi w¨ urde daraus z.B. die erwartete algebraische Unabh¨ angigkeit von e und π folgen, mit u3 = π sogar die algebraische Unabh¨ angigkeit von ollig unrealistisch sind, zeigt ([Ne]) e , π , eπ . Dass solche Vermutungen nicht v¨ der Satz 7.65 (Nesterenko 1996) π , eπ und der Wert Γ(1/4) der Gammafunktion sind algebraisch unabh¨ angig. ¨ Ubrigens erweist sich auch hier der Funktionenk¨ orperfall als einfacher: In geeigneten Erweiterungen des Funktionenk¨orpers Fq (t) lassen sich sinnvolle Analoga zu e und π definieren; f¨ ur q ≥ 3 ist deren algebraische Unabh¨ angigkeit u ¨ber Fq (t) gesichert (Denis 1993 [Den]).
7.11 Aufgaben √ √ 1. Seien K := C(z) und L = C(z, z, 3 z) . Beweisen Sie, dass L eine normale separable K¨orpererweiterung vom Grad 6 u ¨ber K ist und bestimmen Sie die Galoisgruppe, alle Untergruppen und alle Zwischenk¨ orper. 2. L und K seien endliche algebraische K¨ orpererweiterungen des K¨ orpers k mit L ∩ K = k (linear disjunkt, vgl. Abschn. 6.5.3 und die Aufgaben 6.6.14 und 6.6.15), beide seien separabel und normal u ¨ber k , im gleichen algebraischen Abschluss k von k gelegen. Man zeige, dass auch das Kompositum LK separabel und normal u ¨ber k ist und beweise die Isomorphie Gal LK/k ∼ = Gal L/k × Gal K/k . 3. Beschreiben Sie den Zerf¨allungsk¨orper des Polynoms x5 − 2 u ¨ber Q , seine Galoisgruppe u orper. ¨ber Q und alle seine Zwischenk¨ 4. Konstruieren Sie ein u ur 2 cos(2π/7) . ¨ber Q irreduzibles Polynom f¨ 5. Suchen Sie eine galoissche Erweiterung K/Q mit Gal K/Q ∼ = Z/4Z × Z/6Z . 6. Suchen Sie eine galoissche Erweiterung K/Q mit Gal K/Q ∼ = Z/9Z . 7. Ist jede K¨orpererweiterung vom Grad 4 normal u orper? ¨ber dem Grundk¨ 8. Widerlegen Sie folgende Aussage: Wenn L/K und M/L normale K¨ orpererweiterungen sind, dann auch M/K .
225
7 Galoistheorie
9. Wieviele paarweise verschiedene Primpolynome vom Grad 4 gibt es in F3 [x] ? 10. f (t) = at2 + bt + c sei ein quadratisches Polynom in Fp [t] , p Primzahl. Entwickeln Sie ein Verfahren, die Exponentialsumme ζpf (t) t mod p
zu berechnen. 11. Man beweise mit Hilfe einer geeigneten Gaußschen Summe √ 2π 5−1 2 cos = . 5 2 12. Beweisen Sie Folgerung 7.18 . 13. Eine harte Nuss: Sei p eine Primzahl und n < m ganzrational. Man beweise |
m a √ ( ) | < p log p . p a=n
√ 14. Man folgere daraus: Es gibt weniger als p log p aufeinanderfolgende √ Reste/Nichtreste mod p . Insbesondere gibt es ein t ∈ N , t < p log p , t mit ( p ) = −1 . 15. r sei eine rationale Zahl. Beweisen Sie, dass sich der Winkel 2πr genau dann mit Zirkel und Lineal dritteln l¨ asst, wenn der Nenner von r (in gek¨ urzter Darstellung) zu 3 teilerfremd ist. 16. Beweisen Sie, dass sich Q(cos(2π/7)) u ¨ber Q nicht durch Radikale erzeugen l¨asst, obwohl die Galoisgruppe aufl¨ osbar ist. Warum ist das kein Widerspruch zu den S¨atzen 7.32 und 7.35 ? 17. Man benutze die Kummertheorie, um f¨ ur die K¨ orpererweiterung √ √ √ 4 4 4 Q( i , 3 , 4 , 5 ) / Q( i ) die Galoisgruppe, alle ihre Untergruppen und alle Zwischenk¨ orper zu ermitteln. 18. K sei ein K¨orper mit mehr als 3 Elementen. Man zeige, dass P SL2 K die Kommutatoruntergruppe von P GL2 K ist. 19. Konstruieren Sie die Ausnahmeisomorphismen P SL2 F2 ∼ = S3 , P SL2 F3 ∼ = A4 , P SL2 F4 ∼ = A5 . 20. Zeigen Sie, dass f¨ ur algebraische Zahlen a = 0 die Funktionswerte sin a , cos a , tan a transzendent sind.
226 21. Sei O der Ring der ganzalgebraischen Zahlen des Zahlk¨ orpers K ; das Element ω ∈ O besitze ein irreduzibles Polynom pω,Q ∈ Z[x] mit konstantem Glied ±1 . Beweisen Sie, dass ω dann Einheit des Rings O ist. 22. Sei ω ganzalgebraische Zahl einer normalen K¨ orpererweiterung K von Q und sei σ ∈ Gal K/Q . Zeige: Auch σ(ω) ist ganzalgebraisch. Ebenso: Wenn ω Einheit des Rings O der ganzalgebraischen Zahlen in K ist, dann auch σ(ω) . 23. Mit den gleichen Voraussetzungen und Bezeichnungen sei zus¨ atzlich p eine (rationale) Primzahl. Man zeige folgende Teilerbedingungen in O : σ(ω) p | ω ⇐⇒ p | σ(ω) =⇒ p | σ∈Gal K/Q
24. Das letzte Produkt der vorigen Aufgabe liegt in Z (warum?). Man folgere daraus, dass unendlich viele (rationale) Primzahlen p existieren, die ω nicht teilen. 25. Sei O der Ring der ganzalgebraischen Zahlen des Kreisteilungsk¨ orpers Q(ζ) , ζ eine primitive p-te Einheitswurzel, p eine (rationale) Primzahl. Man zeige, dass f¨ ur alle k ∈ Z , k ≡ 0 mod p , der Quotient (1 − ζ k )/(1 − ζ) eine Einheit von O ist. 26. Daraus und aus Fp (1) = p folgere man: In O ist p assoziiert zu (1 − ζ)p−1 . 27. Diese und die folgenden Aufgaben habe ich [Wa2] entnommen. Ihre Aussagen sind unter Annahme der G¨ ultigkeit der Schanuelschen Vermutung zu beweisen: iπ und log 2 sind algebraisch unabh¨ angig (¨ uber Q , wie auch im folgenden; log bezeichne den nat¨ urlichen Logarithmus). 28. π , log 2 , log 3 , log log 2 , log π sind algebraisch unabh¨ angig. 29. Man schließe daraus weiter, dass 1 , iπ , log π , log 2 , log 3 , log log 2 linear unabh¨angig u ¨ber Q sind und darum die folgenden Zahlen algebraisch unabh¨angig: e , π , log π , log 2 , log 3 , log log 2 30. Daraus leite man ab, dass die folgenden Zahlen linear unabh¨ angig u ¨ber Q sind 1 , e , π , log π , log 2 , log 3 , log log 2 , e log π , π log π , √ e log 2 , π log 2 , 2 log 2 , log 3 log log 2 , i , iπ , i log π , i log 2 und dass die folgenden 17 Zahlen algebraisch unabh¨ angig sind: e , π , log π , log 2 , log 3 , log log 2 , ee , eπ , π e , π π , 2e , 2π , 2
√ 2
, (log 2)log 3 , ei , π i , 2i
227
8 Gitter
8 Gitter 8.1 Grundbegriffe L heißt Gitter im Rn , wenn es n linear unabh¨ angige a1 , . . . , an ∈ Rn gibt mit L = Za1 + . . . + Zan = {
n
ai ai | ai ∈ Z } .
i=1
Dabei heißt {ai | i = 1, . . . , n } eine Gitterbasis f¨ ur L . Bezeichnet man mit ei n die Standard-Einheitsvektoren des R , so heißt L0 := Ze1 + , . . . + Zen ¨ das Standardgitter des Rn . Aquivalente M¨oglichkeiten, Gitter zu definieren, bieten sich durch den folgenden Satz 8.1 1. L ⊂ Rn ist genau dann ein Gitter, wenn ein linearer Automorphismus A : Rn → Rn existiert mit L = AL0 . 2. Jedes Gitter ist additive, diskrete Untergruppe des Rn . 3. Jede additive, diskrete Untergruppe des Rn , welche n linear unabh¨angige Vektoren enth¨ alt, ist ein Gitter. Der Beweis von 1) folgt daraus, dass A durch Aei = ai definiert werden kann. 2) ist klar f¨ urr L0 , und der allgemeine Fall folgt daraus, dass die Transformation A in 1) gleichzeitig Gruppenisomorphismus und Hom¨ oomorphismus ist. Zum Beweis von 3) sei die Untergruppe L ⊂ Rn topologisch diskret, d.h. es existiere eine Umgebung U = U (0) des Nullpunkts mit U ∩ L = {0} . Da es n linear unabh¨ angige Vektoren in L gibt, existiert insbesondere ein a1 ∈ L mit a1 = 0 , a ra1 ∈ / L f¨ ur alle 0 < r < 1 . Dieses ist das erste Element einer induktiv zu konstruierenden Gitterbasis. Seien linear unabh¨angige a1 , . . . , ai−1 ∈ L , 1 < i ≤ n bereits gefunden mit der Eigenschaft, dass das (i − 1)-dimensionale Parallelepiped Pi−1 = {
i−1
rj aj | 0 ≤ rj < 1
f¨ ur alle j}
j=1
J. Wolfart, Einführung in die Zahlentheorie und Algebra, DOI 10.1007/978-3-8349-6498-4_8, © Vieweg+Teubner Verlag | Springer Fachmedien Wiesbaden GmbH 2011
228
8.1 Grundbegriffe
nur den Punkt 0 aus L enth¨alt. Nach Voraussetzung gibt es ein von a1 , . . . , ai−1 linear unabh¨angiges ai ∈ L . Dieses l¨asst sich so w¨ ahlen, dass es von dem (i − 1)dimensionalen linearen Unterraum Vi−1 = Ra1 + . . . + Rai−1 ⊃ Pi−1 minimalen euklidischen Abstand > 0 besitzt: Andernfalls g¨ abe es eine Folge solcher Punkte in L , deren Abst¨ande zu Vi−1 gegen 0 konvergiert oder einen Wert d > 0 , der nicht selbst als Abstand eines Gitterpunkts von Vi−1 vorkommt. Man k¨onnte durch Addition geeigneter Z-Linearkombinationen der a1 , . . . , ai−1 — hier verwenden wir die Gruppeneigenschaft von L — sogar daf¨ ur sorgen, dass diese Folge gegen einen Punkt der abgeschlossenen H¨ ulle von Pi−1 konvergiert (Bolzano-Weierstraß) bzw. gegen einen Punkt, der von Pi−1 einen Abstand ≤ d besitzt, in beiden F¨allen im Widerspruch zur Diskretheit von L . Man u ¨berzeuge sich davon, dass das neu entstehende i-dimensionale Parallelepiped Pi = {
i
rj aj | 0 ≤ rj < 1
f¨ ur alle j} ⊂ Vi
j=1
wieder nur den Punkt 0 aus L enth¨alt, da andere einen kleineren Abstand von dem Unterraum Vi−1 h¨atten als ai . Behauptung: Die so induktiv konstruierten a1 , . . . , an bilden eine Gitterbasis f¨ ur L . Die lineare Unabh¨angigkeit ist klar, und jedes b ∈ L besitzt eine Darstellung b =
n
si ai ,
alle si ∈ R .
i=1
urfen wir sogar Durch Addition einer geeigneten Z-Linearkombination der ai d¨ annehmen, dass o.B.d.A. 0 ≤ si < 1 f¨ ur alle i ist — hier verwenden wir wieder die Gruppeneigenschaft von L —, dass also b ∈ Pn ∩ L , was aber nach Konstruktion nur aus 0 besteht. 2 Das in diesem Beweis konstruierte Pn nennt man ein Fundamentalparallelotop des Gitters L . Wie die Abbildung 1 zeigt, ist es ebensowenig eindeutig durch L bestimmt wie die Gitterbasis, wohl aber sein euklidisches Volumen, wie wir gleich sehen werden. Der Name kommt daher, dass es die Rolle eines Fundamentalbereichs f¨ ur die Operation von L auf Rn besitzt, d.h. die L-Translate von Pn n ¨ pflastern R l¨ uckenlos und ohne Uberlappungen: Rn = L + P n =
"
x + Pn
und x + Pn ∩ y + Pn = ∅ f¨ ur alle x = y ∈ L
x∈L
F¨ ur den nun folgenden Satz, der den Wechsel zwischen verschiedenen Gitterbasen beschreibt, stelle man sich die Basis als n-tupel von Spaltenvektoren des Rn vor.
229
8 Gitter
r
r r
r
r r
r
r
r
r
r r r
r
r
r
r
r
r
@ r r @ @ r @
r r
r r
r r
r r
r
r r
r
0r
r r
r
r r
r
r
r
r
r
r
r
r
r
r r
r
r r
Abbildung 8.1: Zwei m¨ogliche P2 in einem Gitter L ⊂ R2 Satz 8.2 Sei L ⊂ Rn Gitter mit Gitterbasis A = (a1 , . . . , an ) . Das n-tupel B = (b1 , . . . , bn ) ist genau dann eine Gitterbasis von L , wenn eine ganzzahlige n×n-Matrix U mit Determinante ±1 existiert (also ∈ GLn (Z) , d.h. unimodular) mit B = AU .
ussen sie ganzzahlige LinearkombinatioBeweis. Sind die bj Gittervektoren, so m¨ nen der ai sein, was bereits die Existenz einer ganzzahligen n × n-Matrix U mit B = AU sichert. Ist dar¨ uber hinaus B eine Gitterbasis, muss U eine ganzzahlige Inverse besitzen. Daraus folgt det U = ±1 nach dem Determinantenmultiplikationssatz, da ±1 die einzigen Einheiten in Z sind. Wenn umgekehrt det U = ±1 , so besitzt U nach der Kramerschen Regel eine ganzzahlige Inverse; damit sind alle ai ganzzahlige Linearkombinationen der bj , folglich sogar alle Elemente von L. 2
Folgerung 8.3 und Definition. Sei L ⊂ Rn Gitter mit Basis A und zugeh¨origem Fundamentalparallelotop P . Dessen Volumen V (P ) = | det A| =: d(L) ist unabh¨angig von der Basiswahl und wird daher als Gitterdeterminante bezeichnet.
Abweichend von den oben gew¨ahlten Bezeichnungen werden wir im folgenden gelegentlich beliebige diskrete Untergruppen des Rn als Gitter bezeichnen, auch wenn sie nicht den ganzen Rn als Vektorraum erzeugen. Wir sprechen dann von einem Gitter L in einem Unterraum V ⊂ Rn oder von einem Gitter vom Rang r := dim V , wenn V als Vektorraum von L erzeugt wird.
230
8.2 Untergitter und Elementarteiler
8.2 Untergitter und Elementarteiler 8.2.1 Untergitter und Basiswechsel Hilfssatz 8.4 Seien Λ ⊆ L Gitter im Rn . Dann ist d(Λ) =: D ∈ N d(L) und das Gitter DL = {Da | a ∈ L } erf¨ ullt DL ⊆ Λ ⊆ L . Beweis. Sei B = (b1 , . . . , bn ) eine Basis von Λ und A = (a1 , . . . , an ) eine Basis von L . Dann existiert eine ganzzahlige n × n-Matrix V mit B = AV , welche offenbar D = | det V | erf¨ ullt. Die Restklassen von L mod Λ werden z.B. durch jene Gitterpunkte von L repr¨asentiert, welche in einem Fundamentalparallelotop PΛ von Λ liegen, und man k¨onnte durch einen Vergleich mit dem Volumen von PL schon jetzt einsehen, dass die Anzahl [L : Λ] dieser Repr¨ asentanten gerade D ist. Jedenfalls ist DA Basis von DL , die Matrix DV −1 hat ebenfalls ganzzahlige Koeffizienten (Kramersche Regel), und aus DA = B · DV −1 folgt, dass DL Untergitter von Λ ist. 2 Satz 8.5 Seien Λ ⊆ L Gitter im Rn . Zu jeder Basis a1 , . . . , an von L gibt es eine Basis b1 , . . . , bn von Λ mit b1 = v11 a1 b2 = v12 a1 + v22 a2 .. . bn = v1n a1 +
...
+ vnn an .
Dabei sind (nat¨ urlich) alle vij ∈ Z und alle vii = 0 , o.B.d.A. sogar > 0 . Beweis. F¨ ur alle i ist Dai ∈ Λ , also gibt es jedenfalls Elemente bi = v1i a1 + ahlen mit . . . + vii ai ∈ Λ mit vii > 0 . Die bi sind von dieser Form zu w¨ kleinstm¨oglichem vii > 0 . Behauptung: Dann bilden sie eine Gitterbasis von Λ . G¨abe es n¨amlich ein c ∈ Λ , welches nicht in Zb1 + . . . + Zbn l¨ age, so k¨ onnte man so ein c auch von der Form c1 a1 +. . .+ck ak , ck = 0 , w¨ ahlen mit minimalem k . Division mit Rest von ck durch vkk ergibt ein c − sbk = (c1 − sv1k )a1 + . . . + (ck − svkk )ak ∈ Λ , dessen k-ter Koeffizient entweder verschwindet — dann w¨ are k nicht minimal — at von vkk bei der oder zwischen 0 und vkk liegt im Widerspruch zur Minimalit¨ Konstruktion von bk . 2
231
8 Gitter
Satz 8.6 Unter den gleichen Voraussetzungen kann man umgekehrt zu jeder Ba¨ sis b1 , . . . , bn von Λ eine Basis a1 , . . . , an von L finden, deren Ubergang durch das Gleichungssystem aus Satz 5 gegeben wird. Zum Beweis schreibe man die Basis von Λ wie in Satz 8.2 in Matrixform als B und wende Satz 8.5 auf die Inklusion DL ⊆ Λ an: Es existiert also eine Basis DA von DL von der Form DA = BW mit einer oberen Dreiecksmatrix W . Daraus folgt B = A · DW −1 , und dabei muss auch DW −1 obere Dreiecksmatrix sein. Dass sie außerdem ganzzahlig ist, folgt aus der Gitterinklusion Λ ⊆ L . 2 Zusatzbemerkung. In den S¨atzen 8.5 und 8.6 lassen sich die Basen so w¨ ahlen, dass ¨ in den Ubergangsmatrizen V f¨ ur alle i und j 0 ≤ vij < vii
in Satz 8.5 ,
0 ≤ vij < vjj
in Satz 8.6 .
In Satz 8.5 ist diese Eigenschaft f¨ ur i = 1 trivial erf¨ ullt. Sei k der kleinste Index, f¨ ur den diese Ungleichungen in bk = v1k a1 + . . . + vkk ak nicht alle gelten, und zwar sei darin i der gr¨ oßte Index, f¨ ur den vik nicht im angegebenen Intervall liegt. Division mit Rest von vik durch vii zeigt die Exi < v ullt. Ersetzt man also stenz eines s ∈ Z , welches 0 ≤ vik − svii =: vik ii erf¨ bk durch bk := bk − sbi , so hat man weiterhin eine Basis von Λ , deren neuer nun aber auch die fragliche Ungleichung erf¨ ¨ Ubergangskoeffizient vik ullt. Durch eine doppelte Induktion (aufsteigend in j , absteigend in i ) l¨ asst sich so ein Basiswechsel durchf¨ uhren, dass die erste Ungleichung f¨ ur alle i und j erf¨ ullt ist. Im Fall von Satz 8.6 nimmt man ganz entsprechend einen Basiswechsel von A zu A vor.
8.2.2 Basiserg¨ anzung Folgerung 8.7 Seien b1 , . . . , bm linear unabh¨ angige Elemente des Gitters L ⊂ Rn . Dieses besitzt eine Basis a1 , . . . , an , so dass b1 = v11 a1 b2 = v12 a1 + v22 a2 .. . bm = v1m a1 +
...
+ vmm am
¨ mit ganzzahligen Ubergangskoeffizienten, die alle die Ungleichungen 0 ≤ vij < vjj erf¨ ullen.
232
8.2 Untergitter und Elementarteiler
Man erg¨anze dazu die bj durch weitere Gittervektoren bm+1 , . . . , bn ∈ L zu einer Basis des Rn . Sie bilden dann eine Basis eines Untergitters Λ , auf das man Satz 8.6 und die Zusatzbemerkung anwenden kann. 2 Folgerung 8.8 Seien b1 , . . . , bm linear unabh¨angige Elemente des Gitters L ⊂ Rn . Diese lassen sich genau dann zu einer Gitterbasis von L erg¨anzen, wenn f¨ ur alle c ∈ L mit c = c1 b1 + . . . + cm bm
gilt: alle
ci ∈ Z .
Die Notwendigkeit der angegebenen Bedingung ist klar. Dass die Bedingung auch hinreichend ist, sieht man so ein: Man nehme die Basis a1 , . . . , an des Gitters L aus Folgerung 8.7 und wende die Bedingung nacheinander an auf −1 b1 c = a1 = v11 −1 −1 b2 − v22 v12 b1 c = a2 = v22
⇒ ⇒
v11 = 1
⇒
a1 = b1 ,
v22 = 1 , v12 = 0
⇒
a2 = b2
u.s.w. und zeige so bi = ai f¨ ur alle i ≤ m . Die Erg¨ anzung zu einer Gitterbasis ist dann durch die u ¨brigen ai m¨oglich. Folgerung 8.9 Sei a1 , . . . , an eine Basis des Gitters L ⊂ Rn und b = b1 a1 + . . . + bn an . anzen, wenn der a1 , . . . , am−1 , b lassen sich genau dann zu einer Basis von L erg¨ ggT (bm , . . . , bn ) = 1 ist. Klar, dass eine solche Basiserg¨anzung nur m¨ oglich ist, wenn a1 , . . . , am−1 , b linear unabh¨angig sind, wenn also bm , . . . , bn nicht alle = 0 sind. Nun setze man in Folgerung 8.8 b1 = a1 , . . . , bm−1 = am−1 , bm = b . Die Bedingung c = c1 b1 + . . . + cm bm = c1 a1 + . . . + cm−1 am−1 + cm bm = = (c1 + b1 cm )a1 + . . . + (cm−1 + bm−1 cm )am−1 + cm bm am + . . . + cm bn an ∈ L bedeutet, dass alle Koeffizienten der letzten Zeile ganz sind. Wenn nun (bm , . . . , bn ) = 1 ist, folgt daraus notwendig cm ∈ Z und c1 , . . . , cm−1 ∈ Z . Nach Folgerung 8.8 ist also a1 , . . . , am−1 , b Teil einer Basis von L . Wenn andererseits (bm , . . . , bn ) = b > 1 ist, l¨asst sich c ∈ L so w¨ ahlen, dass cm = 1/b ∈ Z , ci = −bi /b f¨ ur alle i < m sind, und dann ist a1 , . . . , am−1 , b nicht Teil einer Basis von L .
233
8 Gitter
8.2.3 Elementarteilertheorie Der Sinn der S¨atze 8.5 und 8.6 l¨asst sich kurz so beschreiben: Man m¨ ochte sich durch geschickte Basiswahl von Gitter bzw. Untergitter eine m¨ oglichst bequeme ¨ Ubergangsmatrix verschaffen. Es ist plausibel, dass man dieses Ziel am besten erreichen kann, wenn man beide Basen frei w¨ ahlen kann. Satz 8.10 Seien Λ ⊆ L ⊂ Rn Gitter. Es gibt Basen b1 , . . . , bn von Λ und a1 , . . . , an von L so, dass bj = vj aj , vj ∈ N
f¨ ur alle
j = 1, . . . , n
ist und außerdem v1 |v2 | . . . |vn . Beweis durch Induktion u ur n = 1 ist die Aussage des Satzes tri¨ber n . 1.) F¨ vial. Wir nehmen an, der Satz sei f¨ ur Gitter Λ ⊆ L in (n − 1)-dimensionalen R-Vektorr¨aumen V bereits bewiesen. 2.) Man w¨ahle die Basen von Λ und L so, dass in der durch bj = vij ai be¨ stimmten Ubergangsmatrix der vij ∈ Z ein vij = 0 mit m¨ oglichst kleinem Betrag vorkommt. Durch Umnumerierung und eventuellen Vorzeichenwechsel kann man ¨ von der erreichen, dass i = j = 1 und dass nun v1 := v11 > 0 ist. Der Ubergang einen zur anderen Basis wird dann durch das Gleichungssystem b1 = v11 a1 + v21 a2 + . . . + vn1 an b2 = v12 a1 + v22 a2 + . . . + vn2 an .. . bn = v1n a1 + v2n a2 + . . . + vnn an beschrieben, in dem alle |vij | = 0 oder ≥ v11 > 0 sind. 3.) Behauptung: v1 |vj1 f¨ ur alle j . W¨are dies z.B. f¨ ur j = 2 falsch, so g¨ abe es ein s ∈ Z mit 0 < v21 − sv1 < v1 . Ersetzt man nun a1 durch a 1 = a1 + sa2 (man u ¨berzeuge sich, dass dabei die Basiseigenschaft erhalten bleibt), so hat man die erste Zeile des Gleichungssystems zu ersetzen durch b1 = v1 a 1 + (v21 − sv1 )a2 + . . . im Widerspruch zur Minimalit¨at von v1 . Wendet man die gleiche Idee im Fall v1 |v21 an mit s = v21 /v1 , so verschwindet nun der Koeffizient von a2 , und entsprechend ergibt sich f¨ ur die ganze erste Zeile: Die Basis a1 , . . . , an von L l¨asst sich sogar so w¨ahlen, dass v21 = . . . = vn1 = 0 sind. 4.) Behauptung: v1 |v1j f¨ ur alle j . Wie eben f¨ uhre man eine Division mit Rest der v1j durch v1 durch. Wenn z.B. 0 ≤ v12 −sv1 < v1 , ersetze b2 durch b 2 = b2 −sb1 . ¨ Nun beginnt die zweite Zeile des neuen Systems von Ubergangsgleichungen mit b 2 = (v12 − sv1 )a1 + . . . ,
234
8.2 Untergitter und Elementarteiler
und der erste Koeffizient muss wieder wegen der Minimalit¨ at von v1 verschwinden. Entsprechendes gilt f¨ ur die u ¨brigen v1j , man darf also o.B.d.A. annehmen, dass ur alle j > 1 ist. v1j = 0 f¨ 5.) Behauptung: Es ist v1 = v11 |vij f¨ ur alle i, j > 1 . W¨ are dies n¨ amlich f¨ ur ein Indexpaar (i, j) falsch, so g¨abe es ein s ∈ Z mit 0 < vij − sv1 < v1 , und man k¨onnte a1 durch a 1 = a1 + sai und gleichzeitig bj durch b j = bj + b1 ersetzen (man u ¨berzeuge sich wieder, dass dabei die Basiseigenschaft erhalten bleibt) und h¨atte in der neuen Transformationsgleichung f¨ ur b j an der i-ten Stelle den Koeffizienten vij − sv1 im Widerspruch zur Minimalit¨ at von v1 . 6.) Man darf also annehmen, dass der Basiswechsel von L zu Λ durch das folgende Gleichungssystem beschrieben wird: b1 = v1 a1 b2 =
v22 a2 + v32 a3 + . . . + vn2 an
b3 = .. .
v23 a2 + v33 a3 + . . . + vn3 an
bn =
v2n a2 + v3n a3 + . . . + vnn an ,
dabei teilt v1 alle vij . Die Gittervektoren a2 , . . . , an erzeugen ein Gitter L in alt ein von einem (n − 1)-dimensionalen Unterraum V des Rn , und dieses enth¨ b2 , . . . , bn erzeugtes Untergitter Λ , auf das man die Induktionsannahme anwenden kann. 2 Die Rolle des in Hilfssatz 8.4 eingef¨ uhrten Quotienten der Gitterdeterminanten wird durch Satz 8.10 nun deutlicher: Folgerung 8.11 Seien Λ ⊆ L Gitter mit den Basen aus Satz 10. Dann ist D =
d(Λ) = v1 v2 · . . . · vn = (L : Λ) d(L)
der Index von Λ in L . Ein Repr¨ asentantensystem der Restklassen von L/Λ wird durch ur alle i } { c = c1 a1 + . . . + cn an | 0 ≤ ci < vi f¨ gegeben und es ist
L/Λ ∼ = Z/v1 Z × . . . × Z/vn Z .
8.2.4 Endlich erzeugte abelsche Gruppen Die in Satz 8.10 und Folgerung 8.11 aufgetretenen Elementarteiler sind bereits in Satz 2.38, aufgetreten. Diesen Satz u ¨ber die Klassifikation endlicher abelscher Gruppen kann man nun in allgemeinerem Rahmen beweisen.
235
8 Gitter
Satz 8.12 und Definition. Jede endlich erzeugte abelsche Gruppe A ist isomorph zu einem direkten Produkt Z/v1 Z × . . . × Z/vn Z × Zm−n , dabei ist v1 |v2 | . . . |vn . Diese vi lassen sich o.B.d.A. > 1 w¨ahlen und sind dann ebenso wie der (torsionsfreie) Rang m − n von A eindeutig bestimmt. Zum Beweis nehmen wir an, A besitze m Erzeugende. Dann gibt es einen surjektiven Homomorphismus h : Zm → A mit einem Kern K , der einen ndimensionalen Untervektorraum V des Rn erzeugt. Zm ∩ V ist ein Gitter L mit Untergitter Λ = V ∩ K , auf das sich Folgerung 8.11 anwenden l¨ asst. Nach Konstruktion von L l¨asst sich Folgerung 8.8 anwenden, um eine beliebige Basis von urlich durch m − n Elemente, deren L zu einer Basis von Zm zu erg¨anzen, nat¨ h-Bilder in A eine torsionsfreie Untergruppe erzeugen. Bei dieser Konstruktion kann es vorkommen, dass v1 = . . . = vk = 1 ist und erst vk+1 > 1 (wenn man n¨amlich mit u ussigen Erzeugenden von A gearbeitet hat). Es ist klar, ¨berfl¨ dass die entsprechenden Faktoren aus A trivial sind und weggelassen werden k¨onnen. Dass die verbleibenden dann eindeutig bestimmt sind, l¨ asst sich ebenso wie im Beweis von Satz 2.38, zeigen, indem man Schritt f¨ ur Schritt zyklische Untergruppen maximaler Ordnung aus A herausfaktorisiert. Letztlich bleibt eine torsionsfreie abelsche Gruppe u ¨brig, d.h. ohne Elemente endlicher Ordnung außer der 0 , welche mit der gleichen Begr¨ undung wie eben zu einem Gitter Zr isomorph ist. Dass der Rang r dieses Gitters unter Isomorphismen invariant ist, folgt z.B. aus der Invarianz der Dimension: Jeder solche Isomorphismus induziert einen Isomorphismus des umgebenden Rr . 2
8.3 Der Minkowskische Gitterpunktsatz 8.3.1 Konvexe K¨ orper Eine Untermenge H des Rn heißt konvex, wenn zu je zwei Punkten von H auch ihre Verbindungsstrecke zu H geh¨ort, also wenn mit x, y ∈ H auch x+r(y−x) ∈ H ist f¨ ur alle r ∈ [0, 1] . Wenn H nicht in einer Hyperebene enthalten ist, heißt H konvexer K¨ orper. Die folgende Eigenschaft ist leicht zu beweisen, indem man aus den Richtungsvektoren x − x0 von einem festen Punkt x0 ∈ H zu allen anderen Punkten x ∈ H eine Basis des Rn ausw¨ ahlt: Hilfssatz 8.13 Eine konvexe Menge H ⊆ Rn ist genau dann ein konvexer K¨orper, wenn sie ein nichtleeres Inneres besitzt. 2
236
8.3 Der Minkowskische Gitterpunktsatz
Beispiele konvexer K¨orper sind W¨ urfel, Parallelotope, Kugeln, Ellipsoide, Halbr¨aume, alle Durchschnitte (mit nichtleerem Inneren) von konvexen K¨ orpern, insbesondere Polytope, d.h. nichtleere Durchschnitte endlich vieler Halbr¨ aume. F¨ ur alle konvexen Mengen H und alle affinen Transformationen A ist auch A(H) konvexe Menge. Es l¨asst sich zeigen, dass beschr¨ ankte konvexe Mengen (Jordan-) messbar sind und unbeschr¨ankte konvexe K¨ orper unendliches Volumen haben; wir werden diese Sachverhalte hier nicht beweisen, zumal sie in wichtigen Spezialf¨allen, beispielsweise f¨ ur kompakte und offene konvexen Mengen, offensichtlich sind. Das Volumen wird wie schon bei Parallelotopen mit V bezeichnet werden. Symmetrische konvexe K¨ orper sind dadurch ausgezeichnet, dass sie mit jedem Punkt x auch den Punkt −x enthalten, also bez¨ uglich des Nullpunkts 0 punktsymmetrisch sind.
8.3.2 Spezialfall: das ebene Standardgitter Gibt es ganzzahlige L¨osungen der Gleichung 2x2 + 10xy + 13y 2 = 1 ? Da diese quadratische Form positiv definit ist, kann man sie in ein Problem u ¨ber Gittern n punkte umformulieren: Hat das Standardgitter L0 = Z ⊂ R mit der Ellipse 2x2 + 10xy + 13y 2 < 2 außer 0 noch einen weiteren Gitterpunkt gemeinsam? Die Antwort k¨ onnte man in diesem Fall etwas m¨ uhsam verm¨oge quadratischer Erg¨ anzung geben. Die Frage erlaubt aber die Anwendung eines sehr viel allgemeineren Kriteriums, das sich auf alle symmetrischen konvexen K¨orper anwenden l¨ asst und nur noch deren Volumen benutzt (hier: 2π ). Es ist der erstmals 1892 bewiesene Gitterpunktsatz von Minkowski (1864–1909), den wir zun¨achst f¨ ur das Standardgitter L0 = Z2 des R2 vorstellen. Satz 8.14 Sei K ⊂ R2 ein symmetrischer konvexer K¨orper mit Volumen V (K) > 4 . Dann liegt in K ein Punkt = 0 des Gitters L0 . Unter den vielen bis heute bekannten Beweisen des Satzes ist der nun folgende von Mordell besonders elegant. F¨ ur alle t ∈ N sei N (t) die Anzahl der Punkte in 2t L0 ∩ K . Da K Jordan-messbar ist, erh¨alt man lim
t→∞
4 N (t) > 4 , t2
ur alle hinreichen großen t > t0 ∈ N . Die Restklassengruppe also N (t) > t2 f¨ L0 /tL0 enth¨alt nur t2 Elemente, also gibt es f¨ ur t > t0 unter den N (t) Punkten 2 von t L0 ∩ K sicher Punkte x = y mit x−y ∈
2 tL0 , t
237
8 Gitter
oder — anders gesagt — mit 0 =
1 ( x − y ) ∈ L0 . 2
Wegen der Symmetrie von K ist auch −y ∈ K , und aus der Konvexit¨ at von K folgt daher auch 1 (x − y) ∈ K . 2 2 q q q q q q q q q q # q q q q q q q q q q "! q q q q q
Abbildung 8.2: Standardgitter mit Kreis vom Radius 1.2, V (K) = 1.44π > 4 Dass der Minkowskische Gitterpunktsatz scharf ist, kann man an dem (offenen) Parallelogramm der n¨achsten Abbildung erkennen: Hier hat K das Volumen 4 und enth¨alt keinen Gitterpunkt außer 0 . r
r
r
r
r
r
r
r
r
r
r
r
r
r
r
r
r
r
r
r
r
r
r
r
r
r
r
r
r
r
r
r
r
r
r
Abbildung 8.3: Standardgitter mit Parallelogramm K der Fl¨ ache 4
8.3.3 Der Satz von Minkowski – van der Corput Man k¨onnte den obenstehenden Beweis von Mordell ohne weiteres auf h¨ ohere Dimensionen u ¨bertragen. Zur Abwechslung sei eine andere Methode vorgestellt, die zu einem allgemeineren Satz f¨ uhrt. Sie beruht auf dem folgenden Satz von Birkhoff und Blichfeldt.
238
8.3 Der Minkowskische Gitterpunktsatz
Satz 8.15 Sei L ⊂ Rn ein Gitter, S ⊆ Rn eine messbare Menge, m ∈ N , und V (S) > m d(L)
oder
V (S) = m d(L) , S
kompakt.
Dann existieren paarweise verschiedene x1 , . . . , xm+1 ∈ S , so dass alle Differenzen xi − xj in L liegen. Beweis. Wegen Satz 8.1.1 und Folgerung 8.3 gen¨ ugt es, den Satz f¨ ur das Standardgitter L0 mit d(L0 ) = 1 zu beweisen. P sei ein Fundamentalparallelotop f¨ ur L0 , dann gibt es zu jedem x ∈ Rn eindeutig bestimmte y ∈ L0 und z ∈ P mit x = y + z . F¨ ur alle y ∈ L0 sei R(y) := { z ∈ P | y + z ∈ S } , also V (R(y)) = V (S) . y∈L0
Wenn nun V (S) > m ist, muss wegen R(y) ⊆ P ein z0 existieren, welches in mindestens m + 1 Mengen R(y) enthalten ist. Es gibt also paarweise verschiedene y1 , . . . , ym+1 ∈ L0 mit xi = z0 + yi ∈ S f¨ ur alle i . Diese xi erf¨ ullen diese Behauptung. Nun sei S kompakt mit V (S) = m , dazu Bk die kompakte Kugel ||x|| ≤ k1 (euklidische Norm). Dann existiert f¨ ur alle k ∈ N ein (m + 1)-Tupel paarweise verschiedener Punkte x1k ,$ . . . , xm+1,k in Sk := S + Bk , deren Differenzen alle im Gitter liegen. Da S = k Sk und alle Sk kompakt sind, gibt es eine Teilfolge dieser (m + 1)-Tupel, die gegen ein (m + 1)-Tupel (x1 , . . . , xm+1 ) ∈ S m+1 konvergieren (der Einfachheit halber f¨ uhren wir f¨ ur diese Teilfolge keine Doppelindizes ein). Weil die Differenzen xik − xjk stets in L0 liegen und f¨ ur k → ∞ ebenfalls konvergieren m¨ ussen, sind diese Differenzenfolgen f¨ ur hinreichend große k konstant und insbesondere = 0 , die Limites xi also paarweise verschieden. 2 Satz 8.16 Sei m ∈ N , konvexer K¨ orper mit V (K) > m 2n d(L)
L ⊂ Rn ein Gitter und K ⊆ Rn ein symmetrischer oder
V (K) = m 2n d(L) ,
K kompakt.
Dann enth¨alt L ∩ K außer 0 noch mindestens m paarweise verschiedene Punktepaare ±y1 , . . . , ±ym . ullt n¨amlich die Voraussetzungen von Satz 8.15. Es gibt also Beweis. S = 12 K erf¨ m + 1 paarweise verschiedene Punkte 1 xi ∈ S 2
mit
1 1 ur alle i, j . xi − xj ∈ L f¨ 2 2
Definiert man yj := 12 xm+1 − 12 xj , so sind 0, ±y1 , . . . , ±ym paarweise verschiedene Gitterpunkte, und ebenso wie im Beweis von Satz 14 folgt aus Symmetrie und Konvexit¨at, dass sie alle zu K geh¨oren. 2
239
8 Gitter
8.4 Anwendungen des Gitterpunktsatzes 8.4.1 Der Linearformensatz von Minkowski Satz 8.17 Sei L ⊂ Rn ein Gitter, A = (aij ) eine reelle n × n-Matrix und c1 > 0 , . . . , cn > 0 . Wenn c1 · . . . · cn ≥ | det A| d(L) ist, so existiert ein Gittervektor u = (u1 , . . . , un ) ∈ L , u = 0 , mit | a1j uj | ≤ c1 , | aij uj | < ci f¨ ur i = 2, . . . , n . Zum Beweis w¨ahle man den symmetrischen konvexen K¨ orper K0 := { y = (y1 , . . . , yn ) | |y1 | ≤ c1 , |y2 | < c2 , . . . , |yn | < cn } vom Volumen 2n c1 · . . . · cn . Fasst man A als lineare Transformation auf, so ist auch das Urbild K := { u | Au ∈ K0 } ein symmetrischer konvexer K¨orper vom Volumen 2n c1 ·. . .·cn | det A|−1 (der Wert ∞ ist zugelassen). Wenn nun c1 · . . . · cn > | det A|d(L) , so ist die Aussage des Satzes richtig nach dem Minkowskischen Gitterpunktsatz (Satz 8.16 mit m = 1 ). Steht anstelle von ,,>” das Gleichheitszeichen, so ist die Aussage jedenfalls f¨ ur alt also die Existenz von beliebige c1 + k1 , k ∈ N , anstelle von c1 richtig. Man erh¨ nichttrivialen Gitterpunkten uk in diesen — in y1 -Richtung etwas verbreiterten — konvexen K¨orpern. Da in diesem Fall det A = 0 ist, sind diese K¨ orper beschr¨ ankt, und zumindest eine Teilfolge (die dann wie im Beweis von Satz 8.15 konstant wird) konvergiert gegen ein u ∈ L ∩ K0 , u = 0 . 2 Dass f¨ ur alle Linearformen mit einer Ausnahme ,, 0 der K¨orper K := { x ∈ Rn | Q(x) ≤ λ } ein symmetrisches konvexes kompaktes Ellipsoid vom Volumen V (K) = κn λn/2 D−1/2 ist. Nach dem Minkowskischen Gitterpunktsatz (8.16 mit m = 1 ) enth¨alt K einen nichttrivialen Punkt des Standardgitters L0 jedenfalls n n dann, wenn V (K) ≥ 2 ist, also λ ≥ 4 κ−2 n D. 2
8.4.3 Primzahlen als Summe zweier Quadrate Der Minkowskische Gitterpunktsatz verschafft uns einen neuen Zugang zu der schon in Folgerung 4.29 mit v¨ollig anderen Methoden diskutierten Frage nach der arithmetischen Natur von Quadratsummen. Hilfssatz 8.19 Seien n, m, k1 , . . . , km ∈ N und aij ∈ Z f¨ ur alle i = 1, . . . , m , j = 1, . . . , n . Dann ist L := {u ∈ L0 |
n
aij uj ≡ 0 mod ki
f¨ ur alle
i = 1, . . . , m}
j=1
ein Gitter mit d(L) ≤ k1 · . . . · km . Beweis. L ist Untergruppe von L0 und enth¨ alt das Untergitter k1 · . . . · km L0 . Aus Satz 8.1.3 folgt daher, dass L selbst Gitter ist. Folgerung 8.11 sagt ¨ ur alle u, v ∈ L0 gilt die Aquivalenz d(L) = (L0 : L) , und f¨ u ≡ v mod L
⇔
n j=1
aij uj ≡
n
aij vj mod ki
f¨ ur alle i = 1, . . . , m .
j=1
Die Restklassen n u + L ∈ L0 /L sind also charakterisiert durch die m-Tupel von Restklassen j=1 aij uj mod ki , die Anzahl aller dieser Restklassen ist also ≤ k 1 · . . . · km . 2 Satz 8.20 Jede Primzahl p ≡ 1 mod 4 ist Summe von zwei Quadraten in Z .
241
8 Gitter
(Dass Primzahlen p ≡ 3 mod 4 keine solchen Quadratsummen sind, und was f¨ ur die Darstellbarkeit beliebiger nat¨ urlicher Zahlen als Summen zweier Quadrate daraus folgt, wurde bereits in Abschnitt 4.6.3 er¨ ortert.) Zum Beweis sei zun¨ achst 2 + 1 ≡ 0 mod p eine L¨ ) = 1 ist, also i o sung i ∈ Z daran erinnert, dass ( −1 p besitzt. Nach Hilfssatz 8.19 ist L := {u = (u1 , u2 ) ∈ L0 | u2 ≡ iu1 mod p } ein Untergitter von L0 mit Determinante d(L) ≤ p . K := { x ∈ R2 | x21 + x22 < 2p } ist ein konvexer symmetrischer K¨orper mit Fl¨ acheninhalt V (K) = 2πp > 4p ≥ 4d(L) , nach dem Minkowskischen Gitterpunktsatz gibt es also einen nichttrivialen Gitterpunkt in K , mit anderen Worten eine ganzzahlige L¨ osung von 0 < u21 + u22 < 2p . Wegen u21 + u22 ≡ u21 (1 + i2 ) ≡ 0 mod p kann diese nur von der Form u21 + u22 = p sein. 2
8.4.4 Darstellbarkeit durch Summen von vier Quadraten Satz 8.21 (Lagrange) Jede nat¨ urliche Zahl ist Summe von vier Quadraten ganzer Zahlen. Den Beweis kann man nat¨ urlich auf die Darstellbarkeit quadratfreier m ∈ N beschr¨anken, d.h. man darf m = p1 · . . . · pg annehmen mit paarweise verschiedenen Primfaktoren pi . Man u achst, dass f¨ ur jede Primzahl p die ¨berlege sich zun¨ Kongruenz a2p + b2p + 1 ≡ 0 mod p durch ganze Zahlen ap , bp erf¨ ullt werden kann. F¨ ur p = 2 ist diese Behauptung evident, und f¨ ur p > 2 durchlaufen a2p und −b2p −1 mod p jeweils genau (p+1)/2 verschiedene Restklassen, sie m¨ ussen also mindestens eine gemeinsame Restklasse enthalten. Diese ergibt die L¨osung. F¨ ur diese ap , bp betrachtet man nun nach einer Idee von Davenport das System linearer Kongruenzen LKp :
u1 ≡ ap u3 + bp u4 ,
u2 ≡ bp u3 − ap u4 mod p
und definiert damit das Gitter L := {u = (u1 , u2 , u3 , u4 ) ∈ L0 ⊂ R4 | LKp
f¨ ur alle p = p1 , . . . , pg } ,
das nach Hilfssatz 8.19 eine Gitterdeterminante d(L) ≤ p21 p22 · . . . · p2g = m2 hat. Nach dem Gitterpunktsatz liegt in dem symmetrischen konvexen K¨ orper K = {x ∈ R4 |x21 + . . . + x24 < 2m} vom Volumen V (K) =
1 2 π (2m)2 > 24 m2 ≥ 24 d(L) 2
242
8.5 Das Kreis- und Kugelproblem
ein nichttrivialer Gitterpunkt u , der also u21 + u22 + u23 + u24 < 2m erf¨ ullt und die Kongruenzen u21 + u22 + u23 + u24 ≡ (a2p + b2p + 1)u23 + (a2p + b2p + 1)u24 ≡ 0 mod p f¨ ur alle p = p1 , . . . , pg , somit auch u21 + u22 + u23 + u24 ≡ 0 mod m , was zusammen mit der Gr¨oßenabsch¨atzung und u = 0 nur f¨ ur u21 + u22 + u23 + u24 = m m¨oglich ist. 2 ¨ Ahnlich wie bei der Darstellbarkeit durch zwei Quadrate ist auch der hier vorgestellte Beweis nicht der einzige. Wie so oft erh¨ alt man mit mehr methodischem Aufwand reicheren Ertrag, beispielsweise mit Thetafunktionen, einem m¨ achtigen analytischen Hilfsmittel der Gittertheorie, oder mit Hilfe von Quaternionen: Die Anzahl der verschiedenen u ∈ L0 = Z4 , welche zu Darstellungen von m als Summe von vier Quadraten f¨ uhren, l¨asst sich berechnen als 8· d, d|m,4 | d
also die achtfache Summe der Teiler d ≡ 0 mod 4 von m .
8.5 Das Kreis- und Kugelproblem 8.5.1 Problemstellung Im Gitterpunktsatz geht es darum, dass bereits in relativ kleinen konvexen K¨ orpern mindestens ein Gitterpunkt u = 0 liegt, aber schon in der Beweisidee von Mordell spielt die Anzahl der Gitterpunkte in sehr großen K¨ orpern (genauer: im gleichen K¨orper, aber f¨ ur Gitter mit immer kleinerer Masche) eine wichtige Rolle. Was wir dort eigentlich benutzt haben, ist folgende Tatsache, die aus der Messbarkeit der n-dimensionalen Einheitskugel folgt: Das Volumen Vn (t) der n-dimensionalen Kugel K(t) := { x ∈ Rn | x21 + . . . + x2n ≤ t }
√ vom Radius t ist asymptotisch (f¨ ur t → ∞ ) gleich der Anzahl An (t) der in ihr enthaltenen Punkte des Standardgitters L0 = Zn , d.h. limt→∞ An (t)/Vn (t) = 1 . Dabei ist n Vn (t) = κn · tn/2 = π n/2 · Γ(1 + )−1 · tn/2 2 mit dem schon in Abschnitt 4.2 erw¨ahnten Volumen κn der n-dimensionalen Einheitskugel. Wie groß ist in dieser Asymptotik das Restglied, d.h. der Fehler An (t) − Vn (t) ?
243
8 Gitter
8.5.2 Eine einfache obere Absch¨ atzung Satz 8.22 An (t) = Vn (t) + O(t(n−1)/2 ) , ur alle d.h. es existiert eine Konstante C , so dass |An (t) − Vn (t)| ≤ Ct(n−1)/2 f¨ gen¨ ugend großen t ist. (Die O-Schreibweise hatten wir schon in Abschnitt 1.4.2 eingef¨ uhrt.) Zum Beweis seien P + x , x ∈ L0 die Translate des Standard-Fundamentalquaders P = Pn (vgl. Abschnitt 8.1), das der Standardbasis ei , i = 1, . . . n , zugeordnet ist. An (t) ist gleichzeitig das Volumen von " P +x, P (t) := x∈K(t)
√ und weil P den euklidische Durchmesser n besitzt, zeigt die Dreiecksungleichung f¨ ur t > n √ √ √ √ K(( t − n)2 ) ⊂ P (t) ⊂ K(( t + n)2 ) .
Abbildung 8.4: Beispiel n = 2 , t = 81/4 , V2 (t) = 63.6 . . . , A2 (t) = 69 Daraus folgt √ √ √ √ √ √ √ √ Vn (( t− n)2 ) = κn ( t− n)n < An (t) < Vn (( t+ n)2 ) < κn ( t+ n)n , durch Anwenden der binomischen Formel also An (t) = κn tn/2 + O(t(n−1)/2 ) .
2
8.5.3 Eine einfache untere Absch¨ atzung Wie klein ist das Restglied wirklich? Um diese Frage pr¨ azise stellen zu k¨ onnen, verwenden wir die in der analytischen Zahlentheorie u ur ¨bliche Ω-Notation: F¨ rellwertige Funktionen f, g, h , welche f¨ ur gen¨ ugend große t definiert sind, schreibt man f (t) = g(t) + Ω(h(t)) (f¨ ur t → ∞) ,
244
8.5 Das Kreis- und Kugelproblem
wenn (f (t)−g(t))/h(t) f¨ ur t → ∞ nicht gegen 0 konvergiert. Ω-Resultate geben also untere Schranken f¨ ur obere Absch¨atzungen, also f¨ ur O-Resultate. F¨ ur das Kreis- und Kugelproblem zeigen wir hier An (t) = Vn (t) + Ω(t(n−2)/2 )
Satz 8.23
Der Beweis beruht auf der Beobachtung, dass f¨ ur alle m ∈ N 1 An (m) = An (m + ) 2 osungen von x21 + . . . + x2n ≤ t ist. ist, weil An (t) die Anzahl der ganzzahligen L¨ W¨are die Behauptung des Satzes falsch, so h¨ atte man insbesondere An (m) − Vn (m) = 0, m→∞ m(n−2)/2 lim
An (m + 12 ) − Vn (m + 12 ) = 0, m→∞ (m + 12 )(n−2)/2 lim
und daraus durch Differenzbildung 0 = Vn (m + 12 ) Vn (m) 1 1 − (n−2)/2 + An (m) − lim ≥ m→∞ (m + 1 )(n−2)/2 m m(n−2)/2 (m + 12 )((n−2)/2 2 ≥ κn lim
m→∞
(m + 12 )n/2 mn/2 − (m + 12 )(n−2)/2 m(n−2)/2
= κn lim (m + m→∞
κn 1 − m) = , 2 2
Widerspruch. 2
8.5.4 Verbesserungen und offene Fragen Die Beziehungen zu den Darstellungsanzahlen nat¨ urlicher Zahlen durch Quadratsummen, die wir eben genutzt haben, machen deutlich, warum man an einem m¨oglichst genauen Restglied interessiert ist. Aus den letzten S¨ atzen folgt, dass der wahre Exponent αn des Restglieds zwischen n2 − 1 und n2 liegen muss. Seit Landau und Hardy (1915) weiß man, dass f¨ ur n = 2 die untere Absch¨ atzung 1 α2 ≥ 4 erf¨ ullt, und Verbesserungen hat es seitdem nur in log-Faktoren gegeben. Der Rekord liegt bei Hafner 1981: Es gibt ein c > 0 mit A2 (t) = π t + Ω(t1/4 (log t)1/4 (log log t)(log 2)/4 exp(−c(log log log t)1/2 ) . Die beste bekannte obere Absch¨atzung stammt von Huxley 1993 nach Vorarbeiten von Bombieri und Ivaniec, n¨amlich A2 (t) = π t + O(t23/73 (log t)315/146 ) ,
245
8 Gitter
jedenfalls ist also α2 schon sehr nahe an 1/4 . F¨ ur das Kugelproblem im Raum lauten die besten heute bekannten Resultate 2
1
1
A3 (t) = V3 (t) + O(t 3 log6 t) = V3 (t) + Ω(t 2 log 2 t) Alle diese Verbesserungen (I.M. Vinogradov 1963, Szeg¨ o 1926) erfordern einen erheblichen Aufwand! Merkw¨ urdigerweise wird das Problem in h¨ oheren Dimensionen wieder einfacher (Walfisz 1924): F¨ ur n = 4 ist man mit A4 (t) = V4 (t) + O(t log t) = V4 (t) + Ω(t log log t) schon sehr nahe an der unteren Absch¨atzung des Restglieds durch Satz 23, und f¨ ur n > 4 schließt sich die L¨ ucke ganz verm¨ oge An (t) = Vn (t) + O(t(n−2)/2 ) .
8.6 Der Satz von Minkowski-Hlawka Auch dieser Abschnitt besch¨aftigt sich mit einer Fragestellung, die sich aus dem Minkowskischen Gitterpunktsatz ergibt. Gegeben eine messbare Menge S ⊂ Rn , die nicht in einem echten linearen Unterraum des Rn gelegen ist. Was l¨ asst sich dann u ur die ¨ber die kleinstm¨ogliche Gitterdeterminante d(L) aussagen, f¨ ur das L ∩ S nur aus 0 und Randpunkten von S ein Gitter L ⊂ Rn existiert, f¨ besteht? Wir werden die Fragestellung einschr¨ anken auf Sternk¨ orper S ⊂ Rn , die wir durch folgende Eigenschaft definieren: S ist nichtleer, und f¨ ur jeden Punkt x der abgeschlossenen H¨ ulle S von S und jedes r aus dem halboffenen Intervall [0, 1) geh¨ort der Punkt rx zum offenen Kern S 0 von S . Insbesondere ist auch S 0 nichtleer, und jede von 0 ausgehende Halbgerade trifft den Rand von S h¨ ochstens in einem Punkt. Beispiele von Sternk¨orpern sind alle konvexen K¨ orper, die 0 im Innern enthalten, aber auch der durch |x1 x2 | < 1 definierte Bereich des R2 . Wie schon konvexe K¨orper heißen auch Sternk¨ orper symmetrisch, wenn f¨ ur jedes x ∈ S auch −x zu S geh¨ort.
8.6.1 Zul¨ assige Gitter und kritische Determinante Sei S ⊂ Rn messbar. Ein Gitter L ⊂ Rn heißt (S-)zul¨ assig, wenn L ∩ S 0 = {0} ist, und streng (S-)zul¨ assig, wenn sogar L∩S = {0} ist. Die Gitterkonstante oder kritische Determinante von S ist Δ(S) := inf{ d(L) | L
streng zul¨ assig } .
Wenn kein streng zul¨assiges Gitter f¨ ur S existiert, setzen wir Δ(S) := ∞ . Anstelle streng zul¨assiger Gitter kann man bei Sternk¨ orpern ebensogut mit zul¨ assigen Gittern arbeiten wegen der ersten der im folgenden Hilfssatz zusammengestellten elementaren Eigenschaften.
246
8.6 Der Satz von Minkowski-Hlawka
Hilfssatz 8.24 S ⊆ Rn sei ein Sternk¨orper. Dann gilt 1. Δ(S) = inf{ d(L) | L
zul¨assig } ,
2. Δ(S) = 0 , 3. jedes Gitter L ⊂ Rn mit d(L) < Δ(S) enth¨alt einen Punkt 0 = x ∈ L∩S , 4. f¨ ur jeden kleineren Sternk¨orper K ⊂ S ist Δ(K) ≤ Δ(S) , 5. f¨ ur alle r ∈ R∗ ist Δ(rS) = |r|n Δ(S) , 6. f¨ ur alle A ∈ GLn (R) ist Δ(AS) = | det A| · Δ(S) , 7. f¨ ur konvexe symmetrische K¨orper K ist Δ(K) ≥ 2−n V (K) . (3. bis 6. sind f¨ ur beliebige M ⊆ Rn g¨ ultig.) Beweis. 1. Wenn L zul¨ assig ist, so ist rL streng zul¨assig f¨ ur jedes reelle r > 1 , denn wir wissen bereits, dass auf jeder von 0 ausgehenden Halbgeraden h¨ochstens ein Randpunkt von S liegen kann. F¨ ur 6. ersetze man alle Gitter L durch AL , und 5. ist ein Spezialfall davon. 7. ergibt sich aus dem Gitterpunktsatz von Minkowski. 3. und 4. ergeben sich direkt aus der Definition von Δ . Zum Beweis von 2. beachte man, dass 0 innerer Punkt von S ist, und dass darum ein konvexer symmetrischer K¨ orper K ⊂ S existiert, auf den man 7. und 4. anwenden kann. 2 Beispiel. S := { x = (x1 , . . . , xn ) ∈ Rn | |x1 x2 · . . . · xn | < 1 } ist ein Sternk¨ orper und enth¨alt nach der Ungleichung vom geometrischen und arithmetischen Mittel den konvexen symmetrischen K¨orper K = { x | |x1 | + |x2 | + . . . + |xn | < n } vom Volumen 2n nn /n! , also ist Δ(S) ≥ nn /n! . Der letzte Punkt des Hilfssatzes gibt eine untere Absch¨ atzung f¨ ur den Quotienten Δ(K)/V (K) . L¨asst sich auch eine obere Absch¨ atzung finden, d.h. eine Schranke q , so dass f¨ ur jedes d ≥ qV (K) ein zul¨assiges Gitter L mit d(L) = d existiert?
8.6.2 Hilfsbetrachtungen Hilfssatz 8.25 f : Rn → R sei eine stetige Funktion mit kompaktem Tr¨ager { x ∈ Rn | f (x) = 0 } , und f¨ ur alle x ∈ R sei
V (x) := f (x1 , . . . , xn−1 , x) d(x1 , . . . , xn−1 ) . Rn−1
Λ sei ein Gitter vom Rang n − 1 in der Hyperebene xn = 0 und a > 0 fest ur das Gitter Lz := gew¨ahlt. Dann gibt es ein z = (z1 , . . . , zn−1 , a) , so dass f¨ Λ + Zz gilt 1 f (x) = V (ra) . d(Λ) x∈Lz , xn =0
r∈Z, r=0
247
8 Gitter
Zum Beweis d¨ urfen wir verm¨oge einer Koordinatentransformation in der Hyperebene xn = 0 annehmen, dass Λ das Standardgitter des Rn−1 ist; die Integrale ¨andern sich dabei um den gleichen Faktor wie d(Λ) . Dann wird f (x) = f (u1 + rz1 , . . . , un−1 + rzn−1 , ra) . x∈Lz , xn =0
r∈Z, r=0 u1 ,...,un−1 ∈Z
Integriert man die innere Summe u ¨ber die zi und setzt rzi = yi , so wird
1
1 ... f (u1 + rz1 , . . . , un−1 + rzn−1 , ra)dz1 · . . . · dzn−1 = 0
= r
0
−n+1
ui ∈Z
r 0
=
r
... 0
1
... 0
0
1
f (u1 + y1 , . . . , un−1 + yn−1 , ra) dy1 · . . . · dyn−1 =
ui ∈Z
f (u1 + y1 , . . . , un−1 + yn−1 , ra) dy1 · . . . · dyn−1 =
ui ∈Z
= Rn−1
f (y1 , . . . , yn−1 , ra) d(y1 , . . . , yn−1 ) = V (ra) .
Summiert man nun u ¨ber r , so ergibt sich ⎛ ⎞
1
1 ⎝ ... f (x) ⎠ dz1 · . . . · dzn−1 = 0
0
x∈Lz , xn =0
V (ra) ,
r∈Z, r=0
und mit dem Mittelwertsatz der Integralrechnung erh¨ alt man daraus die Behauptung des Hilfssatzes (f¨ ur d(Λ) = 1 ). 2 Hilfssatz 8.26 Sei f : Rn → R eine beschr¨ankte Riemann-integrierbare Funktion mit kompaktem Tr¨ager. F¨ ur alle > 0 gibt es ein Gitter L ⊂ Rn mit d(L) = 1 und
f (x) < f (x) dx + . x∈L, x=0
Rn
Zum Beweis sei zun¨achst f stetig, a > 0 und Λ das Gitter in der Hyperebene xn = 0 mit der Basis be1 , . . . , ben−1 , b = a−1/(n−1) , so dass d(Λ) = 1/a wird und die im vorigen Hilfssatz betrachteten Gitter Lz die Determinante 1 haben. F¨ ur a → 0 , d.h. b → ∞ , ist f (x) = 0 f¨ ur alle x ∈ Λ, x = 0 , weil f kompakten Tr¨ager hat. Andererseits ist nach dem Satz von Fubini
lim a V (ra) = f (x) dx . a→0
r∈Z, r=0
Rn
248
8.6 Der Satz von Minkowski-Hlawka
Es gibt also zu jedem > 0 ein hinreichend kleines a > 0 und dazu nach Hilfssatz 8.25 ein Gitter L = Lz mit
f (x) = f (x) = a V (ra) < f (x) dx + , x∈L, x=0
x∈L, xn =0
r∈Z, r=0
Rn
wie behauptet. Verzichtet man nun auf die Voraussetzung, dass f stetig ist, so kann man f als Riemann-integrierbare Funktion von oben durch eine Treppenfunktion und darum (durch Gl¨atten) sogar durch eine stetige Funktion f1 so approximieren, ur alle x ∈ Rn und trotzdem % %dass f1 (x) ≥ f (x) ist f¨ Rn f1 (x)dx < Rn f (x)dx + , also
f (x) ≤ f1 (x) < f1 (x) dx + < f (x) dx + 2 . 2 x∈L, x=0
Rn
x∈L, x=0
Rn
Satz 8.27 Sei M ⊂ Rn beschr¨ankt und Jordan-messbar. Dann ist Δ(M ) ≤ V (M ) . Wenn dar¨ uber hinaus M symmetrisch ist, gilt sogar Δ(M ) ≤
1 V (M ) . 2
Sei zun¨achst V (M ) < 1 und f die charakteristische Funktion von M . Aus Hilfssatz 8.26 folgt, dass es ein Gitter L ⊂ Rn mit d(L) = 1 gibt und f (x) < 1 ⇒ f (x) = 0 ⇒ L ∩ M ⊆ {0} , x∈L, x=0
x∈L, x=0
L ist also streng M -zul¨assig, somit Δ(M ) ≤ 1 . Da diese Schlussweise auf alle rM, r ≥ 0 , anwendbar ist, solange nur V (rM ) < 1 ist, folgt daraus die erste Behauptung. F¨ ur die zweite Behauptung sei M symmetrisch und M± := { x ∈ M | xn ≥ 0
bzw.
xn ≤ 0 } .
Dann ist offenbar M− = −M+ und V (M± ) = 12 V (M ) , andererseits — wegen der Symmetrie des Gitters — Δ(M± ) = Δ(M ) . 2
8.6.3 Primitive Gitterpunkte Mit dem letzten Satz hat man eine bereits eine obere Absch¨ atzung von Δ(M )/V (M ) gewonnen. Wie von Minkowski vermutet und von Hlawka bewiesen, kann man diese Absch¨atzung im Fall von Sternk¨ orpern um einiges verbessern, indem man die Summation u ¨ber die Gitterpunkte auf eine Summation u ¨ber
249
8 Gitter
eine sehr spezielle Auswahl von Gitterpunkten zur¨ uckspielt. Sei dazu L ⊂ Rn ein Gitter mit Basis a1 , . . . , an . Einen Gitterpunkt x ∈ L nennen wir primitiv, wenn er = 0 und kein echtes Vielfaches eines anderen Gitterpunkts ist. An der Koordinatendarstellung x = a1 a1 + . . . + an an ist das daran erkennbar, dass die Koeffizienten a1 , . . . , an teilerfremd sind. Geometrisch l¨asst sich diese Eigenschaft dadurch ausdr¨ ucken, dass die primitiven Gitterpunkte genau jene sind, die vom Nullpunkt aus ,,sichtbar” sind (schwarze Punkte in Abb. 8.5, Punkt (3, 2) ist sichtbar vom Nullpunkt aus, Punkt (6, 4) unsichtbar). c
s
c
c
c
s
c
c
s
s
s
s
c
s
s c s s s c c s c s c s c c s c s s s s s s s c c c c c s c 0 c
s
c
s
c
Abbildung 8.5: Primitive Gitterpunkte im ersten Quadranten eines ebenen Standardgitters Satz 8.28 Sei n > 1 und S ⊂ Rn ein Sternk¨orper. Dann ist Δ(S) ≤
1 V (S) . ζ(n)
Ist S ein symmetrischer Sternk¨orper, so gilt sogar Δ(S) ≤
1 V (S) . 2ζ(n)
Dabei ist ζ(n) = N k −n die in Abschnitt 1.4.2 eingef¨ uhrte Riemannsche Zetaur die funktion. Zum Beweis sei daran erinnert, dass 1/ζ(n) = N μ(k)k−n ist f¨ in Abschnitt 4.1.2 behandelte M¨ obiussche μ-Funktion (leicht zu beweisen mit Hilfe der Eulerschen Produktdarstellung der Zetafunktion, vgl. Aufgaben 4.7.1 und 2). Den Beweis werden wir f¨ ur beschr¨ankte Sternk¨ orper f¨ uhren. Wie im Beweis von Satz 8.27 gen¨ ugt es, zu zeigen, dass Δ(S) ≤ 1 ist, wenn V (S) < ζ(n) gilt bzw.
250
8.6 Der Satz von Minkowski-Hlawka
V (S) < 2ζ(n) im symmetrischen Fall. Sei nun f0 die charakteristische Funktion von S und ∞ μ(k) f0 (kx) . f (x) := k=1
F¨ ur ein zun¨achst beliebiges Gitter L ⊂ Rn bezeichnet man mit L∗ die Summation u ber die primitiven Gitterpunkte von L ; die M¨ o biussche Umkehrformel ¨ (Abschnitt 4.1.6) ergibt
∞
f (x) =
f (mx) =
∞ ∞
m=1 L∗
x∈L, x=0
=
∞
μ(k) f0 (kmx) =
L∗ m=1 k=1
f0 (sx)
L∗ s=km=1
μ(d) =
f0 (x) .
L∗
d|s
Aus Hilfssatz 8.26 folgt nun f¨ ur jedes > 0 die Existenz eines Gitters L mit d(L) = 1 und
f0 (x) = f (x) < f (x) dx + = L∗
=
∞ k=1
x∈L, x=0
μ(k) Rn
f0 (kx) dx + =
Rn
∞ μ(k) V (S) + < 1 kn k=1
(bzw. < 2 f¨ ur symmetrische S ). Daraus folgt, dass S keinen primitiven Gitterpunkt enth¨alt; weil S Sternk¨orper ist, enth¨ alt S u ¨berhaupt keinen Gitterpunkt = 0 , somit ist L streng zul¨assig, damit ist die Behauptung f¨ ur beschr¨ ankte S bewiesen. F¨ ur unbeschr¨ankte S und V (S) = ∞ ist nichts zu zeigen. F¨ ur unbeschr¨ ankte S mit endlichem Volumen V (S) darf man o.B.d.A. annehmen, dass S offen ist und ausgesch¨opft wird durch eine Folge beschr¨ ankter Sternk¨ orper Sr := { x ∈ S| ||x|| < r } , f¨ ur die jeweils ein zul¨assiges Gitter Lr mit d(Lr )ζ(n) ≤ V (Sr ) (bzw. ≤ 12 V (Sr ) ) existiert. Da die L¨ange der beteiligten Gittervektoren nach unten beschr¨ankt ist, kann man mit Hilfe eines geeigneten Konvergenzbegriffs f¨ ur die Gitter Lr (Chabauty-Topologie, Kompaktheitssatz von Mahler) zeigen, dass auch f¨ ur S ein zul¨assiges Gitter L mit der gew¨ unschten oberen Absch¨ atzung f¨ ur die Gitterdeterminante existiert. Da die Details einigen Aufwand erfordern und dieser Teil des Satzes f¨ ur uns in der Folge keine Rolle spielen wird, sei hierzu auf speziellere Literatur u ¨ber die Geometrie der Zahlen verwiesen ([Ca], [GL]). 2 Wir gehen nun von Δ(K)/V (K) zum reziproken Quotienten u ¨ber, der in den Lagerungsproblemen des n¨achsten Abschnitts eine besondere Rolle spielen wird. F¨ ur n = 2 und konvexe symmetrische K¨ orper erhalten wir aus Satz 8.28 die Absch¨atzungen π2 V (K) ≤ ≤4 3.2 < 3 Δ(K)
251
8 Gitter
und entsprechend f¨ ur n = 3 2.4 < 2 ζ(3) ≤
V (K) ≤8. Δ(K)
Hier deutet sich schon an, dass mit wachsender Dimension die vorhandenen Absch¨atzungen immer weniger aussagekr¨aftig werden. Beweistechnisch liegt das daran, dass in Hilfssatz 8.25 ein Mittelungsprozess u ¨ber alle Gitter eines bestimmten Typs vorgenommen wird und somit ein durchschnittliches und keineswegs ein besonders g¨ unstiges zul¨assiges Gitter ausgew¨ ahlt wird. Wie man dieses f¨ ur Kreise und Kugeln gewinnen kann, werden wir im folgenden Abschnitt sehen — leider aber mit Methoden, die auf kleine Dimensionen beschr¨ ankt sind. Zu erw¨ahnen ist hier, dass Rogers und W.M. Schmidt Verbesserungen des Satzes von Minkowski-Hlawka erzielt haben, welche einen erheblichen Aufwand erfordern und f¨ ur große n leider nur eine geringe Verbesserung erbringen ([Ca], [Ro]).
8.7 Packungsdichte 8.7.1 Gitterpackungen und zul¨ assige Gitter Sei K ⊂ Rn ein offener beschr¨ankter konvexer K¨ orper. Ein Gitter L ⊂ Rn heißt Packungsgitter f¨ ur K , wenn die Menge der Translate K + L disjunkt ist, d.h. wenn f¨ ur alle x = y ∈ L gilt K + x ∩ K + y = ∅. In diesem Fall nennt man K + L eine Gitterpackung. Die Voraussetzungen, dass L ein Gitter ist und dass K konvex und beschr¨ ankt ist, spielt f¨ ur die Begriffsbildung eigentlich keine Rolle, wird aber S¨ atze und Beweise dieses Abschnitts ganz erheblich vereinfachen. Auf den allgemeineren Packungsbegriff werden wir nur gelegentlich verweisen. Gitterpackungen stehen in engem Zusammenhang mit den im vorigen Abschnitt behandelten zul¨assigen Gittern: Satz 8.29 K ⊂ Rn sei offener beschr¨ankter konvexer K¨orper. Ein Gitter L ⊂ Rn ist genau dann ein Packungsgitter f¨ ur K , wenn L zul¨ assig ist f¨ ur die Differenzmenge DK := { x − y | x, y ∈ K } . Wenn K symmetrischer konvexer K¨orper ist, so ist DK = 2K . (Man erinnere sich, dass Differenzmengen schon in den Beweisen des Minkowskischen Gitterpunktsatzes eine wesentliche Rolle gespielt haben.) Zum Beweis sei zun¨achst L kein Packungsgitter f¨ ur K . Dann gibt es x = y ∈ L mit K + x ∩ K + y = ∅ ,
252
8.7 Packungsdichte
also a, b ∈ K mit 0 = x − y = a − b ∈ DK ∩ L , L ist also nicht DK-zul¨assig. Der Umkehrschluss funktioniert genauso, und der Zusatz u ¨ber symmetrische konvexe K¨orper ist evident. 2
8.7.2 Dichte F¨ ur eine Packung von K kann man nun in naheliegender Weise einen Dichtebegriff einf¨ uhren: Sei etwa Q ein achsenparalleler und 0-symmetrischer Quader der Seitenl¨ange s und δ(L, K) := lim sup V ((K + L) ∩ Q)/sn . s→∞
Dass f¨ ur Gitterpackungen beschr¨ankter offener Mengen K rechts sogar der Limes ¨ existiert, ist eine Ubungsaufgabe der Analysis II oder III: Man mache sich klar, dass man Q durch Parallelotope ersetzen darf und arbeite mit Vielfachen eines Fundamentalparallelotops von L . Dann steht rechts gerade der Anteil von K +L am Fundamentalparallelotop von L , und die Translationsinvarianz des Volumens sowie die Pflasterungseigenschaft des Fundamentalparallelotops (vgl. Abschnitt 8.1) ergeben Hilfssatz 8.30 F¨ ur offene beschr¨ankte K ⊂ Rn mit Packungsgitter L ist die Gitterpackungsdichte δ(L, K) = V (K)/d(L) .
Es ist plausibel, dass man sich bei festem K f¨ ur besonders dichte Packungen interessiert und darum versucht, die obere (Gitter)packungsdichte ρ(K) := sup δ(L, K) L
zu bestimmen oder zumindest einzugrenzen. Das Supremum werden wir hier u ¨ber alle Packungsgitter L f¨ ur K nehmen, man beachte allerdings die Bemerkungen am Ende dieses Abschnitts 8.7 u ¨ber Nicht-Gitter-Packungen. Bei festem konvexem symmetrischem K das Supremum u aquivalent ¨ber die V (K)/d(L) zu nehmen, ist ¨ zur Bestimmung des Infimums u ur 2K-zul¨ assige Gitter L (Satz ¨ber die d(L) f¨ 8.29), also zur Bestimmung von Δ(2K) = 2n Δ(K) (Hilfssatz 8.24.5), und nach dem Satz von Minkowski-Hlawka heißt das orper. F¨ ur seine Satz 8.31 Sei K ⊂ Rn , n > 1 , ein konvexer symmetrischer K¨ obere Gitterpackungsdichte gilt 21−n ζ(n) ≤ ρ(K) .
8 Gitter
253
8.7.3 Dichteste Kreisgitterpackungen Am interessantesten — auch f¨ ur praktische Anwendungen, wie sich im kommenden Abschnitt zeigen wird — sind dichte Kugelpackungen. Hierzu sind keine allgemeinen Resultate bekannt, die wesentlich besser w¨ aren als die eben gewonnene Absch¨atzung f¨ ur ρ(K) , allerdings sind f¨ ur viele kleine n dichte und z.T. sogar dichteste Kugelgitterpackungen bekannt [CS], die eine weit bessere Packungsdichte ergeben als Satz 8.31. Wir wollen uns hier mit zwei klassischen Resultaten begn¨ ugen und beginnen mit einem Satz von Lagrange (1773). Satz 8.32 Das hexagonale Gitter L ⊂ R2 (d.h. mit zwei Gitterbasisvektoren gleicher L¨ange, die den Winkel π/3 einschließen) liefert die — bis auf Streckungen und Drehungen sogar eindeutig bestimmte — dichteste Kreisgitterpackung. Die Dichte ist π ρ(K) = δ(L, K) = √ ≈ 0.907 . 2 3 (Die Schranke aus Satz 8.31 w¨ urde hier ζ(2)/2 = π 2 /12 ≈ 0.822 ergeben.) Beweis. 1. O.B.d.A. d¨ urfen wir annehmen, dass K der offene Einheitskreis ist. Da Packungsgitter L ⊂ R2 gesucht sind, haben alle Gitterpunkte einen euklidischen Abstand ≥ 2 voneinander, insbesondere erf¨ ullt der Gitterpunkt mit kleinster euklidischer Norm die Ungleichung ||a|| ≥ 2 . 2. W¨are nun ||a|| > 2 , so h¨atten keine zwei Kreise der Gitterpackung L + K gemeinsame Randpunkte, und es g¨abe ein > 0 , so dass auch noch (1 − )L ein Packungsgitter f¨ ur K w¨are, und zwar mit gr¨ oßerer Dichte als L . Bei der Suche nach dichtesten Gitterpackungen d¨ urfen wir also annehmen, dass der k¨ urzeste Gittervektor a = 0 die euklidische L¨ange 2 hat. Durch Drehung des Koordinatensystems darf man o.B.d.A. annehmen, dass a = (2, 0) ist, also in Richtung der positiven x-Achse zeigt. 3. W¨ urde der Kreis K nun nur die Nachbarkreise K ± a ber¨ uhren (d.h. gemeinsame Randpunkte mit ihnen besitzen), so w¨ urde die Gitterpackung in isolierte Kreisketten K +b+Za zerfallen und man k¨ onnte L in y-Richtung mit einem Faktor (1 − ) multiplizieren, ohne die Gitterpackungseigenschaft zu zerst¨ oren, aber mit Verdichtung der Packung. Man darf also annehmen, dass K nicht nur seine beiden Nachbarn in x-Richtung ber¨ uhrt, dass also ein Gitterpunkt b ∈ L − Za existiert mit euklidischer L¨ange ||b|| = 2 . ¨ 4. Durch eventuellen Ubergang zu −b darf man annehmen, dass a und b einen Winkel ≤ π/2 einschließen. Dieser Winkel ist außerdem ≥ π/3 , da andernfalls ||b−a|| < 2 w¨are. Die Punkte a und b bilden eine Gitterbasis von L : Andernfalls g¨abe es in dem von a und b aufgespannten Parallelogramm einen weiteren Gitterpunkt, der von einem der Eckpunkte notwendig einen euklidischen Abstand < 2 h¨atte im Widerspruch zu der Packungseigenschaft.
254
8.7 Packungsdichte q q b c q q 0 a
Abbildung 8.6: Eine Kreisgitterpackung im R2 5. Das von a und b aufgespannte Parallelogramm ist also ein Fundamentalparallelogramm P von L , und es ist zu untersuchen, wann unter den oben gefundenen Bedingungen π π ≤ ∠(a, b) ≤ ||a|| = ||b|| = 2 , 3 2 d(L) = V (P ) sein Minimum annimmt. Es ist leicht zu sehen, dass dies gerade f¨ ur den Winkel π/3 der Fall ist. 2
8.7.4 Die dichteste Kugelgitterpackung Satz 8.33 (Gauß 1831) Die (bis auf Streckungen und Drehungen) eindeutige achenzentriert-kubische Gitdichteste Kugelgitterpackung im R3 wird durch das fl¨ ter L ⊂ R3 realisiert, dessen Basispunkte mit 0 ein regul¨ares Tetraeder bilden. ρ(K) =
π √ ≈ 0.74 3 2
(Die Schranke aus Satz 8.31 w¨ urde hier ζ(3)/4 ≈ 0.3 ergeben!) Die Beweisschritte 1. bis 3. aus dem Beweis von Satz 8.32 k¨onnen wir direkt u ¨bernehmen. Sie zeigen, dass ein dichtestes Packungsgitter L f¨ ur die Einheitskugel in der xy-Ebene eines geeigneten cartesischen Koordinatensystems ein Teilgitter Λ bilden mit Erzeugenden a, b , welche die Bedingungen ||a|| = ||b|| = 2 ,
π π ≤ ∠(a, b) ≤ 3 2
erf¨ ullen. Der Schnitt der Kugelpackung mit der xy-Ebene sieht also aus wie in Abb. 8.6 angegeben. 4. Wie schon in der Basiskonstruktion aus Abschnitt 1 zerf¨ allt L in Schichten parallel zu Λ . Wenn Λ + K keine andere Kugel der Kugelpackung L + K ber¨ uhrt, kann man die z-Koordinaten des Gitters L wieder mit (1 − ) multiplizieren, um die Dichte zu erh¨ohen und ohne die Packungseigenschaft zu zerst¨ oren. Bei der Suche nach dichtesten Kugelgitterpackungen darf man also zus¨ atzlich annehmen, dass ein dritter Gittervektor d ∈ L − Λ existiert mit euklidischer L¨ ange
255
8 Gitter
||d|| = 2 . Die Projektion d von d auf die xy-Ebene liegt o.B.d.A. in dem Fundamentalparallelogramm von Λ , welches von a, b erzeugt wird, o.B.d.A. sogar in dem abgeschlossenen Dreieck 0, a, b . Analog zum Beweis von Satz 8.32 bilden a, b, d eine Gitterbasis von L , weil das von ihnen erzeugte Parallelotop P nur Punkte enth¨alt, die von einem der Eckpunkte einen Abstand < 2 haben. Die Abbildung 8.7 zeigt das Teilgitter Λ (schwarze Punkte) und die Translate Λ + d (weiße Punkte), also die Projektion der n¨achsten Schicht von L . r b
b r
b
r b
0 b
r
rc
b
d’
r
r
b
b
r
r
b
b r
a
r
b r
Abbildung 8.7: Zwei Schichten einer Kugelgitterpackung im R3 , Grundriss 5. Die Gitterdeterminante d(L) = V (P ) ist nun 2F h , wobei F die Fl¨ ache des Dreiecks 0, a, b bezeichnet und h den Absolutbetrag der z-Koordinate von d . Wegen 4 = ||d||2 = ||d ||2 + h2 l¨auft die Suche nach einer dichtesten Kugelgitterpackung bei gegebenem Λ darauf hinaus, ||d || zu maximieren. Da die Kugel K + d sich nicht mit den Kugeln K + a, K + b schneiden darf, muss dabei ||a − d ||2 , ||b − d ||2 ≥ 4 − h2 = ||d ||2 sein. Etwas Elementargeometrie zeigt: Unter diesen Bedingungen wird ||d || genau dann maximal, wenn hier das Gleichheitszeichen steht, wenn also d der Umkreismittelpunkt des Dreiecks 0, a, b ist und R = ||d || der Umkreisradius, denn jeder andere Punkt d im Dreieck hat von einem der Eckpunkte einen kleineren Abstand als R . 6. Um ein Kugelpackungsgitter maximaler Dichte zu finden, ist also 2F h zu minimieren, wo F die Fl¨ache eines√gleichschenkligen Dreiecks mit Schenkell¨ ange 2 und Basisl¨ange u ist, 2 ≤ u ≤ 2 2 , und h zum Umkreisradius R des Dreiecks in der Beziehung h2 = 4 − R2 steht. Etwas mehr Elementargeometrie: Wir bezeichnen den Mittelpunkt des Dreiecks mit M und den Mittelpunkt der Basisseite mit B , die L¨ange der Strecke MB mit l , dann sagt der Satz des Pythagoras (R + l)2 +
u2 = 4 und 4
u2 + l 2 = R2 , 4
256
8.7 Packungsdichte
also
2 R ist die H¨ohe des Dreiecks auf der Basisseite. Daraus entnimmt man R2 + 2Rl + R2 = 2R(R + l) = 4 ,
und R + l =
u u2 1 + 2 = 1 und F = . 16 R R uhren ( 12 ≤ v ≤ Es ist zweckm¨aßig, v := 1/R2 als Hilfsgr¨oße einzuf¨ Quadrat der Gitterdeterminante u ¨berzugehen. Dieses wird dann
3 4
) und zum
1 4F 2 h2 = 4u2 v(4 − ) = 64(1 − v)(4v − 1) v und nimmt sein Minimum ( 32 ) genau an den beiden Randpunkten des Intervalls an, also f¨ ur das gleichseitige und das rechtwinklige Dreieck. Mit V (K) = 43 π ergibt sich in beiden F¨allen die im Satz angegebene obere Gitterpackungsdichte. 7. Um die Eindeutigkeitsaussage zu zeigen, ist noch nachzuweisen, dass beide F¨alle das gleiche Gitter in verschiedenen Koordinatensystemen beschreiben. Im Fall des hexagonalen Untergitters Λ w¨ahle man die Gitterbasis # √ 1 8 (2, 0, 0) , (1, 3, 0) , (1, √ , ) 3 3 und im Fall des quadratischen Gitters Λ die Gitterbasis √ √ (2, 0, 0) , (1, 1, 2) , (1, −1, 2) und u aren Tetra¨berzeuge sich davon, dass jedesmal mit 0 die Ecken eines regul¨ eders entstehen. 2
8.7.5 Schlussbemerkungen Im Fall ebener Kreispackungen existiert keine Nicht-Gitter-Packung, welche die Dichte der hexagonalen Gitterpackung aus Satz 32 erreicht. Dieser sehr anschauliche und lange vermutete Sachverhalt ist durchaus nicht leicht zu beweisen. Ein erster Beweis wurde von Thue 1910 gegeben, allerdings nicht in allen Details ´ th 1940 u ¨berzeugend. Den ersten allgemein akzeptierten Beweis hat L. Fejes To geliefert, vgl. [Ro]. Im Fall von Kugelpackungen, also f¨ ur n = 3 , liegen die Dinge schon viel komplizierter, was man sich bereits anhand der dichtesten Kugelgitterpackung aus Satz 8.33 klarmachen kann. Wir d¨ urfen davon ausgehen, dass der Schnitt von L mit der xy-Ebene das hexagonale Gitter Λ ist (Schicht a, schwarze Punkte in Abbildung 8.8). Die in der z-Richtung n¨achstgelegene Schicht b von Gitterpunkten ist in Abb. 8.8 ebenfalls auf die xy-Ebene projiziert und als weiße Punkte dargestellt,
257
8 Gitter
b
b r
r
r
r
r
b
b
b
b
r
r
r
r
b
b
b
b
r
r
r
Abbildung 8.8: Drei Schichten des dichtesten Kugelpackungsgitters im R3 , Grundriss ebenso die darauffolgende Schicht c (als Kreuze auf die xy-Ebene projiziert). F¨ ur die Kugelgitterpackung L + K wiederholen sich beim Durchlaufen der z-Achse die Projektionen der Schichten periodisch als abcabcabc u.s.w. Man k¨onnte aber ebensogut die Schichten der Kugelpackung anders aufeinandersetzen, etwa als ababacbcaba u.s.w., solange nur keine zwei Schichten gleichen Typs aufeinander folgen. Dabei entsteht eine Kugelpackung, die jedenfalls in z-Richtung nicht einmal √ periodisch sein muss, wohl aber die gleiche maximale Packungsdichte π/3 2 hat. Sowohl die Kugel-Gitterpackung wie die NichtGitter-Kugelpackungen dieser Dichte kommen in der Natur vor, z.B. in der Anordnung der Atome in metallischem Gold und diversen Kristallgittern. In der Natur hat man es nat¨ urlich h¨aufig mit Packungen aus endlich vielen Kugeln zu tun (Tennisb¨alle, Orangen). Verallgemeinert man den Dichtebegriff auf solche endlichen Packungen, so stellt man fest, dass f¨ ur wenige Kugeln zun¨ achst lineare Anordnungen dichter sind als Teilbereiche der hier diskutierten Gitteroder Nicht-Gitter-Kugelpackungen. Mit wieviel Kugeln die Dichte dieser linearen Packungen u ¨berboten wird durch sogenannte Clusterpackungen oder schließlich Teilbereiche von Gitterpackungen, ist durchaus nicht klar und f¨ uhrt auf interessante geometrisch-kombinatorische Probleme, vgl. Arbeiten von Wills und anderen ([Le]). K¨onnte √ es eine unendliche Nicht-Gitter-Kugelpackung geben, welche die Dichte oglich ist, π/3 2 sogar u ¨berbietet? Schon Kepler hat vermutet, dass dies unm¨ und im Lauf der Mathematikgeschichte sind einige erfolglose Beweisversuche f¨ ur diese Vermutung unternommen worden. Erst in j¨ ungster Zeit ist ein offenbar ¨ u wie der ¨berzeugender Beweis von Th. Hales gegeben worden, vgl. [Oe]. Ahnlich Beweis des Vierfarbensatzes durch Appel und Haken hat er leider den Nachteil, dass er die Behauptung auf so viele Fallunterscheidungen reduziert, dass diese nur mit Computerhilfe abzuarbeiten sind. W¨ unschenswert auch hier: ein einfacherer und durchsichtigerer Zugang!
258
8.8 Packungsdichte und Codierungstheorie
Die entsprechende Fragestellung in h¨oheren Dimensionen ist v¨ ollig offen. F¨ ur einige Dimensionen kennt man immerhin noch die dichtesten Kugelgitterpackungen [CS], z.B. ist f¨ ur n = 4 L := { (m1 , m2 , m3 , m4 ) ∈ Z4 | m1 + m2 + m3 + m4 ≡ 0 mod 2 } √ das dichteste Packungsgitter (f¨ ur Kugeln vom Radius 2/2 , Dichte π 2 /16 , Korkine und Zolotareff 1872). Die Beweise der S¨ atze 8.32 und 8.33 auf h¨ ohere Dimensionen zu verallgemeinern, ist nicht nur technisch sehr schwierig, wie z.B. der Punkt 4 dieser Beweise zeigt: Man erweitere das Standardgitter L0 = Z5 ⊂ R5 um den Mittelpunkt des Fundamentalquaders zu einem Obergitter L und benutze dieses als Packungsgitter f¨ ur Kugeln K vom Radius 1/2 . Der Mittelpunkt des Fundamentalquaders hat dann von allen Ecken einen Abstand > 1 ; folglich ist es nicht m¨oglich, aus den Mittelpunkten der K ber¨ uhrenden Kugeln eine Gitterbasis von L zu gewinnen, man erh¨alt nur eine Basis des Untergitters L0 . ¨ Hinsichtlich der Packungen endlich vieler Kugeln gibt es ebenfalls eine Uberraschung [Le]: Mit wachsendem n > 4 werden selbst die dichtesten Kugelgitterpackungen so d¨ unn, dass f¨ ur beliebig große Anzahlen von Kugeln lineare Anordnungen dichter sind als Teilbereiche von Gitterpackungen!
8.8 Packungsdichte und Codierungstheorie 8.8.1 Lineare Codes in Kurzfassung Ein Code der L¨ ange n ist eine Untermenge C eines Vektorraums V = Fnq u ¨ber einem endlichen K¨orper Fq mit q Elementen, die Elemente von C heißen dann Nachrichten oder Codew¨ orter. Wenn C sogar Untervektorraum von V ist, nennt man C einen linearen Code, und im Fall q = 2 heißt C bin¨ ar. Wir werden hier zumeist bin¨are lineare Codes betrachten. Die Hammingdistanz von v = (v1 , . . . , vn ), w = (w1 , . . . , wn ) ∈ V ist als die Anzahl der Koordinaten definiert, in denen sich v und w unterscheiden, also d(v, w) := #{ i = 1, . . . , n | vi = wi } . Hilfssatz 8.34 Die Hammingdistanz definiert eine Metrik auf V . 2 Dann ist klar, was man unter einer Hammingkugel Sr (v) := { w ∈ V | d(v, w) ≤ r } zu verstehen hat. Das Minimalgewicht w(C) eines Codes C ist die kleinste Hammingdistanz zwischen zwei verschiedenen Punkten von C . Wenn w(C) > 1
259
8 Gitter
¨ ist, kann bei der Ubermittlung von Codew¨ ortern zumindest das Vorliegen eines ¨ einzelnen Ubertragungsfehlers, d.h. ein Fehler in einer Koordinate erkannt werden, etwa durch Vergleich mit der Liste aller Codew¨ orter (was ein sehr aufwendiges Verfahren ist; bei linearen Codes gibt es dazu viel schnellere M¨ oglichkeiten, s.u.). Ein Code C heißt t-fehlerkorrigierend, wenn in jeder Hammingkugel St (v) h¨ochstens ein Punkt von C liegt. C heißt perfekter t-fehlerkorrigierender Code, wenn in jeder Hammingkugel St (v) genau ein Codewort liegt. Die Bezeichnung kommt nat¨ urlich daher, dass dann (f¨ ur vorgegebenes t ) eine m¨ oglichst große Anzahl von Codew¨ortern mit m¨oglichst kleiner L¨ ange n existieren. Es ist klar, dass man einerseits ein großes t haben m¨ ochte — abh¨ angig davon, wie viele ¨ Ubertragungsfehler erfahrungsgem¨aß auftreten und wie gravierend diese sind — und andererseits aber eine große Informationsrate R :=
logq #C . logq #Fnq
F¨ ur lineare Codes C der Dimension k u ¨ber Fq ist die Informationsrate einfach R = k/n . Wir stellen einige einfache Fakten zusammen: Hilfssatz 8.35 Sei C ein Code in V = Fnq und t ∈ N . 1. Wenn die Hammingkugeln St (v) um die Punkte v ∈ C disjunkt sind, ist C ein t-fehlerkorrigierender Code. 2. C ist t-fehlerkorrigierend genau dann, wenn sein Minimalgewicht w(C) ≥ 2t + 1 erf¨ ullt. 3. Wenn C linearer Code ist, ist sein Minimalgewicht w(C) = min{ d(0, v) | v ∈ C , v = 0 } . 4. C ist genau dann ein perfekter t-fehlerkorrigierender Code, wenn V die disjunkte Vereinigung der Hammingkugeln St (v), v ∈ C , ist. 5. Ein 1-fehlerkorrigierender bin¨arer linearer Code erf¨ ullt #C ≤
2n . n+1
Die Gleichheit gilt genau dann, wenn er perfekt ist. 2 ortern Um die entscheidenden Daten eines Codes C ⊂ Fnq mit M = #C Codew¨ und Minimalgewicht w = w(C) zusammenzufassen, spricht man von einem (n, M, w)-Code, bei bin¨aren linearen Codes, also im Fall q = 2, #C = 2k , k = dim C , von einem [n, k, w]-Code. Es gibt zwei M¨ oglichkeiten, lineare Codes einfacher zu beschreiben als durch Angabe einer Liste von M = qk Codew¨ ortern: Erstens lassen sich k Basisvektoren von C als Zeilen einer k × n-Generatormatrix
260
8.8 Packungsdichte und Codierungstheorie
G auffassen, zweitens kann man C als Kern einer surjektiven linearen Abbildung Fnq → Fn−k beschreiben, die durch eine (n − k) × n-Kontrollmatrix H gegeben q ist. Bezeichnet man die transponierte Matrix mit H t , so ist eine Kontrollmatrix dadurch charakterisiert, dass sie den Rang n − k hat und dass GH t die k × (n − k)-Nullmatrix ist. Bei bin¨aren linearen Codes hat die Kontrollmatrix noch eine andere Interpretation. Zu einem Code C definiert man einen dualen Code ur alle (z1 , . . . , zn ) ∈ C } , C ⊥ := { (w1 , . . . , wn ) | w1 z1 + . . . + wn zn = 0 f¨ also eigentlich die Menge jener Linearformen des Dualraums von V , die auf C verschwinden. Hilfssatz 8.36 Sei C ein linearer bin¨ arer [n, k, w]-Code. Dann gilt 1. dim C ⊥ = n − k 2. Jede Kontrollmatrix H von C ist Generatormatrix von C ⊥ und umgekehrt. 3. C ⊥⊥ = C 4. Wenn 2k = n ist und C ⊆ C ⊥ oder C ⊥ ⊆ C , so gilt sogar C = C ⊥ , der Code heißt dann selbstdual. 5. Ein Code C ist selbstdual genau dann, wenn jede Generatormatrix auch Kontrollmatrix ist und umgekehrt. 6. Ein selbstdualer Code ist insbesondere von geradem Gewicht, d.h. f¨ ur jedes Codewort v = (v1 , . . . , vn ) ist d(0, v) gerade, und es erf¨ ullt die Parit¨atsbedingung v1 + . . . + vn = 0 . 2
8.8.2 Beispiele 1. Der triviale [n, n, 1]-Code C = Fn2 = V , bei dem weder Fehlererkennung noch Fehlerkorrektur m¨oglich ist. Der duale Code besteht hier nur aus dem Wort 0 . 2. Der [3, 1, 3]-Wiederholungscode mit Generatormatrix (1, 1, 1) ist zwar 1-fehlerkorr und perfekt, hat aber die ¨außerst schlechte Informationsrate R = 1/3 . 3. Die Hammingcodes Hr , benannt nach R.W. Hamming, einem der Gr¨ undungsv¨ater der Codierungstheorie, kann man wie folgt konstruieren. Sei r ∈ N, r > 1 und n := 2r −1 die Anzahl der Vektoren = 0 in Fr2 ; diese Vektoren denkt man sich als Spalten einer r × n-Matrix H , z.B. im Fall r = 3, n = 7 ⎛ ⎞ 1 0 0 1 1 0 1 ⎝ 0 1 0 1 0 1 1 ⎠ . 0 0 1 0 1 1 1
261
8 Gitter
Schon anhand der Einheits-Spaltenvektoren sieht man, dass H den Rang r besitzt und somit als Kontrollmatrix eines Codes C = Hr der Dimension k = n − r = 2r − 1 − r dienen kann. Hat nun v ∈ C ⊆ V = Fn2 unter seinen Koordinaten d = w(C) Einsen, so m¨ ussen wegen vH t = 0 jedenfalls d Spalten von H linear abh¨angig sein, und das kann weder f¨ ur d = 1 vorkommen (die Nullspalte kommt nicht vor) noch f¨ ur 2 , weil im Fn2 zwei linear abh¨ angige Vektoren = 0 sind oder u ur d = 3, ein. Mit Hilfe von Hilfssatz 8.35, Punkte ¨bereinstimmen; es tritt erst f¨ 2,3, und 5, sieht man darum: Satz 8.37 F¨ ur r > 1 sind die Hammingcodes Hr perfekte 1-fehlerkorrigierende [2r − 1, 2r − 1 − r, 3]-Codes. (F¨ ur r = 2 entsteht nur wieder der Wiederholungscode aus Beispiel 2, aber f¨ ur r > 2 erh¨alt man brauchbare Informationsraten.) 4. Aus jedem bin¨aren linearen Code C l¨asst sich ein erweiterter Code C ∗ als Bild von C unter der Einbettung Fn2 → Fn+1 : (x1 , . . . , xn ) → (x1 , . . . , xn , x1 + . . . + xn ) 2 definieren. Offensichtlich ist C ∗ ein [n + 1, k, w(C ∗ )]-Code von geradem Gewicht, da man durch die letzte Koordinate die G¨ ultigkeit der Parit¨ atsbedingung erzwungen hat. Aus einer Kontrollmatrix von C eine Kontrollmatrix von C ∗ zu erzeugen, ist leicht: Der letzte Zeilenvektor besteht nur aus Einsen (Parit¨ atsbedingung), die u anzt. F¨ ur den [3, 3, 1]¨brigen Zeilen werden durch 0 in der letzten Koordinate erg¨ Code aus Beispiel 1 ist (1 1 1 1) die Kontrollmatrix von C ∗ , und des H3∗ ist ⎛ 1 0 ⎜ 0 1 ⎜ ⎝ 0 0 1 1
die Kontrollmatrix des erweiterten Hammingco0 0 1 1
1 1 0 1
1 0 1 1
0 1 1 1
1 1 1 1
⎞ 0 0 ⎟ ⎟ 0 ⎠ 1
.
H3∗ ist aus verschiedenen Gr¨ unden besonders interessant. Hilfssatz 8.36.5 und einfaches Nachrechnen zeigen, dass er selbstdual ist, dazu vom Typ [8, 4, 4] und doppelt-gerade, d.h. alle Hammingabst¨ande zum Nullpunkt sind sogar durch 4 teilbar.
262
8.8 Packungsdichte und Codierungstheorie
8.8.3 Codes und Gitter Sei C ⊆ Fn2 ein bin¨arer linearer Code der Dimension k . Der komponentenweise verwendete kanonische Homomorphismus ρ : Zn → (Z/2Z)n = Fn2 zeigt, dass man dem Code ein Gitter ρ−1 (C) zwischen Zn und 2Zn zuordnen kann. Die Homomorphies¨atze der Gruppentheorie und Folgerung 8.11 zeigen (Zn : ρ−1 (C)) = 2n−k ,
(ρ−1 (C) : 2Zn ) = 2k ,
d(ρ−1 (C)) = 2n−k .
Aus Gr¨ unden, die gleich einsichtig√werden, versieht man das Gitter u ¨blicherweise mit einem Normierungsfaktor 1/ 2 : 1 ΓC := √ ρ−1 (C) , 2
d(ΓC ) = 2 2 −k n
Schreibt man das Standardskalarprodukt xyt der (Zeilen)vektoren des Rn einfach als x · y (identifiziert also Rn mit seinem Dualraum), so kann man jedem Gitter L ⊂ Rn ein duales Gitter durch L∗ := { x ∈ Rn | x · y ∈ Z
f¨ ur alle y ∈ L }
zuordnen (nicht verwechseln mit primitiven Gitterpunkten aus Abschnitt 8.6 !). Als Basis von L∗ kann man stets eine zur Basis A von L duale Basis nehmen, also die Transponierte der Matrix-Inversen A−1 . Wenn L ⊆ L∗ , also wenn x·y ∈Z
f¨ ur alle x, y ∈ L ,
so heißt L ganzes Gitter, im Falle L = L∗ heißt L unimodular. Hilfssatz 8.38 d(L∗ ) = d(L)−1 , d.h. insbesondere: Unimodulare Gitter L besitzen die Determinante d(L) = 1 . 2 Ein ganzes Gitter L heißt gerade, wenn f¨ ur alle x ∈ L gilt ||x||2 = x · x ≡ 0 mod 2 . Der folgende Satz schl¨agt eine Br¨ ucke von diesen Gittereigenschaften zu den Begriffen der Codierungstheorie. Satz 8.39 Sei C ⊆ Fn2 ein linearer bin¨ arer Code und ΓC sein zugeordnetes Gitter. 1. C ⊆ C ⊥ genau dann, wenn ΓC ein ganzes Gitter ist.
263
8 Gitter
2. C ist selbstdual genau dann, wenn ΓC unimodulares Gitter ist. 3. C ist doppelt-gerade genau dann, wenn ΓC gerades Gitter ist. Beweis. F¨ ur Punkt 1 seien u = (u1 , . . . , un ), v = (v1 , . . . , vn ) ∈ C Codeworte mit Repr¨asentanten x, y ∈ Zn im Standardgitter. Dann ist 1 1 1 1 √ x · √ y = x · y ≡ (u1 v1 + . . . + un vn ) mod Z 2 2 2 2 (die rechte Seite ist wohldefiniert in 12 Z/Z ), also genau dann ganz, wenn u1 v1 + . . . + un vn = 0 ∈ F2 . Aus Punkt 1 ergibt sich Punkt 2, und Punkt 3 folgt aus einer entsprechenden Kongruenzbetrachtung mod 4 . 2
8.8.4 Packungsdichte und Gewicht Wir haben schon in Hilfssatz 35.4 gesehen, dass Codes etwas mit dichten Packungen zu tun haben: Perfekte Codes liefern eine dichtestm¨ ogliche Packung von Hammingkugeln im Fn2 . Das ist zwar nicht die Metrik, die man bei Packungsgittern zu betrachten hat, trotzdem zeigt es sich, dass gute Codes C etwas mit dichten Kugelpackungen bei den zugeh¨origen Gittern ΓC zu tun haben. Was gut heißen soll, werden wir gleich pr¨azisieren. Satz 8.40 Sei C ein bin¨ arer linearer [n, k, w]-Code mit Minimalgewicht w ≤ 4. 1 Dann ist ΓC ein Packungsgitter f¨ ur Kugeln K vom Radius 2 w/2 und mit Packungsdichte δ(ΓC , K) = κn wn/2 2k−2n . (κn ist wieder das Volumen der n-dimensionalen Einheitskugel.) Beweis. Wegen w ≤ 4 haben paarweise verschiedene Punkte von ρ−1 (C) vonein√ ander einen euklidischen Abstand ≥ w . Daraus folgt, dass ΓC Packungsgitter f¨ ur die im Satz angegebenen Kugeln ist. Die Packungsdichte folgt damit aus Hilfssatz 8.30 und der oben durchgef¨ uhrten Berechnung der Gitterdeterminante d(ΓC ) . 2 F¨ ur festes n erh¨alt man also eine besonders dichte Kugelpackung, wenn einerseits w groß ist und andererseits k , also die Informationsrate des Codes. Als Beispiel kann erstens der [4, 3, 2]-Code C ∗ dienen, der bei Erweiterung des trivialen [3, 3, 1]-Codes entsteht und hier auf die Packungsdichte κ4 · 2−3 =
π2 16
f¨ uhrt. Es ist genau jenes Gitter maximaler Packungsdichte im R4 , das schon am Ende von Abschnitt 8.7 erw¨ahnt wurde.
264
8.9 Golay-Code und Leech-Gitter
Als zweites Beispiel betrachte man den erweiterten Hammingcode H3∗ , der als [8, 4, 4]-Code auf ein Gitter L = ΓH3∗ der Packungsdichte κ8 · 2−4 =
π4 π4 = 7 ≈ 0.254 4! · 16 2 ·3
f¨ uhrt (wieder einmal weit dichter als die Minkowski-Hlawka-Schranke aus Satz 8.31). Auch dieses sogenannte E8 -Gitter ist als Gitter maximaler Packungsdichte ˇinkin 1980). Man mache in seiner Dimension bekannt (Blichfeldt 1934, Vetc sich klar, dass trotz des bescheidenen Zahlenwerts 0.254 diese Kugelpackung ganz außerordentlich dicht ist: Der Fundamentalquader des Gitters asentanten der Punkte von einer, 2Z8 ⊂ ρ−1 (H3∗ ) enth¨alt nicht nur die Repr¨ ¨ sondern von insgesamt 16 Kugeln vom Radius 1 ohne Uberlappungen!
8.9 Golay-Code und Leech-Gitter Satz 8.40 hat die unerfreuliche Einschr¨ankung w ≤ 4 , weil man in der dort vorgenommenen Konstruktion von Kugelpackungen wegen 2Zn ⊂ ρ−1 (C) keine Kugeln vom Radius > 1 packen kann. Da man sich f¨ ur gr¨ oßere w eigentlich noch bessere Packungsresultate erhofft, muss man die Konstruktion modifizieren, was hier an einem besonders wichtigen Beispiel durchgef¨ uhrt werden soll. Wir holen dazu etwas aus, um zun¨achst eine weitere Methode der Codekonstruktion vorzustellen.
8.9.1 Zyklische Codes und quadratische Reste Ein bin¨arer linearer Code C ⊆ Fn2 heißt zyklisch, wenn mit jedem Codewort (v0 , . . . , vn−1 ) auch (vn−1 , v0 , . . . , vn−2 ) ein Codewort ist. Ordnet man dem ersten Codewort die Polynomrestklasse p(x) = v0 + v1 x + . . . + vn−1 xn−1 ∈ F2 [x]/(xn − 1)F2 [x] zu, so entspricht der zyklischen Vertauschung der Koordinaten gerade die Abbildung p(x) → xp(x) . Die Menge der Polynomrestklassen f¨ ur die Codew¨ orter n f¨ uhrt daher auf ein Ideal I in F2 [x]/(x − 1)F2 [x] . Sein Urbild in F2 [x] ist ein Hauptideal, das xn − 1 enth¨alt. Es gibt also eine erzeugende Polynomrestklasse g(x) mod (xn − 1) , und zwar f¨ ur ein Polynom g(x)|(xn − 1) . Eine Abz¨ ahlung der n Restklassen mod g und mod (x − 1) ergibt k = dim C = n − grad g . Beispiele. g(x) = 1 f¨ uhrt auf den trivialen Code, g(x) = 1 + x + . . . + xn−1 auf den [n, 1, n]-Wiederholungscode, und g(x) = 1 + x + x3 mod (x7 − 1) auf den
265
8 Gitter
Hammingcode H3 — man u ¨berzeuge sich an Hand der Kontrollmatrix davon, dass die den Polynomrestklassen xj g(x), j = 0, 1, 2, 3, entsprechenden Codew¨ orter wirklich in H3 liegen. Allgemeiner kann man den Hammingcode Hr als zyklischen Code folgendermaßen konstruieren: F¨ ur n = 2r − 1 hat das Polynom xn − 1 u ¨ber r dem K¨orper F2 die Primfaktorzerlegung x −1 = n
n
(x − ai )
i=1
mit einem erzeugenden Element a der multiplikativen Gruppe F∗2r . Man w¨ ahle nun g als das irreduzible Polynom von a u ber F , nach der Galoistheorie endlicher ¨ 2 K¨orper also r−1 j (x − a2 ) . g(x) := j=0
Dass hierbei tats¨achlich wieder die in Abschnitt 8.8.2 eingef¨ uhrten Hammingcodes Hr entstehen, ist nicht ganz einfach einzusehen, f¨ ur das folgende aber auch unerheblich. Wichtiger ist die Beobachtung, dass f¨ ur r = 3, n = 7 die Exponenten von a genau die quadratischen Reste mod 7 durchlaufen, was zu einer anderen Verallgemeinerung von H3 Anlass gibt, den quadratische Reste-Codes. Hier sei n eine Primzahl, f¨ ur die 2 mod n quadratischer Rest ist, also n ≡ ±1 mod 8 . Sei jetzt a eine primitive n-te Einheitswurzel u ¨ber F2 ; diese existiert in jedem K¨orper F2r , f¨ ur den 2r ≡ 1 mod n ist, also z.B. f¨ ur r = n − 1 oder (weil 2 quadratischer Rest mod n ist) sogar f¨ ur r = (n − 1)/2 . Dann ist q (x − aq ) , Q := { q mod n | ( ) = 1 } g(x) := n q∈Q
das Polynom unserer Wahl: Wegen 2 ∈ Q ist g invariant, wenn wir auf die Koeffizienten den Frobeniusautomorphismus ( b → b2 ) ∈ Gal F2r /F2 anwenden, erf¨ ullt also g ∈ F2 [x] und f¨ uhrt zu einem zyklischen [n, n+1 2 , w]-Code mit Minimalgewicht w .
8.9.2 Bericht u ¨ber den Golay-Code Eine allgemeine Formel f¨ ur dieses Minimalgewicht ist nicht bekannt, wohl aber untere und obere Absch¨atzungen, die f¨ ur kleine n sehr n¨ utzlich sind. Außerdem besteht nat¨ urlich die M¨oglichkeit, g explizit zu berechnen, damit eine Generatormatrix aufzulisten und das Minimalgewicht auf direktem Weg zu bestimmen. Beides erfordert einigen Aufwand, deswegen sei hier nur das Resultat f¨ ur den im Fall n = 23 entstehenden Golay-Code G23 angegeben (den man durchaus nicht nur auf die hier angegebene Weise konstruieren kann, vgl. [Eb]).
266
8.9 Golay-Code und Leech-Gitter
Satz 8.41 Der Golay-Code G23 ist ein perfekter 3-korrigierender [23, 12, 7]-Code. Sein erweiterter Code G24 := G∗23 ist ein selbst-dualer und doppelt-gerader [24, 12, 8]-Code. 2 Eine Generator- und Kontrollmatrix von G24 kann man als H = (E, M ) beschreiben, wo E die 12 × 12-Einheitsmatrix ist und M eine 12 × 12-Matrix (mij ) ist, deren Eintr¨age charakterisiert sind durch • m11 = 0 ur i, j ≥ 2 und i + j − 4 quadratischer Rest mod 11 • mij = 0 f¨ • mij = 1 in allen anderen F¨allen.
8.9.3 Das Leech-Gitter Sei nun Λ := ρ−1 (G24 ) . Wie zu Beginn von Abschnitt 8.8.3 erl¨ autert, ist (Z24 : Λ) = (Λ : 2Z24 ) = d(Λ) = 212 , und jedes x ∈ Λ besitzt eine wohldefinierte Beschreibung als x = c + 2y ,
y = (y1 , . . . , y24 ) ∈ Z24
mit einem eindeutig bestimmten Codewort c ∈ G24 . Da der Code doppelt-gerade ist, erf¨ ullen die Koordinaten xi dieser Gitterpunkte xi ≡ 2 yi mod 4 , und wir k¨onnen ein Untergitter K vom Index 2 in Λ definieren als Kern des Homomorphismus 1 xi mod 2 . h : Λ → F2 : x → yi ≡ 2 Eine der vielen M¨oglichkeiten, das Leech-Gitter√L zu definieren, besteht nun darin, L mit dem u ¨blichen Normierungsfaktor 1/ 2 als Index-2-Obergitter von K
1 1 −1 K + h (1) + (1, . . . , 1) L := √ 2 2 einzuf¨ uhren. Gewissermaßen wird also Λ in zwei Teile zerlegt und daraus anders wieder zusammengesetzt. Dass dabei eine diskrete Untermenge des R24 entsteht, ist evident; dass es sich außerdem um ein Gitter handelt, sieht man daran, dass die Summe je zweier Punkte aus h−1 (1) wieder in K liegt, ebenso wie der Punkt 1 = (1, . . . , 1) (Kontrollmatrix von G24 verwenden!). Aus d(K) = 213 folgt d(L) = 1 . Da G24 selbstdual ist, wird ΓG24 ein unimodulares Gitter, erst recht bleibt also das Untergitter √12 K ein ganzes Gitter. Man rechnet leicht nach, dass die Erweiterung L ebenfalls ganz ist und sogar wieder unimodular wird. ur alle x ∈ h−1 (0) und Man beachte dabei 4| xi f¨ 4 | #{ i | xi ≡ 1 mod 2 } ≥ w(G24 ) = 8
267
8 Gitter
f¨ ur alle x ∈ Λ . F¨ ur x ∈ K erhalten wir 8 ≤ ||x||2 ≡ 0 mod 4 und ein entsprechendes Ergebnis auch f¨ ur h−1 (1) + 12 1 , denn die Betr¨ age aller Koordinaten der letzteren Punkte sind stets ≥ 12 , der Betrag mindestens einer Koordinate sogar ≥ 32 . Nach Umnormierung heißt das 4 ≤ ||x||2 ≡ 0 mod 2 f¨ ur alle x ∈ L , die Gitterpunkte von L haben also voneinander den Mindestabstand 2 . Somit ist L als Packungsgitter f¨ ur Einheitskugeln brauchbar. Wir fassen diese ¨ Uberlegungen zusammen: Satz 8.42 Das Leech-Gitter L ⊂ R24 ist ein gerades unimodulares Gitter. Der Mindestabstand seiner Gitterpunkte ist 2 , und seine Packungsdichte f¨ ur Einheitskugeln K1 ist π 12 ≈ 0.00193 . δ(L, K1 ) = κ24 = 12! (Die Minkowski-Hlawka-Schranke w¨ urde wenig mehr als 2−23 ≈ 10−7 ergeben!) Es handelt sich in der Tat um die dichteste Kugelgitterpackung in der Dimension 24 . Das Leech-Gitter kann noch etliche andere Rekorde aufweisen (,,Kusszahl”, Automorphismengruppe, vgl. [CSl], [Eb]) und spielt in noch vielen anderen Gebieten der Mathematik bis hin zur mathematischen Physik eine bemerkenswerte Rolle. Unsere Raumanschauung ist an den Dimensionen 2 und 3 geschult und hat erhebliche M¨ uhe, sich ein Fundamentalparallelotop vorzustellen, dessen Eckpunkte voneinander nur Abst¨ande ≥ 2 besitzen und das trotzdem nur das Volumen 1 hat — und dabei eine Einheitskugel enth¨ alt, zerlegt in 224 ∼ 2·107 Bestandteile!
8.10 Reduktionstheorie ¨ 8.10.1 Aquivalenz quadratischer Formen Bereits in den Abschnitten 3 und 4 sind Querverbindungen zwischen Gittern und quadratischen Formen aufgetreten und genutzt worden. Wir wollen diese etwas ausbauen und bleiben dabei, der Einfachheit halber nur positiv definite quadratische Formen bij xi xj = xBxt ( bij = bji ∈ R ) Q(x) = Q(x1 , . . . , xn ) = i,j
268
8.10 Reduktionstheorie
zu betrachten und die Vektoren (anders als in Abschnitt 8.1) als Zeilenvektoren zu schreiben. Da die Matrix B symmetrisch und positiv definit ist, k¨ onnen wir sie via Hauptachsentransformation als Produkt zweier Matrizen AAt schreiben und stellen fest: Hilfssatz 8.43 Durch B → L0 A wird eine Bijektion zwischen positiv definiten quadratischen Formen Q mit Matrix B = AAt auf dem Standardgitter L0 ⊂ Rn und den Gittern L = L0 A definiert, versehen mit dem euklidischen Normquadrat x · x = ||x||2 . Dabei gilt: • Kleine Deformationen der quadratischen Form Q bzw. ihrer Matrix B entsprechen kleinen Deformationen der Gitterbasis von L . • Die Wertemenge von Q auf L0 ist die Wertemenge des Normquadrats auf L. • Die Minima ( = 0 ) der quadratischen Form Q entsprechen den k¨ urzesten Gittervektoren ( = 0 ) von L . • d(L)2 = det B Genauso unerheblich ist ein Basiswechsel des Gitters f¨ ur die quadratische Form, ¨ also der Ubergang von den Standardeinheitsvektoren ei zu einer anderen Ba¨ sis ei U , i = 1, . . . , n , U ∈ GLn (Z) (vgl. Satz 8.2) bzw. der Ubergang von der quadratischen Form mit Matrix B zur quadratischen Form mit Matrix U BU t . Die zugeh¨origen quadratischen Formen bzw. die zugeh¨ origen Gitterbasen nen¨ nen wir ¨ aquivalent. Dass es sich um eine Aquivalenzrelation handelt, ist klar. Es ist nat¨ urlich zweckm¨aßig, unter allen m¨ oglichen Gitterbasen eine m¨ oglichst einfache auszuw¨ahlen — etwa unter Benutzung der geometrischen Ideen des Beweises von Satz 8.1 — bzw. ein Koordinatensystem, in dem die Darstellung der quadratischen Form besonders bequem ist. Eine solche Gitterbasis bzw. quadratische Form nennt man dann reduziert, wobei nat¨ urlich zu pr¨ azisieren ist, wie ¨ die Auswahl dieses Repr¨asentanten aus der Aquivalenzklasse vorzunehmen ist. Eine dritte Interpretation des Begriffs Reduktion ergibt sich, wenn wir die Gruppe PGLn (Z) der unimodularen Matrizen modulo Vorzeichen via U : B → U BU t auf dem Raum P Sn ⊂ Rn(n+1)/2 der symmetrischen positiv definiten Matrizen operieren lassen. Diese Operation ist treu, wie man schon an der Einheitsmatrix E ∈ P Sn sieht: Aus U EU t = E folgt, dass U außer ganzzahlig auch noch orthogonal ist, also U B = BU f¨ ur alle B ∈ P Sn erf¨ ullt und damit zum Zentrum der GLn geh¨ort. Es kommt also nur U = ±E in Frage. Die Operation von PGLn (Z) ist dar¨ uber hinaus diskontinuierlich, d.h. die Bahnen besitzen keinen H¨aufungspunkt im Raum P Sn (in der vom Rn(n+1)/2 geerbten Topologie;
8 Gitter
269
die topologischen Eigenschaften der Operation werden sich weiter unten noch nebenbei ergeben). Man sucht nun nach einem Fundamentalbereich f¨ ur diese Operation, d.h. nach nach einer abgeschlossenen Menge Rn (reduzierter) Matrizen, deren Bilder unter der Operation der unimodularen Gruppe den ganzen Raum ¨ P Sn l¨ uckenlos u nur an den R¨ andern. F¨ ur die Rolle ¨berdecken mit Uberlappungen dieser Betrachtungsweise im Rahmen der Theorie der Siegelschen Modulgruppe vgl. [Kl].
8.10.2 Minkowski-Reduktion Auf Lagrange bzw. L.A. Seeber und Gauss (vgl. [GL]) in den F¨ allen n = 2 bzw. 3 und auf Minkowski und Hermite f¨ ur beliebige n geht die folgende Konstruktion zur¨ uck. Satz 8.44 Der Bereich Rn im Raum P Sn der positiv definiten symmetrischen reellen n × n-Matrizen B = (bij )i,j=1,...,n sei definiert durch die Bedingungen ur alle ganzzahligen x mit (xk , . . . , xn ) = 1 1. xBxt ≥ bkk f¨ 2. bk,k+1 ≥ 0 f¨ ur alle k = 1, . . . , n − 1 . ur die Operation der unimodularen Gruppe Dann ist Rn ein Fundamentalbereich f¨ PGLn (Z) auf P Sn . Diese Operation ist diskontinuierlich. Zum Beweis verwenden wir die Ideen, welche schon dem Beweis von Satz 8.1 zugrundelagen, jetzt aber in der Sprache der quadratischen Formen. Da die ¨ Aquivalenz quadratischer Formen einem Basiswechsel des Gitters L0 entspricht, m¨ ussen wir f¨ ur eine gegebene positiv definite quadratische Form eine Gitterbauglich dieser die Matrix B der quadratischen sis von L0 konstruieren, so dass bez¨ Form Q den angegebenen Bedingungen gen¨ ugt. Die neue Basis a1 , . . . , an von L0 w¨ahlt man induktiv so, dass Q(a1 ) > 0 minimal unter allen Gittervektoren = 0 ist; das ist m¨oglich, weil Q positiv definit ist. Angenommen, a1 , . . . , ak , k < n , seien bereits gefunden, dann wird ak+1 so ausgew¨ ahlt, dass anzt werden k¨ onnen, • a1 , . . . , ak+1 zu einer Basis von L0 erg¨ • Q(ak+1 ) unter dieser Nebenbedingung minimal wird und • die zugeh¨orige Bilinearform ak Batk+1 ≥ 0 erf¨ ullt. Es ist klar, dass die letzte Bedingung immer durch Vorzeichenwahl erf¨ ullbar ist, außer in einer ak+1 -Hyperebene sogar eindeutig. Dass die ersten beiden Bedingungen immer erf¨ ullbar sind, kann man sich ¨ ahnlich wie in den geometrischen ¨ Uberlegungen zum Beweis von Satz 8.1 klarmachen; mit Ausnahme von niederdimensionalen Untermengen des P Sn wird die Wahl der ak+1 sogar jeweils eindeutig ausfallen. (Nat¨ urlich ist a1 immer nur modulo Vorzeichen eindeutig, aber der ¨ Ubergang zu −a1 bedingt Vorzeichenwechsel auch f¨ ur alle anderen Basisvektoren
270
8.10 Reduktionstheorie
— wieder außerhalb der Hyperebenen atk Bak+1 = 0 — und das wirkt sich nach Hilfssatz 8.43 nicht auf die quadratische Form aus.) Das Verfahren l¨ asst sich sogar zu einem Algorithmus ausbauen, der f¨ ur große n allerdings nicht mit brauchbarer Geschwindigkeit funktioniert. Bleibt zu kl¨aren, was das Auswahlverfahren mit den im Satz formulierten Bedingungen zu tun hat. Dazu nehmen wir an, das Auswahlverfahren sei abgeschlossen, ur die Maund wir schreiben anstelle von ai nun wieder ei , i = 1, . . . , n und B f¨ trix der quadratischen Form bez¨ uglich dieser Basis ei . Die zweite Bedingung des Satzes entspricht genau der letzten Auswahlbedingung. F¨ ur die erste Bedingung ist zu beachten, dass man e1 , . . . , ek−1 , xi ei genau dann zu einer Basis von L0 erg¨anzen kann, wenn alle xi ganz und xk , . . . , xn teilerfremd sind (Folgerung 8.9). Damit ist klar, dass das beschriebene Auswahlverfahren einen Punkt in Rn ergibt. Bis auf niederdimensionale Teilmengen des P Sn ist dieser sogar eindeutig bestimmt. Ausnahmen kann es nur dort geben, wo Q(ak+1 ) auf L0 unter den angegebenen Nebenbedingungen mehr als zwei Minima besitzt, aber selbst dann gibt es immer nur endlich viele M¨oglichkeiten f¨ ur ak+1 . Das bleibt sogar dann richtig, wenn man die Gitterbasis (bzw. B ) um ein ε deformiert. Das bedeutet f¨ ur den Bereich Rn : Hilfssatz 8.45 1. Jeder Punkt B ∈ Rn besitzt eine Umgebung, in der fast alle Ungleichungen aus Satz 8.44 als strikte Ungleichungen gelten. 2. Rn ist abgeschlossen. 3. Sein offener Kern wird durch die strikten Ungleichungen aus Satz 8.44 beschrieben. 4. Ein Punkt B ∈ Rn ist nur zu endlich vielen anderen Punkten des Rn ¨aquivalent. 5. Die PGLn (Z)-Bilder des offenen Kerns von Rn sind alle disjunkt. Damit ist gleichzeitig klar, dass Rn alle Eigenschaften eines Fundamentalbereichs besitzt und von lokal endlich vielen linearen oder quadratischen Hyperfl¨ achen berandet wird; in Wahrheit sind es sogar global endlich viele, aber dieser Punkt uckenlos gepflastert ist und erfordert gr¨oßeren Aufwand. Da SPn mit Rn -Bildern l¨ ¨ Uberlappungen nur auf den R¨andern auftreten, ist damit auch die Diskontinuit¨ at der Operation von PGLn (Z) bewiesen. 2
8.10.3 Konsequenzen Die Reduktionstheorie hat eine Reihe wichtiger Konsequenzen, auch wenn einige der unten aufgef¨ uhrten in anderer Form aus dem Satz von Minkowski-Hlawka herleitbar sind. Der Einfachheit halber verzichten wir auf Doppelindizes in den
271
8 Gitter
Diagonalelementen von B , schreiben also bk anstelle von bkk f¨ ur alle k . Die erste Konsequenz ist das sogenannte Hermitesche Lemma u ¨ber die Minima μ(Q) := min{xBxt | x ∈ L0 − {0} } der quadratischen Form Q auf dem Standardgitter, das f¨ ur reduzierte quadratische Formen nach Satz 44 gleich b1 ist. F¨ ur n positive reelle r ist μ(rQ) = rμ(Q) und det(rB) = r det B , es ist also naheliegend, μ(Q) und die n-te Wurzel aus der Diskriminante der quadratischen Form (det B)1/n zu vergleichen. Folgerung 8.46 Mit einer Konstanten c1 = c1 (n) ≤ ( 43 )(n−1)/2 ist μ(Q) ≤ c1 (det B)1/n . Beweis durch Induktion u ur n = 1 ist die Aussage offensichtlich richtig. ¨ber n . F¨ Wir nehmen an, sie sei f¨ ur positiv definite quadratische Formen in n−1 Variablen, also f¨ ur positiv definite symmetrische reelle (n − 1) × (n − 1)-Matrizen T richtig und zerlegen B in Bl¨ocke
1 0 p 0 1 p−1 q p q = , T = S − p−1 qt q , B= 0t p−1 qt 1 0t T 1 qt S wobei p := b1 > 0 , q := (b12 , . . . , b1n ) , 0 ∈ Rn−1 sind und S eine positiv definite reelle symmetrische (n − 1) × (n − 1)-Matrix ist, 1 die (n − 1) × (n − 1)Einheitsmatrix. Bezeichnet man die Koeffizienten von T wie u ¨blich mit tij , so erh¨alt man f¨ ur die quadratische Form Q(x) = xBxt = b1 (x1 +
b12 b1n x2 + . . . + xn )2 + tkl xk xl . b1 b1 k,l>1
Nach Induktionsvoraussetzung gibt es eine nichttriviale ganzzahlige L¨ osung (x2 , . . . , xn ) von tkl xk xl ≤ c1 (n − 1) (det T)1/(n−1) . k,l>1
Außerdem existiert ein x1 so, dass & & & & &x1 + b12 x2 + . . . + b1n xn & ≤ 1 , & b1 bn & 2 dann folgt aus den letzten drei Gleichungen bzw. Ungleichungen b1 = Q(e1 ) ≤ Q(x) ≤ und
bn1
≤
1 b1 + c1 (n − 1) (det T)1/(n−1) 4
n−1
4 c1 (n − 1) 3
b1 det T
272
8.10 Reduktionstheorie
und aus b1 det T = det B schließlich
(n−1)/n 4 c1 (n − 1) (det B)1/n = c1 (n) (det B)1/n , b1 ≤ 3 und die angegebene obere Absch¨atzung f¨ ur c1 (n) folgt induktiv. Weder die De¨ terminante noch μ ¨andern sich beim Ubergang zu einer ¨ aquivalenten reduzierten quadratischen Form, und f¨ ur diese ist nach der ersten Aussage in Satz 8.44 μ(Q) = b1 . 2 ¨ Als Ubungsaufgabe vergleiche man Folgerung 8.46 mit Satz 8.18 und die n¨ achste Folgerung mit den S¨atzen 8.32 und 8.33 ! Bessere Werte f¨ ur c1 (n) sind von Minkowski, Blichfeldt und Rogers gefunden worden, vgl. [GL]. ur die Gute Absch¨atzungen der Konstante c1 (n) sind von erheblichem Interesse f¨ Frage nach den dichtesten Kugelgitterpackungen, wie man anhand einer Umformulierung von Folgerung 8.46 f¨ ur das euklidische Normquadrat einsieht: Wenn n Einheitskugeln im R gitterf¨ormig und √ m¨oglichst dicht gelagert werden sollen, ist μ(Q) = 4 fest zu w¨ahlen und d(L) = det B (s. Hilfssatz 8.43) zu minimieren. Dann ergibt sich mit d(L)2 = det B ≥ (4/c1 )n Folgerung 8.47 Die obere Gitterpackungsdichte von Einheitskugeln Kn im Rn erf¨ ullt
c1 (n) n/2 ≤ κn 2n(n−3)/2 3−n(n−1)/4 , ρ(Kn ) ≤ κn 4 wobei κn wieder das Volumen der n-dimensionalen Einheitskugel bezeichnet (vgl. Abschnitt 8.4.2). Ebenso wie dichteste Gitterpackungen sind optimale Werte von c1 nur f¨ ur n ≤ 8 bekannt. Folgerung 8.48 F¨ ur alle B ∈ Rn gelten die folgenden Ungleichungen. ur alle k = 1, . . . , n − 1 , 1. bk ≤ bk+1 f¨ 2. |2bkl | ≤ bk f¨ ur alle k < l , 3. Es gibt eine Konstante c = c(n) , so dass det B ≤
n
bk ≤ c det B .
k=1
Beweis. Die Ungleichungen 1) folgen aus der ersten Bedingung in Satz 8.44, angewandt auf x = ek+1 , die Ungleichungen 2) folgen entsprechend mit x = ek ± el aus xBxt = bk + bl ± 2bkl ≥ bl .
8 Gitter
273
Die linke Ungleichung in 3) beweist man am einfachsten auf geometrischem Wege mit Hilfe der schon ¨ofter verwendeten Zerlegung B = AAt und det B = (det A)2 . Der Eintrag bk ist gerade das euklidische Normquadrat der k-ten Zeile von A , und deren Determinante wird als Volumen des von ihren Zeilen erzeugten Parallelepipeds genau dann maximal, wenn die Zeilen paarweise orthogonal stehen. In diesem Fall erh¨alt man als Volumen genau das Produkt der bk . F¨ ur die rechte Ungleichung 3) begn¨ ugen wir uns mit einer Beweisskizze. Der Fall n = 1 ist klar. F¨ ur n > 1 nehmen wir der Einfachheit halber an, es g¨ abe eine = c (n) , so dass b ≤ c b f¨ u r alle k = 1, . . . , n − 1 . Dann Konstante c 2 2 2 k+1 k ist bk ≤ c3 bn1 f¨ ur eine geeignete Konstante c3 , und die Behauptung folgt mit b1 = μ(Q) und Folgerung 8.46. Wenn es keine solche Konstante gibt (was in Wahrheit nicht zutrifft), muss man wieder eine Blockzerlegung von B vornehmen und ¨ahnlich wie im Beweis des Hermiteschen Lemmas argumentieren; in [Kl] ist der Beweis genau ausgef¨ uhrt. ur den konvexen Bemerkung. Die bk spielen eine wichtige geometrische Rolle. F¨ symmetrischen K¨orper K := {x | Q(x) ≤ 1} sind sie die Quadrate der sukzessiven Minima λk , der kleinsten positiven Zahlen mit der Eigenschaft, dass λk K mindestens k linear unabh¨angige Gitterpunkte des Standardgitters L0 enth¨ alt [GL].
8.11 Bin¨ are quadratische Formen: Reduktion und Klassenzahl 8.11.1 Ringe imagin¨ arquadratischer Zahlen und ihre Normformen Sei d eine negative quadratfreie ganzrationale Zahl. Wir erinnern daran, dass Od√= Z[α] der Ring der ganzalgebraischen Zahlen im quadratischen Zahlk¨ orper Q( d) ist (Satz 3.5, Folgerung 7.58), wenn man α definiert durch √ √ 1+ d f¨ ur d ≡ 1 mod 4 . α := d f¨ ur d ≡ 2, 3 mod 4 , α := 2 Wenn wir die komplexe Zahlenebene in der u ¨blichen Weise mit dem R2 identifizieren, wird Od offenbar zu einem Gitter. Dabei wird das komplexe Betragsquadrat zum euklidischen Normquadrat |z|2 = x2 + y 2 , und ebenso wie im vorangegangenen Abschnitt k¨onnen wir entweder diese quadratische Form auf dem Gitter Od oder die quadratische Form x2 + (α + α)xy + |α|2 y 2 auf dem Standardgitter L0 = Z2 studieren. Die Koeffizienten α + α und |α|2 dieser Normform sind dann 1−d 0 und − d bzw. 1 und 4 in den beiden F¨allen d ≡ 2, 3 bzw. ≡ 1 mod 4 . Die Diskriminante der quadratischen Form (ebenso wie des Gitters Od ) ist in unserer alten Bezeichnungsweise
274
8.11 Bin¨ are quadratische Formen: Reduktion und Klassenzahl
also −d bzw. −d/4 . Da es sehr l¨astig ist, bei quadratischen Formen mit ganzzahligen Koeffizienten gebrochene Invarianten betrachten zu m¨ ussen, werden wir an dieser Stelle unsere Definition der Diskriminante durch Multiplikation mit dem Faktor −4 ab¨andern: F¨ ur die positiv definite quadratische Form ax2 + bxy + cy 2 sei als Diskriminante die Gr¨oße D := b2 − 4ac bezeichnet. Dieses entspricht auch einer ¨alteren Tradition bei der Betrachtung bin¨arer quadratischer Formen bzw. quadratischer Zahlk¨ orper ([Co], [Cox]; mit ¨ etwas mehr technischem Aufwand lassen sich die Uberlegungen dieses Abschnitts auch auf indefinite bin¨are quadratische Formen bzw. rell-quadratische Zahlk¨ orper u bertragen, wesentliche Teile bleiben sogar f¨ u r Zahlk¨ o rper h¨ o heren Grades g¨ ultig, ¨ Gegenstand der algebraischen Zahlentheorie). Wir notieren einige einfache Sachverhalte u ¨ber Ideale im Ring Od . Man beacharte, dass alle α ∈ Od Normen in Z besitzen (sogar ≥ 0 , da wir nur imagin¨ quadratische Zahlk¨orper betrachten). Das l¨ asst sich entweder elementar einsehen oder z.B. mit Folgerung 7.58.2; dass die Normen rational sein m¨ ussen, sagt die Galoistheorie. Hilfssatz 8.49 a) Wird Od als Gitter im R2 betrachtet, so wird jedes Ideal A = {0} zum Untergitter. b) Hauptideale A = αOd , α = 0 , haben den Index |α|2 in Od . c) Sei ax2 + bxy + cy 2 eine Normform auf dem Gitter B ⊆ Od und α ∈ Od , α = 0 . Dann ist |α|2 (ax2 + bxy + cy 2 ) Normform auf dem Gitter αB . d) Umgekehrt: Sei f (x, y) = ax2 + bxy + cy 2 ∈ Z[x, y] positiv definit mit Diskriminante D < 0 , dann ist f bis auf einen konstanten Faktor eine Normform in √ einem Untergitter der ganzen Zahlen von Q( D) , n¨amlich √ b+ D 2 2 2 4a f (x, y) = (2ax + by) − Dy = ||ax + y || . 2 Das legt folgende Konvention nahe. Die quadratische Form f (x, y) = ax2 + bxy + cy 2 ∈ Z[x, y] heißt primitiv, wenn ihre Koeffizienten teilerfremd sind. Wir notieren ferner die folgende Beobachtung. Hilfssatz 8.50 a) D ≡ 0 oder 1 mod 4 , und in diesen F¨ allen ist b) jeweils b gerade bzw. ungerade. c) a, c > 0 sind Werte der quadratischen Form f (x, y) an ganzzahligen Stellen. ¨ d) Aquivalente quadratische Formen haben die gleiche Diskriminante.
275
8 Gitter
8.11.2 Reduktionstheorie ¨ Auch die Definition der Aquivalenz ¨andern wir ab: Zwei positiv definite quadratische Formen f, g ∈ Z[x, y] nennen wir eigentlich ¨ aquivalent, wenn sie durch eine SL2 (Z)-Transformation in den Variablen auseinander hervorgehen, wir lassen also die Determinante −1 nicht mehr zu, oder in der Sprache der Gitterbasen: Wir betrachten nur noch Gitterbasen gleicher Orientierung als eigentlich ¨ sucht man nach einer ¨aquivalent. Wie im bisher betrachteten Aquivalenzbegriff geeigneten Menge R reduzierter quadratischer Formen, am einfachsten beschrieben durch die Menge ihrer Koeffiziententripel (a, b, c) , welche zu jeder positiv definiten bin¨aren quadratischen Form genau einen Repr¨ asentanten bez¨ uglich der ¨ eigentlichen Aquivalenz enth¨alt. Man beachte, dass f¨ ur b = 0 die quadratischen Formen zu (a, b, c) und (a, −b, c) ¨aquivalent, aber i.a. nicht eigentlich ¨ aquivalent sind. Satz 8.51 Die Menge R aller positiv definiten bin¨aren quadratischen Formen f (x, y) = ax2 + bxy + cy 2 mit |b| ≤ a ≤ c
und
b≥0
in den F¨allen
|b| = a
oder
a=c
¨ ist eine bez¨ uglich eigentlicher Aquivalenz reduzierte Menge. Zum Beweis k¨onnte man wie in Satz 8.44/Folgerung 8.48 vorgehen oder sich sogar auf diese berufen. Hier bietet sich aber ein algorithmisches Vorgehen an, Variante ¨ des euklidischen Algorithmus: Durch Ubergang von einem gegebenen f zu einem eigentlich ¨aquivalenten g(x, y) = f (x + my, y) = ax2 + (2am + b)xy + c y 2 mit einem geeigneten m ∈ Z l¨asst sich |b| ≤ a erreichen. Falls a > c , vertauscht man beide durch (x, y) → (−y, x) . Nach endlich vielen Schritten erf¨ ullt das Resultat die geforderten Ungleichungen, und es ist leicht zu sehen, dass mit den gleichen Transformationen auch b ≥ 0 in den beiden ,,Randf¨ allen” erreichbar ist. Es bleibt zu zeigen, dass zwei verschiedene f und g , welche beide die angegebenen Ungleichungen erf¨ ullen, nicht eigentlich ¨aquivalent sein k¨ onnen. Man kann etwa durch quadratische Erg¨anzung wie in Hilfssatz 8.49d) im Falle xy = 0 f (x, y) ≥ (a − |b| + c) min{x2 , y 2 } beweisen, also f (x, y) ≥ a − |b| + c . Damit ist klar, dass f (1, 0) = a der kleinste positive Wert von f auf Z2 ist; genauso ist c der kleinste Wert von f auf Z2 au¨ ßerhalb der x-Achse, insofern sind a und c durch die eigentliche Aquivalenzklasse von f bereits eindeutig bestimmt. Schließlich ist b dadurch eindeutig bestimmt, dass a − |b| + c der kleinste Wert von f auf Z2 außerhalb der beiden Achsen ist und dass (a, b, c) und (a, −b, c) nur in den F¨ allen b = 0 und |b| = a eigentlich ¨aquivalent sind. 2
276
8.11 Bin¨ are quadratische Formen: Reduktion und Klassenzahl
8.11.3 Endlichkeit der Klassenzahl Wieviele positiv definite primitive quadratische Formen gibt es in Z[x, y] zu gege¨ bener Diskriminante D < 0 ? Diese Frage ist nat¨ urlich nur f¨ ur Aquivalenzklassen sinnvoll, mit anderen Worten f¨ ur reduzierte quadratische Formen. Mit den Ungleichungen aus Satz 8.51 sehen wir −D = 4ac − b2 ≥ 4a2 − a2 = 3a2 , #
also
−D . 3 Gleichzeitig ist damit der Wertevorrat f¨ ur b beschr¨ ankt, und da c durch a, b, D eindeutig bestimmt ist, gilt a ≤
¨ Satz 8.52 Die Klassenzahl h(D) der eigentlichen Aquivalenzklassen positiv definiter primitiver quadratischer Formen von Diskriminante D in Z[x, y] ist endlich. Satz 8.53 F¨ ur nat¨ urliche Zahlen n ist die Klassenzahl h(−4n) = 1 genau dann, wenn n ∈ {1, 2, 3, 4, 7} . Beweis (Landau). Es gibt immer eine reduzierte quadratische Form x2 + ny 2 der Diskriminante D = −4n . F¨ ur die angegebenen Werte von n mag man durch Ausprobieren verifizieren, dass es sich dabei um die einzige primitive reduzierte quadratische Form handelt. Bleibt zu zeigen, dass f¨ ur alle anderen n > 4, n = 7 , noch weitere reduzierte primitive Formen existieren. 1. Sei n keine Primzahlpotenz, also zusammengesetzt mit einer Faktorzerlegung n = ac , o.B.d.A. mit teilerfremden a < c , dann nehme man ax2 + cy 2 . 2. F¨ ur n = 2r , r > 3 nehme man 4x2 ± 4xy + (2r−2 + 1)y 2 und f¨ ur n = 8 die Form 3x2 + 2xy + 3y 2 . 3. Wenn n = pr eine ungerade Primpotenz ist und n + 1 sich in teilerfremde Faktoren c > a ≥ 2 zerlegen l¨asst, ist ax2 + 2xy + cy2 primitiv reduziert und besitzt die Diskriminante 22 − 4ac = 4 − 4(n + 1) = −4n . 4. Schließlich ist nur noch der Fall zu betrachten, dass n = pr ungerade Primpotenz und n + 1 = 2s ist. F¨ ur s > 5 nehme man die primitive reduzierte Form 8x2 ± 6xy + (2s−3 + 1)y 2 und beachte D = 62 −4·8(2s−3 +1) = 36−4·2s −32 = −4n . F¨ ur s = 4 ist n = 15 keine Primpotenz, und f¨ ur n = 31, s = 5, w¨ ahle man (a, b, c) = (5, ±4, 7) . 2
277
8 Gitter
So handgestrickte Beweise gibt es f¨ ur ungerade Diskriminanten leider nicht. Auf Heegner geht die folgende Liste zur¨ uck, deren Vollst¨ andigkeit erst durch Stark in den 60-er Jahren des 20. Jahrhunderts endg¨ ultig bewiesen wurde (und deren Beweis den Rahmen dieses Buchs bei weitem sprengen w¨ urde; der interessierte Leser sei auf [Cox] verwiesen). Satz 8.54 F¨ ur ungerade D < 0 ist h(D) = 1 genau in den F¨ allen −D = 3 , 7 , 11 , 19 , 27 , 43 , 67 , 163 .
8.11.4 Warum Klassenzahlen? Skizze eines Ausblicks Wir kommen nun auf die eingangs erw¨ahnte Rolle unserer bin¨ aren positiv definiten quadratischen Formen f ∈ Z[x, y] als Normformen von Idealen zur¨ uck. Selbst wenn sie nicht primitiv sind, lassen sie sich bis auf einen Faktor als euklidisches √ Normquadrat auf einem Gitter im imagin¨arquadratischen K¨ orper K := Q( D) lesen, wenn wir diesen ebenso wie seinen Ring der ganzen Zahlen in C bzw. R2 eingebettet denken. Wir bestimmen zun¨achst das Gitter. √ Sei τ = (−b + D)/2a ∈ C jene Nullstelle von f (x, 1) = ax2 + bx + c mit positiv definitem Imagin¨arteil, also in der oberen Halbebene; man beachte, dass wegen D < 0 keine reellen Nullstellen existieren und dass aτ ∈ OK , also eine ganze Zahl des K¨orpers K ist. Identifizieren wir C mit R2 , so bilden 1 und τ die (orientierte) Basis eines Gitters L , auf dem (Hilfssatz 8.49d)) das euklidische Normquadrat eigentlich ¨aquivalent ist zu 4af auf Z2 . Anstatt auf L kann man nun alles auf das Gitter aL ⊆ OK umrechnen, aber ist dies ein Ideal in OK ? Das ist im allgemeinen nicht richtig. Man stellt leicht fest, dass O := {β ∈ C | βL ⊆ L} ein Ring ist, der Endomorphismenring von L (¨ ubrigens gleichermaßen von aL ) und dass O ⊆ OK in den ganzen Zahlen von K enthalten ist — eine sogenannte Ordnung ganzer Zahlen in K (in dieser etwas altert¨ umlichen Terminologie heißt OK die Hauptordnung). Genauer kann man sich u ¨berlegen, dass der so definierte Endomorphismenring O nicht nur Z enth¨ alt, sondern sogar ein Untergitter von OK ist, es gilt n¨amlich O = Z + Zaτ , und nun ist aL =: A tats¨achlich ein Ideal in O . ¨ Was bedeutet eigentliche Aquivalenz primitiver quadratischer Formen f¨ ur die¨ se Ideale? Unter einer eigentlichen Aquivalenz ¨ andert sich das Ideal A nicht, allenfalls seine Basis (aber die Orientierung bleibt erhalten). Schon zu Beginn ¨ dieses Abschnitts haben wir gesehen, dass sich beim Ubergang zu einem Ideal 2 andert, die zugeh¨ orige βA, β ∈ O , die Normform nur um den Faktor |β| ∈ N ¨ primitive Form also unge¨andert bleibt. Das legt die folgende Definition einer
278
8.11 Bin¨ are quadratische Formen: Reduktion und Klassenzahl
¨ Aquivalenz von Idealen nahe: Zwei Ideale A, B ⊆ O , beide = {0} , fallen in die gleiche Idealklasse, wenn α, β ∈ O , beide = 0 , existieren mit αA = βB . Damit ist klar, dass alle Hauptideale in die durch OK repr¨ asentierte Hauptklasse fallen, und dass die Anzahl der Idealklassen ein Maß darstellt daf¨ ur, wie weit OK von der eindeutigen Primfaktorzerlegung entfernt ist. Man kann zeigen, dass die ¨ Diskriminante D die Ordnung bereits eindeutig bestimmt (Ubungsaufgabe: Wie sieht man an D , dass es sich um eine Hauptordnung handelt?), darum folgt aus Satz 8.52 Folgerung 8.55 Jede Ordnung ganzer Zahlen eines imagin¨arquadratischen Zahlk¨orpers besitzt nur endlich viele Idealklassen. Aus Satz 8.53 und 8.54 und der Erkenntnis, dass die Hauptideale genau die Hauptklasse ausmachen, folgt die bereits in Abschnitt 3.4.8 erw¨ ahnte Folgerung√8.56 Im Ring der ganzen Zahlen Od des imagin¨ arquadratischen Zahlk¨orpers Q( d) gilt die eindeutige Primfaktorzerlegung genau dann, wenn −d einen der Werte 1 , 2 , 3 , 7 , 11 , 19 , 43 , 67 , 163
besitzt.
Es ist u ¨brigens kein Zufall, dass die Klassenzahl nur dann 1 ist, wenn −d (o.B.d.A. > 1 und quadratfrei) Primzahl ist. Allgemeiner ist −d prim, wenn die Klassenzahl ungerade ist, und das l¨asst sich zu einem verh¨ altnism¨ aßig schnellen Primzahltest ausbauen. Allerdings muss man dazu weit effektivere Berechnungsverfahren f¨ ur h(D) entwickeln als wir das hier getan haben. Diese kombinieren analytische Methoden mit der Tatsache, dass die Idealklassen eine Gruppenstruktur besitzen: Da man Ideale multiplizieren kann und die Multiplikation mit Hauptidealen die Idealklasse nicht a¨ndert, l¨asst sich repr¨ asentantenweise eine Multiplikation von Idealklassen einf¨ uhren. Assoziativit¨at und Kommutativit¨ at der Multiplikation sind klar, und die Multiplikation eines Ideals mit seinem komplex konjugierten ergibt stets ein Hauptideal, also existieren auch Inverse. Eine sorgf¨ altige Untersuchung dieser Idealklassengruppe zeigt, dass ihre Elemente der Ordnung 2 R¨ uckschl¨ usse erlauben auf die m¨oglichen Faktorzerlegungen von D . Um diese Ideen Computer-f¨ahig zu machen, ist es zweckm¨ aßig, statt der Idealklassengruppe ¨ besser eine entsprechende Gruppe aus Aquivalenzklassen quadratischer Formen zu benutzen, deren Multiplikation (die Komposition bin¨ arer Formen) viel ¨ alter ist als die Idealtheorie und welche D. Shanks 1969 wieder erfolgreich vom Speicher der Mathematik heruntergeholt hat. Idealklassengruppen gibt es genauso f¨ ur Zahlk¨orper h¨ oheren Grades; auch da sind sie endlich und stellen ein Maß dar f¨ ur die Abweichung von der Eindeutigkeit der Primfaktorzerlegung. Allerdings gibt es f¨ ur h¨ ohere Zahlk¨ orper keine Entsprechung mehr zu einer Kompositionstheorie quadratischer Formen.
279
8 Gitter
¨ Ganz zum Schluss noch ein Ausblick auf die Auswirkung der eigentlichen Aquivalenzen auf die oben eingef¨ uhrte ,,Nullstelle” τ der quadratischen Form. Eine naheliegende Rechnung zeigt, dass jedes Element der Modulgruppe SL2 (Z) auf τ operiert via
αβ ατ + β : τ → , γδ γτ + δ also als gebrochen-lineare Transformation, welche die obere Halbebene in sich u uhrt. In der Tat ist diese Operation von SL2 (Z) diskontinuierlich, und die ¨berf¨ Menge der reduzierten Formen (vgl. Satz 8.51) liegt gerade in dem durch die Ungleichungen 1 |Re τ | ≤ , |τ |2 ≥ 1 2 definierten Fundamentalbereich f¨ ur diese Operation der Modulgruppe.
8.12 Der LLL-Algorithmus Schon bei der Frage nach den Minima = 0 positiv definiter quadratischer Formen sind wir auf das Problem gestoßen, den k¨ urzesten Gittervektor = 0 eines Gitters L zu bestimmen, oder besser noch n linear unabh¨ angige Gittervektoren, deren euklidische Normen die sukzessiven Minima auf dem Gitter sind. In Dimension 2 k¨onnen wir eine Variante des im letzten Abschnitt beschriebenen Gaußschen Reduktionsverfahrens verwenden, aber in hohen Dimensionen ist das Problem unangenehm schwer — dabei f¨ ur f¨ ur viele Fragen der ,,Computational Algebra” oder ,,Computational Number Theory” von großer Bedeutung (vgl. [St] f¨ ur mehr ´sz hierzu Hinweise). 1986 haben A.K. Lenstra, H.W. Lenstra jr. und Lova einen großen Durchbruch erzielt, der in raffinierter Weise eine Variante des aus der Linearen Algebra bekannten Orthonormalisierungsverfahrens mit der Erkenntnis kombiniert, dass man f¨ ur die meisten praktischen Zwecke nicht unbedingt den wirklich k¨ urzesten Vektor ben¨otigt, dass vielmehr ein ,,ziemlich” kurzer gen¨ ugt, wobei ziemlich noch zu pr¨azisieren ist. Das Verfahren wird nach seinen Erfindern der LLL-Algorithmus genannt und soll hier beschrieben werden.
8.12.1 Die Gram-Schmidt-Orthogonalisierung Seien z1 , . . . , zr ∈ Rn , jetzt wieder als Spaltenvektoren geschrieben, und der Rn sei mit dem Standardskalarprodukt zt w versehen. Die zj m¨ ussen nicht einmal linear unabh¨angig sein, da es nicht um Normalisierung, nur um Orthogonalisierung geht. Wir definieren induktiv w1 := z1 ,
wi := zi −
j