166 92 4MB
German Pages 578 Year 2007
de Gruyter Lehrbuch Walter · Einführung in die Analysis 1
Rolf Walter
Einführung in die Analysis 1
≥
Walter de Gruyter Berlin · New York
Prof. Dr. Rolf Walter Fachbereich Mathematik Institut für Analysis Universität Dortmund Vogelpothsweg 87 44227 Dortmund E-Mail: [email protected]
" Gedruckt auf säurefreiem Papier, das die US-ANSI-Norm über Haltbarkeit erfüllt. ISBN 978-3-11-019539-2 Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. " Copyright 2007 by Walter de Gruyter GmbH & Co. KG, 10785 Berlin. Dieses Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Printed in Germany. Konvertierung von LaTeX-Dateien des Autors: M. Pfizenmaier, Berlin. Einbandgestaltung: Martin Zech, Bremen. Druck und Bindung: Druckhaus »Thomas Müntzer«, Bad Langensalza.
Vorwort Der Start in die Analysis ist für viele Studenten eine besondere Erfahrung. Sie lernen dabei die Kraft der Mathematik kennen, werden aber auch konfrontiert mit den Mühen und Anstrengungen dieses Fachs. Beiden Polen sollte ein Analysisbuch Rechnung tragen: Es soll dem Leser ein guter Leitfaden sein und zugleich sein Interesse für dieses Gebiet fördern. Unter Beachtung dieser Aspekte bietet das vorliegende Buch eine Einführung in die Analysis mit den zentralen Themen der Differential- und Integralrechnung. Der Text beruht auf vielfältigen Vorlesungserfahrungen an den Universitäten Freiburg i.Br. und Dortmund. Das Grundthema der Analysis ist die Frage, wie man Veränderungen in Prozessen mathematisch in den Griff bekommt. Prozesse können sehr umfassend verstanden werden, soweit sie kontinuierlicher Art sind. Die Zahl der Beispiele ist unübersehbar (einfache Fallgesetze in der Physik, komplizierte Vorgänge des Wettergeschehens, wirtschaftliche Entwicklungen, usw.). Die Analysis gibt fundierte Antworten darauf, was eine Veränderung im Kleinen ist (Stichwort: Differentialrechnung), wie globale Umwandlungen zu verstehen sind, oder welche Beziehungen eigentlich zwischen lokalen und globalen Veränderungen bestehen können (Stichwort: Integralrechnung). All diese Fragen spielen in der Entwicklung der exakten Wissenschaften eine herausragende Rolle. Das unterstreicht die Bedeutung der Analysis als einer umfassenden Modellierung für solche Probleme. Die Mathematik ist kein abgeschlossenes Gebiet, und selbst ihre Grundthemen können immer wieder neu gesehen werden. Das hängt auch damit zusammen, dass die Mathematik die Brücke schlagen muss zwischen anschaulichen oder neu aufkommenden Vorstellungen auf der einen Seite und präzisen Beschreibungen auf der anderen. In diesem Buch wird versucht, die Begriffe auf möglichst natürliche Weise einzuführen. Das geschieht traditionell dadurch, dass an die anschauliche Bedeutung angeknüpft wird, z.B. beim Begriff der Ableitung. Es kann aber auch dadurch erfolgen, dass die Begriffe durch möglichst einfache Eigenschaften charakterisiert werden, auf denen alles folgende aufgebaut ist. Diese Methode der Definition durch Eigenschaften wird hier als ein tragendes Prinzip angesehen und nach Möglichkeit realisiert, z.B. bei der Definition der Exponentialfunktion (Abschnitt 2.4) oder bei der Einführung des bestimmten Integrals (Abschnitt 5.1). All das bedingt zu einem gewissen Teil eine neue Sichtweise, die dem Verständnis der Dinge sehr entgegenkommt.
vi Ein Blick auf das Inhaltsverzeichnis lehrt, welche „großen“ Themen behandelt werden. Dazu zählen neben der Differential- und Integralrechnung die verschiedenen Ausformungen des Grenzwertbegriffs, z.B. bei Folgen und Reihen, die Einordnung der Limesprozesse in einen angemessenen allgemeinen Rahmen und nicht zuletzt die Einführung „kanonischer“ klassischer Objekte (Exponentialfunktion, trigonometrische Funktionen, die „mathematischen Naturkonstanten“ e und &, usw.). Das meiste hiervon gehört der Substanz nach zum üblichen und bewährten Standard. Darüber hinaus gibt es Fragestellungen von Interesse, die jedoch (aus Zeitgründen) im Rahmen einer Vorlesung nicht behandelt werden können. Solche „optionalen“ Themen sind durch Sterne markiert und können bei der ersten Lektüre übergangen werden. Sie eignen sich sehr für ergänzende Veranstaltungen, z.B. für Proseminare. Am Ende der meisten Abschnitte befinden sich Übungsaufgaben und zusätzliche Kommentare unter der Überschrift „Aufgaben und Anmerkungen“. Der Schwierigkeitsgrad ist dabei gestaffelt, ausgehend von einfachen Rechenübungen bis hin zu anspruchsvolleren Überlegungen, die dann vielfach mit Lösungshinweisen versehen sind. Die Beschäftigung mit Aufgaben ist ein ganz wesentlicher Teil der Aneignung von Mathematik und dringend zu empfehlen. Der eigentliche Text ist in sich abgeschlossen, d.h. in ihm wird von den Aufgaben und Anmerkungen kein Gebrauch gemacht. Ich hoffe, dass durch diese Gesichtspunkte und die Art und Weise der Darstellung das Interesse des Lesers geweckt wird und er in reichem Maße profitiert von dem Schatz der Erkenntnisse, die in einer langen und anhaltenden Entwicklung der Mathematik gefunden wurden. Die Analysis ist voller Glanzstücke an Ideen, die hier wie in der Parallel-Literatur zum Tragen kommen. Die Kommunikation ist gerade auch in der Mathematik ein wesentliches Element; niemand ist alleine auf der Welt. So wie die Noten in der Musik erst mal leblos wirken und durch das Spielen auferweckt werden, so geht es auch mit mathematischen Inhalten: Texte und Formeln sind die Noten, und man kann sie durch Lesen, Verständnis, Austausch und Anwendung zum Klingen bringen. Der Austausch geschieht oft auch ganz persönlich und im fruchtbaren Wechselspiel. In diesem Sinne sei gedankt: meinen Freunden und Kollegen Prof. Dr. Wolfgang Kühnel und Prof. Dr. Helmut Reckziegel für Kritik und Anregungen; den Herren Privatdozent Dr. Peter Kohlmann und Dr. Ilijas Selimovic für viele gute Diskussionen und fürs Zuhören. Besonders danken möchte ich Herrn Dr. Günter Skoruppa sowohl in mathematischer Hinsicht wie auch für unermüdlichen und kompetenten Einsatz bei der „Elektronik“. Vielen Dank auch dem Verlag de Gruyter, insbesondere Herrn Dr. Robert Plato, für angenehme, kundige und zuverlässige Zusammenarbeit! Dortmund, im April 2007
Rolf Walter
Zum Gebrauch des Buches Teil 1 umfasst die Kapitel 1 bis 9, Teil 2 die Kapitel 10 bis 14. Alle Kapitel sind in Abschnitte mit zweistelligen Unternummern gegliedert. In jedem Abschnitt fängt die Nummerierung von Definitionen, Formeln usw. neu an, wobei Sätze, Definitionen, Beispiele und Bemerkungen gemeinsam mit großen lateinischen Buchstaben durchgezählt sind. Verweise erfolgen im gleichen Abschnitt ohne dessen Nennung, an anderen Stellen unter Anfügung des zitierten Abschnitts in eckigen Klammern; z.B. verweist „Satz E[5.1]“ auf Satz E des Abschnitts 5.1. Bei einem Zusatz werden stets die Voraussetzungen beibehalten. Das Ende eines Beweises wird durch das Symbol „"“ angedeutet, die Zeichen „´“ und „µ“ signalisieren eine Definitionsgleichung, wobei der Doppelpunkt auf der Seite der neu eingeführten Größe steht. Generalvoraussetzungen eines Kapitels oder Abschnitts gelten auch für die zugehörigen Aufgaben und Anmerkungen. Die $-Teile sind nützliche, aber optionale Ergänzungen. Von ihnen wird im „ungesternten“ Haupttext kein Gebrauch gemacht (wohl aber in anderen $-Teilen). Bei den Aufgaben signalisiert der Stern den Bezug zu einem $-Teil oder einen etwas höheren Schwierigkeitsgrad. Von der Sprechweise der Mengenlehre wird zunächst sehr sparsam, später ausführlicher Gebrauch gemacht. Die nötigen mengentheoretischen Begriffe sind in einem Anhang zusammengestellt. Dieser ist zur Zeit in Kurzfassung elektronisch verfügbar unter der Adresse http://www.mathematik.uni-dortmund.de/lsvii/Preprints/mengen.pdf Folgende dort getroffene Konvention sei hier hervorgehoben: Sind A.x/; B.x/ Aussageformen auf der Menge M , so ist die Formel: A.x/ H) B.x/ eine Kurznotation für die Formel: 8 x 2 M W A.x/ H) B.x/. Von dieser Verabredung wird gelegentlich Gebrauch gemacht, um lange formelmäßige Sequenzen etwas abzukürzen. Dabei ist die Menge M meistens aus dem Zusammenhang klar. Im Übrigen sei dem Leser empfohlen, diesen mengentheoretischen Anhang wie eine Grammatik zu benützen, d.h. ohne Hemmungen im Haupttext voranzuschreiten und nur bei Bedarf dort nachzusehen.
viii Die Standardmengen der Mathematik sind folgendermaßen bezeichnet: N Z Q R C
Menge der natürlichen Zahlen (ohne 0) Menge der ganzen Zahlen Menge der rationalen Zahlen Menge der reellen Zahlen Menge der komplexen Zahlen.
Das Anhängen des Indexes 0 bedeutet hier die Hinzunahme der Null; z.B. ist N0 die Menge der natürlichen Zahlen zusammen mit 0. Die Marken „C“ und „&“ bezeichnen entsprechende Vorzeichenbeschränkungen; z.B. ist RC die Menge aller positiven, RC 0 die Menge aller nichtnegativen reellen Zahlen. Die Darstellung der Analysis ist vollständig und in sich abgeschlossen. Aber die Mathematik ist immer offen für neue Probleme, Lösungen und Entwicklungen. Wer weitere Publikationen kennen lernen möchte, sei auf die Literaturliste am Ende hingewiesen. Dort findet sich auch ein ausführliches Stichwortverzeichnis für auftretende Begriffe. Hinweise auf die Literaturliste erfolgen durch Nennung der Autoren zusammen mit dem entsprechenden Erscheinungsjahr in eckigen Klammern (Beispiel: Hilbert[1999]). Das Stichwortverzeichnis ist ein nützliches Hilfsmittel zur Ergänzung der im Text reichlich angegebenen Bezüge; es enthält auch die Lebensdaten der zitierten Wissenschaftler.
Inhaltsverzeichnis Vorwort . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Zum Gebrauch des Buches . . . . . . . . . . . . . . . . . . . . . . . . . . .
v vii
1 Die Zahlmengen der Analysis . . . . . . . . . . 1.1 Die reellen Zahlen . . . . . . . . . . . . . . . 1.2 Natürliche Zahlen und vollständige Induktion 1.3 Anwendungen des Induktionsprinzips . . . . 1.4 Zur Vollständigkeit . . . . . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
1 1 15 23 37
2
Reelle Zahlenfolgen . . . . . . . . . . . . . . . . . 2.1 Konvergenz . . . . . . . . . . . . . . . . . . . 2.2 Anwendung auf die Wurzelfunktion . . . . . . 2.3 Intervallschachtelungen . . . . . . . . . . . . . 2.4 Anwendung auf die Exponentialfunktion und e 2.5 Anwendung auf den Arkustangens und & . . . 2.6 Teilfolgen und das Kriterium von Cauchy . . . 2.7 $ Limes superior und Limes inferior . . . . . . 2.8 $ Dezimaldarstellung . . . . . . . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
49 49 61 66 68 75 82 88 92
3
Reelle Funktionen und ihre Grenzwerte . . . . . . 3.1 Reelle Funktionen . . . . . . . . . . . . . . . . 3.2 Grenzwerte . . . . . . . . . . . . . . . . . . . 3.3 Stetigkeit . . . . . . . . . . . . . . . . . . . . 3.4 Extrema und Zwischenwertsatz . . . . . . . . . 3.5 Uneigentliche Konvergenz und die Rolle von 1 3.6 Monotonie und Injektivität . . . . . . . . . . . 3.7 Exponentialfunktionen, Logarithmen, Potenzen
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
99 99 116 126 135 141 152 159
4
Differentialrechnung . . . . . . . . . . . . . . . . . . 4.1 Differenzierbarkeit . . . . . . . . . . . . . . . . . 4.2 Ableitungsregeln . . . . . . . . . . . . . . . . . . 4.3 Extrema und Mittelwertsatz . . . . . . . . . . . . . 4.4 Trigonometrische Funktionen und der Einheitskreis 4.5 $ Grenzwerte nach de l’Hospital . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
167 167 173 179 189 212
5
Integralrechnung . . . . . . . . . . . . . . . . . . . . . 5.1 Das bestimmte Integral . . . . . . . . . . . . . . . . 5.2 Der Hauptsatz der Differential-und Integralrechnung 5.3 Produktintegration und Transformationsformel . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
220 220 237 245
x
Inhaltsverzeichnis
5.4 5.5
Das unbestimmte Integral . . . . . . . . . . . . . . . . . . . . . . . . 253 Gliedweise Integration und Differentiation . . . . . . . . . . . . . . . 261
6
Metrische Räume . . . . . . . . . . 6.1 Grundbegriffe für Mengen . . . 6.2 Grundbegriffe für Abbildungen . 6.3 Kompaktheit und Vollständigkeit 6.4 Kartesische Produkte . . . . . . 6.5 Gleichmäßigkeit . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
270 270 286 298 309 318
7
Die komplexen Zahlen . . . . . . . . . . . . . . . . . . 7.1 Der Körper der komplexen Zahlen . . . . . . . . . . 7.2 Komplexe Exponentialfunktion und Polardarstellung 7.3 Konvergenz bei komplexen Zahlen . . . . . . . . . . 7.4 Komplexe Polynome . . . . . . . . . . . . . . . . . 7.5 $ Der Fundamentalsatz der Algebra nach Argand . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
328 328 334 342 358 367
8
Weiterführung der Analysis . . . . . . . . . . . . . . . . . . . . 8.1 Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.2 Funktionenreihen . . . . . . . . . . . . . . . . . . . . . . . . 8.3 Höhere Ableitungen und die Taylor-Entwicklung . . . . . . . 8.4 Extrema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.5 Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . 8.6 Konvexe Funktionen . . . . . . . . . . . . . . . . . . . . . . 8.7 $ Stammfunktionen rationaler Funktionen und weiterer Typen . 8.8 $ Spezielle Konvergenzkriterien für Reihen . . . . . . . . . . 8.9 $ Andere Zugänge zu den elementaren Funktionen . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
370 370 388 394 413 416 437 448 461 476
9
Elementare Analysis im Rn . . . 9.1 Abbildungen vom Wegtypus 9.2 Funktionen vom Skalartypus 9.3 $ Holomorphie . . . . . . .
. . . .
. . . .
. . . .
. . . .
485 486 512 524
. . . .
. . . .
. . . . . .
. . . .
. . . . . .
. . . .
. . . . . .
. . . .
. . . . . .
. . . .
. . . . . .
. . . .
. . . . . .
. . . .
. . . . . .
. . . .
. . . . . .
. . . .
. . . . . .
. . . .
. . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 541 Wichtige Symbole . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 543 Sachregister . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 550
1
Die Zahlmengen der Analysis
1.1 Die reellen Zahlen Die reellen Zahlen sind der Stoff, aus dem die Analysis aufgebaut ist. Anschaulich kann man die reellen Zahlen als eine Verfeinerung der rationalen Zahlen betrachten, also derjenigen Zahlen, die sich als Brüche ganzer Zahlen darstellen lassen. Die reellen Zahlen umfassen die rationalen Zahlen und füllen außerdem die Lücken zwischen diesen aus. So entsteht das, was man als ein Kontinuum bezeichnen kann. Historisch hat es eine ganze Weile gedauert, die reellen Zahlen zu konstruieren und schließlich herauszufinden, welche Strukturen eigentlich für sie maßgeblich sind. Heutzutage ist die strukturelle Klärung abgeschlossen, so dass man nicht unbedingt den mühsamen Prozess der Konstruktion durchlaufen muss, sondern die reellen Zahlen durch geeignete Eigenschaften, also durch Axiome, kennzeichnen kann. Das ist der Weg, den wir hier einschlagen werden. Wir stellen zunächst die Axiome zusammen, die dem bloßen Rechnen mit reellen Zahlen zugrunde liegen. Diese Axiome regulieren also algebraische Eigenschaften. In ihrer Gesamtheit nennt man sie die Körperaxiome. A. Definition (Körperaxiome). Eine Menge K heißt ein Körper, wenn zu je zwei Elementen a; b in K die Summe a C b und das Produkt a ( b D ab als Elemente von K jeweils eindeutig definiert sind und dabei folgende Eigenschaften gelten:
(S.1) a C b D b C a + (S.2)
a C .b C c/ D .a C b/ C c µaCbCc
Kommutativgesetz Assoziativgesetz
(S.3) Es gibt genau ein Element in K, genannt 0, sodass für alle a 2 K gilt: a C 0 D a.
Eindeutige Existenz eines Neutralelements 0 (bzgl. C)
(S.4) Zu jedem a 2 K gibt es genau ein Element in K, genannt &a, sodass gilt: a C .&a/ D 0.
Eindeutige Existenz eines Inversen &a (bzgl. C)
2
Kapitel 1 Die Zahlmengen der Analysis
(P.1) a ( b D b ( a
Kommutativgesetz
(P.2) a ( .b ( c/ D .a ( b/ ( c µ a ( b ( c
Assoziativgesetz
(P.3) Es gibt genau ein Element in K n f0g, genannt 1, sodass für alle a 2 K gilt: a ( 1 D a:
Eindeutige Existenz eines Neutralelements 1 in K n f0g (bzgl. ()
(P.4) Zu jedem a 2 K n f0g gibt es genau ein Element in K n f0g, genannt a&1 , sodass gilt: a ( a&1 D 1.
Eindeutige Existenz eines Inversen a&1 in K n f0g (bzgl. ()
(D) a ( .b C c/ D a ( b C a ( c
Distributivgesetz.
Das Rechnen mit Summen und Produkten nach den Körperaxiomen kennzeichnet die reellen Zahlen noch nicht vollständig. Es gibt viele weitere Zahlbereiche, die ebenfalls diese Axiome befolgen (z.B. die rationalen Zahlen). Es müssen also weitere Eigenschaften hinzukommen, mit denen wir die reellen Zahlen wirklich charakterisieren können. Solche Eigenschaften sind die Gesetze, die den Größenvergleich betreffen, die so genannten Anordnungsaxiome und schließlich das Vollständigkeitsaxiom. Darauf kommen wir bald zurück. Zunächst wollen wir uns mit den Körperaxiomen beschäftigen und das tun, was man in solchen Situationen immer tun muss, nämlich aus den Axiomen möglichst viele Folgerungen ziehen. Schließlich gibt es viele weitere Regeln, die man beim praktischen Rechnen braucht. Das Wort „Körper“ ist historisch bedingt und hat in diesem Zusammenhang keine anschauliche Bedeutung. Alle Eigenschaften, die später verwendet werden, sollten eine logische Konsequenz der Axiome sein. An diesem Grundsatz muss man schon deswegen festhalten, um eine wirklich tragfähiges Fundament zu gewährleisten. Kurz gesagt, nur die Axiome und ihre Folgerungen dürfen in Beweisen verwendet werden. Wir werden deswegen am Anfang auch eine Reihe von Dingen ableiten, die aus sich selber heraus einleuchten. Jedoch werden wir diese Grundlagendinge nicht übertreiben, sondern rasch zu interessanten Fragestellungen vorstoßen, z.B. zur Definition der Eulerschen Zahl e und der Kreiszahl &, den beiden mathematischen Naturkonstanten, die ziemlich direkt aus dieser Grundlegung entspringen werden. Einfache Folgerungen aus den Körperaxiomen Zunächst einige Kommentare zu den Axiomen der Definition A selbst: Die Axiomengruppe (S.1) bis (S.4) bezieht sich auf die Bildung der Summe, die Addition, die Axiomengruppe (P.1) bis (P.4) bezieht sich auf die Bildung des Produkts,
Abschnitt 1.1 Die reellen Zahlen
3
die Multiplikation, während das Axiom (D) die beiden Operationen miteinander verbindet. Wie allgemein üblich, werden die auftretenden Symbole so gesprochen: a C b als a plus b; a ( b als a mal b; 0 als Null; &a als minus a; 1 als Eins; a&1 als a hoch &1. Ist a D 0, so sagt man dafür auch: a verschwindet. In a C b (bzw. a ( b) wird a oder b als Summand (bzw. Faktor) bezeichnet. Soweit mengentheoretische Symbole verwendet werden, kann der Leser den Anhang zur Mengenlehre konsultieren. Das ist allerdings nur in geringem Umfang nötig. Hier z.B. ist K n f0g die Menge K ohne das Element 0. Das Axiom (P.3) besagt also z.B., dass es genau ein von 0 verschiedenes Element in K gibt (genannt 1), sodass die Neutraleigenschaft a ( 1 D a für alle a 2 K gilt. (Dieser Anhang existiert derzeit in einer elektronischen Kurzfassung unter der Adresse: „http://www.mathematik.unidortmund.de/lsvii/Preprints/mengen.pdf“.) In (S.1), (S.2), (P.1), (P.2) wird die Gültigkeit für alle a; b; c 2 K gefordert. Solche Gleichungen, die für alle vorkommenden Objekte gelten, werden oft mit dem Wort Regel oder Gesetz oder Identität bezeichnet. Im Gegensatz hierzu gibt es die so genannten Bestimmungsgleichungen, die eine unbekannte Größe enthalten, wobei dann gefragt ist, ob es tatsächlich Elemente gibt, die anstelle der Unbekannten eingesetzt, die Gleichung erfüllen. Solche Elemente werden Lösungen der Gleichung genannt. Ein Beispiel hierfür ist die Gleichung a C x D 0, wobei a 2 K vorgegeben und x (als Element von K) gesucht ist. Das Axiom (S.4) besagt gerade, dass diese Bestimmungsgleichung in K genau eine Lösung für x besitzt, die dann (zunächst als reine Bezeichnung) &a genannt wird. Analog fordert das Axiom (P.4) die eindeutige Lösbarkeit der Gleichung a(x D 1, sofern a in K gegeben, aber nicht gleich 0 ist. Im Axiom (D) wären strenggenommen a ( b und a ( c einzuklammern; man müsste also eigentlich schreiben: a ( .b C c/ D .a ( b/ C .a ( c/. Solche Klammern regulieren die Reihenfolge, in der die Operationen abzuarbeiten sind. Hier heißt das, dass man bei der rechten Seite zuerst a ( b und a ( c bilden soll und danach die Summe dieser beiden Resultate. Bei dem Ausdruck .a ( b/ C .a ( c/ werden allerdings die Klammern zwar gemeint, aber meistens weggelassen. Man folgt also der Konvention: „Punktrechnung geht vor Strichrechnung“. Wir bringen jetzt einige Musterbeispiele dafür, wie man aus den Axiomen weitere Folgerungen ziehen kann. Der leichteste Einstieg geschieht so, dass man in den allgemeinen Eigenschaften Spezialisierungen vornimmt. Bis auf weiteres sei K ein Körper, und die vorkommenden Buchstaben seien Elemente von K. B. Satz. Es gilt: (i)
0 C 0 D 0.
(ii)
Für alle a 2 K ist a ( 0 D 0.
4
Kapitel 1 Die Zahlmengen der Analysis
(iii) Aus ab D 0 folgt a D 0 oder b D 0. (Diese Eigenschaft wird als Nullteilerfreiheit in K bezeichnet.) Beweis. Zu (i): Man setzt in (S.3) einfach a D 0. Zu (ii): Da in der Behauptung sowohl addiert wie auch multipliziert wird, liegt es nahe, das beide Operationen verbindende Gesetz (D) heranzuziehen: Wir spezialisieren in (D) b D c D 0. Dies ergibt a ( .0 C 0/ D a ( 0 C a ( 0: Dann können wir auf der linken Seite 0 C 0 D 0 einsetzen, was gerade bewiesen wurde, und erhalten a ( 0 D a ( 0 C a ( 0: Mit der Abkürzung d ´ a ( 0 bedeutet dies d D d C d: Addieren wir auf beiden Seiten dieser Gleichung &d , so folgt d C .&d / D .d C d / C .&d /: Dass dies erlaubt ist, folgt aus der eindeutigen Definition der Summe. Mit den Axiomen (S.2) und (S.4) folgt hieraus 0 D d C 0; also mit dem Axiom (S.3)
0 D d:
Gehen wir auf die Bedeutung von d zurück, so ergibt sich die Behauptung 0 D a ( 0: Zu (iii): Wir machen die Fallunterscheidung (u): b ¤ 0 bzw. (g): b D 0. Im Fall (g) ist nichts zu beweisen. Im Fall (u) schließen wir so: Aus ab D 0 folgt durch Multiplikation beider Seiten mit b &1 : abb &1 D 0 ( b &1 . Daraus folgt mit (P.4): a ( 1 D 0, also mit (P.3): a D 0. " C. Definition und Satz. Man definiert: (a) die Differenz b & a ´ b C .&a/; (b) die Zwei 2 ´ 1 C 1 und damit das Doppelte 2a D a C a;
Abschnitt 1.1 Die reellen Zahlen
5
b 1 1 ´ a&1 , ´ b ( , falls a ¤ 0; a a a (d) das Quadrat a2 ´ a ( a.
(c)
die Quotienten
Hierfür gilt: (i)
b & a ist die eindeutig bestimmte Lösung der Gleichung a C x D b. b (ii) Ist a ¤ 0, so ist die eindeutig bestimmte Lösung der Gleichung a ( x D b. a Beweis. Zu (i): Der Beweis zerfällt in die zwei Teile der Existenz und Eindeutigkeit: Existenz: Dass b & a Lösung ist, sieht man anhand der Probe: a C .b & a/ D a C .b C .&a// D a C ..&a/ C b/ D .a C .&a// C b D 0 C b D b: Eindeutigkeit: Dass die Lösung eindeutig ist, ergibt sich aus den Schlüssen: aCx Db
impliziert .a C x/ C .&a/ D b C .&a/ impliziert x D b & a:
Die Schritte in diesen Rechnungen erklären sich selbst. Der Leser sollte sich aber klar machen, was jeweils vom bereits Bekannten verwendet wird. Zu (ii): Der Beweis dieses „multiplikativen Gegenstücks“ verläuft ganz analog, wobei man die Voraussetzung a ¤ 0 benötigt, damit ab bzw. a&1 gebildet werden kann. " Ist a D 0, so ist die Gleichung 0 ( x D b nicht lösbar, wenn b ¤ 0; denn die linke Seite ist ja immer gleich 0. Ist aber auch noch b D 0, so ist die Gleichung 0 ( x D 0 lösbar, jedoch nicht eindeutig; denn jedes x 2 K erfüllt diese Gleichung. Die Bildung von b & a wird Subtraktion genannt. Den Übergang von a zu a2 nennt man Quadrieren. Ein Ausdruck der Form ab (gelesen: „b durch a“) wird auch als Bruch bezeichnet, wobei b der Zähler und a der Nenner ist. Die Bildung von ab wird Division genannt. Der Nenner eines Bruchs muss aus den vorgenannten Gründen immer ¤ 0 sein: „Durch Null darf man nicht dividieren.“ Um Platz zu sparen, wird manchmal ab als b=a geschrieben, jedoch sollte diese Schreibweise die Ausnahme sein. Man nennt 1=a den Kehrwert oder das Reziproke von a. Sind Zähler oder Nenner eines Bruchs zusammengesetzte Ausdrücke, so ist die Division zum Schluss durchzuführen. Kommt ein Bruch in einem Ausdruck vor, so gilt er als eingeklammert. Z.B. ist 3aa . / aCb .a C b/ b b b ´ 3b- : ´ ; aC ´aC ; c c c(d .c ( d / c c d d
6
Kapitel 1 Die Zahlmengen der Analysis
Die obigen Herleitungen mögen als Muster dafür reichen, wie man aus den Axiomen weitere gewohnte Rechenregeln ableiten kann. Details zum algebraische Rechnen werden auch in den Vorlesungen über lineare Algebra behandelt. Es gibt natürlich weitere solche Regeln, die man ähnlich beweisen kann, z.B. die Vorzeichenregeln: &.&a/ D a;
&.a Cb/ D &a &b;
.&a/(b D &.ab/ µ &ab;
.&a/(.&b/ D ab
und die multiplikativen Gegenstücke zu den ersten beiden Regeln für a ¤ 0; b ¤ 0: .a&1 /&1 D a;
.ab/&1 D a&1 b &1 :
Oft gebraucht werden auch folgende Umrechnungen (1) (2)
.a C b/2 D .a C b/.a C b/ D aa C ab C ba C bb D aa C ab C ab C bb D a2 C 2ab C b 2 .a C b/.a & b/ D aa & ab C ba & bb D aa & ab C ab & bb D a2 & b 2 ;
bei denen man mehrfach das Distributivgesetz sowie die Definitionen in C verwendet. Anordnungseigenschaften Wir kommen zur nächsten Gruppe von Eigenschaften. Diese beziehen sich auf den Größenvergleich, der für reelle Zahlen möglich sein wird. D. Definition. Ein Körper K heißt angeordnet durch eine Relation < (kleiner), wenn gilt: (O.1) Für a; b 2 K ist jeweils genau eine der Beziehungen a < b; a D b; b < a richtig (Trichotomie); (O.2)
aus a < b und b < c folgt a < c
(Transitivität);
(O.3)
aus a < b folgt a C c < b C c
(Monotonie der Addition);
(O.4)
aus a < b und 0 < c folgt ac < bc
(Monotonie der Multiplikation).
Von jetzt an sei K in diesem Abschnitt ein angeordneter Körper, und die vorkommenden Buchstaben seien Elemente von K. Auch hier gibt es eine Reihe von Sprechweisen und Symbolen, die im Folgenden gebraucht werden: Gilt a < b, so nennt man a kleiner (als) b. Äquivalent wird dies auch durch b > a symbolisiert, und man sagt dafür: b ist größer (als) a. (Gedächtnisstütze: die Spitze des Zeichens < bzw. > weist zum kleineren, die Öffnung zum größeren der beiden Elemente.) Zwei Relationen der Art a < b und b < c werden zu a < b < c oder zu c > b > a zusammengefasst, und man sagt dafür: b liegt zwischen a und c. Ein a heißt positiv, wenn a > 0 gilt, und negativ, wenn a < 0 gilt.
7
Abschnitt 1.1 Die reellen Zahlen
E. Satz. Es gilt: (i)
aus a < b und c < d folgt a C c < b C d („gleichsinnige Ungleichungen darf man addieren“);
(ii)
aus a < b und c < 0 folgt ac > bc;
(iii) aus a ¤ 0 folgt a2 > 0 (speziell ist 1 D 12 > 0); 1 > 0; a
(iv)
aus a > 0 folgt
(v)
aus a < b und ab > 0 folgt
1 1 < . b a
Wir haben bislang mathematische Schlüsse verbal ausgedrückt, also z.B. in (O.3) gesagt: „aus a < b folgt a C c < b C c“. Das ist eine optimale Art der Darstellung, wie sie in fortgeschrittenen mathematischen Texten gepflegt wird (vgl. z.B. Dieudonné[1976/1987]). Trotzdem ist es manchmal praktischer, das Gleiche mit etwas mehr Symbolik auszudrücken, also z.B. mit Hilfe des Folgerungspfeils zu schreiben: „a < b H) a C c < b C c“. Den folgenden Beweis von Satz E formulieren wir jetzt einmal mit einer solchen abgekürzten Symbolik. Dabei werden die verwendeten Hilfsmittel jeweils mit notiert. Außerdem stellen wir zwei weitere Handwerkszeuge der Beweisführung vor. Zum einen handelt es sich um die Zerlegung in einzelne Teilschritte, die man als Zwischenbehauptungen mit entsprechenden Zwischenbeweisen bezeichnen kann. Zum Zweiten geht es um die Beweisfigur des Widerspruchsbeweises, die hier in einer konkreten Situation demonstriert wird. Beweis von E. Zu (i): In symbolischer Form lautet die Behauptung: a < b; c < d H) a C c < b C d . Ihr Beweis geht so: 9 a < b H) a C c < b C c = (O.2) (O.3) H) a C c < d C b: ; c < d H) c C b < d C b Zu (ii): In symbolischer Form lautet die Behauptung a < b; c < 0 H) ac > bc. Wir beweisen zunächst als Zwischenbehauptung: (3) Zwischenbeweis:
c < 0 () &c > 0
(speziell &1 < 0):
(O.3) Zu H) : c < 0 H) c C .&c/ < 0 C .&c/ H) 0 < &c: (O.3) Zu (H : &c > 0 H) 0 < &c H) c C 0 < c C .&c/ H) c < 0:
8
Kapitel 1 Die Zahlmengen der Analysis
Eigentlicher Beweis: (3) (O.4) a < b; c < 0 H) a < b; &c > 0 H) a ( .&c/ < b ( .&c/ (O.3) H) &ac < &bc H) bc < ac: Beim letzten Schritt addiert man auf beiden Seiten ac C bc. Zu (iii): In symbolischer Form lautet die Behauptung: a ¤ 0 H) a2 > 0. Zu ihrem Beweis machen wir die Fallunterscheidung (p) a > 0; (n) a < 0. Diese Fallunterscheidung ist vollständig; denn nach (O.1) gibt es nur diese beiden Fälle, da ja a ¤ 0 vorausgesetzt ist. Bei (p): a > 0 H) a2 > 0 ( a D 0. (Beim Folgerungspfeil werden beide Seiten mit a multipliziert.) (p) (3) Bei (n): a < 0 H) &a > 0 H) .&a/2 > 0 H) a2 > 0: (O.1) (P.4) Zu (iv): Zunächst gilt: a > 0 H) a ¤ 0 H) a&1 6D 0. Die endgültige Behauptung wird in Form eines Widerspruchsbeweises nachgewiesen. Man nimmt an, die Behauptung sei falsch und leitet hieraus einen Widerspruch ab. Hier geht dies so: Angenommen a&1 < 0, so folgt nach (O.4) a&1 ( a < 0 ( a, also 1 < 0. Dies widerspricht (iii). Somit ist die Annahme nicht haltbar; es muss a&1 > 0 sein. Zu (v): (iv)
a < b; ab > 0 H) a < b;
(O.4) 1 1 1 1 1 > 0 H) a ( 0 durch, so folgt die Behauptung. Im Falle a C b D 0 ist die Behauptung von vorn herein klar nach (i) und (ii). " I. Folgerung. Es gelten die modifizierten Dreiecksungleichungen ˇ ˇ ˇ ˇ ja C bj % ˇjaj & jbjˇ; ja & bj % ˇjaj & jbjˇ: Beweis. Die erste Ungleichung ergibt sich aus jaj D j.a C b/ C .&b/j . ja C bj C j & bj D ja C bj C jbj: Hieraus folgt jaj & jbj . ja C bj. Vertauschung von a und b liefert jbj & jaj . ja C bj, und aus beidem zusammen folgt die Behauptung. Die zweite Ungleichung folgt aus der ersten, indem man b durch &b ersetzt und beachtet, dass jbj D j & bj gilt. " Die obigen Schlüsse machen deutlich, dass man mit Ungleichungen in mancher Hinsicht umgehen kann wie mit Gleichungen. Man kann z.B. auf beiden Seiten das Gleiche addieren oder, als Spezialfall hiervon, einen Term mit geändertem Vorzeichen auf die andere Seite schaffen. Natürlich muss man eine gewisse Vorsicht walten lassen, d.h. die aufgestellten Regeln beachten. Z.B. dreht sich der „Richtungssinn“ einer Ungleichung um, wenn man mit etwas Negativem durchmultipliziert, entsprechend E(ii). Enthält eine Ungleichung eine Unbekannte, so kann man mit diesen Regeln manchmal die Unbekannte auf einer Seite isolieren. Falls die Umformungen in Äquivalenzschritten erfolgen, hat man dann die Lösungsmenge bestimmt, genau wie bei Gleichungen. Mehr von theoretischem Interesse ist die folgende Aussage: J. Satz (Nichtexistenz einer kleinsten positiven Zahl). In einem angeordneten Körper K gibt es kein a > 0 mit: a . b für alle b > 0. Beweis. Angenommen, ein solches a > 0 würde existieren. Dann ist auch a=2 > 0, also a . a=2, also a . 0, Widerspruch. " Wichtige Teilmengen eines angeordneten Körpers sind die Intervalle:
11
Abschnitt 1.1 Die reellen Zahlen
K. Definition. Sei a < b. Dann nennt man:
(5)
Œa; b/ /a; bŒ Œa; bŒ /a; b/
´ ´ ´ ´
fx fx fx fx
2K 2K 2K 2K
ja.x ja s (z.B. s1 ´ s C1), so ist auch s1 obere Schranke von M . Eine obere Schranke ist also, falls existent, niemals eindeutig bestimmt.
12
Kapitel 1 Die Zahlmengen der Analysis
M. Beispiele. (i) Jedes Intervall der Typen Œa; b/ ; /a; bŒ ; Œa; bŒ ; /a; b/ ist nach oben beschränkt; eine obere Schranke ist b, aber z.B. auch b C 1. (ii) K selbst ist nicht nach oben beschränkt: Angenommen, es wäre x . s für alle x 2 K. Dann wäre auch s C 1 . s, also 1 . 0, Widerspruch! (iii) Die leere Teilmenge ¿ von K gilt als nach oben beschränkt; denn sie erfüllt formal die Definition L mit beliebigem s 2 K (d.h. jedes Element von K ist eine obere Schranke für ¿). N. Definition. Sei M , K nach oben beschränkt. Eine obere Schranke s0 von M heißt kleinste obere Schranke oder Supremum von M , wenn für jede obere Schranke s von M gilt: s0 . s. Man schreibt dann s0 µ sup M . O. Bemerkung. Ein solches Supremum braucht nicht zu existieren (vgl. C[2.3] und p die Ausführungen zu 2 am Ende von 2.2), aber wenn es existiert, ist es eindeutig bestimmt: Ist neben s0 sei auch s00 Supremum von M , so gilt: s0 . s00 (da s00 obere Schranke), aber auch s00 . s0 (da s0 obere Schranke). Es folgt s0 D s00 . P. Beispiele. (i) Hat M eine obere Schranke s, die in M enthalten ist, so ist s zugleich das Supremum von M : Ist nämlich s1 irgendeine obere Schranke von M , so gilt x . s1 für alle x 2 M , also speziell für x ´ s: s . s1 . Somit ist s die kleinste obere Schranke von M . (ii)
Für die folgenden Intervalltypen ergibt sich damit sofort sup Œa; b/ D b;
sup /a; b/ D b;
wobei im zweiten Fall a < b sein soll (damit das Intervall nicht leer ist). (iii) Bei einem offenen Intervall gilt sup /a; bŒ D b; falls a < b: Das ist nicht ganz so einfach zu sehen. Man argumentiert so: Jedenfalls ist b eine obere Schranke von M ´ /a; bŒ. Um weiter zu kommen, benutzen wir die folgende allgemeine Aussage: (8)
a < b () a
c D a > .b > c/ gilt und es genau ein Neutralelement e 2 G gibt sowie zu jedem a 2 G genau ein Inverses a$ (mit den jeweiligen Eigenschaften a > e D e > a D a und a > a$ D a$ > a D e). Die Gruppe .G; >/ heißt kommutativ oder Abelsch, wenn außerdem die Regel a > b D b > a erfüllt ist. Man drücke die Axiome für einen Körper K durch Gruppeneigenschaften von .K; C/ und .K n f0g; (/ und die Distributivgesetze aus.
1.2 Natürliche Zahlen und vollständige Induktion Hier soll gezeigt werden, wie man im Körper der reellen Zahlen besonders einfache Zahltypen aussondern kann. Vor allem geht es dabei um die natürlichen Zahlen, die historisch gesehen, am Anfang allen Rechnens standen. Ganz leicht kann man dann die nahen Verwandten der natürlichen Zahlen einführen: die ganzen und die rationalen Zahlen. Die natürlichen Zahlen lassen sich innerhalb unseres angeordneten vollständigen Körpers R durch das so genannte Induktionsprinzip kennzeichnen. Das wollen wir genau beschreiben. Was aber die vielen einfachen Eigenschaften der natürlichen Zahlen angeht, so ist deren Herleitung aus dem Induktionsprinzip zwar möglich, aber insgesamt doch recht mühselig. Wir machen deshalb ausnahmsweise einige Abstriche von der strengen Deduktion, die uns zu sehr von der Analysis wegführen würde. So begnügen wir uns in einigen Fällen mit einer präzisen Formulierung des Ergebnisses. Schließlich wollen wir uns mehr um die typisch analytischen Aspekte kümmern, die nicht so offen zu Tage liegen.
16
Kapitel 1 Die Zahlmengen der Analysis
A. Definition. Eine Teilmenge M , R heißt induktiv, wenn gilt: (Ind.1) 1 2 M . (Ind.2) Ist x 2 M , so ist auch x C 1 2 M . B. Beispiele. (i)
R selbst ist induktiv.
(ii) Die Menge fx 2 R j x % 1g ist induktiv. Offenbar sind wir auf dem richtigen Weg, wenn wir die „kleinste“ induktive Menge finden können. Das machen wir mit der Durchschnittsbildung induktiver Mengen und stellen zunächst fest: C. Satz. Der Durchschnitt einer beliebigen Familie F induktiver Teilmengen von R ist induktiv. T Beweis. Sei D ´ M ein solcher Durchschnitt. Zu zeigen ist, dass D die M 2F Eigenschaften (Ind.1), (Ind.2) erfüllt, wenn jede zur Familie F gehörende Menge dies tut. Das ist aber leicht einzusehen: Zu (Ind.1): Da die 1 in jeder Menge M 2 F enthalten ist, so ist sie auch in D enthalten. Zu (Ind.2): Ist x 2 D, so ist x 2 M für alle M 2 F , also x C 1 2 M für alle M 2 F , also x C 1 2 D. " D. Definition. Die Menge N der natürlichen Zahlen ist definiert als der Durchschnitt aller induktiven Teilmengen von R: N´
\
fM , R j M ist induktivg:
E. Bemerkungen. (i)
Da die 1 in jeder induktiven Menge liegt, ist 1 2 N. Weiter gilt N , fx 2 R j x % 1g. Ist also n 2 N gegeben, so folgt daraus n % 1. Mit anderen Worten: 1 ist die kleinste natürliche Zahl.
(ii) Es gibt keine größte natürliche Zahl. Wäre n0 eine solche, so gälte n0 C 1 . n0 , Widerspruch!
Abschnitt 1.2 Natürliche Zahlen und vollständige Induktion
17
Da N die „kleinste“ induktive Teilmenge von R ist, versteht sich die folgende Aussage fast von selbst. Wir formulieren sie trotzdem explizit, da sie die Grundlage für das Beweisverfahren der so genannten vollständigen Induktion darstellt: F. Satz (Induktionssatz). Gegeben sei eine Menge W natürlicher Zahlen, d.h. es sei W , N. Besitzt W die Eigenschaften: (i)
12W,
(ii) aus w 2 W folgt w C 1 2 W , so gilt W D N. Hierin nennt man die Eigenschaft (i) den Induktionsanfang oder die Induktionsverankerung und die Eigenschaft (ii) den Induktionsschluss. Die Voraussetzung w 2 W in (ii) heißt die Induktionsvoraussetzung. Beweis von F. Nach (i) und (ii) ist die Menge W induktiv, also N , W . Da nach Voraussetzung W , N gilt, folgt W D N. " Der Induktionssatz ist die Grundlage für die Beweismethode der vollständigen Induktion. Diese dient dazu, Aussagen zu beweisen, die von einer natürlichen Zahl abhängen. G. Folgerung (Methode der vollständigen Induktion). Zu jeder natürlichen Zahl n 2 N sei eine Aussage A.n/ vorgelegt, die in Abhängigkeit von n zunächst wahr oder falsch sein kann. Sie ist für alle n 2 N richtig, wenn die folgenden zwei Forderungen erfüllt sind: (a)
Induktionsanfang: A.1/ ist richtig.
(b)
Induktionsschluss: Für jedes n 2 N gilt: Aus A.n/ folgt A.n C 1/.
In (b) wird A.n/ wiederum als Induktionsvoraussetzung bezeichnet. Allgemein sagt man statt „Induktionsschluss“ auch Induktionsschritt. Beweis von G. Man betrachtet die Erfüllungsmenge W ´ fn 2 N j A.n/ ist richtigg. Diese ist wegen (a), (b) induktiv, also folgt W D N nach Satz F. Somit ist A.n/ für alle n 2 N richtig. " Für das Umgehen mit natürlichen Zahlen ist es enorm wichtig, dass man der begrifflichen Definition D eine konstruktive Erzeugung von N gegenüberstellen kann. Dazu beachten wir, dass zu jedem n 2 N der Nachfolger n C 1, der wiederum in N liegt, gebildet werden kann. Tut man dies, startend mit der 1, immer wieder, so erhält man
18
Kapitel 1 Die Zahlmengen der Analysis
schrittweise neue Elemente von N, die nichts anderes sind, als das was man üblicherweise mit 2; 3; 4; : : : bezeichnet: 1 1C1µ2 .1 C 1/ C 1 µ 1 C 1 C 1 µ 3 .1 C 1 C 1/ C 1 µ 1 C 1 C 1 C 1 µ 4 :: : Die Menge der so erzeugten natürlichen Zahlen ist offensichtlich induktiv, also gleich N: (1) und es gilt
N D f1; 1 C 1; 1 C 1 C 1; 1 C 1 C 1 C 1 : : :g D f1; 2; 3; 4 : : :g; 1 < 2 < 3 < 4 < ((( ;
insbesondere sind diese Elemente paarweise verschieden. Wie man diesen Einsersummen n D 1 C 1 C ( ( ( C 1 die üblichen Namen, z.B. im Dezimalsystem, geben kann, setzen wir im Augenblick als bekannt voraus (vgl. jedoch F[2.8]). Außerdem akzeptieren wir, dass zur Darstellung eines n 2 N in Gestalt einer solchen Einsersumme eine ganz bestimmte Anzahl von Einsen zu verwenden ist, nämlich n. Das ist letzten Endes eine Definition des Anzahlbegriffs. Entsprechend kann der Anzahlbegriff für „endliche“ Mengen gefasst werden. Dazu bilden wir für jedes p 2 N die folgende Teilmenge von N, die aus einem Anfangsstück der Liste in (1) besteht: N.p/ ´ f1; 2; : : : ; pg: Eine solche Menge wird als Abschnitt in N bezeichnet. H. Definition. Eine nichtleere Menge X heißt endlich, wenn es ein p 2 N und eine bijektive Abbildung h W N.p/ ! X gibt. Die natürliche Zahl p heißt die Anzahl von X , geschrieben: jM j ´ p. Auch die leere Menge ¿ gilt als endlich mit der Anzahl j¿j ´ 0. Ist jM j D p, so sagt man dafür auch, M sei eine Menge mit p Elementen. Eine Menge heißt unendlich, wenn sie nicht endlich ist. Ist X eine endliche Menge ¤ ¿, so wird eine bijektive Abbildung h W N.p/ ! X eine Durchnummerierung von X genannt. Zur Rechtfertigung der obigen Begriffe ist Folgendes zu sagen: Zunächst einmal sind Summen von mehr als zwei Körperelementen erst dann definiert, wenn eine bestimmte Beklammerung, die jeweils nur zwei Elemente erfasst, vorgegeben ist. Allerdings
Abschnitt 1.2 Natürliche Zahlen und vollständige Induktion
19
kann man (wiederum mit dem Induktionsprinzip) nachweisen, dass der Wert bei gleichen Summanden unabhängig von der Art und Weise der Beklammerung ist. Bei den Einsersummen gilt z.B. nicht nur wie oben .1C1C1/C1 D ..1C1/C1/C1, sondern auch ..1C1/C1/C1 D .1C1/C.1C1/ oder ..1C1/C1/C1 D .1C.1C.1C1///, usw. Diese Unabhängigkeit hat zur Folge, dass man auf die Angabe einer Beklammerung überhaupt verzichten kann. (Analoges ist für mehrfache Produkte richtig.) Im Hinblick auf die Anzahldefinition in H verbleibt der Nachweis, dass die Zahl p eindeutig bestimmt ist. Es könnte ja zunächst passieren, dass zwei Bijektionen h W N.p/ ! X und g W N.q/ ! X mit p ¤ q existieren. Dann gäbe es auch eine Bijektion von N.p/ auf N.q/, nämlich g &1 ı h. Das ist aber in der Tat unmöglich (außer für p D q). Tatsächlich ist Folgendes anschaulich klar und auch streng deduktiv beweisbar: I. Satz. Ist p < q, so gibt es keine surjektive Abbildung von N.p/ auf N.q/ und auch keine injektive Abbildung von N.q/ in N.p/. " Aufgrund von Definition H überträgt sich dies sofort auf endliche Mengen. D.h. Satz I bleibt genauso gültig, wenn N.p/ durch eine beliebige Menge X mit p Elementen und N.q/ durch eine beliebige Menge Y mit q Elementen ersetzt wird. Insbesondere gibt es unter der Voraussetzung p < q keine injektive Abbildung von Y in X, d.h. bei jeder Abbildung f W Y ! X existieren j ¤ k in Y mit f .j / D f .k/. Anschaulich ausgedrückt: Legt man q Gegenstände in weniger als q Schubfächer, so liegen in wenigstens einem Schubfach mindestens zwei Gegenstände. Das ist das so genannte Schubfachprinzip. Auch der folgende Satz leuchtet anschaulich ein, soll aber ebenfalls nicht formal bewiesen werden. J. Satz. Ist die Menge X endlich und A , X, so ist auch A endlich und jAj . jXj. Hierbei gilt jAj D jXj genau dann, wenn A D X. " Eine weitere Konsequenz des Induktionsprinzips ist der folgende Satz, den wir formal beweisen werden: K. Satz (Wohlordnungssatz in N). In jeder nichtleeren Teilmenge M von N existiert ein kleinstes Element. Beweis. In Bemerkung E(i) haben wir schon gesehen, dass 1 die kleinste natürliche Zahl ist. Enthält also M die 1, so ist sie auch das kleinste Element von M . Gilt 1 … M , so sei eine Hilfsmenge H definiert durch H ´ fp 2 N j N.p/ \ M D ¿g. Dann ist 1 2 H . Wäre nun stets der Schluss richtig, dass aus p 2 H folgt p C 1 2 H , so folgte nach dem Induktionssatz F: H D N, also M D ¿ im Widerspruch zur Voraussetzung. Folglich gibt es ein p 2 H mit p C 1 … H , also p C 1 2 M . Beides zusammen besagt, dass p C 1 kleinstes Element von M ist. "
20
Kapitel 1 Die Zahlmengen der Analysis
Weiter bietet das Induktionsprinzip die Möglichkeit zur rekursiven Definition von Objekten, die von einer natürlichen Zahl abhängen. Das beruht auf Folgendem: L. Satz (Rekursionssatz). Gegeben sei eine Menge X und ein Element a 2 X. Ferner sei zu jeder natürlichen Zahl n 2 N eine Abbildung gn W X ! X vorgegeben. Dann existiert genau eine Abbildung f W N ! X mit ( f .1/ D a (2) f .n C 1/ D gn .f .n// für alle n 2 N: Diese Formeln werden als ein Rekursionsschema bezeichnet, wobei die erste Startbedingung und die zweite Rekursionsschritt genannt wird. Statt von „Rekursion“ " spricht man auch von Iteration. Trotz der etwas komplizierten Formulierung ist das wieder anschaulich klar: Schaut man sich die ersten Fälle der zweiten Forderung in (2) an: f .2/ D g1 .f .1//;
f .3/ D g2 .f .2//; : : : ;
so sieht man, dass sukzessive aus f .1/ D a unter Verwendung von g1 der Wert f .2/ zu berechnen ist, dann aus f .2/ unter Verwendung von g2 der Wert f .3/, usw. Insgesamt gilt für allgemeines n 2 N f .n C 1/ D gn .f .n// D gn .gn&1 .f .n & 1/// D ( ( ( D gn .( ( ( .g2 .g1 .a/// ( ( ( /; was letzten Endes auf eine explizite (allerdings stets sich ausdehnende) Vorschrift zur Berechnung von f .n C 1/ aus a hinausläuft. Den formalen Beweis auf der Basis des Induktionsprinzips wollen wir auch in diesem Fall übergehen. Meistens sind alle Abbildungen gn gleich einer einzigen Abbildung g W X ! X. Das Rekursionsschema vereinfacht sich dann zu ( f .1/ D a (3) f .n C 1/ D g.f .n// für alle n 2 N: Hierbei berechnen sich die Werte von f durch eine immer gleiche Vorschrift aus den jeweils vorhergehenden. Den anschaulichen Gehalt kann man auch so ausdrücken: Der Rekursionsschritt sagt, wie es weiter geht, das Rekursionsprinzip garantiert, dass es weitergeht. Schließlich benennen wir einige elementare Tatsachen über natürlichen Zahlen, die aus dem Bisherigen oder aus dem Induktionsprinzip gefolgert werden können.
Abschnitt 1.2 Natürliche Zahlen und vollständige Induktion
21
M. Satz. (i)
m; n 2 N H) m C n; m ( n 2 N.
(ii) m; n 2 N; m > n H) m & n 2 N.
"
Diese Regeln bedeuten die Abgeschlossenheit von N gegenüber der Addition und Multiplikation und (unter der genannten Voraussetzung) auch gegenüber der Subtraktion. Der Unterschied zu den bisherigen Fällen besteht darin, dass die Aussagen von zwei natürlichen Zahlen abhängen. Will man solche Aussagen mittels des Induktionsprinzips beweisen, so hält man eine der Zahlen fest und wendet die vollständige Induktion bezüglich der anderen an. Aus den natürlichen Zahlen, die ja spezielle Elemente von R sind, kann man nun leicht durch Anwendung der Körperoperationen neue Zahltypen gewinnen: N. Definition. Es sei (i)
N0 ´ N [ f0g.
(ii)
Z ´ fx 2 R j x 2 N0 oder &x 2 N0 g, die Menge der ganzen Zahlen. n ˇ mo , die Menge der rationalen (iii) Q ´ x 2 R ˇ es gibt m 2 Z; n 2 N mit x D n Zahlen. (iv)
R n Q die Menge der irrationalen Zahlen.
Eine ganze Zahl ist also entweder eine natürliche Zahl oder die 0 oder das Negative einer natürlichen Zahl. Eine rationale Zahl ist eine ganze Zahl oder ein Quotient einer ganzen Zahl und einer natürlichen Zahl. In aufzählender Schreibweise hat man N D f1; 2; : : :g N0 D f0; 1; 2; : : :g Z D f0; 1; &1; 2; &2; : : :g D f: : : ; &2; &1; 0; 1; 2; : : :g; wobei die letzte Notation nicht ganz dem vorgeschriebenen Muster entspricht (dafür aber sehr anschaulich ist). Wir werden bald sehen, dass man auch die rationalen Zahlen „aufzählen“ kann. Ergänzend zum Symbol N.p/ seien allgemeiner für p; q 2 Z die folgenden Bezeichnungen eingeführt: Z.p; q/ ´ fm 2 Z j p . m . qg (4)
Z.p; 1/ ´ fm 2 Z j p . mg Z.&1; q/ ´ fm 2 Z j m . qg:
22
Kapitel 1 Die Zahlmengen der Analysis
Speziell ist N.p/ D Z.1; p/, falls p 2 N. Im Fall p . q ist Z.p; q/ die endliche Menge der ganzen Zahlen von p bis q (einschließlich) mit der Anzahl jZ.p; q/j D q & p C 1. Im Fall p > q ist Z.p; q/ leer. Das Zeichen „1“ (gesprochen: unendlich) hat hier keine tiefere Bedeutung. Es dient lediglich zur Abkürzung der Schreibweise, die allerdings recht suggestiv ist. Im Augenblick ist es noch offen, ob der Körper R Zahlen enthält, die nicht als Quotient ganzer Zahlen darstellbar sind. Die Existenz solcher irrationaler Zahlen hängt stark an der Vollständigkeit von R. Tatsächlich gibt es sogar „sehr viel mehr“ irrationale reelle Zahlen als rationale. Q ist nämlich „abzählbar“, und R selbst ist „überabzählbar“. Darauf kommen wir in J[1.4] und C[2.3] zurück. Konkrete irrationale Zahlen sind p ebenfalls leicht mittels der Vollständigkeit zu konstruieren, z.B. 2, wie wir am Ende des Abschnitts 2.2 sehen werden. Die Eigenschaften in Satz M übertragen sich von N auf Z, wobei man im dritten Teil auf die Voraussetzung m > n verzichten kann. O. Satz. Die Menge Q der rationalen Zahlen ist ein angeordneter Körper. Beweis. Q besteht aus allen Brüchen m=n ganzer Zahlen mit n ¤ 0. Summe und Produkt zweier solcher ist wieder von dieser Form, wie man mit den Regeln der Bruchrechnung sieht. Die Körperaxiome aus A[1.1] sind damit für K D Q leicht nachprüfbar, ebenso die Anordnungsaxiome aus D[1.1]. " Für die Standardmengen R, Q, Z, N seien noch folgende Schreibweisen eingeführt: Die oberen Marken „C“ bzw. „&“ bezeichnen entsprechende Einschränkungen aufs Positive bzw. Negative, die untere Marke „0“ die Hinzunahme der Null, also z.B. RC ´ fx 2 R j x > 0g;
RC 0 ´ fx 2 R j x % 0g;
Z& 0 ´ fn 2 Z j n . 0g; etc:
Zum Abschluss sei noch angemerkt, dass das Wort „vollständige Induktion“ nichts zu tun hat mit der „Vollständigkeit“ der reellen Zahlen, wie in Q[1.1] definiert. Die Namengebung ist historisch bedingt. Aufgaben und Anmerkungen 1. Man bestimme alle x 2 R, für die gilt: a)
x2 & x < 6
b) jx & 2j C jx C 1j < 4. Hinweis: Bestimmen heißt hier: Man stelle die betreffende Punktmenge als Vereinigung von möglichst wenigen Intervallen dar.
Abschnitt 1.3 Anwendungen des Induktionsprinzips
23
Lösungshinweis: Bei a) kann man quadratisch ergänzen, d.h. einen Ausdruck umformen gemäß 3 p p p2 p2 p -2 p2 x 2 Cpx Cq D x 2 C2( x Cq D x 2 C2( x C & Cq D x C Cq & : 2 2 4 4 2 4
1.3 Anwendungen des Induktionsprinzips Nach den grundsätzlichen Überlegungen zur Induktion wollen wir nun eine Reihe von konkreten Anwendungen besprechen. Es besteht also reichlich Gelegenheit, dieses Prinzip in der Beweispraxis kennen zu lernen. Die einzelnen Themen werden in Form von Beispielen oder Sätzen formuliert. Selbstverständlich gibt es auch Aussagen über natürliche Zahlen, die ohne vollständige Induktion beweisbar sind. Ein simples Beispiel ist die Gleichung .n C 1/.n & 1/ D n2 &1 für n 2 N. Ihre Richtigkeit ist von vornherein klar, da diese Umformung für alle reellen Zahlen gültig ist; vgl. (2)[1.1]. Bei einigen (weniger trivialen) Gelegenheiten gehen wir auf solche Alternativen ein. Ganz allgemein können für ein und dieselbe Tatsache durchaus verschiedene gültige Beweise existieren. Insofern ist in der Mathematik keineswegs „alles eindeutig“. A. Beispiele. (i) Fakultät: Für n 2 N ist die Fakultät in expliziter Weise definiert als Produkt aller natürlichen Zahlen von 1 bis n. nŠ ´ 1 ( 2 ( ( ( n: Die induktive Definition lautet (1)
1Š ´ 1;
.n C 1/Š ´ nŠ ( .n C 1/:
Üblicherweise definiert man zusätzlich 0Š ´ 1: Man spricht nŠ als n-Fakultät. (ii) Potenzen: Für n 2 N und a 2 R ist die n-te Potenz von a explizit definiert als n-faches Produkt von a mit sich selbst; an ´ a ( ( ( a
(n Faktoren):
24
Kapitel 1 Die Zahlmengen der Analysis
Die induktive Definition lautet a1 ´ a;
(2)
anC1 ´ an ( a:
An die Stelle der natürlichen Zahl n kann auch eine ganze Zahl treten, indem man festsetzt: a0 ´ 1;
00 ´ 1;
a&n ´ .a&1 /n D .an /&1
für n 2 N und a ¤ 0:
Man spricht am als: a hoch m und nennt den Ausdruck am eine Potenz mit der Basis a und dem Exponenten m. (iii) Summen- und Produktzeichen: Für n 2 N und a1 ; a2 ; : : : ; an 2 R sind explizit definiert: (3)
n X
n Y
aj ´ a1 C a2 C ( ( ( C an ;
aj ´ a1 ( a2 ( ( ( an :
j D1
j D1
Die Symbole mit den großen griechischen Buchstaben werden gesprochen als: „Summe (bzw. Produkt) aj von 1 bis n“ (wobei aj einfach als „aj “ gesprochen wird). Die induktive Definition lautet z.B. im Fall der Summe: 1 X
aj ´ a1 ;
nC1 X
aj ´
.X n
j D1
j D1
/ aj
C anC1 :
j D1
Als Rechenanweisung kann man (3) so aussprechen (im Fall der Summe): Ersetze in dem Ausdruck nach dem Summenzeichen den Laufindex j der Reihe nach durch 1; 2; : : : ; n und addiere diese Auswertungen alle auf. Die Grenzen für den Laufbereich sind gerade die, die unten bzw. oben am Summenzeichen angegeben sind. Genauso kann man Summen- und Produktzeichen mit anderen ganzzahligen Laufbereichen definieren, z.B. n X
aj ´ a&2 C a&1 C a0 C a1 C ( ( ( C an ;
j D&2
wobei natürlich die Summanden für alle Werte des Laufindexes definiert sein müssen. Ist der Laufbereich leer, d.h. die unten angeschriebene Grenze größer als die oben angeschriebene, so wird ein solches Symbol immer als 0 gerechnet (beim Produkt als 1), z.B. 3 3 Y X aj ´ 1: aj ´ 0; j D5
j D5
Beim Gebrauch des Summen- und Produktzeichens ist zu beachten, dass der Laufindex (hier j ) frei gewählt werden kann, soweit er im betreffenden Zusammenhang
Abschnitt 1.3 Anwendungen des Induktionsprinzips
25
nicht schon verbraucht ist. Es ist also z.B. n X
aj D
j D1
n X
ak :
kD1
Schließlich kann man die Summanden oder Faktoren in irgendeiner anderen Reihenfolge aufaddieren bzw. aufmultiplizieren. Das bedeutet, dass man am Laufindex eine so genannte Indextransformation vornehmen kann. Z.B. gilt (4)
n X
aj D
j D1
n&1 X
an&k :
kD0
Denn ausgeschrieben besagt dies a1 C a2 C ( ( ( C an D an C an&1 C ( ( ( C a1 : Die zugehörige Transformation der Laufindizes ist hier beschrieben durch j D n & k (oder äquivalent k D n & j ). Diese Formeln stellen eine bijektive Beziehung zwischen dem „j -Laufbereich“ von 1 bis n und dem „k-Laufbereich“ von 0 bis n & 1 her (wenn auch unter Umkehrung der Reihenfolge). Man spricht kurz von der Indextransformation j D n & k. Formal kommt man in (4) von links nach rechts durch die Substitution bei den Summanden j Dn&k und durch die Umrechnung der Grenzen: j D 1 () k D n & 1 j D n () k D 0; wobei natürlich 0 als neue untere und n & 1 als neue obere Grenze beim Summenzeichen zu nennen sind. Entsprechend verfährt man allgemein, wenn der eine Laufbereich bijektiv auf den anderen abgebildet ist. Z.B. gilt mit der Indextransformation j D k & 9 n X j D1
aj D
9Cn X
ak&9 :
kD10
Ist J eine endliche Menge mit p > 0 Elementen und ist für jedes j 2 J ein aj 2 R gegeben, so definiert man p X X ah.i/ ; aj ´ j 2J
iD1
26
Kapitel 1 Die Zahlmengen der Analysis
wobei h W N.p/ ! J irgendeine Durchnummerierung von J ist. Welche ist egal (aufgrund des Assoziativ- und Kommutativgesetzes der Addition). Wird die Indexmenge P J durch eine einfachePEigenschaft beschrieben, so schreibt man anstelle von j 2J das Summenzeichen und hängt an dieses die betreffende Eigenschaft an. So gilt z.B. im Falle J ´ f1; 2; : : : ; pg: X X j2 µ j 2: 1#j #p
j 2J
B. Satz (Bernoullische Ungleichung). Für n 2 N und a 2 R mit a > &1 gilt: .1 C a/n % 1 C na: Beweis durch vollständige Induktion. Induktionsanfang für n D 1: Die Behauptung ist im Fall n D 1 richtig (mit Gleichheit); denn sie lautet einfach .1 C a/1 D 1 C 1 ( a. Induktionsschluss von n auf n C 1: Es ist zu zeigen: Aus .1 C a/n % 1 C na folgt .1Ca/nC1 % 1C.nC1/a. Dazu multipliziert man die Voraussetzung mit der positiven Zahl 1 C a und erhält .1 C a/nC1 % .1 C na/.1 C a/ D 1 C .n C 1/a C na2 % 1 C .n C 1/a; da na2 % 0, also wirklich die Behauptung.
"
C. Satz und Definition (binomische Formel, Binomialkoeffizienten). Für n 2 N und a; b 2 R gilt: (5)
0 ! n X n n&k k a b : .a C b/n D k kD0
Darin sind die so genannten Binomialkoeffizienten definiert: 0 ! n n.n & 1/ ( ( ( .n & k C 1/ ´ k kŠ
(n) k
– gelesen „n über k“ – so
für 1 . k . n;
0 ! n ´ 1: 0
Wenn bei dem Zähler des letzten Bruchs der letzte Faktor als .n&.k &1// geschrieben wird, kann man sich die Definition besser merken: Zähler und Nenner haben gleichviele Faktoren.
27
Abschnitt 1.3 Anwendungen des Induktionsprinzips
Beweis von C. Wir beweisen zunächst als Zwischenbehauptung auf direkte Weise: ! ! 0 ! 0 nC1 n n D C k k k&1
0 (6)
für 1 . k . n:
Zwischenbeweis: Für k D 1 besagt die Behauptung: 1Cn D nC1, ist also in Ordnung. Für k > 1 startet man mit der linken Seite und formt solange um, bis man zur rechten Seite gelangt: ! 0 ! n.n & 1/ ( ( ( .n & k C 2/ n n n.n & 1/ ( ( ( .n & k C 1/ D C C .k & 1/Š kŠ k k&1
0
n.n & 1/ ( ( ( .n & k C 2/ n.n & 1/ ( ( ( .n & k C 2/ (kC ( .n & k C 1/ kŠ kŠ n.n & 1/ ( ( ( .n & k C 2/ ( .n C 1/ D kŠ 0 ! nC1 D : k D
Damit ist die Zwischenbehauptung (6) bewiesen. Beweis von (5) durch vollständige Induktion: Induktionsanfang für n D 1: Die Behauptung lautet für n D 1 0 ! 1 X 1 1&k k 1 a b : .a C b/ D k kD0
Da die rechte Seite laut Definition gleich 0 ! 0 ! 1 1 a(1C 1(b DaCb 0 1 ist, stimmt der Induktionsanfang. Induktionsschluss von n auf n C 1: Es ist zu zeigen: Aus 0 ! n X n n&k k n A.n/ .a C b/ D a b k kD0
28
Kapitel 1 Die Zahlmengen der Analysis
folgt .a C b/nC1 D
A.n C 1/
nC1 X kD0
! 0 n C 1 nC1&k k a b : k
Dazu multipliziert man A.n/ mit a C b und formt solange um, bis man A.n C 1/ erreicht: 0 ! n X n n&k k nC1 a b .a C b/ .a C b/ D k kD0 0 ! 0 ! n n X n n&kC1 k X n n&k kC1 a b C a b D k k kD0 kD0 0 ! 0 ! n&1 n X X n n n&k kC1 an&kC1 b k C a b C b nC1 D anC1 C k k kD1
kD0
Indextransformation k D j & 1 in der zweiten Summe: 0 ! 0 ! n n X n n&kC1 k X n nC1 Da C an&j C1 b j C b nC1 a b C j &1 k kD1
j D1
Umbenennung j D k: 0 ! 0 ! n n X X n n D anC1 C an&kC1 b k C an&kC1 b k C b nC1 k k&1 kD1 kD1 00 ! 0 !! n X n n C an&kC1 b k C b nC1 D anC1 C k k&1 kD1
(6) W
0 ! n X n C 1 D anC1 C an&kC1 b k C b nC1 k kD1 0 ! nC1 X nC1 anC1&k b k : D k kD0
An wichtigen Stationen dieser Rechnung ist der nächste durchzuführende Schritt mit angegeben. Der Induktionsschluss funktioniert also, und damit ist die binomische Formel bewiesen. " Bei diesem Vorgehen wird ein Phänomen sehr deutlich: Man muss die Behauptung schon kennen oder zumindest vermuten, um die vollständige Induktion ansetzen zu
29
Abschnitt 1.3 Anwendungen des Induktionsprinzips
können. Vermutungen hervorbringen kann man in vielen Fällen dadurch, dass man einige niedrige Fälle (z.B. für n D 1; n D 2; n D 3) explizit ausschreibt. Manchmal kann man daran schon sehen, wie die allgemeine Behauptung aussehen wird. Beim binomischen Satz würde diese „unvollständige Induktion“ entsprechend den folgenden Formeln (7) und (8) laufen. Die Definition der Binomialkoeffizienten in C kann durch Erweitern mit .n & k/Š so geschrieben werden: 0 ! nŠ n D kŠ.n & k/Š k
für 0 . k . n:
Daraus liest man unmittelbar die Spiegelungseigenschaft bei Vertauschen von k mit n & k ab: 0 ! 0 ! n n D : k n&k Die Zwischenbehauptung (6) entspricht der Erzeugungsweise der Binomialkoeffizienten am so genannten Pascalschen Dreieck: nD0W nD1W nD2W nD3W nD4W (((
(7)
1 1 1 1 2 1 1 3 3 1 1 4 6 4 1 ((((((((((((((((((
Dabei stehen an der Spitze und in den beiden Schenkeln lauter Einsen, und jede innere Zahl ergibt sich durch Addition der beiden darüber stehenden Zahlen, z.B. 4 D 3 C 1 oder 6 D 3 C 3, usw. (Der Fall n D 0 ist gleich miterfasst.) Dementsprechend lauten die Spezialfälle der binomischen Formel für n D 1 bis 4:
(8)
.a C b/1 .a C b/2 .a C b/3 .a C b/4
D aCb D a2 C 2ab C b 2 D a3 C 3a2 b C 3ab 2 C b 3 4 D a C 4a3 b C 6a2 b 2 C 4ab 3 C b 4 :
In den folgenden Fällen wollen wir zuerst einmal versuchen, die richtige Behauptung auf anderem Wege zu finden, und sie dann erst mittels vollständiger Induktion beweisen.
30
Kapitel 1 Die Zahlmengen der Analysis
Sei n 2 N und q 2 R. Kann man die Summe der fortlaufenden Potenzen 1 C q C q2 C ( ( ( C qn irgendwie geschlossen ausdrücken? „Geschlossen“ bedeutet dabei, dass eine Formel angegeben wird, die ohne Pünktchen auskommt, sich also mit wachsendem n nicht weiter ausdehnt. Manchmal reicht das „Spielen“ mit den Voraussetzungen, um ein Resultat zu finden: Wir nennen hier die gesuchte Summe einmal S S ´ 1 C q C q2 C ( ( ( C qn und multiplizieren mit q durch: qS ´ q C q 2 C q 3 C ( ( ( C q nC1 : Subtrahiert man die beiden Formeln, so fällt rechts das meiste heraus. Es verbleibt S & qS D 1 & q nC1 : Somit folgt durch Isolieren von S (falls q ¤ 1) die nachstehende Formel (9). D. Satz (geometrische Summenformel). Für n 2 N und q 2 R mit q ¤ 1 gilt: (9)
1 C q C q2 C ( ( ( C qn D
1 & q nC1 : 1&q
Die linke Seite in (9) wird als eine geometrische Summe mit dem Quotienten q bezeichnet. Obwohl dies bereits durch die Vorüberlegung „induktionsfrei“ bewiesen ist, folgt hier der Beweis von D mittels vollständiger Induktion. Induktionsanfang n D 1: Aufgrund der Formel 1 & q 2 D .1 & q/.1 C q/ gilt (9) für n D 1. Induktionsschluss von n auf n C 1: Man addiert auf beiden Seiten der Induktionsvoraussetzung (9) die Potenz q nC1 und erhält so 1 & q nC1 1 & q nC1 C .1 & q/q nC1 1 & q nC2 C q nC1 D D : 1&q 1&q 1&q Das ist die Behauptung für n C 1 anstelle n. Sei wieder n 2 N. Kann man die Summe der ersten n natürlichen Zahlen 1 C 2 C 3 C ((( C n
"
31
Abschnitt 1.3 Anwendungen des Induktionsprinzips
irgendwie „geschlossen“ ausdrücken? Wiederum durch „Spielen“ kann man auf das Ergebnis kommen, wie es Gauß in der Grundschule getan haben soll: Man nennt die Summe S, schreibt sie zweimal auf, beim zweiten Mal in umgekehrter Reihenfolge S ´ 1 C 2 C 3 C ( ( ( C .n & 2/ C .n & 1/ C n S D n C .n & 1/ C .n & 2/ C ( ( ( C 3 C 2 C 1 und addiert gliedweise: 2S D .1 C n/ C .1 C n/ C ( ( ( C .1 C n/: Die letzt Summe hat n gleiche Summanden n C 1, ist also gleich n ( .n C 1/. Damit folgt für S der nachstehende Ausdruck (10). E. Satz (arithmetische Summenformel). Für n 2 N gilt: (10)
1 C 2 C 3 C ((( C n D
1 n.n C 1/: 2
Die linke Seite in (10) wird als eine arithmetische Summe bezeichnet, da zwei aufeinander folgende Summanden eine feste Differenz 1 haben. Beweis von E mittels vollständiger Induktion. Induktionsanfang n D 1: Hier geht die Behauptung über in 1 D sichtlich stimmt.
1 2
( 1 ( 2, was offen-
Induktionsschluss von n auf n C 1: Man addiert auf beiden Seiten der Induktionsvoraussetzung (10) den Summanden n C 1 und erhält so 1 C 2 C 3 C ( ( ( C n C .n C 1/ D
1 1 n.n C 1/ C .n C 1/ D .n C 1/.n C 2/: 2 2
Das ist die Behauptung für n C 1 anstelle n.
"
F. Bemerkung. An vielen Stellen werden in der Mathematik rechnerische Umformungen eingesetzt, um komplizierte Ausdrücke auf eine einfache Gestalt zu bringen. Beispiele sind die obigen Formeln (9) und (10) für geometrische und arithmetische Summen. Es gibt aber auch die umgekehrte Notwendigkeit, nämlich einfache Terme anders, eventuell komplizierter, zu schreiben, um daran gewisse Eigenschaften besser zu erkennen. So kann man etwa die Formel (9) von rechts nach links lesen und sehen, dass 1 & q nC1 den Faktor 1 & q „enthält“. Damit ist z.B. klar, dass 81000 & 1 durch 7 teilbar ist, was ansonsten nicht so leicht herauszufinden ist.
32
Kapitel 1 Die Zahlmengen der Analysis
Eine andere Situation dieser Art entsteht, wenn a1 ; a2 ; : : : ; an für n 2 N gegeben sind und die Differenz an & a1 aus den sukzessiven Differenzen aufgebaut wird: (11)
an & a1 D .a2 & a1 / C .a3 & a2 / C ( ( ( C .an & an&1 / D
n&1 X
.akC1 & ak /:
kD1
Das ist sicher richtig, da sich rechts alles heraushebt bis auf &a1 und an . Eine solcher Ausdruck wie auf der rechten Seite von (11) wird als Teleskopsumme bezeichnet. Diese Verwandlung einer einfachen Differenz in eine Teleskopsumme wird im weiteren Verlauf ab und zu gebraucht und sollte vom Leser in seine „Trick-Kiste“ aufgenommen werden. G. Definition. Besitzt eine Teilmenge M von R ein größtes Element, d.h. existiert ein K 2 M mit: K % x für alle x 2 M , so heißt K das Maximum von M , geschrieben K µ max M . Besitzt eine Teilmenge M von R ein kleinstes Element, d.h. existiert ein k 2 M mit: k . x für alle x 2 M , so heißt k das Minimum von M , geschrieben k µ min M . Wenn das zutrifft, so sagt man auch, das Maximum bzw. das Minimum von M existiert. Im Fall der Existenz sind natürlich Maximum bzw. Minimum eindeutig bestimmt. Oberbegriff für „Maximum“ und „Minimum“ ist Extremum. Bei den nichtleeren Intervallen haben wir bereits in P[1.1] gesehen, dass ein Maximum existieren kann (etwa bei Œa; b/ und /a; b// oder auch nicht (etwa bei Œa; bŒ und /a; bŒ). Entsprechendes gilt natürlich für das Minimum. Für endliche Mengen zeigen wir nun: H. Satz. Jede nichtleere endliche Menge M , R besitzt ein Maximum und ein Minimum. Genauer: Im Fall von ein oder zwei Elementen gilt: (12)
max fa; bg D
1 .a C b C ja & bj/; 2
min fa; bg D
1 .a C b & ja & bj/: 2
Für n 2 N mit n % 2 gelten die Rekursionsformeln: (13)
max fa1 ; : : : ; an ; anC1 g D max fmax fa1 ; : : : ; an g; anC1 g min fa1 ; : : : ; an ; anC1 g D min fmin fa1 ; : : : ; an g; anC1 g:
Beweis. Vollständige Induktion nach der Anzahl der Elemente n ´ jM j: Induktionsanfang: Für n D 1, d.h. für eine einelementige Menge M D fag, ist max fag D min fag D a. Die Formeln (12) enthalten dies im Fall a D b.
Abschnitt 1.3 Anwendungen des Induktionsprinzips
33
Für n D 2, d.h. für eine zweielementige Menge M D fa; bg, ist das Maximum natürlich das größere der beiden Elemente, das Minimum das kleinere. Äquivalent hiermit hat man die Darstellungen in (12). Ohne Beschränkung der Allgemeinheit sei nämlich a < b angenommen. Dann ist ja & bj D b & a, also geben die rechten Seiten in (12) gerade b bzw. a. Induktionsschluss: Die Formeln (13) sind offensichtlich richtig, und damit ist alles bewiesen. " Wie sehr oft bei rekursiven Bestimmungen eignen sich die Gleichungen (12), (13) hervorragend zur programmierten Bestimmung der Extrema endlich vieler Zahlen. „Ohne Beschränkung der Allgemeinheit“ Ein Wort zu dieser Wendung, die oben im Beweis gebraucht wurde: Damit schränkt man sich auf Unterfälle ein, was natürlich nur geht, wenn die anderen Fälle trivial einsichtig sind oder leicht aus den behandelten Unterfällen folgen. In der obigen Situation ist der Unterfall a < b behandelt. Der verbleibende Fall a > b (es war ja a ¤ b) beruht einfach darauf, dass beide Seiten der Gleichungen (12) symmetrisch in a; b sind, d.h. bei Vertauschung von a und b keine Änderung erleiden. Die Wendung „ohne Beschränkung der Allgemeinheit“ wird öfters in Beweisen im genannten Sinne gebraucht und kann durch o.B.d.A abgekürzt werden. Zwei Anwendungen in der Kombinatorik In der Kombinatorik untersucht man die Anzahlregeln für endliche Mengen, z.B. in der folgenden Situation: I. Satz. Sei p 2 N gegeben. Die Anzahl der bijektiven Abbildungen der p-elementigen Menge N.p/ D f1; 2; : : : ; pg auf eine beliebige p-elementige Menge Gp D fa1 ; a2 ; : : : ; ap g ist genau pŠ. Beweis. Vollständige Induktion nach p: Induktionsanfang für p D 1: Für p D 1 gibt es genau eine (automatisch bijektive) Abbildung f1g ! fa1 g. Induktionsschluss von p & 1 auf p für p % 2: Voraussetzung ist also, dass es genau .p & 1/Š bijektive Abbildungen von N.p & 1/ auf jede .p & 1/-elementige Menge gibt. Bei einer bijektive Abbildung f W N.p/ ! Gp existieren genau p Möglichkeiten für f .p/, nämlich a1 ; a2 ; : : : ; ap . Bei jeder dieser Möglichkeiten definiert die Einschränkung von f auf N.p & 1/ eine bijektive Abbildung von N.p & 1/ auf eine .p & 1/-elementige Teilmenge von Gp , wofür nach
34
Kapitel 1 Die Zahlmengen der Analysis
Induktionsvoraussetzung .p & 1/Š Möglichkeiten existieren. Also bestehen für f insgesamt p ( .p & 1/Š D pŠ Möglichkeiten. " Beim Induktionsschluss haben wir diesmal von p & 1 auf p geschlossen, allerdings für p % 2. Das ist natürlich genauso gut, wie von p auf p C 1 für p % 1 zu schließen. Der einzige Grund für diese (rein äußerliche) Abänderung ist, dass sich der Induktionsschluss dadurch etwas einfacher formulieren lässt. Es gibt noch weitere Modifikationen bei der Anwendung des Induktionsprinzips, auf die wir gleich zu sprechen kommen. Satz I gilt speziell für Gp ´ N.p/. Eine bijektive Abbildung ' W N.p/ ! N.p/ wird eine Permutation (der Ziffern von 1 bis p) genannt. Eine solche Permutation entspricht einer Umstellung der Elemente 1; 2; : : : ; p von N.p/ auf eine andere Reihenfolge ' .1/; ' .2/; : : : ; ' .p/ dieser Elemente. Es gibt also genau pŠ Permutationen der Ziffern von 1 bis p. Eine noch anschaulichere Deutung einer solchen Permutation ' erhält man in der Situation, dass p Kästen mit den Nummern 1; : : : ; p gegeben sind und p Gegenstände, ebenfalls durch die Zahlen 1; : : : ; p repräsentiert, in diese Kästen verteilt werden sollen (so dass in jeden Kasten genau ein Gegenstand kommt). Gelangt der Gegenstand p in den Kasten mit der Nummer ' .p/, so ist die Abbildung ' injektiv, da ein Gegenstand nicht in mehr als einen Kasten kommt, und sie ist surjektiv, da jeder Kasten einen Gegenstand erhält. Eine solche Realisierung einer Verteilung wird eine Belegung von 1; : : : ; p genannt. Insgesamt existieren also pŠ dieser Belegungen. J. Satz. Seien p 2 N und k 2 N0 mit 0 . k . p gegeben. Die Anzahl der k( ) elementigen Teilmengen von N.p/ D f1; : : : ; pg ist genau pk . Beweis. Dies überlegt man sehr kurz anhand der binomischen Formel 0 ! n X p p&k k p a b : .a C b/ D k kD0
Wenn man sich nämlich den Ausdruck .aCb/p einzeln distributiv ausgerechnet denkt, so hat man, um bei festem k alle Glieder mit ap&k b k zu sammeln, aus den p Faktoren .a C b/ ( ( ( .a C b/ jeweils p & k mal a und k mal b auszuwählen. Das geht genauso oft, wie es k-elementige Teilmengen von N.p/ gibt. " Eine Auswahl einer k-elementigen Teilmenge aus N.p/ ( ) wird eine Kombination von k Elementen aus p Elementen genannt. Es gibt also pk solcher Kombinationen. K. Beispiel. Die bekannteste Anwendung ist die Auswahl von sechs Ziffern aus den ersten 49 natürlichen Zahlen, wie sie beim deutschen Zahlenlotto „6 aus 49“ auftritt. ( ) Dafür gibt es 49 Möglichkeiten; das sind ausgerechnet 6 0 ! 49 49 ( 48 ( 47 ( 46 ( 45 ( 44 D D 49 ( 8 ( 47 ( 23 ( 3 ( 11 D 13:983:816 6 1(2(3(4(5(6
Abschnitt 1.3 Anwendungen des Induktionsprinzips
35
Möglichkeiten. Beachte: Der vorletzte Ausdruck entsteht durch nahe liegendes Kürzen. Die Gewinnchance ist also rund 1 zu 14 Millionen. Wenn also rund 14 Millionen Lottoscheine ausgefüllt werden, so ist dabei ungefähr ein Hauptgewinn zu erwarten. Aus der binomischen Formel folgt für a D b D 1: 0 ! 0 ! 0 ! 0 ! p p p p p : 2 D C C C ((( C p 0 1 2 L. Folgerung. Es gibt insgesamt 2p Teilmengen von N.p/ D f1; : : : ; pg (die leere Menge und N.p/ selbst mitgezählt.) " M. Bemerkung. Der Induktionssatz F[1.2] wird auch in verschiedenen anderen Varianten angewendet. Z.B. dürfen anstelle von N Mengen der Form N ´ Z.n1 ; 1/ D fn 2 Z j n1 . ng oder auch N ´ Z.n1 ; n2 / D fn 2 Z j n1 . n . n2 g treten, wobei n1 < n2 aus Z fest gegeben sind. Ist dann W , N , so sind Induktionsanfang und Induktionsschluss folgendermaßen abzuändern: Induktionsanfang: n1 2 W Induktionsschluss: w 2 W H) w C 1 2 W (falls w C 1 2 N ). Sind diese erfüllt, so kann man wieder auf W D N schließen. Auch kann der Induktionsschluss so ersetzt werden: Verdickter Induktionsschluss: Z.n1 ; w/ , W H) w C 1 2 W (falls w C 1 2 N ). Diese verdickte Variante ist manchmal von Vorteil, da man beim Induktionsschluss mehr an Voraussetzungen zur Verfügung hat. Man kann die verdickte Variante auf die vorhergehende zurückführen, indem man diese auf W 0 ´ fw 2 N j Z.n1 ; w/ , W g anwendet. Aufgaben und Anmerkungen 1. Manche Regeln, die zunächst für zwei oder drei Operanden gelten, lassen sich mit vollständiger Induktion auf n Operanden mit n 2 N ausdehnen. Man verallgemeinere z.B. die Dreiecksungleichung H(v)[1.1] zu (14)
ˇ X ˇX n ˇ ˇ n ˇ. ˇ jak j; a k ˇ ˇ kD1
gültig für alle n 2 N und a1 ; : : : ; an 2 R.
kD1
36
Kapitel 1 Die Zahlmengen der Analysis
2. Analog verallgemeinere man die Assoziativ-, Kommutativ- und Distributivgesetze aus den Körperaxiomen A[1.1] auf n Operanden. 3. Man zeige: In der Dreiecksungleichung (14) steht dann und nur dann das Gleichheitszeichen, wenn alle ak % 0 oder alle ak . 0 sind. Lösungshinweis: Aus
ˇ ˇX n ˇ X ˇ n ˇD ˇ a jak j k ˇ ˇ kD1
folgt
n X
kD1
jak j D "
n X
ak
kD1
kD1
für ein " 2 f1; &1g, also
n X
.jak j & "ak / D 0:
kD1
Da hierin alle Summanden nichtnegativ sind, folgt für alle k: jak j & "ak D 0, also jak j D "ak . 4. Man beweise durch vollständige Induktion für n 2 N: a)
n X kD1
1 k D n.n C 1/.2n C 1/, 6 2
b)
n X
k3 D
kD1
1 2 n .n C 1/2 . 4
5. Man beweise durch vollständige Induktion für n 2 N0 : a)
2n X
kC1
.&1/
n X 1 1 D , k nCk kD1
kD1
nC1
n 2 X&1 Y ( k ) ak : b) 1 C a.2 / D
6. Für welche n 2 N gilt a) 2n > n3 ,
b) 3n > n3 ,
kD0
kD0
c) nŠ .
3 n -n 2
?
7. Für n % m in N beweise man durch vollständige Induktion 0 ! 0 ! n X k nC1 D : m mC1 kDm
8. Man beweise die folgende Formel für eine allgemeine arithmetische Summe: 1 .a C b/ C .a C 2b/ C ( ( ( C .a C nb/ D na C n.n C 1/b: 2
Abschnitt 1.4 Zur Vollständigkeit
1.4
37
Zur Vollständigkeit
In der Analysis spielen Grenzwerte eine zentrale Rolle. Das gilt insbesondere für das Kernstück der Analysis, die Differential- und Integralrechnung. Praktisch gibt es keinen Begriff der Analysis, in dem nicht irgendeine Art von Grenzwert vorkommt. Die wichtigste Grundlage für Grenzwerte im Bereich der reellen Zahlen ist die Vollständigkeit. Sie sichert, dass die „Lücken“ zwischen den rationalen Zahlen ausgefüllt werden, sodass wirklich das entsteht, was man als „Kontinuum“ bezeichnet. Das Vollständigkeitsaxiom wurde bereits in Q[1.1] formuliert. In diesem Abschnitt ziehen wir zunächst weitere Folgerungen aus diesem Axiom, bevor wir dann im nächsten Kapitel zu den Grenzwerten übergehen, Wir haben schon gesehen, dass es keine größte natürliche Zahl geben kann; vgl. E(ii)[1.2]. Tatsächlich gilt noch mehr: A. Satz. Die Menge N der natürlichen Zahlen ist nicht nach oben beschränkt. Beweis. Wäre N nach oben beschränkt, so sei s0 ´ sup N 2 R. Dann kann s0 & 1 nicht auch obere Schranke von N sein. Also existierte ein n0 2 N mit n0 > s0 & 1, d.h. mit n0 C 1 > s0 . Wegen n0 C 1 2 N, widerspricht dies der Eigenschaft von s0 , obere Schranke von N zu sein. " B. Folgerung (Archimedische Eigenschaft von R). Zu jedem a > 0 und b aus R gibt es ein n 2 N mit na > b. Anschaulich gesprochen: Durch wiederholtes aneinander Fügen einer (noch so kleinen) Strecke a > 0 kann jede (noch so große) Strecke b > 0 übertroffen werden. (Für b . 0 ist die Behauptung trivial.) Beweis von B. Angenommen, n existierte nicht. Dann gälte für alle n 2 N: na . b, also auch n . b=a. Das ist aber ein Widerspruch zu Satz A. " C. Folgerung. Aus 0 . a .
1 für alle n 2 N folgt a D 0. n
Beweis. Sonst wäre 0 < a und n . 1=a für alle n 2 N. Widerspruch zu A!
"
Auf den ersten Blick könnte man meinen, dass die Eigenschaften A bis C in jedem angeordneten Körper richtig sind. Das ist allerdings ein Irrglaube. Denn nach Hilbert kann man einen angeordneten Körper konstruieren, in dem alle drei Eigenschaften nicht zutreffen. Vgl. Hilbert[1999], §12. Für eine Teilmenge M , R kann man analog zu L[1.1] und N[1.1] die Begriffe „untere Schranke“ und „größte untere Schranke“ einführen. Tatsächlich lässt sich dies
38
Kapitel 1 Die Zahlmengen der Analysis
mittels „Vorzeichenumkehr“ auf die frühere Situation reduzieren. Dazu definieren wir die zu M gespiegelte Menge &M ´ f&x j x 2 M g: Man sagt auch, &M geht durch Spiegelung aus M hervor. Natürlich gilt &.&M / D M . Gilt M D &M , so nennt man M spiegelbildlich oder spiegelsymmetrisch bzgl. 0. Dies bedeutet, dass M mit x auch jeweils &x als Element enthält. D. Definition und Satz. Eine Teilmenge M , R heißt nach unten beschränkt, wenn es ein t 2 R gibt, sodass für alle x 2 M gilt x % t. Ein solches t heißt dann eine untere Schranke von M . Eine untere Schranke t0 von M heißt größte untere Schranke oder Infimum von M , wenn für jede untere Schranke t von M gilt: t0 % t. Man schreibt dann für das eindeutig bestimmte t0 t0 µ inf M: Es gilt (i)
Ist s eine obere Schranke von M , so ist &s eine untere Schranke von &M .
(ii)
Ist t eine untere Schranke von M , so ist &t eine obere Schranke von &M .
(iii) Zu jeder nichtleeren nach unten beschränkten Teilmenge M , R existiert das Infimum inf M in R. (iv)
Ist M nach unten beschränkt, so ist &M nach oben beschränkt, und es gilt sup.&M / D & inf M .
(v)
Ist M nach oben beschränkt, so ist &M nach unten beschränkt, und es gilt inf.&M / D & sup M .
Beweis. Dies beruht in einfacher Weise auf dem Vorzeichenschluss bei Ungleichungen: a < b () &a > &b: Unmittelbar klar sind damit (i) und (ii). Für (iii) und (iv) überlegt man so: Die Gesamtheit der unteren Schranken von M entsteht aufgrund von (i), (ii) durch Vorzeichenumkehr aus der Gesamtheit der oberen Schranken von &M . Ist also s0 die kleinste obere Schranke von &M , so ist &s0 die größte untere Schranke von M , diese also existent in R und & sup.&M / D inf M . (v) geht durch die Ersetzung von M durch &M aus (iv) hervor.
"
Wir haben schon in P(i)[1.1] gesehen, dass das Maximum einer Menge M * R, wenn es existiert, zugleich das Supremum von M ist. Umgekehrt folgt aus sup M 2 M ,
Abschnitt 1.4 Zur Vollständigkeit
39
dass sup M das Maximum von M ist. Entsprechendes gilt für das Infimum. Maxima und Minima sind also dasselbe wie angenommene (d.h. in der Menge enthaltene) Suprema und Infima. Die leere Teilmenge von R besitzt kein Supremum und auch kein Infimum in R. E. Satz. (i)
Jede nichtleere nach unten beschränkte Teilmenge M , Z besitzt ein Minimum.
(ii) Jede nichtleere nach oben beschränkte Teilmenge M , Z besitzt ein Maximum. Beweis. Zu (i): Sei a eine untere Schranke von M und n 2 N so gewählt, dass n > &a also nCa > 0 (das geht nach Satz A). Wir „verschieben M um n in N hinein“, d.h. wir betrachten die Menge M 0 ´ fz C n j z 2 M g und rechnen später zurück. Zunächst ist wirklich M 0 , N; denn für z 2 M haben wir Z 3 z C n % a C n > 0. Sei m0 ´ min M 0 2 M 0 (die Existenz ist klar aus dem Wohlordnungssatz K[1.2]). Es ist m0 D m C n für ein m 2 M . Aus z C n % m0 D m C n für alle z 2 M folgt z % m für alle z 2 M . Somit ist m D min M . Zu (ii): Dies reduziert man wieder durch Spiegelung auf (i), analog zu D.
"
F. Beispiel. Zu einer gegebenen reellen Zahl a betrachten wir die Menge aller ganzen Zahlen k mit k . a. Diese Menge hat die oberen Schranke a, besitzt also ein Maximum k0 . Offensichtlich ist k0 die größte ganze Zahl . a. Man bezeichnet sie durch Œa/ und nennt sie das Größteganze von a. G. Definition und Satz. Die Menge M , R heißt beschränkt, wenn M sowohl nach oben wie nach unten beschränkt ist. Äquivalent damit ist: Es gibt ein c 2 R mit: jxj . c für alle x 2 M . Beweis. Zunächst erkennt man mittels (4)[1.1] die Äquivalenz: jxj . c () &c . x . c: Ist nun jxj . c für alle x 2 M vorausgesetzt, so folgt damit &c . x . c für alle x 2 M , also hat M eine obere und untere Schranke. – Ist umgekehrt a . x . b für alle x 2 M vorausgesetzt, so setzt man c ´ max fjaj; jbjg und sieht: jxj . c für alle x 2 M. " Die leere Menge gilt ebenfalls als beschränkt. Alle Intervalle der Form Œa; b/; Œa; bŒ, /a; b/ ; /a; bŒ mit a < b sind beschränkt; a ist jeweils das Infimum, b das Supremum. Nur bei Œa; b/ existieren beide Extrema.
40
Kapitel 1 Die Zahlmengen der Analysis
Die beiden Begriffe „endlich“ und „beschränkt“ sind wohl zu unterscheiden. Die Eigenschaft „endlich“ bezieht sich auf beliebige Mengen und die Anzahl ihrer Elemente. Die Eigenschaft „beschränkt“ bezieht sich (nach unserem augenblicklichen Stand) auf Teilmengen von R und zwar darauf, dass die Elemente dem Betrage nach unter einer festen (nichtnegativen) Zahl liegen. Eine endliche Teilmenge von R ist stets beschränkt (H[1.3]), aber nicht notwendig umgekehrt. So ist die Menge aller Brüche 1=n mit n 2 N zwar beschränkt, da diese alle im Intervall Œ0; 1/ liegen, aber nicht endlich. Aus den Sätzen H[1.3] und A folgt insbesondere, dass N nicht endlich ist. Jedoch ist N gewissermaßen die „kleinste“ unendliche Menge. Ist nämlich M irgendeine unendliche Menge, so kann man induktiv paarweise verschiedene Elemente a1 ; a2 ; : : : aus M auswählen, und diese sind vermöge n 7! an bijektiv auf N bezogen. Solch eine Menge fa1 ; a2 ; : : :g unterscheidet sich „größenmäßig“ nicht von N. Man wird also N als ein Modell für die einfachsten unendlichen Mengen ansehen: H. Definition. Eine Menge M heißt (i)
abzählbar unendlich, wenn sie bijektiv auf N abgebildet werden kann;
(ii)
abzählbar, wenn sie endlich oder abzählbar unendlich ist;
(iii) überabzählbar, wenn sie nicht abzählbar ist. Die Forderung in (i) kann äquivalent dadurch ausgedrückt werden, dass N bijektiv auf M abgebildet werden kann. Ist ' W N ! M bijektiv, so sind '.1/; '.2/; : : : die Elemente von M , wobei jedes genau einmal vorkommt. Eine solche Bijektion heißt deswegen eine Durchnummerierung von M . Neben Durchnummerierungen werden bei abzählbaren Mengen auch Aufzählungen verwendet. Bei diesen verzichtet man auf die Forderung der Injektivität. Eine Aufzählung einer abzählbaren Menge M ¤ ¿ ist also eine surjektive Abbildung der Art ˛ W N.q/ ! M oder ˛ W N ! M . Die Menge M kann dann in der Gestalt M D f˛.1/; : : : ; ˛.q/g bzw. M D f˛.1/; ˛.2/; : : :g geschrieben werden (aufzählende Mengenschreibweise). Dabei brauchen (im Gegensatz zur Durchnummerierung) die ˛.i/ nicht paarweise verschieden zu sein. Statt ˛.i/ schreibt man oft auch ˛i (Indexschreibweise), und gelegentlich werden anstelle der Mengen N.q/ bzw. N auch andere endliche oder unendliche Teilmengen von N als Definitionsmengen verwendet. Aus der Vorüberlegung ist bereits der folgende Satz I klar geworden. Recht überraschend ist die Tatsache über die rationalen Zahlen, die in Satz J ausgedrückt ist: I. Satz. Jede unendliche Menge enthält eine abzählbar unendliche Teilmenge. J. Satz. Die Menge Q der rationalen Zahlen ist abzählbar unendlich.
"
41
Abschnitt 1.4 Zur Vollständigkeit
Beweis. Zunächst ist Q unendlich, da N , Q. Das klassische Verfahren, Q durchzunummerieren, läuft folgendermaßen: Man betrachtet zunächst den „positiven Teil“ o nm ˇ ˇ QC ´ fx 2 Q j x > 0g D ˇ m; n 2 N n und konstruiert eine Bijektion von N auf QC nach dem folgenden Schema: 1 1+ 1 3 1+
2 # 4 1+ 3 9 1+
! . % .
2 2+ 1
2 2 8 2+ 3
% .
5 3+ 1
6 4+ 1
(((
2
4 2
(((
3 3
4 3
((( (((
7 3+
! .
4
2 4
3 4
4 4
:: :
:: :
:: :
:: :
Die Durchnummerierung erfolgt mit dem so genannten Diagonalverfahren: Man beginnt links oben und durchläuft das Schema in der Reihenfolge der Pfeile. Tritt eine rationale Zahl mehrfach auf, so bekommt sie nur beim ersten Mal eine Nummer. Dies sind die eingekreisten Zahlen. Die Bijektion ordnet dieser Nummer j die dabeistehende rationale Zahl rj zu. (Abänderungen sind möglich, indem der „Anschluss“ der Diagonalen anders gemacht wird.)
Damit wird durchnummeriert: QC D fr1 ; r2 ; r3 ; : : :g, und Q selbst ergibt sich durchnummeriert nach dem Reißverschlusssystem: Q D f0; r1 ; &r1 ; r2 ; &r2 ; : : :g D fs1 ; s2 ; s3 ; : : :g mit j 7! sj als Bijektion von N auf Q.
"
Am Ende dieses Abschnitts werden wir dieses Diagonalverfahren etwas systematischer beschreiben. K. Lemma. Jedes offene Intervall /a; bŒ der Länge b & a > 1 enthält eine ganze Zahl. Beweis. Wir führen einen Widerspruchsbeweis: Angenommen, das Intervall /a; bŒ ist frei von ganzen Zahlen. Dann bilden wir die beiden Mengen A ´ fj 2 Z j j . ag;
B ´ fk 2 Z j k % bg
$ und wissen: Z ist disjunkte Vereinigung von A und B (Z D A [ B). Beide Mengen sind nichtleer. Bei B ist dies klar nach Satz A, da N * Z. Bzgl. A wählt man nach Satz A ein i 2 N mit i % &a. Dann ist Z 3 &i . a. Da A nach oben und B nach unten beschränkt ist, existieren j0 ´ max A 2 A, k0 ´ min B 2 B (Satz E), und $ es gilt j0 . a < b . k0 . Wegen Z D A [ B liegt zwischen j0 und k0 keine ganze Zahl, also ist k0 D j0 C 1. Hieraus folgt 1 D k0 & j0 % b & a > 1, ein Widerspruch. Somit muss /a; bŒ mindestens eine ganze Zahl enthalten. "
42
Kapitel 1 Die Zahlmengen der Analysis
L. Satz. Zwischen je zwei verschiedenen reellen Zahlen liegt stets eine rationale Zahl. Beweis. Sind a; b 2 R mit a < b gegeben, so wählt man zunächst ein n 2 N mit 1=n < b & a. Das ist möglich nach Folgerung B. Dann gilt nb & na > 1. Also gibt es nach Lemma K ein k 2 Z mit na < k < nb. Die rationale Zahl k=n liegt dann zwischen a und b. " Die Überabzählbarkeit von R, die in C[2.3] bewiesen werden wird, beinhaltet insbesondere, dass es „sehr viel mehr“ irrationale Zahlen gibt als rationale. Auch unter dem Gesichtspunkt des Maßes wird sich das später so darstellen; vgl. Analysis 2. M. Lemma. (i)
Ist B , R nach oben beschränkt und ¿ ¤ A , B, so ist auch A nach oben beschränkt und sup A . sup B.
(ii) Ist B , R nach unten beschränkt und ¿ ¤ A , B, so ist auch A nach unten beschränkt und inf A % inf B. Beweis. Zu (i): Jede obere Schranke von B ist auch obere Schranke von A. Also ist A nach oben beschränkt. Insbesondere ist sup B obere Schranke von A, also sup A . sup B. Zu (ii): „Spiegelbildlich“ schließt man: Jede untere Schranke von B ist auch untere Schranke von A. Also ist A nach unten beschränkt. Insbesondere ist inf B untere Schranke von A, also inf A % inf B. " Konventionen Neue Mengen werden oft als Bildmengen gegebener Mengen konstruiert. In der Mengenlehre hat man dafür folgende Schreibweise: Ist eine Abbildung f W X ! Y sowie eine Teilmenge M , X gegeben, so bezeichnet f .M / das Bild von M unter f (definiert als Menge aller f .x/ mit x 2 M ). Diese Symbolik wird nun auch dann angewendet, wenn das Funktionszeichen f nicht benannt ist, sondern nur die Funktionsvorschrift x 7! f .x/. So haben wir oben, wenn M eine Teilmenge von R ist, das Symbol &M eingeführt als die Menge f&x j x 2 M g; die Abbildungsvorschrift ist hierbei x 7! &x. Im gleichen Sinne bezeichnet 2M die Menge f2x j x 2 M g; die Abbildungsvorschrift ist hierbei x 7! 2x. Oder es bezeichnet N1 die Menge aller Reziproken n1 natürlicher Zahlen; die Abbildungsvorschrift ist hierbei n 7! n1 . Dass eine Menge M , R nach oben (bzw. nach unten) beschränkt ist, wird oft so ausgedrückt, dass man sagt sup M (bzw. inf M ) existiert in R. Ähnlich wie früher in (4)[1.2] bei den ganzen Zahlen benutzt man das Zeichen 1 (Unendlich) zur formelmäßigen Kennzeichnung der Unbeschränktheit:
43
Abschnitt 1.4 Zur Vollständigkeit
(1)
M nicht nach oben beschränkt
() W sup M D 1
M nicht nach unten beschränkt
() W inf M D &1:
Wie gesagt, die Symbole 1 und &1 haben hier keine tiefere Bedeutung. Auch sind 1 und &1 keineswegs reelle Zahlen. Beziehungen, in denen 1 und &1 vorkommen, beschreiben einfach die Unbeschränktheit gewisser Objekte. Zum Diagonalverfahren Das obige Diagonalverfahren kann man systematischer aufbauen, indem man es in zwei Teile zerlegt: in die Durchnummerierung eines kartesischen Produkts und die Abzählung von Teilmengen. Der erste Teil (Durchnummerierung eines kartesischen Produkts) beruht auf Folgendem N. Satz. Sind X und Y abzählbar unendliche Mengen, so ist auch ihr kartesisches Produkt X ) Y abzählbar unendlich. Beweis. Man kann o.B.d.A. annehmen, dass X und Y beide gleich N sind. Bezeichnen nämlich ' W N ! X und 4 W N ! Y Durchnummerierungen von X und Y , so ist die Abbildung ' ) 4 W N ) N ! X ) Y mit .' ) 4/.j; k/ ´ .'.j /; 4.k// bijektiv. Aus einer Durchnummerierung f W N ! N)N erhält man dann in Gestalt von .' )4/ıf eine Durchnummerierung von X ) Y . Die Elemente von N)N lassen sich nun wieder in einem Schema der folgenden Gestalt anordnen: .1; 1/ .1; 2/ .1; 3/ .1; 4/ ( ( ( .2; 1/ .2; 2/ .2; 3/ .2; 4/
(((
.3; 1/
.3; 4/
(((
.4; 1/ .4; 2/ .4; 3/ .4; 4/
(((
:: :
.3; 2/ :: :
.3; 3/ :: :
:: :
Dann kann man die Schrägzeilen der Reihe nach durchlaufen, etwa so: (2)
.1; 1/; .1; 2/; .2; 1/; .1; 3/; .2; 2/; .3; 1/; .1; 4/; .2; 3/; .3; 2/; .4; 1/; : : : ;
und erhält dadurch eine Durchnummerierung von N ) N. Man nennt ein solches Vorgehen ein Diagonalverfahren.
"
44
Kapitel 1 Die Zahlmengen der Analysis
Das konkrete Diagonalverfahren, das zur Liste aller Paare in (2) führt, ließe sich auch formelmäßig beschreiben (was aber die ohnehin bestehende Klarheit dieses Vorgehens nicht erhöhen würde). Jedenfalls erhält man so eine bijektive Abbildung ' W N ! N ) N, mit '.1/ D .1; 1/, '.2/ D .1; 2/, '.3/ D .2; 1/, '.4/ D .1; 3/, usw. Durch eine leichte Abänderung des Diagonalverfahrens sieht man, dass X ) Y immer noch abzählbar unendlich bleibt, falls einer der kartesischen Faktoren X oder Y endlich und der andere abzählbar unendlich ist. Im Falle, dass beide kartesische Faktoren endlich sind, ist auch X ) Y endlich und jX ) Y j D jX j ( jY j: Zur Durchnummerierung von Teilmengen gilt ähnlich wie bei Satz J[1.2]: O. Satz. Ist X abzählbar unendlich und A , X, so ist A abzählbar. Beweis. Wiederum dürfen wir o.B.d.A. annehmen, dass X D N, also A , N gilt. Dann streichen wir in der Liste 1; 2; 3; : : : alle Zahlen, die nicht zu A gehören. Übrig bleiben gewisse natürliche Zahlen a1 < a2 < a3 < ( ( ( , nämlich die von A. Bricht diese Liste ab, so ist A endlich, im anderen Fall liefert die Abbildung f W N ! A mit f .j / ´ aj eine Durchnummerierung von A. Das Streichen entspricht dem folgenden Rekursionsschema für die verbleibenden Elemente f .1/ ´ min fk j k 2 Ag;
f .nC1/ ´ min fk j k 2 Anff .1/; f .2/; : : : ; f .n/gg;
und ist damit präzisiert. Die einzelnen Schritte beruhen hierbei auf dem Wohlordnungssatz K[1.2]. " P. Folgerung. Gegeben sei eine Abbildung g W X ! Y . Ist X abzählbar unendlich, so ist das Bild g.X/ abzählbar. Beweis. O.B.d.A. kann wieder X D N angenommen werden. Zu jedem y 2 g.N/ ist die Urbildmenge g &1 .y/ eine nichtleere Teilmenge von N. Somit existiert k.y/ ´ min g &1 .y/ (Wohlordnungssatz). Dann ist g.k.y// D y, die Abbildung k W g.N/ ! N also injektiv und, betrachtet als Abbildung k W g.N/ ! k.g.N//, auch bijektiv. Als Teilmenge von N ist k.g.N// abzählbar (Satz O). Also ist auch g.N/ abzählbar. " Q. Satz. Ist .Xj /j 2J eine abzählbar unendliche Familie von abzählbar unendlichen S Mengen Xj , so ist auch die Vereinigung X WD j 2J Xj abzählbar unendlich.
45
Abschnitt 1.4 Zur Vollständigkeit
Beweis. Wieder kann o.B.d.A. J D N angenommen werden. Die Mengen Xj lassen sich dann in der Form aufschreiben X1 D fx11 ; x12 ; x13 ; : : :g X2 D fx21 ; x22 ; x23 ; : : :g X3 D fx31 ; x32 ; x33 ; : : :g :: : was wiederum eine Form des Diagonalverfahrens nahe legt. Tatsächlich ist dann die Vereinigung darstellbar als X D fx11 ; x12 ; x21 ; x13 ; x22 ; x32 ; : : :g; also X D F .N ) N/, wobei die Abbildung F W N ) N ! A definiert ist durch F .j; k/ ´ xj k . Da X z.B X1 als Teilmenge enthält, ist X unendlich. Nach N und P folgt, dass X abzählbar unendlich ist. " Mit leichten Abänderungen dieses Vorgehens kann man auch die Fälle behandeln, in denen die Mengenfamilie endlich ist oder unter den einzelnen Mengen auch endliche Mengen vorkommen. In all diesen Fällen resultiert immer eine abzählbare Vereinigung. Diese ist endlich, wenn sowohl die Familie wie auch alle Einzelmengen endlich sind. Neuer Beweis für die Abzählbarkeit von Q Will man die Abzählbarkeit von QC nochmals mittels dieser Sätze beweisen, so geht dies ganz einfach so: Man definiert eine Abbildung F W N)N ! QC durch F .j; k/ ´ j=k. Diese ist surjektiv, und N ) N ist abzählbar unendlich. Also ist QC abzählbar nach Folgerung P und unendlich, da N * QC . Die Abzählbarkeit von Q selbst ergibt sich jetzt z.B aus den vorangehenden Überlegungen aufgrund der Vereinigung Q D QC [ .&QC / [ f0g. Ein Wort zur Veranschaulichung Wir haben bisher ganz bewusst keine Bilder zur Veranschaulichung herangezogen, um darzutun, dass mathematische Schlüsse auf logischem Wege zustande kommen und nicht etwa aufgrund vager Vorstellungen. Diese „Strenge“ oder „Exaktheit“ gehört gewissermaßen zum Berufsethos der Mathematik. Trotzdem ist es vielfach hilfreich, exakte Argumente durch Figuren zu illustrieren. Die Anschauung soll ja nicht ausgesperrt werden, nur ist sie eben als Beweismittel nicht zugelassen. In diesem Sinne wird der reelle Zahlkörper durch die so genannte Zahlgerade veranschaulicht, eine (meistens) horizontale Gerade, auf der vielleicht einige ganze und
46
Kapitel 1 Die Zahlmengen der Analysis
reelle Zahlen in Gestalt von kleinen Marken (Striche oder Pfeile o.ä.) hervorgehoben sind. x -3
-2
-1
0
1
2
R 3
Aufgaben und Anmerkungen 1. Man beweise: Jede reelle Zahl x ist als Supremum einer Menge rationaler Zahlen darstellbar. Lösungshinweis: Man nehme die Menge M ´ fr 2 Q j r < xg und wende Satz L an. 2. Es ist eine wichtige Frage, wie viele ganze Zahlen in einem gegebenen Intervall liegen. Genauer: Kann man die Anzahl ganzer Zahlen in einem beschränkten Intervall durch die Länge des Intervalls abschätzen? Im höherdimensionalen Fall (den wir im Augenblick nur andeutungsweise beschreiben können) verallgemeinert sich dies zum Problem, wie viele Gitterpunkte in einem konvexen Körper liegen, möglichst ausgedrückt durch das Volumen des Körpers. Dazu hat Minkowski[1925] in dem von ihm begründeten Gebiet Geometrie der Zahlen bedeutsame Beiträge geliefert; vgl. auch Aufgabe 6. Wir bleiben aber hier im Eindimensionalen. Eine erste Feststellung ist in Lemma K getroffen: Bei b & a > 1 liegt im Intervall /a; bŒ mindestens eine ganze Zahl. Es ist aber klar, dass in einem „langen“ Intervall ungefähr b &a ganze Zahlen liegen werden. Dazu beweise man genauer: a) Bezeichnet n die Anzahl ganzer Zahlen im Intervall Œa; bŒ, so gilt b & a & 1 < n < b & a C 1: b) Ist a 2 R und m 2 N, so liegen im Intervall Œa; a C mŒ genau m ganze Zahlen. c) Bezeichnet n$ die Anzahl der Intervalle der Form Œk; k C 1Œ , Œa; bŒ mit k 2 Z, so gilt
b & a & 2 < n$ . b & a:
Lösungshinweis: Bei a) sei A0 ´ fk 2 Z j k 2 Œa; bŒ g, also n D jA0 j, und km ´ min A0 , kM ´ max A0 . Dann gilt km % a, aber km & 1 < a und kM < b, aber kM C 1 % b. Daraus folgt die Behauptung unter Beachtung von n D kM & km C 1. b) ist ein Spezialfall von a), und bei c) schließe man ähnlich wie in a).
47
Abschnitt 1.4 Zur Vollständigkeit
3. In dieser Aufgabe wird die obige Durchnummerierung (2) von N)N hergeleitet. a) Man beweise folgende Zerlegung von N ) N in „Diagonalschichten“: 1 [ N ) N D ' f.p; q/ 2 N ) N j p C q D rg: rD2
Die Marken am Vereinigungszeichen besagen, dass die Vereinigung für alle r 2 N mit r % 2 gebildet werden soll. Der Punkt bedeutet, dass die Mengen paarweise disjunkt sind. Was ist die anschauliche Bedeutung dieser Formel? b) Mittels E[1.3] zeige man damit, dass die Abbildung f W N ) N &! N;
f .p; q/ D
.p C q & 1/.p C q & 2/ Cp 2
bijektiv, also f &1 W N &! N ) N eine Durchnummerierung von N ) N ist. In Aufgabe 6[2.2] wird eine explizite Formel für die Umkehrfunktion f &1 W N ! N ) N aufgestellt werden. 4. $ Die Tatsache, dass N bijektiv auf N ) N abgebildet werden kann, ist stark verallgemeinerungsfähig. Es gilt nämlich der Multiplikationssatz der Mengenlehre: Ist X eine unendliche Menge, so existiert eine bijektive Abbildung von X auf X ) X. Zur Geschichte dieses merkwürdigen Satzes und den verschiedenen Beweismethoden sehe man Deiser[2005]. 5. Seien A; B nichtleere Teilmengen von R. Neben A [ B und A \ B betrachte man auch die Menge aller Summen C ´ fa C b j a 2 A und b 2 Bg: Man beweise a) Sind A; B beide nach oben beschränkt, so sind es auch A [ B, A \ B und C , und es gilt sup.A [ B/ D max fsup A; sup Bg sup C D sup A C sup B: b) Sind A; B beide nach unten beschränkt, so sind es auch A [ B, A \ B und C , und es gilt inf.A [ B/ D min finf A; inf Bg inf C D inf A C inf B:
48
Kapitel 1 Die Zahlmengen der Analysis
6. $ Lemma K kann nach dem ersten Hauptsatz von Minkowskis Geometrie der Zahlen auf folgende Weise in höhere Dimensionen übertragen werden: Wenn ein konvexer Körper mit dem Mittelpunkt 0 ein Volumen > 2n besitzt, so enthält er mindestens einen Gitterpunkt ¤ 0 im Inneren. Die eingehenden Begriffe können erst später eingeführt werden. Vgl. z.B. Weyl[1966], Kap. IV, 6.
2
Reelle Zahlenfolgen
Für viele Konstruktionen sind Folgen ein wichtiges Werkzeug. Sie dienen allgemein dazu, abzählbare Prozesse zu beschreiben. In der Analysis sind Folgen vor allem dann brauchbar, wenn sie konvergieren. Die Konvergenz ist ein fundamentaler Begriff, mit dem die Analysis erst richtig in Gang kommt. Wir erklären den Begriff einer Folge zunächst in beliebigen Mengen, gehen dann aber rasch zu Folgen in R und ihrer Konvergenz über.
2.1 Konvergenz Sei X eine beliebige Menge. Eine Folge in X stellt man sich anschaulich so vor, dass man in diskreten Schritten in der Menge X herum springt, und zwar beliebig lange. Hier die mathematische Präzisierung: A. Definition. Eine Folge in einer Menge X ist eine Abbildung a W N ! X. Jedem Element n 2 N ist also ein Element an 2 X zugeordnet. Die Elemente an heißen die Glieder der Folge und n jeweils der Index. Weitere gebräuchliche Symbole für eine Folge sind n 7! an
oder .an /n2N
oder a1 ; a2 ; a3 ; : : :
kurz auch .an / oder sogar an : X
Die anschauliche Vorstellung ist die, dass man in diskreten Schritten in der Menge X herum springt, und zwar beliebig lange. Zum „Zeitpunkt“ n befindet man sich am „Ort“ an 2 X.
a3 a1 a2
ˇ Anstelle von N kann als Indexmenge auch eine Teilmenge von Z der Form fj 2 Z ˇ j % j0 g verwendet werden. Die nötigen Abänderungen sind leicht und offensichtlich. Z.B. zählt man oft von 0 an, d.h. man betrachtet eine Folge a0 ; a1 ; a2 ; a3 ; : : : . Von jetzt an geht es um Folgen in R; es ist also X D R.
50
Kapitel 2 Reelle Zahlenfolgen
B. Beispiele. (i)
an D ˛, die konstante Abbildung mit Wert ˛; 1 (ii) bn D , die Folge der Kehrwerte natürlicher Zahlen; n (iii) cn D .&1/n , die Eins mit abwechselnden Vorzeichen;
(iv)
dn D n, die Folge der natürlichen Zahlen.
C. Definition. Die Folge .an /n2N heißt (i)
nach oben beschränkt bzw. nach unten beschränkt bzw. beschränkt, wenn ihre Bildmenge fa1 ; a2 ; a3 ; : : :g diese Eigenschaft hat;
(ii)
monoton wachsend, wenn für alle n 2 N gilt: an . anC1 ;
(iii) streng monoton wachsend, wenn für alle n 2 N gilt: an < anC1 ; Entsprechend zu (ii), (iii) sind die Begriffe monoton fallend bzw. streng monoton fallend definiert. Oberbegriff zu „monoton wachsend“, „monoton fallend“ ist monoton und entsprechend bei den strengen Varianten streng monoton. D. Beispiele. Von den Folgen aus B sind: an ; bn ; cn beschränkt; dn nicht nach oben beschränkt; an monoton wachsend und monoton fallend; bn streng monoton fallend; cn nicht monoton; dn streng monoton wachsend. Die Veranschaulichung einer reellen Zahlenfolge .an / kann auf zwei Arten erfolgen: Entweder markiert man (einige) Glieder an auf der Zahlgeraden, oder man bedient sich wie bei Funktionen einer Graphendarstellung, bei der über dem Abszissenwert n (auf der horizontalen Achse) als Ordinatenwert das zugehörige an (in Richtung der vertikalen Achse) aufgetragen wird. Den „asymptotischen“ Verlauf kann man aber so allenfalls erahnen.
R a4
a5
a3 (5,a5)
0
R
R 1
2
3
4
5
6
51
Abschnitt 2.1 Konvergenz
Die Konvergenz einer Folge .an / bedeutet, dass es eine feste reelle Zahl a gibt, der alle Glieder mit genügend großem Index beliebig nahe kommen. Dieses a ist dann der Grenzwert. Natürlich muss man präzisieren, was die Kombination „genügend großer Index – beliebig nahe“ bedeuten soll. Das geschieht auf folgende Weise: E. Definition (Konvergenz). Die Folge .an / heißt konvergent, wenn es ein a 2 R gibt mit folgender Eigenschaft: Zu jedem " > 0 existiert ein N D N."/ 2 N, sodass für alle n > N gilt: jan & aj < ". Ist dies der Fall, so heißt a der Grenzwert der Folge .an /, und man schreibt lim an D a
n!1
oder
an &! a
(für n &! 1):
Wir werden gleich sehen, dass der Grenzwert im Falle der Existenz eindeutig bestimmt ist. D.h. ein und dieselbe Folge kann nicht zwei verschiedene Grenzwerte besitzen. Die eingerahmte Eigenschaft nennen wir den ."; N /-Test. Will man die Konvergenz einer Folge mit dieser Definition nachweisen, so muss man den ."; N /-Test explizit durchführen. Dass in ihm diverse Ungleichungen vorkommen, ist der Grund, weswegen Abschätzungen in der Analysis so wichtig sind. Beispiele, wie der ."; N /-Test konkret ausgeführt werden kann, folgen in H. Besteht die Konvergenz an ! a, so weichen die Folgenglieder an vom Grenzwert a beliebig wenig ab, wenn nur der Index n hinreichend groß ist. Der Grenzwertbegriff realisiert also gleichzeitig den für die angewandte Mathematik zentralen Begriff der (beliebig genauen) Annäherung (= Approximation). Der Konvergenzbegriff ist absolut zentral für die Analysis und muss unbedingt verstanden werden. Es sei nochmals betont, was der eingerahmte Teil in der Definition E verlangt: Bei beliebig vorgegebener „Fehlerschranke“ " > 0 muss es möglich sein, einen (davon abhängenden) Index N zu finden, jenseits dessen die Folgenglieder an alle von a um weniger als " abweichen. Da der Index N i. Allg. von " abhängen wird, ist er in Definition E auch mit N."/ bezeichnet worden. Äquivalent kann man den ."; N /-Test auch so formulieren: Zu jedem " > 0 existiert ein N D N."/ 2 N, sodass gilt: n > N H) jan & aj < ". E. Zusatz. Gilt limn!1 an D a, so sagt man auch: .an / konvergiert (oder geht oder strebt) gegen a oder auch: a D limn!1 an existiert (in R). Gilt limn!1 an D 0, so nennt man .an / eine Nullfolge. Die Verneinung von „konvergent“ ist divergent.
52
Kapitel 2 Reelle Zahlenfolgen
Das Zeichen lim wird als „Limes“ ausgesprochen, die Verbindung n ! 1 als „n gegen Unendlich“, die Verbindung an ! a als „an gegen a“. Divergenz bedeutet, dass der ."; N /-Test für keine reelle Zahl a erfüllt ist. F. Bemerkung. Beim ."; N /-Test „kommt es nur auf kleine " > 0 an“. Das soll heißen: Ist "0 > 0 fest gegeben und gilt der ."; N /-Test in der Form ($) Zu jedem " > 0 mit " < "0 existiert ein N D N."/ 2 N, sodass für alle n > N gilt: jan & aj < ", so gilt er auch in der ursprünglichen Form (ohne den Zusatz " < "0 ). Ist nämlich ein " > 0 beliebig gegeben, so kann man ($) auf "0 ´ min f"; "0 =2g anwenden. Dafür ist dann 0 < "0 < "0 , und es gibt ein N 2 N mit: jan & aj < "0 für alle n > N . Für diese gilt erst recht jan & aj < ", da "0 . ". G. Satz. Eine konvergente Folge hat genau einen Grenzwert. Viele Limesüberlegungen beruhen auf geeigneten Vorausabschätzungen, das sind Ungleichungen, die es erlauben, das Kleinwerden des Ausdrucks jan & aj besser als auf direktem Wege zu erkennen. Letzten Endes muss man ja in der Lage sein, jan & aj „klein zu kriegen“. Das gelingt oft dadurch, dass man den Ausdruck jan &aj nach oben abschätzt, aber so, dass die Schranke selbst klein wird. Solche Vorausabschätzungen sollten unabhängig von eventuellen „"-Überlegungen“ sein, diese aber geeignet vorbereiten. Beweis von G. Sei a D limn!1 an und auch b D limn!1 an . Zu zeigen ist a D b. Hier ist eine mögliche Vorausabschätzung: (1)
ja & bj D ja & an C an & bj . ja & an j C jan & bj:
Gestützt auf (1) argumentiert man nun so: Ist ein " > 0 vorgegeben, so existieren gemäß E natürliche Zahlen N1 ; N2 mit (2)
jan & aj
N2 :
Hier ist also E auf 2" angewandt: Was für alle " > 0 geht, geht auch für mit neuen Schranken für n).
" 2
(natürlich
Sei N3 ´ max fN1 ; N2 g. Dann gilt in (2) beides, wenn n > N3 , also nach (1): (3)
ja & bj
0:
Da es nach J[1.1] keine kleinste positive Zahl gibt , ist ja & bj D 0, also a D b. Direkt kann man auch so schließen: Wäre ja&bj > 0, so ergäbe sich aus (3) ein Widerspruch, indem man " ´ ja & bj setzt. "
53
Abschnitt 2.1 Konvergenz
H. Beispiele. (i)
Für eine konstante Folge gilt lim ˛ D ˛:
n!1
Klar: Der Unterschied von an D ˛ zu ˛ ist stets 0, also beliebig klein für alle n. Hier tut es also N."/ ´ 1. (ii)
Für die Kehrwertfolge der natürlichen Zahlen gilt lim
n!1
1 D 0I n
sie ist also eine Nullfolge.
ˇ ˇ Zum Nachweis sei " > 0 gegeben. Wann wird ˇ n1 & 0ˇ D n1 < "? Umrechnung gibt äquivalent: 1" < n. Einmal können wir das schaffen: Da N nicht nach oben beschränkt ist (A[1.4]), gibt es eine natürliche Zahl N."/ > 1" . Dann aber gilt für alle n > N."/: n > 1" , somit n1 < ". Hier tut es also N."/ ´ 1" . Beachte: Ohne A[1.4] käme man hier nicht weiter! (iii) Zu jeder reellen Zahl x existiert eine Folge rationaler Zahlen rn mit limn!1 rn D x: Zu jedem n 2 N wähle man nämlich ein rn 2 Q mit x & n1 < rn < x C n1 . Solch ein rn gibt es nach L[1.4]. Dann gilt jrn & xj < n1 für alle n 2 N. Die gleiche Wahl von N."/ wie bei (ii) führt dann zur Erfüllung des ."; N /-Tests für rn ! x. Man drückt dieses Ergebnis auch so aus: Jeder reelle Zahl lässt sich beliebig genau durch rationale Zahlen annähern (approximieren). (iv) Ist M , R eine nichtleere, nach oben beschränkte Menge und s ´ sup M , so existiert eine Folge .sn / in M mit lim sn D s: n!1
Zu jedem n 2 N wähle man nämlich ein sn 2 M mit s & n1 < sn . s. Solch ein sn gibt es, da sonst s & n1 eine obere Schranke von M wäre. Dann gilt & n1 < sn & s . 0, also jsn & sj < n1 für alle n 2 N. Die gleiche Wahl von N."/ wie bei (ii) führt dann zur Erfüllung des ."; N /-Tests für sn ! s. Eine solche Folge kann sogar monoton wachsend gewählt werden. Denn für tn ´ max fs1 ; : : : ; sn g gilt tn 2 M und nach (13)[1.3] tnC1 % tn sowie s & n1 < sn . tn . s, also tn ! s (genau wie bei sn ). Ist eine Folge .an / gegeben und soll sie auf Konvergenz untersucht werden, so sind eigentlich zwei Dinge zu erledigen: Erstens muss der Grenzwert ermittelt oder zumindest vermutet werden. Zweitens muss der ."; N /-Test durchgeführt werden. Leider gibt es für beide Aufgaben kein universelles Rezept. Selbst wenn der Grenzwert bekannt ist, kann sich die Konvergenzprüfung mit Hilfe von " und N."/, die so genannte Epsilontik, schwierig gestalten. Glücklicherweise gibt es aber ein paar Methoden, mit
54
Kapitel 2 Reelle Zahlenfolgen
denen man die Konvergenz (oder auch die Divergenz) ohne Epsilontik erkennen kann. Dazu gehören die folgenden Aussagen I, K, N, O und Q. Unmittelbar klar aus der Definition der Konvergenz ist die Äquivalenz: (4)
an &! a () jan & aj &! 0;
insbesondere für a D 0: (5)
an &! 0 () jan j &! 0:
I. Satz. (i)
Ist die Folge .an / konvergent, so ist sie auch beschränkt.
(ii)
Majorantenkriterium für Folgen: Gilt jan & aj . bn für alle n und ist .bn / eine Nullfolge, so folgt lim an D a. n!1
(iii) Ist die Folge .an / beschränkt und .bn / eine Nullfolge, so ist auch .an bn / eine Nullfolge. Eine Ungleichung wie in (ii): jan & aj . bn mit bn ! 0 wird oft auch Fehlerabschätzung genannt. Die Umkehrung von (i) gilt nicht, wie man an der Folge cn D .&1/n sieht. Diese ist beschränkt, aber nicht konvergent. Die Aussage (i) dient hauptsächlich zur Erkennung der Divergenz. Denn sie besagt äquivalent: Ist die Folge .an / nicht beschränkt, so ist sie nicht konvergent. Beweis von I. Zu (i): Zu " ´ 1 wähle man N 2 N derart, dass für alle n > N gilt: jan & aj < 1. Dann folgt für diese n jan j D jan & a C aj . jan & aj C jaj < 1 C jaj: Somit ist jan j . max fja1 j; : : : ; jaN j; 1 C jajg für alle n 2 N. Zu (ii): Zu " > 0 wähle man N 2 N derart, dass für alle n > N gilt: jbn j < ". Dafür gilt dann auch jan & aj < ". Zu (iii): Sei jan j < c für alle n 2 N. Dann gilt: jan bn j . cjbn j. Wähle zu " > 0 " ein N 2 N, sodass für alle n > N gilt: jbn j < cC1 . Dafür ist dann auch jan bn j . c " < ". " cC1 J . Lemma (Meidungsprinzip). Die Folge .an / sei konvergent zum Grenzwert a. Dann gilt (i)
Ist b > a, so existiert ein n0 2 N, sodass für alle n % n0 gilt: an < b.
55
Abschnitt 2.1 Konvergenz
(ii) Ist c < a, so existiert ein n0 2 N, sodass für alle n % n0 gilt: an > c. Anschaulich gesprochen: Nach Voraussetzung nähern sich die Folgenglieder an für große n dem festen Wert a mit beliebiger Genauigkeit. Deshalb meiden sie für große n den Bereich der Zahlen x % b und auch der Zahlen x . c. Beweis von J. Zu (i): Zu " ´ b&a wähle man ein n0 2 N derart, dass jan & aj < b&a für alle 2 2 b&a bCa , also a < C a D < b; vgl. n > n0 . Dann gilt dafür auch: an & a < b&a n 2 2 2 (8)[1.1]. Zu (ii): Analog zu (i).
"
Das Meidungsprinzip gilt entsprechend für weitere Grenzwertbegriffe, die im Folgenden entwickelt werden. Den allgemeinen Hintergrund für seine Gültigkeit werden wir in H[6.2] kennen lernen. K. Satz (Rechenregeln für Grenzwerte). Aus an &! a und bn &! b folgt: (i)
jan j &! jaj
(ii)
an C bn &! a C b
(iii)
an ( bn &! a ( b an a &! ; falls b ¤ 0: bn b
(iv)
Dafür sagt man auch, die Grenzwertbildung sei kompatibel mit der Betragsbildung und den Körperoperationen. Beweis von K.
ˇ ˇ Zu (i): Es gilt die Vorausabschätzung ˇjan j&jajˇ . jan &aj als Folge der modifizierten Dreiecksungleichung I[1.1]. Daraus ergibt sich sofort die Behauptung, z.B. mittels (4). Zu (ii): Eine passende Vorausabschätzung ist hier: (6)
j.an C bn / & .a C b/j D jan & a C bn & bj . jan & aj C jbn & bj:
Wir versuchen, die Summanden ganz rechts „klein zu kriegen“. Das gelingt so: Zu einem gegebenen " > 0 gibt es natürliche Zahlen N1 ; N2 , sodass für n > N1 gilt: jan & aj < 2" und für n > N2 analog: jbn & bj < 2" . Für n > N3 ´ max fN1 ; N2 g wird also die linke Seite von (6) kleiner als 2" C 2" D ". Zu (iii): Eine Vorausabschätzung ist hier: jan bn & abj D jan bn & an b C an b & abj D jan .bn & b/ C b.an & a/j . jan j ( jbn & bj C jbj ( jan & aj:
56
Kapitel 2 Reelle Zahlenfolgen
Schaut man auf die Schranke ganz rechts, so ist diese eine Nullfolge. Dazu hat man lediglich einiges zu kombinieren, nämlich (4), die Aussagen von I und den vorhergehenden Punkt (ii). Mittels des Majorantenkriteriums folgt dann aus der Vorausabschätzung die Behauptung. an 1 Zu (iv): Es gilt D an ( . Mit Rücksicht auf (iii) reicht es also zu zeigen: bn bn bn &! b ¤ 0 H)
1 1 &! : bn b
Hierzu überlegen wir: Nach dem Meidungsprinzip, angewandt auf jbn j ! jbj, existiert ein N1 2 N, so dass jbn j >
jbj 2
für alle n > N1 :
Nun könnte allerdings b1 D ( ( ( D bN1 D 0 sein. Dann ist statt der Folge 3 nur die Folge b1n zu betrachten. Damit wird für alle n > N1 :
3
1 bn
n2N
n>N1
ˇ ˇ ˇ ˇ ˇ1 2 1 ˇˇ ˇˇ b & bn ˇˇ jb & bn j jb & bn j ˇ (7) D 2 ( jb & bn j: ˇ b & b ˇ D ˇ b b ˇ D jb j ( jbj . 1 b n n n jbj ( jbj 2 1 1 ! . Hierin geht die rechte Seite nach (iii) gegen 0, und es folgt bn b
"
L. Bemerkungen. (i)
In anderer Schreibweise lauten die Regeln aus Satz K: ˇ ˇ lim jan j D ˇ lim an ˇ n!1
n!1
lim .an C bn / D lim an C lim bn
n!1
n!1
n!1
lim .an ( bn / D lim an ( lim bn
n!1
n!1
lim an an n!1 D ; n!1 bn lim bn lim
n!1
n!1
falls
lim bn ¤ 0;
n!1
vorausgesetzt, die Einzellimites auf den rechten Seiten existieren jeweils. Wir nennen das die operative Schreibweise. (ii) Auf ein festes „Anfangsstück“ a1 ; : : : ; aK einer Folge a1 ; a2 ; a3 ; : : : kommt es bei Konvergenzbetrachtungen nicht an. Denn N."/ in Definition E kann durch max fK C 1; N."/g ersetzt werden. Dies ist generell so, ohne dass es jeweils explizit formuliert wird.
Abschnitt 2.1 Konvergenz
57
M. Satz. Sei q 2 R fest gewählt. Für die Folge der Potenzen q n gilt: (i)
q n ! 0, falls jqj < 1.
(ii) .q n / ist nicht beschränkt (also divergent), falls jqj > 1. Beweis. Zu (i): Im Falle q D 0 ist die Behauptung trivial. Sei also 0 < jqj < 1. Dann ist 1 D 1 C h mit h > 0. Es folgt mittels der Bernoullischen Ungleichung B[1.3] der jqj Reihe nach: 1 D .1 C h/n % 1 C nh jqjn 1 0 1 n n &! jqj . D D 0: 1 1 C nh 0Ch Ch n Dabei wurden beim letzten Konvergenzpfeil die Regeln aus K angewendet. Damit dies möglich ist, musste die davor stehende Umformung vorgenommen werden. Solche Umformungen sind auch in vielen anderen Fällen nützlich. Zu (ii): Diesmal gilt jqj D 1 C k mit k > 0. Wäre die Folge .q n / beschränkt, so wäre es auch die Folge .jq n j/, etwa mit der Schranke s. Aus jq n j . s folgte dann .1 C k/n . s, also 1 C nk . s, also n . s&1 für alle n 2 N. Dies ist ein Widerspruch k zur Unbeschränktheit von N; vgl. A[1.4]. " N. Satz (Hauptsatz über monoton wachsende Folgen). Eine monoton wachsende Folge .an / ist dann und nur dann konvergent, wenn sie nach oben beschränkt ist. Beweis. Zu „dann“: Sei also .an / nach oben beschränkt. Das Wesentliche ist die Konstruktion des Grenzwertes: Wir betrachten die Bildmenge der Folge, A ´ fa1 ; a2 ; a3 ; : : :g, setzen s ´ sup A und zeigen: s D limn!1 an . Zunächst wissen wir: Für alle n 2 N gilt: an . s. Denn s ist obere Schranke von A. Andererseits: Gegeben ein " > 0, so existiert ein N 2 N mit aN > s & " (da s kleinste obere Schranke von A ist). Wegen der Monotonie gilt für die n % N erst recht an > s & ". Zusammengenommen gilt für alle n % N : jan & sj D s & an < ". Zu „nur dann“: Das ist die „triviale Richtung“. Sie folgt unmittelbar aus I(i).
"
N. Zusatz. Im Konvergenzfall gilt limn!1 an D sup fa1 ; a2 ; a3 ; : : :g.
"
Analog hat man:
58
Kapitel 2 Reelle Zahlenfolgen
O. Satz (Hauptsatz über monoton fallende Folgen). Eine monoton fallende Folge .an / ist dann und nur dann konvergent, wenn sie nach unten beschränkt ist. Im Konvergenzfall gilt limn!1 an D inf fa1 ; a2 ; a3 ; : : :g.
"
Die nächsten zwei Sätze liefern zusätzliche Hilfsmittel über Folgen im Zusammenhang mit Ungleichungen. P . Satz. In Ungleichungen darf man „unscharf“ zur Grenze übergehen. Das soll heißen: Hat man zwei konvergente Folgen an ! a und bn ! b und gilt an . bn für alle n 2 N, so ist a . b. Beweis. Mittels K folgt: bn & an ! b & a. Wäre b < a, also b & a < 0, so existierte nach dem Meidungsprinzip J ein N1 2 N mit: bn & an < 0 für alle n > N1 , also bn < an für alle n > N1 . Das ist ein Widerspruch zur Voraussetzung. " Warnung: Aus an < bn folgt zwar an . bn , also hiernach im Falle der Konvergenz: a . b, aber i. Allg. nicht a < b. Ein einfaches Gegenbeispiel erhält man für an ´ 1=.2n/ und bn ´ 1=n. Hier ist stets an < bn , aber lim an D lim bn D 0. n!1
n!1
Q. Satz (Einschnürung). Gilt für drei Folgen: an . cn . bn für alle n und ist außerdem limn!1 an D limn!1 bn D a, so gilt auch limn!1 cn D a. Beweis. Aus &jan & aj . an & a . cn & a . bn & a . jbn & aj ergibt sich die Vorausabschätzung: jcn & aj . max fjan & aj; jbn & ajg: Zum gegebenen " > 0 wählen wir N1 ; N2 2 N mit jan & aj < " für alle n > N1 ;
jbn & aj < " für alle n > N2 :
Dann wird: jcn & aj < " für alle n > N ´ max fN1 ; N2 g.
"
Wir berechnen noch einen konkreten Grenzwert, der uns bei der Exponentialfunktion helfen wird. Dabei benötigen wir das folgende Hilfsmittel, das auch für „Bankleute“ von Interesse ist: Angenommen, eine Aktie steigt von C – 100 auf C – 125, also um 25%, fällt dann aber wieder auf C – 100. Quizfrage: Wie groß ist dieser Verlust, ausgedrückt in Prozent? – Die Antwort 25% wäre falsch; denn 25% von C – 125 sind C – 31,25! Rechnet man in richtigen Bruchteilen statt in Prozent (sodass z.B. 25% dem Bruchteil 0;25 entspricht), so reduziert sich die Frage auf die Gleichung (8)
.1 C x/.1 & y/ D 1:
Dabei ist x der Bruchteil der Wertsteigerung und y der Bruchteil des Verlusts, um den alten Wert zu erhalten. Die Auflösung dieser Gleichung nach y ist ganz einfach:
59
Abschnitt 2.1 Konvergenz
R. Lemma. Zu jedem x ¤ &1 gibt es genau ein y mit (8), nämlich y D
x . 1Cx
"
Ist also im obigen Beispiel x D 0;25 (entsprechend 25%), so ist y D 0;25=1;25 D 0;2 (entsprechend 20%). Der obige Verlust beträgt also 20%. S. Lemma. Ist .cn / eine Nullfolge, so gilt: 3 cn -n 1C D 1: n!1 n lim
Beweis. Vorausabschätzung nach unten: Mittels der Ungleichung von Bernoulli B[1.3] sieht man: 3 cn -n cn cn 1C %1Cn( D 1 C cn ; falls 1 C > 0: n n n Das letzte gilt aufgrund des Meidungsprinzips nach einem gewissen n1 . Vorausabschätzung nach oben: Für n > n1 setzen wir xn WD cnn , und es sei yn WD xn der nach Lemma R zugehörige y-Wert. Dann gilt wieder unter Verwendung der 1Cxn Ungleichung von Bernoulli: /n . 1 1 .1 C xn /n D . ; falls 1 & nyn > 0: 1 & yn 1 & nyn Beachte: Aus 1 & nyn > 0 folgt von alleine 1 & yn > 0. Es gilt xn ! 0, yn ! cn ! 0, sodass die vorstehende Bedingung aufgrund des 0 und sogar nyn D 1Cx n Meidungsprinzips nach einem gewissen n2 > n1 erfüllt ist. Zusammengenommen gilt: 3 cn -n 1 1 C cn . 1 C . ; n 1 & nyn Durch Einschnürung (Q) folgt daraus die Behauptung.
falls n > n2 : "
T. Bemerkungen. (i) Wir schauen nochmals auf die Formulierung des ."; N /-Tests in Definition E. Dort erscheint die eigentliche Behauptung „jan & aj < "“ ganz am Schluss. Das ist logisch angemessen, da zuerst etwas über die in ihr vorkommenden Objekte n und " verfügt werden muss (und zwar mit Hilfe der Quantoren „es gibt“ und „für alle“). Andererseits ist diese Anordnung sprachlich etwas umständlich. Um hier flexibler zu werden, setzen wir gelegentlich die Verfügung „für alle n > N “ hinter die eigentlichen Behauptung, insbesondere dann, wenn diese beiden Dinge in einer Formelzeile
60
Kapitel 2 Reelle Zahlenfolgen
erscheinen, z.B. in (7). Manchmal wird dann der Kürze halber das Wort „alle“ weggelassen, wie z.B. in (2). Gemeint ist aber immer die logisch präzise Form mit Voranstellung der Quantoren-Verfügungen. (ii) Rein inhaltlich wird der ."; N /-Test aus Definition E häufig in leicht abgewandelter Form gebraucht, indem nämlich die Wendung „n > N “ durch „n % N “ ersetzt wird oder die Wendung „jan & aj < "“ durch „jan & aj . "“. Alle diese Umformu0 lierungen sind aber äquivalent. Aus ( )jan & aj . " für alle n >0 (N" )."/ folgt nämlich " 0 " jan & aj . 2 < " für alle n > N 2 , also auch für alle n % N 2 C 1. (iii) Als Formel aufgeschrieben lautet die komplette Definition E: (9) .an / konvergent W ()
9 a 2 R 8 " > 0 9 N 2 N 8 n > N W jan & aj < ":
Bei solchen formelmäßigen Formulierungen sollte die Reihenfolge der QuantorenVerfügungen genau eingehalten und auch die eigentliche Behauptung erst an den Schluss gesetzt werden. Dies hat den Vorteil, dass Verneinungen leicht formal zu bilden sind, indem die Quantoren 8 und 9 vertauscht und die eigentliche Behauptung negiert wird (Verneinungsmechanik). Z.B. ergibt sich so aus der Konvergenzdefinition (9) die Divergenzdefinition: (10) .an / divergent W ()
8 a 2 R 9 " > 0 8 N 2 N 9 n > N W jan & aj % ":
Das kann natürlich wieder sprachlich zurückformuliert werden als: Die Folge .an / ist divergent, wenn für alle a 2 R ein " > 0 existiert, sodass für alle N 2 N ein n > N existiert mit: jan & aj % ". Konvergente Folgen sind (neben den Körper- und Anordnungsoperationen) die wichtigsten Hilfsmittel, um Objekte der Analysis zu konstruieren. Soll eine reelle Zahl a wirklich konstruktiv erfasst werden (über ihre bloße Existenz hinaus), so wird dies i. Allg. nur möglich sein, indem man eine Folge .an / angibt, die gegen a konvergiert. Insbesondere ist die Dezimalbruch-Entwicklung einer reellen Zahl a nichts anderes als eine Folge rationaler Zahlen mit dem Grenzwert a; vgl. Abschnitt 2.8. Aufgaben und Anmerkungen 1. Man berechne
n7 C 3n C 4 : n!1 2n7 C 11 Lösungshinweis: Bei Ausdrücken dieser Art ist es günstig, mit einer geeigneten Potenz von n zu kürzen und dann die Rechenregeln aus Satz K anzuwenden: lim
4 3 1C 6 C 7 n7 C 3n C 4 n n &! 1 C 0 C 0 D 1 : D 11 2n7 C 11 2C0 2 2C 7 n
61
Abschnitt 2.2 Anwendung auf die Wurzelfunktion
2. Gegeben sei die Folge an D a)
1 C 3.&1/n n2 C 13n3 ; n D 1; 2 : : : . n3
Man zeige (wie in Aufgabe 1): lim an D 13. n!1
&5
b) Man gebe zu " D 10 ein N an, sodass gilt: jan & 13j < 10&5 für alle n > N . Dasselbe für " D 10&10 . 3. In Ergänzung der Rechenregeln aus Satz K beweise man: Gilt für zwei Folgen an &! a;
bn &! b;
so folgt max fan ; bn g &! max fa; bg min fan ; bn g &! min fa; bg: Lösungshinweis: Formel (12)[1.3]. 4. Für eine Folge .an / und ein q 2 Œ0; 1Œ gelte janC1 j . q ( jan j für alle n: Man zeige: lim an D 0. n!1
5. Das Resultat der Aufgabe 4 kann angewendet werden, um Nullfolgen zu erkennen: Man bildet den Quotienten ˇ ˇ ˇ anC1 ˇ ˇ ˇ ˇ a ˇ n und schaut, ob er durch eine Zahl q 2 Œ0; 1Œ nach oben beschränkt ist (eventuell ab einem festen Index n1 ). Ist dies der Fall, so folgt limn!1 an D 0 (Quotientenkriterium für Folgen). Damit zeige man z.B. für feste p 2 N und a 2 R: a)
lim np an D 0,
n!1
falls jaj < 1,
b)
an D 0, n!1 nŠ lim
c)
nŠ D 0. n!1 nn lim
2.2 Anwendung auf die Wurzelfunktion Wir haben früher schon betont, wie wichtig Folgen für Konstruktionen in der Analysis sind. Konstruktive Prozesse haben gegenüber abstrakten Überlegungen den Vorzug, dass sie komplett (oder zumindest ansatzweise) praktische Anweisungen enthalten. Sie stellen also eine wichtige Brücke zu den Anwendungen dar. Natürlich wird man
62
Kapitel 2 Reelle Zahlenfolgen
versuchen, Konstruktionen zugleich als Existenzbeweise zu gestalten. Diesem Prinzip folgen wir hier, zunächst für die Existenz der Quadratwurzel, in Kürze auch für die Existenz weiterer Grundobjekte wie der natürlichen Exponentialfunktion und der mathematischen Naturkonstanten e und &. Sei c eine positive reelle Zahl. Wenn man die Quadratwurzel von c einführen will, so geht es um die Frage nach den positiven Lösungen der Gleichung y 2 D c (c gegeben, y gesucht). Wir geben zunächst eine (unpräzise) Motivierung, wie man eine Lösung konstruieren kann, indem man Näherungslösungen weiter verbessert: Ist ˇ eine näherungsweise Lösung, also ˇ 2 ungefähr gleich c, so suchen wir eine exakte Lösung in der Form ˇ 0 ´ ˇ C d . Es soll also gelten: ˇ 02 D c, d.h. ˇ 2 C 2ˇd C d 2 D c. Da d klein sein wird, vernachlässigen wir hierin d 2 , bestimmen also d aus ˇ 2 C 2ˇd D c, 1 .c & ˇ 2 /. Wir vermuten, dass das zugehörige ˇ 0 eine bessere Näherung d.h. d D 2ˇ der Lösung ist als ˇ, wobei . / 1 c 1 2 0 .c & ˇ / D ˇC : ˇ ´ˇCd DˇC 2ˇ 2 ˇ Diese Vermutung wird sich bald bewahrheiten. Wendet man dann auf dies Näherungslösung das gleiche Verfahren erneut an u.s.w, so kann man hoffen, eventuell in der Grenze eine exakte Lösung zu erhalten. Auch dies wird sich gleich bestätigen. A. Satz. Zu jedem c > 0 existiert genau ein w > 0 mit w 2 D c. Beweis. Eindeutigkeit: Angenommen, es sei w 2 D c und v 2 D c. Aus w 2 D v 2 folgt w 2 & v 2 D 0, also .w & v/.w C v/ D 0. Wegen w C v > 0 folgt daraus w & v D 0, also w D v. Existenz: Dies erfolgt mit dem so genannten Heron-Verfahren, das durch die obige Vorüberlegung motiviert ist: Wir starten mit einer frei gewählten Zahl b > 0 und definieren eine Folge .bn /n%0 über das Rekursionsschema 8 ˆ < b0 ´ b (1) c 13 ˆ bn C ; für n % 0: : bnC1 ´ 2 bn Es handelt sich also um ein Iterationsverfahren. Klar ist, dass alle bn positiv und wohldefiniert sind (vollständige Induktion). Das Wichtigste ist der Nachweis, dass die so definierte Folge .bn / konvergiert. Ist dies getan, so kann man ihren Grenzwert g % 0 allein aus dem Rekursionsschema berechnen. Hiernach gilt ja durch Umstellen 2bn bnC1 D bn2 C c, woraus durch Grenzübergang
Abschnitt 2.2 Anwendung auf die Wurzelfunktion
63
n ! 1 folgt 2g 2 D g 2 C c. Dabei wurden die Regeln aus K[2.1] angewendet. Damit ist g 2 D c, insbesondere g > 0. Somit ist g die gesuchte Lösung w. Zur Konvergenz von .bn /: Zunächst ist die Folge .bn /n%1 monoton fallend. Um dies zu sehen, rechnet man mit Hilfe von (1) so: . / 1 c 1 1 c bn & bnC1 D bn & bn C D bn & 2 bn 2 2 bn . /2 c 1 bn&1 C &c 2 bn & c 4 bn&1 D D 2bn 2bn . /2 2 c c 2 bn&1 C 2c C 2 & 4c bn&1 & bn&1 bn&1 D % 0: D 8bn 8bn Zusammen mit bn > 0 ergibt sich nach O[2.1] die Konvergenz.
"
Im trivialen Fall c D 0 hat die Gleichung y 2 D 0 genau eine Lösung, nämlich 0, wie aus der Nullteilerfreiheit folgt. p 0 mit B. Definition. Für x > p 0 sei x die nach Satz A eindeutig bestimmte Zahl pw > C W R0 ! w 2 D x. Für x D 0 sei 0 ´ 0. Damit ist die Quadratwurzelfunktion R wohldefiniert. Das Symbol
p x wird als Wurzel x gesprochen.
C. Bemerkungen. (i) Da der Startwert b beim Heron-Verfahren beliebig ist, kann jedes der auftretenden bn als Startwert betrachtet werden, selbst wenn es zuvor falsch berechnet wurde (allerdings > 0 ist): Das Heron-Verfahren korrigiert sich also nach Rechenfehlern während der Iteration von selbst! (ii)
Allein aus der eindeutigen Existenz der Wurzel folgen die Regeln: r p p p p c1 c1 c1 ( c2 D c1 ( c2 ; Dp ; c2 c2
soweit die Argumente der Wurzelausdrücke, die so genannten Radikanden, nichtnegativ bzw. im Nenner positiv sind. Zum Nachweis überprüft man einfach, dass beide Seiten nichtnegativ sind und derselben Gleichung vom Typ y 2 D c genügen. Z.B. sind bei der zweiten Behauptung beide Seiten offensichtlich % 0, und das Quadrat der rechten Seite gleich . p /2 p c1 . c1 /2 c1 D D ; p p c2 . c2 /2 c2
64
Kapitel 2 Reelle Zahlenfolgen
sodass diese rechte Seite die definierenden Eigenschaften der linken Seite besitzt, also mit dieser übereinstimmt. (iii) Nach dem obigen Schluss bei der Eindeutigkeit pist die pLösungsmenge der Gleichung y 2 D x (x % 0 gegeben, y gesucht) gerade: f x; & xg, also bei x > 0 zweielementig.pMan unterscheide also scharf zwischen dem eindeutig definierten Wurzelausdruck x und der (i.Allg. zweielementigen) Lösungsmenge der Gleichung y 2 D x. (iv) Bei Brüchen, die im Zähler oder Nenner Quadratwurzeln enthalten, wird zur Umformung häufig der so genannte Wurzeltrick verwendet. Dieser besteht in Umformungen des Typs p a aD p ; a p p 1 aC b ; p D p a&b a& b
p a&b bDp p a Cpb p 1 a& b D p p a&b aC b p
a&
für a; b > 0 für a; b > 0; a ¤ b:
Gemeinsam ist diesen Formeln, dass mit der Summe bzw. der Differenz der Wurzeln erweitert wird, wenn ursprünglich die Differenz der Wurzeln vorhanpbzw.pdie Summe p p den war, und anschließend die Formel . a C b/. a & b/ D a & b Verwendung findet. Solche Umformungen sind oftmals sehr hilfreich. Beim Rechnen mit Wurzelausdrücken wird man sich an die definierende Eigenschaft und an die aufgestellten Regeln halten, wie sie in B und C(ii) formuliert sind. Das Heron-Verfahren (oder ein damit äquivalentes Verfahren) dient dem erforderlichen Existenzbeweis, bleibt aber später usw. im Hintergrund: Niemand pbei Umformungen p p denkt bei Rechnungen wie z.B. . 2 & 1/. 2 C 1/ D 1 daran, dass 2 mittels eines Iterationsverfahrens definierbar ist! Entsprechendes gilt allgemein, z.B. für die später zu behandelnde Exponentialfunktion: Mathematische Objekte sollten vor ihrer Verwendung sauber eingeführt, insbesondere existenzmäßig abgesichert werden. Bei der weiteren Handhabung gibt man aber den zugehörigen Regeln und Eigenschaften den Vorzug, besonders dann, wenn diese einfacher sind als der zuvor erbrachte Existenzbeweis. Trotzdem ist der Existenzbeweis nötig und sinnvoll, einmal vom Grundsätzlichen her, aber auch weil er u.U. konstruktive Elemente enthält, die für die Anwendung interessant sein können. Irrationalität von
p 2
Die Quadratwurzel liefert in unserem p Aufbau die ersten konkreten Beispiele für irrationale Zahlen. Der Beweis, dass 2 keine rationale Zahl sein kann, wurde bereits von Euklid geführt. Er stützt sich auf folgende einfache Tatsache: Jede natürliche Zahl n ist entweder gerade, d.h. von der Form n D 2m für ein m 2 N, oder aber ungerade, d.h. von der Form n D 2m & 1 für ein m 2 N. Euklids Beweis kann folgendermaßen beschrieben werden:
65
Abschnitt 2.2 Anwendung auf die Wurzelfunktion
p Angenommen, es wäre 2 D p=q mit p; q 2 N möglich. Dann können wir es einrichten, dass p und q nicht beide gerade sind, weil man sonst sukzessive durch 2 kürzen kann. Da beim Kürzen Zähler und Nenner p kleiner werden, endet dieses Kürzen nach endlich vielen Schritten. Nun folgt aus 2 D p=q durch Quadrieren und Multiplizieren 2q 2 D p 2 , also ist p 2 gerade, und damit auch p selbst. Denn aus p D 2m & 1 würde folgen p 2 D 2.2m2 & 2m/ C 1, also p ungerade. Somit ist p D 2p1 mit einem p1 2 N. Eintragen in 2q 2 D p 2 gibt 2q 2 D 4p12 , also q 2 D 2p12 . Dann ist nach dem gleichen Schluss auch q gerade, im Widerspruch zu der getroffenen Wahl von p; q. p Aus der Existenz der konkreten Irrationalzahl 2 in R folgt die Unvollständigkeit des rationalen Zahlkörpers Q: Wäre der Körper Q vollständig, so enthielte er nach dem gleichen Schluss wie für R die positive Lösung der Gleichung y 2 D 2, was ja gerade nicht möglich ist. Aufgaben und Anmerkungen p p p 1. Ist die Gleichung 4 C 2 3 D 1 C 3 richtig oder falsch?
p das arithmetische Mittel und ab das 2. Für nichtnegative Zahlen a; b heißt aCb 2 geometrische Mittel. Man beweise die Ungleichung vom arithmetischen und geometrischen Mittel p aCb ab . 2 p p durch Betrachtung des Ausdrucks . a & b/2 . Weiter zeige man, dass in dieser Ungleichung genau dann das Gleichheitszeichen steht, wenn a D b ist. r nC1 . Man zeige: lim wn D 1: 3. Sei wn ´ n!1 n Lösungshinweis: Die Differenz zum vermuteten Grenzwert 1 kann mit dem Wurzeltrick umgeformt werden: r p p nC1 nC1& n .n C 1/ & n Dp p &1D p p : n n n. n C 1 C n/ Hieraus folgt 0 < wn & 1 D p
1 n.n C 1/ C n
0 für a % 0, also f .a/ > 0
und
f .&a/ D
1 f .a/
für alle a 2 R:
' Ersetze in (U) a durch &a: Das gibt f .&a/ % 1 & a. Also ist somit f .a/ .
1 1&a
1 % 1 & a und f .a/
für alle a < 1:
' Vollständige Induktion liefert aus (F) für n 2 N und beliebige reelle Argumente ai : f .a1 C ( ( ( C an / D f .a1 / ( ( ( f .an /; speziell f .a/ D f
3a n
C ((( C
3 a -n aDf n n
für alle a 2 R; n 2 N;
wobei das Argument von f im zweiten Term aus n gleichen Summanden besteht. a 1 (das zweite für a < 1) das a durch und ' Ersetze in 1 C a . f .a/ . 1&a n schließe der Reihe nach: 3aa a 1 1C . f für < 1 . a n n n 1& n 3 a -n 3 1 jaj a -n . f . 3 für < 1: 1C -n a n n n 1& n Beim Übergang zur zweiten Zeile durch Potenzieren musste die neue Bedingung hinzugefügt werden, damit alle Terme positiv werden. Zusammen mit dem vorangehenden Punkt ergibt sich also: 3 a -n 1 1C . f .a/ . 3 a -n n 1& n
für n > jaj:
Der Funktionswert f .a/ ist damit in zwei Schranken eingeschlossen. Diese sind so gut, dass sie bei festem a in Abhängigkeit von n 2 N den Funktionswert beliebig genau annähern. Denn wir zeigen nun (unabhängig von der augenblicklichen Folgerungsserie):
Abschnitt 2.4 Anwendung auf die Exponentialfunktion und e
B. Lemma. Ist a 2 R, so bilden die Intervalle vallschachtelung für die n 2 N mit n > jaj.
71
h3 a -&n i a -n 3 eine Inter; 1& 1C n n
Beweis. 1) Es handelt sich wirklich um Intervalle; denn es bestehen die Äquivalenzen 3
1C
3 3 a -n 3 a -&n a -n 3 a -n a 2 -n . 1& () 1 C 1& . 1 () 1 & 2 . 1; n n n n n
und die letzte Ungleichung ist gewiss richtig. 2) Die linken Enden sind monoton wachsend für n > jaj: Um dies zu sehen, bildet man den Quotienten 3 0 a -nC1 a 1n 1C 1C 3 B nC1 nC1C 1C a Qn ´ D 3 @ A a a n nC1 1C 1C n n und macht die Umformung a a a a a a 1C & 1C C & 1 a n n.n C 1/ nC1 D n nC1 n D D 1& : a a a n.n C 1/ 1 C a 1C 1C 1C n n n n
1C
Dann folgt mittels der Bernoullischen Ungleichung 0 1 a a2 1 1 C3 a B Qn % @1 & D 1 C ( % 1; 1 C A a 2 nC1 1C nC1 .n C 1/ a C n n wobei zuletzt sogar > 1 steht, falls a ¤ 0. Die letzte Umformung ist etwas kunstvoll. Man kann sie aber durch eine elementare Rechnung bestätigen, indem man mit .n C 1/2 ( .a C n/ durchmultipliziert. Aus Qn % 1 folgt die Behauptung aufgrund der Definition von Qn . 3) ( Daa2) )nauch bei Ersatz von a durch( &a gilt )&n(immer n > jaj angenommen), ist auch 1 & n monoton wachsend, somit 1 & na monoton fallend für n > jaj. 4) Zur letzten Eigenschaft einer Intervallschachtelung: Die Differenz der Intervallenden geht für n ! 1 wirklich gegen 0; denn es gilt
3
1 1&
3
a -n
a -n & 1 C n n
3 a2 -n 1& 1& 2 n D 3 &! 0; a -n 1& n
72 3 da 1 & ist.
Kapitel 2 Reelle Zahlenfolgen a2 n2
-n
nach S[2.1] gegen 1 konvergiert und
1
n
.1& na /
nach 1) und 3) beschränkt "
Kombiniert man dieses Lemma mit dem Ergebnis der obigen Folgerungsserie, so ergibt sich: C. Folgerung. Es gibt höchstens eine Funktion f W R ! R mit den Eigenschaften (F) und (U) aus Satz A; denn für eine solche Funktion gilt notwendig: 3 a -n f .a/ D lim 1 C für alle a 2 R: " n!1 n Existenzbeweis für A. Wir definieren, angeregt durch den Eindeutigkeitsteil: 3 a -n f .a/ ´ lim 1 C n!1 n und haben zu bestätigen, dass für dieses f die Eigenschaften (F), (U) erfüllt sind. Der Grenzwert existiert jedenfalls nach Lemma B und ist > 0. Zu (F): Wir betrachten den
Dann wird:
f .a/f .b/ entsprechenden Quotienten der Folgenglieder f .a C 3b/ b -n a -n 3 1C 1C n n : cn ´ 3 a C b -n 1C n
1n ab 1n 0 aCb C 2 1 C B n n C D B1 C ab cn D @ A @ A &! 1; aCb aCb n2 1C 1C n n wobei wieder S[2.1] angewendet wurde. 0
1C
f .a/f .b/ f .a/f .b/ . Somit folgt D 1. f .a C b/ f .a C b/ ( )n Zu (U): Aufgrund der Bernoullischen Ungleichung gilt 1 C na % 1 C a, falls 1 C a > 0. Der Grenzübergang n ! 1 liefert hieraus sofort f .a/ % 1 C a. " n Andererseits gilt: cn !
D. Definition. Die durch Satz A festgelegte Funktion heißt die (natürliche) Exponentialfunktion exp W R ! R. Der Wert exp.a/ wird durch die Intervallschachtelung von Lemma B erfasst. Insbesondere gilt: 3 a -n exp.a/ D lim 1 C : n!1 n
Abschnitt 2.4 Anwendung auf die Exponentialfunktion und e
73
Die Eulersche Zahl e ist definiert als 3 1 -n e ´ exp.1/ D lim 1 C : n!1 n 46656 Hinweis: Für n D 6 liefert Lemma B die Abschätzung 2;5 < 11649 < e < 15625 < 46656 3;0. Eine genauere Berechnung erfolgt später mit feineren Hilfsmitteln; vgl. L(i)[8.3].
Aus (F) folgt für n 2 N: exp.n/ D exp.1 C ( ( ( C 1/ D .exp.1//n D e n , wobei im zweiten Argument n Summanden 1 stehen. Die Gleichung exp.n/ D e n gilt auch für 1 1 n D 0 (beide Seiten sind 1) und für &n 2 N, da exp.n/ D exp.&n/ D e#n D e n . Somit ist (1)
exp.n/ D e n
für n 2 Z:
Man schreibt deshalb als reine Konvention für alle x 2 R: exp.x/ µ e x : Dies ist zunächst eine andere Schreibweise; sie bedeutet an dieser Stelle noch nicht, dass e x irgendetwas mit dem Potenzieren von e zu tun hat – außer für x 2 Z gemäß (1). E. Definition (und Zusammenfassung). Man nennt exp auch e-Funktion. Diese hat alle Eigenschaften, die wir bisher für f aus Satz A festgestellt haben, insbesondere: (i)
e aCb D e a ( e b
(ii)
ea % 1 C a
(iii)
ea > 0
(iv)
ea .
1 1&a
(Additionstheorem)
für a < 1:
"
Auch die expliziten Konstruktionen gelten natürlich: (2)
3 1 x -n . ex . 3 1C x -n n 1& n
für n > jxj;
wobei die Schranken eine Intervallschachtelung bilden, die sich auf e x zusammenzieht. Bei der weiteren Behandlung werden wir uns nach Möglichkeit auf die Eigenschaften stützen (und weniger auf die expliziten Formeln). Dies entspricht dem modernen Trend in der Mathematik, möglichst nur die Eigenschaften der Objekte heranzuziehen.
74
Kapitel 2 Reelle Zahlenfolgen
Merkregel: Formal entsteht die obere Schranke in (2) aus der unteren, indem n durch &n ersetzt wird, und umgekehrt. Hinweis: Bei den klassischen Funktionen wie exp (später sin etc.) wird oft die Argumentklammer weggelassen. Man schreibt also exp.x/ µ exp x. Bei „größeren“ Argumenten, z.B. exp.a C b/, geht dies natürlich nicht! Eine andere Motivierung für die e-Funktion. Den strukturellen Zugang mittels Funktionalgleichung und Schrankenfunktion ergänzen wir durch folgende Motivierung, die wieder für „Bankleute“ von Interesse ist. Sei K0 ein Kapital zu Beginn einer Verzinsung, und sei ˛ der Zinssatz pro Jahr als richtiger Bruchteil (sodass z.B. 5% dem Wert ˛ D 0;05 entspricht). Die Vermehrung des Kapitals per Zinseszinsen erfolgt dann nach folgendem Schema, wobei immer mehr Zinstermine pro Jahr angenommen werden: Vermehrung von K0 nach t Jahren auf: K0 C ˛K0 t D K0 .1 C ˛t/ Bei 2 Zinsterminen nach t Jahren auf: . /. / / . ˛t 2 t t 1C˛ D K0 1 C K0 1 C ˛ 2 2 2 Bei 3 Zinsterminen nach t Jahren auf: . /. /. / . / t t t ˛t 3 1C˛ 1C˛ D K0 1 C K0 1 C ˛ 3 3 3 3 :: : Bei n Zinsterminen nach t Jahren auf: / . ˛t n . K0 1 C n Es ist anschaulich klar, dass die Verzinsung umso günstiger ist, je mehr Zinstermine pro Jahr erfolgen, da ja der Zinsgewinn immer früher bereits selbst wieder verzinst wird. Das monotone Anwachsen mit der Anzahl n der Zinstermine pro Jahr entspricht genau der obigen Monotonieaussage im Beweis von Lemma B. Die Frage ist natürlich, ob allein durch Vermehrung der Zinstermine beliebig hohe Gewinne zu machen sind.
75
Abschnitt 2.5 Anwendung auf den Arkustangens und &
Dem ist aber nicht so, wie der Grenzwert in D lehrt. Bei der stetigen Verzinsung, dem Grenzwert für n ! 1, hat das Endkapital nach t Jahren eben den endlichen Wert / . ˛t n D K0 e ˛t : lim K0 1 C n!1 n Bei Steigerung von t ist natürlich in allen Verzinsungsfällen ein beliebig großes Wachstum möglich. Aufgaben und Anmerkungen 1. Man zeige: a)
.13 '/ 1 -n 3 1 -nC1 Auch durch 1C wird eine Intervallschachtelung ; 1C n n n%1 definiert, die sich auf die Eulersche Zahl e zusammenzieht.
b) Für die zugehörigen Intervall-Längen `n gilt die Ungleichung `n . e=n und damit die Fehlerabschätzung 3 1 -n e 3 0 N g (diese Menge ist ¤ ¿, da stets '.k/ % k). Dann folgt aus ` > N1 zunächst '.`/ > '.N1 / > N , also ja'.`/ & aj < ". " D. Satz. Jede reelle Folge .an / besitzt eine monotone Teilfolge. Beweis. Wir nennen einen Index s 2 N eine Spitzenstelle der Folge .an /, wenn für alle j % s gilt: as % aj . Dies bedeutet anschaulich am Graphen, dass man vom Punkt .s; as / aus ungehindert nach rechts über alle Werte hinwegblicken kann; vgl. folgendes Bild:
R 1
2
3
4
5
6
84
Kapitel 2 Reelle Zahlenfolgen
Wir treffen folgende Fallunterscheidung (a), (b): (a) Es gibt unendlich viele Spitzenstellen, etwa s1 < s2 < ( ( ( . Dann ist .ask / eine monoton fallende Teilfolge von .an /. (b) Es gibt nur endlich viele Spitzenstellen (bzw. gar keine). Sei s0 die größte Spitzenstelle (bzw. s0 ´ 0). Dann existiert zu jedem k > s0 ein 4.k/ 2 N mit ak < a..k/ und 4.k/ > k. Definiere nun '.1/ ´ s0 C 1 sowie induktiv: '.k C 1/ ´ 4.'.k// für k % 1. Dann ist .a'.k/ / eine streng monoton wachsende Teilfolge von .an /, da '.k C 1/ D 4.'.k// > '.k/ und a'.kC1/ D a..'.k// > a'.k/ . " Durch Kombination dieses merkwürdigen Sachverhalts mit den Hauptsätzen über monotone Folgen N,O[2.1] ergibt sich sofort: E. Folgerung (Satz von Bolzano/Weierstraß). Jede beschränkte Folge besitzt eine (monotone und damit) konvergente Teilfolge. " Ein Problem bei Grenzübergängen ist, dass man den Grenzwert oft nicht kennt und auch nicht vermutet, sodass der ."; N /-Test aus E[2.1] nicht angesetzt werden kann. Der einzige universelle Ausweg ist das folgende Cauchy-Kriterium. F. Definition. Eine Folge .an / heißt konzentriert oder Cauchy-Folge, wenn gilt: Zu jedem " > 0 existiert ein N D N."/ 2 N, sodass für alle m; n > N gilt: jan & am j < ". Die eingerahmte Eigenschaft nennen wir den ."; N /-Test für Cauchy-Folgen. Dieser ist ganz ähnlich gebaut wie der ."; N /-Test für die Konvergenz. Der wesentliche Unterschied ist, dass hier die Folgenglieder beliebig nahe beieinander liegen, bei der Konvergenz aber beliebig nahe beim Grenzwert, wenn nur die Indizes hinreichend groß sind. Eine äquivalente Umformulierung des ."; N /-Test für Cauchy-Folgen lautet: Zu jedem " > 0 existiert ein N D N."/ 2 N, sodass gilt: n > N und m > N H) jan & am j < ": In formalisierter Form lautet der ."; N /-Test für Cauchy-Folgen: 8 " > 0 9 N 2 N 8 m; n > N W jan & am j < ": G. Lemma. Besitzt eine Cauchy-Folge .an / eine konvergente Teilfolge .a'.k/ /, so ist sie selbst konvergent (mit dem gleichen Grenzwert).
Abschnitt 2.6 Teilfolgen und das Kriterium von Cauchy
85
Beweis. Sei a'.k/ ! a. Wir zeigen an ! a: Dazu stellen wir folgende Vorausabschätzung mit zunächst freiem '.k/ auf jan & aj D jan & a'.k/ C a'.k/ & aj . jan & a'.k/ j C ja'.k/ & aj: Ist nun " > 0 gegeben, so existiert wegen der Konzentriertheit der Folge .an / ein N1 2 N mit " jan & a'.k/ j < ; falls n > N1 und '.k/ > N1 : 2 Außerdem gibt es wegen der Konvergenz der Teilfolge ein N2 2 N mit ja'.k/ & aj
max fN1 , N2 g fest gewählt. Dann gilt '.k/ % k > N1 und k > N2 . Also wird aufgrund der Vorausabschätzung die Größe jan & aj < "=2 C "=2 D ", falls n > N1 . " H. Satz (Cauchy-Kriterium). Eine reelle Folge konvergiert genau dann, wenn sie eine Cauchy-Folge ist. Beweis. Dieser zerfällt wie bei jedem „genau-dann-Satz“ in zwei Teile 1) und 2): 1) Sei an ! a vorausgesetzt. Zu zeigen ist die Gültigkeit des ."; N /-Tests. Wir verwenden als Vorausabschätzung: jan & am j D jan & a C a & am j . jan & aj C jam & aj: Zu gegebenem " > 0 existiert ein N 2 N, sodass für alle n > N gilt: jan & aj < "=2. Aus der Vorausabschätzung folgt also jan & am j < "=2 C "=2 D ", falls n; m > N . 2) Sei .an / als Cauchy-Folge vorausgesetzt. Das wichtigste ist die Konstruktion des Grenzwertes. Diese erfolgt, indem mittels Bolzano/Weierstraß (Satz E) eine konvergente Teilfolge konstruiert und dann Lemma G angewandt wird: Zunächst ist .an / beschränkt: Hierzu wählen wir " D 1. Dann existiert ein N 2 N mit: jan & am j < 1 für n; m > N . Für n > N erhalten wir daraus jan j . jan & aN C1 j C jaN C1 j < 1 C jaN C1 j, also jan j . max f1 C jaN C1 j; ja1 j; : : : ; jaN jg für alle n 2 N. Nach Bolzano/Weierstraß existiert also eine konvergente Teilfolge von .an /, und Lemma G führt direkt zum Ziel. " I. Bemerkung. Eine Variante der Cauchy-Eigenschaft in Definition F entsteht, wenn man in dem Ausdruck jan & am j das n als den kleineren der beiden Indizes ansieht und m als den größeren. Das geht, da dieser Ausdruck symmetrisch bzgl. n; m ist. Dann kann m in der Form m D n C p dargestellt werden, wobei es reicht, p 2 N zu
86
Kapitel 2 Reelle Zahlenfolgen
betrachten, da jan & an j D 0. Damit nimmt der ."; N /-Test für eine Cauchy-Folge die äquivalente Gestalt an: Zu jedem " > 0 existiert ein N D N."/ 2 N, sodass für alle n > N; p > 0 gilt: jan & anCp j < ". Solche „"-Definitionen“ haben wir bisher für die zwei grundlegenden Eigenschaften „konvergent“ und „konzentriert“ kennen gelernt. In ähnlicher Weise werden sie noch öfter auftauchen. Historisch gesehen, stehen sie am Ende einer langen Entwicklung und eines Ringens um die präzise Fassung von wichtigen und typischen Begriffen der Analysis. Auch die Begriffe des Supremums und Infimums, die wir im axiomatischen Aufbau der reellen Zahlen verwendet haben, lassen sich so formulieren, was gelegentlich gebraucht wird: J. Satz. Die Menge M , R sei nach oben beschränkt. Eine Zahl s 2 R ist dann und nur dann das Supremum von M , wenn sie die folgenden zwei Eigenschaften besitzt: (i) s ist eine obere Schranke von M ; (ii) Zu jedem " > 0 gibt es ein x 2 M mit x > s & ". Beweis. Es ist zu zeigen, dass (ii) mit der Eigenschaft: „s ist kleinste obere Schranke von M “ äquivalent ist. 1) Sei (ii) vorausgesetzt. Ist dann s 0 eine obere Schranke von M so gilt s . s 0 . Wäre nämlich s > s 0 , so gäbe es zu " ´ s & s 0 ein x 2 M mit x > s & " D s & .s & s 0 / D s 0 – im Widerspruch zur Schrankeneigenschaft von s 0 . Wegen s . s 0 ist s kleinste obere Schranke von M . 2) Sei s als kleinste obere Schranke von M vorausgesetzt und " > 0 gegeben. Wäre x . s & " für alle x 2 M , so wäre s & " eine obere Schranke von M , also s . s & ", was nicht stimmt. Somit ist (ii) erfüllt. " Spiegelbildlich gilt natürlich bzgl. des Infimums: K. Satz. Die Menge M , R sei nach unten beschränkt. Eine Zahl t 2 R ist dann und nur dann das Infimum von M , wenn sie die folgenden zwei Eigenschaften besitzt: (i) t ist eine untere Schranke von M ; (ii) Zu jedem " > 0 gibt es ein x 2 M mit x < t C ".
"
Wir nennen (ii) jeweils die Puffereigenschaft, weil durch sie ausgedrückt wird, was passiert, wenn man „von s aus ein wenig nach links rückt“ bzw. von „t aus ein wenig nach rechts rückt“.
Abschnitt 2.6 Teilfolgen und das Kriterium von Cauchy
87
$ Ein anderer Beweis für den Satz von Bolzano/Weierstraß Mittels Intervallschachtelungen kann der Satz von Bolzano/Weierstraß E neu bewiesen werden. Dabei verwenden wir die so genannte Halbierungsmethode. Bei dieser teilt man ein gegebenes abgeschlossenes Intervall I D Œa; b/ in die zwei gleich langen Teile I 0 ´ Œa; .a C b/=2/ und I 00 ´ Œ.a C b/=2; b/ und sucht nach einer Vererbungsstrategie von I auf eines der Teilintervalle I 0 oder I 00 . Dies wird dann rekursiv wiederholt. Ist .an / die gegebene beschränkte Folge, so gelingt das hier wie folgt: Es sei I0 ein abgeschlossenes Intervall, in dem alle Folgenglieder an enthalten sind. In mindestens einem der Intervalle I00 ; I000 liegen dann unendlich viele Folgenglieder. Dieses Intervall heiße I1 . Das „unendlich“ bezieht sich dabei auf die Indizes; d.h. die Menge der n 2 N mit an 2 I1 ist nicht endlich. Es sei ein a'.1/ % 1 in I1 gewählt. Diese Vererbung wird genauso induktiv weitergeführt: Ist das Intervall Ik mit a'.k/ 2 Ik schon gewählt, so sei IkC1 eines der beiden Intervalle Ik0 ; Ik00 , indem unendliche viele Folgenglieder liegen und ein a'.kC1/ 2 IkC1 mit '.k C1/ > '.k/ gewählt. Die Intervalle I0 ; I1 ; I2 ; : : : bilden dann wegen der jeweils halbierten Länge eine Intervallschachtelung, wobei stets a'.k/ 2 Ik gilt. Hieraus folgt nach dem Einschnürungsprinzip, dass die Folge .a'.k/ / konvergiert. Aufgaben und Anmerkungen 1. Folgt aus anC1 & an ! 0, dass die Folge .an / konvergiert? 2. Für zwei Teilfolgen .a'.k/ / und .a..k/ / der reellen Zahlenfolge .an /n2N sei bekannt lim a'.k/ D a; lim a..k/ D a k!1
k!1
sowie N D .Bild '/ [ .Bild 4/, d.h. jedes n 2 N kommt als ein '.k/ oder ein 4.k/ vor. Man zeige lim an D a: n!1
3. Sei .an / eine reelle Zahlenfolge, sodass mit festen c % 0 und q 2 Œ0; 1Œ gilt: janC1 & an j . c ( q n
für alle n 2 N:
Man beweise: Die Folge .an / konvergiert, und gegenüber dem Grenzwert a gilt die Fehlerabschätzung qn : jan & aj . c ( 1&q Lösungshinweis: Man schreibe an & anCp als Teleskopsumme und wende die geometrische Summenformel (9)[1.3] sowie das Cauchy-Kriterium in der Variante I an.
88
2.7
Kapitel 2 Reelle Zahlenfolgen
$ Limes superior und Limes inferior
Eine beschränkte Folge kann unter Umständen sehr viele konvergente Teilfolgen enthalten. Die im Titel genannten Begriffe bringen etwas Ordnung in diese Vielfalt, indem sie den größten und den kleinsten der dabei auftretenden Grenzwerte aussondern. In diesem Abschnitt werden ausschließlich reelle Zahlenfolgen betrachtet, da stark von der Anordnung in R Gebrauch gemacht wird. Erfahrungsgemäß stoßen die genannten Begriffe beim Anfänger auf gewisse Verständnisprobleme. Allerdings werden sie im ganzen Kurs auch nur an einer Stelle benötigt, nämlich beim Konvergenzradius von Potenzreihen, und sie können selbst dort durch einfachere Konstruktionen ersetzt werden. Daher ist es möglich, vom vorliegenden Abschnitt nur die folgende Definition eines Häufungswerts zu lernen und den Rest später nachzuholen. A. Definition. Eine Stelle b 2 R heißt Häufungswert der Folge .an /, wenn es eine Teilfolge .a'.k/ / gibt mit lim a'.k/ D b. k!1
B. Beispiele. (i)
Ist die Folge .an / konvergent mit dem Grenzwert a so ist a Häufungswert der Folge. Tatsächlich ist a ihr einziger Häufungswert; denn nach C[2.6] besitzt jede Teilfolge von .an / den Grenzwert a. . / 1 n (ii) Betrachte die Folge an ´ .&1/ 1 C . n n ungerade
n gerade
-1
0
1
Hier ist 1 ein Häufungswert, ebenso &1, und das sind bei dieser Folge auch die einzigen Häufungswerte. C. Satz und Definition. Die reelle Folge .an / sei nach oben beschränkt und habe mindestens einen Häufungswert. Dann besitzt die Menge H aller Häufungswerte von .an / ein Maximum, genannt Limes superior von .an /, geschrieben: lim an ´ max H:
n!1
Außerdem gilt: (C $ ) Zu jedem " > 0 existiert ein N 2 N, sodass für alle n > N gilt: an < max H C ".
Abschnitt 2.7
$ Limes superior und Limes inferior
89
Beweis. Sei c eine obere Schranke von .an /. Ist .a'.k/ / eine Teilfolge von .an /, so ist c auch obere Schranke von .a'.k/ /. Somit gilt b . c für jeden Häufungswert b. Also ist c obere Schranke für H , also existiert s ´ sup H 2 R. 1) Wir beweisen zunächst (C $ ) mit s anstelle max H : (C $$ ) Zu jedem " > 0 existiert ein N 2 N, sodass für alle n > N gilt: an < s C ". Wäre dies falsch, so existierte ein " > 0 und eine Teilfolge .a'.k/ / mit a'.k/ % s C ", also mit s C " . a'.k/ . c für alle k. Nach Bolzano/Weierstraß besäße dann .a'.k/ / eine Teilfolge mit Grenzwert g 2 Œs C "; c/. Da diese Teilfolge auch Teilfolge von .an / ist, wäre g Häufungswert von .an / und g > s, Widerspruch! 2) s ist Häufungswert von .an / (also s 2 H ): Setze k1 .0/ ´ 0 und definiere induktiv natürliche Zahlen k1 .1/; k1 .2/; : : : auf folgende Weise: Zu n 2 N setze man in (C $$ ): " D n1 . Dann existiert ein k0 .n/ 2 N mit 1 für alle k > k0 .n/: ak < s C n Unter den k mit k > k0 .n/ und k > k1 .n & 1/ existiert ein k1 .n/ 2 N mit s & n1 < ak1 .n/ (sonst wäre s & n1 obere Schranke von H). Es gilt dann k1 .n/ > k1 .n & 1/ und s&
1 1 < ak1 .n/ < s C n n
für alle n 2 N:
Somit ist .ak1 .n/ / eine Teilfolge mit ak1 .n/ ! s. Also ist s Häufungswert von .an /, somit s 2 H und s D max H . " Spiegelbildlich gilt analog: D. Satz und Definition. Die reelle Folge .an / sei nach unten beschränkt und habe mindestens einen Häufungswert. Dann besitzt die Menge H aller Häufungswerte von .an / ein Minimum, genannt Limes inferior von .an /, geschrieben: lim an ´ min H:
n!1
Außerdem gilt: (D $ ) Zu jedem " > 0 existiert ein N 2 N, sodass für alle n > N gilt: an > min H & ". " Wir nennen (C $ ) bzw. (D $ ) wieder die Puffereigenschaft, weil damit ausgedrückt ist, was die Folgenglieder tun, wenn man vom Limes superior „ein wenig“ nach rechts bzw. vom Limes inferior „ein wenig“ nach links rückt.
90
Kapitel 2 Reelle Zahlenfolgen
E. Satz. Für jede reelle Folge .an / gilt die Äquivalenz: .an / konvergent () .an / beschränkt und lim an D lim an : n!1
n!1
Ist .an / konvergent, so gilt lim an D lim an D lim an : n!1
n!1
n!1
Beweis. Zu H) : Ist die Folge .an / konvergent, so ist sie beschränkt und besitzt nach Bolzano/Weierstraß mindestens einen Häufungswert. Da alle Teilfolgen den gleichen Grenzwert haben, stimmen maximaler und minimaler Häufungswert überein. Zu (H : Nach Voraussetzung und Bolzano/Weierstraß ist die Menge H der Häufungspunkte nichtleer. Nimmt man (C $ ) und (D $ ) zusammen, so sieht man, dass .an / gegen den gemeinsamen Wert max H D min H konvergiert. " ( ) F. Beispiel. Für die Folge an ´ .&1/n 1 C n1 aus B(ii) ist die Menge H der Häufungspunkte zweielementig und limn!1 an D 1 sowie limn!1 an D &1. Hieran erkennt man auch, dass die Eigenschaft (C $ ) zwar für max H erfüllt, dafür aber nicht kennzeichnend ist; denn z.B. gilt auch: Zu jedem " > 0 existiert ein N 2 N (nämlich N D 1), sodass für alle n > N gilt: an < 2 C ". Analoges kann man über die Eigenschaft (D $ ) sagen. Charakterisierende "-Bedingungen werden in den nachstehenden Aufgaben 1 und 2 formuliert; sie werden aber im Folgenden nicht gebraucht. An dieser Stelle sollen die Begriffe Limes superior und Limes inferior nicht weiter ausgebaut werden, da das Bisherige ausreicht. Dem Anfänger sei empfohlen, sich zunächst an die Maximumdefinition des Limes superior in C und die Minimumdefinition des Limes inferior in D zu halten. Übrigens sind die Begriffe Limes superior und Limes inferior deutlich zu trennen von den Begriffen Supremum und Infimum: Limes superior und Limes inferior beziehen sich auf Folgen, Supremum und Infimum auf Teilmengen in R. Auch beim Supremum bzw. Infimum von Mengen scheint das einfachste Verständnis in den ursprünglichen Definitionen (als kleinste obere bzw. größte untere Schranke) zu liegen. Aufgaben und Anmerkungen 1. Für eine beschränkte Folge .an /n2N gilt stets inf an . lim an . lim an . sup an : n!1
n!1
Hier bezeichnet inf an bzw. sup an das Infimum bzw. Supremum der Bildmenge fan j n % 1g. Man gebe eine beschränkte Folge an, für die in der obigen Ungleichungskette überall das Kleinerzeichen steht.
Abschnitt 2.7
$ Limes superior und Limes inferior
91
2. Die Folge .an / sei nach oben beschränkt. Die Zahl s 2 R ist dann und nur dann der Limes superior von .an /, wenn für jedes " > 0 folgende zwei Bedingungen erfüllt sind: (i)
die Menge fn 2 N j an > s & "g ist unendlich;
(ii) die Menge fn 2 N j an > s C "g ist endlich. 3. Die Folge .an / sei nach unten beschränkt. Die Zahl t 2 R ist dann und nur dann der Limes inferior von .an /, wenn für jedes " > 0 folgende zwei Bedingungen erfüllt sind: (i)
die Menge fn 2 N j an < t C "g ist unendlich;
(ii) die Menge fn 2 N j an < t & "g ist endlich. 4. $ Für eine nach oben beschränkte Folge .an / sei sk ´ sup fakC1 ; akC2 ; : : :g: Für eine nach unten beschränkte Folge .an / sei tk ´ inf fakC1 ; akC2 ; : : :g; jeweils für k 2 N. Man zeige: a) Die Folge .sk / ist monoton fallend und genau dann konvergent, wenn .an / einen Häufungswert hat. In diesem Fall gilt lim sk D lim an :
k!1
n!1
b) Die Folge .tk / ist monoton wachsend und genau dann konvergent, wenn .an / einen Häufungswert hat. In diesem Fall gilt lim tk D lim an :
k!1
n!1
5. Für eine beschränkte Folge .an / gilt das „Spiegelungsprinzip“ lim .&an / D & lim an ;
n!1
n!1
lim .&an / D & lim an :
n!1
n!1
92
2.8
Kapitel 2 Reelle Zahlenfolgen
$ Dezimaldarstellung
Wir wollen mit Intervallschachtelungen diskutieren, wie reelle Zahlen durch Dezimaldarstellungen erfasst werden können. Zunächst betrachten wir reelle Zahlen im Intervall Œ0; 1Œ. Ein Dezimalbruch in Œ0; 1Œ ist nichts anderes als eine gewisse Summe aus Vielfachen der Potenzen 10&j ; z.B. 0;3402 ´
4 0 2 3 C C C D 3 ( 10&1 C 4 ( 10&2 C 0 ( 10&3 C 2 ( 10&4 : 10 100 1000 10000
A. Definition. Ein Dezimalbruch in Œ0; 1Œ ist eine reelle Zahl der Form k1 ( 10&1 C k2 ( 10&2 C ( ( ( C kn ( 10&n mit n 2 N und kj 2 f0; 1; : : : ; 9g. Die Zahlen 0; 1; : : : ; 9 heißen in diesem Zusammenhang Ziffern. Tatsächlich liegt jede reelle Zahl dieser Form in Œ0; 1Œ; denn sie ist offensichtlich nichtnegativ und nach oben beschränkt durch 9 ( 10&1 C 9 ( 10&2 C ( ( ( C 9 ( 10&n D 9 ( 10&1 .1 C 10&1 C 10&2 C ( ( ( C 10&.n&1/ / D 9 ( 10&1 (
1 1 & 10&n < 9 ( 10&1 ( D 1: &1 1 & 10 1 & 10&1
Hierbei wurde die geometrische Summenformel D[1.3] angewendet. Natürlich ist nicht jede reelle Zahl in Œ0; 1Œ gleich einem Dezimalbruch; denn ein solcher ist ja eine (spezielle) rationale Zahl. Aber mit Dezimalbrüchen kann jede reelle Zahl in Œ0; 1Œ beliebig genau approximiert werden: B . Satz (Dezimalbruch-Entwicklung). Zu jeder reellen Zahl a 2 Œ0; 1Œ existiert genau eine Folge k1 ; k2 ; : : : in f0; 1; : : : ; 9g, sodass für die Dezimalbrüche an ´ k1 ( 10&1 C k2 ( 10&2 C ( ( ( C kn ( 10&n T gilt: .Œan ; an C 10&n //n2N ist eine Intervallschachtelung mit n2N Œan ; an C 10&n Œ D fag.
(1)
Beweis. Existenz: Die gesuchten Ziffern werden induktiv erzeugt. Im ersten Schritt * * * &1 * &1 Œ0; teilt man das Intervall 1Œ in 10 gleich lange Teile: 0; 10 ; 10 ; 2 ( 10&1 ; : : : ; * * &1 in*genau einem dieser Intervalle der Länge 10&1 etwa a 2 *9 ( 10 &1; 1 . Dann&1liegt a &1 k1 ( 10 ; k1 ( 10 C 10 . Dadurch ist k1 2 f0; 1; : : : ; 9g bestimmt. Man setzt a1 ´ k1 ( 10&1 . Seien nun k1 ; : : : ; kn 2 f0; 1; : : : ; 9g bereits fixiert, sodass für an ´ k1 ( 10&1 C k2 ( 10&2 C ( ( ( C kn ( 10&n
gilt: a 2 Œan ; an C 10&n Œ :
Abschnitt 2.8
$ Dezimaldarstellung
93
Dann wird das letztgenannte Intervall der Länge 10&n wiederum in 10 gleich lange Teile geteilt, und man erhält auf dieselbe Weise wie im ersten Schritt die Existenz einer wohlbestimmten Ziffer knC1 , sodass h h für anC1 ´ an C knC1 ( 10&.nC1/ gilt: a 2 anC1 ; anC1 C 10&.nC1/ : Die Intervalle Œan ; an C 10&n /, n D 1; 2; : : :, bilden eine Intervallschachtelung mit (2)
an . a < an C 10&n :
Tatsächlich ist die Folge der linken Enden an aufgrund der Konstruktion monoton wachsend und die Folge der rechten Enden bn ´ an C 10&n monoton fallend; denn es ist bn & bnC1 D an C 10&n & anC1 & 10&.nC1/ D &knC1 ( 10&.nC1/ C 10&n & 10&.nC1/ D 10&n & .knC1 C 1/10&.nC1/ % 0: Aufgrund von (2) zieht sich die Intervallschachtelung auf a zusammen, wobei wegen des echten Kleinerzeichens in der zweiten Ungleichung a auch im Durchschnitt der zugehörigen halboffenen Intervalle liegt. Eindeutigkeit: Gilt für das gleiche a mit weiteren Ziffern kj0 und aus diesen analog * * T gebauten an0 : n2N an0 ; an0 C 10&n D fag, so erkennt man die gleichen Monotonieaussagen wie für die obigen ungestrichenen Größen. Die zugehörigen abgeschlossenen Intervalle bilden dann wiederum eine Intervallschachtelung. Wegen an0 . a < an0 C 10&n haben die kj0 die gleiche Eigenschaft wie die kj bezüglich der jeweiligen " Zerlegung in 10 gleich lange Teilintervalle, sodass stets kj D kj0 folgt. Die Ziffern k1 ; k2 ; k3 : : :, die der reellen Zahl a 2 Œ0; 1Œ nach B zugeordnet sind, bestimmen rückwärts das a eindeutig (vermöge der obigen Intervallschachtelung). Man schreibt üblicherweise: (3)
a D 0;k1 k2 k3 : : :
und nennt das die Dezimalbruch-Entwicklung von a. Wenn alle Ziffern nach einem Index m % 1 verschwinden: kj D 0 für j > m, so schreibt man statt (3) (4)
a D 0;k1 k2 k3 : : : km :
In diesem Fall stimmt a mit am überein, da sich die aj ab m nicht mehr ändern und andererseits gegen a konvergieren. Somit ist eine abbrechende DezimalbruchEntwicklung wie in (4) wertemäßig dasselbe wie ein Dezimalbruch. Natürlich können in einem solchen Endziffern, die gleich 0 sind weggelassen oder auch hinzugefügt werden. Wenn alle Ziffern verschwinden, so sind alle an D 0 und ebenso a D 0, und anstelle von (4) kann man einfach a D 0 schreiben.
94
Kapitel 2 Reelle Zahlenfolgen
Als Dezimaldarstellung gemäß Satz B kommt nicht jede Ziffernfolge vor. Es fehlen diejenigen Folgen .kj /, bei denen ab einem Index ` % 1 alle Ziffern gleich 9 sind: kj D 9 für j % `. Für eine solche Folge würde nämlich gelten an D a`&1 C
n X
9 ( 10&j
für alle n % `;
j D`
wobei im Falle ` D 1: a&1 ´ 0 gesetzt ist. Mittels der geometrischen Summenformel folgte hieraus an D a`&1 C 9 ( 10&` (
n&` X
10&j D a`&1 C 9 ( 10&` (
j D0
1 & 10&.n&`C1/ ; 1 & 10&1
also durch Grenzübergang n ! 1 a D a`&1 C 9 ( 10&` (
1 D a`&1 C 10&.`&1/ ; 1 & 10&1
im Widerspruch zu a < a`&1 C 10&.`&1/ . Diese Folgen mit „Neunerschwanz“ sind allerdings die einzigen Ausnahmen. Wir zeigen nämlich C. Satz. Sei k1 ; k2 ; : : : eine Folge in f0; 1; : : : ; 9g, sodass zu jedem ` 2 N ein j > ` existiert mit kj < 9. Dann existiert genau eine reelle Zahl a 2 Œ0; 1Œ mit a D 0;k1 k2 k3 : : :. Beweis. Existenz: Um a zu konstruieren setzen wir zunächst für n 2 N an ´ k1 ( 10&1 C k2 ( 10&2 C ( ( ( C kn ( 10&n : Die Folge .an / ist offensichtlich monoton wachsend. Sie ist auch nach oben beschränkt. Das sieht man, indem man die kj durch 9 ersetzt und wieder die geometrische Summenformel D[1.3] anwendet. Tatsächlich kann man etwas genauer abschätzen, indem man bei gegebenem n einen Summanden, etwa den zum Index `, stehen lässt und nur in den übrigen Summanden kj durch 9 ersetzt. Das gibt dann an . 1 & .9 & k` /10&`
(5)
für n % `:
Somit existiert (6)
a WD lim an : n!1
Aus an % 0 und (5) folgt durch Grenzübergang n ! 1: a % 0;
a . 1 & .9 & k` /10&`
für alle ` 2 N;
Abschnitt 2.8
$ Dezimaldarstellung
95
insbesondere a 2 Œ0; 1Œ, da mindestens ein k` < 9 ist. Genau wie oben überprüft man, dass die Intervalle Œan ; an C 10&n / eine Intervallschachtelung bilden, die sich wegen (6) auf a zusammenzieht. Es gilt also an . a . an C 10&n für alle n 2 N. Tatsächlich steht in der zweiten Ungleichung niemals das Gleichheitszeichen. Wäre nämlich a D a` C 10&` für ein ` 2 N, so wäre die Folge der an C 10&n ab ` konstant, da sie monoton fallend gegen a konvergiert. Aus aj C 10&j D aj C1 C 10&.j C1/ für j % ` folgte dann durch Einsetzen von aj C1 D aj C kj C1 ( 10&.j C1/ und leichtes Umstellen: kj C1 D 9 für alle j % `, im Widerspruch zur Voraussetzung. Damit gilt an . a < an C 10&n für alle n 2 N, und die gleichen Argumente wie oben beim Eindeutigkeitsbeweis von B zeigen, dass das so konstruierte a tatsächlich die Dezimalbruch-Entwicklung 0; k1 k2 k3 : : : besitzt. Eindeutigkeit: Nach dem zuvor Gesagten ist die Eindeutigkeit von a klar.
"
D. Bemerkungen (algorithmische Fassungen). (i) Das induktive Verfahren vom Beginn des Beweises zu B kann als Rekursionsschema ausgesprochen werden: ( k1 D Œ10a/; a1 D k1 ( 10&1 (7) knC1 D Œ10nC1 .a & an //; anC1 D an C knC1 ( 10&.nC1/ ; n D 1; 2; : : : Dies folgt unmittelbar aus den dortigen Bedingungen, die die kn und an bestimmen. Dieses Schema dient also zur Bestimmung der Ziffernfolge k1 ; k2 ; : : : für eine Zahl a 2 Œ0; 1Œ, wobei die an mitgeliefert werden. (Die eckige Klammer bezeichnet das Größteganze.) (ii) Führt man „Reste“ rn ein in Gestalt von (8)
a µ r1 ( 10&1 ;
a & an µ rnC1 ( 10&.nC1/ ;
n D 1; 2; : : :
so kann man das Rekursionsschema (7) auf die kn , rn (anstelle der kn , an ) umschreiben: ( r1 D 10a; k1 D Œr1 / (9) rnC1 D 10.rn & kn /; knC1 D ŒrnC1 /; n D 1; 2; : : : Die ersten beiden Gleichungen von (7) gehen gerade in die ersten beiden Gleichungen von (9) über. Die vierte Gleichung von (7) verwandelt sich in rnC2 D 10.rnC1 &knC1 / für n % 1, also in rnC1 D 10.rn & kn / für n % 2, und für n D 1 ist dies ebenfalls richtig. Das liefert die dritte Gleichung von (9). Schließlich ist die vierte Gleichung von (9) nichts anderes als die dritte Gleichung von (7). Das Schema (9) dient also ebenfalls zur Bestimmung der Ziffernfolge k1 ; k2 ; : : : für a 2 Œ0; 1Œ, wobei diesmal die rn mitgeliefert werden. Wegen kn D Œrn / für n % 1
96
Kapitel 2 Reelle Zahlenfolgen
liegen die reellen Zahlen rn alle im Intervall Œ0; 10Œ. Mittels (8) kann man natürlich die rn und die an stets ineinander umrechnen. Im Fall, dass a rational ist, entspricht die Rekursion (9) übrigens genau den Schritten, die beim „Schulverfahren“ der Division zweier natürlicher Zahlen auftreten. Ist statt a 2 Œ0; 1Œ eine natürliche Zahl Z gegeben, so kann deren Dezimaldarstellung aus der obigen Dezimalbruch-Entwicklung hergeleitet werden. Dazu stellt man zunächst die kleinste Zehnerpotenz fest, die Z übertrifft: n ´ min fj 2 N j Z < 10j g: Dann gilt 10n&1 . Z < 10n , also 10&1 . Z ( 10&n < 1. Auf a ´ Z ( 10&n kann dann Satz B angewandt werden und liefert a D Z ( 10&n D 0;k1 k2 : : : kn knC1 : : : : E. Lemma. In dieser Situation gilt knC1 D knC2 D ( ( ( D 0;
k1 > 0:
Beweis. Nach (2) gilt für p % 1: anCp . a D Z ( 10&n < anCp C 10&.nCp/ , also nach Multiplikation mit 10n nCp X
eC Z
eC kj ( 10n&j . Z < Z
j DnC1
e´ Z
n X
nCp X
e C 1; kj ( 10n&j C 10&p . Z
j DnC1
kj ( 10&j ( 10n 2 N0 ;
j D1
wobei die letzte Abschätzung wieder dadurch entsteht, dass die betreffenden kj durch 9 ersetzt und die geometrische Summenformel angewandt wird. Wäre nun ein kj mit e n gleich null und Z D Z, (10)
ZD
n X
kj ( 10n&j D k1 ( 10n&1 C k2 ( 10n&2 C ( ( ( C kn ( 1;
k1 > 1:
j D1
Dabei ist die Ziffer k1 ¤ 0, denn sonst wäre Z . 9 ( 10n&2 C ( ( ( C 9 ( 1 < 10n&1 , im Widerspruch zur minimalen Wahl von n. " F . Folgerung. Zu jeder natürlichen Zahl Z 2 N gibt es ein n 2 N und Ziffern k1 ; : : : ; kn mit (10). Sowohl n wie auch diese Ziffern sind durch Z eindeutig bestimmt. Man schreibt Z D k1 : : : kn und nennt dies die Dezimaldarstellung von Z (mit der Stellenzahl n).
Abschnitt 2.8
$ Dezimaldarstellung
97
Beweis. Die Existenz ist durch die Vorüberlegung gesichert. Die Eindeutigkeit überlegt man ganz leicht so: Aus (10) folgt durch die übliche Abschätzung: 10n&1 . Z < 10n , sodass n zwangsläufig das obige Minimum ist. Aus Z D k1 : : : kn D k10 : : : kn0 folgt 0;k1 : : : kn D 0;k10 : : : kn0 , also nach Satz B: k1 D k10 , . . . , kn D kn0 . " Ist eine positive reelle Zahl r D Z C a die Summe aus einer natürlichen Zahl Z mit der Dezimaldarstellung Z D k1 : : : kn , entsprechend F, und einem a 2 Œ0; 1Œ mit der Dezimalbruch-Entwicklung a D 0;k&1 k&2 : : : (in leicht geänderter Symbolik), so verwendet man als Dezimaldarstellung von r üblicherweise r D k1 : : : kn ;k&1 k&2 : : :, wobei in dem Teil nach dem Komma ggf. wie oben abgebrochen wird. Bei negativen reellen Zahlen s wird r ´ &s so dargestellt und dann davor ein Minuszeichen gesetzt. Z.B. ist & 54 D &1;25, da 45 D 1;25. Für die Null kann man als Dezimaldarstellung 0 (oder auch 0;00 : : : mit endlich oder unendlich vielen Nullen nach dem Komma) verwenden. (Im angelsächsischen Bereich wird das Komma durch einen Punkt ersetzt.) Im Abschnitt über Reihen 8.1 werden wir die Dezimaldarstellungen auch als Reihen schreiben und dann weitere Eigenschaften ableiten. Aufgaben und Anmerkungen 1. Man überlege, dass die Rekursion (9) im Falle a 2 Q \ Œ0; 1Œ dem üblichen elementaren Divisionsverfahren entspricht, etwa zunächst anhand des Beispiels a ´ 67 . „Schulmäßig“ startet das so, wie links gezeigt, während rechts die Werte aus der Rekursion stehen: 6 : 7 = 0,8571. . . 60 56 __ 40 35 __ 50 49 __ 10 :: :
60 ; 7 / . 40 60 r2 D 10 &8 D ; 7 7 / . 50 40 &5 D ; r3 D 10 7 7 . / 50 10 r4 D 10 &7 D ; 7 7 :: : r1 D
k1 D 8 k2 D 5 k3 D 7 k4 D 1 :: :
Dem schulmäßigen „Herunterholen“ oder „Hinzufügen“ der 0 entspricht die Multiplikation mit 10 in der linken Hälfte des Schemas (9). 2. Der Satz F über die Dezimaldarstellung einer natürlichen Zahl Z kann auch unabhängig von der Dezimalbruch-Entwicklung begründet werden.
98
Kapitel 2 Reelle Zahlenfolgen
Eine begrifflich Möglichkeit besteht darin, *die Existenz und Eindeutigkeit der Darstel* lung der Reihe nach für Z 2 10n&1 ; 10n zu betrachten und vollständige Induktion für n D 1; 2; : : : durchzuführen. Algorithmisch ergibt sich die Existenz, indem man wie oben n als n ´ min fj 2 N j Z < 10j g definiert und das (abbrechende) Rekursionsschema anwendet: 8 ˆ ˆ
10, so benötigt man allerdings zum Aufschreiben dieser Darstellung neue Zeichen für die Ziffern von 10 bis g & 1. Z.B. werden in der Informatik für g D 2 das Dualsystem mit den Ziffern 0; 1 und für g D 16 (dezimal) das Hexadezimalsystem mit den Ziffern 0; 1; 2; 3; 4; 5; 6; 7; 8; 9; A; B; C; D; E; F verwendet. Man übertrage die obigen Aussagen über die Dezimaldarstellung einschließlich Aufgabe 2 auf eine Grundzahl g > 1. Das kann fast automatisch geschehen, indem überall 10 durch g und dementsprechend 9 durch g & 1 ersetzt wird. Trotzdem überlege man bei jedem Schritt nochmals die Korrektheit.
3
Reelle Funktionen und ihre Grenzwerte
Funktionen sind aus dem täglichen Leben und aus unserem Weltbild nicht mehr wegzudenken. Sei es, dass man zu jedem Zeitpunkt t die Temperatur f .t/ an einer bestimmten Stelle (z.B. auf der Zugspitze) angeben möchte, sei es dass zu jedem Buch b sein Preis f .b/ bekanntgemacht werden soll, sei es, dass zu jeder Länge ` einer Feder ihre Zugkraft f .`/ bestimmt ist, usw. Diese Beispiele ließen sich beliebig vermehren. Es geht nun darum, solche Abhängigkeiten mathematisch zu erfassen und zu studieren. Die entsprechende Abstraktion ist der Begriff einer Abbildung f W X ! Y . Durch sie wird jedem Element x einer Menge X genau ein Element f .x/ einer Menge Y zugeordnet. Über die einschlägigen formalen Begriffe und Bezeichnungen kann sich der Leser im Anhang kundig machen, wobei im Augenblick davon nur ganz wenig gebraucht wird. In diesem Kapitel geht es vor allem um reelle Funktionen, das sind Abbildungen vom Typ f W A ! R, wobei A selbst eine Teilmenge von R ist. Jeder reellen Zahl x 2 A ist dann eine reelle Zahl f .x/ zugeordnet. Definitions- bzw. Zielmenge ist A bzw. R, und die Bildmenge (kurz: das Bild) ist f .A/.
3.1
Reelle Funktionen
Wir beschreiben hier einige grundlegende Eigenschaften einer reellen Funktion f W A ! R und führen wichtige Funktionstypen ein, bevor wir dann im nächsten Abschnitt zum zentralen Begriff des Grenzwertes übergehen. Die Definitionsmenge A wird in den meisten Fällen ein reelles Intervall sein. Es ist jedoch zweckmäßig, auch beliebige (nichtleere) Definitionsmengen A , R zuzulassen, wie das folgende Beispiel zeigt: A. Beispiel. Eine reelle Folge .an /n2N ist nichts anderes als eine Funktion f W N ! R, definiert durch f .n/ ´ an . Folgen sind also spezielle Funktionen. Die nachstehenden Eigenschaften haben wir auch schon bei Folgen kennengelernt: B. Definition. Wir nennen eine Funktion f W A ! R (i)
nach oben beschränkt bzw. nach unten beschränkt bzw. beschränkt, wenn das Bild f .A/ diese Eigenschaft hat;
100 (ii)
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
monoton wachsend, wenn für alle x1 ; x2 2 A mit x1 < x2 gilt: f .x1 / . f .x2 /.
(iii) streng monoton wachsend, wenn für alle x1 ; x2 2 A mit x1 < x2 gilt: f .x1 / < f .x2 /. Entsprechend zu (ii), (iii) sind die Begriffe monoton fallend bzw. streng monoton fallend definiert. Oberbegriff zu „monoton wachsend“, „monoton fallend“ ist monoton und entsprechend bei den strengen Varianten streng monoton. Eine streng monotone Funktion f W A ! R ist natürlich injektiv, also – aufgefasst als Abbildung f W A ! f .A/ – bijektiv. Es existiert dann die Umkehrfunktion f &1 W f .A/ ! A. An dieser Stelle sei auch an die folgenden elementaren Begriffe erinnert: Ist die Definitionsmenge A spiegelsymmetrisch bzgl. 0 (d.h. A D &A), so heißt die Funktion f W A ! R gerade bzw. ungerade, wenn für alle x 2 A gilt: f .&x/ D f .x/ bzw. f .&x/ D &f .x/. In der folgenden Beispielsammlung werden einige wichtige Funktionstypen vorgestellt. Viele weitere folgen später, weil die nötigen Hilfsmittel erst noch entwickelt werden müssen. Vgl. die Abschnitte 3.7 und 4.4. C. Beispiele. (i) Ein Polynom P ist eine Funktion P W R ! R mit einer Funktionsvorschrift der Gestalt: P .x/ D an x n C an&1 x n&1 C ( ( ( C a1 x C a0 :
(1)
Dabei sind n 2 N0 und an ; : : : ; a0 2 R gegebene Konstanten. Ist n > 0 und an ¤ 0, so ist ein solches Polynom P nicht beschränkt. Für jxj % 1 folgt nämlich aus (1) P .x/ an&1 1 a0 1 D1C ( C ((( C ( n an x an x an x n ˇ ˇ ˇ ˇ ˇ an&1 ˇ 1 ˇ a0 ˇ ˇ( % 1 & ˇˇ & ( ( ( & ˇˇ ˇˇ ( ˇ an jxj an ˇ ˇ ˇ ˇ ˇ an&1 ˇ 1 ˇ a0 ˇ ˇ( & ( ( ( & ˇˇ ˇˇ ( % 1 & ˇˇ ˇ an jxj an
1 jxjn 1 : jxj
Somit gilt (2)
P .x/ Q %1& n an x jxj
für jxj % 1;
wobei Q ´
jan&1 j C ( ( ( C ja0 j : jan j
101
Abschnitt 3.1 Reelle Funktionen
Hierin wird 1 & Q=jxj % 1=2, falls jxj % 2Q, also gilt 1 P .x/ % n an x 2 speziell
für jxj % max f1; 2Qg;
1 1 P .x/ % xn % x an 2 2
für x % max f1; 2Qg:
Daraus liest man ab: P ist auf RC nach oben unbeschränkt, falls an > 0, und nach unten unbeschränkt, falls an < 0. Monotonie wird man bei Polynomen i. Allg. nicht erwarten dürfen. Ein Spezialfall der Polynome sind die Potenzfunktionen: Pn .x/ ´ x n . Deren Monotonie lässt sich diskutieren, wenn man folgende Identität für n 2 N und a; b 2 R heranzieht: ( ) (3) an & b n D .a & b/ an&1 C an&2 b C ( ( ( C ab n&2 C b n&1 : Diese erhält man z.B. aus der geometrischen Summenformel (9)[1.3], indem man dort q D b=a substituiert (oder man bestätigt sie durch Ausmultiplizieren der rechten Seite). Ist n > 0 ungerade, so liest man aus (3) ab: 0 < a < b H) an & b n < 0 a < b < 0 H) an & b n < 0: Zusammen mit 0n D 0 impliziert dies, dass Pn für ungerades n 2 N streng monoton wächst (auf ganz R). Ist n > 0 gerade, so folgt analog aus (3), dass Pn auf RC 0 streng monoton wächst und auf R& streng monoton fällt. 0 (ii)
Eine rationale Funktion F hat eine Funktionsvorschrift der Form F .x/ ´
P .x/ ; Q.x/
P; Q Polynome:
Die Definitionsmenge ist A ´ R n Q&1 .0/. (Natürlich sei Q nicht das Nullpolynom, weil für dieses die Definitionsmenge von F leer wäre.) (iii)
Die Signumsfunktion sign W R ! R ist definiert durch 8 für x > 0 < 1 0 für x D 0 sign x ´ : &1 für x < 0:
Sie ist beschränkt und monoton wachsend, jedoch nicht streng monoton wachsend.
102
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
(iv) Die Größteganze-Funktion oder Gauß-Klammer Œ / W R ! R ist definiert durch Œx/ ´ max fk 2 Z j k . xg; d.h. Œx/ ist die größte ganze Zahl . x; vgl. Beispiel F[1.4]. Somit gilt x 2 Œk; k C 1Œ; k 2 Z () Œx/ D k; insbesondere stets
Œx/ . x < Œx/ C 1:
Diese Funktion ist also intervallweise konstant. Sie ist unbeschränkt und monoton wachsend. p (v) Die Quadratwurzelfunktionp W RC 0 ! R (B[2.2]) ist unbeschränkt und streng monoton wachsend: Wäre x . c für alle x % 0, so folgte durch p p Quadrieren x . c 2 für alle x % 0, ein Widerspruch. Wäre 0 . a < b, aber a % b, so folgte ebenso ein Widerspruch durch Quadrieren. D . Definition. Der Graph der Funktion f W A ! R ist die folgende Menge im kartesischen Produkt R2 D R ) R: ˇ , ˚ Gf ´ .x; y/ 2 R2 ˇ x 2 A und y D f .x/ : Der Graph dient üblicherweise zur Veranschaulichung von f . Es empfiehlt sich, zwischen einer Funktion (als einer Zuordnung) und ihrem Graphen (als Teilmenge eines kartesischen Produkts) zu unterscheiden. Eine Funktion ist sozusagen etwas Dynamisches, ein Graph etwas Statisches. Die folgenden Bilder zeigen die Graphen der Signumsfunktion und der Gauß-Klammer. 4 3 2 1
1 x 0 -1
x
-4
-3
-2
-1
0
1
2
3
4
-1 -2
Signumsfunktion
-3 -4
Gauß-Klammer
103
Abschnitt 3.1 Reelle Funktionen
Figuren sind als Beweismittel nicht zugelassen. Trotzdem sind sie oftmals sehr hilfreich, um Ideen zu finden oder zu veranschaulichen. Man mache ruhig von Schaubildern, Graphen, numerischen Experimenten usw. Gebrauch – allerdings mit der gebotenen Vorsicht für das präzise Schließen! E . Beispiel. Es gibt Funktionen, deren Graph man nicht zeichnen kann, etwa die Dirichlet-Funktion f W R ! R, definiert durch ( 1 für x 2 Q f .x/ ´ 0 für x 2 R n Q: F. Definition (Operationen für reelle Funktionen). Gegeben seien zwei Funktionen f W A ! R und g W A ! R mit der gleichen Definitionsmenge A. Dann sind definiert: ' der Betrag
jf j W A &! R
' die Summe
f C g W A &! R
' das Produkt
f ( g W A &! R
durch
jf j.x/ ´ jf .x/jI
durch .f C g/.x/ ´ f .x/ C g.x/I durch
.f ( g/.x/ ´ f .x/ ( g.x/I f f f .x/ ' der Quotient W A n g &1 .0/ &! R durch .x/ ´ : g g g.x/ Diese Festsetzungen werden als argumentweise Definitionen bezeichnet. (Beim Produkt schreibt man auch fg und beim Quotienten gelegentlich f =g.) G . Bemerkung. Oftmals ist von einer Funktion zunächst nur die Zuordnungsvorschrift gegeben, etwa in Gestalt eines formelmäßigen Ausdrucks. Üblicherweise wählt man in solchen Fällen als Definitionsmenge die maximal mögliche, für die die Vorschrift sinnvoll ist (es sei denn es wird etwas anderes dazugesagt). Bestimmungsgleichungen Ist eine Funktion f W A ! R gegeben, so ist damit oft das Problem einer Bestimmungsgleichung verbunden. Eine solche hat z.B. die Gestalt (4)
f .x/ D c;
wobei c 2 R ebenfalls vorgegeben ist. Man soll dann alle x 2 A finden, die diese Gleichung erfüllen, die so genannten Lösungen. Mit anderen Worten: Es sind die Urbilder von c unter der Abbildung f gesucht, oder äquivalent: Es soll die Urbildmenge f &1 .c/ bestimmt werden. In einigen Fällen kann dieses formelmäßig durch Umstellen und Isolieren der „Unbekannten“ x geschehen, z.B. bei linearen oder quadratischen Gleichungen. Man muss sich aber im Klaren darüber sein, dass das meistens nicht möglich ist. Es erhebt sich dann die Frage nach der Existenz bzw. der Eindeutigkeit der Lösung, d.h. danach, ob f &1 .c/ nichtleer bzw. einelementig ist. Schließlich soll die Lösung (oder ggf. die Lösungen) berechnet werden.
104
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
H. Beispiele. (i) Eine Gleichung, die nicht formelmäßig gelöst werden kann, ist z.B. x 7 C x D 1, eine andere e x D 3 & x, obwohl man mit den Hilfsmitteln der folgenden Kapitel nachweisen kann, dass beide Gleichungen Lösungen besitzen. (ii) Manchmal kann man durch Substitution auf eine formelmäßig lösbare Gleichung zurückkommen. Sei z.B. die Gleichung vorgelegt: e 2x C 2e x D 3: Durch die Substitution y D e x geht diese über in y 2 C 2y D 3: Diese quadratische Gleichung hat (nach der üblichen Lösungsformel) die beiden Lösungen y D 1 und y D &3. Die „Resubstitution“ führt auf die beiden Gleichungen e x D 1 (mit der Lösung x D 0) und e x D &3 (was nicht lösbar ist, da die e-Funktion nur positive Werte annimmt). Somit hat die Ausgangsgleichung genau die Lösung x D 0. Eine allgemeine Bestimmungsgleichung der Gestalt '.x/ D 4.x/ kann äquivalent in der Form '.x/ & 4.x/ D 0 geschrieben werden, d.h. es ist eine Zurückführung auf das Nullstellenproblem möglich. I. Definition. Ein ˛ 2 A heißt Nullstelle der Funktion f W A ! R, wenn f .˛/ D 0 gilt. Die Nullstellenmenge von f ist fx 2 A j f .x/ D 0g D f &1 .0/, die Urbildmenge von 0 unter f . Wenn 0 gar nicht zum Bild f .A/ gehört, so ist die Urbildmenge f &1 .0/ natürlich leer, d.h. die Gleichung f .x/ D 0 hat keine Lösung. Ansonsten ist die Urbildmenge entweder einelementig – d.h. die Gleichung f .x/ D 0 ist eindeutig lösbar – oder aber sie enthält mindestens zwei Elemente – d.h. die Gleichung f .x/ D 0 ist mehrdeutig lösbar. Zusammengefasst: Das Auffinden der Nullstellen einer Funktion ist dasselbe wie das Lösen der Bestimmungsgleichung f .x/ D 0: Das Lösen von Gleichungen ist eine der Grundaufgaben der Mathematik. Wichtig ist dabei immer das Existenzproblem: „Gibt es eine Lösung?“ und genauso das Eindeutigkeitsproblem: „Gibt es mehr als eine Lösung?“. Schließlich bleibt die Aufforderung: „Berechne die Lösung (oder die Lösungen)!“
Abschnitt 3.1 Reelle Funktionen
105
Einige Grundlagen über Polynome Wir betrachten ein Polynom P W R ! R mit der Darstellung wie in (1) (5)
P .x/ D an x n C an&1 x n&1 C ( ( ( C a1 x C a0 :
Ein Polynom braucht keine Nullstelle zu haben (zum Beispiel ist x 2 C 1 > 0 für alle x 2 R, also sicher niemals 0). Aber wenn es Nullstellen gibt, so liegen sie in einem angebbaren Intervall: J. Lemma. Ist ˛ Nullstelle des Polynoms P (5) mit n 2 N und an ¤ 0, so gilt + % jan&1 j C ( ( ( C ja0 j j˛j . max 1; : jan j Insbesondere kann nicht jede reelle Zahl Nullstelle von P sein. Beweis. Ist j˛j < 1, so ist die Behauptung trivial erfüllt. Sei jetzt j˛j % 1. Dann folgt aus (2) für x D ˛: 0 % 1 & Q=j˛j, also j˛j . Q. " K. Satz (Identitätssätze). Seien n; m 2 N0 . (i)
Gilt für alle x 2 R an x n C ( ( ( C a1 x C a0 D 0;
(6)
so folgt an D ( ( ( D a1 D a0 D 0. (ii) Gilt für alle x 2 R (7)
an x n C ( ( ( C a1 x C a0 D bm x m C ( ( ( C b1 x C b0
und ist an ¤ 0 und bm ¤ 0, so folgt n D m und aj D bj für alle j 2 f0; : : : ; ng. Beweis. Zu (i): Wäre eines der aj ungleich null, so sei ak dasjenige mit größtem Index. Dann hätte das Polynom Q mit Q.x/ ´ ak x k C ( ( ( a0 jede reelle Zahl zur Nullstelle, was nach Lemma J unmöglich ist. Zu (ii): Angenommen es wäre n < m. Dann folgte aus der Voraussetzung bm x m C ( ( ( C bnC1 x nC1 C .bn & an /x n C ( ( ( C .b0 & a0 / D 0 für alle x 2 R. Nach (i) implizierte dies (unter anderem) bm D 0 im Widerspruch zur Voraussetzung. Also ist n % m, und analog überlegt man n . m. Wegen n D m folgt aus der Voraussetzung nun .bn & an /x n C ( ( ( C .b0 & a0 / D 0 für alle x 2 R, also nach (i): bn & an D ( ( ( D b0 & a0 D 0.
"
106
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
K. Zusatz. Die Identitätssätze sind die Grundlage für die Methode des Koeffizientenvergleichs: Die aj und das n in (5) sind allein durch die Zuordnung P bestimmt, falls an ¤ 0. Man nennt dann n den Grad des Polynoms P und schreibt deg.P / ´ n. Die aj heißen die Koeffizienten von P , insbesondere an der Leitkoeffizient und a0 das konstante Glied. Ist der Leitkoeffizient gleich 1, so nennt man das Polynom normiert. Jedes Polynom der Form x 7! ax n heißt ein Monom. Das Nullpolynom 0 (0.x/ ´ 0 8 x 2 R) bekommt formal den Grad deg.0/ ´ &1. Polynome vom Grad . 1, P .x/ D ax C b, also auch das Nullpolynom, heißen affine Funktionen, speziell bei b D 0 lineare Funktionen. Die Identitätssätze dienen hier lediglich dazu, die Eindeutigkeit der im Zusatz genannten Begriffe zu sichern. Wir werden bald sehen, wie sich die Identitätssaussagen deutlich verbessern lassen. L. Lemma. Sind P; Q Polynome, so auch P C Q und P ( Q, und es gilt für die Grade deg.P C Q/ . max fdeg.P /; deg.Q/g deg.P ( Q/ D deg.P / C deg.Q/: Beweis. Summe und Produkt von Polynomen P; Q sind wiederum Polynome. Das liest man an den Darstellungen von P; Q ab und ebenso, wie sich dabei die Leitkoeffizienten verhalten: Bei der Summenbildung P C Q können sich die Leitkoeffizienten aufheben, wenn die Grade von P und Q gleich sind; ansonsten bleibt der Leitkoeffizient des Polynoms mit höherem Grad bei der Addition erhalten. Bei der Produktbildung P (Q entsteht als Leitkoeffizient das Produkt der Leitkoeffizienten von P und Q. Daraus ergeben sich die behaupteten Gradregeln. Diese bleiben auch richtig in den Fällen, wo P oder Q das Nullpolynom ist (wenn man die Terme sinngemäß interpretiert). " Polynome sind besonders wichtige Funktionen, da ihre Werte allein mit den Körperoperationen (ohne Division) berechnet werden können. Man versucht daher, allgemeinere Funktionen durch Polynome zu approximieren. Ein Beispiel dafür ist die Darstellung der e-Funktion aus D[2.4]. 3 x -n e x D lim 1 C : n!1 n Der Ausdruck rechts nach dem Limeszeichen ist ein Polynom vom Grad n. Weitere Beispiele zur Approximation durch Polynome werden bei der Taylor-Entwicklung in 8.3 auftreten. In Analysis 3 werden wir ganz allgemein sehen, wie stetige Funktionen durch Polynome beliebig genau angenähert werden können (Approximationssatz von Weierstraß). Ein einfacher algebraischer Aspekt bei Polynomen ist der folgende: Ist P wie in (5) ein Polynom vom Grad n % 1 und ˛ 2 R fest, so kann man P .x/ D P ..x & ˛/ C ˛/
107
Abschnitt 3.1 Reelle Funktionen
schreiben und bei der Bildung der rechten Seite in jedem Term den binomischen Satz auf das zweite Pluszeichen anwenden: Es gilt ja 0 ! k X k k k x D ..x & ˛/ C ˛/ D .x & ˛/k&j ˛ j : j j D0
Insgesamt entsteht so für das Polynom ein neuer Ausdruck der Form (8)
P .x/ D bn .x & ˛/n C bn&1 .x & ˛/n&1 C ( ( ( C b1 .x & ˛/ C b0 ;
mit gewissen neuen Koeffizienten bn ; : : : ; b0 2 R (Umentwicklung eines Polynoms mit Zentrum ˛). Dabei sind die neuen Koeffizienten wieder eindeutig bestimmt (da die Abbildung x 7! x & ˛ von R auf sich bijektiv ist), und es gilt bn D an . An dieser Umentwicklung sieht man Folgendes: Das Zentrum ˛ ist dann und nur dann Nullstelle von P , wenn P .x/ den Faktor x & ˛ abspaltet, d.h wenn es ein Polynom Q gibt, sodass stets (9)
P .x/ D .x & ˛/ ( Q.x/
gilt. In diesem Fall nennen wir Q.x/ den Kofaktor des Linearfaktors x & ˛. Ist dies so und hat Q erneut die Nullstelle ˛, so kann man auf das Polynom Q die gleiche Prozedur anwenden und ebenso den Faktor x & ˛ abspalten, etc. Es gibt dann eine größte natürliche Zahl ( . n, sodass P .x/ die Potenz .x & ˛/& abspaltet, also mit einem Polynom Q$ stets gilt: (10)
P .x/ D .x & ˛/& ( Q$ .x/ mit Q$ .˛/ ¤ 0:
Dieses ( heißt die Vielfachheit oder Multiplizität der Nullstelle ˛. Man spricht auch von einer (-fachen Nullstelle ˛ (bei ( D 1 bzw. ( D 2 von einer einfachen bzw. doppelten Nullstelle). In (10) wird Q$ .x/ der Kofaktor von .x & ˛/& genannt. Ist P .ˇ/ ¤ 0, so nennt man ˇ eine Nullstelle der Vielfachheit oder Multiplizität 0. Nullstellen der Vielfachheit 0 sind also gerade die Nichtnullstellen! Wendet man die Abspaltung auf jede weitere eventuell vorhandene Nullstelle von P an, so ergibt sich induktiv eine Darstellung (11)
e P .x/ D .x & ˛1 /&1 .x & ˛2 /&2 ( ( ( .x & ˛k /&k ( Q.x/;
e keine Nullstellen mehr in R besitzt und sein Grad nach Lemma in der das Polynom Q L gleich n & .(1 C ( ( ( C (k / ist. Die ˛1 ; : : : ; ˛k sind dann genau die reellen Nullstellen von P mit den jeweiligen Multiplizitäten (1 ; : : : ; (k . Man bezeichnet (11) als eine Produktdarstellung oder Faktorisierung von P . Ihre Kenntnis ist äquivalent mit der Kenntnis aller reellen Nullstellen von P einschließlich der Vielfachheiten. Die Ausdrücke x &˛j werden als Linearfaktoren der Produktdarstellung (11) bezeichnet.
108
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
e eine Konstante (nämlich gleich dem Ist (1 C ( ( ( C (k D n, also das Polynom Q Leitkoeffizienten), so heißt das Polynom zerfallend (in R). Aus diesen Überlegungen folgt insbesondere, dass ein Polynom vom Grad n % 1 höchstens n reelle Nullstellen haben kann. Damit lassen sich die Identitätssätze K deutlich verschärfen: Es brauchen als Voraussetzungen die Gleichungen (6), (7) keineswegs für alle x 2 R zu gelten. Vielmehr reicht es, wenn diese Gleichungen für N reelle Zahlen x erfüllt sind, wenn nur N größer als n und m ist. Ist P ein Polynom vom Grad n, so nennt man die Bestimmungsgleichung P .x/ D 0 eine algebraische Gleichung vom Grad n. Die obigen Feststellungen machen keine Aussage darüber, wie man eine algebraische Gleichung wirklich lösen kann. Tatsächlich ist dies ein nichttriviales Problem. Für algebraische Gleichungen vom Grad 2, 3 und 4 existieren allgemeine Lösungsformeln (für Grad 2 aus der Schulmathematik bekannt). Diese Lösungsausdrücke findet man in den Lehrbüchern der klassischen Algebra, z.B. bei Perron[1951]. Allerdings sind sie für die Grade 3 und 4 so kompliziert, dass sie für praktische Zwecke kaum in Frage kommen. Vom Grad n D 5 an gibt es keine allgemeinen Lösungsformeln mehr. Das ist ein berühmter Satz von Abel. In der numerischen Mathematik werden aber zahlreiche Näherungsverfahren zur Nullstellenberechnung entwickelt. Eine rationale Funktion F ist, wie gesagt, über eine Funktionsvorschrift der Form (12)
F .x/ ´
P .x/ ; Q.x/
P; Q Polynome
definiert, wobei Q nicht das Nullpolynom ist. Die Definitionsmenge ist A ´ R n Q&1 .0/. Da Q nur endlich viele Nullstellen hat, ist F überall in R bis auf endlich viele Stellen definiert. Bei einer Funktion, die über einen Ausdruck definiert ist, kann man diesen umformen, muss aber damit rechnen, dass hierdurch die Definitionsmenge verändert wird. Außerdem ist selbst bei unveränderter Definitionsmenge und gleicher Zuordnung der Ausdruck eventuell nicht eindeutig bestimmt. So auch hier: Ist z.B. a 2 R nicht Nullstelle von Q, so kann man den Bruch in (12) mit x & a erweitern, wodurch sich die Definitionsmenge um fag vermindert, aber die Zuordnungsvorschrift ansonsten unverändert bleibt. Ist a Nullstelle von Zähler und Nenner, so kann man den Bruch mit x &a erweitern, ohne die Definitionsmenge und die Zuordnung zu ändern, aber die Polynome im Zähler und Nenner sind danach andere. Entsprechende Effekte stellen sich ein beim Kürzen, wenn P und Q gemeinsame Nullstellen haben, wobei sich die Definitionsmenge vergrößern kann. Solches Kürzen wird man durchaus anstreben, zumal sich die Grade von Zähler und Nenner dabei verkleinern. Aber das Kürzen ist natürlich nicht zwingend. Aus diesen Gründen sollte eine rationale Funktion zusammen mit dem Paar von Zähler- und Nennerpolynom betrachtet werden, es sei denn, es ist im Einzelfall etwas anderes vereinbart.
109
Abschnitt 3.1 Reelle Funktionen
Wie bei ganzen Zahlen existiert auch bei Polynomen der Begriff der Teilbarkeit. Ein Polynom S heißt Teiler des Polynoms P , wenn ein Polynom S $ existiert mit P D S S $ . Man sagt dafür auch, P sei durch S teilbar. Ein solches S $ werde als Kofaktor von S bezeichnet. Zwei Polynome P; Q heißen teilerfremd, wenn sie keinen gemeinsamen Teiler vom Grad % 1 besitzen. Sind in der Darstellung (12) einer rationalen Funktion die Polynome P und Q teilerfremd, so heißt sie reduziert. Das Umgehen mit rationalen Funktionen wird oftmals durch den so genannten Divisionsalgorithmus erleichtert. Dieser betrifft hauptsächlich den Fall, dass der Zählergrad größer oder gleich dem Nennergrad ist und beide Polynome mindestens den Grad 1 haben. Dann kann man ein Polynom G „abdividieren“ derart, dass der „Rest“ die konträre Eigenschaft hat: R.x/ P .x/ D G.x/ C ; Q.x/ Q.x/
deg.R/ < deg.Q/:
Dies geht trivial auch, wenn deg.P / < deg.Q/, nämlich mit G ´ 0 und R ´ P . Wir beweisen diese Darstellung in der „durchmultiplizierten“ Gestalt: M. Satz und Definition (Division mit Rest). Seien P; Q Polynome mit Q ¤ 0. Dann gibt es genau ein Paar von Polynomen G; R mit (13)
P D GQ C R;
deg.R/ < deg.Q/:
Man nennt G den ganzen Anteil, R=P den gebrochenen Anteil und R den Rest der Division P =Q. Zugelassen ist auch deg.R/ D &1 (d.h. R D 0). Dies charakterisiert gerade den Fall, dass die Division P =Q aufgeht, also P =Q (außer an den Nullstellen von Q) mit einem Polynom G übereinstimmt oder m.a.W., dass P durch Q teilbar ist. Beweis von M. Sei q ´ deg.Q/ % 0. Eindeutigkeit: Sei neben (13) auch P D G1 Q C R1 ;
deg.R1 / < deg.Q/
mit Polynomen G1 ; R1 . Dann folgt durch Subtraktion R & R1 D .G1 & G/Q. Wäre R & R1 ¤ 0, so müsste auch G1 & G ¤ 0 sein. Daraus folgte für den Grad q > deg.R & R1 / D deg.G1 & G/ C q, ein Widerspruch. Somit ist R & R1 D 0, also auch G1 & G D 0. Existenz: Im Fall deg.P / < deg.Q/ leisten G ´ 0 und R ´ P das Gewünschte. Sei jetzt deg.P / % deg.Q/, also mit p ´ deg.P /: P .x/ D cp x p C ( ( ( C c1 x C c0 ;
cp ¤ 0
Q.x/ D bq x q C ( ( ( C b1 x C b0 ;
bq ¤ 0:
110
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
Nun zieht man von P .x/ ein Vielfaches von x p&q Q.x/ ab, sodass das entstehende e einen niedrigeren Grad als P hat. Das richtige Vielfache ist offensichtPolynom R cp p&q e % q ist, kann man das Verfahren für R e anstelle P Q.x/. Falls deg. R/ lich bq x wiederholen. Nach höchstens q & p C 1 Schritten entsteht ein Polynom R D P & GQ mit deg.R/ < q. Das Paar G; R leistet also das Gewünschte. " Dieser Existenzbeweis ist konstruktiv geführt. Tatsächlich liegt er dem üblichen Divisionsschema zugrunde. N. Beispiel. Sei P .x/ ´ x 4 & 2x 3 C 3x 2 C 3x C 6;
Q.x/ ´ x 2 C x C 1:
Dann wird P .x/ & x 2 Q.x/ D &3x 3 C 2x 2 C 3x C 6 P .x/ & x 2 Q.x/ C 3xQ.x/ D 5x 2 C 6x C 6 P .x/ & x 2 Q.x/ C 3xQ.x/ & 5Q.x/ D x C 1; also
G.x/ D x 2 & 3x C 5;
R.x/ D x C 1:
Das gleiche Ergebnis erhält man schematisch in der Form . x 4 & 2x 3 x4 C x3 & 3x 3 & 3x 3
C 3x 2 C x2 C 2x 2 & 3x 2 5x 2 5x 2
C 3x ? y C 3x & 3x C 6x C 5x x
xC1 C 6ˇ / W . x 2 C x C 1 / D x 2 & 3x C 5 C 2 x CxC1 ˇ ˇ ˇ ? y C 6 C 5 C 1
Der ganze Anteil erscheint rechts oben, der Rest ganz unten. Im Fall ganzzahliger Koeffizienten kann man alle rationalen Nullstellen explizit bestimmen. Das beruht auf folgendem O. Lemma (von Gauß). Das Polynom P sei ganzzahlig, d.h. alle seine Koeffizienten seien ganze Zahlen: P .x/ D an x n C ( ( ( C a0 ;
aj 2 Z
für j D 0; : : : ; n;
und es sei hierbei n % 1, an ¤ 0 , a0 ¤ 0. Dann gilt: Ist die rationale Zahl pq mit teilerfremden Zahlen p; q 2 Z n f0g Nullstelle von P , so ist p Teiler von a0 und q Teiler von an .
111
Abschnitt 3.1 Reelle Funktionen
. / p Beweis. Es sei die Bedingung für q abgeleitet (bei p geht es analog): Aus P D0 q folgt der Reihe nach an
p n&1 p pn C a C ( ( ( C a1 C a0 D 0 n&1 qn q n&1 q
an p n C an&1 p n&1 q C ( ( ( C a1 pq n&1 C a0 q n D 0 &q.an&1 p n&1 C ( ( ( C a1 pq n&2 C a0 q n&1 / D an p n : Nach der letzten Zeile ist q Teiler von an p n . Wegen der Teilerfremdheit von q und p muss dann q Teiler von an sein. (Hierzu braucht man etwas elementare Zahlentheorie.) " Bei einem ganzzahligen Polynom kommen als rationale Nullstellen höchstens die rationalen Zahlen mit den im Lemma genannten Teilbarkeitseigenschaften in Frage. Das sind aber endlich viele, sodass man mit der Probe feststellen kann, welche davon wirklich Nullstellen sind. Weitere rationale Nullstellen kann es dann nicht mehr geben (wohl aber natürlich irrationale). Zusätzliche Eigenschaften von Polynomen werden wir bei den komplexen Zahlen in Abschnitt 7.4 besprechen. Aufgaben und Anmerkungen 1. Es seien f; g W R ! R beschränkte bzw. monoton wachsende Funktionen. Sind dann auch f C g, f ( g, f ı g beschränkt bzw. monoton wachsend? 2. Man beweise: Ist die Funktion f W Œa; b/ ! R monoton, so besitzt jf j ein Maximum, und dieses wird bei a oder b angenommen. (jf j ist definiert durch jf j .x/ ´ jf .x/j für alle x 2 Œa; b/.) 3. Die Menge A , R sei spiegelbildlich bzgl. 0. Man beweise: Jede Funktion f W A ! R kann auf genau eine Weise als Summe f D g C u einer geraden Funktion g W A ! R und einer ungeraden Funktion u W A ! R dargestellt werden. Es gilt g.x/ D
1 .f .x/ C f .&x//; 2
u.x/ D
1 .f .x/ & f .&x//: 2
4. Für zwei vom Nullpolynom verschieden Polynome P; Q gilt stets deg.P ı Q/ D deg.P / ( deg.Q/: 5. Für ein Polynom P W R ! R, P .x/ D an x n C ( ( ( C a0 , zeige man: a) P ist dann und nur dann eine gerade Funktion, wenn alle Koeffizienten ak mit ungeradem Index k verschwinden,
112
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
b) P ist dann und nur dann eine ungerade Funktion, wenn alle Koeffizienten ak mit geradem Index k verschwinden, 6. Gegeben sei das folgende Polynom vom Grad 4: P .x/ ´ x 4 & 5x 3 C 7x 2 & 5x C 6: Man bestimme alle reellen Nullstellen sowie die Faktorisierung von P entsprechend (11). Lösung: Da das Polynom ganzzahlige Koeffizienten hat, wird man zunächst alle rationalen Nullstellen bestimmen: Für p; q in Lemma O bestehen die Möglichkeiten p D ˙1; ˙2; ˙3
(die Teiler von 6)
qD1
(der einzige positive Teiler von 1),
wobei nur bei einer Sorte beide Vorzeichen zu berücksichtigen sind (hier beim Nenner). Also kommen als rationale Nullstellen höchstens in Betracht: p D ˙1; ˙2; ˙3: q Durch die Probe findet man, dass davon lediglich 2 und 3 Nullstellen sind. Das Divisionsschema zur Abspaltung des Linearfaktors x & 3 liefert .x 4 & 5x 3 C 7x 2 & 5x C 6/ W .x & 3/ D x 3 & 2x 2 C x & 2: (Das Divisionsverfahren zur Abspaltung eines Linearfaktors ist wie viele der älteren Algorithmen auf die Handrechnung abgestimmt. Ein anderes iteratives Verfahren, das den gleichen Zweck besser erfüllt, wird in Aufgabe 8 vorgestellt.) Das Resultat ist also zunächst P .x/ D x 4 & 5x 3 C 7x 2 & 5x C 6 D .x & 3/ ( .x 3 & 2x 2 C x & 2/: Das Polynom Q.x/ ´ x 3 & 2x 2 C x & 2 hat (natürlich) die Nullstelle x D 2, was man auch direkt bestätigt: Q.2/ D 0. Es muss also den Linearfaktor x & 2 abspalten. Tatsächlich findet man durch erneute Anwendung des Divisionsschemas Q.x/ D x 3 & 2x 2 C x & 2 D .x & 2/.x 2 C 1/: Da der letzte Faktor keine Nullstelle in R besitzt, lautet also die gewünschte Produktdarstellung e P .x/ D x 4 & 5x 3 C 7x 2 & 5x C 6 D .x & 3/ ( .x & 2/ ( Q.x/ mit
e Q.x/ ´ x 2 C 1;
und 2; 3 sind die einzigen reellen Nullstellen von P . Beide besitzen die Vielfachheit 1.
113
Abschnitt 3.1 Reelle Funktionen
7. Man betrachte ein zerfallendes normiertes Polynom P vom Grad n % 1 einerseits in der additiven Darstellung (5) P .x/ D x n C an&1 x n&1 C ( ( ( C a1 x C a0 ;
(14)
andererseits in der multiplikativen Darstellung (15)
P .x/ D .x & ,1 /.x & ,2 / ( ( ( .x & ,n /;
die aus (11) entsteht, indem die Potenzen der Linearfaktoren ausgeschrieben werden; d.h. die Liste ,1 ; ,2 ; : : : ; ,n besteht aus allen Nullstellen von P , wobei jede so oft genannt ist, wie ihre Vielfachheit angibt. Durch Vergleich von (14) und (15) beweise man den Wurzelsatz von Vieta X j D 1; : : : ; n; ,k1 ,k2 ( ( ( ,kj ; (16) .&1/j an&j D 1#k1 N gilt: 1=n < ı. Diese Zahlen 1=n liegen dann in der Menge A \ U $ .0; ı/, die also nichtleer ist. (ii) Bei A ´ N ist jedes Element ein isolierter Punkt; denn in der 1-Umgebung /n & 1; n C 1Œ von n 2 N ist n das einzige Element von A. Die natürlichen Zahlen bilden also eine diskrete Teilmenge von R. (iii) Die Menge A , R sei nichtleer und nach oben beschränkt. Ist sup A … A, so ist sup A Häufungspunkt von A: Sei s ´ sup A. Angenommen, es gäbe ein ı > 0 mit A \ U $ .s; ı/ D ¿. Dann wäre auch A \ U.s; ı/ D ¿ (da
117
Abschnitt 3.2 Grenzwerte
s … A), also s & ı obere Schranke von A. Denn in /s & ı; s/ liegt kein Element von A und ebenso wenig in fx j x > sg (da s obere Schranke von A). Somit wäre s & ı eine kleinere obere Schranke von A als s, Widerspruch! Auch im Falle sup A 2 A kann sup A Häufungspunkt von A sein. In jedem Fall gilt: Ist sup A Häufungspunkt von A, so ist sup A der größte Häufungspunkt von A. Denn sonst gäbe es Elemente von A, die größer als s sind. (iv) Entsprechendes gilt bei einer nichtleeren nach unten beschränkten Menge bzgl. des Infimums. Ein Häufungspunkt von A braucht nicht Element von A zu sein, wie das Beispiel (i) zeigt. Man beachte auch den Unterschied zwischen dem Begriff „Häufungswert“, der sich auf eine Folge bezieht, und dem Begriff „Häufungspunkt“, der sich auf eine Menge bezieht. D. Beispiel. Die Folge .an / mit an D 1 für alle n 2 N hat den Häufungswert 1, aber 1 ist nicht Häufungspunkt der zugehörigen Bildmenge f1g. E. Definition. Gegeben sei die Funktion f W A ! R und ein Häufungspunkt a von A. Wir nennen f konvergent für x gegen a, wenn es ein b 2 R gibt mit folgender Eigenschaft: Zu jedem " > 0 existiert ein ı D ı."/ > 0, sodass für alle x 2 A mit 0 < jx & aj < ı gilt: jf .x/ & bj < ". Ist dies der Fall, so heißt b der Grenzwert von f für x gegen a (symbolisch: x ! a), und man schreibt lim f .x/ D b
x!a
oder
f .x/ &! b
(für x &! a):
Wir werden gleich sehen, dass auch hier der Grenzwert im Falle der Existenz eindeutig bestimmt ist. Die eingerahmte Eigenschaft nennen wir den ."; ı/-Test. Eine äquivalente Umformulierung des ."; ı/-Tests lautet: Zu jedem " > 0 existiert ein ı D ı."/ > 0, sodass der Schluss gilt: x 2 A; 0 < jx & aj < ı H) jf .x/ & bj < ": Nach der in der Mengenlehre getroffenen Vereinbarung bedeutet diese Zeile, dass die Implikation für alle x zutrifft, die die Prämisse erfüllen. Ohne „Variable“ x formuliert, lautet diese Zeile äquivalent: f .A \ U $ .a; ı// , U.b; "/. Ähnlich wie bei Folgen besagt die Konvergenz: f .x/ weicht vom Grenzwert b beliebig wenig ab, wenn nur x hinreichend nahe bei a (jedoch ¤ a) ist. Beachte: f .a/ ist eventuell nicht definiert und spielt auch keine Rolle!
118
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
E. Zusatz. Gilt limx!a f .x/ D b, so sagt man auch: f .x/ konvergiert (oder geht oder strebt) für x gegen a gegen b oder auch: b D limx!a f .x/ existiert (in R). Die Verneinung von „konvergent“ ist divergent. Die direkte Überprüfung des ."; ı/-Tests geschieht wie bei den Folgen in Abschnitt 2.1 durch Angabe eines ı."/, das mittels geeigneter Abschätzungen gewonnen werden kann. Indirekte, aber oft sehr wirksame Methoden zur Grenzwertbestimmung werden sich im weiteren Verlauf ergeben. Zunächst einige Beispiele, die nur die obige Definition verwenden: F. Beispiele. (i)
Es gilt:
lim
x!0
p x D 0:
p Zum Nachweis gibt p sei " > 0 gegeben. Wann wird j x & 0j < "? Umrechnung äquivalent: x < " oder auch (da alle Argumente % 0 sind): x < "2 . Somit leistet ı."/ ´ "2 das Verlangte. (ii)
Es gilt:
lim x 2 D 0:
x!0
Man könnte genauso vorgehen wie eben. Eine andere Methode ist wieder die Aufstellung einer Vorausabschätzung. Hier ist eine solche: jx 2 j . jxj für jxj < 1. Somit wird jx 2 & 0j < ", falls jxj < min f1; "g, also leistet ı."/ ´ min f1; "g das Verlangte. (iii) Ist die Funktion f W A ! R in einer punktierten Umgebung von a konstant gleich c, so gilt lim f .x/ D c: x!a
Ist diese Umgebung gleich U .a; ı0 /, so gilt ja jf .x/ & cj D 0 für x 2 A \ U $ .a; ı0 /, also leistet das konstante ı."/ ´ ı0 das Verlangte. $
Wie bei den Folgen kommt es darauf an, den Unterschied zum vermuteten Grenzwert kleiner als " > 0 zu bekommen, indem hier nun der Unterschied von x zu a kleiner als ein geeignetes ı > 0 gemacht wird – und das für jedes vorgegebene " > 0, wobei ı > 0 von " abhängen darf. Die Diskussion der Funktionenkonvergenz geschieht in weitgehender Analogie zu der bei den Folgen, und zwar sowohl bei den Aussagen wie bei den Beweisen. Die Argumente sollen hier nicht im Einzelnen wiederholt werden. Als Muster für eine analoge Beweisführung sei die folgende notwendige Bedingung für die Konvergenz behandelt. Vgl. dazu bei den Folgen I(i)[2.1]. G. Satz. Existiert der Grenzwert b D limx!a f .x/ in R, so gibt es ein ı1 > 0, sodass f in A \ U.a; ı1 / beschränkt ist.
119
Abschnitt 3.2 Grenzwerte
Beweis. Man nehme als ı1 eines, das laut Definition zu " D 1 gehört. Dann gilt für x 2 A \ U $ .a; ı1 /: jf .x/ & bj < 1, also jf .x/j < jbj C 1. In A \ U.a; ı1 / gilt dann die gleiche Schranke, falls a … A, bzw. jf .x/j . max fjbj C 1; f .a/g, falls a 2 A. " H. Bemerkung. Ähnlich wie hier erkennt man die Analoga für das Meidungsprinzip in J[2.1], die Einschnürung in Q[2.1] und die restlichen Punkte in I[2.1] sowie P[2.1]. Auf den Zusammenhang mit der Monotonie (Analogon zu N[2.1]) gehen wir in Abschnitt 3.6 ein. Darüber hinaus existiert ein Übertragungsprinzip, das die Konvergenz bei Funktionen unmittelbar auf die Konvergenz bei Folgen zurückführt (Satz K). Zuvor sei noch Begriff des Häufungspunkts mit Folgen charakterisiert: I. Satz. Gegeben sei eine Teilmenge A , R und ein a 2 R. Dann sind äquivalent: (i)
a ist Häufungspunkt von A.
(ii) Es gibt eine Folge .xn / in A n fag mit xn ! a. Beweis. (i) H) (ii): Zu ı D 1=n (n eine natürliche Zahl) existiert ein xn 2 A \ U $ .a; 1=n/. Die Folge .xn / liegt dann in A n fag und konvergiert wegen jxn & aj < 1=n gegen a. (ii) H) (i): Zu gegebener punktierter Umgebung U $ .a; ı/ sei ein N 2 N so gewählt, dass für n > N gilt: jxn & aj < ı. Für diese n ist dann xn Element der Menge A \ U $ .a; ı/, diese also nichtleer. " J. Beispiel. Bei einem Intervall A ´ Œ˛; ˇŒ mit ˛ < ˇ ist jedes Element a 2 A Häufungspunkt von A. Dazu betrachtet man die Folge xn ´ a C .1=n/. Diese konvergiert gegen a, und nach dem Meidungsprinzip erfüllen ihre Elemente nach einem gewissen Index alle xn < ˇ, liegen also in A n fag. Nach der obigen Äquivalenz ist a Häufungspunkt von A. Auch ˇ ist Häufungspunkt von A (aber nicht Element von A). Das folgt genau wie eben, indem man die Folge ˇ & .1=n/ betrachtet. Die Punkte außerhalb von Œ˛; ˇ/ sind keine Häufungspunkte von A; denn jede konvergente Folge in A hat ihren Grenzwert in Œ˛; ˇ/. K. Satz. Gegeben sei die Funktion f W A ! R und ein Häufungspunkt a von A. Dann sind äquivalent: (i) (ii)
lim f .x/ existiert in R.
x!a
Für jede Folge .xn / in A n fag mit xn ! a existiert lim f .xn / in R. n!1
120
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
(iii) Für jede Folge .xn / in A n fag mit xn ! a existiert lim f .xn / in R, und alle n!1 diese Limites sind untereinander gleich. Ist dies erfüllt, so gilt für jede solche Folge .xn /: lim f .x/ D lim f .xn /:
x!a
n!1
Beweis. Soll wie hier die Äquivalenz von mehr als zwei Aussagen nachgewiesen werden, so ist es zweckmäßig, statt der paarweisen Äquivalenzen einen Ringschluss durchzuführen. Hier ist ein solcher: H)
(ii)
H (
( H
(i)
(iii)
Der Ringschluss umfasst drei Implikationen, im Gegensatz zu den sechs Implikationen (i) () (ii), (ii) () (iii), (i) () (iii) bei der paarweisen Äquivalenz. Trotzdem liefern die drei Implikationen des Ringschlusses insgesamt die paarweisen Äquivalenzen. Denn man kommt in dem Ring von jedem Punkt zu jedem anderen (ggf. mit „Umweg“). (i) H) (ii): Sei limx!a f .x/ D b; xn 2 A; xn ¤ a für alle n und xn ! a. Zu zeigen ist: limn!1 f .xn / D b. Dies geht so: Zu " > 0 existiert nach Voraussetzung ein ı > 0, sodass für alle x 2 A \ U $ .a; ı/ gilt: jf .x/ & bj < " . Zu diesem ı existiert nach Voraussetzung ein N 2 N, sodass für alle n > N gilt: jxn & aj < ı. Durch Aneinanderfügen dieser Schlüsse erhält man: n > N H) xn 2 A \ U $ .a; ı/ H) jf .xn / & bj < ". Dies impliziert limn!1 f .xn / D b. (ii) H) (iii): Sei für zwei solche Folgen .xn / und .xn0 / vorausgesetzt: limn!1 f .xn / D b und limn!1 f .xn0 / D b 0 . Zu zeigen ist b D b 0 . Hierzu betrachtet man die „gemischte Folge“ nach dem „Reißverschluss-System“: x1 ; x10 ; x2 ; x20 ; x3 ; x30 ; : : : &! a: Diese konvergiert ebenfalls gegen a (man nehme aus den beiden ."; N /-Bedingungen der Einzelfolgen jeweils das maximale N und verdopple dieses). Nach Voraussetzung besteht eine Konvergenz f .x1 /; f .x10 /; f .x2 /; f .x20 /; f .x3 /; f .x30 /; : : : &! b 00 : Für die ungestrichenen und gestrichenen Teilfolgen hiervon gilt nach C[2.6] limn!1 f .xn / D b 00 und limn!1 f .xn0 / ! b 00 , somit b D b 0 D b 00 .
121
Abschnitt 3.2 Grenzwerte
(iii) H) (i): Sei b der gemeinsame Grenzwert der Folgen .f .xn //, und sei " > 0 gegeben. Zu zeigen ist: Es gibt ein ı > 0, sodass gilt: x 2 A \ U $ .a; ı/ H) jf .x/ & bj < ". Angenommen, ı existiert nicht. Dann gibt es zu jedem ı > 0 ein x 2 U $ .a; ı/ mit jf .x/ & bj % ". Speziell existiert zu ı D 1=n (n eine natürliche Zahl) ein xn 2 A \ U $ .a; 1=n/, sodass jf .xn / & bj % ". Dann gilt xn 2 A n fag; xn ! a, jedoch nicht f .xn / ! b, im Widerspruch zu (iii). Die restliche Behauptung ist enthalten zu Beginn des Schlusses (i) H) (ii).
"
L. Beispiele. (i) Existiert limx!0 Œx/? (Die eckige Klammer bezeichnet das Größteganze.) Die Antwort lautet „nein“. Ist nämlich .xn / eine Folge in /&1; 0Œ mit xn ! 0, so gilt f .xn / D &1 ! &1. Ist aber .xn0 / eine Folge in /0; 1Œ mit xn0 ! 0, so gilt f .xn0 / D 0 ! 0. Daraus folgt die Divergenz laut K(iii). So wie hier kann die Bedingung K(iii) oft genutzt werden, um Divergenzen zu erkennen. (ii) Die Äquivalenz zwischen (i) und (ii) in Satz K kann man heranziehen, um die p Konvergenz von Folgen zu diskutieren. Z.B. ergibt sich aus limx!0 x D 0 laut F(i), p dass für jede Nullfolge .xn / in RC gilt: limn!1 xn D 0. Mit dem Übertragungsprinzip von Satz K kann man vieles aus der Konvergenz für Folgen auf die Konvergenz für Funktionen übernehmen, z.B. die folgenden drei Sätze. Dabei sei stets a als Häufungspunkt von A vorausgesetzt. M. Satz. Gilt lim f .x/ D b, so ist b eindeutig bestimmt.
"
x!a
N. Satz (Rechenregeln für Grenzwerte). Gegeben seien zwei Funktionen f W A ! R und g W A ! R. Dann folgt aus der Existenz von lim f .x/ und lim g.x/ in R x!a
(i) (ii) (iii) (iv)
x!a
ˇ ˇ lim jf .x/j D ˇ lim f .x/ˇ
x!a
x!a
lim .f .x/ C g.x// D lim f .x/ C lim g.x/
x!a
x!a
x!a
lim .f .x/ ( g.x// D lim f .x/ ( lim g.x/
x!a
x!a
lim
x!a
lim f .x/ f .x/ x!a D ; g.x/ lim g.x/ x!a
x!a
falls
lim g.x/ ¤ 0
x!a
einschließlich der Existenz der Grenzwerte auf den linken Seiten in R.
"
122
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
Diese Regeln erlauben es, aus bekannten Grenzwerten viele neue zu erzeugen, einfach durch Anwendung der Operationen: Betrag, Addition, Multiplikation und Division. So folgt aus limx!a x D a sofort limx!a x p D ap für Exponenten p 2 N und allgemeiner für jedes Polynom P W R ! R lim P .x/ D P .a/:
x!a
In (iv) wird keine Aussage gemacht, wenn der „Nennerlimes“ gleich null ist. Tatsächlich ist in diesem Fall das Verhalten individuell verschieden: O. Bemerkungen. Es mögen b ´ lim f .x/ und c ´ lim g.x/ x!a
x!a
in R existieren. Dann gibt es bei c D 0 folgende Möglichkeiten: (i) Es ist c D 0 und b ¤ 0. In diesem Fall ist die Funktion f =g in jeder punktierten Umgebung von a (geschnitten mit A) unbeschränkt, also ihr Grenzwert nicht existent in R. Wäre nämlich f =g in A \ U $ .a; ı1 / beschränkt, so könnten wir dort schreiben f .x/ ( g.x/; f .x/ D g.x/ und das Analogon zu I(iii)[2.1] würde zeigen, dass b D 0 ist, im Widerspruch zur Voraussetzung. (ii) Es ist c D 0 und b D 0. In diesem Fall kann f =g sowohl konvergieren (auch gegen 0) als auch divergieren: (ii.a)
Es gilt x2 & 1 .x & 1/.x C 1/ D lim D lim .x C 1/ D 2: x!1 x & 1 x!1 x!1 x&1 lim
Hier ist a D 1, b D limx!1 .x 2 & 1/ D 0 und c D limx!1 .x & 1/ D 0. In solchen Fällen hilft oft geeignetes Kürzen, insbesondere bei Polynomen, wie in (9)[3.1] oder (10)[3.1] ausgedrückt. Hier ist das Kürzen mit x & 1 erlaubt, da im ."; ı/-Test der Konvergenz x D a ausgeschlossen ist. (ii.b) Es gilt x 2 & 2x C 1 .x & 1/2 D lim D lim .x & 1/ D 0: x!1 x!1 x & 1 x!1 x&1 lim
Hier ist ebenfalls a D 1, b D limx!1 .x 2 &2x C1/ D 0 und c D limx!1 .x &1/ D 0.
123
Abschnitt 3.2 Grenzwerte
(ii.c)
Es existiert nicht in R lim
x!1 x 2
x&1 : & 2x C 1
Auch hier ist a D 1, b D limx!1 .x 2 & 2x C 1/ D 0 und c D limx!1 .x & 1/ D 0. Das Kürzen ergibt für x ¤ 1 x&1 1 D ; x 2 & 2x C 1 x&1 und dies kann nach (i) nicht konvergieren. P. Satz (Cauchy-Kriterium). Der Grenzwert limx!a f .x/ existiert dann und nur dann in R, wenn gilt: Zu jedem " > 0 gibt es ein ı D ı."/ > 0, sodass für alle x1 ; x2 2 A \ U $ .a; ı/ gilt: jf .x1 / & f .x2 /j < ": " Neben den mehr algebraischen Rechenregeln für Grenzwerte von Satz N besteht auch ein Substitutionsprinzip für die Komposition: f g Q. Satz (Substitutionsprinzip). Seien A; B Teilmengen von R und A &! B & !R zwei Abbildungen. Weiter sei a Häufungspunkt von A und b Häufungspunkt von B sowie c 2 R und f .x/ ¤ b für alle x ¤ a in A. Dann gilt der Schluss lim f .x/ D b;
x!a
lim g.y/ D c
y!b
H)
lim g.f .x// D c:
x!a
Beweis. Im Grunde hat man lediglich die beiden Konvergenztests für f und g „aneinander zu setzen“: Sei ıf ."/ zu jedem " > 0 dasjenige ı, das zur Konvergenz limx!a f .x/ D b gehört. Ebenso sei ıg ."/ zu jedem " > 0 dasjenige ı, das zur Konvergenz limy!b g.y/ D c gehört. Dann gilt bei gegebenem " > 0 g.f .x// 2 U $ .c; "/;
falls f .x/ 2 U $ .b; ıg ."//;
und weiter f .x/ 2 U $ .b; ıg ."//;
falls x 2 U $ .a; ıf .ıg ."///; x 2 A;
wobei f .x/ ¤ b abgedeckt ist durch die Voraussetzung f .x/ ¤ b für alle x ¤ a. Insgesamt ergibt sich der ."; ı/-Test für lim g.f .x// D c, nämlich mit ı."/ ´ ıf .ıg ."//.
x!a
"
Wie bei den Teilfolgen existieren auch hier Grenzübergänge eingeschränkter Funktionen:
124
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
R. Definition (eingeschränkte Grenzübergänge). Gegeben sei eine Funktion f W A ! R, eine Teilmenge C , A sowie ein Häufungspunkt c von C . Existiert für die Einschränkung b D lim .f jC /.x/ in R, so schreiben wir: x!c
b D lim f .x/; x!c x2C
speziell für den rechtsseitigen Grenzwert im Fall C D A \ fx 2 R j x > cg: b D lim f .x/; x#c
bzw. für den linksseitigen Grenzwert im Fall C D A \ fx 2 R j x < cg: b D lim f .x/: x"c
S. Satz. Gegeben seien f , C und c wie in Definition R. (i) Aus der Existenz von b D limx!c f .x/ folgt die von b D limx!c f .x/. x2C
(ii) Aus der Existenz von b D limx#c f .x/ und b D limx"c f .x/ (einschließlich ihrer Gleichheit!) folgt die von b D limx!c f .x/. Beweis. Zu (i): Der ."; ı/-Test für „x ! c“ enthält den für „x ! c; x 2 C “. Zu (ii): Man nimmt aus den beiden ."; ı/-Tests der einseitigen Grenzübergänge das minimale ı für den Gesamtgrenzwert. " T. Beispiel. Für die Signumsfunktion gilt limx"0 sign.x/ D &1, limx#0 sign.x/ D 1, aber limx!0 sign.x/ existiert nicht, da im Falle der Existenz die beiden einseitigen Grenzwerte nach (i) übereinstimmen müssten. Aufgaben und Anmerkungen 1. Beim ."; ı/-Test „kommt es nur auf kleine " > 0 an“. Das soll heißen: Ist "0 > 0 fest gegeben und gilt der ."; ı/-Test in der Form ($) Zu jedem " > 0 mit " < "0 existiert ein ı D ı."/ > 0, sodass für alle x 2 A mit 0 < jx & aj < ı gilt: jf .x/ & bj < ", so gilt er auch in der ursprünglichen Form (ohne den Zusatz " < "0 ). Man beweise dies in Analogie zu F[2.1].
125
Abschnitt 3.2 Grenzwerte
2. Man untersuche auf Konvergenz bzw. Divergenz a) lim .1=Œ1=x//;
b) lim jxj ( Œ1=x/.
x!0
x!0
3. Es besteht die Aussage zur Einschnürung: Gilt für drei Funktionen f W A ! R, g W A ! R und h W A ! R stets f .x/ . g.x/ . h.x/ und ist für einen Häufungspunkt a von A: limx!a f .x/ D limx!a h.x/ D b, so gilt auch limx!a g.x/ D b. Man beweise dies in Analogie zu Q[2.1]. 4. Es besteht das Majorantenkriterium für Funktionen: Gilt für zwei Funktionen f W A ! R, g W A ! R, ein b 2 R und einen Häufungspunkt a von A stets jf .x/&bj . g.x/ und ist limx!a g.x/ D 0, so folgt limx!a f .x/ D b. Man beweise dies in Analogie zu I(ii)[2.1]. 5. Ist die Funktion f W A ! R beschränkt und gilt für einen Häufungspunkt a von A und eine weitere Funktion g W A ! R: limx!a g.x/ D 0, so gilt auch limx!a f .x/g.x/ D 0. Man beweise dies in Analogie zu I(iii)[2.1]. 6. In Ungleichungen darf man „unscharf“ zur Grenze übergehen. Das soll heißen: Gilt für zwei Funktionen f W A ! R, g W A ! R stets f .x/ . h.x/ und existieren für einen Häufungspunkt a 2 A die Grenzwerte b D limx!a f .x/ und c D limx!a g.x/, so ist b . c. Man beweise dies in Analogie zu P[2.1]. 7. Seien P; Q W R ! R Polynome und a 2 R mit Q.a/ ¤ 0. Zeige: lim
x!a
P .x/ P .a/ D : Q.x/ Q.a/
8. Seien P; Q W R ! R Polynome und a 2 R mit P .a/ ¤ 0 und Q.a/ D 0. Zeige, dass f .x/ ´ P .x/=Q.x/ in jeder punktierten Umgebung von a unbeschränkt ist, also für x ! a divergiert. Lösungshinweis: Antithese mittels der Gleichung P .x/ D f .x/Q.x/. 9. Seien P; Q W R ! R nicht identisch verschwindende Polynome, und es sei a 2 R mit P .a/ D Q.a/ D 0. Die Vielfachheit der Nullstelle a bzgl. P bzw. Q sei p bzw. q. Dann gilt P .x/ D .x & a/p ( P $ .x/ und Q.x/ D .x & a/q ( Q$ .x/ mit Polynomen P $ ; Q$ , wobei P $ .a/ ¤ 0 und Q$ .a/ ¤ 0. Vgl. (10)3.1. Aufgrund der für x ¤ a gültigen Darstellung der rationalen Funktion f .x/ ´
P .x/ P $ .x/ D .x & a/p&q $ Q.x/ Q .x/
zeige man a) Ist p > q, so gilt lim f .x/ D 0. x!a
b) Ist p D q, so gilt lim f .x/ D x!a
P $ .a/ . Q$ .a/
126
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
c) Ist p < q, so ist f in jeder punktierten Umgebung von a unbeschränkt, divergiert also für x ! a. Lösungshinweis zu c): Ähnlich wie bei Aufgabe 8.
3.3
Stetigkeit
Stetige Funktionen sollen das beschreiben, was man von einer vernünftigen Entwicklung erwartet. Eine stetige Funktion sollte z.B. keine Sprünge machen. Die Diskussion, wie das präzise zu fassen ist, war in der Mathematik ein längerer Prozess, der schließlich auf folgende Begriffsbildung führte. Eine anschauliche Motivierung wird am Ende dieses Abschnitts beschrieben. Wir betrachten eine reelle Funktion f W A ! R, definiert auf einer (nichtleeren) Teilmenge A , R, eine feste Stelle a 2 A sowie den Funktionswert f .a/. Die Forderung ist, dass die anderen Funktionswerte f .x/ beliebig wenig von f .a/ abweichen, wenn nur x hinreichend nahe bei a liegt. Das bedeutet in der ."; ı/-Sprache: A. Definition. Die Funktion f W A ! R heißt stetig in a 2 A, wenn gilt: Zu jedem " > 0 existiert ein ı D ı."/ > 0, sodass für alle x 2 A mit jx&aj < ı gilt: jf .x/ & f .a/j < ". Es handelt sich hierbei um die Stetigkeit an einer festen Stelle a 2 A. Die eingerahmte Eigenschaft nennen wir den ."; ı/-Test für die Stetigkeit.
gegeben
f(a) + ε f(a) f(a) - ε gesucht
a-δ
a
a+δ
127
Abschnitt 3.3 Stetigkeit
Der ."; ı/-Test ist im obigen Bild veranschaulicht. Er besagt für den Graphen: Gegeben ein waagrechter Streifen der Dicke 2" um f .a/, so muss es möglich sein, einen senkrechten Streifen um a der Dicke 2ı zu finden, derart dass die Punkte .x; f .x// alle in dem „Fenster“ landen, das vom Durchschnitt der beiden Streifen gebildet wird, wenn nur x im Intervall /a & ı; a C ıŒ (geschnitten mit A) variiert. Das muss für jedes " > 0 erreichbar sein, wobei natürlich ı von " abhängen darf. Eine äquivalente Umformulierung des ."; ı/-Tests lautet: Zu jedem " > 0 existiert ein ı D ı."/ > 0, sodass gilt: x 2 A; jx & aj < ı H) jf .x/ & f .a/j < ": Mit dem Umgebungsbegriff lautet diese Zeile äquivalent x 2 A \ U.a; ı/ H) f .x/ 2 U.f .a/; "/: Beachte: Hier steht U.a; ı/ (nicht U $ .a; ı/ wie beim Grenzwert!). p p B. Beispiel. Die Wurzelfunktion W RC 0 ! R ist in a D 0 stetig: Um j x & p p 0j D x < " für x > 0 zu erreichen, muss offensichtlich x < "2 gemacht werden. Mit ı."/ ´ "2 ist also der ."; ı/-Test erfüllt. Das läuft praktisch genauso wie beim entsprechenden Grenzwert in F(i)[3.2]. Die Stetigkeit kann im Wesentlichen auf den Grenzwertbegriff zurückgeführt werden, was ja schon an der Gestalt des ."; ı/-Tests ablesbar ist: C. Satz. Gegeben sei f W A ! R und a 2 A. Dann gilt: (i)
Ist a isolierter Punkt von A, so ist f in a stetig.
(ii) Ist a Häufungspunkt von A, so besteht die Äquivalenz: f stetig in a ()
lim f .x/ D f .a/:
x!a
Beweis. Zu (i): Nach Voraussetzung existiert ein ı1 > 0 mit A \ U.a; ı1 / D fag. Zu gegebenem " > 0 sei ı ´ ı1 gewählt. Dann gilt für x 2 A \ U.a; ı/ notwendig x D a, also 0 D jf .x/ & f .a/j < ". Zu (ii): Wir schreiben auf, was die beiden Seiten der behaupteten Äquivalenz bedeuten: f stetig in a bedeutet: 8 " > 0 9 ı > 0 8 x 2 A \ U.a; ı/ W jf .x/ & f .a/j < ":
128
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
lim f .x/ D f .a/ bedeutet:
x!a
8 " > 0 9 ı > 0 8 x 2 A \ U $ .a; ı/ W jf .x/ & f .a/j < ": Da jf .a/ & f .a/j < ", verlangen beide Bedingungen dasselbe.
"
Hieraus ergibt sich die Folgencharakterisierung der Stetigkeit: D. Satz. Gegeben sei f W A ! R und a 2 A. Dann sind äquivalent: (i)
f ist stetig in a.
(ii) Für jede Folge .xn / in A mit xn ! a gilt f .xn / ! f .a/. Beweis. Wir machen eine Fallunterscheidung, je nachdem a isolierter Punkt oder Häufungspunkt von A ist: a ist isoliert: Dann ist (i) nach C(i) immer erfüllt. Aber auch (ii) ist immer erfüllt; denn zu ı1 > 0 mit A \ U.a; ı1 / D fag existiert ein N , sodass für alle n > N gilt: xn 2 A \ U.a; ı1 /. Für diese n ist dann xn D a. Also ist .f .xn //n>N die konstante Folge .f .a//n>N . a ist Häufungspunkt von A: Hier folgt die Äquivalenz von (i) und (ii) aus C(ii) und K[3.2]. " Die einfachsten Unstetigkeiten herrschen an den Sprungstellen; das sind Punkte, an denen zwar die einseitigen Grenzwerte von f .x/ existieren, aber untereinander verschieden sind. Die einschlägigen Begriffe für solche einseitigen Annäherungen sind die folgenden: E. Definition. Gegeben sei ein Intervall J , R, eine Funktion f W J ! R und eine Stelle a 2 J . Ist a nicht linker Endpunkt von J , so nennt man f linksseitig stetig in a, wenn limx"a D f .a/ gilt. Ist a nicht rechter Endpunkt von J , so nennt man f rechtsseitig stetig in a, wenn limx#a D f .a/ gilt. Ist a kein Endpunkt von J , so nennt man a eine Sprungstelle von f , wenn die einseitigen Grenzwerte limx"a f .x/ und limx#a f .x/ in R existieren, jedoch verschieden sind. Natürlich gilt über das Verhältnis zwischen diesen einseitigen Grenzwerten und dem Grenzwert limx!a f .x/ das in S(i)[3.2] Gesagte. In einer Sprungstelle a ist f nach C(ii) unstetig. Das folgende Bild veranschaulicht eine Sprungstelle und den negativen Ausgang des ."; ı/-Tests bei geeignetem ".
129
Abschnitt 3.3 Stetigkeit
f(a) + ε f(a) f(a) - ε
a-δ
a
a+δ
Sprungstelle und negativer Ausgang des ."; ı/-Tests Bezüglich der Operationen für Funktionen, wie sie in F[3.1] definiert wurden, verhält sich die Stetigkeit wie folgt: F. Satz. Gegeben seien zwei Funktionen f W A ! R und g W A ! R mit gleicher Definitionsmenge A sowie ein a 2 A. Dann folgt aus der Stetigkeit von f und g in a die Stetigkeit von f C g, f ( g und, falls g.a/ ¤ 0, auch die von f =g in a. Beweis. Kombination von D mit K[2.1].
"
G. Satz (Kettenregel für die Stetigkeit). Gegeben seien zwei Funktionen f W A ! R und g W B ! R mit f .A/ , B. Ist f stetig in a 2 A und g stetig in b ´ f .a/, so ist g ı f stetig in a. Beweis. Man hat die beiden ."; ı/-Tests für f und g „aneinander zu setzen“, wobei man mit g starten muss: Gegeben sei also " > 0. Dann gilt: 9 ı > 0 8 y 2 B mit jy & bj < ı W jg.y/ & g.b/j < ": Für dieses ı gilt: 9 ı1 > 0 8 x 2 A mit jx & aj < ı1 W jf .x/ & bj < ı: Hieraus ergibt sich: x 2 A; jx & aj < ı1 impliziert jg.f .x// & g.b/j < ". Wegen g.b/ D g.f .a// enthält dies den ."; ı/-Test für g ı f . " H. Definition. Man nennt f W A ! R stetig, wenn f in jedem a 2 A stetig ist.
130
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
Die Sätze F und G enthalten eine Fülle von Konstruktionen, wie aus stetigen Funktionen neue stetige Funktionen zu gewinnen sind. In der folgenden Beispielsammlung machen wir hiervon reichlich Gebrauch:
I. Beispiele. (i) Die identische Abbildung von R; x 7! x, ist stetig: Der ."; ı/-Test geht in Ordnung mit ı ´ ". Dann gilt ja: jx & aj < ı H) jx & aj < ". (ii)
Jede konstante Abbildung, x 7! ˛, ist stetig: Wähle z.B. einfach ı ´ 1.
(iii) Aus (i), (ii) folgt durch mehrfache Anwendung von Satz F: Jedes Polynom P W R ! R ist stetig. Jede rationale Funktion R D P =Q W A ! R ist stetig, wobei A die Menge der Nichtnullstellen von Q ist. ˇ ˇ (iv) Die Betragsfunktion j j W R ! R ist stetig: Vorausabschätzung: ˇjxj & jajˇ . jx & aj (modifizierte Dreiecksungleichung). Also tut es ı ´ ". (v) Jede Einschränkung einer stetigen Funktion f W A ! R auf B , A ist wiederum stetig (gleiches ı). p (vi) Die Wurzelfunktion W RC 0 ! R ist stetig: Für die Stelle a D 0 wurde dies in Beispiel B gezeigt. Für eine Stelle a > 0 hat man die Vorausabschätzung: ˇ ˇp p ˇ ˇ ˇ x & a ˇ ˇ x & a ˇ jx & aj p p ˇ ˇ ˇ ˇ j x & aj D ˇ ˇ D ˇ px C pa ˇ . pa : 1 p p Dabei wurde der Wurzeltrick aus C(iv)[2.2] benützt. Hiernach ist j x & aj < ", p p p sobald jx&aj < ", d.h. jx & aj < a" gilt. Mit ı."/ ´ a" ist also der ."; ı/-Test a erfüllt. J. Definition und Satz. Ist f W A ! R gegeben, a Häufungspunkt von A und existiert der Grenzwert limx!a f .x/ µ b 2 R, so heißt a eine hebbare Unstetigkeit, wenn a … A oder a 2 A aber b ¤ f .a/ gilt. Setzt man nämlich neu f .a/ ´ b, so wird f in a stetig. "
131
Abschnitt 3.3 Stetigkeit
K. Beispiel. Sei f W A ! R mit A ´ R n f&1; 1g definiert durch f .x/ ´
x2 & x : jxj & 1
10 9
Nach Satz F ist f in allen x 2 A stetig, da dort jxj & 1 ¤ 0. Ist f in den „Ausnahmepunkten“ &1; 1 stetig fortsetzbar?
8 7
Lösung: Die Limites dort sind:
6
x2 & x lim f .x/ D lim x!1 x!1 x & 1 x.x & 1/ D lim x!1 x & 1 D lim x D 1
5 4
x!1
3
x2 & x D &1 x#&1 &x & 1
lim f .x/ D lim
x#&1
2
x2 & x lim f .x/ D lim D 1; x"&1 x"&1 &x & 1 wobei man die letzten beiden Grenzwerte durch Reziprokenbildung erkennt. Somit ist f durch die Zusatzdefinition f .1/ D 1 stetig in 1 fortsetzbar, 1 also eine hebbare Singularität. Dagegen ist f auf keine Weise in &1 stetig fortsetzbar. Beachte: Als Funktionswert ist 1 oder &1 niemals zugelassen! Das Bild zeigt den Graphen dieser Funktion in der entscheidenden Region.
1 0 -4
-3
-2
-1
1
2
3
-1 -2 -3 -4
L. Beispiel. Die Funktion f .x/ ´ x1 ist in R n f0g stetig. Im Häufungspunkt 0 von R n f0g gilt limx#0 x1 D 1, limx"0 x1 D &1. Es wäre trotzdem falsch zu sagen, f sei unstetig; denn f ist in 0 gar nicht definiert. Richtig ist es zu sagen: „f ist in 0 nicht stetig fortsetzbar“.
132
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
M . Bemerkung. In der Implikation (i) H) (ii) von Satz D steckt eine wichtige Methode, um Grenzwerte komplizierter Ausdrücke „f .xn /“ zu berechnen: Kennt man a ´ limn!1 xn , und weiß man, dass f in a stetig ist, so kennt man auch limn!1 f .xn / D f .a/. r nC1 N. Beispiel. Was ist lim ? n!1 n Lösung: Statt mit Abschätzungen den ."; N /-Test zu versuchen, kann man ) nach ( jetzt 1 Bemerkung M sehr einfach vorgehen: Es gilt limn!1 nC1 D lim D 1, 1 C n!1 n n und die Wurzelfunktion ist in 1 stetig. So ergibt sich r p nC1 D 1 D 1: lim n!1 n Eine „Verstärkung“ der Stetigkeit ist die folgende Eigenschaft: O. Definition. Die Funktion f W A ! R heißt dehnungsbeschränkt oder Lipschitzstetig, wenn ein c % 0 existiert, sodass gilt: (1)
jf .x1 / & f .x2 /j . c ( jx1 & x2 j
für alle x1 ; x2 2 A:
Das c heißt dann eine Lipschitz-Konstante von f , und (1) wird eine Lipschitz-Bedingung genannt. P. Satz. Ist f W A ! R Lipschitz-stetig, so ist f W A ! R erst recht stetig. Beweis. Gegeben a 2 A und " > 0, wählen wir ı ´ der Lipschitz-Bedingung (1) so:
" . Dann schließen wir mit cC1
x 2 A; jx & aj < ı H) jf .x/ & f .a/j . c ( jx & aj . cı D Das zeigt die Stetigkeit von f in a.
c " < ": cC1 "
Die Umkehrung von Satz P ist nicht richtig: p Q. Beispiel. Die Wurzelfunktion W RC 0 ! R ist stetig, aber nicht dehnungsbeschränkt: Wäre c > 0 eine Lipschitz-Konstante, also p p j x1 & x2 j . c ( jx1 & x2 j für alle x1 ; x2 2 RC 0; p so folgte speziell, wenn man x1 D x und x2 D 0 setzt: x . cx oder äquivalent x % c12 für alle x > 0. Dies widerspricht der Nichtexistenz einer kleinsten positiven Zahl (J[1.1]). Einen konkreten Widerspruch erhält man natürlich, indem man x D 2c12 setzt.
Abschnitt 3.3 Stetigkeit
133
Die Lipschitz-Stetigkeit ist somit echt stärker als die Stetigkeit. R. Bemerkung. Die folgende Situation aus dem täglichen Leben beleuchtet, wie sinnvoll die gegebene Definition der Stetigkeit ist: Angenommen, der Geschäftsmann Müller in Aachen muss um 12 Uhr am Bahnhof in Berlin sein, um dort zwischen 12:30 Uhr und 13 Uhr ein Geschäft abzuschließen. Der Zug vom Bahnhof Aachen zum Berliner Hauptbahnhof braucht 4 Stunden, und ein solcher Zug startet um 8 Uhr in Aachen. Es sei vorausgesetzt, dass diese Zeiten von der Bahn eingehalten werden. Das passt also alles gut. Leider verspätet sich Herr Müller etwas und kommt erst um 8:10 Uhr zum Bahnsteig in Aachen. Der Zug ist abgefahren, und der nächste geht erst wieder um 10 Uhr. Herr Müller ist enttäuscht, sein Geschäft in Berlin kommt nicht zustande. Wäre Herr Müller um 7:45 am Bahnsteig in Aachen gewesen, so hätte es geklappt, auch wenn er dies um 7:55 Uhr oder 7:59, ja selbst um 8:00 Uhr geschafft hätte, aber eben nicht mehr um 8:01 Uhr! Das ist eine typische Situation für eine Unstetigkeit. Betrachtet man die Funktion, die der Ankunftszeit x von Herrn Müller am Bahnsteig in Aachen die Ankunftszeit f .x/ am Bahnsteig in Berlin zuordnet, so gilt f .x/ D 12 für 7 . x . 8 und f .x/ D 14 für 8 < x . 10. Wenn Herr Müller noch so wenig nach 8 Uhr einsteigen will, es bringt nichts, die Verzögerung ist nach 8 Uhr immer 2 Stunden. Beheben könnte man dies (theoretisch), wenn es statt des Zuges eine Art „Förderband“ von Aachen nach Berlin gäbe, das ständig läuft und auf das man in Aachen jederzeit aufspringen kann. Dann könnte Herr Müller auch noch um 8:15 aufspringen, und seinen Termin in Berlin zwischen 12:30 Uhr und 13 Uhr wahrnehmen. Es käme bei seiner Abfahrtszeit nicht so genau darauf an. Bei einer Toleranz in der Zielvorgabe von einer halben Stunde könnte Herr Müller sich anstrengen, eine entsprechende Toleranz in der Abfahrtszeit einzuhalten, um doch noch rechtzeitig am Ziel zu sein. Stetigkeit bedeutet also, salopp formuliert: Bei Vorgabe einer Toleranz im Zielbereich kann man diese erfüllen durch Einhaltung einer Toleranz im Ausgangsbereich. Dieses Beispiel zeigt erneut: In der mathematischen Definition A der Stetigkeit ist es sehr sinnvoll, die Toleranz „"“ in der Zielmenge vorzugeben und zu fordern, dass es dazu immer eine Toleranz „ı."/“ in der Definitionsmenge gibt, die sie erfüllt. Die Zielvorgabe einer Leistung erfolgt zuerst, und danach richtet sich die Anstrengung, sie zu erreichen – nicht etwa umgekehrt! Aufgaben und Anmerkungen 1. Man untersuche die folgende Funktionen f auf die maximale Definitionsmenge, die Stetigkeit und die Existenz von Grenzwerten an den Häufungspunkten der Definitionsmenge, die dieser nicht angehören. Man fertige auch eine Skizze des Graphen an.
134 a) f .x/ D c) f .x/ D
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
x 2 & 5x C 6 ; x 2 & 3x C 2 ( x2 für x . 1 x
für x > 1
e) f .x/ D &Œ&x/;
b) f .x/ D
jx 2 C 3x & 4j ; xC4
d) f .x/ D
p x;
f)
f .x/ D Œ2x C 1/Œx* :
2. Die Funktion f W Œ0; 1/ ! R sei gegeben durch ( 1=Œ1=x/ für x ¤ 0 f .x/ D 0 für x D 0: An welchen Stellen ist f stetig, an welchen unstetig? 3. Die Sätze F und G erlauben, aus stetigen Funktionen eine Fülle neuer stetiger Funktionen aufzubauen, nämlich solche, die durch sinnvolle Verknüpfungen mit C; &; (; W und Komposition aus den gegebenen Funktionen entstehen. Vorsicht ist allerdings dort geboten, wo die Voraussetzungen der Sätze nicht erfüllt sind! Zum Beispiel ist ˇ ˇ ˇ 2 60 ˇˇ 1237 1297 ˇ g.x/ ´ x C ˇ.x C 1/ & 2 x C 1ˇ als Funktion g W R ! R stetig (da stets x 2 C 1 > 0). Der ."; ı/-Test wäre hier sehr umständlich! Dagegen folgt für f .x/ ´ x
1237
ˇ ˇ ˇ 2 60 ˇˇ 1297 ˇ & 2 C ˇ.x C 1/ x & 1ˇ
die Stetigkeit nur für x ¤ 1; &1, da der letzte Nenner bei 1; &1 null wird. 4. Zwei stetige Funktionen f W R ! R und g W R ! R mögen auf Q gleiche Werte annehmen, d.h. für alle x 2 Q sei f .x/ D g.x/. Folgt daraus f .x/ D g.x/ für alle x 2 R? 5. Ist die Dirichlet-Funktion (E[3.1]) irgendwo stetig? 6. $ Die Funktion f W /0; 1Œ ! R sei gegeben durch ( 0 für x … Q f .x/ D 1=q für x D p=q mit teilerfremden p; q 2 N: Ist f an den irrationalen Stellen in /0; 1Œ stetig? Ist f überall in /0; 1Œ stetig?
135
Abschnitt 3.4 Extrema und Zwischenwertsatz
p 7. Die Wurzelfunktion W RC 0 ! R ist auf jedem Intervall der Form fx 2 R j x % ag (a > 0 fest) dehnungsbeschränkt. (Die Lipschitz-Konstante hängt allerdings von a ab.) p 8. Man zeige, dass die auf ganz R definierte Funktion f .x/ ´ 5 C x 2 für alle x; y 2 R die Lipschitz-Bedingung jf .x/ & f .y/j . jx & yj erfüllt. 9. Die Funktionen f; g W A ! R seien dehnungsbeschränkt. Sind es dann auch die Funktionen jf j, f C g, f ( g, f =g, f ı g (bei geeigneter Festsetzung der Definitionsmenge)? Welche Zusatzforderungen muss man ggf. stellen?
3.4
Extrema und Zwischenwertsatz
Beide Dinge berühren zentrale Fragen der Analysis: einerseits die Existenz von Extrema reeller Funktionen, andererseits die Existenz von Lösungen (nichtlinearer) Gleichungen. Zur zweiten Frage haben wir bereits in Abschnitt 3.1 gesehen, dass es oft reicht, das Nullstellenproblem zu lösen. Zunächst zu den Extrema: Aus Abschnitt 1.4 wissen wir schon, dass Maxima und Minima von reellen Zahlmengen nichts anderes sind als angenommene (d.h. in der Menge enthaltene) Suprema und Infima. Wenn man von Extrema einer Funktion f W A ! R spricht, so sind damit die Extrema der Bildmenge f .A/ gemeint. In erster Linie interessiert uns hier der Fall, dass A ein abgeschlossenes und beschränktes Intervall ist. A. Satz und Definition. Die Funktion f W Œa; b/ ! R sei stetig. Dann gilt: (i)
f ist beschränkt, also existieren in R: m ´ inf f .Œa; b// und M ´ sup f .Œa; b//:
(ii) m und M werden angenommen, d.h. es gibt xm ; xM 2 Œa; b/ mit f .xm / D m und f .xM / D M: Man nennt m das Minimum, M das Maximum von f und xm bzw. xM eine zugehörige Minimal- bzw. Maximalstelle. Schreibweise: min f ´ m;
Œa;b*
max f ´ M: Œa;b*
136
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
Während Minimum und Maximum jeweils eindeutig bestimmt sind, kann es mehrere Minimal- oder auch mehrere Maximalstellen geben. Beweis von A. Zu (i): Angenommen, f .Œa; b// ist nicht beschränkt. Wähle zu jedem n 2 N ein xn 2 Œa; b/mit jf .xn /j > n. Nach Bolzano/Weierstraß E[2.6] existiert eine konvergente Teilfolgexnk ! ˛ 2 Œa; b/. Dann gilt für alle k W jf .xnk /j > nk , also 1 ( jf .xnk /j > 1. Nun gilt n1k ! 0 und wegen der Stetigkeit von jf j: jf .xnk /j ! nk jf .˛/j (D[3.3]). So folgt 0 ( jf .˛/j % 1, ein Widerspruch! Zu (ii): Angenommen, es gilt f .x/ ¤ m für alle x 2 Œa; b/. Dann ist die Abbildung 1 1 stetig in Œa; b/ (F[3.3]), also nach (i) beschränkt, etwa 0 < f .x/&m ( , also f .x/ > m C (1 . Somit ist m nicht die größte untere Schranke von f .Œa; b//, Widerspruch! Analog führt die Annahme: f .x/ ¤ M für alle x 2 Œa; b/ zum Widerspruch.
"
Dieser Satz erlaubt sehr starke Verallgemeinerungen, die für Theorie und Praxis von großer Bedeutung sind. Wir kommen hierauf in D[6.5] zurück. Weitere Aspekte ergeben sich in der Differentialrechnung. Während Satz A ein reiner Existenzsatz ist, kann man mittels Ableitungen Extremalstellen wirklich berechnen. Das wird in den Abschnitten 4.3 und 8.4 ausführlich diskutiert. B. Bemerkung. Für andere Intervalltypen ist der Satz falsch, ebenso ohne Stetigkeit. Das sieht man leicht an Funktionen des folgenden Typs: f f
-1 0
f W/0; 1/ &! R;
1
x
1
x
f .x/ D 1=x
f W Œ&1; 1/ &! R;
f .x/ D
8 0 und f .cn /(f .bn / > 0 würde nämlich folgen: f .an /(.f .cn //2 (f .bn / > 0, also f .an /( f .bn / > 0, im Widerspruch zur Induktionsvoraussetzung. Der „Vorzeichenwechsel“ f .an / ( f .bn / . 0 vererbt sich also auf mindestens ein Teilintervall. Gilt (i), so sei ŒanC1 ; bnC1 / ´ I , sonst ŒanC1 ; bnC1 / ´ J .
138
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
Wegen bnC1 & anC1 D .bn & an /=2 D .bn&1 & an&1 /=4 D ( ( ( D .b0 & a0 /=2nC1 entsteht eine Intervallschachtelung. Sei s ´ lim an D lim bn : n!1
n!1
Dieses s ist die gesuchte Nullstelle. Denn aus (1) folgt für n ! 1 nach D[3.3] und P[2.1]: f .s/ ( f .s/ . 0, also f .s/ D 0. " Ist f .˛/f .ˇ/ . 0 für zwei Stellen ˛ ¤ ˇ aus dem Definitionsintervall, so sprechen wir von einem Vorzeichenwechsel und im Falle f .˛/f .ˇ/ < 0 von einem echten Vorzeichenwechsel von f . Nach dem Nullstellensatz induziert also jeder Vorzeichenwechsel einer stetigen, auf einem Intervall definierten Funktion eine Nullstelle. D. Folgerung (Zwischenwertsatz). Die Funktion f W Œa; b/ ! R sei stetig, und es gelte f .a/ ¤ f .b/. Dann existiert zu jedem w zwischen f .a/ und f .b/ ein z zwischen a und b mit f .z/ D w. Beweis. Sei z.B. f .a/ < f .b/ vorausgesetzt. Dann gilt f .a/ < w < f .b/, also f .a/ & w < 0 < f .b/ & w. Betrachte die Hilfsfunktion g W Œa; b/ ! R mit g.x/ ´ f .x/ & w. Diese ist stetig (F[3.3]) und erfüllt g.a/ < 0 < g.b/. Also existiert nach dem Nullstellensatz C ein z 2 /a; bŒ mit g.z/ D 0, d.h. mit f .z/ D w. Bei f .a/ > f .b/ schließt man analog. " E. Folgerung. Die Funktion f W Œa; b/ ! R sei stetig. Dann gilt: 1 ' (2) f .Œa; b// D min f; max f : Œa;b*
Œa;b*
Die Bildmenge von f ist also ein Intervall. Beweis. Wie bei A sei m ´ minŒa;b* f und M ´ maxŒa;b* f . Natürlich gilt f .Œa; b// , Œm; M /, sodass nur die Inklusion Œm; M / , f .Œa; b// bewiesen werden muss. Dass m bzw. M als Funktionswerte f .xm / bzw. f .xM / vorkommen, ist nach A klar. Im Fall m D M , ist die Funktion f konstant und die Behauptung trivial. Im Fall m < M , werden auch alle Zahlen zwischen m und M als Funktionswerte angenommen (Zwischenwertsatz D), und zwar bereits in dem offenen Teilintervall von Œa; b/, das zwischen xm und xM liegt. " Symbole: Ist f W X ! R irgendeine Funktion, so werden Supremum, Infimum, Maximum und Minimum der Bildmenge f .X/, falls existent, durch sup f; X
inf f; X
max f; X
min f X
139
Abschnitt 3.4 Extrema und Zwischenwertsatz
bezeichnet, wobei der „Index“ X weggelassen werden kann, wenn die Definitionsmenge aus dem Kontext klar ist. Auch entsprechende Symbole „mit Argumenten“ sind üblich, z.B.: sup f ´ sup f ´ sup f .x/ ´ sup f .X/; X
x2X
etc.
F. Bemerkungen. (i) Aus dem Nullstellensatz folgt, dass jedes Polynom P W R ! R von ungeradem Grad mindestens eine reelle Nullstelle besitzt. Das liegt daran, dass P .x/ für „stark positive“ bzw. „stark negative“ x unterschiedliche Vorzeichen besitzt. Ist nämlich an der Leitkoeffizient von P , so folgt aus (2)[3.1] für x % max f1; Qg: P .x/ > 0; an x n also wegen .&x/n D &x n :
P .&x/ > 0; an .&x/n
P .x/P .&x/ > 0: &an2 x 2n
Daher gibt es a; b 2 R mit P .a/ < 0, P .b/ > 0. Somit existiert ein c zwischen a und b mit P .c/ D 0. (ii) Sei I ¤ ¿ ein Intervall und f W I ! R stetig mit ganzzahligen Werten, d.h. f .I / , Z. Dann ist f notwendig konstant. Wäre nämlich f nicht konstant, so enthielte f .I / zwei verschiedene ganze Zahlen. Nach dem Zwischenwertsatz wäre dann das Intervall zwischen diesen beiden ganzzahligen Werten Teil von f .I /. Ein solches Intervall enthält aber auch reelle Zahlen, die nicht ganzzahlig sind, im Widerspruch zur Voraussetzung. G. Beispiele. Wir behandeln die Bestimmungsgleichungen aus H(i)[3.1]: (i) Die erste Gleichung war x 7 C x D 1 oder, als Nullstellenproblem formuliert, x 7 C x & 1 D 0. Hier ist sofort die obige Bemerkung F(i) zuständig, wonach das Polynom f .x/ ´ x 7 C x & 1 mindestens eine Nullstelle besitzt. Da f nach C(i)[3.1] streng monoton wächst, kann es nicht mehr als eine Nullstelle geben. Die Gleichung x 7 C x D 1 besitzt also genau eine reelle Lösung. (ii) Die zweite Gleichung war e x D 3 & x. Es geht also um die Nullstellen der Funktion f W R ! R mit f .x/ ´ e x C x & 3. Diese ist stetig (wobei wir die Stetigkeit der Exponentialfunktion vorwegnehmen; vgl. B[3.7]). Auch hier kann man wieder einen Vorzeichenwechsel erkennen. Oft geht dies, indem man „stark positive“ und „stark negative“ Argumente betrachtet: Mit der Ungleichung aus E(ii)[2.4] folgt
140
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
als Abschätzung nach unten f .x/ % x C 1 C x & 3 D 2x & 2, also f .x/ > 0 für x > 1. Mit der Ungleichung aus E(iv)[2.4] folgt als Abschätzung nach oben für x < 0 1 C x & 3 . 1 C x & 3 D x & 2; 1&x somit f .x/ < 0 für x < 0. Zwischen 0 und 1 liegt also mindestens eine Nullstelle von f . Aufgrund der strengen Monotonie von f (B[3.7]) kann es keine zwei verschiedenen Nullstellen geben. Die Gleichung e x D 3 & x ist also eindeutig lösbar. f .x/ .
Unter zusätzlichen Regularitätsannahmen hängen Extremalprobleme und Nullstellensuche eng zusammen, wie aus dem bald folgenden Satz A[4.3] hervorgeht und sich später auch mehrdimensional erweisen wird (vgl. Abschnitt 12.1 in Analysis 2). Aufgaben und Anmerkungen 1. Man zeige, dass die einzige Lösung c der Gleichung x 7 C x D 1 der Abschätzung jc & 0; 8j < 4 ( 10&3 genügt. Mit welcher Ziffer nach dem Komma startet die Dezimalbruch-Entwicklung von c? 2. Man zeige, dass die Gleichung x6 C 2 x2 C 6 C D0 xC1 x&1 zwischen &1 und 1 mindestens eine Lösung besitzt. Kann man diese Gleichung in der üblichen Art und Weise durch „Isolieren“ von x lösen? 3. Es sei a1 > 0, a2 > 0, a3 > 0 sowie b1 < b2 < b3 . Man zeige, dass die Gleichung a1 a2 a3 C C D0 x & b1 x & b2 x & b3 eine Lösung zwischen b1 und b2 und eine weitere Lösung zwischen b2 und b3 hat. 4. Man könnte denken, dass stetige Funktionen auf Intervallen durch die Zwischenwerteigenschaft gekennzeichnet werden. Dem ist aber nicht so. Es gibt nämlich sehr einfache Funktionen, die auf einem Intervall unstetig sind, jedoch als Bildmenge ein Intervall besitzen, also sicher mit je zwei verschiedenen Werten auch alle Zahlen dazwischen als Werte annehmen. Man gebe eine solche Funktion an. 5. Sei f W R ! RC 0 stetig und a eine Nullstelle von f , sodass f in keinem Intervall I 0 fag konstant null ist. Man beweise: Zu jedem ı > 0 existiert ein p0 > 0 mit folgender Eigenschaft: Ist 0 < p < p0 , so hat die Gleichung f .x/ D p mindestens zwei Lösungen b; c 2 U.a; ı/ mit b < a < c. Lösungshinweis: Man wähle ein " > 0 mit Œa & "; a C "/ * U.a; ı/ und setze + % p0 ´ min max f; max f : Œa&";a*
Œa;aC"*
Man veranschauliche die Situation in einer Skizze!
Abschnitt 3.5 Uneigentliche Konvergenz und die Rolle von 1
141
3.5 Uneigentliche Konvergenz und die Rolle von 1 Betrachtet wird immer eine Funktion f W A ! R, definiert auf einer (nichtleeren) Menge A , R. Neben der Annäherung des Arguments und des Funktionswerts an reelle Zahlen gibt es die uneigentliche Konvergenz, bei der das Argument oder der Funktionswert beliebig groß werden kann. „Beliebig groß“ soll bedeuten, dass die Werte entweder nach oben oder nach unten unbeschränkt sind. Die verschiedenen Möglichkeiten werden hier der Reihe nach behandelt. Es entstehen insgesamt acht Kombinationen, die wir zunächst ganz direkt formulieren. Dann aber besprechen wir eine Vereinheitlichung, die mit einem erweiterten Umgebungsbegriff möglich wird. Es sei stets a ein Häufungspunkt der Definitionsmenge A und ggf. b eine Zahl in R. Die definierenden Eigenschaften für die uneigentliche Konvergenz werden hier in formalisierter Form angegeben. (Der Leser sollte inzwischen genug Übung entwickelt haben, um zwischen der formalen und der verbalen Sprechweise einwandfrei hin- und herzuwechseln.) Wie verhält sich z.B. f .x/ ´ 1=x 2 bei Annäherung von x ¤ 0 an 0? – Offensichtlich sind die Werte f .x/ positiv und werden alle beliebig groß, wenn nur x nahe genug an 0 heranrückt. Man wird also in diesem Fall den „Grenzwert“ 1 erwarten. Die präzise Fassung dieses Verhaltens ist die folgende A. Definition. Ist a 2 R Häufungspunkt von A, so wird definiert: lim f .x/ D 1
x!a
W () 8 E 2 R 9 ı > 0 8 x 2 A mit 0 < jx & aj < ı W f .x/ > E lim f .x/ D &1
x!a
W () 8 E 2 R 9 ı > 0 8 x 2 A mit 0 < jx & aj < ı W f .x/ < E: Natürlich darf das ı von E abhängen: ı D ı.E/. Eingeschränkte Grenzübergänge sind genauso definiert wie in R[3.2]: sie beziehen sich einfach auf die Restriktion auf eine Teilmenge von A. Insbesondere bei den einseitigen Grenzwerten limx#c f .x/ bzw. limx"c f .x/ wird anstelle von f die Restriktion auf die Menge fx 2 A j x > cg bzw. fx 2 A j x < cg betrachtet (wobei natürlich c Häufungspunkt dieser Menge sein muss). B. Beispiele. (i)
Es gilt limx!0
1 x2
D 1.
Zuständig ist die erste Zeile der obigen Definition: Sei E 2 R vorgegeben. Um 1=x 2 > E für x ¤ 0 zu erzwingen, reicht es, E > 0 zu betrachten. Durch Ump 2 formung erhält man 1=x > E äquivalent: jxj < 1= E. Dann aus der Forderung p leistet ı.E/ ´ 1= E das Verlangte.
142 (ii)
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
Analog erkennt man limx#0
1 x
D 1 und limx"0
1 x
D &1.
limx!0 x1 ;
(iii) Es existiert nicht denn die Forderung 1=x > E ist z.B. für E D 1 in keiner punktierten Umgebung von 0 erfüllbar und ebenso wenig für E D &1 die Forderung 1=x < E. Im übrigen ist leicht einzusehen, dass die Relationen zwischen eingeschränkten und nicht eingeschränkten Grenzübergängen aus Satz S[3.2] auch für die obige Variante gültig bleiben. Wie verhält sich f .x/ ´ 1=x, wenn x „über alle Grenzen wächst“? – Offensichtlich sind die Werte f .x/ positiv, werden aber alle beliebig klein, wenn nur x groß genug ist. Man wird also in diesem Fall für „x ! 1“ den „Grenzwert“ 0 erwarten. Bei f .x/ D x dagegen werden die Werte alle beliebig groß, wenn nur x groß genug ist. Man wird in diesem Fall für „x ! 1“ den „Grenzwert“ 1 erwarten. Hier die Präzisierung: C. Definition. Ist A nicht nach oben beschränkt, so wird definiert: lim f .x/ D b
W () 8 " > 0
lim f .x/ D 1
W () 8 E 2 R 9 D 2 R 8 x 2 A mit x > D W f .x/ > E
x!1
x!1
9 D 2 R 8 x 2 A mit x > D W jf .x/ & bj < "
lim f .x/ D &1 W () 8 E 2 R 9 D 2 R 8 x 2 A mit x > D W f .x/ < E:
x!1
Wiederum darf das D von " bzw. E abhängen: D D D."/ bzw. D D D.E/. Einseitige Varianten gibt es hier nicht („rechts von 1 ist kein Platz mehr“). D. Beispiele. (i)
Für festes p 2 N gilt limx!1
1 xp
D 0.
Wir verwenden die für jxj > 1 gültige Vorausabschätzung 1 1 . : p jxj jxj
ˇ ˇ ˇ 1 ˇ 1 ˇ Hiernach ist ˇ p & 0ˇˇ < ", falls jxj > 1 und < ". Somit leistet D."/ ´ x jxj max f1; 1="g das Verlangte. (ii)
Für festes p 2 N gilt limx!1 x p D 1.
Dazu verwendet man die gleiche für x > 1 gültige Vorausabschätzung in der „reziproken“ Form x p % x und sieht, dass die zweite Zeile der obigen Definition mit D.E/ ´ max f1; Eg erfüllt ist.
Abschnitt 3.5 Uneigentliche Konvergenz und die Rolle von 1
143
E. Bemerkungen (zum Fall A D N). (i) Ist A D N, so ist eine Abbildung f W N ! R dasselbe wie eine Folge: f .n/ D an für n 2 N. Die erste Zeile in der obigen Definition C bedeutet dann genau die Folgenkonvergenz lim an D b:
n!1
Denn zu D 2 R gibt es stets ein N 2 N mit N > D. Die Folgenkonvergenz ist also ein Spezialfall dieser ersten Zeile. Die zweite bzw. dritte Zeile in C definiert in diesem Fall die bestimmte Divergenz für Folgen: lim an D 1 bzw. lim an D &1. n!1
n!1
(ii) $ Bezüglich Limes superior und Limes inferior von Folgen trifft man bei uneigentlichen Werten folgende Konventionen: lim an D
n!1
1
W () .an / ist nicht nach oben beschränkt
lim an D &1 W () .an / ist nicht nach unten beschränkt
n!1
(1)
lim an D
n!1
1
W ()
lim an D &1 W ()
n!1
lim an D 1
n!1
lim an D &1:
n!1
Schließlich sei das Analogon der Definition C für x ! &1 formuliert, was natürlich nach dem gleichen Muster folgt: F. Definition. Ist A nicht nach unten beschränkt, so wird definiert: lim f .x/ D b
W () 8 " > 0
lim f .x/ D 1
W () 8 E 2 R 9 D 2 R 8 x 2 A mit x < D W f .x/ > E
lim f .x/ D &1
W () 8 E 2 R 9 D 2 R 8 x 2 A mit x < D W f .x/ < E:
x!&1
x!&1 x!&1
9 D 2 R 8 x 2 A mit x < D W jf .x/ & bj < "
Auch hierbei darf das D von " bzw. E abhängen: D D D."/ bzw. D D D.E/. Einseitige Varianten gibt es hier ebenfalls nicht („links von &1 ist kein Platz mehr“). Konventionen zur Bezeichnung: In der Bezeichnungsweise deutet das „n“ im Index der Limeszeichen auf eine Grenzübergang bei Folgen hin, das „x“ auf einen Grenzübergang im Sinne von Definition C. Statt n kommen auch andere Buchstaben aus der gleichen „Ecke“ des Alphabets vor, z.B. k; `; m; N , statt x auch solche wie y; z. Was gemeint ist, ergibt sich letztlich aus dem, was hinter dem Limeszeichen steht. Bei den Definitionen A, C, F laufen die Teile, in denen b vorkommt, unter Konvergenz; man sagt auch, der Grenzwert existiert (in R). Alle anderen Fälle laufen unter
144
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
dem Namen bestimmte Divergenz; hierbei sagt man auch, der Grenzwert existiert uneigentlich. Sinnvollerweise darf man auch schreiben: lim als lim ;
x!1
x"1
lim
x!&1
als lim : x#1
Statt der „lim“-Schreibweise wird auch die Pfeilschreibweise gebraucht. Besteht also z.B. die Aussage lim f .x/ D &1; x!1
so sagt man „f .x/ divergiert für x gegen 1 bestimmt gegen &1“, und man schreibt dafür auch f .x/ &! &1 (für x &! 1): G. Bemerkungen. (i) Wir haben schon in H[3.2] darauf hingewiesen, dass viele Aussagen über die Folgenkonvergenz sinngemäß auch für die Funktionenkonvergenz gelten, z.B. das Meidungsprinzip und die Einschnürung. Genauso gilt das für die obigen neuen Varianten der Konvergenz. Tatsächlich ist die Analogie zur Folgenkonvergenz gerade beim Typ limx!1 f .x/ sehr eng, da in beiden Fällen das Argument gegen 1 geht: Bei der Folgenkonvergenz limn!1 an durchläuft das Argument (hier n) über „diskrete“ Werte gegen 1, bei der Funktionenkonvergenz limx!1 f .x/ darf das Argument (hier x) auch „kontinuierlich“ gegen 1 streben. (ii) Die uneigentlichen Grenzübergänge „x ! ˙1“ bzw. „f .x/ ! ˙1“ können durch Reziprokenbildung auf die Nullkonvergenz zurückgeführt werden, z.B. gilt bei den „rein positiven“ Varianten aus A, C und F: lim f .x/ D 1 () lim
x!a
x!a
1 D0 f .x/
und 9 ı0 > 0 8 x 2 A mit 0 < jx & aj < ı0 W f .x/ > 0 . / 1 lim f .x/ D b () lim f Db x!1 y y#0 1 . / D0 1 y#0 f y
lim f .x/ D 1 () lim
x!1
und 9 D0 2 R 8 x 2 A mit x > D0 W f .x/ > 0; und analog bei den „negativen Varianten“ mit entsprechender Abänderung der Vorzeichenbedingungen. Man kann nämlich jeweils die Bedingungen aus den genannten
Abschnitt 3.5 Uneigentliche Konvergenz und die Rolle von 1
145
Definitionen für die uneigentlichen Grenzübergänge leicht in die ."; ı/-Tests für die Nullkonvergenz umrechnen. Z.B. geht dies bei der obigen ersten Zeile so: Zu H) : Ist " > 0 gegeben, so sei E ´ 1=" gesetzt. Dann existiert zu diesem E ein ı > 0, sodass für alle x 2 A mit 0 < jx&aj < ı gilt: f .x/ > E, also 0 < 1=f .x/ < ". Zu (H : Ist E 2 R gegeben, so sei " ´ 1=.jEj C 1/ gesetzt. Dann existiert zu diesem " ein ı1 > 0, sodass für alle x 2 A mit 0 < jx & aj < ı1 gilt: 1=jf .x/j < ", also für 0 < jx & aj < min fı1 ; ı0 g: f .x/ > jEj C 1 > jEj % E. Rein rechnerisch läuft die äquivalente Umformung der obigen zweiten Zeile darauf hinaus, dass man gemäß x D 1=y substituiert und anstelle des Grenzübergangs x ! 1 den Grenzübergang y # 0 durchführt. Bei der dritten Zeile ist außerdem der Kehrwert der Funktion zu betrachten und ihre Positivität für „große“ x zu prüfen. H. Beispiele. 3x 4 C 10x & 13 ? x!1 5x 4 C 1
(i)
Was ist lim
Lösung: Bei solchen Ausdrücken kürzt man mit einer geeigneten Potenz von x, hier mit der (gemeinsamen) höchsten Potenz von Zähler und Nenner, also x 4 : 1 1 3 ( 1 C 10 ( 3 & 13 ( 4 3x 4 C 10x & 13 x x : D 1 5x 4 C 1 5(1C 4 x Auf diese Darstellung können nun die obige Bemerkung G(ii) (zweite Zeile) und die auch hier analog gültigen Rechenregeln N[3.2] angewendet werden. Zusammen mit Beispiel D(i) folgt so 3x 4 C 10x & 13 3 ( 1 C 10 ( 0 & 13 ( 0 3 D D : x!1 5x 4 C 1 5(1C0 5 lim
Die oben empfohlene Substitution y D 1=x ist hierbei „im Sinn“ vorgenommen worden, ohne sie explizit hinzuschreiben (eben dadurch, dass man den ursprünglichen Bruch mittels 1=x ausgedrückt hat). (ii)
3x 4 C 10x & 13 ? x!1 5x 7 C 1
Was ist lim
Lösung: In einem solchen Fall (Zählergrad < Nennergrad) zieht man eine geeignete x-Potenz aus dem Nenner heraus und behandelt den verbleibenden zweiten Faktor wie in (i): 1 1 3 ( 1 C 10 ( 3 & 13 ( 4 3x 4 C 10x & 13 1 3x 4 C 10x & 13 1 x x : D 3 ( D 3 ( 1 1 5x 7 C 1 x x 4 5x C 3 5(1C 4 x x
146
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
An dieser Darstellung sieht man wieder mit den gleichen Hilfsmitteln wie in (i): 3x 4 C 10x & 13 3 ( 1 C 10 ( 0 & 13 ( 0 3 D0( D0( D 0: 7 x!1 5x C 1 5(1C0 5 lim
3x 4 C 10x & 13 ? x!1 5x C 1 Lösung: In einem solchen Fall (Zählergrad > Nennergrad) zieht man zuvor eine geeignete x-Potenz aus dem Zähler heraus, um für den verbleibenden Quotienten gleiche höchste Potenzen zu erreichen: (iii) Was ist lim
1 1 3x C 10 ( 2 & 13 ( 3 3x 4 C 10x & 13 x x : D x3 ( 5x C 1 5x C 1 Man wendet nun Reziprokenbildung gemäß Bemerkung G(ii)(dritte Zeile) an: Der große Bruch der letzten Darstellung strebt analog zu (i) für x ! 1 gegen 53 , ist also nach dem Meidungsprinzip > 0 für genügend große x. Der Vorfaktor x 3 ist dann ebenfalls positiv, also das ganze > 0 für x > x0 mit geeignetem x0 > 0. Dasselbe trifft für das Reziproke zu, und man hat dafür lim
x!1
also
3x 4
5x C 1 1 D lim 3 ( x!1 C 10x & 13 x
5x C 1 5 D 0 ( D 0; 1 1 3 3x C 10 ( 2 & 13 ( 3 x x
3x 4 C 10x & 13 D 1: x!1 5x C 1 lim
Die Methode dieser Beispiele (Herausziehen geeigneter x-Potenzen und Kürzen mit solchen) kann allgemein verwendet werden, um die Grenzwerte rationaler Funktionen für x ! 1 zu bestimmen. Es ergibt sich: I. Satz. Es seien P .x/ ´ an x n C ( ( ( C a0 und Q.x/ ´ bm x m C ( ( ( C b0 Polynome, wobei n; m 2 N0 und an ¤ 0, bm ¤ 0 sowie c´
an : bm
Dann gilt
(2)
8 0 ˆ ˆ ˆ n für m D n für m < n und c > 0 für m < n und c < 0:
Abschnitt 3.5 Uneigentliche Konvergenz und die Rolle von 1
147
Genau die gleichen Grenzwerte resultieren für den Grenzübergang im Sinne der Folgen: (3)
lim
n!1
P .n/ : Q.n/
Beweis. Für (2) ist die Methode vorab beschrieben. Bei (3) kann man genauso vorgehen wie oben (Herausziehen geeigneter n-Potenzen und Kürzen mit solchen). Jedoch kann man (3) auch direkt aus (2) ablesen, da es sich schlicht um eingeschränkte Grenz" übergänge handelt. Die Rolle von 1 Bisher haben wir das Symbol 1 nur verwendet, um gewisse unbeschränkte Situationen prägnant zu beschreiben; eine eigene Bedeutung sollte ihm nicht zukommen. Tatsächlich enthalten die präzisen Definitionen von Ausdrücken wie limn!1 an , limx!1 f .x/ etc. nur Verfügungen über reelle Zahlen. Manchmal kann man sich aber bequemer ausdrücken, indem man den Symbolen 1 und &1 nun doch eine eigene Bedeutung beimisst. Natürlich dürfen 1 und &1 auf keinen Fall reelle Zahlen sein. Das übliche Vorgehen besteht darin, zur Menge R der reellen Zahlen zwei neue Elemente 1 und &1 hinzuzufügen, die untereinander und auch von allen reellen Zahlen verschieden sind; dabei sei auch C1 ´ 1 geschrieben. Man bildet also eine neue Menge $ R´R [ f1; &1g
(4)
und verabredet gewisse Regeln zwischen den hinzukommenden Elemente und den reellen Zahlen selbst. Bzgl. der Anordnung auf R soll es sich um eine Fortsetzung der Anordnung auf R handeln, die die Eigenschaften der Trichotomie und Transitivität besitzt, wobei für alle a 2 R gilt (5)
&1 < a < 1:
Weiter sei für alle a 2 R &.˙1/ ´ #1 j ˙ 1j ´ 1 a ( ˙1 ´ ˙1 ( a ´ ˙1 für a > 0;
(6)
a ´ 0; ˙1
a ˙ 1 ´ ˙1 C a ´ ˙1 a ( ˙1 ´ ˙1 ( a ´ #1 für a < 0 1 ´1 0
˙1 C ˙1 ´ ˙1:
Dabei stehen in ein und derselben Gleichung entweder an allen Stellen die oberen oder an allen Stellen die unteren Vorzeichen. Dagegen sind Kombinationen wie 0 ( ˙1, 1 1 und 1 & 1 nicht definiert.
148
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
Es ist natürlich die Frage, ob es solche Objekte 1, &1 überhaupt gibt. Das ist jedoch einfach zu beantworten: Z.B. leisten die Paare .R; 1/ bzw. .R; &1/ das Verlangte: Sie sind untereinander und von jeder reellen Zahl verschieden, und man hat lediglich (5) und (6) in nahe liegender Weise festzulegen, z.B. &.R; 1/ als .R; &1/ oder j&.R; 1/j als .R; 1/ usw. (Dieser Existenznachweis sollte allerdings nicht dazu verleiten, nun stur 1 mit .R; 1/ oder &1 mit .R; &1/ gleichzusetzen.) Die Relationen (5) drücken aus, was man anschaulich von dem Objekt 1 (bzw. &1) erwartet: es ist ein neu hinzukommendes Element, das rechts (bzw. links) von allen reellen Zahlen liegt. Die Menge R wird die erweiterte reelle Achse genannt. Es ist nun zweckmäßig, auch den Elementen 1, &1 Umgebungen zuzuordnen: J . Definition. Gegeben sei ein D 2 R. Dann sind die D-Umgebungen bzw. die punktierten D-Umgebungen von ˙1 definiert durch U.1; D/ ´ fx 2 R j x > Dg D fx 2 R j x > Dg [ f1g U $ .1; D/ ´ fx 2 R j x > Dg U.&1; D/ ´ fx 2 R j x < Dg D fx 2 R j x < Dg [ f&1g U $ .&1; D/ ´ fx 2 R j x < Dg: Offensichtlich ist eine Teilmenge A , R genau dann nach oben unbeschränkt, wenn für alle D 2 R gilt: A \ U $ .1; D/ ¤ ¿. Man sagt dafür auch: 1 ist (uneigentlicher) Häufungspunkt von A. Analog ist A genau dann nach unten unbeschränkt, wenn für alle D 2 R gilt: A \ U $ .&1; D/ ¤ ¿. Man sagt dafür auch: &1 ist (uneigentlicher) Häufungspunkt von A. Konvention: Wir studieren nur Funktionen, deren Definitions- und Bildmengen keine uneigentlichen Elemente enthalten (es sei denn, es ist etwas anderes dazugesagt).
Mit dem neuen Umgebungsbegriff lassen sich die eigentlichen Grenzübergänge in E[3.2] und die uneigentlichen Grenzübergänge in A, C, F vollständig unter einen Hut bringen: K. Satz. Gegeben sei eine Teilmenge A , R, eine Funktion f W A ! R, ein Häufungspunkt ˛ 2 R von A sowie ein Element ˇ 2 R. Dann gilt lim f .x/ D ˇ
x!˛
Abschnitt 3.5 Uneigentliche Konvergenz und die Rolle von 1
149
genau dann, wenn zu jedem " > 0 eine ı > 0 existiert mit der Eigenschaft: x 2 A \ U.˛; ı/ H) f .x/ 2 U $ .ˇ; "/: Bestimmte Divergenz bzgl. R kann somit als Konvergenz bzgl. R aufgefasst werden.
"
Diese Formulierung hat den Vorteil, dass Eigenschaften, die mittels (punktierter) Umgebungen ausgedrückt sind, leichter vom eigentlichen auf den uneigentlichen Fall übertragen werden können. So gilt z.B. das Substitutionsprinzip, das in Satz Q[3.2] in der Umgebungssprache bewiesen wurde, in analoger Weise auch für uneigentliche Grenzübergänge. Bei dieser Gelegenheit wollen wir noch die folgende Symbolik für die unbeschränkten Intervalle einführen:
Neue Schreibweise bei den uneigentlichen (d.h. unbeschränkten) Intervallen: R µ /&1; 1Œ ;
fx 2 R j x % ag µ Œa; 1Œ ; fx 2 R j x > ag µ /a; 1Œ ;
fx 2 R j x . ag µ /&1; a/ ˇ fx 2 R ˇ x < ag µ /&1; aŒ :
Hierbei ist a 2 R, und ˙1 werden ggf. als (uneigentliche) Endpunkte oder (uneigentliche) Randpunkte bezeichnet. Treten die Intervallsymbole Œa; b/, Œa; bŒ, /a; bŒ, /a; b/, Œa; 1Œ, /a; 1Œ, /&1; a/, /&1; aŒ auf, so soll dies einschließen, dass a; b reelle Zahlen sind, es sei denn, es wird ausdrücklich etwas anderes dazugesagt.
Vergleich von Größenordnungen Wenn zwei Funktionen beim gleichen Grenzübergang den gleichen Grenzwert 0 oder ˙1 haben, entsteht die Frage, welche der beiden sich diesem Grenzwert „schneller“ nähert. Ein Maß dafür ergibt sich, indem man den Quotienten der beiden Funktionen betrachtet. Das führt auf folgende Begriffsbildung, wobei wir gleich von der neuen einheitlichen Charakterisierung in Satz K Gebrauch machen können: L. Definition. Gegeben seien zwei Funktionen f; g W A ! R und ein Häufungspunkt ˛ 2 R von A. Gilt für ein c 2 R lim
x!˛
so nennt man
f .x/ D c; g.x/
150
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
(i)
f; g asymptotisch proportional (für x ! ˛), wenn c ¤ 0 ist;
(ii)
f; g asymptotisch gleich (für x ! ˛), wenn c D 1 ist; in diesem Fall schreibt man f .x/ Š g.x/ .für x &! ˛/:
(iii) Ist c D 0 und ist limx!˛ f .x/ D limx!˛ g.x/ D 1, so sagt man: f .x/ geht (für x ! ˛) langsamer gegen 1 als g.x/, oder auch: g.x/ geht (für x ! ˛) schneller gegen 1 als f .x/. (iv)
Ist c D 0 und ist limx!˛ f .x/ D limx!˛ g.x/ D 0, so sagt man: f .x/ geht (für x ! ˛) schneller gegen 0 als g.x/, oder auch: g.x/ geht (für x ! ˛) langsamer gegen 0 als f .x/.
Die Definitionen (i) und (ii) sind auch dann anwendbar, wenn f oder g einzeln keine Grenzwerte besitzen. M. Beispiele. (i) Seien P; Q Polynome wie in Satz I mit den Graden n; m 2 N0 . Dann kann man aus (2) Folgendes ablesen: Sind P; Q vom gleichen Grad n D m, so sind sie für x ! 1 asymptotisch proportional; haben sie außerdem gleiche Leitkoeffizienten, so sind sie für x ! 1 asymptotisch gleich. Gilt für die Grade: 1 . n < m und sind beide Leitkoeffizienten positiv, so geht P .x/ für x ! 1 langsamer gegen 1 als Q.x/. (ii) Für die Größteganze-Funktion gilt Œx/ Š x
.für x &! 1/;
wie man den Abschätzungen Œx/ . x < Œx/ C 1 entnehmen kann, indem man durch x > 0 durchdividiert.
Aufgaben und Anmerkungen 1. Man untersuche auf Konvergenz bzw. Divergenz: 3p 3p 2 a) lim x C5&x b) lim x2 C 5 & x x!1 x!&1 3 12x 9 C .&1/Œx* x n c) lim d) lim lim .1 & x/ x!1 n!1 x#0 &3x 9 C 17 3 n e) lim lim .1 & x/ x#0
n!1
Abschnitt 3.5 Uneigentliche Konvergenz und die Rolle von 1
151
2. Man untersuche auf Konvergenz bzw. Divergenz: 3p x2 C 5 & x : lim .&1/Œx* x!1
3. Die Funktion f W A ! R habe eine nach oben unbeschränkte Definitionsmenge A , R, und es sei ˇ 2 R. Man beweise die Äquivalenz: lim f .x/ D ˇ ()
x!1
lim f .&y/ D ˇ:
y!&1
4. Man berechne in der Situation von Satz I für eine rationale Funktion den Grenzwert P .x/ x!&1 Q.x/ lim
in Abhängigkeit von den Graden der Polynome P und Q. Insbesondere gilt für ein Polynom P vom Grad n % 1 mit dem Leitkoeffizienten an lim P .x/ D sign.an / ( .&1/n ( 1:
x!&1
5. Gegeben sei eine rationale Funktion F D P =Q wie in C(ii)[3.1]. Für ein b 2 R sei Q.b/ D 0. Die Stelle b gehört also nicht zur Definitionsmenge A von F , ist aber Häufungspunkt von A. Nach (10)[3.1] besitzen P und Q Faktorisierungen der Gestalt P .x/ D .x & b/k P $ .x/;
Q.x/ D .x & b/` Q$ .x/;
wobei k 2 N0 und ` 2 N die entsprechenden Vielfachheiten sind. Bei P ist der Fall k D 0 (d.h. P .b/ ¤ 0) zugelassen. Stets ist P $ .b/ ¤ 0 und Q$ .b/ ¤ 0. Man setze c´
P $ .b/ ; Q$ .b/
" ´ signc
und zeige a) für k > `: b) für k D `: c) für k < `:
lim F .x/ D 0
x!b
lim F .x/ D c
x!b
lim F .x/ D " ( 1,
x#b
lim F .x/ D .&1/`&k " ( 1.
x"b
In den Fällen k % ` kann also F in b stetig fortgesetzt werden. 6. Der Vergleichsaspekt von Definition L besitzt weitere Varianten, die oft in der so genannten Landau-Symbolik mit o („klein-o“) und O („groß-O“) beschrieben werden: Gilt limx!˛ f .x/=g.x/ D 0, so schreibt man dafür auch f .x/ D o.g.x// .x ! ˛/. Ist f .x/=g.x/ für geeignetes ı > 0 in A \ U $ .˛; ı/ beschränkt, so schreibt man
152
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
dafür auch f .x/ D O.g.x// .x ! ˛/. Die Symbolkombination „D o“ bzw. „D O“ bezeichnet dabei strenggenommen eine Relation (keine Gleichheit). Mit diesen Relationen kann man aber in einiger Hinsicht rechnen wie mit Gleichungen. Z.B. gilt der Schluss ) f .x/ D o.g.x// .x ! ˛/ e.x/ D o.g.x// .x ! ˛/: H) f .x/ C f e.x/ D o.g.x// .x ! ˛/ f 7. Das Übertragungsprinzip aus Satz K[3.2] gilt auch für uneigentliche Grenzübergänge. Man zeige nämlich: Gegeben sei die Funktion f W A ! R mit A , R und ein Häufungspunkt ˛ 2 R von A. Dann sind äquivalent: (i) (ii)
lim f .x/ existiert in R.
x!˛
Für jede Folge .xn / in A n f˛g mit xn ! ˛ existiert lim f .xn / in R. n!1
(iii) Für jede Folge .xn / in A n f˛g mit xn ! ˛ existiert lim f .xn / in R, und alle n!1 diese Limites sind untereinander gleich. Ist dies erfüllt, so gilt für jede solche Folge .xn /: limx!˛ f .x/ D limn!1 f .xn /: Lösungshinweis: Im Falle ˛; ˇ 2 R ist dies mit Satz K[3.2] vollständig bewiesen. Die verbleibenden Fälle ˛ 2 R oder ˇ 2 R müssen nach dem augenblicklichen Stand einzeln diskutiert werden, was aber im Großen und Ganzen wie in K[3.2] möglich ist. Eine einheitliche Behandlung wird am Ende von Abschnitt 6.3 beschrieben.
3.6 Monotonie und Injektivität Die Injektivität einer Funktion f W A ! R ist eine wichtige Eigenschaft, bestimmt sie doch, ob die Funktion umkehrbar ist, d.h. ob die Gleichungen f .x/ D y bei gegebenen y 2 f .A/ eindeutig nach x auflösbar sind. Man ist deshalb daran interessiert, Bedingungen zu finden, die die Injektivität garantieren. Im später zu behandelnden mehrdimensionalen Fall kann das eine schwierige Frage sein. Hier, bei unseren reellen Funktionen einer Veränderlichen, besteht jedoch eine einfache Charakterisierung der Injektivität, wenn die Funktion stetig und auf einem Intervall definiert ist: A. Satz. Sei J ein Intervall und f W J ! R stetig. Dann sind äquivalent: (i)
f ist streng monoton.
(ii) f ist injektiv.
153
Abschnitt 3.6 Monotonie und Injektivität
Beweis. Natürlich kann man annehmen, dass J ¤ ¿ und nicht einpunktig ist. Die Richtung (i) H) (ii) ist trivial. (ii) H) (i): Es werden drei Fälle betrachtet: 1. Fall: J D Œa; b/ und f .a/ < f .b/. Wir zeigen: f ist streng monoton wachsend. Zunächst liegt das Minimum bei a und das Maximum bei b. Wäre nämlich c 2 /a; bŒ Minimalstelle, so gälte f .c/ < f .a/ < f .b/, also existierte nach dem Zwischenwertsatz ein 0 2 Œc; b/ mit f .0/ D f .a/ im Widerspruch zur Injektivität. Analog schließt man für das Maximum.
a
c
b
x2
b
Angenommen, f wäre nicht streng monoton wachsend. Dann gäbe es x1 ; x2 2 Œa; b/ mit: x1 < x2 und f .x1 / > f .x2 /, also nach dem vorangehenden f .a/ < f .x2 / < f .x1 /: Laut Zwischenwertsatz existierte ein ˛ 2 /a; x1 Œ mit f .˛/ D f .x2 / im Widerspruch zur Injektivität.
a
x1
2. Fall: J D Œa; b/ und f .a/ > f .b/. Dann ist f streng monoton fallend, was analog zum 1. Fall gezeigt wird. 3. Fall: J beliebig. Nachdem die Behauptung für beschränkte abgeschlossene Intervalle schon feststeht, versucht man, den allgemeinen Fall darauf zurückzuführen. Das geschieht hier mit Hilfe einer so genannten Ausschöpfung, d.h. man stellt J als Vereinigung von immer größer werdenden, beschränkten und abgeschlossenen Intervallen dar, z.B. bei J D Œa; bŒ mit J D
[ a 0. Um den ."; ı/-Test für f &1 zu bestätigen, unterscheiden wir zwei Fälle: 1. Fall: x0 2 /a; bŒ. Sei o.B.d.A. Œx0 & "; x0 C "/ , Œa; b/. Das geeignete ı wird hier auf nahe liegende Weise aus den Funktionswerten an den Enden dieses Teilintervalls konstruiert (vgl. obiges Bild): ı ´ min fy0 & f .x0 & "/; f .x0 C "/ & y0 g:
155
Abschnitt 3.6 Monotonie und Injektivität
Dann gelten nämlich die Schlüsse: jy & y0 j < ı H) &ı < y & y0 < ı H) f .x0 & "/ & y0 < y & y0 < f .x0 C "/ & y0 H) f .x0 & "/ < y < f .x0 C "/ H) x0 & " < f &1 .y/ < x0 C " beachte: f &1 streng monoton wachsend H) jf &1 .y/ & x0 j < " H) jf &1 .y/ & f &1 .y0 /j < "
beachte: x0 D f &1 .y0 /:
Der ."; ı/-Test für f &1 ist also erfüllt. 2. Fall: x0 D a oder x0 D b. Dies läuft analog, aber es entfällt jeweils die „Hälfte“ der Ungleichungen, da links von a und rechts von b nichts zu diskutieren ist. " C. Beispiel. Ohne Stetigkeit folgt aus der Injektivität keineswegs die Monotonie. Das zeigt z.B. die Funktion f W Œ0; 1/ ! R mit ( x für x 2 Q f .x/ ´ 1&x für x … Q: f bildet das Intervall J ´ Œ0; 1/ bijektiv auf sich selbst ab. Dies folgt aus f .J / , J und der leicht zu bestätigenden Tatsache: f .f .x// D x für alle x 2 J (f ist also seine eigene Inverse!). Auf den rationalen Zahlen in J ist f streng monoton wachsend, auf den irrationalen Zahlen in J streng monoton fallend, also insgesamt nicht monoton. Nach Satz A kann f nicht stetig sein. Tatsächlich bestätigt man (z.B. mit Hilfe von D[3.3]), dass f an allen Stellen von J unstetig ist mit Ausnahme von x D 1=2. Satz B lässt sich auf alle anderen Intervalltypen übertragen, wobei an den Randpunkten, die nicht zum Definitionsintervall gehören, anstelle der Funktionswerte die Grenzwerte derselben zu nehmen sind. Über die Existenz der Grenzwerte gilt dabei in Analogie zum Hauptsatz über monoton wachsende Folgen N[2.1] auch ohne Stetigkeit Folgendes: D. Lemma. Die Funktion f W A ! R sei monoton wachsend. (i) Ist c eigentlicher oder uneigentlicher Häufungspunkt von A \ fx 2 R j x < & cg µ A& c , so gilt limx"c f .x/ D sup f .Ac / einschließlich der Existenz bzgl. R. (ii) Ist c eigentlicher oder uneigentlicher Häufungspunkt von A \ fx 2 R j x > C cg µ AC c , so gilt limx#c f .x/ D inf f .Ac / einschließlich der Existenz bzgl. R.
156
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
Beweis. Wir beschränken uns auf den Fall (i) und dabei von den vier möglichen Kom& binationen c 2 R, c D 1 mit sup f .A& c / 2 R, sup f .Ac / D 1 als Muster auf die erste. Alle anderen Fälle, dann auch bei (ii), laufen mit geringfügigen Änderungen analog. Sei also c 2 R und s ´ sup f .A& c / 2 R angenommen. Gegeben ein " > 0, so & existiert ein x1 2 Ac mit f .x1 / > s & ", da s kleinste obere Schranke dieser Menge ist. Wegen der Monotonie gilt erst recht f .x/ > s & " für alle x 2 A& c mit x > x1 . Sei ı ´ c & x1 . Dann gilt insgesamt jf .x/ & sj D s & f .x/ < " für alle x 2 A& c mit jx & ˛j D ˛ & x < ı; denn die letzte Bedingung bedeutet gerade x > x1 . Man beachte sehr genau die Analogie zur Schlussweise bei N[2.1]! " Es folgt die angekündigte Verallgemeinerung von Satz B:: E . Satz. Sei f W J ! R stetig und streng monoton wachsend, J ein beliebiges Intervall mit evtl. uneigentlichen Endpunkten a; b. Dann gilt Satz B entsprechend, wobei A; B zu ersetzen sind durch die Grenzwerte A ´ lim f .x/; x!a
B ´ lim f .x/: x!b
Diese existieren in R oder uneigentlich. Ferner ist f .J / das Intervall mit den Endpunkten A; B, und zwar mit der gleichen Klammerstellung wie bei J (z.B. wenn J D Œa; bŒ, so f .J / D ŒA; BŒ, etc.). Beweis. Die Grundidee ist wiederum die Ausschöpfung. Wir betrachten als Muster den Fall J D Œa; bŒ mit a; b 2 R und nach oben nicht beschränktem Bild, d.h. sup f .J / D 1. (Alle anderen Fälle verlaufen im Großen und Ganzen genauso.) Wegen der Stetigkeit ist in diesem Fall am linken Ende: A ´ limx!a f .x/ D f .a/. Beim rechten Ende gilt nach Lemma D: B ´ limx!b f .x/ D 1 einschließlich der uneigentlichen Existenz. Die passende Ausschöpfung von J ist wie oben J D S S Œa; bŒ D Œa; x/, woraus mit Satz B folgt f .J / D ŒA; f .x//. Aufa 0 folgt dies aus (U) durch Division mit x. Dann ist es auch richtig für x < 0, da die Glieder der Ungleichung beim Übergang von x zu &x unverändert bleiben Zu (ii): Dies ergibt sich durch Einschnürung aus (i). Zu (iii): Man bildet zunächst den Differenzenquotienten für h ¤ 0 und formt mit der Funktionalgleichung (F) um: 1 arctan.x C h/ & arctan x D .arctan.x C h/ C arctan.&x// h h 1 h D arctan : h 1 C x.x C h/ Dazu ist wegen der eingeschränkten Gültigkeit von (F) erforderlich: &x.x C h/ < 1. Bei gegebenem x ist dies nach dem Meidungsprinzip für alle genügend kleinen jhj erfüllt, sodass diese Einschränkung beim jetzt zu erfolgenden Grenzübergang h ! 0 nicht stört. Für diese Limesbildung bezeichnen wir das letzte Argument von arctan mit k und können damit den Differenzenquotienten in die Form bringen: 1 arctan k arctan.x C h/ & arctan x D ( : h 1 C x.x C h/ k Da k mit h gegen null strebt, folgt hieraus mit dem Substitutionsprinzip und (ii) als Grenzwert 1 ( 1: 1 C x2 Zu (iv): Dies folgt unmittelbar aus (iii) mittels des Monotoniekriteriums E(ii)[4.3]. Zu (v): Man führt in der obigen Verdopplungsformel den Grenzübergang x " 1durch: 2x Dafür gilt y ´ 1&x 2 ! 1, also nach dem Substitutionsprinzip lim arctan y D lim 2 arctan x D 2 ( arctan 1 D 2 (
y!1
x"1
& & D : 4 2
Der zweite Grenzwert in (v) folgt hieraus, da arctan ungerade ist. Zu (vi): Die Berechnung der Bildmenge erfolgt nach der Vorschrift in Satz E[3.6] mittels der vorhergehenden Eigenschaften (iii) – (v). " Aufgrund dieser Informationen sieht der Graph des Arkustangens samt Schrankenfunktionen so aus:
192
Kapitel 4 Differentialrechnung
2
x
arctan x
1 -6
-5
-4
-3
-2
-1
x / √ 1+x2 1
0
2
3
4
5
6
x
-1 -2
Übrigens folgt allein aus der Ableitung (1) und dem „Anfangswert“ arctan 0 D 0, dass der Arkustangens durch die Grundeigenschaften (F) und (U) eindeutig bestimmt ist; vgl. D(ii)[4.3]. B . Definition (des Tangens). Die Tangensfunktion tan ist auf dem Intervall /&&=2; &=2Œ die (nach E[3.6] existierende) Umkehrfunktion von arctan: R ! /&&=2; &=2Œ. Es gilt also tan.arctan x/ D x
für alle x 2 R:
Ansonsten wird die Tangensfunktion tan durch &-periodische Fortsetzung festgelegt: tan W T &! R;
wobei
T ´ R n P;
P ´
& C Z&; 2
d.h. derart, dass tan.x C k&/ D tan x für alle x 2 T und k 2 Z gilt. Ausnahmepunkte, an denen die Funktion nicht sinnvoll definiert werden kann, sind also die beiden Stellen ˙&=2 sowie alle Stellen, die durch Addition ganzzahliger Vielfacher von & daraus entstehen. Diese bilden die Menge P .
3 2 1 -5 -4 -3 -2 -1
π
π
2
3
2 0 1 -1 -2 -3
4
5
Abschnitt 4.4 Trigonometrische Funktionen und der Einheitskreis
193
Die &-periodische Fortsetzung geschieht durch die Festsetzung i & &h ; k 2 N: tan.x C k&/ ´ tan x für x 2 & ; 2 2 Die Ausnahmemenge P ist spiegelsymmetrisch bzgl. 0, d.h. es gilt: p 2 P () &p 2 P . An den Stellen p 2 P ist der linksseitige Grenzwert von arctan gleich 1, der rechtsseitige &1. Natürlich ist auch die Definitionsmenge T des Tangens spiegelsymmetrisch bzgl. 0. Hinweis zur Symbolik: Wie bereits in Abschnitt 2.4 vermerkt, werden bei den klassischen Funktionen exp; tan etc. die Argumentklammern oft weggelassen. Z.B. schreibt man tan.x/ µ tan x. Bei „größeren“ Argumenten geht dies natürlich nicht immer, 3 z.B. muss man bei tan.˛ Cˇ/ die Klammern gebrauchen. Aber z.B. geht auch tan ˇ˛ µ tan ˇ˛ . Generell werden Potenzen direkt an das Funktionssymbol angehängt (außer bei &1, um Verwechslungen mit der Umkehrfunktion zu vermeiden). Z.B. bezeichnet f 2 die Funktion x 7! .f .x//2 µ f .x/2 . Kombination ist auch erlaubt: .tan.x//2 µ tan2 x, etc. Durch Übertragung vom Arkustangens auf den Tangens ergibt sich nun C. Satz. Der Tangens tan W R n P ! R hat folgende Eigenschaften: (i)
Die Einschränkung auf /&&=2; &=2Œ ist stetig, streng monoton wachsend und erfüllt: lim tan x D 1; lim tan x D &1: x"0=2
(ii)
tan .&=4/ D 1;
x#&0=2
tan.&&=4/ D &1.
(iii) Insgesamt ist die Funktion tan W R n P ! R ungerade sowie differenzierbar mit der Ableitung tan0 x D 1 C tan2 x: (iv)
An den Stellen p 2 P ist der linksseitige Grenzwert von tan gleich 1, der rechtsseitige gleich &1.
Beweis. Zu (i): Dies ergibt sich wiederum aus E[3.6]. Zu (ii): Dies ist klar aus den Werten von arctan bei ˙1. Zu (iii): Bei beidem genügt der Nachweis für x 2 /&&=2; &=2Œ (wegen der &-Periodizität). Die Eigenschaft tan.&x/ D & tan x ergibt sich aus arctan.&y/ D & arctan y
194
Kapitel 4 Differentialrechnung
durch Anwendung von tan und Substitution y D tan x. Die Ableitung folgt aus dem Umkehrsatz J[4.3] mittels (1): tan0 x D
1 arctan0 .tan
x/
D
1 D 1 C tan2 x: 1 1 C tan2 x
Zu (iv): Dies folgt aus den Grenzwerten in (i) aufgrund der &-Periodizität.
"
Das folgende Lemma wird den entscheidenden Schritt zur Eindeutigkeit von Kosinus und Sinus liefern: D. Lemma. Gilt für zwei differenzierbare Funktionen F; G W R ! R: F 0 D &G G 0 D F; so folgt
F 2 C G 2 D const.
Gibt es außerdem eine Stelle a 2 R mit F .a/ D G.a/ D 0, so folgt F D G D 0. Beweis. Betrachte die Hilfsfunktion H ´ F 2 C G 2 . Ihre Ableitung errechnet man als H 0 D 2FF 0 C 2GG 0 D 2F .&G/ C 2GF D 0: Somit ist H D const. Aus F .a/ D G.a/ D 0 folgt, dass die Konstante gleich 0 sein muss, also verschwinden F; G identisch. " E. Satz und Definition. Es gibt genau ein Paar von Funktionen f; g W R ! R mit: (2)
f 0 D &g g0 D f
und
f .0/ D 1 g.0/ D 0:
Diese Funktionen heißen Kosinus und Sinus: cos ´ f W R &! R;
sin ´ g W R &! R:
Beweis. e; e Eindeutigkeit: Gilt (2) für ein weiteres Funktionenpaar f g W R ! R, e0 D &e f g 0 e e g D f
und
e.0/ D 1 f e g .0/ D 0;
195
Abschnitt 4.4 Trigonometrische Funktionen und der Einheitskreis
e; G ´ g & e so erfüllen die Differenzen F ´ f & f g die Voraussetzungen von Lemma D; denn e0 D &g C e F0 D f 0 & f g D &G 0 0 0 e D F G D g &e g D f &f
e.0/ D 0 F .0/ D f .0/ & f G.0/ D g.0/ & e g .0/ D 0:
und
e; g D e Somit folgt: F D 0, G D 0, also f D f g. Existenz: Mit N ´ 2P D & C Z2& definieren wir zwei Funktionen f; g W R ! R durch (3)
x 2; f .x/ ´ x 1 C tan2 2 1 & tan2
x 2 g.x/ ´ x 1 C tan2 2 2 tan
für x … N
sowie f .x/ ´ &1;
g.x/ ´ 0
für x 2 N
und zeigen: f; g leisten das Verlangte. Klar ist sofort f .0/ D 1; g.0/ D 0. Stetigkeit von f; g in a: In a ˇ… N ˇist die Stetigkeit klar, da die Nenner ¤ 0 sind. Für a 2 N setzt man t ´ ˇtan x2 ˇ. Damit wird mittels C(i) nach dem Substitutionsprinzip 1 & t2 D &1 D f .a/; t !1 1 C t 2
lim f .x/ D lim
x!a
2t D 0 D g.a/: t!1 1 C t 2
lim jg.x/j D lim
x!a
Die jetzige Ausnahmemenge ist also harmlos: Grenzwert und Funktionswert stimmen auf ihr überein. Ableitungen: x Fall 1: x … N : Nach den Differentiationsregeln hat man für f mit q ´ tan2 : 2 - 1 x 3 .1 C q/ ( .&1/ & .1 & q/ ( 1 2 x ( 2 tan ( 1 C tan ( .1 C q/2 2 2 2 x 2 tan &2 x 2 D &g.x/ D ( tan ( .1 C q/ D & 2 x .1 C q/2 2 1 C tan 2
f 0 .x/ D
196
Kapitel 4 Differentialrechnung
und für g mit w ´ tan
x : 2
- 1 .1 C w 2 / ( 2 & 2w ( 2w 3 2 x ( ( 1 C tan .1 C w 2 /2 2 2 x 1 & tan2 1 & w2 2 D f .x/: 2 D ( .1 C w / D 2 x .1 C w 2 /2 1 C tan 2
g 0 .x/ D
Fall 2: a 2 N : Hier ergibt sich aus Fall 1 und der Stetigkeit von f; g: lim f 0 .x/ D & lim g.x/ D &g.a/;
x!a
x!a
lim g 0 .x/ D lim f .x/ D f .a/;
x!a
x!a
also durch Anwendung von H[4.3]: f 0 .a/ D &g.a/ und g 0 .a/ D f .a/ einschließlich der Existenz der Ableitungen. " Der Existenzbeweis durch die Formeln (3) mag im Augenblick etwas eigenartig erscheinen. In Wirklichkeit hängen diese Gleichungen direkt mit der Parametrisierung des Einheitskreises zusammen, und sie liefern später ein nützliches Werkzeug zur Auswertung von Integralen. Vgl. Lemma N und Abschnitt 8.7. Vorerst machen wir aber von den Details des obigen Existenzbeweises keinen Gebrauch. Wir nennen den Kosinus öfters an erster Stelle vor dem Sinus, weil diese Funktionen später in dieser Reihenfolge bei der Parametrisierung des Einheitskreises auftreten. F. Satz. Für Kosinus und Sinus gilt: (i)
cos0 D & sin; sin0 D cos;
(ii)
cos 0 D 1; sin 0 D 0;
(iii) cos2 ˛ C sin2 ˛ D 1 für alle ˛ 2 R (iv)
(trigonometrischer „Pythagoras“);
Additionstheoreme: cos.˛ C ˇ/ D cos ˛ cos ˇ & sin ˛ sin ˇ sin.˛ C ˇ/ D sin ˛ cos ˇ C cos ˛ sin ˇ
(v)
für alle ˛; ˇ 2 RI
cos ist eine gerade, sin eine ungerade Funktion.
Beweis. (i) – (iii) ergeben sich unmittelbar aus der Definition in E und aus Lemma D. Zu (iv): Wir betrachten bei festem ˛ die Hilfsfunktionen F .x/ ´ cos.˛ C x/ & .cos ˛ cos x & sin ˛ sin x/ G.x/ ´ sin.˛ C x/ & .sin ˛ cos x C cos ˛ sin x/:
Abschnitt 4.4 Trigonometrische Funktionen und der Einheitskreis
197
Wir wollen darauf Lemma D anwenden und berechnen dazu die Ableitungen: F 0 .x/ D & sin.˛ C x/ & .& cos ˛ sin x & sin ˛ cos x/ D &G.x/ G 0 .x/ D cos.˛ C x/ & .& sin ˛ sin x C cos ˛ cos x/ D F .x/: Aufgrund von F .0/ D G.0/ D 0 folgt: F D G D 0, also die Behauptung. Zu (v): Setze in (iv) ˇ D &˛: 1 D cos 0 D cos ˛ cos.&˛/ & sin ˛ sin.&˛/ 0 D sin 0 D sin ˛ cos.&˛/ C cos ˛ sin.&˛/: Dies ist ein lineares Gleichungssystem für cos.&˛/; sin.&˛/. Man kann es leicht nach diesen Größen auflösen. Dazu multipliziert man die erste Gleichung mit cos ˛, die zweite mit sin ˛ und addiert dann beide Gleichungen, bzw. man multipliziert die erste Gleichung mit & sin ˛, die zweite mit cos ˛ und addiert wiederum: cos ˛
D cos2 ˛ ( cos.&˛/ C sin2 ˛ ( cos.&˛/ D cos.&˛/
& sin ˛
D sin2 ˛ ( sin.&˛/ C cos2 ˛ ( sin.&˛/ D sin.&˛/:
Dabei wurde im letzten Schritt (iii) verwendet.
"
G. Bemerkung. Aus den Ableitungen cos0 .0/ D 0; sin0 .0/ D 1 gewinnt man durch Zurückgehen auf die Differenzenquotienten die Grenzwertformeln sin h D 1: h!0 h
1 & cos h D 0; h h!0
lim
lim
Da die Kosinusfunktion bei 0 den Wert 1 hat, sind ihre Werte aufgrund der Stetigkeit in einer ganzen Umgebung von 0 ungleich 0. Für solche Intervalle gilt nun: H. Lemma. Ist J ein offenes Intervall mit 0 2 J , in dem cos keine Nullstelle besitzt, so gilt in J (4)
arctan
sin x D x; cos x
also
sin x D tan x: cos x
Beweis. Wir betrachten in J die Hilfsfunktion h.x/ ´ h0 .x/ D
sin x . Ihre Ableitung lautet cos x
cos x ( cos x & .& sin x/ ( sin x D 1 C h.x/2 : cos2 x
198
Kapitel 4 Differentialrechnung
Betrachtet man in J die weitere Hilfsfunktion H.x/ ´ arctan h.x/ & x, so folgt H 0 .x/ D
h0 .x/ & 1 D 0; 1 C h.x/2
also H.x/ D const. D H.0/ D 0.
"
& & ist die kleinste positive Nullstelle von cos; außer cos D 0 gilt I . Satz. 2 2 & sin D 1. 2 Beweis. Die Kosinusfunktion besitzt in RC mindestens eine Nullstelle: Angenommen, cos wäre in RC nullstellenfrei, und damit wegen F(v) in ganz R. Dann gälte dort (4). Da arctan in R beschränkt ist, enthält dies einen Widerspruch. Sei x0 die kleinste positive Nullstelle von cos in RC . Diese existiert als Infimum t aller Nullstellen in RC . Ist nämlich .an / eine Folge in dieser Nullstellenmenge mit an ! t, so folgt aus cos an D 0 wegen der Stetigkeit auch cos t D 0. Das Infimum all dieser Nullstellen ist also selbst eine Nullstelle. Wegen cos 0 D 1 muss t D x0 > 0 sein. Somit ist cos x0 D 0 und cos x > 0 für x 2 Œ0; x0 Œ. Wegen sin0 D cos ist sin auf Œ0; x0 / streng monoton wachsend, also sin x0 > 0. Zusammen mit 1 D cos2 x0 C sin2 x0 D sin2 x0 folgt sin x0 D 1. Damit gilt (4) zunächst in Œ0; x0 Œ, also wegen F(v) in /&x0 ; x0 Œ. Daraus ergibt sich lim arctan
x"x0
sin x D x0 : cos x
Da der letzte Quotient für x " x0 gegen 1 strebt, folgt mittels A(v):
& D x0 . 2
"
J. Satz. (i)
Kosinus und Sinus sind beide 2&-periodisch, d.h. für alle x 2 R gilt cos.x C 2&/ D cos x;
(ii)
Kosinus besitzt die Nullstellenmenge
(iii) tan x D
sin.x C 2&/ D sin x: & C Z&, Sinus die Nullstellenmenge Z&. 2
sin x & für alle x … C Z&. cos x 2
Beim elementaren Zugang wird die Gleichung in (iii) als Definition für den Tangens genommen. Hier bedarf diese Gleichung eines Beweises, da die Tangensfunktion zuvor schon in B definiert war.
199
Abschnitt 4.4 Trigonometrische Funktionen und der Einheitskreis
Beweis von J. Zu (i): Aus Satz I und den Additionstheoremen folgt: 3 & &D cos x cos & sin x sin cos x C 2 2 (5) 3 & & D sin x cos C cos x sin sin x C 2 2 Weitere zweimalige Anwendung liefert hieraus: 3 &D & cos x; cos.x C &/ D & sin x C 2 (6) 3 & sin.x C &/ D cos x C D & sin x; 2
& D & sin x 2 & D cos x: 2
cos.x C 2&/ D cos x sin.x C 2&/ D sin x:
Zu (ii): Zum cos: Wegen cos.xC&/ D & cos x sind die 02 Ck&; k 2 Z, jedenfalls Nullstellen & * von cos. Da das Intervall & 02 ; 02 nullstellenfrei ist, sind ˙ 02 die einzigen Nullstellen in Œ&&; &/ und die 02 C k&; k 2 Z die einzigen überhaupt. ( ) Zum sin: Hier kann man wegen sin x D cos x & 02 auf cos zurückrechnen. sin x stimmen nach Lemma H auf /&&=2; &=2Œ Zu (iii): Beide Funktionen tan x und cos x überein und haben nach B und (6) die Periode &. Daraus folgt ihre Gleichheit, wie behauptet. "
K. Folgerung. Zwischen zwei aufeinander folgenden Nullstellen von cos (bzw. sin) hat cos (bzw. sin) jeweils festes Vorzeichen ¤ 0, also ist wegen F(i) sin (bzw. cos) auf dem abgeschlossenen Intervall dazwischen jeweils streng monoton. " L. Definition. Man nennt cot x ´
cos x ; sin x
x … Z&
den Kotangens und die vier Funktionen cos; sin; tan; cot insgesamt die trigonometrischen Funktionen oder Winkelfunktionen. Es folgen die Graphen von Sinus und Kosinus, wie sie sich (zumindest qualitativ) aus den abgeleiteten Tatsachen ergeben: sin
1
cos
π -7
-6
-5
-4
-3
-2
0
-1 -1
1
2
3
2π 4
5
6
7
200
Kapitel 4 Differentialrechnung
M. Bemerkungen (zum Formelarsenal der trigonometrischen Funktionen). Zwischen den trigonometrischen Funktionen gibt es zahlreiche Relationen, die man in Formelsammlungen aufgelistet findet. Es handelt sich dabei aber nicht um neue, unabhängige Relationen, sondern um Folgerungen aus den obigen Eigenschaften, insbesondere aus den Additionstheoremen, den speziellen Werten bei 0 und &=2 und der Tatsache, dass cos eine gerade, sin eine ungerade Funktion ist. Wir wollen hier nicht alles aufzählen, sondern die Prinzipien zur Herleitung beschreiben. Die gewonnenen Formeln sind oft sehr nützlich, z.B. in der Integralrechnung. (i) Setzt man in den Additionstheoremen F(iv): ˛ D ˇ D x, so folgen die Verdopplungsformeln cos 2x D cos2 x & sin2 x; (ii)
sin 2x D 2 sin x cos x
für x 2 R:
Schreibt man die Verdopplungsformeln in der Gestalt cos 2x D
cos2 x & sin2 x ; cos2 x C sin2 x
sin 2x D
2 sin x cos x cos2 x C sin2 x
und kürzt rechts die Brüche mit cos2 x, so folgt außerhalb der Nullstellen von cos: cos 2x D
1 & tan2 x ; 1 C tan2 x
sin 2x D
2 tan x 1 C tan2 x
für x …
& C Z&: 2
(iii) Aus Verdopplungsformeln wie in (i) und (ii) erhält man durch die Substitution 2x D ' entsprechende Halbwinkelformeln: ' ' & sin2 ; 2 2 ' 1 & tan2 2 cos ' D '; 1 C tan2 2 cos ' D cos2
' ' cos 2 2 ' 2 tan 2 sin ' D ' 1 C tan2 2 sin ' D 2 sin
für ' 2 R für ' … & C Z2&:
Die ersten beiden könnte man nach cos '2 , sin '2 auflösen (allerdings mit Wurzeln). Die letzten beiden waren in E beim Existenzbeweis verwendet worden. (iv) Schreibt man die Additionstheoreme F(iv), indem man ˇ durch &ˇ ersetzt, und addiert bzw. subtrahiert man entsprechende Formeln, so ergibt sich für ˛; ˇ 2 R: cos.˛ C ˇ/ C cos.˛ & ˇ/ D 2 cos ˛ cos ˇ; sin.˛ C ˇ/ C sin.˛ & ˇ/ D 2 sin ˛ cos ˇ; cos.˛ C ˇ/ & cos.˛ & ˇ/ D 2 sin ˛ sin ˇ; sin.˛ C ˇ/ & sin.˛ & ˇ/ D 2 cos ˛ sin ˇ:
201
Abschnitt 4.4 Trigonometrische Funktionen und der Einheitskreis
(v) Oftmals werden diese Gleichungen mit der Substitution ˛ C ˇ D ', ˛ & ˇ D 4 formuliert. Dann lauten sie: 'C4 '&4 cos ; 2 2 '&4 'C4 cos ; sin ' C sin 4 D 2 sin 2 2 '&4 'C4 cos ' & cos 4 D 2 sin sin ; 2 2 'C4 '&4 sin ' & sin 4 D 2 cos sin ; 2 2
cos ' C cos 4 D 2 cos
gültig für '; 4 2 R. Es ist nicht nötig, all diese Formeln parat zu haben. Aber es ist gut zu wissen, dass es sie gibt, und sich an ihre Herleitung zu erinnern. Beziehung zum Einheitskreis Bei der anschaulichen Behandlung werden die Winkelfunktionen am Einheitskreis motiviert. Wie fügt sich dies in den jetzigen präzisen Aufbau ein? – Der Einheitskreis ist als Punktmenge in R2 so definiert: ˇ , ˚ S1 ´ .a; b/ 2 R2 ˇ a2 C b 2 D 1 : Dies ist eine „statische“ Darstellung von S1 . Wir wollen nun die Punkte des Einheitskreises „dynamisch“ beschreiben, d.h. so, dass seine Punkte der Reihe nach durchlaufen werden. Dazu gibt es zwei natürliche Möglichkeiten, eine elementare und eine weitere, die durch Kosinus und Sinus vermittelt wird. Die elementare Möglichkeit nimmt Bezug auf das nebenstehende Bild. Man schneidet die Gerade durch .&1; 0/ und .0; t/ mit S1 . (a,b) Die Koordinaten a; b des Schnittpunkts er(0,t) geben sich durch einfache Rechnung wie in t den folgenden eingerahmten Formeln. Variiert man den „Parameter“ t, so durchläuft (-1,0) der Schnittpunkt .a; b/ den Einheitskreis bis S1 auf den Punkt .&1; 0/. Unabhängig von dieser Konstruktion zeigen wir nun auf exaktem Wege: N. Lemma (rationale Parametrisierung von S1 ). . (i)
Für alle t 2 R gilt:
1 & t2 1 C t2
/2
. C
2t 1 C t2
/2
D 1.
202
Kapitel 4 Differentialrechnung
(ii) Umgekehrt gibt es zu jedem Paar .a; b/ 2 R2 mit a2 C b 2 D 1 und a ¤ &1 genau ein t 2 R mit: aD
1 & t2 ; 1 C t2
nämlich tD
bD
2t ; 1 C t2
b : 1Ca
Beweis. Dieser ist völlig elementar. Zu (i): Diese Identität rechnet man einfach nach: /2 . /2 . 1 & 2t 2 C t 4 C 4t 2 1 & t2 2t 1 C 2t 2 C t 4 D C D D 1: 1 C t2 1 C t2 .1 C t 2 /2 .1 C t 2 /2 Zu (ii): Sind a; b gegeben, so muss man die zugehörigen t finden, d.h. die eingerahmten Gleichungen nach t auflösen. Dies läuft zunächst mit folgenden Schlüssen: 1 & t2 1 C t2 2t bD 1 C t2
.1 C t 2 /a D 1 & t 2
aD
H)
H) 2
.1 C t /b D 2t
1&a 1Ca 1 t D .1 C t 2 /b: 2
t2 D
Hieraus folgt weiter:
. / 1 1&a 1 1CaC1&a b tD 1C bD bD : 2 1Ca 2 1Ca 1Ca
Zu .a; b/ ist also t eindeutig bestimmt. Die Probe zeigt, dass das errechnete t die Ausgangsgleichungen wirklich löst: . /2 b 1& .1 C a/2 & b 2 1 C 2a C a2 & b 2 1Ca D . /2 D .1 C a/2 C b 2 1 C 2a C a2 C b 2 b 1C 1Ca D
2a.1 C a/ a2 C b 2 C 2a C a2 & b 2 D Da 1 C 2a C 1 2.1 C a/
b 2 2b.1 C a/ 2b.1 C a/ 1Ca D D b: . /2 D 2 2 .1 C a/ C b 2.1 C a/ b 1C 1Ca
Abschnitt 4.4 Trigonometrische Funktionen und der Einheitskreis
Damit ist auch die Existenz von t gesichert.
203 "
Rationale Parametrisierungen treten auch bei anderen Gebilden auf und spielen so in verschiedenen Gebieten eine wichtige Rolle. Die obige rationale Parametrisierung wird jetzt in eine Parametrisierung mittels trigonometrischer Funktionen umgerechnet: O. Folgerung (transzendente Parametrisierung von S1 ). (i)
cos2 ' C sin2 ' D 1.
Für alle ' 2 R gilt:
(ii) Umgekehrt gibt es zu jedem Paar .a; b/ 2 R2 mit a2 C b 2 D 1 genau ein ' 2 /&&; &/ mit: a D cos ';
b D sin ':
Beweis. Zu (i): Dies ist einfach der trigonometrische Pythagoras F(iii). Zu (ii): Wir unterscheiden zwei Fälle: Fall 1: a ¤ &1: Setze (7)
t D tan
' : 2
Diese Gleichung vermittelt eine bijektive Abbildung von ' 2 /&&; &Œ auf t 2 R. Die Formeln in N(ii) vermitteln eine bijektive Abbildung von t 2 R auf die .a; b/ des Einheitskreises S1 mit a ¤ &1. Substituiert man das t aus (7) in die Formeln von N(ii), so erhält man insgesamt eine bijektive Abbildung von ' 2 /&&; &Œ auf diese Kreispunkte. Der Witz ist nun, dass bei diesem Einsetzen genau a D cos ', b D sin ' resultiert, wenn man die Halbwinkelformeln in M(iii) berücksichtigt. Fall 2: a D &1: Hier ist notwendigerweise b D 0. Für ' 2 /&&; &/ wird genau einmal &1 D cos '; 0 D sin ', nämlich für ' D &. Insgesamt vermitteln die eingerahmten Formeln in (ii) eine bijektive Abbildung des Intervalls /&&; &/ D /&&; &Œ [ f&g auf S1 " Bei der transzendenten Parametrisierung werden alle Punkte von S1 erfasst, bei der rationalen alle bis auf einen. Wegen dieser Zusammenhänge nennt man die trigonometrischen Funktionen auch Kreisfunktionen. Wenn ' nicht auf das Intervall /&&; &/ beschränkt wird, sondern frei in R läuft, so liefern die Formeln a D cos ', b D sin ' das gleiche Paar .a; b/ mehrfach, nämlich immer dann, wenn ' um ein ganzzahliges Vielfaches von 2& verschoben wird. Das ist dann aber auch die einzige Art der mehrfachen Erfassung; denn es gilt:
204
Kapitel 4 Differentialrechnung
P. Lemma. Für '; 4 2 R besteht die Äquivalenz cos ' D cos 4
)
sin ' D sin 4
() ' & 4 2 Z2&:
Beweis. Dieser beruht auf der Identität '&4 ; 2 die sich aus der zweiten Formelzeile in M(v) durch Quadrieren und Addieren ergibt. An dieser Identität erkennt man unmittelbar die Behauptung, da ihre rechte Seite nach J(ii) genau dann verschwindet, wenn '&. in Z&, also ' & 4 in Z2& liegt. " 2 .cos ' & cos 4/2 C .sin ' & sin 4/2 D 4 sin2
Q. Bemerkung. Anhand dieses Lemmas sieht man auch, dass in O(ii) anstelle des Intervalls / & &; &/ jedes halboffene Intervall der Länge 2& verwendet werden kann, z.B. Œ0; 2&Œ. Die Darstellung des Einheitskreises in Satz O ist die Basis für die Polarkoordinaten in R2 : R. Satz und Definition. Zu .x; y/ 2 R2 mit .x; y/ ¤ .0; 0/ existiert genau ein r > 0 sowie ein ' 2 R mit (8)
x D r cos ' y D r sin ':
Man nennt die beiden Zahlen r; ' Polarkoordinaten von .x; y/, genauer r den Betrag und ' ein (Winkel-)Argument von .x; y/. Es gilt (9)
rD
p x2 C y2:
Ein Argument ' ist durch .x; y/ bis auf die Addition ganzzahliger Vielfache von 2& eindeutig bestimmt, also in / & &; &/ eindeutig und heißt dann der Hauptwert Arg.x; y/. Dieser ist in der geschlitzten Ebene S ´ R2 n f.x; y/ 2 R2 j x . 0; y D 0g gegeben durch (10)
Arg.x; y/ D 2 arctan
y : p x C x2 C y2
Abschnitt 4.4 Trigonometrische Funktionen und der Einheitskreis
205
Beweis. Die Eindeutigkeit von r ist klar, da aus (8) folgt: x 2 C y 2 D r 2 , also (9). Wir setzen nun bei gegebenem .x; y/ ¤ .0; 0/ y b´p : 2 x C y2
x ; a´ p 2 x C y2
Es gilt dann a2 C b 2 D 1. In der Sprechweise der linearen Algebra ist .a; b/ der zu .x; y/ gehörende Einheitsvektor. Auf .a; b/ 2 S1 kann man die Aussagen N, O und P anwenden, woraus die Behauptungen folgen. Dabei gilt für den Hauptwert ' nach (7) x ' b x tan D t D D r y D ; 2 1Ca yCr 1C r also folgt (10).
"
R. Zusatz. Der Nullpunkt .0; 0/ 2 R2 bekommt als Polarkoordinaten r D 0 und ' 2 R beliebig. Dafür ist dann (8) ebenfalls erfüllt.
S. Bemerkung. In der rechten Halbebene H ´ f.x; y/ 2 R2 j x > 0g kann zur Argumentberechnung statt (10) die einfachere Formel (11)
Arg.x; y/ D arctan
y x
dienen. Diese folgt aus (10) mittels der eingangs p genannten Verdopplungsformel des y arctan, indem man dort a ´ xCr mit r ´ x 2 C y 2 setzt. Für x > 0 bestätigt man nämlich durch Umrechnung für das so definierte a: a2 < 1; also 2 arctan
2a y D ; 1 & a2 x y y D arctan : xCr x
Für die Ungleichung a2 < 1 benötigt man die Voraussetzung x > 0. Tatsächlich ist (11) für x < 0 falsch; denn sonst ergäbe sich für .x; y/ und .&x; &y/ das gleiche Argument, was für y ¤ 0 der Eindeutigkeitsaussage von R widerspricht. Die Darstellung (10) hat somit einen viel größeren Geltungsbereich als (11).
206
Kapitel 4 Differentialrechnung
Halbebene
geschlitzte Ebene
T. Definition. Die zyklometrischen Funktionen sind als (teilweise) Umkehrfunktionen der trigonometrischen Funktionen folgendermaßen gegeben: ' arccos ´ .cos j Œ0; &//&1 W Œ&1; 1/ ! Œ0; &/ h & &i 3 ˇ h & & i-&1 ˇ W Œ&1; 1/ ! & ; ' arcsin ´ sin ˇ & ; 2 2 2 2 i & &h 3 ˇ i & & h-&1 ˇ WR! & ; ' arctan D tan ˇ & ; 2 2 2 2 &1 ' arccot ´ .cot j /0; &Œ / W R !/0; &Œ
(streng monoton fallend) (streng monoton wachsend) (streng monoton wachsend) (streng monoton fallend).
Die Vorsilbe „arc-“ wird als „Arkus-“ gesprochen. Die vier Funktionen heißen also Arkuskosinus, Arkussinus, Arkustangens und Arkuskotangens. Die Hochzahlen &1 bedeuten hier natürlich die Umkehrfunktionen. An Regeln für diese Funktionen seien die folgenden genannt: U. Satz. Es gilt: & 2 & (ii) arctan y C arccot y D 2 1 (iii) arcsin0 y D p 1 & y2 1 (iv) arccot0 y D & 1 C y2 (i)
arccos y C arcsin y D
für y 2 Œ&1; 1/ für y 2 R für y 2 /&1; 1Œ für y 2 R:
Beweis. Als Muster seien (i) und (iii) behandelt; (ii) und (iv) laufen analog. * & Zu (i): Für gegebenes y 2 Œ&1; 1/ setze man y D sin x mit einem x 2 & 02 ; 02 , also ( ) x D arcsin y. Nach dem Additionstheorem von cos ist y D cos 02 & x , wobei
207
Abschnitt 4.4 Trigonometrische Funktionen und der Einheitskreis 0 2
& x 2 Œ0; &/, somit Behauptung.
0 2
& x D arccos y. Zusammen mit x D arcsin y folgt die
* & Zu (iii): Die Ableitung von sin ist auf & 02 ; 02 positiv. Nach J[4.3] ist arcsin differenzierbar in /&1; 1Œ und dort (mit den gleichen Bezeichnungen wie bei (i)): arcsin0 y D
1 1 1 1 ; D Dp Dp 0 2 sin x cos x 1 & y2 1 & sin x
wobei beim dritten Gleichheitszeichen verwendet ist, dass cos x > 0.
"
V . Beispiel. Die folgenden Funktionen werden verschiedentlich für Beispiele und Gegenbeispiele herangezogen (dabei sei n 2 N0 ): 8 1 < n x ( sin für x ¤ 0 fn .x/ ´ x :0 für x D 0: Jede dieser Funktionen oszilliert umso stärker, je näher man an 0 herankommt. Andererseits werden die Ausschläge der Schwankungen nahe 0 mit wachsendem n durch x n mehr und mehr „niedergebügelt“.
n=1
n=0
n=2
Alle diese Funktionen sind stetig und differenzierbar außerhalb des Nullpunktes 0. Die Ableitung berechnet man als fn0 .x/ D nx n&1 sin
1 1 & x n&2 cos x x
für x ¤ 0:
Hieraus liest man ab: Für n D 0 ist f0 unstetig in 0; denn beliebig nahe bei 0 gibt es Funktionswerte 1 und 1 &1, nämlich für x 2 " CZ0 . Die Funktion f0 wird als Sinusoid bezeichnet. 2
Für n D 1 ist f1 stetig in 0, aber dort nicht differenzierbar; denn der Differenzenquotient dafür ist sin h1 . Für n D 2 ist f2 in 0 differenzierbar; denn der Differenzenquotient dafür ist h ( sin h1 , somit f20 .0/ D 0. Die Ableitung existiert also auf ganz R. Sie ist aber in 0 unstetig;
208
Kapitel 4 Differentialrechnung
denn in dem obigen Ausdruck für f20 .x/ konvergiert zwar der erste Summand gegen 0 für x ! 0, nicht aber der zweite, der wiederum beliebig nahe bei 0 Funktionswerte 1 und &1 annimmt. Eine auf einem Intervall Œa; b/ überall differenzierbare Funktion kann also sehr wohl eine unstetige Ableitung besitzen. Trotzdem hat die Ableitung nach Darboux immer die Zwischenwerteigenschaft M[4.3]. W. Bemerkungen (Weiteres zum Formelarsenal der trigonometrischen Funktionen). (i) Aus den Additionstheoremen für Kosinus und Sinus gewinnt man auch solche für Tangens und Kotangens, z.B. entsteht das Additionstheorem des Tangens tan.˛ C ˇ/ D
tan ˛ C tan ˇ 1 & tan ˛ tan ˇ
für ˛; ˇ; ˛ C ˇ …
& C Z& 2
aus F(iv) durch Division und Kürzen mit cos ˛ cos ˇ. (ii) Die Verdopplungsformeln aus M(i) kann man auf beliebige natürliche Vielfache ausdehnen, indem man die folgenden Rekursionsformeln verwendet cos.n C 1/˛ D cos n˛ cos ˛ & sin n˛ sin ˛ sin.n C 1/˛ D sin n˛ cos ˛ C cos n˛ sin ˛: Z.B. erhält man für n D 2 hieraus cos 3˛ D cos3 ˛ & 3 cos ˛ sin2 ˛ sin 3˛ D 3 sin ˛ & 4 sin3 ˛: Eine explizite (nicht rekursive) Darstellung für cos nx und sin nx wird sich mit Hilfe der so genannten Formeln von Moivre in der komplexen Behandlung ergeben; vgl. D[7.2]. (iii) Mit solchen Formeln kann man dann auch spezielle Werte berechnen, z.B. indem man in der letzten Gleichung ˛ D &=6 setzt und überlegt, dass die Gleichung 1 D 3x & 4x 3 die einzige positive Lösung 1=2 besitzt. So folgt (ohne Elementargeometrie!): p & 1 & 3 sin D ; cos D : 6 2 6 2 (iv) Ähnlich berechnet man die weiteren Werte der folgenden Tabelle: & & & & ˛! 0 6 4 3 2 p p p p 1 1 1 1 1p sin ˛ 0 D 0 1 2 3 1D 4 2 2 2 2 2 1p 1p 1p 1p 1p cos ˛ 1 D 4 3 2 1 0D 0 2 2 2 2 2
209
Abschnitt 4.4 Trigonometrische Funktionen und der Einheitskreis
Die einzige Frage, die im Augenblick offen bleibt, nämlich die inhaltliche Bedeutung von ' im Paar .cos '; sin '/, wird in I(ii)[9.1] behandelt. Es ist dazu der Begriff „Bogenlänge“ erforderlich. Die Periodizität, die hier bei den trigonometrischen Funktionen eine Rolle spielt, kann allgemein so definiert werden: X. Definition (Periodizität). Eine Funktion f W R ! M in eine beliebige Menge M heißt periodisch, wenn es eine Zahl p ¤ 0 gibt, sodass für alle x 2 R gilt: f .x C p/ D f .x/. Man sagt dann auch, f sei p-periodisch, und man nennt p eine Periode von f . Da mit p auch &p eine Periode von f ist, kann o.B.d.A. p > 0 angenommen werden. Aufgaben und Anmerkungen 1. Man beweise mit den Additionstheoremen 3& 3& cos ˛ D sin & ˛ ; sin ˛ D cos &˛ 2 2 und folgere daraus: 3& &˛ cot ˛ D tan 2
für ˛ … Z&;
tan ˛ D cot
3& 2
&˛
für ˛ 2 R -
für ˛ …
& C Z&: 2
2. Man zeige für alle ˛; ˇ 2 R sin2 ˛ & sin2 ˇ D sin.˛ C ˇ/ ( sin.˛ & ˇ/; eine eigenartige Analogie zur elementaren Formel a2 & b 2 D .a C b/ ( .a & b/. 3. Man berechne die folgenden Grenzwerte: / . tan ˛x & tan ˇx 1 , b) lim (für ˛ ¤ ˇ), a) lim n 1 & cos n!1 x!0 sin ˛x & sin ˇx n 3& c) lim & x tan x. 2 x!0=2 4. Eine modulierte Sinusfunktion f W R ! R hat die Darstellung f .x/ D g.x/ ( sin x, wobei g W R ! R nullstellenfrei und differenzierbar sei. An Beispielen beobachtet man: Treffen sich die Graphen von f und g, so geschieht dies stets tangential. Wie lässt sich das mathematisch formulieren und beweisen? 5. $ Man beweise
s & D sin 5
p 5& 5 : 8
210
Kapitel 4 Differentialrechnung
6. Für welche x 2 R gilt: a) tan.arctan x/ D x,
b) arctan.tan x/ D x?
Dass b) nicht immer stimmt, ist der Grund dafür, dass man aus dem Additionstheorem des Tangens in W(i) nicht ohne weiteres das Additionstheorem des Arkustangens zurückgewinnen kann. Zwar erhält man aus W(i) vermöge der Substitution tan ˛ D a, tan ˇ D b und formales Anwenden von arctan auf beiden Seiten die Formel (F) vom Beginn dieses Abschnitts, aber ohne die nötige Einschränkung ab < 1. Ein Fehler bei diesem Vorgehen ist die blinde Anwendung von b), was eben nicht generell richtig ist. Allenfalls kann man diese formale Rechnung zur Gewinnung einer Vermutung verwenden, beweisen muss man das Ergebnis unabhängig. Das geht oft durch Differenzieren. In diesem Fall liefe das so: Vermutet man (12)
arctan
aCb D arctan a C arctan b; 1 & ab
und will Gewissheit erlangen, ob dies richtig ist, so hält man a fest und lässt b D x laufen, d.h. man betrachtet die Funktion f .x/ ´ arctan
aCx & arctan a & arctan x 1 & ax
etwa auf fx 2 R j 1&ax > 0g. Diese Menge ist in jedem Fall ein offenes Intervall, das 0 enthält (bei a D 0 z.B. gleich R). Sodann berechnet man die Ableitung f 0 .x/, was sich in diesem Fall als 0 herausstellt (man rechne selbst!). Damit folgt f .x/ D const. und wegen f .0/ D 0 in der Tat f .x/ D 0 für alle x mit ax < 1. Somit gilt (12) für ab < 1. Im Fall der Gleichung (12) wäre ein solcher Beweis eigentlich nicht nötig, da sie für ab < 1 ohnehin schon bekannt war. Aber daran kann man die Vorgehensweise gut erläutern. 7. Man beweise: 1 & D für a > 0; a 2 1 & b) arctan a C arctan D & für a < 0; a 2 3 p p c) arcsin a C arcsin b D arcsin a 1 & b 2 C b 1 & a2
a) arctan a C arctan
d) 2 arctan a D arcsin
für a2 C b 2 . 1.
2 für jaj . 1. 1 C a2
8. Was tritt anstelle der Gleichung (12), wenn ab > 1? 9. Seien a; b reelle Konstanten. Man zeige: Es gibt ein r % 0 und ein ' 2 R mit: a cos x C b sin x D r cos.x & '/
für alle x 2 R:
Abschnitt 4.4 Trigonometrische Funktionen und der Einheitskreis
211
p r ist hierbei eindeutig bestimmt, nämlich als r D a2 C b 2 , und ' ist für .a; b/ ¤ .0; 0/ bis auf ganze Vielfache von 2& bestimmt, z.B. als ' D Arg.a; b/. 10. Für n 2 N0 sei die Funktion Tn W Œ&1; 1/ ! R definiert durch Tn .x/ ´ cos.n ( arccos x/: a)
Man beweise durch vollständige Induktion: Tn ist ein Polynom vom Grad n (eingeschränkt auf Œ&1; 1/). Man nennt Tn das n-te Tschebyscheff-Polynom.
b) Man gebe die ersten fünf Tschebyscheff-Polynome T0 ; : : : ; T4 an. c)
Man berechne die Nullstellen von Tn und überlege, dass es genau n verschiedene sind, die alle im Intervall /&1; 1Œ liegen.
11. Sei ' W Œa; b/ ! R (a < b) eine Funktion mit übereinstimmenden Endwerten: '.a/ D '.b/. Man zeige: Es gibt genau eine Fortsetzung f W R ! R von ' mit der Periode b & a, d.h. derart, dass f jŒa; b/ D ' und f .x C b & a/ D f .x/ für alle x 2 R gilt (periodische Fortsetzung). Diese Fortsetzung ist gegeben durch 3 hx & ai ( .b & a/ : f .x/ D ' x & b&a Ist ' nur im offenen Intervall /a; bŒ gegeben, so gilt dies analog, wobei die periodische Fortsetzung nur in den Punkten außerhalb a C Z ( .b & a/ definiert ist. Insbesondere ist die &-periodische Fortsetzung des Tangens auf T D R n P explizit gegeben durch 3 hx 1i tan x D tan x & C (& ; x 2 R n P; & 2 wobei auf der rechten Seite nur Argumente des Tangens in /&&=2; &=2Œ vorkommen. 12. Die rationale Parametrisierung des Einheitskreises in Lemma N kann auch zur Auffindung rationaler oder ganzzahliger Lösungen entsprechender Gleichungen dienen. Man zeige nämlich: a) Die Paare .,; 1/ 2 Q ) Q mit , 2 C 12 D 1 und , ¤ &1 sind genau die, welche sich in der Form 1 & t2 2t ,D ; 1D 2 1Ct 1 C t2 mit t 2 Q darstellen lassen. b) Die Lösungen der Gleichung x2 C y2 D z2 in natürlichen Zahlen x; y; z nennt man pythagoräische Tripel. Das bekannteste pythagoräische Tripel ist das ägyptische Tripel x D 3; y D 4; z D 5; denn es gilt 32 C 42 D 52 . Es sollen nun alle pythagoräischen Tripel bestimmt werden:
212
Kapitel 4 Differentialrechnung
c) Setzt man in a) t D q=p mit natürlichen Zahlen p > q, so wird ,D
p2 & q2 ; p2 C q2
1D
2pq p2 C q2
und , 2 C 12 D 1; woraus nach Durchmultiplizieren mit .p 2 C q 2 /2 entsteht: .p 2 & q 2 /2 C .2pq/2 D .p 2 C q 2 /2 : Man erhält also bereits viele pythagoräische Tripel in der Gestalt (13)
x D p2 & q2;
y D 2pq;
z D p2 C q2
mit .p; q/ 2 N ) N und p > q. Selbstverständlich sind die natürlichen Vielfachen eines solchen Tripels wiederum pythagoräische Tripel. Z.B. liefert (13) für p D 2, q D 1 das ägyptische Tripel .3; 4; 5/ und für p D 3, q D 2 das Tripel .5; 12; 13/ mit 25 C 144 D 169. Auf diese Weise erhält man sogar alle pythagoräischen Tripel: c) Ist .x; y; z/ ein beliebiges pythagoräisches Tripel, so zeige man zunächst, dass mindestens eine der Zahlen x; y gerade sein muss, und dann weiter: d) $ Ist .x; y; z/ ein pythagoräisches Tripel und y gerade, so existieren natürliche Zahlen p; q; r gibt mit
x D .p 2 & q 2 / ( r;
y D 2pq ( r;
z D .p 2 C q 2 / ( r:
Das sind die so genannten indischen Formeln. Diese liefern also eine Parametrisierung aller natürlichen Lösungen der Gleichung x 2 C y 2 D z 2 . e) $ Gibt es unter allen pythagoräischen Tripeln .x; y; z/ eines, für das der „isoperimetrische Quotient“ U 2 =F (U der Umfang x C y C z, F der Flächeninhalt xy=2 des zugehörigen rechtwinkligen Dreiecks) minimal wird? 13. Für n 2 N mit n % 3 gibt es keine Lösungen der Gleichung x n C y n D z n in natürlichen Zahlen x; y; z. Das war um 1630 von Fermat ausgesprochen worden, sein Beweis konnte aber niemals aufgefunden werden. Nach vergeblichen Versuchen vieler Mathematiker gelang es schließlich Wiles[1995], diese Behauptung in einer umfangreichen Arbeit zu verifizieren. Dieser Satz musste also über 300 Jahre als Vermutung gelten; er wird heute als Fermats letzter Satz bezeichnet.
4.5
$ Grenzwerte nach de l’Hospital
Hier wird eine Methode vorgestellt, mit der viele Grenzwerte gleichsam automatisch bestimmt werden können. Hauptsächlich geht es um „unbestimmte Ausdrücke“, die
Abschnitt 4.5
$ Grenzwerte nach de l’Hospital
213
meistens in Form von Quotienten auftreten. Dabei streben Zähler und Nenner einem Grenzwert 0 oder ˙1 zu, und zwar so, dass man von vornherein nicht sehen kann, wer von den beiden „gewinnt“. A. Satz (Regel von de l’Hospital, einfache Variante). Sei A , R und f; g W A ! R differenzierbar in a 2 A sowie f .a/ D g.a/ D 0, g 0 .a/ ¤ 0. Dann gilt: lim
x!a
f 0 .a/ f .x/ D 0 : g.x/ g .a/
Beweis. Schreibe für x ¤ a:
f .x/ & f .a/ f .x/ & f .a/ f 0 .a/ f .x/ x&a D D &! 0 g.x/ & g.a/ g.x/ g.x/ & g.a/ g .a/ x&a
.x &! a/:
Man beachte, dass der Nenner des Doppelbruchs ¤ 0 ist, wenn x nahe genug bei a liegt, jedoch ¤ a ist (Meidungsprinzip). " ln x 3& - ? x!1 x cos 2 Lösung: Die Voraussetzungen von Satz A sind erfüllt für 3& x ; a´1W f .x/ ´ ln x; g.x/ ´ cos 2 1 f .1/ D g.1/ D 0; f 0 .x/ D ; f 0 .1/ D 1; x 3& - & & x ( ; g 0 .1/ D & ¤ 0: g 0 .x/ D & sin 2 2 2 B. Beispiel. Was ist lim
Damit wird lim
x!1
2 1 ln x 3& - D & D & : & cos x & 2 2
Die obige Regel ist stark verallgemeinerungsfähig. Man benötigt als wesentliches Hilfsmittel dafür: C. Satz (verallgemeinerter Mittelwertsatz). Die Funktionen f; g W Œa; b/ ! R seien stetig und im offenen Intervall /a; bŒ differenzierbar. Dann existiert ein c 2 /a; bŒ mit (1)
.f .b/ & f .a// ( g 0 .c/ D .g.b/ & g.a// ( f 0 .c/:
214
Kapitel 4 Differentialrechnung
Beweis. Wir definieren eine Hilfsfunktion ' W Œa; b/ ! R in Gestalt einer Linearkombination aus f und g: '.x/ ´ *f .x/ C +g.x/ und wählen die Konstanten *; + derart, dass '.a/ D '.b/ wird. Dann kann auf ' der gewöhnliche Mittelwertsatz C[4.3] angewandt werden: '.a/ D '.b/ () *f .a/ C +g.a/ D *f .b/ C +g.b/ () *.f .a/ & f .b// D +.g.b/ & g.a// (H * D g.b/ & g.a/; + D f .a/ & f .b/: Bei diesen Werten von *; + existiert ein c 2 /a; bŒ mit ' 0 .c/ D 0. Da ' 0 .c/ D *f 0 .c/ C +g 0 .c/ folgt .g.b/ & g.a// ( f 0 .c/ C .f .a/ & f .b// ( g 0 .c/ D 0; also die Behauptung.
"
C. Zusatz. Gilt g 0 .x/ ¤ 0 auf /a; bŒ, so kann man (1) umformen: f .b/ & f .a/ f 0 .c/ D 0 : g.b/ & g.a/ g .c/
(2)
Beweis. Nach dem gewöhnlichen Mittelwertsatz gilt wegen g 0 .x/ ¤ 0 in /a; bŒ auch g.b/ & g.a/ ¤ 0. Also ist (1) hierdurch dividierbar. " Der gewöhnliche Mittelwertsatz C[4.3] wird auch als erster Mittelwertsatz, der verallgemeinerte Mittelwertsatz C als zweiter Mittelwertsatz der Differentialrechnung bezeichnet. Für g.x/ D x geht dieser natürlich in C[4.3] über. D. Satz (Regel von de l’Hospital, allgemeine Variante). Seien f; g W /a; bŒ ! R differenzierbar (a bzw. b auch als &1 bzw. 1 zugelassen), g 0 .x/ ¤ 0 für alle x 2 /a; bŒ und eine der folgenden Bedingungen (i) oder (ii) erfüllt: (i) (ii)
lim f .x/ D lim g.x/ D 0;
x!b
x!b
lim g.x/ D 1 oder D &1.
x!b
Außerdem existiere der Grenzwert lim
x!b
gilt lim
x!b
f 0 .x/ (eigentlich oder uneigentlich). Dann g 0 .x/
f .x/ f 0 .x/ D lim 0 : g.x/ x!b g .x/
Die gleiche Aussage besteht für x ! a.
Abschnitt 4.5
$ Grenzwerte nach de l’Hospital
215
Beweis. Ein sehr einfacher Fall ist (i) mit a 2 R. Man kann nämlich so argumentieren: Durch f .b/ ´ 0, g.b/ ´ 0 werden f; g stetig auf /a; b/ fortgesetzt. Wendet man nun auf Œx; b/ für x 2 /a; bŒ den verallgemeinerten Mittelwertsatz an, so ergibt sich f .x/ f 0 .,/ D 0 g.x/ g .,/
für ein , D ,.x/ 2 /x; bŒ:
Daraus folgt die Behauptung, da mit x ! b auch , ! b gilt. Der allgemeine Beweis ist etwas detailreicher: Wir folgen wie bei Heuser[2003/2004] (Teil 1, Nr. 50) einer Fallunterscheidung, die nichts mit der von (i), (ii) zu tun hat. Fall 1: lim
x!b
f 0 .x/ 2 R [ f&1g. g 0 .x/
Wir geben uns ein y0 > limx!b bei b.
f 0 .x/ g 0 .x/
vor und zeigen:
f .x/ g.x/
. y0 für x nahe genug
Ein gutes Hilfsmittel ist wieder der verallgemeinerte Mittelwertsatz. Er liefert hier, angewandt auf ein Teilintervall: (3)
f 0 .,/ f .x/ & f .u/ D 0 für alle u ¤ x aus /a; bŒ mit einem , zwischen u und x: g.x/ & g.u/ g .,/
Weiter ist g.x/ & g.u/ ¤ 0 für diese x; u, da g 0 in /a; bŒ keine Nullstellen besitzt. Natürlich hängt , von x; u ab. Zu (i): Bei dieser Voraussetzung wählen wir ein x0 2 /a; bŒ mit f 0 .,/ < y0 g 0 .,/
für alle , 2 /x0 ; bŒ:
Dann gilt nach (3) f .x/ & f .u/ < y0 g.x/ & g.u/
für alle u ¤ x aus /x0 ; bŒ;
also beim Grenzübergang u ! b: f .x/ . y0 g.x/
für alle x 2 /x0 ; bŒ:
Zu (ii): Hier gibt es nach dem Meidungsprinzip ein x3 2 /a; bŒ mit: g.x/ ¤ 0 für alle x 2 /x3 ; bŒ. Wir schreiben dafür (3) in der mit g.x/ gekürzten Form f .x/ f .u/ & f 0 .,/ g.x/ g.x/ D 0 g.u/ g .,/ 1& g.x/
für alle u ¤ x aus /x3 ; bŒ mit einem , zwischen u und x:
216
Kapitel 4 Differentialrechnung
.x/ Die Auflösung dieses Ausdrucks nach fg.x/ ergibt unter den gleichen Bedingungen an u; x; ,: . / g.u/ f .u/ f 0 .,/ f .x/ 1& : D C 0 g.x/ g.x/ g .,/ g.x/
Der iPlan ist nun, xh gegen b streben zu lassen. Dazu wählen wir ein 0 .x/ y1 2 limx!b fg 0 .x/ ; y0 und bestimmen ein x2 2 /x3 ; bŒ mit f 0 .,/ < y1 g 0 .,/
für alle , 2 /x2 ; bŒ:
Dann gilt / . f .x/ f .u/ g.u/ < C y1 1 & g.x/ g.x/ g.x/
für alle u ¤ x aus /x2 ; bŒ mit
g.u/ ! g.x/ g.u/ mit: g.x/
0 fest. Man bestimme folgende Grenzwerte: a)
lim
x!&1
axC1 & 1 , xC1
b)
lim n
n!1
(p n
) a&1 .
3. Man bestimme folgende Grenzwerte: / . 1 1 1=.x&1/ & , a) lim x , b) lim x!1 x!0 ln.1 C x/ x
. c) lim
x!0
sin x x
/1=x 2
.
5
Integralrechnung
Das Integral soll den Flächeninhalt unter einer Kurve messen. Sein Wert hängt also ab von der betreffenden Funktion wie auch von den Grenzen, zwischen denen das Flächenstück liegt. Aus dieser Vorstellung ziehen wir einfache Grundeigenschaften heraus und legen das Integral dann durch diese fest. Sei f W Œa; b/ ! R eine stetige Funktion mit (zunächst) nichtnegativen Werten. Der Flächeninhalt unter dem Graphen ist jedenfalls nichtnegativ, und er verhält sich bei zwei grundlegenden Operationen wie folgt: ' beim Unterteilen mit einem Zwischenpunkt c 2 Œa; b/ ist die Gesamtfläche F die Summe der Einzelflächen: F D F1 C F2 ;
f(x) a
F b
x
F1 a
F2 c
' beim Vervielfachen der Funktionswerte mit einer Konstanten ˛ % 0 multipliziert sich der Flächeninhalt mit der gleichen Konstanten.
b
α f(x)
a
x
b
Schließlich wird (was nicht so gut durch eine Figur zu motivieren ist) für die Summe zweier solcher Funktionen auch der Flächeninhalt die Summe aus den einzelnen Flächeninhalten sein, und man wird auch eine Normierung festlegen müssen. Wir werden sehen, dass die präzise Fassung dieser Grundsätze bereits das Integral charakterisiert.
5.1 Das bestimmte Integral Wir betrachten abgeschlossene Intervalle Œa; b/ * R mit a . b und darauf stetige Funktionen f W Œa; b/ ! R. Wir betrachten dafür eine Zuordnung .a; b; f / 7! Int.a; b; f / 2 R und verlangen für sie folgende Eigenschaften:
221
Abschnitt 5.1 Das bestimmte Integral
(I.1) Zerlegungsregel: Ist a . c . b, so gilt: Int.a; b; f / D Int.a; c; f / C Int.c; b; f /. (I.2) Positive Semidefinitheit: Ist f .x/ % 0 für alle x 2 Œa; b/, so gilt: Int.a; b; f / % 0. (I.3) Linearität: Für f; g W Œa; b/ ! R; ˛ 2 R gilt: Int.a; b; f C g/ D Int.a; b; f / C Int.a; b; g/ Int.a; b; ˛ ( f / D ˛ ( Int.a; b; f /
(Additivität) (Homogenität):
(I.4) Normierung: Für 0 2 R gilt: Int.a; b; 0 / D 0 ( .b & a/. In (I.1) ist rechts jeweils die Restriktion von f gemeint; in (I.4) bezeichnet 0 die konstante Funktion mit Wert 0 . Allgemeiner als bei der obigen Motivierung dürfen die betrachteten Funktionen auch negative Werte annehmen. Nun kann man natürlich viel verlangen. Die Frage ist, ob diese Regeln erfüllbar sind. Insofern ist die Situation ähnlich wie bei der Einführung der Exponentialfunktion in Abschnitt 2.4, wo wir ebenfalls gewisse Grundeigenschaften gefordert haben, aber dann zeigen konnten, dass sie von genau einer Funktion erfüllt werden. In der Tat werden wir hier analog beweisen, dass es genau eine Zuordnung mit den Eigenschaften (I.1) bis (I.4) gibt. D.h. der Integralbegriff für stetige Funktionen auf abgeschlossenen und beschränkten Intervallen ist hierdurch eindeutig bestimmt. Ausgehend von diesem Integral werden wir später in einem einzigen Approximationsschritt zu einem sehr allgemeinen Integralbegriff gelangen, dem so genannten LebesgueIntegral. Dieser wird dann eine sehr große Klasse auch unstetiger Funktionen erfassen. Der Aufbau ist jetzt so, dass wir zunächst viele Folgerungen aus den obigen Grundeigenschaften ziehen, und zwar solange, bis sich die Eindeutigkeit ergibt. Daraufhin wird die Existenz nachgewiesen. Diese Methode hat den Vorteil, dass wir uns in Zukunft (nachdem der Existenzbeweis erbracht sein wird) allein auf die wenigen Grundeigenschaften stützen und aus ihnen alles Nötige herausholen können. A. Satz (einfache Folgerungen aus (I.1) bis (I.4)). (i)
Int.a; a; f / D 0;
(ii)
Int.a; b; 0/ D 0;
(iii) Int.a; b; &f / D &Int.a; b; f /; (iv)
aus f .x/ . g.x/ für alle x 2 Œa; b/ folgt Int.a; b; f / . Int.a; b; g/ (Monotonie);
(v)
jInt.a; b; f /j . Int.a; b; jf j/
(Dreiecksungleichung).
222
Kapitel 5 Integralrechnung
In (v) bezeichnet jf j die Funktion x 7! jf .x/j. Beweis von A. Zu (i): Setze in (I.1) a D c D b. Dann entsteht an allen drei Plätzen Int.a; a; f /, und es folgt unmittelbar Int.a; a; f / D 0. Zu (ii): Setze in (I.3) ˛ D 0. Zu (iii): Setze in (I.3) ˛ D &1. Zu (iv): Aus f .x/ . g.x/ folgt g.x/ & f .x/ % 0. Daraus folgt mit (I.2): Int.a; b; g & f / % 0, also nach (I.3) und (iii): Int.a; b; g/ & Int.a; b; f / % 0 und daraus die Behauptung. Zu (v): Aus &jf .x/j . f .x/ . jf .x/j folgt mit (iii), (iv): &Int.a; b; jf j/ D Int.a; b; &jf j/ . Int.a; b; f / . Int.a; b; jf j/ und daraus die Behauptung.
"
B. Bemerkungen. (i)
Aus (v) folgt weiter mit (I.4): jInt.a; b; f /j . Int.a; b; jf j/ . Int.a; b; max jf j/ D max jf j ( .b & a/: Œa;b*
Œa;b*
(ii) Unter Beibehaltung von (I.1), (I.3), (I.4) kann (I.2) äquivalent ersetzt werden durch (I.2’)
jInt.a; b; f /j . Int.a; b; jf j/:
Denn daraus folgt rückwärts (I.2): f .x/ % 0 8 x 2 Œa; b/ H) f D jf j H) Int.a; b; f / D Int.a; b; jf j/ % jInt.a; b; f /j % 0: C. Satz (weitere Folgerung aus (I.1) bis (I.4)). Sei a < b. Wird F W Œa; b/ ! R definiert durch F .x/ ´ Int.a; x; f /; so ist F differenzierbar, und es gilt: F 0 .x/ D f .x/
für alle x 2 Œa; b/:
223
Abschnitt 5.1 Das bestimmte Integral
Beweis. Sei x0 2 Œa; bŒ fest und der Differenzenquotient von F (bei x0 ) zunächst gebildet für h > 0; x0 C h 2 Œa; b/ : Dann gilt nach (I.1): Int.a; x0 ; f / CInt.x0 ; x0 C h; f / D Int.a; x0 C h; f / ƒ‚ … „ „ ƒ‚ … F .x0 / F .x0 C h/ Hieraus folgt weiter der Reihe nach: F .x0 C h/ & F .x0 / D Int.x0 ; x0 C h; f / 1 F .x0 C h/ & F .x0 / D Int.x0 ; x0 C h; f / h h F .x0 C h/ & F .x0 / 13 & f .x0 / D Int.x0 ; x0 C h; f / & h ( f .x0 / h h 13 Int.x0 ; x0 C h; f / & Int.x0 ; x0 C h; f .x0 // D h D
1 Int.x0 ; x0 C h; f & f .x0 // h
ˇ ˇ ˇ F .x0 C h/ & F .x0 / ˇ 1 ˇ & f .x0 /ˇˇ . ( max jf & f .x0 /j ( h ˇ h h Œx0 ;x0 Ch* ˇ ˚ , D max jf .x/ & f .x0 /j ˇ x0 . x . x0 C h : Im letzten Term der vierten Zeile bezeichnet f .x0 / die konstante Funktion mit Wert f .x0 /. Ist nun ein " > 0 gegeben, so existiert wegen der Stetigkeit von f ein ı > 0 mit der Eigenschaft: jf .x/ & f .x0 /j < " für alle x 2 Œa; b/ mit jx & x0 j < ı. Damit gilt nach der letzten Rechnung ˇ ˇ ˇ F .x0 C h/ & F .x0 / ˇ ˇ & f .x0 /ˇˇ < "; wenn 0 < h < ı: ˇ h Dies zeigt: F .x0 C h/ & F .x0 / D f .x0 / h h#0
lim
für x0 2 Œa; bŒ:
Analog erkennt man das Gleiche für x0 2 /a; b/ bzgl. des Grenzübergangs h " 0, also die Behauptung insgesamt. " D. Satz. Es gibt höchstens eine Zuordnung mit den Eigenschaften (I.1) bis (I.4).
224
Kapitel 5 Integralrechnung
Beweis. Hat man neben Int eine zweite Zuordnung, If nt, so schließt man im Fall a < b e .x/ ´ If nt.a; x; f / die gleiche so: Nach Satz C haben F .x/ ´ Int.a; x; f / und F e .a/ D 0. Daraus folgt laut D(ii)[4.3]: F D F e , also Ableitung und erfüllen F .a/ D F e .b/, d.h. Int.a; b; f / D If speziell F .b/ D F nt.a; b; f /. Im Fall a D b ist sowieso Int.a; a; f / D 0 D If nt.a; a; f /. " Zum Existenzbeweis benötigen wir folgenden Hilfssatz: E. Lemma. Ist f W Œa; b/ ! R stetig, so existiert zu jedem " > 0 ein ı D ı."/ > 0 mit der Eigenschaft: Für alle x; x0 2 Œa; b/ mit jx & x0 j < ı gilt jf .x/ & f .x0 /j < ". Die Behauptung ist die so genannte gleichmäßige Stetigkeit von f . Das Attribut „gleichmäßig“ soll ausdrücken, dass das jetzige ı nur von " abhängt, während bei der bloßen Stetigkeit ı auch von x0 abhängen darf. Die gleichmäßige Stetigkeit wird in Abschnitt 6.5 allgemein diskutiert werden. Man beachte die völlige Gleichberechtigung von x und x0 in der Behauptung! Beweis von E. Sei ein " > 0 gegeben. Angenommen, ı existiert nicht. Dann gibt es zu jedem ı D n1 , wobei n 2 N, Punkte xn ; e x n 2 Œa; b/ mit: jf .xn / & f .e x n /j % " und jxn & e xnj
0 9 ı > 0 8 x 2 Œa; b/ mit jx & x0 j < ı W jf .x/ & f .x0 /j < " 8 " > 0 9 ı > 0 8 x; x0 2 Œa; b/ mit jx & x0 j < ı W jf .x/ & f .x0 /j < ":
225
Abschnitt 5.1 Das bestimmte Integral
Die Größe ı darf von den Objekten abhängen, die zuvor mit dem Allquantor 8 eingeführt sind, also im ersten Fall von x0 und ", im zweiten Fall nur von ". Aus der gleichmäßigen Stetigkeit folgt allgemein die gewöhnliche Stetigkeit, nicht aber umgekehrt. Die Umkehrung gilt allerdings nach obigem Lemma, wenn die Definitionsmenge ein abgeschlossenes und beschränktes Intervall ist. Zurück zum Integral: Es fehlt bisher eine wesentliche Komponente, nämlich die Existenz einer Zuordnung mit den obigen Eigenschaften (I.1) bis (I.4). Das schaffen wir mittels Approximation stetiger Funktionen durch Funktionen, deren Integral unmittelbar angegeben werden kann. Die elementarste Annäherung an eine allgemeine Funktion erfolgt ohne Zweifel durch Funktionen, die stückweise konstant sind, die so genannten Treppenfunktionen. F. Definition. Eine Funktion f W Œa; b/ ! R wird Treppenfunktion genannt, wenn es endlich viele Stellen a D x0 < x1 < ( ( ( < xn D b gibt, sodass f auf allen offenen Teilintervallen /xk&1 ; xk Œ dazwischen konstant ist. Eine solche Punktmenge (1)
Z D fx0 ; x1 ; : : : ; xk g mit a D x0 < x1 < ( ( ( < xn D b;
wird als Zerlegung des Intervalls Œa; b/ bezeichnet, und die xk heißen die Teilpunkte und die Intervalle /xk&1 ; xk Œ die Teilintervalle von Z. Ist das Intervall Œa; b/ einpunktig (also gleich Œa; a/), so ist nur die leere Zerlegung Z D ¿ möglich, und jede Funktion auf Œa; a/ mit reellem Wert gilt als Treppenfunktion. Über die Funktionswerte f .xk / in den Teilpunkten wird nichts gefordert (außer dass es reelle Zahlen sind). Natürlich können zur gleichen Treppenfunktion verschiedene Zerlegungen von Œa; b/ gehören, z.B. dann wenn zu einer vorhandenen Zerlegung weitere Teilpunkte hinzugenommen werden. Das Integral einer Treppenfunktion sollte aber davon unabhängig sind. Dies ist auch so, wenn das Integral wie folgt definiert wird: G. Definition. Ist f W Œa; b/ ! R eine Treppenfunktion zur Zerlegung (1) und ist ck jeweils ihr Funktionswert auf dem Teilintervall /xk&1 ; xk Œ, so sei das Integral von f über Œa; b/ definiert als Z (2)
a
b
f ´
n X
ck ( .xk & xk&1 /:
kD1
Speziell im Fall a D b wird das Integral als 0 festgesetzt.
226
Kapitel 5 Integralrechnung
Beweis zur Rechtfertigung. Zur Rechtfertigung ist zu zeigen, dass für zwei Zerlegungen Z und Z 0 , die zur gleichen Funktion f gehören, die Summen in (2) den gleichen Wert haben. Dazu betrachtet man die Vereinigung Z [ Z 0 , deren Elemente (monoton angeordnet) wiederum eine zu f gehörende Zerlegung darstellen. Nun kann man schrittweise Z zu Z [ Z 0 auffüllen, indem man jeweils einen Teilpunkt von Z 0 hinzunimmt. Dabei ändert sich der Wert der Summe nicht. Liegt z.B. im ersten Schritt der hinzugenommene Punkt z 0 im Intervall /xk&1 ; xk Œ, so enthält die Summe zu Z [ fz 0 g anstelle des alten Summanden ck ( .xk & xk&1 / nunmehr die zwei neuen Summanden ck ( .z 0 & xk&1 / und ck ( .xk & z 0 /, die zusammen gerade den alten Summanden ergeben. So bleibt der Summenwert beim Übergang von Z zu Z [ Z 0 schrittweise immer konstant, also auch insgesamt. Dasselbe geschieht beim Übergang von Z 0 zu Z [ Z 0 . Also stimmen auch die Summenwerte für Z und Z 0 überein. " Das Integral für Treppenfunktionen hat schon mal die Grundeigenschaften, die man sinnvollerweise von einem Integralbegriff erwarten sollte: H. Lemma. Sind f; g Treppenfunktionen von Œa; b/ in R und ist ˛ 2 R, so sind auch f C g, ˛f und jf j Treppenfunktionen von Œa; b/ in R, und es gilt: (i) (ii)
Z b Z c Z b f .x/ C f. Zerlegungsregel: Für a . c . b ist f D a a c ˇ ˇZ ˇ b ˇ Z b ˇ ˇ Abschätzungsregel: ˇ jf j. fˇ. ˇ a ˇ a
(iii) Linearität: Z
b a
Z .f C g/ D
Z
b
a
Z (iv)
Normierung:
b
a
b a
˛(f D˛(
Z f C
Z a
b
a
b
g
f
(Additivität) (Homogenität):
˛ D ˛ ( .b & a/.
Wir hatten schon in B(ii) gesehen, dass aus der Abschätzungsregel sehr leicht die positive Semidefinitheit folgt: Z f .x/ % 0 8 x 2 Œa; b/ H)
b a
f % 0:
Umgekehrt impliziert die positive Semidefinitheit die Abschätzungsregel. Wir arbeiten lieber mit der Abschätzungsregel, da sie später für vektorwertige Funktionen ebenfalls Sinn macht.
227
Abschnitt 5.1 Das bestimmte Integral
Beweis von H. Dass mit f; g auch f C g wieder eine Treppenfunktion ist, sieht man wie oben, indem die Vereinigung der einzelnen Teilpunktmengen gebildet wird. Auf den zugehörigen offenen Teilintervallen ist dann f C g jeweils konstant. Noch einfacher ist es bei ˛f und jf j; hier kann die ursprüngliche Zerlegung beibehalten werden. Zu (i): Nimmt man zu der ursprünglichen Zerlegung von f noch den Teilpunkt c hinzu, so setzt sich diese aus einer Zerlegung von Œa; c/ und von Œc; b/ zusammen, und die Summe in (2) besteht gerade aus den entsprechenden zwei Einzelsummen. Zu (ii): Dies ergibt sich einfach, indem auf die Summe in (2) die Dreiecksungleichung angewandt wird. Zu (iii): Wie gesagt, als Zerlegung für f C g verwendet man die Vereinigung der gegebenen Zerlegungen von f und g. Auf den offenen Teilintervallen addieren sich dann die konstanten Werte von f und g zu denen von f C g. Die Summe in (2) für f C g entsteht daher durch Addition der entsprechenden Summen von f und g einzeln. Analog entsteht die Summe für ˛f aus der für f durch Multiplikation mit ˛. Zu (iv): Auch dies ist anhand der Summe in (2) unmittelbar klar.
"
Der entscheidende Schritt besteht jetzt darin, stetige Funktionen durch Treppenfunktionen zu approximieren und bei dieser Approximation das Integral einfach „mitzuziehen“. Das geht gut, weil die Approximation durch Treppenfunktionen sogar gleichmäßig erfolgen kann: I. Satz. Ist die Funktion f W Œa; b/ ! R stetig und ein " > 0 gegeben, so existiert eine Treppenfunktion g W Œa; b/ ! R derart, dass für alle x 2 Œa; b/ gilt: jf .x/ & g.x/j . ": Beweis. Da f gleichmäßig stetig ist, gibt es zum gegebenen " > 0 ein ı > 0 derart, dass jf .x/ & f .e x /j < " ausfällt, wenn nur jx & e x j < ı ist, egal wo x und e x im Intervall Œa; b/ liegen; vgl. Lemma E. Sei nun eine Zerlegung Z D fx0 ; : : : ; xN g von Œa; b/ so gewählt, dass xk & xk&1 < ı
für k D 1; : : : ; N :
Die gesuchte Treppenfunktion g W Œa; b/ ! R sei dadurch definiert, dass ihr konstanter Wert auf jedem Teilintervall Œxk&1 ; xk Œ gleich f .xk&1 / gesetzt wird (und g.b/ ´ f .b/). Dann gilt jf .x/ & g.x/j < "
228
Kapitel 5 Integralrechnung
zunächst auf jedem Intervall Œxk&1 ; xk Œ, weil dort je zwei Argumente einen Abstand " < ı haben, also schließlich für alle x 2 Œa; b/. Soll nun eine stetige Funktion f integriert werden, so approximiert man sie immer feiner durch Treppenfunktionen und bildet den Grenzwert ihrer Integrale: J. Definition. Zur stetigen Funktion f W Œa; b/ ! R wähle man eine Nullfolge ."k / in RC und zu jedem k eine Treppenfunktion fk mit: jf .x/ & fk .x/j < "k
für alle x 2 Œa; b/:
Dann sei das Integral von f über Œa; b/ definiert durch Z b Z b (3) f ´ lim fk : k!1 a
a
Beweis zur Rechtfertigung. Es ist zweierlei zu zeigen: Erstens dass der Grenzwert in (3) existiert und zweitens, dass er unabhängig von den getroffenen Wahlen ist. 1) Wir zeigen, dass die Integralwerte Z wk ´
a
b
fk
eine Cauchy-Folge in R bilden: Zunächst gilt jfk & f` j D j.fk & f / C .f & f` /j . jfk & f j C jf & f` j < "k C "` : Hieraus folgt aufgrund der Integrationsregeln für Treppenfunktionen die Vorausabschätzung: ˇ Z ˇZ Z b ˇ ˇ b b ˇ ˇ ."k C "` / D ."k C "` / ( .b & a/: jfk & f` j . jwk & w` j D ˇ .fk & f` /ˇ . ˇ ˇ a a a Wegen "k ! 0 kann die zuletzt erhaltene Schranke beliebig klein gemacht werden, wenn nur beide Indizes k; ` hinreichend groß gewählt werden. Das beweist die Cauchy-Eigenschaft der Folge .wk / und damit ihre Konvergenz. 2) Um die Unabhängigkeit von den getroffenen Wahlen zu beweisen, sei für f neben den Folgen ."k / und .fk / eine zweite Nullfolge .1k / in RC und eine zugehörige Folge .hk / von Treppenfunktionen mit jf .x/ & hk .x/j < 1k
für alle x 2 Œa; b/
betrachtet. Es ist zu zeigen: Z (4)
lim
k!1 a
b
Z fk D lim
k!1 a
b
hk :
229
Abschnitt 5.1 Das bestimmte Integral
Man startet wieder mit der Abschätzung der Funktionen: jfk & hk j . jfk & f j C jf & hk j < "k C 1k : Hieraus folgt analog wie bei 1) die Vorausabschätzung ˇZ Z b ˇˇ Z b ˇ b ˇ ˇ f & hk ˇ . jfk & hk j . ."k C 1k / ( .b & a/: ˇ ˇ ˇ a k a a Z Dies zeigt, dass die Differenzen die Behauptung (4).
Z
b
fk &
a
a
b
hk eine Nullfolge bilden. Dies impliziert "
Schließlich übertragen sich die Integrationsregeln von den Treppenfunktionen per Grenzübergang auf entsprechende Integrationsregeln für stetige Funktionen: K. Satz. Die Regeln von Lemma H gelten im gleichen Wortlaut auch für stetige Funktionen f; g W Œa; b/ ! R. Beweis. Wenn zur stetigen Funktion f die Objekte ."k / und .gk / wie in Definition J gewählt sind, so wollen wir vorübergehend die Sprechweise gebrauchen, die Treppenfunktionen gk seien approximierend für f . Die Eigenschaften (i) bis (iv) werden alle nach dem gleichen Muster behandelt. Dazu seien approximierende Treppenfunktionen fk für f und gk für g gewählt. Außerdem kann man annehmen, dass für jedes k die Treppenfunktionen fk und gk zur gleichen Zerlegung gehören, indem man nötigenfalls zur Vereinigung der Teilpunkte übergeht. Dann ergeben sich durch Grenzübergang k ! 1 direkt die folgenden Implikationen: Z b Z c Z b Z b Z c Z b f f C f D fk H) fk C fk D
Z a
b
a
a
c
a
a
ˇ ˇZ ˇ ˇZ ˇ b ˇ Z b ˇ b ˇ Z b ˇ ˇ ˇ ˇ fˇ. f ˇ. jf j jfk j H) ˇ ˇ ˇ a ˇ ˇ a kˇ a a Z
.fk C gk / D Z
b a
b
a
Z fk C
b
a
Z .˛fk / D ˛
a
b
Z gk H)
b a
Z fk H)
a
b
Z .f C g/ D
a
Z .˛f / D ˛
b
a
b
c
Z f C
a
b
g
f;
während die letzt Regel einfach beibehalten wird, da eine konstante Funktion sowohl stetig wie auch Treppenfunktion ist. Dabei hat man zu beachten:
230
Kapitel 5 Integralrechnung
Für die erste Zeile: Die Restriktionen gk jŒa; c/ und gk jŒc; b/ bilden approximierende Treppenfunktionen für f jŒa; c/ und f jŒc; b/. Für die zweite Zeile: Die Treppenfunktionen jf für jf j aufˇ k j sind approximierend ˇ ˇ ˇ grund der modifizierten Dreiecksungleichung: ˇ jf j & jfk j ˇ . jf & fk j. Für die dritte Zeile: Die Treppenfunktionen fk C gk sind approximierend für f C g aufgrund der Dreiecksungleichung: j.f C g/ & .fk C gk /j . jf & fk j C jg & gk j. Für die vierte Zeile: Die Treppenfunktionen ˛fk sind approximierend für ˛f aufgrund von j˛f & ˛fk j D j˛j jf & fk j. " Damit ist der Existenzbeweis für eine Zuordnung mit den Grundeigenschaften (I.1) – (I.4) erbracht, und wir können zusammenfassen: L. Satz. Es existiert genau eine Zuordnung, die jeder stetigen reellen Funktion f auf einem Intervall Œa; b/ eine reelle Zahl Int.a; b; f / zuweist und die Eigenschaften (I.1) bis (I.4) besitzt. Int(a,b,f) ist durch die Vorschrift (3) realisierbar: Z Z b Int.a; b; f / D f D lim a
k!1 a
b
fk :
"
Sehr oft wird die klassische Schreibweise mit Variablen gebraucht: Z b Z b f .x/ dx: f µ (5) a
a
In dem damit eingeführten Symbol ist das x eine „stumme“ Variable so wie ein Summationsindex, d.h. x ist austauschbar durch jede andere noch nicht verbrauchte Variable. Z.B. kann man auch schreiben Z b Z b f .t/ dt; etc. f .x/ dx D a
a
Das Symbol „dx“ hat vorerst keine inhaltliche Bedeutung. Wir werden es am Ende dieses Abschnitts motivieren. Man spricht auch vom bestimmten Integral (im Gegensatz zu der in 5.4 zu besprechenden Variante des „unbestimmten Integrals“). Die Abschätzungsregel kann in folgender Weise ergänzt werden: ˇ Z ˇZ ˇ ˇ b b ˇ ˇ jf .x/j dx . max jf j ( .b & a/: f .x/ dx ˇ . ˇ ˇ ˇ a Œa;b* a Dabei ergibt sich die zweite Ungleichung aus der Monotonie zusammen mit der Normierung. Hierin heißt die erste Abschätzung auch Dreiecksungleichung, Anfang und Ende der Kette die Standard-Abschätzung des Integrals.
231
Abschnitt 5.1 Das bestimmte Integral
Weitere Schreibweisen und Namengebungen: Z
b a
Z
b a
Z 1 dx µ
b
a
g.x/ dx µ f .x/
Z dx; Z a
b
b
a
1 dx µ f .x/
g.x/ dx ; f .x/
Z
b a
Z
b
dx ; f .x/
a
Zb µ
: a
Hierin heißt: a die untere Grenze, b die obere Grenze, f oder f .x/ dx oder f .x/ der Integrand und dx das Differential. An dieser Stelle wäre es ein Irrtum zu glauben, man müsse nur das Integral oder den Flächeninhalt durch irgendwelche Verfahren beliebig genau annähern. Approximieren kann man nämlich nur Objekte, die zuvor definiert waren. Das trifft weder für das Integral noch für den Flächeninhalt zu. Es ist gerade umgekehrt so, dass wir das Integral durch die derzeitigen Überlegungen erst definieren und darauf fußend dann auch den Flächeninhalt erfassen können. M. Definition. Ist die stetige Funktion f W Œa; b/ ! R überall nichtnegativ, so ist der Flächeninhalt A unter dem Graphen von f der Wert des Integrals Z A´
a
b
f .x/ dx:
Die Punktmenge des R2 , auf die sich diese Definition bezieht, ist die so genannte Ordinatenmenge Of ´ f.x; y/ 2 R2 j a . x . b; 0 . y . f .x/g: Diese Definition erlaubt also die Inhaltsberechnung von krummlinig begrenzten Punktmengen des R2 . Allerdings ist dieser Inhaltsbegriff recht eng, da lediglich eine Seite der Punktmenge krumm sein darf (nämlich der Graph von f selbst) und weil die Punktmenge doch eine sehr spezielle Lage zum „Koordinatensystem“ hat. Wir werden später in Gestalt des Maßes eine viel allgemeinere Definition des Flächeninhalts und des Volumens finden, die dann auch invariant gegenüber Bewegungen der Punktmenge sein wird. Integralapproximation durch Riemann-Summen Das Integral einer Treppenfunktion, wie es in Definition J zur Integralapproximation stetiger Funktionen diente, ist im Grunde nichts anderes als eine klassische Näherungssumme. Solche Näherungssummen werden in verschiedenen Ausformungen immer wieder gebraucht. Wir wollen sie unabhängig von den Treppenfunktionen erneut
232
Kapitel 5 Integralrechnung
behandeln und zwar alleine aus den Grundeigenschaften heraus. Damit dies „"-frei“ formuliert werden kann, führen wir zuvor den Begriff des Stetigkeitsmoduls ein. Dieser ist ein Maß dafür, wie gut die gleichmäßige Stetigkeit einer Funktion ausgeprägt ist. N. Definition und Satz. Die Funktion f W Œa; b/ ! R sei stetig. Für jedes 1 > 0 heißt die Größe ˇ ˚ , !f .1/ ´ sup jf .x/ & f .e x /j ˇ x; e x 2 Œa; b/; jx & e xj < 1 der Stetigkeitsmodul von f (bzgl. 1). Dieser existiert in R. Es gilt die Monotonie 0 < 11 . 12 H) !f .11 / . !f .12 / sowie
lim !f .1/ D 0: ,#0
Beweis. Die Existenz des Supremums in R ergibt sich aus der Abschätzung jf .x/ & f .e x /j . 2 maxŒa;b* jf j, die Monotonie mittels M(i)[1.4]. Die gleichmäßige Stetigkeit, wie oben in Lemma E formuliert, impliziert: !f .ı."// . ". Daraus folgt mit der Monotonie: !f .1/ . " für alle 1 . ı."/ (" und 1 stets positiv). Somit gilt !f .1/ ! 0 (für 1 # 0). " O. Beispiele. (i) Ist f W Œa; b/ ! R dehnungsbeschränkt mit der Lipschitz-Konstanten * % 0, so gilt jf .x/ & f .e x /j . *jx & e x j. Hieraus liest man ab: !f .1/ . *1: Aus der Dehnungsbeschränktheit folgt also ein „sublineares“ Verhalten des Stetigkeitsmoduls. (ii) Ist f W Œa; b/ ! R differenzierbar mit beschränkter Ableitung f 0 , so ist f nach dem Mittelwertsatz dehnungsbeschränkt mit der Lipschitz-Konstanten maxŒa;b* jf 0 j; vgl. L[4.3]. Somit gilt hier !f .1/ . max jf 0 j ( 1: Œa;b*
(iii) Von (i) gilt auch die Umkehrung: Ist f W Œa; b/ ! R stetig und gilt mit einer Konstanten * % 0 stets !f .1/ . *1, so ist f dehnungsbeschränkt mit der LipschitzKonstanten *. Zu x; e x 2 Œa; b/ wähle man nämlich eine Folge 1n > jx & e x j mit 1n ! jx & e x j (für n ! 1). Dann gilt jf .x/ & f .e x /j . !f .1n / . *1n . Hieraus folgt durch Grenzübergang n ! 1: jf .x/ & f .e x /j . *jx & e x j.
233
Abschnitt 5.1 Das bestimmte Integral
Wir zeigen nun, wie die traditionelle Integraldarstellung durch Riemann-Summen allein aus den Grundeigenschaften gefolgert werden kann: P. Definition und Satz. Ist Z (1) eine Zerlegung des Intervalls Œa; b/, so ist ihr Feinheitsmaß ıZ definiert als maximaler Abstand benachbarter xk : ˇ ıZ ´ max fjxk & xk&1 j ˇ 1 . k . ng: Ist die Funktion f W Œa; b/ ! R stetig und Z eine Zerlegung von Œa; b/, so ist eine zugehörige Zerlegungssumme oder Riemann-Summe von der Form n X
f .2k / ( .xk & xk&1 /;
kD1
wobei die 2k 2 Œxk&1 ; xk / irgendwie gewählt sind. Dann gilt (6)
ˇZ ˇ ˇ ˇ
b a
f .x/ dx &
n X kD1
ˇ ˇ f .2k / ( .xk & xk&1 /ˇˇ . !f .ıZ / ( .b & a/:
In der Abschätzung (6) ist enthalten, dass das Integral beliebig genau durch RiemannSummen approximiert wird, nämlich durch solche, bei denen das Feinheitsmaß ıZ hinreichend klein ist (vgl. N). Beweis von P. Wir schätzen unter Verwendung der rechts genannten Grundeigenschaften ab: ˇZb ˇ n ˇ ˇ X ˇ ˇ f .2k / ( .xk & xk&1 /ˇ ˇ f .x/ dx & ˇ ˇ kD1 a ˇ n Zxk ˇ Zxk n ˇX ˇ X ˇ ˇ Dˇ f .x/ dx & f .2k / dx ˇ ˇ ˇ kD1xk#1 kD1xk#1 ˇ n 0 !ˇ Zxk Zxk ˇ ˇX ˇ ˇ Dˇ f .x/ dx & f .2k / dx ˇ ˇ ˇ kD1 xk#1 xk#1 ˇ n 0 Zxk !ˇ ˇ ˇX ˇ ˇ .f .x/ & f .2k // dx ˇ Dˇ ˇ ˇ kD1
xk#1
(I.1), (I.4)
(I.3)
234
Kapitel 5 Integralrechnung
. . D
Zxk n X
jf .x/ & f .2k /j dx
A(v)
!f .ıZ / dx
A(iv)
!f .ıZ / ( .xk & xk&1 /
(I.4)
kD1 xk#1 Zxk n X kD1 xk#1 n X kD1
D !f .ıZ / ( .b & a/: Anfang und Ende dieser Kette enthalten die Behauptung (6).
"
Die Approximierbarkeit des Integrals durch Riemann-Summen kann man auch so ausdrücken: Durchläuft man eine Folge .Zm / von Zerlegungen derart, dass die zugehörigen Feinheitsmaße ıZm gegen 0 konvergieren, so streben die zugehörigen RiemannSummen für m ! 1 gegen das Integral. Dabei hat man noch völlig freie Hand in der Wahl der Zwischenstellen 2k . Speziell kann man für 2k eine Minimal- bzw. Maximalstelle von f in Œxk&1 ; xk / nehmen. Die zugehörigen Riemann-Summen heißen dann Unter- bzw. Obersummen. Das Integral wird also speziell durch solche Unterbzw. Obersummen beliebig genau approximiert (und zwar von unten bzw. von oben her, wie man durch die entsprechende Abschätzung genau wie bei P sieht). f
f
a
xj-1 θj xj
b
x
a
b
x
Riemann- bzw. Unter- und Obersummen
Q. Beispiel. Ist f W Œa; b/ ! R dehnungsbeschränkt mit der Lipschitz-Konstanten * % 0 bzw. differenzierbar mit beschränkter Ableitung f 0 , so folgt aus (6) mittels der Beispiele O(i),(ii): 8 * ( ıZ ( .b & a/ ˇ ˆ ˇZ b n X ˇ < ˇ bzw. ˇ ˇ f .x/ dx & f .2k / ( .xk & xk&1 /ˇ . ˇ ˆ a : max jf 0 j ( ıZ ( .b & a/; kD1
Œa;b*
womit der Fehler zwischen Integral und Riemann-Summe direkt abschätzbar wird. In der numerischen Mathematik werden solche Integralnäherungen zu noch effektiveren Quadraturformeln ausgebaut.
235
Abschnitt 5.1 Das bestimmte Integral
R. Bemerkung. Das Integral kann in einfacher Weise auf Funktionen g W Œa; b/ ! R ausgedehnt werden, die stückweise stetig sind. Dies bedeutet, dass eine & Zerlegung * U D fa0 ; a1 ; : : : ; aN g von Œa; b/ existiert, sodass jede Restriktion gj aj &1 ; aj eine stetige Fortsetzung gj auf Œaj &1 ; aj / besitzt (j D 1; : : : ; N ). Unstetigkeiten von g liegen dann höchstens an den Teilpunkten der Zerlegung vor, und es handelt sich allenfalls um Sprungstellen. In diesem Fall setzt man Z (7)
a
b
f .x/ dx ´
N Z X
aj
j D1 aj #1
gj .x/ dx:
Diese Definition ist in Wirklichkeit unabhängig von der Wahl der Zerlegung, wie man mit Hilfe von (I.1) zeigen kann. Das soll hier nicht weiter ausgeführt werden, da wir später viel allgemeinere Zerlegungssätze beweisen werden. Genau wie in Definition M wird auch bei einer stückweise stetigen Funktion mit nichtnegativen Werten der Flächeninhalt A der Ordinatenmenge durch das Integral (7) definiert. In einfachen Fällen können Riemann-Summen auch zur exakten Berechnung bestimmter Integrale verwendet werden, nämlich dann, wenn der Grenzwert irgendeiner Folge von Riemann-Summen mit ıZm ! 0 bekannt ist. Zur Auffindung einer solchen Folge hat man einen ziemlichen Spielraum, da die Punkte der Zerlegung und auch die Zwischenstellen noch passend gewählt werden können. Oft nimmt man eine Zerlegung Zn in n 2 N gleich lange Teilintervalle: Zn ´ fx0 ; : : : ; xn g;
xk ´ a C
k .b & a/; n
k D 0; : : : ; n;
eine so genannte äquidistante Zerlegung. Hierbei gilt ıZn D .b & a/=n, sodass die Forderung ıZn ! 0 mit n ! 1 äquivalent ist. Die einfachste Wahl der Zwischenstellen 2k ist 2k D xk&1 oder 2k D xk . Aber es gibt auch Situationen, in denen man mit anderen Zerlegungspunkten oder Zwischenstellen besser fährt. S. Beispiel. Sei f .x/ D x und Œa; b/ D Œ0; 1/. Die Zerlegung sei äquidistant: Zn ´ fx0 ; : : : ; xn g mit xk ´
k ; k D 0; : : : ; n; n
und etwa 2k ´ xk . Dann wird die zugehörige Riemann-Summe unter Verwendung der arithmetischen Summenformel E[1.3] n X
(8)
n n X 1 X k 1 ( D 2 f .2k /.xk & xk&1 / D k n n n kD1 kD1 kD1 . / 1 1 1 1 1C : D 2 ( n.n C 1/ D n 2 2 n
236
Kapitel 5 Integralrechnung
Der Grenzwert hiervon für n ! 1 ist 1=2, somit Z 1 1 x dx D : 2 0 Die Fehlerschranke ist nach Q (wegen f 0 D 1 und ıZn D n1 ) gegeben durch 1 ( n1 ( 1 D 1 1 . Tatsächlich ist der Fehler exakt gleich 2n , wie man an (8) erkennt. n Solche direkten Integralauswertungen gelingen nur in wenigen Fällen exakt, weil die Riemann-Summen explizit berechnet und der Grenzübergang wirklich durchgeführt werden muss. Viel effektiver sind die Methoden, die auf dem Hauptsatz der Differential- und Integralrechnung beruhen. Dieser liegt im Kern schon in Satz C vor und wird im nächsten Abschnitt weiter ausgebaut Die Überlegungen zu den Riemann-Summen unterstreichen die Vorstellung, dass das Integral näherungsweise eine Summe von Inhalten kleiner Flächenstreifen unter der Kurve y D f .x/ ist, wobei im Limes für ıZ ! 0 exakt das Integral herauskommt. Man kann also sagen, das Integral sei eine „kontinuierliche“ oder „verschmierte“ Summe. Das drückt sich auch in dem klassischen Integralsymbol (5) aus. Dieses ist der Bauart einer Zerlegungssumme nachgebildet. Insbesondere soll das „dx“ an den Term xk & xk&1 in der Zerlegungssumme erinnern. Aus P folgt erneut die Eindeutigkeit des Integralbegriffs für stetige Funktionen mit den Eigenschaften (I.1) – (I.4). In Analysis 2 werden wir vom eindeutig bestimmten Integral stetiger Funktionen mittels eines einzigen Approximationsschrittes zum Lebesgue-Integral gelangen. Von diesem Standpunkt aus betrachtet sind weitere Zwischenstadien für Integrale, wie sie im Laufe der Zeit entwickelt wurden, für den Aufbau der Theorie entbehrlich. Aufgaben und Anmerkungen 1. Nach dem Muster von Beispiel S berechne man: Z 2. Analog zeige man Zerlegung.
a
b
Z a
b
x dx D
b 2 & a2 . 2
e x dx D e b & e a über Riemann-Summen mit äquidistanter
3. Für feste p 2 N und 0 < a < b berechne man Z b b pC1 & apC1 x p dx D pC1 a über die Riemann-Summen zu „geometrischen“ Zerlegungen. Eine solche ist für jedes n 2 N gegeben durch r n b 2 n&1 n Zn ´ fa; aq; aq ; : : : ; aq ; aq g; mit q ´ („Prinzip der Tonleiter“): a
Abschnitt 5.2 Der Hauptsatz der Differential-und Integralrechnung
237
4. $ Sei f W Œa; b/ ! R stetig und a < b. Bei äquidistanter Zerlegung von Œa; b/ in n Teilintervalle mit den Endpunkten xk ´ a C kn .b & a/, k D 0; : : : ; n gilt nach P Z b n b&a X lim f .xk / D f .x/ dx: n!1 n a kD1
Die Frage ist, wie „stark“ die Differenz Z b n b&a X f .xk / & f .x/ dx rn ´ n a kD1
gegen 0 konvergiert. Falls f eine stetige Ableitung f 0 W Œa; b/ ! R besitzt, so zeige man: . / ˇ ˇ .b & a/2 b&a b&a ˇ ˇ a) ˇrn & . .f .b/ & f .a//ˇ . !f 0 2n 2n n b&a b) lim nrn D .f .b/ & f .a//. n!1 2 c) Mit der Landau-Symbolik von Aufgabe 6[3.5] folgt aus a): . / Z b n b&a X b&a 1 f .x/ dx D f .xk / & : .f .b/ & f .a// C o n 2n n a kD1
Das ist eine Variante der so genannten Trapezregel, die zur näherungsweisen Berechnung von Integralen dienen kann; vgl. auch Aufgabe 8[11.1].
5.2
Der Hauptsatz der Differential-und Integralrechnung
Dieser Satz stellt eine starke Koppelung zwischen den Prozessen der Differentiation und Integration her. Er liefert das wichtigste Werkzeug, um bestimmte Integrale in expliziter Weise zu berechnen. Dazu sind dann keine Grenzübergänge erforderlich; die Berechnung erfolgt rein kalkülmäßig. Es gibt einen sehr anschaulichen Hintergrund für seine Gültigkeit, den wir im Laufe der Diskussion besprechen werden. Von diesem Hauptsatz existieren mehrere Varianten, die unterschiedliche Sachverhalte betreffen. Eine erste Form haben wir bereits kennen gelernt: es ist der Satz C[5.1], den wir bislang nur zum Eindeutigkeitsbeweis des Integrals verwendet haben. Wir sprechen diesen Satz einfach nochmals mit der neuen Symbolik aus: In diesem Abschnitt seien alle Intervalle nicht leer und nicht einpunktig.
238
Kapitel 5 Integralrechnung
A. Satz (HDI-1). Zu der stetigen Funktion f W Œa; b/ ! R sei die Funktion F W Œa; b/ ! R definiert durch Z x F .x/ ´ f .t/ dt; a
d.h. das Integral wird „als Funktion seiner oberen Grenze“ betrachtet. Dann ist F differenzierbar mit der Ableitung F 0 .x/ D f .x/
für alle x 2 Œa; b/:
Beweis. Es handelt sich, wie gesagt, um eine bloße Umformulierung von Satz C[5.1]. " Grob gesprochen macht also die Ableitung die Integration rückgängig. Obwohl wir i. Allg. keine Abkürzungen für Fachausdrücke verwenden wollen, ist hier bei der Bezeichnung „Hauptsatz der Differential- und Integralrechnung“ wegen der Länge dieses Wortes eine Ausnahme angebracht. Wir werden also dieses Wort gelegentlich durch HDI abkürzen und z.B. die verschiedenen Varianten dieses Satzes manchmal mit „HDI–1“ usw. ansprechen. Auf eine etwas überraschende Weise ziehen wir zunächst aus Satz A eine Folgerung über die „Definitheit“: B. Folgerung (positive Definitheit). Sei vorausgesetzt (i)
f W Œa; b/ ! R stetig;
(ii)
f .x/ % 0 für alle x 2 Œa; b/;
(iii) es gibt ein x0 2 Œa; b/ mit f .x0 / > 0. Dann folgt
Z
b a
f .x/ dx > 0:
Beweis. Man weiß nach der positiven Semidefinitheit (I.2) in 5.1 Z x f .t/ dt % 0 für alle x 2 Œa; b/: a
Z Angenommen, es wäre
a
Z 0D
b
a
b
f .t/ dt D 0. Dann gälte für x 2 Œa; b/: Z f .t/ dt D
a
x
Z f .t/ dt C
b x
f .t/ dt;
Abschnitt 5.2 Der Hauptsatz der Differential-und Integralrechnung
239
wobei im letzten Ausdruck beide Summanden % 0 sind. Da die Summe null ist, müssten beide Summanden verschwinden, speziell wäre Z x f .t/ dt D 0 für alle x 2 Œa; b/: a
Nach Satz A implizierte dies durch Ableiten nach x: f .x/ D 0 für alle x 2 Œa; b/, im Widerspruch zur Voraussetzung (iii). " Mit dem Integral als Funktion seiner oberen Grenze haben wir eine Funktion konstruiert, die abgeleitet, die Ausgangsfunktion liefert. Solch eine Funktion nennt man eine Stammfunktion. Die allgemeine Definition lautet: C. Definition. Sei f W J ! R eine Funktion, definiert auf einem Intervall J . Eine Funktion ˆ W J ! R heißt eine Stammfunktion von f , wenn ˆ differenzierbar ist und ˆ0 D f gilt. Wie gesagt, bei stetigen Funktionen des Typs f W Œa; b/ ! R existiert eine Stammfunktion. Dies gilt nun aber auch bei beliebigen Intervallen J : D. Satz. Sei J ein Intervall. Jede stetige Funktion f W J ! R besitzt eine Stammfunktion. Beweis. Wir wählen eine feste Stelle ˇ 2 J , die aber nicht Endpunkt von J sein soll, und definieren ˆ W J ! R durch „Integration von ˇ aus“: 8Z x ˆ ˆ f für x % ˇ < ˇ Z ˇ ˆ.x/ ´ ˆ ˆ :& f für x . ˇ: x
0
Für x % ˇ gilt laut Satz A: ˆ .x/ D f .x/, wobei an der Stelle ˇ die rechtsseitige Ableitung gemeint ist. Für x . ˇ sei ein ˛ 2 J mit ˛ < ˇ und ˛ . x . ˇ gewählt. Dann gilt Z ˇ Z x Z ˇ f; f C f D Z ˆ.x/ D
x
˛
˛
also
˛
x
Z f &
ˇ ˛
f
und somit wiederum nach Satz A: ˆ0 .x/ D f .x/, wobei an der Stelle ˛ die rechtsseitige und an der Stelle ˇ die linksseitige Ableitung gemeint ist. An der „Übergangsstelle“ ˇ ergibt sich beidemal die gleiche Ableitung ˆ0 .ˇ/ D f .ˇ/. Wegen der freien Wahl von ˛ folgt: ˆ0 .x/ D f .x/ für alle x 2 J . "
240
Kapitel 5 Integralrechnung
E. Satz (über die Gesamtheit der Stammfunktionen). Sei f W J ! R eine stetige Funktion auf dem Intervall J . (i)
Ist ˆ eine Stammfunktion von f und c 2 R, so ist auch ˆCc eine Stammfunktion von f .
(ii) Sind ˆ und ‰ Stammfunktionen von f , so existiert ein c 2 R mit ‰ D ˆ C c. Beweis. Zu (i): Dies ist klar, da ˆ und ˆ C c die gleiche Ableitung haben. Zu (ii): Aus ˆ0 D f und ‰ 0 D f folgt .ˆ & ‰/0 D 0, also ˆ & ‰ D const.
"
In der Sprache der linearen Algebra kann man das so ausdrücken: Die Menge aller Stammfunktionen einer stetigen Funktion f W J ! R ist ein affiner Unterraum, nämlich eine Gerade im Vektorraum aller differenzierbaren Funktionen J ! R: Man erhält alle Stammfunktionen von f aus einer fest gewählten, indem man zu dieser alle Vielfachen von 1 (d.h. alle konstanten Funktionen mit reellem Wert) hinzuaddiert. F. Satz (HDI–2). Sei f W Œa; b/ ! R stetig und ˆ eine Stammfunktion von f . Dann gilt: Z b f .x/ dx D ˆ.b/ & ˆ.a/: (1) a
Z Beweis. Sei wie oben F .x/ ´
x a
f .t/ dt . Dann ist F laut Satz A eine Stamm-
funktion von f , also gilt laut E(ii): F .b/ & F .a/ D ˆ.b/ & ˆ.a/. Wegen F .b/ D Z b f .t/ dt und F .a/ D 0 folgt die Behauptung. " a
Mit diesen Varianten des Hauptsatzes wird deutlich, wie fruchtbar er für die gegenseitige Beziehung zwischen Integral und Stammfunktion ist: HDI–1 sagt, was das Integral zur Auffindung einer Stammfunktion leisten kann; HDI–2 sagt, was eine Stammfunktion für die Berechnung eines Integrals leisten kann. Die Gleichung (1) ist wohl das am häufigsten verwendete Werkzeug zur expliziten Integralberechnung. Für ihre rechte Seite werden sehr oft die folgenden Schreibweisen gebraucht: ˇb ˇb h ib h ib ˇ ˇ : µ ˆ.x/ µ ˆ.x/ ˆ.b/ & ˆ.a/ µ ˆ.x/ˇ µ ˆ.x/ˇ a
Damit schreibt sich (1) z.B. so: Z a
b
a
xDa
ˇb ˇ f .x/ dx D ˆ.x/ˇ : a
xDa
Abschnitt 5.2 Der Hauptsatz der Differential-und Integralrechnung
241
G. Definition. Sei J ein Intervall. Eine Funktion f W J ! R heißt stetig differenzierbar, wenn f differenzierbar ist und die Ableitung f 0 W J ! R stetig ist. Aus der Differenzierbarkeit alleine folgt nicht die Stetigkeit der Ableitung, wie wir in Beispiel V[4.4] gesehen haben. „Stetig differenzierbar“ bedeutet nicht „stetig und differenzierbar“, was ohnehin ein Pleonasmus wäre, da die Differenzierbarkeit die Stetigkeit impliziert. In der Verbindung „stetig differenzierbar“ ist also das „stetig“ ein Adverb und kein Adjektiv! H. Satz (HDI–3). Sei ˆ W Œa; b/ ! R stetig differenzierbar. Dann gilt: Z
b
ˆ0 .x/ dx D ˆ.b/ & ˆ.a/:
a
Beweis. ˆ ist Stammfunktion von ˆ0 , also folgt die Behauptung aus Satz F.
"
Grob gesprochen, besagen HDI–1 bis HDI–3: Die Integration ist die Umkehrung der Differentiation, und wenn eine Stammfunktion einer stetigen Funktion bekannt ist, so ist die bestimmte Integration ein „Kinderspiel“. I. Beispiele. (i)
Weil x 7! x die Stammfunktion x 7! Z a
b
x dx D
x2 besitzt, gilt: 2
ˇb b 2 a2 x 2 ˇˇ D & : ˇ 2 a 2 2
Man beachte, wie viel einfacher diese Rechnung ist gegenüber der in S[5.1]! (ii)
Sei p 2 R, aber p ¤ &1. Weil x 7! x p in RC die Stammfunktion x 7!
besitzt, gilt für 0 < a . b: Z a
(iii) Weil x 7!
b
x p dx D
x pC1 pC1
ˇb b pC1 x pC1 ˇˇ apC1 D & : ˇ pC1 a pC1 pC1
1 auf RC die Stammfunktion x 7! ln x besitzt, gilt für 0 < a . b: x
Z a
b
1 dx D x
Z
b a
ˇb dx b ˇ D ln x ˇ D ln b & ln a D ln : a x a
242
Kapitel 5 Integralrechnung
Den intuitiven Hintergrund des HDI kann man sehr gut an folgender Analogie erfassen, die auch für „Bankleute“ von Interesse ist: Ein Konto werde täglich mit einer Einzahlung vergrößert, die jedoch von Tag zu Tag eine unterschiedliche Höhe haben kann. Hat man eine Liste, in der neben dem Datum das erreichte Guthaben steht, so kann man sehr leicht eine Liste der täglichen Eingänge erzeugen, indem man jeweils die Differenz des Guthabens zum vorhergehenden Tag bildet. Genau das sagt HDI–1 im kontinuierlichen Fall: Aus der Aufsummierung (sprich: Integration) kann man die Summanden (sprich: Integranden) durch Differenzbildung (sprich: Differenzieren) zurückgewinnen. Hat man eine Liste, in der neben dem Datum die zugehörige Einzahlung steht, so kann man sehr leicht eine Liste der erreichten Guthaben erzeugen, indem man (ausgehend vom Anfangsguthaben) jeweils die Eingänge hinzuaddiert. Genau das sagt HDI–3 im kontinuierlichen Fall: Aus den Summanden (sprich: Integranden) und dem Anfangswert kann man die Summe (sprich: das Integral) durch Addition (sprich: Integration) erzeugen. Eine andere anschauliche Motivierung für HDI–1 geht so: Man betrachtet eine positive Funktion f W Œa; b/ ! R, akzeptiert, dass das Integral den Flächeninhalt unter dem Graphen misst, und betrachtet den Flächenzuwachs von der Stelle x bis zur Stelle x C h für „kleines“ positives h. Der Flächenzuwachs ist ungefähr gleich dem Inhalt des rechteckigen Streifens mit der Basislänge h und der Höhe f .x/, also h ( f .x/:
f(x)
a
x x+h
b
Der Flächenzuwachs, dividiert durch h ist der Differenzenquotient der Flächeninhaltsfunktion von a bis x. Dieser Differenzenquotient ist also ungefähr h ( f .x/, dividiert durch h, was gerade f .x/ ergibt. In der Grenze h ! 0 wird daraus ein exaktes Übereinstimmen zwischen der Ableitung der Flächeninhaltsfunktion an der Stelle x einerseits und f .x/ andererseits.
243
Abschnitt 5.2 Der Hauptsatz der Differential-und Integralrechnung
Wie gesagt, ein Beweis ist dies nicht! Aber die Idee liegt sehr wohl dem präzisen Beweis in C[5.1] zugrunde. J. Bemerkung. Die positive Definitheit von Folgerung B kann man so aussprechen: Für eine stetige Funktion f W Œa; b/ ! R ist der Schluss erlaubt: Z f .x/ % 0 für alle x 2 Œa; b/; H)
a
b
f .x/ dx D 0
f .x/ D 0 für alle x 2 Œa; b/:
Dies ist eine wichtige Grundlage für die so genannte Integralformelmethode, bei der aus dem Verschwinden eines Integrals auf das identische Verschwinden des Integranden geschlossen wird. Ohne die Vorzeichenannahme über f ist das natürlich nicht richtig, wie man am Beispiel I(i) für a D &b sieht. Das Integral kann sehr wohl null sein, ohne dass der Integrand die Nullfunktion ist, nämlich dann, wenn – anschaulich gesprochen – genau so viel Flächeninhalt unterhalb der x-Achse liegt wie oberhalb. Hieraus können wir folgern: K. Satz. Die Dreiecksungleichung für das Integral einer stetigen Funktion f W Œa; b/ ! R geht genau dann in eine Gleichung über: ˇ Z ˇZ ˇ ˇ b b ˇ ˇ jf .x/j dx; f .x/ dx ˇ D (2) ˇ ˇ ˇ a a wenn f keinen echten Vorzeichenwechsel hat, d.h. wenn die Funktionswerte von f auf dem ganzen Intervall Œa; b/ alle nichtnegativ oder alle nichtpositiv sind. Beweis. Wenn f keinen Vorzeichenwechsel besitzt, so ist klar, dass dann die Gleichung (2) besteht. Z b Z b f .x/ dx jf .x/j dx D " Umgekehrt folgt aus dem Bestehen der Gleichung (2): a
für ein " 2 f1; &1g, also Z a
b
a
.jf .x/j & "f .x// dx D 0:
Da hier der Integrand nichtnegativ und stetig ist, folgt für alle x 2 Œa; b/: jf .x/j & "f .x/ D 0, also jf .x/j D "f .x/. Dies impliziert f .x/ % 0 auf Œa; b/ (nämlich im Fall " D 1) oder f .x/ . 0 auf Œa; b/ (nämlich im Fall " D &1). "
244
Kapitel 5 Integralrechnung
Aufgaben und Anmerkungen 1. Zur stetigen Funktion f W Œa; b/ ! R sei die Funktion G W Œa; b/ ! R definiert Z b durch G.x/ ´ f .t/ dt. Man zeige: G ist differenzierbar mit x
G 0 .x/ D &f .x/: Lösungshinweis: Gleiche Idee wie bei D. 2. Die Funktion f W Œa; b/ ! R sei stetig, und es seien u; v W A ! R zwei Funktionen, die in x0 2 A differenzierbar sind. Ist u.x/ . v.x/ für alle x 2 A sowie u.A/ , Œa; b/, v.A/ , Œa; b/, so ist eine Funktion H W A ! R definiert durch Z H.x/ ´
v.x/
u.x/
f .t/ dt:
Man beweise, dass H in x0 differenzierbar ist mit der Ableitung H 0 .x0 / D f .v.x0 // ( v 0 .x0 / & f .u.x0 // ( u0 .x0 /: 3. Weil x 7!
1 die Stammfunktion x 7! arctan x besitzt, gilt 1 C x2 Z 1 ˇ1 dx & ˇ D arctan x ˇ D : 2 0 4 0 1Cx
a) Aus einer Riemann-Summe dieses Integrals mit äquidistanter Zerlegung von Œ0; 1/ in n Teilintervalle gewinne man den Grenzwert (3)
lim
n!1
n X kD1
& n D : n2 C k 2 4
Damit ergibt sich eine erste Möglichkeit, & durch rationale Zahlen beliebig genau zu approximieren (die Grenzwertformel (6)[2.5] liefert für c D 1 eine Approximation durch irrationale Zahlen). b) Mittels Q[5.1] erziele man eine Fehlerabschätzung für die Konvergenz (3). c) Wie groß muss hiernach n gewählt werden, damit der Fehler kleiner als 10&5 wird? 4. Sobald man den Wert eines Integrals kennt (z.B. mittels des HDI) kann man nach dem Muster der vorangehenden Aufgabe die Grenzwerte zugehöriger Riemann-Summen bestimmen. Man wende dies z.B. auf die Funktion x 7! 1=x an.
245
Abschnitt 5.3 Produktintegration und Transformationsformel
5. Als „verbindendes Glied“ zwischen den Integralen in den Beispielen I(ii),(iii) zeige man für 0 < a . b: 3 b pC1
lim
p!&1
pC1
&
apC1 D ln b & ln a: pC1 3
19x&x 6. Gegeben sei die Funktion f W RC . Wie muss t % 0 0 ! R mit f .x/ ´ e gewählt werden, damit der Flächeninhalt unter dem Graphen von f zwischen t und t C 1 maximal wird?
7. Die Funktion f W R ! R sei stetig und periodisch mit der positiven Periode p. Man zeige: Z a) Für alle ˛; ˇ 2 R gilt: Z b) Für alle a 2 R gilt
p
0
˛
ˇ
Z f .x/ dx D
f .x/ dx D
Z
ˇ Cp
˛Cp
aCp
a
f .x/ dx.
f .x/ dx.
Dieser Themenkreis wird in Aufgabe 5[6.1] fortgesetzt. 8. Sei J ein Intervall. Zeige: Jede stetig differenzierbare Funktion f W J ! R lässt sich als Differenz f D f1 & f2 zweier monoton wachsender, stetig differenzierbarer Funktionen f1 ; f2 darstellen. Lösungshinweis: Wähle ein festes a 2 J und betrachte die Identität / .Z x Z x ˇ 0 ˇ ˇ 0 ˇ ˇ ˇ ˇ ˇ f .t/ dt & f .x/ : f .t / dt & f .x/ D a
a
Hinweis: An späterer Stelle kann diese Darstellung auf allgemeinere Funktionen ausgedehnt werden; vgl. Aufgabe 22[9.1].
5.3
Produktintegration und Transformationsformel
Das am meisten verwendete Werkzeug zur expliziten Berechnung von Integralen ist der Hauptsatz der Differential- und Integralrechnung (HDI). Letztlich geht es dabei um die Auffindung von Stammfunktionen. Dazu gibt es eine Handvoll nützlicher Regeln, die neben die Grundeigenschaften in 5.1 treten. Wir starten hier diese Methodik mit der Produktintegration und der Transformationsformel für bestimmte Integrale. Im nächsten Abschnitt folgt die Behandlung mittels „unbestimmter“ Integrale.
246
Kapitel 5 Integralrechnung
A. Satz (Produkt- oder Teilintegration). Sind f; g W Œa; b/ ! R stetig differenzierbar, so gilt: Z (1)
b
a
ˇb Z ˇ f .x/g .x/ dx D f .x/g.x/ˇ &
b
0
a
a
f 0 .x/g.x/ dx:
Beweis. Setze ˆ.x/ ´ f .x/g.x/. Dann folgt der Reihe nach durch Differenzieren und Anwendung von HDI–3 (H[5.2]) ˆ0 .x/ D f 0 .x/g.x/ C f .x/g 0 .x/ Z b ˆ.b/ & ˆ.a/ D .f 0 .x/g.x/ C f .x/g 0 .x// dx a
ˇb Z ˇ f .x/g.x/ˇ D a
b
Z
0
f .x/g.x/ dx C
a
a
b
f .x/g 0 .x/ dx:
Umstellung liefert die Behauptung.
"
B. Beispiele. Z (i)
Berechne
2 &1
xe x dx.
Lösung: Setze f .x/ ´ x und g 0 .x/ ´ e x , also z.B. g.x/ ´ e x (g.x/ ´ e x C 5 täte es auch, aber man nimmt natürlich eine möglichst einfache Stammfunktion). Dann rechnet man mittels (1): Z
2
&1
Z ˇ2 x ( e dx D x ( e ˇ & xˇ
x
&1
&1
1 ( e x dx
ˇ2 ˇ2 2 ˇ ˇ D xe x ˇ & e x ˇ D 2e 2 & .&1/e &1 & .e 2 & e &1 / D e 2 C : &1 &1 e Z
(ii) Berechne
2
0=2 0
sin2 x dx.
Lösung: Manchmal führt die Produktintegration zu einer „impliziten“ Bestimmung eines Integrals, so hier: Setze f .x/ ´ sin x und g 0 .x/ ´ sin x, also z.B. g.x/ ´
247
Abschnitt 5.3 Produktintegration und Transformationsformel
& cos x. Dann rechnet man mittels (1): Z 0=2 Z 0=2 sin2 x dx D sin x ( sin x dx 0
0
ˇ0=2 Z ˇ & D sin x ( .& cos x/ˇ 0
Z D
0=2
0
Z D
0=2
0
cos2 x dx D Z dx &
0=2
0
0=2
0
Z
0=2 0
cos x ( .& cos x/ dx
.1 & sin2 x/ dx
sin2 x dx:
Durch Auflösen nach dem doppelt vorkommenden Integral am Anfang und Ende der Gleichungskette folgt Z 2
0=2 0
Z
2
sin x dx D
0=2
0
Z
& dx D ; 2
also
0=2 0
sin2 x dx D
& : 4
Es gibt auch bestimmte Integrale, bei denen „oben“ etwas kleineres steht als „unten“. Diese werden durch folgende Konvention auf den bisher stets behandelten Fall zurückgeführt: C. Definition (orientiertes Integral). Ist f W Œa; b/ ! R stetig, so setzt man Z
a b
Z f .x/ dx ´ &
a
b
f .x/ dx:
Wie zweckmäßig diese Definition ist, zeigt sich beim Transformieren von Integralen, was der Kettenregel der Differentialrechnung entspricht: D. Satz (Integration durch Substitution). Gegeben seien zwei Funktionen des Typs f h Œ˛; ˇ/ &&&&&! Œa; b/ &&&&&! R, wobei h stetig differenzierbar und f stetig ist. Dann gilt die Transformationsformel Z (T)
h.ˇ /
h.˛/
Z f .x/ dx D
ˇ ˛
f .h.t// ( h0 .t/ dt:
Die transformierende Funktion h braucht nicht injektiv zu sein. Es ist auch erlaubt, dass h.˛/ > h.ˇ/ ist (das ist z.B. der Fall, wenn h monoton fällt). Dass dieser Fall miterfasst werden kann, liegt an der zuvor gegebenen Definition.
248
Kapitel 5 Integralrechnung
Beweis von D. Definiere für x 2 Œa; b/ und t 2 Œ˛; ˇ/ Z x F .x/ ´ f .u/ du; ˆ.t/ ´ F .h.t //: a
Nach HDI–1 (A[5.2]) ist F auf Œa; b/ stetig differenzierbar, und nach der Kettenregel gilt auf Œ˛; ˇ/: ˆ0 .t / D F 0 .h.t// ( h0 .t / D f .h.t//h0 .t/I ˆ ist also auf Œ˛; ˇ/ stetig differenzierbar. Mittels HDI–3 (H[5.2]) folgt: Z ˇ Z ˇ f .h.t //h0 .t / dt D ˆ0 .t / dt ˛
˛
D ˆ.ˇ/ & ˆ.˛/
(2)
D F .h.ˇ// & F .h.˛// Z D
h.ˇ /
a
Z Ist h.˛/ . h.ˇ/, so gilt die Zerlegung Z
h.ˇ /
a
a h.˛/
a
Z Ist h.˛/ % h.ˇ/, so gilt die Zerlegung Verwendung von Definition C Z Z h.ˇ / f & a
a
h.˛/
f .u/ du &
h.ˇ /
Z f &
Z Z f D
Z
h.˛/
h.ˇ /
In beiden Fällen folgt somit aus (2): Z Z ˇ 0 f .h.t//h .t / dt D ˛
h.ˇ / h.˛/
f D
a
f D&
h.˛/
Z
h.˛/
f C
h.ˇ /
h.˛/
f , also
f:
h.ˇ /
a
f D
f .u/ du: Z
Z
h.ˇ /
h.˛/
a
a
Z f D
h.˛/
Z f C h.ˇ /
h.˛/
h.˛/
h.ˇ /
f , also unter
f:
f .u/ du;
was zu zeigen war.
"
E. Bemerkung (Merkregel für die Gleichung (T)). Schreibt man symbolisch (3) so entstehen
„x D h.t /;
dx D h0 .t /; dt
dx D h0 .t / dt“;
249
Abschnitt 5.3 Produktintegration und Transformationsformel
' der Integrand rechts, f .h.t //h0 .t / dt , durch formales Einsetzen in den Integranden links, und zwar sowohl bei der Funktion wie beim Differential; ' die Grenzen links, h.˛/; h.ˇ/, durch Anwendung von h auf die Grenzen rechts. Die symbolischen Gleichungen in (3) haben hier nur den Sinn einer Merkregel. Eine inhaltliche Deutung des Rechnens mit Differentialen erfolgt im Kalkül der Differentialformen, der in Analysis 3 behandelt wird. Z F. Beispiel. Berechne
3
&1
2
t e t dt:
Lösung: Wähle h.t/ D t 2 ; ˛ D &1; ˇ D 3 mit h.&1/ D 1; h.3/ D 9. Dann ist h.Œ&1; 3// D Œ0; 9/, also z.B. a D 0; b D 9 eine mögliche Wahl, damit in Satz D: h.Œ˛; ˇ// , Œa; b/ gilt. Die Abbildung h W Œ&1; 3/ ! Œ0; 9/ ist dann zwar surjektiv, aber nicht injektiv. Trotzdem gibt die Formel (T), gelesen von rechts nach links: Z
3
&1
2
te t dt D
Z
3
&1
1 1 0 h .t/e h.t/ dt D 2 2
Z
h.3/ h.&1/
e x dx D
1 2
Z 1
9
e x dx D
) 1( 9 e &e : 2
G. Bemerkungen. (i) Ist die Abbildung h in Satz D zusätzlich bijektiv und h.˛/ µ a, h.ˇ/ µ b, so schreibt sich die Gleichung (T) auch in der Form Z (T’)
b a
Z f .x/ dx D
h#1 .b/
h#1 .a/
f .h.t // ( h0 .t / dt:
(ii) Die meisten Integrationsregeln übertragen sich vermöge C auf orientierte Integrale, z.B. die drei Varianten HDI–1 bis HDI–3 des Hauptsatzes und die Sätze A, D sowie K[5.1], wobei die positive Definitheit oder auch die Dreiecksungleichung sinngemäß abzuändern sind, etwa wenn a . b: ˇ Z ˇZ ˇ ˇ b b ˇ ˇ jf .x/j dx; f .x/ dx ˇ. ˇ ˇ ˇ a a
ˇZ ˇ ˇ ˇ
aber
b
a
ˇ Z ˇ f .x/ dx ˇˇ .
b a
jf .x/j dx:
H. Beispiele. Z (i)
Berechne für n 2 N0 die Integrale ˇn ´
0
0=2
sinn x dx.
Lösung: Man versucht es wie bei B(ii), diesmal mit f .x/ ´ sinn&1 x, g 0 .x/ ´
250
Kapitel 5 Integralrechnung
sin x, wobei zunächst n % 2 sei: Z 0
0=2
sinn x dx D
Z
0=2
0
sinn&1 x ( sin x dx
ˇ0=2 ˇ D sinn&1 x ( .& cos x/ˇ 0
Z &
0=2 0
.n & 1/ sinn&2 x cos x ( .& cos x/ dx
Z
D.n & 1/ Z D.n & 1/
0=2 0 0=2 0
sinn&2 x cos2 x dx; n&2
sin
cos2 x D 1 & sin2 x Z
x dx & .n & 1/
0=2 0
sinn x dx:
Wie bei B(ii) folgt durch Auflösen nach dem doppelt vorkommenden Integral am Anfang und Ende der Gleichungskette Z n
0=2
0
Z
n
sin x dx D .n & 1/
0
0=2
sinn&2 x dx;
n % 2:
Damit ist eine Rekursionsformel gefunden: ˇn D
n&1 ˇn&2 ; n
n D 2; 3; : : : :
Allerdings wird hierdurch jeweils die übernächste Größe geliefert. Das schadet nicht, da man zwei Startwerte leicht bekommen kann: ˇ0 D &=2 und ˇ1 D 1. Setzt man n D 2m bzw. n D 2mC1, so erhält man Rekursionsformeln für aufeinander folgende m 2 N0 ˇ2m D
2m & 1 ˇ2.m&1/ 2m
bzw.
ˇ2mC1 D
2m ˇ2.m&1/C1 ; 2m C 1
und mit den genannten Startwerten ergibt sich induktiv ˇ2m D bzw.
.2m & 1/.2m & 3/ ( ( ( 3 ( 1 & ( 2m ( .2m & 2/ ( ( ( 4 ( 2 2
ˇ2mC1 D
2m ( .2m & 2/ ( ( ( 4 ( 2 : .2m C 1/.2m & 1/ ( ( ( 5 ( 3
(ii) Anwendung auf das Wallissche Produkt. Dividiert man diese Formeln, so erhält man & 2(2 4(4 6(6 2m ( 2m ˇ2m D ( ( ( ( : 2 1 ( 3 3 ( 5 5 ( 7 .2m & 1/ ( .2m C 1/ ˇ2mC1
251
Abschnitt 5.3 Produktintegration und Transformationsformel
Hierin geht der letzte Bruch für m ! 1 gegen 1; denn aus den Ungleichungen für die Integranden: sin2mC1 x . sin2m x . sin2m&1 x folgt für die Integralwerte: ˇ2mC1 . ˇ2m . ˇ2m&1 ; also 1D
ˇ2mC1 1 ˇ2m ˇ2m&1 2m C 1 D1C : . . D ˇ2mC1 ˇ2mC1 ˇ2mC1 2m 2m
Somit ergibt sich das so genannte Wallissche Produkt: . / & 2(2 4(4 6(6 2m ( 2m D lim ( ( ( : m!1 1 ( 3 2 3 ( 5 5 ( 7 .2m & 1/ ( .2m C 1/ Damit wird & als Grenzwert einer Folge rationaler Zahlen dargestellt! Durch geeignetes Erweitern der zusammengefassten Brüche kann man das Wallissche Produkt auch schreiben als & 16m .mŠ/4 D lim m!1 ..2m/Š/2 .2m C 1/ 2 oder nach etwas „Kosmetik“ p & D lim
4m 4m .mŠ/2 : p D lim 0 ! m!1 m!1 .2m/Š/ m 2m p m m
Aufgaben und Anmerkungen 1. Man berechne mittels Produktintegration folgende Integrale: Z &3 Z 0 Z 0 xe x dx, x cos x dx, c) x sin x dx, b) a) &0
0
&1
Z d)
1
e
ln.x/ dx. x
2. Man berechne mittels Substitution folgende Integrale: Z u Z 3 Z 4 px x e x p ln x dx für p 2 R, u > 1. c) a) dx, b) p dx, 2 x &2 1 C x 1 1 3. Man zeige: Z 20 cos nx cos mx dx D 0 für n ¤ m in N0 a) 0
Z b)
0
20
sin nx sin mx dx D 0 für n ¤ m in N0
252
Kapitel 5 Integralrechnung
Z c)
20
0
Z d)
20
0
cos nx sin mx dx D 0 für n; m 2 N0 Z
2
cos nx dx D
20
0
sin2 nx dx D & für n 2 N.
Lösungshinweis: Man verwende die Formeln aus M[4.4]. 4. Zeige:
Z
a) Ist die Funktion f W Œ&a; a/ ! R stetig und ungerade, so gilt
a
&a
Z
b) Ist die Funktion f W Œ&a; a/ ! R stetig und gerade, so gilt Z a 2 f .x/ dx.
f .x/ dx D 0. a
&a
f .x/ dx D
0
5. Die Funktionen f; g W Œa; b/ ! R seien stetig. Man beweise oder widerlege: 0Z !2 Z a)
b
a
Z b)
a
b
b
f 2 .x/ dx %
a
Z f .x/ dx % 0;
a
b
f .x/ dx Z g.x/ dx % 0
H)
a
b
f .x/ ( g.x/ dx % 0.
6. Die Funktion f W Œa; b/ ! R sei stetig. Man beweise als Zerlegungsregel für orientierte Integrale Z + Z + Z ˇ f; f D f C ˛
ˇ
˛
für beliebige ˛; ˇ; 0 2 Œa; b/, unabhängig von deren gegenseitiger Anordnung. Lösungshinweis: Gleiche Idee wie bei Satz D. 7. Die Funktion f W RC 0 ! R sei stetig differenzierbar und streng monoton wachC send mit f .0/ D 0. Man beweise für alle x 2 RC 0 und y 2 f .R0 / die Youngsche Ungleichung Z y Z x f &1 .u/ du f .t/ dt C xy . 0
0
mit Gleichheit genau für y D f .x/. Lösungshinweis: Man beweise zunächst mit der Produkt- und Substitutionsregel die Gleichheit im Falle y D f .x/. Man deute die Situation auch anschaulich! 8. Seien p; q 2 RC 0 mit
1 1 C D 1. Aus Aufgabe 7 folgere man für alle x; y 2 RC 0: p q xy .
xp yq C p q
253
Abschnitt 5.4 Das unbestimmte Integral
mit Gleichheit genau für x p D y q . 9. Gegeben sei eine stetige Funktion f W Œ0; 2&/ ! R mit f .0/ D f .2&/ > 0 und Z 20 f .x/ dx D 0: 0
Man beweise: a) f hat mindestens zwei Nullstellen in /0; 2&Œ. b) Hat f genau zwei Nullstellen x1 < x2 in /0; 2&Œ, so sind die Vorzeichen von f in den Intervallen /0; x1 Œ, /x1 ; x2 Œ, /x2 ; 2&Œ abwechselnd, nämlich C; &; C. $ c) Gilt auch noch Z 20 Z 20 f .x/ cos x dx D f .x/ sin x dx D 0; 0
0
so hat f mindestens vier Nullstellen in /0; 2&Œ.
5.4 Das unbestimmte Integral Nach dem Hauptsatz der Differential- und Integralrechnung reduziert sich die Berechnung von Integralen stetiger Funktionen auf die Ermittlung von Stammfunktionen. Für eine Funktion, die als Ergebnis einer Differentiation erscheint, ist eine Stammfunktion unmittelbar gegeben: es ist die Ausgangsfunktion. Das liefert eine Reihe von Grundintegralen. Den Kreis solcher Stammfunktionen kann man nun erheblich ausweiten, indem man gewisse formale Regeln anwendet. Das wird hier besprochen. A. Definition (rechnerische Konvention). Als Symbol für eine beliebige StammfunkR tion von f schreibt man f .x/ dx und nennt diesen Ausdruck ein unbestimmtes Rb Integral. Ein Integral des bisher behandelten Typs a f .x/ dx heißt zur Verdeutlichung ein bestimmtes Integral. R Da das Symbol f .x/ dx eine beliebige Stammfunktion bezeichnet, sollte die Auswertung immer eine freie additive Konstante c enthalten. Die Gleichheit zwischen unbestimmten Integralen ist bis auf eine solche additive Konstante zu verstehen. R Formal kann man das Symbol f .x/ dx als die Gesamtheit aller Stammfunktionen von f betrachten. Wir haben diese Gesamtheit in E[5.2] genau bestimmt: Sie besteht eben gerade aus allen Funktionen, die aus einer festen Stammfunktion durch Addition einer beliebigen reellen Konstanten zu erzeugen sind. Wie gesagt, jeder Differentiationsregel entspricht eine Regel für unbestimmte Integrale.
254
Kapitel 5 Integralrechnung
B. Beispiele. n 0
.x / D nx
n&1
Z ()
.e x /0 D e x () 1 .ln x/ D x 0
dx D ln x C c; x
()
.sin x/0 D cos x () 1 .arctan x/ D 1 C x2 1 .arcsin x/0 D p 1 & x2
e x dx D e x C c
Z
.cos x/0 D & sin x ()
0
Z
nx n&1 dx D x n C c
Z
x>0
& sin x dx D cos x C c Z cos x dx D sin x C c Z
dx D arctan x C c 1 C x2 Z dx () D arcsin x C c; p 1 & x2 ()
jxj < 1:
C. Satz (Regeln für unbestimmte Integrale). Die Linearität aus K[5.1] sowie die Regeln der Produktintegration (A[5.3]) und Substitution (D[5.3]) besitzen Analoga für unbestimmte Integrale stetiger Funktionen auf Intervallen: Z (i) (ii) (iii) (iv)
Z .f .x/ C g.x// dx Z ˛f .x/ dx Z f .x/g 0 .x/ dx Z f .h.t //h0 .t / dt
Z
D
f .x/ dx C g.x/ dx Z D ˛ f .x/ dx Z D f .x/g.x/ & f 0 .x/g.x/ dx Z D f .x/ dx;
Letzteres mit x D h.t/ nach Integralauswertung (wobei h als stetig differenzierbar vorausgesetzt ist). Beweis. Differenzieren nach x (bzw. t bei der letzten Gleichung) liefert jeweils Gleichheit. Dabei ist es schon von Bedeutung, dass die Funktionen auf Intervallen betrachtet werden, da nur dann aus der Gleichheit der Ableitungen geschlossen werden kann, dass die Funktionen sich höchstens um eine additive Konstante unterscheiden. "
Abschnitt 5.4 Das unbestimmte Integral
255
D. Bemerkung (zur Substitutionsregel). Die ausführliche Schreibweise für die Gleichung (iv) lautet .Z / Z 0 (iv’) f .h.t//h .t / dt D f .x/ dx .h.t//; und in dieser Form bestätigt man sie durch Differenzieren auf beiden Seiten, was übereinstimmend f .h.t //h0 .t/ ergibt. Ist h injektiv, so folgt daraus für die x 2 Bild h: .Z / Z &1 0 f .h.t //h .t / dt .h .x// D f .x/ dx: Unter dieser Zusatzvoraussetzung wird also durch die Substitutionsregel wirklich das unbestimmten Integral von f berechnet. Natürlich muss die Komposition f ı h ausführbar sein. Beim praktischen Rechnen wir üblicherweise statt der ausführlichen Gleichung (iv’) die Kurzfassung (iv) aufgeschrieben und „im Sinn“ behalten, dass t und x durch die Gleichung x D h.t/ gekoppelt sind. Warnung: Die Vernachlässigung des Gültigkeitsintervalls ist einer der häufigsten Fehler bei der Berechnung von Integralen. Das richtige Intervall sollte daher immer mit angegeben werden, wenn es nicht ganz offensichtlich ist. Wir notieren jetzt eine Liste von unbestimmten Integralen, die sich alle durch Übersetzung der einfachsten Ableitungsformeln ergeben: E. Beispiele (für Grundintegrale). Z x pC1 C c, falls p 2 N0 (i) x p dx D pC1 Z x nC1 (ii) x n dx D C c, falls n D &2; &3; : : : (in RC oder R& ) nC1 Z x ˛C1 C c, falls ˛ 2 R n Z (in RC ) (iii) x ˛ dx D ˛C1 Z dx (iv) D ln jxj C c (in RC oder R& ) x Z (v) e x dx D e x C c Z (vi) cos x dx D sin x C c Z (vii) sin x dx D & cos x C c
256
Kapitel 5 Integralrechnung
Z (viii) (ix)
dx
D arcsin x C c (in /&1; 1Œ) 1 & x2 Z dx D arctan x C c. 1 C x2 p
Weitere Grundintegrale sind in Formelsammlungen verzeichnet. Als Spezialfall von (i) hat man Z Z dx ´ 1 dx D x C c: Beweis von E. Es handelt sich einfach um die Umschreibung von Differentiationsregeln, wie in den Beispielen B erläutert. Bei (iv) ist im Intervall R& zu beachten, dass dort gilt: ln jxj D ln.&x/, was bei der Ableitung mittels Kettenregel auf 1 1 ( .&1/ D &x x führt.
"
Hinweis: Die am häufigsten benutzte Methode zur Berechnung von bestimmten Integralen läuft über Stammfunktionen, d.h. über unbestimmte Integrale, entsprechend dem Schema: 1Z ' Z b
a
f .x/ dx D
f .x/ dx
b
a
:
Dabei kann rechts der Anteil in der eckigen Klammer irgend eine Stammfunktion von f sein (die aber dann während der Auswertung in a und b nicht mehr abgeändert werden darf). Die Schritte sind also: erst Ermittlung einer Stammfunktion, dann Einsetzen der Grenzen, schließlich Subtraktion. Man kann aber durchaus von diesem Schema abweichen. Z.B. ist es bei der Produktintegration oftmals von Vorteil, den „herausintegrierten“ Bestandteil gleich auszuwerten, wie dies in der Regel A[5.3] ausgedrückt ist. F. Beispiele (für kompliziertere Integrale). Z (i) Berechne ln jxj dx. Lösung: Da der Integrand nicht auf ganz R definiert ist, muss eine Zerlegung in möglichst große Gültigkeitsintervalle vorausgehen. Diese sind hier natürlich RC und R& . In RC rechnet man so: Man stellt künstlich ln x als Produkt 1 ( ln x dar und wendet Produktintegration mit g 0 .x/ ´ 1 und f .x/ ´ ln x an: Z Z Z Z 1 ln x dx D 1(ln x dx D x (ln x & x ( dx D x ln x & 1 dx D x ln x &x Cc: x
257
Abschnitt 5.4 Das unbestimmte Integral
Als Probe kann man den erhaltenen Ausdruck differenzieren und erhält tatsächlich ln x. In R& kann man ganz analog vorgehen. Man kann aber auch probeweise den Ausdruck x ln jxj & x D x ln.&x/ & x ableiten und sieht, dass ln.&x/ D ln jxj herauskommt. Damit gilt insgesamt Z ln jxj dx D x ln jxj & x C c in RC oder in R& ; aber eben nicht in R, da ln jxj in 0 nicht definiert (und auch nicht stetig fortsetzbar) ist. Damit gilt Z b ˇb jbjb ˇ ln jxj D x ln jxj & x ˇ D b ln jbj & b & .a ln jaj & a/ D ln a & b C a a jaj a entweder für 0 < a . b oder aber für a . b < 0. Z (ii) Berechne x cos.x 2 / dx. Lösung: Die Substitution y ´ x 2 liefert nach dem Schema E[5.3], das hier genauso gilt: dy D y 0 D 2x; dx
dy D 2x dx:
Damit wird Z Z 2 x cos x dx D cos.x 2 / x dx Z D 1 D 2
.cos y/ Z
1 dy 2
cos y dy
1 sin y C c 2 1 D sin.x 2 / C c 2 D
(Variable und Differential substituiert)
(neues Integral ausgewertet) (resubstituiert)
(iii) Weitere Beispiele, die noch zu den Grundintegralen gerechnet werden können, sind Z p 13 p x 1 & x 2 C arcsin x C c in Œ&1; 1/, 1 & x 2 dx D 2 Z p 3 -p 13 p 2 x 2 & 1 dx D x x & 1 & ln x C x 2 & 1 C c 2
258
Kapitel 5 Integralrechnung
in /&1; &1/ und Œ1; 1Œ, sowie Z p -3 p 13 p 1 C x 2 dx D x 1 C x 2 C ln x C 1 C x 2 C c: 2 Man kann sie durch die Substitutionen x D sin t bzw. x D cosh t bzw. x D sinh t gewinnen und natürlich auch durch Ableiten der rechten Seiten bestätigen. (Bei den ersten zwei Zeilen benötigt man an den Rändern die Aussage H[4.3].) Wie man solche Integraltypen durch algebraische Substitutionen berechnen kann, wird in Abschnitt 8.7 gelehrt. (iv)
Für stetig differenzierbare Funktionen f hat man als gute Tips Z Z 1 f 0 .x/ 0 2 f .x/f .x/ dx D f .x/ ; dx D ln jf .x/j C c; 2 f .x/
wobei im zweiten Fall f auf dem betrachteten Intervall nullstellenfrei sein muss. Beweis durch Differenzieren von f .x/2 bzw. ln jf .x/j in den Fällen f .x/ > 0 oder f .x/ < 0. Allgemeiner Ratschlag Ganz allgemein kann man Ausdrücke, die irgendwie im Integranden hervorstechen oder in ihm mehrfach vorkommen, zur Substitution probieren. Dies trifft insbesondere zu, wenn ein Integrand Umkehrfunktionen enthält. Man wird dann versuchen, diese zur Substitution heranzuziehen. Z G. Beispiel. Berechne das Integral
arcsin x dx.
Lösung: Setze t D arcsin x, also x D sin t und somit dx D cos t dt. Damit wird: Z Z arcsin x dx D t ( cos t dt Substitution x D sin t Z D t sin t & sin t dt Produktintegration D t sin t C cos t C c p D t sin t C 1 & sin2 t C c p D x arcsin x C 1 & x 2 C c
Stammfunktion cos trigonometrische Formel Resubstitution:
Die Ausgangsvariable x ist auf das Intervall Œ&1; 1/ beschränkt und steht dort in bijektiver Beziehung zur Variablen t, die in Œ&&=2; &=2/ läuft, wobei die Abbildung in der
259
Abschnitt 5.4 Das unbestimmte Integral
Richtung t 7! x stetig differenzierbar ist. Das reicht aber nach Satz C zur Gültigkeit der Transformation, sodass das Resultat Z p arcsin x dx D x arcsin x C 1 & x 2 C c für alle x 2 Œ&1; 1/ besteht. Hat man durch die obigen Methoden eine unbestimmtes Integral berechnet, so empfiehlt es sich immer, durch Differenzieren die Probe zu machen, um zu sehen, ob dabei wirklich der Integrand herauskommt. Spätestens bei dieser Probe sollte auch der Ausschluss von Singularitäten (z.B. Nullstellen von Nennern) erfolgen, und es sollten die Gültigkeitsintervalle überprüft werden. H. Bemerkungen. (i) Nicht jede aus Standardfunktionen mittels Körperoperationen und Komposition aufgebaute Funktion hat eine ebensolche Stammfunktion. Anders ausgedrückt: „Elementare“ Funktionen besitzen zwar immer eine Stammfunktion (wenn sie stetig sind), aber diese Stammfunktion braucht nicht„elementar“ darstellbar zu sein. Z.B. kann für 2 f .x/ D e &x keine elementare Stammfunktion angegeben werden. Es gibt eben keine generelle Erfolgsgarantie für die formelmäßige Berechnung von Integralen. Eine näherungsweise Berechnung bestimmter Integrale ist jedoch mit den Mitteln der numerischen Mathematik immer möglich. (ii) Ist ein unbestimmtes Integral nicht elementar auswertbar, so gibt es eventuell Anlass zur Definition einer neuen Grundfunktion. Z.B. definiert man auf ganz R Z x 2 2 e &t dt die Fehlerfunktion durch: erf.x/ ´ p & 0 Z x sin t den Integralsinus durch: Si.x/ ´ dt: t 0 Die Fehlerfunktion spielt in der Wahrscheinlichkeitstheorie eine wichtige Rolle. Im zweiten Fall hat der Integrand bei t D 0 eine hebbare Singularität, da er dort den Grenzwert 1 besitzt. Aufgaben und Anmerkungen 1. Man berechne die folgenden unbestimmten Integrale: Z Z Z p p 3 x 2 a) e dx; b) .x C x/ dx; c) .ln x/3 dx; Z
Z r
1&x dx; f) 1Cx Man gebe jeweils möglichst große Gültigkeitsintervalle an. d)
x
e sin.ax/ dx .a 2 R/; e)
Z
e 2x & e x dx: ex C 1
260
Kapitel 5 Integralrechnung
2. Man berechne die folgenden bestimmten Integrale: Z 0=4 Z 0=4 Z a) e x cos.2x/ dx; b) sin x cos x dx; c) &0=4
Z d)
1 0
Z
arctan x dx; 1 C x2
e)
3. Man berechne: Z 2p a) 1 & jxj dx;
0
13
12
Z b)
&1
2005
.13 & x/
20 0
Z dx;
f)
&2
0
1
16
xe &x dx; p sin 4 x dx: p x
j sin xj dx.
Lösungshinweis: Man zerlege das Integrationsintervall in Intervalle, in denen das Argument der Betragsfunktion festes Vorzeichen hat. 4. Man berechne: Z 1=2 1Cx a) dx, ln 1&x 0
Z b)
0
Z
5. Für m; n 2 N0 zeige man:
1
1
0
x dx . p p 1CxC 1&x
x m .1 & x/n dx D
mŠnŠ : .m C n C 1/Š
6. Manche bestimmten Integrale lassen sich mit Kunstgriffen berechnen, ohne dass eine Stammfunktion bekannt ist, z.B. Z1 J ´ 0
ln.1 C x/ dx: 1 C x2
Man substituiere für t 2 Œ0; &=4/ gemäß x D tan t () t D arctan x;
dx 1 D dt 1 C x2
und erhält Z1 0
ln.1 C x/ dx D 1 C x2
Z0=4 ln.1 C tan t/ dt 0
Z0=4 ln D 0
3& p &t 2 cos 4 dt cos t
Z0=4 Z0=4 Z0=4 p 3& ln cos t dt: & t dt & ln cos ln 2 dt C D 4 0
0
0
Abschnitt 5.5 Gliedweise Integration und Differentiation
261
Dabei wurde beim Übergang zur zweiten Zeile cos t C sin t dadurch umgeformt, dass der Sinusterm in einen Kosinusterm (mit zu &=2 komplementärem Argument) verwandelt und dann die Summe der zwei Kosinusterme mittels der Formeln in M(v)[4.4] in ein Produkt übergeführt wurde. Die zwei letzten Integrale stimmen überein, wie man erkennt, indem man für &=4 & t substituiert. Somit folgt Z1 0
& ln.1 C x/ dx D ln 2: 2 1Cx 8
5.5 Gliedweise Integration und Differentiation Die bisherigen Methoden zur Berechnung von Integralen waren überwiegend rechnerischer Natur, also frei von Grenzwerten. Genauso wichtig sind aber Approximationstechniken, allein schon deshalb, weil viele Integrale nicht elementar auswertbar sind. Die grundlegende Frage bei der Annäherung von Integralen ist die: Wenn eine Funktion als Grenzwert einer Funktionenfolge dargestellt ist, wird dann auch das Integral der Funktion Grenzwert der Einzelintegrale sein? Die gleiche Frage besteht natürlich für das Ableiten anstelle des Integrierens. Für beide Probleme wird hier eine Antwort gegeben, wobei es auf die gleichmäßige Konvergenz ankommen wird. Wir betrachten eine Folge .fn / von reellen Funktionen auf einer Menge A , R, d.h. für jedes n 2 N sei eine Funktion fn W A ! R, x 7! fn .x/ gegeben. A. Definition. (i) Die Funktionenfolge .fn / konvergiert (punktweise) gegen die Funktion f W A ! R, wenn gilt: Zu jedem x 2 A und " > 0 existiert ein N D N.x; "/ 2 N derart, dass für alle n > N gilt: jfn .x/ & f .x/j < ". Dies bedeutet also, dass für jeden Punkt x 2 A die Folgenkonvergenz limn!1 fn .x/ D f .x/ stattfindet. Symbole dafür sind: lim fn .x/ D f .x/
n!1
(auf A)
oder
fn .x/ &! f .x/ (für n &! 1): (auf A)
(ii) Die Funktionenfolge .fn / konvergiert gleichmäßig gegen die Funktion f W A ! R, wenn gilt:
262
Kapitel 5 Integralrechnung
Zu jedem " > 0 existiert ein N D N."/ 2 N derart, dass für alle n > N und alle x 2 A gilt: jfn .x/ & f .x/j < ". Symbole dafür sind: lim fn .x/ D f .x/ glm.
n!1
(auf A)
oder
fn .x/ &! f .x/ glm. (auf A)
(für n &! 1).
Manchmal lässt man in dieser Schreibweise das x weg, die Menge A muss aber auf jeden Fall spezifiziert werden (in der Nähe der Formel oder im Kontext). Gleichmäßige Konvergenz ohne Bezug auf eine Menge ist sinnlos! Natürlich folgt aus der gleichmäßigen Konvergenz gegen f die punktweise Konvergenz gegen f : die gleichmäßige Konvergenz ist die stärkere Forderung. Tatsächlich verlangt die punktweise Konvergenz nur die gewöhnliche Konvergenz der Folge .fn .x// individuell für jedes einzelne x. Daher darf das N in (i) von x und " abhängen. Dagegen fordert die gleichmäßige Konvergenz, dass die „Güte“ der Konvergenz nicht von x abhängt: Für jedes " > 0 ist der Unterschied jfn .x/ & f .x/j < " zu bekommen, wenn nur n hinreichend groß gemacht wird, unabhängig von x. Daher darf das N in (ii) nur von " abhängen.
2ε x a
b
Anschaulich bedeutet die gleichmäßige Konvergenz, dass die Graphen der Funktionen fn für alle n > N."/ in einem Streifen der Dicke 2" um den Graphen von f liegen. Soll die gleichmäßige Konvergenz geprüft werden, so kommt als Grenzfunktion nur die in Frage, die sich aus einer möglichen punktweisen Konvergenz ergibt. Diese muss also zuerst ermittelt werden, bevor man an die Überprüfung der Gleichmäßigkeit gehen kann. Dafür formulieren wir zwei einfache Kriterien, die unmittelbar aus der Definition folgen:
263
Abschnitt 5.5 Gliedweise Integration und Differentiation
B. Satz. Sei neben der Funktionenfolge .fn / eine Funktion f W A ! R betrachtet. Dann gilt: (i) Die Funktionenfolge.fn / konvergiert gleichmäßig gegen f , wenn es eine Nullfolge .an / reeller Zahlen gibt, sodass jfn .x/ & f .x/j . an
für alle x 2 A und n 2 N
gilt (Majorantenkriterium für gleichmäßige Konvergenz). (ii) Gibt es ein k > 0, sodass zu jedem n 2 N ein xn 2 A existiert mit jfn .xn / & f .xn /j % k; so konvergiert die Funktionenfolge nicht gleichmäßig gegen f (Minorantenkriterium " für ungleichmäßige Konvergenz). C. Beispiele. (i) Sei fn W Œ0; 1/ ! R die unten links skizzierte stückweise affine und stetige Funktion mit f .0/ D f .1=n/ D f .1/ D 0 und f .1=.2n// D 2n. Dann gilt bei festem x: limn!1 fn .x/ D 0; denn es ist fn .x/ D 0 für n % x1 , wenn x > 0, und fn .x/ D 0, wenn x D 0. Die Grenzfunktion ist also f D 0. Die Konvergenz erfolgt (1) aber nicht gleichmäßig; denn fn 2n D 2n % 2. Es ist hiernach nicht möglich, dass jfn .x/ & f .x/j für hinreichend große n für alle x 2 R beliebig klein wird. y
y 1
2n
1
fn 1
2
3
5 20
x 0
x 0
1
0
1 n
1
1
0
1
(ii) Sei fn W Œ0; 1/ ! R die Potenzfunktion fn .x/ D x n . Hier gilt punktweise nach M[2.1] ( 0 für 0 . x < 1 n lim x D n!1 1 x für x D 1: Die (punktweise) Grenzfunktion f existiert also, die Konvergenz gegen sie ist aber ungleichmäßig. Das sieht man daran, dass z.B. der Streifen der Dicke 1 um den Graphen von f (der " D 1=2 entspricht) von jedem Graphen dieser Funktionen vor der
264
Kapitel 5 Integralrechnung
Stelle 1 verlassen wird; vgl. das Bild oben rechts. Es folgt aber auch aus dem folgenden Satz D. (iii) Eine Funktionenfolge, die wir schon lange kennen, ergibt sich aus der Konvergenz 3 x -n lim fn .x/ D e x mit fn .x/ ´ 1 C ; n!1 n gültig für alle x 2 R; vgl. Abschnitt 2.4. Die einzelnen Folgenglieder fn sind hier sogar Polynome. Danach strebt die Polynomfolge fn punktweise auf ganz R gegen die Exponentialfunktion f D exp. Allerdings ist die Konvergenz auf R nicht gleichmäßig. Denn es gilt fn .n/ D 2n , also f .n/ & fn .n/ D e n & 2n % e & 2 > 0; wobei sich die Abschätzung z.B. aus der geometrischen Summenformel ergibt. Dagegen ist die Konvergenz auf einem Intervall der Gestalt Œ&a; a/ sehr wohl gleichmäßig. Um B(i) anzuwenden, sei für jxj . a mit der Intervallschachtelung von B[2.4] folgende Abschätzung durchgeführt, wobei n > a: /n . x2 1& 1& 2 3 3 1 x -n x -n n .3 D & 1 C . 0 . ex & 1 C 3 x n x -n n n 1& 1& n n . 2/ x 1& 1& x2 1 a2 n D . ( . 3 - : 3 3 x n x n n 1& a n n 1& 1& n n n Dabei wurde beim Übergang zur zweiten Zeile die Bernoullische Ungleichung B[1.3] angewandt. Die zuletzt erhaltene Schranke definiert eine reelle Nullfolge, da der Nenner des großen Bruchs gegen e &a konvergiert. Damit ist das Kriterium B(i) erfüllt. (Die Abhängigkeit dieser Schranke von a stört nicht, da die Definitionsmenge Œ&a; a/ festgehalten ist.) Der Unterschied zwischen punktweiser und gleichmäßiger Konvergenz sei nochmals verdeutlicht, indem die Definitionen in formalisierter Form notiert werden: (puw) (glm)
8 x 2 A; " > 0 9 N > 0
8 n > N W jfn .x/ & f .x/j < "
8 " > 0 9 N > 0 8 n > N; x 2 A W jfn .x/ & f .x/j < ":
Der Index N darf von den Objekten abhängen, die zuvor mit dem Allquantor 8 eingeführt sind, also im ersten Fall der punktweisen Konvergenz von x und ", im zweiten Fall der gleichmäßigen Konvergenz nur von ".
265
Abschnitt 5.5 Gliedweise Integration und Differentiation
D. Satz. Gilt fn ! f gleichmäßig auf A und sind alle fn W A ! R in a 2 A stetig, so ist auch f in a stetig. Beweis. Sei " > 0 gegeben. Wegen der gleichmäßigen Konvergenz gibt es ein N 2 N mit: x 2 A H) jfN .x/ & f .x/j
0, wähle ein N D N."/ 2 N derart, dass " für alle n > N; x 2 Œa; b/: jfn .x/ & f .x/j < b&a Dies geht aufgrund der gleichmäßigen Konvergenz. Dann folgt zusammen mit der Vorausabschätzung: ˇZ ˇ Z b ˇ b ˇ " ˇ ˇ D" für alle n > N ; fn .x/ dx & f .x/ dx ˇ < .b & a/ ( ˇ ˇ a ˇ b & a a also die Behauptung.
"
Ohne gleichmäßige Konvergenz ist die Behauptung i. Allg. falsch, selbst wenn die Grenzfunktion stetig ist: F. Beispiel. Bei Beispiel C(i) gilt Z 1 1 1 fn .x/ dx D 2n ( ( D 1; n 2 0
Z aber
0
1
Z f .x/ dx D
1
0
0 dx D 0:
Die Folge der Einzelintegrale konvergiert hier noch, aber nicht gegen das Integral der Grenzfunktion. Weniger einfach zu formulieren ist die Vertauschbarkeit mit dem Differenzieren. Methodisch kann man diese Frage mit dem Hauptsatz der Differential- und Integralrechnung aufs Integrieren zurückspielen. G. Satz (über die gliedweise Differentiation). Sei .fn / eine Folge stetig differenzierbarer Funktionen fn W Œa; b/ ! R mit den Eigenschaften: (i)
Für wenigstens ein x0 2 Œa; b/ existiert lim fn .x0 / 2 R. n!1
(ii) Die Folge der Ableitungen
fn0
konvergiert gleichmäßig auf Œa; b/.
Dann existiert (1)
lim fn .x/ µ f .x/ glm. auf Œa; b/;
n!1
und f ist stetig differenzierbar sowie (2)
lim fn0 .x/ D f 0 .x/ glm. auf Œa; b/:
n!1
267
Abschnitt 5.5 Gliedweise Integration und Differentiation
Hinweis: Auch hier besagt die Behauptung (2) die Vertauschbarkeit der Operationen „Limesbildung“ und „Differentiation“. Beweis von G. Sei f $ W Œa; b/ ! R die Grenzfunktion der Folge .fn0 /: f $ .x/ ´ lim f 0 .x/ glm. auf Œa; b/: n!1
n
Nach Satz D ist f $ von alleine stetig. Nach HDI–3 (H[5.2]) gilt für alle x 2 Œa; b/: Z x (3) fn .x/ D fn .x0 / C fn0 .t / dt: x0
Die rechte Seite ist konvergent laut Satz E, also auch die linke Seite, und zwar gegen Z x (4) f .x/ ´ y0 C f $ .t / dt; wobei y0 ´ lim fn .x0 /: n!1
x0
Hieraus folgt mittels HDI–1 (A[5.2]) die Existenz der Ableitung und f 0 .x/ D f $ .x/. Also ist f stetig differenzierbar, und es gilt (2). Zur Gleichmäßigkeit in (1): Vorausabschätzung durch Subtraktion von (3) und (4): ˇ ˇ Z x ˇ ) ˇ ( 0 $ ˇ jfn .x/ & f .x/j D ˇfn .x0 / & y0 C fn .t / & f .t / dt ˇˇ x0
Z . jfn .x0 / & y0 j C
x0
Z . jfn .x0 / & y0 j C
x
a
b
ˇ 0 ˇ ˇf .t / & f $ .t /ˇ dt n
ˇ 0 ˇ ˇf .t / & f $ .t /ˇ dt: n
Dabei sind in der zweiten Zeile die Integrationsgrenzen zu vertauschen, wenn x < x0 , aber die Endabschätzung bleibt dieselbe. Wähle nun zu " > 0 ein N D N."/ 2 N, sodass " 8n>N jfn .x0 / & y0 j < 2 ˇ 0 ˇ " ˇf .t/ & f $ .t /ˇ < 8 n > N; t 2 Œa; b/: n 2.b & a/ Dann ergibt sich zusammen mit der Vorausabschätzung: " " D" jfn .x/ & f .x/j < C .b & a/ ( 2 2.b & a/ Damit ist alles gezeigt.
8 n > N; x 2 Œa; b/: "
Aus der gleichmäßigen Konvergenz fn ! f folgt i. Allg. nicht die Konvergenz oder gar gleichmäßige Konvergenz fn0 ! f 0 (auch wenn alle Funktionen stetig differenzierbar sind).
268
Kapitel 5 Integralrechnung
H. Beispiel. Sei fn .x/ ´ n1 sin nx, A D Œ0; 2&/. Dann gilt fn .x/ ! 0 µ f .x/, gleichmäßig auf A, da jfn .x/j . 1=n. Aber fn0 .x/ D cos nx konvergiert nicht einmal punktweise gegen 0, z.B. ist ja cos n& D .&1/n . Somit hat die Differentiation eine eher „aufrauende“ Wirkung, wohingegen die Integration „glättend“ wirkt. Einen ähnlichen Effekt der Ableitung hatten wir in V[4.4] konstatiert. Dieses Phänomen wird später unter einem allgemeinen Gesichtspunkt neu beleuchtet. Bezüglich der Integration gibt es im Rahmen des Lebesgue-Integrals bessere Aussagen , die viel weniger als die gleichmäßige Konvergenz voraussetzen, z.B. den Satz über die majorisierte Konvergenz. Diese Fragen werden in Analysis 2 ausführlich behandelt. Uneigentliche Integrale Die Relation zwischen Grenzübergängen und Integration bezog sich bisher auf die Integranden. Die analoge Frage besteht natürlich auch, wenn am Integrationsintervall ein Grenzübergang vorgenommen werden soll. Das führt auf die so genannten uneigentlichen Integrale. Typische Fälle sind unbeschränkte Integrationsintervalle oder beschränkte Integrationsintervalle mit Singularitäten des Integranden an den Endpunkten, z.B. Z a
1
Z f .x/ dx ´ lim
E !1 a
E
Z f .x/ dx
oder
a
b
Z f .x/ dx ´ lim "#0
a
b&"
f .x/ dx;
wenn im ersten Fall f auf Œa; 1Œ und im zweiten Fall f auf Œa; bŒ stetig ist, falls die Grenzwerte der Integrale auf der rechten Seite (eigentlich) existieren. Auch die Diskussion uneigentlicher Integrale erfolgt besser im Rahmen einer allgemeineren Integrationstheorie, worauf wir in Analysis 2 zurückkommen. Aufgaben und Anmerkungen 1. Die nachstehenden Funktionenfolgen seien alle in A ´ RC 0 betrachtet. Sind diese punktweise bzw. gleichmäßig in A konvergent, und was ist ggf. die Grenzfunktion? p n
1 b) fn .x/ ´ , 1 C nx 3 xd) fn .x/ ´ n ( ln 1 C . n a) fn .x/ ´
x,
c) fn .x/ ´
2. Man berechne folgende Grenzwerte: Z Z 1p n b) lim n ( e &x 2 dx, a) lim n!1 0
n!1
0 0
x , 1 C nx
sin x dx. nCx
269
Abschnitt 5.5 Gliedweise Integration und Differentiation
3. Man berechne die folgenden uneigentlichen Integrale: Z 1 Z 1 Z 1 Z 1 dx dx dx &x , d) . , b) a) e dx, c) p p 2 x 1&x 1 & x2 0 0 0 1 4. Es gelte für zwei Funktionenfolgen .fn / und .gn / mit der gemeinsamen Definitionsmenge A lim fn D f
n!1
glm. auf A
und
lim gn D g
n!1
glm. auf A:
Man zeige: a) b)
lim jfn j D jf j glm. auf A.
n!1
lim .fn C gn / D f C g
glm. auf A.
n!1
c) Sind f und g beide beschränkt, so gilt lim .fn ( gn / D f ( g n!1
glm. auf A.
d) Man belege durch ein Beispiel, dass die Aussage in c) falsch wird, wenn eine der Funktionen f; g unbeschränkt ist. 5. Für eine Funktionenfolge .fn / mit fn W A ! R und f W A ! R gelte lim fn D f
n!1
glm. auf A
Man zeige: a) Ist g W B ! R eine Funktion mit g.B/ , A, so gilt: lim fn ı g D f ı g
n!1
glm. auf B:
b) Ist G W Œa; b/ ! R eine stetige Funktion, wobei das Intervall Œa; b/ alle Bildmengen f .A/ und fn .A/ enthält, so gilt lim G ı fn D G ı f
n!1
glm. auf A:
6
Metrische Räume
Nach der kalkülmäßigen Behandlung der Analysis ist es an der Zeit, den begrifflichen Hintergrund zu stärken. Das soll im Rahmen der metrischen Räume geschehen. Diese Räume erlauben eine geometrische Sprache mit universellen Begriffen, die große Teile der modernen Mathematik durchdringen. Es handelt sich um eine Vereinheitlichung vieler Ideen, die zunächst in unterschiedlichem Gewand aufgetreten sind. Wichtig für die Anwendungen ist, dass dabei auch unscharfe Begriffe wie „Ähnlichkeit“ von „Wörtern“ oder „Mustern“ erfasst werden können.
6.1 Grundbegriffe für Mengen Wir betrachten eine beliebige Menge (nichtleere) X, deren Elemente auch Punkte genannt werden, und fragen, wie man die Distanz zwischen je zwei Punkten von X messen kann. Natürlich wird es dafür unterschiedliche Vorstellungen geben. Primär geht es nun nicht darum, eine konkrete Entfernungsdefinition anzugeben, sondern zu sagen, was man wohl von einem vernünftigen Distanzbegriff erwarten sollte. Dazu hat sich folgendes Konzept bewährt: A. Definition. Eine Metrik auf der Menge X ist eine Abbildung d W X ) X ! R, die folgenden Regeln genügt: (D.1)
d.x; y/ D d.y; x/
(D.2)
d.x; y/ > 0 für x ¤ y
(D.3)
d.x; x/ D 0
(D.4)
d.x; z/ . d.x; y/ C d.y; z/
)
Symmetrie positive Definitheit Dreiecksungleichung.
Das Paar .X; d / heißt dann ein metrischer Raum (ebenso X selbst, wenn d aus dem Zusammenhang klar ist). Die Elemente x 2 X werden auch Punkte genannt. Je zwei Punkten x; y 2 X ist also die nichtnegative reelle Zahl d.x; y/ als Entfernung oder Abstand oder auch Distanz zugewiesen. Die Dreiecksungleichung drückt aus, dass der „direkte Weg“ von x nach z nicht länger ist als der „Umweg“ von x über y nach z. Sei jetzt ein metrischer Raum .X; d / gegeben.
271
Abschnitt 6.1 Grundbegriffe für Mengen
B. Lemma (modifizierte Dreiecksungleichung). Für x; y; z 2 X gilt: d.x; z/ % jd.x; y/ & d.y; z/j: Beweis. Aus (D.4): d.x; y/ . d.x; z/ C d.z; y/ folgt mit (D.1): d.x; z/ % d.x; y/ & d.y; z/. Vertauschung von x und z liefert mit (D.1): d.x; z/ % d.y; z/ & d.x; y/. " Zusammen folgt daraus die Behauptung. C . Beispiele. Die folgenden Beispiele sollen einen Eindruck vermitteln von der Reichhaltigkeit dieser Begriffsbildung. Die Metrikaxiome (D.1) bis (D.4) sind dabei ohne Mühe nachzuprüfen. (i) Sei X D R und d.x; y/ D jx & yj; die so genannte Standard-Metrik auf R. Die Metrikaxiome sind unmittelbar aus den Eigenschaften des Betrags klar. Wenn nichts anderes gesagt ist, wird R mit der Standard-Metrik versehen. (ii) Sei X D R2 D f.x1 ; x2 / j x1 ; x2 2 Rg. Für x D .x1 ; x2 / und y D .y1 ; y2 / aus R2 ist p d.x; y/ ´ .y1 & x1 /2 C .y2 & x2 /2 die Euklidische (Standard-)Metrik. Die Metrikaxiome für d sind aus der linearen Algebra oder analytischen Geometrie bekannt.
y
y2
x2
x
x1
(iii) Sei X D Z ) Z, die Menge der ganzzahligen Gitterpunkte in R2 . Für x D .x1 ; x2 / und y D .y1 ; y2 / ist
y1
y
dT .x; y/ ´ jy1 & x1 j C jy2 & x2 j die so genannte Taxifahrer-Metrik. Sie misst die vom Fahrgast zu bezahlende Wegstrecke, wenn das Taxi nur auf den ganzzahlig nummerierten Straßen eines Rechteckgitters fahren darf. Auch hierbei folgen die Metrikaxiome aus den Betragsregeln. (iv)
x
Sei X ´ R2 D „Frankreich“, P ´ .0; 0/ D „Paris“, und für x; y 2 X sei ( d.x; y/; falls x; y auf Gerade durch P dF .x; y/ ´ d.P; x/ C d.P; y/ sonst:
272
Kapitel 6 Metrische Räume
Dabei ist d die Standard-Metrik aus (ii). Man nennt dF die Metrik der französischen Eisenbahn in der Annahme, man müsse in Frankreich – um von x nach y zu kommen – immer zentral über Paris fahren, es sei denn, x; y liegen bereits auf einer geraden Strecke, deren Verlängerung durch Paris geht. Bei der Dreiecksungleichung hat man einige Fälle zu unterscheiden, je nachdem ein Teil der drei Punkte oder alle auf einer Geraden durch P liegen oder nicht. In allen Fällen führt aber die Dreiecksungleichung aus (ii) unmittelbar zum Ziel. (v)
y
x y x P
Wortverstellung: Wir betrachten Wörter x aus 10 Buchstaben: x D x1 : : : x10 2 X D A10 ;
A ´ fa; b; c; : : : ; zg das Alphabet:
Wir definieren ein Verstellungsmaß dV : Sei neben x ein weiteres Wort y D y1 : : : y10 2 X gegeben. Falls eine bijektive Abbildung ' W f1; : : : ; 10g ! f1; : : : ; 10g (eine Permutation) existiert mit yi D x%.i/ für i D 1; : : : ; 10, so sei k die kleinste Fehlstandszahl all dieser ' ’s. (Zur Erinnerung: Die Fehlstandszahl von ' ist die Anzahl aller Paare .i; j / mit i < j und ' .i / > ' .j /.) Dabei gilt k . 9 C 8 C 7 C ( ( ( C 1 D 45, denn diese Schranke ist die höchste Fehlstandszahl, die überhaupt vorkommen kann. In diesem Fall sei dV .x; y/ ´ k. Falls ein solches ' nicht existiert, so sei dV .x; y/ ´ 46. Dann ist dV eine Metrik auf X. Der Beweis wird am Ende dieses Abschnitte erbracht. Das Verstellungsmaß ist ein Maß dafür, wie „ähnlich“ zwei Wörter sind. Dabei braucht es sich nicht um Wörter unseres Alphabets zu handeln. Analog kann man auch vorgehen, um ein quantitatives Maß für die Ähnlichkeit von DNA-Sequenzen in einem genetischen Code zu definieren, etc. D. Satz und Definition. Ist A eine Teilmenge des Raums X mit der Metrik d , so liefert die Einschränkung von d W X ) X ! R auf A ) A eine Metrik für A. Man nennt dann A einen (metrischen) Unterraum von X . Beweis. Die Eigenschaften (D.1) bis (D.4) gelten insbesondere für Elemente von A. " E. Definition. Für a 2 X und r > 0 führt man ein: B.a; r/ ´
fx 2 X j d.x; a/ < rg
der offene Ball
B.a; r/ ´
fx 2 X j d.x; a/ . rg
der abgeschlossene Ball
S.a; r/ ´ fx 2 X j d.x; a/ D rg
die Sphäre
9 > =
um a vom > ; Radius r.
273
Abschnitt 6.1 Grundbegriffe für Mengen
a heißt jeweils Mittelpunkt oder Zentrum. F. Beispiele. (i) Sei X D R mit der StandardMetrik. Dann gilt: d.x; a/ < r () jx & aj < r:
B(a,r)
R
B(a,r)
R
Also ist hier B.a; r/ D /a & r; a C rŒ das offene Intervall der Länge 2r mit Zentrum a. Analog ist B.a; r/ D Œa & r; a C r/ das abgeschlossene Intervall der Länge 2r mit Zentrum a. (ii) Sei X D R2 mit der Standard-Metrik. Die Bälle sind Kreisscheiben (ohne bzw. mit begrenzender Kreislinie), die Sphären sind Kreislinien. Sphäre
Bälle
offen
abgeschlossen
Hinweis: In symbolischen Skizzen werden die Bälle oft als Kreisscheiben wiedergegeben (obwohl sie je nach Metrik auch ganz anders aussehen können). Außerdem ist es manchmal hilfreich, Begrenzungen, die nicht zur Menge gerechnet werden, zu stricheln. G. Satz (Eigenschaften von Bällen). Für r; s 2 RC gilt: (i)
a 2 B.a; r/;
(ii)
aus s . r folgt B.a; s/ , B.a; r/;
(iii) aus b 2 B.a; r/ und s . r & d.a; b/ folgt B.b; s/ , B.a; r/; (iv)
aus d.a; b/ > r C s folgt B.a; r/ \ B.b; s/ D ¿.
274
Kapitel 6 Metrische Räume
b
r
s s
r a
b
a
Zu (iii)
Zu (iv)
Beweis von G. Zu (i), (ii): Dies ist unmittelbar klar aus der Definition; (ii) ist auch ein Spezialfall von (iii). Zu (iii): Dies ergibt sich aus der Schlusskette: x 2 B.b; s/ H) d.x; b/ < s H) d.x; a/ . d.x; b/ C d.b; a/ < s C .r & s/ D r: Zu (iv): Wir zeigen das in der Form: B.a; r/ \ B.b; s/ ¤ ¿ H) d.a; b/ . r C s: Sei x 2 B.a; r/ \ B.b; s/ gewählt. Dann schließen wir so: d.x; a/ . r; d.x; b/ . s H) d.a; b/ . d.a; x/ C d.x; b/ . r C s: Entscheidend ist also immer die Dreiecksungleichung.
"
Die Bälle spielen nun die analoge Rolle wie die Intervalle, die in R als Umgebungen verwendet wurden. Die Definition von Umgebungen mittels Bällen läuft hier völlig analog. Sofort danach werden wir mit diesen Umgebungen Grundbegriffe wie Häufungspunkte, offene und abgeschlossene Mengen usw. formulieren. Anschließend werden viele Beispiele diese Begriffswelt illustrieren. H. Definition. Gegeben sei ein Punkt p 2 X und ein " > 0. Wir nennen (i)
U.p; "/ ´ B.p; "/ die "-Umgebung von p;
(ii) U $ .p; "/ ´ B.p; "/ n fpg die punktierte "-Umgebung von p. I . Definition. Gegeben sei eine Teilmenge A , X und ein Punkt p 2 X. Wir nennen (i)
p inneren Punkt von A, wenn es ein " > 0 gibt mit U.p; "/ , A;
(ii)
p Häufungspunkt von A, wenn für jedes " > 0 gilt: A \ U $ .p; "/ ¤ ¿.
(iii) p isolierten Punkt von A, wenn p zu A gehört, aber nicht Häufungspunkt von A ist.
Abschnitt 6.1 Grundbegriffe für Mengen
275
Innere Punkte von A sind also Punkte von A, bei denen eine ganze "-Umgebung auch noch zu A gehört. Häufungspunkte von A brauchen nicht zu A zu gehören, besitzen aber in beliebiger Nähe Punkte von A, die von ihnen verschieden sind. Ein isolierter Punkt von A gehört immer zu A, ist aber in einer geeigneten Umgebung von a der einzige Punkt von A. Auf R mit der Standard-Metrik stimmen die jetzigen Begriffe des Häufungspunkts bzw. isolierten Punkts mit den früheren in B[3.2] überein. J. Definition. Gegeben sei eine Teilmenge A , X. Wir nennen (i)
A offen, wenn jedes Element von A innerer Punkt von A ist;
(ii)
A abgeschlossen, wenn jeder Häufungspunkt von A Element von A ist;
(ii)
A diskret, wenn alle Punkte von A isoliert sind.
X selbst erfüllt beide Forderungen (i), (ii), ist also sowohl offen wie auch abgeschlossen. Auch die leere Menge ¿ gilt als offen und zugleich abgeschlossen. K. Satz. Für das System T der offenen Mengen von X gilt: (T.1) ¿; X 2 T ; (T.2) aus U; V 2 T folgt U \ V 2 T ; (T.3) Ist .V+ /+2) eine beliebige Familie von Mengen V+ 2 T , so gehört auch die S Vereinigung +2) V+ zu T . Beweis. Zu (T.1): Dies ist unmittelbar klar aus der Definition. Zu (T.2): Man schließt so: Ist p 2 U \ V gegeben, so existieren Umgebungen von p mit U.p; "/ , U und U.p; 1/ , V . Dann folgt wegen G(ii): B.p; min f"; 1g/ , U \ V . Somit besitzt p eine offene Umgebung, die ganz zu U \ V gehört. Zu (T.3): Ist p 2
S
V+ gegeben, so existiert ein 00 2 - mit p 2 V+0 . Dann S existiert ein " > 0 mit U.p; "/ , V+0 . Daraus folgt U.p; "/ , + 2) V+ . " +2)
L. Bemerkungen. (i) Die Eigenschaft (T.2) gilt entsprechend für endlich viele Mengen, wie leicht durch vollständige Induktion zu sehen ist (jedoch i. Allg. nicht für beliebige Mengenfamilien). Somit erhalten wir als Zusammenfassung von (T.2), (T.3): Der Durchschnitt endlich vieler und die Vereinigung beliebig vieler offener Mengen ist jeweils wieder offen.
276
Kapitel 6 Metrische Räume
(ii) Ein System von Teilmengen einer Menge X mit den Eigenschaften (T.1) – (T.3) heißt eine Topologie auf X. Man könnte viele Begriffe wie Umgebung, Grenzwert, Stetigkeit usw. alleine auf ein solches Mengensystem stützen. (Das wird hier nicht ganz so konsequent getan, um etwas näher an der Anschauung zu bleiben.) M. Satz. Für Teilmengen A , X gilt die Äquivalenz: A abgeschlossen () X n A offen: Beweis. In den Fällen A D X und A D ¿ ist die Äquivalenz klar. Sei jetzt also ¿ ¤ A ¤ X. Zu H) : Ist p 2 X nA, also p … A, so ist p nicht Häufungspunkt von A. Also existiert ein " > 0 mit A \ U $ .p; "/ D ¿. Es folgt A \ U.p; "/ D ¿, also U.p; "/ , X n A. Zu (H : Zu zeigen ist der Schluss: p Häufungspunkt von A H) p 2 A. Stattdessen zeigen wir äquivalent: p … A H) p nicht Häufungspunkt von A. Sei also p … A, d.h. p 2 X n A. Dann existiert ein " > 0 mit U.p; "/ , X n A. Dies impliziert A \ U.p; "/ D ¿, also ist p nicht Häufungspunkt von A. " N. Folgerung. Für Teilmengen B , X gilt die Äquivalenz: B offen () X n B abgeschlossen. Beweis. Setze A WD X n B und beachte X n .X n B/ D B.
"
„Offen“ und „abgeschlossen“ sind also nicht etwa logische Gegensätze (X selbst ist sowohl offen wie abgeschlossen, ebenso ¿). Jedoch führt die Komplementbildung die eine Sorte von Teilmengen in die andere über (so genannte Dualität). O. Bemerkung. Mit dieser Dualität folgt aus L(i): Der Durchschnitt beliebig vieler und die Vereinigung endlich vieler abgeschlossener Mengen ist jeweils wieder abgeschlossen.
P. Beispiele. (i)
Jeder offene Ball B.a; r/ ist eine offene Teilmenge von X: Zu p 2 B.a; r/ wähle man " ´ r & d.a; p/ > 0. Dann gilt nach G(iii): U.p; "/ D B.p; "/ , B.a; r/.
277
Abschnitt 6.1 Grundbegriffe für Mengen
(ii)
Jeder abgeschlossene Ball B.a; r/ ist eine abgeschlossene Teilmenge von X: Wir verwenden Satz M und zeigen, dass X n B.a; r/ offen ist: Zu p … B.a; r/ wähle man ein " mit 0 < " < d.a; p/ & r. Dann gilt nach G(iv): B.a; r/ \ B.p; "/ D ¿, also U.p; "/ D B.p; "/ , B.p; "/ , X n B.a; r/.
(iii)
In R sind die Intervalle der Typen ¿; /a; bŒ ; /a; 1Œ ; /&1; bŒ3 ; /&1; 1Œ - D aCb b&a R mit a < b aus R offen im Sinne von J(i). Z.B. ist /a; bŒ D B 2 ; 2 und S /a; 1Œ D 1 iD1 /a; a C iŒ. Analog schließt man in den anderen drei Fällen. Die Intervalle der restlichen Typen aus K[1.1] sind nicht offen, weil Endpunkte keine inneren Punkte sind. Die jetzige Eigenschaft „offen“ fällt also bei Intervallen mit der von K[1.1] zusammen.
(iv)
In R sind die Intervalle der Typen ¿; Œa; b/; Œa; 1Œ ; /&1; b/ ; /&1; 1Œ D R mit a . b aus R abgeschlossen im Sinne von J(ii). Z.B. ist R n Œa; b/ D /&1; aŒ [ /b; 1Œ, also R n Œa; b/ offen, also Œa; b/ abgeschlossen. Analog schließt man in den anderen Fällen. Die Intervalle der restlichen Typen aus K[1.1] sind nicht abgeschlossen, weil ihre Endpunkte Häufungspunkte sind, die nicht zum Intervall gehören. Die jetzige Eigenschaft „abgeschlossen“ fällt also bei Intervallen mit der von K[1.1] zusammen.
(v)
Somit sind in R die Intervalle der Typen Œa; bŒ ; /a; b/ mit a < b aus R weder offen noch abgeschlossen im Sinne der Definition J(ii).
(vi)
In R gilt: \ i n2N
1 1h D f0g nicht offen: & ; n n… „ ƒ‚ offen
Ein Durchschnitt unendlich vieler offener Mengen braucht also nicht offen zu sein. Entsprechend braucht eine Vereinigung unendlich vieler abgeschlossener Mengen nicht abgeschlossen zu sein. (vii) In einem beliebigen metrischen Raum X ist jeder offene Ball als Vereinigung abgeschlossener Bälle darstellbar, sogar von abzählbar vielen. Es gelten nämlich Zwiebeldarstellungen der Art B.a; r/ D
[ 0 0; U.p; "/ , A Aı D X n A D .X n A/ı :
(2)
Hieraus folgt rein mengenmäßig: A D X n .X n A/ı ;
(3)
Aı D X n .X n A/:
Die Gleichungen (2) und (3) spiegeln erneut eine Dualität zwischen den beiden Operationen „offener Kern“ und „abgeschlossene Hülle“ wider. Sie können dazu dienen, jeweils die eine Operation auf die andere zurückzuführen. Beweis von S. Zu (1): Dass die linke Seite in der rechten enthalten ist, ist klar. Dass umgekehrt die rechte Seite in der linken enthalten ist, folgt mittels G(iii). Zu (2): Diese Gleichung bestätigt man unmittelbar aufgrund der Definitionen (i) und (ii) in Definition Q. Zu (3): Die erste Gleichung folgt aus (2), indem man das Komplement zu X bildet, die zweite, indem man A durch X n A ersetzt. " Damit ergeben sich beispielsweise die folgenden Aussagen: T. Satz. Seien A; B Teilmengen von X. Dann gilt (i) (ii)
Aı ist offen, A ist abgeschlossen. Es gilt Aı , A sowie: Aı D A genau dann, wenn A offen ist.
(iii) Es gilt A - A sowie: A D A genau dann, wenn A abgeschlossen ist. (iv) Aus A , B folgt Aı , B ı und A , B. Beweis. Der Nachweis für Behauptungen dieser Art ist i. Allg. nicht schwierig, da man lediglich auf die Definitionen zurückgreifen muss. Bündiger kann man argumentieren, wenn man Lemma S mit heranzieht: Aus (1) liest man alle Behauptungen in (i) – (iv) bzgl. der Operation A 7! Aı ab. Mit den Dualitätsformeln (2) und (3) rechnet man dann die Behauptungen nach, die sich auf die Operation A 7! A beziehen. " Da Aı offen und A abgeschlossen ist, folgt aus (ii) und (iii) (4)
Aıı D Aı ;
A D A:
280
Kapitel 6 Metrische Räume
Warnung: Bei Bällen ist i. Allg. B.a; r/ ¤ B.a; r/! Aus B.a; r/ , B.a; r/ folgt zwar (5)
B.a; r/ , B.a; r/ D B.a; r/
(dies ist abgeschlossen), aber nicht die inverse Inklusion. In R und Rn besteht allerdings Gleichheit, wie wir in I(v)[6.4] sehen werden. Jede Teilmenge eines metrischen Raums wird selbst zu einem metrischen Raum, indem man die Metrik einfach restringiert; vgl. D. Wie sich dabei die offenen und abgeschlossenen Mengen verhalten, sagt der folgende Satz. U. Definition und Satz (über Teilmengen). Sollen Eigenschaften, die für einen metrischen Raum X selbst definiert sind, auf eine Teilmenge A , X angewandt werden, so ist dafür A als metrischer Unterraum von X zu betrachten. Das gilt auch für die in den nachstehenden Abschnitten einzuführenden Begriffe. Bezüglich der Offenheit und Abgeschlossenheit kann man feststellen: Die offenen Teilmengen von A sind genau die Durchschnitte von A mit den offenen Teilmengen von X. Ebenso sind die abgeschlossenen Teilmengen von A genau die Durchschnitte von A mit den abgeschlossenen Teilmengen von X. Die offenen Teilmengen des Unterraums A heißen auch relativ offene Mengen oder offen in A. Entsprechend heißen die abgeschlossenen Teilmengen des Unterraums A als relativ abgeschlossene Mengen oder abgeschlossen in A. Die relativ offenen Mengen in A bilden die so genannte Relativ- oder Spurtopologie auf A. Ohne den Zusatz „relativ“ oder „in A“ ist immer die gewöhnliche Eigenschaft bzgl. X gemeint. Beweis. Die Behauptung über die offenen Teilmengen von A ist eine leichte Konsequenz der Tatsache, dass der Ball in A um a 2 A mit Radius r gerade gleich A \ B.a; r/ ist. Die Behauptung über die abgeschlossenen Teilmengen von A folgt dann hieraus per Dualität, d.h. mittels Satz M. " Es besteht also i. Allg. durchaus eine Verschiedenheit zwischen „offen in A“ und „offen in X“ (und analog bei „abgeschlossen“)! Schließlich geben wir noch eine Definition, die nicht topologischer, sondern metrischer Natur ist: V. Definition. Eine Teilmenge A , X heißt beschränkt, wenn A in einem Ball von X enthalten ist. Bei der Standard-Metrik auf R ist dieser Begriff äquivalent mit dem früheren, wie man an G[1.4] sieht.
Abschnitt 6.1 Grundbegriffe für Mengen
281
$ Metrisierung der symmetrischen Gruppe und Verstellungsmaß Wir führen hier den Beweis, dass das Verstellungsmaß dV für Wörter den Metrikaxiomen genügt. Vgl. Beispiel C(v). Im Wesentlichen beruht dies auf einer Metrik für die symmetrische Gruppe Sn , die zunächst behandelt wird. Die Gruppe Sn besteht aus allen bijektiven Abbildungen ' W f1; : : : ; ng ! f1; : : : ; ng mit der Komposition als Verknüpfung. Neutralelement ist die Identität 3. Jedes Element ' 2 Sn heißt eine Permutation (der Ziffern von 1 bis n). Ein Fehlstand von ' ist ein Paar .i; j / mit 1 . i < j . n und '.i/ > '.j /. Die Fehlstandsmenge F% ist die Menge aller Fehlstände von ', und die Fehlstandszahl ˆ.'/ ist ihre Anzahl: ˆ.'/ ´ jF% j. W. Lemma. Bezeichnet ˆ die Fehlstandszahl in der symmetrischen Gruppe Sn , so gilt für alle '; ) 2 Sn : (6)
ˆ.' ı )/ . ˆ.'/ C ˆ.)/:
Beweis. Sei k ´ ˆ.' /; ` ´ ˆ.)/. Die Fehlstandsmenge F%ı' zerfällt in zwei disjunkte Teilmengen: Für ein Paar .i; j / 2 F%ı' gilt entweder ).i/ > ).j /, also .i; j / 2 F' , und somit ist die Anzahl dieser Möglichkeiten höchstens `; oder aber es gilt ).i/ < ).j /, und dann .).i/; ).j // 2 F% , und somit ist die Anzahl dieser Möglichkeiten höchstens k. Insgesamt hat dann F% ı' höchstens ` C k Elemente. " X. Satz. Bezeichnet ˆ die Fehlstandszahl in der symmetrischen Gruppe Sn , so definiert d.'; )/ ´ ˆ.' ı ) &1 /
(7) eine Metrik auf Sn . Beweis.
Zu (D.1) für d : Zu zeigen ist ˆ.' ı ) &1 / D ˆ.) ı ' &1 /. Die Argumente von ˆ sind invers zueinander, also folgt dies aus der Regel ˆ.'/ D ˆ.' &1 /. Diese ist erfüllt; denn es gilt die Äquivalenz: .i; j / 2 F% () .'.j /; ' .i// 2 F% #1 , und die Abbildung .i; j / 7! .'.j /; '.i// bildet f1; : : : ; ng ) f1; : : : ; ng bijektiv auf sich ab. Zu (D.2), (D.3) für d : d.'; )/ % 0 ist klar nach Konstruktion. Da die Identität 3 die einzige Permutation ohne Fehlstände ist, gilt ˆ.' ı ) &1 / D 0 genau für ' ı ) &1 D 3, also genau für ' D ). Zu (D.4) für d : Für '; ); ! 2 Sn folgt unter Verwendung von Lemma W: ˆ.' ı ! &1 / D ˆ..' ı ) &1 / ı .) ı ! &1 // . ˆ.' ı ) &1 / C ˆ.) ı ! &1 /: Hieraus ergibt sich unmittelbar die Dreiecksungleichung für d .
"
282
Kapitel 6 Metrische Räume
Y. Definition und Satz. Das Verstellungsmaß für Wörter aus n Buchstaben, genommen aus dem Alphabet A, sei definiert durch dV .x; y/ ´ min fˆ.' / j ' 2 Sn mit yi D x%.i/ für i D 1; : : : ; ng;
x; y 2 An ;
falls eine solche Permutation existiert (überführbarer Fall), und sonst durch dV .x; y/ ´
1 .n & 1/n C 1: 2
Dann ist dV eine Metrik auf An . Hierbei ist der Summand vor der 1 die höchstmögliche Fehlstandszahl .n & 1/ C .n & 2/C( ( (C1 des ersten Falls. Diese wird erreicht bei der Permutation mit der Werteliste n; n & 1; : : : ; 1. Vgl. E[1.3]. Beweis von Y. Die Metrikaxiome für dV lassen sich analog wie bei der obigen Metrik d auf Sn bestätigen: Für (D.1) beachtet man, dass im überführbaren Fall yi D x%.i/ äquivalent ist mit xj D y% #1 .j / und dass ˆ.'/ D ˆ.' &1 / gilt. Für (D.2), (D.3) beachtet man, dass das minimale ' genau dann die Identität ist, wenn x D y. Schließlich beweist man die Dreiecksungleichung (D.4) für drei paarweise überführbare Wörter x; y; z so: Aus yi D x%.i/ und zj D y' .j / folgt zj D x%.'.j // . Die Ungleichung in W gilt dann für '; ) und natürlich auch für minimale ' und ). Indem man die linke Seite nochmals durch das Minimum ersetzt, das für x; z zuständig ist, ergibt sich dV .x; z/ . dV .x; y/ C dV .y; z/. Für nicht paarweise überführbare x; y; z ist die Dreiecksungleichung immer richtig, da zumindest ein Summand der rechten " Seite gleich 21 .n & 1/n C 1 ist. Aufgaben und Anmerkungen 1. Man bestimme die inneren Punkte, die Häufungspunkte und den Rand folgender Teilmengen von R: ˇ % + [i 1 2 ˇˇ 1 h 3 c) C D : & ˇ n; m 2 N , ; a) A D Q, b) B D m n 2n C 1 2n n2N Welche dieser Mengen sind offen bzw. abgeschlossen bzw. dicht in R? 2. Man bestimme für alle Intervalltypen aus K[1.1] das Innere, den Abschluss sowie den Rand. Insbesondere zeige man, dass bei jedem Intervall die Endpunkte im Sinne von K[1.1] dasselbe sind wie die Randpunkte im Sinne von Q(iii).
Abschnitt 6.1 Grundbegriffe für Mengen
283
3. Man beweise, dass die einzigen Teilmengen von R, die zugleich offen und abgeschlossen sind, die leere Menge ¿ und R selbst sind. Lösungshinweis: Sei A ¤ ¿ eine zugleich offene und abgeschlossene Teilmenge von R. Man wähle ein festes Element a 2 A und zeige, dass die beiden Mengen fb j Œa; bŒ , Ag und fc j Œc; aŒ , Ag nichtleer und unbeschränkt sind. 4. Man verallgemeinere den Satz L[1.4] folgendermaßen: Sei .pn /n2N eine Folge positiver Zahlen mit limn!1 pn D 0. Dann liegt zwischen je zwei verschiedenen reellen Zahlen stets eine Zahl der Form kpn mit k 2 Z und n 2 N. Daraus schließe man, dass die Menge fkpn j k 2 Z; n 2 Ng dicht in R ist. (L[1.4] ist der Spezialfall hiervon für pn ´ 1=n.) Lösungshinweis: Gleiche Prozedur wie in L[1.4]. 5. Gegeben sei eine stetige periodische Funktion f W R ! R, die nicht konstant ist, und es sei p ¤ 0 eine Periode von f . Man beweise: a) Mit p ist auch jedes ganze Vielfache kp; k 2 Z n f0g, Periode von f . b) Sei P die Menge aller positiven Perioden von f . Dann ist p0 ´ inf P positiv und selbst Periode von f . c) Jede Periode p von f ist ein ganzes Vielfaches von p0 . Wegen dieser Eigenschaften heißt p0 die primitive Periode von f . (Eine konstante Funktion gilt ebenfalls als periodisch mit der primitiven Periode 0.) Lösungshinweis: Bei b) nehme man an, p0 sei 0. Dann existiert eine Folge positiver Perioden pn ! 0, und mittels Aufgabe 4 schließe man f D const. Bei c) nehme man an, wenn p > 0 irgendeine Periode von f ist, es sei 1 < ˛ ´ p=p0 … N. Dann wähle man ein n 2 N mit n < ˛ < n C 1 und schließe, dass p & np0 positive Periode von f ist mit p & np0 < p0 , was der Wahl von p0 widerspricht. 6. Die folgenden Aussagen klären, wann eine Stammfunktion einer stetigen periodischen Funktion periodisch ist: Sei f W R ! R stetig und periodisch mit der primitiven Periode p0 > 0. Sei ˆ eine Stammfunktion von f . Dann sind paarweise äquivalent: (i)
ˆ ist periodisch;
(ii)
ˆ ist periodisch mit der primitiven Periode p0 ; Z p0 f .t/ dt D 0. (iii) 0
Lösungshinweis: Man verwende den Hauptsatz der Differential- und Integralrechnung R xCp f .t/ dt. in der Form ˆ.x C p/ & ˆ.x/ D x
284
Kapitel 6 Metrische Räume
7. Es sei X eine nichtleere Menge. Man definiere eine Abbildung d W X ) X ! R durch ( 0 für x D y d.x; y/ ´ 1 für x ¤ y: a) Man beweise: d ist eine Metrik auf X. b) Man bestimme alle offenen und abgeschlossenen Bälle sowie Sphären mit festem Mittelpunkt a 2 X und folgere daraus, dass X ein diskreter Raum ist. c) Man zeige B.a; 1/ ¤ B.a; 1/ und damit @B.a; 1/ ¤ S.a; 1/ sowie B.a; r/ D B.a; r/ für r ¤ 1. 8. Für eine Menge X sei d W X ) X ! R eine Abbildung, sodass für alle x; y; z 2 X gilt d.x; y/ D 0 () x D y d.x; y/ . d.x; z/ C d.z; y/: Man zeige, dass d eine Metrik auf X ist. 9. Unter der symmetrischen Differenz zweier Mengen U; V versteht man die Menge U 4V ´ .U n V / [ .V n U /:
a) Sei N eine beliebige Menge und M die Menge aller endlichen Teilmengen von N . Für U; V 2 M sei eine Distanz definiert durch d.U; V / ´ jU 4V j. Man beweise, dass d eine Metrik auf M ist. b) Für N ´ fn; e; u; j; a; h; rg sei U ´ fj; a; h; rg. Welche Mengen V , N haben von U in dieser Metrik eine Distanz . 1? In den folgenden Aufgaben sei X stets ein metrischer Raum und A; B; : : : seien Teilmengen von X. 10. In Verallgemeinerung der modifizierten Dreiecksungleichung beweise man für x; y; z; w 2 X die Ungleichung jd.x; y/ & d.z; w/j . d.x; z/ C d.y; w/: 11. Man zeige: Der Abschluss A besteht aus allen Punkten p 2 X mit der Eigenschaft, dass jede "-Umgebung von p die Menge A schneidet. Solche Punkte p 2 X werden Berührungspunkte von A genannt. Man mache sich den Unterschied zu den Häufungspunkten klar!
285
Abschnitt 6.1 Grundbegriffe für Mengen
12. Man beweise die Regeln .A \ B/ı D Aı \ B ı ;
A [ B D A [ B:
13. Man beweise die disjunkte Zerlegung $ $ @A [ .X n A/ı : X D Aı [
Die Menge .X nA/ı heißt das Äußere von A. Jeder Punkt von X gehört also entweder zum Inneren oder aber zum Rand oder aber zum Äußeren von A. 14. Man zeige a) A ist genau dann offen, wenn A \ @A D ¿ gilt. b) A ist genau dann abgeschlossen, wenn @A , A gilt. 15. Man beweise @A D A \ .X n A/ und folgere daraus, dass @A stets abgeschlossen ist, sowie @A D @.X n A/. 16. Man beweise a) Aı ist die Vereinigung aller offenen Mengen B mit B , A. Somit ist Aı die größte offene Teilmenge von A. a) A ist der Durchschnitt aller abgeschlossenen Mengen C mit A , C , X. Somit ist A die kleinste abgeschlossene Obermenge von A. c) @A besteht aus allen p 2 X mit der Eigenschaft, dass jede "-Umgebung von p sowohl A wie auch das Komplement X n A schneidet. 17. In der Situation A , B , X beweise man die Implikationen a) A offen in X H) A offen in B; b) A abgeschlossen in X H) A abgeschlossen in B. Umkehren lassen sich diese Schlüsse nicht. Beispiele? 18. Man zeige: @.A [ B/ , @A [ @B;
@.A \ B/ , @A [ @B:
286
6.2
Kapitel 6 Metrische Räume
Grundbegriffe für Abbildungen
Immer wenn man in der Mathematik Räume untersucht, ist es angebracht, auch die zwischen ihnen bestehenden Abbildungen zu studieren. Deren Eigenschaften sollten natürlich die Besonderheiten der betreffenden Raumstrukturen berücksichtigen. Hier wird es hauptsächlich um stetige Abbildungen zwischen metrischen Räumen gehen. Gegeben seien zwei metrische Räume .X; d / und .Y; d /, wobei die Metriken gleich bezeichnet seien (obwohl sie verschieden sein dürfen). Wir studieren als Erstes Abbildungen, die auf Teilmengen von X definiert sind: F W A &! Y
wobei
A , X:
A. Definition. Sei a ein Häufungspunkt von A. Wir nennen F konvergent für x gegen a, wenn es ein b 2 Y gibt mit folgender Eigenschaft: Zu jedem " > 0 existiert ein ı D ı."/ > 0, sodass für alle x 2 A mit 0 < d.x; a/ < ı gilt: d.F .x/; b/ < ". Ist dies der Fall, so heißt b der Grenzwert von F für x gegen a (symbolisch: x ! a), und man schreibt lim F .x/ D b
x!a
oder
F .x/ &! b
(für x &! a):
Man beachte die starke Analogie zur Grenzwertdefinition in E[3.2]. Im Grunde hat man ja lediglich den Abstand ju & vj in R zu ersetzen durch die Abstände d.p; q/ in X bzw. Y . Nach diesem Muster sind viele der folgenden Begriffe gebildet. Falls existent, ist der Grenzwert b eindeutig bestimmt. Dies folgt leicht aus der Dreiecksungleichung: d.b; e b/ . d.b; F .x// C d.F .x/; e b/. Ab jetzt sei A D X, also wird der Abbildungstyp F W X ! Y weiter untersucht. Will man die folgenden Begriffe auf Teilmengen beziehen, so kann man diese als metrische Räume mit der Relativtopologie betrachten. (Bei Definition A ging das nicht, weil a nicht Element von A sein musste.) B. Definition. Die Abbildung F W X ! Y heißt stetig in a 2 X, wenn gilt: Zu jedem " > 0 existiert ein ı D ı."/ > 0, sodass für alle x 2 A mit d.x; a/ < ı gilt: d.F .x/; F .a// < ".
287
Abschnitt 6.2 Grundbegriffe für Abbildungen
Die eingerahmten Bedingungen seien wieder als ."; ı/-Tests bezeichnet. Diese können wie früher mit Hilfe von Umgebungen ausgedrückt werden. Mögliche äquivalente Umformulierungen lauten im Falle des Grenzwertes z.B. 8 " > 0 9 ı > 0 W x 2 A \ U $ .a; ı/ H) F .x/ 2 U.b; "/ bzw. im Fall der Stetigkeit 8 " > 0 9 ı > 0 W x 2 U.a; ı/ H) F .x/ 2 U.F .a/; "/: C. Satz. Gegeben sei die Abbildung F W X ! Y und ein Punkt a 2 X. Dann gilt: (i)
Ist a isolierter Punkt von X, so ist F in a stetig.
(ii) Ist a Häufungspunkt von X, so besteht die Äquivalenz: F stetig in a ()
lim F .x/ D F .a/:
x!a
Beweis. Dieser Satz ist völlig analog zu seinem „konkreten“ Gegenstück C[3.3]. In solchen Fällen ergibt sich der Beweis der jetzigen allgemeinen Fassung aus dem Beweis der konkreten Fassung, indem man dort überall d.u; v/ statt ju & vj schreibt (und natürlich die Bezeichnungen an die neue Situation anpasst). Wir führen dies explizit an dieser Stelle vor, werden aber im weiteren Verlauf dieses Prinzip nur kurz andeuten. Zu (i): Nach Voraussetzung existiert ein ı1 > 0 mit U.a; ı1 / D fag. Zu jedem " > 0 sei ı ´ ı1 gewählt. Dann gilt für d.x; a/ < ı1 : x D a, also 0 D d.F .x/; F .a// < ". Zu (ii): F stetig in a bedeutet: 8 " > 0 9 ı > 0 W x 2 U.a; ı/ H) d.F .x/; F .a// < ": lim F .x/ D F .a/ bedeutet:
x!a
8 " > 0 9 ı > 0 W x 2 U $ .a; ı/ H) d.F .x/; F .a// < ": Da d.F .a/; F .a// < ", verlangen beide Bedingungen dasselbe.
"
Der ."; ı/-Test der Stetigkeit in Definition B ist auch so formulierbar: 8 " > 0 9 ı > 0 W F .U.a; ı// , U.F .a/; "/: Er verlangt also, bei gegebenem " das ı so zu bestimmen, dass die Umgebung U.a; ı/ durch F in die Umgebung U.F .a/; "/ hinein abgebildet wird. Man macht sich das anhand der folgenden Skizze klar:
288
Kapitel 6 Metrische Räume
N
M
a
δ
F
F(a)
ε
gesucht
vorgegeben
Vorgegeben ist also eine „Zieltoleranz“ ", und die Stetigkeit verlangt, eine „Definitionstoleranz“ ı so anzupassen, dass die Zieltoleranz erreicht wird. Das formale und inhaltliche Verständnis der Stetigkeit ist absolut wichtig und zentral für die Analysis! F G D. Satz (Kettenregel der Stetigkeit). Gegeben seien Abbildungen X &&! Y &&! Z zwischen metrischen Räumen X; Y; Z. Ist F stetig in a 2 X und G stetig in F .a/ 2 Y , so ist G ı F stetig in a. Beweis. Wie bei G[3.3], indem man dort überall d.u; v/ statt ju & vj schreibt.
"
E. Definition. Man nennt die Abbildung F W X ! Y stetig, wenn F in jedem a 2 X stetig ist. Das bedeutet also: 8 a 2 X; " > 0 9 ı > 0 8 x 2 X mit d.x; a/ < ıW d.F .x/; F .a// < ": Hierbei darf ı von " und a abhängen: ı D ı."; a/. Eine stärkere Forderung entsteht, wenn man die Abhängigkeit von a fallen lässt: F. Definition. Man nennt die Abbildung F W X ! Y gleichmäßig stetig, wenn zu jedem " > 0 ein ı ´ ı."/ existiert, sodass für alle x; a 2 X mit d.x; a/ < ı gilt: d.F .x/; F .a// < ". Formelmäßig ausgedrückt lautet das: 8 " > 0 9 ı > 0 8 x; a 2 X mit d.x; a/ < ıW d.F .x/; F .a// < ": Dieses ı darf jetzt nur von " abhängen. Natürlich folgt aus der gleichmäßigen Stetigkeit die Stetigkeit, aber i. Allg. nicht umgekehrt. Wann dies doch der Fall ist, wird in Abschnitt 6.5 diskutiert. Eine solche Situation haben wir schon in E[5.1] kennengelernt.
289
Abschnitt 6.2 Grundbegriffe für Abbildungen
G. Satz. Für jede Abbildung F W X ! Y sind äquivalent: (i)
F ist stetig;
(ii)
für jede offene Teilmenge V , Y ist das Urbild F &1 .V / offen in X;
(iii) für jede abgeschlossene Teilmenge C , Y ist das Urbild F &1 .C / abgeschlossen in X. Beweis. Aus (i) folgt (ii): Sei V offen in Y . Um die Offenheit von F &1 .V / zu zeigen, muss zu gegebenem a 2 F &1 .V / eine Umgebung von a konstruiert werden, die ganz in F &1 .V / enthalten ist. Da F .a/ 2 V , existiert eine Umgebung U.F .a/; "/ , V . Wegen der Stetigkeit von F in a existiert eine Umgebung U.a; ı/ mit F .U.a; ı// , U.F .a/; "/ , V . Hieraus folgt U.a; ı/ , F &1 .V /. Aus (ii) folgt (i): Sei a 2 X; " > 0 gegeben. Dann ist U.F .a/; "/ offen in Y ; vgl. P[6.1]. Also ist nach Voraussetzung F &1 .U.F .a/; "// offen in X, also existiert ı > 0 mit Ua; ı/ , F &1 .U.F .a/; "//. Dann gilt F .U.a; ı// , U.F .a/; "/. Somit ist F stetig in a. Äquivalenz von (ii) und (iii): Dies ergibt sich mittels Dualität, nämlich aus M[6.1] und N[6.1] sowie aus der rein mengentheoretischen Gleichung F &1 .Y n W / D X n F &1 .W /; die für alle Teilmengen W , Y zutrifft.
"
H. Bemerkung. Satz G wird sehr oft angewendet, um die Offenheit oder Abgeschlossenheit von Mengen zu erkennen, insbesondere wenn diese durch Gleichungen oder Ungleichungen definiert sind: Ist z.B. f W X ! R stetig und c 2 R gegeben, so haben die folgenden Teilmengen von X die angegebene Eigenschaft: fx 2 X j f .x/ < cg D f &1 ./ & 1; cŒ/ offen fx 2 X j f .x/ . cg D f &1 ./ & 1; c// abgeschlossen fx 2 X j f .x/ D cg D f &1 .fcg/
abgeschlossen;
da sie in der angeschriebenen Weise als Urbilder dargestellt werden können und da /&1; cŒ offen bzw. /&1; c/ sowie fcg abgeschlossen in R sind. Mengen der ersten und zweiten bzw. dritten Zeile werden als Subniveaumengen bzw. als Niveaumengen bezeichnet. Im Zusammenhang mit der ersten Zeile ist Folgendes bemerkenswert: Ist eine strikte Ungleichung f .x0 / < c für einen festen Punkt x0 2 X erfüllt, so auch in einer Umgebung U.x0 ; ı/. Das ist eine weitgehende Variante des Meidungsprinzips.
290
Kapitel 6 Metrische Räume
Eine weitere Verstärkung der gleichmäßigen Stetigkeit ist die Lipschitz-Stetigkeit: I. Definition. Die Abbildung F W X ! Y heißt dehnungsbeschränkt oder Lipschitzstetig oder eine Lipschitz-Abbildung, wenn ein c % 0 existiert, sodass gilt: (1)
d.F .x1 /; F .x2 // . c ( d.x1 ; x2 /
für alle x1 ; x2 2 X:
Das c heißt dann eine Lipschitz-Konstante von F , und (1) wird eine Lipschitz-Bedingung genannt. J. Satz. Ist F W X ! Y Lipschitz-stetig, so ist F W X ! Y erst recht gleichmäßig stetig. Beweis. Wie in P[3.3]: ı."/ ´
" tut es. cC1
"
K. Beispiele. (i)
Die Distanzfunktion dA einer nichtleeren Menge A , X ist dA W X &! R;
dA .x/ ´ inf fd.p; x/ j p 2 Ag:
dA ist Lipschitz-stetig mit der Lipschitz-Konstanten 1, also gleichmäßig stetig: Zu x; y 2 X sei " > 0 vorgegeben. Dann existiert ein q 2 A mit d.y; q/ < dA .y/ C "; vgl. K[2.6]. Also gilt d.x; q/ . d.x; y/ C d.y; q/ < d.x; y/ C dA .y/ C ". Hieraus folgt dA .x/ < d.x; y/ C dA .y/ C ", also für " # 0: dA .x/ . d.x; y/ C dA .y/, d.h. dA .x/ & dA .y/ . d.x; y/. Vertauschung von x; y liefert die Lipschitz-Bedingung jdA .x/ & dA .y/j . d.x; y/. Für eine einelementige Teilmenge A D fpg erhält man speziell die Distanzfunktion von p, auch geschrieben als dp ´ dfpg . Hier gilt einfach dp .x/ D d.p; x/. Statt „Distanzfunktion“ sagt man auch Abstandsfunktion. Mit Bemerkung H kann man leicht folgern, dass jede Sphäre S.p; r/ abgeschlossen ist, da S.p; r/ D fx 2 X j dp .x/ D rg. Ebenso folgt, dass jede einelementige Teilmenge fpg von X abgeschlossen ist, da fpg D fx 2 X j d.x; p/ D 0g. (ii) Für die Reziprokenfunktion R W RC ! R; f .x/ D x1 , gilt: a) Rj Œ1; 1Œ ist gleichmäßig stetig; b) Rj /0; 1/ ist stetig, aber nicht gleichmäßig stetig. Zu a): Für je zwei Punkte x1 ; x2 % 1 gilt ˇ ˇ ˇ1 jx1 & x2 j 1 ˇˇ ˇ . jx1 & x2 j: jR.x1 / & R.x2 /j D ˇ & ˇ D x1 x2 jx1 j ( jx2 j Somit ist Rj Œ1; 1Œ dehnungsbeschränkt mit der Lipschitz-Konstanten 1, also gleichmäßig stetig.
291
Abschnitt 6.2 Grundbegriffe für Abbildungen
Zu b): Die Stetigkeit ergibt sich aus F[3.3]. Sie kann jedoch auf /0; 1/ nicht gleichmäßig sein. Anschaulich am Graphen ist dies klar: Damit sich zwei Funktionswerte höchstens um " unterscheiden, müssen die Argumente immer dichter beieinander gewählt werden, je näher man bei 0 ist.
nicht gleichmäßig stetig
ε (1,1) gleichmäßig stetig
ε δ
δ
Präzise: Das ist schon bei " D 1 der Fall: Wäre bei geeignetem ı1 > 0: jR.x1 / & R.x2 /j . 1 für beliebige x1 ; x2 2 /0; 1/ mit jx1 & x2 j < ı1 , so träfe dies erst recht für ein ı1 < 1 zu, und dann erhielte man leicht einen Widerspruch bei der Wahl x1 ´ ı1 ; x2 ´ ı1 =2; denn es wird jR.x1 / & R.x2 /j D 1=ı1 . In F[6.5] wird ein allgemeiner Satz angegeben, wann aus der Stetigkeit die gleichmäßige Stetigkeit folgt.
Warnung: Spricht man von der Stetigkeit einer Abbildung F W X ! Y bezogen auf eine Teilmenge A * X, so ist eine gewisse Vorsicht angebracht, da zwei verschiedene Bedeutungen (˛) oder (ˇ) möglich sind: (˛) F W X ! Y ist in allen Punkten a 2 A stetig. (ˇ) Die Restriktion F jA W A ! Y ist stetig (bzgl. der Spurtopologie von A). (˛) ist die stärkere Forderung. Denn (˛) impliziert (ˇ), aber die Umkehrung gilt nicht: Die Gauß-Klammer (C[3.1]) ist im Sinne von (ˇ) auf Œ0; 1Œ stetig, nicht aber im Sinne von (˛), da sie im Gesamtverlauf (d.h. als Funktion von R in R) bei 0 und 1 Sprünge aufweist. Andererseits: Ist A offen in X, so sind (˛) und (ˇ) äquivalent. Wenn nichts besonderes vereinbart wird, so ist die Bedeutung (˛) gemeint. Andernfalls muss detailliert gesagt werden, welche Bedeutung gewählt ist. Analoges gilt für die Differenzierbarkeit auf Teilmengen.
292
Kapitel 6 Metrische Räume
$ Beziehungen unter metrischen Räumen und Visualisierung des Unendlichen Für die Beziehungen zwischen metrischen Räumen gibt es mehrere Möglichkeiten. Man kann z.B. auf die Distanz abheben oder auf die weniger starke Struktur der offenen Teilmengen. Dies führt auf folgende Begriffe: L. Definition. Die Abbildung F W X ! Y heißt (i)
isometrisch, wenn für alle x1 ; x2 2 X gilt:
(2)
d.F .x1 /; F .x2 // D d.x1 ; x2 /I
statt „isometrischer Abbildung“ sagt man auch Isometrie; (ii) topologisch, wenn F W X ! Y bijektiv ist und beide Abbildungen F W X ! Y und F &1 W Y ! X stetig sind; statt „topologisch“ sagt man auch homöomorph, statt „topologischer Abbildung“ sagt man auch Homöomorphismus. Eine Isometrie ist von alleine injektiv; denn aus F .x1 / D F .x2 / folgt mittels (2) sofort x1 D x2 . Ist die Abbildung F W X ! Y eine surjektiv Isometrie, so ist sie bijektiv, und die Umkehrabbildung F &1 W Y ! X erfüllt d.F &1 .y1 /; F &1 .y2 // D d.y1 ; y2 / für alle y1 ; y2 2 Y , ist also wieder eine Isometrie. In diesem Fall sind beide Abbildungen stetig, d.h. eine surjektive Isometrie ist stets ein Homöomorphismus. Isometrien sind recht eingeschränkt. Deshalb sind für die Analysis die topologischen Abbildungen sehr viel wichtiger. M. Bemerkungen. (i) Ist F W R ! R eine Isometrie, wobei R als Definitions- und Zielraum mit der Standard-Metrik versehen ist, so ist F entweder von der Form F .x/ D x C c oder F .x/ D &x C c mit konstantem c 2 R: Bildet man G.x/ ´ F .x/ & F .0/, so folgt aus (2) für alle x1 ; x2 2 R: jG.x1 / & G.x2 /j D jx1 & x2 j;
wobei G.0/ D 0;
speziell also jG.x1 /j D jx1 j, sodass G.x1 /=x1 für x1 ¤ 0 stets vom Betrag 1 ist. Hieraus berechnet man weiter 2G.x1 /G.x2 / D G.x1 /2 C G.x2 /2 & .G.x1 / & G.x2 //2 Dx12 C x22 & .x1 & x2 /2 D 2x1 x2 : Division mit G.x1 /2 D x12 liefert G.x2 /=G.x1 / D x2 =x1 , also G.x2 /=x2 D G.x1 /=x1 für x1 ¤ 0, x2 ¤ 0. Somit ist G.x/=x für x ¤ 0 konstant und vom Betrag 1, also entweder G.x/ D x für alle x 2 R oder aber G.x/ D &x für alle x 2 R. Wegen G.x/ ´ F .x/ & F .0/ folgt die Behauptung.
Abschnitt 6.2 Grundbegriffe für Abbildungen
293
(ii) Ist J , R ein Intervall und F W J ! R stetig und streng monoton, so definiert F eine topologische Abbildung von J auf das Bildintervall F .J /. Das ist gerade die Aussage von E[3.6] und F[3.6]. (iii) Ist F W X ! Y injektiv und Y ein metrischer Raum, X aber lediglich als Menge betrachtet, so kann X in eindeutiger Weise so mit einer Metrik versehen werden, dass F eine Isometrie wird. Man setzt einfach für x1 ; x2 2 X d $ .x1 ; x2 / ´ d.F .x1 /; F .x2 // und bestätigt leicht die Metrikeigenschaften für d $ . Man sagt, d $ sei von d durch F induziert. (Wenn X zuvor schon eine Metrik d hatte, so kann man natürlich d $ mit d vergleichen, was durchaus von Interesse sein kann, etwa um die Abweichung von F von der Isometrieeigenschaft zu messen.) N. Definition und Satz. Man nennt zwei metrische Räume X; Y isometrisch, wenn es eine Isometrie F von X auf Y gibt. Die Isometrie zwischen metrischen Räumen hat die Eigenschaften einer Äquivalenzrelation. Man nennt zwei metrische Räume X; Y topologisch äquivalent oder homöomorph, wenn es eine topologische Abbildung F W X ! Y gibt. Die Homöomorphie zwischen metrischen Räumen hat ebenfalls die Eigenschaften einer Äquivalenzrelation. Beweis. Im Fall der Isometrie bestätigt man ohne Mühe die Eigenschaften: Reflexivität: X ist zu X isometrisch (vermöge der identischen Abbildung); Symmetrie: ist X zu Y isometrisch, so auch Y zu X (vermöge der Umkehrabbildung zu einer Isometrie F von X auf Y ); Transitivität: ist X isometrisch zu Y und Y isometrisch zu Z, so ist auch X isometrisch zu Z (vermöge der Komposition zweier Isometrien von X auf Y und von Y auf Z). In allen drei Fällen ist die neue Abbildung ja wiederum isometrisch. Im Fall der Homöomorphie geht dies analog, da Identität sowie Umkehrabbildung und Komposition topologischer Abbildungen wiederum topologische Abbildungen sind. " O. Definition und Satz. Zwei Metriken d und d1 auf ein und derselben Menge X heißen äquivalent, wenn sie die gleiche Topologie erzeugen, d.h. wenn das System der offenen Mengen von X bzgl. d mit dem System der offenen Mengen von X bzgl. d1 übereinstimmt. Dies ist genau dann der Fall, wenn die Identität idX W X ! X topologisch ist (wobei X als Definitionsraum mit der Metrik d und als Zielraum mit der Metrik d1 versehen ist). Beweis. Dies ergibt sich unmittelbar aus der Charakterisierung der Stetigkeit in G(ii). "
294
Kapitel 6 Metrische Räume
P. Satz. Seien X; Y metrische Räume und F W X ! Y eine Bijektion. Dann sind d und die induzierte Metrik d $ auf X genau dann äquivalent, wenn F ein Homöomorphismus ist. Beweis. Der Beweis beruht wesentlich auf der Gleichung (3) F &1 .U.F .a/; 1// D U $ .a; 1/ für alle a 2 X; 1 > 0: Hierin bezieht sich U links auf die gegebene Metrik in Y und U $ rechts auf die Umgebung bzgl. der induzierten Metrik d $ in X. Der Beweis von (3) ergibt sich aus folgender Umformung: F &1 .U.F .a/; 1// D fF &1 .y/ j d.F .a/; y/ < 1g D fx j d.F .a/; F .x// < 1g D fx j d $ .a; x/ < 1g
(setze x D F &1 .y/)
D U $ .a; 1/: 1) Die Stetigkeit von F in a 2 X bedeutet, dass zu jedem " > 0 ein ı > 0 existiert mit F .U.a; ı// , U.F .a/; "/, also äquivalent mit U.a; ı/ , U $ .a; "/: 2) Die Stetigkeit von F &1 in b ´ F .a/ bedeutet, dass zu jedem " > 0 ein ı > 0 existiert mit F &1 .U.b; ı// , U.F &1 .b/; "/, also äquivalent mit U $ .a; ı/ , U.a; "/: Ist nun F als Homöomorphismus vorausgesetzt, so sind F und F &1 beide stetig, und die Äquivalenzen in 1) und 2) beinhalten, dass jede Teilmenge A , X , die bzgl. d $ offen ist, auch bzgl. d offen ist, und umgekehrt. Sind d und d $ äquivalent vorausgesetzt, so ist jede Umgebung U $ .a; "/ nicht nur offen bzgl. d $ , sondern auch bzgl. d , enthält also eine Umgebung U.a; ı/. Somit ist
nach der Äquivalenz in 1) F stetig. Der gleiche Schluss mit vertauschten Rollen von U und U $ zeigt die Stetigkeit von F &1 . "
Q. Beispiel. Auf R betrachten wir neben der Standard-Metrik d.a; b/ ´ ja & bj die Metrik d $ , induziert von der Abbildung F W R ! R mit x : F .x/ ´ 1 C jxj Diese ist stetig und streng monoton wachsend mit dem (offenen) Bildintervall J ´ /&1; 1Œ, also ein Homöomorphismus von R auf J (beide mit der Standard-Metrik bzw. mit deren Einschränkung versehen). Die induzierte Metrik auf R ist somit ˇ ˇ ˇ a b ˇˇ $ ˇ ; & d .a; b/ D jF .a/ & F .b/j D ˇ 1 C jaj 1 C jbj ˇ
295
Abschnitt 6.2 Grundbegriffe für Abbildungen
und diese ist äquivalent mit d . Man beachte, dass die Werte von d $ im Intervall /0; 2Œ liegen, also beschränkt sind. Wir setzen nun F auf die erweiterte reelle Achse R fort, indem wir definieren: F .&1/ ´ &1 und F .1/ ´ C1. Hierdurch wird R bijektiv auf das abgeschlossene Intervall J D Œ&1; 1/ abgebildet. Die durch F induzierte Metrik auf R ist nach wie vor gegeben durch d $ .a; b/ D jF .a/ & F .b/j: Somit ist F eine Isometrie und damit eine topologische Abbildung von R mit der Metrik d $ auf J mit der Standard-Metrik d . Damit erhalten wir in J ein „sichtbares“ topologisches Äquivalent der erweiterten reellen Achse, wobei die Endpunkte ˙1 den beiden Unendlichs ˙1 entsprechen („Visualisierung des Unendlichen“):
-1
0
1
Die Bilder der ganzen Zahlen drängen sich immer enger an &1 und 1 heran, die ganze reelle Achse ist auf den endlichen Bereich von &1 bis 1 „zusammengequetscht“. Die Anordnungsbeziehungen (einschließlich derer für ˙1) bleiben aber erhalten, da F streng monoton ist. Durch die Fortsetzung hat sich d $ .a; b/ für Argumente a; b 2 R nicht verändert, erfüllt nun aber zusätzlich für a 2 R: d $ .a; 1/ D 1 & F .a/;
d $ .a; &1/ D 1 C F .a/;
d $ .&1; 1/ D 2:
Die offenen Mengen in R * R bzgl. d $ stimmen mit den gewöhnlichen offenen Mengen (es sind die bzgl. der Standard-Metrik d ) überein. Die "-Umgebungen von 1 in R bzgl. d $ sind außer den zwei Einzelmengen R (" > 2) und f1g [ R (" D 2) die der Schar f1g [ /D; 1Œ für D 2 R (" < 2), wobei D D F &1 .1 & "/. Man erkennt dies durch Umrechnen der Bedingung d $ .1; x/ < " für x 2 R. Die Mengen dieser Schar koinzidieren mit den früher in J[3.5] definierten Umgebungen von 1. Entsprechendes gilt für die "-Umgebungen von &1 in R. Insbesondere sieht man, dass jede "-Umgebung von ˙1 Punkte mit R gemeinsam hat, dass also R in R dicht liegt. Damit ist die Rolle der beiden uneigentlichen Elemente ˙1 in diesem topologischen Kontext geklärt. Ein weiterer Aspekt wird am Ende von Abschnitt 6.3 hinzugefügt.
296
Kapitel 6 Metrische Räume
Aufgaben und Anmerkungen 1. Sei X ein metrischer Raum, und seien f; g W X ! R Funktionen, die in einem Punkt a 2 X stetig sind. Man zeige: Auch f C g und f ( g sind in a stetig, ebenso f , falls g.a/ ¤ 0. g F G 2. Gegeben seien Abbildungen X &&! Y &&! Z zwischen metrischen Räumen X; Y; Z. Als Varianten der Kettenregel in Satz D zeige man a) Sind F und G gleichmäßig stetig, so auch G ı F . b) Sind F und G Lipschitz-stetig, so auch G ı F . 3. Für jede Teilmenge A eines metrischen Raumes X beweise man A D fx 2 X j dA .x/ D 0g. 4. Sei .X; d / ein metrischer Raum und f W X ! R eine dehnungsbeschränkte Funktion. Man beweise, dass f sublinear wächst, d.h. es gibt einen festen Punkt p 2 X und Konstanten a % 0, b % 0 derart, dass für alle x 2 X gilt: jf .x/j . a ( d.p; x/ C b: 5. Sei F W X ! Y eine Abbildung zwischen metrischen Räumen X, Y , und sei S A+ mit endlicher oder auch .A+ /+ 2) eine Überdeckung von X, d.h. X D +2) nichtendlicher Indexmenge - derart, dass alle Restriktionen F+ ´ F jA+ W A+ ! Y stetig sind. Die Stetigkeit der Restriktion F+ bezieht sich dabei auf A+ als metrischen Unterraum von X. Man beweise die folgenden hinreichenden Kriterien für die Stetigkeit von F : a) Ist die Überdeckung offen, d.h. sind alle Mengen A+ offen, so ist F stetig. b) Ist die Überdeckung abgeschlossen, d.h. sind alle Mengen A+ abgeschlossen und ist sie endlich (d.h. die Indexmenge - endlich), so ist F stetig. Lösungshinweis zu b): Man verwende G(iii). 6. Die Regeln der Aufgabe 5 sind sehr nützlich bei den in der Analysis häufig vorkommenden Klammerdefinitionen. Es soll z.B. eine Abbildung f W R ! R definiert werden durch 8 0 existiert ein N 2 N, sodass für alle k > N gilt: ak 2 U.a; "/. Viele topologische Begriffe in metrischen Räumen lassen sich mit Hilfe von Folgen charakterisieren. (Das wird oft als einfacher empfunden als Kennzeichnungen mittels Umgebungen). Z.B. gilt: B. Satz. Ist A , X, so sind äquivalent: (i)
A ist abgeschlossen in X .
(ii) Ist .ak / irgendeine konvergente Folge in A mit dem Grenzwert limk!1 ak D a in X , so folgt a 2 A. Beweis. Zu (i) H) (ii): Angenommen, limk!1 ak D a … A. Dann wäre a Häufungspunkt von A, also wegen (i) a 2 A, Widerspruch! Zu (ii) H) (i): Sei a Häufungspunkt von A. Wähle zu jedem k 2 N ein ak 2 A mit d.ak ; a/ < 1=k. Daraus folgt ak ! a, also nach (ii) a 2 A. " C. Definition. Der metrische Raum X heißt folgenkompakt, wenn jede Folge in X eine Teilfolge besitzt, die in X konvergiert.
300
Kapitel 6 Metrische Räume
D. Beispiel. Jedes Intervall Œa; b/ mit a . b aus R ist folgenkompakt. (Natürlich bezieht sich dies auf Œa; b/ als metrischen Unterraum von R mit der Standard-Metrik.) Diese Aussage ist eine Konsequenz aus dem Satz von Bolzano/Weierstraß E[2.6] und der Erhaltung von Ungleichungen gemäß P[2.1]. Alle Intervalle der anderen Typen sind (soweit ¤ ¿) nicht folgenkompakt! Z.B. ist bei Œa; bŒ W Œa; 1ŒW
1 k ak ´ a C k ak ´ b &
ohne konvergente Teilfolge in
Œa; bŒ Œa; 1Œ :
Im ersten Fall muss k natürlich so groß sein, dass ak > a. Insbesondere ist R selbst nicht folgenkompakt, wie man etwa an der Folge der natürlichen Zahlen sieht. E. Lemma. Sei X folgenkompakt und " > 0 gegeben. Dann existieren endlich viele offene Bälle vom Radius ", die X überdecken, d.h. es gibt ein q 2 N und Bälle B.ai ; "/, i D 1; : : : ; q; mit [q XD B.ai ; "/: iD1 Beweis. Definiere induktiv Punkte a1 ; a2 ; : : : 2 X von gegenseitigem Abstand % " auf folgende Weise: a1 sei irgendwie fest gewählt. Falls a1 ; : : : ; ak 2 X schon definiert sind mit d.ai ; aj / % " für 1 . i < j . k, so sucht man ein akC1 2 X derart, dass d.ai ; akC1 / % " für 1 . i . k gilt. Falls ein solches akC1 existiert, wird es Sk hinzugefügt. Falls ein solches akC1 nicht existiert, so gilt X D iD1 B.ai ; "/, und es wird q D k gesetzt und abgebrochen. Dieses Verfahren muss nach endlich vielen Schritten abbrechen. Sonst gäbe es nämlich eine Folge .ai /i2N in X mit d.ai ; aj / % " für alle i ¤ j aus N. Diese kann aber keine konvergente Teilfolge enthalten. Widerspruch! " F . Lemma. Sei M folgenkompakt. Dann existiert eine Folge .Bk /k2N von Bällen Bk , X mit folgender Eigenschaft: ($) Zu jeder offenen Menge U , M und zu jedem p 2 U gibt es ein Bk mit p 2 Bk , U . Wählt man U D X, so folgt, dass solche Bälle Bk notwendigerweise den Raum X überdecken. Beweis. Nach Lemma E gibt es zu jedem n 2 N eine Darstellung (1)
XD
[q iD1
3 1B ai ; : n
Abschnitt 6.3 Kompaktheit und Vollständigkeit
301
Die endlich vielen ai hierin ändern sich beim Wechsel zu neuem n, ebenso auch ihre Anzahl q. Man nehme nun als die gesuchten Bk alle Bälle, die in den verschiedenen Darstellungen (1) für n D 1; 2; : : : auftreten. Die Gesamtheit dieser Bälle ist nach dem Diagonalverfahren abzählbar, und sie erfüllt die Forderung ($), wie folgendermaßen gezeigt werden kann: Zum gegebenen p 2 U wähle man ein r > 0 mit B.p; r/ , U . Das geht, weil U offen ist. Weiter wähle man ein n 2 N mit 1=n < r=2 und ein ai aus (1) mit p 2 B.ai ; 1=n/. Dann ist B.ai ; 1=n/ , B.p; r/ laut G(iii)[6.1]; es gilt nämlich ai 2 B.p; 1=n/ , B.p; r/ und r r 1 1 < D r & < r & < r & d.ai ; p/: n 2 2 n Also leistet der Ball B.ai ; 1=n/ das Gewünschte.
"
G . Definition. Eine offene Überdeckung von X ist eine Mengenfamilie .U+ /+ 2) derart, dass alle U+ offen in X sind und [ XD U+ + 2) gilt. Die Indexmenge - darf dabei endlich oder abzählbar unendlich oder auch ganz beliebig sein. H. Satz. Sei X folgenkompakt. Dann existiert zu jeder offenen Überdeckung .U+ /+ 2) von X eine endliche Teilüberdeckung, d.h. es gibt endlich viele 01 ; : : : ; 0L 2 - mit [L XD U : `D1 +` Beweis. Man wähle zu jedem p 2 M ein U+ mit p 2 U+ und dann eine der Mene` des Systems von Lemma F, sodass also p 2 B e` , U+ gilt. Die auftretenden gen B e B ` sind Teil eines abzählbaren Systems, bilden also selbst ein abzählbares System e1 ; B e2 ; : : : . Nach Konstruktion wird X von den B e` überdeckt. Tatsächlich gilt beB reits für geeignete endlich viele [L e` : B (2) XD `D1 S e` ¤ ¿ für alle q, so wähle man zu jedem q Wäre nämlich die Differenz X n q`D1 B Sq S e` . Dann gälte xq ; xqC1 ; : : : 2 X n q e` . Dies Differenzen ein xq 2 X n `D1 B B `D1 sind abgeschlossen. Nach Voraussetzung existiert eine konvergente Teilfolge xqn ! Sqn e` . Da dies für jedes n gilt, folgte x0 2 x0 , und nach Satz B ist x0 2 X n `D1 B S e Xn 1 `D1 B ` D ¿, Widerspruch! e` in (2) ein U+ mit B e` , U+ , so gilt erst recht X D Wählt man zu jedem B ` ` SL " `D1 U+` .
302
Kapitel 6 Metrische Räume
I. Definition. Der metrische Raum X heißt kompakt, wenn zu jeder offenen Überdeckung von X eine endliche Teilüberdeckung existiert (Heine/Borelsche Überdeckungseigenschaft). J. Satz. Ein metrischer Raum X ist dann und nur dann kompakt, wenn er folgenkompakt ist. Beweis. „folgenkompakt“ impliziert „kompakt“: Dies ist gerade Satz H. „kompakt“ impliziert „folgenkompakt“: Gegeben sei eine Folge .ak / in X. Angenommen .ak / besäße keine konvergente Teilfolge: Dann wähle man zu jedem p 2 X eine ı-Umgebung U.p; ı/, die nur endlich viele Punkte ak enthält (endlich viele heißt hier: mit endlich vielen Indizes). Diese ı-Umgebungen bildeten eine offene Überdeckung von X. Also würde X durch endlich viele unter diesen überdeckt. Somit enthielte X nur endlich viele Punkte ak , Widerspruch! " Wir haben schon in Beispiel D erkannt, dass R selbst nicht folgenkompakt, also auch nicht kompakt ist. Dagegen trifft auf R eine weniger einschneidende Forderung zu, nämlich die Vollständigkeit. Diese ist im Kontext der metrischen Räume folgendermaßen definiert: K. Definition. (i)
Eine Folge .ak / in X heißt konzentriert oder Cauchy-Folge, wenn gilt: Zu jedem " > 0 existiert ein N D N."/ 2 N, sodaß für alle k; ` > N gilt: d.ak ; a` / < ".
(ii) Der metrische Raum .X; d / heißt vollständig, wenn jede Cauchy-Folge in X einen Grenzwert in X besitzt. Eine konvergente Folge ist stets auch eine Cauchy-Folge. Das ist eine simple Konsequenz der Dreiecksungleichung; vgl. Teil 1) bei H[2.6]. Die Umkehrung gilt i. Allg. nicht. Z.B. ist Q (als metrischer Unterraum von R) nicht p vollständig: Man kann eine Folge .ak / rationaler Zahlen wählen, die in R gegen 2 konvergiert. Diese p Folge ist dann in R konzentriert, also auch in Q, aber in Q nicht konvergent, da 2 irrational ist; vgl. die Ausführungen am Ende von Abschnitt 2.2. Die Vollständigkeit ist eine Abschwächung der Kompaktheit: L. Satz. Ist X kompakt, so ist X auch vollständig.
Abschnitt 6.3 Kompaktheit und Vollständigkeit
303
Beweis. Sei .ak / Cauchy-Folge in X. Es gibt dann eine konvergente Teilfolge akj ! a 2 X. Dann gilt auch ak ! a. Dies folgt aus der Vorausabschätzung d.ak ; a/ . d.ak ; akj / C d.akj ; a/; indem man zunächst den zweiten Term „klein macht“ mit festem j (aufgrund der Konvergenz der Teilfolge) und daraufhin den ersten Term „klein macht“ für alle genügend großen k (aufgrund der Konzentriertheit der Ausgangsfolge). Details exakt wie in G[2.6]. " Hinweis: Die Umkehrung gilt nicht. Gegenbeispiel ist R selbst! Nach H[2.6] ist R vollständig im hier gebrauchten Sinne, aber laut D nicht folgenkompakt, also auch nicht kompakt. Entsprechend der allgemeinen Konvention in U[6.1] beziehen sich bei einer Teilmenge A , X die Eigenschaften „folgenkompakt“, „kompakt“ und „vollständig“ auf A als metrischen Unterraum von X. Explizit formuliert, bedeutet dies z.B. Folgendes: M. Satz. Eine Teilmenge A , X ist genau S dann kompakt, wenn zu jeder Familie .V+ /+ 2) offener Teilmengen in X mit A , +2) V+ endlich viele 0` 2 - existieren SL mit: A , `D1 U+` . Eine solche Familie .V+ /+2) wird natürlich wieder als eine offene Überdeckung von A bezeichnet, und die Bedingung des Satzes sagt in dieser Sprechweise genau wie oben: A ist dann und nur dann kompakt, wenn zu jeder offenen Überdeckung von A eine endliche Teilüberdeckung existiert. Beweis von M. Der Grund ist einfach, dass die offenen Mengen in A genau die Durchschnitte von A mit den offenen Mengen von X sind. " Die Kompaktheit einer Teilmenge A , X hängt allein von deren Relativtopologie ab. Bei der Offenheit und Abgeschlossenheit ist dies anders! Dass eine Teilmenge A , X in X offen ist, wird nicht allein durch die Relativtopologie von A bestimmt, sondern hängt wesentlich von der Art und Weise ab, wie A in X positioniert ist. Das erkennt man schon daran, dass jede Teilmenge A , X in A selbst offen ist, während sie in X nicht offen zu sein braucht. Genauso ist jede Teilmenge A , X in A selbst abgeschlossen, aber nicht notwendig in X. N. Beispiele. (i)
Jede endliche Teilmenge A von X ist kompakt.
304
Kapitel 6 Metrische Räume
(ii) Ist eine Folge .ak /k2N in X konvergent mit Grenzwert a D limk!1 ak 2 X, so ist ihre Bildmenge, zusammen mit dem Grenzwert: A ´ fak j k 2 Ng [ fag kompakt. Liegt a nämlich in einer offenen Menge einer Überdeckung, wie in Satz M beschrieben, so liegen in dieser Menge alle ak bis auf endlich viele, und diese liegen ebenfalls in endlich vielen Mengen der Überdeckung (wieder bezogen auf die Indizes). O. Satz. Für A , X gelten folgende Implikationen: (i)
A kompakt H) A beschränkt;
(ii) A kompakt H) A vollständig H) A abgeschlossen. Beweis. Zu (i): Da A von allen Bällen mit Zentrum in A und Radius 1 überdeckt wird, gibt es endlich viele Bälle mit A , B.a1 ; 1/ [ ( ( ( [ B.aL ; 1/. Diese Vereinigung ist beschränkt: Wähle p 2 X irgendwie. Dann gilt der Schluss: x 2 B.ai ; 1/ H) d.x; p/ . d.x; ai / C d.ai ; p/ . 1 C max d.ai ; p/: 1#i #L
Damit liegt auch A im Ball mit Zentrum p und Radius entsprechend dieser Schranke. Zu (ii), erster Pfeil: Das ist Satz L. Zu (ii), zweiter Pfeil: Mittels der Charakterisierung der Abgeschlossenheit aus Satz B läuft der Nachweis so: Ist .ak / eine Folge in A mit limk!1 ak D a 2 X, so ist .ak / Cauchy-Folge in A, also auch Cauchy-Folge in X und damit konvergent in X, also a 2 X. " P. Satz. (i)
Sei X kompakt. Dann sind die kompakten Teilmengen von X genau die abgeschlossenen Teilmengen von X.
(ii) Sei X vollständig. Dann sind die vollständigen Teilmengen von X genau die abgeschlossenen Teilmengen von X . Beweis. Sei A , X. Nach Satz O gilt: A kompakt A abgeschlossen. Es bleibt zu zeigen:
H)
A vollständig
H)
Zu (i): A abgeschlossen H) A kompakt: Sei eine offene Überdeckung von A gegeS S ben: A , + 2) V+ ; V+ offen in X. Dann ist M D .M n A/ [ + 2) V+ eine offene
305
Abschnitt 6.3 Kompaktheit und Vollständigkeit
Überdeckung von X, also gilt mit endlich vielen 0` : X D .X n A/ [ SL SL X D `D1 V+` . In jedem Fall ist A , `D1 V+` .
SL `D1
V+` oder
Zu (ii): A abgeschlossen H) A vollständig: Sei .ak / Cauchy-Folge in A. Dann ist .ak / auch Cauchy-Folge in X , also existiert limk!1 ak D a 2 X, und nach B folgt a 2 A. " Der folgende Satz liefert eine hinreichende Bedingung, um die Kompaktheit von Teilmengen zu erkennen: Q. Satz. Im metrischen Raum X seien alle abgeschlossenen Bälle B.a; r/ kompakt. Dann gilt für jede Teilmenge A , X die Äquivalenz A kompakt () A beschränkt und abgeschlossen: Beweis. Zu H) : Konsequenz von O. Zu (H : Da die Menge A beschränkt ist, liegt sie in einem Ball: A , B.a; r/. Da A und B.a; r/ abgeschlossen sind, ist A auch in B.a; r/ abgeschlossen. Nach Satz P ist dann A kompakt in B.a; r/, also auch in X. (Die Kompaktheit hängt nur von der Relativtopologie ab.) " Die Voraussetzung ist insbesondere für X D R erfüllt; denn die abgeschlossenen Bälle in R sind abgeschlossene Intervalle, und diese sind nach Beispiel D folgenkompakt, also kompakt. So ergibt sich zusammenfassend über R: R. Folgerung. Die reellen Zahlen bilden einen vollständigen metrischen Raum R. Eine Teilmenge A , R ist genau dann kompakt, wenn sie beschränkt und abgeschlossen ist. " Wir formulieren noch zwei Charakterisierungen topologischer Begriffe mittels Folgen, da diese oft als angenehmer empfunden werden als die Kennzeichnungen mittels Umgebungen. Von der reellen Situation her sind beide aus Kapitel 3 bekannt: S. Satz. Seien X, Y metrische Räume, F W A ! Y (A , X) eine Abbildung und a ein Häufungspunkt von A. Dann sind äquivalent: (i) (ii)
lim F .x/ existiert in Y .
x!a
Für jede Folge .xn / in A n fag mit lim xn D a existiert lim F .xn / in Y . n!1
n!1
(iii) Für jede Folge .xn / in A n fag mit lim xn D a existiert lim F .xn / in Y , und n!1 n!1 alle diese Grenzwerte sind gleich.
306
Kapitel 6 Metrische Räume
Ist dies erfüllt, so gilt für jede solche Folge .xn /: lim F .x/ D lim F .xn /:
x!a
n!1
Beweis. Es handelt sich um eine bloße Übersetzung von K[3.2] nach dem Rezept: Ersatz von ju & vj durch d.u; v/. " T. Satz. Sei F W X ! Y eine Abbildung zwischen metrischen Räumen und a 2 X. Dann sind äquivalent: (i)
F ist stetig in a.
(ii) Für jede Folge .xn / in X mit xn ! a in X gilt F .xn / ! F .a/ in Y . Beweis. Auch dies ergibt sich durch Übersetzung aus D[3.3].
"
U. Bemerkung. Auch der Begriff des Häufungswerts aus A[2.7] lässt sich ohne weiteres übertragen: Ein b 2 X heißt Häufungswert der Folge .xn / in X, wenn diese eine Teilfolge .x'.k/ / mit limk!1 x'.k/ D b besitzt. Die Definition C lautet damit äquivalent: Der Raum X ist folgenkompakt, wenn jede Folge in X einen Häufungswert in X hat. $ Vervollständigung und Kompaktifizierung Wenn ein metrischer Raum X nicht vollständig ist, so kennt man ein Standardverfahren zur Vervollständigung, d.h. man kann dem Raum auf kanonische Weise Punkte hinzufügen, so dass der entstehende größere Raum vollständig wird. Dazu betrachtet man die Cauchy-Folgen in X als neue selbständige Objekte und baut mit diesen auf folgende Weise einen neuen Raum auf: Zunächst nennt man zwei Cauchy-Folgen , D .xn / und 1 D .yn / äquivalent, wenn die Folge der Distanzen .d.xn ; yn // eine Nullfolge ist. Diese Relation C ist wirklich eine Äquivalenzrelation. Sodann bildet man die Quotientenmenge Xv ´ X=C, also die Gesamtheit aller Äquivalenzklassen von Cauchy-Folgen unter der Relation C. Die Quotientenmenge wird selbst zu einem metrischen Raum, wenn man die Distanz zweier Elemente &.,/, &.1/ 2 Xv durch d.&.,/; &.1// ´ limn!1 d.xn ; yn / definiert (& die kanonische Projektion von X auf Xv ). Dieser Grenzwert existiert in R und erweist sich als unabhängig von den gewählten Repräsentanten. Das wichtigste ist jedoch, dass der neue metrische Raum Xv vollständig ist. Die Punkte des Ausgangsraums X können als Elemente von Xv aufgefasst werden, indem jedem x 2 X die konstante Folge xn D x zugeordnet wird. Insgesamt kommt bei dieser Konstruktion heraus, dass X zu einem dichten metrische Unterraum des vollständigen metrische Raums Xv wird. Dieser Plan soll in Analysis 2 ausgeführt werden. Nach ähnlichem Muster kann auch der Körper der rationalen Zahlen konstruktiv zum Körper der reellen Zahlen erweitert werden.
Abschnitt 6.3 Kompaktheit und Vollständigkeit
307
Bei der analogen Frage der Kompaktifizierung gibt es keine so klare, allgemeine Antwort. Auch hier ist das Ziel natürlich, zu einem nichtkompakten Raum X einen größeren Raum Xk zu finden, der einerseits kompakt ist und andererseits den gegebenen Raum als dichte Teilmenge enthält. Das kann auf viele Arten geschehen, was davon abhängt, wie groß der erweiterte Raum sein soll. Außerdem ist man möglicherweise gezwungen, die Metrik (äquivalent) abzuändern, d.h. X wird eventuell kein metrischer Unterraum von Xk sein können. Dies kann hier nicht in voller Allgemeinheit diskutiert werden. Konkrete Fälle sind demgegenüber sehr gut zu beschreiben, z.B. der Schritt von den reellen Zahlen R zur erweiterten reellen Achse R durch die Hinzunahme zweier uneigentlicher Elemente ˙1, wie in Q[6.2] ausgeführt: Nach Übergang zu einer äquivalenten Metrik auf R wurde R zu einem metrischen Unterraum von R, der in R dicht ist. Da R sich als homöomorph zum kompakten reellen Intervall Œ&1; 1/ erwiesen hat, ist R selbst kompakt. Denn unter Homöomorphismen bleibt die Kompaktheit erhalten, wie man unmittelbar an der Heine/Borel-Charakterisierung der Kompaktheit sehen kann. Aus R entsteht somit durch Hinzunahme zweier neuer Punkte ˙1 ein kompakter Raum R, der R als dichte Menge enthält, wobei R zwar die Relativtopologie von R trägt, aber bzgl. der Standard-Metrik nicht metrischer Unterraum von R ist. Man nennt R die Zweipunktkompaktifizierung von R. Diese hat hier den zusätzlichen Vorteil, dass Ordnungsrelationen erhalten bleiben. Es gibt auch Einpunktkompaktifizierungen, bei denen nur ein einziges uneigentliches Element hinzugefügt wir. Diese sind für den Körper R nicht ganz so üblich wie die eben besprochene Zweipunktkompaktifizierung, werden jedoch standardmäßig für den Körper der komplexen Zahlen gebraucht. Wir kommen hierauf am Ende der Abschnitte 6.4 und 7.3 zurück. Aufgaben und Anmerkungen 1. Man zeige, dass die Vereinigung endliche vieler bzw. der Durchschnitt beliebig vieler kompakter Teilmengen eines metrischen Raumes wieder kompakt ist. 2. Sei X ein metrischer Raum. In der Situation A , B , X beweise man durch direktes Zurückgehen auf die Definition die Äquivalenz: A kompakt in B () A kompakt in X . 3. Sei X ein kompakter metrischer Raum. Man beweise für jede Teilmenge A , X die Äquivalenzen: A abgeschlossen () A kompakt () A vollständig. 4. Sei X ein metrischer Raum und A , X. Man beweise die nachstehenden Folgencharakterisierungen: a) Ein Punkt a 2 X ist dann und nur dann Häufungspunkt von A, wenn es eine Folge .an / in A n fag mit a D lim an gibt. n!1
308
Kapitel 6 Metrische Räume
b) Der Abschluss A besteht aus allen Punkten a 2 X, zu denen es eine Folge .an / in A mit a D lim an gibt. n!1
5. Man gebe ein Beispiel für einen metrischen Raum, in dem ein abgeschlossener Ball existiert, der nicht kompakt ist. 6. Man beweise: Der metrische Raum X ist dann nur dann kompakt, wenn jede absteigende Folge abgeschlossener nichtleerer Teilmengen A1 - A2 - A3 - ( ( ( von X einen nichtleeren Durchschnitt besitzt. 7. Sei .X; d / ein metrischer Raum. Für eine beschränkte, nichtleere Teilmenge A , X wird der Durchmesser diam.A/ definiert als diam.A/ ´ sup fd.x; y/ j x; y 2 M g. Für unbeschränktes A , X setzt man diam.A/ ´ 1. Sei A1 - A2 - A3 - ( ( ( eine absteigende Folge kompakter nichtleerer Teilmengen von X mit T1 limk!1 diam.Ak / D 0. Man zeige: Der Durchschnitt kD1 Ak besteht aus genau einem Punkt (vgl. Aufgabe 6). Dies verallgemeinert das Intervallschachtelungsprinzip B[2.3] auf metrische Räume. 8. Man beweise die so genannte Lebesgue-Eigenschaft: Sei .U+ /+2) eine offene Überdeckung des kompakten metrischen Raumes X. Dann existiert eine Zahl ˛ > 0, sodass jeder offene Ball vom Radius ˛ in wenigstens einem U+ enthalten ist. 9. Man beweise das so genannte Injektivitätslemma: Sei F W X ! Y eine stetige Abbildung zwischen metrischen Räumen und A eine kompakte Teilmenge von X. Weiter sei die Restriktion F jA injektiv, und es gebe zu jedem Punkt a 2 A eine Umgebung Va WD U.a; "a / derart, dass die Restriktion F jVa injektiv ist. Dann existiert eine offene Obermenge U von A, sodass die Restriktion F jU injektiv ist. 10. Man zeige, dass es keine Metrik auf der erweiterten reellen Achse R geben kann, sodass R mit der Standard-Metrik ein metrischer Unterraum von R ist. Bei der Erweiterung von R zu R in Q[6.2] musste man also die Standard-Metrik „verbiegen“. 11. Man beweise: Zwei Metriken d und d1 auf der Menge X sind dann und nur dann äquivalent, wenn für alle Folgen .an / in X und alle a 2 X gilt: d.an ; a/ &! 0 () d1 .an ; a/ &! 0; d.h. wenn die Folgenkonvergenz bzgl. d äquivalent ist mit der Folgenkonvergenz bzgl. d1 . 12. Man zeige: a) Die Kompaktheit ist ein topologischer Begriff, d.h. ist F W X ! Y ein Homöomorphismus zwischen metrischen Räumen und ist X kompakt, so ist auch Y kompakt. (Dies wird in Satz A[6.5] noch verbessert.) b) Die Vollständigkeit ist kein topologischer Begriff, d.h. ist F W X ! Y ein Homöomorphismus zwischen metrischen Räumen und ist X vollständig, so braucht Y nicht vollständig zu sein.
Abschnitt 6.4 Kartesische Produkte
309
Lösungshinweis zu b): Betrachte R und J ´ /&1; 1Œ (beide mit der Standard-Metrik) sowie die topologische Abbildung F W R ! J mit F .x/ ´ x=.1 C jxj/. Dann ist R vollständig, nicht aber F .R/ D J . Z.B. ist xn ´ 1 & .1=n/ eine Cauchy-Folge in J , die aber in J nicht konvergiert. 13. Man zeige in Verallgemeinerung von Lemma G[2.6]: Besitzt eine Cauchy-Folge .an / in einem metrischen Raum X eine konvergente Teilfolge .a'.k/ /, so ist sie selbst konvergent (mit dem gleichen Grenzwert). 14. $ Sei n % 3 eine natürliche Zahl. Man konstruiere einen nichtkompakten metrischen Raum, der durch Hinzunahme von genau n paarweise verschiedenen neuen Elementen zu einem kompakten Raum wird (n-Punkt-Kompaktifizierung). Lösungshinweis: Man nehme n paarweise verschiedene und abgeschlossene Halbgeraden in R2 , die vom Ursprung 0 ausgehen.
6.4 Kartesische Produkte Mit kartesischen Produkten kann man aus gegebenen Räumen auf natürliche Weise neue „höherdimensionale“ Räume erzeugen. Die höhere Dimension ist so zu verstehen, dass die Elemente der Ausgangsräume die Rolle von „Koordinaten“ in einem kartesischen Produkt spielen. Aus der linearen Algebra weiß man z.B., dass der ndimensionale Raum Rn das kartesische Produkt von n Exemplaren der reellen Zahlen R ist. Demgemäß haben die Elemente von Rn , die n-Tupel, jeweils n Koordinaten aus R. Bei einem allgemeinen kartesischen Produkt dürfen allerdings die Koordinaten aus verschiedenen Räumen stammen. Wir behandeln hier kartesische Produkte aus zwei (bzw. endlich vielen) Faktoren. Die Symbole X; X1 ; X2 ; Y; : : : bezeichnen wieder metrische Räume. Es sei daran erinnert, dass das kartesische Produkt X1 )X2 als Menge aus allen Paaren .x1 ; x2 / mit x1 2 X1 und x2 2 X2 besteht. Solche Paare schreiben wir als x D .x1 ; x2 /, y D .y1 ; y2 /, usw. Beim kartesischen Produkt X1 ) X2 bezeichnet man X1 und X2 auch als die Faktoren. Es geht nun darum, solch ein kartesisches Produkt mit einer Metrik zu versehen: A. Satz und Definition. Sind .X1 ; d1 /; .X2 ; d2 / metrische Räume, so ist durch d.x; y/ D d..x1 ; x2 /; .y1 ; y2 // ´ max fd1 .x1 ; y1 /; d2 .x2 ; y2 /g: eine Metrik auf X1 ) X2 definiert. Man nennt d die Maximumsmetrik für X1 ) X2 .
310
Kapitel 6 Metrische Räume
Beweis. Zu den Metrikaxiomen (D.1) – (D.3): Diese sind für das so definierte d unmittelbar klar. Zum Metrikaxiom (D.4): Mit z D .z1 ; z2 / 2 X1 ) X2 hat man für i D 1; 2: di .xi ; zi / . di .xi ; yi / C di .yi ; zi / . d.x; y/ C d.y; z/: Aus Anfang und Ende dieser Kette folgt d.x; z/ . d.x; y/ C d.y; z/.
"
Konvention: Wenn nichts anderes gesagt wird, soll das kartesische Produkt X1 ) X2 stets mit der Maximumsmetrik versehen sein. Wir formulieren sogleich, was diese Metrik für die Konvergenz von Paaren bedeutet. B. Lemma (koordinatenweise Konvergenz). Für eine Folge von Paaren .ak ; bk / in X1 ) X2 und ein Paar .a; b/ in X1 ) X2 gilt genau dann limk!1 .ak ; bk / D .a; b/, wenn limk!1 ak D a und limk!1 bk D b gilt. Beweis. Dies ist unmittelbar klar aus der Gleichung d..ak ; bk /; .a; b// D max fd1 .ak ; a/; d2 .bk ; b/g und der Definition der Folgenkonvergenz in A[6.3].
"
Schreibweise: Für eine Abbildung in ein kartesisches Produkt hinein schreibt man: F W X &! X1 ) X2 x 7&! F .x/ µ .F1 .x/; F2 .x//
kurz
F D .F1 ; F2 /:
F1 W X ! X1 und F2 W X ! X2 sind dann die erste und zweite Komponentenfunktion oder Komponente von F . C. Lemma. Für Abbildungen in kartesische Produkte hinein gilt: F W X &! X1 )X2 ist dann und nur dann stetig in a 2 X , wenn beide Komponentenfunktionen F1 W X ! X1 und F2 W X ! X2 in a stetig sind. Beweis. Auch dies ist unmittelbar klar aus der Gleichung d.F .x/; F .a// D max fd1 .F1 .x/; F1 .a//; d2 .F2 .x/; F2 .a//g und der Definition der Stetigkeit in B[6.2].
"
Warnung: Für Abbildungen aus kartesischen Produkten heraus geht das nicht so glatt!
311
Abschnitt 6.4 Kartesische Produkte
D. Beispiel. Wir betrachten die Abbildung
f W R ) R &! R;
8 < 2xy f .x; y/ ´ x 2 C y 2 : 0
für .x; y/ ¤ .0; 0/ für .x; y/ D .0; 0/.
Dann ist bei jedem festen y die Abbildung x 7! f .x; y/ stetig; denn für y ¤ 0 ist der auftretende Nenner ¤ 0, und für y D 0 ist diese Abbildung konstant D 0. Ebenso ist bei jedem festen x die Abbildung y 7! f .x; y/ stetig.
z
y
x
Aber f selbst ist unstetig in .0; 0/; denn die Vorschaltung der stetigen Abbildung x 7! .x; x/ liefert die Abbildung x 7&! f .x; x/ D
2x 2 D 1 für x ¤ 0; 2x 2
0 7&! f .0; 0/ D 0;
und diese ist in x D 0 offensichtlich unstetig: Die Stetigkeit in jeweils einer Veränderlichen garantiert nicht die stetige Abhängigkeit vom Paar der Veränderlichen! (Etwas Ähnliches werden wir später bei der Differenzierbarkeit konstatieren.) Bei der Graphendarstellung (bei der die Funktionswerte z D f .x; y/ senkrecht nach oben über der .x; y/-Ebene aufgetragen werden) entsteht „über der Diagonalen“ in der .x; y/-Ebene eine „Straße“ auf der Fläche in der konstanten Höhe 1, die in .0; 0/ durch den Funktionswert 0 unstetig unterbrochen ist. Analog, wenn x 7! .x; &x/ vorgeschaltet wird (mit &1 als Höhe).
312
Kapitel 6 Metrische Räume
E. Lemma. Die erste und zweite Projektion P1 W X1 ) X2 &! X1
P2 W X1 ) X2 &! X2
.x1 ; x2 / 7&! x1
.x1 ; x2 / 7&! x2
sind Lipschitz-stetig, ebenso die kanonischen Injektionen J1 W X1 &! X1 ) X2
J2 W X2 &! X1 ) X2
x1 7&! .x1 ; a2 /
x2 7&! .a1 ; x2 /;
wobei a2 2 X2 bzw. a1 2 X1 jeweils fest sind. (Als Lipschitz-Konstante ist in allen vier Fällen die Eins möglich.) Beweis. Auch dies folgt direkt aus der Definition der Maximumsmetrik in A.
"
F . Beispiel. Als ganz konkrete Beispiele für Abbildungen aus einem kartesischen Produkt heraus betrachten wir für R die Körperoperationen „Summe“, „Produkt“ und „Quotient“: s W R ) R ! R, p W R ) R ! R, q W R ) .R n f0g/ ! R mit s.x; y/ ´ x C y;
p.x; y/ ´ xy;
q.x; y/ ´
x : y
Alle drei Abbildungen sind stetig: Bei s und p folgt dies aus den nachstehenden Vorausabschätzungen, bei denen zur Abkürzung + WD d..x; y/; .a; b// D max fjx & aj; jy & bjg gesetzt ist: js.x; y/ & s.a; b/j D j.x C y/ & .a C b/j . jx & aj C jy & bj . 2+ jp.x; y/ & p.a; b/j D jxy & abj D j.x & a/b C .y & b/a C .x & a/.y & b/j . .jaj C jbj/+ C +2 : Bei q genügt wegen der Stetigkeit von p der Nachweis, dass R.x; y/ ´ 1=y auf R ) .R n f0g stetig ist. Dies folgt aber aus der Vorausabschätzung ˇ ˇ ˇ1 1ˇ jy & bj 1 + 1 1 ˇ ˇ. jR.x; y/ & R.a; b/j D ˇ & ˇˇ D (ˇ ( für + . jbj: 2 2 ˇ ˇ 1 y b b b 2 ˇ1 C y & b ˇ ˇ 2 b ˇ Wir haben gerade in Beispiel D gesehen, dass eine Abbildung aus einem kartesischen Produkt heraus unstetig sein kann, obwohl die Abhängigkeit von jeder einzelnen Veränderlichen (bei Festhaltung der anderen) immer stetig ist. Die umgekehrte Richtung ist jedoch in Ordnung:
313
Abschnitt 6.4 Kartesische Produkte
G. Lemma. Für Abbildungen aus kartesischen Produkten heraus gilt: Ist F W X1 ) X2 ! Y stetig und a D .a1 ; a2 / 2 X1 ) X2 fest, so ist die partielle Funktion x1 7! F .x1 ; a2 / von X1 in Y in a1 und die partielle Funktion x2 7! F .a1 ; x2 / von X2 in Y in a2 stetig. Beweis. Die erstgenannte partielle Abbildung ist einfach die Komposition von F mit der kanonischen Injektion x1 7! .x1 ; a2 /, also mit dieser in a1 stetig. Analog für die zweitgenannte partielle Abbildung. " Kompaktheit und Vollständigkeit vererben sich auf das kartesische Produkt X1 ) X2 : H. Satz. (i)
Sind X1 ; X2 kompakt, so ist auch X1 )X2 kompakt (kleiner Satz von Tychonoff).
(ii) Sind X1 ; X2 vollständig, so ist auch X1 ) X2 vollständig. Beweis. Zu (i): Wir zeigen dies in der Variante „folgenkompakt“ (was ja nach J[6.3] mit „kompakt“ äquivalent ist): Sei ..ak ; bk // eine Folge in X1 ) X2 . Dann existiert eine konvergente Teilfolge a'.k/ ! a in X1 und dafür eine Teilfolge b'...k// ! b in X2 . Sodann konvergiert auch a'...k// ! a in X1 . Nach Lemma B ergibt sich: .a'...k// ; b'...k// / ! .a; b/ in X1 ) X2 . Zu (ii): Sei ..ak ; bk // eine Cauchy-Folge in X1 ) X2 . Nach Definition der Maximumsmetrik ist dann .ak / eine Cauchy-Folge in X1 und .bk / eine Cauchy-Folge in X2 . Nach Voraussetzung sind konvergent: ak ! a in X1 und bk ! b in X2 , also besteht nach Lemma B die Konvergenz .ak ; bk / ! .a; b/ in X1 ) X2 . " Die bisherigen Überlegungen gelten analog für kartesische Produkte X1 ) ( ( ( ) XL aus endlich vielen Faktoren anstelle von zweien (es ist nur etwas mehr Schreibarbeit erforderlich). Der Übergang zu beliebig vielen Faktoren wird hier nicht vollzogen. Der eigentliche Satz von Tychonoff bezieht sich gerade auf diesen allgemeinen Fall (Formulierung und Beweis sind dann komplizierter). I. Beispiel. Der n-dimensionalen reelle Raum Rn ist aus der linearen Algebra bekannt. Er besteht aus allen n-Tupeln reeller Zahlen x D .x1 ; : : : ; xn /;
xi 2 R für i D 1; : : : ; n;
ist also das kartesische Produkt Rn D R ) ( ( ( ) R. Wir setzen als bekannt voraus, dass man n-Tupel komponentenweise addieren und mit reellen Zahlen multiplizieren kann: x D .x1 ; : : : ; xn / x C y D .x1 C y1 ; : : : ; xn C yn / H) y D .y1 ; : : : ; yn / * ( x D .* ( x1 ; : : : ; * ( xn /
314
Kapitel 6 Metrische Räume
und dass diese Operationen den Rechenregeln eines reellen Vektorraums genügen. Rn wird nun mit der zugehörigen Maximumsmetrik ausgestattet: dm .x; y/ ´ max fjx1 & y1 j; : : : ; jxn & yn jg ; und wird dadurch zu einem metrischen Raum. Wir wollen diskutieren, wie die Grundelemente (Bälle, Sphären, usw.) hier aussehen, und daraus einige Konsequenzen für den metrischen Raum .Rn ; dm / ziehen. Ein Ball ist bei dieser Metrik ein kartesisches Produkt von Intervallen: Ist a D .a1 ; : : : ; an / das Zentrum, so gilt z.B. im abgeschlossenen Fall
x 2 B.a; r/ () dm .x; a/ . r () jxi & ai j . r
8 i 2 f1; : : : ; ng
() xi 2 Œai & r; ai C r/
r
8 i 2 f1; : : : ; ng;
a
a2 r r
r a1
also (1)
B.a; r/ D Œa1 & r; a1 C r/ ) ( ( ( ) Œan & r; an C r/:
Genauso sieht man im offenen Fall (2)
B.a; r/ D /a1 & r; a1 C rŒ ) ( ( ( ) /an & r; an C rŒ :
Das hat einige Konsequenzen für den Raum .Rn ; dm /: (i) Jeder Ball B.a; r/ * Rn ist kompakt: Folgerung aus dem kleinen Satz von Tychonoff H(i). (ii) Eine Teilmenge von Rn ist genau dann kompakt, wenn sie beschränkt und abgeschlossen ist: Folgerung aus (i) und Q[6.3].
315
Abschnitt 6.4 Kartesische Produkte
(iii) Jede Sphäre S.a; r/ * Rn ist kompakt. Denn sie ist beschränkt und abgeschlossen; vgl. K(i)[6.2]. (iv)
Rn ist vollständig: Folgerung aus H(ii).
(v) Es gilt B.a; r/ D B.a; r/: Nach (5)[6.1] ist eine Inklusion immer richtig, nämlich B.a; r/ , B.a; r/. Zu beweisen ist also: B.a; r/ , B.a; r/, d.h. S.a; r/ , B.a; r/. Also hat man letztlich zu zeigen: Jedes p 2 S.a; r/ ist Häufungspunkt von B.a; r/. Dazu „marschiert“ man radial vom Zentrum zum gegebenen Sphärenpunkt; vgl. folgendes Bild: p pk a
S(a,r)
B(a,r)
Präzise: Zu p 2 S.a; r/ sei eine Folge .pk /k2N in Rn definiert durch pk ´ p &
1 .p & a/: k
Dann bestehen folgende Schlüsse / . / . / . 1 1 1 .p & a/ ) dm .pk ; a/ D 1 & dm .p; a/ D 1 & r pk & a D 1 & k k k ) pk 2 B.a; r/; p & pk D
1 1 1 .p & a/ ) dm .pk ; p/ D dm .p; a/ D r k k k ) pk ¤ p; pk &! p:
Aus den Resultaten dieser zwei Zeilen folgt, dass p Häufungspunkt von B.a; r/ ist. (vi)
Damit gilt auch @B.a; r/ D S.a; r/: Denn man hat @B.a; r/ D B.a; r/ n B.a; r/ı D B.a; r/ n B.a; r/ D S.a; r/:
(vii) Jede offene nichtleere Teilmenge A , Rn enthält einen Punkt mit rationalen Koordinaten: Zu einem festen Punkt a 2 A sei nämlich ein Ball B.a; r/ , A gewählt. B.a; r/ ist ein kartesisches Produkt von offenen nichtleeren Intervallen der Gestalt (2). In jedem Intervall /ai & r; ai C rŒ gibt es eine rationale Zahl ri . Somit gilt .r1 ; : : : ; rn / 2 B.a; r/ , A.
316
Kapitel 6 Metrische Räume
$ Einpunktkompaktifizierung von R Wir hatten in Q[6.2] die erweiterte reelle Achse R D R [ f1; &1g als einen metrischen Raum erkannt, der zum Intervall Œ&1; 1/ homöomorph ist, wobei die Endpunkte &1 und 1 den beiden Unendlichs &1 und 1 entsprechen. Am Ende von Abschnitt 6.3 hat sich dann gezeigt, dass R eine so genannte Zweipunktkompaktifizierung von R ist, in der R selbst dicht liegt. Man kann die reellen Zahlen aber auch durch Hinzunahme eines uneigentlichen Elements 1 kompaktifizieren: b R ´ R [ f1g; wobei das neue 1 als verschieden von dem bisherigen in R gelten soll. Diese Einpunktkompaktifizierung ist zwar bei den reellen Zahlen etwas unüblich, kann aber als Muster für die später erfolgende Einpunktkompaktifizierung der komplexen Zahlen dienen. Für R geht dies so: Man betrachtet (wieder einmal) die rationale Parametrisierung der punktierten Kreislinie S1 n f.&1; 0/g, wie in N[4.4] beschrieben. Diese definiert eine bijektive Abbildung (3)
F W R &! S1 n f.&1; 0/g
. mit
F .t/ ´
2t 1 & t2 ; 1 C t2 1 C t2
/ :
Bezeichnet d die Euklidische Standard-Metrik auf R2 , so definiert man eine so genannte chordale Metrik dc auf R durch (4)
dc .t; s/ ´ d.F .t/; F .s//;
d.h. dc ist die von F auf R induzierte Metrik. Anschaulich ist dc .t; s/ der Euklidische Abstand der beiden Punkte F .t/; F .s/ auf der Einheitskreislinie, d.h. die Länge der Sehne zwischen diesen beiden Punkten; vgl. das Bild bei N[4.4]. Aus (3) und (4) berechnet man explizit die chordale Metrik auf R als dc .t; s/ ´ p
2jt & sj p 1 C t 2 1 C s2
für t; s 2 R. Die Abbildung F W R &! S1 n f.&1; 0/g ist ein Homöomorphismus. Denn sie ist zunächst bijektiv und stetig (ausweislich der Formel in (3)), aber auch die Umkehrabbildung ist stetig; denn diese wird nach N[4.4] gegeben durch die Restriktion von y .x; y/ 7! 1Cx auf S1 n f.&1; 0/g. Daraus folgt nach P[6.2], dass dc zur Standard-Metrik auf R äquivalent ist.
317
Abschnitt 6.4 Kartesische Produkte
Nun kommt der entscheidende Schritt: Der bisher ausgelassene Punkt .&1; 0/ auf S1 wird jetzt mitbetrachtet, und als sein Urbild unter F wird das neue uneigentliche Element 1 zu R hinzugefügt. Man setzt somit, F und dc erweiternd: F .1/ ´ .&1; 0/ 2 ; dc .t; 1/ ´ d.F .t/; .&1; 0// D p 1 C t2
dc .1; 1/ ´ d..&1; 0/; .&1; 0// D 0;
wobei das vorvorletzte Gleichheitszeichen durch Rechnung mittels (3) zustande R D R [ f1g (mit kommt. Also vermittelt F insgesamt eine Isometrie zwischen b 1 Metrik dc ) und S (mit Metrik d ). Erst recht ist F ein Homöomorphismus von b R auf S1 . Da S1 kompakt ist und S1 n f.&1; 0/g als dichte Teilmenge enthält, trifft das Gleiche für die Urbilder zu: b R ist kompakt und R liegt dicht in b R. Aufgaben und Anmerkungen 1. Man zeige, für die Körperoperationen in R, wie in Beispiel F definiert: a) Die Summe s ist auf ganz R ) R Lipschitz-stetig. b) Produkt und Quotient p und q sind auf jeder kompakten Teilmenge ihrer Definitionsmenge Lipschitz-stetig. 2. Für eine Teilmenge A eines metrischen Raumes X gilt stets A , A, also Aı , .A/ı , jedoch i. Allg. nicht: Aı D .A/ı . a) Man gebe eine Beispiel für eine Teilmenge A * Rn mit Aı * .A/ı . b) Für Bälle B.a; r/ * Rn zeige man, dass stets gilt: B.a; r/ı D . B.a; r/ /ı und deduziere hieraus: @B.a; r/ D S.a; r/. 3. Für eine Teilmenge A eines metrischen Raumes X gilt stets Aı , A, also Aı , A jedoch i. Allg. nicht: Aı D A. Man gebe eine Beispiel für eine Teilmenge A * Rn mit Aı * A. 4. Man zeige für die Maximumsmetrik in X1 ) X1 : B.a1 ; r/ ) B.a2 ; r/ D B..a1 ; a2 /; r/ für a1 2 X1 , a2 2 X2 . 5. Seien A1 , X1 ; A2 , X2 , A , X1 ) X2 . Man beweise: a) Ist A1 offen in X1 und A2 offen in X2 , so ist A1 ) A2 offen in X1 ) X2 . b) A1 ) A2 D A1 ) A2 . c) @.A1 ) A2 / D .A1 ) @A2 / [ .@A1 ) A2 /. d) Ist A offen in X1 ) X2 , so ist P1 .A/ offen in X1 und P2 .A/ offen in X2 .
318
Kapitel 6 Metrische Räume
6. Sind F1 W X1 ! Y1 und F2 W X2 ! Y2 zwei Abbildungen (X1 ; X2 ; Y1 ; Y2 metrische Räume), so ist deren kartesisches Produkt definiert als F1 ) F2 W X1 ) X2 ! Y1 ) Y2 mit .F1 ) F2 /.x1 ; x2 / ´ .F1 .x1 /; F2 .x2 //: Man zeige: F1 ) F2 D .F1 ı P1 ; F2 ı P2 /. Dies reduziert die Stetigkeit dieser neuen Abbildung auf die Lemmata C und E.
6.5 Gleichmäßigkeit Hierbei geht es um Grenzübergänge, in denen „Parameter“ auftauchen, d.h. zusätzliche Variablen. Man möchte klären, wann die „Güte“ der Approximation gleichmäßig ist, d.h. unabhängig von den Parametern. Solche Gleichmäßigkeitsbegriffe haben wir schon in konkreten Situationen kennengelernt, nämlich die gleichmäßige Stetigkeit bei der Einführung des Integrals in E[5.1] und die gleichmäßige Konvergenz beim Grenzübergang „unter dem Integralzeichen“ in E[5.5]. Jetzt werden diese Eigenschaften einheitlich zusammengefasst, wobei weitere interessante Aussagen herauskommen, z.B. ein allgemeines Extremalprinzip. Die Symbole X; Y; : : : bezeichnen wieder metrische Räume. Gleichmäßige Stetigkeit und das allgemeine Extremalprinzip Bei der Stetigkeit einer Abbildung F W X ! Y ist der Parameter die Stelle. Wir hatten dies bereits in F[6.2] formuliert: Gleichmäßige Stetigkeit war demnach die Forderung: 8 " > 0 9 ı > 0 W d.x1 ; x2 / < ı H) d.F .x1 /; F .x2 // < ": Natürlich impliziert die gleichmäßige Stetigkeit die Stetigkeit. Das Ziel ist jetzt die Umkehrung, natürlich unter Zusatzvoraussetzungen (Satz F). Auf dem Weg dahin liegen einige Aussagen, die auch für sich genommen wertvoll sind. A. Satz. Ist F W X ! Y stetig und X kompakt, so ist auch F .X/ kompakt. Beweis. Sei eine offene Überdeckung von F .X/ gegeben: [ F .X/ , V ; V+ alle offen in Y : + 2) + Durch Übergang zum Urbild folgt: - [ 3[ X D F &1 V D F &1 .V+ /; + + 2) + 2)
319
Abschnitt 6.5 Gleichmäßigkeit
wobei die F &1 .V+ / offen in X sind (G[6.2]). Da X kompakt ist, existiert eine endliche SL Teilüberdeckung X D `D1 F &1 .V+` /, also erhält man durch Übergang zum Bild SL eine endliche Teilüberdeckung F .X/ , `D1 V+` . " B. Folgerung. Ist F W X ! Y stetig und bijektiv sowie X kompakt, so ist auch F &1 W Y ! X stetig (und Y kompakt). Beweis. Die Kompaktheit von Y D F .X/ ist klar aus A. Nach G(iii)[6.2] ist zu zeigen: C abgeschlossen in X H) .F &1 /&1 .C / abgeschlossen in Y , also äquivalent, da F bijektiv ist: C abgeschlossen in X H) F .C / abgeschlossen in Y : Dies geht auf dem Weg über die Kompaktheit so: C , X abg.
P(i)[6.3] P(i)[6.3] A H) C kompakt H) F .C / kompakt H) F .C / , Y: abg.
Warum man nicht direkt über die Abgeschlossenheit folgern kann, wird gleich erklärt. " C. Beispiel. In diesem Beweis ist der Weg über die Kompaktheit nicht zu vermeiden, weil die Abgeschlossenheit unter stetigen (bijektiven) Abbildungen i. Allg. nicht erhalten bleibt. Ein Beispiel ist die Funktion f W X ! Y mit X ´ Œ&1; 0/ [ Œ1; 2Œ, Y ´ Œ&1; 1/ und ( x C 1; x 2 Œ&1; 0/ f .x/ ´ x & 2; x 2 Œ1; 2Œ : f ist bijektiv und stetig. Das Intervall Œ1; 2Œ ist abgeschlossen in X (!) aber f .Œ1; 2Œ/ D Œ&1; 0Œ ist nicht abgeschlossen in Y , und f &1 W Y ! X ist unstetig in 0. D. Folgerung (allgemeines Extremalprinzip). Sei f W X ! R stetig und X kompakt. Dann werden inf f .X/ und sup f .X/ als Funktionswerte angenommen. D.h. es existieren Extremalstellen x0 ; x1 aus X und die Extrema f .x0 / D inf f .X/ D min f; X
f .x1 / D sup f .X/ D max f: X
Beweis. f .X/ ist nach Satz A kompakte Teilmenge von R, also nach R[6.3] beschränkt und abgeschlossen. Aus „beschränkt“ folgt: inf f .X/; sup f .X/ 2 R. Aus „abgeschlossen“ folgt: inf f .X /; sup f .X/ 2 f .X/; denn Infimum und Supremum sind generell Elemente oder Häufungspunkte der jeweiligen Menge; vgl. C(iii)[3.2]. " Hinweis: Dies ist eines der wirkungsvollsten allgemeinen Prinzipien!
320
Kapitel 6 Metrische Räume
E. Lemma. Für jeden metrischen Raum .X; d / ist die Funktion d W X ) X ! R Lipschitz-stetig, also gleichmäßig stetig. Beweis. Für .x; y/ 2 X ) X und .a; b/ 2 X ) X kann man abschätzen: jd.x; y/ & d.a; b/j D jd.x; y/ & d.a; y/ C d.a; y/ & d.a; b/j . jd.x; y/ & d.a; y/j C jd.a; y/ & d.a; b/j . d.x; a/ C d.y; b/
(B[6.1])
. 2 ( max fd.x; a/; d.y; b/g D 2 ( d..x; y/; .a; b//: Eine Lipschitz-Konstante für d ist somit 2.
"
F. Folgerung. Ist F W X ! Y stetig und X kompakt, so ist F gleichmäßig stetig. Beweis. Wir betrachten zu gegebenem " > 0 die Größe ı."/ ´ min fd.x; y/ j d.F .x/; F .y// % "g > 0: Das Minimum existiert: Sei nämlich die Funktion f W X ) X ! R definiert durch f .x; y/ ´ d.F .x/; F .y//. Diese ist stetig, da sie Komposition stetiger Abbildungen ist. Man schreibt dazu f .x; y/ D d.F .P1 .x; y//; F .P2 .x; y/// und wendet E[6.4] und Lemma E an. Dann ist die Menge A ´ f.x; y/ 2 X ) X j f .x; y/ % "g abgeschlossen, also kompakt; vgl. H[6.2] und P(i)[6.3]. Schließlich ist d auf X ) X stetig, also auch auf A ) A. Damit wird Folgerung D anwendbar. Hiernach gilt: d.F .x/; F .y// % " H) d.x; y/ % ı."/; also d.x; y/ < ı."/ H) d.F .x/; F .y// < "; und das ist gerade der Test für die gleichmäßige Stetigkeit.
"
Schon bei den reellen Funktionen einer Veränderlichen hatten wir den Begriff des Stetigkeitsmoduls eingeführt. Dieser hat eine sehr nützliche Funktion bei Abschätzungen, z.B. konnte mit seiner Hilfe der Unterschied zwischen einem bestimmten Integral und den zugehörigen Riemann-Summen eingegrenzt werden, ohne die Epsilontik zu bemühen. Vgl. N[5.1] und P[5.1]. Die allgemeine Definition folgt genau dem damaligen konkreten Muster und auch die Grundeigenschaften ergeben sich ganz analog: G. Definition und Satz. Die Abbildung F W X ! Y sei stetig. Zu jedem 1 > 0 ist der Stetigkeitsmodul definiert als ˇ , ˚ x 2 X; d.x; e x // < 1 !F .1/ ´ sup d.F .x/; F .e x // ˇ x; e (er kann 1 sein). Es gilt dann:
321
Abschnitt 6.5 Gleichmäßigkeit
(i)
Für 0 < 11 . 12 gilt !F .11 / . !F .12 /, d.h. !F ist monoton wachsend.
(ii) Die Abbildung F ist genau dann gleichmäßig stetig, wenn lim !F .1/ D 0 ,!0
gilt.
"
Gleichmäßige Konvergenz Wir betrachten nun eine Folge .Fk / von Abbildungen, d.h. für jedes k 2 N sei eine Abbildung gegeben: Fk W M &! Y; x 7&! Fk .x/: Dabei darf M eine beliebige Menge sein (nicht notwendig metrischer Raum). Der Parameter für die Konvergenz der Folge Fk .x/ ist hier wiederum die Stelle x 2 M . D.h. man fragt, ob die Güte der Annäherung an den Grenzwert für k ! 1 unabhängig von x 2 M sein kann. Die folgende Definition wiederholt wörtlich die konkrete Fassung aus A[5.5], nur dass jetzt alles an die allgemeinere Situation angepasst ist: H. Definition. (i) Die Funktionenfolge .Fk / konvergiert (punktweise) gegen die Funktion F W M ! Y , wenn gilt: Zu jedem x 2 M und " > 0 existiert ein N D N.x; "/ 2 N derart, dass für alle k > N gilt: d.Fk .x/; F .x// < ". Dies bedeutet also, dass für jeden Punkt x 2 M die Folgenkonvergenz lim Fk .x/ D k!1
F .x/ stattfindet. Symbole dafür sind: lim Fk .x/ D F .x/
k!1
(auf M )
oder
Fk .x/ &! F .x/ (für k &! 1): (auf M )
(ii) Die Funktionenfolge .Fk / konvergiert gleichmäßig gegen die Funktion F W M ! Y , wenn gilt: Zu jedem " > 0 existiert ein N D N."/ 2 N derart, dass für alle k > N und alle x 2 M gilt: d.Fk .x/; F .x// < ". Symbole dafür sind: lim Fk .x/ D F .x/ glm.
k!1
(auf M )
oder
Fk .x/ &! F .x/ glm. (auf M )
(für k &! 1).
322
Kapitel 6 Metrische Räume
Manchmal lässt man in dieser Schreibweise das x weg, die Menge M muss aber auf jeden Fall spezifiziert werden (in der Nähe der Formel oder im Kontext). Gleichmäßige Konvergenz ohne Bezug auf eine Menge ist sinnlos! Natürlich impliziert die gleichmäßige Konvergenz die punktweise Konvergenz. Ein einfaches hinreichendes Kriterium für die gleichmäßige Konvergenz ist: I. Satz (Majorantenkriterium für gleichmäßige Konvergenz). Gilt mit einer reellen Nullfolge .˛k /: d.Fk .x/; F .x// . ˛k
für alle k 2 N und alle x 2 M ;
so besteht die gleichmäßige Konvergenz Fk .x/ ! F .x/ auf M . Beweis. Der ."; N /-Test für die Folge .˛k / liefert wegen der vorausgesetzten Ungleichung den gleichmäßigen ."; N /-Test für .Fk /. " Hat man keine Kenntnis oder Vermutung der Grenzfunktion, so hilft auch hier ein Cauchy-Kriterium, wenn der Zielraum vollständig ist: J. Satz (Cauchy-Kriterium für gleichmäßige Konvergenz). Sei .Fk / eine Folge von Abbildungen Fk W M ! Y , und sei Y vollständig. Dann sind äquivalent: (i)
Die Folge .Fk / konvergiert gleichmäßig.
(ii) Zu jedem " > 0 existiert ein N D N."/ 2 N derart, dass für alle k; ` > N und alle x 2 M gilt: d.Fk .x/; F` .x// < ". Beweis. Zu (i) H) (ii): Sei die gleichmäßige Konvergenz vorausgesetzt: Fk .x/ ! F .x/ auf M . Dann gilt die Dreiecksungleichung d.Fk .x/; F` .x// . d.Fk .x/; F .x// C d.F .x/; F` .x//: Daraus liest man unmittelbar (ii) ab. Zu (ii) H) (i): Zunächst existiert zu jedem x 2 M individuell der Grenzwert F .x/ ´ limk!1 Fk .x/, da bei festgehaltenem x die Folge .Fk .x// eine CauchyFolge in Y und Y vollständig ist. Sei nun " > 0 vorgegeben und N gemäß (ii) bestimmt. Dann gilt d.Fk .x/; F` .x// < " für alle k; ` > N und x 2 M . Hieraus folgt erneut mittels der Dreiecksungleichung d.Fk .x/; F .x// . d.Fk .x/; F` .x// C d.F` .x/; F .x// < " C d.F` .x/; F .x//
8 k; ` > N; x 2 M:
323
Abschnitt 6.5 Gleichmäßigkeit
Grenzübergang ` ! 1 am Anfang und Ende der Ungleichungskette gibt daraus d.Fk .x/; F .x// . "
8 k > N; x 2 X:
Dies bestätigt den Test für die gleichmäßige Konvergenz.
"
Von jetzt an sei in diesem Abschnitt M D X ein metrischer Raum. K. Satz. Gilt Fk .x/ ! F .x/ gleichmäßig auf X und sind alle Fk in a 2 X stetig, so ist auch die Grenzfunktion F in a stetig. Beweis. Genau wie in D[5.5]. Man hat lediglich das übliche Rezept anzuwenden (d.h. statt ju & vj zu schreiben d.u; v/). " L. Beispiele. Hier sei stets X ein reelles Intervall und Y D R. (i)
Anschauliche Fälle sind in den folgenden Bildern dargestellt: Glm. Konvergenz gegen f
Unglm. Konvergenz gegen stetiges f 3
2
Unglm. Konvergenz gegen unstetiges f
1
ε ε
3
2
1
(ii) Sei X D Œ0; 1/; fk W Œ0; 1/ ! R; fk .x/ D x k . Die Folge dieser Potenzfunktionen auf Œ0; 1/ wurde in C(ii)[5.5] betrachtet. Sie konvergiert punktweise, jedoch nicht gleichmäßig, da die Grenzfunktion bei 1 unstetig ist. (iii) Sei X D Œ0; p/ für ein festes p mit 0 < p < 1; fk W Œ0; p/ ! R; fk .x/ D x k . Diesmal gilt für die Potenzfunktionen auf der verkleinerten Definitionsmenge lim x k D 0
k!1
glm. auf X D Œ0; p/:
Es ist das Majorantenkriterium I anwendbar; denn 0 . x k . p k für alle x 2 X, und .p k / ist eine reelle Nullfolge. Anwendung auf gekoppelte Grenzwerte Wir betrachten eine Folge der Form bk ´ Fk .xk /, d.h. mit k variierende Funktionen werden auf variierende xk angewandt. Man ist dann in der Versuchung, aus den zwei Konvergenzen „xk ! a“ und „Fk ! F “ auf „Fk .xk / ! F .a/“ zu schließen. Das ist i. Allg. aber nicht erlaubt!
324
Kapitel 6 Metrische Räume
M. Beispiel. ( )k Das klassische Gegenbeispiel ist bk ´ 1 & k1 . Hier ist Fk .x/ ´ .1 & x/k und xk ´ k1 . Mit punktweiser Konvergenz auf X ´ Œ0; 1/ ist die Grenzfunktion nach L(ii) ( 0 für 0 < x . 1 lim Fk .x/ D F .x/ ´ und xk ! a ´ 0: k!1 1 für x D 0 Somit ist F .a/ D 1, aber
3 1 1 -k D : lim Fk .xk / D 1 & k e k!1
Unter Zusatzvoraussetzungen ist das obige Wunschdenken aber doch erfüllbar: N. Satz (Entkoppelung von Grenzübergängen). Gegeben sei eine Folge .Fk / von Abbildungen Fk W X ! Y , die alle in a 2 X stetig sind, sowie eine Folge .xk / in X. Dann gilt der Schluss: lim Fk .x/ D F .x/ glm. auf X;
k!1
lim xk D a
k!1
H)
lim Fk .xk / D F .a/:
k!1
Beweis. Es gilt die Vorausabschätzung d.Fk .xk /; F .a// . d.Fk .xk /; F .xk // C d.F .xk /; F .a//: Außerdem ist die Grenzfunktion F nach Satz K in a stetig. Sei " > 0 gegeben. Wegen der gleichmäßigen Konvergenz existiert ein Index N0 2 N, sodass gilt: d.Fk .x/; F .x// < "=2 für alle k > N0 und alle x 2 X. Somit gilt für diese k auch: d.Fk .xk /; F .xk // < "=2. Wegen der Stetigkeit von F in a existiert ein N1 2 N mit: d.F .xk /; F .a// < "=2 für alle k > N1 . Aufgrund der Vorausabschätzung folgt " " d.Fk .xk /; F .a// < C D " für alle k > max fN0 ; N1 g: 2 2 Hierin ist die Behauptung enthalten. " O. Beispiel. Nach Beispiel C(iii)[5.5] gilt 3 x -n D ex lim 1 C n!1 n gleichmäßig auf jedem Intervall der Form X D Œ&a; a/. Ist .xn / eine konvergente reelle Folge, so ergibt sich aus Satz N 3 xn -n lim xn D c H) lim 1 C D ec : n!1 n!1 n Denn man kann a so groß wählen, dass alle Folgenglieder xn in Œ&a; a/ liegen. Für c D 0 war dieser Grenzwert in Lemma S[2.1] mit ganz elementaren Mitteln gewonnen worden. Er resultiert jetzt auf eine systematische Weise.
325
Abschnitt 6.5 Gleichmäßigkeit
$ Der Satz von Dini Aus der punktweisen Konvergenz kann man die gleichmäßige Konvergenz nur dann schließen, wenn man Zusatzvoraussetzungen macht. Ein bekannter Satz in dieser Richtung geht auf Dini zurück. Er befasst sich mit reellwertigen Funktionen, stützt sich nämlich auf Anordnungseigenschaften. P. Satz (von Dini). Sei X ein kompakter metrischer Raum und .fk / eine Folge reellwertiger stetiger Funktionen fk W X ! R mit monotonem Wachstum bzgl. k, d.h. für alle x 2 X und k 2 N gelte: fkC1 .x/ % fk .x/. Konvergiert die Folge .fk / punktweise gegen eine stetige Funktion f W X ! R, so erfolgt diese Konvergenz sogar gleichmäßig. Die gleiche Aussage bleibt richtig, wenn anstelle des monotonen Wachsens das monotone Fallen bzgl. k vorausgesetzt wird, d.h. wenn für alle x 2 X und k 2 N gilt: fkC1 .x/ . fk .x/. Beweis. Zu jedem " > 0 und x 2 X existiert ein N.x/ 2 N, sodass für k % N.x/ gilt: f .x/ & fk .x/ < "=3. Wegen der Stetigkeit von f und fN.x/ existiert eine Umgebung U.x; ı.x// von x derart, dass für alle e x 2 U.x; ı.x// gilt: jf .x/ & f .e x /j < "=3 und jfN.x/ .x/&fN.x/ .e x /j < "=3. Somit gilt für alle e x 2 U.x; ı.x//: f .e x /&fN.x/ .e x/ < ". Das alles ist richtig bei festem x. Variiert man x, so überdecken die Umgebungen U.x; ı.x// den Raum X. Da dieser kompakt ist, gibt es endlich viele Punkte xi , sodass die Umgebungen U.xi ; ı.xi // ebenfalls X überdecken. Sei N das Maximum der N.xi /. Dann gehört jeder Punkt x 2 X zu einer solchen Umgebung U.xi ; ı.xi //. Damit folgt für k % N : f .x/ & fk .x/ . f .x/ & fN .x/ . f .x/ & fN.xi / .x/ < ": Somit ist der Test für die gleichmäßige Konvergenz fk .x/ ! f .x/ erfüllt. Im Fall des monotonen Fallens kann man analog argumentieren oder zur Folge .&fk / übergehen. " Aufgaben und Anmerkungen 1. Man berechne: 3 1 --n 3 1 , a) lim 1 C cos n!1 n n
b)
3 1 -n -n 13 lim 1 C 1C . n!1 n n
2. Zeige, dass die Implikation in Beispiel O auch umgekehrt werden kann, also die Äquivalenz besteht: 3 xn -n lim xn D c () lim 1 C D ec : n!1 n!1 n
326
Kapitel 6 Metrische Räume
3. Sei .Fk / eine Folge von Funktionen Fk W M ! Y , und sei M D A[B. Man zeige: .Fk / konvergiert dann und nur dann gleichmäßig, wenn die Folgen der Restriktionen .Fk jA/ und .Fk jB/ beide gleichmäßig konvergieren. 4. Man zeige im Anschluss an L(ii), dass die Folge der Potenzfunktionen x 7! x k auch auf Œ0; 1Œ nicht gleichmäßig konvergieren kann. S Œ0; p/. Man sieht also, dass die 5. In L(ii) bzw. Aufgabe 4 gilt Œ0; 1Œ D 0 N und alle x 2 A:
327
Abschnitt 6.5 Gleichmäßigkeit
Das folgt aus der gleichmäßigen Konvergenz der Fn . Setzt man x D x` , so ergibt sich d.Fm .x` /; Fn .x` // < "
für alle n; m > N und alle `;
also durch Grenzübergang ` ! 1: d.ym ; yn / . "
für alle n; m > N :
Dies zeigt, dass die Folge .yn / die Cauchy-Eigenschaft besitzt, also ihr Grenzwert y ´ limn!1 yn existiert. Zu zeigen bleibt jetzt: F .x` / ! y für ` ! 1. Dazu verwendet man die Vorausabschätzung d.F .x` /; y/ . d.F .x` /; Fn .x` // C d.Fn .x` /; yn / C d.yn ; y/; gültig für alle `; n. Bei gegebenem " > 0 kann man nun so argumentieren: Es gibt ein festes n derart, dass der erste Summand rechts < "=3 wird, und zwar für alle ` (gleichmäßige Konvergenz Fn ! F ) und dass auch der dritte Summand < "=3 ausfällt (Konvergenz yn ! y). Bei diesem festen n existiert ein Index L, sodass der zweite Summand rechts ebenfalls < "=3 wird für alle ` > L (Konvergenz Fn .x` / ! yn für ` ! 1). Insgesamt zeigt also die Vorausabschätzung: d.F .x` /; y/ < " für alle ` > L. Das beweist die Konvergenz F .x` / ! y. 9. Sei A nichtleere Teilmenge des metrischen Raums X und dA ihre Distanzfunktion; vgl. K[6.2]. Falls zu x 2 X ein x $ 2 A existiert mit dA .x/ D d.x; x $ /, so heißt x $ ein Proximum oder ein Fußpunkt von x in A. a) Zeige: Ist A kompakt, so existiert zu jedem x 2 X ein Proximum x $ 2 A. b) Ist ein Proximum, falls existent, immer eindeutig bestimmt? 10. $ Sind A; B nichtleere kompakte Teilmengen des metrischen Raums X, so sei dA .B/ ´ maxy2B dA .y/ und h.A; B/ ´ max fdA .B/; dB .A/g. Man beweise, dass h eine Metrik auf der Menge K.M / aller nichtleeren kompakten Teilmengen von X ist. Man nennt h die Hausdorff-Metrik. 11. Wie verhält sich der Stetigkeitsmodul gegenüber Komposition? Gilt eine Art Kettenregel !GıF . !G ı !F ?
7
Die komplexen Zahlen
Die komplexen Zahlen sind eine Erweiterung der reellen Zahlen. Das Motiv für diese nochmalige Ausdehnung des Zahlbegriffs ist zunächst rein algebraisch: Es gibt ja einfache algebraische Gleichungen (sogar simple quadratische Gleichungen), die keine reellen Lösungen besitzen, z.B. die Gleichung x 2 C1 D 0. Die komplexen Zahlen entstanden aus dem Bedürfnis heraus, solchen Gleichungen eine Lösung zu verschaffen. Später hat sich herausgestellt, dass man mit den komplexen Zahlen eine reichhaltige Analysis aufbauen kann, die sowohl in den Anwendungen wie auch in der Mathematik selbst zu nützlichen und reizvollen Resultaten führt. In diesem Kapitel konstruieren wir die komplexen Zahlen auf algebraischem Wege, entwickeln dann aber recht bald analytische Hilfsmittel wie die komplexe Exponentialfunktion und die Grundlagen für die Konvergenzfragen im komplexen Bereich. Den Abschluss bildet ein Beweis für den so genannten Fundamentalsatz der Algebra, der mit einfachen Hilfsmitteln geführt werden kann.
7.1
Der Körper der komplexen Zahlen
Die einfachste algebraische Gleichung, die keine reellen Lösungen besitzt, ist (1)
x 2 C 1 D 0:
Diese Gleichung ist nicht reell lösbar, da x 2 C 1 für alle x 2 R positiv ist. Man betrachte nun versuchsweise ein „Symbol“ i , für das i 2 C 1 D 0 gilt, und rechne mit diesem sowie mit „Symbolen“ der Form a C bi (a; b 2 R) nach den Körperregeln. Dann gilt i 2 D &1 und weiter .a1 C b1 i/ C .a2 C b2 i/ D .a1 C a2 / C .b1 C b2 /i .a1 C b1 i/ ( .a2 C b2 i/ D a1 a2 C a1 b2 i C b1 a2 i C b1 b2 i 2 D .a1 a2 & b1 b2 / C .a1 b2 C b1 a2 /i a & bi a & bi 1 D D 2 a C bi .a C bi/.a & bi/ a & b2i 2 D
a2
b a & 2 i: 2 Cb a C b2
Obwohl also i nur ein Symbol ist, ergeben sich konkrete Rechenvorschriften. Aufgrund dieses Befundes soll jetzt definiert werden, was i – oder allgemeiner eine komplexe Zahl – sein soll. Die gefundenen Regeln dienen dabei als Leitfaden. Das Ziel
Abschnitt 7.1 Der Körper der komplexen Zahlen
329
ist, einen Körper zu finden, der einerseits R umfasst, und andererseits Lösungen der Gleichung (1) enthält. Wir betrachten die Menge aller Paare z D .a; b/ reeller Zahlen, also die Menge R2 D R ) R D fz j z D .a; b/ mit a; b 2 Rg: Außer der koordinatenweisen Addition zweier Paare z1 D .a1 ; b1 / und z2 D .a2 ; b2 /: (2)
z1 C z2 ´ .a1 ; b1 / C .a2 ; b2 / ´ .a1 C a2 ; b1 C b2 /
definieren wir folgende Multiplikation von z1 und z2 : (3)
z1 ( z2 D .a1 ; b1 / ( .a2 ; b2 / ´ .a1 a2 & b1 b2 ; a1 b2 C b1 a2 /:
(Die Multiplikation von Elementen von R2 mit reellen Zahlen spielt im Augenblick keine Rolle.) A. Satz. Mit den Verknüpfungen (2), (3) bildet R2 einen Körper. Beweis. Es sind die Eigenschaften von Definition A[1.1] zu bestätigen. Zu den dortigen Regeln für die Addition (S.1) - (S.4): Diese sind sehr leicht zu überprüfen; sie sind natürlich auch aus der linearen Algebra (für R2 als Vektorraum) bekannt. Neutralelement bzgl. der Addition ist das Paar .0; 0/ µ 0, Inverses zum Paar .a; b/ ist das Paar &.a; b/ ´ .&a; &b/. Die noch fehlenden reinen Umformungsregeln kann man einfach nachrechnen: Das multiplikative Kommutativgesetz (P.1) ist klar, weil der Ausdruck rechts in (3) bei Vertauschung von 1 und 2 in sich übergeht. Zum multiplikativen Assoziativgesetz (P.2) rechnet man für zk D .ak ; bk /, k D 1; 2; 3 so: .z1 z2 /z3 D .a1 a2 & b1 b2 ; a1 b2 C a2 b1 / ( .a3 b3 / D ..a1 a2 & b1 b2 /a3 & .a1 b2 C a2 b1 /b3 ; .a1 a2 & b1 b2 /b3 C a3 .a1 b2 C a2 b1 // .z1 .z2 z3 / D .a1 ; b1 / ( .a2 a3 & b2 b3 ; a2 b3 C a3 b2 / D .a1 .a2 a3 & b2 b3 / & b1 .a2 b3 C a3 b2 /; a1 .a2 b3 C a3 b2 / C .a2 a3 & b2 b3 /b1 /: Ein Vergleich der beiden Resultate zeigt deren Übereinstimmung. Das Distributivgesetz (D) kann man analog bestätigen. Zum Neutralelement bzgl. der Multiplikation: Soll das Paar .u; v/ neutral sein, so bedeutet dies .a; b/ ( .u; v/ D .a; b/ für alle .a; b/ ¤ .0; 0/; also äquivalent .au & bv; av C bu/ D .a; b/ für alle .a; b/ ¤ .0; 0/:
330
Kapitel 7 Die komplexen Zahlen
Das ist offensichtlich genau dann erfüllt, wenn u D 1 und v D 0 ist (setze speziell a D 1, b D 0). Es gibt also genau ein Neutralelement, nämlich .1; 0/. Zum Inversen bzgl. der Multiplikation: Soll das Paar .u; v/ ¤ .0; 0/ invers zu .a; b/ ¤ .0; 0/ sein, so bedeutet dies .a; b/ ( .u; v/ D .1; 0/; also äquivalent .au & bv; av C bu/ D .1; 0/
oder auch
au & bv D 1 bu C av D 0:
Diese beiden Gleichungen haben die eindeutig bestimmte Lösung uD
a ; a2 C b 2
vD
&b ; a2 C b 2
wie man erkennt, indem man die erste Gleichung mit a, die zweite mit b multipliziert und die Resultate addiert, bzw. indem man die erste Gleichung mit &b, die zweite mit a multipliziert und die Resultate addiert. Da mit .a; b/ ¤ .0; 0/ auch .u; v/ ¤ .0; 0/ ist, existiert zu .a; b/ genau ein multiplikatives Inverses. " Der nächste Schritt ist die „Einbettung“ von R in den so entstandenen Körper R2 . Dazu betrachten wir die speziellen Paare .a; 0/. Für diese gilt .a1 ; 0/ C .a2 ; 0/ D .a1 C a2 ; 0/;
.a1 ; 0/ ( .a2 ; 0/ D .a1 a2 ; 0/
d.h. diese addieren und multiplizieren sich wie die reellen Zahlen, die als erste Koordinaten auftreten. Ferner gilt .a1 ; 0/ D .a2 ; 0/ () a1 D a2 : Wir können daher gefahrlos schreiben (4)
a ´ .a; 0/
und mit diesen speziellen Elementen von R2 rechnen wie mit reellen Zahlen. Die reellen Zahlen erscheinen so in natürlicher Weise eingebettet in R2 . Außerdem kürzen wir ab: (5)
i ´ .0; 1/
und nennen dieses spezielle Paar die imaginäre Einheit. Damit wird i 2 D .0; 1/ ( .0; 1/ D .0 ( 0 & 1 ( 1; 0 ( 1 C 1 ( 0/ D .&1; 0/ D &1:
331
Abschnitt 7.1 Der Körper der komplexen Zahlen
Somit ist auch das dritte Ziel erreicht: Die Gleichung (1) hat in R2 (zumindest) die Lösung i (tatsächlich ist mit i auch &i ´ .0; &1/ Lösung dieser Gleichung). Schließlich erhalten wir folgende Zerlegung eines Paares z D .a; b/: z D .a; b/ D .a; 0/ C .0; b/ D .a; 0/ C .b; 0/ ( .0; 1/ D a C bi: In beiden Fällen kamen zum Schluss die Verabredungen (4) und (5) zum Zuge. Wir fassen zusammen : B. Satz und Definition. Die Menge der Paare reeller Zahlen wird unter Beachtung der Konventionen (4), (5) zu einem Körper C, dessen Elemente eindeutig in der Form (6)
z D a C bi
mit a; b 2 R
geschrieben werden können. In dieser Gestalt kann mit den Elementen von C nach den Körperregeln gerechnet werden, wobei i 2 D &1 gilt. C heißt der Körper der komplexen Zahlen. Dieser enthält den Körper R der reellen Zahlen in Form der Elemente (6) mit b D 0. " Beim analytischen Arbeiten mit komplexen Zahlen tritt die Entstehung aus den Paaren reeller Zahlen in den Hintergrund; man wird z.B. das z in (6) nicht mehr weiter als .a; b/ schreiben, sondern eben als a C bi. Nach wie vor bleibt jedoch die bijektive Entsprechung von .a; b/ 2 R2 mit a C bi 2 C. Das trifft insbesondere für die Beschreibung von Teilmengen, aber auch für die Veranschaulichung zu: Es empfiehlt sich durchaus und ist allgemein üblich, bei der anschaulichen Deutung z als Punkt oder auch Ortsvektor in R2 mit den Koordinaten a; b zu betrachten. Bei den komplexen Zahlen geht die Anordnung, wie man sie von den reellen Zahlen her kennt, verloren. Jedoch bleibt der Betrag erhalten. Das liegt an einigen spezifischen Begriffen, die zur „Grundausstattung“ von C gehören: C. Definition. Für eine komplexe Zahl z D a C bi mit a; b 2 R definiert man: (i)
den Realteil und Imaginärteil: Re z ´ a, Im z ´ b;
die konjugiert komplexe Zahl z ´ a & bi; p (iii) den Betrag jzj ´ a2 C b 2 . (ii)
Die Größen in (ii) und (iii) kann man durch das konjugiert Komplexe ausdrücken, indem man die Gleichungen z D a C bi und z ´ a & bi addiert, subtrahiert bzw. multipliziert. Das ergibt: (7)
Re z D
1 .z C z/; 2
Im z D
1 .z & z/; 2i
jzj D
p
zz:
332
Kapitel 7 Die komplexen Zahlen
Das konjugiert Komplexe lässt Summe und Produkt in C invariant (ist also ein so genannter Körper-Automorphismus), d.h. für alle z; w 2 C gilt: (8)
z C w D z C w;
z ( w D z ( w:
Das kann man leicht nachrechnen, z.B. beim Produkt, wenn w D c C di
mit c; d 2 R
gesetzt wird, so: Einerseits gilt zw D ac & bd C .ad C bc/i; also zw D ac & bd & .ad C bc/i, andererseits ist z ( w D ac & bd & .ad C bc/i („nur b und d ändern das Vorzeichen“). Durch Vergleich folgt die Behauptung. Genau die reellen Zahlen in C werden durch das Konjugieren in sich übergeführt: z 2 R () z D z: Die reellen Vielfachen von i , also die komplexen Zahlen der Form ti mit t 2 R heißen rein imaginär. Als Folgerung aus (8) ergibt sich für einen Quotienten q ´ z=w 2 C mit w ¤ 0, da q ( w D z, also q ( w D z: 3zw
D
z ; w
falls w ¤ 0:
Das Berechnen von Real- und Imaginärteil eines Quotienten geschieht am schnellsten durch „Erweitern mit dem konjugiert Komplexen des Nenners“: zw z zw D D w ww jwj2
falls w ¤ 0:
D. Satz. Für den Betrag in C gelten die Regeln: (i)
jzj > 0 für z ¤ 0, j0j D 0;
(ii)
jz ( wj D jzj ( jwj; ˇzˇ jzj ˇ ˇ für w ¤ 0; (iii) ˇ ˇ D w jwj (iv) (v)
jz C wj . jzj C jwj (Dreiecksungleichung); ˇ ˇ ˇ ˇ jz C wj % ˇjzj & jwjˇ und jz & wj % ˇjzj & jwjˇ (modifizierte Dreiecksungleichungen).
Beweis. (i) ist aus der Definition des Betrags unmittelbar klar. (ii) und (iii) sind einfache Folgerungen aus der dritten Regel in (7).
Abschnitt 7.1 Der Körper der komplexen Zahlen
333
Zu (iv): Für z Cw D 0 ist die Behauptung trivial richtig. Im Falle z Cw ¤ 0 betrachte man den Quotienten ˇ ˇ ˇ ˇ ˇ z ˇ ˇ w ˇ jzj C jwj jzj jwj ˇ ˇ ˇ: ˇ Q´ D C Dˇ C jz C wj jz C wj jz C wj z C w ˇ ˇz C w ˇ Um Q % 1 nachzuweisen, muss man also zeigen: jqjCj1&qj % 1 oder äquivalent j1& qj % 1 & jqj für q 2 C. Im Fall jqj > 1 ist dies klar. Im Fall jqj . 1 liefert Quadrieren und Ausrechnen mittels (7) äquivalent Re q . jqj, und das ist sicher richtig, wie man mi Definition C sieht. Zu (v): Diese Ungleichungen ergeben sich durch Umstellen aus (iv), genau wie in I[1.1]. " Aufgaben und Anmerkungen 1. Man zerlege in Real- und Imaginärteil: a) .1 C 3i /2 ,
b) .1 C 3i/2 ,
d) .3 C i /.9 & 3i /,
e)
c)
.3 C i/ & .2 & i/ , 1Ci
.1 C i/1000 . .1 & i/1001
2. Für eine gegebene komplexe Zahl a Cbi mit a; b 2 R betrachte man die Gleichung z 2 D a C bi und zeige: a) Ist b ¤ 0, so hat die Gleichung in C genau eine Lösung mit positivem Realteil, nämlich p .q qp / p 2 z1 D a2 C b 2 C a C i sign b a2 C b 2 & a : 2 b) Ist b D 0 und a > 0, sop hat die Gleichung in C genau eine Lösung mit positivem Realteil, nämlich z1 D a. c) Ist b D 0 und a < 0, so hat die p Gleichung in C genau eine Lösung mit positivem Imaginärteil, nämlich z1 D i jaj. In allen drei Fällen a) – c) ist die Lösungsgesamtheit die Menge fz1 ; z2 g mit z2 ´ &z1 . d) Ist a D b D 0, so hat die Gleichung in C nur die Lösung z1 D 0. 3. Gegeben seien komplexe Zahlen a; b; c mit a ¤ 0. Man zeige: Die Lösungen der quadratischen Gleichung az 2 C bz C c D 0 in C sind r c b $ b2 ˙ & ; z1;2 D & 2 2a 4a a
334
Kapitel 7 Die komplexen Zahlen
b2 c wobei die Wurzel eine der Lösungen der Gleichung w 2 D 2 & bezeichnet (wel4a a che, ist egal). Lösungshinweis: Man dividiere die Ausgangsgleichung durch a und führe dann quadratische Ergänzung durch nach dem Muster z 2 C 2pz C q D z 2 C 2pz C p 2 & p 2 C q D .z C p/2 & p 2 C q. 4. Für drei komplexe Zahlen gelte a C b C c D 0 und jaj D jbj D jcj. Man beweise hieraus ja & bj D jb & cj D jc & aj. 5. In der Dreiecksungleichung jz C wj . jzj C jwj für z; w 2 C steht dann und nur dann das Gleichheitszeichen, wenn z und w „nichtnegativ proportional“ sind, d.h. wenn es ein * % 0 gibt mit w D *z, oder wenn es ein + % 0 gibt mit z D +w. Lösungshinweis: Man benutze die Argumente aus dem obigen Beweis der Dreiecksungleichung D(iv). 6. Soweit in Kapitel 1 nur davon Gebrauch gemacht wurde, dass R ein Körper ist, der die natürlichen Zahlen enthält, übertragen sich die Ergebnisse aufs Komplexe. Das gilt z.B. für die binomische Formel (5)[1.3] und die geometrische Summenformel (9)[1.3]. Diese lauten also für a; b 2 C, n 2 N und q 2 C mit q ¤ 1: 0 ! n X 1 & q nC1 n n&k k n : .a C b/ D a b ; 1 C q C q2 C ( ( ( C qn D 1&q k kD0
7. $ Zeige: Ist K ein Körper mit R , K , C, so ist K D R oder K D C: „Es gibt keine echten Zwischenkörper zwischen R und C“.
7.2
Komplexe Exponentialfunktion und Polardarstellung
Wir knüpfen an an die Parametrisierung der Einheitskreislinie S1 durch Kosinus und Sinus, wie in O[4.4] beschrieben. Danach kann man die Punkte von S1 in der Form .cos t; sin t/ mit t 2 R erfassen. Aus diesem Paar machen wir jetzt eine komplexe Zahl: A. Definition („Trauung von Kosinus und Sinus“). Für t 2 R sei (1)
e it ´ cos t C i sin t:
Abschnitt 7.2 Komplexe Exponentialfunktion und Polardarstellung
335
Das ist die so genannte Eulersche Relation. Allgemeiner setzt man für s; t 2 R: e sCit ´ e s ( e it D e s .cos t C i sin t/:
(2)
Damit ist die Exponentialfunktion komplett in C hinein fortgesetzt. Man verwendet auch hier die „exp“-Schreibweise: exp.z/ ´ e z
für z 2 C
und nennt die Exponentialfunktion wieder kurz e-Funktion. Es handelt sich wirklich um eine Fortsetzung; denn die rechte Seite von (2) geht für t D 0 in e s über. An dieser Definition sieht man auch, dass e sCit niemals 0 wird. Tatsächlich liest man hieraus ab: je sCit j D e s , also für alle z 2 C je z j D e Re z ¤ 0:
(3) B. Beispiele.
e i (0 D cos 0 C i sin 0 D 1 D e 0
(i)
e i (20 D cos 2& C i sin 2& D 1 & & (iii) e i.0=2/ D cos C i sin D 0 C i ( 1 D i. 2 2 C. Lemma (einfache Konsequenzen). Für z; w 2 C; n 2 Z; t 2 R gilt
(ii)
(i)
e zCw D e z ( e w
(ii)
.e z /n D e nz
(iii) e z D e z (iv)
e it D e &it D
(v)
e zC20 i D e z .
1 ; je it j D 1 e it
Die Gleichung in (i) drückt aus, dass die Exponentialfunktion auch im Komplexen die Summe in das Produkt überführt, genau wie im Reellen. Die Relation (v) besagt, dass die Addition von 2& i zum Argument von exp den Funktionswert nicht verändert. Man sagt, die komplexe e-Funktion hat die (komplexe) Periode 2& i. Beweis von C. Zu (i): Dies ergibt sich durch direktes Nachrechnen aus der Definition (2) mit Hilfe der Additionstheoreme von Kosinus und Sinus F(iv)[4.4]. Im einzelnen: Sei z D s C it, w D u C iv mit s; t; u; v 2 R. Dann gilt einerseits e zCw D e .sCu/Ci.tCv/ D e .sCu/ ( e i.tCv/ D e s e u ( .cos.t C v/ C i sin.t C v//;
336
Kapitel 7 Die komplexen Zahlen
andererseits e z ( e w D e sCi t ( e uCiv D e s e it ( e u e iv D e s e u ( .cos t C i sin t/.cos v C i sin v/ 3 D e s e u .cos t cos v & sin t sin v/ C i.sin t cos v C cos t sin v/ : Die beiden rechten Seiten am Ende stimmen überein, also auch die linken Seiten. Zu (ii) bis (iv): Dies sind Folgerungen aus (i): Durch vollständige Induktion erhält man zunächst (ii) für n 2 N. Weiter folgt aus (i) für w D &z, da e 0 D 1: e &z D 1=e z und daraus (ii) auch für n 2 &N. (iii) sieht man unmittelbar der Definition (2) an. (iv) ergibt sich durch Kombination von (iii) und (ii) für n D &1 und (v) aus (i) und B(ii). " D. Bemerkung. Für z D e it ; t 2 R besagt (ii) speziell .e it /n D e i nt . Wegen (1) ist dies äquivalent mit der für t 2 R und n 2 Z gültigen Gleichung .cos t C i sin t/n D cos nt C i sin nt
(Formeln von Moivre):
Die Übertragung des Polarkoordinatensatzes R[4.4] in die komplexe Schreibweise gibt unmittelbar folgenden: E. Satz. Zu z D x C iy 2 C mit x; y 2 R existiert genau ein r % 0 sowie ein ' 2 R mit z D re i' : Man nennt diese Formel die Polardarstellung in C. Dabei sind r; ' Polarkoordinaten von .x; y/ 2 R2 mit den gleichen Eigenschaften wie in R[4.4]: Es ist r D jzj D
p x2 C y2:
Für z ¤ 0 gilt für den Hauptwert Arg.z/ des Arguments ' 2 /&&; &/ in der geschlitzten Ebene C n fx C iy j x . 0; y D 0g: Arg.z/ D Arg.x; y/ D 2 arctan
y p x C x2 C y2
und in der rechten Halbebene fx C iy j x > 0g: Arg.z/ D Arg.x; y/ D arctan
y : x
Die Formel z D x C iy wird auch als kartesische Darstellung von z bezeichnet.
"
Abschnitt 7.2 Komplexe Exponentialfunktion und Polardarstellung
337
Die kartesische Darstellung eignet sich besonders für die Addition: für z1 D a1 C b1 i und z2 D a2 C b2 i wird ja (4)
z1 C z2 D a1 C a2 C .b1 C b2 /i:
Die Polardarstellung eignet sich besonders für die Multiplikation: für z1 D r1 e '1 , z2 D r2 e '2 wird ja z1 ( z2 D r1 e '1 r2 e '2 D r1 r2 e '1 C'2 :
(5)
F. Bemerkungen. (i) Aus den Moivre-Formeln ergeben sich Darstellungen für cos nt; sin nt; n 2 N, indem man die linke Seite nach der binomischen Formel entwickelt und Real- und Imaginärteile vergleicht. (ii) Da die Abbildung exp W C ! C die Periode 2& i besitzt, kann sie nicht injektiv sein. Tatsächlich ist die 2& i-Periodizität die einzige „Störung“ der Injektivität. Es gilt nämlich für z; w 2 C die Äquivalenz: e z D e w () z & w 2 Z2& i:
(6)
Dies folgt letztlich aus dem Lemma P[4.4]. Betrachtet man zunächst die spezielle Gleichung e z D 1, so ist diese für z D x C iy mit x; y 2 R nach (2) äquivalent zu den beiden reellen Gleichungen e x cos y D 1, e x sin y D 0, also zu e x D 1, cos y D 1, sin y D 0 („quadriere und addiere“). Dies bedeutet aber x D 0 und y 2 Z2&, also z 2 Z2& i. Da die allgemeine Gleichung e z D e w durch Multiplikation mit e &w in e z&w D 1 umgeformt werden kann, folgt die Äquivalenz (6). Insbesondere hat die e-Funktion die komplexen Perioden ˙2& i; ˙4& i; ˙6& i; : : : und keine anderen. (iii) Aus der Eulerschen Relation (1) folgt: e it ´ cos t C i sin t;
e &it ´ cos t & i sin t:
Addition bzw. Subtraktion dieser Formeln gibt unmittelbar cos t D
e i t C e &it ; 2
sin t D
e it & e &it : 2i
Man kann also Kosinus und Sinus umgekehrt als komplexe Linearkombinationen von komplexen Exponentialfunktionen ausdrücken.
338
Kapitel 7 Die komplexen Zahlen
G . Beispiel (Kosinus hyperbolicus und Sinus hyperbolicus). Diese beiden (zunächst im Reellen betrachteten) Funktionen sind motiviert durch die obigen Ausdrücke für Kosinus und Sinus: Es sind die Funktionen cosh W R ! R und sinh W R ! R, definiert durch cosh x ´
e x C e &x ; 2
sinh x ´
e x & e &x : 2
Die Eigenschaften dieser Funktionen kann man ohne große Mühe ableiten, da sie ja vollkommen explizit aus der wohlbekannten (reellen) e-Funktion aufgebaut sind. Es ergibt sich ein Formelapparat, der in großer Analogie zu dem trigonometrischen Formelwerk steht. Eines ist allerdings ganz anders: Diese Funktionen haben keine reellen Periodizitätseigenschaften. Es seien einige Eigenschaften aufgelistet: a) cosh2 & sinh2 D 1;
cosh0 D sinh;
sinh0 D cosh.
b) sinh ist streng monoton wachsend und eine ungerade Funktion sowie sinh 0 D 0. cosh ist für x % 0 streng monoton wachsend und eine gerade Funktion sowie cosh 0 D 1. c) Die Umkehrfunktionen werden mit der Vorsilbe „ar“ bezeichnet. Genauer gilt: arcosh ´ .cosh jŒ0; 1Œ/&1 , arsinh ´ sinh&1 . Man kann diese Funktionen auch mit dem natürlichen Logarithmus ausdrücken: 3 3 p p arsinh y D ln y C y 2 C 1 ; arcosh y D ln y C y 2 & 1 ; indem man die Gleichungen y D cosh x bzw. y D sinh x (per Substitution e x D u) nach x auflöst (es entstehen quadratische Gleichungen). d) Die Folgefunktionen Tangens hyperbolicus und Kotangens hyperbolicus sind definiert als tanh x ´
sinh x ; cosh x
cotanh x ´
cosh x ; sinh x
x ¤ 0;
und ihre Umkehrfunktionen heißen artanh und arcotanh (definiert auf /&1; 1Œ bzw. auf R n Œ&1; 1/). e) Die Rolle von cos und sin zur Parametrisierung des Einheitskreises übertragen sich auf cosh und sinh zur Parametrisierung der Einheitshyperbel H1 ´ f.x; y/ 2 R2 j x 2 & y 2 D 1; x > 0g; dergestalt dass zu jedem .x; y/ 2 H1 genau ein t 2 R existiert mit x D cosh t; y D sinh t. Die Funktionen cosh; sinh, tanh und cotanh werden deswegen als Hyperbelfunktionen bezeichnet.
339
Abschnitt 7.2 Komplexe Exponentialfunktion und Polardarstellung
Standardveranschaulichung Da eine komplexe Zahl z D a C bi (mit a; b 2 R) einfach ein anders geschriebenes Paar reeller Zahlen ist, kann man z wie gewohnt in der Zahlenebene veranschaulichen, und zwar entweder durch den Punkt .a; b/ oder den (vom Ursprung ausgehenden) Ortsvektor .a; b/. In diesem Zusammenhang spricht man von der Gaußschen Zahlenebene. Neben der kartesischen Darstellung z D a C bi kann man wahlweise die Polardarstellung z D re i' verwenden. Bei der anschaulichen Deutung, die wir jetzt beschreiben, werden einige Begriffe verwendet, die erst später präzisiert werden können. Diese dürfen zwar zur Veranschaulichung dienen, sind aber vorläufig nicht als Beweismittel zugelassen. In der Gaußschen Zahlenebene heißt die 1-Achse die reelle Achse, da sie von allen z D a 2 R gebildet wird, und die 2-Achse imaginäre Achse, da sie von allen z D bi gebildet wird. Weil jzj die Euklidische Länge des Ortsvektors z ist, stellt sich die Einheitskreislinie S1 wirklich auch als Kreis mit Mittelpunkt 0 und Radius 1 dar. imaginäre Achse z = a+bi
bi = |z|
i
S1 sin
ϕ
ϕ 0
r
cos
ϕ
1
a
reelle Achse
Das Argument ' von z ¤ 0 mit ' 2 Œ0; 2&Œ veranschaulicht man durch die Bogenlänge auf S1 , gemessen vom Punkt 1 im Gegenuhrzeigersinn (= „mathematisch positiven Drehsinn“) bis zum Schnittpunkt der durch z bestimmten Halbgeraden mit S1 . (Gerade auch für die Bogenlänge ist die obige Vorsichtsmaßnahme zu beachten. Die Bogenlänge ist hiermit noch nicht als exakter mathematischer Begriff eingeführt. Das ist erst mit Hilfe weiterer Begriffsbildungen möglich, die wir in Abschnitt 9.1 besprechen werden.) Demgemäß wird ' auch als orientierter Winkel von z gegen 1 bezeichnet. Die Veranschaulichung von Addition und Multiplikation liest man aus (4) und (5) ab:
340
Kapitel 7 Die komplexen Zahlen
Im Im
|z1 | . | z2 |
ϕ1+ϕ2
z1 + z2 z2
ϕ2 |z2 | |z1 |
z1 Re
ϕ1 Re
Die Summe wird mit der Parallelogramm-Regel für die zugehörigen Ortsvektoren gebildet, beim Produkt multiplizieren sich die Beträge, und es addieren sich die Argumente.
Im
Der Übergang von z zum konjugiert Komplexen z bedeutet Spiegelung an der reellen Achse.
z = a + bi
Re z = a - bi
Aufgaben und Anmerkungen 1. Aus den Formeln von Moivre (Bemerkung D) leite man durch Entwicklung der linken Seite nach der binomischen Formel Gleichungen für cos nt und sin nt für n D 2; 3; 4; 5 her. 2. In der geometrischen Summenformel (Aufgabe 6[7.1]) setze man q ´ re it für r % 0 und t 2 R und gewinne so durch Trennung von Real- und Imaginärteil die Gleichungen 1 C r cos t C r 2 cos 2t C ( ( ( C r n cos nt D
1 & r cos t & r nC1 cos .n C 1/t C r nC2 cos nt 1 & 2r cos t C r 2
r sin t C r 2 sin 2t C ( ( ( C r n sin nt D
r sin t & r nC1 sin .n C 1/t C r nC2 sin nt 1 & 2r cos t C r 2
Abschnitt 7.2 Komplexe Exponentialfunktion und Polardarstellung
341
für n 2 N, falls der Nenner rechts ¤ 0 ist. Im Fall r D 1 spezialisiere man dies unter Verwendung der trigonometrischen Formeln aus M[4.4] zu 3 1t sin n C 1 2 C cos t C cos 2t C ( ( ( C cos nt D t 2 2 sin 2 nC1 sin t sin nt 2 sin t C sin 2t C ( ( ( C sin nt D ; t sin 2 gültig für alle t 2 R mit t … Z2&. 3. Punktmengen in R2 lassen sich reell durch Relationen für die kartesischen Koordinaten x; y von .x; y/ 2 R2 oder komplex und äquivalent durch Relationen für z D x C iy 2 C beschreiben. Man zeige z.B. a) Eine reelle Geradengleichung 2˛x C 2ˇy D % mit .˛; ˇ/ ¤ .0; 0/ geht für z ´ x C iy über in mit a ´ ˛ C iˇ.
&az & az C % D 0
b) Eine Kreislinie mit Mittelpunkt a 2 C und Radius r > 0 wird komplex durch jz & aj D r beschrieben. Quadrieren und Entwickeln liefert aus dieser Gleichung äquivalent mit % ´ aa & r 2 .
zz & az & az C % D 0
c) Als gemeinsame Gleichungsform für Geraden und Kreislinien erhält man somit 0zz & az & az C % D 0; wobei 0; % 2 R und a 2 C Konstanten sind. Diese sind allerdings nicht frei wählbar; denn im Fall 0 D 0 muss, damit eine Gerade dargestellt wird, a ¤ 0 sein, und im Fall 0 ¤ 0 muss, damit eine Kreislinie dargestellt wird, jaj2 &%0 > 0 sein. Im zweiten Fall ist dann der Radius p jaj2 & %0 rD : j0j 4. Die Abbildung f W C n f0g, definiert durch 1 ; z hat als Bildmenge A WD Cnf0g, kann somit als Selbstabbildung f W A ! A aufgefasst werden und ist als solche bijektiv (und ihre eigene Inverse). f .z/ ´
342
Kapitel 7 Die komplexen Zahlen
a) Man zeige: f bildet Kreise oder Geraden in Kreise oder Geraden ab, soweit sie in A liegen (wobei es vorkommen kann, dass Geraden in Kreise und Kreise in Geraden übergehen). Lösungshinweis: Man verwende die gemeinsame Gleichungsform für Geraden und Kreise aus Aufgabe 3 c) und stelle fest, dass die Bildpunkte w D f .z/ jeweils wieder eine solche Gleichung erfüllen. b) Man berechne die Bilder der Geraden Re z D ˛ D const. bzw. der Geraden Re z D ˇ D const. (vgl. das Bild).
f f(z) = 1/z
Wenn in der Urbildebene mit den ganzzahligen Gitterlinien ein Schachbrettmuster verbunden wird, so veranschauliche man das entsprechende „krummlinige Schachbrettmuster“ in der Bildebene durch Ausmalen einiger entsprechender krummliniger Maschen. & 5. $ Für n 2 N und t 2 R n Z gilt n n cot nt D
n&1 X kD0
7.3
3 k& cot t C : n
Konvergenz bei komplexen Zahlen
Um Konvergenzfragen der komplexen Zahlen zu studieren, fassen wir den Körper C als metrischen Raum auf. Als solcher ist er zunächst das Gleiche wie R2 D R ) R mit der Maximumsmetrik dm gemäß I[6.4]. Diese ist gegeben durch: z D x C iy;
x; y 2 R
w D u C iv;
u; v 2 R
H)
dm .z; w/ ´ max fjx & uj; jy & vjg:
343
Abschnitt 7.3 Konvergenz bei komplexen Zahlen
Tatsächlich arbeitet man in C lieber mit der Euklidischen Standard-Metrik d , wie sie in C(ii)[6.1] für R2 definiert war. Man kann sie jetzt durch den komplexen Betrag ausdrücken p p d.z; w/ ´ jz & wj D .x & u/2 C .y & v/2 : jzj ´ x 2 C y 2 ; Hieraus folgen unmittelbar die Metrikaxiome für d , insbesondere die Dreiecksungleichung; denn man hat für je drei komplexe Zahlen: d.z1 ; z3 / D jz1 & z3 j D j.z1 & z2 / C .z2 & z3 /j . jz1 & z2 j C jz2 & z3 j D d.z1 ; z2 / C d.z2 ; z3 /: Glücklicherweise führen beide Metriken zu den gleichen Konvergenzbegriffen, und das liegt an Folgendem: Zunächst kann man abschätzen: max fjxj; jyjg . jzj D
p p x 2 C y 2 . 2 max fjxj; jyjg;
indem man den Quadratausdruck dadurch verkleinert, dass das kleinere von x 2 ; y 2 weggelassen wird, bzw. dadurch vergrößert, dass beide durch ihr Maximum ersetzt werden. Hieraus folgt durch Anwendung auf die Differenz z & w: (1)
dm .z; w/ . d.z; w/ .
p
2 dm .z; w/:
An diesen gegenseitigen Abschätzungen sieht man schon, dass aus Bedingungen der Gestalt dm .z; w/ < 1 leicht entsprechende Ungleichungen für d folgen (und umgekehrt), wobei lediglich die Schranke durch ein festes Vielfaches ersetzt wird. Da in den grundlegenden Definitionen für Konvergenz nur solche Bedingungen vorkommen, macht es im Ergebnis keinen Unterschied, welche der beiden Metriken zur Formulierung verwendet wird. Das gilt auch für die topologischen Grundbegriffe. Die gegenseitigen Abschätzungen (1) drücken nämlich so genannte Ballinklusionen in R2 (und damit in C) aus. Darunter versteht man Folgendes: Die Bälle der Maximumsmetrik sind Quadrate (I[6.4]), die Bälle der Standard-Metrik sind Kreisscheiben.
β
r
r
a
α Ball in der Maximumsmetrik
β
r
r
a
α Ball in der Euklidischen Metrik
344
Kapitel 7 Die komplexen Zahlen
Ist a 2 C das Zentrum der betrachteten Bälle, so ergibt sich aus (1) für r > 0: p d.z; a/ < r H) dm .z; a/ < r H) d.z; a/ < 2 r: Dies besagt: Jede Kreisscheibe ist in dem umbeschriebenen Quadrat enthalten; jedes Quadrat wird umfasst von der umbeschriebenen Kreisscheibe (jeweils mit gleichem Zentrum). Ist also ein „Maximumsball“ in einer Menge A ent- β halten, so auch der „Euklidische“-Ball mit gleichem Zentrum und gleichem Radius, und ist ein „Euklidischer“-Ball in A enthalten, so auch der „Maximumsball“ mit gleichem Zentrum und mit p durch 2 dividiertem Radius. (Im Bild ist a D .˛; ˇ/.)
r √2 r
r
a
α
Daraus folgt, dass eine Menge A , C genau dann bzgl. der Maximumsmetrik offen ist, wenn sie bzgl. der Euklidischen Metrik offen ist. Ähnlich haben wir oben die Gleichwertigkeit der Konvergenzbegriffe bzgl. der beiden Metriken überlegt. Unter Beachtung der Resultate (i) bis (iv) in I[6.4] können wir zusammenfassen: A. Satz. Die Maximumsmetrik bzw. die Euklidische Standard-Metrik führen auf C zu den gleichen topologischen Begriffen (Offenheit, Abgeschlossenheit, Häufungspunkt, Abschluss, Inneres, Rand, Dichtheit, Kompaktheit von Teilmengen, Konvergenz von Folgen, Grenzwert und Stetigkeit von Abbildungen). Dasselbe gilt für die zugehörigen gleichmäßigen Varianten, die Beschränktheit und Vollständigkeit von Teilmengen und die Cauchy-Eigenschaft von Folgen. Insbesondere haben wir bzgl. beider Metriken: (i)
Für die Folgenkonvergenz gilt die Äquivalenz: zn ! a
(ii)
()
Re .zn / ! Re .a/;
Im .zn / ! Im .a/:
Die abgeschlossenen Bälle und die Sphären in C sind kompakt.
(iii) Eine Teilmenge von C ist genau dann kompakt, wenn sie beschränkt und abgeschlossen ist. (iv)
C ist vollständig.
"
Auch die Grundlagen der Differential- und Integralrechnung wollen wir, soweit es nach den obigen Prinzipien geht, übertragen. Wir hatten bisher betrachtet Funktionen des Typs (2)
f W A &! R;
mit A , R
345
Abschnitt 7.3 Konvergenz bei komplexen Zahlen
und wollen jetzt auch Funktionen studieren der Art (3)
f W A &! C;
mit A , R:
Ist f von diesem neuen Typ, so definieren Real- und Imaginärteil ihrer Werte zwei reelle Funktionen u; v W A ! R: (4)
f .t/ D u.t/ C iv.t / 8 t 2 A; kurz: u D Re .f /; v D Im .f / oder f D u C iv:
Umgekehrt kann man aus zwei solchen Funktionen u; v immer eine komplexwertige Funktion f D u C iv aufbauen. Übrigens ist der Typ (2) ein Spezialfall des Typs (3), nämlich der für v D 0. Wir beschränken uns zunächst auf reelle Definitionsmengen A, und zwar wegen der in Beispiel D[6.4] geschilderten Problematik: Abbildungen aus einem kartesischen Produkt heraus (das wäre hier R ) R oder eben C) sind danach nicht so einfach „komponentenweise“ zu behandeln. Eine durchgreifende Diskussion dieser Typen wird erst bei den Funktionen mehrerer Veränderlicher ab Kapitel 9 möglich sein. Wir listen nun einige Eigenschaften der Funktionen f der Gestalt (4) auf. Das Leitmotiv ist die komponentenweise Behandlung, d.h. die Zurückführung auf die Eigenschaften von Real- und Imaginärteil u und v. B . Satz und Definition (weitere Übertragungen). gilt:
Für Funktionen der Art (4)
(i)
f stetig in a 2 A: () gleicher ."; ı/-Test wie in A[3.3] () u; v stetig in a.
(ii)
f differenzierbar in a 2 A mit Ableitung f 0 .a/: () gleiche Definition wie in A[4.1] () u; v differenzierbar in a und f 0 .a/ D u0 .a/ C iv 0 .a/.
(iii) Die Ableitungsregeln übertragen sich sinngemäß unter entsprechenden Voraussetzungen, z.B. die Summen- und Produktregel: .f C g/0 .a/ D f 0 .a/ C g 0 .a/;
.fg/0 .a/ D f 0 .a/g.a/ C f .a/g 0 .a/
sowie die Kettenregel, diese allerdings nur bei Vorschaltung einer rein reellen Funktion ' W B ! A (B; A , R): .f ı '/0 .b/ D f 0 .'.b// ( ' 0 .b/: (iv)
Für stetiges f W Œ˛; ˇ/ ! C; f D u C iv, setzt man Z ˇ Z ˇ Z ˇ v.t/ dt: u.t / dt C i f .t/ dt ´ ˛
˛
˛
346
Kapitel 7 Die komplexen Zahlen
Auch die formalen Integrationsregeln bleiben unter entsprechenden Voraussetzungen erhalten, insbesondere der Hauptsatz der Differential- und Integralrechnung in den drei Fassungen von Abschnitt 5.2 sowie die Produktintegration und die Substitutionsregel aus Abschnitt 5.3, wobei die transformierende Funktion vom rein reellen Typ sein muss (wie oben bei der Kettenregel). Man beachte, dass die Regeln für die Differentiation und Integration von Produkten die Homogenitätsregeln gegenüber komplexen Vielfachen beinhalten. Z.B. gilt für eine stetige Funktion f W Œ˛; ˇ/ ! C und c 2 C Z ˇ Z ˇ c ( f .t/ dt D c ( f .t/ dt: ˛
˛
Beweis von B. Wenn wir sagen, die Regeln übertragen sich, so ist damit gemeint, dass die Regeln erhalten bleiben einschließlich der Beweise. Natürlich sind die entsprechenden Ersetzungen vorzunehmen, insbesondere der reelle Betrag durch den komplexen Betrag zu ersetzen. Das soll nun nicht alles wiederholt werden. Aber nachdem klar ist, dass die involvierten Grenzübergänge komponentenweise (an Real- und Imaginärteil) vorgenommen werden dürfen, ist alles auch einfach durch Rechnung zu bestätigen. Das geht dann z.B. bei der Kettenregel in (iii) so (wobei gleichzeitig ausformuliert ist, was mit „entsprechenden Voraussetzungen“ gemeint ist): Die betrachteten Funktionen sind zum einen ' W B ! R und zum anderen f W A ! C mit '.B/ , A. Es sei ' in b 2 B und f in a ´ '.b/ differenzierbar, also f 0 .a/ D u0 .a/ C iv 0 .a/. Die Komposition ist f ı ' D .u ı '/ C i.v ı '/. Da auf die reellen Kompositionen u ı ' und v ı ' die gewöhnliche Kettenregel B[4.2] anwendbar ist, folgt .f ı '/0 .b/ D .u ı '/0 .b/ C i.v ı '/0 .b/ D .u0 .'.b//' 0 .b/ C i.v 0 .'.b//' 0 .b/ D .u0 .'.b// C iv 0 .'.b///' 0 .b/ D f 0 .'.b//' 0 .b/; einschließlich der Differenzierbarkeit von f ı ' in b.
"
Die Übertragung gelingt nicht immer auf diesem Routineweg. So bleibt die Dreiecksungleichung für Integrale für den komplexen Betrag zwar erhalten, sie folgt jedoch nicht durch bloße Übersetzung aus der reellen Variante. C. Lemma. Ist f W Œ˛; ˇ/ ! C stetig, so gilt die Dreiecksungleichung ˇ Z ˇZ ˇ ˇ ˇ ˇ ˇ ˇ jf .t/j dt: f .t/ dt ˇ . ˇ ˇ ˇ ˛ ˛
347
Abschnitt 7.3 Konvergenz bei komplexen Zahlen
Beweis. Im Beweis seien die Integranden argumentfrei geschrieben. Wir setzen Z ˇ c´ f: ˛
Im Fall c D 0 ist die Behauptung trivial richtig. Im Fall c ¤ 0 betrachte man die Größe Z ˇ Z ˇˇ ˇ ˇf ˇ 1 ˇ ˇ: Q´ jf j D ˇcˇ jcj ˛ ˛ Die Behauptung ist dann Q % 1. Um dies nachzuweisen, beachtet man, dass Rˇ f ˛ c D 1 gilt. Man muss also für stetiges g W Œ˛; ˇ/ ! C die Implikation nachweisen: Z Z ˇ
˛
g D 1 H)
ˇ
˛
jgj % 1:
Setzt man g D u C iv (mit reellen Funktionen u; v), so gilt nach Voraussetzung Rˇ ˛ u D 1, also wird ˇZ ˇ Z ˇ Z ˇp Z ˇ ˇ ˇ ˇ ˇ ˇ u2 C v 2 % juj % ˇ uˇ D 1: jgj D ˇ ˇ ˛ ˛ ˛ ˛ Dabei wurde zum Schluss die Dreiecksungleichung für reelle Integrale verwendet. " Warnung: Die Übertragung reeller Prinzipien auf C ist problematisch, wenn im Reellen von der Anordnung Gebrauch gemacht wurde. Die Anordnung ist eine typisch reelle Relation, die nicht sinnvoll aufs Komplexe ausgedehnt werden kann. So gibt es z.B. keinen Zwischen- oder Mittelwertsatz für komplexwertige Funktionen in der gewohnten Form. Nun folgen einige einfache Eigenschaften für den allgemeineren Funktionentyp (5)
f W B &! C;
B offene Teilmenge von C:
Was Grenzwerte in C und Stetigkeit betrifft, so ist hier nichts Neues zu erklären, da sich diese Begriffe denen für metrische Räume unterordnen. Darüber hinaus existieren aber Besonderheiten, die untersucht werden müssen. Eine solche Besonderheit sind die uneigentlichen Grenzübergänge. Diese hängen im Reellen stark an der Anordnung, müssen also für C modifiziert werden. Das Grundmuster ist dasselbe wie in den Definitionen A, C, F von Abschnitt 3.5. Der wichtigste Unterschied ist der, dass zu C nur ein uneigentliches Element 1 hinzugefügt wird: b C ´ C [ f1g: Dadurch gestaltet sich die Situation im Komplexen eher einfacher, weil es nicht mehr ganz so viele Kombinationen gibt. Man nennt b C die erweiterte komplexe Ebene.
348
Kapitel 7 Die komplexen Zahlen
D. Definition (uneigentliche Grenzübergänge im Komplexen). Es sei f eine Funktion vom Typ (5) sowie b; c 2 C. (i)
Ist b Häufungspunkt von B, so wird definiert
lim f .z/ D 1 W () 8 E > 0 9 ı > 0 8 z 2 A mit 0 < jz&bj < ı W jf .z/j > E:
z!b
(ii)
Ist B nicht beschränkt, so wird definiert: lim f .z/ D c W () 8 " > 0 9 D > 0 8 z 2 A mit jzj > D W jf .z/ & cj < "
z!1
lim f .z/ D 1 W () 8 E 2 R 9 D > 0 8 z 2 A mit jzj > D W jf .z/j > E:
z!1
E. Beispiel. Es gilt lim
z!0
1 D 1; z
lim
z!1
1 D 0; z
lim z 3 D 1:
z!1
Man bestätigt sehr leicht durch einfache Ungleichungen, dass die voranstehenden Definitionen erfüllt sind: So wird für z ¤ 0: j1=zj > E, falls jzj < 1=E (also tut es ı ´ 1=E); für z ¤ 0: j1=zj > ", falls jzj > 1=" (also tut es D ´ 1="); jz 3 j > E, falls jzj > max fE; 1g (also tut es D ´ max fE; 1g). Die uneigentlichen Grenzübergänge können wie in G(ii)[3.5] durch Reziprokenbildung auf die Nullkonvergenz zurückgeführt werden, wobei die Begründung fast genauso verläuft: (6) (7) (8)
1 D0 z!b z!b f .z/ . / 1 Dc lim f .z/ D c () lim f z!1 w!0 w lim f .z/ D 1 () lim
1 . / D0 z!0 1 f w
lim f .z/ D 1 () lim
z!1
Korrespondierend werden analog zu (6)[3.5] einige Regeln zwischen Unendlich und den komplexen Zahlen verabredet: Für alle a 2 C sei: &.1/ D 1; (9)
j1j D 1
aC1D1Ca D1
a ( 1 D 1 ( a D 1 für a ¤ 0 a D 0; 1
1 D 1: 0
Abschnitt 7.3 Konvergenz bei komplexen Zahlen
Dagegen sind Kombinationen wie 0 ( 1,
349
1 und 1 ˙ 1 nicht definiert. 1
Nun wollen wir uns mit einigen Eigenschaften der komplexen e-Funktion beschäftigen. Sie ist von der Gestalt (5) mit B D C, lässt sich aber vom zuvor betrachten Typ her erschließen: F. Lemma. Sei A , R und 0 W A ! C in a 2 A differenzierbar. Dann ist e + W A ! C ebenfalls in a differenzierbar, und es gilt .e + /0 .a/ D e +.a/ ( 0 0 .a/: Beweis. Die Kettenregel in B(iii) ist hier nicht zuständig, da die komplexe Exponentialfunktion i. Allg. komplexe Argumente hat. Schreibt man wieder 0 D uCiv mit reellen Funktionen u; v, so wird e + D e u .cos vC i sin v/, und es sind mit 0 auch u; v in a differenzierbar, also auch e + . Die Ableitung berechnet man als .e + /0 .a/ D e u.a/ u0 .a/.cos v.a/ C i sin v.a// C e u.a/ .& sin v.a/ ( v 0 .a/ C i cos v.a/ ( v 0 .a// D e u.a/ .cos v.a/ C i sin v.a//.u0 .a/ C iv 0 .a/ D e +.a/ ( 0 0 .a/; wie behauptet.
"
G. Folgerung. (i)
Ist 0 W Œ˛; ˇ/ ! C stetig differenzierbar, so gilt Z ˇ e +.t / 0 0 .t/ dt: e +.ˇ / & e +.˛/ D ˛
(ii) Für z1 ; z2 2 C gilt e min fRe z1 ;Re z2 g ( jz1 & z2 j . je z1 & e z2 j . e max fRe z1 ;Re z2 g ( jz1 & z2 j: Beweis. Zu (i): Dies folgt sofort aus der Ableitungsregel von F: .e + /0 .t / D e +.t / ( 0 0 .t / durch Integration über Œ˛; ˇ/ mittels des Hauptsatzes der Differential- und Integralrechnung. Zu (ii): Man verbindet z1 ; z2 geradlinig, d.h. man definiert die Abbildung 0 W Œ0; 1/ ! C durch 0.t/ ´ z1 C t.z2 & z1 /. Diese hat die (konstante) Ableitung 0 0 .t/ D z2 & z1 und erfüllt 0.0/ D z1 und 0.1/ D z2 . Damit folgt aus (i) Z 1 z2 z1 e +.t / .z2 & z1 / dt: e &e D 0
350
Kapitel 7 Die komplexen Zahlen
Übergang zum Betrag, Anwendung der Dreiecksungleichung und von (3)[7.2] liefert hieraus die Behauptung, da Re 0.t/ D Re .z1 C t.z2 & z1 // D .1 & t/Re z1 C t Re z2 , was für t 2 Œ0; 1/ im abgeschlossenen Intervall mit Endpunkten Re z1 und Re z2 liegt. " H. Satz. Die komplexe e-Funktion exp W C ! C ist auf jeder Halbebene fz 2 C j Re z . ˇg Lipschitz-stetig mit der Lipschitz-Konstanten e ˇ . Somit ist exp W C ! C insgesamt stetig. Beweis. Aus der oberen Abschätzung in G(ii) folgt für z1 ; z2 in dieser Halbebene je z1 & e z2 j . e ˇ ( jz1 & z2 j: Wegen d.z; w/ D jz & wj ist das die Behauptung.
"
Man beachte die Analogie der Aussagen G(ii) und H mit den entsprechenden reellen Aussagen in A[3.7] und B(ii)[3.7]! Die obige Definition der komplexen e-Funktion in A[7.2] („Trauung von Kosinus und Sinus“) hat ihren Reiz, fällt aber etwas vom Himmel (wie so manches Wunder). Dass diese Definition gerechtfertigt war, zeigt sich aber jetzt an folgender Kennzeichnung: I. Satz. Sei a 2 C fest. Dann existiert genau eine nicht identisch verschwindende Funktion f W R ! C mit: (F) (D)
f .t C s/ D f .t/ ( f .s/
für alle t; s 2 R
f ist in 0 differenzierbar und f 0 .0/ D a:
Diese Funktion ist f .t/ D e at . Für a ¤ 0 folgt aus f 0 .0/ D a automatisch, dass f nicht identisch null ist. Beweis von I. Existenz: Mittels C(i)[7.2] und Lemma F folgt leicht, dass e at alle Forderungen erfüllt. Eindeutigkeit: Sei f ¤ 0 beliebig mit (F), (D). Aus (F) folgt für s D 0: f .t/ D f .t/ ( f .0/. Nach Voraussetzung gibt es mindestens ein t 2 R mit f .t/ ¤ 0. Somit ist f .0/ D 1. Nun folgt aus der Differenzierbarkeit in 0 die Differenzierbarkeit überall. Dazu bildet man den Differenzenquotienten bei t 2 R und rechnet mit Hilfe von (F) um: f .t C h/ & f .t/ f .t/f .h/ & f .t/ f .h/ & 1 f .h/ & f .0/ D D ( f .t/ D ( f .t/: h h h h
Abschnitt 7.3 Konvergenz bei komplexen Zahlen
351
Hieraus folgt mittels (D): f .t C h/ & f .t/ D f 0 .0/ ( f .t/ D a ( f .t/: h h!0 lim
Also ist f in t differenzierbar und f 0 .t / D af .t/. Damit folgt weiter wie in I(ii)[4.3] .e &at f .t//0 D e &at ( .&a/ ( f .t/ C e &at f 0 .t / D e &at ( .&a/ ( f .t/ C e &at ( af .t/ D 0; also e &at f .t/ D const. D 1 (setze t D 0). Dies impliziert f .t/ D e at .
"
Für einen Beweis von Satz I mittels Potenzreihen vgl. Kneser[2004]. Holomorphie Eine für komplexe Funktionen spezifische Regularitätseigenschaft ist die Holomorphie. Die folgende Definition ist motiviert durch die obige Kettenregel für die komplexe e-Funktion. Es handelt sich um eine vorläufige Erklärung, die es erlaubt, mit diesem Begriff umzugehen, ohne die Feinheiten der mehrdimensionalen Analysis zu bemühen. Trotz ihrer Vorläufigkeit wird sich diese Definition später als die endgültig richtige herausstellen. Nach wie vor geht es hier um Funktionen mit echt komplexer Definitionsmenge des Typs (5). J. Definition. Die Funktion f W B ! C (5) heißt holomorph oder analytisch, wenn e W B ! C gibt, sodass für alle stetig differenzierbaren es eine stetige Funktion f Funktionen 0 W Œ˛; ˇ/ ! B die Komposition f ı 0 W Œ˛; ˇ/ ! C differenzierbar ist mit der Ableitung (10)
e.0.t// ( 0 0 .t / für alle t 2 Œ˛; ˇ/: .f ı 0/0 .t/ D f
Aufgrund der Gleichung (10) ist dann f ı 0 sogar stetig differenzierbar. K. Beispiele. (i) Die komplexe e-Funktion exp W C ! C ist nach Lemma F holomorph; hierbei e.z/ D e z . ist f e existie(ii) Die Konjugation f W C ! C, f .z/ ´ z, ist nicht holomorph: Würde f ren, so wäre speziell für 0.t/ ´ a C tb mit festen a; b 2 C, da f .a C tb/ D a C t b: e.a C bt/ ( b; bD f e.a/ ( b. Dies wäre also für alle a; b 2 C richtig, was also speziell für t D 0: b D f e.a/ D 1, somit b D b offensichtlich unmöglich ist: Setzt man b D 1, dann folgte f für alle b 2 C, also &i D i , Widerspruch!
352
Kapitel 7 Die komplexen Zahlen
L. Lemma. Ist f W B ! C holomorph, so ist f stetig. Beweis. Das Argument ist ungefähr das gleiche wie bei G(ii). Um die Stetigkeit von f in a 2 B zu zeigen, wähle man einen Ball B.a; r/ * B. Ist z 2 B.a; r/ gegeben, so verbinde man a mit z geradlinig durch 0 W Œ0; 1/ ! B.a; r/ mit 0.t/ ´ a C t.z & a/. e.0.t//0 0 .t / folgt durch Dann gilt 0.0/ D a, 0.1/ D z, und aus .f ı 0/0 .t / D f Integration Z 1 e.0.t// ( .z & a/dt; f .z/ & f .a/ D f 0
also
e.%/j: jf .z/ & f .a/j . jz & aj ( max j f /2B.a;r/
Aus dieser Vorausabschätzung liest man die Stetigkeit von f in a ab.
"
e eindeutig bestimmt. Man erkennt das, indem man Ist die Definition J erfüllt, so ist f e die komplexe Abein 0 mit nullstellenfreier Ableitung 0 0 wählt. Man nennt dann f 0 e leitung von f und schreibt f µ f . Die definierende Gleichung (10) nimmt also endgültig die Gestalt der Kettenregel an: (11) kurz
.f ı 0/0 .t / D f 0 .0.t // ( 0 0 .t / für alle t 2 Œ˛; ˇ/; .f ı 0/0 D .f 0 ı 0/ ( 0 0 :
M. Beispiele. (i) Die Identität f W C ! C, f .z/ ´ z, ist holomorph mit der Ableitung f 0 .z/ D 1. Denn f ı 0 D 0 und 0 0 D 1 ( 0 0 . (ii) Eine konstante Funktion, definiert auf einer offenen Menge B , C, ist holomorph mit der Ableitung 0. (iii) Für die Exponentialfunktion gilt nach K(i) wie im Reellen: exp0 D exp. (iv) Ist f W B ! C holomorph mit der Ableitung f 0 W B ! C und C , B offene Teilmenge, so ist auch f jC W C ! C holomorph mit der Ableitung f 0 jC W C ! C. Man braucht ja speziell nur die Abbildungen 0 mit Bild in C zu betrachten. N. Bemerkung (zur Koinzidenz). Sei f W B ! C wie oben holomorph und B \R ¤ ¿. Dann ist B \ R offen in R. Ist nämlich a 2 B \ R gegeben, so wird R von jedem Ball B.a; r/ , B im Intervall /a & r; a C rŒ geschnitten. Die Restriktion f jB \ R bildet dann B \ R in C hinein ab, und es gilt .f jB \ R/0 .a/ D f 0 .a/, wobei links die Ableitung im Sinne von B(ii) steht und rechts die Auswertung der komplexen Ableitung. Dies folgt unmittelbar aus (11), indem man dort als 0 die identische Abbildung von /a & r; a C rŒ wählt. Dann wird nämlich f j /a & r; a C rŒ D f ı 0 und 0 0 D 1.
Abschnitt 7.3 Konvergenz bei komplexen Zahlen
353
Durch reine Rechnung folgt nun die Gültigkeit vertrauter Regeln: O. Satz (Rechenregeln für die komplexe Ableitung). Sind die Funktionen f; g W B ! C und h W C ! C holomorph mit f .B/ , C , so sind auch f C g; f ( g; h ı f W B ! C holomorph, und es gilt für alle z 2 B .f C g/0 .z/ D f 0 .z/ C g 0 .z/ .f ( g/0 .z/ D f 0 .z/g.z/ C f .z/g 0 .z/ .h ı f /0 .z/ D h 0 .f .z// ( f 0 .z/: Auch die in B0 ´ B n g &1 .0/ definierte Funktion f =g W B0 ! C ist holomorph mit .
f g
/0
.z/ D
f 0 .z/g.z/ & f .z/g 0 .z/ : g.z/2
Beweis. In allen Fällen ergibt sich der Beweis aus den entsprechenden Regeln für reelle Argumente, zusammen mit der Definitionsgleichung (11). Wegen der Stetigkeit von g ist B0 offen. Als Muster seien die Produkt- und Kettenregel überprüft: Zur Produktregel: Es gilt ..f ( g/ ı 0/0 .t / D ..f ı 0/ ( .g ı 0//0 .t / D .f ı 0/0 .t /.g ı 0/.t/ C .f ı 0/.t/.g ı 0/0 .t / D f 0 .0.t //0 0 .t/.g ı 0/.t / C .f ı 0/.t/g 0 .0.t //0 0 .t / D .f 0 g C g 0 f /.0.t //0 0 .t /: Zur Kettenregel: Es gilt ..h ı f / ı 0/0 .t / D .h ı .f ı 0//0 .t/ D h0 ..f ı 0/.t //.f ı 0/0 .t / D h0 .f .0.t ///f 0 .0.t //0 0 .t /: Daraus folgen nach Definition J die Behauptungen.
"
Aus der Produktregel ergibt sich z.B. mittels vollständiger Induktion, dass die komplexe Potenzfunktion z 7! z n (mit festem n 2 N) die komplexe Ableitung z 7! nz n&1 besitzt. Mit diesen Feststellungen ist die tiefere Bedeutung der holomorphen Funktionen bei weitem noch nicht ausgeschöpft. Wir werden in den folgenden Kapiteln noch manche der interessanten Eigenschaften dieser Funktionen ans Tageslicht bringen. Der endgültige Ausbau der Holomorphietheorie erfolgt in dem weiterführenden Gebiet der Funktionentheorie.
354
Kapitel 7 Die komplexen Zahlen
$ Einpunktkompaktifizierung von C Mit R2 ist auch C vollständig, aber nicht kompakt. Jedoch kann die erweiterte komplexe Ebene b C D C [ f1g zu einem kompakten Raum gemacht werden (Einpunktkompaktifizierung von C). Die Konstruktion verläuft völlig analog zur Einpunktkompaktifizierung von R, die am Schluss von Abschnitt 6.4 beschrieben wurde: An die Stelle der Einheitskreislinie tritt jetzt die Euklidische Einheitssphäre ˇ , ˚ S2 ´ .X; Y; Z/ 2 R3 ˇ j.X; Y; Z/j D 1 ; wobei die senkrechten Striche die Euklidische Norm bezeichnen: p j.X; Y; Z/j ´ X 2 C Y 2 C Z 2 : Die zugehörige Distanz in R3 ist für P D .X; Y; Z/ und Q D .U; V; W / gegeben durch p d.P; Q/ ´ jP & Qj D .X & U /2 C .Y & V /2 C .Z & W /2 : Diese definiert wirklich eine Metrik auf R3 , die Euklidische Standard-Metrik, die aber zur Maximumsmetrik äquivalent ist. Als beschränkte und abgeschlossene Teilmenge von R3 ist S2 kompakt. An die Stelle der Abbildung (3)[6.4] tritt nun (12) 2
F W C &! S n f.0; 0; 1/g
mit
.
F .z/ ´
/ 2x 2y jzj2 & 1 ; ; ; jzj2 C 1 jzj2 C 1 jzj2 C 1
wobei z D x C iy mit x; y 2 R gesetzt ist. Die Analogie zu (3)[6.4] ist bis auf eine leichte Permutation der Koordinaten und einen Vorzeichenwechsel evident. Geometrisch erhält man F .z/ aus z D x C iy, indem man den Punkt .x; y; 0/ der .x; y/Ebene des R3 mit dem Nordpol N ´ .0; 0; 1/ 2 S2 geradlinig verbindet. F .z/ ist dann der Schnittpunkt der Verbindungsgeraden mit S2 (so genannte stereographische Projektion aus dem Nordpol). Man bestätigt, dass die Bildpunkte von F tatsächlich auf S2 liegen, ja dass F sogar einen Homöomorphismus von C auf die punktierte Sphäre S2 n fN g vermittelt. Die Stetigkeit der Umkehrabbildung F &1 W S2 n fN g ! C ergibt sich dabei aus deren expliziten Darstellung als Restriktion von .X; Y; Z/ 7&!
X C iY 1&Z
auf S2 n fN g. Nun definiert man in weiterer Analogie zum reellen Fall eine so genannte chordale Metrik dc auf C durch dc .z; w/ ´ d.F .z/; F .w//;
355
Abschnitt 7.3 Konvergenz bei komplexen Zahlen
d.h. dc ist die von F auf C induzierte Metrik. Hierbei ist dc .z; w/ nichts anderes als die Euklidische Distanz der beiden Punkte F .z/; F .w/, d.h. die Länge der Sehne zwischen diesen beiden Sphärenpunkten. Explizit ergibt sich 2jz & wj : dc .z; w/ ´ p p 1 C jzj2 1 C jwj2 Nach P[6.2] ist dc zur Euklidischen Standard-Metrik auf C äquivalent. Der entscheidende Schritt verläuft nun so: Der bisher ausgelassene Punkt N D .0; 0; 1/ auf S2 wird jetzt mitbetrachtet, und als sein Urbild unter F wird das uneigentliche Element 1 zu C hinzugefügt. Man setzt somit, F und dc erweiternd: F .1/ ´ N (13)
dc .z; 1/ ´ d.F .z/; N / D p
2 1 C jzj2
;
dc .1; 1/ ´ d.N; N / D 0;
wobei das vorvorletzte Gleichheitszeichen durch explizite Rechnung zustande kommt. C D C [ f1g (mit Metrik Dann vermittelt F insgesamt eine Isometrie zwischen b dc ) und S2 (mit Metrik d ). Erst recht ist F ein Homöomorphismus von b C auf S2 . 2 2 Da S kompakt ist und S n fN g als dichte Teilmenge enthält, trifft das Gleiche für die Urbilder zu: b C ist kompakt und C liegt dicht in b C . Man nennt S2 als Bild der erb weiterten komplexen Ebene C unter F die Riemannsche Zahlenkugel. Jeder Punkt der Riemannschen Zahlenkugel S2 repräsentiert eine komplexe Zahl, jedoch mit einer Ausnahme: der Punkt N D .0; 0; 1/ repräsentiert 1. In einem anschaulich vergröberten Bild kann man sagen: Die Riemannsche Zahlenkugel ist gepflastert mit komplexen Zahlen bzw. genau an einer Stelle, N , mit 1. P. Bemerkung (Bälle mit Mittelpunkt 1). Die chordale Metrik dc auf b C ist durch die Zahl 2 nach oben beschränkt. Ein offener Ball Bc .1; R/ bzgl. der chordalen Metrik mit Radius R < 2 enthält außer dem Mittelpunkt 1 die komplexen Zahlen z mit 2 < R: p jzj2 C 1 Vgl. (13). Dies rechnet sich um zu jzj >
r
4 & 1: R2
Diese Bälle mit Mittelpunkt 1 sind also die Komplemente der abgeschlossenen Euklidischen Bälle mit Zentrum 0. (Für R D 2 ist Bc .1; 2/ D b C n f0g, für R > 2 ist Bc .1; R/ D b C .) Hieraus folgt durch Vergleich mit Definition D, dass die dort definierten uneigentlichen Grenzübergänge dieselben sind wie die bzgl. der chordalen Metrik in b C.
356
Kapitel 7 Die komplexen Zahlen
Die Entsprechung der erweiterten komplexen Ebene mit der Riemannschen Zahlenkugel geht noch deutlich über das Topologische hinaus. Z.B. ist die stereographische Projektion F auf den eigentlichen Punkten „winkeltreu“. Dies und weitere Einzelheiten (auch der obigen Argumente) müssen wir allerdings auf später verschieben, bis die erforderlichen Hilfsmittel aus der mehrdimensionalen Analysis und Geometrie zur Verfügung stehen. Aufgaben und Anmerkungen 1. Die Dreiecksungleichung C für das Integral einer stetigen Funktion f W Œ˛; ˇ/ ! C geht genau dann in eine Gleichung über: ˇZ ˇ Z ˇ ˇ ˇ ˇ ˇ ˇ f .t/ dt ˇ D jf .t/j dt; ˇ ˇ ˛ ˇ ˛ wenn f von der Form ist f D c ( p mit einer Konstanten c 2 C und einer nichtnegativen stetigen Funktion p W Œ˛; ˇ/ ! RC 0. Lösungshinweis: Man benutze die Argumente im Beweis von C sowie die reelle Version K[5.2]. 2. Man zeige: lim e z existiert nicht. z!1
3. Für Funktionen des Typs f W A ! C mit A , R bzw. f W B ! R mit B , C können uneigentliche Grenzübergänge betrachtet werden, bei denen R zu R und C zu b C erweitert wird („gemischter Fall“). Man formuliere entsprechende Definitionen und zeige z.B. a) b) c)
lim e at D 1 und lim e at D 0 falls a 2 C mit Re a > 0;
t !1
lim e
t !1
t !&1
at
existiert nicht falls a 2 C mit Re a D 0; Im a ¤ 0 (jedoch falls a D 0).
lim e jzj D 1;
z!1
lim e &jzj D 0.
z!1
4. Die Funktion f W C ! C sei holomorph. Man beweise: a) Ist f 0 D 0, so ist f konstant. b) Hat f nur reelle Werte, so ist f 0 D 0, also f konstant. c) Ist neben f W C ! C auch g W C ! C holomorph und gilt: f .x/ D g.x/ für alle x 2 R, so folgt: f .z/ D g.z/ für alle z 2 C (Permanenzprinzip für holomorphe Funktionen auf C). 5. Die Funktionen Kosinus und Sinus können nach C fortgesetzt werden, indem man die Formeln aus F(iii)[7.2] übernimmt, d.h. für z 2 C setzt cos z ´
e iz C e &iz ; 2
sin z ´
e iz & e &iz : 2i
357
Abschnitt 7.3 Konvergenz bei komplexen Zahlen
Man zeige, dass die so definierten Funktionen cos; sin W C ! C holomorph sind und ihre komplexen Ableitungen die Gleichungen cos0 D & sin;
sin0 D cos
erfüllen. Welche der Grundeigenschaften des reellen Kosinus und Sinus bleiben erhalten? Gilt z.B. der trigonometrische Pythagoras cos2 z C sin2 z D 1 für alle z 2 C? 6. Analog behandle man die komplexen Fortsetzungen der hyperbolischen Funktionen, die entsprechend G[7.2] für z 2 C durch cosh z ´
e z C e &z ; 2
sinh z ´
e z & e &z 2
definiert sind. Eigentlich stellen diese im Komplexen nichts wesentlich Neues dar; denn es gilt ja cosh.iz/ D cos z; sinh.iz/ D i ( sin z: 7. Die Funktion f W R ! C sei stetig und erfülle für alle t; s 2 R die Funktionalgleichung f .t C s/ D f .t/ C f .s/: Man beweise: Es gibt eine Konstante c 2 C mit f .t/ D c ( t. Lösungshinweis: Man zeige der Reihe nach f .nt/ D nf .t / für n 2 N, f .rt/ D rf .t/ für r 2 Q und t 2 R. Daraus folgere man mit Hilfe der Stetigkeit: f .st/ D sf .t / für t; s 2 R. 8. Die Funktion f W C ! C sei holomorph, nicht identisch null und erfülle für alle z; w 2 C die Funktionalgleichung f .z C w/ D f .z/ ( f .w/: Man beweise: Es gibt eine Konstante c 2 C mit: f .z/ D e cz für alle z 2 C. Lösungshinweis: Man definiere bei (zunächst) festem z 2 C die Funktion g W R ! C durch g.t/ ´ f .tz/ und wende auf sie Satz I an. 9. Gegeben seien komplexe Zahlen z D x Ciy und w D uCiv mit x; y; u; v 2 R. a) Man definiert das Skalarprodukt hz; wi und die Determinante Œz; w/ durch hz; wi ´ xu C yv;
Œz; w/ ´ xv & yu:
(Das sind die gleichen Definitionen wie in der linearen Algebra.) Zeige: hz; wi D Re .zw/;
Œz; w/ D Im .zw/:
358
Kapitel 7 Die komplexen Zahlen
b) Sind z ¤ 0 und w ¤ 0, so ist der orientierte Winkel ! bzw. der (unorientierte) Winkel ' zwischen z und w definiert durch cos ! D
hz; wi ; jzj ( jwj
bzw. cos ' D
sin ! D
Œz; w/ ; jzj ( jwj
hz; wi ; jzj ( jwj
! 2 /&&; &/
' 2 Œ0; &/:
Man schreibt ! µ ^0 .z; w/ bzw. ' µ ^.z; w/. Man zeige: ^0 .z; w/ D Arg.zw/ D Arg
3w z
;
^.z; w/ D j^0 .z; w/j:
10. $ Für die stereographische Projektion F (12) gilt F .z/ D
jzj2 & 1 2 .x; y; 0/ C 2 N: C1 jzj C 1
jzj2
Da die Summe der Koeffizienten rechts gleich 1 ist, deduziere man, dass die zwei Punkte .x; y; 0/ und F .z/ stets auf einer Geraden durch N liegen. Zusammen mit den Eigenschaften: F .z/ 2 S2 und F .z/ ¤ N charakterisiert dies die Abbildung F .
7.4
Komplexe Polynome
Neben der Exponentialfunktion bilden die komplexen Polynome eine weitere Klasse von konkreten Abbildungen des Typs C ! C. Die Grundlagen gestalten sich genau wie bei den reellen Polynomen in Abschnitt 3.1, sodass wir sie nur zu referieren brauchen. Ein Polynom P über C ist eine Funktion P W C ! C mit einer Funktionsvorschrift der Gestalt: (1)
P .z/ D cn z n C cn&1 z n&1 C ( ( ( C c1 z C c0 :
Dabei sind n 2 N0 und cn ; : : : ; c0 2 C gegebene Konstanten. Ist n > 0 und cn ¤ 0, so sieht man, dass P auf C nicht beschränkt ist; denn es gilt ähnlich wie in (2)[3.1] (2)
jP .z/j Q %1& n jcn j ( jzj jzj
für jzj % 1;
wobei Q ´
jcn&1 j C ( ( ( C jc0 j : jcn j
Abschnitt 7.4 Komplexe Polynome
359
Hieraus folgt für die möglichen Nullstellen % 2 C von P wie bei J[3.1] die Abschätzung % + jcn&1 j C ( ( ( C jc0 j : j%j . max 1; jcn j Insbesondere kann nicht jede komplexe Zahl Nullstelle von P sein. Daraus ergeben sich dann die Identitätssätze wie in K[3.1], wobei in der Formulierung jetzt einfach z 2 C anstelle von x 2 R zu lesen ist. Die Identitätssätze sind die Grundlage für die Methode des Koeffizientenvergleichs, die hier analog wie bei reellen Polynomen besteht. Insbesondere sind die Koeffizienten cj und das n in (1) allein durch die Zuordnung P bestimmt, falls cn ¤ 0. Man nennt dann n den Grad des Polynoms P und schreibt deg.P / ´ n, wobei die Gradregeln analog zu L[3.1] erhalten bleiben. Auch die Abspaltung einer Nullstelle wie bei (9)[3.1] und die Faktorisierung anhand der Gesamtheit der Nullstellen gestaltet sich wie dort. Speziell besitzt ein Polynom vom Grad n % 1 höchstens n Nullstellen in C. Tatsächlich ist die Existenz von Nullstellen im Komplexen dramatisch einfacher als im Reellen, weil sich der Kofaktor in e in (11)[3.1] stets als eine komplexe Konstante erweist. Im der Art des dortigen Q Komplexen zerfällt also ein Polynom immer. Diese Tatsache ist allerdings nicht durch Übertragung der einfachen algebraischen Argumente, die bis hierher möglich waren, zu erhalten. Er ist eine Konsequenz des Fundamentalsatzes der Algebra, der besagt, dass jedes komplexe Polynom vom Grad % 1 eine Nullstelle in C besitzt. Dieser Satz war jahrhundertelang offen, bis er 1799 vom 22-jährigen Gauß in seiner Doktorarbeit bewiesen wurde. Heutzutage kann man ihn sehr elegant mittels holomorpher Funktionen begründen. Einen elementareren Beweis mit den bisher entwickelten Hilfsmitteln werden wir gleich im Anschluss vorstellen. Die eben genannte Konsequenz des Fundamentalsatzes der Algebra sei jedoch gleich hier festgehalten: A. Satz. Sei P ein Polynom über C vom Grad n % 1 mit den paarweise verschiedenen komplexen Nullstellen a1 ; : : : ; ak und dem Leitkoeffizienten c. Dann besteht eine Faktorisierung der Gestalt P .z/ D c ( .z & a1 /&1 ( ( ( .z & ak /&k mit natürlichen Zahlen (1 ; : : : ; (k der Summe (1 C ( ( ( C (k D n. Hierin ist (j jeweils die Vielfachheit von aj als Nullstelle von P (j D 1; : : : ; k). Man sagt dafür auch, dass jedes Polynom über C vom Grad n % 1 vollständig in Potenzen von Linearfaktoren zerfällt. Die Kenntnis einer solchen Faktorisierung ist äquivalent mit der Kenntnis aller komplexen Nullstellen von P einschließlich der Vielfachheiten (wobei c dann der Leitkoeffizient von P ist). Beweis von A (unter Verwendung des Fundamentalsatzes der Algebra). Man führt eine vollständige Induktion nach dem Grad n durch.
360
Kapitel 7 Die komplexen Zahlen
Induktionsanfang: Für n D 1 ist die Behauptung klar, denn P .z/ D cz Cb kann in der Form P .z/ D c.z & a/ mit a WD &b=c geschrieben werden, und a ist offensichtlich die einzige Nullstelle (und hat die Vielfachheit 1). Induktionsschluss: Ist das Polynom P vom Grad nC1 % 2 gegeben, so besitzt es nach dem Fundamentalsatz der Algebra eine Nullstelle a 2 C mit einer Vielfachheit ( 2 N. Dann kann nach dem gleichen Argument wie im Reellen die zugehörige Potenz des Linearfaktors abgespalten werden: P .z/ D .z & a/& P $ .z/; wobei der Kofaktor P $ ein Polynom vom Grad m ´ .n C 1/ & ( ist mit P .a/ ¤ 0. Nach Induktionsvoraussetzung besitzt dieser eine Faktorisierung der Gestalt P $ .z/ D c.z & a1 /&1 ( ( ( .z & a` /&` mit paarweise verschiedenen a1 ; : : : ; a` 2 C und (1 ; : : : ; (` 2 N, wobei (1 C ( ( ( C (` D m gilt. Setzt man k WD ` C 1, ak ´ a, (k D (, so folgt zusammengenommen P .z/ D c ( .z & a1 /&1 ( ( ( .z & ak /&k
mit (1 C ( ( ( C (k D n C 1:
Durch Vergleich des höchsten Koeffizienten folgt, dass c der Leitkoeffizient von P ist. Weiter verschwindet der jeweilige Kofaktor von .z & aj /&j an der Stelle aj nicht, sodass aj wirklich Nullstelle von P der Vielfachheit (j ist (j D 1; : : : ; k). " Aus reeller Sicht ist es von Bedeutung, dass man ein reelles Polynom (5)[3.1]: (3) P .x/ D an x n C an&1 x n&1 C ( ( ( C a1 x C a0 ;
aj 2 R
für j D 0; : : : ; n
auch als komplexes Polynom mit reellen Koeffizienten auffassen kann: (4) P .z/ D an z n C an&1 z n&1 C ( ( ( C a1 z C a0 ;
aj 2 R
für j D 0; : : : ; n:
Bei solchen Polynomen treten die Nullstellen immer in Paaren konjugiert komplexer Zahlen auf: B. Lemma. Ist b 2 C Nullstelle eine Polynoms P mit reellen Koeffizienten der Vielfachheit (, so ist auch b Nullstelle des Polynoms P mit der gleichen Vielfachheit (. Beweis. Mittels der Darstellung (4) berechnet man für alle z 2 C: P .z/ D
n X kD0
ak z k D
n X
ak z k D
kD0
n X
ak z k D P .z/:
kD0
Nach Voraussetzung gilt für alle z 2 C mit einem Polynom Q$ P .z/ D .z & b/& ( Q$ .z/;
Q$ .b/ ¤ 0:
361
Abschnitt 7.4 Komplexe Polynome
Aus beidem zusammen folgt P .z/ D P .z/ D .z & b/& ( Q$ .z/ D .z & b/& ( Q$ .z/: Dabei ist R.z/ ´ Q$ .z/ wiederum ein Polynom, was man durch eine ähnliche Rechnung wie zu Beginn des Beweises sieht. Außerdem gilt: R.b/ D Q$ .b/ ¤ 0. Somit ist b Nullstelle von P der Vielfachheit (. " Für ein solches reelles Polynom P vom Grad n % 1 kann man nun mittels Satz A folgendermaßen weiter argumentieren: Es seien a1 ; : : : ; ar 2 R die paarweise verschiedenen reellen Nullstellen und b1 ; b 1 ; : : : ; bs ; b s 2 C n R die paarweise verschiedenen „echt“ komplexen Nullstellen von P . Dann hat die vollständige Ausfaktorisierung nach A die Gestalt (5) P .z/ D c (.z &a1 /n1 ( ( ( .z &ar /nr (.z &b1 /m1 .z &b 1 /m1 ( ( ( .z &bs /ms .z &b s /ms mit reellem Leitkoeffizienten c und entsprechenden Vielfachheiten der Summe n1 C ( ( ( C nr C 2m1 C ( ( ( C 2ms D n: Je zwei zusammengehörende Linearfaktoren der letzten Sorte lassen sich „reell“ zusammenfassen nach dem Muster .z & b/.z & b/ D .z 2 C 2pz C q/ wobei
2p ´ &b & b 2 R;
q ´ bb 2 RC :
„Reell“ bedeutet, dass in der Zusammenfassung die Koeffizienten 2p; q reell werden. Dabei gilt 1 1 1 q & p 2 D bb & .b C b/2 D & .b & b/2 D jb & bj2 > 0; 4 4 4 eine Bedingung an die reellen Koeffizienten, die garantiert, dass das quadratische Polynom z 2 C 2pz C q keine reellen Nullstellen besitzt. Wird dies in die Faktorisierung (5) entsprechend für alle konjugiert komplexen Nullstellenpaare eingebracht, so geht diese über in P .z/ D c ( .z & a1 /n1 ( ( ( .z & ar /nr ( .z 2 C 2p1 z C q1 /m1 ( ( ( .z 2 C 2ps z C qs /ms oder für reelle z D x (6) P .x/ D c (.x &a1 /n1 ( ( ( .x &ar /nr (.x 2 C2p1 x Cq1 /m1 ( ( ( .x 2 C2ps x Cqs /ms mit rein reellen Faktoren und (7)
qj & pj2 > 0 für j D 1; : : : ; s:
Die Darstellung (6) ist die reelle Faktorisierung eines reellen Polynoms P .
362
Kapitel 7 Die komplexen Zahlen
C. Beispiel. Man bestimme alle Nullstellen des Polynoms: P .x/ ´ 3x 4 & 7x 3 C 6x 2 C 2x & 4 sowie seine reelle Faktorisierung. Lösung: Zunächst versucht man es mit einer rationalen Nullstellensuche nach dem Lemma von Gauß O[3.1]: Soll der gekürzte Bruch pq mit p ¤ 0 in Z und q 2 N Nullstelle sein, so gibt es dafür höchstens folgende Möglichkeiten: p D ˙1; ˙2; ˙4
(die Teiler von 4)
q D 1; 3
(die positiven Teiler von 3).
Also kommen als rationale Nullstellen höchstens in Betracht: p 1 2 4 D ˙1; ˙ ; ˙2; ˙ ; ˙4; ˙ : q 3 3 3 Durch die Probe findet man, dass davon lediglich & 23 und 1 Nullstellen sind. Somit ( ) ist P .x/ durch x C 32 .x & 1/ teilbar, und das Divisionsverfahren ergibt: 3 2P .x/ D x C .x & 1/.3x 2 & 6x C 6/ D .3x C 2/.x & 1/.x 2 & 2x C 2/: 3 Die restlichen Nullstellen „stecken“ in der letzten Klammer. Tatsächlich hat diese nach der üblichen Formel für quadratische Gleichungen die Nullstellen 1 ˙ i . Somit liefert die letzte Zeile bereits die gewünschte reelle Faktorisierung, und die Nullstellen von P sind genau: & 32 ; 1; 1 C i; 1 & i: D. Bemerkung (Polynome vom Grad 1). Hat das Polynom P den Grad 1, so ist es von der Gestalt (8)
P .z/ D az C b
mit a; b 2 C; a ¤ 0:
Der einfachste Spezialfall ist jaj D 1, b D 0. Dann hat a die Form a D e i˛ mit ˛ 2 R. Man nennt die Abbildung von C in sich mit z 7! D˛ .z/ D e i˛ z die Drehung von C um den Winkel ˛. Setzt man z D x C iy und w D u C iv mit reellen x; y; u; v, so ist die Relation w D D˛ .z/ äquivalent mit u C iv D .cos ˛ C i sin ˛/.x C iy/, was durch Vergleich von Real- und Imaginärteil auf u D cos ˛ ( x & sin ˛ ( y v D sin ˛ ( x C cos ˛ ( y führt. Die somit definierten Drehungen entsprechen also den eigentlichen Drehungen, wie sie in der analytischen Geometrie betrachtet werden.
363
Abschnitt 7.4 Komplexe Polynome
Ein allgemeines Polynom (8) vom Grad 1 kann in der Form P .z/ D %e i˛ z C b
mit % > 0; ˛ 2 R; b 2 C
geschrieben werden. Als Abbildung von C in sich ist dann P eine Drehung D˛ , gefolgt von einer Streckung mit dem Faktor % > 0 (z 7! %z) und anschließender Translation mit b (z 7! z C b). Eine solche Komposition wird als Ähnlichkeit oder Homothetie bezeichnet. Komplexe Wurzeln Durch die Konstruktion der komplexen Zahlen ist viel mehr erreicht worden, als man ursprünglich wollte. Es hat nicht nur die Gleichung z 2 C 1 D 0 eine Lösung bekommen, sondern jede algebraische Gleichung (mit Koeffizienten in C). Das ist die Aussage des Fundamentalsatzes der Algebra. Als Vorstufe hierzu kann man die Existenz komplexer Wurzeln ansehen, der wir uns jetzt zuwenden. Es geht dabei um Gleichungen der Gestalt z n D w0
(9)
mit festem Grad n 2 N und gegebener rechter Seite w0 2 C. E. Satz und Definition. Ist w0 D r0 exp.i'0 / eine Polardarstellung von w0 , so hat die Gleichung (9) genau die Lösungen / . p '0 C 2k& n (10) zk ´ r0 exp i ; k D 0; : : : ; n & 1: n Ist w0 ¤ 0, so sind diese paarweise verschieden (also in der Anzahl n vorhanden). Ist w0 D 0, so sind diese alle gleich 0: die Gleichung z n D 0 hat nur die eine Lösung 0. Die zk in (10) nennt man die (komplexen) n-ten Wurzeln aus w0 . Beweis. Der Fall w0 D 0 ist nach der Nullteilerfreiheit, die in jedem Körper besteht, klar. Sei also jetzt w0 ¤ 0, somit r0 > 0. Die Unbekannte z sei ebenfalls in der Polardarstellung z D r exp.i'/ angesetzt. Dann ist (9) schrittweise äquivalent mit folgenden Zeilen: r n exp.i n'/ D r0 exp.i'0 / r n D r0 ; r n D r0 ; (11)
rD
p n r0 ;
exp.i n'/ D exp.i'0 /
n' & '0 D 2k& für ein k 2 Z 'D
'0 C 2k& für ein k 2 Z: n
364
Kapitel 7 Die komplexen Zahlen
Dabei wird (6)[7.2] verwendet. Zwei solche '-Werte wie in (11), etwa ' für k und e ' Q liefern genau dann die gleiche Lösung z D r exp.i'/ D r exp.i e ' /, wenn gilt: für k, '&e ' D 2g& für ein g 2 Z, also k& 2.k & e k/& '0 C 2k& '0 C 2 e & D D 2g&; n n n d.h. k&e k D g ( n für ein g 2 Z:
(12)
Sei M D f0; 1; : : : ; n&1g die Menge der in (10) genannten k-Werte. Zwei verschiedekj . n & 1), liefern also ne k; e k 2 M erfüllen die Bedingung (12) nicht (da 0 < jk & e verschiedene Lösungen. Dagegen gibt es zu jedem k 2 Z n M ein e k 2 M , das (12) erfüllt ( e k ist der „Rest“ der Division k=n), sodass also k und e k die gleiche Lösung liefern. Daraus folgt die Behauptung. " F. Beispiel. Für w0 D 1 handelt es sich um die Gleichung z n D 1. Hier ist r0 D 1, '0 D 0, also zk aus (10) gegeben durch / . 2k& 2k& 2k& D cos zk D exp i C i ( sin : n n n Diese n komplexen Zahlen nennt man die n-ten Einheitswurzeln. In der Standardveranschaulichung liegen diese Punkte auf dem Einheitskreis S1 mit Winkeln 2k0 gegen n z0 D 1,
Im z2 = i S1
z3
z1
z4 = -1
z0 = 1 Re
z5
z7 z6 = -i
365
Abschnitt 7.4 Komplexe Polynome
d.h. sie bilden die Ecken des gleichseitigen (= regulären) S1 einbeschriebenen n-Ecks, das 1 als Ecke enthält (das Bild zeigt den Fall n D 8). Daher heißt z n D 1 die Kreisteilungsgleichung. Mit ihrer Hilfe hat Gauß als Achtzehnjähriger bewiesen, dass das reguläre Siebzehneck mit Zirkel und Lineal konstruierbar ist, und er hat später alle solchermaßen konstruierbaren regulären n-Ecke bestimmt.
Rationale Funktionen Eine rationale Funktion F über C hat eine Funktionsvorschrift der Form (13)
F .z/ ´
P .z/ ; Q.z/
P; Q Polynome:
Die größtmögliche Definitionsmenge in C ist B ´ C n Q&1 .0/ (natürlich sei Q nicht das Nullpolynom, weil für dieses die Definitionsmenge von F leer wäre). Da Q nur endlich viele Nullstellen hat, ist F überall in C bis auf endlich viele isolierte Stellen definiert. Da die Identität z 7! z holomorph ist, folgt nach den Regeln O[7.3]: G. Lemma. Ein Polynom ist in ganz C holomorph. Eine rationale Funktion ist in ihrer (offenen) Definitionsmenge holomorph. " H. Beispiel. Durch vollständige Induktion erhält man die folgenden Ausdrücke für die komplexen Ableitungen ganzzahliger Potenzen der Identität im Fall p 2 N bzw. q 2 &N: f W C &! C; f .z/ ´ z p H) f 0 .z/ D pz p&1 g W C n f0g &! C;
g.z/ ´ z q H) g 0 .z/ D qz q&1 :
Über die Teilbarkeit von Polynomen und die Darstellungsmöglichkeiten rationaler Funktionen gilt Analoges wie im reellen Fall. Insbesondere besteht die Division mit Rest M[3.1] samt dem Divisionsalgorithmus genauso weiter, nur dass eben die Koeffizienten jetzt komplexe Zahlen sein dürfen. Aufgaben und Anmerkungen
) ( 1. Sei n % 3 eine natürliche Zahl. Zeige: exp i 20 ist unter allen n-ten Einheitsn wurzeln bestimmt als die einzige mit größtmöglichem Realteil < 1 und positivem Imaginärteil. 2. Beweise
p p p / . 2& 5&1 10 C 2 5 D Ci exp i 5 4 4
366
Kapitel 7 Die komplexen Zahlen
und schließe daraus 2& cos D 5
p
5&1 ; 4
2& sin D 5
p p 10 C 2 5 : 4
Lösungshinweis: Man behandle die Gleichung z 5 D 1 durch Abspalten der Nullstelle 1: z 5 & 1 D .z & 1/.z 4 C z 3 C z 2 C z C 1/; Durchdividieren von z 4 C z 3 C z 2 C z C 1 D 0 mit z 2 : / / . . 1 2 1 zC &1D0 C zC z z und Substituieren von w ´ z C z1 ; schließlich Anwenden von Aufgabe 1. 3. Analog zeige man
p . / 2& 1 3 exp i D& Ci : 3 2 2
4. Man untersuche die angegebenen Folgen in C auf Konvergenz und bestimme im Falle der Divergenz alle Häufungswerte: 0 p !n / . 1Ci 3 1Ci n a) cn D , b) cn D . 2 2 5. Man übertrage die Aufgaben 9 und 10 aus Abschnitt 3.1 entsprechend ins Komplexe. Man wird feststellen, dass alles sinngemäß erhalten bleibt! 6. Sei P ein komplexes Polynom mit der Eigenschaft: x 2 R H) P .x/ 2 R. Man beweise, dass alle Koeffizienten von P reell sind. Lösungshinweis: Man betrachte neben P das Polynom PR , das aus P entsteht, indem man alle Koeffizienten durch ihre Realteile ersetzt, und wende auf P und PR das Permanenzprinzip aus Aufgabe 4[7.3] an. 7. Man zeige (unter Verwendung des Fundamentalsatz der Algebra), dass zwei Polynome P und Q über C dann und nur dann keine gemeinsame Nullstelle haben, wenn sie teilerfremd sind. 8. Man beweise folgende komplexe Variante von Aufgabe 5[3.5]: Gegeben sei eine rationale Funktion F D P =Q wie in (13). Für ein b 2 C sei Q.b/ D 0. Die Stelle b gehört also nicht zur Definitionsmenge von F , liegt aber in deren Abschluss. Analog zu (10)[3.1] besitzen P und Q Faktorisierungen der Gestalt P .z/ D .z & b/k P $ .z/;
Q.z/ D .z & b/` Q$ .z/;
Abschnitt 7.5
$ Der Fundamentalsatz der Algebra nach Argand
367
wobei k 2 N0 und ` 2 N die entsprechenden Vielfachheiten sind. Bei P ist der Fall k D 0 (d.h. P .b/ ¤ 0) zugelassen. Stets ist P $ .b/ ¤ 0 und Q$ .b/ ¤ 0. Dann gilt: 8 ˆ 0 für k > ` ˆ ˆ < $ P .b/ lim F .z/ D für k D ` ˆ z!b Q$ .b/ ˆ ˆ :1 für k < `. In den Fällen k % ` kann also F in b stetig fortgesetzt werden. 9. Man beweise folgende komplexe Variante von Satz I[3.5]: Gegeben sei eine rationale Funktion F D P =Q wie in (13), wobei P .z/ ´ an z n C ( ( ( C a0 und Q.z/ ´ bm z m C ( ( ( C b0 mit an ¤ 0, bm ¤ 0 und n; m 2 N0 . Dann gilt: 8 ˆ 0 für m > n ˆ ˆ < an lim F .z/ D für m D n z!1 ˆ bn ˆ ˆ :1 für m < n. 10. Sei P ein Polynom vom Grad % 1 und T ein größter gemeinsamer Teiler von P und P 0 . Man zeige: a) Ist a eine Nullstelle von P der Vielfachheit ( % 1, so ist a eine Nullstelle von P 0 der Vielfachheit ( & 1 und auch eine Nullstelle von T der Vielfachheit ( & 1. b) Man bilde nun den Kofaktor zu T , also das Polynom T $ mit P D T T $ (z.B. mit dem Divisionsalgorithmus, angewandt auf P =T ) und zeige: Das Polynom T $
hat die gleichen Nullstellen wie P , aber alle von der Vielfachheit 1. Da T ohne Kenntnis der Nullstellen von P; P 0 mit dem Euklidischen Algorithmus berechenbar ist, so auch T $ . Hat man zur Ermittlung von T den Euklidischen Algorithmus verwendet, so kann man das Polynom T $ aus den dabei auftretenden Polynomen berechnen; vgl. Aufgabe 10[3.1].
7.5
$ Der Fundamentalsatz der Algebra nach Argand
Dieser Satz sagt aus, dass jedes (nichtkonstante) Polynom mit komplexen Koeffizienten wenigstens eine komplexe Nullstelle besitzt. Der erste Beweis dieses Satzes wurde von Gauß im Alter von 22 Jahren erbracht. Wir stellen hier eine andere, besonders elementare Beweisanordnung vor, die auf Argand zurückgeht. Ein rein algebraischer Beweis wird nicht möglich sein, da es ja Körper gibt, deren Polynome keine Nullstellen in dem Körper haben (z.B. R und Q). Tatsächlich macht jeder Beweis dieses
368
Kapitel 7 Die komplexen Zahlen
Satzes, so auch der folgende, zumindest von der Stetigkeit Gebrauch. Ein Polynom P W C ! C ist natürlich stetig; das ergibt sich z.B. daraus, dass P holomorph ist (G[7.4] und L[7.3]) oder durch Berechnung seines Real- und Imaginärteils und Anwendung von B(i)[7.3]. A. Satz (Fundamentalsatz der Algebra). Für jedes Polynom P W C ! C vom Grad n % 1 mit komplexen Koeffizienten: P .z/ D c0 C c1 z C ( ( ( C cn z n ;
cj 2 C für j D 0; : : : ; n;
existiert ein z0 2 C mit P .z0 / D 0. Beweis. Die Idee besteht darin, eine Minimalstelle der reellwertigen Betragsfunktion z 7! jP .z/j in C zu suchen und nachzuweisen, dass eine solche Minimalstelle sogar Nullstelle von P ist. Als Komposition von P mit dem Betrag ist die Betragsfunktion wiederum stetig. Weiter ist jP .z/j in C nicht beschränkt. Dies folgt leicht aus der Abschätzung (2)[7.4]. Aus diesen beiden Tatsachen schließen wir auf ein Minimum von jP .z/j in C: Sei m zunächst das Infimum von jP .z/j: ˇ ˚ , m ´ inf jP .z/j ˇ z 2 C : Dann existiert ˚ ˇ ein r >,0 mit: jP .z/j % mC1 für alle jzj % r. Nun ist die Kreisscheibe B.r/ ´ z ˇ jzj . r beschränkt und abgeschlossen, also kompakt, sodass auf ihr nach dem allgemeinen Extremalprinzip D[6.5] eine Minimalstelle z0 2 B.r/ existiert: jP .z0 /j . jP .z/j für alle z 2 B.r/. Da außerhalb B.r/ der Wert jP .z/j % m C 1 ist, gilt sogar m D jP .z0 /j . jP .z/j für alle z 2 C: Nun beweisen wir die Hauptsache: P .z0 / D 0. Ohne Einschränkung dürfen wir hierfür z0 D 0 annehmen (sonst kann man anstelle von P das Polynom Q.z/ ´ P .z C z0 / betrachten). Angenommen, es wäre P .0/ D c0 ¤ 0: Dann sei ck der Koeffizient mit niedrigstem Index k % 1, der ¤ 0 ist, sodass also (1)
P .z/ D c0 C ck z k C z kC1 H.z/
mit einem nicht näher interessierenden neuen Polynom H gilt. Wir betrachten die Hilfsgleichung aus dem „Anfangsstück“ von (1): c0 C ck z k D 0. Diese hat genau k Lösungen, nämlich die komplexen k-ten Wurzeln aus &c0 =ck . Wir greifen irgendeine dieser Wurzeln, etwa z1 , heraus, so dass also z1k D &
c0 ck
Abschnitt 7.5
$ Der Fundamentalsatz der Algebra nach Argand
369
gilt, und verfolgen das Verhalten von P längs der Geraden ftz1 j t 2 Rg: 0 ! kC1 z P .tz1 / D c0 C ck t k z1k C t kC1 z1kC1 H.tz1 / D c0 1 & t k C t kC1 1 H.tz1 / : c0 Die angegebene Gestalt dieser Funktion legt es nahe, dass für kleine t auch Werte vom Betrag < jc0 j angenommen werden. Tatsächlich kann man P .tz1 / für t 2 Œ0; 1/ folgendermaßen abschätzen, wenn man beachtet, dass wegen der Stetigkeit der reellen Funktion t 7! jH.tz1 /j auf Œ0; 1/ eine Konstante 0 > 0 existiert, sodass ˇ ˇ ˇ z kC1 ˇ ˇ 1 ˇ H.tz1 /ˇ . 0 für t 2 Œ0; 1/: ˇ ˇ ˇ c0 Damit folgt für t 2 Œ0; 1/: 3 3 jP .tz1 /j . jc0 j ( 1 & t k C 0 t kC1 D jc0 j 1 & t k .1 & 0 t/ : Die letzte große Klammer wird < 1 für 0 < t < 1=0, also gilt insgesamt: % + 1 ; jP .tz1 /j < jc0 j für 0 < t < min 1; 0 im Widersprach dazu, dass jP .0/j D jc0 j das Minimum aller jP .z/j ist.
"
Aufgaben und Anmerkungen 1. Zeige: Ein Polynom P vom Grad n % 1 ist als Abbildung P W C ! C stets surjektiv und genau dann injektiv, wenn n D 1 ist.
8
Weiterführung der Analysis
Dieses Kapitel dient der Entwicklung feinerer analytischer Werkzeuge wie der TaylorFormel und der Potenzreihen. Dazu kommen Anwendungen auf die Extrema von reellen Funktionen und die Konvexität. Gemeinsame Basis für viele dieser Aspekte sind die höheren Ableitungen, in denen sich subtilere Eigenschaften widerspiegeln als eben nur in den Ableitungen selber. Zunehmend einbezogen in die analytischen Entwicklungen werden nun auch die komplexen Zahlen. Diese sind von großer Bedeutung in der gesamten Mathematik, insbesondere auch in der Analysis. Darüber hinaus gibt es interessante Wechselbeziehungen zwischen dem reellen und komplexen Bereich, wie man schon am Nullstellenproblem für Polynome sehen kann. Manche der zukünftigen Themen sind eher reell orientiert, andere eher komplex. Natürlich wird man jeweils den adäquaten Gesichtspunkt hervorheben. Wir beginnen dieses Kapitel mit der Behandlung von Reihen, die eine besonders effektive Ausgestaltung der Folgen darstellen.
8.1
Reihen
Reihen sind Folgen, deren Elemente sukzessive Summen sind. Wenn eine Zahl dadurch entsteht, dass zum Vorhandenen immer wieder etwas hinzuaddiert wird, so handelt es sich um die Erzeugung dieser Zahl durch eine Reihe. Ein noch anschaulicheres Bild ist das eines Sees, zu dem schrittweise immer wieder ein neues Quantum Wasser hinzugegeben (oder auch aus ihm weggenommen) wird. Wenn die Beiträge rasch genug klein werden, wird sich ein stabiler Zustand herausbilden, sodass sich die Wassermenge des Sees nur noch beliebig wenig von einem festen Volumen unterscheidet. Dann wird man von Konvergenz sprechen. Es folgt die Präzisierung. Um den reellen und komplexen Fall nicht getrennt behandeln zu müssen, bezeichnen wir den verwendeten Körper mit K. Dieser ist also entweder R oder C. A. Definition. Ist eine Folge .ak /k2N in K gegeben, so ist die Reihe (1)
1 X kD1
ak D a1 C a2 C ( ( (
371
Abschnitt 8.1 Reihen
dasselbe wie die Folge .sn /n2N der Teilsummen (2)
sn ´
n X
ak D a1 C a2 C ( ( ( C an :
kD1
Die ak heißen die Glieder der Reihe. Wenn der Grenzwert der Teilsummen limn!1 sn µ s in K existiert, so heißt die Reihe (1) konvergent, und man schreibt: 1 X
(3)
ak D a1 C a2 C ( ( ( D s:
kD1
In diesem Fall wird s die Summe oder der Grenzwert (kurz auch der Wert) der Reihe genannt. Existiert ein solcher Grenzwert s nicht, so heißt die Reihe (1) divergent. Das Anschreiben von (3) (mit s 2 K) soll beinhalten, dass die Reihe konvergiert und den Grenzwert s hat. Die Indexmenge N kann genauso verallgemeinert werden wie bei Folgen in Abschnitt 2.1. Oft zählt man von 0 an, betrachtet also eine Reihe a0 C a1 C ( ( ( . Im Allgemeinen verwenden wir die Indizierung mit den natürlichen Zahlen. Die Modifikationen für andere Indexmengen sind leicht und offensichtlich. Eine endliche Summe b1 C ( ( ( C bn ordnet sich dem Reihenbegriff unter: Man kann sie als (konvergente) Reihe b1 C ( ( ( C bn C 0 C 0 C ( ( ( auffassen. Die Teilsummen brauchen nicht notwendig nach der Vorschrift (2) gebildet zu werden. Effektiver und anschaulicher ist ihre rekursive Erzeugung durch das Schema (4)
s1 ´ a1 ;
snC1 ´ sn C anC1 ;
n D 1; 2; : : :
Damit ist man in der eingangs beschriebenen Situation: „es wird zu dem Vorhandenen schrittweise immer wieder etwas hinzuaddiert“. B. Beispiele. (i)
Gegeben sei die Reihe
1 X kD1
1 1 1 1 D C C C (((. k ( .k C 1/ 1(2 2(3 3(4
Die Teilsummen sind: sn D
n X kD1
1 : k.k C 1/
In diesem Fall hat man Glück; denn die Teilsummen sind explizit berechenbar: Man schreibt die Reihenglieder als 1 1 1 D & : k ( .k C 1/ k kC1
372
Kapitel 8 Weiterführung der Analysis
Dann wird . sn D
1 1 & 1 2
/
"
. C
1 1 & 2 3 "
/
. C
"
1 1 & 3 4
/
. C ((( C
"
"
1 1 & n nC1
/ D
1 1 & : 1 nC1
"
Die markierten Terme heben sich gegenseitig weg; es handelt sich um eine Teleskopsumme. So verbleibt nur der erste Teil der ersten Klammer und der zweite Teil der letzten Klammer, und an dieser Darstellung von sn kann man unmittelbar den Grenzwert ablesen: sn D 1 &
1 nC1
H)
lim sn D 1:
n!1
Somit ist die Reihe konvergent und 1 X kD1
(ii)
Geometrische Reihe:
1 X
1 D 1: k ( .k C 1/
qk D 1 C q C q2 C ( ( ( .
kD0
Dabei ist die Zahl q 2 K fest gegeben; man nennt sie den Quotienten. Auch hier sind die Teilsummen explizit darstellbar, nämlich mit der geometrischen Summenformel D[1.3]: sn D 1 C q C q 2 C ( ( ( C q n D
1 & q nC1 1&q
für q ¤ 1:
1&0 Nach M(i)[2.1] und K[2.1] folgt für jqj < 1: sn ! , also gilt inklusive Konver1&q genz 1 X kD0
qk D
1 1&q
für jqj < 1:
Die zitierten Begründungen bestehen komplex genau wie im Reellen.
373
Abschnitt 8.1 Reihen
(iii) Harmonische Reihe: 1 X 1 1 1 D 1 C C C ((( : k 2 3
kD1
Hier sind die Teilsummen zwar nicht explizit bestimmbar, jedoch abschätzbar mittels Integralen. Denn es ist 1 % k
kC1 Z
k
dx ; x
da für x 2 Œk; k C 1/ gilt:
k
D 1
k + 1
x
1 1 % . Daraus folgt: k x
1 1 sn D 1 C C ( ( ( C % 2 n nC1 Z
1 x
Z2 1
dx C x
Z3 2
dx C ((( C x
nC1 Z
n
dx x
ˇnC1 ˇ dx D ln.n C 1/: D ln x ˇˇ x 1
Die Teilsummen sind also nach oben nicht beschränkt, da ln.n C 1/ für n ! 1 bestimmt gegen 1 divergiert. Somit ist 1 X 1 k
divergent:
kD1
Die Teilsummen wachsen hier „über alle Grenzen“ jedoch außerordentlich schleppend. Um z.B. sn > 10 zu erreichen, muss man mehr als zwölftausend Glieder aufsummieren! Die Annäherung an einen Grenzwert in K kann nur erfolgen, wenn die Reihenglieder selbst gegen null konvergieren: C. Satz (notwendiges Konvergenzkriterium). P Ist die Reihe 1 kD1 ak konvergent, so folgt limk!1 ak D 0. Beweis. Der Beweis beruht ganz einfach auf der rekursiven Erzeugung der Teilsummen (4) bzw. deren „Umkehrung“ durch anC1 D snC1 & sn ;
n D 1; 2; : : : :
374
Kapitel 8 Weiterführung der Analysis
Hieraus folgt unmittelbar mit den Rechenregeln für konvergente Folgen in K[2.1]: limn!1 anC1 D s & s D 0. " Warnung: Die Bedingung, dass die Glieder eine Nullfolge bilden, ist nicht hinreichend für die Reihenkonvergenz, wie man am obigen Beispiel der harmonischen Reihe sieht. D. Beispiel. Die geometrische Reihe .q k / keine Nullfolge ist.
P1
kD0
q k ist divergent, falls jqj % 1, da dann
E. Bemerkung. Die rekursive Erzeugung der Teilsummen aus den Gliedern s1 D a1 ;
snC1 D sn C anC1 ;
n D 1; 2; : : :
ist äquivalent zur Gewinnung der Glieder aus den Teilsummen: a1 D s1 ;
anC1 D snC1 & sn ;
n D 1; 2; : : : :
Hat man also eine Folge .sn /n2N in K vorgegeben, so gibt es genau eine Reihe mit den sn als Teilsummen, nämlich diejenige mit den gerade berechneten Gliedern ak : Folgen und Reihen und ihre Konvergenz sind in K ineinander umrechenbar. Für Bereiche, die keine additive Struktur besitzen, ist dies anders. Z.B sind Folgen in einem metrischen Raum nach wie vor sinnvoll, Reihen existieren i. Allg. aber gar nicht. Alle Konvergenzeigenschaften aus Kapitel 2 für Folgen können natürlich auf die Teilsummen sn angewandt werden. Dies trifft auch für die komplexen Analoga zu, soweit nicht die Anordnung von R betroffen ist. So ergeben sich die folgenden Sätze F und G unmittelbar aus den früheren Überlegungen: F. Satz (Rechenregeln für Reihen). Für Reihen und Grenzwerte a; b in K gelten die Schlüsse: 1 X
(i)
ak D a;
kD1
bk D b H)
kD1 1 X
(ii)
1 X
ak D a;
1 X
.ak C bk / D a C b
kD1
c 2 K H)
kD1
1 X
cak D ca:
kD1
Für Reihen und Grenzwerte a; b in R gilt der Schluss: (iii)
1 X kD1
ak D a;
1 X kD1
bk D b;
ak . bk für alle k 2 N H) a . b:
375
Abschnitt 8.1 Reihen
Beweis. Übertragung von K[2.1] und P[2.1].
"
In operativer Schreibweise lauten (i) und (ii) 1 X
.an C bn / D
nD1
1 X nD1
an C
1 X
1 X
bn ;
nD1
can D c
nD1
1 X
an ;
nD1
vorausgesetzt die Einzelwerte rechts existieren jeweils. G. Satz (Cauchy-Kriterium). Die Reihe Folgendes zutrifft:
P1
kD1
ak konvergiert genau dann, wenn
jedem "ˇ > 0 existiert ein N D N."/ 2 N, sodass für alle q % p > N gilt: ˇZu ˇ ˇPq ˇ kDp ak ˇ < ": Beweis. Übertragung von H[2.6] und I[2.6].
"
H. Bemerkungen. (i) Unterscheiden sich zwei Reihen nur in einem festen Anfangsstück, so ist ihr Konvergenz- bzw. Divergenzverhalten dasselbe. Wohl aber kann der Wert der Reihen — im Falle der Konvergenz — verschieden sein! Z.B. gilt im Falle der Konvergenz für festes n 2 N 1 n 1 X X X ak D ak C ak ; kD1
kD1
kDnC1
wie man unmittelbar an den entsprechenden Teilsummen erkennt. Der erste Bestandteil rechts ist die Teilsumme sn der Ausgangsreihe, der zweite wird als zugehöriger Fehler oder Reihenrest rn bezeichnet. Der Fehler ist das, was man zur Teilsumme sn hinzuaddieren muss, um den Reihenwert zu erhalten. (Wegen der vorausgesetzten Konvergenz gilt rn ! 0 für n ! 1.) Der Begriff des Reihenrests hat nur dann einen Sinn als Element von K, wenn die Reihe konvergiert. (ii)
Zwischen endlichen Summen und Reihen a1 C a2 C ( ( ( C an ;
a1 C a2 C ( ( (
besteht eine gewisse (jedoch nicht durchgängige) Analogie. Man kann fragen, ob Operationen, die für endliche Summen erlaubt sind, auch für Reihen gelten. Das ist unterschiedlich zu beantworten. Aufgrund des additiven Kommutativgesetzes im Körper K darf man in einer endlichen Summe sinnvoll Klammern setzen. (Tatsächlich ist eine endliche Summe von mehr als zwei Summanden geradezu definiert durch sinnvolle sukzessive Beklammerungen von jeweils nur zwei Körperelementen.) In einer konvergenten Reihe darf man ebenfalls
376
Kapitel 8 Weiterführung der Analysis
beliebig Klammern setzen, ohne das Konvergenzverhalten oder den Reihenwert zu verändern (wobei die Klammern jeweils endlich viele aufeinander folgende Glieder umfassen). Z.B. gilt für die geometrische Reihe mit q D &1=3 / . / . 1 1 1 1 1 1 1 1 1 1 1& C & C & C & C C( ( ( : C& ( ( ( D 1C & C & 3 9 27 81 243 3 9 27 81 243 Die Teilsummen der beklammerten Reihe bilden nämlich eine Teilfolge der Teilsummen der Ausgangsreihe. Klammern wegzulassen ist jedoch i. Allg. nicht erlaubt. Z.B. gilt .1 & 1/ C .1 & 1/ C ( ( ( D 0, aber natürlich ist 1 & 1 C 1 & 1 C & ( ( ( nicht konvergent, weil die Glieder keine Nullfolge bilden. Bei endlichen Summanden darf man als Folge des Kommutativgesetzes die Summanden permutieren. Bezieht sich eine solche Permutation nur auf endlich viele Glieder einer konvergenten Reihe, so passiert ähnlich wie bei (i) gar nichts: Konvergenz und Reihenwert bleiben unverändert. Bezieht sich die Permutation auf unendlich viele Glieder, so kann alles mögliche geschehen, je nachdem, wie die Reihe beschaffen ist. Diese Problematik wird im kleinen Umordnungssatz O[8.8] und im Riemannschen Umordnungssatz S[8.8] behandelt werden. Konvention: Manchmal verwendet man statt der ausführlichen Bezeichnung P P einer Reihe durch das Summenzeichen (1) die Schreibweise k ak oder sogar ak , und zwar auch dann, wenn die Indizes nicht bei 1 starten. Das ist bei bloßen Konvergenzfragen gerechtfertigt, da es dabei nicht auf ein Anfangsstück der Reihe ankommt; vgl. Bemerkung H(i). Als Nächstes seien zwei Fälle diskutiert, die sich nur aufs Reelle beziehen, da von der Anordnung Gebrauch gemacht wird. I. Definition. Eine alternierende Reihe in R hat die Gestalt (5)
a1 & a2 C a3 & C ( ( (
mit ak % 0 für alle k 2 N:
Auch a1 & a2 C a3 & C ( ( ( mit den Vorzeichenbedingungen: ak . 0 kann als alternierende Reihe bezeichnet werden, lässt sich aber leicht auf den obigen Typ zurückführen, nämlich mit F(ii) für c D &1. Wir behandeln nur die obige Variante (5), um Fallunterscheidungen zu vermeiden. J. Satz (Leibniz-Kriterium). Die alternierende Reihe (5) konvergiert, falls .ak /k2N eine monoton fallende Nullfolge ist. Beweis. Die Teilsummen sn geben Anlass zu einer Intervallschachtelung:
377
Abschnitt 8.1 Reihen
s
s4
s2
...
...
s3
s1
Es wird immer weniger subtrahiert, als vorher addiert wurde, bzw. immer weniger addiert, als vorher subtrahiert wurde. Wir zeigen präzise: .Œs2m ; s2m&1 //m2N ist eine Intervallschachtelung: Zunächst erkennt man die folgenden drei Punkte: ' .s2m /m%1 ist monoton wachsend: Aus s2.mC1/ D s2mC2 D s2m C a2mC1 & a2mC2 % s2m : ƒ‚ … „ %0
' .s2m&1 /m%1 ist monoton fallend: Aus s.2mC1/&1 D s2mC1 D s2m&1 &a2m C a2mC1 . s2m&1 : ƒ‚ … „ .0 ' s2m&1 & s2m D a2m &! 0. Sei nun s ´ limm!1 s2m D limm!1 s2m&1 der gemeinsame Grenzwert der Intervallenden (B[2.3]). Dann gilt: s2m . s . s2mC1 . s2m&1 , also (6)
0 . s & s2m . s2mC1 & s2m D a2mC1 0 D s & s . s2m&1 & s . s2m&1 & s2m D a2m :
Es folgt js & sn j ! 0 (für n ! 1).
"
J. Zusatz. Ist s die Reihensumme, so gilt für den Fehler s & sn die Abschätzung: (7)
0 . s & s2m . a2mC1 ;
&a2m . s & s2m&1 . 0
für alle m 2 N:
Ist .an /n%1 streng monoton fallende Nullfolge, so steht in (7) statt „.“ überall „ 1
p 9 q 2 R [ f1g W lim k jak j D q > 1 k!1 w 2 ) p 9 unendlich W k jak j % 1 viele k 2 N w 2 X ak divergent:
In beiden Fällen – vor und nach dem senkrechten Strich – handelt es sich um hinreichende Bedingungen für absolute Konvergenz bzw. für Divergenz. Die Bedingungen
380
Kapitel 8 Weiterführung der Analysis
sind „hierarchisch“ geordnet, angedeutet durch die Implikationspfeile. Man kann sich aussuchen, welche der Bedingungen man im Einzelfall nehmen will, um die Entscheidung über die letzte Zeile zu treffen. Wenn der Limes superior in den zweiten Zeilen als ungünstig erscheinen sollte, so bleiben immer noch die zwei anderen hinreichenden Bedingungen, die bei konkreten Reihen oftmals sehr nützlich sind. Beweis von P. Wir konzentrieren uns auf die linke Hälfte: Zum ersten Pfeil: Dieser folgt aus E[2.7]. Zum zweiten Pfeil: Dieser folgt aus C[2.7]; jedes q1 2 /q; 1Œ tut es. Direkt von der ersten zur dritten Zeile: Wenn man den Begriff des Limes superior ganz vermeiden will, so geht dieser Weg ganz einfach mit dem Meidungsprinzip J[2.1]. p k jak j . q1 < 1 folgt jak j . q1k , und daraus ergibt sich, dass Zum dritten Pfeil: Aus P k q1 eine konvergente Majorante ab k1 ist. Ebenso leicht überlegt man die rechte Hälfte. Die letzte Implikation folgt einfach daraus, dass unter der genannten Voraussetzung die Glieder keine Nullfolge bilden. " Q. Satz (Quotientenkriterium). Gegeben sei die Reihe alle k 2 N. Dann gilt: ˇ ˇ ˇ akC1 ˇ ˇDq1 9 q 2 R W lim ˇˇ ak ˇ k!1 w 2 ˇ ˇ ˇ akC1 ˇ ˇ % 1 8 k % k1 9 k1 2 N W ˇˇ ak ˇ w 2 X ak divergent:
Beweis. Die Argumente für die ersten Pfeile verlaufen wie oben beim Wurzelkriterium. Der dritte Pfeil rechts ist klar, da ab k1 alle jak j % jak1 j sind. Zum dritten Pfeil links: Die Voraussetzung impliziert, dass für alle k % k1 gilt: jakC1 j . q1 jak j, wobei ohne Einschränkung q1 > 0 angenommen werden kann.
381
Abschnitt 8.1 Reihen
Durch vollständige Induktion ergibt sich hieraus jak j . q1k&n1 jak1 j für diese k. Also hat man als Majorante ab k1 : 1 X
q1k&k1 jak1 j
kDk1
D
1 jak1 j X
q1k1
q1k ;
kDk1
die wegen 0 < q1 < 1 konvergiert.
"
R. Bemerkungen. (i) Etwas störend in der Formulierung des Quotientenkriteriums ist die Voraussetzung, dass alle Glieder ¤ 0 sein sollen. Man kann aber die vorletzte Zeile links in Q nennerfrei formulieren als: „Es gibt ein q1 2 Œ0; 1Œ und ein k1 2 N, sodass für k % k1 gilt: jakC1 j . q1 jak j“. Dann folgt hieraus ebenfalls die absolute Konvergenz der Reihe. Tatsächlich wird im Beweis nur diese nennerfreie Voraussetzung verwendet. (ii) Fasst man jeweils die nebeneinander stehenden Zeilen im Wurzel- und Quotientenkriteriums zusammen, so gelangt man zu äquivalenten aber etwas bündigeren Formulierungen. Z.B. gilt nach der ersten Zeile im Wurzelkriterium P lim
p k
k!1
jak j
X < 1 H) jak j >
absolut konvergent divergent,
vorausgesetzt, der Grenzwert links existiert in R [ f1g. Analog kann man die zweite Zeile in P und die erste Zeile in Q zusammenfassen. (iii) Jenseits aller Kriterien ist die einfachste Bedingung für Divergenz in Satz C enthalten: Bildet die Folge der Glieder keine Nullfolge, so ist die Reihe mit Sicherheit divergent. S. Beispiele. Ist beim Wurzel- oder Quotientenkriterium (in den ersten beiden Zeilen) q D 1, so ist keine Entscheidung möglich. Die harmonische Reihe 1C
1 1 C C ((( 2 3
ist divergent, und es gilt nach K[3.7]:
ˇ ˇ ˇ akC1 ˇ k ˇ ˇ ˇ a ˇ D k C 1 &! 1: k p Hieran sieht man auch, dass weder die Bedingung k jak j < 1 noch die Bedingung jakC1 =ak j < 1 zur Konvergenz hinreichen. p k
1 jak j D p &! 1; k k
Die Reihe 1C
1 1 C 2 C ((( 2 2 3
382
Kapitel 8 Weiterführung der Analysis
ist konvergent, und es gilt ebenfalls ˇ . ˇ /2 ˇ akC1 ˇ k ˇD ˇ &! 1: ˇ a ˇ kC1 k
. / p 1 2 1 k D jak j D p &! 1; p k k k k2
T. Satz (Integralkriterium). Die Funktion f W Œ1; 1Œ ! R sei stetig und monoton fallend, und es gelte f .x/ % 0 für alle x % 1. Dann besteht die Äquivalenz: 1 X
Z f .k/ konvergent
()
kD1
lim
n
n!1 1
f .x/ dx existiert in R:
Ist eine der beiden Aussagen erfüllt, so gelten die Abschätzungen: Z
n
lim
n!1 1
f .x/ dx .
1 X
Z f .k/ . f .1/ C lim
n
n!1 1
kD1
f .x/ dx:
Beweis. Wegen der Monotonie gilt: f .kC1/ . f .x/ . f .k/ 8 x 2 Œk; kC1/; also folgt durch Integration über das Intervall Œk; k C 1/: Z f .k C 1/ .
k
kC1
f(x)
f . f .k/; k
somit durch Aufaddieren:
(9)
snC1 & f .1/ D
n X kD1
Z f .k C 1/ .
1
nC1
f .
n X
k + 1
x
f .k/ D sn :
kD1
(R n ) Sowohl die Folge .sn / der Teilsummen wie auch die Folge 1 f der Integralwerte ist monoton wachsend, da stets f .x/ % 0. Aus derR Abschätzung (9) liest man unn mittelbar die Äquivalenz ab: sn beschränkt () 1 f beschränkt. Also folgt die behauptete Äquivalenz aus dem Hauptsatz über monoton wachsende Folgen N[2.1]. Die Ungleichungen zwischen den Grenzwerten ergeben sich aus (9) durch Grenzübergang n ! 1. "
383
Abschnitt 8.1 Reihen
U. Beispiele. (i)
Ist
X
2k cosk
1 konvergent oder divergent? k
Lösung: Wegen der Potenzen versucht man es mit dem Wurzelkriterium: ˇ ˇ p ˇ 1 ˇˇ k ˇ jak j D 2 ( ˇcos ˇ &! 2 ( 1 D 2 > 1: k Somit ist die Reihe divergent. X 1 (ii) Ist k k sink konvergent oder divergent? 2k Lösung: Wegen der Potenzen versucht man es wiederum mit dem Wurzelkriterium: ˇ ˇ ˇ ˇˇ sin 1 ˇˇ ˇ p ˇ 1 ˇˇ ˇ k 2k ˇˇ ( 1 &! 1 ( 1 D 1 < 1: jak j D k ( ˇˇsin Dˇ ˇ 1 ˇ 2 ˇ 2k 2 2 ˇ ˇ 2k Dabei wurde der Differenzenquotient des Sinus bei 0 verwendet (G[4.4]). Somit ist die Reihe absolut konvergent. X ck (iii) Für welche c 2 C konvergiert die Reihe ? kŠ Lösung: Bei Fakultäten ist es oft besser, das Quotientenkriterium zu verwenden. Für c ¤ 0 gilt: ˇ ˇ ˇ akC1 ˇ jcjkC1 kŠ jcj ˇ ˇ ˇ a ˇ D .k C 1/Šjcjk D k C 1 &! 0: k Somit konvergiert die Reihe für jedes c 2 C absolut. Insbesondere ist für alle c 2 C: ck D 0: k!1 kŠ lim
(iv)
Für welche ˛ 2 R konvergiert die Reihe
1 X 1 ? k˛
kD1
Lösung: Für ˛ D 1 entsteht die harmonische Reihe, und diese ist divergent. Da für ˛ < 1 gilt: k1˛ % k1 , divergiert die Reihe für ˛ < 1 erst recht. Für ˛ > 1 versagen sowohl Wurzel- wie Quotientenkriterium (es ist jeweils q D 1), aber das Integralkriterium hilft: Z 1
k
dx D x˛
Z 1
k
x
&˛
1
x &˛C1 dx D &˛ C 1
'k 1
D
k 1&˛ 1 1 & &! 0 C : 1&˛ 1&˛ ˛&1
384
Kapitel 8 Weiterführung der Analysis
Die Reihe divergiert also für ˛ . 1, und sie konvergiert für ˛ > 1. Im zweiten Fall definiert sie die so genannte Riemannsche Zetafunktion: % W /1; 1Œ &! R;
%.˛/ ´
1 X 1 : k˛
kD1
$ Nochmals die Dezimaldarstellung Eine schöne Anwendung der Reihenlehre, besonders der geometrischen Reihe, bezieht sich auf die Dezimalbruch-Entwicklung der reellen Zahlen. Ohne wesentliche Einschränkung sei die gegebene Zahl a aus dem Intervall Œ0; 1Œ. Wir hatten in Abschnitt 2.8 gesehen, dass ein solches a eine Dezimaldarstellung a D 0; k1 k2 k3 : : : besitzt; vgl. (3)[2.8]. Aus dieser Formel folgt nach (6)[2.8] und (1)[2.8], dass für
an ´ k1 ( 10&1 C k2 ( 10&2 C ( ( ( C kn ( 10&n
gilt:
a D lim an : n!1
Offensichtlich sind die an die Teilsummen einer Reihe, sodass wir jetzt schreiben können: (10)
a D 0; k1 k2 k3 : : : D
1 X
k` ( 10&` ;
`D1
einschließlich der (absoluten) Konvergenz. Die Ziffern k` bilden eine Folge in f0; : : : ; 9g, wobei alle solche Folgen vorkommen bis auf die mit „Neunerschwanz“. Die Zuordnung „reelle Zahl in Œ0; 1Œ 7! Dezimaldarstellung“ ist in dieser Konstellation bijektiv; vgl. Satz C[2.8]. Jetzt können wir auch die Frage der periodischen Dezimalbrüche klären: V. Satz und Definition (Rationalitätskriterium). Die reelle Zahl a 2 Œ0; 1Œ ist dann und nur dann rational, wenn ihre Dezimaldarstellung (10) periodisch ist, d.h. von der Gestalt (11a)
a D 0; k1 : : : kv kvC1 : : : kvCp kvC1 : : : kvCp : : :
mit v 2 N0 und p 2 N. Hierin ist k1 : : : kv die Vorperiode, die auch nicht vorhanden sein kann (nämlich für v D 0), und kvC1 : : : kvCp ist die Periode, bestehend aus dem „Ziffernpaket“ kvC1 : : : kvCp , das sich nach der Position v ständig wiederholt. Man schreibt statt (11a) auch (11b)
a D 0; k1 : : : kv kvC1 : : : kvCp :
385
Abschnitt 8.1 Reihen
Beweis. 1) Sei die Dezimaldarstellung von der Form (11a) vorausgesetzt. Dann kann a hieraus explizit rekonstruiert werden: Nach (10) gilt aD
v X
k` 10&` C
`D1
1 X
k` 10&` :
`DvC1
Hierin ist v X
( ) k` 10&` D k1 10&1 C ( ( ( C kv 10&v D 10&v k1 10v&1 C ( ( ( C kv 100
`D1
D 10&v ( k1 : : : kv ; worin k1 : : : kv in nahe liegender Weise die Dezimaldarstellung einer natürlichen Zahl (oder 0) bezeichnet. Analog ist 1 X
( ) k` 10&` D kvC1 10&.vC1/ C ( ( ( C kvCp 10&.vCp/
`DvC1
also wird mit
( ) C kvC1 10&.vCpC1/ C ( ( ( C kvCp 10&.vC2p/ C ( ( ( ; , ´ kvC1 10&.vC1/ C ( ( ( C kvCp 10&.vCp/
nach der geometrischen Reihe 1 X
kvCp 10&.vCp/ D , C , ( 10&p C , ( 10&2p C ( ( ( D , (
`DvC1
Hierbei ist wie zuvor
1 : 1 & 10&p
, D 10&.vCp/ ( kvC1 : : : kvCp
mit kvC1 : : : kvCp 2 N. Zusammengenommen, ergibt sich 10&.vCp/ ( kvC1 : : : kvCp 1 & 10&p 10&v ( k1 : : : kv C p ( kvC1 : : : kvCp : 10 & 1
a D 10&v ( k1 : : : kv C D 10&v
Diese Formel zeigt, dass a rational ist. 2) Sei umgekehrt a als rational vorausgesetzt. Um die Periodizität der Dezimaldarstellung nachzuweisen stützt man sich auf die rekursive Bestimmung der Ziffern k1 ; k2 ; : : : aus Bemerkung D(ii)[2.8]: Es sei aD
p q
mit
p; q 2 N0 ;
0 . p < q:
386
Kapitel 8 Weiterführung der Analysis
Aus dem dortigen Rekursionsschema sieht man, dass alle Zahlen rn rational sind mit Nenner q und durch 10 teilbarem Zähler. Wegen 0 . rn < 10 können die rn nur die Werte 10.q & 1/ 10 20 ; ; :::; 0; q q q annehmen. In der Folge r1 ; r2 ; : : : müssen also an zwei verschiedenen Positionen einmal gleiche Werte stehen, etwa rvC1 D rvCpC1 für ein v 2 N0 und ein p 2 N. Dann gilt auch kvC1 D kvCpC1 , und die Rekursion zeigt, dass sich diese Gleichheiten auf alle nachfolgenden Indizes übertragen: rvC1C` D rvCpC1C` und kvC1C` D kvCpC1C` für ` 2 N. Hieraus folgt a D 0; k1 : : : kv kvC1 : : : kvCp ; sodass a wirklich eine periodische Dezimaldarstellung besitzt.
"
Die Endformel des Beweisteils 1) liefert noch den V. Zusatz. Die Umwandlung einer periodischen Dezimaldarstellung in eine rationale Zahl kann mit der Formel 0; k1 : : : kv kvC1 : : : kvCp D
1 kvC1 : : : kvCp k1 : : : kv C v ( v 10 10 10p & 1
bewerkstelligt werden.
"
Dabei ist, wie gesagt, für irgendwelche Ziffern kj k1 : : : k` ´ k1 ( 10`&1 C ( ( ( C k` ( 100 : W. Beispiel. Es gilt 1 234 427 19 C ( D ; 100 100 999 2220 19 1 234 4227 0; 0190234 D C ( D : 1000 1000 9999 222200 0; 19234 D
Im ersten Fall ist v D 2 und p D 3, im zweiten v D 3 und p D 4
Aufgaben und Anmerkungen 1. Man untersuche die folgenden Reihen auf Konvergenz und absolute Konvergenz:
387
Abschnitt 8.1 Reihen 1 X
a)
kD1 1 X
d)
kD2 1 X
1 X kŠ2 b) , .2k/Š
1 , k2 & k & 1
c)
kD1
1 3 -k X p k 3&1 , e)
1 , k ln k
kC1 .&1/k p , g) 2k k kD1
h)
kD1 1 X kD1
1 X
.&1/k
kD1
f)
2 C .&1/k , k
1 X
1 , p 2 k C 1 kD1
.&1/k ln k . k
2. Für welche a 2 R bzw. a 2 C konvergiert die Reihe vergenzfall soll der Reihenwert bestimmt werden.
1 3 X
ak & ak&1 ? Im Kon-
kD1
3. Eine alternierende Reihe, deren Glieder eine nicht monotone Nullfolge bilden, kann a) konvergieren oder auch b) divergieren. Man zeige dies an folgenden Beispielen: a) b)
3 1 1 1 1 & C 2 & 2 C 2 & C(((; 4 42 3 6 5 1 1 1 1 1 1 & 2 C & 2 C & 2 C &((( 2 2 3 3 4 4
4. Eine Reihe mit positiven, gegen null konvergierenden Gliedern, die divergiert und explizit bestimmbare Teilsummen sn hat, ist 1 X kD1
p
1
1 1 1 p Dp p Cp p Cp p C ((( : 0C 1 1C 2 2C 3 k&1C k
Man verifiziere die genannten Eigenschaften und berechne insbesondere die Teilsummen explizit. Für welches n ist erstmalig sn > 100? 5. Man beweise oder widerlege die folgenden Aussagen: a)
1 X
ak konvergent H)
kD1
b)
1 X
1 X
ak2 konvergent.
kD1
ak absolut konvergent H)
kD1
1 X
ak2 absolut konvergent.
kD1
6. Es seien P und Q reelle Polynome mit deg.P / D p 2 N0 und deg.Q/ D p C 1. Konvergieren die Reihen a)
1 X P .k/ , Q.k/
kDk0
b)
1 X kDk0
.&1/k
P .k/ , Q.k/
wobei k0 2 N so gewählt sei, dass für k % k0 gilt: Q.k/ ¤ 0?
388
Kapitel 8 Weiterführung der Analysis
7. Sei .Œ˛k ; ˇk //k2N eine Intervallschachtelung mit ˇ1 % 0 und limk!1 ˛k D limk!1 ˇk µ '. Man zeige: a) Es existiert genau eine alternierende Reihe a1 & a2 C a3 & C ( ( ( , für deren Teilsummen sn gilt Œs2m ; s2m&1 / D Œ˛m ; ˇm /, m D 1; 2; : : : . b) Die ak dieser alternierenden Reihe bilden eine monoton fallende Nullfolge, und es gilt a1 & a2 C a3 & C ( ( ( D ': Eine solche alternierende Reihe ist also grob gesprochen das Gleiche wie eine Intervallschachtelung. So, wie die konvergenten Folgen den konvergenten Reihen (im Sinne von Bemerkung E) entsprechen, korrespondieren Intervallschachtelungen im Wesentlichen mit den alternierenden Reihen mit den im Leibniz-Kriterium J genannten Eigenschaften.
8.2 Funktionenreihen Wie bei den Folgen gibt es auch bei den Reihen solche, deren Glieder von einer zusätzlichen Variablen abhängen. Das allgemeine Konzept für derartige Folgen wurde in Abschnitt 6.5 entwickelt. Im Falle der Reihen werden die dortigen Prinzipien jetzt einfach auf die Teilsummen angewandt. Bei dieser Übertragung nehmen wir gleichzeitig die Verallgemeinerung auf komplexwertige Funktionen vor. Es bezeichne wie im vorangehenden Abschnitt K den Körper R oder C. Gegeben sei eine Folge .fk /k2N von Abbildungen fk W M ! K. Dabei darf M eine beliebige Menge sein. A. Definition. Eine Funktionenreihe mit den Gliedern fk hat die Gestalt ($)
1 X
fk D f1 C f2 C ( ( ( :
kD1
Die Folge .gn /n2N ihrer Teilsummen ist definiert durch gn ´ f1 C ( ( ( C fn . Diese sind ebenfalls Abbildungen des Typs gn W M &! K. (i) Die Funktionenreihe ($) konvergiert (punktweise) gegen die Funktion f W M ! K, wenn die Folge .gn /n2N der Teilsummen P punktweise gegen f konvergiert. Dies bedeutet also, dass für alle p 2 M gilt: 1 kD1 fk .p/ D f .p/. Symbol dafür ist auch 1 X
fk D f;
kD1
und man sagt, die Funktion f werde durch die links stehende Reihe dargestellt.
Abschnitt 8.2 Funktionenreihen
389
(ii) Die Funktionenreihe ($) konvergiert gleichmäßig gegen die Funktion f W M ! K, wenn die Folge .gn /n2N der Teilsummen gleichmäßig gegen f konvergiert. Symbol dafür ist 1 X fk D f (glm. auf M ) kD1
(oder auch das Gleiche mit Argumentbesetzung auf beiden Seiten der Gleichung). Wie generell bei der gleichmäßigen Konvergenz ist die Spezifikation der Menge unerlässlich. Die gleichmäßige Konvergenz ist wieder die stärkere Forderung. Wenn man die Grenzfunktion f weder kennt noch vermutet, so verbleibt in beiden Fällen das Cauchy-Kriterium zur Konvergenzprüfung, natürlich angewandt auf die Folge der Teilsummen. Da die Distanz zweier Teilsummen im Falle m > n so geschrieben werden kann: ˇ ˇ ˇ X ˇ ˇ m ˇ ˇ jgn & gm j D ˇ fk ˇˇ ˇkDnC1 ˇ bedeutet dies z.B. im zweiten Fall: B. Satz (Cauchy-Kriterium für gleichmäßige Konvergenz von Funktionenreihen). Die Funktionenreihe ($) konvergiert dann und nur dann gleichmäßig auf M , wenn zu jedem " > 0 ein N D N."/ 2 N existiert derart, dass für alle n; m mit m > n > N und alle p 2 M gilt ˇ ˇ ˇ ˇ X m ˇ ˇ ˇ fk .p/ˇˇ < ": ˇ ˇ ˇkDnC1 " Eine wichtige und oft gebrauchte Folgerung hieraus ist: C. Satz (Majorantenkriterium von Weierstraß für gleichmäßige Konvergenz von Funktionenreihen). Zur Funktionenreihe ($) existiere eine konvergente Majorante, P 0 mit konstanten reellen Gliedern 0k % 0 derart, d.h. eine konvergente Reihe 1 kD1 k dass für alle k 2 N und alle p 2 M gilt: jfk .p/j . 0k . Dann konvergiert ($) gleichmäßig auf M gegen eine Funktion f W M ! K. Beweis. Die Teilsummen der Majorante seien mit sn bezeichnet. Man überprüft leicht das obige Cauchy-Kriterium: Für m > n und p 2 M gilt nämlich ˇ ˇ ˇ ˇ X m m X X ˇ ˇ m ˇ fk .p/ˇˇ . jfk .p/j . 0k D sm & sn : (1) jgm .p/ & gn .p/j D ˇ ˇ kDnC1 ˇkDnC1 kDnC1
390
Kapitel 8 Weiterführung der Analysis
Hieraus liest man ab: Die Cauchy-Eigenschaft von .sm / impliziert die von Satz B. " P1 P Anwendung auf 1 kD1 fk .p/ liefert den kD1 jfk .p/j anstelle von C. Zusatz. Auch
P1
kD1
jfk j konvergiert gleichmäßig auf M .
"
Aus der mittleren Abschätzung in (1) folgt zusammen mit Satz B auch ohne Bezugnahme auf eine Majorante: P D. Satz und Definition. P Konvergiert die Reihe jfk j gleichmäßig auf M , so konvergiert auch P die Reihe fk gleichmäßig auf M . Man sagt unter dieser Voraussetzung: Die Reihe fk konvergiert absolut-gleichmäßig. " Eine Funktionenreihe, die die Voraussetzungen des Majorantenkriteriums C erfüllt, konvergiert also absolut-gleichmäßig. E. Beispiele. (i)
Konvergiert die Reihe
1 X sin kx auf R gleichmäßig? k2
kD1
ˇLösung: ˇ Hier ist M ´PR und K ´ R. Es gilt für alle x 2 R und k 2 N: ˇ sin kx ˇ 1 ˇ k 2 ˇ . k12 . Somit ist kD1 k12 eine konvergente Majorante, also konvergiert die Ausgangsreihe absolut-gleichmäßig in R. (ii) In der Theorie der „elliptischen Funktionen“ tritt folgende Reihe auf 1 X
2
q k cos kx;
kD1
mit q 2 C vom Betrag jqj < 1=15 und x 2 R. Man kläre die Konvergenz bzw. gleichmäßige Konvergenz diese Reihe für .q; x/ 2 B.0; 1=15/ ) R, wobei B.0; 1=15/ der Euklidische Ball um 0 2 C vom Radius 1=15 ist. Lösung: Hier ist M ´ B.0; 1=15/ ) R und K ´ C. Da in M gilt . /k ˇ ˇ 2 1 2 ˇ ˇ k ; ˇq cos kx ˇ . jqjk . jqjk . 15 ( 1 )k P ist die geometrische Reihe 1 eine konvergente Majorante, also konvergiert kD1 15 die Ausgangsreihe absolut-gleichmäßig in M . Die explizite Bestimmung der Reihensumme ist in vielen Fällen nicht möglich. Es geht dann darum, Existenz und Eigenschaften der Grenzfunktion ohne solche Kenntnis herauszufinden. Dazu dienen gerade Sätze wie das Cauchy- und Majorantenkriterium oder Aussagen über gliedweise Operationen. Ähnlich wie bei den Integralen
391
Abschnitt 8.2 Funktionenreihen
(H[5.4]) können Funktionenreihen Anlass zur Einführung neuer Grundfunktionen geben, wie z.B. bei der Riemannschen Zetafunktion in U(iv)[8.1]. Die Frage der gliedweisen Integration bzw. Differentiation erledigt sich einfach durch Anwendung der früheren Sätze auf die Teilsummen. Dabei ist klar, dass die Integration bzw. die Ableitung einer jeden Teilsumme summandenweise erfolgt, wie sich unmittelbar aus den Grundeigenschaften dieser Operationen ergibt. Ebenso ist klar, dass sich die Stetigkeit oder stetige Differenzierbarkeit der Glieder auf die Teilsummen überträgt. Vgl. hierzu die Sätze E, G und D in Abschnitt 5.5. Gleichzeitig sieht man an deren Beweisen, dass nur vom Betrag Gebrauch gemacht wird, aber nicht von der Anordnung von R. Die Situation überträgt sich also auch auf komplexwertige Funktionen, die auf einem kompakten Intervall definiert sind. (Bei nichtkompakten Intervallen kann man die Aussagen zumindest auf kompakte Teilintervalle anwenden.) Konvention: Hier und in Zukunft wird statt „Funktionenreihe“ oft auch einfach „Reihe“ gesagt. In den meisten Fällen erkennt man ja an der Bauart der Reihe, ob ihre Glieder von zusätzlichen Variablen (außer dem Summationsindex) abhängen – es sich also um eine Funktionenreihe handelt – oder nicht – also eine Reihe „mit konstanten Gliedern“ vorliegt. Aufgaben und Anmerkungen 1. Man bestimme möglichst große Mengen M , R, auf denen die Reihe 1 X kD1
1 1 C .kx/2
gleichmäßig konvergiert. a) Stellt diese Reihe auf der punktierten reellen Achse Rnf0g eine stetige Funktion dar? b) Darf man diese Reihe über ein Intervall Œa; b/ mit 0 < a < b gliedweise integrieren und so das Ergebnis Z
b a
0
1 X
kD1
1 1 C .kx/2
! dx D
1 X k.b & a/ 1 arctan k 1 C k 2 ab
kD1
erhalten? c) Darf man diese Reihe auf der punktierten reellen Achse gliedweise differenzieren?
392
Kapitel 8 Weiterführung der Analysis
2. Analoge Aufgabe im Komplexen: Man bestimme möglichst große Teilmengen M der rechten Halbebene fz 2 C j Re .z/ > 0g, auf denen die Reihe 1 X kD1
1 1 C k2z
gleichmäßig konvergiert. Stellt diese auf der rechten Halbebene eine stetige Funktion dar? 3. Eine Reihe kann natürlich gleichmäßig konvergieren ohne absolut konvergent zu sein. Man studiere hierzu die Reihe 1 X .&1/k 1 C kx 2
kD1
auf möglichst großen Teilmengen M , R. Ist dort die Reihe absolut konvergent? Stellt diese Reihe auf der punktierten reellen Achse R n f0g eine stetige Funktion dar? Darf man die Reihe über ein Intervall Œa; b/ mit 0 < a < b gliedweise integrieren bzw. auf der punktierten reellen Achse gliedweise differenzieren? 4. In Beispiel U(iv)[8.1] war die Riemannsche Zetafunktion % W /1; 1Œ ! R durch die Reihe 1 X 1 %.t/ ´ kt kD1
definiert worden. Man zeige: a) Diese Reihe konvergiert in jedem Intervall Œ˛; 1Œ mit ˛ > 1 absolut-gleichmäßig. Daraus folgt, dass die Zetafunktion auf dem ganzen Definitionsintervall /1; 1Œ stetig ist. b) $ Die Zetafunktion ist auf /1; 1Œ stetig differenzierbar, und es gilt dort 1 X ln k % .t / ´ & kt 0
kD1
mit absolut-gleichmäßiger Konvergenz der Reihe auf jedem Intervall Œ˛; 1Œ mit ˛ > 1. 5. $ Der Satz von Dini P[6.5] kann in folgender „Reihenvariante“ ausgesprochen werden: Sei X ein kompakter metrischer Raum und (2)
1 X
fk D f
kD1
eine konvergente Funktionenreihe mit stetigen nichtnegativen Gliedern fk W X ! RC 0 und stetiger Summe f W X ! R. Dann erfolgt die Konvergenz in (2) gleichmäßig.
393
Abschnitt 8.2 Funktionenreihen
6. $ In dieser Aufgabe wird eine stetige, nirgends differenzierbare Funktion f W R ! R konstruiert. Das Grundprinzip ist die „Vervielfältigung des Zackens“ der Betragsfunktion mittels einer Reihe. a) Als Erstes sei die Betragsfunktion g.x/ D jxj vom Intervall Œ&1=2; 1=2/ mit der Periode 1 auf ganz R fortgesetzt, d.h. so, dass g.x C 1/ D g.x/ für alle x 2 R gilt. Eine Darstellung dieser Fortsetzung ist ˇ h 1 iˇˇ ˇ g W R &! R; g.x/ ´ ˇx & x C ˇ: 2 Denn dieser Ausdruck stimmt auf Œ&1=2; 1=2/ mit jxj überein und erfüllt: g.x C 1/ D g.x/ für alle x 2 R; vgl. Aufgabe 11[4.4]. Man skizziere den Graph von g. Die Funktion g ist auf ganz R stetig, erfüllt 0 . g.x/ .
1 ; 2
und genau in den Punkten von Z=2 hat g „Zacken“, ist also dort nicht differenzierbar. b) Diese „Singularitäten“ werden nun „verdichtet“ und gleichzeitig die „Amplituden“ gedämpft, indem man definiert: gj .x/ ´
1 g.2j x/: 2j
Für jedes j 2 N0 ist dann die Funktion gj W R ! R stetig, erfüllt 0 . gj .x/ .
1 2j C1
und ist in den Punkten von Z=2j C1 nicht differenzierbar. c) Man überlege: Für a D k=2n und b D .k C 1/=2n , k 2 N0 , hat der Differenzenquotient gj .b/ & gj .b/ b&a den Wert 1 oder &1 für j < n und den Wert 0 für j % n. d) Die gewünschte Funktion ist jetzt gegeben durch die Reihe f .x/ ´
1 X
gj .x/:
j D0
Diese hat nach b) eine konvergente, von x unabhängige Majorante, ist also gleichmäßig konvergent und stellt eine stetige Funktion f W R ! R dar. Um die Nichtdifferenzierbarkeit von f an einer beliebigen Stelle a 2 R zu beweisen,
394
Kapitel 8 Weiterführung der Analysis
verwende man Aufgabe 3 b)[4.1], indem man zwei Folgen an und bn in Z=2n mit bn & an D 1=2n und an . a . bn wählt, den Quotienten f .bn / & f .an / bn & an mit der obigen Reihe darstellt und mittels c) nachweist, dass dieser abwechselnd eine gerade oder ungerade ganze Zahl ist.
8.3
Höhere Ableitungen und die Taylor-Entwicklung
Die Ableitung, wie sie bisher definiert und gebraucht wurde, spiegelt die Approximation einer Funktion durch ein Polynom der Ordnung . 1 wider. Geometrisch drückt sich das in der Annäherung durch die Tangente, analytisch z.B. durch den Mittelwertsatz aus. Höhere Ableitungen erfüllen einen ähnlichen Zweck in verfeinerter Form, insofern die gegebene Funktion durch eine Polynom höherer Ordnung besser approximiert werden kann als durch eine affine Funktion. Der präzise Ausdruck für diese Art von Annäherung ist die Taylor-Formel. Wir steuern rasch auf diese Approximationsfrage zu. Die hier betrachteten Funktionen sind zunächst vom Typ f W A ! R mit A , R. Generell soll die Definitionsmenge A keine isolierten Punkte enthalten. Im weiteren Verlauf wird dann A ein Intervall sein. Zum Schluss wird erklärt, wie die wesentlichen Ergebnisse auf komplexwertige Funktionen f W A ! C ausgedehnt werden können. Höhere Ableitungen f 00 ; f 000 ; : : : ergeben sich durch sukzessives Differenzieren, soweit dies möglich ist: A. Definition. Gegeben sei eine Stelle a 2 A. Damit f 00 .a/ erklärt werden kann, ist als Voraussetzung erforderlich, dass die Ableitung f 0 .x/ für alle x in einer "Umgebung von a (geschnitten mit A) existiert und in a differenzierbar ist. Dann setzt man f 00 .a/ ´ .f 0 /0 .a/ und nennt dies die zweite Ableitung von f in a. Man schreibt auch f 00 .a/ µ f .2/ .a/. Entsprechend sind höhere Ableitungen f 000 .a/ D f .3/ .a/; f .4/ .a/; : : : induktiv definierbar: Damit f .nC1/ .a/ für n 2 N mit n % 2 erklärt werden kann, ist als Voraussetzung erforderlich, dass f .n/ .x/ in einer "-Umgebung von a (geschnitten mit A) existiert und in a differenzierbar ist. Dann setzt man f .nC1/ .a/ ´ .f .n/ /0 .a/:
Abschnitt 8.3 Höhere Ableitungen und die Taylor-Entwicklung
395
Die nullte Ableitung ist die Funktion selbst: f µ f .0/ . Die Ableitung f 0 .a/ bzw. f 0 heißt (im Falle der Existenz) auch die erste Ableitung, geschrieben als f .1/ statt f 0 . Existiert f .n/ .x/ für jedes x 2 A, so ist dadurch eine Funktion f .n/ W A ! R definiert. Im Fall der Existenz heißt f .n/ .a/ bzw. f .n/ die n-te Ableitung . Gelesen werden die Symbole f 0 ; f 00 ; f 000 als „f Strich“, „f zwei Strich“, „f drei Strich“. 5=2 B. Beispiel. Sei A ´ RC . Dann existiert f 0 .x/ D 25 x 3=2 für alle 0 und f .x/ ´ x x 2 A. Weiter existiert f 00 .x/ D 52 ( 32 x 1=2 für alle x 2 A. Aber f 000 .x/ D 25 ( 32 ( 21 x &1=2 existiert nur für x > 0 in A; denn die Quadratwurzelfunktion ist in 0 zwar noch stetig, aber nicht mehr differenzierbar.
C. Definition. Existiert f .n/ W A ! R für ein n 2 N, so heißt f n-mal differenzierbar. Ist außerdem f .n/ W A ! R stetig, so heißt f n-mal stetig differenzierbar oder von der Klasse C n oder eine C n -Funktion. Man definiert die Funktionenmenge C n .A/ ´ ff W A ! R j f n-mal stetig differenzierbarg: Ist f für alle n 2 N stetig differenzierbar, so heißt f von der Klasse C 1 oder eine C 1 -Funktion, und man definiert die Funktionenmenge C 1 .A/ ´ ff W A ! R j f für alle n 2 N stetig differenzierbarg: Manchmal werden in dem Symbol C n .A/ die Klammern um A weggelassen. Ist von vornherein klar, dass die Definitionsmenge gleich A ist, so schreibt man statt f 2 C n .A/ etwas einfacher f 2 C n . Existiert f .n/ W A ! R, so ist f .n&1/ W A ! R stetig (D[4.1]). Also ist in der vorangehenden Definition von C 1 .A/ in der Klammer rechts „stetig differenzierbar“ äquivalent ersetzbar durch „differenzierbar“. D. Beispiele. (i) Anknüpfend an das obige Beispiel B kann man feststellen, dass f in A von der Klasse C 2 ist, aber nicht von der Klasse C 3 . Es ist also f 2 C 2 .A/, aber f … C 3 .A/. Jedoch gilt für die Einschränkung f jRC 2 C 1 .RC /. (ii) Jedes Polynom ist auf ganz R von der Klasse C 1 ebenso die Funktionen exp, cos, sin, arctan. Bei den Umkehrfunktionen trifft dies dagegen nur mit eventuellen Einschränkungen zu, da diese nicht durchgängig definiert sein können und in den Bildpunkten der Nullstellen der Ableitung nicht differenzierbar sind. Z.B. ist ln 2 C 1 .RC /, jedoch arcsin 2 C 0 Œ&1; 1/, aber nur arcsin j /&1; 1Œ 2 C 1 .
396
Kapitel 8 Weiterführung der Analysis
(iii) Eine rationale Funktion ist in ihrer Definitionsmenge (d.h. außerhalb der Nullstellen des Nennerpolynoms) von der Klasse C 1 . E. Definition. Für zwei Funktionen f; g W A ! R und a 2 A und n 2 N0 mögen f .n/ .a/ und g .n/ .a/ existieren. Man sagt, f und g stimmen in a in n-ter Ordnung überein, wenn gilt: f .a/ D g.a/;
f 0 .a/ D g 0 .a/;
f 00 .a/ D g 00 .a/;
:::;
f .n/ .a/ D g .n/ .a/:
Das ist natürlich eine Äquivalenzrelation in der Gesamtheit der Funktionen, die die Voraussetzungen bzgl. der Existenz der n-ten Ableitungen erfüllen. Wir werden sehen, dass die Übereinstimmung genügend vieler Ableitungen an einer festen Stelle die Funktionen zwingen kann, auch in einer Umgebung der Stelle nicht allzu stark voneinander abzuweichen! F. Lemma. Existiert f .n/ .a/, so gibt es genau ein Polynom P vom Grad . n, sodass f und P in a in n-ter Ordnung übereinstimmen. Beweis. Es ist günstig, das gesuchte Polynom in der umentwickelten Form (8)[3.1] mit Zentrum a anzusetzen, natürlich mit unbestimmten Koeffizienten ck . Dann folgt durch sukzessives Differenzieren: P .x/ D c0 C c1 .x & a/ C c2 .x & a/2 C c3 .x & a/3 C ( ( ( C cn .x & a/n P 0 .x/ D c1 ( 1 C c2 ( 2.x & a/ C c3 ( 3.x & a/2 C ( ( ( C cn ( n.x & a/n&1 P 00 .x/ D c2 ( 2 C c3 ( 3 ( 2.x & a/ C ( ( ( C cn ( n ( .n & 1/.x & a/n&2 P 000 .x/ D c3 ( 3 ( 2 C ( ( ( C cn ( n ( .n & 1/ ( .n & 2/.x & a/n&3 :: : P .n/ .x/ D cn ( n ( .n & 1/ ( .n & 2/ ( ( ( 1: Daraus ergibt sich: P .k/ .a/ D ck ( kŠ für 0 . k . n;
P .nC1/ D 0:
Also wird für 0 . k . n: P .k/ .a/ D f .k/ .a/ () ck ( kŠ D f .k/ .a/ () ck D Es ergeben sich eindeutig bestimmte Koeffizienten!
f .k/ .a/ : kŠ "
Abschnitt 8.3 Höhere Ableitungen und die Taylor-Entwicklung
397
F. Definition (als Zusatz). Dieses eindeutig bestimmte Polynom Tn .x/ ´ f .a/ C
f 0 .a/ f 00 .a/ f .n/ .a/ .x & a/ C .x & a/2 C ( ( ( C .x & a/n 1Š 2Š nŠ
heißt das n-te Taylor-Polynom von f mit Zentrum a. (Manchmal schreibt man Tn .f; x/ anstelle von Tn .x/, um die Funktion f zu spezifizieren.) Nachdem das Polynom Tn .x/ hinsichtlich seiner Ableitungen gut mit der Funktion f übereinstimmt, erhebt sich naturgemäß die Frage, ob dieses Polynom vielleicht auch sonst eine gute Annäherung an f darstellt. Präziser gefragt, wie groß ist der Unterschied oder Fehler (1)
Rn .x/ ´ f .x/ & Tn .x/‹
Da (2)
f .x/ D Tn .x/ C Rn .x/
heißt Rn .x/ auch das Restglied. Diese Frage hat zwei Aspekte, da Rn .x/ von zwei Objekten abhängt, nämlich von x und n: Wird der Fehler bei festem n klein, wenn x nahe bei a liegt? Wird der Fehler bei festem x klein, wenn immer mehr Ableitungen zur Übereinstimmung gebracht werden, d.h. wenn n gegen 1 geht? Wir untersuchen das der Reihe nach. Die betrachtete Funktion sei dabei auf einem Intervall mit nichtleerem Inneren definiert. Zur bequemen Schreibweise sei ein neues Intervallsymbol eingeführt, nämlich für ˛; ˇ 2 R gesetzt: ( Œ˛; ˇ/ für ˛ . ˇ j˛; ˇj ´ Œˇ; ˛/ für ˛ > ˇ Sei n zunächst fest. G. Satz (Taylor-Formel). Sei f 2 C nC1 .J /, J , R ein Intervall mit J ı ¤ ¿ und n 2 N0 . Dann gilt für a; x 2 J die Identität (3) f .x/ D f .a/C
f 00 .a/ f .n/ .a/ f 0 .a/ .x&a/C .x&a/2 C( ( (C .x&a/n CRn .x/; 1Š 2Š nŠ
wobei (4)
1 Rn .x/ D nŠ
Z a
x
.x & t/n f .nC1/ .t / dt
(Integral-Restglied):
398
Kapitel 8 Weiterführung der Analysis
Der Ausdruck (4) stellt das Restglied in Gestalt eines Integrals dar. Man spricht kurz vom Integral-Restglied. Zwar ist Rn .x/ unabhängig von einer bestimmten Darstellung durch (1) oder (2) für n-mal differenzierbare Funktionen erklärt, brauchbare Informationen über Rn .x/ lassen sich aber nur bei zusätzlichen Informationen gewinnen, hier also durch die Kenntnis einer stetigen .n C 1/-ten Ableitung. Wir werden gleich anhand von Beispielen sehen, dass sich die Fehlergröße über eine solche Darstellung sehr effektiv abschätzen lässt. Beweis von G. Mehrfache Produktintegration liefert: Z x f .x/ D f .a/ C f 0 .t / dt a
Z D f .a/ C
a
x
1 ( f 0 .t / dt
ˇx ˇ D f .a/ C .t & x/f .t /ˇ
Z
0
t Da
D f .a/ C .x & a/f 0 .a/ &
&
Z
x a
x a
.t & x/f 00 .t/ dt
.t & x/f 00 .t/ dt
Z x ˇx 1 1 ˇ 2 00 C .t & x/2 f 000 .t/ dt D f .a/ C .x & a/f .a/ & .t & x/ f .t /ˇ t Da 2 2 a Z x 1 1 .t & x/2 f 000 .t / dt D f .a/ C .x & a/f 0 .a/ C .x & a/2 f 00 .a/ C 2 2 a :: : 0
1 1 D f .a/ C .x & a/f 0 .a/ C .x & a/2 f 00 .a/ C ( ( ( C .x & a/n f .n/ .a/ 2 nŠ Z 1 x .x & t/n f .nC1/ .t / dt: C nŠ a Dieser Beweis kommt offensichtlich in Gang durch den Hauptsatz der Differentialund Integralrechnung und wird letzten Endes durch eine geschickte Ausgestaltung dieses Hauptsatzes zu Ende geführt. Beim Übergang von Zeile 2 zu Zeile 3 wird als Stammfunktion der (konstanten) Funktion 1 nicht t 7! t , sondern t 7! t & x gewählt (x ist bei der Integration fest). " G. Zusatz. (i) (5)
Es gilt die Restgliedabschätzung jRn .x/j .
jx & ajnC1 ( max jf .nC1/ j: .n C 1/Š ja;xj
399
Abschnitt 8.3 Höhere Ableitungen und die Taylor-Entwicklung
(ii) Es gibt eine Stelle c 2 ja; xj, sodaß Rn .x/ D
(6)
.x & a/nC1 ( f .nC1/ .c/ .n C 1/Š
(Lagrange-Restglied):
Wie beim Mittelwertsatz C[4.3] lässt sich die Zwischenstelle c in (ii) schreiben als c D a C 2 ( .x & a/ mit einem 2 2 Œ0; 1/. Dabei kann c sowohl von a und x wie auch von n abhängen. Beweis des Zusatzes. Für x D a sind die Behauptungen trivial richtig. Sei nun zunächst a < x. Zu (i): Man schätzt das Integral-Restglied ab: Z Z ˇ ˇ ˇ ˇ 1 x 1 x n ˇ nC1 ˇ jRn .x/j . .t / dt . .x & t/ f .x & t/n dt ( max ˇf nC1 ˇ : nŠ a nŠ a Œa; x/ Die Substitution x & t D u im Integral gibt Z x Z 0 Z n n .x & t / dt D u .&du/ D a
x&a
0
x&a
un du D
.x & a/nC1 : nC1
Daraus folgt die Behauptung. Zu (ii): Sei
m ´ min f .nC1/ ; Œa;x*
M ´ max f .nC1/ : Œa;x*
Die gleiche Abschätzungsweise wie in (i) liefert: .x & a/nC1 .x & a/nC1 m . Rn .x/ . M: .n C 1/Š .n C 1/Š Da f .nC1/ jede Vorgabe in Œm; M / als Wert annimmt (D[3.4]), folgt (ii). Der Fall a > x verläuft analog mit kleinen Änderungen.
"
H. Folgerung. Eine n-mal differenzierbare Funktion f W J ! R (J Intervall, n 2 N) ist dann und nur dann Restriktion eines Polynoms vom Grad . n & 1 auf J , wenn f .n/ D 0 gilt. Beweis. Ist f Restriktion eines Polynoms vom Grad . n & 1, so folgt wie im Beweis von F durch sukzessives Differenzieren: f .n/ D 0. Ist umgekehrt f .n/ D 0 vorausgesetzt, so ist f von der Klasse C 1 , und es verschwindet das Restglied Rn&1 für irgendein fest gewähltes a 2 J , wie man an der Integral- oder Lagrange-Gestalt sieht. Nach der Taylor-Formel ist dann f auf J das .n & 1/-te Taylor-Polynom. "
400
Kapitel 8 Weiterführung der Analysis
Die Taylor-Formel ist ein gutes Hilfsmittel, um aus Informationen an der festen Stelle a (hier: f .a/; f 0 .a/; : : : ; f n .a/), also punktalen Eigenschaften, Informationen in einer Umgebung, also lokale Eigenschaften, zu gewinnen. Ist z.B. jf .nC1/ j im Intervall J klein, so trifft dies erst recht für das Restglied zu, da laut (i) noch der Nenner .n C 1/Š hinzukommt sowie der Faktor jx & ajnC1 , der für x ! a rasch klein wird. Hinweis: Generell kann man in der Analysis Eigenschaften oft nach folgenden Gesichtspunkten unterscheiden: Wir nennen eine Eigenschaft ' punktal, wenn sie der einzelnen Stelle zukommt; ' infinitesimal, wenn sie Ableitungen der einzelnen Stelle zukommt; ' lokal, wenn zum einzelnen Punkt eine Umgebung existiert, der sie zukommt; ' global, wenn sie sich auf die Gesamtheit aller Punkte bezieht. Zum Beispiel sind in f .a/; f 0 .a/; : : : ; f n .a/ punktale (und bei n % 1 zugleich infinitesimale) Eigenschaften ausgedrückt. Ein globaler Satz ist z.B. das allgemeine Extremalprinzip von D[6.5]. Um die Chancen für die Approximation nach Taylor weiter zu verbessern, lassen wir nun n ! 1 laufen: I. Definition. Sei f 2 C 1 .J /, J Intervall in R. Zu a 2 J heißt 1 X f .k/ .a/ .x & a/k kŠ
kD0
die Taylor-Reihe oder Taylor-Entwicklung von f mit Zentrum a. Dies ist zunächst eine formale Definition. Die Hauptfragen, die damit verbunden sind, lauten natürlich: (a)
Für welche x konvergiert die Taylor-Reihe? (Konvergenzproblem)
(b) Für welche dieser x ist der Reihenwert gleich dem Funktionswert f .x/? (Darstellungsproblem) Das Konvergenzproblem werden wir im Abschnitt 8.5 ausführlich behandeln. Das eigentlich interessierende Darstellungsproblem kann man (wenigstens im Prinzip) gut angehen, da man den Unterschied zwischen den Teilsummen und dem Funktionswert f .x/ nach Satz G kennt. Es gilt ja f .x/ D Tn .x/ C Rn .x/;
Abschnitt 8.3 Höhere Ableitungen und die Taylor-Entwicklung
401
wobei der erste Summand rechts die Teilsumme der Taylor-Reihe, nämlich das n-te Taylor-Polynom, ist und der zweite das Restglied, das man in Integralform oder in Mittelwertgestalt kennt und abschätzen kann. Hieraus folgt schon mal ganz einfach: J. Lemma. Für das Darstellungsproblem gilt die Äquivalenz: 1 X f .k/ .a/ f .x/ D .x & a/k kŠ
()
kD0
lim Rn .x/ D 0:
n!1
"
Eine hinreichende Bedingung gibt: K. Satz. Existiert in der Situation von Definition I eine stetige Funktion g W J ! R und eine Konstante C % 0 mit jf .n/ .x/j . g.x/C n
für alle n 2 N0 ; x 2 J ;
so besteht die Darstellung f .x/ D
1 X f .k/ .a/ .x & a/k kŠ
für alle x 2 J :
kD0
Beweis. Nach (5) und der Voraussetzung gilt jRn .x/j .
jx & ajnC1 jx & ajnC1 max jf .nC1/ j . max g ( C nC1 : .n C 1/Š ja;xj .n C 1/Š ja;xj
Bezeichnet man das letzte Maximum, das wegen der Stetigkeit von g in R existiert (aber von x abhängt), mit g1 .x/, so folgt hieraus jRn .x/j .
.jx & ajC /nC1 ( g1 .x/: .n C 1/Š
Nach U(iii)[8.1] konvergiert die erhaltene Schranke für n ! 1 gegen 0, also gilt erst recht limn!1 Rn .x/ D 0. " L. Beispiele. (i) Sei f .x/ ´ e x , J ´ R, a ´ 0. Hier sind alle Ableitungen gleich: f .k/ .x/ D e x . Also sind in Satz K brauchbar: g.x/ ´ e x , C D 1. Wegen f .k/ .0/ D e 0 D 1 folgt die so genannte Exponentialreihe ex D 1 C
x x2 x3 C C C ((( ; 1Š 2Š 3Š
402
Kapitel 8 Weiterführung der Analysis
gültig für alle x 2 R. Speziell für x D 1; &1 ergibt sich: e D1C
1 1 1 1 C C C C ((( 1Š 2Š 3Š 4Š
1 1 1 1 1 1 1 1 D e &1 D 1 & C & C & C ( ( ( D & C & C((( : e 1Š 2Š 3Š 4Š 2Š 3Š 4Š Die Verrechnung der ersten beiden Reihenglieder ist möglich wegen der freien Klammersetzung (H[8.1]). Die Konvergenz der obigen Reihen für e und 1=e ist ausgezeichnet, und es sind auch leicht Fehlerabschätzungen möglich, nämlich mittels (5) oder, noch einfacher bei der letzten Reihe, mittels des Leibniz-Kriteriums J[8.1], da die Glieder betragsmäßig streng monoton fallen. In diesem Fall ergibt sich ˇ . /ˇ ˇ1 1 1 1 .&1/n ˇˇ ˇ < & C &((( C für n % 2: (7) 0 0) zeige man: a) Ist f gerade, so ist f 0 ungerade. b) Ist f ungerade, so ist f 0 gerade. Gilt hiervon jeweils die Umkehrung? Ist f von der Klasse C 1 , so zeige man: c) Ist f gerade, so kommen in der Taylor-Reihe von f mit Zentrum 0 nur gerade Potenzen der Variablen vor. d) Ist f ungerade, so kommen in der Taylor-Reihe von f mit Zentrum 0 nur ungerade Potenzen der Variablen vor. Es ist hierbei nicht erforderlich, dass die Taylor-Reihe konvergiert oder die Funktion darstellt!
Abschnitt 8.3 Höhere Ableitungen und die Taylor-Entwicklung
407
5. Um aus cos x und sin x approximativ x zu berechnen (für kleine jxj), wurden folgende Näherungsausdrücke erfunden: x/
3 sin x µ C.x/ 2 C cos x
x / sin x (
(Formel von Cusanus)
14 C cos x µ N.x/ 9 C 6 cos x
(Formel von Newton):
Die präzise Formel ist natürlich (für jxj < &=2) x D arctan
sin x µ E.x/: cos x
a) In welcher Ordnung stimmen E und C bzw. E und N bei a D 0 überein? Welche der beiden Näherungsformeln ist somit als die bessere zu bezeichnen? b) Man zeige für jxj . &=4: jx & C.x/j . 2 ( 10&3 ;
jx & N.x/j . 10&4 :
Lösungshinweis zu b): Man untersuche die Monotonie der beiden Differenzfunktionen. 6. Zeige für alle x 2 R und n 2 N0 : ˇ ˇ . 2 2nC2 4 2n /ˇ ˇ ˇcos x & 1 & x C x & C ( ( ( C .&1/n x ˇ . jxj ˇ 2Š 4Š .2n/Š ˇ .2n C 2/Š ˇ ˇ . 5 2nC1 /ˇ 3 2nC3 ˇ ˇsin x & x & x C x & C ( ( ( C .&1/n x ˇ . jxj ; ˇ ˇ 3Š 5Š .2n C 1/Š .2n C 3/Š wobei das Vorzeichen der Differenz jeweils gleich .&1/nC1 ist. 7. Für z 2 C mit Re .z/ . 0 und n 2 N beweise man: ˇ ˇ . nC1 2 n /ˇ ˇ z ˇe & 1 C z C z C ( ( ( C z ˇ . jzj : ˇ ˇ 1Š 2Š nŠ .n C 1/Š Lösungshinweis: Man arbeite mit der gleichen Hilfsfunktion wie bei Satz O. 8. Man verallgemeinere das Kriterium von Satz K folgendermaßen: In der Situation von Definition I gebe es eine stetige Funktion g W J ! R sowie eine reelle Folge .Cn /n%0 , sodass für alle n und x 2 J gilt jf .n/ .x/j . g.x/ ( Cn
mit
lim
n!1
Cn jx & ajn D 0: nŠ
Dann konvergiert die Taylor-Reihe von f mit Zentrum a in J und stellt dort f dar.
408
Kapitel 8 Weiterführung der Analysis
9. Eine Umformulierung der Taylor-Formel in Satz G entsteht, indem man wie beim Mittelwertsatz x D a C h setzt. Die Voraussetzungen seien wie in G, insbesondere sei a 2 J fest. Der Zuwachs h variiert natürlich so, dass x D a C h im Intervall J bleibt (d.h. h läuft im „parallel verschobenen“ Intervall Ja ´ J & fag). Dann gilt (8)
f .a C h/ D f .a/ C
wobei (9)
hnC1 Rn .h/ D nŠ
(10)
Rn .h/ D
Z 0
f 00 .a/ 2 f .n/ .a/ n f 0 .a/ hC h C ((( C h C Rn .h/; 1Š 2Š nŠ
1
.1 & )/n f .nC1/ .a C )h/ d )
hnC1 f .nC1/ .a C 2h/ .n C 1/Š
(Integral-Restglied) (Lagrange-Restglied)
mit geeignetem 2 2 Œ0; 1/, das von n; a; x abhängen darf. Mittels (9) folgt weiter: Es gibt genau eine stetige Funktion rn W Ja ! R, sodass für alle h 2 Ja gilt; n X f .k/ .a/ k rn .h/ nC1 f .a C h/ D h C h : kŠ .n C 1/Š kD0
Es ist rn .0/ D f .nC1/ .a/. 10. $ In einer Umgebung von a 2 R sei die reelle Funktion f von der Klasse C nC1 , also f 2 C nC1 .U.a; ı// mit ı > 0 und n % 1. Zu jedem h mit jhj < ı sei ein 2.h/ 2 Œ0; 1/ so bestimmt, dass die Taylor-Formel mit Lagrange-Restglied gilt: f .a C h/ D
n&1 X f .k/ .a/ k f .n/ .a C 2.h/h/ n h C h : kŠ nŠ
kD0
Man beweise: Ist f .nC1/ .a/ ¤ 0, so gilt lim 2.h/ D
h!0
1 : nC1
11. $ Die Funktion f W R ! R sei n-mal differenzierbar (n % 1), und mit festem 2D
1 nC1
gelte für alle x; h 2 R: n&1 X f .k/ .x/ k f .n/ .x C 2h/ n f .x C h/ D h C h : kŠ nŠ kD0
Abschnitt 8.3 Höhere Ableitungen und die Taylor-Entwicklung
409
Zeige: Dann ist f ein Polynom vom Grad . n C 1. Lösungshinweis: Man beweise zunächst, dass f von der Klasse C 1 ist und leite sodann für F ´ f .n/ die Identität F .x Ch/&F .x/ D hF 0 .x Ch/ her. Diese impliziert, dass F affin ist. 12. Es seien die gleichen Annahmen und Bezeichnungen wie bei Aufgabe 9 getroffen. Dann gibt es eine weitere Restglieddarstellung, in der nochmals ein „gewöhnlicher“ Taylor-Term der Ordnung n C 1 absepariert ist. Dazu schreibe man f .a C h/ D
nC1 X kD0
mit
f .k/ .a/ k enC1 .h/ h CR kŠ
.nC1/ .a/ nC1 enC1 .h/ D Rn .h/ & f h R .n C 1/Š
und folgere hieraus lim
h!0
enC1 .h/ R D 0; hnC1
f .nC1/ .a/ Rn .h/ D : .n C 1/Š h!0 hnC1
also
lim
Das Ergebnis kann mittels der Landau-Symbolik (Aufgabe 6[3.5]) so geschrieben werden: f .a C h/ D f .a/ C
f 0 .a/ f .nC1/ .a/ nC1 h C ((( C h C o.hnC1 / 1Š .n C 1/Š
Lösungshinweis zum ersten Teil: Man stelle
f .nC1/ .a/ „künstlich“ als Integral dar. .n C 1/Š
13. Die Legendre-Polynome Pn W R ! R sind definiert durch Pn .x/ ´
1 2n nŠ
dn .x 2 & 1/n ; dx n
n 2 N0 :
Man zeige: a) Pn ist ein Polynom vom Grad n. b) Es gilt Z
1
&1
Pn .x/Pm .x/ dx D 0 Z
1 &1
.Pn .x//2 dx D
.h &! 0/:
2 2n C 1
für n ¤ m aus N0 für n aus N0 :
410
Kapitel 8 Weiterführung der Analysis
c) Pn hat n einfache Nullstellen im Intervall /&1; 1Œ. 14. Mit der folgenden Aussage kann man Funktionen der Gestalt „Polynom mal Sinus“ in geschlossener Form integrieren: Sei g ein Polynom und r ¤ 0 eine reelle Zahl. Man bilde das neue Polynom G´
g .4/ g g 00 & 3 C 5 & C((( : r r r
(Die Summe bricht ab, da die höheren Ableitungen eines Polynoms jenseits des Grades verschwinden.) Man zeige: Z x 1 g.t/ sin rt dt D G 0 .x/ sin rx & G.x/ cos rx C G.0/; r 0 speziell für r ´ & und x ´ 1 G´
Z
g g 00 g .4/ & 3 C 5 & C((( W & & &
0
1
g.t/ sin & t dt D G.0/ C G.1/:
15. Seien f; g; h W A ! R in a 2 A n-mal differenzierbar (für ein n 2 N). Man zeige mittels vollständiger Induktion: a) Die Funktion f C g ist in a n-mal differenzierbar, und es gilt .f C g/.n/ .a/ D f .n/ .a/ C g .n/ .a/: b) Die Funktion f ( g ist in a n-mal differenzierbar, und es gilt die so genannte Leibniz-Regel: 0 ! n X n .n&k/ .n/ f .a/ ( g .k/ .a/: .f ( g/ .a/ D k kD0
c) Ist g.a/ ¤ 0, so ist die reziproke Funktion 1=g in a n-mal differenzierbar (und dann aufgrund von b) auch f =g). d) Im Falle g.a/ ¤ 0 zeige man mittels b): f und h=g stimmen dann und nur dann in a in n-ter Ordnung überein, wenn f ( g und h dies tun. 16. Wiederum mittels vollständiger Induktion beweise man für n 2 N: a) Gegeben seien Funktionen f W A &! R;
g W B &! R
mit
f .A/ , B:
Ist f in a 2 A n-mal differenzierbar und g in b ´ f .a/ n-mal differenzierbar, so ist g ı f in a n-mal differenzierbar. Für n D 2 berechne man explizit .g ı f /00 .a/.
Abschnitt 8.3 Höhere Ableitungen und die Taylor-Entwicklung
411
b) Für die Funktion f W A ! R sei vorausgesetzt: (i) f ist injektiv; (ii) f ist in a 2 A n-mal differenzierbar und f 0 .a/ ¤ 0; (iii) die Umkehrfunktion f &1 W f .A/ ! A ist in b ´ f .a/ stetig. Dann ist f &1 in b n-mal differenzierbar. Für n D 2 berechne man explizit .f &1 /00 .b/. 17. $ In dieser Aufgabe wird die Irrationalität von & bewiesen. Für das Polynom g.x/ ´
x n .1 & x/n nŠ
zeige man: a) g .k/ .0/ D .&1/k g .k/ .1/ 2 Z für alle k 2 N0 . b) Wird zu g nach der Vorschrift von Aufgabe 14 das Polynom G gebildet, d.h. G´ so gilt:
Z
1 0
g g 00 g .4/ & 3 C 5 & C((( ; & & &
g.t/ sin & t dt D G.0/ C G.1/:
Damit beweise man: Die Kreiszahl & ist nicht Quadratwurzel einer rationalen Zahl. Insbesondere ist & selbst irrational. Lösungshinweis: Angenommen, es wäre & 2 D ab mit a; b 2 N. Dann folgt aus der letzten Integralformel Z 1 &an g.t/ sin & t dt D &an G.0/ C &an G.1/: 0
R1 Mittels a) folgere man: &an G.0/; &an G.1/ 2 Z, also 0 &an g.t/ sin & t dt 2 Z. Andererseits zeige man Z 1 &an g.t/ sin & t dt D 0; lim n!1 0
also für genügend große n: 0
0 im Intervall fx 2 R j x < 1=bg, für b < 0 im Intervall fx 2 R j x > 1=bg und für b D 0 auf ganz R. Die Ableitung berechnet man nach dem Hauptsatz der Differential- und Integralrechnung und der Kettenregel als 1 .1 & xb/ ( 1 C .x C b/ ( b 3 x C b -2 ( .1 & xb/2 1C 1 & xb 1 C b2 1 C b2 D D : .1 & xb/2 C .x C b/2 .1 C b 2 /.1 C x 2 /
ˆ0 .x/ D
Somit ist ˆ0 .x/ D A0 .x/, also ˆ.x/ & A.x/ D const., und wegen ˆ.0/ & A.0/ D A.b/ & 0 ist die Konstante gleich A.b/, also ˆ.x/ & A.x/ D A.b/ im jeweiligen Intervall. Mit b D y entsteht die Behauptung. Zu (AU): Offensichtlich gilt 1 1 . 1: . 2 3=2 1 C t2 .1 C t / Hieraus folgt durch Integration von 0 bis x % 0 p
x 1 C x2
. A.x/ . x;
da 1=.1 C t 2 /3=2 die Stammfunktion t=.1 C t 2 /1=2 besitzt. " p Schreibt man .1 C t 2 /3=2 als .1 C t 2 / 1 C t 2 , so sieht man, dass hierzu keineswegs allgemeine Potenzen erklärt sein müssen: die Quadratwurzelfunktion reicht aus. Aus (AF) und (AU) kann man die weiteren Eigenschaften der Arkustangensfunktion ableiten, wobei es jetzt viel einfacher ist als in Abschnitt 2.5, weil die dortigen Beweise zur Eindeutigkeit und Existenz nun nicht mehr nötig sind. Die Existenz ergibt sich ja schon aus der Definition (3), und die Eindeutigkeit aus den Argumenten zu Beginn des Abschnitts 4.4. Nach Satz A(i)[4.4] folgt allein aus den Grundeigenschaften (AF) und (AU) die Differenzierbarkeit von A sowie die Ableitungsformel A0 .x/ D
1 ; 1 C x2
480
Kapitel 8 Weiterführung der Analysis
sodass A wegen A.0/ D 0 zwangsläufig durch den Ausdruck in (3) gegeben ist. Der weitere Ausbau der trigonometrischen Funktionen Kosinus und Sinus kann dann direkt wie in Abschnitt 4.4 gestartet werden. Bei den trigonometrischen Funktionen fällt der Aufwand bei der jetzigen Methode deutlich geringer aus als bei dem gänzlich elementaren Aufbau in 4.4. Aber das hat auch hier seinen Preis. Man braucht für den jetzigen Zugang nicht nur die Differentialrechnung, sondern auch die Integralrechnung, die zuvor entwickelt sein muss. Komplexe Vereinheitlichung Die bisherigen Alternativen arbeiten rein im Reellen, ebenso wie die elementaren Methoden der Abschnitte 2.4 und 2.5. Erlaubt man den Durchgang durchs Komplexe, so stellt es sich heraus, dass die Exponentialfunktion und die trigonometrischen Funktionen eine innige Einheit bilden. Das ist dann gewissermaßen der „ultimative“ Weg zu diesen Funktionen. Dieser Zugang ist so schön, dass er dem Leser nicht vorenthalten werden soll. Ein Wermutstropfen für den Anfänger ist natürlich die Verwendung komplexer Zahlen und der Grenzübergänge für diese, insbesondere der komplexen Potenzreihen. All das muss zuvor bekannt sein. Man geht auf folgende Weise vor: Zunächst erklärt man die obige Funktion E auch komplex als Abbildung E W C ! C durch die Potenzreihe (4)
E.z/ ´
1 X zj j D0
jŠ
D1CzC
z2 z3 C C ((( ; 2Š 3Š
z 2 C:
Wie oben ist natürlich auch hier der Konvergenzradius r D 1, und das CauchyProdukt liefert genau wie bei Satz A die Funktionalgleichung E.z C w/ D E.z/ ( E.w/
für alle z; w 2 C:
Wegen E.0/ D 1 ist speziell E.z/E.&z/ D E.0/ D 1 also stets E.z/ ¤ 0 und E.&z/ D
1 : E.z/
Außerdem folgt aus der Potenzreihendarstellung, da das Konjugieren eine stetige Operation ist und die Koeffizienten reell sind: E.z/ D
1 X zj j D0
jŠ
D
1 X zj j D0
jŠ
D E.z/:
Durch gliedweises Differenzieren der Potenzreihe (4) ergibt sich E 0 .z/ D 1 C
3z 2 2z C C ( ( ( D E.z/; 2Š 3Š
Abschnitt 8.9
$ Andere Zugänge zu den elementaren Funktionen
481
d.h. E reproduziert sich beim komplexen Ableiten, und nach der komplexen Kettenregel gilt für jede C 1 -Abbildung 0 W J ! C (J ein Intervall): .E ı 0/0 .t / D E 0 .0.t // ( 0 0 .t /: Vgl. (11)[7.3] und Satz U[8.5]. Für reelle Argumente z D s 2 R stimmt E.s/ natürlich mit dem obigen E.s/ 2 R überein. Für rein imaginäre Argumente z D it, t 2 R, ist E.it/ D E.&it/ D 1=E.it/, also jE.it/j D 1: Kosinus und Sinus sind in diesem Aufbau als Funktionen von R in R definierbar durch (5)
C.t/ ´ Re .E.it//;
S.t/ ´ Im .E.it//;
und es folgt sogleich C.t/2 C S.t/2 D 1;
C.0/ D 1;
S.0/ D 0
sowie wegen E.it/ D E.&it/, dass C eine gerade und S eine ungerade Funktion ist. Aus E.it/ D C.t/ C iS.t/ ergibt sich, da die Ableitung der linken Seite nach t gleich E.it/ ( i ist: C 0 .t/ C iS 0 .t / D i.C.t/ C iS.t//, also C 0 .t / D &S.t/;
S 0 .t / D C.t/:
Damit ist der Anschluss an die Grundeigenschaften von Kosinus und Sinus in (2)[4.4] erreicht, und man kann von da ab die Eigenschaften dieser Funktionen so entwickeln, wie dort beschrieben. Allerdings ist bei der augenblicklichen Vorgehensweise der Arkustangens und der Tangens zunächst nicht vorhanden und damit auch nicht die damalige Erklärung von &. Die Definition von & kann hier aber so erfolgen: C. Satz und Definition. Die Funktion C W R ! R (5) hat eine kleinste positive Nullstelle, genannt &=2: & ´ min ft > 0 j C.t/ D 0g: 2 Beweis. Durch einen Widerspruchsbeweis erkennt man zunächst, dass C überhaupt eine positive Nullstelle besitzt. Angenommen, C wäre ohne jede Nullstelle in RC , also – da C eine gerade Funktion und C.0/ D 1 ist – in ganz R. Nach dem Zwischenwertsatz folgte dann aus C.0/ > 0 sogar C.t/ > 0 in R. Wegen S 0 D C wäre S streng monoton wachsend und wegen S.0/ D 0: S.t/ > 0 in RC . Nun wähle man ein t0 2 RC fest. Dann gälte für t > t0 nach dem Mittelwertsatz für eine Stelle ) 2 /t0 ; tŒ: C.t/ & C.t0 / D .t & t0 /C 0 .)/ D &.t & t0 /S.)/ < &.t & t0 /S.t0 /;
482
Kapitel 8 Weiterführung der Analysis
also
C.t/ < C.t0 / & .t & t0 /S.)/:
Dies implizierte C.t/ < 0 für hinreichend große t > 0, Widerspruch! Somit ist die Nullstellenmenge von C in RC nicht leer, und dann ihr Infimum selbst Nullstelle wegen der Stetigkeit von C . Dieses Infimum ist nicht 0, da C.0/ D 1, also ist es die kleinste positive Nullstelle von C . " Dieser Beweis hätte auch in Abschnitt 4.4 so geführt werden können. Nun kann man wie dort weiter vorgehen, und zwar in folgender Anordnung: D, E (ohne die Existenz, die ja hier schon feststeht), F (wobei das meiste schon bekannt ist und die Additionstheoreme direkt aus E.i.˛ C ˇ// D E.i˛/E.iˇ/ abgelesen werden können), G, I (wobei nur S.&=2/ D 1 gezeigt werden muss), J (bis auf (iii)). Der Punkt J(iii)[4.4] wird hier ersetzt durch die Definition T .t / ´
S.t/ C.t/
für t …
& C Z&: 2
Ab K[4.4] wird dann alles beibehalten, insbesondere auch die Beziehungen zum Einheitskreis. Die Dinge in Abschnitt 7.2 sind beim vorliegenden Aufbau zum großen Teil direkt ersichtlich oder Übertragungen vom Reellen ins Komplexe. Selbstverständlich wird man auch hier ab einem geeigneten Zeitpunkt die klassischen Bezeichnungen gebrauchen: E.z/ µ e z µ exp z sowie C.t/ µ cos t;
S.t/ µ sin t;
T .t/ µ tan t;
C.t/ µ cot t: S.t/
Die Taylor-Entwicklungen von Kosinus und Sinus mit Zentrum 0 ergeben sich nun aus (4) durch die Substitution z D it und Trennung von Real- und Imaginärteil entsprechend (5) als cos t D
1 X
.&1/k
kD0
t 2k ; .2k/Š
sin t D
1 X kD0
.&1/k
t 2kC1 .2k C 1/Š
mit Konvergenz und Darstellung in ganz R (in Übereinstimmung mit L(ii)[8.3]). Bei der obigen rein reellen Behandlung von E.x/ ergab sich die Übereinstimmung der additiven und multiplikativen Darstellung, (2), indirekt über den Eindeutigkeitsbeweis bei Satz A[2.4]. Das kann man auch über eine direkte Abschätzung zeigen, die ganz allgemein sowohl reell wie auch komplex besteht:
Abschnitt 8.9
$ Andere Zugänge zu den elementaren Funktionen
483
D. Lemma. Für alle z 2 C und n 2 N gilt ˇ /n ˇ . 2 n ˇ ˇ ˇ1 C z C z C ( ( ( C z & 1 C z ˇ . 1 jzj2 e jzj : ˇ 1Š 2Š nŠ n ˇ n Beweis. Zunächst hat man nach der binomischen Formel: 0 ! 0 ! 0 ! 0 ! / . n z2 z n n z n z3 n zn C 1C D1 C C C ( ( ( C n 2 n2 1 n 3 n3 n nn n ( .n & 1/ z 2 n ( .n & 1/ ( .n & 3/ z 3 nz C C n 1Š n2 2Š n3 3Š n n ( .n & 1/ ( ( ( 1 z C ((( C nn nŠ z z2 z3 zn D 1 C cn1 ( C cn2 C cn3 C ( ( ( C cnn 1Š 2Š 3Š nŠ D1 C
mit
. /. / . / 1 2 k&1 cnk ´ 1 ( 1 & 1& ((( 1 & ; n n n
1 . k . n:
Für die fragliche Differenz ergibt sich hieraus . / zn z3 zn z z2 z n z2 1C C C( ( (C & 1C D .1&cn2 / C.1&cn3 / C( ( (C.1&cnn / : 1Š 2Š nŠ n 2Š 3Š nŠ Die neuen Koeffizienten lassen sich so abschätzen / . / . .k & 1/2 .k & 1/2 k & 1 k&1 .1& 1& D ; 0 . 1 & cnk . 1 & 1 & n n n wobei zum Schluss die Bernoullische Ungleichung (B[1.3]) verwendet wurde. Damit wird ˇ . /n ˇ X n 2 n ˇ ˇ .k & 1/2 jzjk ˇ1 C z C z C ( ( ( C z & 1 C z ˇ . ˇ 1Š 2Š nŠ n ˇ n kŠ kD2
1
.
1 2 X .k & 1/2 jzjk&2 jzj n k.k & 1/ .k & 2/Š kD2
. wie behauptet. Hieraus folgt unmittelbar:
1 2 jzj jzj e ; n "
484
Kapitel 8 Weiterführung der Analysis
E. Satz. Für alle z 2 C gilt . / 1 X z n zk e D D lim 1 C : n!1 kŠ n z
kD0
Beide Darstellungen konvergieren gleichmäßig in jeder Kreisscheibe B.0; r/ * C mit r 2 RC . " Aufgaben und Anmerkungen 1. Man zeige anhand der Taylor-Entwicklung: cos 2 < 0 und schließe daraus, dass die Kosinusfunktion eine kleinste positive Nullstelle (< 2) besitzt. Lösungshinweis: Man fasse in der Taylor-Entwicklung des Kosinus Glieder analog zusammen wie beim obigen Beweis von (EU) bei Satz A. 2. Man beweise allein aus der Potenzreihe (4) für z 2 C und n 2 N: ˇ ˇ . nC1 2 n /ˇ ˇ z ˇe & 1 C z C z C ( ( ( C z ˇ . jzj e jzj ˇ 1Š 2Š nŠ ˇ .n C 1/Š sowie, falls n C 2 > jzj: ˇ ˇ . nC1 2 n /ˇ ˇ z nC2 ˇe & 1 C z C z C ( ( ( C z ˇ . jzj : ˇ ˇ 1Š 2Š nŠ .n C 1/Š n C 2 & jzj
9
Elementare Analysis im Rn
Die meisten Effekte unterliegen mehreren Einwirkungen. Das gilt im täglichen Leben und auch in der Wissenschaft. Die Steuern, die eine Familie zu zahlen hat, hängen vom Einkommen der beiden Eltern und von der Zahl der Kinder ab. Der Druck in einem Gasbehälter ist eine Funktion der Gasmenge und der Temperatur. Das Volumen eines Autoreifens wird bestimmt durch inneren und äußeren Durchmesser und die Breite des Reifens. Oft kommen noch weitere Einflüsse hinzu. Andererseits gibt es auch Funktionen von einer Veränderlichen, die mehrere Zahlenwerte zugleich liefern, z.B. die beiden geographischen Koordinaten eines fahrenden Autos in Abhängigkeit von der Zeit. Diese Beispiele zeigen schon, dass Funktionen von mehreren Veränderlichen untersucht werden sollten, um das verschiedene Zusammenwirken der Veränderlichen zu verstehen oder um z.B. Maxima und Minima festzustellen. In diesem abschließenden Kapitel des ersten Bandes studieren wir Aspekte solcher mehrdimensionaler Abhängigkeiten, die direkt von den Funktionen einer Veränderlichen her zugänglich sind. Begriffe dieser Art sind z.B. die Bogenlänge von Kurven oder die partiellen Ableitungen. Im zweiten Band werden diese Gesichtspunkte neu aufgenommen, und zwar im allgemeinen Rahmen der normierten Vektorräume. Der Lebensraum der Analysis mehrerer Veränderlicher ist der Rn , die Menge der nTupel reeller Zahlen. Solche n-Tupel werden meistens als Spalten aufgefasst, z.B. 1 x1 B C x ´ @ ::: A ; 0
xn
1 y1 B C y ´ @ ::: A : 0
yn
Rn ist ein reeller Vektorraum unter den komponentenweisen Operationen 1 0 1 0 1 x1 C y1 y1 x1 C B B C B C :: x C y D @ ::: A C @ ::: A ´ @ A; : 0
xn
yn
xn C yn
1 1 0 *x1 x1 C B B C *x D * @ ::: A ´ @ ::: A ; * 2 R: 0
xn
*xn
Die Schreibweise der n-Tupel als Spalten ist nicht streng fixiert; man kann sie auch als Zeilen schreiben, wie wir das bei den kartesischen Produkten oder z.B. im R2 schon getan haben, wo die Elemente mit .a; b/ bezeichnet wurden. Im Zusammenhang mit dem Matrizenkalkül ist allerdings die Spaltenversion vereinbart. Statt *x D * ( x schreibt man auch x* D x ( *. Für Grenzprozesse in Rn wird zunächst die Maximumsmetrik dm verwendet, dann aber auch die Euklidische Standard-Metrik d . Beide entstehen aus einer Norm,
Kapitel 9 Elementare Analysis im Rn
486
nämlich aus den folgenden Ausdrücken jxjm und jxj: jxjm ´ max fjx1 j; : : : ; jxn jg W jxj ´
dm .x; y/ ´ jx & yjm
p jx1 j2 C ( ( ( C jxn j2 W
d.x; y/ ´ jx & yj:
Im Fall der Maximumsmetrik ist sehr leicht an dem Ausdruck für dm zu erkennen, dass die Metrikaxiome erfüllt sind. Die Dreiecksungleichung ist zunächst in der Gestalt ersichtlich: jx C yjm . jxjm C jyjm , und hieraus folgt dm .x; z/ D jx & zjm D j.x & y/ C .y & z/jm . jx & yjm C jy & zjm D dm .x; y/ C dm .y; z/: Im Fall der Euklidischen Standard-Metrik gilt das Gleiche, wobei genau wie eben aus der Dreiecksungleichung in der Variante (7)[8.6] die allgemeine Gestalt d.x; z/ . d.x; y/ C d.y; z/ folgt. Wie bei R2 in 7.3 sind beide Normen gegeneinander abschätzbar: jxjm . jxj . p njxjm , indem man den Quadratausdruck in jxj dadurch verkleinert, dass man nur die größte der Zahlen x12 ; : : : ; xn2 beibehält, bzw. dadurch vergrößert, dass alle durch ihr Maximum ersetzt werden. Dann folgt weiter durch Anwendung auf die Differenz x & y: (1)
dm .x; y/ . d.x; y/ .
p ndm .x; y/
mit der in Abschnitt 7.3 beschriebenen Konsequenz, dass die Konvergenzbegriffe unabhängig davon sind, welche der beiden Metriken man zu ihrer Formulierung verwendet. Wir kommen später im Rahmen der normierten Vektorräume auf diese Dinge ausführlich zurück (wobei die Notation für diverse Normen stärker systematisiert wird). Für die augenblicklichen Zwecke reichen die eben genannten Tatsachen. Als Distanz wird in diesem Kapitel meistens die Euklidische Standard-Metrik benutzt.
9.1 Abbildungen vom Wegtypus Ein typisches Beispiel für solche Abbildungen ist die Bewegung eines Punktes im Raum in Abhängigkeit von der Zeit. Deshalb nennt man die unabhängige Veränderliche häufig t , obwohl diese auch eine andere Bedeutung haben kann. Die präzise
487
Abschnitt 9.1 Abbildungen vom Wegtypus
mathematische Darstellung ist natürlich unabhängig von möglichen Deutungen und verläuft so: Sei J Intervall in R. Wir betrachten eine Abbildung des Typs: 0 W J &! Rn
1 01 .t / C B t& 7 ! 0.t/ D @ ::: A : 0
0n .t /
Wie gesagt, physikalisch beschreibt dies die „Wanderung eines Punktes“ im Rn in Abhängigkeit von der „Zeit“ t. Mathematisch handelt es sich um mehrere Funktionen 01 ; : : : ; 0n einer reellen Veränderlichen t , zusammengefasst zu einem n-Tupel. Das Intervall J soll natürlich nicht leer sein und bei Differenzierbarkeitsfragen innere Punkte besitzen. A. Definition. Ein Weg im Rn ist eine stetige Abbildung 0 W J ! Rn . Er hat die Eigenschaft „stetig“ oder „differenzierbar“ oder „von der Klasse C 1 “ usw. wenn alle 0i jeweils diese Eigenschaft haben. Entsprechend sind Differenzieren und Integrieren „komponentenweise“ erklärt: 0Z ˇ 1 0 0 1 0 1 .t / 01 .t / dt C B Z ˇ B C B ˛ C B C B C :: 0 0 .t / D B ::: C ; 0.t/ dt ´ B C für Œ˛; ˇ/ , J : : BZ C @ A ˛ @ ˇ A 0 0 n .t / 0n .t / dt ˛
Ist das Definitionsintervall kompakt, also der Weg von der Form 0 W Œa; b/ ! Rn , so heißt 0.a/ sein Anfangspunkt und 0.b/ sein Endpunkt. Man nennt dann 0 auch einen Weg von 0.a/ nach 0.b/. Die Komponenten in der letzten Spalte sind natürlich gewöhnliche Integrale, wie sie in Abschnitt 5.1 eingeführt wurden. Wir bezeichnen solche Integrale zur besseren UnRˇ terscheidung jetzt auch als skalare Integrale und entsprechend ˛ 0.t/ dt als vektorielles Integral. B. Beispiele. (i) Sei n D 2. Ein Kreis (besser: Kreislinie) mit Radius r > 0 und Mittelpunkt 0 2 R2 entsteht als Bild des Wegs: / . r cos t 2 : 0 W Œ0; 2&Œ &! R ; 0.t / ´ r sin t Das Bild ist also
˚ , 0 .Œ0; 2&Œ/ D .x; y/ 2 R2 j x 2 C y 2 D r 2 :
Kapitel 9 Elementare Analysis im Rn
488
γ(t)
Die Abbildung 0 W Œ0; 2&Œ ! 0 .Œ0; 2&Œ/ ist nach O[4.4] bijektiv. Sie entspricht der transzendenten Parametrisierung der Einheitskreislinie S1 , gestreckt mit dem Faktor r.
r 0
(ii) Sei n D 3. Eine Schraubenlinie oder Helix wird beschrieben durch 1 0 r cos t 0 W R &! R3 ; 0.t / ´ @ r sin t A ; pt r > 0; p > 0 fest. Sie wickelt sich um einen Zylinder vom Radius r mit der 3Achse als Achse, indem die Projektion von 0.t/ auf einem Kreis in der (1,2)-Ebene wandert, während gleichzeitig die „Höhe“ (die dritte Koordinate von 0.t/) proportional zu t ansteigt: „Parkhausauffahrt“.
x
x3
t = 2π
x1
t=0
x2
(iii) Sei n 2 N beliebig. Die gerade Strecke zwischen zwei Punkten A; B 2 Rn wird beschrieben durch 0 W Œ0; 1/ ! Rn ; (1)
0.t/ ´ A C t.B & A/ D .1 & t/A C tB:
Für t D 0 ergibt sich der Anfangspunkt A, für t D 1 der Endpunkt B. Genauer gesagt, ist die gerade Strecke oder das Segment zwischen A und B definiert als die Bildmenge des Wegs (1). Wir beleuchten zunächst die beiden grundlegenden Operationen des Differenzierens und Integrierens und gehen dann zum Begriff der Bogenlänge über: C. Definition und Satz. Ist 0 W J ! Rn in t0 2 J differenzierbar, so heißt 0 0 .t0 / der Tangentialvektor von 0 in t0 . Es gilt: (2)
0 0 .t0 / D lim
t !t0
0.t/ & 0.t0 / : t & t0
/&+i .t0 / 0/ Beweis. Der Vektor +.t/&+.t hat offensichtlich die Komponenten +i .t t&t . Wegen t&t0 0 der komponentenweisen Grenzübergänge folgt daraus die Behauptung (2). "
489
Abschnitt 9.1 Abbildungen vom Wegtypus
Anschauliche Deutung:
γ(t)
Nach (2) ist 0 0 .t0 / der Grenzwert von „Sekantenvektoren“, dividiert durch t & t0 . Physikalische Deutung: 0 0 .t0 / ist der Geschwindigkeitsvektor, j0 0 .t0 /j die Geschwindigkeit.
γ(t0)
γ'(t0)
0
0/ C. Zusatz. Ist 0 0 .t0 / ¤ 0, so nennt man den Weg in t0 regulär und bezeichnet j++ 0 .t .t0 /j 0 als den Tangenteneinheitsvektor von 0 in t0 . Ist 0 .t / ¤ 0 für alle t 2 J , so heißt 0 regulär schlechthin.
Von den Rechenregeln zur Ableitung bleibt das meiste erhalten, z.B. die Summenund Produktregel sowie die Kettenregel, soweit die involvierten Operationen sinnvoll sind: Sind 0; ! W J ! Rn sowie f W J ! R und ' W e J ! J (e J ein Intervall) differenzierbar, so gilt dasselbe für 0 C !, f ( 0 und 0 ı ', und es ist .0 C !/0 D 0 0 C ! 0 ;
.f ( 0/0 D f 0 ( 0 C f ( 0 0 ;
.0 ı '/0 D .0 0 ı '/ ( ' 0 :
Die Produktregel gilt auch für das Skalarprodukt: ˝ ˛ ˝ ˛ .h0; !i/0 D 0 0 ; ! C 0; ! 0 : All dies folgt rein rechnerisch aus der komponentenweisen Definition der Ableitung (ohne jegliche Grenzprozesse). Die letzte Regel impliziert speziell .j0j2 /0 D .h0; 0i/0 D 2 h0; 0 0 i und damit, falls 0 nicht null wird: j0j0 D
h0; 0 0 i : j0j
Auch beim Integral übertragen sich die meisten Regeln unmittelbar aufgrund der komponentenweisen Definition, insbesondere die Zerlegungsregel, die Linearität und die Normierung. Dagegen ist die positive Semidefinitheit für n % 2 sinnlos, da Rn nicht angeordnet ist; vgl. den Beginn des Abschnitts 5.1. Auch der Hauptsatz der Differential- und Integralrechnung bleibt in den drei Versionen von Abschnitt 5.2 erhalten, wie man direkt an der obigen Definition A erkennt. Nichttrivial sind die damaligen Konsequenzen aus der positiven Definitheit, insbesondere die Abschätzungsregel. Diese wird hier folgendermaßen behandelt:
Kapitel 9 Elementare Analysis im Rn
490
D. Satz (Dreiecksungleichung für vektorielle Integrale). Für jede stetige Abbildung 0 W Œa; b/ ! Rn gilt: ˇZ ˇ Z ˇ b ˇ b ˇ ˇ (3) 0.t/ dt ˇ . j0.t/j dt: ˇ ˇ a ˇ a Beweis. Ein möglicher Beweis stützt sich auf Riemann-Summen. Jedoch kann auf diesem Wege nicht die Gleichheit diskutiert werden. Wir bevorzugen deshalb das folgende Vorgehen: Für jedes u 2 Rn gilt (der Kürze halber in argumentfreier Notation): ˇ* Z ˇ Z +ˇ ˇZ Z b Z b ˇ ˇ b ˇ ˇ b b ˇ ˇ ˇ ˇ j0j: 0 ˇDˇ jhu; 0ij . juj ( j0 j D juj ( hu; 0iˇ . ˇ u; ˇ ˇ a ˇ ˇ a a a a Dabei wurden die Regeln für skalare Integrale und bei der letzten Abschätzung die Cauchy/Schwarz-Ungleichung in Rn verwendet; vgl. G[8.6]. Spezialisiert man nun u Rb zu u0 ´ a 0, so folgt ˇZ ˇ Z Z b Z b ˇ b ˇ b ˇ ˇ 2 (4) ju0 j D hu0 ; u0 i D ˇ jhu0 ; 0ij . ju0 j(j0 j D ju0 j( j0j: hu0 ; 0iˇ . ˇ a ˇ a a a Anfang und Ende dieser Kette liefern, falls ju0 j ¤ 0: ju0 j . richtig, falls ju0 j D 0. Dies ist die Behauptung.
Rb a
j0 j, und das ist trivial "
D. Zusatz. Die Dreiecksungleichung (3) geht genau dann in eine Gleichung über: ˇ Z ˇZ ˇ ˇ b b ˇ ˇ j0.t/j dt; 0.t/ dt ˇ D (5) ˇ ˇ ˇ a a wenn 0 von der Form ist 0 D p ( c mit einer nichtnegativen stetigen Funktion p W n Œa; b/ ! RC 0 und einem konstanten Element c 2 R . Beweis. Ist 0 von der genannten Form, so ist (5) offensichtlich richtig. Sei nun umgekehrt (5) vorausgesetzt. Es werden die Bezeichnungen aus dem vorhergehenden Beweis beibehalten. Im Fall u0 D 0 folgt aus (5): 0 D 0, sodass die Behauptung mit p D 0 und c D 0 erfüllt ist. Im Fall u0 ¤ 0 folgt aus (5), dass in (4) an der Stelle der beiden Kleinergleichzeichen jeweils das Gleichheitszeichen steht. Aus der Gleichheit bei der zweiten Position ergibt sich Z b .ju0 j ( j0j & j hu0 ; 0i j/ D 0: a
491
Abschnitt 9.1 Abbildungen vom Wegtypus
Da der Integrand nach der Cauchy/Schwarz-Ungleichung nichtnegativ ist, muss er gleich null sein. Daraus folgt nach der Gleichheitsdiskussion der Cauchy/SchwarzUngleichung in G[8.6]: 0 D q ( u0 mit einer reellen Funktion q W Œa; b/ ! R, deren Stetigkeit wegen u0 ¤ 0 aus der Stetigkeit von 0 ˇfolgt.ˇDurch Einsetzen von 0 D q(u0 Rb ˇR b ˇ folgt aus der Gleichheit bei der ersten Position: ˇ a q ˇ D a jqj. Nach der „skalaren Gleichheitsdiskussion“ in K[5.2] ist dann q stets nichtnegativ oder stets nichtpositiv. Wegen 0 D q ( u0 folgt damit die Behauptung mit p ´ q und c ´ u0 im ersten Fall und p ´ &q und c ´ &u0 im zweiten Fall. " E. Folgerung. Sei 0 W Œa; b/ ! Rn stetig differenzierbar und t0 2 Œa; b/. Dann gilt: j0.b/ & 0.a/j . max j0 0 .t/j ( .b & a/
(6)
t2Œa;b*
(7) j0.b/ & 0.a/ & 0 0 .t0 /.b & a/j . max j0 0 .t/ & 0 0 .t0 /j ( .b & a/ t2Œa;b*
3 j0.b/ & 0.a/j % j0 0 .t0 /j & max j0 0 .t / & 0 0 .t0 /j ( .b & a/:
(8)
t2Œa;b*
Die erste Abschätzung ersetzt den Mittelwertsatz der Differentialrechnung, der für vektorwertige Abbildungen nicht mehr in der gewohnten Form gültig ist. Man nennt sie den Schrankensatz oder den Satz vom endlichen Zuwachs. Beweis von E. Zu (6): Dies ergibt sich ganz leicht durch eine Kombination des Hauptsatzes der Differential- und Integralrechnung mit der Dreiecksungleichung: ˇ Z ˇZ ˇ ˇ b b ˇ ˇ j0 0 .t/j dt 0 0 .t / dt ˇ . j0.b/ & 0.a/j D ˇ ˇ ˇ a a Z b 0 . max j0 .t /j ( dt D max j0 0 .t/j ( .b & a/: t 2Œa;b*
a
t2Œa;b*
Zu (7): Wendet man (6) auf g.t/ ´ 0.t/ & 0 0 .t0 /t anstelle 0.t/ an, so ergibt sich jg.b/ & g.a/j . max j0 0 .t / & 0 0 .t0 /j ( .b & a/: t 2Œa;b*
Das ist die Behauptung, da g.b/ & g.a/ D 0.b/ & 0.a/ & 0 0 .t0 /.b & a/. Zu (8): Mit der modifizierten Dreiecksungleichung gilt zunächst j0.b/ & 0.a/j D j0 0 .t0 /.b & a/ C 0.b/ & 0.a/ & 0 0 .t0 /.b & a/j % j0 0 .t0 /.b & a/j & j0.b/ & 0.a/ & 0 0 .t0 /.b & a/j:
Kapitel 9 Elementare Analysis im Rn
492
Wendet man nun auf den letzten Term (7) an, so folgt die Behauptung.
"
Bogenlänge Die Bogenlänge soll die Länge eines Weges messen. Handwerklich erhält man diese Länge, indem man einen Faden entlang der Bildmenge des Weges legt, den Faden (ohne Dehnung) gerade streckt und dann seine Länge feststellt. Mathematisch nähert man die Bildmenge des Weges durch Streckenzüge an, deren Ecken auf der Bildmenge liegen. Jeder solche Streckenzug besitzt eine elementargeometrische Länge, nämlich die Summe der Längen seiner Seiten.
γ(b) γ(tj)
γ(tj-1) γ(a) Daran muss sich ein Grenzprozeß anschließen, um den Weg immer feiner durch solche Streckenzüge anzunähern. Da die Hinzunahme eines weiteren Eckpunkts auf der Bildmenge die Länge des Streckenzugs nicht verkleinert, reicht es in diesem Fall, zum Supremum der Längen aller einbeschriebenen Streckenzüge überzugehen. Spezielle Unterteilungen sind zwar möglich, aber zur Definitionen nicht erforderlich. Statt „Streckenzug“ sagt man auch Polygonzug. Somit lautet die endgültige Definition wie folgt: F . Definition. Gegeben sei ein Weg 0 W Œa; b/ ! Rn . Ist Z eine Zerlegung des Intervalls Œa; b/: (9)
Z D ft0 ; t1 ; : : : ; tk g mit a D t0 < t1 < ( ( ( < tn D b;
so definiert man die zugehörige Länge des einbeschriebenen Polygonzugs als P .0; Z/ ´
k X j D1
j0.tj / & 0.tj &1 /j:
493
Abschnitt 9.1 Abbildungen vom Wegtypus
Der Weg 0 heißt rektifizierbar, wenn die Größen P .0; Z/, genommen über alle Zerlegungen Z von Œa; b/, nach oben beschränkt sind. Die Bogenlänge von 0 ist dann definiert als das Supremum: ˇ ˚ , Lba .0 / ´ sup P .0; Z/ ˇ Z Zerlegung von Œa; b/ : Man schreibt auch kürzer P .Z/ statt P .0; Z/, wenn klar ist, um welchen Weg es sich handelt, und L.0/ statt Lba .0/, wenn klar ist, was das (kompakte) Definitionsintervall von 0 ist. Hat ein Weg ein beliebiges Definitionsintervall, 0 W J ! Rn , und ist für ein ˇ ˇ Teilintervall Œ˛; ˇ/ , J die Restriktion 0 Œ˛; ˇ/ rektifizierbar, so schreibt man statt ˇ Lˇ˛ .0 ˇŒ˛; ˇ// kürzer Lˇ˛ .0/. Im C 1 -Fall kann das Supremum durch das Integral über die Geschwindigkeit j0 0 .t /j ersetzt werden, was natürlich eine große Erleichterung darstellt. Statt dieses begrifflich zu beweisen, wollen wir die Differenz zwischen den Polygonzuglängen und diesem Integral konkret abschätzen. Das geschieht mittels des Feinheitsmaßes und des Stetigkeitsmoduls, an deren Definition erinnert sei: Für eine Zerlegung Z wie in (9) ist das Feinheitsmaß ı.Z/ einfach das Maximum der Intervall-Längen tj & tj &1 für j D 1; : : : ; k; vgl. P[5.1]. Der Stetigkeitsmodul von 0 ist für jedes 1 > 0 gegeben durch ˇ , ˚ (10) !+ .1/ ´ sup j0.t/ & 0.s/j ˇ t; s 2 Œa; b/; jt & sj < 1 : Wegen der gleichmäßigen Stetigkeit von 0 existiert dieses Supremum in R. Auch könnte man (ebenfalls wegen der Stetigkeit) die Bedingung jt &sj < 1 ohne Änderung von !+ .1/ durch jt & sj . 1 ersetzen. Vgl. G[6.5]. G. Lemma. Sei 0 W Œa; b/ ! Rn ein stetig differenzierbarer Weg und Z eine Zerlegung des Intervalls Œa; b/ mit dem Feinheitsmaß ıZ . Dann gilt Z b 3 j0 0 .t /j dt &P .0; Z/ . !j+ 0 j .ıZ /C!+ 0 .ıZ / (.b &a/ . 2!+ 0 .ıZ /(.b &a/: 0. a
Insbesondere ist 0 rektifizierbar. Zu beachten ist, dass in dieses Lemma nicht der Stetigkeitsmodul von 0 selbst, sondern der von 0 0 und j0 0 j eingeht. Beweis von G. Einerseits gilt, wenn man wieder Funktionsdifferenzen mit dem Hauptsatz der Differential- und Integralrechnung ausdrückt: ˇ k ˇ Z tj k X X ˇ ˇ 0 ˇ 0 .t/ dt ˇˇ j0.tj / & 0.tj &1 /j D P .0; Z/ D ˇ j D1
j D1
.
k Z X j D1
tj tj #1
j0 0 .t /j dt D
Z a
b
tj #1
j0 0 .t /j dt:
Kapitel 9 Elementare Analysis im Rn
494
Insbesondere ist P .0; Z/ nach oben beschränkt und damit 0 rektifizierbar. Andererseits gilt unter Verwendung von (8) 3 j0.tj / & 0.tj &1 /j % j0 0 .tj &1 /j & max
t 2Œtj #1 ;tj *
j0 0 .t / & 0 0 .tj &1 /j ( .tj & tj &1 /
( ) % j0 0 .tj &1 /j & !+ 0 .ıZ / ( .tj & tj &1 /; also P .0; Z/ %
k X
j0 0 .tj &1 /j ( .tj & tj &1 / & !+ 0 .ıZ / ( .b & a/
j D1
und damit Z a
b
j0 0 .t /j dt & P .0; Z/ .
k Z X j D1
&
tj tj #1
k X
j0 0 .t /j dt
j0 0 .tj &1 /j ( .tj & tj &1 / C !+ 0 .ıZ / ( .b & a/
j D1
D
k Z X j D1
tj tj #1
( 0 ) j0 .t/j & j0 0 .tj &1 /j dt C !+ 0 .ıZ / ( .b & a/
. !j+ 0 j .ıZ / ( .b & a/ C !+ 0 .ıZ / ( .b & a/: ˇ ˇ Schließlich gilt wegen ˇj0 0 .t /j & j0 0 .s/jˇ . j0 0 .t / & 0 0 .s/j: !j+ 0 j .1/ . !+ 0 .1/; womit alles bewiesen ist.
"
H. Satz. Jeder stetig differenzierbare Weg 0 W Œa; b/ ! Rn ist rektifizierbar, und seine Bogenlänge ist gegeben durch Z b b j0 0 .t /j dt: La .0 / D a
Ist .ZN /N 2N eine Folge von Zerlegungen des Intervalls Œa; b/, deren Feinheitsmaße gegen null konvergieren: limN !1 ıZN D 0, so folgt limN !1 P .0; ZN / D Lba .0 / mit der Fehlerabschätzung ) ( 0 . Lba .0/ & P .0; ZN / . !j+ 0 j .ıZN / C !+ 0 .ıZN / ( .b & a/ . 2!+ 0 .ıZN / ( .b & a/:
495
Abschnitt 9.1 Abbildungen vom Wegtypus
Beweis. Nach der ersten Ungleichung in Lemma G wissen wir bereits, dass für jede Zerlegung Z von Œa; b/ gilt Z P .0; Z/ .
b
a
j0 0 .t /j dt:
Durch Übergang zum Supremum folgt hieraus Lba .0 /
Z .
b a
j0 0 .t /j dt:
Zum Nachweis der inversen Ungleichung sei ein " > 0 vorgegeben. Dann kann durch passende Wahl von Z der letzte Term in der Ungleichungskette von Lemma G kleiner als " gemacht werden. Denn es gilt wegen der gleichmäsigen Stetigkeit von 0 0 (11)
lim !+ 0 .1/ D 0: ,#0
Rb Für eine solche Zerlegung Z gilt dann nach G: P .0; Z/ > a j0 0 .t /j dt & ". Hieraus Rb folgt für das Supremum: Lba .0 / > a j0 0 .t /j dt & " und daraus: Lba .0 / Rb % a j0 0 .t /j dt durch Grenzübergang " # 0. Der Rest der Behauptung ergibt sich unmittelbar aus den Ungleichungen von Lemma G, wenn man diese für Z D ZN spezialisiert und Gleichung (11) beachtet. " I. Beispiele. (i) Die Funktion f W Œa; b/ ! R, x 7! f .x/ sei C 1 . Der zugehörige y Weg ist / . t ; a . t . b: 0.t/ ´ f .t/
γ(t) =
( tf(t) )
Somit ist die Bogenlänge dieses Weges: Lba .0 /
Z D
p 1 C .f 0 .t //2 dt
b
p 1 C .f 0 .x//2 dx:
a
Z D
b
a
a
x=t
b
x
(ii) Einheitskreislinie, exakt einmal durchlaufen, vgl. O[4.4] (einschließlich Zusatz):
Kapitel 9 Elementare Analysis im Rn
496
2
0 W Œ0; 2&Œ &! R ; t 0
y
γ(t)
j0 0 .) /j d )
. / & sin t 0 0 .t / D cos t 0
2
2
t
sin t
Lt0 .0 / D
Z
. / cos t 0.t / ´ : sin t
γ(0) cos t
x
2
j0 .t /j D sin t C cos t D 1 Lt0 .0 / D
Z 0
t
1 d ) D t:
( t) Dies ist die erste Stelle im exakten Aufbau, wo die Variable t in cos eine inhaltliche sin t Bedeutung bekommt, nämlich als Bogenlänge des Kreiswegs 0jŒ0; t /. ( ) Die Gesamtbogenlänge bei Fortsetzung von 0 auf Œ0; 2&/ durch 0.2&/ ´ 10 (wobei dies der einziger Punkt ist, der zweimal erreicht wird) hat den Wert Z 20 20 L0 D 1 d ) D 2&: 0
Dies ist die erste Stelle im exakten Aufbau, wo die Zahl & eine inhaltliche Bedeutung bekommt, nämlich als halben Umfang der Einheitskreislinie. (iii) Für das Segment zwischen zwei Punkten A; B 2 Rn galt nach Beispiel B(iii) die Darstellung 0.t/ ´ A C t .B & A/ D .1 & t/A C tB für 0 . t . 1. Wegen 0 0 .t/ D B & A folgt für seine Bogenlänge Z 1 1 jB & Aj dt D jB & Aj: L0 .0 / D 0
Es herrscht hier also Koinzidenz zwischen dem Abstand der Endpunkte und der Bogenlänge des Segments dazwischen. J. Bemerkung. In praktischen Anwendungen wird der Gesamtumfang der Einheitskreislinie oftmals nicht als Gesamtbogenlänge 2& gemessen, sondern mit einer anderen Einheit als 360 Grad. Für Teile des Kreisumfangs hat man dann neben dem Bogenmaß t das dazu proportionale Gradmaß mit der Umrechnungsformel Gradmaß von t ´
180 ( t: &
Dieses wird durch einen hochgestellten Kreis bezeichnet. Z.B. ist das Gradmaß von t D &=2 gleich 90ı .
497
Abschnitt 9.1 Abbildungen vom Wegtypus
K . Bemerkung. Die Ungleichungen (U)[2.5], die ursprünglich den Arkustangens festzulegen halfen, schreiben sich auf den Tangens so um:
1 C tan2 t
. t . tan t
h &h : für t 2 0; 2
y
Man hat dazu in D[2.5] zu setzen: a D tan t . Mittels F(iii)[4.4] und J(iii)[4.4] (und da cos t dafür positiv ist), lautet dies äquivalent: h &h sin t . t . tan t für t 2 0; : 2 In der anschaulichen Deutung sagt dies, dass die Bogenlänge t des Kreiswegs 0 jŒ0; t / durch diejenigen Streckenlängen nach unten bzw. oben beschränkt ist, die in dem rechts stehendem Bild hervorgehoben sind. Die Bezeichnung ist wie in I(ii) gewählt.
tan t
tan t
sin t
p
t x
Zu den Polarkoordinaten Bei der Einführung der Polarkoordinaten r; ' in R[4.4] galt Folgendes: Zu jedem Paar .x; y/ in R2 gibt es ein r % 0 und ein ' 2 R, sodass x D rpcos ', y D r sin '. Dabei ist r eindeutig bestimmt als Euklidische Distanz r D x 2 C y 2 von .x; y/ vom Ursprung .0; 0/. Das Argument ' ist nur für .x; y/ ¤ .0; 0/ und dann nur bis auf ganze Vielfache von 2& eindeutig bestimmt. Die Strecke von .0; 0/ nach .x; y/, d.h. der Weg + 7! + ( .x; y/, + 2 Œ0; 1/; wird als Fahrstrahl oder Radiusvektor von .x; y/ bezeichnet. Schneidet man im Fall r > 0 den Fahrstrahl bzw. seine Fortsetzung für + > 1 mit der Einheitskreislinie, so ergibt sich der Punkt
p.x; y/ ´
3x y ; D .cos '; sin '/: r r
Zur eindeutigen Festlegung von ' sei nun das Intervall Œ0; 2&Œ gewählt (im Gegensatz zum Hauptwert in R[4.4], der sich auf das Intervall /&&; &/ bezieht). Dann hat ' genau wie in Beispiel I(ii) die Bedeutung der Bogenlänge auf der Einheitskreislinie, gemessen vom Punkt .1; 0/ bis zum Punkt p.x; y/ entlang des Kreisweges 0jŒ0; '/. Damit sind die Polarkoordinaten endgültig gedeutet.
Kapitel 9 Elementare Analysis im Rn
498
y
(x,y) r p(x,y)
ϕ (0,0)
(1,0)
x
Legt man wie in R[4.4] den Hauptwert ' 2 /&&; &/ zugrunde, so erhält man im Wesentlichen die gleiche Deutung, nur dass ' für y < 0 mit dem Negativen der entsprechenden Bogenlänge übereinstimmt. Außerdem besteht hier generell für .x; y/ ¤ .0; 0/ Koinzidenz von ' mit dem orientierten Winkel zwischen den Vektoren u ´ .1; 0/ und v ´ .x; y/, wie ein Vergleich mit der Definition in der linearen Algebra zeigt. L . Definition. Ein Weg 0 W Œa; b/ ! Rn heißt geschlossen, wenn Anfangs- und Endpunkt zusammenfallen: 0.a/ D 0.b/. Ist der Weg 0 W Œa; b/ ! Rn von der Klasse C r für ein r 2 N0 [ f1g, so nennt man ihn C r -geschlossen, wenn 0 .k/ .a/ D 0 .k/ .b/ für alle k . r gilt. $ Zur geometrischen Analysis Wir beschreiben noch einige Situationen, die in besonderem Maße durch die räumliche Anschauung motiviert sind. Es handelt sich also um Anfangsgründe der geometrischen Analysis. Diese wird in weiterführenden Vorlesungen zur Differentialgeometrie gepflegt und besitzt zahlreiche Anwendungen, z.B. in der Physik und der Computergraphik. Das Integral der Geschwindigkeit verhält sich bei Zerlegung des Definitionsintervalls additiv, sodass man bei der Berechnung von Bogenlängen auch stückweise vorgehen kann. Tatsächlich ist die Additivität auch ohne Differenzierbarkeit gewährleistet: M. Satz. Sei 0 W Œa; b/ ! Rn stetig und ein c 2 /a; bŒ gegeben. Dann sind äquivalent:
499
Abschnitt 9.1 Abbildungen vom Wegtypus
(i)
0 ist rektifizierbar;
ˇ ˇ (ii) die Restriktionen 0 ˇŒa; c/ und 0 ˇŒc; b/ sind beide rektifizierbar. Ist (i) oder (ii) erfüllt, so gilt Lba .0 / D Lca .0 / C Lbc .0 /. Beweis. 1) Sei 0 als rektifizierbar vorausgesetzt. Um die Rektifizierbarkeit der beiden Restriktionen zu beweisen, sei Z 0 bzw. Z 00 eine Zerlegung von Œa; c/ bzw. Œc; b/ (vgl. das folgende linke Bild). Dann ist die Vereinigung Z 0 [ Z 00 eine Zerlegung von Œa; b/. Aufgrund der Definition der Polygonzuglängen gilt P .Z 0 [ Z 00 / D P .Z 0 / C P .Z 00 /. Wegen Lba .0/ % P .Z 0 [ Z 00 / folgt Lba .0 / % P .Z 0 / C P .Z 00 /: Isoliert man P .Z 0 / auf der linken Seite dieser Ungleichung, so sieht man, dass P .Z 0 / ˇ 0 für alle Z nach oben beschränkt, also 0 ˇŒa; c/ rektifizierbar ist. Durch Übergang zum Supremum bzgl. der Z 0 folgt Lca .0/ . Lba .0 / & P .Z 00 /, also Lba .0 / % Lca .0 / C P .Z 00 /:
ˇ Mit dem gleichen Schluss bzgl. P .Z 00 / folgt hieraus die Rektifizierbarkeit von 0 ˇŒc; b/ sowie Lba .0 / % Lca .0/ C Lbc .0 /:
γ(b)
γ(b) γ(Z'')
γ(Z')
γ(a)
γ(c)
γ(c) γ(a)
ˇ ˇ 2) Seien umgekehrt 0 ˇŒa; c/ und 0 ˇŒc; b/ als rektifizierbar vorausgesetzt. Um die Rektifizierbarkeit von 0 zu beweisen, sei Z eine Zerlegung von Œa; b/. Dann erhält man e ´ Z [fcg von Œa; b/ und aus dieser durch Hinzunahme von c eine neue Zerlegung Z 0 e e e 00 ´ Z e \ Œc; b/ eine Zerlegung Z ´ Z \ Œa; c/ von Œa; c/ bzw. eine Zerlegung Z von Œc; b/ (vgl. das obige rechte Bild). Es gilt dann (wie generell bei Hinzunahme eines e was man erkennt, indem man die Dreiecksungleichung Teilpunkts): P .Z/ . P . Z/,
Kapitel 9 Elementare Analysis im Rn
500
e 0 und des zweiten Punkts von Z e 00 auf die Bilder von c, des vorletzten Punkts von Z anwendet. Somit ist e D P. Z e0/ C P . Z e 00 /; P .Z/ . P . Z/ wobei die letzte Gleichheit wie bei 1) gerechtfertigt ist. Hieraus folgt P .Z/ . Lca .0/ C Lbc .0 /; sodass P .Z/ nach oben beschränkt, also 0 rektifizierbar ist. Durch Übergang zum Supremum bzgl. Z ergibt sich weiter Lba .0 / . Lca .0 / C Lbc .0 /: 3) Nimmt man die Schlussungleichungen von 1) und 2) zusammen, so folgt endgültig die Behauptung. " N. Bemerkung (Parameterinvarianz der Bogenlänge). So wie die Bogenlänge eingeführt wurde, ist sie zunächst einem Weg 0 W Œa; b/ ! Rn zugeordnet, d.h. einer Abbildung, während sie doch eigentlich ein Maß für eine Punktmenge 0.Œa; b// einschließlich einer bestimmten Abfolge ihrer Punkte sein sollte. Tatsächlich ist das schon gewährleistet, wenn man neben der „nackten“ Punktmenge 0.Œa; b// noch die Aufeinanderfolge ihrer Punkte berücksichtigt. Das soll präzise Folgendes bedeuten: Betrachtet man außer der stetigen Abbildung 0 W Œa; b/ ! Rn eine zweite, e 0 W Œe a; e b/ ! Rn , mit gleichen Anfangs- und Endpunkten e 0 .e a/ D 0.a/, e 0 .e b/ D 0.b/ und gleichem Bild e 0 .Œe a; e b// D 0.Œa; b//, so werden die Punkte dieses Bildes durch e 0 .e t / bzw. 0.t/ in gleicher Reihenfolge durchlaufen, wenn es eine surjektive, streng monoton wachsende Abbildung ' W Œe a; e b/ ! Œa; b/ gibt mit: e 0 .e t/ D 0.'.e t// für e e e alle t 2 Œe a; b/. Dies impliziert '.e a/ D a und '. b/ D b, weil sonst ' nicht surjektiv wäre. Auch gilt dann automatisch das Entsprechende für die Umkehrabbildung ' &1 W Œa; b/ ! Œe a; e b/, insbesondere 0.t/ D e 0 .' &1 .t // für alle t 2 Œa; b/. In dieser Situation sind nun wirklich 0 und e 0 gleichzeitig rektifizierbar oder gleichzeib .e 0 / D Lba .0/. D.h. es kommt nur auf tig nicht rektifizierbar, und im ersten Fall gilt: Le e a die Reihenfolge der Punkte auf dem Bild 0.Œa; b// an, nicht aber darauf, wie schnell oder langsam (oder überhaupt nach welchem „Zeitgesetz“) diese Punkte durchlaufen werden. Zum Nachweis dieser Unabhängigkeit sei Folgendes überlegt: Ist e D fe Z t 0; : : : ; e t k g mit
e aDe t0 < ( ( ( < e tk D e b
e eine Zerlegung von Œa; b/, die mit den eine Zerlegung von Œe a; e b/, so ist Z ´ '. Z/ Bildpunkten tj ´ '.e tj /, j D 0; : : : ; k geschrieben werden kann als Z D ft0 ; : : : ; tk g mit a D t0 < ( ( ( < tk D b:
501
Abschnitt 9.1 Abbildungen vom Wegtypus
Nun gilt e 0 .e tj / D 0.'.e tj // D 0.tj /, also e D P .e 0 ; Z/
k k X ˇ X ˇ ˇe 0 .e tj / & e 0 .e tj &1 /ˇ D j0.tj / & 0.tj &1 /j D P .0; Z/: j D1
j D1
e nach oben beschränkt, d.h. mit 0 auch e Daher ist mit P .0; Z/ auch P .e 0 ; Z/ 0 rektifib b e e e zierbar, und für jede Zerlegung Z von Œe a; b/ gilt P .e 0 ; Z/ . La .0 /, also Le .e 0/ . e a b La .0/. Durch Rollentausch von 0 und e 0 folgt, dass mit e 0 auch 0 rektifizierbar ist e b b .e 0 /, also schließlich die Gleichheit der beiden Bogenlängen, wie sowie La .0 / . Le a behauptet. Übrigens ist ' dann von selbst stetig, da eine surjektive monotone Abbildung von einem Intervall auf ein anderes von alleine stetig ist; vgl. H(iv)[3.6]. Die Stetigkeit von ' wird im obigen Nachweis allerdings gar nicht gebraucht. Diese Unabhängigkeit der Bogenlänge bleibt auch noch erhalten, wenn die Punkte des Bildes von 0 in umgekehrter Reihenfolge durchlaufen werden. Das soll heißen: Ist 4 W Œe a; e b/ ! Œa; b/ surjektiv und streng monoton fallend, so gilt für e 0 ´ 0 ı 4, dass 0 und e 0 gleichzeitig rektifizierbar oder nicht rektifizierbar sind und im ersten Fall b wieder Le .e 0 / D Lba .0 /. Der Nachweis hierfür geht analog wie oben, wobei natürlich e a die Punkte der Bildzerlegung in umgekehrter Reihenfolge aufzuschreiben sind und die e entsprechend umzuordnen ist. Summe P .e 0 ; Z/ So wie hier sind manche Eigenschaften eines Weges 0 gar nicht durch die Abbildung 0 insgesamt bestimmt, sondern nur abhängig von einem Teil der in ihr steckenden Information (im Idealfall nur von der Bildmenge von 0 ). Solche „Invarianzen“ werden durch die folgende Begriffe beschreibbar: O. Definition. Ist 0 W J ! Rn ein Weg und ' W e J ! J eine stetige bijektive Abe e bildung (J; J Intervalle), so heißt e 0 ´ 0 ı ' W J ! Rn eine Umparametrisierung von 0 (mit der Parametertransformation '). Nach Satz A[3.6] ist ' entweder streng monoton wachsend oder aber streng monoton fallend. Je nachdem spricht man genauer von einer sinntreuen oder orientierungstreuen bzw. sinnumkehrenden oder orientierungsumkehrenden Umparametrisierung. Ist ' nur stetig, surjektiv und monoton, was eben auch vorkommt, so sollte man dafür eine andere Terminologie verwenden, also etwa statt „Umparametrisierung“ sagen: Neuparametrisierung. Was in der obigen Bemerkung N herauskam, kann demnach bezeichnet werden als die Invarianz der Bogenlänge gegenüber beliebigen Umparametrisierungen. Man geht oft noch einen Schritt weiter, indem man Wege, die auseinander durch Parametertransformation hervorgehen, in einer Klasse zusammenfasst und eine solche
Kapitel 9 Elementare Analysis im Rn
502
Klasse als Kurve bezeichnet. Je nachdem, welche Sorte von Parametertransformationen zugelassen werden, erhält man verschiedene Kurvenbegriffe. Z.B. ist eine orientierte (reguläre) C r -Kurve mit r % 1 eine Klasse von (regulären) C r -Wegen, die aus einem festen (regulären) C r -Weg durch Anwendung aller orientierungstreuen (regulären) Parametertransformationen der Klasse C r hervorgehen, usw. Wir wollen hier solche Klassenbildungen nicht weiter betonen, achten aber darauf, in welchem Ausmaß Eigenschaften von Wegen gegenüber Parametertransformation invariant sind. Natürlich werden Begriffe, die einen hohen Invarianzgrad aufweisen, wie z.B. die Bogenlänge, von besonderer Bedeutung sein. P. Bemerkung (stückweise differenzierbare Wege). Die Berechnung der Bogenlänge mittels Integration kann auf Wege ausgedehnt werden, die nur stückweise stetig differenzierbar sind. Ein Weg 0 W Œa; b/ ! Rn ist stückweise von der Klasse C r mit r % 1, wenn es ˇeine Zerlegung Z D fa0 ; a1 ; : : : ; ak g von Œa; b/ gibt derart, dass alle Restriktionen 0 ˇŒaj &1 ; aj / (j D 1; : : : ; k) von der Klasse C r sind. 0 selbst ist dabei nach wie vor überall stetig. Ein solcher Weg ist aufgrund der Additivität der Bogenlänge (Satz M) rektifizierbar, und seine Bogenlänge ist gegeben durch das Integral über die stückweise stetige Funktion j0 0 j: Lba .0 / D
Z a
b
j0 0 .t/j dt D
k Z X
aj
j D1 aj #1
j0 0 .t /j dt:
Wegen der Parameterinvarianz kann bei dieser Rechnung jede einzelne Restriktion für sich genommen umparametrisiert werden, wenn dies günstiger erscheint. Die Bogenlänge eines Weges, der stückweise von der Klasse C r ist, setzt sich also additiv zusammen aus den Bogenlängen seiner „Teilwege“ der Klasse C r . Insbesondere lässt sich ein Polygonzug ! auffassen als ein Weg, der in dieser Bezeichnungsweise nicht nur stückweise von der Klasse C 1 ist, sondern stückweise affin, d.h. stückweise parametrisiert durch eine Abbildung der Form t 7! cj ( t C dj . Da diese durch Parametertransformation auf die Form ) 7! .1 & )/Aj &1 C )Aj &1 , gebracht werden kann, wobei Aj &1 ; Aj die Endpunkte der j -ten Restriktion sind, folgt aufgrund von B(iii) k X L.0/ D jAj & Aj &1 jI j D1
d.h. die Bogenlänge des Polygonzugs ! koinzidiert mit der Summe der elementargeometrischen Seitenlängen. Dies gilt insbesondere für einen Polygonzug, der einem Weg 0 im Sinne von Definition F einbeschrieben ist. Der Stetigkeitsmodul einer Funktion hängt eng mit dem Differenzenquotienten und so auch mit der Ableitung zusammen. Davon haben wir schon an früherer Stelle Gebrauch gemacht, als es darum ging, den Unterschied zwischen einem bestimmten Integral und den Riemannschen Näherungssummen abzuschätzen; vgl. Q[5.1]. Im jetzigen
503
Abschnitt 9.1 Abbildungen vom Wegtypus
Fall einer vektoriellen Abbildung 0 W Œa; b/ ! Rn von der Klasse C 1 gilt wegen (10) und (6) !+ .1/ . maxŒa;b* j0 0 j ( 1. Entsprechendes gilt auch eine Differentiationsordnung höher. Insbesondere kann in der Ungleichung von Lemma G die Schranke durch die zweite Ableitung abgeschätzt werden, wenn diese existiert und stetig ist: (12)
0 . Lba .0 / & P .0; Z/ . 2 max j0 00 j ( ıZ ( .b & a/: Œa;b*
Solche Fehlerabschätzungen sind in der Praxis von Nutzen, da Integrale oder Bogenlängen oft nicht exakt berechnet werden können. $ Die Rolle der Krümmung Der Einfluss der zweiten Ableitung wird in der geometrischen Analysis durch die Krümmung ausgedrückt. Deren allgemeine Definition lautet: Q. Definition. Ist 0 W J ! Rn ein regulärer Weg der Klasse C 2 , so ist die Krümmung ~ W J ! R definiert durch q j0 0 j2 ( j0 00 j2 & h0 0 ; 0 00 i2 ~´ : j0 0 j3 Der Ausdruck ist relativ kompliziert gebaut, hat aber seinen guten Sinn. Zunächst ist der Radikand aufgrund der Cauchy/Schwarz-Ungleichung % 0. Außerdem kann man nachrechnen, dass ~ in der Gesamtheit dieser Wege gegenüber Parametertransformationen der Klasse C 2 invariant ist. (j0 00 j selbst hat diese Invarianzeigenschaft nicht.) Die endgültige Rechtfertigung dieser Definition ergibt sich allerdings erst aus der Bedeutung von ~.t/ als Kehrwert des Radiuses eines Kreises, der den gegebenen Weg im Punkt 0.t/ besonders gut berührt, des so genannten Schmiegkreises. Hierauf soll an dieser Stelle aber nicht weiter eingegangen werden. Näheres erfährt man in der Differentialgeometrie. Der Krümmungsausdruck vereinfacht sich deutlich, wenn der Tangentialvektor überall die Länge 1 hat; denn aus j0 0 j D 1 folgt ~ D j0 00 j: Man erkennt dies durch Differenzieren der Gleichung h0 0 ; 0 0 i D 1. Dies ergibt h0 0 ; 0 00 i D 0, d.h. in diesem Fall steht der Vektor 0 00 .t / stets senkrecht auf dem Tangentialvektor 0 0 .t /. Man nennt dann 0 00 .t / den Krümmungsvektor, da seine Länge gleich der Krümmung ~.t/ ist. Diese ist also die Geschwindigkeit des Tangentialvektors längs des Weges. (Das gilt aber nur im Falle j0 0 j D 1.)
Kapitel 9 Elementare Analysis im Rn
504
R. Definition. Ein Weg 0 W J ! Rn der Klasse C 1 heißt normal oder auf Bogenlänge bezogen, wenn j0 0 j D 1 gilt. Der zweite Name rührt daher, dass im Falle j0 0 j D 1 für je zwei Stellen t < s in J gilt: Lst .0 / D s & t, d.h. die Differenz der Parameterwerte ist zugleich die Bogenlänge dazwischen. Übrigens folgt aus dieser letzten Bedingung rückwärts wieder j0 0 j D 1, wie man unmittelbar mit dem Hauptsatz der Differential- und Integralrechnung erkennt. An die Stelle der Ungleichung (12) tritt für einen normalen C 2 -Weg 0 W Œa; b/ ! Rn die Abschätzung (13)
0 . Lba .0 / & P .0; Z/ . max ~ ( ıZ ( .b & a/ Œa;b*
ohne den Faktor 2! Denn man kann in diesem Fall auf die mittlere Schranke in Lemma G zurückgreifen, da !j+ 0 j wegen der Konstanz von j0 0 j verschwindet. Die Annahme der Normalität ist nicht so einschränkend, wie es auf den ersten Blick erscheint. Man kann sie nämlich unter Voraussetzung der Regularität stets durch eine Umparametrisierung erreichen: S. Satz. Zu jedem regulären Weg 0 W Œa; b/ ! Rn der Klasse C r mit r % 1 und der Bogenlänge * ´ Lba .0/ existiert eine Parametertransformation ' W Œ0; */ ! Œa; b/ der Klasse C r mit '.0/ D a; '.*/ D b derart, dass e 0 ´ 0 ı ' W Œ0; */ ! Rn normal r und wiederum von der Klasse C ist. Beweis. Anschaulich gesprochen, hat man lediglich die Bogenlänge, gemessen von a aus, zur Parametrisierung der Wegpunkte zu verwenden. Präzise geht dies so: Sei 4 W Œa; b/ ! Œ0; */ die Bogenlängenfunktion, 4.t/ ´ Lta .0/, hier gegeben durch das Integral Z 4.t/ ´
t
a
j0 0 .)/j d );
wobei für t D a sinnvollerweise Laa .0/ ´ 0 gesetzt ist. Dann gilt nach dem Hauptsatz der Differential- und Integralrechnung: 4 0 .t / D j0 0 .t /j, insbesondere ist 4 von der Klasse C r und 4 0 .t / > 0 in Œa; b/. Daher ist 4 streng monoton wachsend und surjektiv. Die inverse Funktion ' ´ 4 &1 W Œ0; */ ! Œa; b/ ist nach dem Umkehrsatz J[4.3] differenzierbar mit der Ableitung ' 0 .s/ D
1 1 D 0 : 4 0 .'.s// j0 .'.s//j
Somit ist ' in Œ0; */ von der Klasse C r , und dort gilt weiter nach der Kettenregel .0 ı '/0 .s/ D 0 0 .'.s//' 0 .s/ D
0 0 .'.s// : j0 0 .'.s//j
Abschnitt 9.1 Abbildungen vom Wegtypus
505
Dann ist e 0 ´ 0 ı ' W Œ0; */ ! Rn normal und von der Klasse C r .
"
Aufgaben und Anmerkungen 1. Für Abbildungen des Typs 0 W Œa; b/ ! Rn gilt der Mittelwertsatz nicht mehr in der Gestalt von C[4.3], wenn n % 2 ist. a) Im Fall n D 2 sei 0 W Œa; b/ ! R2 stetig und im Inneren /a; bŒ differenzierbar. Dann existiert ein c 2 /a; bŒ und ein % 2 R mit 0.b/ & 0.a/ D % ( 0 0 .c/; b&a d.h. anschaulich: Irgendwo auf dem Weg stellt sich die Tangente parallel zur Sehne. Lösungshinweis: Im Fall 0.b/ ¤ 0.a/ ergänze man den Vektor 0.b/ & 0.a/ durch einen Vektor v 2 R2 zu einer Basis von R2 und stelle 0.t/ in dieser Basis dar. Durch ein geeignetes Beispiel zeige man, dass % i. Allg. nicht als 1 gewählt werden kann. Lässt sich durch Umparametrisieren des Wegs erreichen, dass % D 1 wird? b) Im Fall n % 3 gilt der Mittelwertsatz nicht einmal mehr in der Fassung von a). Man zeige nämlich bei der Schraubenlinie B(ii) in R3 : Es gibt kein t 2 R, sodass 0.2&/ & 0.0/ ein Vielfaches von 0 0 .t / ist. Anschaulich: Kein Tangentialvektor der Schraubenlinie ist parallel zur Achse. Wie folgt daraus das Entsprechende im Fall n % 4? 2. Das Integral einer stetigen vektoriellen Funktion 0 W Œa; b/ ! Rn kann wie im skalaren Fall durch Riemann-Summen beliebig genau approximiert werden. Man zeige nämlich mit den gleiche Schlüssen wie bei P[5.1] für jede Zerlegung Z D fa0 ; : : : ; ak g von Œa; b/ und für jede Wahl von Zwischenstellen 2j 2 Œaj &1 ; aj / für j D 1; : : : ; k: ˇZ ˇ ˇ ˇ
a
b
0.t/ dt &
k X j D1
ˇ ˇ f .2j / ( .aj & aj &1 /ˇˇ . !+ .ıZ / ( .b & a/;
wobei wieder ıZ das Feinheitsmaß von Z und ! den Stetigkeitsmodul bezeichnet.
506
Kapitel 9 Elementare Analysis im Rn
3. Die berühmte Doppelhelix der Mikrobiologie besteht in der Hauptsache aus zwei Schraubenlinien, die um den Winkel von 180ı gegeneinander versetzt sind, Vgl. nebenstehendes Bild. Die horizontalen „Brücken“ zwischen gleich hohen Punkten der beiden Schraubenlinien sind geradlinig und dienen zur Aufnahme der genetischen „Buchstaben“, die dann sukzessive in großer Anzahl entlang der gemeinsamen Achse der Schraubenlinien aufgereiht sind. Natürlich ist das ein prinzipielles Bild zum räumlichen Verständnis dieser Grundstruktur des Lebens. Die tatsächlichen Verhältnisse sind komplizierter. 4. $ Bei einem injektiven Weg mit kompaktem Definitionsintervall 0 W Œa; b/ ! Rn ist die Gesamtheit der Umparametrisierungen allein durch die Bildmenge 0.Œa; b// bestimmt. Man zeige nämlich mittels B[6.5]: Sind 0 W Œa; b/ ! Rn und e 0 W Œe a; e b/ ! n e R injektive Wege mit gleichem Bild 0.Œa; b// D e 0 .Œe a; b//, so existiert eine stetige bijektive Abbildung ' W Œe a; e b/ ! Œa; b/ mit e 0 D 0 ı '. Damit ist klar, dass für solche Wege alles, was invariant gegenüber Parametertransformation ist, allein durch die Bildmenge des Weges bestimmt ist. Die Bildmenge eines injektiven Weges mit kompaktem Definitionsintervall wird ein Jordanbogen genannt. 5. $ Ist 0 W J ! Rn ein injektiver Weg und das Definitionsintervall J nicht kompakt (sowie n % 2), so ist die Umkehrabbildung 0 &1 W 0.J / ! J nicht notwendig stetig. Vgl. Aufgabe 7[6.5]. 6. $ Es sei 0 W J ! Rn ein regulärer Weg der Klasse C r für ein r 2 N und e 0 D0ı ' W e J ! Rn eine Umparametrisierung von 0 vermöge der Parametertransformation 'W e J ! J . Man beweise: Ist e 0 von der Klasse C r , so ist auch ' von der Klasse C r . Ist außerdem e 0 regulär, so auch '. Parametertransformationen zwischen regulären C r -Wegen haben also von alleine die Eigenschaften, von der Klasse C r und regulär zu sein. Lösungshinweis: Um die Abbildungseigenschaften von ' nahe einem Punkt e t0 2 e J herauszufinden, sei der Punkt t0 ´ '.e t 0 / betrachtet und ein Index i gewählt mit 0i 0 .t0 / ¤ 0. Dann hat 0i 0 auf einem geeigneten Intervall J0 mit t0 2 J0 , J keine Nullstellen, und die Restriktion 0i jJ0 vermittelt eine bijektive Abbildung von J0 auf das Intervall 0i .J0 /, die in beiden Richtungen von der Klasse C r ist (Aufgabe 16[8.3]). Weiter ist e J 0 ´ ' &1 .J0 / ein e t 0 enthaltendes Teilintervall von e J . Aus &1 e e e 0 i D 0i ı ' folgere man 'j J 0 D .0i jJ0 / ı .e 0 i j J 0 / und schließe hieraus auf die C r -Eigenschaft von '. 7. $ Wege, die nur stückweise von einer Klasse C r (mit einem r 2 N [ f1g) sind, können an den „Ecken“ abgerundet werden, was für manche Approximationszwecke
507
Abschnitt 9.1 Abbildungen vom Wegtypus
nützlich ist. In vielen Fällen genügt schon eine „Ausglättung“ der Parameter, die die Bildmenge nicht verändert. Dies soll am Fall, dass nur eine „Ecke“ vorhanden ist, präzisiertˇwerden: Seiˇ0 W Œa; b/ ! Rn ein Weg und c 2 /a; bŒ, und es seien die Restriktionen 0 ˇŒa; c/ und 0 ˇŒc; b/ von der Klasse C r . (Die zugehörige Zerlegung entsprechend Bemerkung P ist also fa; c; bg.) Man beweise: Dann existiert eine Parametertransformation ' W Œa; b/ ! Œa; b/ der Klasse C 1 mit '.a/ D a und '.b/ D b derart, dass die Umparametrisierung e 0 ´ 0 ı ' von der Klasse C r ist (auf ganz Œa; b/). Lösungshinweis: Durch Abwandlung der flachen Wanne (N[8.3]) konstruiere man ' als streng monoton wachsende C 1 Funktion ' W Œa; b/ ! Œa; b/ mit '.a/ D a und '.b/ D b und 0 D ' 0 .c/ D ' 00 .c/ D ( ( ( : Dann ist die Komposition e 0 ´ 0 ı ' in ganz Œa; b/ von der Klasse C r , da ihre rechtsund linksseitigen Ableitungen in c bis zur Ordnung r alle null sind. Anschaulich: In der neuen Parametrisierung werden die Punkte von 0.Œa; b// D e 0 .Œa; b// so durchlaufen, dass zum Zeitpunkt c ein „momentaner Stillstand“ herrscht. 8. Man berechne die Bogenlängen der zu folgenden Funktionen f W R ! R gehörenden Wege jeweils von x D 0 bis x D X > 0: a) f .x/ ´ px 2 (p > 0 fest),
b) f .x/ ´ cosh x,
c) f .x/ ´ sinh x.
In der Klasse der Kegelschnitte lässt sich die Bogenlänge nur dann durch elementare Funktionen ausdrücken, wenn es sich um Kreise wie in B(i) oder Parabeln wie in wie in a) handelt, nicht jedoch bei Ellipsen oder Hyperbeln. 9. $ Die Möglichkeit zur Umparametrisierung auf Bogenlänge besteht auch für beliebige Definitionsintervalle. Man zeige nämlich durch Abwandlung des Beweises zu Satz S: Zu jedem regulären Weg 0 W J ! Rn (J Intervall) der Klasse C r mit r % 1 existiert eine streng monoton wachsende surjektive Funktion ' W e J ! J (e J Interr vall) der Klasse C derart, dass e 0 ´ 0 ı ' normal und wiederum von der Klasse C r ist. 10. Man berechne die Bogenlänge der Schraubenlinie 0 aus Beispiel B(ii) zwischen den Parameterwerten t D 0 und t D T , also LT0 .0 / für T > 0. $ Weiter berechne man a) die Krümmung; b) eine normale Umparametrisierung von 0; c) den Krümmungsvektor. 11. $ Im Fall eines regulären C 2 -Wegs 0 W J ! Rn ist neben der Familie der Tangenteneinheitsvektoren V W J ! Rn , V ´ 0 0 = j0 0 j, auch die Familie der Krümmungsvektoren H W J ! Rn durch H ´ V 0 = j0 0 j definiert.
Kapitel 9 Elementare Analysis im Rn
508
a) Man beweise hV; H i D 0, d.h. der Krümmungsvektor ist stets orthogonal zum Tangenteneinheitsvektor und natürlich auch zum Tangentialvektor. b) Man berechne
.
00 j0 0 j
/0
D
j0 0 j2 ( 0 00 & h0 0 ; 0 00 i ( 0 0 j0 0 j3
und folgere daraus für die Krümmung ~ die Darstellung ~ D jH j. Die Krümmung ist also die Geschwindigkeit jV 0 j des Tangenteneinheitsvektors dividiert durch die Geschwindigkeit j0 0 j von 0 selbst. c) Ist 0 zusätzlich normal, so koinzidiert die obige Definition des Krümmungsvektors mit der vor Definition R. Tatsächlich ist die obige Definition invariant gegenüber Parameterwechseln. 12. Ein Weg in R2 ist in Polarkoordinaten beschrieben , wenn eine nichtnegative Funktion ' 7! r.'/, auf einem Intervall J gegeben ist. Der zu betrachtende Weg 0 W J ! R2 ist dann kraft Definition: . / r.'/ cos ' 0.'/ ´ : r.'/ sin ' Hierdurch wird jedem Winkel ' gegenüber der 1-Achse des R2 der Punkt mit Polarkoordinaten r.'/; ' zugeordnet. Das Definitionsintervall J für ' darf dabei ruhig auch länger als 2& sein, und r.'/ darf auch null werden. Wichtig ist nur, dass 0, wie oben gegeben, stetig bzw. von einer bestimmten Klasse differenzierbar ist. Man beweise: Ist die Funktion r von der Klasse C 1 , so auch 0 und für ein Teilintervall Œa; b/ , J ist die Bogenlänge gegeben durch Lba .0/
Z ´
b a
p .r.'//2 C .r 0 .'//2 d':
13. Vor allem spiralförmige Wege lassen sich in Polarkoordinaten gut beschreiben. Man behandle die folgenden Beispiele, in denen jeweils die Funktion ' 7! r.'/, ihr Definitionsintervall J und ggf. das Teilintervall Œa; b/ zur Bogenlängenberechnung angegeben sind: a) r.'/ ´ k' (k D const. > 0), J ´ R, a ´ 0; b > 0; die so genannten Archimedischen Spiralen. k & & (k D const. > 0), J ´ RC , 0 < a < ; b ´ ; die so genannten ' 2 2 hyperbolischen Spiralen.
b) r.'/ ´
c) r.'/ ´ r0 e k' (r0 D const. > 0, k D const.), J ´ R; die so genannten logarithmischen Spiralen.
509
Abschnitt 9.1 Abbildungen vom Wegtypus
Archimedische Spirale
Hyperbolische Spirale
Logarithmische Spirale
14. Oftmals kommt es vor, dass eine Punktmengen vorgegeben ist und gefragt wird, ob es einen (evtl. injektiven) Weg gibt, der die Punktmenge als Bild besitzt. Als Beispiel in R2 sei folgende Menge betrachtet ˇ (p ) ˚ (p ) , A ´ .x; y/ 2 R2 ˇ 3 x 2 C 3 y 2 D 1 ; wobei die dritten Wurzeln im Sinne von (7)[3.7] gemeint sind. A wird eine Sternkurve oder Asteroide genannt. a) Man finde einen injektiven Weg 0 W Œ0; 2&Œ ! R2 derart, dass zu jedem Punkt .x; y/ 2 A ein y t 2 Œ0; 2&Œ existiert mit 0.t/ D 1 .x; y/. (Wäre A die Einheitskreislinie, so wäre die entsprechende Frage durch O[4.4] beantwortet.) x
Lösungshinweis: Man versuche nicht, Polarkoordinaten zu verwenden, sondern wende O[4.4] auf die (p ) Quadratsummengleichung (p ) 3 x 2 C 3 y 2 D 1 an. Das führt auf den Weg 0.t/ D .cos3 t; sin3 t/;
1 Sternkurve (Asteroide)
t 2 Œ0; 2&Œ :
b) Man berechne die Bogenlänge des Weges, der durch stetige Fortsetzung von 0 auf das abgeschlossene Intervall Œ0; 2&/ entsteht. c) Ist 0 regulär bzw. an welchen Stellen t ist die Regularität verletzt? Das Bild zeigt, dass dort die Sternkurve Spitzen entwickelt, obwohl ihre Parametrisierung durch 0 von der Klasse C 1 ist. Der Weg 0 ist also nur „stückweise regulär“. 15. Der Weg 0 W Œa; b/ ! Rn sei von der Klasse C 2 . Man zeige: (14)
0 . Lba .0/ & j0.b/ & 0.a/j . 2 max j0 00 j ( .b & a/2 : Œa;b*
Kapitel 9 Elementare Analysis im Rn
510 $ Ist 0 zusätzlich regulär, so gilt (15)
0 . Lba .0 / & j0.b/ & 0.a/j . max ~ ( Lba .0/2 : Œa;b*
Lösungshinweis: Man spezialisiere (12) bzw. (13) auf die Zerlegung Z D fa; bg. Hinweis: Aus der speziellen Natur der Euklidischen Metrik kann man weitere Abschätzungen der Differenz Lba .0 / & j0.b/ & 0.a/j gewinnen. Je nach Größe von j0 00 j, ~ und Lba .0/ sind diese günstiger oder auch ungünstiger als (14) bzw. (15). Wir kommen darauf in Analysis 2 zurück (Aufgabe 7[11.2]). 16. Gerade Strecken als kürzeste Verbindungen. Sei 0 W Œa; b/ ! Rn ein rektifizierbarer Weg mit 0.a/ ¤ 0.b/. Es gilt dann j0.b/ & 0.a/j . Lba .0/. a) Mittels des Zusatzes zu D zeige man: Ist 0 von der Klasse C 1 , so gilt dann und nur dann j0.b/ & 0.a/j D Lba .0 /, wenn es eine monoton wachsende Funktion ' W Œa; b/ ! Œ0; 1/ gibt, sodass für alle t 2 Œa; b/ gilt: 0.t/ D 0.a/ C '.t/ ( .0.b/ & 0.a//. Die Funktion ' ist dann von selbst von der Klasse C 1 , also 0 eine C 1 Neuparametrisierung des Segments von 0.a/ nach 0.b/. Das besagt: Die gerade Strecke von 0.a/ nach 0.b/ ist die eindeutig bestimmte kürzeste Verbindung unter allen C 1 -Wegen von 0.a/ nach 0.b/. b) $ Man beweise das Gleiche ohne Annahmen über die Differenzierbarkeit: Genau
dann gilt j0.b/ & 0.a/j D Lba .0 /, wenn es eine monoton wachsende Funktion ' W Œa; b/ ! Œ0; 1/ gibt, sodass für alle t 2 Œa; b/ gilt: 0.t/ D 0.a/ C '.t/ ( .0.b/ & 0.a//. Die Funktion ' ist dann von selbst stetig, und 0 ist eine Neuparametrisierung des Segments von 0.a/ nach 0.b/. Das besagt: Die gerade Strecke von 0.a/ nach 0.b/ ist die eindeutig bestimmte kürzeste Verbindung unter allen rektifizierbaren Wegen von 0.a/ nach 0.b/.
In beiden Fällen a) und b) gilt bei Erfülltsein '.t/ D
Lta .0 / ; j0.b/ & 0.a/j
speziell '.a/ D 0 und '.b/ D 1. Man behandle diesbezüglich auch den Sonderfall 0.a/ D 0.b/. 17. Ist 0 W Œa; b/ ! Rn ein rektifizierbarer Weg, so gilt ˇ ˇ Lb .0/ % ˇj0.b/j & j0.a/jˇ: a
Hierin steht genau dann das Gleichheitszeichen, wenn 0 die Gestalt hat 0.t/ D %.t/ ( c mit festem c 2 Rn und monotoner Funktion % W Œa; b/ ! RC 0. 18. Es gibt Wege 0 W Œa; b/ ! Rn , sogar differenzierbare, die nicht rektifizierbar sind: Dazu zeige man:
511
Abschnitt 9.1 Abbildungen vom Wegtypus
a) Die Funktion f W Œ0; 1/ ! R mit f .x/ ´ x sin
1 x
für x ¤ 0;
f .0/ ´ 0
ist stetig. Der zugehörige Weg 0 W Œ0; 1/ ! R2 , 0.t/ ´ .t; f .t //, ist jedoch nicht rektifizierbar. b) $ Die Funktion f W Œ0; 1/ ! R mit 3 1für x ¤ 0; f .0/ ´ 0 f .x/ ´ x 2 sin exp x ist differenzierbar, jedoch nicht stetig differenzierbar. Der zugehörige Weg 0 W Œ0; 1/ ! R2 , 0.t/ ´ .t; f .t //, ist dann ebenfalls differenzierbar, aber nicht stetig differenzierbar, und 0 ist nicht rektifizierbar. 19. Man zeige: Für jeden rektifizierbaren Weg 0 W Œa; b/ ! Rn ist die Bogenlängenfunktion * W Œa; b/ ! R, *.t/ ´ Lta .0 /, stetig. Lösungshinweis: Für a . t < b, jede Zerlegung Z D ft; t1 ; : : : ; tN g von Œt; b/ und jedes s 2 /t; t1 Œ beweise man zunächst die Abschätzung ˇ Lst .0/ . Lbt .0 / & P .0 ˇŒt; b/; Z/ C j0.t/ & 0.s/j: Daraus folgere man die rechtsseitige Stetigkeit von * in Œa; bŒ. Analog für die linksseitige Stetigkeit. 20. Ein Weg 0 W J ! Rn heißt Lipschitz-stetig oder dehnungsbeschränkt, wenn eine Konstante * % 0 existiert derart, dass für alle t; s 2 J gilt: j0.t/ & 0.s/j . *jt & sj. Das * wird dann als Lipschitz-Konstante von 0 bezeichnet. Man zeige: Ein Lipschitz-stetiger Weg 0 W Œa; b/ ! Rn ist stets rektifizierbar. 21. Der Fall n D 1 ist im ganzen Abschnitt zugelassen, wenn auch die geometrische Aufmerksamkeit eher auf den höherdimensionalen Fall gerichtet ist. Natürlich wird R1 D R gesetzt. Die reellen Zahlen bilden selbst einen Euklidischen „Raum“ mit dem Skalarprodukt .,; 1/ 7! , ( 1 für ,; 1 2 R und der zugehörigen Norm , 7! j,j, die mit dem gewöhnlichen Betrag zusammenfällt. Ein Weg 0 W Œa; b/ ! R ist dasselbe wie eine stetige Abbildung von Œa; b/ in R. Ist er rektifizierbar, so sagt man auch, er sei von beschränkter Variation. Dies bedeutet ja, dass die Größen k X P .0; Z/ D j0.tj / & 0.tj &1 /j; j D1
genommen über alle Zerlegungen Z von Œa; b/, eine feste obere Schranke besitzen. Die Bogenlänge von 0 wird dann auch die totale Variation von 0 genannt und so bezeichnet: Vab .0 / ´ Lba .0/ D sup P .0; Z/: Z
Kapitel 9 Elementare Analysis im Rn
512
Statt des Wortes „Variation“ wird auch das Wort Schwankung gebraucht. Alle Aussagen dieses Abschnitts, die für allgemeines n gemacht wurden, gelten speziell auch in diesem Fall n D 1; lediglich die Namengebung ist, historisch bedingt, etwas anders! Darüber hinaus zeige man, dass ein Weg 0 W Œa; b/ ! Rn dann und nur dann rektifizierbar ist, wenn seine n Komponentenfunktionen 01 ; : : : ; 0n alle von beschränkter Variation sind. Welche Ungleichungen ergeben sich daraus zwischen Lba .0 / einerseits und den totalen Variationen Vab .01 /; : : : ; Vab .0n / andererseits? Hinweis: Der Begriff der Variation kann analog auf unstetige Funktionen ausgedehnt werden. 22. $ Zeige: Jede Funktion f W Œa; b/ ! R von beschränkter Variation lässt sich als Differenz f D f1 & f2 zweier monoton wachsender Funktionen f1 ; f2 darstellen. Ist f stetig, so sind auch f1 ; f2 stetig wählbar. Lösungshinweis: Betrachte die Identität f .x/ D Vax .f / & .Vax .f / & f .x// und im stetigen Fall Aufgabe 19. Vgl. auch Aufgabe 8[5.2].
9.2
Funktionen vom Skalartypus
Die vektoriellen Funktionen einer Veränderlichen (Abschnitt 9.1) haben einen Gegentyp, bei dem eine einzige reelle Größe von mehreren Variablen abhängt. Beispiele hierfür gibt es viele. Einige wurden zu Beginn dieses Kapitels genannt. So hängt etwa der Druck in einem Gasbehälter von der Menge des Gases und der Temperatur ab. Es handelt sich dabei um eine skalare Funktion von zwei Veränderlichen. Allgemein geht es hier um reelle (= skalare) Funktionen von n reellen Veränderlichen. Eine solche Funktion ist von der Art (1)
f W A &! R;
A , Rn
x D .x1 ; : : : ; xn / 7&! f .x1 ; : : : ; xn / D f .x/:
Jedem n-Tupel einer Teilmenge A des Rn wird eine reelle Zahl zugeordnet. Wie hier werden die n-Tupel, die als Argumentlisten vorkommen, meistens als Zeilen geschrieben. Zur Veranschaulichung einer solchen Funktion f gibt es folgende Möglichkeiten, die graphisch etwa so aussehen (für n D 2):
513
Abschnitt 9.2 Funktionen vom Skalartypus z
(x,y,f(x,y)) G
c3 c2 c1
y x
A
(x,y)
Das linke Bild zeigt die Linien konstanter Werte, wie sie z.B als Isobaren in einer Wetterkarte oder als Höhenlinien in einer Geländekarte üblich sind. Die „Linien“ können in Wirklichkeit auch ganze Bereiche sein, z.B. in einer Geländekarte bei einem Hochplateau oder einem See. Allgemein handelt es sich bei einer Funktion (1) um die Niveaumengen. Das sind die Mengen ˇ , ˚ c D const. 2 R: x 2 A ˇ f .x/ D c D f &1 .c/; Zu jedem c 2 R ist dies also der Teil der Definitionsmenge A, auf dem f den konstanten Wert c annimmt. (Kommt c nicht im Bild von f vor, so ist die zugehörige Niveaumenge natürlich leer und als solche uninteressant.) Das rechte Bild ist eine Graphendarstellung einer skalaren Funktion von zwei Veränderlichen x; y mit einem Rechteck A als Definitionsmenge. Über jedem Punkt der Definitionsmenge wird in Richtung einer weiteren Koordinatenachse z der Wert der Funktion aufgetragen. Man muss dafür in einen Raum mit einer um 1 höheren Dimension gehen. Allgemein ist der Graph einer Funktion (1) definiert als die Menge ˇ , ˚ .x1 ; : : : ; xn ; xnC1 / 2 RnC1 ˇ .x1 ; : : : ; xn / 2 A; xnC1 D f .x1 ; : : : ; xn / : Die Stetigkeit braucht bei diesem Funktionentyp nicht neu formuliert zu werden, da A und R metrische Räume sind, sodass die entsprechenden Begriffe aus Kapitel 6 zuständig sind. Neu dagegen ist die Differenzierbarkeit. Diese wird uns noch öfter beschäftigen. Hier wird zunächst ein Konzept entwickelt, das unmittelbar auf dem eindimensionalen Fall beruht. Dabei werden alle Variablen bis auf eine festgehalten und nach dem „Änderungsverhalten“ der Funktionswerte in Abhängigkeit von dieser einen Variablen gefragt. A. Definition. Gegeben sei ein Punkt a D .a1 ; : : : ; an / im Inneren Aı von A und ein fester Index i 2 f1; : : : ; ng. Die partielle Ableitung von f in a nach der i -ten Variablen ist
Kapitel 9 Elementare Analysis im Rn
514
i ^ f .a1 ; : : : ; ai C h; : : : ; an / & f .a1 ; : : : ; ai ; : : : ; an / .@i f /.a/ ´ lim ; h h!0 falls dieser Limes in R existiert. Dies ist die gewöhnliche Ableitung der Funktion i ^ , 7! f .a1 ; : : : ; , ; : : : ; an / in ai : Es werden also alle Variable xj festgehalten (D aj ) bis auf die i -te xi . Ist dies für alle i 2 f1; : : : ; ng erfüllt, so heißt f in a partiell differenzierbar. Ist es bei festem i für alle a in einer Teilmenge Ai , A erfüllt, so hat man eine neue Funktion, die i -te partielle Ableitung: @i f W Ai &! R. Der „Aufsatz“ bei den obigen Formeln dient der Markierung der Position in der Argumentliste. Das Symbol @ heißt das „runde d“ und wird oft als „del“ ausgesprochen. Klassischerweise gibt es weitere Symbole für partielle Ableitungen, nämlich bezogen auf die feste Stelle ˇ @f ˇˇ @f µ fxi .a/ µ fi .a/ .a/ µ .@i f /.a/ µ @xi @xi ˇa und als Funktion (definiert auf Ai ): @f µ fxi µ fi : @xi p B. Beispiel. Sei f .x1 ; : : : ; xn / D jxj D .x1 /2 C ( ( ( C .xn /2 . Hier ist: @i f µ
.@i f /.x/ D
1 xi 1 (p : ( 2xi D 2 2 2 jxj .x1 / C ( ( ( C .xn /
Es ist A D Rn , jedoch A1 D ( ( ( D An D A n f.0; : : : ; 0/g. Rein rechnerisch wird einfach nach der betreffenden Variablen unter Konstanthaltung der anderen differenziert. Anschaulich ist die partielle Ableitung die Steigung des Funktionsverlaufs bei Veränderung der betreffenden Variablen unter Festhaltung der anderen.
z
y x
515
Abschnitt 9.2 Funktionen vom Skalartypus
C. Definition (höhere partielle Ableitungen). Diese sind nach dem gleichen „induktiven“ Muster wie bei einer Veränderlichen definierbar; vgl. A[8.3]. Dabei kann beim jeweils nächsten Schritt auch nach einer anderen Veränderlichen als der zuvor partiell differenziert werden, immer vorausgesetzt die vorhandene Funktion ist bereits existent und nach der neu gewählten Variablen partiell differenzierbar. Die Symbolik startet wie folgt: (2)
.@k @i f /.a/ ´ .@k .@i f //.a/
2. Ordnung
(3)
.@` @k @i f /.a/ ´ .@` .@k @i f //.a/ :: :
3. Ordnung
Die Voraussetzungen zur Existenz sind, dass a im Inneren von A liegt und bei (2), dass @i f in einer Umgebung von a existiert und in a nach der k-ten Variablen partiell differenzierbar ist; entsprechend bei (3), dass @k @i f in einer Umgebung von a existiert und in a nach der `-ten Variablen partiell differenzierbar ist; usw. Bei i D k schreibt man auch @k @k µ @2k , usw. Bei den anderen Schreibweisen erfolgt die Symbolik nach folgendem Muster @` @k @i f µ
@3 f µ fxi xk x` µ fik` @x` @xk @xi
und z.B. @` @2k f µ
@3 f ; @x` @xk2
(Reihenfolge!)
usw.
Die partielle Ableitung nullter Ordnung ist wieder f selbst. Die Symbole mit den @-Operatoren werden von rechts nach links abgearbeitet, die mit den Indizes umgekehrt von links nach rechts. Z.B. heißt @k @i f : leite zuerst nach xi ab, dann das Ergebnis nach xk , und fxi xk sagt genau dasselbe! Bei der Auswertung an einer Stelle a wird entweder die übliche Argumentklammer verwendet oder bei den Bruchstrich-Varianten der senkrechte Strich mit a als Index. Man beachte, dass in einen Ausdruck der Form fxi xk .x1 ; : : : ; xn / für die x1 ; : : : ; xn in der Argumentklammer etwas substituiert werden darf, nicht jedoch für xi ; xk im Index von f . Konvention zur Bezeichnung: Im Raum R2 bzw. R3 werden die Koordinaten klassischerweise nicht x1 ; x2 bzw. x1 ; x2 ; x3 genannt, sondern x; y bzw. x; y; z. Das steht etwas in Konflikt mit unserer allgemeinen Bezeichnung eines Elements von Rn durch x. Wir wollen das so regeln, dass wir die Verwendung von x; y; z als Koordinaten durch den Hinweis in klassischer Symbolik o.ä. signalisieren. Die Paare bzw. Tripel selbst müssen dann natürlich anders genannt werden (z.B. u D .x; y/ oder v D .x; y; z/ etc.), was im Einzelnen verabredet werden kann.
Kapitel 9 Elementare Analysis im Rn
516
D. Beispiel. Mit klassischen Koordinatennamen sei die Funktion f W A D R2 ! R definiert durch f .x; y/ D e xy C x & y 3 . Die partiellen Ableitungen bis zur zweiten Ordnung sind dann: fx .x; y/ D e xy y C 1;
fy .x; y/ D e xy x & 3y 2
fxx .x; y/ D e xy y 2 ;
fxy .x; y/ D e xy xy C e xy
fyx .x; y/ D e xy yx C e xy ;
fyy .x; y/ D e xy x 2 & 6y:
Hier ist A1 D A2 D A D R2 . In diesem Beispiel beobachtet man die „Symmetrie der gemischten Ableitungen“: fxy D fyx . Dies gilt viel allgemeiner, wie wir jetzt beweisen werden. E. Satz (von H.A. Schwarz). Sei A Teilmenge von R2 mit (klassischer Koordinatenbezeichnung), .a; b/ ein innerer Punkt von A und f W A ! R eine reelle Funktion. Existieren in einer Umgebung U von .a; b/ mit U , A die partiellen Ableitungen fx ; fy ; fxy und ist fxy in .a; b/ stetig, so existiert auch fyx .a; b/, und es gilt fxy .a; b/ D fyx .a; b/: Beweis. O.B.d.A. sei U ein Ball in der Maximumsmetrik mit Zentrum .a; b/, also ein (offenes) Quadrat mit Mittelpunkt .a; b/. Wir betrachten für je vier Punkte .x; y/; .x C h; y/; .x; y C k/; .x C h; y C k/ 2 U den Ausdruck C ´ f .x C h; y C k/ & f .x C h; y/ & f .x; y C k/ C f .x; y/: Bei festem y und k sei gesetzt: '.x/ ´ f .x; y C k/ & f .x; y/: Dann ist nach dem Mittelwertsatz C D '.x C h/ & '.x/ D h' 0 .x C 2h/
mit einem 2 2 /0; 1Œ:
Hierbei ist erneut nach dem Mittelwertsatz ' 0 .x/ D fx .x; y C k/ & fx .x; y/ D kfxy .x; y C 2 k/
mit einem 2 2 /0; 1Œ:
Natürlich hängen 2; 2 von x; y; h; k ab. Eingesetzt ergibt sich (4)
C D hkfxy .x C 2h; y C 2 k/:
Speziell für .x; y/ D .a; b/ wird dies zu (5)
( ) C $ ´ hkfxy .a C 2h; b C 2 k/ D hk fxy .a; b/ C R.h; k/ ;
517
Abschnitt 9.2 Funktionen vom Skalartypus
wobei wegen der Stetigkeit von fxy in .a; b/ gilt (6)
lim
.h;k/!.0;0/
R.h; k/ D 0:
Nun ist die Größe C $ auch anders darstellbar, da sie aus C durch die Spezialisierung .x; y/ D .a; b/ entsteht: C $ D ' $ .a C h/ & ' $ .a/ mit ' $ .x/ ´ f .x; b C k/ & f .x; b/: Hieraus folgt für k ¤ 0: C$ ' $ .a C h/ ' $ .a/ D & mit: k k k ' $ .a/ ' $ .a C h/ D fy .a; b/; lim D fy .a C h; b/: lim k k k!0 k!0 Vergleich mit (5) ergibt jetzt für k ¤ 0: ( ) ' $ .a C h/ ' $ .a/ & D h fxy .a; b/ C R.h; k/ : k k Ist hierin auch h ¤ 0, so folgt durch Isolieren von R.h; k/, dass der Grenzwert R$ .h/ ´ lim R.h; k/ k!0
existiert, sowie (7)
( ) fy .a C h; b/ & fy .a; b/ D h fxy .a; b/ C R$ .h/ :
Wenn wir wüssten, dass (8)
lim R$ .h/ D 0
h!0
gilt, so wären wir fertig; denn aus (7) folgt dann durch Division mit h und Grenzübergang h ! 0: fyx .a; b/ D fxy .a; b/ einschließlich der Existenz der linken Seite. Tatsächlich ist (8) erfüllt: Zu gegebenem " > 0 existiert nach (6) ein ı > 0 derart, dass die Implikation gilt: max fjhj; jkjg < ı H) jR.h; k/j < ". Damit gilt aber auch jhj < ı H) jR$ .h/j . ", wie man durch Antithese erkennt. Das beweist (8). " F. Definition. Ist r 2 N0 , A offen in Rn und sind alle partiellen Ableitungen der Funktion f W A ! Rn der Ordnungen . r existent und stetig in A, so heißt f r-mal stetig partiell differenzierbar oder von der Klasse C r oder eine C r -Funktion. Die Gesamtheit dieser Funktionen wird C r .A/ genannt. Diese Bezeichnungen werden mit
Kapitel 9 Elementare Analysis im Rn
518
1 anstelle von r gebraucht, wenn alle partiellen Ableitungen von f jeder beliebigen Ordnung r 2 N0 existieren und stetig sind. Somit ist \1 C 1 .A/ D C r .A/: rD0 Ist von vornherein klar, dass die Definitionsmenge einer Funktion f gleich A ist, so schreibt man statt f 2 C r .A/ auch einfacher f 2 C r . Manchmal werden in dem Symbol C r .A/ die Klammern um A weggelassen. Ist f W A ! R in der offenen Menge A von der Klasse C 2 und ist n % 2, so sind die Voraussetzungen von Satz E an jeder Stelle und für jedes Paar von Veränderlichen erfüllt, wenn die anderen Variablen festgehalten werden. Dies impliziert, dass auch in dieser Situation die gemischten Ableitungen unabhängig von der Reihenfolge der Differentiationen sind: @i @j f D @j @i f für i ¤ j in f1; : : : ; ng (und natürlich trivial auch für i D j ). Durch vollständige Induktion ergibt sich hieraus ganz allgemein: G. Folgerung. Ist A offen in Rn und f W A ! R von der Klasse C r für ein r % 2, so sind die partiellen Ableitungen bis zur Ordnung r einschließlich unabhängig von der Reihenfolge der Differentiationen: @i1 ( ( ( @is f D @i# .1/ ( ( ( @i# .s/ f für alle s . r, alle i1 ; : : : ; is 2 f1; : : : ; ng und alle Permutationen ' 2 Ss .
"
Parameterintegrale In dieser Diskussion betrachten wir Funktionen von zwei Veränderlichen. Die inhaltliche Fragestellung ist: Enthält der Integrand eines bestimmten Integrals eine zusätzlichen Variable p, einen so genannten Parameter, wie hängt dann der Wert des Integrals von diesem ab? Ein solches Parameterintegral hat die Gestalt Z (9)
F .p/ ´
a
b
f .t; p/ dt:
Hierin sei f gegeben als Funktion (10)
f W Œa; b/ ) J .t; p/
&!
R
7&!
f .t; p/;
wobei J ein beliebiges Intervall mit nichtleerem Inneren ist. Das Integrationsintervall ist also Œa; b/, während der Parameter p das Intervall J durchlaufen darf. Bei jedem festem p sei die Funktion t 7! f .t; p/ stetig, sodass das Integral F .p/ existiert.
519
Abschnitt 9.2 Funktionen vom Skalartypus
Sein Wert hängt natürlich i. Allg. von p ab. Typische Fragen sind: Ist F stetig? Unter welchen Umständen ist F differenzierbar? Natürlich könnte man im Einzelfall das Integral mit variablem p berechnen und hinterher diese Abhängigkeiten klären. Eine prinzipielle Antwort ist folgende: H. Satz. Ist die Funktion f (10) stetig, so definiert das Parameterintegral (9) eine stetige Funktion F W J ! R. Besitzt die Funktion f außerdem eine stetige partielle Ableitung nach dem Parameter: fp W Œa; b/ ) J &! R; so ist F stetig differenzierbar, und es gilt die so genannte Leibniz-Regel Z b 0 F .p/ ´ fp .t; p/ dt: a
Kurz gesagt: Man darf unter dem Integralzeichen differenzieren. Die partielle Ableitung fp passt nicht vollständig in das Konzept von Definition A, da z.B. im Falle J D Œc; d / ein Punkt .t; c/ nicht innerer Punkt von Œa; b/ ) Œc; d / ist. Aber die gleiche Definition funktioniert hier dennoch, da die Differenzierbarkeit bei einer Veränderlichen auch am Rande des Definitionsintervalls sinnvoll ist. Beweis von H. Zunächst sei J als kompaktes Intervall Œc; d / angenommen. Zur Stetigkeit von F : Für zwei Argumente p0 und p0 C k in Œc; d / gilt Z b ( ) F .p0 C k/ & F .p0 / D f .t; p0 C k/ & f .t; p0 / dt; a
also
Z jF .p0 C k/ & F .p0 /j .
Hierin gilt
a
b
jf .t; p0 C k/ & f .t; p0 /j dt:
jf .t; p0 C k/ & f .t; p0 /j . !f .jkj/;
wobei ! den Stetigkeitsmodul bezeichnet. Somit erhalten wir die Vorausabschätzung jF .p0 C k/ & F .p0 /j . !f .jkj/ ( .b & a/; die die Stetigkeit von F in p0 impliziert. Zur Differenzierbarkeit von F : Für die gleichen Argumentstellen gilt Z b Z b ( ) f .t; p0 Ck/&f .t; p0 /&k(fp .t; p0 / dt: F .p0 Ck/&F .p0 /&k( fp .t; p0 / dt D a
a
Kapitel 9 Elementare Analysis im Rn
520
Zur Abschätzung des Integranden ist E[9.1] ein gutes Hilfsmittel. Nach (7)[9.1] gilt nämlich (mit t0 ´ a) ˇ ˇ ˇ ˇ ˇf .t; p0 C k/ & f .t; p0 / & k ( fp .t; p0 /ˇ . max ˇfp .t; p0 C 2 k/ & fp .t; p0 /ˇ ( jkj -2Œ0;1*
. !fp .jkj/ ( jkj: Zusammen mit der voranstehenden Gleichung folgt hieraus für k ¤ 0 die Vorausabschätzung ˇ ˇ Z b ˇ ˇ F .p0 C k/ & F .p0 / ˇ & fp .t; p0 / dt ˇˇ . !fp .jkj/ ( .b & a/: ˇ k a Diese zeigt, dass die Ableitung von F in p0 existiert und den behaupteten Wert hat. In beiden Fällen verwendet man natürlich, dass der Stetigkeitsmodul zusammen mit seinem Argument gegen null konvergiert; vgl. G(ii)[6.5]. Ist nun J beliebig, so ist F auf jedem kompakten Teilintervall Œc; d / , J im ersten Fall stetig bzw. im zweiten Fall stetig differenzierbar. Daraus folgen aber leicht die gleichen Eigenschaften für das ganze Intervall J selbst. " Abgesehen von der grundsätzlichen Bedeutung sind diese Sätze ein nützliches Hilfsmittel, um Integrale auszuwerten oder abzuschätzen, wenn keine Stammfunktionen bekannt sind, z.B. in folgender Situation: I. Beispiel (Gaußsches Fehlerintegral). Wir betrachten das Parameterintegral Z1 &.1 C t 2 /x 2 e F .x/ ´ dt 1 C t2 0
für x % 0. Es ist also J ´ RC 0 , und der Parameter heißt x statt p. Der Integrand 2
e &.1 C t /x f .t; x/ ´ 1 C t2
2
erfüllt die Voraussetzungen von Satz H; denn die partielle Ableitung 2 2 fx .t; x/ D &2xe &.1 C t /x
ist ebenso wie f selbst in Œ0; 1/ ) RC 0 stetig. Nach der Leibniz-Regel folgt für die Ableitung, die gleich mittels einer einfachen Variablensubstitution umgeformt werde: Z 1 Z 1 2 2 2 2 2 e &t x dt &2xe &.1 C t /x dt D &2xe &x F 0 .x/ D 0
D &2e &x
2
0
Z
x 0
2
e &) d ):
521
Abschnitt 9.2 Funktionen vom Skalartypus
Da rechts ebenfalls eine Ableitung erscheint, ergibt sich hieraus mit einer Konstanten c .Z x /2 2 F .x/ D & e &) d ) Cc; 0
und die Spezialisierung für x D 0 liefert wegen Z 1 & dt F .0/ D D arctan 1 D 2 4 0 1Ct c D &=4, also
& F .x/ D & 4
.Z
x 0
2 e &) d )
/2
:
Aus der Definition von F .x/ erkennt man unmittelbar die Abschätzung Z 1 2 2 & dt D e &x ; 0 . F .x/ . e &x 2 4 0 1Ct also wird 0.
& & 4
.Z
x
0
2
e &) d )
/2
.
& &x 2 e 4
und schließlich durch Anwendung der Regel a2 & b 2 D .a & b/.a C b/ p
(11)
& 0. & 2
Z
x
0
2 e &) d ) .
p & &x 2 e : 2
Hieraus folgt nach dem Einschnürungsprinzip p Z x 2 & &) : e d) D lim x!1 0 2 Das schreibt man auch in der Form Z (12)
0
1
2
e &) d ) D
p & : 2
Hierin ist die linke Seite ein uneigentliches Integral; denn es entsteht aus dem vorhergehenden bestimmten Integral durch einen Grenzübergang am Integrationsintervall. Das uneigentliche Integral (12) heißt das Gaußsche Fehlerintegral. Es spielt in der Wahrscheinlichkeitstheorie eine wichtige Rolle, ebenso wie die in H(ii)[5.4] definierte Gaußsche Fehlerfunktion erf. Für diese ist damit der Grenzwert lim erf.x/ D 1
x!1
Kapitel 9 Elementare Analysis im Rn
522
gefunden. Wie gesagt, die Methode der Stammfunktion versagt hier; denn man kann zeigen, dass exp.&) 2 / keine Stammfunktion in elementarer Gestalt besitzt. Eine ganz andere Herleitung der Abschätzung (11) und des Fehlerintegrals (12) wird in Analysis 2 erfolgen. In Analysis 2 werden wir auch die Voraussetzungen von Satz H weiter abschwächen und dadurch den Anwendungsbereich der Leibniz-Regel deutlich erweitern. J. Bemerkung (zum Zwischenwertsatz von Darboux). $ Ein „geometrischer“ Beweis dieses Satzes, der in M[4.3] formuliert ist, kann folgendermaßen geführt werden: Ist f W Œa; b/ ! R die gegebene differenzierbare Funktion, so betrachte man ihre Differenzenquotienten, und zwar als Funktion von zwei Veränderlichen: 8 < f .x/ & f .y/ ; falls x ¤ y x&y ˆ W Œa; b/ ) Œa; b/ ! R; ˆ.x; y/ ´ : 0 f .x/; falls x D y. ˆ hat die speziellen Werte ˆ.a; a/ D f 0 .a/ und ˆ.b; b/ D f 0 .b/, ist im Allg. aber nur stetig außerhalb der Diagonalen . ´ f.x; y/ 2 R2 j x D yg. Nun betrachte man einen Weg 0 W Œ0; 1/ ! Œa; b/ ) Œa; b/ von .a; a/ nach .b; b/, der ansonsten . meidet (also mit 01 .t / ¤ 02 .t / für 0 < t < 1) und der in den Randpunkten differenzierbar ist, jedoch so, dass 0 0 .0/ und 0 0 .1/ nicht proportional zu .1; 1/ sind. Solche Wege gibt es in großer Zahl; zum Beispiel ist der Polygonzug von .a; a/ nach .b; b/ über .a; b/ in geeigneter Parametrisierung ein solcher Weg. Dann ist die Komposition ˆ ı 0 W Œ0; 1/ ! R stetig. Für t 2 /0; 1Œ ist dies unmittelbar klar, und für t D 0 oder t D 1 liefert die Regel von de l’Hospital A[4.5]: lim t #0 ˆ ı 0.t/ D f 0 .a/, lim t"1 ˆ ı 0.t/ D f 0 .b/. Nach dem Zwischenwertsatz, angewandt auf ˆ ı 0 , ist jede Zahl zwischen f 0 .a/ und f 0 .b/ ein Funktionswert von ˆ ı 0, und ein solcher ist nach dem gewöhnlichen Mittelwertsatz gleich einem Wert der Ableitung f 0 . (Nimmt man als 0 den o.g. Polygonzug, so braucht man die Regel von de l’Hospital gar nicht, da die zuletzt genannten Limites direkt berechnet werden können.)
Aufgaben und Anmerkungen 1. Die Funktion f .x; y/ ´ x y werde auf dem „ersten Quadranten“ Q ´ f.x; y/ 2 R2 j x % 0; y % 0g betrachtet: f W Q ! R. Man zeige: a) f ist in allen Punkten .x; y/ ¤ .0; 0/ stetig. b) f ist in .0; 0/ unstetig, und kann dort auch nicht stetig ergänzt werden.
523
Abschnitt 9.2 Funktionen vom Skalartypus
2. Man berechne alle partiellen Ableitungen der Funktion f .x; y/ ´ sin.xy/ für .x; y/ 2 R2 bis zur zweiten Ordnung. Ist f von der Klasse C 1 ? 1Cx 2 2 3. Man p untersuche, an welchen Punkten von R die Funktion f .x; y/ ´ y 2x 2 C y 2 , .x; y/ 2 R2 , (einmal) partiell differenzierbar ist und berechne dort ihre ersten partiellen Ableitungen.
4. Man differenziere die folgenden Funktionen einmal partiell nach allen ihren Veränderlichen: a) g.x; y; a; b/ D a sin x C b cos y p b) h.x1 ; x2 / D exp.x1 & x2 / c) '.x; y; z/ D
p p 1Cz 2 1 C x2 C y2 .
5. Gegeben ist die Funktion f .x; y; z/ D x 2 C 4x y z C sin.xz/. a) Was ist die maximale Definitionsmenge A in R3 ? b) Man berechne alle partiellen Ableitungen erster und zweiter Ordnung von f . Existieren diese in ganz A? 6. Die Funktion f W R2 ! R sei definiert durch 8 2 2