136 62 10MB
German Pages 405 [417] Year 2011
Springer-Lehrbuch
Ernst Hairer · Gerhard Wanner
Analysis in historischer Entwicklung ¨ Ubersetzt von Andreas Lochmann
123
Prof. Dr. Ernst Hairer Universit´e de Gen`eve Section de math´ematiques rue du Li`evre 2-4 1211 Gen`eve 4 Suisse [email protected]
Prof. Gerhard Wanner Universit´e de Gen`eve ´ Section de mathematiques rue du Li`evre 2-4 1211 Gen`eve 4 Suisse [email protected]
¨ Ubersetzung der englischsprachigen Ausgabe: Analysis by Its History von E. Hairer und G. Wanner. c 2008 Springer Science+Business Media, LLC. Alle Rechte vorbehalten. Copyright
ISSN 0937-7433 ISBN 978-3-642-13766-2 e-ISBN 978-3-642-13767-9 DOI 10.1007/978-3-642-13767-9 Springer Heidelberg Dordrecht London New York Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet u¨ ber http://dnb.d-nb.de abrufbar. Mathematics Subject Classification (2010): 26-03, 01-01 c Springer-Verlag Berlin Heidelberg 2011 Dieses Werk ist urheberrechtlich gesch¨utzt. Die dadurch begr¨undeten Rechte, insbesondere die der ¨ Ubersetzung, des Nachdrucks, des Vortrags, der Entnahme von Abbildungen und Tabellen, der Funksendung, der Mikroverfilmung oder der Vervielf¨altigung auf anderen Wegen und der Speicherung in Datenverarbeitungsanlagen, bleiben, auch bei nur auszugsweiser Verwertung, vorbehalten. Eine Vervielf¨altigung dieses Werkes oder von Teilen dieses Werkes ist auch im Einzelfall nur in den Grenzen der gesetzlichen Bestimmungen des Urheberrechtsgesetzes der Bundesrepublik Deutschland vom 9. September 1965 in der jeweils geltenden Fassung zul¨assig. Sie ist grunds¨atzlich verg¨utungspflichtig. Zuwiderhandlungen unterliegen den Strafbestimmungen des Urheberrechtsgesetzes. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten w¨aren und daher von jedermann benutzt werden d¨urften. Einbandentwurf: WMXDesign GmbH, Heidelberg Gedruckt auf s¨aurefreiem Papier Springer ist Teil der Fachverlagsgruppe Springer Science+Business Media (www.springer.com)
Vorwort . . . das vom u¨ blichen knochentrockenen Mathematik-Lehrbuch abwich. (M. Kline, aus dem Vorwort zur Taschenbuchausgabe von Kline 1972) Darum habe ich auch mit vieler M¨uhe eine grosse Zahl von Zeichnungen gemacht. (Brieskorn & Kn¨orrer, Ebene algebraische Kurven, 1981, S. vi) . . . m¨ochte ich . . . Punkte auff¨uhre[n], durch deren Hervorhebung sie sich von den u¨ blichen Darstellungen der Lehrb¨ucher besonders unterscheiden: 1.) Veranschaulichung abstrakter Betrachtungen durch anschauliche konkrete Figuren . . . 2.) Betonung der Verbindung mit den Nachbargebieten, wie der Differenzen- und Interpolationsrechnung, . . . 3.) Hervorhebung des geschichtlichen Werdegangs. . . . Mir scheint es a¨ ußerst wichtig, daß gerade die Lehramtskandidaten von all dem Kenntnis haben. (F. Klein 1908, 3.III.3, oder S. 514f. in der Autographie)
Traditionellerweise wird eine erste Vorlesung u¨ ber Analysis (mehr oder minder) in der folgenden Reihenfolge abgehalten: Grenzwerte, Mengen, ⇒ stetige ⇒ Ableitungen ⇒ Integration. Abbildungen Funktionen Andererseits fand die historische Entwicklung dieser Reihenfolge in umgekehrter Reihung statt: Archimedes Cantor 1875 Cauchy 1821 Newton 1665 ⇐ ⇐ ⇐ Kepler 1615 Dedekind Weierstraß Leibniz 1675 Fermat 1638 In diesem Buch versuchen wir in den vier Kapiteln Kapitel I. Kapitel II. Kapitel III. Kapitel IV.
Einf¨uhrung in die Analysis des Unendlichen Differential- und Integralrechnung Grundlagen der klassischen Analysis Differentialrechnung in mehreren Variablen,
die historische Reihenfolge wiederherzustellen und beginnen in Kapitel I mit Cardano, Descartes, Newton und Eulers ber¨uhmter Introductio. Kapitel II pr¨asentiert dann die Integral- und Differentialrechnung des 17ten und 18ten Jahrhunderts — auf Originalinstrumenten“ (wie ein Musiker sagen w¨urde). Die Begr¨undung der ” mathematischen Strenge durch Cauchy, Weierstraß und Peano im 19ten Jahrhundert f¨ur eine bzw. mehrere Variablen ist Gegenstand der Kapitel III bzw. IV. Dieses Buch ist das Ergebnis einer langen Zeit der Lehrt¨atigkeit beider Autoren. Im Jahr 1968 gab der zweite Autor seine erste Vorlesung u¨ ber Analysis an der Universit¨at von Innsbruck, an der der erste Autor als Student im ersten Jahr teilnahm. Seit damals haben wir an vielen Universit¨aten Vorlesungen gehalten, mal auf Deutsch, mal auf Franz¨osisch, beeinflusst von vielen B¨uchern und Moden. Der vorliegende Text wurde schließlich f¨ur unsere Studenten in Genf auf Franz¨osisch geschrieben, jedes Jahr u¨ berarbeitet und verbessert, dann ins Englische u¨ bersetzt, wiederum u¨ berarbeitet und mit der unsch¨atzbaren Hilfe unseres
vi
Vorwort
Kollegen John Steinig verbessert. Er hat so viele Fehler korrigiert, dass wir uns nicht vorstellen wollen, was wir ohne ihn getan h¨atten. Nummerierung: Jedes Kapitel ist in Abschnitte unterteilt. Formeln, S¨atze, ¨ Abbildungen und Ubungsaufgaben sind in jedem Abschnitt fortlaufend nummeriert, wobei wir auch die Nummer des Abschnitts selber angeben, nicht jedoch die Kapitelnummer. Beispielsweise wird die siebte Gleichung in Abschnitt II.6 als (6.7)“ bezeichnet. Referenzen auf diese Formel aus anderen Kapiteln heraus sind ” von der Form (II.6.7)“. ” Referenzen auf das Literaturverzeichnis: Wann immer wir beispielsweise Euler (1737)“ oder (Euler 1737)“ schreiben, beziehen wir uns auf einen Text, ” ” der von Euler im Jahr 1737 ver¨offentlicht wurde, die genaue Referenz findet sich dann im Literaturverzeichnis am Ende des Buches. Gelegentlich sind auch genauere Angaben zu finden, wie beispielsweise (Euler 1737, S. 25)“. Dies ist ” dazu gedacht, diejenigen Leser zu unterst¨utzen, die die Originalquelle einsehen m¨ochten, und um die oftmals eleganten und enthusiastischen Texte der Pioniere zu w¨urdigen. Wenn es im Literaturverzeichnis keinen passenden Eintrag gibt, sparen wir entweder die Klammern aus, oder schreiben beispielsweise (im Jahr 1580)“. ” Zitate: Wir haben viele Zitate aus der Literatur entnommen. Diejenigen, die im Text erscheinen, sind vornehmlich ins Deutsche u¨ bersetzt; die nichtdeutschsprachigen Originalzitate k¨onnen im Anhang eingesehen werden. Wir haben sie mit dem Ziel aufgenommen, die Mathematik als internationale Wissenschaft mit langer Geschichte wiederzugeben, manchmal zur Unterhaltung, aber auch um denjenigen Lesern entgegenzukommen, die keinen Zugang zu einer Bibliothek voller alter B¨ucher haben. Wenn die Quelle eines Zitats nicht im Literaturverzeichnis enthalten ist, ist ihr Titel direkt angegeben, so wie beim oben erw¨ahnten Buch von Brieskorn und Kn¨orrer. Danksagung: Der Text wurde auf unseren Sun-Rechnern an der Universit¨at von Genf in plain-TEX geschrieben, unter Verwendung von Macros des SpringerVerlags New York. Wir sind dankbar f¨ur die Hilfe von J.M. Naef, Mr. Sun“ der ” Services Informatiques“ unserer Universit¨at. Die Abbildungen sind entweder ” Kopien aus alten B¨uchern (fotographiert von J.M. Meylan von der Universit¨atsbibliothek Genf und von A. Perruchoud) oder wurden von unseren Fortran-Programmen berechnet und als Postscript-Dateien eingebunden. Der abschließende Druck wurde auf einem 1200dpi-Laserdrucker in der Fakult¨at f¨ur Psychologie in Genf angefertigt. Wir danken auch der Belegschaft der Bibliothek der Fakult¨at f¨ur Mathematik und vielen Kollegen, besonders R. Bulirsch, P. Deuflhard, Ch. Lubich, R. M¨arz, A. Ostermann, J.-Cl. Pont und J.M. Sanz-Serna f¨ur ihre wertvollen Kommentare und Hinweise. Den abschließenden aber mit Sicherheit nicht geringsten Dank richten wir an Dr. Ina Lindemann und ihre e´ quipe vom Springer-Verlag New York f¨ur all ihre Hilfe, ihre kompetenten Bemerkungen und die angenehme Zusammenarbeit. M¨arz 1995
E. Hairer und G. Wanner.
Vorwort zur zweiten, dritten und vierten korrigierten Auflage. Dank dieser neuen Auflagen konnten wir einige Druckfehler korrigieren und den Text an vielen
Vorwort
vii
Stellen verbessern. Insbesondere k¨onnen wir nun eine geometrischere Anschauung f¨ur Tartaglias L¨osung der kubischen Gleichung angeben, die Beschreibung der einh¨ullenden Kurven verbessern und einen vollst¨andigeren Beweis der Transformationsformel f¨ur Mehrfachintegrale anbieten. Wir danken vielen Studenten und Kollegen, die uns geholfen haben, Fehler und m¨ogliche Verbesserungen zu finden, insbesondere R.B. Burckel, H. Fischer, J.-L. Gaudin und H.-M. Maire. Wir ¨ wollen besonderen Dank an Y. Kanie richten, den Ubersetzer der japanischen Ausgabe. M¨arz 1997, April 2000, September 2007
E. Hairer und G. Wanner.
¨ Vorwort zur deutschen Ubersetzung Wenn das Buch, nach zwei Jahrzehnten Odyssee, aus einem franz¨osischen Manuskript in Genf, nach einer englischen Ausarbeitung in New York, dann einer japanischen in Tokyo, wieder einer franz¨osischen in Paris, einer russischen in Moskau, schließlich in die Muttersprache der Autoren u¨ bersetzt wird, ist dies nat¨urlich ein Moment tiefer Emotion. Wir sind Herrn Laurent Bartholdi, welcher vor eben diesen 20 Jahren unsere damalige Einf¨uhrungsvorlesung in Genf geh¨ort hatte und jetzt, nach einer fulmi¨ nanten Karriere Professor in G¨ottingen ist, daf¨ur dankbar, dass er diese Ubersetzung in die Wege geleitet hatte. Weiters danken wir Herrn Andreas Lochmann, ¨ der diese Ubersetzung dann musterg¨ultig und mit viel K¨onnen durchgef¨uhrt hat. Zus¨atzlich haben beide noch manche der restlichen Fehler entdeckt und zahlreiche Verbesserungsvorschl¨age gemacht. Juni 2010
E. Hairer und G. Wanner.
Inhaltsverzeichnis Kapitel I Einfuhrung ¨ in die Analysis des Unendlichen I.1 Kartesische Koordinaten und Polynome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Algebra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Algebra Nova“ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ”Descartes’ Geometrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Polynomiale Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ¨ Ubungen .............................................................. I.2 Exponentialfunktion und binomischer Lehrsatz . . . . . . . . . . . . . . . . . . . . . . . . . . Der binomische Lehrsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Exponentialfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ¨ Ubungen .............................................................. I.3 Logarithmen und Fl¨achen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Berechnung des Logarithmus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Berechnung von Fl¨achen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Fl¨ache unter der Hyperbel und nat¨urlicher Logarithmus . . . . . . . . . . . . . . . . . . . . . ¨ Ubungen .............................................................. I.4 Trigonometrische Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Grundlegende Beziehungen und Folgerungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Reihenentwicklungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Arkusfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Berechnung von Pi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ¨ Ubungen .............................................................. I.5 Komplexe Zahlen und Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Eulersche Identit¨at und ihre Folgerungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ein neuer Blick auf trigonometrische Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . Eulers Produkt f¨ur die Sinus-Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ¨ Ubungen .............................................................. I.6 Kettenbruche ¨ ......................................................... Urspr¨unge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . N¨aherungsbr¨uche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Irrationalit¨at . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ¨ Ubungen ..............................................................
2 2 6 8 10 15 18 19 26 29 31 33 35 37 42 43 46 49 52 56 59 61 63 65 67 70 73 73 76 81 84
Kapitel II Differential- und Integralrechnung II.1 Die Ableitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 Die Ableitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 Ableitungsregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 Parametrische Darstellung und implizite Gleichungen . . . . . . . . . . . . . . . . . . . . . . . 95 ¨ Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 II.2 H¨ohere Ableitungen und Taylorreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 Die zweite Ableitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 De Conversione Functionum in Series . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 ¨ Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 II.3 Einhullende ¨ und Krummung ¨ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 Einh¨ullende einer Familie von Geraden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 Die Kaustik eines Kreises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 Einh¨ullende von ballistischen Kurven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 Kr¨ummung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 ¨ Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
Inhaltsverzeichnis
ix
II.4 Integralrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 Stammfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 Integrationsmethoden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 Taylorsche Formel mit Restglied . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 ¨ Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 II.5 Elementar integrierbare Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 Integration rationaler Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 N¨utzliche Substitutionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134 ¨ Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136 II.6 N¨aherungsweise Berechnung von Integralen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138 Reihenentwicklungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138 Numerische Methoden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140 Asymptotische Entwicklungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143 ¨ Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145 II.7 Gew¨ohnliche Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 Einige Klassen integrabler Gleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151 Differentialgleichungen zweiter Ordnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153 ¨ Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 II.8 Lineare Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157 Homogene Gleichung mit konstanten Koeffizienten . . . . . . . . . . . . . . . . . . . . . . . . 158 Inhomogene lineare Gleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161 Die Cauchy-Gleichung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165 ¨ Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166 II.9 Numerisches L¨osen von Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . 168 Das Euler-Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168 Taylorreihen-Ansatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170 Gleichungen zweiter Ordnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172 ¨ Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173 II.10 Die Euler-Maclaurin-Formel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174 Eulers Herleitung der Formel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174 De Usu Legitimo Formulae Summatoriae Maclaurinianae . . . . . . . . . . . . . . . . . . . 177 Die Stirling-Formel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179 Die harmonische Reihe und die Eulersche Konstante . . . . . . . . . . . . . . . . . . . . . . . 182 ¨ Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183
Kapitel III Grundlagen der klassischen Analysis III.1 Unendliche Folgen und reelle Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 Konvergenz einer Folge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 Konstruktion der reellen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192 Monotone Folgen und kleinste obere Schranke . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197 H¨aufungspunkte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199 ¨ Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201 III.2 Unendliche Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204 Konvergenzkriterien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205 Absolute Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208 Doppelreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211 Das Cauchy-Produkt zweier Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213 Vertauschen von unendlichen Reihen und Grenzwertbildung . . . . . . . . . . . . . . . . . 215 ¨ Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217 III.3 Reelle Funktionen und Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219 Stetige Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221 Der Zwischenwertsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223 Satz vom Maximum und Minimum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224
x
III.4
III.5
III.6
III.7
III.8
III.9
Inhaltsverzeichnis Monotone und Umkehrfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225 Limes einer Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227 ¨ Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228 Gleichm¨aßige Konvergenz und gleichm¨aßige Stetigkeit . . . . . . . . . . . . . . . . . . . 231 Der Grenzwert einer Folge von Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231 Das Weierstraß-Kriterium f¨ur gleichm¨aßige Konvergenz . . . . . . . . . . . . . . . . . . . . 234 Gleichm¨aßige Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235 ¨ Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238 Das Riemann-Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239 Definitionen und Kriterien f¨ur Integrabilit¨at . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239 Integrierbare Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245 Ungleichungen und der Mittelwertsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247 Integration unendlicher Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 249 ¨ Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251 Differenzierbare Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254 Der Hauptsatz der Differential- und Integralrechnung . . . . . . . . . . . . . . . . . . . . . . . 258 Die Regeln von de L’Hospital . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262 Ableitungen einer unendlichen Reihe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 264 ¨ Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265 Potenzreihen und Taylorreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268 Bestimmung des Konvergenzradius . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 269 Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270 Differentiation und Integration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271 Taylorreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272 ¨ Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 276 Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 278 Beschr¨ankte Funktionen auf unendlichen Intervallen . . . . . . . . . . . . . . . . . . . . . . . . 278 Unbeschr¨ankte Funktionen auf endlichen Intervallen . . . . . . . . . . . . . . . . . . . . . . . . 281 Die Eulersche Gammafunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282 ¨ Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 284 Zwei S¨atze uber ¨ stetige Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 285 Stetige, aber nirgends differenzierbare Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . 285 Der Approximationssatz von Weierstraß . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287 ¨ Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292
Kapitel IV Differentialrechnung in mehreren Variablen IV.1 Topologie des n-dimensionalen Raumes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 295 Abst¨ande und Normen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 295 Konvergenz von Vektorfolgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 297 Umgebungen, offene und abgeschlossene Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . 300 Kompakte Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 305 ¨ Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 308 IV.2 Stetige Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 310 Stetige Funktionen und Kompaktheit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 312 Gleichm¨aßige Stetigkeit und gleichm¨aßige Konvergenz . . . . . . . . . . . . . . . . . . . . . 313 Lineare Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 316 Hausdorffs Charakterisierung stetiger Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . 318 Integrale mit Parametern . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321 ¨ Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322 IV.3 Differenzierbare Funktionen von mehreren Variablen . . . . . . . . . . . . . . . . . . . . 324 Differenzierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 326 Gegenbeispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 328 Eine geometrische Interpretation des Gradienten . . . . . . . . . . . . . . . . . . . . . . . . . . . 329 Der Mittelwertsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 332
Inhaltsverzeichnis
xi
Der Satz von der impliziten Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 334 Differenzierbarkeit von Integralen bez¨uglich eines Parameters . . . . . . . . . . . . . . . 336 ¨ Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 337 IV.4 H¨ohere Ableitungen und Taylorreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 341 Taylorreihen in zwei Variablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 344 Taylorreihen in n Variablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 346 Optimierungsprobleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 348 Extrema mit Nebenbedingungen (Lagrange-Multiplikatoren) . . . . . . . . . . . . . . . . 351 ¨ Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 354 IV.5 Mehrdimensionale Integrale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 356 Doppelintegrale u¨ ber ein Rechteck . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 356 Nullmengen und unstetige Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 360 Beliebige beschr¨ankte Integrationsbereiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 363 Die Transformationsformel f¨ur Doppelintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . 365 Integrale mit unbeschr¨anktem Integrationsbereich . . . . . . . . . . . . . . . . . . . . . . . . . . 372 ¨ Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 374 Anhang: Originalzitate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 378 Literaturverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 385 Symbolverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 396 Personen- und Sachverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 398
I Einf¨uhrung in die Analysis des Unendlichen
. . . unsere Mathematik-Studenten w¨urden sehr viel mehr davon profitieren, Eulers Introductio in Analysin Infinitorum zu studieren anstelle der verf¨ugbaren modernen Lehrb¨ucher. (Andr´e Weil 1979, zitiert nach J.D. Blanton 1988, S. xii) . . . da der Lehrer einsichtig genug war den ungew¨ohnlichen Sch¨uler (Jacobi) gew¨ahren zu lassen und es zu gestatten, daß dieser sich mit Eulers Introductio besch¨aftigte, w¨ahrend die u¨ brigen Sch¨uler m¨uhsam . . . . (Dirichlet 1852, Ged¨achtnisrede auf Jacobi, in Jacobis Werke, Band I, S. 4)
Dieses Kapitel erl¨autert den Ursprung der grundlegenden Funktionen und den Einfluss von Descartes’ G´eom´etrie auf ihre Berechnung. Das Interpolationspolynom f¨uhrt zu Newtons binomischem Lehrsatz und zu den Reihenentwicklungen der Exponential- und Logarithmusfunktion und der trigonometrischen Funktionen. Das Kapitel endet mit einer Diskussion der komplexen Zahlen, unendlichen Produkten und Kettenbr¨uchen. Die Darstellung der Themen folgt ihrer historischen Entwicklung und der mathematischen Strenge der damaligen Zeit. Die Begr¨undung zweifelhafter Schlussfolgerungen wird eine weitere Motivation liefern f¨ur die strenge Behandlung des Konvergenzbegriffs in Kapitel III. Eulers Introductio in Analysin Infinitorum (1748) ist die Inspiration f¨ur große Teile dieses Kapitels wie auch seines Titels.
E. Hairer, G. Wanner, Analysis in historischer Entwicklung, Springer-Lehrbuch, DOI 10.1007/978-3-642-13767-9_1, © Springer-Verlag Berlin Heidelberg 2011
2
I. Einf¨uhrung in die Analysis des Unendlichen
I.1 Kartesische Koordinaten und Polynome Als Algebra und Geometrie noch voneinander getrennt wurden, war ihr jeweiliger Fortschritt langsam und ihr Nutzen gering; aber in dem Moment, in dem diese Wissenschaften vereint wurden, unterst¨utzten sie sich gegenseitig und strebten schnell und gemeinsam zur Perfektion. Wir verdanken Descartes die Anwendung der Algebra auf die Geometrie; dies wurde der Schl¨ussel zur gr¨oßten Entdeckung auf dem Gebiet der Mathematik. (Lagrange 1795, Oeuvres, Band 7, S. 271)
Die griechische Zivilisation brachte die erste große Bl¨ute mathematischen Fort¨ (∼ 300 v. Chr.) entwickelte sich schritts hervor. Beginnend mit Euklids Ara Alexandria zum weltweiten Zentrum der Wissenschaft. Alexandria wurde dreimal verw¨ustet (47 v. Chr. von den R¨omern, 392 von den Christen, und schließlich 640 von den Moslems), was zum Untergang dieser Zivilisation f¨uhrte. Im Anschluss an die (f¨ur den Koran notwendigen) Verbesserungen am arabischen Schriftsystem u¨ bersetzten arabische Gelehrte eifrig diejenigen Fragmente, die von den griechischen Werken verblieben waren (Euklid, Aristoteles, Platon, Archimedes, Apollonius, Ptolem¨aus), sowie Werke indischer Arithmetiker, und vertieften das mathematische Wissen. W¨ahrend den Kreuzz¨ugen (1100–1300) entdeckten die Europ¨aer schließlich diese Kultur; Gerhard von Cremona (1114–1187), Robert von Chester (12tes Jhd.), Leonardo da Pisa ( Fibonacci“, um 1200) und Regiomon” tanus (1436–1476) waren die Haupt¨ubersetzer und ersten Wissenschaftler Westeuropas. Zu dieser Zeit gliederte sich die Mathematik in zwei klar abgegrenzte Gebiete: zum einen Algebra, zum anderen Geometrie.
Algebra Diophant kann als der Erfinder der Algebra betrachtet werden; . . . (Lagrange 1795, Oeuvres, Band 7, S. 219)
Die Algebra ist ein Erbe der griechischen und orientalischen Vorzeit. Das ber¨uhmte Buch Al-jabr w’al muqˆabala von Mohammed ben Musa Al-Khowˆarizmˆı1 (830 n. Chr.) beginnt mit L¨osungsverfahren f¨ur quadratische Gleichungen. Das a¨ lteste bekannte Manuskript datiert auf 1342 und beginnt wie folgt:2
1 2
Die W¨orter Algorithmus“ und Algebra“ stammen jeweils von Al-Khowˆarizmˆıs Namen ” ” Buchs ab. und dem Kurztitel Al-jabr“ seines ” Dieses Bild sowie die Abb. 1.1 and 1.2 sind abgedruckt mit der Erlaubnis der Bodleian Library, Universit¨at von Oxford, Ms. Huntington 214, Folios 1R, 4R und 4V. Englische ¨ Ubersetzung: F. Rosen (1831).
I.1 Kartesische Koordinaten und Polynome
3
Al-Khowˆarizmˆıs Beispiele. Betrachten Sie die quadratische Gleichung x2 + 10x = 39.
(1.1)
Eine solche Gleichung beschreibt die unbekannte L¨osung x, die von den Arabern dshidr (Wurzel) genannt wurde, ein Wort, das urspr¨unglich f¨ur die Seite eines Quadrats von vorgegebener Fl¨ache stand ( A root is any quantity which is to be ” multiplied by itself“, F. Rosen 1831, S. 6).
Manuskript von 1342
Moderne Darstellung 2
ABB. 1.1. L¨osung von x + 10x = 39
L¨osung. Al-Khowˆarizmˆı skizziert ein Quadrat der Seitenl¨ange x, um x2 zu repr¨asentieren, sowie zwei Rechtecke der Seitenl¨angen 5 und x f¨ur die Terme 10x (siehe Abb. 1.1). Gleichung (1.1) zeigt, dass das schattierte Gebiet von Abb. 1.1 die Fl¨ache 39 besitzt; folglich ist die Fl¨ache des gesamten Quadrats 39 + 25 = 64 = 8 · 8, also 5 + x = 8 und x = 3.
Manuskript von 1342
Moderne Darstellung 2
ABB. 1.2. L¨osung von x + 21 = 10x
Ein zweites Beispiel (von Al-Khowˆarizmˆı), (1.2)
x2 + 21 = 10x
(oder, falls Sie die lateinische Version von Robert von Chester vorziehen: Sub” stancia vero et 21 dragmata 10 rebus equiparantur“), demonstriert, wie verschiedene Vorzeichen zu verschiedenen Figuren f¨uhren. Um seine L¨osung zu errechnen, skizzieren wir ein Quadrat f¨ur x2 und f¨ugen ein Rechteck der Breite x und unbekannter L¨ange f¨ur die 21 hinzu (Abb. 1.2). Aufgrund von (1.2) hat die
4
I. Einf¨uhrung in die Analysis des Unendlichen
vollst¨andige Figur die L¨ange 10. Sie wird mittig zerteilt, und das kleine Rechteck (A) zwischen x2 und der Halbierenden wird auf (B) platziert. Die resultierende Figur hat die H¨ohe 5. Das graue Gebiet betr¨agt 21 und das gesamte Quadrat (grau und schwarz) hat die Gr¨oße 5·5 = 25. Folglich muss das kleine schwarze Quadrat 25 − 21 = 4 = 2 · 2 groß sein, und wir erhalten x = 3. Mit einer a¨ hnlichen Zeichnung (versuchen Sie es), fand Al-Khowˆarizmˆı auch die zweite L¨osung x = 7. Mohammed ben Musa Al-Khowˆarizmˆı beschreibt seine L¨osung wie folgt (Rosen 1831, S. 11): . . . for instance, a square and twenty-one in numbers are equal to ten roots of the same square.“ That is ”to say, what must be the amount of a square, which, when twenty-one dirhems are added to it, becomes equal to the equivalent of ten roots of that square? Solution: Halve the number of the roots; the moiety is five. Multiply this by itself; the product is twenty-five. Subtract from this the twenty-one which are connected with the square; the remainder is four. Extract its root; it is two. Subtract this from the moiety of the roots, which is five; the remainder is three. This is the root of the square which you required, and the square is nine. Or you may add the root to the moiety of the roots; the sum is seven; this is the root of the square which you sought for, and the square itself is forty-nine.
Als Anwendung l¨ost Al-Khowˆarizmˆı das folgende R¨atsel: Ich habe 10 in ” zwei Teile zerlegt, und multipliziert man einen mit dem anderen, so ist das Resultat 21“. Setzen wir f¨ur einen der Teile x ein und f¨ur den anderen 10 − x, so ist ihr Produkt (1.3)
x · (10 − x) = 21
was (1.2) entspricht. Entsprechend ist die L¨osung gegeben durch die zwei Wurzeln von Gl. (1.2), also 3 und 7 oder umgekehrt. Die L¨osung von Gleichungen dritten Grades. Tartaglia pr¨asentierte seine L¨osung in schlechter italienischer Lyrik . . . (Lagrange 1795, Oeuvres, Band 7, S. 22) . . . Ich habe die allgemeine Regel entdeckt, aber f¨ur den Moment m¨ochte ich sie aus verschiedenen Gr¨unden geheim halten. (Tartaglia 1530, siehe M. Cantor 1891, Band II, S. 485)
Lassen Sie uns als Beispiel versuchen, die Gleichung (1.4)
x3 + 6x = 20,
zu l¨osen, oder, in schlechter“ italienischer Lyrik, Quando che’l cubo con le cose ” ” appresso, Se agguaglia a` qualche numero discreto . . .“ (siehe M. Cantor 1891, Band II, S. 488). Nicol`o Tartaglia (1499–1557) und Scipione dal Ferro (1465– 1526) fanden unabh¨angig voneinander die L¨osungsmethode f¨ur dieses Problem, hielten sie aber geheim, um mit ihr Wettbewerbe zu gewinnen. Erst unter Druck und gelockt von falschen Versprechungen verriet Tartaglia sie an Gerolamo Cardano (1501–1576), lyrisch verschleiert und ohne Beweis ( suppressa demonstra” tione“). Cardano rekonstruierte unter großer M¨uhe ihre Herleitung ( quod diffi” cillimum fuit“) und ver¨offentlichte sie 1545 in seiner Ars Magna“ (siehe auch ” di Pasquale 1957, und Struik 1969, S. 63–67).
I.1 Kartesische Koordinaten und Polynome
x
x
u
v
x
x
u
5
v v v v
v v ABB. 1.3a. Kubische Gl. (1.4)
ABB. 1.3b. Rechtfertigung von (1.6)
ABB. 1.3c. Ausschnitt aus Cardanos Ars Magna von 1545, ed. Basilea 15703
Herleitung. Wir repr¨asentieren x3 durch einen W¨urfel der Kantenl¨ange x (wie auch sonst? Grauer Teil in Abb. 1.3a). Der Term 6x wird in Form je dreier Prismen mit quadratischer Grundfl¨ache und Volumen x2 v und xv 2 angeh¨angt (weiß in Abb. 1.3a). Wir erhalten einen K¨orper mit Volumen 20 (gem¨aß (1.4)), der die Differenz der Kuben u3 und v 3 ist (siehe Abb. 1.3a), also u3 − v 3 = 20, wobei (1.5)
u = x + v.
Arrangieren wir die sechs neuen Prismen wie in Abb. 1.3b, so sehen wir, dass ihr Volumen (wie gefordert) 6x gleicht, falls (1.6)
3uvx = 6x
oder
uv = 2
gilt. Nun kennen wir Summe (= 20) und Produkt (= −8) von u3 und −v 3 , und k¨onnen daraus die urspr¨unglichen Zahlen wie in Al-Khowˆarizmˆıs R¨atsel (1.3) rekonstruieren, n¨amlich
6
I. Einf¨uhrung in die Analysis des Unendlichen
u3 = 10 +
√
108,
−v 3 = 10 −
√
108.
Wenden wir die Kubikwurzel und x = u − v an, erhalten wir (siehe auch die Nachbildung in Abb. 1.3c) q q 3 √ 3 √ (1.7) x= 108 + 10 − 108 − 10. Einige Jahre sp¨ater wurde eine L¨osungsstrategie f¨ur Gleichungen vierten ¨ Grades entdeckt (Ludovico Ferrari, siehe Struik 1969, S. 69f, und Ubungen 1.1 und 1.2); die Gleichungen vom Grad 5 blieben dagegen f¨ur Jahrhunderte ein R¨atsel, bis Abel 1826 bewies, dass sich ihre L¨osungen im allgemeinen nicht durch Radikale schreiben lassen.4
Algebra Nova“ ” Die Numerische Logistik ist diejenige, die mit Zahlen dargestellt und behandelt wird; die Spezifische wird durch Arten oder Erscheinungsformen von Dingen beschrieben: so wie die Buchstaben des Alphabets. (Vi`ete 1600, Algebra nova, franz¨osische Ausgabe 1630) ALGEBRA ist eine allgemeine Berechnungsmethode mittels bestimmter Zeichen und Symbole, die zu diesem Zweck ersonnen und als n¨utzlich erkannt wurden. (Maclaurin 1748, A Treatise of Algebra, S. 1)
Die antiken Werke behandelten ausschließlich konkrete Beispiele, und ihre Autoren f¨uhrten arithmetische“ Betrachtungen nur mit Zahlen aus. Franc¸ois Vi`ete ” (= Franciscus Vieta 1540–1603, 1591 In artem analyticam isagoge, 1600 Algebra nova) entwickelte das grundlegende Konzept, Buchstaben A, B, C, X, . . . f¨ur die bekannten und unbekannten Gr¨oßen eines (oftmals geometrischen) Problems zu schreiben, um dann mit ihnen algebraisch zu rechnen (siehe Abb. 1.4a). Da sich keines der Probleme der griechischen Epoche der Methode geometrisches Problem
Buchstaben einsetzen ↓ −−− − −→
algebraisches Problem
rechnen ↓ −−− − −→
L¨osung
widersetzen konnte, schrieb Vi`ete in Großbuchstaben: NVLLVM NON PRO” ¨ BLEMA SOLVERE“ (d.h. LOSVNG EINES JEDEN PROBLEMS“). Dieses ” Konzept fand seine Vollendung in Descartes’ La G´eom´etrie“. ” 3 4
5
Abbildung mit Erlaubnis der Bibl. Publ. Univ. Gen`eve. ¨ Anm. d. Ubers.: Nat¨urlich blieben Polynome f¨unften Grades nicht g¨anzlich unbeachtet, und es gab lange vor Abels Durchbruch eine ganze Reihe großartiger Ergebnisse: Ehrenfried Walther von Tschirnhaus nutzte Transformationen der Art von (1.11), um zu zeigen, dass jedes Polynom f¨unften Grades auf die Form x5 +ax +b = 0 gebracht werden kann; Gianfrancesco Malfatti fand eine Methode, alle u¨ berhaupt in Radikale aufl¨osbaren Wurzeln auch als solche darzustellen; und Paolo Ruffini schuf 1799 mit einem (fehlerhaften) Beweis, dass nicht alle Wurzeln f¨unften Grades aufl¨osbar sind, eine der Grundlagen f¨ur Abels sp¨ateren Erfolg. Abgebildet mit Erlaubnis der Bibl. Publ. Univ. Gen`eve.
I.1 Kartesische Koordinaten und Polynome
7
ABB. 1.4a. Nachbildung aus der franz¨osischen Auflage (1630) von Vi`ete (1600)5
Beispiel. (Dreiteilung eines Winkels). Das ber¨uhmte klassische Problem Datum angulum in tres partes ” æquales secare“ wird unter Zuhilfenahme von (1.8)
sin(3α) = 3 sin α cos2 α − sin3 α
B
(siehe (4.14) unten) und einigen einfachen Rechnungen zur algebraischen Gleichung (1.9)
X
−4X 3 + 3X = B
(siehe Vi`ete 1593, Opera, S. 290). Ihre L¨osung erhalten wir aus (1.14) unten. Formel fur ¨ Gleichungen vom Grad 2. Mit Vi`ete’s Notation wird der schwer verst¨andliche Text von Al-Khowˆarizmˆı (siehe S. 4) zur Formel“ ” p (1.10) x2 + ax + b = 0 =⇒ x1 , x2 = −a/2 ± a2 /4 − b. Formel fur ¨ Gleichungen vom Grad 3. (1.11)
y 3 + ay 2 + by + c = 0
y + a/3 = x =⇒
x3 + px + q = 0.
Wir setzen x = u + v (dies entspricht (1.5), wenn −v“ durch v“ ersetzt wird), ” ” so wird aus Gl. (1.11) (1.12)
u3 + v 3 + (3uv + p)(u + v) + q = 0.
Einsetzen von uv = −p/3 (entspricht (1.6)) liefert (1.13)
u3 + v 3 = −q,
u3 v 3 = −p3 /27.
Nach Al-Khowˆarizmˆı s R¨atsel (1.3) und den Formeln (1.10) erhalten wir (vergleiche die Nachbildung in Abb. 1.4b), q q p p 3 3 (1.14) x = −q/2 + q 2 /4 + p3 /27 + −q/2 − q 2 /4 + p3 /27.
8
I. Einf¨uhrung in die Analysis des Unendlichen
ABB. 1.4b. Auszug aus Vi`ete (1591a)6 (Opera S. 129 und 150); L¨osung von A2 +2BA = Z und A3 − 3BA = 2Z
Descartes’ Geometrie An dieser Stelle m¨ochte ich Sie bitten, nebenbei zu beobachten, wie die Skrupel, die die antiken Autoren davon abhielten, arithmetische Begriffe in der Geometrie einzusetzen, und die nur eine Folge ihrer Unf¨ahigkeit sein konnten, die Beziehung zwischen diesen zwei Gebieten klar zu erkennen, f¨ur viel Unklarheit und Verwirrung in ihren Erkl¨arungen sorgten. (Descartes 1637)
¨ Die Uberlieferung der Geometrie, dem gewaltigen Erbe der griechischen Antike, ¨ verdankt Europa arabischen Ubersetzern. So besteht Euklids Elemente (etwa 300 v. Chr.) aus 13 B¨uchern“, die Defi” ” nitionen“, Postulate“ und alles in allem 465 Propositionen“ enthalten, die streng ” ” bewiesen werden. Die Kegelschnitte des Apollonius (200 v. Chr.) sind von gleicher Wichtigkeit. Nichtsdestotrotz entzogen sich einige ungel¨oste Probleme den Anstrengungen dieser Wissenschaftler: die Dreiteilung des Winkels, die Quadratur des Kreises und ein Problem, das Pappus im Jahr 350 erw¨ahnte, und das Descartes’ Forschung motivieren sollte. Problem von Pappus. ( Die Frage, deren L¨osung von Euklid begonnen und ” von Apollonius fortgef¨uhrt, aber von keinem beendet werden konnte, lautet wie folgt“): Seien a, b, c drei Geraden und α, β, γ drei gegebene Winkel. F¨ur einen beliebig gew¨ahlten Punkt C seien B, D, F diejenigen Punkte auf a, b, c, so dass CB, CD, CF mit a, b, c nacheinander die Winkel α, β, γ bilden (siehe Abb. 1.5a und 1.5b). Wir suchen den Ort des Punktes C, f¨ur den gilt: (1.15)
CB · CD = (CF)2 .
Descartes l¨oste dieses Problem unter Verwendung von Vi`etes neuer“ und ange” sehender Algebra; der Punkt C wird festgelegt durch die Abst¨ande AB und BC. 6
Abgebildet mit Erlaubnis der Bibl. Publ. Univ. Gen`eve. Die unbekannte Variable ist hier A. Erst seit Descartes w¨ahlt man x, y, z f¨ur Unbekannte.
I.1 Kartesische Koordinaten und Polynome
9
ABB. 1.5a. Problem von Pappus, Skizze von Descartes7
Diese zwei unbekannten Werte“ notierte er mit x“ und y“ ( Que le segment de ” ” ” ” la ligne AB, qui est entre les points A & B, soit nomm´e x. & que BC soit nomm´e y“.) Wir betrachten f¨ur den Moment nur zwei der Geraden (Abb. 1.5c) ( & pour ” me demesler de la c˜ofusion de toutes ces lignes . . .“). Wir zeichnen eine Parallele von EF durch C. Da alle Winkel festgelegt sind, sehen wir, dass es Konstanten K1 und K2 gibt mit u = K1 · CF, v = K2 · y. Da AE = x + u + v = K3 , erhalten wir (1.16)
CF = d + ℓx + ky,
d, ℓ, k Konstanten.
¨ Ahnlich finden wir (1.17)
CD = mx + ny,
m, n Konstanten.
( Und so sieht man, dass . . . die L¨ange einer jeden solchen Gerade . . . stets durch ” drei Terme ausgedr¨uckt werden kann, von denen einer aus der Unbekannten y, multipliziert mit oder dividiert durch eine bekannte Gr¨oße, besteht; einem weiteren Term, bestehend aus der Unbekannten x, multipliziert mit oder dividiert durch eine andere bekannte Gr¨oße; und einem dritten Term, der nur aus einer bekannten Gr¨oße besteht. Eine Ausnahme stellt der Fall paralleler Geraden dar . . .“, Descartes 1637, S. 312). Folglich wird aus der Bedingung (1.15) y · (mx + ny) = (d + ℓx + ky)2 , welche eine Gleichung der Form (1.18)
Ax2 + Bxy + Cy 2 + Dx + Ey + F = 0
ist. F¨ur jedes beliebige, feste y ist (1.18) eine quadratische Gleichung, die durch Algebra (siehe (1.10)) gel¨ost werden kann. Koordinatentransformation zeigt dann, dass (1.18) stets einen Kegelschnitt repr¨asentiert.
10
I. Einf¨uhrung in die Analysis des Unendlichen
u
E a x
A
B
α
y
v c
C
x
A
B
α
y
C
γ b
E
γ F
β
F
D
ABB. 1.5b. Problem von Pappus
ABB. 1.5c. Gleichung einer Geraden
Polynomiale Funktionen Algebra kann nicht nur der Geometrie helfen, sondern Geometrie hilft auch der Algebra, da kartesische Koordinaten die Algebra in ein neues Licht tauchen. Wenn wir beispielsweise anstelle von (1.1) und (1.4) die Gleichungen (1.19)
y = x2 + 10x − 39,
y = x3 + 6x − 20
betrachten, und beliebige Werte f¨ur x einsetzen, dann k¨onnen wir f¨ur jedes x einen Wert f¨ur y ausrechnen und die auf diese Weise erhaltenen Kurven studieren (Abb. 1.6). Die Wurzeln von (1.1) und (1.4) erscheinen als Schnittpunkte dieser Kurven mit der (horizontalen) x-Achse. So stellen wir fest, dass die L¨osung von (1.4) schlicht x = 2 lautet (etwas sch¨oner als Gl. (1.7)). (1.1) Definition. Ein Polynom ist ein Ausdruck der Form y = an xn + an−1 xn−1 + . . . + a0 , wobei a0 , a1 , . . . , an beliebige Konstanten sind. Ist an 6= 0, dann ist das Polynom vom Grad n. Interpolationsproblem. F¨ur n+1 gegebene Punkte xi , yi (siehe Abb. 1.7) suchen wir ein Polynom vom Grad n, das durch all diese Punkte verl¨auft. Wir interessieren uns haupts¨achlich f¨ur den Fall, in dem die xi a¨ quidistant sind, insbesondere x0 = 0, 7
x1 = 1,
x2 = 2,
Abb. 1.5a mit Erlaubnis der Bibl. Publ. Univ. Gen`eve.
x3 = 3, . . . .
I.1 Kartesische Koordinaten und Polynome
11
100
50
50 −15
−10
0
−5
5
−4
0
−2
2
4
−50 −50
−100
ABB. 1.6. Die Polynome x2 + 10x − 39 und x3 + 6x − 20
Die L¨osung dieses Problems, die sich als sehr praktisch in der Berechnung von Logarithmen und in der Nautik erwies, erschien erstmals im fr¨uhen 17ten Jahrhundert in den Arbeiten von Briggs und Sir Thomas Harriot (siehe Goldstine 1977, S. 23f). Newton (1676) ging das Problem an im Sinne von Vi`etes Algebra nova (siehe Abb. 1.8): Wir schreiben Buchstaben f¨ur die unbekannten Koeffizienten des Polynoms, z.B. y = A + Bx + Cx2 + Dx3 .
(1.20)
Mit den vorgegebenen Werten y0 , y1 , y2 , y3 transformieren wir das Problem“ in ” algebraische Gleichungen“ ” Abszisse Ordinate x=0 x=1
A A+B+C +D
= y0 = y1
x=2 x=3
A + 2B + 4C + 8D = y2 A + 3B + 9C + 27D = y3
Wir stellen nun fest, dass der Wert A verschwindet, wenn wir die Gleichungen voneinander abziehen, die erste von der zweiten, die zweite von der dritten, die dritte von der vierten: (1.21)
B + C + D = y1 − y0 =: ∆y0 B + 3C + 7D = y2 − y1 =: ∆y1
B + 5C + 19D = y3 − y2 =: ∆y2 . B verschwindet, wenn wir ein weiteres Mal subtrahieren: (1.22)
7
2C + 6D = ∆y1 − ∆y0 =: ∆2 y0
2C + 12D = ∆y2 − ∆y1 =: ∆2 y1 ,
Abbildung mit Erlaubnis der Bibl. Publ. Univ. Gen`eve.
12
I. Einf¨uhrung in die Analysis des Unendlichen
6
5
5 4
4
2
2 0
1
2
2 3
4
2 5
ABB. 1.7. Interpolationspolynom
ABB. 1.8. Interpolationsproblem von Newton (1676, Methodus Differentialis)8
und ebenso C: 6D = ∆2 y1 − ∆2 y0 =: ∆3 y0 .
(1.23)
Dies gibt uns D. Durch die erste Gleichung von (1.22) erhalten wir C, durch die erste von (1.21) den Wert von B. Wir erhalten als L¨osung (1.24)
y = y0 + ∆y0 · x +
∆2 y 0 ∆3 y 0 · (x2 − x) + · (x3 − 3x2 + 2x), 2 6
was auch geschrieben werden kann als (1.24′)
y = y0 +
x x(x − 1) 2 x(x − 1)(x − 2) 3 ∆y0 + ∆ y0 + ∆ y0 . 1 1·2 1·2·3
I.1 Kartesische Koordinaten und Polynome
13
Wir werden im n¨achsten Abschnitt unter Verwendung des Pascalschen Dreiecks sehen, dass dies ein Spezialfall einer allgemeineren Formel f¨ur Polynome beliebigen Grades ist. (1.2) Satz. Das Polynom vom Grad n, das die Werte y0 (f¨ur x = 0),
y1 (f¨ur x = 1), . . . , yn (f¨ur x = n)
annimmt, ist gegeben durch die Formel y = y0 +
x x(x − 1) 2 x(x − 1) . . . (x − n + 1) n ∆y0 + ∆ y0 + . . . + ∆ y0 . 1 1·2 1 ·2 · ...· n
(1.3) Bemerkung. Seit Newton (siehe Abb. 1.9) ist es u¨ blich, die Differenzen in folgendem Schema anzuordnen: y0 y1 (1.25)
y2 y3 y4
∆y0 ∆y1 ∆y2 ∆y3
mit 2
∆ y0 2
∆ y1 ∆2 y 2
∆3 y 0 ∆3 y 1
4
∆ y0
∆yi = yi+1 − yi
∆2 yi = ∆yi+1 − ∆yi
∆3 yi = ∆2 yi+1 − ∆2 yi , etc.
ABB. 1.9. Newtons Differenzenschema (Newton 1676, Methodus Differentialis)9
9
Abbildung mit Erlaubnis der Bibl. Publ. Univ. Gen`eve.
14
I. Einf¨uhrung in die Analysis des Unendlichen
Beispiel. F¨ur die Werte in unserem Problem (Abb. 1.7) erhalten wir 4 5 2 5 2 2
1 −3 3
−3 0
−4 6
−6 3
10 −12 9
1 4 ·x− · x(x − 1) + . . . 1 1·2 613 x 473 x3 =4+ − 35 x2 + 30 24 9 x4 43 x5 − + . 2 120
y =4+ −22 21
⇒
43
Weitere Beispiele. a) Wir betrachten das Polynom y = x3 , f¨ur das wir die L¨osung bereits kennen. Das Differenzenschema lautet: x(x − 1) x=0: 0 y =0+1·x+6· 1 2 x=1: 1 6 x(x − 1)(x − 2) 7 6 ⇒ +6· x=2: 8 12 6 19 x = 3 : 27 = x + 3x2 − 3x + x3 − 3x2 + 2x = x3 . b) Die Werte f¨ur x = n sind hier die Summen 13 + 23 + . . . + n3 , x=0:
0
x=1:
13 3
x=2:
1 +2 3
x=3: x=4:
1
3
1 +2 +3 3
3
23
3
3
3
1 +2 +3 +4
3
3
3
4
3
7 19 37 61
12 18 24
6 6 6
0 0
0,
und wir erhalten die Formel x(x − 1) x(x − 1)(x − 2) x(x − 1)(x − 2)(x − 3) y =x+7 + 12 +6 2 6 24 x4 x3 x2 = + + . 4 2 4 Auf a¨ hnliche Weise leiten wir her: 1 + 2 + ...+ n = 12 + 2 2 + . . . + n2 = (1.26)
13 + 2 3 + . . . + n3 = 14 + 2 4 + . . . + n4 = 15 + 2 5 + . . . + n5 =
n2 2 n3 3 n4 4 n5 5 n6 6
+ + + + +
n 2 n2 2 n3 2 n4 2 n5 2
n 6 n2 + +0 4 n3 n + +0− 3 30 5n4 n2 + +0− 12 12 +
I.1 Kartesische Koordinaten und Polynome
15
Jakob Bernoulli (1705) fand die allgemeine Formel 1q + 2 q + . . . + nq =
wobei (1.27) A =
nq+1 nq q q(q − 1)(q − 2) + + Anq−1 + Bnq−3 + q+1 2 2 2·3·4 q(q − 1)(q − 2)(q − 3)(q − 4) q−5 + Cn + ... , 2·3·4·5·6
1 1 1 1 5 691 , B=− , C= , D=− , E= , F =− ,... 6 30 42 30 66 2730
die sogenannten Bernoulli-Zahlen sind. F¨ur eine elegante Erkl¨arung verweisen wir auf Abschnitt II.10.
¨ Ubungen 1.1 Das folgende Problem in Vi`etes Notation x + y + z = 20 x:y=y:z xy = 8 wurde Tartaglia am 15. Dezember 1536 von Zuanne de Tonini da Coi (Colla) gestellt. Tartaglia konnte es nicht l¨osen (siehe Notari 1924). Eliminieren Sie die Variablen x und z, um zu verstehen, wieso. Cardano gab das Problem ¨ sp¨ater an Ferrari weiter, der eine L¨osung fand (siehe n¨achste Ubung). Es ist nicht erstaunlich, dass Ferrari und Tartaglia sp¨ater b¨ose Briefe mit hitzigen Wortwechseln u¨ ber mathematische Fragestellungen austauschten. 1.2 Rekonstruieren Sie Ferraris L¨osung der biquadratischen Gleichung (1.28)
x4 + ax2 = bx + c.
Hinweis. a) Addieren Sie auf beiden Seiten a2 /4 und Sie erhalten a 2 a2 x2 + = bx + c + . 2 4
b) F¨ugen Sie einen Parameter y ein und addieren Sie y 2 + ay + 2x2 y auf beiden Seiten, mit dem Ergebnis 2 a a2 x2 + + y = 2x2 y + bx + y 2 + ay + c + . 2 4
c) Der Ausdruck auf der rechten Seite, geschrieben als Ax2 + Bx + C, ist von der Form (αx + β)2 falls B 2 = 4AC. Dies f¨uhrt zu einer Gleichung dritten Grades f¨ur y.
16
I. Einf¨uhrung in die Analysis des Unendlichen
d) Cardanos Formel (1.14) liefert eine L¨osung f¨ur y, setzen Sie diese ein in die folgende Gleichung mit zwei Wurzeln: a x2 + + y = ±(αx + β). 2 Bemerkung. Jedes Polynom z 4 + az 3 + bz 2 + cz + d = 0 kann auf die Form (1.28) zur¨uckgef¨uhrt werden, wenn man x = z + a/4 substituiert. 1.3 (Euler 1749, Opera Omnia, Band VI, S. 78–147). L¨osen Sie die Gleichung vierten Grades x4 + Bx2 + Cx + D = 0 durch Koeffizientenvergleich mit x4 + Bx2 + Cx + D = (x2 + ux + α)(x2 − ux + β) und finden Sie eine Gleichung dritten Grades f¨ur u2 . L¨osen Sie diese Gleichung und berechnen Sie die L¨osungen der zwei quadratischen Gleichungen. 1.4 (L. Euler 1770, Vollst. Anleitung zur Algebra, St. Petersburg, Opera Omnia, Band I). Betrachten Sie eine Gleichung vom Grad 4 mit symmetrischen Koeffizienten, z.B. (1.29)
x4 + 5x3 + 8x2 + 5x + 1 = 0.
Zerlegen Sie das Polynom in (x2 + rx + 1)(x2 + sx + 1) und finden Sie die vier L¨osungen von (1.29). Bemerkung. F¨ur eine weitere M¨oglichkeit, (1.29) zu l¨osen, teilen Sie die Gleichung durch x2 und benutzen Sie die neue Variable u = x + x−1 . 1.5 Problem vorgestellt von Armenien/Australien f¨ur die 35te Internationale Mathematik-Olympiade (stattgefunden in Hong Kong, 12. bis 19. Juli 1994). Sei ABC ein gleichschenkliges Dreieck mit AB = AC. Nehmen Sie an, dass (i) M ein Mittelpunkt von BC ist, und dass O derjenige Punkt auf der Geraden AM ist, bei dem OB senkrecht auf AB steht; (ii) Q ein beliebiger Punkt auf dem Segment BC ist, verschieden von B und C; und (iii) E auf der Geraden AB liegt und F auf der Geraden AC liegt, so dass E, Q und F verschieden und kollinear sind. Beweisen Sie mit Vi`ete’s Methode, dass OQ genau dann auf EF senkrecht steht, wenn QE = QF .
I.1 Kartesische Koordinaten und Polynome
Jak. Bernoulli, Ars conj. 170510
9, 10
Abbildungen mit Erlaubnis der Bibl. Publ. Univ. Gen`eve.
17
18
I. Einf¨uhrung in die Analysis des Unendlichen
I.2 Exponentialfunktion und binomischer Lehrsatz Hier ist es angemessen, zu bemerken, dass ich x−1 , x−2 , x−3 , x−4 , &c. √ √ 1 3 5 1 2 f¨ur x1 , x12 , x13 , x14 , &c. schreibe, x 2 , x 2 , x 2 , x 3 ,x 3 , &c. f¨ur x, x3 , √ √ √ 1 2 1 3 1 1 x5 , 3 x, x2 , &c. und x− 2 , x− 3 , x− 4 &c. f¨ur √1x , √ 3 2, √ 4 x , &c. Und x dies gem¨aß einem Analogieschluss, den man aus geometrischen Folgen wie 5 3 1 1 dieser hier ersehen kann; x3 , x 2 , x2 , x 2 , x, x 2 , x0 , (d.h. 1;) x− 2 , x−1 , −3 −2 x 2 , x , &c. (Newton 1671, Fluxiones, Engl. Ver¨offentl. 1736, S. 3)
F¨ur eine gegebene Zahl a schreiben wir (2.1)
a · a = a2 ,
a · a · a = a3 ,
a · a · a · a = a4 , . . . .
Diese Schreibweise hatte sich nur langsam durchgesetzt, haupts¨achlich dank den Arbeiten von Bombelli im Jahr 1572, Simon Stevin in 1585, Descartes und Newton (siehe Zitat). Wenn wir multiplizieren, beispielsweise a2 · a3 = (a · a) · (a · a · a) = a · a · a · a · a = a5 ,
erkennen wir die Regel (2.2)
an · am = an+m .
In der geometrischen Folge (2.1) ist jeder Term das a-fache seines Vorg¨angers. Wir k¨onnen diese Folge auch nach links hin fortsetzen, indem wir die Zahlen durch a teilen. Dies f¨uhrt zu 1 1 . . . a−2 = , a−1 = , a0 = 1, a1 = a, a2 = a · a, . . . , a·a a wobei wir Nutzen ziehen aus der Notation 1 (2.3) a−m = m . a Auf diese √ Weise gilt Formel (2.2) auch f¨ur negative Exponenten. Wenn wir nun mehrfach a an 1 multiplizieren, wobei a eine positive Zahl sein muss, erhalten wir die geometrische Folge √ √ √ √ √ √ √ √ 1, a, a · a = a, a · a · a = a3 , a4 = a2 , . . . , was uns zur Notation (2.4)
am/n =
√ n
am .
veranlasst. Hiermit bleibt Formel (2.2) auch f¨ur rationale Exponenten g¨ultig. Wir ziehen dabei nur die positiven Wurzeln, so dass a5/2 zwischen a2 und a3 liegt. Der letzte Schritt (f¨ur die Menschheit) liegt in irrationalen Exponenten, die, wie Euler √ 7 uns versichert, schwerer zu verstehen“ sind. Aber Sic a √ erit valor determi” ” natus intra limites a2 et a3 comprehensus“ bedeutet, dass a 7 als Wert zwischen a2 und a3 liegt, zwischen a26/10 und a27/10 , zwischen a264/100 und a265/100 , zwischen a2645/1000 und a2646/1000 , und so weiter.
I.2 Exponentialfunktion und binomischer Lehrsatz
19
Der binomische Lehrsatz Obwohl diese Behauptung eine unendliche Zahl an F¨allen umfasst, werde ich einen ziemlich kurzen Beweis angeben, allein durch die Annahme zweier Lemmata. Das erste, das selbstverst¨andlich ist, sagt aus, dass dieses Verh¨altnis f¨ur die zweite Zeile eintritt; denn es ist ziemlich offensichtlich, dass sich ϕ zu σ verh¨alt wie 1 zu 1. Das zweite besagt, dass, wenn dieses Verh¨altnis in irgendeiner Zeile auftritt, es auch in der n¨achsten Zeile notwendigerweise auftreten muss. (Pascal 1654, einer der ersten Induktionsbeweise)
Wir wollen den Ausdruck (a+ b)n ausmultiplizieren. Indem wir nacheinander mit (a + b) multiplizieren, erhalten wir jeweils (a + b)0 = 1 (a + b)1 = a + b (a + b)2 = a2 + 2ab + b2
(2.5)
(a + b)3 = a3 + 3a2 b + 3ab2 + b3 (a + b)4 = a4 + 4a3 b + 6a2 b2 + 4ab3 + b4 , und so weiter. Es erscheint ein interessantes Dreieck von Binomialkoeffizienten“ ” (Omar Alkhaijˆamˆa im Jahr 1080, Tshu shi Kih in 1303, M. Stifel 1544, Cardano 1545, Pascal 1654, siehe Abb. 2.1) 1 1 1 1
(2.6)
1 1 1 1
7
3 4
5 6
1 3
6 10
15 21
1 2
10 20
35
1 4
1 5
15 35
1 6
21
1 7
1
¨ in dem jede Zahl die Summe ihrer zwei Ubergestellten“ ist. Wir wollen eine ” allgemeine Regel f¨ur diese Koeffizienten finden. Es ist nicht schwer zu sehen, dass die erste Diagonale nur aus Einsen besteht, und die zweite (1, 2, 3, . . .) aus n“. F¨ur die dritte Diagonale (1, 3, 6, 10, . . .) erraten wir n(n−1) “, gefolgt von ” n(n−1)(n−2) ” 1·2 “ und so weiter. Dies l¨ a sst uns folgenden Satz vermuten. 1·2·3 ” (2.1) Satz (Pascal 1654). F¨ur n = 0, 1, 2, . . . finden wir (a + b)n = an +
n n−1 n(n − 1) n−2 2 n(n − 1)(n − 2) n−3 3 a b+ a b + a b +... . 1 1·2 1·2·3
Diese Summe ist endlich und endet nach n + 1 Termen.
Beweis. Wir berechnen das Verh¨altnis einer jeden Zahl aus (2.6) zu ihrem linken Nachbarn (Pascal 1654, S. 7, Consequence douziesme“). ”
20
I. Einf¨uhrung in die Analysis des Unendlichen
ABB. 2.1. Erstpublikation des Pascalschen Dreiecks, Pascal (1654)1
(2.7) 7 1
5 1
6 1
6 2
...
4 1 5 2
3 1 4 2 5 3
2 1 3 2 4 3
1 1 2 2 3 3 4 4
...
1 2 2 3 3 4
1 3 2 4 3 5
1 4 2 5
1 5 2 6
1 6
...
1 7
Nun ist es nicht mehr schwer, eine allgemeing¨ultige Regel zu erraten. Wir beweisen diese Regel durch Induktion nach der Zeilennummer“ (siehe Zitat). Nehmen ” wir an, dass (2.8)
A
B D
C E
D = A + B, E = B + C
ein Teil des Pascalschen Dreiecks ist, in dem die Induktionsannahme“ ” B k C k−1 = , = . A ℓ−1 B ℓ gilt. Dann gilt auch (2.9) 1
1+ C 1 + k−1 E B+C = = A B = ℓ−1 ℓ = D A+B +1 +1 B k
Abb. 2.1 mit Genehmigung der Bibl. Publ. Univ. Gen`eve.
ℓ+k−1 ℓ ℓ−1+k k
=
k , ℓ
I.2 Exponentialfunktion und binomischer Lehrsatz
21
was bedeutet, dass wir in der n¨achsten Zeile dieselbe Struktur vorfinden. Die Tatsache, dass die Verh¨altnisse in der n-ten Zeile von (2.7) gegeben sind durch n/1, (n−1)/2, (n−2)/3, . . . impliziert, dass die Koeffizienten von (2.6) ein Produkt dieser Verh¨altnisse sind; beispielsweise ist die 20“ in der siebten Zeile ” das Produkt 20 15 6 (2.7) 4 5 6 6·5·4 20 = · · = · · = , 15 6 1 3 2 1 3·2·1 und wir sehen ein, dass Satz 2.1 allgemeing¨ultig ist. ⊓ ⊔ Diese Koeffizienten n(n − 1) . . . (n − j + 1) n(n − 1) . . . (n − j + 1) (n − j) . . . 1 = 1 · 2 ·... ·j 1 · 2 · . . . · j · 1 · 2 · . . . · (n − j) (2.10) n! n = = j! (n − j)! j
werden Binomialkoeffizienten genannt, und n! = 1 · 2 · . . . · n heißt die Fakult¨at von n. Anwendung auf das Interpolationspolynom. Wir entwickeln die Ausdr¨ucke im Differenzenschema (1.25): y0 y1 y2 y3
y1 − y0 y2 − y1 y3 − y2
y2 − 2y1 + y0 y3 − 2y2 + y1
y3 − 3y2 + 3y1 − y0 .
Das Auftauchen des Pascalschen Dreiecks ist kein Zufall, da jeder Term die Differenz der zwei links von ihm stehenden Terme ist. Desweiteren ist jeder Term des Schemas (1.25) die Summe des Terms u¨ ber ihm und des Terms rechts von ihm. Damit kann das Schema auch wie folgt geschrieben werden: y0 ∆y0 y0 + ∆y0
∆2 y 0
2
2
y0 + 2∆y0 + ∆ y0 y0 + 3∆y0 + 3∆2 y0 + ∆3 y0
∆y0 + ∆ y0 ∆y0 + 2∆2 y0 + ∆3 y0
2
3
∆3 y 0 .
∆ y0 + ∆ y0
Auch in dieser Richtung erscheint wieder das Pascalsche Dreieck. Formel (2.10) ergibt damit n n(n − 1) 2 n(n − 1)(n − 2) 3 ∆y0 + ∆ y0 + ∆ y0 + . . . , 1 2! 3! womit Satz 1.2 bewiesen ist. yn = y 0 +
22
I. Einf¨uhrung in die Analysis des Unendlichen
Negative Exponenten. Wir beginnen mit (a + b)−1 =
1 . a+b
Wenn wir annehmen, dass |b| < |a|, so ist eine erste Ann¨aherung an dieses Verh¨altnis schlicht 1/a. Wir versuchen, diesen Wert durch eine unbekannte Gr¨oße δ zu verbessern: 1 1 = +δ a+b a
⇒
1 = 1+
b + aδ + bδ. a
Da |b| < |a|, vernachl¨assigen wir den Term bδ und erhalten δ = −b/a2 . Wiederholen wir diesen Prozess wieder und wieder (oder, um pr¨aziser zu sein, fahren mit einer Induktion fort), finden wir (2.11)
(a + b)−1 =
1 b b2 b3 − 2 + 3 − 4 + ..., a a a a
was dasselbe ist wie Satz 2.1 f¨ur n = −1; doch dieses Mal ist die Reihe unendlich lang. Wenn wir (2.11) mit a multiplizieren und x = b/a einsetzen, erhalten wir (2.12)
1 = 1 − x + x2 − x3 + x4 − x5 + . . . 1+x
|x| < 1,
die ber¨uhmte geometrische Reihe (Vi`ete 1593). √ 1/2 Quadratwurzeln. Als n¨achstes betrachten = a + b. Wieder √ wir (a√+ b) nehmen wir an, dass b klein ist, so dass a + b ≈ a, und suchen nach einem δ, so dass √ √ a+b= a+δ eine bessere Ann¨aherung ist. Quadrieren liefert 2 √ √ a+b= a + δ = a + 2 aδ + δ 2 . √ Da δ klein ist, vernachl¨assigen wir δ 2 und erhalten δ = b/(2 a), also (2.13)
√
a+b ≈
√
b a+ √ 2 a ,
|b| ≪ a.
√ Beispiel. Berechnung von 2. Wir beginnen mit dem Sch¨atzwert v = 1, 4 und setzen a = v 2 und b = 2 − a = 2 − v 2 ein. Dann gibt uns (2.13) einen neuen Sch¨atzwert 2 − v2 12 v+ = +v , 2v 2 v eine Formel, die wir nun wiederholt anwenden k¨onnen, mit dem Ergebnis
I.2 Exponentialfunktion und binomischer Lehrsatz
23
1, 4 1, 414285 1, 4142135642 1, 4142135623730950499 1, 4142135623730950488016887242096980790 1, 41421356237309504880168872420969807856967187537694807317667973799 .
Dieselbe Rechnung, durchgef¨uhrt in Basis 60, ergibt mit dem Startwert 1, 25 das Resultat 1, 24, 51, 10 (Kommas trennen hier die Ziffern in Basis 60). Dieser Wert wurde auf einer babylonischen Tafel gefunden, die auf 1900 v. Chr. datiert (siehe Abb. 2.2, siehe auch van der Waerden 1954, Kapitel II, Bildtafel 8b). Dies deutet darauf hin, dass Formel (2.13) bereits seit der babylonischen und griechischen Antike angewandt wird.
ABB. 2.2. Auf der babylonischen Keilschrift-Tafel YBC 7289 von 1900 v. Chr. ist ein Quadrat der Seitenl¨ange 30 abgebildet, die Diagonale wird mit 42, 25, 35 angegeben, und das Verh¨altnis mit 1, 24, 51, 10.2
N¨achster Schritt (Alkalsˆadˆı etwa 1450, Briggs 1624). Um (2.13) weiter zu verbessern, betrachten wir √
a+b =
√
b a + √ + δ, 2 a
berechnen das Quadrat a+b= a+b+
√ b2 bδ + 2 a δ + √ + δ2, 4a a
vernachl¨assigen die letzten zwei Terme, und erhalten (2.14) 2
√ √ b b2 a+b≈ a+ √ − √ . 2 a 8 a3
Abbildung mit Erlaubnis der Yale Babylonian Collection.
24
I. Einf¨uhrung in die Analysis des Unendlichen
Beispiel. F¨ur
√
2 liefert die neue Approximation diesmal v+
2 − v2 4 − 4v2 + v 4 3v 3 1 − = + − , 2v 8v3 8 2v 2v 3
deren wiederholte Anwendung, beginnend mit v = 1, 4, sehr schnell konvergiert: 1, 4 1, 4142128 1, 41421356237309504870 1, 41421356237309504880168872420969807856967187537694807317643 .
Die √ Gleichungen (2.13) und (2.14) werden deutlich u¨ bersichtlicher, wenn wir durch a teilen, und b/a durch x ersetzen: 1
(1 + x) 2 ≈ 1 +
x , 2
1
(1 + x) 2 ≈ 1 +
x x2 − . 2 8
Mit dem Ziel noch besserer Ann¨aherungen k¨onnen wir die obigen Rechnungen weiterf¨uhren. Das Ergebnis wird eine Reihe der Form 1
(1 + x) 2 = 1 +
x + bx2 + cx3 + dx4 + . . . , 2
sein, deren Koeffizienten b, c, d, . . . wir noch bestimmen m¨ussen. Setzen wir diese 1 1 Darstellung ein in die Beziehung (1 + x) 2 (1 + x) 2 = 1 + x und vergleichen die Potenzen von x miteinander, so erhalten wir b = −1/8, c = 1/16, d = −5/128, . . . , was sofort zu einer besseren Approximation f¨uhrt (Newton 1665): 1 1 1 1 5 4 (1 + x) 2 = 1 + x − x2 + x3 − x + ... . 2 8 16 128
(2.15)
Wir stellen u¨ berdies fest − −
1 1·1 =− = 8 2·4
1 1 2(2
− 1) , 2
5 1·1·3·5 =− = 128 2·4·6·8
1 1 2(2
1 1·1·3 = = 16 2·4·6
− 1)( 12 − 2)( 12 − 3) , 1·2·3·4
1 1 2(2
− 1)( 12 − 2) , 1·2·3
was uns vermuten l¨asst, dass Satz 2.1 auch f¨ur n = 1/2 g¨ultig ist. Die Folge 2 1+x/2, 1+x/2−x √ /8, . . . ist in Abb. 2.3 skizziert und illustriert die Konvergenz von (2.15) gegen 1 + x f¨ur −1 < x < 1. Beliebige rationale Exponenten.
Alles dies geschah in den zwei Jahren der Seuche 1665 und 1666, denn zu dieser Zeit war ich in der Bl¨ute meiner Jahre als Erfinder, und widmete mich der Mathematik und Philosophie mehr als zu jeder sp¨ateren Zeit. (Newton, zitiert nach Kline 1972, S. 357)
Einer von Newtons Einf¨allen in jenen anni mirabiles“, inspiriert von der Arbeit ” von Wallis (siehe die Bemerkung, die auf Gl. (5.27) folgt), war der Versuch, die
I.2 Exponentialfunktion und binomischer Lehrsatz
25
3 2
√ N=2
N=1
4
1
−1
1+x
0
1
2 6
N = 16
1
ABB. 2.3. Reihe f¨ur (1 + x) 2 = 1 + 12 x − 18 x2 +
1 3 x 16
−
5 x4 128
...
Polynome (1 + x)0 , (1 + x)1 , (1 + x)2 , . . . zu interpolieren, mit dem Ziel, eine Reihe f¨ur (1 + x)a mit rationalem a zu finden. Dies bedeutet, dass wir die Koeffizienten in Satz 2.1 interpolieren m¨ussen (siehe Abb. 2.4). Da letztere selber Polynome in n sind, ist klar, dass das Resultat durch denselben Ausdruck gegeben sein muss, wenn man n durch a ersetzt. Wir erhalten somit den allgemeinen Satz. (2.2) Satz (Allgemeiner binomischer Lehrsatz von Newton). F¨ur jedes rationale a und f¨ur |x| < 1 gilt a a(a − 1) 2 a(a − 1)(a − 2) 3 (1 + x)a = 1 + x + x + x +... . 1 1·2 1·2·3
ABB. 2.4. Interpolation des Pascalschen Dreiecks, Newtons Originalmanuskript (1665)3
26
I. Einf¨uhrung in die Analysis des Unendlichen
Selbst Newton empfand das Interpolationsargument als gef¨ahrlich. Euler gab den allgemeinen Satz in seiner Introductio (1748, §71) ohne weiteren Beweis oder Kommentar wieder ( ex hoc theoremate universali“). Erst Abel sah Bedarf f¨ur ” einen strengen Beweis, ein Jahrhundert sp¨ater (siehe Abschnitt III.7 unten). Bemerkung. Dies ist genau die Formel, die auf Newtons Grabstein in Westminster Abbey 1727 eingraviert wurde. Versuchen Sie nicht, sie zu finden . . . in den letzten hundert Jahren war die Formel unlesbar.
Die Exponentialfunktion . . . ubi e denotat numerum, cuius logarithmus hyperbolicus est 1. (erste Definition von e; Euler 1736b, Mechanica, S. 60)
Urspr¨unge. 1. F. de Beaune (1601–1652) war der erste Leser von Descartes’ G´eo” m´etrie“ aus dem Jahr 1637. Ein Jahr sp¨ater stellte er Descartes das folgende geometrische Problem: Man finde eine Kurve y(x), so dass f¨ur jeden Punkt P der Abstand zwischen den Punkten V und T, die die Schnittpunkte zwischen der x-Achse und der vertikalen bzw. tangentialen Linie sind, stets konstant a ist (siehe Abb. 2.5a). Trotz den Anstrengungen von Descartes und Fermat blieb dieses Problem f¨ur fast 50 Jahre ungel¨ost. Leibniz (1684, . . . tentavit, sed non ” solvit“) schlug dann folgende L¨osung vor (siehe Abb. 2.5b): Sei (x, y) ein bereits gegebener Punkt auf der L¨osungskurve. Sodann erh¨ohe man x um einen kleinen ¨ Betrag b, so dass sich y (aufgrund der Ahnlichkeit zweier Dreiecke) um yb/a erh¨oht. Man wiederhole diesen Prozess, und erhalte eine Folge von Funktionswerten y,
b 1+ y, a
1+
b 2 y, a
b 3 1+ y, . . . a
f¨ur die Abszissen x, x + b, x + 2b, x + 3b, . . . . 2. Fragen der Form Wenn die Bev¨olkerung einer bestimmten Region j¨ahrlich ” um ein Dreißigstel w¨achst, und diese Region zu einem Zeitpunkt 100.000 Einwohner hatte, wie hoch w¨are dann die Bev¨olkerung 100 Jahre sp¨ater?“ (Euler 1748, Introductio §110) oder Ein bestimmter Mann lieh sich 400.000 Gulden zum ” Wucherzins von f¨unf Prozent im Jahr . . .“ (Introductio §111) f¨uhren zur Berechnung von Ausdr¨ucken der Art (2.16)
1+
1 100 , 30
N 1 + 0.05 ,
oder allgemein
wobei ω klein ist und N groß. 3
Abb. 2.4 mit Genehmigung der Cambridge University Press.
1+ω
N
,
I.2 Exponentialfunktion und binomischer Lehrsatz
y
P
T
ABB. 2.5a. Beaunesche Aufgabe
ABB. 2.5b. Leibniz’ L¨osung
Die Eulersche Zahl. Nehmen wir zun¨achst mal an, dass ω = (2.16) mit Hilfe von Satz 2.1 zu N 1+
1 N
z
xb b b b b b
V
a
27
1 N.
Wir berechnen
N N (N − 1) 1 N(N − 1)(N − 2) 1 + + + ... N 1·2 N2 1·2·3 N3 1(1 − N1 ) 1(1 − N1 )(1 − N2 ) =1+1+ + +... . 1·2 1·2·3 =1+
Ohne mit der Wimper zu zucken, behauptet Euler nun: Wenn N eine Zahl ist ” gr¨oßer als jede bestimmbare Zahl, dann ist NN−1 gleich 1“. Dies zeigt, dass, wenn N gegen Unendlich strebt, (1 + N1 )N gegen die sogenannte Eulersche Zahl (2.17)
e=1+1+
1 1 1 + + + ... . 1·2 1·2·3 1·2·3·4
konvergiert. Wir m¨ochten betonen, dass dieses Argument gef¨ahrlich ist, da es unendlich oft angewendet werden muss. So k¨onnte man durch einen a¨ hnlichen Be” weis“ zeigen: 1 1 1 1 1 1 1 1 + = + + = + + ...+ = 0 + 0 + 0 + . . . = 0. 2 2 3 3 3 N N N Wir werden auf diese Frage in Abschnitt III.2 zur¨uckkommen. Tabelle 2.1 vergleicht die G¨ute der Konvergenz der Reihe (2.17) mit der von (1 + N1 )N . 1=
Potenzen von e. Als n¨achstes betrachten wir in (2.16) den Fall ω = x/N , wobei x eine feste, z.B. rationale Zahl ist. Das bedeutet, dass wir gleichzeitig N gegen Unendlich und ω gegen Null streben lassen, in der Weise, dass ihr Produkt konstant gleich x bleibt. Dieselbe Rechnung wie zuvor f¨uhrt uns nun zum Ergebnis x N x2 x3 x4 (2.18) 1+ → 1+x+ + + + ... . N 1·2 1·2·3 1·2·3·4
28
I. Einf¨uhrung in die Analysis des Unendlichen
TABELLE 2.1. Berechnung von e N
(1 +
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
1 N ) N
2,000 2,250 2,370 2,441 2,488 2,522 2,546 2,566 2,581 2,594 2,604 2,613 2,621 2,627 2,633 2,638 2,642 2,646 2,650 2,653 2,656 2,659 2,661 2,664 2,666 2,668 2,670 2,671
1+
1 1!
+
1 2!
+ ... +
1 N!
2,0 2,5 2,66 2,708 2,7166 2,71805 2,718253 2,7182787 2,71828152 2,718281801 2,7182818261 2,71828182828 2,718281828446 2,7182818284582 2,71828182845899 2,7182818284590422 2,71828182845904507 2,718281828459045226 2,7182818284590452349 2,718281828459045235339 2,7182818284590452353593 2,718281828459045235360247 2,7182818284590452353602857 2,718281828459045235360287404 2,7182818284590452353602874687 2,71828182845904523536028747125 2,718281828459045235360287471349 2,71828182845904523536028747135254
Wir k¨onnen aber auch M = N/x, N = xM f¨ur jene Werte von N einsetzen, f¨ur die M eine ganze Zahl ist. Lassen wir N und M gegen Unendlich streben, bedeutet dies x N 1 Mx 1 M x (2.19) 1+ = 1+ = 1+ → ex . N M M Kombinieren wir (2.18) und (2.19), erhalten wir den folgenden Satz.
(2.3) Satz (Euler 1748, Introductio §§123, 125). F¨ur N gegen Unendlich gilt
1+
x N x2 x3 x4 → ex = 1 + x + + + + ... . N 2! 3! 4!
⊓ ⊔
Die Konvergenz dieser Ausdr¨ucke gegen ex (was auch mit exp x bezeichnet wird) ist in den Abbildungen 2.6a und 2.6b dargestellt. Die gepunktete Linie ist dabei die exakte Funktion ex .
I.2 Exponentialfunktion und binomischer Lehrsatz
29
3
6 6
6 2 2
4
2
4
2
N=1
2
N=1
4 2
6
−3
−2
−1
0
1
2
−3 5
−2
−2
−1
0
1
2
−2 3
ABB. 2.6a. 1 +
x N
N
ABB. 2.6b. 1 + x +
x2 2!
+
x3 3!
+ ...
¨ Ubungen 2.1 Beweisen Sie die folgende Formel (Euler 1755, Opera Band X, S. 280), nutzen Sie daf¨ur 50 = 2 · 52 = 72 + 1: √ 7 1 1·3 1·3·5 2= 1+ + + + etc. 5 100 100 · 200 100 · 200 · 300 quae ad computum in fractionibus decimalibus instituendum est optissima“. ” Summieren Sie nummerisch f¨unf Terme dieser Reihe. Hinweis. Arbeiten Sie mit der Reihenentwicklung von (1 − x)−1/2 . 2.2 Zeigen Sie, dass die Zahl, die in Basis 60 als 1, 25 geschrieben wird, eine √ gute Ann¨aherung an 2 ist. Zeigen Sie dann, dass eine Iteration des ba” bylonischen Quadratwurzel-Algorithmus“, der aus Formel (2.13) folgt, zu 1, 24, 51, 10, . . . f¨uhrt, dem Wert aus Abb. 2.2. 2.3 Multiplizieren Sie die Reihe (1 + x)1/3 = 1 + ax + bx2 + cx3 + . . . zweimal mit sich selbst, und bestimmen Sie so die Koeffizienten a, b, c, . . . . Sie sollten folgendes finden: (1 + x)1/3 = 1 +
x 2 2 2·5 3 − x + x −+... . 3 3·6 3·6·9
30
I. Einf¨uhrung in die Analysis des Unendlichen
Benutzen Sie 2 · 43 − 53 = 3, um hieraus die folgende Formel abzuleiten: √ 5 1 2 3 2= 1+ − 4 1 · 125 1 · 2 · (125)2 2·5 2·5·8 + − + ... . 1 · 2 · 3 · (125)3 1 · 2 · 3 · 4 · (125)4 √ Bemerkung. Die Bestimmung von 3 2 war eines der großen Probleme der griechischen Mathematik (Verdoppelung des W¨urfels). 2.4 (Bernoullis Ungleichung; Jak. Bernoulli 1689, siehe 1744, Opera, S. 380; Barrow 1670, siehe 1860, Works, Lectio VII, §XIII, S. 224). Beweisen Sie durch Induktion nach n, dass (1 + a)n ≥ 1 + na
f¨ur a ≥ −1, n = 0, 1, 2, . . . 1 1 − na < (1 − a)n < f¨ur 0 < a < 1, n = 2, 3, . . . . 1 + na n 2.5 Studieren Sie die Konvergenz von 1+ n1 gegen e, und betrachten Sie daf¨ur die Folgen 1 n 1 n+1 an = 1 + und bn = 1 + . n n Zeigen Sie, dass
a1 < a2 < a3 < . . . < e < . . . < b3 < b2 < b1 und bn − an ≤ 4/n gelten. ¨ Hinweis. Benutzen Sie die zweite Ungleichung von Ubung 2.4 mit a = 1/n2 .
I.3 Logarithmen und Fl¨achen
31
I.3 Logarithmen und Fl¨achen Tabularum autem logarithmicarum amplissimus est usus . . . (Euler 1748, Introductio, §110)
Der Begriff des Logarithmus wird von den Sch¨ulern im allgemeinen nur sehr schwer verstanden. (B.L. van der Waerden 1957, S. 1)
M. Stifel widmete 1544 (siehe Nachbildung in Abb. 3.1) sein Interesse dem Zusammenspiel folgender zweier Folgen: ...
−3
−2
−1
0
1
2
3
4
5
6
7
8
...
...
1 8
1 4
1 2
1
2
4
8
16
32
64
128
256
...
ABB. 3.1. Ausz¨uge aus Stifels Buch (S. 237 und 250)1
¨ Uns f¨allt auf, dass der Ubergang von der unteren zur oberen Zeile Produkte in Summen u¨ berf¨uhrt. So kann man beispielsweise, statt 8 mit 32 in inferiore ordine“ ” zu multiplizieren, auch die entsprechenden Logarithmen“ 3 und 5 in superiore ” ” ordine“ nehmen, ihre Summe (8) berechnen, und zur inferiore ordine“ zur¨uck” kehren, womit man das Produkt 8 · 32 = 256 findet. Da Addition einfacher ist als Multiplikation, w¨are eine detailliertere Tabelle dieser Art von großem Nutzen. Derart logarithmische“ Tabellen (λ´ oγoς ist griechisch f¨ur Wort, Beziehung“, ” ” α̺ιθµ´ oς steht f¨ur Zahl“, Logarithmen sind folglich n¨utzliche Beziehungen zwi” schen Zahlen) wurden zuerst von John Napier (1614, 1619), Henry Briggs (1624) und Jost B¨urgi (1620) berechnet.
1
Abbildung mit Genehmigung der Bibl. Publ. Univ. Gen`eve.
32
I. Einf¨uhrung in die Analysis des Unendlichen
(3.1) Definition. Eine Funktion ℓ(x), definiert f¨ur positive Werte x, heißt logarithmische Funktion, falls f¨ur alle x, y > 0 gilt: (3.1)
ℓ(x · y) = ℓ(x) + ℓ(y). Wenn wir zun¨achst y = z/x und dann x = y = 1 in (3.1) einsetzen, folgt
(3.2)
ℓ(z/x) = ℓ(z) − ℓ(x),
(3.3)
ℓ(1) = 0.
Wenden wir (3.1) zweimal auf x · y · z = (x · y) · z an, finden wir (3.4)
ℓ(x · y · z) = ℓ(x) + ℓ(y) + ℓ(z),
und entsprechendes f¨ur√Produkte √ von √ vier oder mehr Faktoren. Desweiteren k¨o√ nnen wir (3.4) auf 3 x · 3 x · 3 x = x anwenden, wir erhalten daraus ℓ( 3 x) = 13 ℓ(x) oder allgemein √ m m m (3.5) ℓ(x n ) = ℓ(x), mit x n = n xm . n Basen. Sei ℓ(x) eine fest vorgegebene logarithmische Funktion. Wir nehmen außerdem an, dass es eine Zahl a gibt, f¨ur die ℓ(a) = 1 ist. Dann wird aus (3.5) m m (3.6) ℓ(a n ) = , n d.h., die logarithmische Funktion ist die Umkehrfunktion der Exponentialfunktion ax . Wir nennen sie den Logarithmus zur Basis a und schreiben (3.7)
y = loga x
falls
x = ay .
Logarithmen zur Basis 10 (Briggsche Logarithmen) sind besonders geeignet f¨ur numerische Berechnungen, da eine Verschiebung des Dezimalkommas schlicht eine ganze Zahl zum Logarithmus hinzuf¨ugt. Die beste Basis f¨ur theoretische Arbeiten ist jedoch, wie wir bald sehen werden, die Eulersche Zahl e (nat¨urlicher Logarithmus, selten auch Neperscher, Napierscher oder hyperbolischer Logarithmus). Dieser Logarithmus wird gew¨ohnlich mit ln x oder log x bezeichnet. Eulers goldene Regel“. Sobald die Logarithmen in einer Basis bekannt sind, ” lassen sich die Logarithmen aller anderen Basen durch eine einfache Division errechnen. Um dies einzusehen, betrachtet man den Logarithmus von x = ay zur Basis b und benutzt (3.7) und (3.5), also (3.8)
logb x = y · logb a
⇒
y = loga x =
logb x . logb a
I.3 Logarithmen und Fl¨achen
33
Berechnung des Logarithmus Man erh¨alt eine große Zahl an Logarithmen dadurch, dass man die Quadratwurzel der Basis a berechnet, dann die Quadratwurzel der Quadratwurzel usw., wobei sich die Logarithmen mittels (3.6) stets halbieren. Produkte der Quadratwurzeln liefern mit (3.1) weitere Logarithmen. Dies ist f¨ur a = 10 in Abb. 3.2 dargestellt. 1,00 Zahlen
Logarithmen
10,0000 7,4989 5,6234 4,2170 3,1623 2,3714 1,7783 1,3335 1,0000
1,0 0,875 0,75 0,625 0,5 0,375 0,25 0,125 0,0
0,75
0,50
0,25
0,00
1 101/4 101/2
103/4
10
ABB. 3.2. Mehrfache Wurzeln von 10 und ihre Produkte
Es bleibt aber ein Problem: Uns w¨urden vielmehr Logarithmen zu Zahlen wie 2, 3, 4, . . . interessieren, als solche zu 4, 2170 oder 2, 3714. Briggs Methode. Man berechne die Wurzel von 10, dann die Wurzel der Wurzel usw., 54 Mal (siehe die Nachbildung in Abb. 3.3). Mit c = 1/254 ergibt dies (3.9a)
10c = 1,00000 00000 00000 12781 91493 20032 35 = 1 + a.
Sodann berechne man auf dieselbe Weise die iterierten Wurzeln von 2: (3.9b)
2c = 1,00000 00000 00000 03847 73979 65583 10 = 1 + b.
Wir wollen den Wert von x = log10 2 berechnen, dieser erf¨ullt 2 = 10x. Folglich gilt (Satz 2.2) (3.9b) (3.9a) 1 + b = 2c = (10c )x = (1 + a)x ≈ 1 + ax und wir finden (3.10)
log10 (2) = x ≈
b 3847739796558310 = ≈ 0,3010299956638812. a 12781914932003235
Damit haben wir gerademal einen Wert. Die Gesamtarbeit, die f¨ur eine umfangreiche Tabelle notwendig ist, u¨ bertrifft jede Vorstellung. 2
Abb. 3.3 mit Erlaubnis der Bibl. Publ. Univ. Gen`eve.
34
I. Einf¨uhrung in die Analysis des Unendlichen
ABB. 3.3. Briggs Berechnung der iterierten Wurzeln von 10, Briggs (1624)2
I.3 Logarithmen und Fl¨achen
35
Interpolation. Ein wichtiges Werkzeug zur schnellen Berechnung von Logarithmen war in der damaligen Zeit die Interpolation. Angenommen, wir haben bereits vier Werte von log10 berechnet. Wir k¨onnen leicht ihr Differenzenschema berechnen: log(44) = 1,6434526765 0,0097598373 0,0095453179
−0,0002145194
0,0093400262
−0,0002052917
log(45) = 1,6532125138 log(46) = 1,6627578317
0,0000092277 .
log(47) = 1,6720978579 Satz 1.2 (mit verschobenen Koordinaten) erlaubt uns, das Interpolationspolynom zu berechnen: p(x) =1,6434526765 + (x − 44) 0,0097598373 (3.11) x − 45 x − 46 + −0,0002145194 + · 0,0000092277 . 2 3 Einige ausgew¨ahlte Werte sind in Tabelle 3.1 mit ihren Abweichungen von den echten Werten wiedergegeben. Trotz der Einfachheit der Rechnung sind die Abweichungen sehr gering. Indem man weitere St¨utzpunkte hinzuf¨ugt, l¨asst sich die Pr¨azision erh¨ohen, falls gew¨unscht. TABELLE 3.1. Abweichungen vom Interpolationspolynom x 44,25 44,50 44,75 45,25 45,50 45,75 46,25 46,50 46,75
p(x) 1,645913252 1,648359987 1,650793026 1,655618594 1,658011411 1,660391109 1,665111724 1,667452930 1,669781593
log10 (x) 1,645913275 1,648360011 1,650793040 1,655618584 1,658011397 1,660391098 1,665111737 1,667452953 1,669781615
Differenz 2,34 · 10−8 2,42 · 10−8 1,35 · 10−8 −1,05 · 10−8 −1,43 · 10−8 −1,04 · 10−8 1,32 · 10−8 2,34 · 10−8 2,24 · 10−8
Bevor wir mit dem Logarithmenkalk¨ul fortfahren, f¨ugen wir einen kurzen Exkurs in die Geometrie ein.
Berechnung von Fl¨achen Die Bestimmung von Fl¨achen und Volumina fasziniert Mathematiker seit der griechischen Antike. Zwei der gr¨oßten Errungenschaften von Archimedes (283– 212 v. Chr.) waren die Berechnungen der Fl¨achen der Parabel und des Kreises. Im
36
I. Einf¨uhrung in die Analysis des Unendlichen
fr¨uhen 17ten Jahrhundert trat dann die Berechnung von Fl¨achen unter Kurven der Form y = xa ins Rampenlicht, sowohl f¨ur ganze Zahlen a als auch f¨ur beliebige (Bonaventura Cavalieri, Roberval, Fermat). Problem. Sei a gegeben. Man bestimme die Fl¨ache unter der Kurve y = xa zwischen den Schranken x = 0 und x = B.
y = x1/3
ABB. 3.4a. Fermat 1601–1655
Ba θaBa θ2aBa θ2B θB B
ABB. 3.4b. Fermats Berechnung der Fl¨ache unter xa
L¨osung (Fermat 1636). Wir w¨ahlen ein θ, das nahe an, aber kleiner als 1 ist, und betrachten die Rechtecke, die von der geometrischen Folge B, θB, θ2 B, θ 3 B, . . . (Abb. 3.4b) herr¨uhren, mit ihren H¨ohen B a , θa B a , θ2a B a , θ3a B a , . . . . Dann kann die gesuchte Fl¨ache ann¨ahernd durch eine geometrische Reihe berechnet werden, erstes Rechteck + zweites Rechteck + drittes Rechteck + . . . (3.12)
= B(1 − θ)B a + B(θ − θ2 )θa B a + B(θ2 − θ3 )θ2a B a + . . . 1−θ = B a+1 (1 − θ) 1 + θa+1 + θ2a+2 + . . . = B a+1 , 1 − θa+1 | {z } geometrische Reihe
solange nur a + 1 > 0 bzw. a > −1 gilt (siehe Gl. (2.12)). Sei nun θ = 1 − ε mit kleinem ε. Dann ist 1 − θ = ε, θa+1 = 1 − (a + 1)ε + . . . nach Satz 2.2. Wir finden 1−θ ε 1 ≈ = f¨ur ε → 0. a+1 1−θ (a + 1)ε a+1 Die Summe der Rechtecke (3.12) approximiert die Fl¨ache S von oben (f¨ur a > −1). Wenn wir nun die H¨ohen der Rechtecke durch θa B a , θ2a B a , . . . ersetzen, erhalten wir eine Approximation von S von unten. In diesem Fall wird der Wert (3.12) schlicht mit θa multipliziert, was f¨ur θ → 1 gegen 1 strebt. Damit m¨ussen beide N¨aherungen gegen denselben Wert streben, wir erhalten das folgende Resultat. (3.2) Satz (Fermat 1636). Die Fl¨ache unter der Kurve y = xa zwischen den Schranken x = 0 und x = B ist gegeben durch S=
B a+1 a+1
falls
a > −1.
⊓ ⊔
I.3 Logarithmen und Fl¨achen
37
Fl¨ache unter der Hyperbel und nat¨urlicher Logarithmus Im Monat September 1668 ver¨offentlichte Mercator seine Logarithmotechnia, welche ein Beispiel dieser Methode (d.h. der unendlichen Reihen) f¨ur einen einzigen Fall beinhaltet, n¨amlich die Quadratur der Hyperbel. (Brief an Collins, 26. Juli 1672)
Fermats Methode l¨asst sich nicht auf die Hyperbel y = 1/x anwenden. Tats¨achlich wird aus der geometrischen Folge der Abszissen B, θB, θ2 B, θ3 B, . . . die Summe (1 − θ)(1 + 1 + 1 + . . .) f¨ur die Fl¨achen, deren Partialsummen eine arithmetische Folge beschreiben. Dies motivierte die folgende Entdeckung von Gr´egoire de Saint-Vincent im Jahr 1647 und Alfons Antonius de Sarasa im Jahr 1649 (siehe Kline 1972, S. 354): Die Fl¨ache unter der Hyperbel y = 1/x ist ein Logarithmus (siehe Abb. 3.5).
ABB. 3.5. Die Fl¨ache unter der Hyperbel ist ein Logarithmus
Durch Kontraktion der x-Koordinaten und Strecken der y-Koordinaten stellen wir fest, dass beispielsweise Fl¨ache (3 → 6) = Fl¨ache (1 → 2). Damit haben wir Fl¨ache (1 → 3) + Fl¨ache (1 → 2) = Fl¨ache (1 → 6). Dies bedeutet, dass die Funktion ln(a) = Fl¨ache (1 → a) die Identit¨at ln(a) + ln(b) = ln(a · b) erf¨ullt und folglich ein Logarithmus ist (der nat¨urliche“ Logarithmus). ” Die Mercator-Reihe. Wenn wir den Ursprung um 1 verschieben, sehen wir, dass ln(1 + a) die Fl¨ache unter 1/(1 + x) zwischen 0 und a ist. Wir ersetzen 1/(1 + x) = 1 − x + x2 − x3 + . . . mittels Formel (2.12) und f¨ugen f¨ur die Fl¨achen unter 1, x, x2 , . . . zwischen 0 und a die Ausdr¨ucke aus Satz 3.2 ein: a2 a3 a4 , , , ... 2 3 4 (siehe Abb. 3.6). Auf diese Weise finden wir, wenn wir noch a durch x ersetzen (N. Mercator 1668) a,
(3.13) 3
ln(1 + x) = x −
x2 x3 x4 x5 + − + − +.... 2 3 4 5
Fermats Portr¨at, abgebildet mit Genehmigung der Bibl. Math. Univ. Gen`eve.
38
I. Einf¨uhrung in die Analysis des Unendlichen
ABB. 3.6. Integration der geometrischen Reihe Term f¨ur Term
Die Konvergenz dieser Reihe ist f¨ur verschiedene Werte von x in Abb. 3.7 zu sehen. Mit dem Wert x = 1 wird die Reihe zu (3.13a)
ln 2 = 1 −
1 1 1 1 1 + − + − + −..., 2 3 4 5 6
einer wundersch¨onen Formel von begrenztem Nutzen (siehe Tabelle 3.1). F¨ur noch gr¨oßere Werte von x konvergiert die Reihe u¨ berhaupt nicht mehr.
N=1
1
3
ln (1 + x)
N=2 0
−1
1 4
−1 N = 10
ABB. 3.7. Konvergenz von x −
x2 2
+
x3 3
−
x4 4
+ ...±
xN N
gegen ln(1 + x)
I.3 Logarithmen und Fl¨achen
39
Die Gregorysche Reihe. Wir ersetzen in (3.13) die Unbekannte x durch −x: x2 x3 x4 x5 − − − − ... 2 3 4 5 und ziehen diese Gleichung von (3.13) ab. Dies liefert (Gregory 1668) (3.14)
(3.15)
ln(1 − x) = −x −
ln
1+x x3 x5 x7 x9 =2 x+ + + + +... . 1−x 3 5 7 9
Beispiele. Setzen wir x = 1/2 in (3.14) und x = 1/3 in (3.15) ein, so erhalten wir die folgenden zwei Reihen f¨ur ln 2: 1 1 1 1 (3.14a) ln 2 = + + + +... 2 3 2 2·2 3·2 4 · 24 1 1 1 1 (3.15a) ln 2 = 2 + + + + . . . . 3 3 · 33 5 · 3 5 7 · 37 Tabelle 3.2 stellt die G¨ute der Konvergenz gegen ln 2 der drei Reihen (3.13a), (3.14a) und (3.15a) einander gegen¨uber. Es ist offensichtlich, welche Reihe die beste ist. TABELLE 3.2. Konvergenz der Reihen f¨ur ln 2 n 1 2 3 4 5 6 7 8 9 10 11 12
(3.13a) 1,000 0,500 0,833 0,583 0,783 0,617 0,760 0,635 0,746 0,646 0,737 0,653
(3.14a) 0,500 0,625 0,667 0,6823 0,6885 0,6911 0,69226 0,69275 0,69297 0,693065 0,693109 0,693130
(3.15a) 0,667 0,6914 0,69300 0,693135 0,6931460 0,69314707 0,693147170 0,6931471795 0,693147180559 0,6931471805498 0,6931471805589 0,69314718055984
Berechnung von ln p fur ¨ Primzahlen ≥ 3. Nutzt man (3.1), so reicht es aus, die Logarithmen der Primzahlen zu kennen. Die Logarithmen zusammengesetzter ganzer Zahlen und rationaler Zahlen erh¨alt man sodann u¨ ber Addition und Subtraktion. Will man den Logarithmus einer Primzahl p berechnen, so teilt man p durch eine Zahl in ihrer N¨ahe, deren Logarithmus bereits bekannt ist. Dann kann man einen kleinen Wert f¨ur x in Reihe (3.15) einsetzen, die sehr schnell konvergiert. Zum Beispiel k¨onnen wir f¨ur p = 3 ansetzen: 3 3 1+x 1 3 = · 2, = ⇔ x= , 2 2 1−x 5 so dass gilt (3.16)
ln 3 = ln
1+ 3 + ln 2 = ln 2 1−
1 5 1 5
+ ln 2.
40
I. Einf¨uhrung in die Analysis des Unendlichen
Eine Alternative bildet 3 = (3/4) · 4, was zu (3.17)
ln 3 = 2 ln 2 − ln
1+ 1−
1 7 1 7
f¨uhrt. Noch besser ist, man benutzt das geometrische Mittel der obigen Ausdr¨ucke: r 1 9 √ 3 1 1 + 17 3= · 8 ⇒ ln 3 = ln 2 + ln 1 8 2 2 1 − 17 r 1 25 √ 3 1 1 1 + 49 (3.18) 5= · 24 ⇒ ln 5 = ln 2 + ln 3 + ln 1 24 2 2 2 1 − 49 r 1 49 √ 1 1 1 + 97 7= · 48 ⇒ ln 7 = 2 ln 2 + ln 3 + ln , 1 48 2 2 1 − 97 und so weiter. Je gr¨oßer p ist, desto schneller konvergiert Reihe (3.15). Die ersten Werte, die man auf diese Weise erh¨alt, lauten: ln(1) = 0,000000000000000000000000000000 ln(2) = 0,693147180559945309417232121458 ln(3) = 1,098612288668109691395245236923 ln(4) = 1,386294361119890618834464242916 ln(5) = 1,609437912434100374600759333226 ln(6) = 1,791759469228055000812477358381 ln(7) = 1,945910149055313305105352743443 ln(8) = 2,079441541679835928251696364375 ln(9) = 2,197224577336219382790490473845 ln(10) = 2,302585092994045684017991454684 . Diese eindrucksvolle Verfeinerung des Rechenverfahrens seit Briggs wurde in nur wenigen Jahrzehnten (zwischen 1620 und 1670) erarbeitet. Sie verdeutlicht wieder einmal den enormen Fortschritt, der in der Mathematik durch das Erscheinen von Descartes’ La G´eom´etrie“ ausgel¨ost wurde. ” Zusammenhang zur Eulerschen Zahl. Der Zusammenhang zwischen e und dem nat¨urlichen Logarithmus (in seiner Definition als Fl¨ache unter der Hyperbel) wird durch folgenden Satz hergestellt. (3.3) Satz. Der nat¨urliche Logarithmus ln x ist der Logarithmus zur Basis e. Beweis. Wir wenden den nat¨urlichen Logarithmus auf die Formel aus Satz 2.3 an. Zusammen mit (3.5) und (3.13) ergibt dies x x N x x2 ln 1 + = N · ln 1 + =N· − + . . . → x, 2 N N N 2N
so dass ln ex = x sein muss.
⊓ ⊔
I.3 Logarithmen und Fl¨achen
41
Dies liefert uns eine geometrische Interpretation von e: Die Eulersche Zahl ist diejenige Zahl e, f¨ur die die Fl¨ache unter der Hyperbel y = 1/x zwischen 1 und e gerade 1 ist (siehe Abb. 3.8). y = 1/x 1
1 0
1
2
e = 2,71828 . . .
ABB. 3.8. Geometrische Bedeutung von e
4
4 3x
10x 3
3
y = x3 y = x2 y=x
2
-x
e
1
e
2x
1 y = 1/x3
0
2
x
0
1
y = 1/x
2
3
4 −2 a
ABB. 3.9a. Funktionen y = x
−1
0 0
1
ABB. 3.9b. Funktionen y = a
2 x
Beliebige Potenzen. Logarithmen erlauben es uns, beliebige Potenzen wie folgt zu berechnen (und zu definieren) (Joh. Bernoulli 1697, Principia Calculi Exponentialium, Opera, Band I, S. 179): Wir nutzen a = eln a und erhalten (3.19)
ab = (eln a )b = eb ln a .
Graphen der Funktionen (3.19), sei es als Funktionen von a oder als Funktionen von b, sind in den Abbildungen 3.9a und 3.9b dargestellt.
42
I. Einf¨uhrung in die Analysis des Unendlichen
¨ Ubungen 3.1 (Newton 1671, Method of Fluxions, Euler 1748, Introductio, §123). Zeige dass man aus 2 = (4/3) · (3/2) erh¨alt: 1 + 15 1 + 17 1 + 15 ln 2 = ln + ln , ln 3 = ln + ln 2, 1 − 15 1 − 17 1 − 15 was eine gleichzeitige Berechnung von ln 2 und ln 3 mittels der schnell konvergierenden Reihe (3.15) erlaubt. 3.2 (Newton 1669, Inventio Basis ex Area data). Angenommen, die Fl¨ache z unter der Hyperbel ist gegeben durch die Formel z = x − 12 x2 + 13 x3 − 14 x4 + 15 x5 − . . . . Finden Sie eine Reihenentwicklung von x = ez − 1 von der Form x = z + a2 z 2 + a3 z 3 + a4 z 4 + . . . und (re)konstruieren Sie damit die Reihe der Exponentialfunktion.
I.4 Trigonometrische Funktionen
43
I.4 Trigonometrische Funktionen Sybil: Es geht zur¨uck auf die Anf¨ange der Zivilisation. (J. Cleese & C. Booth 1979, Fawlty Towers, The Psychiatrists)
Winkelmessung. Eine der a¨ ltesten Anwendungen der Geometrie ist die Bestimmung von Winkeln, insbesondere f¨ur astronomische Zwecke. Die Babylonier teilten daf¨ur den Kreis in 360◦, wahrscheinlich weil dies die ungef¨ahre Zahl an Tagen im Jahr ist. Ein halber Kreis entspricht dann 180◦ , ein rechter Winkel 90◦ , und das gleichseitige ebene Dreieck hat 60◦ -Winkel (siehe Abb. 4.1a). Ptolem¨aus4 , verfeinerte im Jahr 150 in seinem Almagest die Winkelmessungen, indem er die n¨achste Ziffer des damals aktuellen Zahlensystems in Basis 60 einbezog, partes minutae primae (erste kleine Unterteilungen) und partes minutae secondae (zweite kleine Unterteilungen). Aus ihnen entwickelten sich unsere Minuten“ ” und Sekunden“. Doch gibt es noch andere Systeme als die 360◦-Zerlegung. Viele ” andere Einheiten k¨onnen benutzt werden, beispielsweise wird in einigen technischen Anwendungen in einem System gerechnet, in dem ein rechter Winkel aus 100 Gon“ besteht. Wie im Fall der Logarithmen gibt es jedoch auch hier ein ” nat¨urliches Maß, das auf der Bogenl¨ange eines Kreises vom Radius 1 basiert, das Bogenmaß (siehe Abb. 4.1b). Dabei ist die Bogenl¨ange eines Halbkreises, geschrieben in der Genauigkeit, die von Th. F. de Lagny im Jahr 1719 angegeben und von Euler reproduziert wurde (mit einem Fehler an der 113ten Dezimalstelle, der hier korrigiert ist), 3,14159265358979323846264338327950288419716939937510 58209749445923078164062862089986280348253421170679 821480865132823066470938446 . . . . F¨ur diesen etwas unhandlichen Ausdruck pr¨agte W. Jones (1706, S. 243) die Abk¨urzung π ( periphery“, zu deutsch: Umfang“). Dann betr¨agt das Bogenmaß ” ” des Winkels von 54◦ aus Abb. 4.1 gerade 54π/180 = 0,9425 rad ( Radiant“). ” 120 130 140 150
110 100
90 80 70
60
2π/3 3π/4
50
π/3
π/2
1
π/4
40 30
160
π/6
20
170 180
2
−1
0
α
ABB. 4.1a. Babylonische Grade
10
1
0
3 π
−1
0
α
1
0
ABB. 4.1b. Bogenl¨ange als Winkelmaß
Definition der trigonometrischen Funktionen. Wie kann man die Gr¨oße eines Winkels messen, wenn man nur u¨ ber ein gerades Lineal verf¨ugt? Nun, man kann lediglich die Sehne vermessen (siehe Abb. 4.2) und dann mit Hilfe von Tabellen 4
= Πτ oλεµα˜ιoς, Ptolemeus, Ptolemy, Ptolem´ee, Tolomeo, Ptolemei˘ , . . . .
44
I. Einf¨uhrung in die Analysis des Unendlichen
auf den Winkel schließen, oder umgekehrt. Solche Tabellen haben ihren Ursprung in der griechischen Antike (Hipparch 150 v. Chr. (verloren gegangen) und Ptolem¨aus 150 n. Chr.). Die Sinusfunktion, die mit der Sehnenfunktion (engl. chord“) u¨ ber sin α = (1/2) chord (2α) eng verwandt ist, stammt aus Indien ” (Brahmagupta um 630) und der europ¨aisch-mittelalterlichen Wissenschaft (Regiomontanus 1464). Sie hieß urspr¨unglich sinus rectus (also senkrechter Sinus) und eignet sich wesentlich besser f¨ur Berechnungen am Dreieck als die Sehnenfunktion.
1
1
1
cos α
α
tan α
sin α
cot α
chord α
1
x
α
0
0
1
ABB. 4.2. Ptolem¨aus’ Sehnenfunktion
1
ABB. 4.3. Definition von sin, cos, tan und cot
(4.1) Definition. Wir betrachten ein rechtwinkliges Dreieck in einem Kreis vom Radius 1, wie in Abb. 4.3 positioniert. Dann wird die L¨ange der Seite gegen¨uber dem Winkel α mit sin α bezeichnet, die der anliegenden Seite mit cos α. Ihre Verh¨altnisse, die zugleich die L¨angen der senkrechten und waagerechten Tangenten an den Kreis sind, notieren wir mit tan α =
sin α cos α
und
cot α =
cos α . sin α
Diese Definitionen lassen sich unmittelbar auf beliebige rechtwinklige Dreiecke anwenden: F¨ur eine Hypotenuse c, Ankathete b und Gegenkathete a (d.h. a liegt dem Winkel α und c dem rechten Winkel gegen¨uber) finden wir: (4.1)
a = c · sin α,
b = c · cos α,
a = b · tan α.
Obwohl in der Geometrie Winkel u¨ blicherweise mit kleinen griechischen Buchstaben notiert werden, wollen wir, sobald wir zum Bogenmaß wechseln und Funktionen einer reellen Variablen betrachten (siehe Funktionsgraphen in Abb. 4.4), kleine lateinische Buchstaben (wie z.B. x) als Argument bevorzugen. Viele Formeln lassen sich bereits als Spezialf¨alle aus Abb. 4.3 ableiten, wie sin 0 = 0, cos 0 = 1, sin π/2 = 1, cos π/2 = 0, sin π = 0, cos π = −1, (4.2a) (4.2b)
sin(−x) = − sin x,
sin(x + π) = − sin x,
cos(−x) = cos x cos(x + π) = − cos x
I.4 Trigonometrische Funktionen
(4.2c) (4.2d)
45
sin(x + π/2) = cos x, cos(x + π/2) = − sin x 2 2 sin x + cos x = 1.
Die Funktionen sin x und cos x sind periodisch mit Periode 2π, tan x ist periodisch mit Periode π. 2
cos x
sin x
1
−π/2
0
y=x
tan x
π/2
π
3π/2
2π
5π/2
3π
−1 −2
ABB. 4.4. Die trigonometrischen Funktionen sin x, cos x und tan x
Abb. 4.5 zeigt die Zeichnung einer Sinuskurve aus Seite 17 von A. D¨urers Underweysung der Messung (1525). D¨urer nannte diese Kurve eynn schraufen ” lini“ und behauptet, dass sie sich f¨ur Steinmetze eignet, die Wendeltreppen anlegen wollen.
ABB. 4.5. Eine Sinuskurve bei D¨urer (1525)2
Seltsame geometrische Muster erscheinen, wenn man sin n nur an ganzen Zahlen n auswertet (Abb. 4.6, siehe Strang 1991, Richert 1992).
2
Abbildung mit Erlaubnis des Dr. Alfons Uhl Verlag, N¨ordlingen.
46
I. Einf¨uhrung in die Analysis des Unendlichen
1
0 0 10
101
102
103
−1
ABB. 4.6. Werte von sin 1, sin 2, sin 3, . . . mit n in logarithmischer Skala
Grundlegende Beziehungen und Folgerungen Die Gleichungen . . . haben . . . ein ehrw¨urdiges Alter. Schon Ptolem¨aus leitet . . . (L. Vietoris 1949, J. reine ang. Math., Band 186, S. 1)
Seien α und β zwei Winkel mit Bogenmaß x bzw. y. (4.2) Satz (Ptolem¨aus 150 n. Chr., Regiomontanus 1464). (4.3) (4.4)
sin(x + y) = sin x cos y + cos x sin y cos(x + y) = cos x cos y − sin x sin y.
Beweis. Diese Zusammenh¨ange sieht man sofort f¨ur 0 ≤ x, y ≤ π/2, wenn man die drei rechtwinkligen Dreiecke in Abb. 4.7 n¨aher untersucht. Alle anderen Kombinationen f¨ur x und y kann man mit den Formeln (4.2b) und (4.2c) auf diesen Fall reduzieren. ⊓ ⊔ sin β cos α
α
sin β sin β sin α
1 cos β sin α cos β β α 0
cos β cos α
1
ABB. 4.7. Beweis der Formeln (4.3) und (4.4)
I.4 Trigonometrische Funktionen
47
Indem man die Gleichung (4.3) durch Gl. (4.4) teilt, erh¨alt man (4.5)
tan(x + y) =
sin x cos y + cos x sin y tan x + tan y = . cos x cos y − sin x sin y 1 − tan x tan y
Weitere Formeln. Ersetzen wir y in (4.3) und (4.4) durch −y, erhalten wir (4.3′ ) (4.4′ )
sin(x − y) = sin x cos y − cos x sin y cos(x − y) = cos x cos y + sin x sin y.
Addieren wir nun die Gleichungen (4.3) und (4.3′ ), liefert dies uns sin(x + y) + sin(x − y) = 2 · sin x cos y. Schließlich f¨uhren wir neue Variablen anstelle von x + y und x − y ein, n¨amlich x+y =u x−y =v
also
x = (u + v)/2 y = (u − v)/2,
mit der ersten der folgenden drei Formeln als Ergebnis: u + v u − v (4.6) sin u + sin v = 2 · sin · cos 2 2 u + v u − v (4.7) cos u + cos v = 2 · cos · cos 2 2 u + v u − v (4.8) cos v − cos u = 2 · sin · sin . 2 2 Die anderen leitet man a¨ hnlich her. Der Spezialfall x = y f¨uhrt in (4.3) und (4.4) zu (4.9)
sin(2x) = 2 sin x cos x
(4.10)
cos(2x) = cos2 x − sin2 x = 1 − 2 sin2 x = 2 cos2 x − 1.
Ersetzen wir nun x durch x/2 in (4.10), finden wir r r x x 1 − cos x 1 + cos x (4.11) sin =± , cos =± . 2 2 2 2 Einige Werte von sin und cos. Die Verh¨altnisse im gleichseitigen Dreieck und im Quadrat erlauben uns direkt die Werte von sin und cos f¨ur die Winkel 30◦ , 60◦ und 45◦ zu berechnen. F¨ur das C regelm¨aßige F¨unfeck betrachten wir die nebenstehende Abbildung (Hippasos 450 v. Chr.): Die Dreiecke ACE und AEF sind sich a¨ hnlich, √ wir haben 1 + 1/x = x und daher x = (1 + 5)/2, d.h. die Diagonale CA wird vom Punkt F im goldenen Schnitt geteilt (siehe Euklid, Elemente, Band XIII, §8); damit haben wir sin 18◦ = 1/(2x).
B
1
1/x
F x x
1 18˚ 18˚ 1 36˚ 36˚
D
E
A
48
I. Einf¨uhrung in die Analysis des Unendlichen
TABELLE 4.1. Spezielle Werte von sin, cos und tan
α
Bogenmaß
0◦
0
◦
π/12
18◦
π/10
30◦
π/6
36◦
π/5
45◦
π/4
60◦
π/3
75◦
5π/12
90◦
π/2
15
sin α
cos α
0
1
√ √ 2 4 ( 3− √ 5−1 4
1)
√ √ 2 4 ( 3 1 2
1 1 2
q2
√ 5− 5 2 √ 2 2 √ 3 2
√ √ 2 4 ( 3
+ 1)
q
+ 1)
√ 5+ 5 2 √ 3 2 √ 5+1 4 √ 2 2
1 2 √ √ 2 ( 3 4
1
− 1)
tan α 0 √ 2− 3 √ √
√ (3 5−5) 5+ 5 √ 10 2 √ 3 √ √3 √ 5− 5( 5−1) √ 2 2
1 √ 3 √ 2+ 3 ∞
0
Tabelle 4.1 ist eine Liste aller auf diese Weise erhaltenen Werte. F¨ur eine vollst¨andige Liste von sin α f¨ur α = 3◦ , 6◦ , 9◦ , 12◦ . . . siehe Lambert (1770c). Formeln von de Moivre. Wenn wir in (4.3) und (4.4) y durch nx ersetzen, erhalten wir die rekursiven Formeln (4.12) sin (n + 1)x = sin x cos nx + cos x sin nx, (4.13) cos (n + 1)x = cos x cos nx − sin x sin nx. Beginnen wir mit (4.9) und (4.10) und wenden (4.12) und (4.13) mehrfach an, finden wir cos(3x) = cos3 x sin(3x) =
3 sin x cos2 x
cos(4x) = cos4 x sin(4x) =
− sin3 x
− 6 sin2 x cos2 x
4 sin x cos3 x
cos(5x) = cos5 x sin(5x) =
− 3 sin2 x cos x
− 4 sin3 x cos x
− 10 sin2 x cos3 x
5 sin x cos4 x
+ sin4 x + 5 sin4 x cos x
− 10 sin3 x cos2 x
+ sin5 x.
Uns f¨allt dabei auf, dass das Pascalsche Dreieck wieder auftaucht; die Begr¨undung hierf¨ur ist genau dieselbe wie in Abschnitt I.2 (Satz 2.1). Hieraus folgern wir die allgemeinen Formeln (gefunden von de Moivre 1730, siehe Euler 1748, Introductio, §133):
I.4 Trigonometrische Funktionen
49
n(n − 1) 2 sin x cosn−2 x 1·2 n(n − 1)(n − 2)(n − 3) + sin4 x cosn−4 x − . . . 1·2·3·4 n(n − 1)(n − 2) sin nx = n sin x cosn−1 x − sin3 x cosn−3 x 1·2·3 n(n − 1)(n − 2)(n − 3)(n − 4) 5 + sin x cosn−5 x − . . . 1·2·3·4·5
cos nx = cosn x − (4.14)
Reihenentwicklungen Sit arcus z infinite parvus; erit sin z = z et cos z = 1; . . . (Euler 1748, Introductio, §134)
W¨ahrend s¨amtliche bisherige Formeln (4.5) bis (4.14) nur unter Einsatz von (4.3) und (4.4) sowie (4.2a) hergeleitet wurden, ben¨otigen wir nun eine weitere grundlegende Annahme: Wenn x gegen Null strebt, so n¨ahert sich der sinus rectus“ ” seinem Kreisbogenabschnitt an. Da wir Winkel in Bogenmaß messen, folgt daraus: Je n¨aher x an Null ist, desto besser wird sin x von x approximiert. Wir notieren dies als (4.15)
sin x ≈ x
f¨ur x → 0.
Nun wenden wir dieselbe Idee an, die wir schon im Beweis der Gleichungen (2.18) und (2.19) eingesetzt haben: Wir setzen x = y/N , n = N in den Formeln (4.14) von de Moivre ein, wobei y ein fester Wert ist, w¨ahrend N gegen unendlich und x gegen Null streben. Aufgrund von (4.15) k¨onnen wir nun sin x durch x und cos x durch 1 ersetzen. Da N → ∞ strebt, werden auch alle Terme (1 − k/N ) gegen 1 streben. Ersetzen wir schließlich y durch x, f¨uhrt uns dies zu den folgenden Formeln (Newton 1669, Leibniz 1691, Jak. Bernoulli 1702): (4.16) (4.17)
x2 x4 x6 x8 + − + −... 2! 4! 6! 8! x3 x5 x7 x9 sin x = x − + − + −... . 3! 5! 7! 9!
cos x = 1 −
¨ Newtons Herleitung dieser Reihen wird in Ubung 4.1 skizziert; der obige Beweis stammt von Jak. Bernoulli und Eulers Introductio, §134.
Bemerkung. Es bedarf eigentlich einer gr¨oßeren Sorgfalt, wenn wir cos(y/N ) f¨ur große N durch 1 ersetzen wollen, da dieser Ausdruck in der N -ten Potenz auftritt. Beispielsweise strebt zwar 1 + y/N gegen 1 f¨ur N → ∞, nicht jedoch (1 + y/N )N (siehe Satz 2.3). Die Rettung kommt hier aus der Tatsache, dass cos(y/N ) schneller gegen 1 strebt als 1 + y/N . Genauer gesagt gilt
50
I. Einf¨uhrung in die Analysis des Unendlichen
N/2 1 y2 cosN (y/N ) = 1 − sin2 (y/N ) ≈1− →1 2 N
nach (4.2d), Satz 2.2 und (4.15).
Die Konvergenz der Reihen (4.16) und (4.17) wird in Abb. 4.8 demonstriert. Sie konvergieren offenbar f¨ur alle x (siehe Abschnitt III.7). Man sieht sehr deutlich, wie ab etwa x = 15 numerische Probleme aufgrund von Rundungsfehlern auftreten (die Berechnungen wurden hierf¨ur absichtlich nur mit 32 Bit-Zahlen durchgef¨uhrt). 3 2
y = sinx
1
5
9
13
17
21
25
29
33
37
41
45
1 0
5
−1
10
15
−2 −3 3 2
3
y = cosx
7 4
11 8
15
12
19
16
23
20
27 24
31
28
35
32
39
36
43 40
44
1 0
5
−1
10
15
−2 2
−3
6
10
14
ABB. 4.8. Die Reihen sin x = x −
18 3
x 3!
+
22 5
x 5!
26
30
− . . . und cos x = 1 −
34 2
x 2!
38
+
4
x 4!
42
−...
Die Reihen von tan x. Wir setzen y = tan x =
sin x = a1 x + a3 x3 + a5 x5 + a7 x7 + . . . . cos x
Um a1 , a3 , a5 , . . . zu bestimmen, multiplizieren wir diese Formel mit cos x und benutzen die bekannten Reihen (4.16) und (4.17): x3 x5 x2 x4 x− + − . . . = a1 x + a3 x3 + a5 x5 + . . . 1 − + − ... . 6 120 2 24 Vergleichen wir die Koeffizienten von x, x3 und x5 , erhalten wir 1 = a1 ,
−
1 a1 = − + a3 , 6 2
1 a1 a3 = − + a5 , 120 24 2
und damit a1 = 1,
1 1 1 a3 = − + = , 6 2 3
a5 =
1 1 1 2 − + = . 120 24 6 15
I.4 Trigonometrische Funktionen
51
Wenn wir hiermit fortfahren, finden wir die Reihe (4.18) tan x = x +
x3 2 x5 17 x7 62 x9 1382 x11 21844 x13 + + + + + +... . 3 15 315 2835 155925 6081075
Man sieht zun¨achst keine allgemeine Regel in den Koeffizienten. Es gibt aber ¨ eine, und diese basiert auf den Bernoulli-Zahlen (1.29) (siehe Ubung 10.2 aus Abschnitt II.10). Antike Berechnungen und Tabellen. Aus den Werten der Tabelle 4.1, die bereits seit der Antike bekannt sind, k¨onnen wir mit Hilfe von (4.3′ ) und (4.4′ ) die Werte von sin 3◦ , cos 3◦ oder, wie es damals u¨ blich war, chord 6◦ bestimmen. Die Formeln (4.11) f¨ur Winkelhalbierung erlaubt uns dann die Berechnung von ◦ ◦ chord 3◦ , chord 1 21 , chord 34 , jedoch nicht von chord 1◦ . Ptolem¨aus bemerkte, ◦ 3◦ dass chord 4 ungef¨ahr die H¨alfte ist von chord 1 21 . Damit liegt die Vermutung ◦ nahe, dass chord 1◦ = 23 · chord 1 12 , womit sich in Basis 60 ergibt (siehe Aaboe 1964, S. 121): (4.19) chord 1◦ = 0; 1, 2, 50 (richtiger Wert: 0; 1, 2, 49, 51, 48, 0, 25, 27, 22, . . .). Aus (4.14) k¨onnen wir hiermit die Werte des Sinus und Cosinus f¨ur alle Winkel 2◦ , 3◦ , 4◦ usw. berechnen. Etwa um 1464 stellte Regiomontanus eine Tabelle auf ( SEQVITVR NVNC EIVSDEM IOANNIS Regiomontani tabula sinuum, per ” singula minuta extensa . . .“), in der er den Sinus aller Winkel in Schritten von einer Winkelminute angibt, bis auf f¨unf Dezimalstellen genau; siehe Abb. 4.9 f¨ur eine von ihm handgeschriebene Tabelle von tan x (¨ublicherweise mit vier korrekten Dezimalstellen). Eine besonders genaue Berechnung von sin 1◦ wurde von Al-K¯ash¯ı (Samarkand in 1429) durchgef¨uhrt, indem er numerisch die aus Gl. (1.9) folgende Gleichung (4.20)
−4x3 + 3x = sin 3◦
l¨oste, dabei nutzte er eine iterative Methode und gab die L¨osung in Basis 60 an ( Wir gewannen sie mit inspirierter Kraft der Ewigen Pr¨asenz . . .“, siehe A. Aaboe ” 1954) sin 1◦ = 0; 1, 2, 49, 43, 11, 14, 44, 16, 19, 16 . . . . Hier ist nun der wahre Wert in Basis 60, berechnet von einem modernen Computer: sin 1◦ = 0; 1, 2, 49, 43, 11, 14, 44, 16, 26, 18, 28, 49, 20, 26, 50, 41, . . . .
52
I. Einf¨uhrung in die Analysis des Unendlichen
ABB. 4.9. Regiomontanus’ Originaltabelle von tan α (siehe Kaunzner 1980)3
Ein weiteres Mal sehen wir den enormen Fortschritt der Reihenmethode (4.17), aus der wir sin 1◦ = sin(π/180) = sin(0,0174532925 . . .) bereits mit nur drei Termen auf sin 1◦ ≈ 0,0174532925199 − 0,0000008860962 + 0,000000000013496 ≈ 0,0174524064373 .
bestimmen k¨onnen.
Arkusfunktionen Die trigonometrischen Funktionen definieren sin x, cos x und tan x f¨ur einen vorgegebenen Bogen x. Die inversen trigonometrischen Funktionen liefern den Bogen x als Funktion von sin x, cos x oder tan x, und heißen deshalb Arkus” funktionen“. 1
1 1 0
x
arcsin x 1
0
1 1
arccos x
x
1
1
x arctan x
0
ABB. 4.10. Definition von arcsin x, arccos x und arctan x
3
Abbildung mit Genehmigung der N¨urnberger Stadtbibliothek, Cent V, 63, f. 30r .
1
I.4 Trigonometrische Funktionen
53
(4.3) Definition. Wir betrachten ein rechtwinkliges Dreieck mit Hypotenuse 1. Sei x die L¨ange der dem Winkel gegen¨uberliegende Seite, so ist arcsin x die L¨ange des zugeh¨origen Bogens (siehe Abb. 4.10a). Die Werte arccos x und arctan x werden a¨ hnlich definiert (Abbildungen 4.10b und 4.10c). Aufgrund der Periodizit¨at der trigonometrischen Funktionen besitzen die Arkusfunktionen mehrere m¨ogliche Funktionswerte. Die sogenannten Haupt¨aste erf¨ullen dabei die folgenden Ungleichungen: y = arcsin x y = arccos x y = arctan x
⇔ ⇔
⇔
x = sin y x = cos y x = tan y
f¨ur − 1 ≤ x ≤ 1, −π/2 ≤ y ≤ π/2, f¨ur − 1 ≤ x ≤ 1, 0 ≤ y ≤ π,
f¨ur − ∞ < x < ∞, −π/2 < y < π/2.
Reihen fur ¨ arctan x. Es ist aber guth, dass wann man etwas w¨urklich exhibiret, ma entweder keine demonstration gebe, oder eine solche, dadurch sie uns nicht hinter die schliche kommen. (Brief von Leibniz; zitiert aus Eulers Opera Omnia, Band 27, S. xxvii)
Die Reihe des Arkustangens wurde von Gregory im Jahr 1671 entdeckt. 1674 fand Leibniz sie ein zweites Mal und ver¨offentlichte sie 1682 in den Acta Eruditorum, schw¨armend u¨ ber die Weisheit Gottes, doch ohne Herleitung (siehe Zitat). Wir suchen daher die Inspiration in Newtons Behandlung der Reihe von arcsin x in seinem Manuskript De Analysi, das er 1669 schrieb, das aber erst 40 Jahre sp¨ater ver¨offentlicht wurde (siehe Formel (4.25) unten). Man kann entweder die Bogenl¨ange oder die Fl¨ache des zugeh¨origen Kreissektors berechnen. Die Beziehung ¨ zwischen beiden ist seit Archimedes bekannt (Uber die Vermessung des Kreises, Proposition 1) und wird auch von Kepler dargestellt (Abb. 4.12). Sei x die gegebene L¨ange der Tangente eines Winkels, dessen Bogenmaß y = arctan x wir bestimmen wollen (siehe Abb. 4.11a). Aufgrund des Satzes von Pythagoras haben wir p (4.21) OA = 1 + x2 .
Wir k¨onnen den Satz des Thales auf die zwei gr¨oßeren, einander a¨ hnlichen, grau gef¨arbten Dreiecke anwenden, und finden (4.22)
OB = √
1 1 + x2
sowie
∆u = √
∆x . 1 + x2
Gem¨aß den rechten Winkeln ist das kleine graue Dreieck auch a¨ hnlich zu den anderen zwei Dreiecken, und wir schließen (4.23) 3
∆y = √
(4.22) ∆x ∆u = . 1 + x2 1 + x2
Abbildung mit Genehmigung der Bibl. Publ. Univ. Gen`eve.
54
I. Einf¨uhrung in die Analysis des Unendlichen
A ∆x
x
1
y
B
1
∆u ∆y
1 1 + x2
1
O
1
a)
0
∆x
1 x
b)
ABB. 4.11. Die Ableitung der Reihe f¨ur y = arctan x
Dies bedeutet, dass die infinitesimal kleine Bogenl¨ange ∆y gleich der schattierten Fl¨ache in Abb. 4.11b ist. Der gesuchte Bogen y ist daher gleich der Gesamtfl¨ache zwischen 0 und x unter 1 1 + x2
(2.12) =
1 − x2 + x4 − x6 + x8 − x10 + . . . ,
nach Satz 3.2 (Fermat) heißt das f¨ur alle |x| ≤ 1: (4.24)
y = arctan x = x −
x3 x5 x7 x9 x11 + − + − + ... . 3 5 7 9 11
ABB. 4.12. Die Fl¨ache des Kreises, Kepler 16154
Reihe fur ¨ arcsin x. Ein Freund, der außergew¨ohnliche F¨ahigkeiten in solchen Dingen hat, zeigte mir letztens einige Artikel, in denen er Methoden zur Berechnung von Gr¨oßen wie der von Mr Mercator f¨ur die Hyperbel aufzeigte, aber viel allgemeiner . . . Er heißt Mr Newton; ein Gelehrter unseres Colleges, & sehr jung . . . aber von außerordentlichem Genie & Kenntnisstand in diesen Dingen. (Brief von Barrow an Collins 1669, zitiert aus Westfall 1980, S. 202)
Nach der Ver¨offentlichung von Mercators Buch zum Ende des Jahres 1668 hin, in dem auch die Reihenentwicklung von ln(1 + x) stand, beeilte sich Newton,
I.4 Trigonometrische Funktionen
55
ABB. 4.13. Beweis von (4.25) f¨ur y = arcsin x; Skizze von Newton (1669)5
sein Manuskript De Analysi (Newton 1669) einigen seiner Freunde zu zeigen, erlaubte aber nicht dessen Ver¨offentlichung. Es wurde schließlich als erstes Kapitel von Analysis per quantitatum (Newton 1711) von W. Jones publiziert. Newton hat Mercators Reihe nicht nur deutlich fr¨uher entdeckt, sondern dazu noch die Reihe (4.25)
arcsin x = x +
1 x3 1 · 3 x5 1 · 3 · 5 x7 + + + ... 2 3 2·4 5 2·4·6 7
¨ und ebenso die Reihen f¨ur sin x und cos x (siehe Ubung 4.1). Newtons Beweis f¨ur (4.25) lautete wie folgt. Beweis. Angenommen, x ist gegeben und wir wollen den Bogen y berechnen, zu dem x = sin y gilt (siehe Abb. 4.13). Wenn sich x um den Wert ∆x erh¨oht, so erh¨oht sich y um ∆y, dabei ist (4.26)
∆y ≈ √
∆x 1 − x2
¨ aufgrund der Ahnlichkeit der zwei schattierten Dreiecke in Abb. √ 4.13. Diese ¨ Gr¨oße ist die Fl¨ache des Rechtecks mit Breite ∆x und H¨ohe 1/ 1 − x2 . Ahnlich wie in Abb. 4.11c folgt daraus, √ dass die vollst¨andige Bogenl¨ange y gleich der Fl¨ache unter der Funktion 1/ 1 − x2 zwischen 0 und x ist. Wir wenden den binomischen Lehrsatz 2.2 mit a = −1/2 an, und finden (4.27)
1 1 1·3 4 1·3·5 6 √ = 1 + x2 + x + x +... 2 2 2·4 2·4·6 1−x
sowie Formel (4.25), wenn wir die Funktionen 1, x2 , x4 , . . . durch ihre Fl¨achen x, x3 /3, x5 /5, . . . ersetzen (Satz 3.2). ⊓ ⊔
5
Die rechte H¨alfte von Abb. 4.13 mit Genehmigung der Bibl. Univ. Gen`eve.
56
I. Einf¨uhrung in die Analysis des Unendlichen
Berechnung von Pi . . . Du wirst kaum leugnen, dass Du eine sehr bemerkenswerte Eigenschaft des Kreises entdeckt hast, die f¨ur immer unter Geometern ber¨uhmt sein wird. (Brief von Huygens an Leibniz, 7. Nov. 1674) Daher verh¨alt sich der Durchmesser zu seinem Umfang, wie 1,000,&c. zu 3,141592653.589 7932384.6264338327.9502884197.1693993751.0582097494.4592307816 .4062862089.9862803482.5342117067.9+, exakt bis auf die hundertste Stelle; so berechnet vom genauen und stets bereiten Stift des wahrhaft genialen Mr. John Machin: Schlicht als ein Beispiel f¨ur den gewaltigen Fortschritt, den die arithmetischen Berechnungen aus der modernen Analysis ziehen, in einem so dermaßen f¨ur sich einnehmenden Bereich, dass er die K¨opfe der bedeutendsten Mathematiker aller Zeiten auf sich gelenkt hat. . . . Aber die Methode der Reihen (wie sie von Mr. Newton and Mr. Halley verbessert wurde) bew¨altigt dies mit gr¨oßter Leichtigkeit, verglichen mit den umst¨andlichen und weitschweifigen Rechenwegen von Archimedes, Vi`ete, Van Ceulen, Metius, Snellius, Lansbergius, &c. (W. Jones 1706)
Archimedes (283–212 v. Chr.) sch¨atzte die Kreiszahl π ab, indem er den Kreis zwischen regelm¨aßigen 6-, 12-, 24-, 48- und 96-Ecken einschloss und deren Umf¨ange berechnete, er erhielt (4.28)
3
10 1 0 haben wir α < 1. Nehmen wir nun an, dass α = B/A rational ist mit 0 < B < A. Eine einfache Umformulierung von (6.30) liefert dann p1 − q1 α Ap1 − Bq1 β= = , α B so dass sich β ausdr¨ucken l¨asst als rationale Zahl, dessen Nenner kleiner ist als der von α. Wenn wir dieselbe Argumentation auf β = p2 /(q2 + γ) anwenden, und dies immer wieder wiederholen, finden wir fortlaufend kleinere Nenner, die aber noch alle ganze Zahlen sind. Dies ist nicht unendlich oft m¨oglich. ⊓ ⊔ Negative pj . Die Schlussfolgerung von Satz 6.4 ist auch dann g¨ultig, wenn wir (6.29) ersetzen durch (6.29’)
2|pj | ≤ qj − 1.
Dies sieht man, wenn man wiederholt die Gleichheit qj−1 +
1 pj = (qj−1 − 1) + qj + β |pj | 1+ qj − |pj | + β
ausnutzt (sie gilt f¨ur pj < 0), welche unter der Annahme (6.29’) den Kettenbruch in einen anderen Kettenbruch umformt, der (6.29) erf¨ullt. (6.5) Satz (Lambert 1768, 1770a, Legendre 1794). F¨ur jedes rationale x (x 6= 0) ist der Wert tan x irrational. Beweis. Sei x = m/n rational, wir setzen x in (6.6) ein: (6.31)
tan
m m/n m = = . n m2 /n2 m2 1− n− m2 /n2 m2 3− 3n − m2 /n2 m2 5− 5n − 7 − ... 7n − . . .
Rechts steht ein Kettenbruch mit ganzzahligen Koeffizienten. Da die Faktoren 1, 3, 5, 7, 9, . . . gegen Unendlich streben, ist die Bedingung (6.29’) f¨ur alle m und n ab einem bestimmten Index i0 erf¨ullt. ⊓ ⊔ Dasselbe Ergebnis gilt f¨ur den Arkustangens; tats¨achlich muss x = arctan y irrational sein, wenn y rational ist, da ansonsten y = tan x irrational w¨are nach Satz 6.5. Insbesondere muss π = 4 arctan 1 irrational sein.
84
I. Einf¨uhrung in die Analysis des Unendlichen
Der Beweis eines analogen Resultats f¨ur den hyperbolischen Tangens tanh x = (ex − e−x )/(ex + e−x ) = (e2x − 1)/(e2x + 1) ist sogar noch einfacher, da s¨amtliche Minuszeichen in (6.31) zu Pluszeichen werden. Invertieren wir die letzte Formel, so haben wir ex = (1 + tanh(x/2))/(1 − tanh(x/2)) und erhalten insbesondere die Irrationalit¨at von ex und ln x f¨ur rationale Zahlen x 6= 0 beziehungsweise x 6= 1.
¨ Ubungen 6.1 Zeigen Sie, dass die Nenner Ak und Bk der N¨aherungsbr¨uche (6.8) mit Hilfe der Matrixnotation wie folgt ausgedr¨uckt werden k¨onnen:
Ak Ak−1 Bk Bk−1
=
q0 1 1 0
q1 1 p1 0
q2 1 p2 0
...
qk−1 1 pk−1 0
qk 1 pk 0
.
6.2 Berechnen Sie numerisch die regul¨aren Kettenbr¨uche der Zahlen √
2,
√
3,
√
5,
√
6,
√
7,
√ 3
2,
√ 3
3,
√ 3
√ 3
4,
5,
√ √ 3 3 6, 7
und entdecken Sie einen bedeutenden Unterschied zwischen den Quadratund Kubikwurzeln. 6.3 Zeigen Sie, dass 1 a+
und
1 a+
1 a+
1 1 a+ a +...
1 b+
1 a+
1 b+
1 a + ...
L¨osungen einer Gleichung zweiten Grades sind. Berechnen Sie ihre Werte. 6.4 Die L¨ange eines astronomischen Jahres ist (Euler 1748, §382) 365 Tage 5 Stunden 48′ 55′′ . Entwickeln Sie 5 Stunden 48′ 55′′ (gemessen in Tagen) als regul¨aren Kettenbruch und berechnen Sie die zugeh¨origen N¨aherungsbr¨uche. Vergessen Sie nicht, Papst Gregor XIII. ihren wertvollen Ratschlag f¨ur die Kalenderreform vorzulegen. 6.5 Geben Sie einen detaillierten Beweis von Gl. (6.24).
I.6 Kettenbr¨uche
85
6.6 Beweisen Sie Formel (6.6). Hinweis (Legendre 1794). Definieren Sie ϕ(z) = 1 +
a a2 a3 + + + ... 1·z 1 · 2 · z(z + 1) 1 · 2 · 3 · z(z + 1)(z + 2)
und zeigen Sie, dass gilt: ϕ(z) − ϕ(z + 1) = Sie als n¨achstes (6.33)
ψ(z) =
a · ϕ(z + 1) z · ϕ(z)
, so dass
a ϕ(z + 2) . Definieren z(z + 1) ψ(z) =
a . z + ψ(z + 1)
Iteration von (6.33) f¨uhrt zu einem Kettenbruch. Setzen Sie schließlich a = x2 /4, so dass ϕ(1/2) = cosh x und xϕ(3/2) = sinh x erf¨ullt sind, und ersetzen Sie x durch ix. Wir wollen anmerken, dass diese Formeln verwandt sind mit den Kettenbr¨uchen hypergeometrischer Funktionen (Gauß, Heine, siehe Perron 1913, S. 313, 353).
86
I. Einf¨uhrung in die Analysis des Unendlichen
L. Euler 1707–1783
C.F. Gauß 1777–1855
Mit freundlicher Erlaubnis der Schweizer Nationalbank und der Deutschen Bundesbank
J. Wallis 1616–1703
J.H. Lambert 1728–1777
Mit Erlaubnis des Georg Olms Verlags Hildesheim und der Univ.-Bibl. Basel
II Differential- und Integralrechnung
Die Reichweite dieses Kalk¨uls ist unermesslich: Er l¨asst sich sowohl auf mechanische als auch geometrische Kurven anwenden; Wurzelzeichen bereiten ihm keine Schwierigkeiten und sind oftmals sogar angenehm im Umgang; er l¨asst sich auf so viele Variablen erweitern, wie man sich nur w¨unschen kann; der Vergleich unendlich kleiner Gr¨oßen aller Art gelingt m¨uhelos. Und er erlaubt eine unendliche Zahl an u¨ berraschenden Entdeckungen u¨ ber gekr¨ummte wie geradlinige Tangenten, Fragen De maximis & minimis, Wendepunkte und Spitzen von Kurven, Evoluten, Spiegelungs- und Brechungskaustiken, &c. wie wir in diesem Buch sehen werden. (Marquis de L’Hospital 1696, Einf¨uhrung zur Analyse des infiniment petits)
Dieses Kapitel stellt die Differential- und Integralrechnung vor, die gr¨oßte Errungenschaft der Mathematik u¨ berhaupt. Wir erkl¨aren die Ideen von Leibniz, der Bernoullis und von Euler. Eine strenge Behandlung im Sinne des 19ten Jahrhunderts wird in den Abschnitten III.5 und III.6 gegeben. Die Entwicklung dieser zwei Kalk¨ule wirft auch Licht auf die oft nur schwer durchschaubare Maschinerie wissenschaftlicher Forschung, wie die obige Abbildung zeigt. E. Hairer, G. Wanner, Analysis in historischer Entwicklung, Springer-Lehrbuch, DOI 10.1007/978-3-642-13767-9_2, © Springer-Verlag Berlin Heidelberg 2011
88
II. Differential- und Integralrechnung
II.1 Die Ableitung Und ich wage zu behaupten, dass dies nicht nur das n¨utzlichste und allgemeinste Problem der Geometrie ist, das ich kenne, sondern das ich auch wissen m¨ochte. (Descartes 1637, S. 342) Isaac Newton war kein angenehmer Mensch. Sein Verh¨altnis zu anderen Akademikern war ber¨uchtigt, den Großteil seines Lebens war er in einen u¨ berhitzten Streit verwickelt . . . Ein ernsthafter Konflikt erwuchs zwischen ihm und dem deutschen Philosophen Gottfried Leibniz. Sowohl Leibniz als auch Newton haben voneinander unabh¨angig einen Zweig der Mathematik entwickelt, die sogenannte Differentialrechnung, dem der Großteil der modernen Physik zugrundeliegt . . . Nach Leibniz’ Tod, so wird berichtet, soll Newton große Genugtuung daran ge¨außert haben, ‘Leibniz’ Herz gebrochen zu haben’. (Hawking 1988, A brief history of time, Bantam Editors, New York) Was f¨ur eine Geringsch¨atzung gegen¨uber den nicht-Engl¨andern! Wir haben diese Methoden ohne jede Hilfe durch die Engl¨ander gefunden. (Joh. Bernoulli 1735, Opera, Band IV, S. 170) Was Du mir u¨ ber Bernard Niewentijt berichtest, spielt keine Rolle. Wer k¨onnte sich das Lachen verkeifen, wenn er seine l¨acherliche Haarspaltereien u¨ ber unseren Kalk¨ul liest, als w¨are er blind gegen¨uber seinen Vorteilen. (Brief von Joh. Bernoulli, zitiert aus Parmentier 1989, S. 316). Wir wollen die Funktion f x eine Stammfunktion der Funktionen f ′ x, f ′′ x, &c. , die sich von ihr ableiten, nennen, und wir wollen die letzteren abgeleitete Funktionen der ersten Funktion nennen. (Lagrange 1797)
Problem. Sei y = f (x) eine gegebene Kurve. Wir wollen an jedem Punkt x die Steigung der Kurve bestimmen, sei es in Form der Tangente an die Kurve oder ihrer Normalen. Motivationen. – Berechnung des Winkels, unter dem sich zwei Kurven schneiden (Descartes); – Konstruktion von Teleskopen (Galilei) und Uhren (Huygens 1673); – Suche nach Maxima und Minima einer Funktion (Fermat 1638); – Geschwindigkeit und Beschleunigung (Galilei 1638, Newton 1686); und – Best¨atigung des Gravitationsgesetzes in der Astronomie (Kepler, Newton).
Die Ableitung Die lineare Funktion y = ax+b. Zus¨atzlich zum festen Wert x betrachten wir den leicht verschobenen Wert x + ∆x. Die zugeh¨origen y-Werte sind y = ax + b und y + ∆y = a(x + ∆x) + b, also ∆y = a∆x. Die Steigung der Geraden ∆y ist definiert durch ∆x und folglich gleich a. Abb. 1.1 zeigt mehrere Funktionen y = ax + 1 f¨ur verschiedene Werte von a.
∆y = a ∆x
y = ax + b
∆x
b 0
x
∆x
II.1 Die Ableitung
a=2
a=1
a = 1/2
a = −1/2
a=0
a = −1
89
a = −2
ABB. 1.1. Steigungen in Abh¨angigkeit von a
Die Parabel y = x2 . Wenn man x um ∆x erh¨oht, so erh¨oht sich y auf y + ∆y = (x + ∆x)2 = x2 + 2x∆x + (∆x)2 so dass gilt (siehe Abb. 1.2a) ∆y = 2x∆x + (∆x)2 .
(1.1)
Daher ist die Steigung der Geraden, die (x, y) mit (x + ∆x, y + ∆y) verbindet, gleich 2x+∆x. Wenn nun ∆x gegen Null strebt, wird sich diese Sekantensteigung der Steigung der Tangente an die Parabel ann¨ahern.
2x ∆x + ∆x 2 y = x2
0
∆x x
ABB. 1.2a. Tangente an die Parabel
ABB. 1.2b. Tangente an die Parabel (Zeichnung von Joh. Bernoulli 1691/92)1
Leibniz (1684) stellte sich vor, dass ∆x und ∆y unendlich klein“ werden ( tan” ” gentem invenire, esse rectam ducere, quæ duo curvæ puncta distantiam infinite parvam habentia, jungat, . . .“) und bezeichnete sie mit dx und dy. Wir vernachl¨assigen dann den Term (dx)2 , der unendlich viel kleiner“ ist als 2x dx und ” erhalten anstelle von (1.1) (1.1′ ) 1
dy = 2x dx
oder
Abbildung mit Genehmigung der Univ. Bibl. Basel.
dy = 2x. dx
90
II. Differential- und Integralrechnung
Newton (1671, Ver¨offentl. 1736, S. 20) betrachtete seine Variablen v, x, y, z als allm¨ahlich und unaufh¨orlich anwachsend, . . . Und die Geschwindigkeiten, um ” die jede Gr¨oße durch ihre allgemeine Bewegung w¨achst, (die ich Fluxionen nennen m¨ochte, . . .) werde ich mit den gleichen Buchstaben durch einen Punkt schreiben, also v, ˙ x, ˙ y, ˙ z“. ˙ Ihre Werte erh¨alt man durch vernachl¨assigen der ” Terme . . . als w¨aren sie gleich Null“. Newton widersetzte sich kategorisch der Ver¨offentlichung dieses Werkes ( Ich flehe Sie an, dass keiner meiner mathemati” schen Artikel ohne meine besondere Erlaubnis gedruckt wird“). Jak. und Joh. Bernoulli entwickelten die Differentialrechnung ein drittes Mal, basierend auf Leibniz’ schwer verst¨andlicher Ver¨offentlichung von 1684 ( une ” e´ nigme plutˆot qu’une explication“). Joh. Bernoulli (1691/92) gab dann dem adligen Marquis de L’Hospital Privatunterricht in der neuen Differentialrechnung. F¨ur ihn waren unendlich kleine Gr¨oßen ledigleich Werte, die man zu jeder endlichen Gr¨oße addieren kann, ohne deren Wert zu a¨ ndern, und Kurven waren Polygone mit unendlich kurzen Seiten. Desweiteren vertrat dieser gr¨oßte aller Lehrer (neben seinen zahlreichen S¨ohnen und Neffen sowie de L’Hospital f¨uhrte er auch Euler in die Mathematik ein) auch die Meinung, dass zu viele Erkl¨arungen u¨ ber das unendlich Kleine eher das Verst¨andnis derer behindern, die nicht accoutum´es a` de ” longues explications“. B. Nieventijt schrieb 1694 eine erste Kritik am unendlich Kleinen (siehe das obige Zitat aus einem Brief von Joh. Bernoulli), gefolgt von einer Responsio“ von Leib” niz (im Juli 1695 im Journal Acta Eruditorum). Marquis de L’Hospital (1696) schrieb das ber¨uhmte Buch Analyse des infiniment petits (siehe Abb. 1.3), das zum endg¨ultigen Durchbruch der neuen Differentialrechnung selbst in Frankreich f¨uhrte, wo die Wissenschaft f¨ur viele Jahrzehnte von den Kartesianern“ beherrscht wurde (abb´e Catelan, Papin, Rolle, . . . ). ”
ABB. 1.3. Zeichnung von de L’Hospital (1696), Analyse des infiniment petits2
Bischof Berkeley ver¨offentlichte den polemischen Artikel The Analyst im Jahr 1734 gegen das Konzept des unendlich Kleinen (siehe die Zitate in Abschnitt II.2 und Struik 1969, S. 333). Maclaurin (1742, Treatise of Fluxions, Band II, S. 420): . . . untersuchen das ” Verh¨altnis, welches der Grenzwert ist . . .“ 2
Abbildung mit Genehmigung der Bibl. Publ. Univ. Gen`eve.
II.1 Die Ableitung
91
Euler (1755, Institutiones Calculi Differentialis) begann mit zwei langen Kapiteln De differentiis finitis und De usu differentiarum in doctrina serierum, gefolgt von sechs Seiten in Latein u¨ ber das Unendliche, bevor er den Satz wagte denotet ” dx quantitatem infinite parvam“ (dx = 0 und a dx = 0), dabei aber verlangte, a dx a dass ratio geometrica dx = 1 erit finita“. Er favorisierte Leibniz’ Schreibweise ” ¨¨ gegen¨uber Newtons und bemerkte . . . incommode hoc modo y¨¨¨ repraesantur, cum ” nostro signandi modo d10 y facillime comprehendatur“. D’Alembert (1754, Encyclop´edie) f¨uhrte eine klare Definition des Grenzwertes ein ( Dieser Grenzwert ist derjenige Wert, der sich dem Verh¨altnis z/n nach und ” nach ann¨ahert . . . Nichts ist klarer als diese Idee; . . .“). Lagrange (1797) verwarf das Konzept des unendlich Kleinen von vornherein und versuchte, die Analysis auf Reihenentwicklungen aufzubauen ( Man kennt die ” Schwierigkeiten, die aus der Annahme unendlich kleiner Gr¨oßen entspringen, auf der Leibniz’ Differentialrechnung basiert.“) Er f¨uhrte die Bezeichnung Ableitung ein und benutzte als Schreibweise f¨ur dy/dx (siehe Zitat) (1.2)
y′
oder f ′ (x). 2
Cauchy (1823) missbilligte die Taylorreihen (mit dem Gegenbeispiel y = e−1/x , siehe Abschnitt III.7 unten) und nutzte erneut das Konzept des unendlich Kleinen f¨ur seinen Grenzwert. Bolzano (1817) und Weierstraß (1861) perfektionierten den Begriff des Grenzwertes mittels ε und δ (siehe Kapitel III). F. Klein (1908, 3.III.1, Aut. S. 460) verteidigte den p¨adagogischen Wert des unendlich Kleinen ( Die u¨ berzeugende Kraft, die solchen naiven hodegetischen [an” leitenden] Betrachtungen inne wohnt, ist f¨ur verschiedene Personen nat¨urlich sehr verschieden. Manche — und dazu rechne ich mich selbst — f¨uhlen sich durch sie außerordentlich befriedigt; andere wieder, die einseitig nach der rein logischen Seite veranlagt sind, finden sie durchaus nichtssagend, und k¨onnen sich nicht denken, wie man sie u¨ berhaupt als Grundlage mathematischer Betrachtungen auffassen kann. . . . In diesem Zusammenhang m¨ochte ich gleich die Leibnizsche Schreibweise r¨uhmen . . .“).
Ableitungsregeln His positis calculi regulae erunt tales:
(Leibniz 1684)
Summen und konstante Faktoren. Sei y(x) = a · u(x) + b · v(x), wobei a und b konstante Faktoren sind. Wir setzen y + ∆y = y(x + ∆x), u + ∆u = u(x + ∆x), v + ∆v = v(x + ∆x), finden ∆y = a · ∆u + b · ∆v und erhalten die folgende Ableitungsregel:
92
II. Differential- und Integralrechnung
(1.3)
dy du dv =a· +b· dx dx dx
⇒
y = au + bv
oder y ′ = au′ + bv ′ .
Produkte. F¨ur das Produkt zweier Funktionen y(x) = u(x) · v(x) haben wir y + ∆y = u(x + ∆x) · v(x + ∆x) = (u + ∆u) · (v + ∆v) = uv + u ∆v + v ∆u + ∆u ∆v, was zu dy = u dv + v du f¨uhrt da du dv eine unendlich kleine Gr¨oße ist, wenn ” man sie mit den anderen Termen u dv & v du vergleicht“ (de L’Hospital 1696, S. 4), oder (1.4)
y =u·v
dy dv du =u +v dx dx dx
⇒
oder y ′ = u′ v + uv ′ .
Beispiele. Wir schreiben x3 als Produkt y = x3 = x2 · x und wenden die obige Formel an, mit dem Resultat y ′ = x2 ·1+x·2x = 3x2 . Auf a¨ hnliche Weise erhalten wir f¨ur das Produkt y = x4 = x3 · x die Ableitung y ′ = x3 · 1 + x · 3x2 = 4x3 . Durch Induktion finden wir auf diese Weise f¨ur jede positive ganze Zahl n y = xn
(1.5)
⇒
y ′ = n · xn−1 .
Quotienten. F¨ur den Quotienten y(x) = u(x)/v(x) zweier Funktionen gilt y + ∆y =
u + ∆u . v + ∆v
Subtrahieren wir y auf beiden Seiten und benutzen die geometrische Reihe f¨ur (1 + ∆v/v)−1 , so erhalten wir f¨ur v 6= 0 ∆y =
u + ∆u u v∆u − u∆v v∆u − u∆v ∆v (∆v)2 − = 2 = · 1 − + ± . . . . v + ∆v v v + v∆v v2 v v2
Damit haben wir f¨ur v 6= 0 (1.6)
y=
u v
⇒
v du − u dv dy = dx 2 dx dx v
oder y ′ =
u′ v − uv ′ . v2
Beispiel. Die Funktion y = x−n = 1/xn ist der Quotient von u = 1 und v = xn . Durch Anwendung von (1.6) finden wir y=
1 xn
⇒
dy −nxn−1 1 = = −n n+1 = −n · x−n−1 . 2n dx x x
Dies ist Gleichung (1.5) f¨ur negative n.
II.1 Die Ableitung
93
∆x
∆y Steig. = 1/2 1
Steigung = 2
∆x 0
∆y 0
1
ABB. 1.4. Eine Umkehrfunktion
Umkehrfunktionen. Sei y = f (x) eine gegebene Funktion und x = g(y) ihre Umkehrfunktion. Da die Graphen von f und g durch eine Reflexion an der 45◦ Achse ineinander u¨ bergehen (Abb. 1.4), gilt
(1.7)
∆y 1 = ∆x ∆x ∆y
dy 1 = dx dx dy
und
f¨ur
dx 6= 0. dy
Beispiel. y = x1/2 ist die Umkehrfunktion von x = y 2 . F¨ur sie gilt daher y = x1/2
dy 1 1 1 1 = dx = = √ = x−1/2 dx 2y 2 x 2 dy
⇒
und Gl. (1.5) scheint auch f¨ur rationale n zu stimmen. Exponentialfunktion. F¨ur die Exponentialfunktion y = ex (Abschnitt I.2) gilt y + ∆y = ex+∆x = ex · e∆x
und
∆y = ex (e∆x − 1).
Benutzen wir e∆x = 1 + ∆x + (∆x)2 /2! + . . . (Satz I.2.3), so erhalten wir y = ex
(1.8)
⇒
y ′ = ex .
Die Exponentialfunktion ist also ihre eigene Ableitung. Logarithmen. Es gibt mehrere Wege, die Ableitung von y = ln x zu berechnen. a) Sie ist die Umkehrfunktion von x = ey . Nach (1.7) gilt dann (1.9)
y = ln x
⇒
dy 1 1 1 = = y = . dx dx/dy e x
b) Wir k¨onnen ∆y auch aus y + ∆y = ln(x + ∆x) berechnen, und erhalten x + ∆x ∆x ∆y = ln(x + ∆x) − ln(x) = ln = ln 1 + . x x
94
II. Differential- und Integralrechnung
∆x ∆x 1 ∆x 2 Die Reihe f¨ur ln 1 + = − + . . . (siehe (I.3.13)) liefert dann x x 2 x wieder (1.9). Trigonometrische Funktionen. Wir betrachten zuerst y = sin x. Mit Gl. (I.4.3) finden wir y + ∆y = sin(x + ∆x) = sin x cos ∆x + cos x sin ∆x. Die Reihenentwicklungen von sin ∆x und cos ∆x (siehe (I.4.16) und (I.4.17)) zeigen dann (∆x)2 (∆x)3 ∆y = sin x − + . . . + cos x ∆x − +... 2! 3! und folglich (1.10)
y = sin x
Auf a¨ hnliche Weise finden wir (1.11)
y = cos x
⇒ ⇒
y ′ = cos x. y ′ = − sin x.
F¨ur y = tan x = sin x/ cos x benutzen wir (1.6) und erhalten (1.12)
dy cos2 x + sin2 x 1 = = 1 + tan2 x = . dx cos2 x cos2 x
Arkusfunktionen. Als eine Folgerung aus (1.7) und den obigen Formeln f¨ur die Ableitungen der trigonometrischen Funktionen gelten: (1.13)
y = arctan x
⇒
(1.14)
y = arcsin x
⇒
(1.15)
y = arccos x
⇒
dy 1 1 1 = = = , 2 dx dx/dy 1 + x2 1 + tan y dy 1 1 1 = =p =√ , 2 dx cos y 1 − x2 1 − sin y
dy 1 −1 −1 = =p = √ . 2 dx − sin y 1 − x2 1 − cos y
Zusammengesetzte Funktionen. Wir betrachten eine Funktion y = h(x) = f g(x) und setzen z = g(x). F¨ur die Funktionswerte bei x + ∆x finden wir z + ∆z = g(x + ∆x) und y + ∆y = h(x + ∆x) = f (z + ∆z). Aus der trivialen Identit¨at ∆y ∆y ∆z = · ∆x ∆z ∆x folgt (1.16)
dy dy dz = · dx dz dx
oder
h′ (x) = f ′ g(x) · g ′ (x).
Um nun eine zusammengesetzte Funktion abzuleiten, muss man die Ableitungen der Funktionen f und g multiplizieren.
II.1 Die Ableitung
y 1
z ∆y
0
y
∆z
1
∆x 1
x
0
95
1
∆x 1
x
∆y
0
∆z 1
z
ABB. 1.5. Eine zusammengesetzte Funktion
Beispiel. Die Funktion y = sin(2x) ist zusammengesetzt aus y = sin z und z = 2x (siehe Abb. 1.5). Nach (1.16) ist ihre Ableitung y ′ = cos z · 2 = 2 cos(2x).
Wenn wir auf diese Regeln vertrauen, wird die Berechnung der Ableitung einer jeden aus elementaren Funktionen zusammengesetzten Funktion (Descartes’ großer Traum, siehe das Zitat zu Beginn dieses Abschnitts) eine Banalit¨at. Beispielsweise gilt y = ax = ex·ln a
(z = x · ln a) ⇒
y = xa = ea·ln x
(z = a · ln x) ⇒
dy dy dz = · = ex·ln a · ln a = ln a · ax , dx dz dx dy dy dz a = · = xa · = a · xa−1 . dx dz dx x
Insbesondere gilt also Gl. (1.5) f¨ur jede reelle Zahl n.
Parametrische Darstellung und implizite Gleichungen Wir betrachten das Beispiel einer Kurve von durchaus ehrw¨urdigem Alter: Die Konchoide des Nikomedes (200 v. Chr.). Zu zwei gegebenen Konstanten a und b wird die Konchoide wie folgt definiert: F¨ur jeden Punkt A auf der Konchoide ist der Abstand zwischen A und dem Schnittpunkt F zwischen dem Strahl vom Koordinatenursprung G durch A mit der horizontalen Gerade der H¨ohe a von konstanter L¨ange b (siehe Abb. 1.6). ¨ Aus der Ahnlichkeit der Dreiecke FAB und FGL folgern wir die Beziehung
und damit gilt (1.17)
y−a b =p 2 a x + y2 − b (y − a)2 (x2 + y 2 ) = b2 y 2 .
Wenn wir nun y als Funktion von x ausdr¨ucken wollten, so m¨ussten wir ausgehend von obiger Gleichung ein Polynom vierten Grades l¨osen. Stattdessen sollten wir versuchen, mit der impliziten Gleichung (1.17) selber zu arbeiten.
96
II. Differential- und Integralrechnung
M
A b
b
L F a
B
t G
ABB. 1.6. Die Konchoide des Nikomedes
Eine Alternative ist es, den Winkel LGF mit ϕ zu bezeichnen, was uns die folgende Beschreibung der Kurve erlaubt: (1.18)
x = a tan ϕ + b sin ϕ y = a + b cos ϕ.
Wenn nun ϕ die Werte zwischen −π/2 bis π/2 annimmt, formen die Ausdr¨ucke (1.18) eine parametrische Darstellung unserer Kurve. Die parametrische Darstellung ist keineswegs eindeutig. So k¨onnten wir auch den Abstand GF als Parameter t anstelle von ϕ nutzen (siehe Abb. 1.6). Wir erhalten dann p x = (b/t + 1) t2 − a2 (1.19) y = (b/t + 1)a. Dies stellt die rechte H¨alfte der Kurve dar, wenn t von a nach ∞ l¨auft. Wir betrachten nun das Problem, die Tangente an die Konchoide zu einem gegebenen Punkt A zu finden (dies ist Aufgabe 7“ von Joh. Bernoulli 1691/92). ” Ableitung der parametrischen Darstellung. Wir betrachten y in der zweiten Gleichung von (1.18) oder (1.19) als Funktion des Parameters (ϕ oder t) und interpretieren den Parameter wiederum u¨ ber die erste Gleichung als Umkehrfunktion von x. Wir finden dann aus (1.16) und (1.7) dy dy dϕ dy . dx dy dy . dx (1.20) = · = oder = . dx dϕ dx dϕ dϕ dx dt dt Nochmals vielen Dank an Dich, Leibniz, f¨ur Deine Notation. Ableiten der Gleichungen (1.19) und Division der Ableitungen liefert uns f¨ur die Konchoide √ dy −ab t2 − a2 (1.21) = . dx t3 + a 2 b
Diese Formel besitzt eine sehr sch¨one Interpretation (Joh. Bernoulli 1691/92): Wir bezeichnen mit M denjenigen Punkt, zu dem die Dreiecke LGF und GMA a¨ hnlich werden. Dann ist die Tangente in A parallel zu der Geraden, die M und F verbindet (siehe Abb. 1.6).
II.1 Die Ableitung
97
Implizite Ableitung. Diese Methode, die bereits Leibniz (1684) einsetzte, besteht aus der Anwendung der obigen Regeln, um eine Funktion y(x) abzuleiten, die nur durch eine implizite Gleichung gegeben ist, in unserem Beispiel durch Gl. (1.17). Wir finden 2(y − a) dy (x2 + y 2 ) + (y − a)2 (2x dx + 2y dy) = 2b2 y dy und nach Division durch 2dx dy −x(y − a)2 = . dx (y − a)(x2 + y 2 ) + (y − a)2 y − b2 y
(1.22)
Diese implizite Ableitung wird von uns in Abschnitt IV.3 etwas strenger behandelt.
¨ Ubungen 1.1 Dehnen Sie die Ableitungsregel (1.4) auf drei Faktoren aus: y =u·v·w
⇒
y ′ = u′ · v · w + u · v ′ · w + u · v · w ′ .
1.2 Berechnen Sie die Ableitung dy/dx von 2 2 q √ k x x 5 sin 3x + b x2 + e2x · tan 1+u + 3 ax−ln 2 x2 a2 +x2 q y= . x2 −b2 x 3a2 x3 3x arccos √3+x + arctan(1/x) + e− 2 · arcsin 1−x 2
1.3 (Ein Beispiel aus Euler 1755, §192). Zeigen Sie, dass aus ex
y = ee
ex
y ′ = ee
folgt
1.4 Berechnen Sie die Ableitung der Zissoide des Diokles (etwa 180 v. Chr.). Diese Kurve, die von Diokles genutzt wurde, um das delische Problem der W¨urfelverdoppelung zu l¨osen, wird erzeugt aus dem Kreis MCE als die Menge aller Schnittpunkte der Geraden DM und BF, wobei die B¨ogen BD und CD gleich lang sein sollen. Zeigen Sie, dass die Tangente in A parallel ist zu EH, wobei H so gew¨ahlt ist, dass EF und GH parallel sind.
x
· ee · ex .
D
C
B A
G −2
E −1
0
M 1
x
F H
98
II. Differential- und Integralrechnung
1.5 Berechnen Sie die Ableitung des Kreises, der durch x2 + y 2 = r2 definiert ist, sowohl durch implizite Ableitung als auch durch Aufl¨osen nach y und anschließender expliziter Ableitung. 1.6 (Leibniz 1684). Berechnen Sie die Ableitung der Funktion y(x), die durch √ x (a + bx) · (c − xx) yy + + ax gg + yy + √ = 0, y (ex + f xx)2 hh + ℓx + mxx definiert wird, wobei a, b, c, e, f , g, h, ℓ und m Konstanten sind. Diese Gleichung repr¨asentiert nicht etwa eine uralte ber¨uhmte babylonische oder a¨ gyptische Kurve, und hat auch sonst keine besondere Bedeutung. Sie wurde nur von Leibniz als entsetzlich komplizierter Ausdruck gew¨ahlt, um mit ihr die F¨ahigkeiten seines Kalk¨uls zu demonstrieren.
II.2 H¨ohere Ableitungen und Taylorreihen
99
II.2 H¨ohere Ableitungen und Taylorreihen Aber die Geschwindigkeiten der Geschwindigkeiten, die zweiten, dritten, vierten und f¨unften Geschwindigkeiten &c. u¨ bersteigen, wenn ich mich nicht irre, jedes menschliche Verst¨andnis. Je weiter der Verstand diese fl¨uchtigen Ideen analysiert und verfolgt, desto mehr verirrt und verwirrt er sich; . . . (Bishop Berkeley 1734, The Analyst, s. Struik 1969, Source Book, S. 335) . . . unsere modernen Analysten sind nicht damit zufrieden, die Differenzen endlicher Gr¨oßen zu betrachten: Sie betrachten auch die Differenzen solcher Differenzen, und die Differenzen der Differenzen der ersten Differenzen. Und so weiter ad infinitum. Das heißt, sie betrachten Werte, die unendlich viel kleiner sind als die kleinste erkennbare Gr¨oße; und andere, die unendlich viel kleiner sind als die unendlich kleinen; und wiederum andere, die unendlich viel kleiner sind als die vorangehenden Infinitesimalen, und so weiter ohne Ende oder Grenze . . . Wie man nun eine unendlich kleine Gr¨oße erh¨alt . . . geht, so muss ich zugeben, u¨ ber meine F¨ahigkeiten hinaus. Aber von einer solchen unendlich kleinen Gr¨oße einen Teil zu nehmen, der wiederum unendlich viel kleiner ist als dieser, und folglich selbst bei unendlicher Vervielfachung niemals auch nur der kleinsten endlichen Gr¨oße gleicht, ist, so vermute ich, f¨ur wirklich jeden Menschen eine unendlich schwere Aufgabe; . . . (Bishop Berkeley 1734, The Analyst)
Die zweite Ableitung Wir haben in Abschnitt II.1 gesehen, dass die Ableitung f ′ (x) einer gegebenen Funktion y = f (x) die Steigung der Tangente an die Kurve y = f (x) ist. Dementsprechend ist die Funktion anwachsend auf dem Intervall [a, b], falls f ′ (x) > 0 f¨ur alle a < x < b ist, und abfallend, falls f ′ (x) < 0 f¨ur alle a < x < b ist. Punkte mit f ′ (x) = 0 heißen station¨are Punkte. y ′′ > 0 y0 x0
y1
y1
y0
y ′′ < 0 x1
x0
x1
ABB. 2.1a. Geometrische Bedeutung der zweiten Ableitung
ABB. 2.1b. Eine Zeichnung von Joh. Bernoulli (1691/92)1
Newton (1665) und Joh. Bernoulli (1691/92) haben als erste die geometrische Bedeutung der zweiten Ableitung von f untersucht. Wir leiten y ′ = f ′ (x) ab, um y ′′ = f ′′ (x) zu erhalten. Falls f ′′ (x) > 0 gilt f¨ur alle a < x < b, dann wird f ′ (x) in diesem Bereich ansteigen, d.h. f¨ur zwei Punkte x0 < x1 finden wir f ′ (x0 ) < f ′ (x1 ). Dies bedeutet, dass die Kurve bei x1 steiler ist als bei x0 , 1
Abbildung mit Genehmigung der Univ. Bibl. Basel.
100 II. Differential- und Integralrechnung
und dass sie sich nach oben biegt (siehe Abb. 2.1a, links). Wir sagen dann, dass die Funktion f (x) konvex ist. Analog sagen wir, dass die Funktion f (x) konkav (seltener auch konvex von oben) ist, falls f ′′ (x) < 0 eintritt f¨ur a < x < b (siehe Abb. 2.1a, rechts). Punkte mit f ′′ (x0 ) = 0, an denen die zweite Ableitung ihr Vorzeichen wechselt, heißen Wendepunkte. Abb. 2.1b bildet eine Zeichnung von Joh. Bernoulli ab, die diese Zusammenh¨ange erl¨autert. Probleme de maximis & minimis“. ”
Ich m¨ochte nur, dass er weiß, dass unsere Fragen de maximis et minimis und de tangentibus linearum curvarum noch vor acht oder zehn Jahren perfekt waren, und dass viele Menschen, die sie in den letzten f¨unf oder sechs Jahren gesehen haben, dies bezeugen k¨onnen. (Brief von Fermat an Descartes, Juni 1638, Oeuvres, Band 2, S. 154–162) Wenn eine Gr¨oße so groß oder so klein wie m¨oglich ist, so fließt sie in diesem Moment weder zur¨uck noch vorw¨arts. Denn wenn sie vorw¨arts fließen w¨urde, d.h. gr¨oßer wird, so beweist dies, dass sie mal kleiner war und aktuell gr¨oßer ist als sie es war. . . . Darum suche ihr Fluxion, nach Prob. 1, und nehme an, es sei Null. (Newton 1671, engl. Ver¨off. 1736, S. 44)
Das Problem, maximale oder minimale Werte zu finden, war eine der fr¨uhesten Motivationen f¨ur die Differentialrechnung (Fermat 1638) und es wurde zu Lagranges Lebenswerk (siehe Lagrange 1759). An einem Maximal- bzw. Minimalwert einer Funktion f (x) kann diese nicht weiter ansteigen bzw. abfallen. Damit muss f ′ (x0 ) = 0 gelten (station¨arer Punkt). Falls sich das Vorzeichen von f ′ (x) von + nach − a¨ ndert (dies ist der Fall, wenn f ′′ (x0 ) < 0), so handelt es sich um ein (lokales) Maximum, und bei einem Vorzeichenwechsel von − nach + (entsprechend f ′′ (x0 ) > 0), so ist es ein (lokales) Minimum. Wir fassen dies zusammen: (2.1)
f ′ (x0 ) = 0 und f ′′ (x0 ) > 0 f ′ (x0 ) = 0 und f ′′ (x0 ) < 0
⇒ ⇒
x0 ist ein lokales Minimum, x0 ist ein lokales Maximum.
Diese Fakten sequentibus exemplis illustrabimus“: ” Beispiel 1. Wir w¨ahlen
(2.2)
y = x3 − x2 − 3x,
y ′ = 3x2 − 2x − 3, y ′′ = 6x − 2.
Man sieht, dass die Funktion dort√w¨achst, wo y ′ > 0 gilt, d.h.√f¨ur x < (1 − 10)/3 und f¨ur x > (1 + 10)/3. Sie ist konvex f¨ur x > 1/3 und konkav f¨ur x < 1/3. Der Punkt x = 1/3 √ ist ein Wendepunkt. Der Punkt x = (1 − 10)/3 ist ein lokales (aber kein√globales) Maximum, der Punkt x = (1 + 10)/3 ist ein lokales Minimum.
2 Max
−2
−1
0
y’’
y’
1
2
Wend. −2
−4
Min
y
3
II.2 H¨ohere Ableitungen und Taylorreihen 101
1
y′ Max
√ − 3
−1
Wend.
Min
0 Wend.
−1
Wend. y √
1
3
y ′′
ABB. 2.2. Maxima, minima, Wendepunkte in Eulers Beispiel
Beispiel 2. Wir betrachten die Funktion (siehe Euler 1755, Pars Posterior, §265) (2.3)
y=
x , 1 + x2
y′ =
1 − x2 , (1 + x2 )2
y ′′ =
−6x + 2x3 , (1 + x2 )3
die wir zusammen mit ihrer ersten und zweiten Ableitung in Abb. 2.2 dargestellt sehen. Die Funktion y(x) besitzt ein (globales) Minimum bei x = −1, ein √ (globales) Maximum bei x = 1 und Wendepunkte bei x = 0 und x = ± 3. Sie √ √ ist konvex in den Intervallen − 3 < x < 0 und 3 < x < ∞ und ansonsten konkav. Fermats Prinzip. A v1
a α1 x
α2
l−x
v2
b B
ABB. 2.3. Zeichnung von Joh. Bernoulli 1691/922
ABB. 2.4. Fermats Prinzip
Fermat wollte das Snelliussche Brechungsgesetz erkl¨aren k¨onnen, das die Lichtbrechung zwischen zwei Medien mit verschiedenen Lichtgeschwindigkeiten v1 2
Abbildung mit Genehmigung der Univ. Bibl. Basel.
102 II. Differential- und Integralrechnung
f (x) p(x)
f (x)
f (x)
p(x) p(x) ∆x = 0,4 x0
x1
x2
∆x = 0,2 x0 x1 x2
∆x = 0,1 x0 x2
ABB. 2.5. Entwicklung des Taylorpolynoms
und v2 beschreibt. Seien zwei Punkte A und B gegeben (siehe Abb. 2.4). Wir suchen Winkel α1 und α2 , so dass das Licht von A nach B die k¨urzeste Zeit ben¨otigt, bzw. auf den geringsten Widerstand trifft. Das heißt, wir suchen x, so dass p √ b2 + (ℓ − x)2 a 2 + x2 (2.4) T = + = min ! v1 v2 Fermat selbst empfand das Problem als zu schwierig, um es analytisch zu behandeln ( I admit that this problem is not one of the easiest“). Voller Stolz f¨uhrte ” daraufhin Leibniz (1684) die n¨otigen Berechnungen in tribus lineis“ aus. Die ” Ableitung von T als Funktion von x ist 1 2x −2(ℓ − x) 1 √ + p . 2 2 v1 2 a2 + x2 v 2 b + (ℓ − x) 2 p √ Beachten wir, dass sin α1 = x/ a2 + x2 und sin α2 = (ℓ − x)/ b2 + (ℓ − x)2 , so sehen wir, dass die Ableitung verschwindet, wenn T′ =
sin α1 sin α2 = v1 v2
(2.5)
gilt (Snelliussches Brechungsgesetz). Die Berechnung von T ′′ T ′′ =
1 a2 1 b2 + > 0, v1 (a2 + x2 )3/2 v2 (b2 + (ℓ − x)2 )3/2
zeigt abschließend, dass unser Ergebnis tats¨achlich ein Minimum ist.
De Conversione Functionum in Series Taylors Ansatz. Hierin liegt nun tats¨achlich ein Grenz¨ubergang von unerh¨orter K¨uhnheit. (F. Klein 1908, 3.III.2, oder S. 507 in der Autographie)
Wir betrachten f¨ur eine Funktion f (x) die Punkte (Taylor 1715) x0 , x1 = x0 +∆x, x2 = x0 + 2∆x, . . . und die Funktionswerte y0 = f (x0 ), y1 = f (x1 ), y2 = f (x2 ), . . . .
II.2 H¨ohere Ableitungen und Taylorreihen 103
Dann berechnen wir das Interpolationspolynom, das durch diese Punkte verl¨auft (siehe Abb. 2.5 und Satz I.1.2; um letzteren anzuwenden, definieren wir x = x0 + 0 t∆x, t = x−x ) ∆x (2.6)
p(x) = y0 +
x − x0 ∆y0 (x − x0 )(x − x1 ) ∆2 y0 + , 1 ∆x 1·2 ∆x2
oder mit weiteren solchen Termen f¨ur h¨ohere Grade. Lassen wir nun ∆x → 0, x1 → x0 , x2 → x0 gehen (oder, wie wir vormals gesagt haben: wir nehmen an, dass ∆x unendlich klein ist), so strebt der Quotient ∆y0 /∆x im zweiten Term gegen f ′ (x0 ). Desweiteren wird das Produkt (x−x0 )(x−x1 ), das im dritten Term auftritt, gegen (x − x0 )2 streben. Taylor hat dann postuliert, dass die zweiten Dif¨ ferenzen (geteilt durch ∆x2 ) gegen die zweite Ableitung streben (siehe Ubungen 2.5 und III.6.4); im allgemeinen: ∆k y 0 dk y → k = f (k) (x0 ). k ∆x dx 0
(2.7)
Wenn wir im Interpolationspolynom (2.6) mehr und mehr Terme ber¨ucksichtigen, und zugleich den Grenzwert ∆x → 0 nehmen, erhalten wir die ber¨uhmte Formel (2.8) (x − x0 )2 ′′ (x − x0 )3 ′′′ f (x) = f (x0 ) + (x − x0 )f ′ (x0 ) + f (x0 ) + f (x0 ) + . . . . 2! 3! Alle Reihen des ersten Kapitels sind letztlich Spezialf¨alle dieser series univer” salissima“. Beispielsweise hat die Funktion f (x) = ln(1 + x) die Ableitungen f (0) = 0,
f ′ (0) = 1,
f (k) (0) = (−1)k−1 (k − 1)!
und wir erhalten ln(1 + x) = x −
x2 x3 x4 + − ± ... . 2 3 4
Bemerkungen. Formel (2.8) wurde f¨ur u¨ ber ein Jahrhundert als allgemein g¨ultig gesehen. Cauchy fand dann ein Beispiel einer Funktion, f¨ur die die Reihe (2.8) zwar konvergiert, jedoch nicht gegen f (x) (siehe Abschnitt III.7). Es gibt auch Beispiele von Funktionen, f¨ur die die Reihe (2.8) u¨ berhaupt nicht konvergiert ¨ f¨ur x 6= x0 (siehe Ubung III.7.6). Ein klarerer Beweis von (2.8) (erbracht von Joh. Bernoulli) benutzt die Integralrechnung und wird in Abschnitt II.4 vorgestellt. Maclaurins Ansatz (Maclaurin 1742, S. 223–224, Art. 255). F¨ur die Funktion y = f (x) und einen gegebenen Punkt x0 definieren wir die Reihe (oder das Polynom) (2.9)
p(x) = p0 + (x − x0 )q0 + (x − x0 )2 r0 + (x − x0 )3 s0 + . . .
mit (2.10)
p(i) (x0 ) = f (i) (x0 )
i = 0, 1, 2, . . . ,
104 II. Differential- und Integralrechnung
d.h. beide Funktionen haben bei x = x0 bis zu einer bestimmten Ordnung dieselben Ableitungen. Setzen wir n¨amlich in (2.9) x = x0 , so erhalten wir p0 = p(x0 ) = f (x0 ) aus (2.10). Wir leiten dann (2.9) ab, setzen erneut x = x0 und erhalten q0 = p′ (x0 ) = f ′ (x0 ). Durch weitere Ableitungen finden wir 2! · r0 = f ′′ (x0 ), 3! · s0 = f ′′′ (x0 ) und so weiter. Daher ist Reihe (2.9) identisch mit der aus (2.8). Die Partialsummen der Reihe (2.8) heißen Taylorpolynome. Beispiel. Zu der Funktion, die in (2.2) gegeben ist, w¨ahlen wir den Punkt x0 = 1 und finden f (x0 ) = −3, f ′ (x0 ) = −2, f ′′ (x0 ) = 4, und f ′′′ (x0 ) = 6. Daher sind die Taylorpolynome −2 ersten, zweiten und dritten Grades p1 (x) = −3 − 2(x − 1) = −2x − 1,
p2 (x) = p1 (x) + 42 (x − 1)2 = 2x2 − 6x + 1, p3 (x) = p2 (x) + 66 (x − 1)3 = x3 − x2 − 3x.
2
−1
0 0
p1
f = p3
−2
1
2
3
p2
−4
Newtons Verfahren fur ¨ Wurzeln von Gleichungen. Die Taylorpolynome stellen ein ungemein n¨utzliches Werkzeug zur n¨aherungsweisen Berechnung von Wurzeln zur Verf¨ugung. Wir betrachten hierzu ein Beispiel, dass von Newton (1671) behandelt wurde, (2.11)
x3 − 2x − 5 = 0.
Wir berechnen einige Funktionswerte von f (x) = x3 − 2x − 5: f (0) = −5, f (1) = −6, f (2) = −1, f (3) = 16. Hieraus sehen wir, dass es eine Wurzel nahe bei x0 = 2 geben muss. Die Idee ist nun, die Kurve f (x) durch ihre Tangente an x0 zu ersetzen, diese ist gegeben durch p1 (x) = −1 + 10(x − 2). Die Wurzel von p1 (x) = 0, n¨amlich x = 2,1, ist dann ein verbesserter Sch¨atzwert f¨ur die Wurzel von (2.11). Wir w¨ahlen nun x0 = 2,1 und wiederholen die Berechnung. Dies liefert p1 (x) = 0,061 + 11,23(x − 2,1) und x = 2,0945681 als neue Absch¨atzungen der Wurzel von (2.11). Ein weiterer Schritt liefert bereits x = 2,0945515, in dem alle gezeigten Ziffern schon korrekt sind (vergl. in Abb. 2.6a die Nachbildung der Originalrechnung von Newton). Nutzen des Polynoms zweiten Grades (E. Halley 1694). Wir w¨ahlen f¨ur das obige Beispiel den Punkt x0 = 2,1 und bringen nun zwei Terme des Taylorpolynoms zum Einsatz. Mit ihnen erhalten wir 0,061 + 11,23(x − 2,1) + 6,3(x − 2,1)2 = 0, 3
Abbildung mit Genehmigung der Bibl. Publ. Univ. Gen`eve.
II.2 H¨ohere Ableitungen und Taylorreihen 105
ABB. 2.6. Newtons Berechnung von x3 − 2x − 5 = 03
eine quadratische Gleichung f¨ur z = x − 2,1 mit zwei Wurzeln. Wir w¨ahlen diejenige, deren Betrag kleiner ist (d.h. f¨ur die x n¨aher an 2,1 liegt) und finden p −11,23 + 11,232 − 4 · 0,061 · 6,3 z = x − 2,1 = , 12,6 also x = 2,0945515. Diesmal sind bereits nach einer einzigen Iteration alle gezeigten Ziffern korrekt.
¨ Ubungen 2.1 (Euler 1755, §261). Studieren Sie die Funktionen y = x4 − 8x3 + 22x2 − 24x + 12,
y = x5 − 5x4 + 5x3 + 1.
Finden Sie Maxima, Minima, konvexe Gebiete und Wendepunkte. 2.2 (Euler 1755, §272). Die Zahlenfolge √ 1
1 = 1,
√ 2
2 = 1,4142,
√ 3
3 = 1,4422,
√ 4
4 = 1,4142,
√ 5
5 = 1,3797 , . . .
√ suggeriert, dass die Funktion y = x x = x1/x einen maximalen Wert nahe an x = 3 annimmt. Wo genau? In welcher Beziehung steht dieser Wert zum Minimalwert von y = xx ?
106 II. Differential- und Integralrechnung
2.3 (Joh. Bernoulli 1691/92). Finden Sie x, so dass das Rechteck, dass aus Abszisse und Ordinate eines Punktes auf dem Kreis y = √ x − x2 geformt wird, die gr¨oßtm¨ogliche Fl¨ache annimmt. Best¨atigen Sie mittels der zweiten Ableitung, dass es sich um ein Ma0 ximum handelt.
x
1
2.4 (Euler 1755, §272). Finden Sie x, so dass x sin x ein (lokales) Maximum annimmt (Sie werden eine Gleichung finden, die sich am besten durch Newtons oder Halleys Verfahren l¨osen l¨asst; Euler gibt als Ergebnis x = 116◦ 14′ 21′′ 20′′′ 35′′′′ 47′′′′′ an; der korrekte Wert der letzten Ziffern lautet 32′′′′ 38′′′′′ ). 2.5 Berechnen Sie die zweite Differenz ∆2 y = (x + 2∆x)3 − 2(x + ∆x)3 + x3 der Funktion y = x3 . Zeigen Sie, dass diese Differenz, dividiert durch ∆x2 , f¨ur ∆x → 0 gegen 6x strebt (die zweite Ableitung). 2.6 Sei f (x) = sin(x2 ). Berechnen Sie f ′ (x), f ′′ (x), f ′′′ (x), f ′′′′ (x), . . ., um daraus die Taylorreihe f (x) = f (0) + f ′ (0)x + f ′′ (0)
x2 x3 x4 + f ′′′ (0) + f ′′′′ (0) + . . . 2! 3! 4!
zu bestimmen. Gibt es einen deutlich einfacheren Weg, zu diesem Ergebnis zu gelangen? 2.7 Zeigen Sie, dass Newtons Verfahren, angewendet auf x2 − 2 = 0, genau √ der babylonischen Berechnung (I.2.13) von 2 entspricht. Allerdings weicht Formel (I.2.14) von Halleys Verfahren ab. Warum? 2.8 (Leibniz 1710). Zeigen Sie f¨ur eine Funktion y(x) = u(x) · v(x) als Erweiterung von (1.4), dass gilt: y ′′ = u′′ v + 2u′ v ′ + uv ′′ ,
y ′′′ = u′′′ v + 3u′′ v ′ + 3u′ v′′ + uv ′′′ .
Finden Sie eine allgemeine Regel f¨ur y (n) .
II.3 Einh¨ullende und Kr¨ummung 107
II.3 Einh¨ullende und Kr¨ummung Mein Bruder, Professor in Basel, hat diese Gelegenheit zum Anlass genommen, verschiedene Kurven zu untersuchen, die uns die Natur jeden Tag vor Augen f¨uhrt . . . (Joh. Bernoulli 1692) Ich bin absolut u¨ berzeugt davon, dass es kaum einen Geometer in der Welt gibt, der sich mit Ihnen messen kann. (de L’Hospital 1695, Brief an Joh. Bernoulli)
Einh¨ullende einer Familie von Geraden Wir lassen uns von von einer Zeichnung A. D¨urers inspirieren (1525, S. 38, siehe Abb. 3.1, rechts), und betrachten einen Punkt (a, 0), der sich auf der xAchse bewegt, sowie einen Punkt (0, 13 − a), der sich auf der y-Achse in entgegengesetzte Richtung bewegt. Wenn wir diese Punkte durch eine Gerade (3.1)
y=
13−a
a − 13 13x (x − a) = 13 + x − a − a a
a
verbinden, so erhalten wir eine unendliche Zahl an Linien, die in Abb. 3.1 angedeutet sind, und die eine interessante Kurve erscheinen lassen, ihre Einh¨ullende oder auch H¨ullkurve, die jede dieser Geraden tangential ber¨uhrt. Die Frage lautet, wie man diese Kurve berechnet. Leibniz (siehe Leibniz 1694a), Joh. Bernoulli und de L’Hospital diskutierten solche Problemstellungen ausf¨uhrlich.
ABB. 3.1. Familie von Geraden, die eine Parabel formen; eine Skizze von D¨urer (1525)1
1
Abbildung mit Genehmigung des Verlags Dr. Alfons Uhl, N¨ordlingen.
108 II. Differential- und Integralrechnung
Ansatz. Wir halten die Variable x bei einem beliebigen Wert konstant, beispielsweise x = 4, f¨ur welchen die Familie (3.1) die Gleichung y = 17 − a − 52/a erzeugt. Wir stellen nun fest, dass dieser Wert sich zun¨achst f¨ur gr¨oßer werdende a erh¨oht (siehe Abb. 3.1; f¨ur a = 3; 4; 5; 6 haben wir jeweils y = −3,33; 0; 1,6; 2,33). In diesem Bereich n¨ahert sich der Punkt (4, y) der Einh¨ullenden an. Schließlich wird die Einh¨ullende genau dann erreicht, wenn diese Funk2 tion ihr Maximum annimmt, d.h. wenn die Ableitung y ′ = −1 + 52/a = 0 ist, √ √ also f¨ur a = 52. Der zugeh¨orige Funktionswert lautet y = 17 − 2 52 = 2,58. Dieses Prinzip funktioniert nun auch f¨ur beliebige Werte von x: Wir m¨ussen die Ableitung von (3.1) bez¨uglich a ausrechnen, wobei x als konstant angenommen wird ( differentiare secundum a“). Dies wird auch als partielle Ableitung ” bez¨uglich a bezeichnet. An Punkten der Einh¨ullenden muss diese Ableitung verschwinden. Die moderne Schreibweise hierf¨ur lautet (siehe Abschnitt IV.3 unten, sowie Jacobi 1827, Oeuvres, Band 3, S. 65) ∂y = 0. ∂a
(3.2)
2 F¨ur Gl. √ (3.1) wird daraus ∂y/∂a = −1 + 13x/a und Bedingung (3.2) liefert uns a = 13x. Wir erhalten die Einh¨ullende, indem wir dies in (3.1) einsetzen: √ (3.3) y = x − 2 13x + 13
oder (y − x − 13)2 = 52x.
(3.4)
Dies ist die Gleichung eines Kegelschnitts; in unserem Spezialfall handelt es sich um eine Parabel.
Die Kaustik eines Kreises Fragestellung. Sei x2 + y 2 = 1 ein Kreis (Abb. 3.2), und wir nehmen an, dass parallel einlaufende vertikale Lichtstrahlen von diesem Kreis reflektiert werden. Wir erhalten eine weitere Geradenfamilie, die offenbar eine interessante Einh¨ullende generiert. Wir suchen die Gleichung dieser Einh¨ullenden. Joh. Bernoulli (1692) fand eine L¨osung per vulgarem Geometriam Carte” sianam“; jedoch verwendet er in seinen Lectiones“ (Joh. Bernoulli 1691/92b, ” Lectio XXVII, Caustica circularis radiorum parallelorum“, Opera, Bd. 3, S. 467), ” die moderne“ Differentialrechnung. ” L¨osung. Um die Familie der reflektierten Strahlen zu beschreiben, w¨ahlen wir als Parameter den Winkel α zwischen dem Strahl und dem Radiusvektor (siehe ¨ Abb. 3.3). Nach einigen elementar-geometrischen Uberlegungen und aus der Tatsache heraus, dass der reflektierte Strahl die Steigung tan(2α − π/2) = − cos 2α/ sin 2α hat, finden wir die Gleichung
II.3 Einh¨ullende und Kr¨ummung 109
−1
0
1
ABB. 3.2. Die Kaustik des Kreises (Joh. Bernoulli 1692)
y 0
α
1
1 2
1 2 cos α
2α − π/2
α
x
α
−1
ABB. 3.3. Der reflektierte Strahl
(3.5)
y=−
1 cos 2α 1 x sin α cos α −x =− + − . 2 cos α sin 2α 2 cos α 2 cos α sin α
Gleichung (3.2) beschreibt nun die Bedingung an die Kaustik als (3.6)
∂y sin α x =− + =0 2 2 ∂α 2 cos α 2 cos α sin2 α
also (3.7)
x = sin3 α.
Wir setzen dies in (3.5) ein, und erhalten
110 II. Differential- und Integralrechnung
1 1 1 sin4 α − + − sin2 α cos α = − cos α + sin2 α . 2 cos α cos α 2 Zusammen mit (3.7) bildet dies eine parametrische Darstellung der Kaustik. Wenn wir nun y durch x ausdr¨ucken wollen, m¨ussen wir nur sin α = x1/3 einsetzen, und erhalten 1 p (3.8) y = − 1 − x2/3 + x2/3 . 2 y=
Einh¨ullende von ballistischen Kurven Fragestellung. Eine Kanone im Koordinatenursprung verschieße Kugeln mit Anfangsgeschwindigkeit v0 = 1 unter allen H¨ohenwinkeln. Wir suchen die Einh¨ullende aller ballistischen Parabeln (Abb. 3.4). Diese Frage, die bereits von E. Torricelli (De motu projectorum 1644) betrachtet wurde, geh¨orte zu den ersten, die den jungen Joh. Bernoulli faszinierten (siehe Briefwechsel, S. 111).
0,4 0,2
0,5
1,0
ABB. 3.4a. Einh¨ullende von Wurfparabeln
ABB. 3.4b. Die Sonnen-Font¨ane“ ” von 1721, in Peterhof“, St. Petersburg ”
L¨osung. Sei a die Steigung der Kanone. Dann ist die Bewegung der Kugel (unter einer Schwerebeschleunigung von g = 1) gegeben durch t x(t) = √ , 1 + a2
at t2 y(t) = √ − . 2 1 + a2
√ Substituieren wir den Parameter t = x 1 + a2 , so erhalten wir
x2 (1 + a2 ) . 2 Ableitung von (3.9) bez¨uglich a ergibt ∂y/∂a = x − ax2 und Bedingung (3.2) f¨uhrt zu a = 1/x. Setzen wir dies in (3.9) ein, so erhalten wir (3.9)
y = ax −
y = (1 − x2 )/2,
folglich ist die Einh¨ullende eine Parabel, mit der Kanone in ihrem Brennpunkt.
II.3 Einh¨ullende und Kr¨ummung 111
Kr¨ummung Es gibt nur wenige Probleme u¨ ber Kurven, die so elegant sind wie dieses oder eine gr¨oßere Einsicht in die Natur bieten. (Newton 1671, engl. Ver¨off. 1736, S. 59)
Fragestellung. Zu einer gegebenen Kurve y = f (x) und einen gegebenen Punkt (a, f (a)) auf dieser Kurve, m¨ochten wir die Gleichung desjenigen Kreises finden, der so gut wie m¨oglich die Funktion f (x) in der Umgebung von a approximiert. Dieser Kreis heißt Kr¨ummungskreis und sein Zentrum ist der Kr¨ummungsmittelpunkt. Der Kehrwert seines Radius (des Kr¨ummungsradius) wird Kr¨ummung der Kurve am Punkt (a, f (a)) genannt. Ansatz (Newton 1671). Sei (3.10)
y = f (a) −
1 f ′ (a)
(x − a)
die Normale an die Kurve y = f (x) im Punkt x = a. Wenn wir a erh¨ohen ( imagine the point D to move in the curve an infinitely little distance“), so ” finden wir eine zweite Normale, die die erste im Kr¨ummungsmittelpunkt schneidet (Abb. 3.5). Wir finden dieselbe Situation vor wie bei den Einh¨ullenden (siehe Abb. 3.1b). Daher rechnen wir ∂y f ′′ (a) 1 = f ′ (a) + ′ (x − a) + ′ , ∂a (f (a))2 f (a)
(3.11)
und Bedingung (3.2) liefert uns den Kr¨ummungsmittelpunkt (3.12) 1 + (f ′ (a))2 f ′ (a) 1 + (f ′ (a))2 x0 − a x0 − a = − , y0 − f (a) = − ′ = . f ′′ (a) f (a) f ′′ (a) p F¨ur Radius r = (x0 − a)2 + (y0 − f (a))2 und Kr¨ummung κ finden wir daher (3.13)
1 + (f ′ (a))2 r= |f ′′ (a)|
3/2
und
κ=
1 + (f ′ (a))2
Beispiele. F¨ur die Parabel y = x2 erhalten wir r = Kr¨ummungsmittelpunkt ist gegeben durch (3.14) x0 = a −
(1 + 4a2 )2a = −4a3 , 2
|f ′′ (a)|
y0 = a2 +
1 (1 2
3/2 .
+ 4a2 )3/2 , und der
(1 + 4a2 ) 1 = + 3a2 . 2 2
Diese Formeln bilden eine parametrische Darstellung der Ortskurve (x0 , y0 ) s¨amtlicher Kr¨ummungsmittelpunkte. Sie wird als Evolute bezeichnet. Im Spezialfall der Gl. (3.14) kann der Parameter (hier a) substituiert werden, und wir finden (siehe Abb. 3.6b) 2
Abbildung mit Genehmigung der Editions Albert Blanchard, Paris.
112 II. Differential- und Integralrechnung
¨ ABB. 3.5. Kr¨ummung, Skizzen von Newton 1671, (Meth. Fluxionum; franz¨os. Ubers. 1740)2
2/3 1 x0 y0 = + 3 . 2 4 Abb. 3.6a illustriert, dass die Evolute die H¨ullkurve der Familie aller Normalen an die gegebene Kurve ist. 5
3
4 2
A
3 B
2 1
−2
−1
0
B 1
1
ABB. 3.6a. Evolute = H¨ullkurve der Normalen
2
−2
C C −1
0
1
2
3
4
ABB. 3.6b. Parabel y = x2 und ihre Evolute
Krummung ¨ einer Kurve in parametrischer Darstellung. Betrachten Sie eine Kurve, die durch (x(t), y(t)) gegeben ist, und nehmen Sie an, dass sie nahe dem Punkt (x(a), y(a)) durch y = f (x) beschrieben werden kann. Dann folgt aus (1.20) dy dy/dt y ′ (t) f ′ (x) = = = ′ , dx dx/dt x (t)
II.3 Einh¨ullende und Kr¨ummung 113
und f¨ur die zweite Ableitung gilt f ′′ (x) =
d dy d y ′ (t) . dx x′ (t)y ′′ (t) − x′′ (t)y ′ (t) = = . dx dx dt x′ (t) dt x′ (t)3
Eingesetzt in die Gleichungen (3.12) und (3.13) finden wir
y ′ (a) x′ (a)2 + y ′ (a)2 x0 − x(a) = − ′ , x (a)y ′′ (a) − x′′ (a)y ′ (a) x′ (a) x′ (a)2 + y ′ (a)2 y0 − y(a) = ′ , x (a)y ′′ (a) − x′′ (a)y ′ (a) 3/2 x′ (a)2 + y ′ (a)2 r= ′ . |x (a)y ′′ (a) − x′′ (a)y ′ (a)|
(3.15) (3.16) (3.17) 2
1
−1
0
1
2
3
4
5
6
7
−1
−2
ABB. 3.7. Zykloide und ihre Evolute
ABB. 3.8. Zeichnung einer Zykloide von Joh. Bernoulli (1955, S. 254, Brief vom 12. Jan. 1695 an de L’Hospital)3
Beispiel. Die Zykloide (beispielsweise die Spur des Ventils an einem Fahrradreifen) ist gegeben durch die parametrische Darstellung (3.18) 3
x = t − sin t,
y = 1 − cos t.
Abbildung mit Genehmigung des Birkh¨auser Verlags, Basel.
114 II. Differential- und Integralrechnung
Berechnen wir ihre Ableitungen, so erhalten wir aus Gl. (3.15) via (3.17), dass die Evolute der Zykloide gegeben ist durch (3.19)
x0 = a + sin a,
y0 = −1 + cos a.
Dies ist wieder eine Zykloide, nur in anderer Lage. Evolventen. Wir beginnen nun mit einer gegebenen Evolute ABB (Abb. 3.6b) und konstruieren aus ihr eine neue Kurve CC, die dadurch definiert ist, dass die Bogenl¨ange ABC konstant ist (man stelle sich einen Faden vor, der sich von der Evolute abwickelt). Diese neuen Kurven heißen Evolventen. Wenn einer der Punkte der Evolvente mit einem Punkt der urspr¨unglichen Funktion f (x) u¨ bereinstimmt, so haben beide Kurven dieselbe Kr¨ummung. Es folgt dann (wie mit Hilfe der Ideen in Abschnitt III.6 streng bewiesen werden muss), dass beide Kurven gleich sind. Damit ist nicht nur die Evolute, sondern auch die Evolvente einer Zykloide (unter korrekter Wahl der Bogenl¨ange) wieder eine Zykloide (Newton 1671, Prob. V, Nr. 34). Huygens (1673) hat diese Eigenschaft genutzt, um die besten Pendeluhren seines Jahrhunderts zu bauen, gr¨undend auf dem Fakt, dass ein Pendel, das sich auf einer Zykloide bewegt, isochron schwingt (siehe Abb. 7.8 aus Abschnitt II.7).
¨ Ubungen 3.1 Ein Stab der L¨ange 1 gleitet an einer vertikalen Wand herab (siehe Abb. 3.9a). Finden Sie die Formel der dadurch erzeugten Einh¨ullenden. 3.2 Finden Sie eine Formel f¨ur die Einh¨ullende, die von der folgenden Familie erzeugt wird (siehe Abb. 3.9b): 5 y = αx − (α3 − α). 2 3.3 (Cauchy 1824). Finden Sie die Einh¨ullende, die von der Familie von Parabeln y = b(x + b)2 mit Parameter b erzeugt wird (siehe Abb. 3.9c). 3.4 Berechnen Sie f¨ur die Funktion y = ln x den Kr¨ummungsradius am Punkt a und bestimmen Sie dasjenige a, f¨ur den dieser Radius minimal ist (siehe Abb. 3.9d). Man kann erkennen, dass die Evolute einen station¨aren Punkt (eine Spitze) an diesem Minimum besitzt. 3.5 Berechnen Sie die Evolute der Ellipse (siehe Abb. 3.9e) x2 y2 + 2 =1 2 a b
oder
x = a cos t y = b sin t
0 ≤ t ≤ 2π .
Bestimmen Sie ihre maximale und minimale Kr¨ummung. b2 a2 3 Ergebnis. x= a− cos3 t , y = b− sin t . a b
II.3 Einh¨ullende und Kr¨ummung 115
a)
1
b)
3 2
1
1 0 −3 −2 −1 −1
1
2
3
−2
d) 3
6
f)
3
2
9
1 −3
−2
−1
0
2 1
2
M
3
1
−1 −2
Evolute
2
−2
3
e)
y = ln x
1
−1
−3
1
0
−1
−2 0
c)
2
−2
−3
0
−1
1
N
2
ABB. 3.9. Evoluten und Einh¨ullende
3.6 Berechnen Sie den Kr¨ummungsradius der Kettenlinie y = (ex + e−x )/2. Zeigen Sie, dass dieser Radius f¨ur einen gegebenen Punkt M auf der Kurve die L¨ange der Normalen MN besitzt (siehe Abb. 3.9f). 3.7 Wir stellen in Abb. 3.7 fest, dass eine Speiche eines rollenden Rades eine Einh¨ullende erzeugt, die einer Mini-Zykloide halber H¨ohe a¨ hnelt. Dies wird noch deutlicher, wenn der gesamte Durchmesser gezeichnet wird (Abb. 3.10). Berechnen Sie die Einh¨ullende dieser Geradenfamilie y = 1 + (x − t) ·
cos t . sin t
2
1
−1
0
1
2
3
4
5
ABB. 3.10. Kleine Zykloide als Einh¨ullende
6
7
116 II. Differential- und Integralrechnung
Guillaume-Franc¸ois-Antoine de L’Hospital (1661–1704)5 Johann Bernoulli (1667–1748) Marquis de Sainte-Mesme et du Montellier Compte d’Autremonts, Seigneur d’Ouques et autres lieux 4
4 5
Abbildung mit Genehmigung des Georg Olms Verlags, Hildesheim. Abbildung mit Genehmigung des Birkh¨auser Verlags, Basel.
II.4 Integralrechnung 117
II.4 Integralrechnung . . . notam
R
pro summis, ut adhibetur nota d pro differentiis . . . (Letter of Leibniz to Joh. Bernoulli, March 8/18, 1696) . . . quod autem . . . vocabulum i n t e g r a l i s etiamnum usurpaverim . . . (Letter of Joh. Bernoulli to Leibniz, April 7, 1696) R r Und w¨ahrend M Leibnits den Buchstaben der Ordinate einer Kurve
voranstellt, um die Summe der Ordinaten oder die Fl¨ache der Kurve zu bezeichnen, habe ich einige Jahre zuvor dieselbe Sache durch ein Quadrat um die Ordinate dargestellt . . . Meine Symbole sind daher . . . die a¨ ltesten ihrer Art. (Newton, Brief an Keill, 20. April 1714)
Die Integralrechnung ist tats¨achlich wesentlich a¨ lter als die Differentialrechnung, insofern als die Berechnung von Fl¨acheninhalten, Oberfl¨achen und Volumina die besten Mathematiker seit der Antike besch¨aftigt hat: Archimedes, Kepler, Cavalieri, Viviani, Fermat (siehe Satz I.3.2), Gr´egoire de Saint-Vincent, Guldin, Gregory, Barrow. Der entscheidende Durchbruch aber kam, als Newton, Leibniz und Joh. Bernoulli unabh¨angig voneinander entdeckten, dass die Integration die Umkehrung der Differentiation ist, womit alle Anstrengungen der erstgenannten Forscher auf ein paar Ableitungsregeln zur¨uckgef¨uhrt wurden. Das Integrationszeichen stammt von Leibniz (1686), der Ausdruck Integral“ geht auf ” Joh. Bernoulli zur¨uck und wurde von seinem Bruder Jak. Bernoulli (1690) bekannt gemacht.
Stammfunktionen Zu einer vorgegebenen Funktion y = f (x) m¨ochten wir die zwischen der xAchse und dem Graphen der Funktion eingeschlossene Fl¨ache bestimmen. Wir legen einen Punkt a fest und bezeichnen mit z = F (x) die Fl¨ache unter f (x) zwischen a und x (Abb. 4.1a). Der entscheidende Punkt ist nun, dass (4.1)
die Funktion f (x) die Ableitung von F (x) ist.
Wir nennen F (x) dann eine Stammfunktion von f (x). Begrundung. ¨ Newton stellte sich vor, wie das Segment BD u¨ ber die betrachtete Fl¨ache streicht ( And conceive these Areas . . . to be generated by the lines BE and ” BD, as they move along . . .“, Abb. 4.1a, 4.1c); folglich muss die Fl¨ache, wenn x um ∆x anw¨achst, ihrerseits um ∆z = F (x + ∆x) − F (x) wachsen, was unter Vernachl¨assigung von Termen h¨oherer Ordnung in ∆x als f (x)∆x geschrieben werden kann (das dunkle Rechteck in Abb. 4.1a). Im Limes ∆x → 0 finden wir daher (4.2)
dz = f (x) · dx
und
dz = f (x). dx
118 II. Differential- und Integralrechnung
D
y = f (x) z = F(x)
dx B
a
x
a x1x2 . . .
xn = b
ABB. 4.1a. Newtons Idee ABB. 4.1b. Leibniz’ Idee ABB. 4.1c. Skizze von Newton1
Leibniz interpretierte die Fl¨ache als Summe (sp¨ater: Integral“) vieler kleiner ” Rechtecke (Abb. 4.1b): (4.3)
zn = f (x1 ) ∆x1 + f (x2 ) ∆x2 + . . . + f (xn ) ∆xn .
Daraus folgt, dass zn − zn−1 = f (xn ) ∆xn ,
und wieder erhalten wir (4.2), wenn ∆xi → 0. Daher ist die Ableitung die Umkehroperationen des Integrals, so wie die Subtraktion die Umkehroperation der Addition ist. Nach vielen Ans¨atzen notierte Leibniz die Summe in (4.3) (f¨ur den Limes ∆xi → 0) als (siehe Abb. 4.2) Z (4.4) f (x) dx. Heutzutage wird die Fl¨ache zwischen den Grenzen a und b mit Z b (4.5) f (x) dx, a
notiert (Fourier 1822), wohingegen (4.4), das unbestimmte Integral“ f¨ur eine be” liebige Stammfunktion F (x) von f (x) steht. Stammfunktionen sind nicht eindeutig; aus jeder Stammfunktion F (x) kann man durch Addition einer beliebigen Konstanten C eine weitere Stammfunktion F (x) + C derselben Ausgangsfunktion f (x) erhalten. F¨ur C = −F (a) erhalten 1
Abbildung mit Genehmigung der Editions Albert Blanchard, Paris.
II.4 Integralrechnung 119
wir diejenige Stammfunktion F (x) − F (a), die bei x = a verschwindet (so wie die Fl¨ache z). Folglich ist die Fl¨ache zwischen a und b gegeben durch Z
(4.6)
a
b
f (x) dx = F (b) − F (a)
(siehe Hauptsatz der Differential- und Integralrechnung“ in Abschnitt III.6). ”
ABB. 4.2. Erste Ver¨offentlichung des Integralzeichens, ein s“ in altem Schriftstil ” (Leibniz 1686)2
Indem wir die Ableitungsregeln umkehren, erhalten wir Formeln f¨ur Stammfunktionen. Beispielsweise hat die Funktion f (x) = xn+1 die Ableitung f ′ (x) = (n + 1) · xn . Deshalb muss xn+1 /(n + 1) eine Stammfunktion von xn sein. Diese und weitere Regeln aus Abschnitt II.1 sind in Tabelle 4.1 zusammengefasst. TABELLE 4.1. Eine kurze Tabelle der Stammfunktionen
Z Z Z Z
xn dx =
xn+1 +C n+1
Z
(n 6= −1)
1 dx = ln x + C x
ex dx = ex + C sin x dx = − cos x + C 1 dx = arctan x + C 1 + x2
Z
Z
cos x dx = sin x + C √
1 dx = arcsin x + C 1 − x2
Umfangreichere Integraltafeln k¨onnen mehrere hundert Seiten lang sein. Wir erw¨ahnen hier die Auflistungen von Gr¨obner & Hofreiter (1949) und Gradshteyn & Ryzhik (1980). In den letzten Jahren wurde dieses Wissen auch in viele Computeralgebrasysteme eingebaut.
Anwendungen Fl¨ache der Parabeln. Die Fl¨ache unter der Parabel n-ten Grades y = xn zwischen a und b lautet gem¨aß (4.6) und Tabelle 4.1 Z b xn+1 b bn+1 − an+1 (4.7) xn dx = , = n+1 a n+1 a 2
Abbildung mit Genehmigung der Bibl. Publ. Univ. Gen`eve.
120 II. Differential- und Integralrechnung
wobei wir bereits die Schreibweise F (x)|ba = F (b) − F (a) benutzt haben. F¨ur a = 0 ist diese Formel Fermats Satz I.3.2. Fl¨ache der Kreisscheibe. Um die Fl¨ache einer Viertelkreisschreibe vom Radius √ 1 zu berechnen, betrachten wir die Funktion f (x) = 1 − x2 f¨ur 0 ≤ x ≤ 1. Eine Stammfunktion von f (x) ist (4.8)
F (x) =
xp 1 1 − x2 + arcsin x. 2 2
Man kann dies durch Ableitung von (4.8) pr¨ufen. Sp¨ater werden wir sehen, wie man solche Formel direkt findet. Durch Anwendung von (4.6) erhalten wir nun Z 1p Fl¨ache der Einheitskreisschreibe = 4 1 − x2 dx = 4 F (1) − F (0) = π, 0
da sin(π/2) = 1. Es gibt noch einen eleganten Weg, den Kreisfl¨acheninhalt zu berechnen. Niemand zwingt uns dazu, anzunehmen, dass die Streifen f (x) dx d¨unne vertikale Rechtecke sind. Lassen Sie uns lieber die Scheibe (von Radius a) in unendlich d¨unne Dreiecke zerlegen (Kepler 1615, vergleichen Sie auch mit Leibniz’ Vorstellung, Fig. I.4.11). Die Fl¨ache eines solchen Dreiecks lautet dS =
a2 · dϕ , 2
wobei dϕ der unendlich kleine Zuwachs des Winkels ist. Die ganze Fl¨ache ist (als Summe all dieser Dreiecke) Z 2π 2 Z a dϕ a2 2π a2 2π S= = dϕ = ϕ = a2 π. 2 2 2 0 0 0
π/2
dϕ·a
ϕ 0
a
Volumen der Kugel. Betrachten Sie eine Kugel vom Radius a (siehe Abb. 4.3) und lassen √ Sie sie uns zerlegen in d¨unne Scheiben der Dicke dx und Radius r = a2 − x2 . Das Volumen einer solchen Scheibe ist dV = r2 π dx = (a2 − x2 )π dx und f¨ur das Gesamtvolumen der Kugel erhalten wir Z +a x3 +a 4a3 π V = (a2 − x2 )π dx = π xa2 − . = 3 −a 3 −a Arbeit in einem Kraftfeld. Nehmen wir an, dass eine Kraft f (x) in Richtung einer Geraden wirkt, die mit s parametrisiert ist. Die Arbeit, die n¨otig ist, um einen K¨orper von s nach s + ∆s zu bewegen, ist f (s)∆s (Kraft × Strecke). Daher Rb ist die gesamte Arbeit a f (s) ds. Beispiel. Die Anziehungskraft der Erde auf eine Masse von 1 kg betr¨agt f (s) = 9,81 · R2 /s2 [N ] , wobei s der Abstand zum Erdmittelpunkt ist. Folglich ist die
II.4 Integralrechnung 121
dx x = −a
(a2 − x2)1/2 x=a
ABB. 4.3. Volumen der Sph¨are
Energie, die n¨otig ist, um 1 kg aus dem Ruhezustand von der Erdoberfl¨ache ins Unendliche zu heben, gegeben durch Z ∞ R2 R2 ∞ E= 9,81 2 ds = −9,81 = 9,81 R = 62 · 106 [J]. s s R R Bogenl¨ange. Das Fluxion der L¨ange wird bestimmt, indem man es mit der Quadratwurzel aus der Summe der Quadrate der Fluxione der Abszisse und der Ordinate gleichsetzt. (Newton 1736, Fluxions, S. 130)
Wir wollen die L¨ange L einer Kurve y(x) f¨ur a ≤ x ≤ b berechnen. Wenn wir x um ∆x erh¨ohen (siehe Abb. 4.4), so w¨achst die Ordinate um ∆y = y ′ (x)∆x (wir vernachl¨assigen Terme h¨oherer Ordnung). Dies impliziert, dass die L¨ange eines kleinen St¨ucks der Kurve durch ∆s gegeben ist, mit ∆s2 = ∆x2 + ∆y 2 = 1 + y ′ (x)2 ∆x2 (Satz des Pythagoras). F¨ur den Limes ∆x → 0 erhalten wir Z bp p (4.9) ds = 1 + y ′ (x)2 · dx und L= 1 + y ′ (x)2 dx. a
Beispiel. F¨ur die Parabel y = x2 finden wir y ′ = 2x, und als L¨ange des Bogens zwischen x = 0 und x = 1 (siehe (4.27) unten) Z 1p 1 p 1 p 1 L= 1 + 4x2 dx = x 1 + 4x2 + ln 2x + 4x2 + 1 2 4 0 0 √ √ 5 1 = + ln(2 + 5 ). 2 4
122 II. Differential- und Integralrechnung
1 dy
ds
dy dx dx
0
0
1
ABB. 4.4. Bogenl¨ange von y = x2
Schwerpunkt. Nehmen wir beispielhaft an, zwei verbundene Massen m1 , m2 befinden sich an den Punkten x1 , x2 auf der Abszisse. Das Gesamtdrehmoment, das auf den Ursprung wirkt, ist m1 x1 + m2 x2 . Der Schwerpunkt x ist nun derjenige Punkt, an dem beide Massen gemeinsam dasselbe Drehmoment erzeugen w¨urden, also (4.10)
(m1 + m2 ) · x = m1 x1 + m2 x2 .
Wenn sich die Dichte eines K¨orpers entlang seiner Ausdehnung kontinuierlich in der Weise a¨ ndert, dass eine Scheibe der Dicke dx die Masse m(x) dx besitzt, finden wir in Analogie zu (4.10) Rb Z b Z b x m(x) dx (4.11) m(x) dx · x = x m(x) dx und x = Ra b . a a m(x) dx a
Beispiel. F¨ur ein Dreieck, das von der Geraden y = cx und 0 ≤ x ≤ a begrenzt wird, gilt Ra 2 cx dx a3 /3 2a (4.12) m(x) = cx, x = R0a = 2 = . a /2 3 cx dx 0 Bemerkung. f (x) (die die BeR ∞ F¨ur eine Zufallsvariable X mit ”Dichtefunktion“ R∞ dingung −∞ f (x) dx = 1 erf¨ullt), ist der Wert x = −∞ x f (x) dx gerade der Mittelwert von X.
Integrationsmethoden Wir werden nun einige allgemeine Techniken demonstrieren, wie man Stammfunktionen findet. Einen systematischen Zugang zu bestimmten Klassen von Funktionen wird in Abschnitt II.5 vorgestellt. Unsere erste Beobachtung ist, dass Integration eine lineare Operation ist, d.h. Z Z Z (4.13) c1 f1 (x) + c2 f2 (x) dx = c1 f1 (x) dx + c2 f2 (x) dx. Dies folgt sofort aus der Tatsache, dass die Ableitung linear ist (siehe (1.3)).
II.4 Integralrechnung 123
Substitutionsregel. Nehmen wir an, F (z) ist eine Stammfunktion von f (z), d.h. F (z) = f (z), und betrachten wir die Ersetzung z = g(x), welche die Variable z in x u¨ berf¨uhrt. Dann folgt aus (1.16), dass F g(x) eine Stammfunktion von f g(x) g ′ (x) ist. ′
Dies impliziert (4.14)
Z
b a
f g(x) g ′ (x) dx =
Z
g(b)
f (z) dz,
g(a)
da gem¨aß (4.6) beide Terme gleich F g(b) − F g(a) sind. Den Ausdruck auf der linken Seite erh¨alt man, indem man z durch g(x) in f (z) und dz = g ′ (x)dx ersetzt.
ABB. 4.5. Ersetzen einer Variable in einem Integral
Geometrische Interpretation. Wir wollen das Integral Z 1,5 4x dx 1 + x2 0
berechnen und benutzen hierf¨ur die Substitution z = x2 . Wegen dz = 2x dx erhalten wir aus Gl. (4.14) Z 1,5 Z 2,25 2,25 2 2 · 2x dx = dz = 2 · ln(1 + z) 2 1 + x 1 + z 0 0 0 1,5 = 2 · ln(1 + x2 ) = 2 ln(3,25). 0
Abb. 4.5 veranschaulicht die Transformation z = x2 und die Funktionen 4x/(1 + x2 ) und 2/(1 + z). Die Punkte x und x + ∆x werden auf z = x2 und z + ∆z = x2 +2x∆x+∆x2 abgebildet. Folglich sind die schattierten Rechtecke f¨ur ∆x → 0 gleich groß, und beide Integrale in (4.14) haben den gleichen Wert.
124 II. Differential- und Integralrechnung
Beispiele. Die ganze Kunst besteht darin, eine geeignete“ Substitution zu finden. ” Wir demonstrieren dies in einer Reihe von Beispielen. F¨ur Funktionen der Form f (ax + b) ist die Ersetzung z = ax + b oft sinnvoll. Beispielsweise haben wir mit z = 5x + 2, dz = 5 dx Z Z dz 1 1 (4.15) e5x+2 dx = ez = ez = e5x+2 . 5 5 5 Manchmal kann man die Anwesenheit des Faktors g ′ (x) f¨ur eine Ersetzung z = g(x) sehr einfach erkennen. Beispielsweise dr¨angt einem bereits die bloße Anwesenheit des Faktors x in unten stehendem Integral die Substitution z = −x2 , dz = −2x dx auf, so dass wir erhalten: Z Z 2 1 1 1 −x2 (4.16) xe dx = − ez dz = − ez = − e−x . 2 2 2 √ In Tabelle 4.1 finden wir die Integrale von √ 1/(1 + x2 ) und 1/ 1 − x2 . Wenn wir nun beispielsweise f¨ur 1/(7 + x2 ) oder 1/√ 7 − x2 Stammfunktionen finden √ wollen, substituieren wir x2 = 7z 2 bzw. x = 7 z, dx = 7 dz. Damit erhalten wir Z Z √ dx 7 dz 1 1 x (4.17) = = √ arctan z = √ arctan √ . 2 2 7+x 7(1 + z ) 7 7 7 Quadratische Ausdr¨ucke x2 + 2bx + c lassen sich oft dadurch vereinfachen, dass man sie quadratisch erg¨anzt zu (x + b)2 + (c − b2) und dann die Substitution z = x + b folgen l¨asst. Auf diese Weise k¨onnen wir folgendes Integral durch die Substitution z = x + 1/2 auf das Integral der Gl. (4.17) zur¨uckf¨uhren: (4.18) Z Z 2x + 1 dx dz 2 2z 2 √ √ √ √ = = arctan = arctan . x2 + x + 1 z 2 + 3/4 3 3 3 3 Als abschließendes Beispiel betrachten wir die Funktion (x+2)/(x2 +x+1) (Euler 1768 § 62). Wir schreiben hierf¨ur den Z¨ahler als x+2 = (x+1/2)+3/2, so dass der erste Teil x+1/2 ein skalares Vielfaches der Ableitung des Nenners wird. Diesen Teil des Integrals berechnen wir dann mit der Substitution z = x2 + x + 1. Der zweite Teil ist ein Vielfaches von (4.18), so dass wir in der Summe folgendes Ergebnis finden: Z 2x + 1 √ x+2 1 2 √ (4.19) dx = ln(x + x + 1) + 3 arctan . x2 + x + 1 2 3 Partielle Integration. Eine zweite Integrationstechnik basiert auf der Ableitungsregel (1.4) f¨ Integration der Formel (uv)′ = u′ v + uv ′ liefert Rur Produkte. ′ u(x)v(x) = u (x)v(x) + u(x)v′ (x) dx bzw. (4.20)
Z
u′ (x)v(x) dx = u(x)v(x) −
Z
u(x)v′ (x) dx.
II.4 Integralrechnung 125
Durch diese Formel wird ein Integral durch ein anderes ersetzt. Wenn man jedoch die Faktoren u′ und v geschickt w¨ahlt, kann man das zweite Integral zuweilen einfacher berechnen als das erste. R Beispiele. Lassen Sie uns versuchen, das Integral x sin x dx zu berechnen. Es w¨urde nichts bringen, u′ (x) = x (also u(x) = x2 /2) und v(x) = sin x zu w¨ahlen, da dann das zweite Integral noch viel schwieriger wird als das urspr¨ungliche. Daher w¨ahlen wir u′ (x) = sin x (mit u(x) = − cos x) und v(x) = x. Gleichung (4.20) liefert dann Z Z (4.21) x sin x dx = −x cos x + 1 · cos x dx = −x cos x + sin x. Manchmal muss man die partielle Integration mehrfach wiederholen. In folgendem Beispiel setzen wir zun¨achst v(x) = x2 , u′ (x) = ex und anschließend in einer zweiten partiellen Integration v(x) = x, u′ (x) = ex : Z Z 2 x 2 x (4.22) x e dx = x e − 2 x ex dx = ex (x2 − 2x + 2). Funktionen wie ln x und arctan x besitzen einfache Ableitungen. Sie spielen oft die Rolle von v(x): Z Z Z x (4.23) ln x dx = 1 · ln x dx = x ln x − dx = x(ln x − 1), x
(4.24)
Z
arctan x dx = x arctan x − = x arctan x −
Z
x dx 1 + x2
1 ln(1 + x2 ). 2
In diesem Fall wird das letzte Integral durch die Substitution z = 1 + x2 , dz = 2x dx gel¨ost. R√ Betrachten wir nun als n¨achstes das Integral 1 + 4x2 dx, das uns in der Berechnung der√Bogenl¨ange der Parabel begegnete. Partielle Integration mit u′ (x) = 1, v(x) = 1 + 4x2 liefert Z p Z p 4x2 2 2 √ (4.25) 1 + 4x dx = x 1 + 4x − dx. 1 + 4x2
Nun sieht das zweite Integral zun¨achst nicht besser aus als das erste. Jedoch kann man nun den Z¨ahler zerlegen in 4x2 R=√(1+4x2 )−1. Das Integral spaltet sich dann in zwei Teile, von denen der eine − 1 + 4x2 dx lautet (das ist das Integral, das wir suchen) und auf die linke Seite gebracht werden kann; der √andere ist das letzte Integral aus Tabelle 4.1: Die Ableitung von arsinh z ist 1/ 1 + z 2 , so dass wir ¨ mit der Substitution z = 2x (siehe Ubung I.4.3) erhalten: Z p dx 1 1 √ (4.26) = arsinh (2x) = ln 2x + 4x2 + 1 . 2 2 1 + 4x2
126 II. Differential- und Integralrechnung
F¨ur (4.25) bedeutet dies: Z p p 1 p 1 (4.27) 1 + 4x2 dx = x 1 + 4x2 + ln 2x + 4x2 + 1 . 2 4 Rekursive Integrale. Angenommen, wir wollen Z (4.28) In = sinn x dx
berechnen. Wir w¨ahlen u′ (x) = sin x, v(x) = sinn−1 x und wenden partielle Integration an. Wir finden Z Z sinn x dx = − cos x sinn−1 x + (n − 1) cos2 x sinn−2 x dx. Nun setzen wir cos2 x = 1 − sin2 x ein, so dass das rechte Integral in die zwei Integrale In−2 und In zerf¨allt. Bringen wir In auf die linke Seite, so erhalten wir (1 + n − 1)In = − cos x sinn−1 x + (n − 1)In−2 , bzw. (4.29)
In = −
1 n−1 cos x sinn−1 x + In−2 . n n
R Diese Rekursionsformel kann man nun R nutzen, um jedes In auf I1 = sin x dx = − cos x (f¨ur ungerades n) oder I0 = dx = x (f¨ur gerades n) zur¨uckzuf¨uhren. Als ein weiteres Beispiel betrachten wir das Integral Z dx (4.30) Jn = . (1 + x2 )n In Ermangelung einer besseren Idee, wenden wir eine partielle Integration mit u′ (x) = 1 und v(x) = 1/(1 + x2 )n an: Z Z 1 x 2x2 Jn = 1 · dx = + n dx. 2 n 2 n (1 + x ) (1 + x ) (1 + x2 )n+1
Wir wiederholen unseren Trick aus (4.25), schreiben im letzten Integral 2x2 = 2(1 + x2 ) − 2, und finden Jn =
x + 2nJn − 2nJn+1 . (1 + x2 )n
Wir scheinen kein Gl¨uck gehabt zu haben, da der Index n gr¨oßer geworden ist anstatt kleiner. Das spielt aber keine Rolle: Wir l¨osen die Formel einfach nach Jn+1 auf und erhalten (4.31)
Jn+1 =
1 x 2n − 1 + Jn . 2n (1 + x2 )n 2n
Diese Beziehung f¨uhrt die Berechnung von (4.30) auf die von J1 = arctan x zur¨uck.
II.4 Integralrechnung 127
Taylorsche Formel mit Restglied Joh. Bernoulli (1694b, Effectiones omnium quadraturam . . .“) berechnete Inte” grale durch wiederholte partielle Integration und fand generalissimam“ Reihen, ” die denen a¨ hnelten, die sp¨ater von Taylor entdeckt wurden. Cauchy (1821) fand dann heraus, dass diese Methode, geschickt modifiziert, zielstrebig zu Taylors Reihen f¨ur eine Funktion f f¨uhrt, zusammen mit einem Fehlerglied, das sich als Integral ausdr¨ucken ließ. Der Ansatz besteht dabei darin (siehe (4.6)), Z x f (x) = f (a) + 1 · f ′ (t) dt a
zu schreiben, und dann mit u (t) = 1 und v(t) = f ′ (t) partiell zu integrieren. Der Knackpunkt ist, dass wir u(t) = −(x − t) anstelle von u(t) = t einsetzen (x ist dabei eine Konstante). So erhalten wir x Z x ′ f (x) = f (a) − (x − t)f (t) + (x − t)f ′′ (t) dt a a Z x ′ = f (a) + (x − a)f (a) + (x − t)f ′′ (t) dt. ′
a
Im n¨achsten Schritt w¨ahlen wir u(t) = −(x − t)2 /2! und v(t) = f ′′ (t) mit dem Ergebnis Z x (x − a)2 ′′ (x − t)2 ′′′ ′ f (x) = f (a) + (x − a)f (a) + f (a) + f (t) dt. 2! 2! a Wiederholen wir diese Vorgehensweise, gelangen wir zum gesuchten Resultat:
(4.32)
f (x) =
k X (x − a)i i=0
i!
f
(i)
(a) +
Z
a
x
(x − t)k (k+1) f (t) dt. k!
Beispiel. F¨ur f (x) = ex , f (i) (x) = ex und a = 0 wird Gl. (4.32) zu Z x x2 xk (x − t)k t (4.33) ex = 1 + x + + ... + + e dt. 2! k! k! 0
Es mag Sie erstaunen, dass der Fehlerterm der Reihe durch ein Integral ausgedr¨uckt wird, nachdem wir soviel M¨uhe damit hatten, solche Integrale auszurechnen. Wenn man das Integral in (4.33) ausrechnet, erh¨alt man auch tats¨achlich nur Pk ex − i=0 xi /i!, was uns kein St¨uck weiterhilft. Die weitere Vorgehensweise lautet nun, den Integranden in (4.33) durch etwas einfacheres zu ersetzen, um den Fehlerterm zumindest abzusch¨atzen. Wenn wir beispielsweise annehmen, dass 0 ≤ x ≤ 1, und damit auch 0 ≤ t ≤ 1, so werden sich die Funktionswerte et zwischen 1 und 3 aufhalten. Es erscheint nun zweckm¨aßig (und dies wird sp¨ater Satz III.5.14 sein), dass die dazu geh¨orige Fl¨ache ebenfalls zwischen
128 II. Differential- und Integralrechnung
Z
0
x
(x − t)k xk+1 · 1 dt = k! (k + 1)!
und
Z
0
x
(x − t)k 3xk+1 · 3 dt = . k! (k + 1)!
liegen wird. Dies erlaubt uns die Schlussfolgerung, dass, beispielsweise f¨ur k = 10, der Fehlerterm kleiner ist als 10−7 .
¨ Ubungen 4.1 Es sei eine Kurve in parametrischer Darstellung x(t), y(t) gegeben. Zeigen Sie, dass ihre Bogenl¨ange f¨ur a ≤ t ≤ b Z bp L= x′ (t)2 + y ′ (t)2 dt a
lautet. Berechnen Sie die Bogenl¨ange der Zykloide (3.18) f¨ur 0 ≤ t ≤ 2π. 4.2 Berechnen Sie die Integrale Z Z Z x dx dx √ √ a) , b) , c) x2 sin x dx, 9 − x2 9 − x2 Z Z Z dx 3 −x2 d) I−n = , e) x e dx, f) arccos x dx, sinn x Z Z Z x dx g) eαx cos βx dx, h) eαx sin βx dx, i) . x2 − 6x + 13
Hinweise. F¨ur (d) kehren Sie Gl. (4.29) um, f¨ur (e) schreibenRSie x3 = x · x2 , (g) und (h) k¨onnen Sie entweder partiell integrieren oder e(α+iβ)x dx in Real- und Imagin¨arteil zerlegen. 4.3 Zeigen Sie durch wiederholte partielle Integration, dass f¨ur ganze Zahlen m und n gilt: Z b (b − x)m (x − a)n (b − a)m+n+1 (4.34) dx = . m! n! (m + n + 1)! a Insbesondere gilt Z
1
−1
(1 − x2 )n dx =
2 · 2 · 4 · 6 · · · 2n . 1 · 3 · 5 · · · (2n + 1)
II.5 Elementar integrierbare Funktionen 129
II.5 Elementar integrierbare Funktionen Die obige Gr¨oße ppads qqss − ppaa
¨ reduziert sich unmittelbar, ohne jede Anderung, auf zwei logarithmische Br¨uche, indem man sie wie folgt zerlegt: 1 1 pds pds ppads = 2 − 2 ... qqss − ppaa qs − pa qs + pa (Anhang an einen Brief von Joh. Bernoulli, 1699, siehe Briefwechsel, Band 1, S. 212) Problem 3: Wenn X f¨ur eine beliebige rationale Funktion in x steht, beschreibe man eine Methode, mit der man den Ausdruck Xdx integrieren kann. (Euler 1768, Opera Omnia, Band XI, S. 28)
Im vorigen Abschnitt haben wir einige Integrationsmethoden kennen gelernt. Nun wollen wir diese Methoden systematisch einsetzen, um zu zeigen, dass einige Klassen von Funktionen elementar integrierbar sind, d.h. dass ihre Stammfunktionen elementare Funktionen sind. Elementare Funktionen sind dabei solche Funktionen, die sich aus Polynomen, rationalen, Exponential-, Logarithmus-, trigonometrischen und Arkusfunktionen zusammensetzen.
Integration rationaler Funktionen Sei R(x) = P (x)/Q(x) eine rationale Funktion (mit den Polynomen P (x) und R Q(x)). Wir werden einen konstruktiven Beweis pr¨asentieren, dass R(x) dx elementar ist. Die Berechnung der Stammfunktion geschieht dabei in drei Schritten: – R¨uckf¨uhrung auf den Fall deg P < deg Q (dabei ist deg P der Grad von P (x)); – Faktorisierung von Q(x) und Zerlegung von R(x) in Partialbr¨uche; sowie – Integration der Partialbr¨uche.
Ruckf ¨ uhrung ¨ auf den Fall deg P < deg Q. Wir k¨onnen eine erste Vereinfachung der Funktion R(x) im Fall deg P ≥ deg Q erzielen. In dieser Situation teilen wir P durch Q und erhalten (5.1)
P (x) Pb (x) = S(x) + , Q(x) Q(x)
wobei S(x) und Pb(x) Polynome sind (Quotient und Rest) mit deg Pb < deg Q. Als Beispiel betrachten wir (5.2)
P (x) 2x6 − 3x5 − 9x4 + 23x3 + x2 − 44x + 39 = . Q(x) x5 + x4 − 5x3 − x2 + 8x − 4
Wir entfernen zuerst den Term 2x6 , indem wir 2x · Q(x) von P (x) abziehen, sodann f¨ugen wir 5Q(x) zu P (x) hinzu und gelangen zu
130 II. Differential- und Integralrechnung
(5.3)
P (x) 6x4 − 20x2 + 4x + 19 = 2x − 5 + 5 . Q(x) x + x4 − 5x3 − x2 + 8x − 4
Das Polynom S(x) l¨asst sich schnell integrieren, so dass nur der zweite Term in (5.1) noch weiterer Beachtung bedarf. Zerlegung in Partialbruche. ¨ Wir nehmen an, dass eine Faktorisierung von Q(x) in lineare Terme bekannt ist: (5.4)
m1
Q(x) = (x − α1 )
(x − α2 )
m2
· . . . · (x − αk )
mk
=
k Y
i=1
(x − αi )mi .
Dabei sind α1 , . . . , αk voneinander verschiedene (m¨oglicherweise komplexe) Wurzeln von Q(x) und die mi ihre zugeh¨origen Vielfachheiten. Das folgende Lemma zeigt, wie unsere rationale Funktion als Linearkombination einfacher Br¨uche geschrieben werden kann, sogenannter Partialbr¨uche. Dieses Prinzip geht zur¨uck auf einen Briefwechsel zwischen Joh. Bernoulli und Leibniz (um 1700), und wurde von Joh. Bernoulli (1702), Leibniz (1702), Euler (1768, Caput I, Problema 3), und Hermite (1873) systematisch erforscht. (5.1) Lemma. Sei Q(x) wie in (5.4), und sei P (x) ein Polynom, das deg P < deg Q erf¨ullt. Dann gibt es Konstanten Cij mit k
(5.5)
m
i P (x) X X Cij = . Q(x) (x − αi )j i=1 j=1
Beweis. Wir entfernen wie folgt einen Faktor nach dem anderen aus Q(x): Wir schreiben Q(x) = (x − α)m q(x), wobei α eine Wurzel von Q(x) und q(α) 6= 0 ist. Wir werden die Existenz einer Konstanten C und eines Polynom p(x) vom Grad < deg Q − 1 nachweisen mit (5.6)
P (x) C p(x) = + , (x − α)m q(x) (x − α)m (x − α)m−1 q(x)
oder, was dazu (durch Multiplikation mit dem gemeinsamen Teiler) a¨ quivalent ist: (5.7)
P (x) = C · q(x) + p(x) · (x − α).
Der Spezialfall x = α erzwingt die Wahl (5.8)
C = P (α)/q(α).
Das Polynom p(x) erh¨alt man nun, indem man P (x) − C · q(x) durch den Faktor (x − α) teilt. Dieser Algorithmus wird nun auf den rechten Ausdruck von (5.6) rekursiv angewendet, bis wir die gew¨unschte Zerlegung (5.5) vorfinden. ⊓ ⊔
II.5 Elementar integrierbare Funktionen 131
Beispiel. Das Polynom Q(x) auf (5.2) besitzt die Faktorisierung (5.9)
Q(x) = x5 + x4 − 5x3 − x2 + 8x − 4 = (x − 1)3 (x + 2)2 .
Wenden wir (5.7) und (5.8) mit α = −2 und m = 2 an, erhalten wir f¨ur (5.6): 6x4 − 20x2 + 4x + 19 −1 6x3 − 11x2 − x + 9 = + . (x − 1)3 (x + 2)2 (x + 2)2 (x − 1)3 (x + 2) Eine zweite Anwendung mit α = −2 und m = 1 ergibt (5.10)
6x4 − 20x2 + 4x + 19 −1 3 3x2 − 8x + 6 = + + . (x − 1)3 (x + 2)2 (x + 2)2 x+2 (x − 1)3
Im letzten Ausdruck setzen wir x = (x − 1) + 1 ein, also 3x2 − 8x + 6 = 3(x − 1)2 − 2(x − 1) + 1, und schließlich wird aus (5.10) (5.11) 6x4 − 20x2 + 4x + 19 1 −2 3 −1 3 = + + + + . 3 2 3 2 2 (x − 1) (x + 2) (x − 1) (x − 1) x − 1 (x + 2) x+2 Zweite M¨oglichkeit. Aus Lemma 5.1 wissen wir, dass es eine Zerlegung (5.12) 6x4 − 20x2 + 4x + 19 A0 A1 A2 B0 B1 = + + + + . (x − 1)3 (x + 2)2 (x − 1)3 (x − 1)2 x − 1 (x + 2)2 x + 2 gibt. Die Koeffizienten Ai und Bi k¨onnen nun wie folgt berechnet werden: Wir multiplizieren Gl. (5.12) mit (x − 1)3 und erhalten 6x4 − 20x2 + 4x + 19 = A0 + A1 (x − 1) + A2 (x − 1)2 + (x − 1)3 g(x), (x + 2)2 mit einer Funktion g(x), die in einer Umgebung von x = 1 wohldefiniert ist. Daher sind die Ai die ersten Koeffizienten der Taylorreihe von P (x)/(x + 2)2 (siehe Abschnitt II.2) und erf¨ullen 1 di 6x4 − 20x2 + 4x + 19 , i! dxi (x + 2)2 x=1
Ai =
also A0 = 1, A1 = −2, A2 = 3. Auf a¨ hnliche Weise erhalten wir Bi =
1 di 6x4 − 20x2 + 4x + 19 , i! dxi (x − 1)3 x=−2
bzw. B0 = −1, B1 = 3.
Integration der Partialbruche. ¨ Die einzelnen Terme der Zerlegung (5.5) k¨onnen auf einfache Weise integriert werden, wenn wir die Formeln aus Abschnitt II.4 einsetzen (siehe Tabelle 4.1):
132 II. Differential- und Integralrechnung
(5.13)
Z
−1 dx = (j − 1)(x − α)j−1 (x − α)j ln(x − α)
falls j > 1 falls j = 1.
F¨ugen wir die Gleichungen (5.3), (5.9) und (5.11) zusammen, erhalten wir f¨ur unser Beispiel die Stammfunktion Z P (x) 1 2 1 dx = x2 −5x− + +3 ln(x−1)+ +3 ln(x+2)+C. 2 Q(x) 2(x − 1) x − 1 x+2 Falls alle Wurzeln von Q(x) reell sind (d.h. die αi aus (5.4) sind allesamt reell), so sind auch die Cij in (5.5) reell und wir haben das Integral als Linearkombination reeller Funktionen ausgedr¨uckt. Aber nichts h¨alt uns davon ab, den obigen Reduktionsprozess auch in F¨allen anzuwenden, in denen Q(x) komplexe Wurzeln hat. R Beispiel mit komplexen Wurzeln. Nehmen wir an, wir wollen (1 + x4 )−1√dx √ 4 berechnen. Die Wurzeln von x + 1 = 0√ sind α1 = (1 + i)/ 2, α2 = (1 − i)/ 2, √ α3 = (−1 + i)/ 2, α4 = (−1 − i)/ 2, die Zerlegung von Lemma 5.1 f¨uhrt daher zu 1 A B √ + √ = 4 1+x x − (1 + i)/ 2 x − (1 − i)/ 2 C D √ + √ . (5.14) + x + (1 − i)/ 2 x + (1 + i)/ 2 Aus (5.8) folgern wir
α3 −1 α4
α1 0
1 α2
√ 1 1 2 √ √ = A= = √ √ (−1 − i), (α1 − α2 )(α1 − α3 )(α1 − α4 ) 8 i 2 · 2 · ( 2 + i 2) √ √ √ und auf a¨ hnliche Weise B = (−1+i) 2/8, C = (1−i) 2/8, D = (1+i) 2/8. Daher gilt Z √ √ dx = A ln(x − (1 + i)/ 2) + B ln(x − (1 − i)/ 2) 4 1+x (5.15) √ √ + C ln(x + (1 − i)/ 2) + D ln(x + (1 + i)/ 2). Nutzen wir (I.5.11) und die Relation arctan u + arctan(1/u) =
π/2 falls u > 0 −π/2 falls u < 0,
die sowohl aus (I.4.5) als auch aus (I.4.32) folgt, so gelangen wir zu Z dx 1 x−α = ln(x − α − iβ) = ln (x − α)2 + β 2 + i arctan , x − (α + iβ) 2 β und k¨onnen die rechte Seite des Ausdrucks (5.15) nun schreiben als
II.5 Elementar integrierbare Funktionen 133
(5.16) √ √ √ Z √ √ dx 2 x2 + 2x + 1 2 √ = ln + arctan(x 2+1)+arctan(x 2−1) . x4 + 1 8 x2 − 2x + 1 4 Vermeidung komplexer Arithmetik. Wann immer komplexe Arithmetik unerw¨unscht ist, kann man auch wie folgt vorgehen: Nehmen wir an, dass das Polynom Q(x) genau l verschiedene komplex-konjugierte Paare von Wurzeln α1 ± iβ1 , . . . , αl ± iβl und k verschiedene reelle Wurzeln γ1 , . . . , γk hat. Dann haben wir die reelle Faktorisierung (5.17)
Q(x) =
l Y
i=1
(x − αi )2 + βi2
k mi Y
i=1
(x − γi )ni ,
wobei mi und ni die Vielfachheiten der Wurzeln sind. Eine reelle Version von Lemma 5.1 lautet dann: (5.2) Lemma. Sei Q(x) gegeben durch (5.17) und sei P (x) ein Polynom mit reellen Koeffizienten und deg P < deg Q. Dann gibt es reelle Konstanten Aij , Bij und Cij , so dass gilt: l
(5.18)
m
k
n
i i XX P (x) X X Aij + Bij x Cij = + . j 2 2 Q(x) (x − γi )j i=1 j=1 (x − αi ) + βi i=1 j=1
Beweis. F¨ur die reellen Wurzeln gilt das im Beweis von Lemma 5.1 mgesagte. F¨ur die komplexen Wurzeln schreiben wir nun Q(x) = (x − α)2 + β 2 q(x), wobei α+iβ eine Wurzel von Q(x) und q(α±iβ) 6= 0 ist. Dann gibt es reelle Konstanten A, B und ein Polynom p(x) vom Grad < deg Q − 2, so dass P (x) A + Bx p(x) m m + = . m−1 2 (x − α)2 + β 2 q(x) (x − α)2 + β 2 (x − α) + β 2 q(x)
Um dies einzusehen, betrachten wir die a¨ quivalente Gleichung
P (x) = (A + Bx) · q(x) + p(x) · (x − α)2 + β 2 .
Aus den Spezialf¨allen x = α ± iβ erhalten wir A und B, und das Polynom p(x) folgt dann aus der Division von P (x) − (A + Bx) · q(x) durch den Faktor (x − α)2 + β 2 . So wie im Beweis von Lemma 5.1 erhalten wir Formel (5.18) durch eine Induktion nach dem Grad von Q(x). ⊓ ⊔ Um den allgemeinen Term aus (5.18) zu integrieren, schreiben wir ihn als A + Bx (x −
α)2
+
j β2
=
B(x − α)
(x −
α)2
+
j β2
+
A + Bα (x − α)2 + β 2
j .
134 II. Differential- und Integralrechnung
Den ersten Term in dieser Summe k¨onnen wir sofort mit Hilfe der Substitution z = (x − α)2 + β 2 , dz = 2(x − α)dx integrieren. Im zweiten Term setzen wir die Substitution z = (x − α)/β ein und finden das Integral (4.30) aus Abschnitt II.4. Daher gilt f¨ur j = 1 Z x − α A + Bα A + Bx B dx = ln (x − α)2 + β 2 + arctan , 2 2 (x − α) + β 2 β β und f¨ur j > 1 Z A + Bx
(x − α)2 + β 2
j dx =
−B
2(j − 1) (x − α)2 + β 2
mit J1 (z) = arctan z und (5.19)
Jj+1 (z) =
j−1 +
A + Bα x − α Jj , β 2j−1 β
z 2j − 1 + Jj (z). j + 1) 2j
2j(z 2
Beispiel. F¨ur die Funktion aus Gl. (5.14) liefert uns Lemma 5.2 die Zerlegung 1 1 A + Bx C + Dx √ √ √ √ = = + . 2 2 2 2 1 + x4 (x + 2x + 1)(x − 2x + 1) x + 2x + 1 x − 2x + 1 √ √ Multiplizieren wir diese Relation mit (x2 + 2x+1) und setzen x = (−1±i)/ 2 ein, so erhalten wir 1 1±i (−1 ± i) = =A+B √ , 2 ∓ 2i 4 2 √ und wir finden A = 1/2, B = 2/4 durch den Vergleich √ von Real- und Imagin¨arteil dieser Formel. Die Konstanten C = 1/2 und D = − 2/4 folgen analog. Benutzen wir nun obige Formeln, gelangen wir wieder zu (5.16). Bemerkung. Die neue Technik der Partialbruchzerlegungen entfachte bei den Mathematikern des 18ten Jahrhunderts das Interesse an Wurzeln von Polynomen und an der Algebra aufs Neue.
N¨utzliche Substitutionen Wir kombinieren nun das obige Resultat mit speziellen Substitutionen, um so zu weiteren Klassen von Funktionen mit elementaren unbestimmten Integralen zu gelangen. In diesem gesamten Abschnitt soll dabei R f¨ur eine rationale Funktion mit ein, zwei oder drei Argumenten stehen. √ R Integrale der Form R n ax + b, x dx. Eine offensichtliche Ersetzung ist (5.20)
√ n
ax + b = u,
mittels der wir zu
x=
un − b , a
dx =
n n−1 ·u · du, a
II.5 Elementar integrierbare Funktionen 135
Z
R
Z Z √ n un − b n−1 n e ax + b, x dx = R u, u du = R(u) du a a
e gelangen, wobei R(u) eine andere rationale Funktion ist. Dieses letzte Integral kann nun mit den zuvor erl¨auterten Techniken gel¨ost werden. R Integrale der Form R eλx dx. Die offensichtliche Substitution u = eλx mit du = λeλx dx und dx = du/(λu) gibt uns als Ergebnis ein Integral einer rationalen Funktion. Beispiel. Z Z Z dx dx du = = 2 = 2 + sinh x 2 + (ex − e−x )/2 u2 + 4u − 1 √ √ Z du 1 u+2− 5 1 ex + 2 − 5 √ = √ ln √ . =2 = √ ln (u + 2)2 − 5 5 u+2+ 5 5 ex + 2 + 5 ¨ Hier haben wir die Formel aus der sp¨ater folgenden Ubung 5.1 eingesetzt. R Integrale der Form R(sin x, cos x, tan x)dx. Seit der Antike ist bekannt (Pythagoras 570–501 v. Chr., siehe auch R.C. Buck 1980, Sherlock Holmes in Babylon, Am. Math. Monthly Band 87, Nr. 5, S. 335–345), dass die Tripel (3, 4, 5), (5, 12, 13), (7, 24, 25), . . . die Gleichung a2 + b2 = c2 erf¨ullen und von der Form (u, (u2 − 1)/2, (u2 + 1)/2) sind. Dies erlaubt uns die Substitution (Euler 1768, Caput V, §261) (5.21)
sin x =
2u , 1 + u2
cos x =
1 − u2 , 1 + u2
tan x =
Man stellt fest, dass sin x = u(1 + cos x) gilt, so dass der Punkt (cos x, sin x) im Schnittpunkt der Geraden η = u(1 + ξ) mit dem Einheitskreis liegt (siehe Abbildung). Daher gilt u = tan(x/2), x = 2 arctan u und 2 du. 1 + u2 R Setzen wir dies in R(sin x, cos x, tan x)dx ein, finden wir das Integral einer rationalen Funktion.
x/2
dx =
u
2u . 1 − u2
2u 1+u2
x 1−u2 1+u2
Beispiel. Z
dx = 2 + sin x
Z
2du 2 (1 + u )(2 +
2u 1+u2 )
=
Z
u2
du . +u+1
Das letzte Integral kennen wir aus Gl. (4.18), also Z dx 2 2 1 2 2 x 1 = √ arctan √ u + = √ arctan √ tan + . 2 + sin x 2 2 2 3 3 3 3
136 II. Differential- und Integralrechnung
√ R Integrale der Form R ax2 + 2bx + c, x dx. Der Ansatz (Euler 1768, § 88) ist es, eine neue Variable z zu definieren, die die Gleichung ax2 + 2bx + c = a(x − z)2 erf¨ullt. Dies erlaubt die Ersetzung a(az 2 + 2bz + c) dz, 2(b + az)2 p √ √ az 2 + 2bz + c ax2 + 2bx + c = ± a (z − x) = ± a · , 2(b + az) .√ p z = x ± ax2 + 2bx + c a, x= (5.22)
az 2 − c , 2(b + az)
dx =
und wieder erhalten wir das Integral einer rationalen Funktion. F¨ur a < 0 ¨ f¨uhrt dies zu komplexer Arithmetik, welche man aber durch die in Ubung 5.3 vorgestellte Transformation umgehen kann. √ Manchmal ist es etwas angenehmer, den Ausdruck ax2 + 2bx + c zuvor durch eine geeignete lineare Substitution z = αx + β in eine der Formen p p p z 2 + 1, z 2 − 1, 1 − z2 zu u¨ berf¨uhren. Dann k¨onnen die Ersetzungen (5.23)
z = sinh u,
z = cosh u,
z = sin u
direkt eingesetzt werden, um die Quadratwurzel unter dem Integral zu entfernen. Beispiel. Betrachten wir nochmals Integral (4.27). Setzen wir x = sinh u ein, so erhalten wir Z p Z Z 1 cosh 2u u sinh 2u x2 + 1 dx = cosh2 u du = + du = + 2 2 2 4 √ p 2 u sinh u cosh u 1 x x +1 = + = ln x + x2 + 1 + . 2 2 2 2 ¨ F¨ur die Umkehrfunktion von x = sinh u verweisen wir auf Ubung I.4.3.
¨ Ubungen 5.1 (Joh. Bernoulli, siehe Zitat zu Beginn dieses Abschnitts). Beweisen Sie Z dx 1 x−a = ln + C. 2 2 x −a 2a x+a Z s n ax + b 5.2 Zeigen Sie, dass R , x dx eine elementare Funktion ist. ex + f
5.3 (Euler 1768, Caput II, §88). Nehmen Sie an, dass ax2 +2bx+c die voneinander verschiedenen reellen Wurzeln α und β hat. Zeigen Sie, dass die Substitution z 2 = a(x − β)/(x − α) das Integral
II.5 Elementar integrierbare Funktionen 137
Z
R
p ax2 + 2bx + c, x dx
(R R ist eine rationale Funktion mit zwei Argumenten) in ein Integral der Form e dz u¨ berf¨uhrt, wobei R e rational ist. R(z)
5.4 Herr C.L. Ever vereinfacht Gl. (5.16) unter Zuhilfenahme von (I.4.32) zu √ √ √ √ Z dx 2 x2 + 2x + 1 2 x 2 √ = ln + arctan x4 + 1 8 4 1 − x2 x2 − 2x + 1 und erh¨alt beispielsweise √ √ Z √2 dx 2 2 = ln 5 + arctan(−2) = −0,1069250677, 4 +1 x 8 4 0
also einen negativen Wert f¨ur das Integral einer positiven Funktion. Wo hat er einen Fehler gemacht, und was ist der wahre Wert? 5.5 Berechnen Sie
Z
dx x2 + 1 auf zweierlei Weise; einmal mit der Substitution (5.22) und außerdem √ mit der Substitution (5.23). Dies f¨uhrt Sie zur Formel arsinh x = ln(x + x2 + 1) ¨ (siehe Ubung I.4.3). 5.6 Beweisen Sie, dass Z R(sin2 x, cos2 x, tan x) dx √
integriert werden kann, wenn man folgende Ersetzungen vornimmt: sin2 x =
u2 , 1 + u2
cos2 x =
1 , 1 + u2
tan x = u.
138 II. Differential- und Integralrechnung
II.6 N¨aherungsweise Berechnung von Integralen . . . weil die Analysten nach allen Versuchen endlich geschlossen haben, daß man die Hoffnung aufgeben m¨usse, elliptische B¨ogen durch algebraische Formeln, Logarithmen und Circulb¨ogen auszudr¨ucken. (J.H. Lambert 1772, Rectification elliptischer B¨ogen . . ., Opera, Band I, S. 312) Obwohl das Problem (der numerischen Quadratur) etwa zweihundert Jahre alt ist und von zahlreichen Geometern bearbeitet worden ist: Newton, Cotes, Gauß, Jacobi, Hermite, Tch´ebychef, Christoffel, Heine, Radeau [sic], A. Markov, T. Stitjes [sic], C. Poss´e, C. Andr´eev, N. Sonin und anderen, kann es dennoch nicht als zu Gen¨uge ersch¨opft betrachtet werden. (Steklov 1918) Mit unserer RMethode kann man sich sehr leicht davon u¨ berzeugen, dass x das Integral e xdx , das viele Geometer lange besch¨aftigt hat, unm¨oglich in endlicher Form geschrieben werden kann . . . (Liouville 1835, S. 113)
Trotz der außergew¨ohnlichen Ergebnisse der vorigen Abschnitte, widersetzten sich die meisten Integrale doch der Genialit¨at der Bernoullis, Eulers, Lagranges und vieler anderer. Zu diesen Integralen geh¨oren beispielsweise Z Z x Z 2 e dx dx e−x dx, , , x ln x Z Z p Z dx dx 2 2 p p , 1 − k cos x dx, . 2 3 (1 − x )(1 − k 2 x2 ) 4x − g2 x − g3
Die letzten drei sind sogenannte elliptische Integrale“. Legendre, Abel, Jacobi ” und Weierstraß haben einen großen Teil ihrer Arbeit dem Studium dieser Integrale gewidmet. Die obigen Integrale k¨onnen nicht durch endlich viele Terme elementarer Funktionen dargestellt werden (Liouville 1835, siehe Zitat), und wir sehen uns mit neuen Funktionen konfrontiert, die mit neuen Methoden berechnet werden m¨ussen. Wir verfolgen daf¨ur drei Ans¨atze: (1) Reihenentwicklungen; (2) N¨aherung durch Polynome (numerische Integration); und (3) asymptotische Entwicklungen.
Reihenentwicklungen Der Ansatz besteht darin, die Funktion als Reihe zu entwickeln (entweder in Potenzen von x oder in allgemeineren Termen) und diese Term f¨ur Term zu integrieren. Eine Rechtfertigung dieses Vorgehens werden wir in Abschnitt III.5 weiter unten liefern. Historische Beispiele. Die Berechnungen von Mercator (siehe Gl. (I.3.13)) Z Z 1 x2 x3 ln(1 + x) = dx = 1 − x + x2 − . . . dx = x − + −... 1+x 2 3
sind √ das a¨ lteste Beispiel. Die Berechnung der Bogenl¨ange des Kreises y = 1 − x2 (siehe Gl. (4.9) und Satz I.2.2)
II.6 N¨aherungsweise Berechnung von Integralen 139
Z
Z p ′ 2 1 + y (t) dt =
r
Z x t2 arcsin x = 1+ dt = (1 − t2 )−1/2 dt 1 − t2 0 0 0 Z x 1 1·3 4 1 x3 1 · 3 x5 = 1 + t2 + t + . . . dt = x + + +... 2 2·4 2 3 2·4 5 0 x
x
ist genau Newtons Ansatz f¨ur Gl. (I.4.25).
Umfang der Ellipse. Wir wollen den Umfang einer Ellipse mit den Halbachsen 1 und b berechnen: x2 +
y2 =1 b2
oder
x = cos t,
y = b sin t.
Da dx = − sin t dt und dy = b cos t dt ist, betr¨agt der Umfang Z 2π p Z π/2 p P = dx2 + dy 2 = 4 sin2 t + b2 cos2 t dt 0 0 (6.1) Z π/2 p =4 1 − (1 − b2 ) cos2 t dt. | {z } 0 α Dies ist ein elliptisches Integral“ (daher der Name), das im allgemeinen nicht ” elementar l¨osbar ist. Wir berechnen es √ wie folgt: Sei 1 > b > 0, also 0 < α < 1. Die Idee ist nun, Newtons Reihe f¨ur 1 − x (Satz I.2.2) zu benutzen, (6.2)
√
1−x= 1−
mit dem Ergebnis (6.3)
P =4
Z
π/2
(1 −
0
x 1·1 2 1·1·3 3 − x − x − ..., 2 2·4 2·4·6 α 1·1 2 cos2 t − α cos4 t − . . .) dt. 2 2·4
Mit den Methoden aus Abschnitt II.4 (siehe Gl. (4.28)) finden wir Z π/2 π 1 · 3 · 5 · . . . · (2n − 1) cos2n t dt = · , 2 2 · 4 · 6 · . . . · (2n) 0 und (6.3) wird zu (vgl. Euler 1750, Opera, Band XX, S. 49) 1 1 1·1 1·3 1·1·3 1·3·5 (6.4) P = 2π 1 − α · − α2 · − α3 · − ... . 2 2 2·4 2·4 2·4·6 2·4·6
Die Konvergenz dieser Formel ist in Abb. 6.1 dargestellt. F¨ur α = 0 (d.h. b = 1) haben wir einen Kreis vorliegen, also P = 2π. F¨ur α = 1 (d.h. b = 0) konvergiert die Reihe nur a¨ ußerst langsam gegen den wahren Wert, n¨amlich 4. Fresnelsche Integrale. Die Fresnelschen Integrale (Fresnel 1818), Z t Z t (6.5) x(t) = cos(u2 ) du, y(t) = sin(u2 ) du, 0
0
140 II. Differential- und Integralrechnung
2π 6
y=
5
1 3
Z
t
sin u2 du
0
−1
x=
2
Z
t
1 cos u2 du
0
exakt
4 .0
b 1.0
.5
−1
ABB. 6.1. Konvergenz der Reihen (6.4) (Umfang der Ellipse)
ABB. 6.2. Fresnelsche Integrale
¨ haben interessante Eigenschaften (Ubung 6.4) und erzeugen in der (x, y)-Ebene eine wundersch¨one Spirale (Abb. 6.2). Sie sind nicht elementar. Jedoch haben die Funktionen sin(u2 ) und cos(u2 ) einfache Reihendarstellungen (die Reihen von sin z und cos z mit z = u2 ; siehe (I.4.16) und (I.4.17)), aus denen wir das Integral Term f¨ur Term bestimmen k¨onnen: Z t Z t u6 u10 t3 t7 t11 sin(u2 ) du = u2 − + − . . . du = − + −... 3! 5! 3 7 · 3! 11 · 5! 0 0 Z t Z t u4 t5 t9 t13 cos(u2 ) du = 1− + . . . du = t − + − + ... . 2! 5 · 2! 9 · 4! 13 · 6! 0 0 Die Konvergenz dieser Reihen ist in Abb. 6.3 wiedergegeben. Die Ergebnisse sind besonders gut f¨ur kleine Werte von t. F¨ur wachsende Werte von |t| m¨ussen dagegen mehr und mehr Terme in Betracht gezogen werden.
1 0
Z
t
cos u2 du
9
1
0
1
2
5 13
3
4
5
0
Z
t
sin u2 du
11
0
1
2
7 15
3
4
5
ABB. 6.3. Fresnelsche Integrale aus der Reihenentwicklung; die Zahlen 5,9,13 und 7,11,15 beziehen sich auf die letzte berechnete Potenz von t.
Numerische Methoden Rb Nehmen wir an, wir wollen das Integral a f (x)dx u¨ ber ein gegebenes Integrationsintervall [a, b] berechnen. Der Ansatz ist nun der folgende: Wir halten ein N
II.6 N¨aherungsweise Berechnung von Integralen 141
fest, unterteilen das Intervall [a, b] in N Teilintervalle der L¨ange h = (b − a)/N , x0 = a,
x1 = a + h,
...
xi = a + ih,
...
xN = b,
und ersetzen die Funktion f (x) lokal durch Polynome, die sich leichter integrieren lassen. Trapezregel. Auf dem Intervall [xi , xi+1 ] ersetzen wir die Funktion f (x) durch eine gerade Strecke, die durch (xi , f (xi )) und (xi+1 , f (xi+1 )) verl¨auft. Das Integral zwischen xi und xi+1 wird dann durch die trapezf¨ormige Fl¨ache h · f (xi ) + f (xi+1 ) /2 gen¨ahert, und wir erhalten Z
b
f (x) dx ≈
a
N −1 X i=0
h f (xi ) + f (xi+1 ) 2
f (x0 ) f (xN ) =h + f (x1 ) + f (x2 ) + . . . + f (xN−1 ) + . 2 2
(6.6)
Beispiel. Die oberen Bilder aus Abb. 6.4 zeigen die Funktionen cos x2 und sin x2 zusammen mit ihren jeweiligen trapezf¨ormigen Approximationen (Schrittweite h = 0,5, N = 10). Die Punkte in den unteren Abbildungen stellen die N¨aherungen des Fresnelschen Integrals dar, die man jeweils f¨ur h = 1/2 und h = 1/8 erh¨alt; die einzelnen Punkte sind durch gerade Linien miteinander verbunden. 1
1 sin x2
cos x2
0
1
2
3
4
5
−1
1 0
0
1
2
3
4
5
2
3
4
5
−1
Z
x
cos t2 dt
1
0
1
2
3
4
5
0
Z
x
sin t2 dt
0
1
ABB. 6.4. Fresnelsche Integrale mit der Trapezregel
Simpson-Regel (benannt nach Simpson 1743). Die Idee ist, drei aufeinander folgende Werte von f (xi ) (yi = f (xi )) auszuw¨ahlen und dann die Interpolationsparabel durch diese Punkte zu berechnen (siehe Satz I.1.2 und Gl. (2.6)): p(x) = y0 + (x − x0 )
∆y0 (x − x0 )(x − x1 ) ∆2 y0 + . h 2 h2
Mit der Ersetzung x = x0 + th wird die Fl¨ache zwischen x-Achse und dieser Parabel zu
142 II. Differential- und Integralrechnung TABELLE 6.1. Berechnung von N 12 24 48 96 192 384 768 1536 3072 6144
(6.7)
R 10 1
dx x
mit verschiedenen Quadratur-Regeln
Trapez
Simpson
2,34 2,31 2,305 2,303 2,3027 2,3026 2,3025 2,302587 2,3025858 2,3025852
2,307 2,303 2,3026 2,302587 2,3025852 2,3025851 2,302585093 2,3025850930 2,302585092996 2,3025850929941
Z
x2 x0
p(x) dx = 2h · y0 + h
Z
Newton
Cotes
2,31 2,303 2,3026 2,30259 2,3025854 2,3025851 2,302585094 2,3025850930 2,302585092999 2,3025850929943
2,305 2,3027 2,30259 2,3025852 2,302585095 2,3025850930 2,3025850929947 2,30258509299405 2,3025850929940458 2,302585092994045686
0
2
Z t dt · ∆y0 + h
0
2
t(t − 1) dt · ∆2 y0 2
h = y0 + 4y1 + y2 . 3 Wir finden die Simpson-Regel (f¨ur gerades N ) (6.8) Z b h f (x) dx ≈ f (x0 ) + 4f (x1 ) + 2f (x2 ) + 4f (x3 ) + 2f (x4 ) + . . . + f (xN ) . 3 a Newton-Cotes-Formel. W¨ahlen wir statt einer Parabel Interpolationspolynome h¨oheren Grades, so finden wir analog Z x3 3h f (x) dx ≈ f (x0 ) + 3f (x1 ) + 3f (x2 ) + f (x3 ) 8 x Z x0 4 2h f (x) dx ≈ 7f (x0 ) + 32f (x1 ) + 12f (x2 ) + 32f (x3 ) + 7f (x4 ) , 45 x0 und so weiter. Die erste Formel geht auf Newton (1671) zur¨uck, und heißt 3/8Regel. Cotes berechnete 1711 s¨amtliche dieser Formeln bis zum Grad 10 (siehe Goldstine 1977, S. 77). R 10 Numerische Beispiele. Wir berechnen N¨aherungswerte f¨ur 1 dx x = ln(10) mit den obigen Regeln f¨ur N = 12, 24, 48, . . . . Die Ergebnisse sind in Tabelle 6.1 zusammengefasst. Wir stellen fest, dass sich die N¨aherungswerte nur in jeder ¨ zweiten Spalte deutlich verbessern (siehe Ubung 6.5 f¨ur eine Erkl¨arung). Wir k¨onnen ein interessantes Ph¨anomen beobachten, wenn wir die TrapezR 2π √ regel auf das elliptische Integral P = 0 1 − α cos2 t dt anwenden (hier mit b = 0,2, α = 0,96, siehe Tabelle 6.2). Die N¨aherung konvergiert viel besser als erwartet. Der Grund hierf¨ur liegt in der Periodizit¨at der Funktion f (t); wir werden diese Superkonvergenz“ durch die Euler-Maclaurin-Formel in Abschnitt ” II.10 erkl¨aren k¨onnen.
II.6 N¨aherungsweise Berechnung von Integralen 143 TABELLE 6.2. Berechnung eines elliptischen Integrals mit der Trapezregel N Trapezregel 12 24 48 96 192 384
4,1 4,201 4,2020080 4,20200890792 4,20200890793780018891 4,2020089079378001889398329176947477824
Asymptotische Entwicklungen Rx 2 Die folgende Methode wurde von Laplace (1812) zur Berechnung von 0 e−t dt ¨ eingesetzt (siehe Oeuvres, Band VII, S. 104 und Ubung 6.7), sowie 1842 von Cauchy f¨ur Fresnelsche Integrale (siehe Kline 1972, S. 1100). Wohingegen sich Reihenentwicklungen und numerische Methoden f¨ur besonders kleine und auch mittlere Werte von x eignen, ist die Methode der asymptotischen Entwicklung angepasst an große x. Wir demonstrieren diese Technik anhand der Fresnelschen Integrale. F¨ur den ¨ Grenzwert x → ∞ ist der exakte Wert des Integrals bekannt (Ubung IV.5.14): r Z ∞ Z ∞ 1 π (6.9) cos t2 dt = sin t2 dt = . 2 2 0 0 Rx R∞ R∞ Die Idee ist nun, das Integral in die zwei Teile 0 = 0 − x aufzuspalten, d.h. (6.10)
Z
0
x
cos t2 dt =
1 2
r
π − 2
Z
∞
cos t2 dt.
x
Dem Integral auf der rechten Seite f¨ugen wir k¨unstlich die Faktoren 2t und 1/(2t) hinzu, um eine partielle Integration mit u(t) = 1/t, v(t) = sin t2 auszuf¨uhren. Dies liefert uns Z ∞ Z Z 1 ∞1 1 1 1 ∞ 1 2 2 2 − cos t dt = − · 2t cos t dt = sin x − sin t2 dt. 2 2 t 2 x 2 t x x x Das neue Integral erscheint keineswegs einfacher zu sein als das anf¨angliche. Doch f¨ur große x ist das Integral auf der rechten Seite, das ja den zus¨atzlichen Faktor 1/t2 enth¨alt, viel kleinerR als das urspr¨ungliche. Daher ist bereits (2x)−1 sin x2 ∞ eine gute N¨aherung f¨ur − x cos t2 dt. Falls die G¨ute der N¨aherung noch nicht ausreicht, kann man das Verfahren wiederholen (nun mit u(t) = 1/t3 und v(t) = − cos t2 ): Z Z 1 ∞ 1 1 1 1·3 ∞ 1 2 2 (6.11) − sin t dt = − cos x + cos t2 dt. 2 x t2 2 · 2 x3 2 · 2 x t4
144 II. Differential- und Integralrechnung
Setzen wir dies fort, finden wir nach (6.10) r Z x 1 π 11 1 1 1·3 1 2 cos t dt = + sin x2 − cos x2 − sin x2 3 2 2 2 x 2 · 2 x 2 · 2 · 2 x5 0 1·3·5 1 1·3·5·7 1 (6.12) + cos x2 + sin x2 − . . . . 2 · 2 · 2 · 2 x7 2 · 2 · 2 · 2 · 2 x9 Eine analoge Formel gilt f¨ur r Z x 1 π 11 1 1 1·3 1 2 sin t dt = − cos x2 − sin x2 + cos x2 3 2 2 2x 2·2 x 2 · 2 · 2 x5 0 1·3·5 1 1·3·5·7 1 (6.13) + sin x2 − cos x2 − . . . . 2 · 2 · 2 · 2 x7 2 · 2 · 2 · 2 · 2 x9
Die außergew¨ohnliche Pr¨azision dieser N¨aherungen f¨ur große x wird in Abb. 6.5 dargestellt. Die Zahlen 1, 3, 5 stehen dabei f¨ur die jeweils letzte betrachtete Potenz von 1/x.
1
0
Z
3
cos t2 dt
0
1 2
10 1
1
20 2
Z
x
1
30 3
3
0
sin t2 dt
0
2 1
x
10
20 2
30 3
ABB. 6.5. Asymptotische Entwicklungen (6.12) und (6.13) mit 1, 2, 3, 10, 20, 30 Termen
(6.1) Bemerkung. Wir k¨onnen den Fehler der Partialsummen von (6.12) auf einfache Weise absch¨atzen. Wenn wir beispielsweise nach dem Term (2x)−1 sin x2 abbrechen, zeigt die obige Ableitung, dass der Fehler durch den Wert des Integrals in (6.11) gegeben ist (im Bereich x ≤ t < ∞). Setzen wir | cos t2 | ≤ 1 ein, erhalten wir als obere Schranke (2x3 )−1 , was f¨ur x > 2 weniger als 0,0625 betr¨agt. (6.2) Bemerkung. Die unendlichen Reihen (6.12) und (6.13) konvergieren nicht f¨ur festes x. Dies liegt daran, dass der allgemeine Term den Faktor 1 · 3 · 5 · 7 · 9 · . . . im Z¨ahler enth¨alt, der alle anderen Faktoren dominiert. Solche Reihen wurden von Poincar´e asymptotische Entwicklungen genannt.
II.6 N¨aherungsweise Berechnung von Integralen 145
¨ Ubungen 6.1 (Joh. Bernoulli 1697). Leiten Sie die series mirabili“ her: ” Z 1 1 1 1 1 xx dx = 1 − 2 + 3 − 4 + 5 &c. 2 3 4 5 0 Hinweis. Benutzen Sie die Reihenentwicklung der Exponentialfunktion f¨ur R xx = ex ln x und berechnen Sie xn (ln x)n dx durch partielle Integration. √ R 6.2 Das Integral x2 dx/ 1 − x4 ist Jak. Bernoulli in seinen Studien u¨ ber das elastische Band und Leibniz in seiner Untersuchung der Isochrona Paracentrica begegnet. Best¨atigen Sie die Formel (Leibniz 1694b) Z x2 dx 1 1 1·3 1·3·5 √ = x3 + x7 + x11 + x15 &c. 3 7·2·1 11 · 4 · 1 · 2 15 · 8 · 1 · 2 · 3 1 − x4 6.3 Leiten Sie wie in (6.7) die Newton-Cotes-Formeln durch Integration der Interpolationspolynome der Grade 3 und 4 her, jeweils in den Intervallen [x0 , x3 ] and [x0 , x4 ]. 6.4 Beweisen Sie f¨ur die in (6.5) definierte Kurve (siehe Abb. 6.2), dass a) die Bogenl¨ange zwischen dem Ursprung und (x(t), y(t)) gleich t ist; und b) der Kr¨ummungsradius am Punkt (x(t), y(t)) gleich 1/(2t) ist. 6.5 Zeigen Sie, dass die Simpson-Regel f¨ur alle Polynome vom Grad 3 exakt ist. 6.6 Berechnen Sie mit Hilfe der Simpson-Regel Z 1 ln(1 + x) dx . 1 + x2 0 Untersuchen Sie, wie der Fehler mit wachsendem N abnimmt. Ergebnis. Der wahre Wert betr¨agt (π/8) ln 2 = 0,2721982613 . R∞ √ 2 6.7 Leiten Sie unter Einsatz von 0 e−t dt = π/2 (siehe (IV.5.41) unten) Rx 2 eine asymptotische Entwicklung der Fehlerfunktion Φ(x) = √2π 0 e−t dt her, die f¨ur große Werte von x gilt (Laplace 1812, Livre premier, No. 44). 2 e−x 1 1 1·3 1·3·5 Ergebnis. Φ(x) = 1 − √ − + − + . . . . π x 2 · x3 22 · x5 23 · x7 6.8 Berechnen Sie numerisch das Integral √ p √ Z ∞ 1 π 2 2+ 2 2 √ cos x dx = ≈ 1,674813394 . 4 · Γ (3/4) x 0 W¨ahlen Sie zwei Zahlen A ≈ 1/10, B ≈ 10 und berechnen Sie das Integral a) im Intervall (0, A] mittels einer Reihe; b) im Intervall [A, B] nach der Simpson-Regel; und c) im Intervall [B, ∞) mit einer asymptotischen Entwicklung.
146 II. Differential- und Integralrechnung
II.7 Gew¨ohnliche Differentialgleichungen Ergo & horum integralia aequantur.
(Jak. Bernoulli 1690)
In den Abschnitten II.4 und II.5 haben wir das Problem behandelt, wie man eine Stammfunktion zu einer gegebenen Funktion f (x) findet, d.h. wir suchten nach einer Funktion y(x), die die Gleichung y ′ (x) = f (x) erf¨ullt. Nun betrachten wir das deutlich schwerere Problem, in dem f zus¨atzlich von der unbekannten Funktion y(x) abh¨angt. Eine gew¨ohnliche Differentialgleichung ist eine Beziehung der Form y ′ = f (x, y).
(7.1)
Wir suchen nach einer Funktion y(x), f¨ur die y ′ (x) = f (x, y(x)) f¨ur jedes x in einem vorgegebenen Intervall gilt. Lassen Sie uns mit einigen historischen Beispielen beginnen (f¨ur weitere Details siehe Wanner 1988). Das Isochronenproblem von Leibniz. Galilei entdeckte, dass ein K¨orper, der aus dem Koordinatenursprung √heraus entlang der y-Achse nach unten f¨allt, seine Geschwindigkeit gem¨aß v = −2gy erh¨oht, wobei g die Schwerebeschleunigung ist. W¨ahrend seiner Auseinandersetzungen mit den Kartesianern u¨ ber Mechanik ver¨offentlichte Leibniz (in der September-Ausgabe 1687 des Journals Nouvelles de la R´epublique des lettres) das folgende Problem: Man finde eine Kurve y(x) (siehe Abb. 7.1) derart, dass, wenn ein K¨orper auf dieser Kurve nach unten gleitet, seine Vertikalgeschwindigkeit dy/dt u¨ berall gleich einer vorgegebenen Konstante −b ist. 1 1
S1 x
−1
r
−1 −
2gy b2
dx
−1
S2
y dy
ABB. 7.1. Die Leibnizsche Isochrone
Ein Monat sp¨ater gab Vir Celeberrimus Christianus Hugenius“ (Huygens) ” eine L¨osung an, sed suppressa demonstratione & explicatione“. Die demon” ” stratio“, die sodann von Leibniz (1689) ver¨offentlicht wurde, bleibt unzufriedenstellend, da die L¨osung geraten wurde und erst dann die ihr zugeschriebenen Eigenschaften gezeigt wurden. Ein allgemeiner Ansatz zur L¨osung wurde unter Zuhilfenahme der modernen“ Differentialrechnung von Jak. Bernoulli (1690) ”
II.7 Gew¨ohnliche Differentialgleichungen 147
¨ spektakul¨arer Entdeckungen durch Jak. und ver¨offentlicht. Dies er¨offnete eine Ara Joh. Bernoulli, sp¨ater auch durch Euler und Daniel Bernoulli, und machte Basel f¨ur viele Jahrzehnte zum weltbedeutendsten Zentrum mathematischer Forschung. Lassen Sie uns Galileis Formel schreiben in der Form ds 2 dx2 + dy 2 (7.2) = = −2gy (s = Bogenl¨ange), dt dt2 und dann durch (dy/dt)2 = +b2 teilen (dies ist die gesuchte Bedingung): dx 2 −2gy dy −1 (7.3) +1= oder = p . dy b2 dx −1 − 2gy/b2
Dies ist eine Differentialgleichung der Art (7.1). Um nun Bernoullis Idee zu verstehen, schreiben wir (7.3) als r 2gy (7.4) dx = − −1 − 2 dy, b was die Tatsache ausdr¨uckt (siehe Abb. 7.1), dass die zwei gestreiften Rechtecke stets gleich große Fl¨achen haben. Jakob schrieb hierzu Ergo & horum Integralia ” aequantur“ (hier erscheint das erste Mal u¨ berhaupt in der Mathematik das Wort Integral“), d.h. dass die Fl¨achen S1 und S2 ebenfalls gleich sein m¨ussen. Nach ” Integration finden wir die L¨osung b2 2gy 3/2 x= −1 − 2 , 3g b und die Solutio sit linea paraboloeides quadrato cubica . . .“ (Leibniz). ” Die Traktrix.
Der ausgezeichnete Pariser Arzt Claude Perrault, gleichermaßen ber¨uhmt f¨ur seine Arbeiten u¨ ber Mechanik wie Architektur, wohlbekannt f¨ur seine Ausgabe des Vitruv, und zu Lebzeiten ein wichtiges Mitglied der k¨oniglichen Pariser Akademie der Wissenschaften, stellte mir und vielen anderen vor mir dieses Problem vor, wobei er aufrichtig eingestand, dass er nicht in der Lage war, es zu l¨osen . . . (Leibniz 1693)
W¨ahrend sich Leibniz in Paris aufhielt (1672–1676) und dort von Huygens unterrichtet wurde, stellte der ber¨uhmte Anatom und Architekt Claude Perrault das folgende Problem: F¨ur welche Kurve hat die Tangente an jeden Punkt P von P zu ihrem Schnittpunkt mit der x-Achse die konstante L¨ange a (Abb. 7.2)? Um seine Frage zu illustrieren, zog er die Kette seiner Taschenuhr hervor, eine horologio portabili suae thecae argenteae“, und zog sie ” u¨ ber den Tisch, wodurch die Kette eine Kurve beschrieb. Er behauptete, dass kein Mathematiker aus Paris oder Toulouse (Fermat) in der Lage war, die Formel dieser Kurve, Traktrix“ oder auch Schleppkurve“ genannt, zu ” ” bestimmen.
148 II. Differential- und Integralrechnung
ABB. 7.2. Die Traktrix
ABB. 7.3. Skizze von Leibniz (1693)1
Leibniz publizierte seine L¨osung 1693 (siehe Leibniz 1693), in der er versichert, er h¨atte die L¨osung bereits seit geraumer Zeit in der Form p dy y a2 − y 2 = −p bzw. − dy = dx 2 2 dx y a −y
gekannt, und fand ( ergo & horum . . .“) eine L¨osung durch Quadratur (Abbil” dungen 7.2 und 7.3). Leibniz stellte weiter fest, es sei wohlbekannt“, dass diese ” Fl¨ pache durch den Logarithmus ausgedr¨uckt werden kann, mittels der Substitution 2 2 2 a2 − y 2 = v, a − y = v , −y dy = v dv findet man also (7.5)
x=
Z
a
y
p p p a2 − y 2 a − a2 − y 2 2 2 dy = − a − y − a log , y y
¨ was sich als L¨osung herausstellt (siehe auch Ubung 7.1). Wir wollen kurz erw¨ahnen, dass Leibniz an dieser Theorie auch in umgekehrter Richtung Interesse fand: Perraults Uhr als mechanische Integrationsmaschine zur Berechnung des Integrals (7.5) (und damit des Logarithmus) zu benutzen, sowie weitere mechanische Ger¨ate f¨ur a¨ hnliche Integrale zu entwickeln. Die Katenoide. Aber um die Qualit¨at Ihres Algorithmus sicher bewerten zu k¨onnen, warte ich ungeduldig auf die Ergebnisse, die Sie f¨ur die Form eines h¨angenden Seils oder einer h¨angenden Kette erhalten haben, welche Mr. Bernouilly Ihnen als Untersuchungsobjekt vorgeschlagen hatte, weshalb ich ihm sehr dankbar bin, denn diese Kurve besitzt bemerkenswerte Eigenschaften. Ich habe sie vor langer Zeit in meiner Jugend untersucht, als ich erst 15 Jahre alt war, und ich bewies Vater Mersenne, dass sie keine Parabel sein kann ... (Brief von Huygens an Leibniz, 9. Okt. 1690) Die M¨uhen meines Bruders waren ohne Erfolg, ich selbst hatte etwas mehr Gl¨uck, da ich den Weg gefunden habe . . . Es stimmt, dass dies tiefer ¨ Uberlegungen bedurfte, die mir den Schlaf einer ganzen Nacht raubten . . . (Joh. Bernoulli, siehe Briefwechsel, Band 1, S. 98) 1
Abbildung mit Genehmigung der Bibl. Publ. Univ. Gen`eve.
II.7 Gew¨ohnliche Differentialgleichungen 149
Galilei (1638) bemerkte, dass eine Kette, die von zwei N¨ageln herabh¨angt, ad ” unguem“ eine Parabel formt. Etwa 20 Jahre sp¨ater entdeckte ein 16 Jahre alter niederl¨andischer Junge (Christiaan Huygens), dass dieses Ergebnis falsch sein musste. Schließlich wurde die L¨osung des Problems der Form eines h¨angenden beweglichen Fadens ( Linea Catenaria vel Funicularis“, die Katenoide“ oder ” ” auch Kettenlinie“) durch Leibniz (1691b) und Joh. Bernoulli (1691) ein u¨ ber” ragender Erfolg des neuen“ Kalk¨uls. Hier stellen wir Johanns Ansatz vor (Opera, ” Band III, S. 491–493).
y A s B
H
E V
x
ABB. 7.4. Die Katenoide
ABB. 7.5. Katenoide (Leibniz 1691)2
Sei B der tiefste Punkt und A ein beliebiger anderer Punkt auf der Kurve (Abb. 7.4). Als n¨achstes zeichnen wir die Tangenten AE und BE und stellen uns vor, dass die Masse der Kette von L¨ange s zwischen A und B im Punkt E konzentriert ist, und u¨ ber zwei masselose F¨aden ( duorum filiorum nullius gravitatis“) ” mit A und B verbunden ist. Da die Masse in E proportional zu s ist, zeigt das Kr¨afteparallelogramm in E, dass die Steigung in A proportional zur Bogenl¨ange ist, d.h. (7.6)
c · y ′ = s.
Von da ab werden Johanns Berechnungen sehr kompliziert, er benutzt Differentiale zweiter Ordnung (siehe Opera, Band III, S. 426). Sie werden allerdings einfach, wenn wir im Geiste Riccatis (siehe (7.21) unten) die Ableitung y ′ durch die neue Variable p ersetzen und nun nach Differentiation p (7.7) c · dp = ds = 1 + p2 dx finden, eine Differentialgleichung zwischen den Variablen p und x. 2
Abbildung mit Genehmigung der Bibl. Publ. Univ. Gen`eve.
150 II. Differential- und Integralrechnung
Integration liefert Z Z dp c p = dx, 1 + p2 x − x 0 p = sinh c
(7.8)
also
und
arsinh(p) =
y = K + c · cosh
x − x0 , c
x − x 0 . c
Die Brachistochrone. Gegeben zwei Punkte A und B in einer vertikalen Ebene, bestimme man denjenigen Pfad AM B, auf dem ein bei A startendes und sich nur aufgrund seines Gewichts bewegendes Teilchen M den Punkt B in k¨urzestm¨oglicher Zeit erreicht. (Joh. Bernoulli 1696) Dieses Problem scheint mir eines der kuriosesten und sch¨onsten zu sein, die je er¨ortert wurden, und ich w¨urde mich sehr gerne um seine L¨osung bem¨uhen, aber daf¨ur ist es notwendig, dass Sie es mir auf reine Mathematik reduzieren, denn die Physik verwirrt mich . . . (de L’Hospital, Brief an Joh. Bernoulli, 15. Juni 1696)
Galilei bewies 1638, dass ein K¨orper, der von A nach C gleitet (Abb. 7.7) weniger Zeit auf dem Umweg ADC ben¨otigt als auf der geraden Verbindung (aufgrund seiner gr¨oßeren Anfangsgeschwindigkeit). Er fuhrt fort und bewies, dass ADEC, ADEFC und ADEFGC stets schneller sind, und schlussfolgert, dass der Kreis der schnellste aller Pfade ist. Als er h¨orte, dass sein Bruder Jakob denselben Fehler gemacht hatte, ergriff Johann (1696) diese Gelegenheit, um einen o¨ ffentlichen Wettbewerb auszuschreiben, wer die sogenannte Brachistochrone“ ” finden kann (β̺αχ´ υ ς = kurz, χ̺´ oνoς = Zeit). Die zeitig eingereichten L¨osungen, einschließlich der von Jakob, waren leider alle fehlerfrei; allerdings war Johanns eigene die eleganteste: Er zog eine Analogie zu Fermats Prinzip“ (siehe ” Gl. (2.5)): B A A x D
dx ds
E
α
y ABB. 7.6. Die Brachistochrone
F
C
C
G
ABB. 7.7. Galileis falsche Brachistochrone
Er dachte an viele√Schichten, in denen die Geschwindigkeit des Lichts“ ” gegeben ist durch v = 2gy (siehe (7.2) und Abb. 7.6). Der schnellste Pfad ist nun derjenige, der u¨ berall das Brechungsgesetz (also Fermats Prinzip) erf¨ullt: v = K. sin α
II.7 Gew¨ohnliche Differentialgleichungen 151
Aufgrund von sin α = dx/ds finden wir also r dy 2 p (7.9) 1 + 2 · 2gy = K bzw. dx
dx =
r
y · dy. c−y
¨ Nach wie vor in Ubereinstimmung mit ergo & horum integralia æquantur“ f¨uhrt ” die Ersetzung (7.10)
y = c · sin2 u =
c c − cos 2u 2 2
zur Formel (7.11)
x − x0 = c u −
c sin 2u 2
ex qua concludo Curvam Brachystochronam esse Cycloidem vulgarem“. ”
Einige Klassen integrabler Gleichungen Wir diskutieren nun einige der einfachsten Formen von Differentialgleichungen, die sich durch Berechnung von Integralen l¨osen lassen. Gleichung mit getrennten Variablen. (7.12)
y ′ = f (x)g(y).
Alle vorhergehenden Beispiele, namentlich (7.3), (7.5), (7.7) und (7.9), sind von diesem Typ. Man l¨ost sie durch Separation der Variablen“, d.h. man setzt y ′ = ” dy/dx ein, bringt dann x und y auf verschiedene Seiten des Gleichheitszeichens und integriert anschließend ( ergo & . . .“), also ” Z Z dy dy (7.13) = f (x) dx und = f (x) dx + C. g(y) g(y) Falls G(y) und F (x) Stammfunktionen von 1/g(y) bzw. f (x) sind, so l¨asst sich die L¨osung ausdr¨ucken durch G(y) = F (x) + C. Homogene lineare Differentialgleichung. (7.14)
y ′ = f (x)y.
Dies ist ein Spezialfall von (7.12). Seine L¨osung lautet Z Z (7.15) ln y = f (x) dx + C, also y = C · exp f (x) dx . Inhomogene lineare Differentialgleichung. (7.16)
y ′ = f (x)y + g(x).
152 II. Differential- und Integralrechnung
Joh. Bernoulli schlug vor, die L¨osung als Produkt zweier Funktionen y(x) = u(x) · v(x) zu schreiben (vergleiche Tartaglias Ansatz in Gl. (I.1.5)). Wir erhalten dann du dv ·v+ · u = f (x) · u · v + g(x). dx dx Wir k¨onnen nun beide Terme einzeln gleichsetzen, und erhalten (7.17a) (7.17b)
du = f (x) · u dx dv g(x) = dx u(x)
um u zu berechnen, um v zu berechnen.
Gleichung (7.17a) ist eine homogene lineare Differentialgleichung f¨ur u, und ihre L¨osung ist gegeben durch (7.15). Die Funktion v(x) erh¨alt man dann durch Integration von (7.17b). Entsprechend lautet die L¨osung von (7.16): Z x Z x g(t) (7.18) y(x) = C · u(x) + u(x) dt, u(x) = exp f (t) dt . 0 u(t) 0 Diese Beziehung ist Ausdruck der Tatsache, dass die L¨osung von (7.16) eine Summe der allgemeinen L¨osung der homogenen Gleichung und einer speziellen L¨osung der inhomogenen Gleichung ist. Bernoullis Differentialgleichung. In Wahrheit gibt es keine genialere L¨osung als die, die Sie f¨ur die Gleichung Ihres Bruders angegeben haben; und diese L¨osung ist so einfach, dass man u¨ berrascht ist, wie schwierig das Problem zuvor erschien: Dies ist wahrlich, was man eine elegante L¨osung nennt. (P. Varignon, Brief an Joh. Bernoulli 6 Aoust 1697“) ”
Im Jahr 1695 hat sich Jak. Bernoulli monatelang abgem¨uht, (7.19)
y ′ = f (x) · y + g(x) · y n .
zu l¨osen. Dies erschien Jakob eine geeignete Gelegenheit zu sein, einen o¨ ffentlichen Wettbewerb zu organisieren. Ungl¨ucklicherweise hatte Johann gleich zu Beginn zwei elegante Ans¨atze (siehe Joh. Bernoulli 1697b). Den ersten Ansatz ¨ behandeln wir in Ubung 7.2. Der zweite ist derselbe wie der oben beschriebene, n¨amlich die L¨osung in der Form y(x) = u(x) · v(x) zu schreiben. F¨ur die Differentialgleichung (7.19) f¨uhrt dies wieder zu (7.17a) f¨ur u und (7.20)
dv = g(x)un−1 (x)vn dx
f¨ur v, eine Differentialgleichung, die sich durch Separation der Variablen l¨osen l¨asst. Dies f¨uhrt zur L¨osung Z x 1/(1−n) y(x) = u(x) C + (1 − n) g(t)un−1 (t) dt , 0
mit u(x) wie in Gl. (7.18).
II.7 Gew¨ohnliche Differentialgleichungen 153
Differentialgleichungen zweiter Ordnung Um die obige Formel von ihren zweiten Differenzen zu befreien, . . ., bezeichnen wir die Subnormale BF mit p. (Riccati 1712)
Eine Differentialgleichung zweiter Ordnung ist von der Form y ′′ = f (x, y, y ′ ). Die analytische L¨osung einer solcher Gleichung ist nur selten m¨oglich. Es gibt aber einige Ausnahmen. Gleichungen, die nicht von y abh¨angen. Es ist nat¨urlich, p = y ′ einzusetzen, um so die Differentialgleichung y ′′ = f (x, y ′ ) auf die Gleichung erster Ordnung p′ = f (x, p) zur¨uckzuf¨uhren. Wir bemerken dabei, dass die Differentialgleichung (7.7) der Katenoide tats¨achlich von diesem Typ ist. Gleichungen, die nicht von x abh¨angen. y ′′ = f (y, y ′ ).
(7.21)
Der Ansatz (Riccati 1712) lautet, y als unabh¨angige Variable zu betrachten, und dann nach einer Funktion p(y) zu suchen mit y ′ = p(y). Die Kettenregel liefert dann dp dp dy y ′′ = = · = p′ · p, dx dy dx und Gl. (7.21) wird zur Gleichung erster Ordnung (7.22)
p′ · p = f (y, p).
Sobald man die Funktion p(y) aus (7.22) gefunden hat, bleibt einem nur noch u¨ brig, y ′ = p(y) zu integrieren, was eine Gleichung vom Typ (7.12) ist. Beispiel. Die Bewegung eines Pendels (s. Skizze von Leonardo da Vinci) wird durch die Gleichung (7.23)
y ′′ + sin y = 0
beschrieben (y beschreibt die Auslenkung aus dem Gleichgewichtszustand). Da Gl. (7.23) nicht von t abh¨angt (wir schreiben t statt x, da diese Variable in diesem Beispiel f¨ur die vergangene Zeit steht), k¨onnen wir unsere obige Transformation benutzen und finden p · dp = − sin y · dy
und
c
Bibl. Nacional, Codex Madrid I 147r
p2 = cos y + C. 2
154 II. Differential- und Integralrechnung
Wenn wir nun die Amplitude der Schwingungen mit A notieren (in diesem Moment gilt p = y ′ = 0), so gilt C = − cos A und wir erhalten (7.24)
p=
dy p = 2 cos y − 2 cos A, dt
was eine Differentialgleichung f¨ur y darstellt. Separation der Variablen liefert schließlich die L¨osung in impliziter Form, als Ausdruck eines elliptischen Integrals Z
(7.25)
0
y
√
dη =t 2 cos η − 2 cos A
(die Integrationskonstante bestimmt sich aus der Annahme y = 0 f¨ur t = 0). Wenn T die Periodendauer der Schwingungen ist, wird die maximale Auslenkung A zum Zeitpunkt t = T /4 angenommen. Folglich gilt f¨ur die Periodendauer (7.26)
T =4
Z
0
A
√
dy =2 2 cos y − 2 cos A
Z
A
0
dy q . sin2 (A/2) − sin2 (y/2)
Wir sehen, dass dies von der Amplitude A abh¨angt, und f¨ur kleine A nahe an 2π ¨ liegt (Ubung 7.5). Das isochrone Pendel. Das Problem besteht darin, das normale Pendel derart zu modifizieren, dass seine Periodendauer unabh¨angig von der Amplitude wird. Der Ansatz von Huygens (1673, Horologium Oscillatorium) bestand darin, den Kreis, auf dem sich ein normales Pendel bewegt, so zu ver¨andern, dass die Beschleunigungskraft proportional zur Bogenl¨ange s wird. Die Bewegung des Pendels w¨are dann beschrieben durch s′′ + Ks = 0,
(7.27)
dessen Schwingungen von der Amplitude unabh¨angig sind. ¨ L¨osung. Wir sehen aus der Ahnlichkeit der Dreiecke in Abb. 7.8 (rechts), dass die Beschleunigungskraft f = −dy/ds betr¨agt, mit unserer Bedingung f = −Ks also: (7.28)
dy = K · s ds.
Falls s = 0 f¨ur y = 0 gilt (d.h. der Ursprung wird im niedrigsten Punkt platziert), erhalten wir durch Integration (7.29)
K 2 y= ·s 2
bzw.
s=
r
2y . K
II.7 Gew¨ohnliche Differentialgleichungen 155
F¨ur unsere Kurve ist also die H¨ohe proportional zum Quadrat der Bogenl¨ange (Joh. Bernoulli 1691/92b, S. 489–490). Setzen wir s aus (7.29) in (7.28) ein, finden wir √ p dy √ = 2K dx2 + dy 2 y oder nach Quadrieren r c c−y 2 2 (7.30) − 1 dy = dx und dy = dx y y mit c = 1/(2K). Abgesehen von einer Verschiebung in y ist dies genau die Gleichung (7.9) der Brachistochrone, und wir erkennen, dass das isochrone Pendel auf einer Zykloiden l¨auft, so wie Joh. Bernoulli (1697c) sagte: animo revol” vens inexpectatam illam identitatem Tautochronae Hugeniae nostrae que Brachystochronae“ (siehe Abb. 7.8).
ds dy
f
1
ABB. 7.8. Das isochrone Pendel von Huygens
¨ Ubungen 7.1 Berechnen Sie das Integral (7.5) f¨ur die Traktrix mit der Substitution y = a cos t, durch Einsetzen von sin2 t = 1 − cos2 t, und Anwendung der Substitution (5.21). 7.2 (Joh. Bernoulli 1697b). L¨osen Sie die Differentialgleichung de mon Fr´ere“ ” (7.31) y ′ = g(x) · y + f (x) · y n
durch die Transformation y = vβ . Bestimmen Sie diejenige Konstante β, f¨ur die (7.31) zu einer linearen Differentialgleichung in v wird. 7.3 Die logistische Gleichung des Bev¨olkerungswachstums (Verhulst 1845) wird durch die Differentialgleichung y ′ = by(a − y)
beschrieben, wobei a, b Konstanten sind. W¨ahlen Sie a = 5, b = 2 und finden Sie eine L¨osung mit der Anfangsbedingung y(0) = 0,1.
156 II. Differential- und Integralrechnung
7.4 Zeigen Sie, dass eine Differentialgleichung der Form y y′ = G x
durch die Substitution v(x) = y(x)/x gel¨ost werden kann. Wenden Sie diese Methode an, um 9x + 2y y′ = 2x + y zu l¨osen.
7.5 Die L¨osung der Pendelgleichung y ′′ + ω 2 sin y = 0, die zu den Anfangswerten y(0) = A, y ′ (0) = 0 geh¨ort, hat die Periodendauer Z −1/2 2 A 2 T = sin (A/2) − sin2 (y/2) dy ω 0
(siehe Gl. (7.26)). Setzen Sie k = sin(A/2), wenden Sie die Ersetzung sin(y/2) = k · sin α an, und berechnen Sie die ersten Terme der Entwicklung von T nach Potenzen von k. Ergebnis. 2π A2 11A4 173A6 2π 1 2 4 1 · 3 2 1+k 2 +k +. . . = 1+ + + +. . . ω 2 2·4 ω 16 3072 737280 7.6 L¨osen Sie die Differentialgleichung y′ =
4 + y2 . 4 + x2
7.7 Die Bewegung eines K¨orpers im Schwerefeld der Erde wird durch die Differentialgleichung gR2 y ′′ = − 2 y beschrieben, dabei ist g = 981 m/s2 , R = 6,36 · 106 m und y ist der Abstand des K¨orpers zum Erdmittelpunkt. Bestimmen Sie die Konstanten in der L¨osung, so dass y(0) = R und y ′ (0) = v ist. Finden Sie nun die niedrigste Geschwindigkeit v, f¨ur die der K¨orper nicht mehr zur Erde zur¨uckkehrt (seine Fluchtgeschwindigkeit).
II.8 Lineare Differentialgleichungen 157
II.8 Lineare Differentialgleichungen . . . es ist ganz unm¨oglich, heute noch eine Zeile von d’Alembert hinunterzuw¨urgen, w¨ahrend man die meisten Eulerschen Sachen noch mit Entz¨ucken liest. (Jacobi, siehe Spiess 1929, S. 139)
Seien a0 (x), a1 (x), . . . , an−1 (x) fest vorgegebene Funktionen. Wir nennen (8.1)
y (n) + an−1 (x)y (n−1) + . . . + a1 (x)y ′ + a0 (x)y = 0
eine homogene lineare Differentialgleichung der Ordnung n und (8.2)
y (n) + an−1 (x)y (n−1) + . . . + a1 (x)y ′ + a0 (x)y = f (x)
eine inhomogene lineare Differentialgleichung. Die linke Seite dieser Gleichungen wollen wir abk¨urzen als (8.3)
L(y) : = y (n) + an−1 (x)y (n−1) + . . . + a0 (x)y,
so dass sich (8.1) und (8.2) jeweils schreiben lassen als (8.4)
L(y) = 0
und
L(y) = f.
Wir nennen L einen Differentialoperator. Er operiert auf Funktionen y(x) und liefert als Resultat die Funktion L(y) zur¨uck, die durch (8.3) gegeben ist. Die Haupteigenschaft dieses Operators ist seine Linearit¨at, d.h. (8.5) L c1 y1 + c2 y2 = c1 L(y1 ) + c2 L(y2 ). Eine offensichtliche Folgerung aus dieser Linearit¨at ist das folgende Lemma.
(8.1) Lemma. Seien zur homogenen Gleichung (8.1) bereits n L¨osungen y1 (x), y2 (x), . . . , yn (x) bekannt, dann ist f¨ur beliebige Konstanten c1 , . . . , cn auch die Funktion (8.6)
c1 y1 (x) + c2 y2 (x) + . . . + cn yn(x)
eine L¨osung dieser Gleichung.
⊓ ⊔
Bemerkung. Die L¨osungen der Gleichungen von Ordnung 1 ben¨otigen eine Integrationskonstante (siehe Abschnitt II.7) und die Gleichungen von Ordnung 2 ben¨otigen zwei Konstanten (siehe beispielsweise Gl. (7.23)). Analog k¨onnen wir annehmen (Euler), dass die Gleichungen von Ordnung n genau n Konstanten ben¨otigen, und dass (8.6) die allgemeine L¨osung von (8.1) ist, falls y1 (x), . . . , yn (x) voneinander linear unabh¨angige Funktionen sind. Dabei heißen die Funktionen y1 (x), . . . , yn (x) linear unabh¨angig, wenn die Linearkombination (8.6) nur dann identisch verschwindet, wenn s¨amtliche ci selber Null sind. Beispielsweise sind 1, x, x2 , x3 linear unabh¨angige Funktionen.
158 II. Differential- und Integralrechnung
(8.2) Lemma. Allgemeine L¨osung der homogenen Gleichung (8.1) + eine spezielle L¨osung der inhomogenen Gleichung (8.2) = allgemeine L¨osung der inhomogenen Gleichung (8.2). Beweis. Sei ye eine spezielle L¨osung von (8.2), d.h. L(e y ) = f . F¨ur eine allgemeine L¨osung y von (8.1) (d.h. L(y) = 0) gilt dann L(y + ye) = f nach (8.5), so dass y + ye eine L¨osung von (8.2) darstellt. Sei nun andererseits yb eine weitere L¨osung von (8.2) (also L(b y ) = f ). Dann ist, wieder aufgrund von (8.5), L(b y − ye) = 0 und yb = ye + (b y − ye) ist die Summe von ye und einer L¨osung der homogenen Gleichung (8.1). ⊓ ⊔ Folgerung. Um die Differentialgleichungen (8.1) und (8.2) zu l¨osen, muss man – n verschiedene (linear unabh¨angige) L¨osungen von (8.1) bestimmen, sowie – eine L¨osung von (8.2) finden.
Homogene Gleichung mit konstanten Koeffizienten Nur selten ist es m¨oglich, Gl. (8.1) vollst¨andig zu l¨osen. Es gibt allerdings ein paar Ausnahmen. Die wichtigste ist sicherlich, wenn die Koeffizienten ai (x) alle unabh¨angig von x sind, d.h. (8.7)
y (n) + an−1 y (n−1) + . . . + a1 y ′ + a0 y = 0.
Eine weitere Ausnahme ist der Fall ai (x) = ai xi−n ( Cauchy-Gleichung“). ” Diesen Fall werden wir am Ende dieses Abschnitts betrachten. Der grundlegende Ansatz, um (8.7) zu l¨osen (Euler kommunizierte diesen am 15. Sept. 1739 in einem Brief an Joh. Bernoulli und ver¨offentlichte ihn 1743) besteht darin, L¨osungen der Form y(x) = eλx
(8.8)
zu suchen, wobei λ eine noch zu bestimmende Konstante ist. Berechnet man die Ableitungen y ′ (x) = λeλx ,
y ′′ (x) = λ2 eλx ,
...
, y (n) (x) = λn eλx ,
und setzt sie in Gl. (8.7) ein, erh¨alt man (8.9)
(λn + an−1 λn−1 + . . . + a1 λ + a0 )eλx = 0.
II.8 Lineare Differentialgleichungen 159
Daher ist die Funktion (8.8) eine L¨osung von (8.7) dann und nur dann, wenn λ eine Wurzel der sogenannten charakteristischen Gleichung ist: (8.10)
χ(λ) = 0,
χ(λ) := λn + an−1 λn−1 + . . . + a1 λ + a0 .
Verschiedene Wurzeln. Falls Gl. (8.10) n paarweise verschiedene Wurzeln hat, nennen wir sie λ1 , . . . , λn , dann sind die Funktionen eλ1 x , . . ., eλn x gerade n ¨ linear unabh¨angige L¨osungen von (8.7) (siehe Ubung 8.1). Die allgemeine L¨osung ist also gegeben als (8.11)
y(x) = c1 eλ1 x + c2 eλ2 x + . . . + cn eλn x .
Vielfache Wurzeln. Betrachten wir zun¨achst die einfache Differentialgleichung (8.12)
y (n) = 0,
deren charakteristische Gleichung λn = 0 die Wurzel Null mit Vielfachheit n besitzt. Offensichtlich ist die allgemeine L¨osung von (8.12) c1 + c2 x + c3 x2 + . . . + cn xn−1 , ein Polynom vom Grad n − 1. Als n¨achstes studieren wir die Gleichung (8.13)
y ′′′ − 3ay ′′ + 3a2 y ′ − a3 y = 0,
deren charakteristische Gleichung (λ − a)3 = 0 die Wurzel a mit Vielfachheit 3 besitzt. Wir f¨uhren eine neue, noch unbekannte Funktion u(x) ein durch die Beziehung (Euler 1743b) (8.14)
y(x) = eax · u(x).
Dann f¨uhrt dreifaches Ableiten dieser Gleichung und Einsetzen der Ergebnisse in (8.13) zu Gl. (8.12) f¨ur u mit n = 3. Folglich ist die allgemeine L¨osung von (8.13) gegeben durch (8.15) y(x) = eax · c1 + c2 x + c3 x2 . Differentialoperatoren. Die obigen Berechnungen werden besonders elegant, wenn wir zu einer gegebenen Konstante a den Differentialoperator Da wie folgt einf¨uhren: (8.16)
Da y = y ′ − a · y.
Die Komposition zweier solcher Operatoren Da und Db liefert (8.17) Db Da y = (y ′ − ay)′ − b(y ′ − ay) = y ′′ − (a + b)y ′ + aby = Da Db y.
160 II. Differential- und Integralrechnung
Wir stellen fest, dass Da und Db miteinander vertauschen, und dass die Differentialgleichung (8.7) mit Da Db Dc . . . y = 0 u¨ bereinstimmt, so dass die Koeffizienten diejenigen des charakteristischen Polynoms (λ − a)(λ − b)(λ − c) . . . sind. Daher ist Gl. (8.13) gleichbedeutend mit Da3 y = 0.
(8.13′)
Wenden wir nun Da auf (8.14) an, so erhalten wir Da y = aeax · u + eax · u′ − aeax · u = eax · u′ , Da2 y = eax · u′′ , und schließlich Da3 y = eax · u(3) . Dies best¨atigt, dass (8.15) eine allgemeine L¨osung von (8.13) ist. (8.3) Satz (Euler 1743b). Angenommen, das charakteristische Polynom (8.10) besitzt die Faktorisierung χ(λ) = (λ − λ1 )m1 (λ − λ2 )m2 · . . . · (λ − λk )mk (mit verschiedenen λi ), dann ist die allgemeine L¨osung von (8.7) gegeben durch (8.18)
y(x) = p1 (x)eλ1 x + p2 (x)eλ2 x + . . . + pk (x)eλk x ,
wobei die pi (x) beliebige Polynom vom Grad mi − 1 sind (diese L¨osung umfasst Pk genau i=1 mi = n Konstanten).
Beweis. Wir veranschaulichen den Beweis am Fall zweier vielfacher Wurzeln χ(λ) = (λ − a)3 (λ − b)4 . Aufgrund der Vertauschbarkeit von Da und Db k¨onnen wir die Differentialgleichung auch schreiben als oder als Da3 Db4 y = 0. Die L¨osung y = eax · c1 + c2 x + c3 x2 von Da3 y = 0 l¨ost offensichtlich zugleich die linke Version von (8.19); die L¨osung y = ebx · c4 + c5 x + c6 x2 + c7 x3 von Db4 y = 0 zeichnet sich dagegen durch die rechte Version als L¨osung von (8.19) aus. Daher sind beides L¨osungen und haben gemeinsam sieben freie Konstanten ¨ (siehe Ubung 8.2 zur linearen Unabh¨angigkeit der involvierten Funktionen). ⊓ ⊔ (8.19)
Db4 Da3 y = 0
Vermeidung komplexer Arithmetik. Das Ergebnis von Satz 8.3 gilt auch f¨ur komplexe λi . Falls jedoch die Koeffizienten ai von Gl. (8.7) alle reell sind, sind wir auch vornehmlich an reell-wertigen L¨osungen interessiert. Die Tatsache, dass komplexe Wurzeln reeller Polynome stets in zueinander konjugierten Paaren auftreten, erlaubt es uns, (8.18) zu vereinfachen. Seien λ1 = α + iβ und λ2 = α − iβ zwei solche Wurzeln. Der entsprechende Teil der L¨osung (8.18) ist dann ein Polynom multipliziert mit (8.20) eαx c1 eiβx + c2 e−iβx .
II.8 Lineare Differentialgleichungen 161
Dank Eulers Formel (I.5.4) wird dieser Ausdruck zu eαx d1 cos βx + d2 sin βx ,
(8.21)
wobei d1 = c1 + c2 und d2 = i(c1 − c2 ) neue Konstanten sind. Dieser Ausdruck kann weiter vereinfacht werden, wenn man d2 +id1 = Ceiϕ = C cos ϕ+iC sin ϕ einsetzt. Wir erhalten dann mit Gl. (I.4.3) (siehe Abb. 8.1) Ceαx sin ϕ cos βx + cos ϕ sin βx = Ceαx sin βx + ϕ .
α0
ABB. 8.1. Stabile und instabile Schwingungen
Beispiel. Die Pendelgleichung (7.23) kann f¨ur kleine Auslenkungen vereinfacht werden, indem man sin y durch y ersetzt, also y ′′ + ω 2 y = 0,
(8.22)
ω 2 = g/ℓ,
wobei g = 9,81m/s2 und ℓ die L¨ange des Pendels ist. Die charakteristische Gleichung λ2 + ω 2 = 0 besitzt die Wurzeln ±iω. Daher lautet die allgemeine L¨osung von (8.22) y(t) = C sin(ωt + ϕ), mit der Periodenl¨ange T = 2π/ω = 2π
p ℓ/g .
Inhomogene lineare Gleichungen Das Problem besteht darin, eine spezielle L¨osung von L(y) = f zu finden, d.h. (8.23)
y (n) + an−1 y (n−1) + . . . + a1 y ′ + a0 y = f (x).
Aus der Linearit¨at von (8.5) folgt dann unmittelbar das folgende Resultat. (8.4) Lemma (Superpositionsprinzip). Seien y1 (x) und y2 (x) zwei L¨osungen von L(y1 ) = f1 und L(y2 ) = f2 , dann ist c1 y1 (x) + c2 y2 (x) eine L¨osung von L(y) = c1 f1 + c2 f2 . ⊓ ⊔ Falls also die Inhomogenit¨at f (x) in (8.23) in eine Summe einfacherer Terme zerf¨allt, k¨onnen diese Terme separat behandelt werden.
162 II. Differential- und Integralrechnung
Die schnelle Methode (Euler 1750b). Dieser Zugang ist dann m¨oglich, wenn f (x) eine Linearkombination der Funktionen xj , eax , eαx sin(ωx), . . . ist; um genau zu sein, wenn f (x) selbst L¨osung einer homogenen linearen Gleichung mit konstanten Koeffizienten ist. Der Ansatz besteht nun darin, nach einer L¨osung mit derselben Struktur zu suchen. Beispiel. Wir betrachten den Fall, dass f ein Polynom vom Grad 2 ist, d.h. (8.24)
y ′′′ + 5y ′′ + 2y ′ + y = 2x2 + x.
Wir suchen daher eine L¨osung der Form (8.25)
y(x) = a + bx + cx2 .
Setzen wir die Ableitungen von (8.25) in (8.24) ein, erhalten wir cx2 + (b + 4c)x + (a + 2b + 10c) = 2x2 + x. Koeffizientenvergleich liefert c = 2, b = −7 und a = −6, eine spezielle L¨osung von (8.24) ist folglich y(x) = 2x2 − 7x − 6. Beispiel. Nehmen Sie nun an, f (x) ist eine Sinusfunktion (8.26)
y ′′ − y ′ + y = sin 2x.
Es reicht nicht aus, y(x) = a·sin 2x anzusetzen, da y ′ auch Terme cos 2x erzeugt. Daher versuchen wir (8.27)
y(x) = a · sin 2x + b · cos 2x,
berechnen die Ableitungen und setzen sie in (8.26) ein. Wir erhalten die Bedingung (a + 2b − 4a) sin 2x + (b − 2a − 4b) cos 2x = sin 2x und damit ein lineares Gleichungssystem −3a + 2b = 1, −2a − 3b = 0 mit der L¨osung a = −3/13, b = 2/13. Daher ist eine spezielle L¨osung gegeben durch (8.28)
y(x) = −
2 3 sin 2x + cos 2x. 13 13
Eine weitere M¨oglichkeit, (8.26) zu l¨osen, besteht darin, die Gleichung (8.29)
y ′′ − y ′ + y = e2ix
zu betrachten, und nun nach L¨osungen der Form y(x) = Ae2ix zu suchen. Einsetzen der Ableitungen gibt uns −4A − 2iA + A = 1 und A = (−3 + 2i)/13. Daher ist eine L¨osung von (8.29) (8.30)
y(x) =
−3 + 2i 2ix e . 13
II.8 Lineare Differentialgleichungen 163
Da nun (8.26) der Imagin¨arteil von (8.29) ist, k¨onnen wir eine L¨osung von (8.26) finden, indem wir den Imagin¨arteil von (8.30) berechnen. Rechtfertigung f¨ur diesen Zugang. Nach Annahme erf¨ullt f (x) die Bedingung L1 (f ) = 0, wobei L1 = Dam Dbp . . . ein Differentialoperator mit konstanten Koeffizienten ist. Wenden wir diesen Operator auf Gl. (8.23) an, d.h. L(y) = f , so finden wir (L1 L)(y) = 0 und wir sehen ein, dass die L¨osung von (8.23) die lineare homogene Differentialgleichung (L1 L)(y) = 0 l¨osen muss. Die allgemeine L¨osung dieser Gleichung ist nach Satz 8.3 bekannt. 100
ω = 1,0
50 0
ω = 1,015
ω = 1,03 ω = 1,09 100
200
300
−50 −100
ABB. 8.2. L¨osung von y ′′ + y = sin ωx, y(0) = 0, y ′ (0) = 1, ω = 1,09; 1,03; 1,015; 1.
Resonanzfall. Betrachten wir beispielsweise die Gleichung (8.31)
y ′′ + y = sin x.
Wir k¨onnen hier nicht y(x) = a sin x + b cos x benutzen, da diese Funktion selber L¨osung einer homogenen Gleichung ist. Lassen wir uns von der Diskussion u¨ ber doppelte Wurzeln inspirieren (siehe auch Fig. 8.2), so k¨onnen wir den Ansatz (8.32)
y(x) = ax sin x + bx cos x
testen. Die u¨ bliche Vorgehensweise (Einsetzen der Ableitungen von (8.32) in (8.31)) liefert dann 2a cos x − 2b sin x = sin x, so dass a = 0 und b = −1/2 gilt. Eine spezielle L¨osung von (8.31) ist daher (8.33)
1 y(x) = − x cos x. 2
Diese Funktion explodiert f¨ur x → ∞ (siehe Abb. 8.2).
Methode der Variation der Konstanten (Lagrange 1775, 1788). Dies ist eine allgemeine Methode, die es uns erlaubt, eine spezielle L¨osung von (8.2) in jenen F¨allen zu finden, in denen die allgemeine L¨osung der homogenen Gleichung (8.1) bekannt ist. Um die Notation zu vereinfachen, erkl¨aren wir diese Methode nur f¨ur den Fall n = 2.
164 II. Differential- und Integralrechnung
Betrachten wir das Problem (8.34)
y ′′ + a(x)y ′ + b(x)y = f (x)
und nehmen wir an, y1 (x) und y2 (x) sind zwei bekannte und linear unabh¨angige L¨osungen der homogenen Gleichung y ′′ + a(x)y ′ + b(x)y = 0. Die Idee besteht nun darin, nach einer L¨osung der Form (8.35)
y(x) = c1 (x)y1 (x) + c2 (x)y2 (x)
zu suchen (daher der Name Variation der Konstanten“). Die Ableitung von (8.35) ” ist (8.36)
y ′ = c′1 y1 + c′2 y2 + c1 y1′ + c2 y2′ .
Um Schwierigkeiten mit h¨oheren Ableitungen aus dem Weg zu gehen, fordern wir zus¨atzlich (8.37)
c′1 y1 + c′2 y2 = 0,
so dass die Ableitung von (8.35) zu y ′ = c1 y1′ + c2 y2′ wird. Die zweite Ableitung ist dann (8.38)
y ′′ = c′1 y1′ + c′2 y2′ + c1 y1′′ + c2 y2′′ .
Wenn diese Formeln alle in (8.34) eingesetzt werden, verschwinden die Terme, die c1 und c2 enthalten, da wir angenommen haben, dass y1 (x) und y2 (x) bereits L¨osungen der homogenen Gleichung sind. Was noch u¨ brig bleibt, ist (8.39)
c′1 y1′ + c′2 y2′ = f (x).
Dies, zusammen mit (8.37), bildet ein lineares Gleichungssystem ′ y1 (x) y2 (x) c1 (x) 0 (8.40) · ′ = . y1′ (x) y2′ (x) c2 (x) f (x) | {z } | {z } | {z } W (x) F (x) c′ (x)
Die Matrix W (x) wird Wronski-Matrix genannt. Berechnen und integrieren wir c′ (x) aus (8.40), so erhalten wir Z x c(x) = W −1 (t)F (t) dt, 0
und die folgende L¨osung von (8.34): Z x c1 (x) (8.41) y(x) = y1 (x), y2 (x) = y1 (x), y2 (x) W −1 (t)F (t) dt. c2 (x) 0 Beispiel. Wir betrachten die Gleichung mit konstanten Koeffizienten (8.42)
y ′′ + 2ay ′ + by = f (x),
II.8 Lineare Differentialgleichungen 165 (α+iβ)x mit a2 < b. Die homogene Gleichung besitzt , √ die L¨osungen y1 (x) = e (α−iβ)x 2 y2 (x) = e mit α = −a und β = b − a . Die Wronski-Matrix und ihr Inverses sind eiβx e−iβx W (x) = eαx , (α + iβ)eiβx (α − iβ)e−iβx e−αx (−α + iβ)e−iβx e−iβx −1 W (x) = . 2iβ (α + iβ)eiβx −eiβx
Folglich gilt wegen (8.41) Z 1 x α(x−t) eiβ(x−t) − e−iβ(x−t) y(x) = e f (t) dt β 0 2i (8.43) Z x 1 = eα(x−t) sin β(x − t) f (t) dt. β 0 Diese Formel ist f¨ur jede Funktion f (t) erf¨ullt.
Die Cauchy-Gleichung Eine Gleichung der Form (8.44)
y (n) +
an−1 (n−1) a1 a0 y + . . . + n−1 y ′ + n y = 0 x x x
wird u¨ blicherweise Cauchy-Gleichung“ genannt. Ihre analytische L¨osung wurde ” in vollem Umfang von Euler (1769, Sectio Secunda, Caput V“) diskutiert. ” Anstelle von eλx sucht man nun nach L¨osungen der Form y(x) = xr .
(8.45)
Beispiel. Wir betrachten das Problem y ′′ +
(8.46)
1 ′ 1 y − 2 y = 0. x x
Einsetzen von (8.45) liefert r(r − 1) + r − 1 xr−2 = 0.
Die Wurzeln dieser Gleichung sind r = 1 und r = −1. Daher ist die allgemeine L¨osung von (8.46) gegeben durch (8.47)
y(x) = c1 x +
c2 . x
Eine weitere M¨oglichkeit, (8.44) zu l¨osen, besteht in der Substitution (8.48)
x = et ,
y(x) = z(t).
166 II. Differential- und Integralrechnung
Wegen (8.49)
z′ =
dz dy dx = · = xy ′ , dt dx dt
z ′′ = . . . = xy ′ + x2 y ′′
wird Gl. (8.46) zu einer Gleichung mit konstanten Koeffizienten z ′′ − z = 0, auf die wir die obige Theorie anwenden k¨onnen (Satz 8.3). So erhalten wir z(t) = c1 et + c2 e−t , was wiederum nach R¨uckeinsetzen der Substitution zu (8.47) wird.
¨ Ubungen 8.1 Sind λ1 , . . . , λn paarweise verschiedene komplexe Zahlen, so ist f¨ur alle x (8.50)
c1 eλ1 x + c2 eλ2 x + . . . + cn eλn x = 0
dann und nur dann, wenn c1 = c2 = . . . = cn = 0. Pn Hinweis. Ableiten von Gl. (8.50) an der Stelle x = 0 zeigt, dassP i=0 ci λki = n 0 f¨ur k = 0, 1, . . . gilt. Betrachten Sie dann den Ausdruck i=1 ci p(λi ), wobei p(x) ein Polynom ist, das f¨ur λ1 , . . . , λj−1 , λj+1 , . . . , λn verschwindet, jedoch nicht f¨ur λj . 8.2 F¨ur paarweise verschiedene Werte λ1 , . . . , λn gilt n X ci + di x + ei x2 eλi x = 0 i=1
f¨ur alle x dann und nur dann, wenn alle Koeffizienten ci , di , ei verschwinden. Hinweis. Beweisen Sie, dass f¨ur ein beliebiges Polynom p gilt: Pn ′ ′′ i=1 ci p(λi ) + di p (λi ) + ei p (λi ) = 0.
8.3 Ein zweiter Zugang zum Fall mehrfacher charakteristischer Werte (d’Alembert 1748). Angenommen λ ist eine doppelte Wurzel von (8.10). Spalten Sie die Wurzel in zwei benachbarte Wurzeln λ und λ + ε auf (mit unendlich kleinem ε). In diesem Fall sind eλx , e(λ+ε)x und auch die Linearkombination y(x) =
e(λ+ε)x − eλx ε
L¨osungen des Problems. Zeigen Sie, dass aus letzterer f¨ur ε → 0 die L¨osung xeλx wird. 8.4 Suchen Sie eine spezielle L¨osung von y ′′ + 0,2y ′ + y = sin(ωx) und studieren Sie die Amplitude als Funktion von ω. Welches Ph¨anomen k¨onnen Sie beobachten?
II.8 Lineare Differentialgleichungen 167
8.5 Berechnen Sie eine spezielle L¨osung von y ′′ − 2y ′ + y = ex cos x a) durch Einsetzen von y = Aex sin x + Bex cos x; b) durch Variation der Konstanten; und c) durch L¨osen von y ′′ − 2y ′ + y = e(1+i)x . 8.6 L¨osen Sie die folgenden homogenen und inhomogenen Cauchy-Gleichungen: x2 y ′′ − xy ′ − 3y = 0,
x2 y ′′ − xy ′ − 3y = x4 ,
x2 y ′′ − 3xy ′ + 4y = 0.
Die letzte Gleichung f¨uhrt auf ein Problem mit doppelten Wurzeln. Meet the situation with determination (Laurel & Hardy 1933, The Sons of the Desert). 8.7 Seien y1 (x) und y2 (x) zwei L¨osungen von y ′′ + a(x)y ′ + b(x)y = 0. Zeigen Sie dann, dass f¨ur die Wronski-Matrix (8.40) gilt: Z x det W (x) = det W (x0 ) · exp − a(t) dt . x0
Hinweis. Finden Sie eine Differentialgleichung f¨ur z(x) = det W (x) .
168 II. Differential- und Integralrechnung
II.9 Numerisches L¨osen von Differentialgleichungen Ich habe immer wieder beobachtet, daß Mathematiker und Physiker mit abgeschlossenem Examen u¨ ber theoretische Ergebnisse sehr gut, aber u¨ ber die einfachsten N¨aherungsverfahren nicht Bescheid wußten. (L. Collatz 1951, Num. Beh. Diffgl., Springer-Verlag)
Oftmals ist es unm¨oglich, eine Differentialgleichung y ′ = f (x, y)
(9.1)
auf analytischem Wege zu l¨osen (bspw. y ′ = x2 + y 2 ). Falls es doch gelingt, kann es passieren, dass die auftretenden Integrale nicht elementar sind (z.B. bei y ′′ + sin y = 0, siehe (7.23)). Selbst wenn alle Integrale elementar sind, k¨onnen die erhaltenen Formeln noch immer nutzlos sein. Beispielsweise ist die L¨osung von y ′ = y 4 + 1 gegeben durch (siehe Gl. (5.16)) √
√ √ √ √ 2 y 2 + 2y + 1 2 √ ln + arctan(y 2 + 1) + arctan(y 2 − 1) = x + C, 8 4 y 2 − 2y + 1
was sich als a¨ ußerst sperrige Formel erweist, speziell wenn wir daran interessiert sind, y als Funktion von x auszudr¨ucken. Darum ist es interessant, nach numerischen Methoden zu suchen, um (9.1) direkt anzugehen.
Das Euler-Verfahren PROBLEM 85: Gegeben eine beliebige Differentialgleichung, finde man eine gute N¨aherung f¨ur ihr Integral. (Euler 1768, §650)
Gleichung (9.1) schreibt f¨ur jeden Punkt (x, y) einen Wert f (x, y) vor, der die Steigung der L¨osung benennt. Man kann sich also ein Feld von vielen kleinen Richtungspfeilen vorstellen (Joh. Bernoulli 1694). Diejenigen Kurven, die diesen Richtungen folgen, sind die L¨osungen von (9.1). In Abb. 9.1 finden Sie das Ex” emplo res patebit“ (genannt Riccatische Differentialgleichung) (9.2)
y ′ = x2 + y 2 ,
welches keine elementare L¨osung besitzt (Liouville 1841, J’ai donc pens´e qu’il ” pouvait eˆ tre bon de soumettre la question a` une analyse exacte . . .“). Offensichtlich sind die L¨osungen nicht eindeutig. Daher schreiben wir einen Anfangswert vor: (9.3)
y(x0 ) = y0 .
II.9 Numerisches L¨osen von Differentialgleichungen 169
1
−1
0
1
−1
ABB. 9.1. Vorgegebene Steigungen f¨ur y ′ = x2 + y 2 mit vier L¨osungen
Eulers Verfahren (Euler 1768, Sectio Secunda, Caput VII). Wir w¨ahlen h > 0 und ersetzen die L¨osung im Bereich x0 ≤ x ≤ x0 + h durch ihre Tangente ℓ(x) = y0 + (x − x0 ) · f (x0 , y0 ). F¨ur den Punkt x1 = x0 + h finden wir y1 = y0 + hf (x0 , y0 ). An diesem Punkt berechnen wir wieder eine neue Richtung und wiederholen den obigen Prozess mit dem Ziel, valores successivi“ zu erhalten: ” (9.4)
xn+1 = xn + h,
yn+1 = yn + hf (xn , yn ).
Dies ist das Euler-Verfahren. Die Funktion, die man durch Verbindung all dieser Tangenten erh¨alt, heißt Euler-Polygon. Wenn wir h → 0 streben lassen, n¨ahern sich diese Polygone der L¨osung an (siehe Abb. 9.2). Numerisches Experiment. Wir betrachten die Differentialgleichung (9.2), w¨ahlen die Anfangswerte x0 = −1,5, y0 = −1,4 und die Schrittweiten h = 1/4, 1/8, 1/16, 1/32. Die resultierenden Euler-Polygone sind in Abb. 9.2 abgebildet. Die numerische Approximation und ihre Fehler bei x = 0 sind in Tabelle 9.1 gelistet. Wir beobachten, dass sich die Fehler um einen Faktor 2 verringern, wann immer wir die Schrittweite halbieren ( Quot“ steht f¨ur den Quotienten zwischen ” den Fehlern zweier aufeinanderfolgender Schrittweiten). Eine Erkl¨arung dieser Beobachtung kann in jedem Lehrbuch u¨ ber numerische Analysis gefunden werden (bspw. Hairer, Nørsett & Wanner 1993, Abschnitt II.3, S. 159).
170 II. Differential- und Integralrechnung TABELLE 9.2. Ansatz (9.5)
TABELLE 9.1. Das Euler-Verfahren 1/h
y(0)
Fehler
4 8 16 32 64 128 256 512
0,7246051 0,2968225 0,1577289 0,0999576 0,0734660 0,0607632 0,0545412 0,0514618
−0,6762019 −0,2484192 −0,1093256 −0,0515543 −0,0250628 −0,0123599 −0,0061380 −0,0030586
Quot
1/h
2,722 2,272 2,121 2,057 2,028 2,014 2,007
2 −0,7330279 0,7814312 4 −0,1063739 0,1547771 5,049 8 0,0153874 0,0330159 4,688 16 0,0409854 0,0074179 4,451 32 0,0466509 0,0017523 4,233 64 0,0479776 0,0004257 4,116 128 0,0482984 0,0001049 4,058 256 0,0483772 0,0000260 4,029
Fehler
y(0)
Quot
h = 1/4
1
1 h = 1/8
x2 , y2 x1 , y1
−1
0
1
−1
h = 1/4
1 h = 1/2
x2 , y2
−1
x1 , y1
x0 , y 0
x0 , y 0
ABB. 9.2. Polygone f¨ur y ′ = x2 + y 2
ABB. 9.3. Parabeln der Ordnung 2
Taylorreihen-Ansatz PROBLEM 86: Man gebe eine deutliche Verbesserung der obigen Methoden f¨ur eine n¨aherungsweise Integration von Differentialgleichungen an, so dass das Ergebnis n¨aher an der Wahrheit liegt. (Euler 1768, §656)
Wir stellen fest, dass (9.4) die ersten zwei Terme einer Taylorreihe darstellt. Um nun die Genauigkeit zu verbessern, k¨onnen wir drei Terme verwenden, also (9.5)
yn+1 = yn + hyn′ +
h2 ′′ y . 2 n
Wir haben yn′ = f (xn , yn ), und um yn′′ zu berechnen, leiten wir die Differentialgleichungen einfach bez¨uglich x ab. Wir erhalten f¨ur y ′ = x2 + y 2 (9.6)
y ′′ = 2x + 2yy ′ = 2x + 2x2 y + 2y 3 .
Die numerischen Ergebnisse, die aus (9.5) mit h = 1/2, 1/4, 1/8 und 1/16 folgen, sind in Abb. 9.3 dargestellt. Wir haben die Polygone aus dem EulerVerfahren durch Polyparabeln“ ersetzt, die sich aus der gek¨urzten Taylorreihe ”
II.9 Numerisches L¨osen von Differentialgleichungen 171
v
−π
π
2π
y
ABB. 9.4. Vektorfeld der Pendelgleichung (9.8′ )
v
−π
π
2π
y
ABB. 9.5. L¨osungen f¨ur das Pendel (9.8′ ) v
Startwert −π
Startwert π
Euler, h = 0,15
2π
y
Taylor2, h = 0,3
ABB. 9.6. Numerische L¨osungen f¨ur das Pendel (9.8′ )
172 II. Differential- und Integralrechnung
zusammensetzen. Die Fehler bei x = 0 sind in Tabelle 9.2 notiert. F¨ur kleine h sind die Ergebnisse deutlich besser als mit dem Euler-Verfahren; Halbierung der Schrittweise liefert einen um den Faktor 4 kleineren Fehler. Bemerkung. Es ist nat¨urlich m¨oglich, weitere Terme der Taylorreihe in die Rechnung einzubeziehen, z.B. (9.7)
yn+1 = yn + hyn′ +
h2 ′′ h3 ′′′ y + y . 2! n 3! n
Die h¨oheren Ableitungen erh¨alt man durch wiederholte Ableitung der Differentialgleichung. Aus der Riccatischen Differentialgleichung folgt so aus (9.6): y ′′′ = 2 + 2y ′ y ′ + 2yy ′′ = 2 + 4xy + 2x4 + 8x2 y 2 + 6y 4 , y ′′′′ = 4y + 12x3 + 20xy 2 + 16x4 y + 40x2 y 3 + 24y 5 ,
usw.
Gleichungen zweiter Ordnung Betrachten wir exemplarisch die Pendelgleichung (7.23) y ′′ = − sin y.
(9.8)
Wir f¨uhren eine neue Variable f¨ur y ′ ein, so dass aus (9.8) y′ = v v′ = − sin y
(9.8′ )
wird. Dieses System kann als Vektorfeld gesehen werden, das an jedem Punkt (y, v) dem Punkt (y(x), v(x)) eine Geschwindigkeit zuordnet, mit der er sich in der Zeit x bewegt (Abb. 9.4). Die L¨osungen (y(x), v(x)) besitzen zu jedem Zeitpunkt genau diese Geschwindigkeiten. Sie sind in Abb. 9.5 skizziert. Die Ovale stellen Oszillationen dar; die sinus-artigen Kurven sind diejenigen F¨alle, in denen das Pendel u¨ berschl¨agt. Euler-Verfahren. Der Ansatz (Cauchy 1824) besteht darin, das Euler-Verfahren (9.4) auf beide Funktionen y(x) und v(x) anzuwenden. Falls y(x0 ) = y0 und v(x0 ) = v0 die gegebenen Anfangswerte sind, und h > 0 die gew¨ahlte Schritt¨ weite ist, ist das Aquivalent von (9.4) im Fall von (9.8′ ) einfach (9.9) xn+1 = xn + h,
yn+1 = yn + h · vn ,
vn+1 = vn − h · sin(yn ).
Abb. 9.6 zeigt die Euler-Polygone f¨ur die Anfangswerte y(0) = 1,2, v(0) = 0 und f¨ur h = 0,15. Wir stellen fest, dass unser primitives Verfahren im Gegensatz zur physikalischen Realit¨at vorhersagt, dass das Pendel mehr und mehr beschleunigt und schließlich u¨ berschl¨agt. Taylorreihen-Ansatz. Ableiten von (9.8′ ) bez¨uglich x liefert (9.10)
y ′′ = v′ = − sin y,
v ′′ = − cos y · y ′ = − cos y · v,
II.9 Numerisches L¨osen von Differentialgleichungen 173
was es uns erlaubt, einen zus¨atzlichen Term aus der Taylorreihe unserem Verfahren hinzuzuf¨ugen. Das Analogon zu Gl. (9.5) lautet
(9.11)
h2 ′′ h2 yn = yn + hvn − sin yn , 2 2 h2 ′′ h2 = vn + hvn′ + vn = vn − h sin(yn ) − cos yn · vn . 2 2
yn+1 = yn + hyn′ + vn+1
Die Ergebnisse (siehe Abb. 9.6 rechts) sind deutlich besser selbst f¨ur doppelte Schrittweite h.
¨ Ubungen 9.1 Wenden Sie das Euler-Verfahren mit h = 1/N auf die Gleichung y ′ = λy,
y(0) = 1
an, um eine N¨aherung f¨ur y(1) = eλ zu finden. Das Ergebnis ist eine wohlbekannte Formel aus Kapitel I. 9.2 (Umgekehrte Fehlerfunktion). Definieren Sie eine Funktion y(x) implizit durch die Beziehung Z y 2 2 x= √ e−t dt. π 0
Leiten Sie diese Formel ab und zeigen Sie, dass y(x) die Differentialgleichung √ π y2 y′ = e , y(0) = 0 2 erf¨ullt. Berechnen Sie die ersten vier Terme der Taylorreihe f¨ur y(x) (entwickelt um den Punkt x = 0).
9.3 (Van-der-Pol-Gleichung). Berechnen Sie y (i) und v (i) f¨ur i = 1, 2, 3 f¨ur die L¨osungen der Differentialgleichung 2
y ′ = v,
1
v′ = ε(1−y 2 )v − y, und berechnen Sie numerisch die L¨osung aus einem Taylorreihen-Ansatz dritter Ordnung f¨ur ε = 0,3, die Anfangswerte y(0) = 2,00092238555422, v(0) = 0, und f¨ur 0 ≤ x ≤ 6,31844320345412. Die richtige L¨osung ist periodisch in diesem Intervall und f¨ur die gegebenen Anfangswerte.
−2
−1 −1 −2
174 II. Differential- und Integralrechnung
II.10 Die Euler-Maclaurin-Formel Der K¨onig nennt mich meinen Professor“, und ich bin der gl¨ucklichste Mensch auf der Welt! ” (Euler ist stolz darauf, Friedrich II. in Berlin zu dienen) Ich habe hier einen großen Zyklopen von einem Geometer . . . der nur noch ein Auge besitzt, und eine neue Kurve, die er gegenw¨artig berechnet, k¨onnte ihn vollst¨andig erblinden lassen. (Friedrich II., siehe Spiess 1929, S. 165–166.)
Diese Formel wurde unabh¨angig von Euler (1736) und Maclaurin (1742) als kraftvolles Hilfsmittel zur Berechnung von Summen entdeckt, wie beispielsweise der harmonischen Summe 1 + 12 + 13 + . . . + n1 , der Summe der Logarithmen ln 2+ln 3+ln 4+. . .+ln n = ln n!, der Summe der Potenzen 1k +2k +3k +. . .+nk oder der Summe der reziproken Potenzen 1 + 21k + 31k + . . . + n1k . Dabei baut sie auf der Differentialrechnung auf. Problem. Zu einer gegebenen Funktion f (x) suchen wir eine Formel f¨ur die Summe (10.1)
S = f (1) + f (2) + f (3) + . . . + f (n) =
n X
f (i)
i=1
( investigatio summae serierum ex termino generali“). ”
Eulers Herleitung der Formel Die erste Idee (siehe Euler 1755, pars posterior, § 105, Maclaurin 1742, Band II, Kap. IV, S. 663f) besteht darin, auch die Summen mit verschobenem Argument zu betrachten: (10.2)
s = f (0) + f (1) + f (2) + . . . + f (n − 1).
Wir berechnen die Differenz S−s u¨ ber die Taylorreihe (Gl. (2.8) mit x−x0 = −1) f (i − 1) − f (i) = −
f ′ (i) f ′′ (i) f ′′′ (i) + − + ... 1! 2! 3!
und finden f (n) − f (0) =
n X i=1
n
f ′ (i) −
n
n
1 X ′′ 1 X ′′′ 1 X ′′′′ f (i) + f (i) − f (i) + . . . 2! i=1 3! i=1 4! i=1
P P Um nun diese Formel f¨ur f ′ (i) in eine Formel f¨ur f (i) zu u¨ berf¨uhren, ersetzen wir f durch seine Stammfunktion, die wir wiederum mit f schreiben: (10.3) Z n n n n n X 1 X ′ 1 X ′′ 1 X ′′′ f (i) = f (x) dx + f (i) − f (i) + f (i) − . . . . 2! i=1 3! i=1 4! i=1 0 i=1
II.10 Die Euler-Maclaurin-Formel 175
P P P Die zweite Idee ist nun, die Summen f ′ , f ′′ , f ′′′ etc. auf der rechten Seite zu entfernen, indem wir dieselbe Formel immer wieder einsetzen, wobei wir f jeweils durch f ′ , f ′′ , f ′′′ usw. ersetzt haben. Dies f¨uhrt uns auf eine Gleichung der Form Z n n X f (i) = f (x) dx − α f (n) − f (0) + β f ′ (n) − f ′ (0) (10.4) 0 i=1 − γ f ′′ (n) − f ′′ (0) + δ f ′′′ (n) − f ′′′ (0) − . . . Um die Koeffizienten α, β, γ, . . . zu berechnen, ersetzen wir nun wiederum in (10.4) f durch f ′ , f ′′ , . . ., und erhalten Rn P f (i) = 0 f (x) dx −α(f (n) − f (0)) +β(f ′ (n) − f ′ (0)) − . . . 1 P ′ 1 α − 2! f (i) = − 2! (f (n) − f (0)) + 2! (f ′ (n) − f ′ (0)) − . . . P 1 1 f ′′ (i) = + 3! (f ′ (n) − f ′ (0)) − . . . 3! .. . Rn Die Gesamtsumme muss dann nach (10.3) 0 f (x) dx sein. Daraus folgt 1 α 1 β α 1 = 0, β+ + = 0, γ+ + + = 0, . . . , 2! 2! 3! 2! 3! 4! 1 1 woraus wir α = − 21 , β = 12 , γ = 0, δ = − 720 , . . . berechnen k¨onnen, und wir finden (10.5)
(10.6)
α+
n X i=1
f (i) =
Z
n
f (x) dx + 0
1 1 f (n)−f (0) + f ′ (n)−f ′ (0) 2 12
1 1 − f ′′′ (n)−f ′′′ (0) + f (5) (n)−f (5) (0) + . . . . 720 30240
(10.1) Beispiel. Diese Formel, angewendet auf die folgende Summe von nahezu einer Million Terme, gibt uns bereits nach wenigen Rechenschritten eine ausgezeichnete N¨aherung des exakten Resultats: 1 1 1 1 1 1 + + + ... + = ln(106 ) − ln(10) + 10−6 − 11 12 13 1000000 2 20 1 1 1 + − 10−4 + 10−6 + . . . ≈ 11,463758469, 1200 120 252 Die Formel ist allerdings ohne Nutzen bei der Berechnung der ersten Terme 1 + 1 1 + . . . + 10 . 2 Die Bernoulli-Zahlen. Es ist u¨ blich, die Koeffizienten α, β, γ, . . . als Bi /i! (B0 = 1, α = B1 /1!, β = B2 /2!, . . .) zu schreiben, in (10.5) also k−1 X k (10.5′) 2B1 + B0 = 0, 3B2 + 3B1 + B0 = 0, . . . , Bi = 0. i i=0
176 II. Differential- und Integralrechnung
Diese sogenannten Bernoulli-Zahlen lauten, so weit wie Euler sie berechnet hatte: 1 1 , B8 = − , 42 30 5 691 7 3617 43867 = , B12 = − , B14 = , B16 = − , B18 = , 66 2730 6 510 798 174611 854513 236364091 =− , B22 = , B24 = − , 330 138 2730 8553103 23749461029 8615841276005 = , B28 = − , B30 = , 6 870 14322
B0 = 1, B10 B20 B26
1 B1 = − , 2
B2 =
1 , 6
B4 = −
1 , 30
B6 =
und B3 = B5 = . . . = 0. In dieser Schreibweise wird Gl. (10.6) zu
(10.6′)
n X
f (i) =
i=1
Z
n
f (x) dx + 0
+
1 f (n) − f (0) 2
X B2k f (2k−1) (n) − f (2k−1) (0) . (2k)!
k≥1
Beispiel. F¨ur f (x) = xq ist die Reihe von Gl. (10.6′) endlich und liefert uns die wohlbekannte Formel von Jak. Bernoulli (I.1.28), (I.1.29). Erzeugende Funktion. Um ein besseres Verst¨andnis f¨ur die Bernoulli-Zahlen zu erlangen,wenden wir eine von Eulers großen Ideen an: Wir betrachten die Funktion V (u), deren Taylorkoeffizienten gerade die uns interessierenden Zahlen sind, d.h. wir definieren (10.7)
V (u) = 1 + αu + βu2 + γu3 + δu4 + . . . B1 B2 2 B3 3 B4 4 =1+ u+ u + u + u + ... . 1! 2! 3! 4!
Nun lautet die Aussage von Formel (10.5) bzw. (10.5′) einfach
also
u u2 u3 V (u) · 1 + + + + . . . = 1, 2! 3! 4!
(10.8)
V (u) =
u . eu − 1
So haben wir unendlich viele algebraische Gleichungen in eine einzige analytische Formel u¨ berf¨uhrt. Die Tatsache, dass (10.9)
V (u) +
u u u u eu/2 + e−u/2 = u + = · u/2 2 e −1 2 2 e − e−u/2
eine gerade Funktion ist, zeigt auf elegantem Wege B3 = B5 = B7 = . . . = 0.
II.10 Die Euler-Maclaurin-Formel 177
De Usu Legitimo Formulae Summatoriae Maclaurinianae Wir setzen nun f (x) = cos(2πx) in Gl. (10.6′) ein, f¨ur diese gilt f (i) = 1 f¨ur alle i. Wir finden auf der linken Seite 1 + 1 + . . . + 1, w¨ahrend auf der rechten 0 + 0 + 0 + . . . steht, da cos(2πx) ebenso wie alle seine Ableitungen periodisch mit Periode 1 sind. Wir sehen, dass die Formel in dieser Form offensichtlich falsch ist! Ein weiteres Problem besteht darin, dass f¨ur die allermeisten Funktionen f die unendliche Reihe in (10.6′) noch nicht einmal konvergiert. Daher ist es erforderlich, die Formel nach einer endlichen Zahl an Termen abzubrechen und einen Ausdruck f¨ur den Rest anzugeben. Dies wurde von Jacobi (1834) in wundersch¨onem Latein ausgef¨uhrt (siehe oben), indem er Eulers Beweis rearrangierte und durchg¨angig den Fehlerterm (4.32) von Bernoulli-Cauchy benutzte. Erst sp¨ater entdeckte Wirtinger (1902), dass der Beweis durch wiederholte partielle Integration nach Art des Beweises von Gl. (4.32) viel leichter bewerkstelligt werden kann. Die Hauptzutat des Beweises besteht in den sogenannten Bernoulli-Polynomen. Bernoulli-Polynome. Die Polynome B1 (x) = B0 x + B1 B2 (x) = B0 x2 + 2B1 x + B2 B3 (x) = B0 x3 + 3B1 x2 + 3B2 x + B3 B4 (x) = B0 x4 + 4B1 x3 + 6B2 x2 + 4B3 x + B4 oder allgemein (10.10) erf¨ullen die Beziehungen (10.11)
= x − 12 = x2 − x + 16 = x3 − 32 x2 + 12 x = x4 − 2x3 + x2 −
1 30
,
k X k Bk (x) = Bi xk−i , i i=0
Bk′ (x) = kBk−1 (x),
Bk (0) = Bk (1) = Bk
(k ≥ 2).
Tats¨achlich ist die erste Formel von (10.11) eine Eigenschaft der BinomialKoeffizienten (siehe Satz I.2.1); die zweite Formel folgt direkt aus der Definition und (10.5′ ). (10.2) Satz. Es gilt n X i=1
f (i) =
Z
n
f (x) dx +
0
+
1 f (n) − f (0) 2
k X (−1)j Bj j=2
j!
mit (10.12)
k−1 ek = (−1) R k!
Z
ek , f (j−1) (n) − f (j−1) (0) + R n
0
ek (x) f (k) (x) dx. B
178 II. Differential- und Integralrechnung
ek (x) gleich Bk (x) f¨ur 0 ≤ x ≤ 1 und wird periodisch mit Periode 1 Dabei ist B fortgesetzt (siehe Abb. 10.1). .5 .0 −.5 .5 .0 .5 .0
e1 (x) B
1
2
3
4
e2 (x) B
1
2
3
4
e3 (x) B
1
2
3
4
ABB. 10.1. Bernoulli-Polynome
Beweis. Wir beginnen mit dem Beweis im Fall n = 1. Mit B1′ (x) = 1 und durch partielle Integration finden wir Z 1 Z 1 1 Z 1 f (x) dx = B1′ (x)f (x) dx = B1 (x)f (x) − B1 (x)f ′ (x) dx. 0
0
0
0
1 2 (f (1) + f (0)). Im
Der erste Term ist zweiten Term setzen wir B1 (x) = 12 B2′ (x) aus (10.11) ein und integrieren abermals, mit dem Ergebnis Z 1 B 1 Z 1 1 2 ′ ′ f (x) dx = f (1) + f (0) − f (1) − f (0) + B2 (x)f ′′ (x) dx 2 2! 2! 0 0
und, wenn wir derart fortfahren, (10.13) k Z 1 X 1 (−1)j Bj (j−1) f (1) + f (0) = f (x) dx + f (1) − f (j−1) (0) + Rk , 2 j! 0 j=2
mit
(−1)k−1 Rk = k!
(10.14)
Z
1
Bk (x) f (k) (x) dx.
0
Als n¨achstes wenden wir Gl. (10.14) auf die verschobenen Funktionen f (x+i−1) an und stellen fest: Z 1 Z i ek (x)f (k) (x) dx. Bk (x)f (k) (x + i − 1) dx = B 0
i−1
Wir erhalten die Behauptung von Satz 10.2, indem wir diese Formeln von i = 1 bis i = n aufsummieren. ⊓ ⊔
II.10 Die Euler-Maclaurin-Formel 179
Absch¨atzung des Restglieds. Die Absch¨atzungen (f¨ur 0 ≤ x ≤ 1) √ 1 1 3 1 |B1 (x)| ≤ , |B2 (x)| ≤ , |B3 (x)| ≤ , |B4 (x)| ≤ , 2 6 36 30 Rn lassen sich leicht pr¨ufen, und zeigen zusammen mit der Beziehung | 0 g(x) dx| ≤ Rn |g(x)| dx, dass gilt: 0 Z Z n 1 n ′ 1 e e (10.15) |R1 | ≤ |f (x)| dx, |R2 | ≤ |f ′′ (x)| dx, . . . . 2 0 12 0 Dies sind die strengen Absch¨atzungen f¨ur das Restglied der Euler-Maclaurin-Formel, die wir gesucht haben. Weitere Maximal- und Minimalwerte der Bernoulli¨ Polynome wurden von Lehmer (1940) berechnet; siehe Ubung 10.3. (10.3) Bemerkung. Wenn wir die Formel aus Satz 10.2 auf die Funktion f (t) = hg(a+ th) mit h = (b − a)/n anwenden, und wenn wir dann den Term f (n) − f (0) /2 auf die linke Seite bringen, erhalten wir (mit xi = a + ih) Z b n−1 X h h g(x0 ) + h g(xi ) + g(xn ) = g(x) dx 2 2 a i=1
(10.16)
+
k X hj j=2
j!
Bj g (j−1) (b) − g (j−1) (a)
k+1 k−1 h
+ (−1)
k!
Z
0
n
ek (t)g (k) (a + th) dt, B
worin wir auf der linken Seite die Trapezregel wiedererkennen. Gleichung (10.16) zeigt, dass der dominante Fehlerterm (h2 /12) g ′ (b) − g ′ (a) ist. Falls nun allerdings g periodisch ist, so verschwinden alle Terme der Euler-Maclaurin-Reihe ek f¨ur ein beliebiges k; dies erkl¨art die unerwartet guten und der Fehler gleicht R Ergebnisse von Tabelle 6.2 (Abschnitt II.6).
Die Stirling-Formel Wir setzen f (x) = ln x in die Euler-Maclaurin-Formel ein. Wegen n X
f (i) = ln 2 + ln 3 + ln 4 + ln 5 + . . . + ln n = ln (n!),
i=2
k¨onnen wir eine N¨aherung f¨ur die Fakult¨at n! = 1 · 2 · . . . · n erwarten. (10.4) Satz (Stirling 1730). Wir finden √ 1 2πn nn 1 1 1 e9 , (10.17) n! = · exp − + − + R en 12n 360n3 1260n5 1680n7
180 II. Differential- und Integralrechnung
e9 | ≤ 0,0006605/n8. Wir erhalten f¨ur n → ∞ die N¨aherung mit |R (10.18)
n! ≈
√ 2πn nn . en
Bemerkung. Diese ber¨uhmte Formel ist besonders n¨utzlich in der kombinatorischen Analysis, der Statistik und in der Wahrscheinlichkeitstheorie. Dabei haben wir Gleichung (10.17) schlicht nach dem vierten Term abgebrochen, da jeder weitere Term nicht mehr auf dieselbe Zeile gepasst h¨atte. Die numerischen Werte von (10.18) und (10.17) (mit jeweils einem, zwei und drei Korrekturtermen) haben wir in Tabelle 10.1 f¨ur n = 10 und n = 100 dem echten Wert von n! exemplarisch gegen¨uber gestellt. TABELLE 10.1. Fakult¨atsfunktion und ihre N¨aherungen durch die Stirling-Formel
n = 10 : Stirling 0 Stirling 1 Stirling 2 Stirling 3 n!
= = = = =
0,35|9869561874103592162317593283 · 107 0,36288|1005142693352994116531675 · 107 0,36287999|7141301292538591223941 · 107 0,3628800000|21301281279077612862 · 107 0,362880000000000000000000000000 · 107
n = 100 : Stirling 0 Stirling 1 Stirling 2 Stirling 3 n!
= = = = =
0,93|2484762526934324776475612718 · 10158 0,93326215|7031762340989619195146 · 10158 0,933262154439|367463946383356624 · 10158 0,9332621544394415|32371338864918 · 10158 0,933262154439441526816992388563 · 10158
¨ Beweis. Wir haben bereits zuvor in Ubung 10.1 gesehen, dass die Euler-MaclaurinFormel ineffizient wird, wenn die h¨oheren Ableitungen von f (x) auf dem betreffenden Intervall zu groß sind. Wir wenden deshalb die Formel mit f (x) = ln x auf die Summe von i = n + 1 bis i = m an. Aufgrund von Z dj (j − 1)! ln x dx = x ln x − x, ln x = (−1)j−1 , j dx xj erhalten wir aus Satz 10.2, dass m X
i=n+1
(10.19)
1 ln m − ln n 2 1 1 1 1 1 1 e + − − − 3 +R 5 3 12 m n 360 m n
f (i) = ln m! − ln n! = m ln m − m − (n ln n − n) +
e5 | ≤ 0,00123/n4 f¨ur alle m > n ist. Diese Absch¨atzung wiederum gilt, wobei |R erhalten wir aus (10.12), (10.15) und dem Fakt, dass |B5 (x)| ≤ 0,02446 f¨ur 0 ≤
II.10 Die Euler-Maclaurin-Formel 181
x ≤ 1 ist. Die Terme ln n!, n ln n, n und (1/2) ln n in (10.19) divergieren jeder f¨ur sich f¨ur n → ∞. Wir fassen sie deshalb zusammen und setzen 1 γn = ln n! + n − n + ln n, 2
(10.20) womit aus (10.19) wird: (10.21)
γn = γm +
1 1 1 1 1 1 e − − − − R5 . 12 n m 360 n3 m3
F¨ur gen¨ugend große n und m n¨ahern sich γn und γm einander beliebig an. Daher scheint es, dass die Werte γm f¨ur m → ∞ gegen einen Wert konvergieren, den wir γ nennen wollen (den genauen Beweis werden wir im Satz von Cauchy III.1.8 sehen). Wir betrachten dann den Grenzwert f¨ur m → ∞ in Gl. (10.21) und erhalten 1 1 1 b5 , ln n! + n − n + ln n = γ + − +R 2 12n 360n3
b5 | ≤ 0,00123/n4. Wenden wir die Exponentialfunktion auf diesen Ausmit |R druck an, finden wir (10.22) n! = Dn
√
n nn en
mit
1 1 b5 . Dn = eγ · exp − +R 3 12n 360n
Damit sind sowohl (10.18) als auch (10.17) bewiesen, √ sobald wir einsehen, dass der Limes von Dn (d.h., D = eγ ) tats¨achlich gleich 2π ist. Hierf¨ur rechnen wir mittels (10.22) den Ausdruck √ √ Dn · Dn n! · n! · (2n)2n · e−2n 2n 2 · 4 · 6 · 8 · . . . · 2n 2 √ = = · D2n n2n · e−2n · n · (2n)! 1 · 3 · 5 · 7 · . . . · (2n − 1) n aus, der ebenfalls gegen D strebt. Diese Formel erinnert uns an das Wallissche Produkt aus Gl. (I.5.27). Tats¨achlich strebt ihr Quadrat D · D 2 2 · 2 · 4 · 4 · 6 · 6 · · · (2n)(2n) 2(2n + 1) n n = · , D2n 1 · 3 · 3 · 5 · 5 · 7 · · · (2n − 1)(2n + 1) | {z n } | {z } →4 → π/2
√ e9 folgt aus gegen 2π, so dass D = 2π ist. Die behauptete Absch¨atzung f¨ur R (10.12) und |B9 (x)| ≤ 0,04756. ⊓ ⊔
182 II. Differential- und Integralrechnung
Die harmonische Reihe und die Eulersche Konstante Wir versuchen, 1+
1 1 1 1 + + + ...+ 2 3 4 n
durch Einsetzen von f (x) = 1/x in Satz 10.2 zu berechnen. Wegen f (j) (x) = (−1)j j!x−j−1 erhalten wir anstelle von (10.19) Z m m X 1 1 1 1 1 1 1 1 = dx + − − − 2 2 i 2 m n 12 m n n x (10.23) i=n+1 1 1 1 1 1 1 1 1 1 e + − − − + − + R9 , 120 m4 n4 252 m6 n6 240 m8 n8
e9 | ≤ 0,00529/n9 gilt. Die divergenten wobei dank |B9 (x)| ≤ 0,04756 diesmal |R Terme, die wir diesmal wie zuvor in (10.20) einsammeln, lauten γn =
n X 1 i=1
i
− ln n,
was genau wie oben untersucht wird, mit der Erkenntnis, dass die Folge γn konvergiert. Der von uns gefundene Wert (10.24)
1+
1 1 1 + + . . . + − ln n → γ = 0,57721566490153286 . . . 2 3 n
ist eine neue mathematische Konstante und tr¨agt den Namen Euler-Mascheroni” Konstante“ oder schlicht Euler-Konstante“ (siehe Abb. 10.2 f¨ur einen Ausschnitt ” eines Briefs von Euler, der seine Konstante und ihren Einsatz in der Berechnung der Summe aus Beispiel 10.1 enth¨alt). Lassen wir wie zuvor m → ∞ in (10.23) streben, finden wir (10.25)
n X 1 i=1
i
= γ + ln n +
1 1 1 1 1 e9 , − + − + +R 2n 12n2 120n4 252n6 240n8
e9 | ≤ 0,00529/n9. Um nun die Konstante γ zu finden, setzen wir beispielsmit |R weise n = 10 in Gl. (10.25) ein (so machte es Euler) und erhalten den Wert von (10.24). D. Knuth (1962) hat diese Konstante mit großer Genauigkeit berechnet. Doch bis heute ist unbekannt, ob sie rational oder irrational ist. 1
Abbildung mit Genehmigung des Birkhaeuser Verlags, Basel.
II.10 Die Euler-Maclaurin-Formel 183
ABB. 10.2. Euler u¨ ber seine Konstante (Brief an Joh. Bernoulli 1740, siehe Fellmann 1983, S. 96)1
¨ Ubungen 10.1 Die Spirale des Theodoros setzt aus rechtwinkligen Dreiecken zusam√ sich √ men, deren Seitenl¨angen 1, n und n + 1 betragen. Nach 17 Dreiecken hat sie eine komplette Drehung ausgef¨uhrt (dies √ scheint der Grund zu sein, warum Theodoros keine Wurzeln jenseits von 17 betrachtete). Von solchen Skrupeln unber¨uhrt wollen wir nun berechnen, wieviele Drehungen eine Milliarde dieser Dreiecke vollf¨uhren. Dies bedarf der Berechnung von (siehe Abb. 10.3) 1000000000 X 1 1 1+ arctan √ 2π i=18 i ¨ mit einem Fehler kleiner als 1. Diese Ubung ist nicht nur eine weitere Gelegenheit, die St¨arke der Euler-Maclaurin-Formel auszuspielen, sondern gibt uns zudem ein interessantes Integral zu l¨osen. 10.2 (Taylorreihe f¨ur tan x). Wenn wir cot x = 1/ tan x und coth x = 1/ tanh x definieren, sehen wir, dass Gl. (10.9) die Taylorreihe von (x/2) coth(x/2) darstellt. Sie k¨onnen hieraus die Taylorreihenentwicklung von x · coth x ableiten, und, indem Sie x durch ix ersetzen, auch die von x·cot x. Benutzen Sie schließlich den Zusammenhang 2 · cot 2x = cot x − tan x, um die Entwicklungskoeffizienten des Tangens zu bestimmen. Vergleichen Sie sie mit Gl. (I.4.18).
184 II. Differential- und Integralrechnung
1
1
1
√ 5
√
4
√
0
3 √
0
5
1
2 1
ABB. 10.3. Die Spirale des Theodoros von Kyrene, 470–390 v.Chr.
10.3 Best¨atigen Sie numerisch die Absch¨atzungen (Lehmer 1940) |B3 (x)| ≤ 0,04812, |B9 (x)| ≤ 0,04756, f¨ur 0 ≤ x ≤ 1.
|B5 (x)| ≤ 0,02446,
|B11 (x)| ≤ 0,13250,
|B7 (x)| ≤ 0,02607,
|B13 (x)| ≤ 0,52357
III Grundlagen der klassischen Analysis
Weierstraß erkl¨art Cauchy die gleichm¨aßige Konvergenz, der u¨ ber ein Gegenbeispiel von Abel nachdenkt (Zeichnung von K. Wanner)
. . . Ich bin mir nicht sicher, ob ich in zehn Jahren noch immer Geometrie machen werde. Ich denke auch, dass die Mine beinahe schon zu tief ist, und fr¨uher oder sp¨ater aufgegeben werden muss. Heutzutage er¨offnen Physik und Chemie glanzvollere Entdeckungen, die einfacher auszunutzen sind ... (Lagrange, 21. Sept. 1781, Brief an d’Alembert, Oeuvres, Band 13, S. 368)
Auf Eulers Tod im Jahr 1783 folgte eine Periode des Stillstands in der Mathematik. Er hatte virtuell jedes Problem gel¨ost: zwei un¨ubertroffene Abhandlungen u¨ ber die Analysis des Unendlichen und der Differentiale (Euler 1748, 1755), l¨osbare Integrale gel¨ost, l¨osbare Differentialgleichungen gel¨ost (Euler 1768, 1755), E. Hairer, G. Wanner, Analysis in historischer Entwicklung, Springer-Lehrbuch, DOI 10.1007/978-3-642-13767-9_3, © Springer-Verlag Berlin Heidelberg 2011
186 III. Grundlagen der klassischen Analysis
die Geheimnisse der Fl¨ussigkeiten (Euler 1755b), der Mechanik (Euler 1736b, Lagrange 1788), des Variationskalk¨uls (Euler 1744), der Algebra (Euler 1770) alle offenbart. Es schien, als bliebe keine Aufgabe mehr u¨ brig, die Euler nicht schon in den 30.000 Seiten seines Lebenswerkes abgearbeitet h¨atte. Die Th´eorie des fonctions analytiques“ von Lagrange (1797), befreit von ” ¨ ” allen Uberlegungen zu unendlich kleinen Werten, verschwindenden Zahlen, Grenzwerten und Fluxionen“, die Doktorarbeit von Gauß (1799) u¨ ber den Fundamen” talsatz der Algebra“ und die Studien zur Konvergenz der hypergeometrischen Reihe (Gauß 1812) markierten den Beginn einer neuen Epoche. Bolzano bemerkte, dass es Gauß’ erstem Beweis an Strenge gemangelt hatte; er gab sodann 1817 einen rein analytischen Beweis des Satzes, dass zwischen ” zwei Werten, die verschiedene Vorzeichen hervorbringen, mindestens eine Wurzel der Gleichung existieren muss“ (Satz III.3.5 unten). 1821 etablierte Cauchy neue Maßst¨abe an die Strenge in seinem ber¨uhmten Cours d’Analyse“. Die Fragen lauteten wie folgt: ” – Was ist eine Ableitung in Wahrheit? Antwort: Ein Grenzwert. – Was ist ein Integral in Wahrheit? Antwort: Ein Grenzwert. – Was ist eine unendliche Reihe a1 + a2 + a3 + . . . in Wahrheit? Antwort: Ein Grenzwert. Dies f¨uhrt zu: – Was ist ein Grenzwert? Antwort: Eine Zahl. Und schließlich die letzte Frage: – Was ist eine Zahl? Weierstraß und seine Mitstreiter (Heine, Cantor), sowie M´eray, beantworteten diese Frage um 1870–1872. Sie f¨ullten auch viele L¨ucken in Cauchys Beweisen, indem sie die Begriffe der gleichm¨aßigen Konvergenz (siehe Bild unten), der gleichm¨aßigen Stetigkeit, der termweisen Integration einer unendlichen Reihe und der termweisen Ableitung einer unendlichen Reihe kl¨arten. Das Herz dieses Kapitels bilden die Abschnitte III.5, III.6 und III.7, die jeweils die Integralrechnung, die Differentialrechnung und unendliche Potenzreihen behandeln. Die vorbereitenden Abschnitte III.1 bis III.4 werden uns in die Lage versetzen, unsere Theorien auf ein festes Fundament zu stellen. Abschnitt III.8 vervollst¨andigt die Integralrechnung und Abschnitt III.9 stellt zwei Ergebnisse von Weierstraß u¨ ber stetige Funktionen vor, die jede f¨ur sich aufsehenerregende Entdeckungen dieser Epoche waren.
III.1 Unendliche Folgen und reelle Zahlen 187
III.1 Unendliche Folgen und reelle Zahlen Wenn wir jeder positiven ganzen Zahl n eine Zahl sn zuordnen, so sprechen wir von einer (unendlichen) Folge und schreiben (1.1)
{sn } = {s1 , s2 , s3 , s4 , s5 , . . .}.
Die Zahl sn nennen wir den n-ten Term oder allgemeinen Term der Folge. Ein erstes Beispiel sei (1.2)
{1, 2, 3, 4, 5, 6, . . .},
welches eine arithmetische Folge oder auch arithmetische Progression darstellt. Dies bedeutet, dass der Abstand zweier aufeinander folgenden Terme konstant ist. Die Folge (1.3)
{q 0 , q 1 , q 2 , q 3 , q 4 , q 5 , . . .}
heißt geometrische Folge oder Progression (der Quotient zweier aufeinander folgenden Terme ist konstant).
Konvergenz einer Folge Man sagt, eine Gr¨oße ist der Grenzwert einer anderen Gr¨oße, wenn die zweite sich der ersten bis auf jede beliebig kleine Gr¨oße n¨ahert . . . (D’Alembert 1765, Encyclop´edie, tome neuvieme, a` Neufchastel.) Wenn eine variable Gr¨oße gegen einen festen Grenzwert konvergiert, ist es oftmals n¨utzlich, diesen Grenzwert durch eine besondere Notation zu bezeichnen, was wir durch das Setzen der Abk¨urzung lim vor die betroffene Variable erzielen wollen . . . (Cauchy 1821, Cours d’Analyse)
Wenn die Terme sn einer Folge (1.1) einer Zahl s f¨ur gen¨ugend großes n beliebig nahe kommen, so nennen wir diese Zahl den Grenzwert oder Limes von (1.1). Dieses Konzept ist sehr wichtig und bedarf einer exakteren Definition: – beliebig nahe“ heißt n¨aher als jede positive Zahl ε“, d.h. |sn − s| < ε. Dabei ” ” steht | · | f¨ur den Betrag und zwingt sn dazu, s sowohl in positiver als auch in negativer Richtung nahe zu sein. – f¨ur gen¨ugend großes n“ heißt, dass es ein N geben muss, so dass die obige ” Absch¨atzung f¨ur alle n ≥ N gilt. Mit den Symbolen ∀ ( f¨ur alle“) und ∃ ( es gibt“) k¨onnen wir die obige Idee in ” ” folgender kompakter Form beschreiben: (1.1) Definition (D’Alembert 1765, Cauchy 1821). Wir sagen, dass die Folge (1.1) konvergiert, falls es eine Zahl s gibt, so dass gilt: (1.4)
∀ε > 0 ∃N ≥ 1 ∀n ≥ N
|sn − s| < ε.
188 III. Grundlagen der klassischen Analysis 1.5
s2
1.4 s6
1.3
s10 1.2
s3
1.1
s7 s5
1.0 s 1 .9
s14
s11 s9
s8
s13
s12
s15
s18 s19
ε
s17
ε
s
s16
N
s4
ABB. 1.1. Konvergenz der Folge (1.6)
Wir schreiben dann (1.5)
s = lim sn n→∞
oder
sn → s.
Falls (1.4) f¨ur kein s gilt, so sagen wir, dass die Folge (1.1) divergiert. (1.2) Beispiele. Betrachten wir die Folge n1 2 3 4 5 o , , , , , ... , 2 3 4 5 6
also
sn =
n . n+1
Diese Folge konvergiert gegen 1, da n 1 |sn − 1| = − 1 = 1/ε − 1 gilt. Zu einem gegebenen ε > 0 k¨onnen wir also unser N als irgendeine ganze Zahl w¨ahlen, die gr¨oßer als 1/ε − 1 ist, wodurch Bedingung (1.4) verifiziert ist. Als n¨achstes Beispiel w¨ahlen wir die Folge 1 1 1 s2 = 1 + , s3 = 1 + − , 2 2 3 n X 1 1 1 1 s4 = 1 + − − , ... , sn = (−1)[(i−1)/2] 2 3 4 i s1 = 1, (1.6)
i=1
(dabei steht [i/2] f¨ur die gr¨oßte ganze Zahl k, die nicht gr¨oßer ist als i/2; also [i/2] = k falls i = 2k oder i = 2k + 1). Diese Folge ist in gewissem Sinne weniger trivial und wir haben sie in Abb. 1.1 dargestellt. Sie scheint gegen eine Zahl nahe 1,13 zu konvergieren (die wir nach unseren Erfahrungen aus Kap. I auf π/4 + ln 2/2 sch¨atzen). Wir stellen fest, dass es f¨ur gegebenes ε (hier ε = 0,058)
III.1 Unendliche Folgen und reelle Zahlen 189
stets ein letztes sn gibt (hier s16 ), das |sn −s| < ε verletzt. Daher ist (1.4) f¨ur N = 17 erf¨ullt. Die Tatsache, dass bereits einige fr¨uhere Terme (s3 , s5 , . . .) ebenfalls diese Absch¨atzung erf¨ullen, widerspricht (1.4) nicht im geringsten. (1.3) Satz. Wenn eine Folge {sn } konvergiert, dann ist sie beschr¨ankt, d.h. (1.7)
∃B ∀n ≥ 1
|sn | ≤ B.
Beweis. Wir setzen ε = 1. Wir wissen aus der Definition der Konvergenz, dass es eine ganze Zahl N gibt, so dass |sn − s| < 1 f¨ur alle n ≥ N gilt. Benutzen ¨ wir die Dreiecksungleichung (siehe Ubung 1.1), so erhalten wir |sn | = |sn − s + s| ≤ |sn − s| + |s| < 1 + |s| f¨ur n ≥ N und die Behauptung gilt wegen B = max {|s1 |, |s2 |, . . . , |sN −1 |, |s| + 1}. ⊓ ⊔ Umgekehrt ist es f¨ur die Beschr¨anktheit einer Folge nicht n¨otig, dass sie konvergiert. Beispielsweise ist die Folge (1.8) {sn } = 1, 0, 1, 0, 1, 0, 1, 0, . . .
zwar beschr¨ankt (mit B = 1) aber nicht konvergent. Die Folge (1.2) ist weder beschr¨ankt noch konvergiert sie. Die allgemeine arithmetische Folge (1.9) {sn } = d, 2d, 3d, 4d, 5d, . . . ist ebenfalls unbeschr¨ankt (f¨ur d 6= 0). F¨ur d > 0 erf¨ullt die Folge (1.10)
∀M > 0 ∃N ≥ 1 ∀n ≥ N
sn > M.
Um dies zu sehen, w¨ahlt man f¨ur N eine ganze Zahl mit N > M/d. Falls (1.10) erf¨ullt ist, so sagen wir, dass die Folge {sn } gegen Unendlich strebt und schreiben lim sn = ∞
n→∞
bzw.
sn → ∞.
In a¨ hnlicher Weise definieren wir limn→∞ sn = −∞. Als n¨achstes untersuchen wir die Konvergenz der Folge (1.3). (1.4) Lemma. F¨ur die geometrische Folge (1.3) finden wir: 0 f¨ur |q| < 1, lim q n = 1 f¨ur q = 1, n→∞ ∞ f¨ur q > 1. Die Folge (1.3) divergiert f¨ur q ≤ −1.
Beweis. Wir beginnen mit dem Fall q > 1, schreiben q = 1 + r (mit r > 0) und wenden Satz I.2.1 an, mit dem Ergebnis q n = (1 + r)n = 1 + nr +
n(n − 1) 2 r + . . . ≥ 1 + nr. 2
190 III. Grundlagen der klassischen Analysis
Folglich streben die Terme q n gegen Unendlich (zu einem gegebenen M w¨ahle man f¨ur (1.10) N ≥ M/r). F¨ur q = 1 ist die Aussage trivial. F¨ur |q| < 1 betrachten wir die Folge sn = (1/|q|)n , welche nach obigen ¨ Uberlegungen gegen Unendlich strebt. Zu einem gegebenen ε > 0 setzen wir nun M = 1/ε ein und wenden (1.10) auf die Folge {sn } an. So beweisen wir die Existenz einer ganzen Zahl N , so dass f¨ur jedes n ≥ N gilt sn > M oder, a¨ quivalent dazu, |q n | < ε. Wir schlussfolgern q n → 0. F¨ur q = −1 oszilliert die Folge zwischen −1 und 1 und f¨ur q < −1 ist sie unbeschr¨ankt und oszillierend. ⊓ ⊔ Der folgende Satz vereinfacht die Berechnung von Grenzwerten. (1.5) Satz. Seien sn → s und vn → v zwei konvergente Folgen. Dann konvergieren auch die Folgen, die durch termweise Addition, termweises Produkt sowie termweisen Quotienten aus den zwei Folgen {sn } und {vn } hervorgehen, und es gilt (1.11) (1.12) (1.13)
lim (sn + vn ) = s + v
n→∞
lim (sn · vn ) = s · v s s n lim = falls n→∞ vn v n→∞
vn 6= 0 und v 6= 0.
Beweis. Wir beginnen mit dem Beweis von (1.11). Dazu sch¨atzen wir |(sn + vn ) − (s + v)| = |sn − s + vn − v| ≤ |sn − s| + |vn − v| < 2ε = ε′ | {z } | {z } 0 so, dass 2ε = ε′ ist. Nach Voraussetzung konvergieren die Folgen {sn } und {vn } gegen s bzw. v. Daher gibt es N1 und N2 , so dass |sn − s| < ε f¨ur n ≥ N1 und |vn − v| < ε f¨ur n ≥ N2 gelten. W¨ahlen wir nun N = max(N1 , N2 ), so sehen wir, dass (1.4) f¨ur die Folge {sn + vn } erf¨ullt ist. Sind wir erst einmal an dieses Argument gew¨ohnt, ist eine Wiederholung seiner Erkl¨arung nicht n¨otig. F¨ur den Beweis von (1.12) m¨ussen wir sn vn − sv absch¨atzen. Wir addieren und subtrahieren die gemischten Produkte“ −svn + svn , mit dem Ergebnis ” |sn vn − sv| = |sn vn − svn + svn − sv| ≤ |vn | · |sn − s| + |s| · |vn − v| < (B + |s|) ε = ε′ . Hier wenden wir Satz 1.3 auf die Folge {vn } an. Es reicht aus, (1.13) f¨ur den Spezialfall sn = 1 f¨ur alle n zu beweisen, also s = 1. Das allgemeine Resultat folgt dann aus (1.12), da sn /vn das Produkt von (1/vn ) und sn ist. Wir stellen zuerst fest, dass die Werte von |vn | nicht beliebig
III.1 Unendliche Folgen und reelle Zahlen 191 s2
s2
1.4
1.4 s6
1.2
s6 s10
s3
s7 s5
1.0 s 1
s9 s8
s4
s14
s18 s19
s11 s15 s13 s17 s16 s 12
N
ε
1.2
s10 s3
s7 s5
ε 1.0 s 1
s9 s8
s14
s11
s18 s19
s15 s13 s17 s16 s
ε ε
12
N
s4
ABB. 1.2. Folge (1.6) als Cauchy-Folge
klein werden k¨onnen. Denn w¨ahlen wir ε = |v|/2 in der Definition der Konvergenz, erhalten wir |vn − v| < |v|/2 (und damit |vn | > |v|/2) f¨ur gen¨ugend große n. Aus dieser Absch¨atzung folgt 1 − 1 = |v − vn | ≤ 2|vn − v| ≤ 2ε = ε′ . ⊓ ⊔ vn v |vn | · |v| |v|2 |v|2 (1.6) Satz. Angenommen, die Folge {sn } konvergiert gegen s und sn ≤ B gilt f¨ur alle gen¨ugend großen n. Dann erf¨ullt auch der Grenzwert s die Bedingung s ≤ B.
Beweis. Wir werden zeigen, dass s > B zu einem Widerspruch f¨uhrt. Hierf¨ur setzen wir ε = s − B > 0. Gl. (1.4) impliziert nun, dass f¨ur gen¨ugend große n s − sn ≤ |sn − s| < ε = s − B,
gilt, also sn > B, was unserer Annahme widerspricht.
⊓ ⊔
Bemerkung. Das entsprechende Resultat f¨ur strikte Ungleichungen (sn < B f¨ur alle n impliziert s < B) ist falsch. Man sieht dies am Gegenbeispiel sn = n/(n + 1) < 1 mit limn→∞ sn = 1. Cauchy-Folgen. Lassen Sie uns nun ein wichtiges Problem angehen. Die Definition der Konvergenz in (1.4) zwingt uns zur Absch¨atzung von |sn − s|; der Grenzwert s muss also bereits bekannt sein. Aber was machen wir, wenn der Grenzwert s nicht bekannt ist, oder, wie in Beispiel (1.6), nicht mit beliebiger Genauigkeit angegeben werden kann? Es ist dann unm¨oglich, |s − sn | < ε f¨ur ε > 0 mit der geh¨origen mathematischen Strenge zu beweisen. Um dieses Hindernis zu umgehen, hatte Cauchy die Idee, den Ausdruck |sn − s| < ε in (1.4) durch |sn − sn+k | < ε f¨ur alle Nachfolger sn+k von sn zu ersetzen. (1.7) Definition. Eine Folge {sn } heißt Cauchy-Folge, wenn gilt: (1.14)
∀ε > 0 ∃N ≥ 1 ∀n ≥ N ∀k ≥ 1
|sn − sn+k | < ε.
192 III. Grundlagen der klassischen Analysis
Beispiel. Abb. 1.2 illustriert die Bedingung (1.14) anhand der Folge (1.6). Wir sehen, dass beispielsweise f¨ur ε = 0,11 die Bedingung (1.14) f¨ur n ≥ 17 erf¨ullt ist. Auf a¨ hnliche Weise sieht man, dass (1.14) f¨ur jedes ε > 0 gilt, da 1/(n + 2) + 1/(n + 3) gegen Null strebt. (1.8) Satz (Cauchy 1821). Eine Folge {sn } reeller Zahlen ist genau dann konvergent (mit einer reellen Zahl als Grenzwert), wenn sie eine Cauchy-Folge ist. Aus |sn − sn+k | ≤ |sn − s| + |s − sn+k | < 2ε folgt unmittelbar, dass konvergente Folgen Cauchy-Folgen sein m¨ussen. Ein strenger Beweis der Umkehrung, der u¨ ber Cauchys Intuition hinaus geht, ist erst m¨oglich, nachdem man das Konzept der irrationalen und reellen Zahlen verstanden hat. Im Gegensatz zu den Ergebnissen, die wir bis jetzt gesammelt haben (S¨atze 1.3, 1.5 und 1.6) ist Satz 1.8 im Rahmen rationaler Zahlen n¨amlich falsch. Beispielsweise ist die Folge (1.15) 1 , 1,4 , 1,41 , 1,414 , 1,4142 , 1,41421 , . . . . durchaus eine Cauchy-Folge rationaler Zahlen (es gilt |sn − sn+k | < 10−n+1 ), √ aber ihr Grenzwert 2 ist nicht rational.
Konstruktion der reellen Zahlen . . . Je mehr ich ueber die Principien der Functionentheorie nachdenke — und ich thue dies unabl¨assig —, um so fester wird meine Ueberzeugung, dass diese auf dem Fundamente algebraischer Wahrheiten aufgebaut werden muss . . . (Weierstraß 1875, Werke, Band 2, S. 235) Bitte vergiß alles, was Du auf der Schule gelernt hast; denn Du hast es nicht gelernt. . . . indem meine T¨ochter bekanntlich schon mehrere Semester studieren (Chemie), schon auf der Schule Differential- und Integralrechnung gelernt zu haben glauben und heute noch nicht wissen, warum x · y = y · x ist. (Landau 1930) √ 3 ist also nur ein Zeichen f¨ur eine Zahl, welche erst noch gefunden werden soll, nicht aber deren Definition. Letztere wird jedoch in meiner Weise, etwa durch (1.7, 1.73, 1.732, . . .) befriedigend gegeben. (G. Cantor 1889) . . . Definition der irrationalen Zahlen, bei welcher Vorstellungen der Geometrie . . . oft verwirrend eingewirkt haben. . . . Ich stelle mich bei der Definition auf den rein formalen Standpunkt, indem ich gewisse greifbare Zeichen Zahlen nenne, so dass die Existenz dieser Zahlen also nicht in Frage steht. (Heine 1872) F¨ur mich war damals das Gef¨uhl der Unbefriedigung ein so u¨ berw¨altigendes, dass ich den festen Entschluss fasste, so lange nachzudenken, bis ich eine rein arithmetische und v¨ollig strenge Begr¨undung der Principien der Infinitesimalanalysis gefunden haben w¨urde. . . . Dies gelang mir am 24. November 1858, . . . aber zu einer eigentlichen Publication konnte ich mich nicht recht entschliessen, weil erstens die Darstellung nicht ganz leicht, und weil ausserdem die Sache so wenig fruchtbar ist. (Dedekind 1872) Die Analysis zu einem blossen Zeichenspiele herabw¨urdigend . . . (Du Bois-Reymond 1882, Allgemeine Funktionentheorie, T¨ubingen)
III.1 Unendliche Folgen und reelle Zahlen 193
F¨ur viele Jahrzehnte wusste niemand, wie man irrationale Zahlen in den strengen mathematischen Rahmen einordnen k¨onnte, oder wie man den abschließenden ” Term“ einer Cauchy-Folge wie in (1.15) genau verstehen sollte. Dieser gordische ” Knoten“ wurde schließlich unabh¨angig voneinander von Cantor (1872), Heine (1872), M´eray (1872) (und auf vergleichbare Weise von Dedekind 1872) durch die folgende waghalsige Idee aufgel¨ost: Die ganze Cauchy-Folge selbst ist“ be” reits die reelle Zahl, die wir suchen (siehe Zitate). Das bedeutet, dass wir einer Cauchy-Folge von rationalen Zahlen sn (im weiteren als rationale Cauchy-Folge bezeichnet) eine reelle Zahl zuordnen. Dies scheint Satz 1.8 auf elegante Weise zu l¨osen. Aber es bleibt dabei noch einiges zu tun: Wir m¨ussen verschiedene rationale Cauchy-Folgen miteinander identifizieren k¨onnen, wenn sie dieselbe reelle Zahl beschreiben, wir m¨ussen algebraische und Ordnungsrelationen f¨ur diese neuen Objekte definieren, und wir werden schließlich den Beweis von Satz 1.8 viel schwieriger vorfinden, als wir anf¨anglich dachten, da die Terme sn in (1.4) nun ihrerseits wieder reelle Zahlen sind, d.h. rationale Cauchy-Folgen. Alle diese Details wurden detailliert von Landau (1930) in einem ber¨uhmten Buch ausgearbeitet, in dem er selber zugibt, dass viele Teile nur eine langweilige M¨uhe“ sind. ” ¨ Die Aquivalenzrelation. Angenommen, dass √ 2 beschrieben wird durch {1,4 ; 1,41 ; 1,414 ; . . .} √ 3 beschrieben wird durch {1,7 ; 1,73 ; 1,732 ; . . .}, √ √ dann sollte 2 · 3 beschrieben sein durch die Folge der Produkte √
{2,38 ; 2,4393 ; 2,449048, . . .}.
Andererseits wird 6 auch durch {2,4 ; 2,44 ; 2,449 ; . . .} beschrieben. Daher m¨ussen wir die zwei Folgen miteinander identifizieren. Zwei rationale Cauchy-Folgen {sn } und {vn } heißen a¨ quivalent, wenn limn→∞ (sn − vn ) = 0 gilt, also (1.16)
∀ε > 0 ∃N ≥ 1 ∀n > N
|sn − vn | < ε.
Wir schreiben dann {sn } ∼ {vn }. Es ist nicht schwer zu u¨ berpr¨ufen, dass (1.16) ¨ eine Aquivalenzrelation auf der Menge aller rationalen Cauchy-Folgen definiert. Das bedeutet, wir haben {sn } ∼ {sn }
(Reflexivit¨at)
{sn } ∼ {vn } =⇒ {vn } ∼ {sn } (Symmetrie) {sn } ∼ {vn }, {vn } ∼ {wn } =⇒ {sn } ∼ {wn }
(Transitivit¨at).
¨ Dadurch k¨onnen wir die Menge aller rationalen Cauchy-Folgen in Aquivalenzklassen n o {sn } = {vn } {vn } ist eine rationale Cauchy-Folge mit {vn } ∼ {sn } ¨ zerlegen. Die Elemente einer Aquivalenzklasse heißen Repr¨asentanten.
194 III. Grundlagen der klassischen Analysis
¨ (1.9) Definition. Reelle Zahlen sind Aquivalenzklassen rationaler Cauchy-Folgen, d.h. n o R = {sn } {sn } ist eine rationale Cauchy-Folge . Die Menge Q der rationalen Zahlen kann nun in folgender Weise als Untermenge von R interpretiert werden: Wenn r ein Element von Q ist (abgek¨urzt: r ∈ Q), dann ist die konstante Folge {r, r, r, . . .} eine rationale Cauchy-Folge. So identifizieren wir die rationale Zahl r mit der reellen Zahl {r, r, . . .}. Addition und Multiplikation. Um nun mit R arbeiten zu k¨onnen, m¨ussen wir die u¨ blichen Operationen definieren. Seien s = {sn } und v = {vn } zwei reelle Zahlen. Wir definieren dann ihre Summe (Differenz) und ihr Produkt (Quotient) (1.17)
s + v := {sn + vn },
s · v := {sn · vn }.
Wir m¨ussen dabei sorgsam mit dieser Definition umgehen. Zun¨achst einmal m¨ussen wir sicherstellen, dass die Folgen {sn + vn } und {sn · vn } wieder rationale Cauchy-Folgen sind (dies folgt aus |(sn + vn ) − (sn+k + vn+k )| ≤ |sn − sn+k | + |vn − vn+k | f¨ur die Summe und wird f¨ur das Produkt aus dem Beweis von Satz 1.5 gewonnen). Dann m¨ussen wir zeigen, dass (1.17) wohldefiniert ¨ ist. Denn wenn wir verschiedene Repr¨asentanten der Aquivalenzklassen s und v w¨ahlen, beispielsweise {s′n } und {vn′ }, so muss das Ergebnis mit s + v u¨ bereinstimmen. Hierf¨ur m¨ussen wir zeigen, dass aus sn − s′n → 0 und vn − vn′ → 0 folgt (sn + vn ) − (s′n + vn′ ) → 0 und (sn · vn ) − (s′n · vn′ ) → 0. Aber dies finden wir exakt so wie im Beweis von Satz 1.5. Im n¨achsten Schritt m¨ussen wir die bekannten Regeln zum Rechnen mit reellen Zahlen u¨ berpr¨ufen (Kommutativit¨at, Assoziativit¨at, Distributivit¨at). Und hier setzt Landau’s langweilige M¨uhe“ ein. Wir u¨ berspringen diese Details und ” u¨ berlassen es dem Leser, entweder Landaus fabelhaftes Buch oder ein anderes Lehrbuch u¨ ber Algebra zu lesen. Ordnung. Seien s = {sn } und v = {vn } zwei reelle Zahlen. Wir definieren (1.18)
s < v :⇐⇒
∃ ε′ > 0 ∃ M ≥ 1 ∀ m ≥ M
s ≤ v :⇐⇒ s < v oder s = v
sm ≤ vm − ε′ ,
(dabei muss die Zahl ε′ rational sein, um eine Mehrdeutigkeit zu vermeiden). Die eher komplizierte Definition von s < v bedeutet, dass f¨ur gen¨ugend große m die Elemente sm und vm weit genug voneinander entfernt sein m¨ussen. Sie impliziert auch die Wohldefiniertheit der Relation. Offenbar reicht es n¨amlich nicht aus, sm < vm f¨ur alle m zu fordern (die Folgen {1, 1/2, 1/3, 1/4, . . .} und {0, 0, 0, . . .} stellen beide die reelle Zahl 0 dar und dienen als Gegenbeispiel). Die Relation s ≤ v aus (1.18) definiert eine Ordnungsrelation. Das bedeutet, wir haben s ≤ s (Reflexivit¨at) s ≤ v, v ≤ w =⇒ s ≤ w (Transitivit¨at) s ≤ v, v ≤ s
=⇒
s=v
(Antisymmetrie).
III.1 Unendliche Folgen und reelle Zahlen 195
Wir deuten nur kurz den Beweis der Antisymmetrie an. Angenommen, es gilt s ≤ v und v ≤ s, aber s 6= v. Dann gibt es positive rationale Zahlen ε′1 und ε′2 , so dass sm ≤ vm − ε′1 f¨ur m ≥ M1 und vm ≤ sm − ε′2 f¨ur m ≥ M2 gilt. F¨ur m ≥ max(M1 , M2 ) finden wir somit ε′2 ≤ sm −vm ≤ −ε′1 , was ein Widerspruch ist. (1.10) Lemma. Die Ordnung ≤ aus (1.18) ist total, d.h. f¨ur zwei beliebige reelle Zahlen s und v mit s 6= v gilt stets entweder s < v oder v < s. Bemerkung. s 6= v ist die Negation von s = v, was durch Gl. (1.16) ausgedr¨uckt wird. Um die Negation einer Aussage wie die von (1.16) zu formulieren, rufen wir uns ein wenig Logik in Erinnerung. Sei S(x) eine Aussage, die von x ∈ A abh¨angt (A sei irgendeine Menge) und ¬S(x) ihre Negation. Dann gilt: 2 ∀ x ∈ A S(x) ∃ x ∈ A S(x)
ist die Negation von ist die Negation von
∃ x ∈ A ¬S(x), ∀ x ∈ A ¬S(x).
Um nun die Negation einer langen Aussage zu finden, m¨ussen wir alle Quantoren umkehren ( ∀ ↔ ∃ ) und die letzte Aussage durch ihre Negation ersetzen. Daher erh¨alt man s 6= v aus (1.16) in der Form (1.19)
∃ε > 0 ∀N ≥ 1 ∃n ≥ N
|sn − vn | ≥ ε.
Beweis von Lemma 1.10. Seien s = {sn} und v = {vn } zwei verschiedene reelle Zahlen, so dass (1.19) gilt. Wir setzen ε′ = ε/3. Da {sn} und {vn } CauchyFolgen sind, gibt es N1 , so dass |sn − sn+k | < ε′ f¨ur n ≥ N1 und k ≥ 1 gilt, und es gibt N2 , so dass |vn − vn+k | < ε′ f¨ur n ≥ N2 und k ≥ 1 gilt. Wir w¨ahlen nun N = max(N1 , N2 ) und leiten aus (1.19) die Existenz einer ganzen Zahl n ≥ N ab, f¨ur die |sn − vn | ≥ ε gilt. Es gibt jetzt zwei F¨alle: (1.20)
oder
sn − vn ≥ ε
vn − sn ≥ ε.
≥ε
≥ε
ε′
ε′ vn
≥ ε′
sn
ε′
ε′ sn
≥ ε′
vn
ABB. 1.3. Darstellung der zwei F¨alle in (1.20)
F¨ur k ≥ 1 bleiben die Zahlen sn+k und vn+k in den Bereichen mit Radius ε′ = ε/3 (siehe Abb. 1.3). Daher ist (1.18) mit M = N erf¨ullt und wir haben s > v im ersten Fall, bzw. v > s im zweiten. ⊓ ⊔ 2
Die Behauptung alle (∀) Eisb¨aren sind weiß“ ist falsch, wenn es mindestens einen ” gef¨arbten (nicht weißen) Eisb¨aren gibt; und umgekehrt.
196 III. Grundlagen der klassischen Analysis
Der Betrag. Sobald wir gezeigt haben, dass die Ordnung total ist (Lemma 1.10), ist es m¨oglich, den Absolutwert oder Betrag einer Zahl s als s (f¨ur s ≥ 0) und −s (f¨ur s < 0) zu definieren. Eine einfache Folgerung dieser Definition ist (1.21)
|s| = {|sn |}
f¨ur
s = {sn }.
Die Dreiecksungleichung |s + v| ≤ |s| + |v| und alle ihre Konsequenzen gelten f¨ur reelle Zahlen. Bemerkung. In den Definitionen und S¨atzen 1.1 bis 1.7 waren wir nicht sonderlich genau beim Konzept der Zahl“. Um es logisch einwandfrei zu schreiben, ” h¨atten sie nur f¨ur rationale Zahlen behauptet werden sollen. Nachdem wir nun mit viel Schmerz und M¨uhe das Konzept der reellen Zahlen eingef¨uhrt haben, k¨onnen wir diese Definitionen auf reelle Zahlen ausdehnen und pr¨ufen, dass die Behauptungen der S¨atze im nun allgemeineren Kontext noch immer g¨ultig sind. Beweis von Satz 1.8. . . . bis jetzt wurden diese Propositionen als Axiome aufgefasst. (M´eray 1869, siehe Dugac 1978, S. 82)
Sei {si } eine Cauchy-Folge von reellen Zahlen, so dass jedes si seinerseits eine ¨ Aquivalenzklasse rationaler Cauchy-Folgen ist, also si = {sin }n≥1 . Der Ansatz ist nun der, zu jedem i eine Zahl zu w¨ahlen, die immer kleiner und kleiner wird (beispielsweise 1/2i) und hierauf die Definition der rationalen Cauchy-Folge anzuwenden, mit dem Ergebnis ∃ Ni ≥ 1 ∀ n ≥ Ni ∀ k ≥ 1 |sin − si,n+k |
0 ein αn , so dass αn > ξ − ε erf¨ullt ist. Da αn keine obere Schranke von X ist, kann auch ξ − ε keine sein. ⊓ ⊔ (1.13) Satz. Sei {sn} eine Folge, die monoton w¨achst (sn ≤ sn+1 ) und nach oben beschr¨ankt ist (sn ≤ B f¨ur alle n). Dann konvergiert sie gegen einen reellen Grenzwert.
III.1 Unendliche Folgen und reelle Zahlen 199
Beweis. Nach Voraussetzung ist die Menge X = {s1 , s2 , s3 , . . .} nicht leer und nach oben beschr¨ankt (siehe Abb. 1.5). Daher existiert ξ = sup X nach Satz 1.12. Nach Definition von sup X ist der Wert ξ − ε f¨ur ein gegebenes ε > 0 keine obere Schranke von X. Folglich gibt es ein N , so dass sN > ξ − ε ist. Da X nach oben durch ξ beschr¨ankt ist, gilt ξ − ε < sN ≤ sN +1 ≤ sN+2 ≤ sN +3 ≤ . . . ≤ ξ, also ξ − ε < sn ≤ ξ (bzw. |sn − ξ| < ε) f¨ur alle n ≥ N . Damit ist die Konvergenz von {sn } gegen ξ bewiesen. ⊓ ⊔ (1.14) Korollar. Wir betrachten zwei Folgen {sn } und {vn }. Nehmen wir an, {sn } ist monoton wachsend (sn ≤ sn+1 ) und sn ≤ vn gilt f¨ur alle (gen¨ugend großen) n. Dann gilt: {vn } konvergiert
=⇒
{sn} divergiert
=⇒
{sn } konvergiert, {vn } divergiert.
Beweis. Falls die Folge {vn } konvergiert, so ist sie nach Satz 1.3 beschr¨ankt. Damit ist auch die Folge {sn } beschr¨ankt und ihre Konvergenz folgt aus Satz 1.13. Die zweite Zeile ist die logische Umkehrung der ersten. ⊓ ⊔ Bemerkung. Auf a¨ hnliche Weise k¨onnen wir eine untere Schranke einer Menge definieren, ebenso von unten beschr¨ankte und monoton fallende Folgen. Wir benutzen die Notation (1.23)
ξ = inf X
f¨ur die gr¨oßte untere Schranke oder auch Infimum von X (d.h. x ≥ ξ f¨ur alle x ∈ X und ∀ ε > 0 ∃ x ∈ X mit x < ξ + ε). Es gibt dann S¨atze, die analog zu den S¨atzen 1.12 und 1.13 funktionieren.
H¨aufungspunkte Ich finde es wirklich u¨ berraschend, dass Mr. Weierstraß und Mr. Kronecker so viele Zuh¨orer — zwischen 15 und 20 — f¨ur ihre Vorlesungen gewinnen k¨onnen, obwohl sie so schwierig und auf so hohem Niveau sind. (Brief von Mittag-Leffler 1875, siehe Dugac 1978, S. 68)
Die Folge (1.24)
1 , 3
⌣
2 , 3
⌣
1 , 4
⌣
3 , 4
⌣
1 , 5
⌣
4 , 5
⌣
1 , 6
⌣
5 , 6
⌣
1 , 7
⌣
6 , 7
⌣
... →0 →1
konvergiert nicht. Entfernt man jedoch jeden zweiten Term, so konvergiert der Rest entweder gegen 0 oder gegen 1. Eine Folge, in der Terme fehlen, heißt Teil” folge“. Oder genauer:
200 III. Grundlagen der klassischen Analysis
(1.15) Definition. Eine Folge {s′n } heißt Teilfolge von {sn }, falls es eine steng monoton wachsende Abbildung σ : N → N gibt mit s′n = sσ(n) (streng monoton wachsend heißt, dass σ(n) < σ(m) ist, wann immer n < m ist). (1.16) Definition. Ein Punkt s heißt H¨aufungspunkt einer Folge {sn }, wenn es eine Teilfolge gibt, die gegen s konvergiert. Beispiele. Die Punkte 0 und 1 sind H¨aufungspunkte der Folge (1.24). Ein interessantes Beispiel ist die Folge (1.25)
n1 1 2 1 2 3 1 2 3 4 1 2 3 4 5 1 2 3 4 5 6 1 o , , , , , , , , , , , , , , , , , , , , , ,... , 2 3 3 4 4 4 5 5 5 5 6 6 6 6 6 7 7 7 7 7 7 8
f¨ur die alle Zahlen zwischen 0 und 1 (einschließlich 0 und 1 selber) H¨aufungspunkte sind. Um dies einzusehen, betrachten wir beispielsweise ln 2, und finden, dass die Folge n 6 69 693 6931 69314 693147 o , , , , , ,... 10 100 1000 10000 100000 1000000
gegen ln 2 strebt, und sicherlich als Teilfolge irgendwo in (1.25) enthalten ist; damit ist ln 2 ein H¨aufungspunkt von (1.25). Die unbeschr¨ankten Folgen {1, 2, 3, 4, 5, . . .}, {−1, −2, −3, −4, −5, . . .} und {1, −1, 2, −2, 3, −3, 4, −4, . . .}, besitzen keine H¨aufungspunkte. (1.17) Satz von Bolzano-Weierstraß (Weierstraß’ Vorlesung von 1874). Eine beschr¨ankte Folge {sn } besitzt mindestens einen H¨aufungspunkt. Beweis. Weierstraß’ urspr¨unglicher Beweis benutzt ein Halbierungsargument a¨ hnlich dem aus dem Beweis von Satz 1.12. Steht uns dieser Satz bereits zur Verf¨ugung, k¨onnen wir die Menge (1.26)
X = x sn > x f¨ur unendlich viele n
betrachten und einfach ξ = sup X setzen, was sich sofort als H¨aufungspunkt herausstellt (siehe Abb. 1.6). Diese Zahl existiert, weil X nicht leer und nach oben beschr¨ankt ist (die Folge {sn } ist beschr¨ankt). Nach Definition des Supremums kann nur eine endliche Zahl an sn die Bedingung sn ≥ ξ + ε erf¨ullen, weshalb unendlich viele Terme sn gr¨oßer als ξ − ε sein m¨ussen (ε ist dabei eine beliebige positive Zahl). Folglich liegen unendlich viele Terme sn im Intervall [ξ − ε, ξ + ε]. Wir w¨ahlen nun ein beliebiges Element der Folge, das in [ξ − 1, ξ + 1] liegt, und nennen es s′1 = sσ(1) . Sodann w¨ahlen wir ein Element in [ξ − 1/2, ξ + 1/2], dessen Index gr¨oßer ist als σ(1) (dies ist sicherlich m¨oglich, da es unendlich viele gibt), und nennen es s′2 = sσ(2) . Im n-ten Schritt w¨ahlen wir f¨ur s′n = sσ(n) ein Element der Folge in [ξ − 1/n, ξ + 1/n] mit Index gr¨oßer als σ(n − 1). Die so erhaltene Teilfolge konvergiert gegen ξ, da |s′n − ξ| ≤ 1/n. ⊓ ⊔
III.1 Unendliche Folgen und reelle Zahlen 201
X
ξ − 1/n
ξ + 1/n ξ = sup X
ABB. 1.6. Beweis des Satzes von Bolzano-Weierstraß
Bemerkung. Dieser Beweis bringt nicht etwa irgendeinen beliebigen H¨aufungspunkt hervor, sondern genau den gr¨oßten H¨aufungspunkt. Wir nennen ihn den Limes superior“ der Folge, und schreiben ihn als ” (1.27) ξ = lim sup sn = sup x ∈ R sn > x f¨ur unendlich viele n n→∞
¨ (siehe auch Ubung 1.12). F¨ur den kleinsten H¨aufungspunkt schreiben wir entsprechend (1.28) ξ = lim inf sn = inf x ∈ R sn < x f¨ur unendlich viele n . n→∞
Beispiel. F¨ur die Folge 32 , − 21 , 43 , − 31 , 54 , − 14 , 65 , − 51 , 76 , − 16 , 87 , − 71 . . . finden wir lim supn→∞ sn = 1, lim inf n→∞ sn = 0, sup{sn} = 3/2, inf{sn } = −1/2.
¨ Ubungen 1.1 (Dreiecksungleichung). Zeigen Sie, indem Sie alle m¨oglichen VorzeichenKombinationen untersuchen, dass f¨ur zwei beliebige reelle Zahlen u und v gilt: (1.29)
|u + v| ≤ |u| + |v|.
Zeigen Sie dann, dass f¨ur drei beliebige Zahlen u, v und w stets (1.29′ )
|u − w| ≤ |u − v| + |v − w|
erf¨ullt ist. 1.2 Zeigen Sie, dass die Folge {sn } mit sn =
2n − 1 n+3
gegen s = 2 konvergiert. Finden Sie zu einem gegebenen ε > 0, beispielsweise ε = 10−5 , eine Zahl N , so dass |sn − s| < ε f¨ur alle n ≥ N gilt.
202 III. Grundlagen der klassischen Analysis
1.3 Zeigen Sie, dass die Folgen sn =
1 1 1 1 1 + + + + ...+ 1 · 5 3 · 7 5 · 9 7 · 11 (2n − 1)(2n + 3)
sn =
1 1 1 1 + + + ...+ 1·2·3 2·3·4 3·4·5 n(n + 1)(n + 2)
Cauchy-Folgen sind und bestimmen Sie ihre Grenzwerte. Hinweis. Zerlegen Sie die rationalen Funktionen in Partialbr¨uche.
1.4 Konstruieren Sie zwei Folgen sn und vn mit lim sn = ∞ und lim vn = 0, n→∞ n→∞ um jede der folgenden M¨oglichkeiten zu realisieren: a) lim (sn · vn ) = ∞; n→∞
b) lim (sn · vn ) = c, wobei c eine beliebige Konstante ist; und n→∞
c) sn · vn ist beschr¨ankt aber nicht konvergent. 1.5 Betrachten Sie die drei Folgen sn =
√
√ n + 1000− n, vn =
q
n+
√
√ n − n, un =
r
n+
√ n − n. 1000
Zeigen Sie, dass sn > vn > un f¨ur n < 106 gilt und berechnen Sie lim sn , lim vn , lim un , sofern diese Grenzwerte existieren. Sortieren Sie n→∞ n→∞ n→∞ die Grenzwerte nach Gr¨oße. ¨ 1.6 Zeigen Sie mit Hilfe der Absch¨atzungen aus Ubung I.2.5, dass 1 n vn = 1 + n
eine Cauchy-Folge ist. Finden Sie f¨ur ε = 10−5 eine ganze Zahl N , so dass |vn − vn+k | < ε f¨ur alle n ≥ N und k ≥ 1 gilt.
1.7 Seien {an } und {bn } zwei Cauchy-Folgen, so wollen wir ihr termweises Produkt als {an · bn } schreiben. Zeigen Sie: a) Die Folge {an · bn } ist wieder eine Cauchy-Folge, und b) falls mit den Bezeichnungen aus (1.16) {an } ∼ {sn } und {bn } ∼ {vn } ist, dann ist auch {an · bn } ∼ {sn · vn }. Dies demonstriert, dass das Produkt zweier reeller Zahlen, wie es in (1.17) definiert wurde, unabh¨angig von der Wahl der Repr¨asentanten ist. 1.8 Zeigen Sie, dass, wenn s der einzige H¨aufungspunkt einer beschr¨ankten Folge {sn } ist, die Folge konvergent sein muss und gegen limn→∞ sn = s strebt. Zeigen Sie anhand eines Gegenbeispiels, dass dies f¨ur unbeschr¨ankte Folgen nicht mehr gelten muss.
III.1 Unendliche Folgen und reelle Zahlen 203
1.9 (Cauchy 1821, S. 59; auch unter dem Namen Ces`aro-Summe“ bekannt). Es ” sei limn→∞ an = a und n X 1 bn = ak . n k=1
Zeigen Sie, dass limn→∞ bn = a ist. √ 1.10 Sei α eine irrationale Zahl (beispielsweise α = 2 ). Betrachten Sie die Folge {sn }, die durch sn = (nα) mod 1 definiert wird, d.h. sn ∈ (0, 1) ist die Zahl, die man aus nα erh¨alt, wenn man den Ganzteil der Zahl entfernt. Berechnen Sie s1 , s2 , s3 , s4 , . . . und skizzieren Sie diese Werte. Zeigen Sie, dass jeder Punkt in [0, 1] ein H¨aufungspunkt dieser Folge ist. Hinweis. F¨ur ε > 0 und n ≥ 1/ε sind mindestens zwei der n + 1 Punkte s1 , s2 , . . . , sn+1 einander n¨aher als ε (wir nennen sie sk und sk+ℓ ). Dann formen die Punkte sk , sk+ℓ , sk+2ℓ , . . . ein Netz mit Maschenweite < ε. Bemerkung. Am Anfang des Computerzeitalters war diese Vorgehensweise die Standardmethode, um Pseudozufallszahlen zu erzeugen. 1.11 Seien {sn } und {vn } zwei beschr¨ankte Folgen. Beweisen Sie lim sup (sn + vn ) ≤ lim sup sn + lim sup vn n→∞
n→∞
n→∞
lim inf (sn + vn ) ≥ lim inf sn + lim inf vn . n→∞
n→∞
n→∞
Zeigen Sie anhand von Beispielen, dass die F¨alle “ explizit ” ” auftreten k¨onnen. 1.12 Beweisen Sie, dass f¨ur eine Folge {sn } gilt: lim sup sn = lim vn mit vn = sup sn , sn+1 , sn+2 , . . . . n→∞
n→∞
1.13 Berechnen Sie s¨amtliche H¨aufungspunkte der Folge
{sn } = p11 , p21 , p22 , p31 , p32 , p33 , p41 , p42 , . . . ,
pkℓ =
k X 1 . i2 i=ℓ
Beweisen Sie lim sup sn = π /6 (siehe Gl. (I.5.23)), und dass lim inf sn = 0 ist (siehe Abb. 1.7). 2
0
π2/6 − 1
1
ABB. 1.7. Folge mit einer abz¨ahlbaren Zahl an H¨aufungspunkten
π2/6
204 III. Grundlagen der klassischen Analysis
III.2 Unendliche Reihen Ich m¨ochte meine ganze Kraft daf¨ur einsetzen, Licht in die immense Dunkelheit zu bringen, die heutzutage in der Analysis herrscht. Ihr fehlt es so an einem Plan oder einem System, dass man wirklich erstaunt ist, dass sich ihr so viele Menschen hingeben — und, noch schlimmer, ihr fehlt es an jeder Strenge. (Abel 1826, Oeuvres, Band 2, S. 263) Cauchy ist verr¨uckt, und es gibt keine M¨oglichkeit, sich mit ihm gut zu stellen, obwohl er zur Zeit der einzige Mensch ist, der weiß, wie man Mathematik behandeln muss. Was er macht, ist exzellent, aber sehr verwirrend ... (Abel 1826, Oeuvres, Band 2, S. 259)
Seit Newton und Leibniz waren unendliche Reihen (2.1)
a0 + a1 + a2 + a3 + . . .
das universelle Werkzeug f¨ur Berechnungen aller Art (siehe Kap. I). Wir wollen hier nun pr¨azisieren, was (2.1) wirklich bedeutet. Die Idee besteht darin, die Folge {sn } der Partialsummen (2.2)
s0 = a0 ,
s1 = a0 + a1 ,
...,
sn =
n X
ai ,
...
i=0
zu betrachten und die Definitionen und Ergebnisse des vorhergehenden Abschnitts anzuwenden. Eine klassische Referenz zu unendlichen Reihen ist das Buch von Knopp (1922). (2.1) Definition. Wir sagen, dass die unendliche Reihe (2.1) konvergiert, falls die Folge {sn } von (2.2) konvergiert. Wir schreiben dann ∞ X
n→∞
i=0
1
q 1
q2 q
ai = lim sn . n→∞
i≥0
q3 q2
X
oder
ai = lim sn
q4 q3
q4
....
ABB. 2.1. Geometrischer“ Blickwinkel auf die geometrische Reihe ”
1 1−q
(2.2) Beispiel. Betrachten Sie die geometrische Reihe, deren n-te Partialsumme durch sn = 1 + q + q 2 + . . . + q n gegeben ist (siehe Abb. 2.1). Wenn wir diesen Ausdruck mit 1 − q multiplizieren, heben sich die meisten Terme weg, und wir finden (f¨ur q 6= 1) sn = 1 + q + q 2 + . . . + q n =
1 − q n+1 . 1−q
III.2 Unendliche Reihen 205
Aus Lemma 1.4 in Verbindung mit Satz 1.5 folgt 1 1−q 1 + q + q2 + q3 + q4 + q5 + . . . = divergiert → ∞ divergiert
falls |q| < 1, falls q ≥ 1,
falls q ≤ −1.
Konvergenzkriterien
¨ Ublicherweise ist es nicht m¨oglich, einen einfachen Ausdruck f¨ur sn zu finden, und dementsprechend schwer, den Grenzwert von {sn } explizit zu berechnen. In diesem Fall ist es am nat¨urlichsten, das Cauchy-Kriterium aus Satz 1.8 auf die Folge der Partialsummen anzuwenden. Wegen sn+k − sn = an+1 + an+2 + . . . + an+k erhalten wir (2.3) Lemma. Die unendliche Reihe (2.1) konvergiert gegen eine reelle Zahl genau dann, wenn gilt: ∀ ε > 0 ∃ N ≥ 0 ∀ n ≥ N ∀ k ≥ 1 an+1 + an+2 + . . . + an+k < ε. ⊓ ⊔ Setzen wir k = 1 in diesem Kriterium, so finden wir, dass
(2.3)
lim ai = 0
i→∞
eine notwendige Bedingung f¨ur die Konvergenz von (2.1) ist. Allerdings ist (2.3) keineswegs hinreichend. Dies sieht man beispielsweise am Gegenbeispiel 1 1 1 1 1 1 1 1 1 1 1 + + + + + + + + + + + . . . → ∞. 2 2 3 3 3 4 4 4 4 5 Im folgenden wollen wir einige hinreichende Bedingungen f¨ur die Konvergenz von (2.1) diskutieren. Das Leibniz-Kriterium. Wir betrachten eine unendliche Reihe, deren Terme alternierende Vorzeichen haben, also X (2.4) a0 − a1 + a2 − a3 + a4 − . . . = (−1)i ai . i≥0
(2.4) Satz (Leibniz 1682). Die Terme ai einer alternierenden Reihe (2.4) m¨ogen f¨ur alle i die Bedingungen ai > 0,
ai+1 ≤ ai ,
lim ai = 0
i→∞
erf¨ullen. Dann konvergiert die Reihe (2.4) gegen eine reelle Zahl s und es gilt die Absch¨atzung (2.5)
|s − sn | ≤ an+1 ,
d.h. der Fehler der n-ten Partialsumme ist nicht gr¨oßer als der erste vernachl¨assigte Term.
206 III. Grundlagen der klassischen Analysis
− a1 − a3 − a 5 s1
s3 s5
s4 + a4 + a2
s2
s0
ABB. 2.2. Beweis des Leibniz-Kriteriums
Beweis. Wir bezeichnen mit sn die n-te Partialsumme von (2.4). Sodann folgt aus der Monotonit¨atsbedingung s2k+1 = s2k−1 + a2k − a2k+1 ≥ s2k−1 und s2k+2 = s2k − a2k+1 + a2k+2 ≤ s2k . Aus der Positivit¨at von a2k+1 finden wir s2k+1 < s2k , so dass wir durch Kombination dieser Ungleichungen s1 ≤ s3 ≤ s5 ≤ s7 ≤ . . . ≤ s6 ≤ s4 ≤ s2 ≤ s0 schlussfolgern (siehe Abb. 2.2). Infolgedessen liegt sn+k f¨ur alle k zwischen sn und sn+1 , also insbesondere (2.6)
|sn+k − sn | ≤ |sn+1 − sn | = an+1 .
Hieraus folgt die Konvergenz von {sn } nach Satz 1.8, da an+1 f¨ur n → ∞ gegen 0 strebt. Schließlich erhalten wir die Absch¨atzung (2.5) aus der Betrachtung des Grenzwertes k → ∞ in (2.6) (z.B. mit Satz 1.6). ⊓ ⊔ Beispiel. Die Konvergenz der Reihen (siehe (I.4.29) und (I.3.13a)) 1−
1 1 1 + − + ... 3 5 7
und
1−
1 1 1 + − + ... 2 3 4
ist damit bewiesen. Allerdings haben wir so noch nicht streng bewiesen, dass die erste Summe π/4 und die zweite ln 2 darstellt (siehe Beispiel 7.11 unten). Wenn ein Kettenbruch (I.6.7) in eine unendliche Reihe u¨ berf¨uhrt wird, erhalten wir (siehe Gl. (I.6.16)) q0 +
p1 p1 p2 p1 p2 p3 p1 p2 p3 p4 − + − +... . B1 B1 B2 B2 B3 B3 B4
Wenn wir davon ausgehen, dass die ganzen Zahlen pi und qi positiv sind, so ist dies eine alternierende Reihe (zumindest ab dem zweiten Term). Desweiteren gilt Bk = qk Bk−1 + pk Bk−2 > pk Bk−2 , woraus folgt, dass die Terme der Reihe monoton fallen. Unter der zus¨atzlichen Annahme, dass 0 < pi ≤ qi f¨ur alle i ≥ 1 ist (siehe Satz I.6.4), haben wir 2 Bk Bk−1 = qk Bk−1 + pk Bk−1 Bk−2 > 2pk Bk−1 Bk−2
III.2 Unendliche Reihen 207
und damit auch Bk Bk−1 > 2k−1 pk pk−1 ·. . .·p1 . Dies beweist, dass die Terme der Reihe gegen Null streben, und nach Satz 2.4, dass die von uns betrachtete Reihe konvergiert. Majoranten- und Minorantenkriterium. F¨ur unendliche Reihen mit nicht-negativen Termen sind die folgenden Kriterien ausgesprochen hilfreich. (2.5) Satz. Es sei 0 ≤ ai ≤ bi f¨ur alle (gen¨ugend große) i. Dann gilt: P∞ P∞ =⇒ ai konvergiert, i=0 bi konvergiert P∞ Pi=0 ∞ =⇒ i=0 ai divergiert i=0 bi divergiert.
P P Beweis. Setzen wir sn = ni=0 ai und vn = ni=0 bi , so ist diese Aussage eine direkte Folgerung aus Korollar 1.14. ⊓ ⊔ Als erste Anwendung pr¨asentieren wir einen einfachen Beweis f¨ur die DiverP genz der harmonischen Reihe i≥1 1i (N. Oresme, um 1350; siehe Struik 1969, S. 320). Wir wenden das Minorantenkriterium wie folgt an: P
P
bi = 1 +
1 2
+ 31 +
1 4
+ 15 +
1 6
+
ai = 1 +
1 2
+ 14 + 14 + 18 + | {z } |
1 8
+1+1 + 1 + {z 8 8} |16
1/2
1 7
+
1 8
1/2
+ 91 +
1 10 1 16
+ ... +
1 16
1 + 17 + ...
1 + . . . + 16 + 1 + ... . {z } 32
1/2
P P Da ai divergiert, folgt aus 0 < ai ≤ bi , dass auch die harmonische Reihe bi divergieren muss. Als zweites Beispiel betrachten wir die Folge (I.2.18) f¨ur ex (z.B. f¨ur x = 10): (2.7)
1 + 10 +
102 103 104 105 + + + +... . 2! 3! 4! 5!
Wir lassen die ersten 10 Terme aus (dies beeinflusst die Konvergenz nicht), und vergleichen die restliche Reihe mit der geometrischen Reihe (Beispiel 2.2 mit q = 10/11 < 1) 1010 1011 1012 1010 + + +... = 1+ 10! 11! 12! 10! 10 10 ≤ 1+ 10!
10 10 · 10 10 · 10 · 10 + + + ... 11 11 · 12 11 · 12 · 13 10 102 103 + 2 + 3 + ... . 11 11 11
Die Konvergenz der geometrischen Reihe demonstriert also die Konvergenz von (2.7). Auf a¨ hnliche Weise zeigt man, dass die Reihe (I.2.18) f¨ur alle x konvergiert. Einen solchen Vergleich mit der geometrischen Reihe werden wir noch o¨ fters nutzen (siehe Kriterien 2.10 und 2.11, Lemma 7.1 und die S¨atze 7.5 und 7.7).
208 III. Grundlagen der klassischen Analysis
(2.6) Lemma. Die Reihe 1 1 1 1 1 + + α + α + α + ... 1α 2α 3 4 5
(2.8)
konvergiert f¨ur alle α > 1. Sie divergiert f¨ur α ≤ 1.
Beweis. Die Divergenz der Reihe f¨ur α = 1 (harmonische Reihe) haben wir oben bereits bewiesen. F¨ur α < 1 sind die einzelnen Terme sogar noch gr¨oßer, so dass die Folge nach Satz 2.5 divergieren muss. Als n¨achstes beweisen wir die Konvergenz von (2.8) f¨ur α = (k + 1)/k, wobei k ≥ 1 eine ganze Zahl sei. Der Ansatz besteht nun darin, die Reihe X 1 1 1 1 1 1− √ + √ − √ + √ − ... = (−1)i+1 √ , k k k k k 2 3 4 5 i i≥1
zu betrachten, die nach dem Leibniz-Kriterium konvergiert. Auf Summen von je zwei aufeinander folgenden Termen wenden wir nun das Minorantenkriterium an: √ √ k 1 1 2i − k 2i − 1 1 (2.9) − = √ √ √ ≥ Ck · (k+1)/k , √ k k k i 2i − 1 2i 2i − 1 · k 2i wobei Ck = 1/(k · 2(k+1)/k ) eine von i unabh¨angige Konstante ist. Die letzte Ungleichung in (2.9) erhalten wir aus der Identit¨at ak − bk = (a − b)(ak−1 + √ √ k k−2 k−3 2 k−1 a b+a b +...+ b ) mit a = 2i und b = k 2i − 1 wie folgt: √ k
2i −
√ k 2i − 1 =
1 1 ≥ . (2i)(k−1)/k + . . . + (2i − 1)(k−1)/k k · (2i)(k−1)/k
Danach ist nach Satz 2.5 die Reihe (2.8) konvergent f¨ur α = (k + 1)/k. Schließlich gibt es zu jedem beliebigen α > 1 stets eine ganze Zahl k, so dass α > (k + 1)/k ist. Wenden wir ein weiteres Mal Satz 2.5 an, finden wir die gesuchte Konvergenz f¨ur alle α > 1. ⊓ ⊔
Absolute Konvergenz Beispiel. Die Reihe (2.10)
1−
1 1 1 1 1 + − + − +... 2 3 4 5 6
konvergiert aufgrund des Leibniz-Kriteriums (und zwar gegen ln 2). Wenn wir nun die Reihe wie folgt umordnen: 1 1 1 1 1 1 1 1 1 1 1 1− − + − − + − − + − − + ... , | {z 2} 4 |3 {z 6} 8 |5 {z 10} 12 |7 {z 14} 16 1/2 1/6 1/10 1/14
III.2 Unendliche Reihen 209
so finden wir 1 1 1 1 1 1 1 1 1 1 − + − + − ... = 1 − + − + −... , 2 4 6 8 10 2 2 3 4 5
was nunmehr nur noch die H¨alfte der urspr¨unglichen Summe darstellt. Dies zeigt, dass der Wert einer unendlichen Summe von der Reihenfolge der Summation abh¨angen kann. P∞ ′ P∞ (2.7) Definition. P∞ Eine Reihe P∞ ′ i=0 ai heißt Umordnung von i=0 ai , wenn jeder Term von i=0 ai in i=0 ai genau einmal auftaucht und umgekehrt (d.h. es gibt eine bijektive Abbildung σ : N0 → N0 mit a′i = aσ(i) ; dabei sei hier N0 = {0, 1, 2, 3, 4, . . .}). Erkl¨arung. Eine elegante Erkl¨arung des obigen Ph¨anomens wurde von Riemann gegeben (1854, Werke, S. 235, . . . ein Umstand, welcher von den Mathematikern ” des vorigen Jahrhunderts u¨ bersehen wurde . . .“). Tats¨achlich hat Riemann weit mehr feststellen k¨onnen: Zu jeder gegebenen reellen Zahl A ist es m¨oglich, die Terme von (2.10) so umzuordnen, dass die resultierende Summe gegen A konvergiert. Der Grund liegt darin, dass die Summe der positiven Terme von (2.10) ebenso wie die Summe der negativen Terme 1+
1 1 1 1 + + + + ... 3 5 7 9
und
−
1 1 1 1 1 − − − − − ... 2 4 6 8 10
divergieren (oder anders gesagt: Die Reihe (2.10) divergiert, wenn man jeden Term durch seinen Betrag ersetzt). Die Vorgehensweise (f¨ur A > 0) besteht darin, zun¨achst soviele positive Terme 1 + 1/3 + . . . zu addieren, bis ihre Summe A u¨ bersteigt (dies muss irgendwann passieren, da die Reihe der positiven Terme divergiert). Dann addieren wir soviele negative Terme, bis die Summe wieder unter A f¨allt (auch dies muss irgendwann eintreten, da −1/2 − 1/4 − . . . divergiert). Dann f¨ugen wir wieder positive Terme hinzu, bis A abermals u¨ berschritten wird, und so fort. Auf diese Weise erhalten wir eine umgeordnete Reihe, die gegen A konvergiert (vergl. die Beispiele in Abb. 2.3). (2.8) Definition. Die Reihe (2.1) heißt absolut konvergent, wenn |a0 | + |a1 | + |a2 | + |a3 | + . . . konvergiert. P∞ (2.9) Satz (Dirichlet 1837b). Wenn die Reihe i=0 ai absolut konvergiert, dann konvergiert jede ihrer Umordnungen gegen denselben Grenzwert. Beweis. Nach dem Cauchy-Kriterium bedeutet absolute Konvergenz:
∀ ε > 0 ∃ N ≥ 0 ∀ n ≥ N ∀ k ≥ 1 |an+1 | + |an+2 | + . . . + |an+k | < ε
210 III. Grundlagen der klassischen Analysis 1,3 1,2 1,1 1,0 0,9 0,8 1,5 1,4 1,3 1,2 1,1 1,0
1,2 = 1 +
1 3
−
1 2
+
1 5
+
20
1 7
+
1 9
−
1 4
+
1 11
+ ...
40
1,5 = 1 +
1 3
+
1 5
20
−
1 2
+
1 7
+
60
1 9
+
1 11
+ ...
40
60
ABB. 2.3. Umordnungen der Reihe (2.10)
Zu einem gegebenen ε > 0 und dem dazugeh¨origen N ≥ 0 w¨ahlen wir eine ganze Zahl dass alle Terme a0 , a1 , . . . , aN in der M -ten Partialsumme PMM derart, ′ s′M = a der Umordnung erscheinen. Dadurch verschwinden in der Difi=0 i ferenz sm − s′m s¨amtliche Terme a0 , a1 , . . . , aN (f¨ur m ≥ M ) und wir finden |sm − s′m | ≤ |aN +1 | + |aN +2 | + . . . + |aN +k | < ε, wobei k eine gen¨ugend große ganze Zahl ist. Damit ist bewiesen, dass sm − s′m gegen 0 strebt, und dass die Umordnung gegen denselben Grenzwert konvergiert wie die urspr¨ungliche Reihe. ⊓ ⊔ Als n¨achstes stellen wir zwei hinreichende Kriterien f¨ur die absolute Konvergenz einer unendlichen Reihe vor. (2.10) Quotientenkriterium (Cauchy 1821). Wenn die Terme an einer Reihe (2.1) die Bedingung (2.11)
lim sup n→∞
|an+1 | 1 ist, so divergiert sie. Beweis. Wir w¨ahlen eine Zahl q, so dass lim supn→∞ |an+1 |/|an | < q < 1 gilt. Dann ist nur eine endliche Anzahl an Quotienten |an+1 |/|an | gr¨oßer als q und wir finden |an+1 | ∃N ≥ 0 ∀n ≥ N ≤ q. |an |
Hieraus folgt wiederum |aN+1 | ≤ q|aN |, |aN+2 | ≤ q 2 |aN |, |aN +3 | ≤ q 3 |aN | usw. Da die geometrische Reihe konvergiert (hier ist 0 < q < 1), konvergiert P auch die Reihe i≥0 |ai |.
III.2 Unendliche Reihen 211
Falls lim inf n→∞ |an+1 |/|an | > 1 gilt, so w¨achst die Folge {|an |} monoton an f¨ur n ≥ N , und die zur Konvergenz notwendige Bedingung (2.3) ist nicht erf¨ullt. ⊓ ⊔ Beispiele. Der allgemeine Term der Reihe f¨ur ex lautet an = xn /n!. Hier ist nun |an+1 |/|an | = |x|/(n + 1) → 0, so dass die Reihe (I.2.18) f¨ur alle reellen x absolut konvergiert. Analog zeigt man die absolute Konvergenz der Reihenentwicklungen von sin x und cos x f¨ur alle x. F¨ur die Reihe (2.8) kann dieses Kriterium nicht angewendet werden, da |an+1 |/|an | = (n/(n + 1))α → 1 strebt. (2.11) Das Wurzelkriterium (Cauchy 1821). Wenn p (2.12) lim sup n |an | < 1 n→∞
gilt, dann ist die Reihe (2.1) absolut konvergent. Wenn lim supn→∞ ist, so divergiert sie.
p n
|an | > 1
Beweis. Wie bereits im Beweis des Quotientenkriteriums w¨ahlen wir eine Zahl p q < 1, die strikt gr¨oßer ist als lim supn→∞ n |an |. Damit gilt p ∃ N ≥ 0 ∀ n ≥ N n |an | ≤ q.
Hieraus folgt |an | ≤ q n f¨ur n ≥ N und Vergleich mit der geometrischen Reihe p Pein ∞ liefert die absolute Konvergenz von i=0 ai . Falls lim supn→∞ n |an | > 1, so ist Bedingung (2.3) nicht erf¨ullt und die Reihe kann nicht konvergieren. ⊓ ⊔
Doppelreihen Wir betrachten eine zweidimensionale Anordnung reeller Zahlen
(2.13)
a00 + a10 + a20 + a30 + : = v0
+ a01 + + a11 + + a21 + + a31 + : = + v1
+ a02 + + a12 + + a22 + + a32 + : = + v2
+ a03 + + a13 + + a23 + + a33 + : = + v3
+... = +... = +... = +... =
+... =
s0 + s1 + s2 + s3 + : = ???
und wollen versuchen, sie alle aufzusummieren. Es gibt eine Vielzahl nat¨urlich anmutender Methoden hierzu. Man k¨onnte alle der i-ten Zeile summieren, PElemente ∞ das Ergebnis mit si bezeichnen, und dann i=0 si berechnen; man k¨onnte ebensogut alle Elemente der j-ten Spalte summieren, ihr Resultat mit vj bezeichnen
212 III. Grundlagen der klassischen Analysis M
1 − 1 + 0 + 0 +... = 0 + + + + + 0 + 1 − 1 + 0 +... = 0 + + + + + 0 + 0 + 1 − 1 +... = 0 + + + + + 0 + 0 + 0 + 1 − . . .= 0 + + + + + .. .. .. .. .. . . . . . = = = = = 1 + 0 + 0 + 0 + . . . = 1 6= 0
a00 a01
b1
a10 b2
b0
bN+1 b3
bN+3
bN−1
bN
M
bN+2
bN+4
ABB. 2.4a. Gegenbeispiel
bN+k
ABB. 2.4b. Doppelreihe
P und ∞ onnte auch zun¨achst alle Elemente linear hinj=0 vj berechnen. Man k¨ tereinander schreiben, und dann summieren. Beispielsweise k¨onnten wir mit a00 starten, dann die Elemente aij hinzuf¨ugen, f¨ur die i + j = 1 ist, dann diejenigen mit i + j = 2 und so weiter. Dies f¨uhrt dann zu (2.14)
a00 + (a10 + a01 ) + (a20 + a11 + a02 ) + (a30 + . . .) + . . . .
Wir notieren nun die Paare (0, 0), (1, 0), (0, 1), (2, 0), . . . als σ(0), σ(1), σ(2), σ(3), . . . , so dass σ eine Abbildung σ : N0 → N0 × N0 wird, wobei N0 × N0 = {(i, j) | i ∈ N0 , j ∈ N0 } das sogenannte kartesische Produkt von N0 und N0 ist. F¨ur den Allgemeinfall definieren wir also: P∞ (2.12) Definition. Eine Reihe k=0 bk heißt lineare Anordnung der Doppelreihe (2.13), falls es eine bijektive Abbildung σ : N0 → N0 ×N0 gibt, so dass bk = aσ(k) ist. Die Frage lautet nun: F¨uhren die verschiedenen M¨oglichkeiten, die Doppelreihe zu summieren, auch alle zum selben Ergebnis? Gilt also
(2.15)
s0 + s1 + . . . =
∞ X ∞ X i=0
j=0
∞ X ∞ X aij = aij = v0 + v1 + . . . j=0
i=0
und konvergieren alle linearen Anordnungen gegen denselben Wert? Das Gegenbeispiel aus Abb. 2.4a zeigt uns, dass dies nicht stimmt – zumindest nicht ohne zus¨atzliche Forderungen.
III.2 Unendliche Reihen 213
(2.13) Satz (Cauchy 1821, Note VII“). Wenn f¨ur die Doppelreihe (2.13) ” m X m X (2.16) ∃B ≥ 0 ∀m ≥ 0 |aij | ≤ B i=0 j=0
gilt, dann sind die Reihen in (2.15) konvergent und die Identit¨aten von (2.15) erf¨ullt. Desweiteren konvergiert dann jede lineare Anordnung der Doppelreihe gegen denselben Wert. Beweis.P Sei b0 + b1 + b2 + . . . eine lineare Anordnung der Doppelreihe (2.13). Die Folge { Pni=0 |bi |} w¨achst monoton an und ist beschr¨anktP(nach Annahme (2.16)), ∞ ∞ so dass i=0 |bi | konvergiert,Pund infolgedessen P auch i=0 bi . Analog k¨onnen ∞ ∞ wir die Konvergenz von si = j=0 aij und vj = i=0 aij feststellen. MotiviertP vom Beweis von Satz 2.9 wenden wir nun das Cauchy-Kriterium ∞ auf die Reihe i=0 |bi | an und finden ∀ ε > 0 ∃ N ≥ 0 ∀ n ≥ N ∀ k ≥ 1 |bn+1 | + |bn+2 | + . . . + |bn+k | < ε.
Zu einem gegebenen ε > 0 und dem entsprechenden N ≥ 0 w¨ahlen wir eine ganze Zahl M derart, dass sich alle Elemente b0 , b1 , . . . , bN in dem Rechteck 0 ≤ i ≤ M , 0 ≤ j ≤ M befinden Pl (siehe Abb. 2.4b). Mit dieser Wahl Pm erscheinen Pn b0 , b1 , . . . , bN in der Summe i=0 bi (f¨ur l ≥ N ) ebenso wie in i=0 j=0 aij (f¨ur m ≥ M und n ≥ M ). Daher gilt f¨ur l ≥ N , m ≥ M , n ≥ M , m n l X X X (2.17) aij − bi ≤ |bN +1 | + . . . + |bN +k | < ε i=0 j=0
i=0
P∞ f¨ur ein gen¨ugend großes k. Wir definieren s = i=0 bi und betrachten den Grenzwert f¨ur l P → ∞P und n → ∞ Pnin (2.17). Pm Dann vertauschen wir die endlichen Summ n mationen i=0 j=0 ↔ j=0 i=0 und betrachten die Grenzwerte f¨ur l → ∞ und m → ∞. Nach Satz 1.6 f¨uhrt uns dies zu X X m n ≤ ε. s − s ≤ ε und v − s i j i=0
Folglich konvergieren
j=0
P∞
i=0 si
und
P∞
j=0
vj gegen denselben Grenzwert s.
⊓ ⊔
Das Cauchy-Produkt zweier Reihen P∞ P∞ Wenn wir das Produkt zweier unendlicher Reihen i=0 ai und j=0 bj ausrechnen wollen, so m¨ussen wir alle Elemente der zweidimensionalen Tabelle
(2.18)
a0 b0 a1 b0
a0 b1 a1 b1
a0 b2 a1 b2
a0 b 3 a1 b 3
... ...
a2 b0 a3 b0 :
a2 b1 a3 b1 :
a2 b2 a3 b2 :
a2 b 3 a3 b 3 :
... ... .
214 III. Grundlagen der klassischen Analysis
addieren. Wenn wir die Elemente wie in Gl. (2.14) anordnen, bekommen wir das sogenannte Cauchy-Produkt der zwei Reihen. (2.14) Definition. Das Cauchy-Produkt der Reihen definiert als ∞ X n X
n=0
j=0
an−j · bj
P∞
i=0
ai und
P∞
j=0 bj
ist
= a0 b0 + (a0 b1 + a1 b0 ) + (a0 b2 + a1 b1 + a2 b0 ) + . . . .
Die Frage lautet nun, ob das P Cauchy-Produkt P konvergiert, und ob es tats¨achlich das Produkt der zwei Reihen i≥0 ai und j≥0 bj beschreibt. (2.15) Gegenbeispiel (Cauchy 1821). Die Reihe
1 1 1 1 1 − √ + √ − √ + √ − ... 2 3 4 5 konvergiert nach dem Leibniz-Kriterium. Wir betrachten ihr Cauchy-Produkt mit sich selbst. Wegen n n X X 1 2n + 2 √ √ a · b = ≥ n−j j n+2 n + 1 − j · j + 1 j=0 j=0
(diese Ungleichung folgt aus (n + 1 − x)(x + 1) ≤ (1 + n/2)2 f¨ur 0 ≤ x ≤ n) ist die notwendige Bedingung (2.3) f¨ur die Konvergenz des Cauchy-Produktes nicht erf¨ullt (siehe Abb. 2.5). Dieses Beispiel zeigt auf, dass das Cauchy-Produkt zweier konvergenter Reihen nicht konvergieren muss.
1
0
50
100
−1
ABB. 2.5. Divergenz des Cauchy-Produktes aus Gegenbeispiel 2.15
III.2 Unendliche Reihen 215
P∞ P∞ (2.16) Satz (Cauchy 1821). Wenn die zwei Reihen i=0 ai und j=0 bj absolut konvergieren, dann konvergiert ihr Cauchy-Produkt und es gilt: X X X ∞ ∞ ∞ X n (2.19) ai · bj = an−j · bj . i=0
n=0
j=0
j=0
P∞ P∞ Beweis. Nach Voraussetzung gilt i=0 |ai | ≤ B1 und j=0 |bj | ≤ B2 . Daher finden wir f¨ur die zweidimensionale Tabelle (2.18) f¨ur alle m ≥ 0 m X m X i=0 j=0
|ai ||bj | ≤ B1 B2
und l¨asst sich anwenden. Die P∞Satz 2.13P P∞ P∞Summe der i-ten Zeile gibt si = ai · ∞ b und s = ( a )( j i i j=0 i=0 i=0 j=0 bj ). Nach Satz 2.13 konvergiert das Cauchy-Produkt, das eine lineare Anordnung von (2.18) ist, gegen diesen Wert. ⊓ ⊔ Beispiele. F¨ur |q| < 1 betrachten wir die zwei Reihen 1 + q + q2 + q3 + . . . = Ihr Cauchy-Produkt ist
1 1−q
und
1 − q + q2 − q3 + . . . =
1 + q2 + q4 + q6 + . . . =
1 . 1+q
1 , 1 − q2
was tats¨achlich auch das Produkt von (1 − q)−1 und (1 + q)−1 ist. Das Cauchy-Produkt der absolut konvergenten Reihen ex = 1 + x +
x2 x3 + +... 2! 3!
und
ey = 1 + y +
y2 y3 + + ... 2! 3!
liefert die Reihenentwicklung f¨ur ex+y (benutzen Sie den binomischen Lehrsatz I.2.1). Bemerkung. Die Aussage von Satz 2.16 ist auch dann noch wahr, wenn nur eine der zwei Reihen absolut konvergiert und die zweite konvergiert (F. Mertens 1875, ¨ siehe Ubung 2.3). P P Unter der Annahme, dass die Reihen i ai , j bj und auch ihr CauchyProdukt (Definition 2.14) konvergieren, gilt die Identit¨at (2.19) (Abel 1826, siehe ¨ Ubung 7.9).
Vertauschen von unendlichen Reihen und Grenzwertbildung An verschiedenen Stellen in Kap. I standen wir vor dem Problem, eine unendliche Reihe mit einem Limes zu vertauschen (beispielsweise bei der Herleitung der Reihenentwicklung von ex in Abschnitt I.2 und von sin x und cos x in Abschnitt I.4).
216 III. Grundlagen der klassischen Analysis
P∞ Wir betrachteten Reihen dn = j=0 snj , die von einem ganzzahligen ParameP∞ ter n abh¨angen, und nutzten die Tatsache limn→∞ dn = j=0 limn→∞ snj aus. Bereits in Abschnitt I.2 (nach Gl. (I.2.17)) haben wir festgestellt, dass dies nicht immer gelten muss, und dass einige Vorsicht angebracht ist. Der folgende Satz gibt nun hinreichende Bedingungen an, unter denen eine solche Vertauschung erlaubt ist. (2.17) Satz. Angenommen, die Glieder der Folge {s0j , s1j , s2j , . . .} haben alle dasselbe Vorzeichen und |sn+1,j | P ≥ |snj | gilt f¨ur alle n und j. Wenn außerdem n eine Schranke B existiert, so dass j=0 |snj | ≤ B f¨ur alle n ≥ 0 gilt, dann ist (2.20)
lim
n→∞
∞ X
snj =
j=0
∞ X j=0
lim snj .
n→∞
Beweis. Der Ansatz besteht in einer Umformulierung der Voraussetzungen auf eine Weise, die die direkte Anwendung von Satz 2.13 erlaubt. Zu Beginn dieses Abschnitts haben wir gesehen, dass jede Reihe als unendliche Folge ihrer Partialsummen (2.2) aufgefasst werden kann. Umgekehrt bestimmen die Partialsummen Pn s0 , s1 , s2 , . . . diejenigen Elemente ai auf eindeutige Weise, f¨ur die i=0 ai = sn ist. Wir m¨ussen daf¨ur nur a0 = s0 und ai = si − si−1 f¨ur alle i ≥ 1 setzen. Wenden wir nun diesen Ansatz auf die Folge {s0j , s1j , s2j , . . .} an, so definieren wir a0j := s0j ,
aij := sij − si−1,j
mit
n X
aij = snj .
i=0
Ersetzen wir snj durch diesen Ausdruck, wird aus (2.20) (2.21)
lim
n→∞
∞ X n X j=0 i=0
aij =
∞ X j=0
lim
n→∞
n X
aij .
i=0
Vertauschen wir die Summationen auf der linken Seite von (2.21) (dies ist nach Satz 1.5 erlaubt), so sehen wir, dass (2.21) a¨ quivalent zu (2.15) ist. Daher m¨ussen wir nur noch Bedingung (2.16) nachweisen. Aus den Annahmen an {s0j , s1j , . . .} folgt, dass die Elemente a0j , a1j , . . . alle dasselbe Vorzeichen haben. Deshalb gilt n X i=0
|aij | = |snj |
und
n X n X i=0 j=0
|aij | =
n X j=0
|snj | ≤ B.
Nach Satz 2.13 impliziert dies (2.21) und damit auch (2.20).
⊓ ⊔
(2.18) Beispiel. Wir geben nun einen strengen Beweis von Satz I.2.3. Aus dem binomischen Lehrsatz folgt (2.22)
1+
y 2 (1 − n1 ) y 3 (1 − n1 )(1 − n2 ) y n =1+y+ + +... , n 1·2 1·2·3
III.2 Unendliche Reihen 217
was eine vom Parameter n abh¨angige Reihe charakterisiert. Wir setzen sn0 = 1,
sn1 = y,
sn2 =
y 2 (1 − n1 ) , 1·2
sn3 =
y 3 (1 − n1 )(1 − n2 ) , 1·2·3
... .
Zu einem festen y haben die Elemente der Folge {s0j , s1j , . . .} alle dasselbe Vorzeichen und {|s0j |, |s1j |, . . .} ist monoton wachsend. Desweiteren haben wir n X j=0
|snj | ≤
n X |y|j ≤B j! j=0
P j da nach dem Quotientenkriterium ∞ j=0 |y| /j! konvergiert. Satz 2.17 liefert uns dann schließlich y n y2 y3 y4 lim 1 + =1+y+ + + +... . n→∞ n 2! 3! 4!
¨ Ubungen 2.1 Berechnen Sie das Cauchy-Produkt der zwei Reihen f (x) = x −
x3 x5 + − ... 3! 5!
und
g(y) = 1 −
y2 y4 + −... 2! 4!
und finden Sie die Reihenentwicklung von f (x)g(y) + g(x)f (y). Rechtfertigen Sie Ihre Berechnungen. Kommt Ihnen das Ergebnis bekannt vor? 2.2 Zeigen Sie, dass das Cauchy-Produkt der zwei divergenten Reihen 2 + 2 + 22 + 23 + 24 + . . . −1 + 1 + 1 + 1 + 1 + 1 + . . . absolut konvergiert. P∞ 2.3 (Mertens 1875). P Die Reihe i=0 ai ∞ sei konvergent, j=0 bj sei absolut konvergent. Beweisen Sie, dass ihr Cauchy-Produkt aus Definition 2.14 konvergent ist, und dass (2.19) gilt. Hinweis. Wenden Sie die Dreiecksungleichung auf die Pnfolgende Identit¨at mit cn = j=0 an−j bj an (aber nur auf die ersten Summen): 2n X i=0
ci −
n X i=0
ai
n X j=0
n a0b0 a0b1 a0b2 a0b3 a0b4 a0b5 a0b6 a1b0 a1b1 a1b2 a1b3 a1b4 a1b5 a2b0 a2b1 a2b2 a2b3 a2b4 n a3b0 a3b1 a3b2 a3b3 a4b0 a4b1 a4b2 a5b0 a5b1 a6b0
2n−j 2n n−1 X 2n−j X X X bj = bj ai + bj ai . j=0
i=n+1
j=n+1
i=0
218 III. Grundlagen der klassischen Analysis
2.4 Bestimmen Sie Konstanten a1 , a2 , a3 , a4 , . . . so, dass das Cauchy-Produkt der zwei Reihen 1 − a1 + a2 − a3 + . . . 1 − a1 + a2 − a3 + . . . = 1 − 1 + 1 − 1 + . . . die divergente Reihe 1 − 1 + 1 − . . . ist. Zeigen Sie, dass die Reihe 1 − a1 + a2 − a3 + . . . konvergiert (Abb. 2.6). Konvergiert sie auch absolut? Hinweis. Die Verwendung der erzeugenden Funktion f¨ur die Zahlen 1, −a1 , ¨ a2 , −a3 , . . . f¨uhrt diese Ubung auf eine bekannte Formel aus Kapitel I und auf das Wallissche Produkt zur¨uck. 1
X
(−1)n an
n
0
50
1
X n
0
(−1)n
n X i=0
ai · an−i
50
¨ ABB. 2.6. Divergenz des Cauchy-Produktes aus Ubung 2.4
2.5 Rechtfertigen Sie Gl. (I.5.26), indem Sie den Logarithmus nehmen und die ¨ Ideen aus Ubung 2.18 anwenden.
III.3 Reelle Funktionen und Stetigkeit 219
III.3 Reelle Funktionen und Stetigkeit Wir wollen hier mit Funktion einer variablen Gr¨oße einen Wert bezeichnen, der in jeder beliebigen Weise aus dieser variablen Gr¨oße & aus Konstanten zusammengesetzt ist. (Joh. Bernoulli 1718, Opera, Band 2, S. 241) Wenn also f ( xa + c) eine beliebige Funktion bezeichnet . . . (Euler 1734, Opera, Band XXII, S. 59) Entspricht nun jedem x ein einziges, endliches y, . . . so heisst y eine . . . Function von x f¨ur dieses Intervall. . . . Diese Definition schreibt den einzelnen Theilen der Curve kein gemeinsames Gesetz vor; man kann sich dieselbe aus den verschiedenartigsten Theilen zusammengesetzt oder ganz gesetzlos gezeichnet denken. (Dirichlet 1837)
Reelle Funktionen y = f (x) einer reellen Variablen x sind seit Descartes das universelle Werkzeug zum Studium geometrischer Kurven, und seit Galilei und Newton auch Grundlage mechanischer und astronomischer Berechnungen. Das Wort functio“ wurde von Leibniz und Joh. Bernoulli vorgeschlagen, das Symbol ” ¨ von Leiby = f (x) wurde von Euler (1734) eingef¨uhrt (siehe Zitate). In der Ara niz und Bernoulli stellte man sich unter reellen Funktionen zumeist nur solche vor, die sich aus elementaren Funktionen zusammensetzen lassen. ( expressio √ ” analytica quomodocunque . . . . Sic a + 3z, az − 4z 2 , az + b a2 − z 2 , cz etc. sunt functiones ipsius z“, Euler 1748), m¨oglicherweise noch mit verschiedenen Formeln f¨ur verschiedene Definitionsbereiche ( curvas discontinuas seu mixtas ” et irregulares appellamus“). Im 19ten Jahrhundert setzte sich eine breitere Begriffsfassung durch, vornehmlich unter dem Einfluss der W¨armeleitungsgleichung (die vom Fourierschen Gesetz der W¨armeleitung abgeleitet wurde) und Dirichlets Studium der Fourierreihen: jede zeichenbare Kurve“ oder jeder Wert y, der von ” ” einem Wert x abh¨angt“ (siehe obige Zitate). (3.1) Definition (Dirichlet 1837). Eine Funktion f : A → B besteht aus zwei Mengen, dem Definitionsbereich A und dem Bildbereich B, sowie aus einer Regel, die jedem x ∈ A ein eindeutiges Element y ∈ B zuweist. Diese Zuordnung wird notiert als y = f (x) oder x 7→ f (x). Wir sagen: y ist das Bild von x, und x ist das Urbild von y. In diesem gesamten Abschnitt sei der Bildbereich stets R (oder ein Intervall) und der Definitionsbereich ist ein Intervall oder eine Vereinigung von Intervallen der Form (a, b) = {x ∈ R | a < x < b} oder [a, b] = {x ∈ R | a ≤ x ≤ b} oder (a, b] = {x ∈ R | a < x ≤ b} oder [a, ∞) = {x ∈ R | a ≤ x < ∞} etc. Das Intervall (a, b) heißt offen, w¨ahrend [a, b] als abgeschlossen bezeichnet wird. In den folgenden Beispielen verwenden wir große geschweifte Klammern f¨ur st¨uckweise definierte Funktionen, also Funktionen mit verschiedenen Ausdr¨ucken f¨ur verschiedene Teile des Definitionsbereichs A.
220 III. Grundlagen der klassischen Analysis
Beispiele. 1. Die Funktion f : [0, 1] → R, (3.1)
f (x) =
0 ≤ x ≤ 1/2 1/2 ≤ x ≤ 1,
x 1−x
0,5
ist rechts skizziert. Wir stellen fest, dass einige y ∈ R kein Urbild besitzen, und andere mehr als eines. 2. Unsere zweite Funktion kann entweder als Limes eines einzelnen Ausdrucks geschrieben werden oder mit Klammern durch Fallunterscheidung:
0,0
0,5
1,0
1
(3.2)
f (x) = lim arctan(nx) n→∞ x>0 π/2 = 0 x=0 −π/2 x < 0.
3. Die folgende, sehr schwer zu zeichnende Funktion geht auf Dirichlet zur¨uck (s. Werke, Band 2, S. 132, 1829, On aurait un exemple ” d’une fonction . . .“): (3.3)
f (x) =
0
x irrational
1
x rational.
4. Diese Funktion ist von a¨ hnlicher Natur wie Dirichlets, aber ihre Peaks werden f¨ur wachsende Nenner von x kleiner: (3.4)
f (x) =
0
x irrational
1/q
x = p/q gek¨urzt.
5. F¨ur x → 0 strebt 1/x gegen ∞, daher oszilliert (3.5)
f (x) =
sin 1/x 0
−2
−1
0
0
−1
1
2
n = 1, 2, 4, 8, 16, . .
1
0
1
0,5
0
1
x 6= 0 x=0
unendlich oft in der Umgebung des Ursprungs (Cauchy 1821).
0,5
III.3 Reelle Funktionen und Stetigkeit 221
6. Hier sind die Oszillationen nahe dem Nullpunkt aufgrund des d¨ampfenden Faktors x weniger heftig, aber es sind nach wie vor unendlich viele (Weierstraß 1874): (3.6)
f (x) =
x · sin 1/x 0
x 6= 0 x = 0.
7. Unser letztes Beispiel wurde laut Weierstraß (1872) von Riemann vorgeschlagen (vgl. Abschnitt III.9 unten) und wird als unendliche konvergente Summe definiert: (3.7)
f (x) =
∞ X sin(n2 x) . n2 n=1
0,5
1
0
1
2
3
Stetige Funktionen . . . f (x) heißt stetige Funktion, falls . . . die Zahlenwerte der Differenz f (x + α) − f (x) mit jenen von α unbegrenzt fallen . . . (Cauchy 1821, Cours d’Analyse, S. 43) Wir nennen dabei eine Gr¨osse y eine stetige Function von x, wenn man nach Annahme einer Gr¨osse ε die Existenz von δ beweisen kann, sodass zu jedem Wert zwischen x0 − δ . . . x0 + δ der zugeh¨orige Wert von y zwischen y0 − ε . . . y0 + ε liegt. (Weierstraß 1874)
Cauchy (1821) f¨uhrte das Konzept der stetigen Funktionen ein, indem er forderte, ¨ ¨ dass unbegrenzt kleine Anderungen von x zu unbegrenzt kleinen Anderungen von y f¨uhren sollen (siehe Zitat). Bolzano (1817) und Weierstraß (1874) pr¨azisierten (zweites Zitat): Die Differenz f (x) − f (x0 ) muss beliebig klein sein, sofern die Differenz x − x0 hinreichend klein ist. (3.2) Definition. Sei A eine Untermenge von R und x0 ∈ A. Die Funktion f : A → R ist stetig bei x0 , wenn zu jedem ε > 0 ein δ > 0 existiert, so dass f¨ur alle x ∈ A mit |x − x0 | < δ gilt |f (x) − f (x0 )| < ε, oder in Symbolen: ∀ ε > 0 ∃ δ > 0 ∀ x ∈ A : |x − x0 | < δ
|f (x) − f (x0 )| < ε.
Die Funktion f (x) heißt stetig, falls sie bei allen x0 ∈ A stetig ist. Siehe Abb. 3.1a f¨ur eine stetige Funktion und Abb. 3.1b–3.1f f¨ur Funktionen mit Unstetigkeiten.
222 III. Grundlagen der klassischen Analysis
b)
a) f(x0) εε
c)
f(x0) εε δ δ x0
d)
f(x0) εε
x0
e)
f)
f(x0) εε
f(x0) εε
x0
x0
f(x0) εε
x0
x0
ABB. 3.1. Stetige und unstetige Funktionen
Diskussion der Beispiele (3.1) bis (3.7). Die Funktion (3.1) ist u¨ berall stetig, selbst bei x0 = 1/2; die Funktion (3.2) ist unstetig bei 0; (3.3) ist u¨ berall unstetig; ¨ (3.4) ist stetig bei allen irrationalen x0 und unstetig f¨ur rationales x0 (Ubung 3.1); (3.5) ist unstetig bei x0 = 0; (3.6) ist u¨ berall stetig, selbst bei x = 0; (3.7) ist, obwohl sie heftigen Schwankungen zu unterliegen scheint, nichtsdestotrotz u¨ berall stetig (wie wir sp¨ater in Satz 4.2 sehen werden). (3.3) Satz. Eine Funktion f : A → R ist stetig bei x0 ∈ A dann und nur dann, wenn f¨ur jede Folge {xn }n≥1 mit xn ∈ A gilt: (3.8)
lim f (xn ) = f (x0 )
n→∞
falls
lim xn = x0 .
n→∞
Beweis. Zu einem gegebenen ε > 0 w¨ahlen wir δ > 0 wie in Definition 3.2. Wegen xn → x0 existiert ein N , so dass |xn − x0 | < δ f¨ur alle n ≥ N ist. Nach Stetigkeit bei x0 gilt dann |f (xn ) − f (x0 )| < ε f¨ur n ≥ N und (3.8) ist erf¨ullt. Nehmen wir nun an, (3.8) gilt, aber f (x) ist dennoch unstetig bei x0 . Die Negation der Stetigkeit bei x0 lautet ∃ ε > 0 ∀ δ > 0 ∃ x ∈ A : |x − x0 | < δ
|f (x) − f (x0 )| ≥ ε.
Die Idee besteht darin, δ = 1/n zu w¨ahlen und an x einen Index n zu setzen, welcher von δ abh¨angt. So erhalten wir eine Folge {xn } in A, so dass |xn − x0 | < 1/n gilt (und folglich xn → x0 ) w¨ahrend zugleich |f (xn ) − f (x0 )| ≥ ε ist. Dies widerspricht (3.8). ⊓ ⊔
III.3 Reelle Funktionen und Stetigkeit 223
(3.4) Satz. Seien f : A → R und g : A → R stetig bei x0 ∈ A und sei λ eine reelle Zahl. Dann sind auch die Funktionen f + g,
λ · f,
f · g,
f /g
( falls g(x0 ) 6= 0)
stetig bei x0 . Beweis. Wir w¨ahlen eine Folge {xn } mit Elementen aus A, die gegen x0 konvergiert. Die Stetigkeit von f und g erzwingt dann f (xn ) → f (x0 ) und g(xn ) → g(x0 ) f¨ur n → ∞. Nach Satz 1.5 gilt nun f (xn ) + g(xn ) → f (x0 ) + g(x0 ), so dass f + g offenbar stetig bei x0 sein muss (Satz 3.3). Die Stetigkeit der anderen Funktionen kann auf dieselbe Weise hergeleitet werden. ⊓ ⊔ Beispiel. Es ist offensichtlich, dass die konstante Funktion f (x) = a stetig ist. Die Funktion f (x) = x ist ebenfalls stetig (man w¨ahle δ = ε in Definition 3.2). Eine Folgerung aus Satz 3.4 ist dann, dass s¨amtliche Polynome P (x) = a0 + a1 x + . . .+an xn stetig sind, ebenso wie alle rationalen Funktionen R(x) = P (x)/Q(x) an Punkten x0 mit Q(x0 ) 6= 0.
Der Zwischenwertsatz Dieser Satz ist seit langer Zeit bekannt . . . (Lagrange 1807, Oeuvres, Band 8, S. 19, siehe auch S. 133)
Dieser Satz scheint geometrisch offensichtlich zu sein, und wurde von Euler und Gauß ohne Skrupel eingesetzt (siehe Zitat). Erst Bolzano fand, ein rein analyti” scher Beweis“ sei n¨otig, um der Analysis und Algebra mehr Strenge zu verleihen. (3.5) Satz (Bolzano 1817). Sei f : [a, b] → R eine stetige Funktion. Falls f (a) < c und f (b) > c, so gibt es ein ξ ∈ (a, b) mit f (ξ) = c.
Beweis. Die Menge X = {x ∈ [a, b] ; f (x) < c} ist nicht leer (a ∈ X) und wird durch b beschr¨ankt. Folglich existiert nach Satz 1.12 ihr Supremum ξ = sup X. Wir werden zeigen, dass f (ξ) = c gilt (Abb. 3.2). Angenommen, es ist f (ξ) = K > c. Wir setzen ε = K − c > 0 und folgern aus der Stetigkeit von f (x) bei ξ, dass es ein δ > 0 geben muss mit |f (x) − K| < ε
f¨ur |x − ξ| < δ.
Dies bedeutet, dass f (x) > K − ε = c f¨ur ξ − δ < x ≤ ξ gilt, was der Tatsache widerspricht, dass ξ das Supremum von X ist. In a¨ hnlicher Weise schließen wir den Fall f (ξ) = K < c aus. ⊓ ⊔
224 III. Grundlagen der klassischen Analysis
f(b)
X c
ξ = sup X
f(a) a
b ABB. 3.2. Beweis des Satzes von Bolzano
Satz vom Maximum und Minimum In seinem Satze, dem zufolge eine stetige Funktion einer reellen Ver¨anderlichen ihre obere und untere Grenze stets wirklich erreicht, d. h. ein Maximum und Minimum notwendig besitzt, schuf WEIERSTRASS ein Hilfsmittel, dass heute kein Mathematiker bei feineren analytischen oder arithmetischen Untersuchungen entbehren kann. (Hilbert 1897, Gesammelte Abh. , Band 3, S. 333)
Der folgende Satz wurde von Weierstraß in seinen Vorlesungen von 1861 Haupt” lehrsatz“ genannt und wurde von Cantor (1870) ver¨offentlicht. (3.6) Satz. Es sei f : [a, b] → R eine stetige Funktion, dann ist sie auf [a, b] beschr¨ankt und besitzt ein Maximum und ein Minimum, d.h. es gibt u ∈ [a, b] und U ∈ [a, b] mit (3.9)
f (u) ≤ f (x) ≤ f (U )
f¨ur alle
x ∈ [a, b].
Diskussion der Voraussetzungen. Die Funktion f : (0, 1] → R, die durch f (x) = 1/x definiert ist, ist nicht auf A = (0, 1] beschr¨ankt. Daher ist die Voraussetzung, dass der Definitionsbereich A geschlossen ist, unverzichtbar. Die Funktion f : [0, ∞) → R, die durch f (x) = x2 gegeben ist, zeigt, dass auch die Beschr¨anktheit des Definitionsgebietes von f (x) eine notwendige Voraussetzung ist. Die Funktion f : [0, 1] → R mit f (1/2) = 0 und f (x) = (x − 1/2)−2
f¨ur
x 6= 1/2
ist bei x = 1/2 unstetig und unbeschr¨ankt. Daher ist auch die Voraussetzung notwendig, dass die Funktion u¨ berall stetig ist. Unser letztes Beispiel beschreibt eine beschr¨ankte Funktion f : [0, 1] → R, die kein Maximum besitzt:
III.3 Reelle Funktionen und Stetigkeit 225 1,0
f (x) =
−3x + sin(1/x)
0,5
falls x 6= 0
0 falls x = 0 . Das Supremum der Menge {f (x) ; x ∈ [0, 1]} ist 1, aber es gibt kein U ∈ [0, 1] mit f (U ) = 1, d.h. das Supremum wird nicht angenommen.
0,0 0,0
0,1
0,2
−0,5 −1,0
Beweis von Satz 3.6. Wir beweisen zun¨achst, dass f (x) auf [a, b] beschr¨ankt ist. Wir nehmen daf¨ur das Gegenteil an: (3.10)
∀ n ≥ 1 ∃ xn ∈ [a, b]
|f (xn )| > n.
Die Folge x1 , x2 , x3 , . . . besitzt nach dem Satz von Bolzano-Weierstraß (Satz 1.17) eine konvergente Teilfolge. Wir umgehen es, neue Symbole einzuf¨uhren, und schreiben die Teilfolge wieder als x1 , x2 , x3 , . . ., mit der kurzen Bemerkung: ¨ nach Ubergang zu einer Teilfolge, gelte“ limn→∞ xn = ξ. Da f bei ξ stetig ist, ” folgt aus Satz 3.3 limn→∞ f (xn ) = f (ξ). Dies widerspricht (3.10) und beweist somit die Beschr¨anktheit von f (x). Um nun die Existenz von U ∈ [a, b] zu beweisen, f¨ur das (3.9) gilt, betrachten wir die Menge Y = {y ; y = f (x), a ≤ x ≤ b}. Diese Menge ist nicht leer und beschr¨ankt (wie wir soeben gesehen haben). Daher existiert das Supremum M = sup Y . Nach Definition 1.11 des Supremums ist der Wert M − ε (f¨ur beliebiges ε > 0) bereits keine obere Schranke von Y mehr. Wir w¨ahlen ε = 1/n und finden eine Folge von Elementen xn ∈ [a, b], die (3.11)
M − 1/n < f (xn ) ≤ M
erf¨ullen. Wenden wir nun den Satz von Bolzano-Weierstraß an; dazu gehen wir zu einer Teilfolge u¨ ber, f¨ur die {xn } konvergiert und schreiben den Grenzwert als U = limn→∞ xn . Aufgrund der Stetigkeit von f (x) bei U folgt aus (3.11), dass f (U ) = M ist. Die Existenz des Minimums beweist man a¨ hnlich. ⊓ ⊔
Monotone und Umkehrfunktionen (3.7) Definition. Es seien A und B Untermengen von R. Die Funktion f : A → B heißt • injektiv, falls f (x1 ) 6= f (x2 ) f¨ur x1 6= x2 , • surjektiv, falls ∀ y ∈ B ∃ x ∈ A f (x) = y , • bijektiv, falls sie injektiv und surjektiv ist, • steigend, falls f (x1 ) < f (x2 ) f¨ur x1 < x2 , • fallend, falls f (x1 ) > f (x2 ) f¨ur x1 < x2 , • nicht-fallend, falls f (x1 ) ≤ f (x2 ) f¨ur x1 < x2 , • nicht-steigend, falls f (x1 ) ≥ f (x2 ) f¨ur x1 < x2 , • monoton, falls sie nicht-steigend oder nicht-fallend ist, und • streng monoton, falls sie steigend oder fallend ist.
226 III. Grundlagen der klassischen Analysis
Streng monotone Funktionen sind injektiv. Interessanterweise ist f¨ur reelle Funktionen auf einem Intervall auch die umgekehrte Aussage wahr. (3.8) Lemma. Sei f : [a, b] → R stetig und injektiv, dann ist f streng monoton. Beweis. F¨ur je drei beliebige Punkte u < v < w liegt (3.12)
f(v)
f (v) zwischen f (u) und f (w) .
Denn angenommen, f (v) liegt außerhalb dieses Intervalls, und zwar beispielsweise n¨aher an f (u). Dann gibt es ein ξ zwischen v und w mit f (u) = f (ξ) (Satz 3.5). Dies widerspricht der Injektivit¨at von f . Daher sind f¨ur a < c < d < b die einzig m¨oglichen Anordnungen f (a) < f (c) < f (d) < f (b)
oder
f(u) f(w)
u
v
ξ
w
f (a) > f (c) > f (d) > f (b);
alle anderen Reihenfolgen der Ungleichungen widersprechen (3.12).
⊓ ⊔
Surjektivit¨at der Funktion f : A → B bedeutet, dass jedes y ∈ B mindestens ein Urbild besitzt. Injektivit¨at dagegen bedeutet, dass das Urbild eindeutig ist, falls es existiert. Daher besitzt eine bijektive Funktion eine Umkehrfunktion f −1 : B → A, die definiert ist durch (3.13)
f −1 (y) = x
⇐⇒
f (x) = y.
(3.9) Satz. Sei f : [a, b] → [c, d] stetig und bijektiv. Dann ist auch die Umkehrfunktion f −1 : [c, d] → [a, b] stetig. Beweis. Sei {yn } mit yn ∈ [c, d] eine Folge, die limn→∞ yn = y0 erf¨ullt. Nach Satz 3.3 m¨ussen wir zeigen, dass limn→∞ f −1 (yn ) = f −1 (y0 ) ist. Daf¨ur betrachten wir eine Folge {xn } = {f −1 (yn )}. Sei {x′n } eine konvergente Teilfolge (diese existiert nach dem Satz von Bolzano-Weierstraß) und schreiben ihren Grenzwert als x0 . Aus der Stetigkeit von f (x) bei x0 folgt f (x0 ) = lim f (x′n ) = lim yn′ = y0 , n→∞
n→∞
und damit x0 = f −1 (y0 ). Deshalb konvergiert jede konvergente Teilfolge von {xn } = {f −1 (yn )} gegen f −1 (y0 ). Dieser Punkt ist der einzige H¨aufungspunkt ¨ der Folge {f −1 (yn )} und wir finden f −1 (yn ) → f −1 (y0 ) (siehe auch Ubung 1.8). ⊓ ⊔ Beispiel. Jede der reellen Funktionen x2√ , x3 , √ . . . ist streng monoton auf [0, ∞) und besitzt daher eine Umkehrfunktion: x, 3 x, . . . . Nach Satz 3.9 sind diese Funktionen alle stetig.
III.3 Reelle Funktionen und Stetigkeit 227
Limes einer Funktion Der Begriff des Grenzwertes einer Funktion ist wohl zuerst von Weierstrass mit gen¨ugender Sch¨arfe definiert worden. (Pringsheim 1899, Enzyclop¨adie der Math. Wiss., Band II.1, S. 13)
Nehmen wir an, f (x) ist nicht stetig bei x0 oder sogar nicht definiert bei x0 ; in so einer Situation stellen wir uns die Frage, ob zumindest der Grenzwert von f (x) existiert, wenn x gegen x0 strebt. Offenbar muss daf¨ur x0 nahe am Definitionsbereich von f liegen. Wir sagen, x0 ist ein H¨aufungspunkt der Menge A, wenn (3.14)
∀ δ > 0 ∃ x ∈ A 0 < |x − x0 | < δ
erf¨ullt ist. F¨ur ein beschr¨anktes Intervall besteht die Menge der H¨aufungspunkte aus dem Intervall selbst und seinen zwei Endpunkten. (3.10) Definition. Es sei f : A → R eine Funktion und x0 ein H¨aufungspunkt von A. Wir sagen, dass der Grenzwert von f (x) bei x0 existiert und gleich y0 ist, also (3.15)
lim f (x) = y0 ,
x→x0
falls gilt: (3.16)
∀ ε > 0 ∃ δ > 0 ∀ x ∈ A : 0 < |x − x0 | < δ
|f (x) − y0 | < ε.
Diese Definition kann man variieren, um auch F¨alle der Art x0 = ±∞ und/oder y0 = ±∞ abzudecken (siehe beispielsweise Gl. (1.10)). Die Annahme, dass x0 ein H¨aufungspunkt ist, impliziert, dass die Menge der x ∈ A, die 0 < |x − x0 | < δ erf¨ullen, niemals leer ist. Mittels Definition 3.10 kann nun die Stetigkeit von f (x) bei x0 wie folgt ausgedr¨uckt werden (siehe Definition 3.2): (3.17)
lim f (x)
x→x0
existiert
und
lim f (x) = f (x0 ).
x→x0
Beispiele. Die Funktion aus Abb. 3.1b besitzt den Grenzwert limx→x0 f (x), der sich von f (x0 ) unterscheidet. F¨ur die Funktion (3.4) existiert der Grenzwert ¨ limx→x0 f (x) f¨ur alle x0 (siehe Ubung 3.1; erinnern Sie sich daran, dass der Punkt x0 in Definition 3.10 explizit ausgeschlossen wurde) und es ist limx→x0 f (x) = 0. Eine noch schw¨achere Eigenschaft ist die Existenz eines einseitigen Grenzwertes. (3.11) Definition. Wir sagen, dass der linksseitige (bzw. rechtsseitige) Grenzwert von f (x) bei x0 existiert, falls (3.16) unter der Einschr¨ankung x < x0 (bzw. x0 < x) gilt. Diese Grenzwerte schreiben wir als (3.18)
lim f (x) = y0
x→x0 −
bzw.
lim f (x) = y0 .
x→x0 +
228 III. Grundlagen der klassischen Analysis
Die Funktionen aus Abb. 3.1b, 3.1c und 3.1d besitzen links- wie rechtsseitige Grenzwerte (oftmals = f (x0 )); diese Grenzwerte existieren nicht f¨ur die Funktionen in den Abb. 3.1e and 3.1f. Der folgende Satz ist ein Analogon zum Cauchy-Kriterium aus Satz 1.8. (3.12) Satz (Dedekind 1872). Der Grenzwert limx→x0 f (x) existiert dann und nur dann, wenn gilt: (3.19) 0 < |x − x0 | < δ ∀ ε > 0 ∃ δ > 0 ∀ x, x b∈A : |f (x) − f (b x)| < ε. 0 < |b x − x0 | < δ Beweis. Der nur dann, wenn“-Teil folgt aus ”
|f (x) − f (b x)| ≤ |f (x) − y0 | + |y0 − f (b x)| < 2ε. F¨ur den dann, wenn“-Teil w¨ahlen wir eine Folge {xi } mit xi ∈ A, die gegen x0 ” konvergiert. Wegen (3.19) ist die Folge {yi } mit yi = f (xi ) eine Cauchy-Folge und konvergiert nach Satz 1.8 gegen, sagen wir, y0 . F¨ur ein x mit 0 < |x−x0 | < δ gilt nun, wieder aufgrund von (3.19), |f (x) − y0 | ≤ |f (x) − f (xi )| + |f (xi ) − y0 | < 2ε f¨ur gen¨ugend große i.
⊓ ⊔
¨ Ahnliche Ergebnisse finden sich f¨ur den Fall x0 = ±∞ sowie f¨ur einseitige Grenzwerte.
¨ Ubungen 3.1 Zeigen Sie, dass die Funktion (3.4) an allen irrationalen x0 stetig ist und nat¨urlich f¨ur alle rationalen x0 unstetig. √ Hinweis. Falls Sie auf Schwierigkeiten stoßen, setzen Sie x0 = 2 − 1 und ε = 1/10 und bestimmen Sie jene Werte von x, f¨ur die f (x) ≥ ε ist. Dies gibt Ihnen ein δ, f¨ur das die Aussage in Definition 3.2 erf¨ullt ist. 3.2 (Pringsheim 1899, S. 7). Zeigen Sie, dass sich die Dirichlet-Funktion (3.3) schreiben l¨asst als m f (x) = lim lim cos(n!πx) . n→∞ m→∞
III.3 Reelle Funktionen und Stetigkeit 229 0
3
1
0
2
0
0
1 0
0
0
0 −1
1
2
3
4
5
6
−2
−1
−3 1
1
0 −5 −4 −3 −2 −1 0 1 2 3 4 5
−1
0
−1
−1
0
2
1
1
7
0
0
1
1
−1 0
1
0
0
1
2
3
1 0
1 0 −4 −3 −2 −1 0
−1
1
2
3
0
4
0
−2 0
−3
0
1
2
3
¨ ABB. 3.3. Zw¨olf der Funktionen aus Ubung 3.5
3.3 Berechnen Sie die Grenzwerte √ √ x2 + 3x + 2 4+x− 4−x lim , lim . x→−1 x→0 x2 − 1 2x √ √ √ √ Hinweis. Erinnern Sie sich an ( a − b)( a + b) = a − b.
3.4 Beweisen Sie: Falls f : [a, b] −→ [c, d] stetig bei x0 und g : [c, d] −→ [u, v] stetig bei y0 = f (x0 ) ist, so ist die Komposition (g ◦ f )(x) = g(f (x)) stetig bei x0 . 3.5 Hier ist eine Liste von Funktionen f : A → R: 1) 2)
f (x) = x · sin(1/x) − 2x f (x) = x/(x2 + 1)
3)
wie (2)
4) 5)
f (x) = (1/ sin x) − 1 wie (4) √ f (x) = x · sin(x2 )
6) 7) 8) 9)
√
wie (6) f (x) = arctan((x − 0,5)/(x2 − 0,1x − 0,7)) f (x) = sin(x2 )
A = [0, 15 ] A = [−4, +4] A = (−∞, +∞) A = (0, π) A = [0, π] A = [0, 7] A = [0, ∞) A = [− 23 , 32 ] A = [−5, 5]
230 III. Grundlagen der klassischen Analysis
10) wie (9) √ 11) f (x) = 3 x
A = (−∞, ∞) A = [−1, 1]
12) wie (11) 13) f (x) = cos x + 0,1 sin(40x)
A = (−∞, ∞) A = [− 58 , 85 ]
14) f (x) = x − [x] √ √ 15) f (x) = x · sin(1/x) − 2 x p 16) f (x) = 3 − 1/ x(1 − x) 17) f (x) = sin(5/x) − x
A = [0, 3] 1 A = [0, 10 ] A = (0, 1) A = [0, 25 ]
Hierbei steht die Gauß-Klammer [x] f¨ur die gr¨oßte ganze Zahl, die kleiner oder gleich x ist. Wann immer eine der obigen Definitionen f¨ur f (x) keinen Sinn macht (beispielsweise weil ein bestimmter Nenner Null wird), setzen Sie f (x) = 0. Bestimmen Sie, welche der Funktionen in Abb. 3.3 skizziert wurden. ¨ 3.6 Welche der Funktionen aus Ubung 3.5 sind stetig auf A? An welchen Punkten sind sie unstetig? ¨ 3.7 Welche der Funktionen aus Ubung 3.5 besitzen einen maximalen Wert auf A; welche besitzen einen minimalen Wert auf A?
III.4 Gleichm¨aßige Konvergenz und gleichm¨aßige Stetigkeit 231
III.4 Gleichm¨aßige Konvergenz und gleichm¨aßige Stetigkeit Der folgende Satz findet sich in der Arbeit von Mr. Cauchy: Wenn die ” sind, . . . diversen Terme der Reihe u0 + u1 + u2 + . . . stetige Funktionen dann ist die Summe s der Reihe ebenfalls eine stetige Funktion von x.“ Mir scheint es aber, dass dieser Satz Ausnahmen kennt. Beispielsweise ist die Reihe sin x − 12 sin 2x + 13 sin 3x . . . an jeder Stelle (2m + 1)π f¨ur x unstetig . . . (Abel 1826, Oeuvres, Band 1, S. 224–225)
¨ von Cauchy und Bolzano (erste H¨alfte des 19ten Jahrhunderts) hinterDie Ara ließ zwei wichtige L¨ucken im Geb¨aude der Analysis: erstens das Konzept der gleichm¨aßigen Konvergenz, das den Grenzwert stetiger Funktionen und das Integral von Grenzwerten kl¨art; und zum zweiten das Konzept der gleichm¨aßigen Stetigkeit, welches die Integrabilit¨at stetiger Funktionen sichert. Beide L¨ucken wurden von Weierstraß und seiner Schule geschlossen (zweite H¨alfte des 19ten Jahrhunderts).
Der Grenzwert einer Folge von Funktionen Wir betrachten eine Folge von Funktionen f1 , f2 , f3 , . . . : A → R. F¨ur ein festes x ∈ A bilden die Werte f1 (x), f2 (x), f3 (x), . . . eine Folge von Zahlen. Falls der Grenzwert (4.1)
lim fn (x) = f (x)
n→∞
f¨ur alle x ∈ A existiert, so sagen wir, dass {fn (x)} auf A punktweise gegen f (x) konvergiert. Cauchy behauptete in seinem Cours (1821, S. 131; Oeuvres II.3, S. 120), dass, falls (4.1) f¨ur alle x in A konvergiert und alle fn (x) stetig sind, auch f (x) stetig sein muss. Hier sind vier Gegenbeispiele zu dieser Behauptung; das erste stammt von Abel (1826, siehe obiges Zitat). Beispiele. a) (Abel 1826, siehe Graph oben-links in Abb. 4.1) (4.2a)
fn (x) = sin x −
sin 2x sin 3x sin 4x sin nx + − + ...± . 2 3 4 n
Abb. 4.1 zeigt f1 (x), f2 (x), f3 (x) und f100 (x). Offenbar konvergiert {fn (x)} gegen die lineare Funktion y = x/2 f¨ur −π < x < π (man kann dies mit der Theorie der Fourierreihen beweisen), w¨ahrend fn (π) = 0 ist und f¨ur π < x < 3π ist der Grenzwert gar y = x/2 − π. Folglich ist die Grenzfunktion unstetig. b) (Graph oben-rechts in Abb. 4.1) 0 x 1.
d) (Graph unten-rechts in Abb. 4.1) 2 n
(4.2d) fn (x) = (1 − x )
auf A = [−1, 1],
lim fn (x) =
n→∞
0 1
x 6= 0 x = 0.
Ein weiteres Beispiel, dem wir bereits begegnet sind, ist fn (x) = arctan(nx) (siehe (3.2)).
1
0
ε = 0,140
1
0
ε = 0,070
1
0
ABB. 4.2. Folge gleichm¨aßig konvergenter Funktionen
ε = 0,035
III.4 Gleichm¨aßige Konvergenz und gleichm¨aßige Stetigkeit 233
Erkl¨arung (Seidel 1848). Wir betrachten den Graph oben rechts in Abb. 4.1. Je n¨aher x dem Punkt x = 1 kommt, desto langsamer ist die Konvergenz und desto gr¨oßer m¨ussen wir n w¨ahlen, um eine vorgeschriebene Genauigkeit ε zu erreichen. Dies gew¨ahrt die Entstehung einer Unstetigkeitsstelle. Wir m¨ussen deshalb fordern, dass zu einem gegebenen ε > 0 die Differenz fn (x)−f (x) f¨ur alle x ∈ A kleiner ist als ε f¨ur alle n ≥ N (siehe Abb. 4.2). (4.1) Definition (Weierstraß 1841). Die Folge fn : A → R konvergiert gleichm¨aßig auf A gegen f : A → R , falls (4.3)
∀ε > 0 ∃N ≥ 1 ∀n ≥ N ∀x ∈ A
|fn (x) − f (x)| < ε.
In dieser Definition ist es wichtig, dass N nur von ε abh¨angt, und nicht etwa von x ∈ A. Darum steht in (4.3) ∀ x ∈ A“ auch hinter ∃ N ≥ 1“. ” ” Wie in Abschnitt III.1 (Definition 1.7) k¨onnen wir f (x) in (4.3) durch alle Nachfolger von fn (x) ersetzen. Wir erhalten dann das Cauchy-Kriterium f¨ur gleichm¨aßige Konvergenz: (4.4) ∀ ε > 0 ∃ N ≥ 1 ∀ n ≥ N ∀ k ≥ 1 ∀ x ∈ A |fn (x)−fn+k (x)| < ε. (4.2) Satz (Weierstraß’ Vorlesung von 1861). Falls fn : A → R stetige Funktionen sind und fn (x) auf A gleichm¨aßig gegen f (x) konvergiert, dann ist f : A → R stetig. f(x) 0 ∀ x0 ∈ A ∀ x ∈ A : |x − x0 | < δ
|f (x) − f (x0 )| < ε
erf¨ullt ist. Bemerkung. Die gleichm¨aßige Stetigkeit einer gegebenen Funktion kann man oft mit Hilfe des Lagrangeschen Mittelwertsatzes zeigen (siehe Satz III.6.11 unten): (4.11)
f (x) − f (x0 ) = f ′ (ξ)(x − x0 ).
Falls A ein Intervall und f differenzierbar auf A ist mit (4.12)
M = sup |f ′ (ξ)| < ∞, ξ∈A
III.4 Gleichm¨aßige Konvergenz und gleichm¨aßige Stetigkeit 237
dann k¨onnen wir f¨ur ein gegebenes ε die Bedingung aus Definition 4.4 dadurch ¨ erf¨ullen, dass wir δ = ε/M w¨ahlen (siehe auch Ubung 4.3 unten). Allerdings ist Differenzierbarkeit keinesfalls notwendig, und es gilt der folgende erstaunliche Satz. (4.5) Satz (Heine 1872). Sei A ein geschlossenes Intervall [a, b] und f : A → R eine stetige Funktion auf A; dann ist f gleichm¨aßig stetig auf A. Erster Beweis (nach Heine 1872, S. 188). Wir nehmen die Negation der Bedingung in Definition 4.4 an und w¨ahlen δ = 1/n f¨ur n = 1, 2, . . . . Damit erhalten wir (4.13a) (4.13b)
∃ ε > 0 ∀ 1/n > 0 ∃ x0n ∈ A ∃ xn ∈ A : |xn − x0n | < 1/n mit
|f (xn ) − f (x0n )| ≥ ε.
¨ Nach Ubergang zu einer konvergenten Teilfolge aus {xn } (die wir wieder mit {xn } notieren; siehe Satz 1.17) finden wir limn→∞ xn = x, und aufgrund von |xn − x0n | < 1/n gilt auch limn→∞ x0n = x. Da f stetig ist, gilt also (siehe Satz 3.3) lim f (xn ) = f (x) = lim f (x0n ), n→∞
n→∞
in Widerspruch zu (4.13b).
⊓ ⊔
Zweiter Beweis (L¨uroth 1873). Sei ε > 0 beliebig. Zu jedem x ∈ [a, b] sei δ(x) > 0 die L¨ange des gr¨oßten offenen Intervalls I mit Zentrum x, so dass noch |f (y) − f (z)| < ε f¨ur y, z ∈ I gilt. Genauer gesagt: (4.14)
δ(x) = sup{δ > 0 ; ∀ y, z ∈ [x − δ/2, x + δ/2] |f (y) − f (z)| < ε}
(wobei nat¨urlich die Werte x, y und z in A zu liegen haben). Gem¨aß der Stetigkeit von f (x) bei x ist die Menge {δ > 0 | . . .} in (4.14) nicht leer, so dass δ(x) > 0 f¨ur alle x ∈ A ist. Falls δ(x) = ∞ f¨ur ein x ∈ A sein sollte, so gilt die Ungleichung |f (y) − f (z)| < ε ohne jede Einschr¨ankung und jedes δ > 0 erf¨ullt die Bedingung von Definition 4.4. y
z
x
I
δ(x) x x+η
I' 2η
ABB. 4.6. L¨uroth’s Beweis von Satz 4.3
Falls δ(x) < ∞ f¨ur alle x ∈ A ist, wechseln wir von x zu x±η. Das neue Intervall I ′ kann nicht l¨anger sein als δ(x) + 2|η|, da sonst I komplett in I ′ enthalten w¨are und vergr¨oßert werden k¨onnte. Ebensowenig kann es k¨urzer sein als δ(x) − 2|η|. Folglich ist δ(x) eine stetige Funktion. Weierstraß’ Satz vom Maximum und
238 III. Grundlagen der klassischen Analysis
Minimum (Satz 3.6) versichert uns in seiner Minimum“-Version, dass es einen ” Wert x0 gibt, f¨ur den δ(x0 ) ≤ δ(x) f¨ur alle x ∈ A ist. Dieser Wert δ(x0 ) ist nach Konstruktion positiv und kann dazu verwendet werden, die Bedingung in Definition 4.4 zu erf¨ullen. ⊓ ⊔ Bemerkung. Falls Sie mit beiden obigen Beweisen unzufrieden sind, k¨onnen Sie gerne noch einen dritten lesen, der von Darboux (1875, S. 73–74) ver¨offentlicht wurde, und der auf einer Intervallschachtelung basiert.
¨ Ubungen 4.1 Zeigen Sie, dass die Funktionen fn (x) = (n + 1)xn (1 − x),
x ∈ A = [0, 1]
f¨ur alle x ∈ A gegen Null konvergieren, aber ein Maximum der asymptotischen H¨ohe 1/e bei x = n/(n + 1) besitzen. Somit haben wir keine gleichm¨aßige Konvergenz vorliegen, obwohl die Grenzfunktion stetig ist. 4.2 (Pringsheim 1899, S. 34). Zeigen Sie, dass die Reihe f (x) =
x2 1 n 1 + x2 1 + x2 n=1 ∞ X
a) f¨ur alle x ∈ R absolut konvergiert und b) auf [−1, 1] nicht gleichm¨aßig konvergiert. c) Berechnen Sie f (x). Ist die Funktion stetig? 4.3 Die Funktion f : [0, 1] → R, die durch √ x · sin x1 + 2 f¨ur 0 < x ≤ 1, f (x) = 0 f¨ur x = 0 definiert ist, ist auf [0, 1] stetig und sollte daher gleichm¨aßig stetig sein. Finden Sie zu einem gegebenem ε > 0, beispielsweise ε = 0,01, explizit ein δ > 0, f¨ur welches gilt: ∀ x1 , x2 ∈ [0, 1] : |x1 − x2 | < δ
|f (x1 ) − f (x2 )| < ε.
Hinweis. Benutzen Sie den Mittelwertsatz f¨ur Werte weit weg vom Ursprung und eine direkte Absch¨atzung f¨ur Werte in der N¨ahe von 0. ¨ 4.4 Welche der Funktionen aus Abb. 3.3 (siehe Ubung 3.5) sind gleichm¨aßig stetig auf A ?
III.5 Das Riemann-Integral 239
III.5 Das Riemann-Integral Also zuerst: Was hat man unter
Rb
f (x) dx zu verstehen? (Riemann 1854, Werke, S. 239) Der ber¨uhmte Geometer [Riemann] . . . verallgemeinerte mit einer Einsicht, zu der nur ein Geist h¨ochsten Ranges in der Lage ist, das Konzept des bestimmten Integrals . . . (Darboux 1875) a
Die Diskussion, die wir in den Abschnitten II.5 und II.6 u¨ ber das Integral gef¨uhrt haben, basierte auf der Formel Z b (5.1) f (x) dx = F (b) − F (a), a
wobei F (x) eine Stammfunktion von f (x) ist. Wir haben dabei implizit angenommen, dass eine solche Stammfunktion immer existiert und (bis auf eine additive Rb Konstante) eindeutig ist. Jetzt werden wir eine genaue Definition f¨ur a f (x) dx angeben, die von der Differentialrechnung unabh¨angig ist. Dies erlaubt es uns, Rb f (x) dx f¨ur eine gr¨oßere Klasse von Funktionen zu verstehen, einschließlich a unstetiger Funktionen oder Funktionen mit unbekannter Stammfunktion. Wir werden dann in Abschnitt III.6 einen strengen Beweis von (5.1) f¨ur stetige Funktionen f pr¨asentieren. Cauchy (1823) beschrieb, mit der damals m¨oglichen Strenge, das Integral einer stetigen Funktion als den Grenzwert einer Summe. Riemann (1854) definierte, eher als Nebenbemerkung in seiner Habilitationsarbeit u¨ ber trigonometrische Reihen, das Integral f¨ur allgemeinere Funktionen. In diesem Abschnitt wollen wir Riemanns Theorie und ihre Erweiterungen durch Du Bois-Reymond und Darboux vorstellen. Noch allgemeinere Theorien, die wir hier nicht behandeln wollen, gehen auf Lebesgue (im Jahr 1902) und Kurzweil (im Jahr 1957) zur¨uck. Allgemeine Annahmen. In diesem gesamten Abschnitt wollen wir Funktionen f : [a, b] → R betrachten, wobei [a, b] = {x | a ≤ x ≤ b} ein beschr¨anktes Intervall und f (x) eine beschr¨ankte Funktion ist, d.h. (5.2)
∃ M ≥ 0 ∀ x ∈ [a, b]
|f (x)| ≤ M.
Ansonsten w¨are die Definition der Darboux-Summen (siehe unten) nicht m¨oglich. Situationen, in denen eine dieser Annahmen nicht erf¨ullt ist, werden in Abschnitt III.8 besprochen.
Definitionen und Kriterien f¨ur Integrabilit¨at Wir wollen das Integral als Fl¨ache zwischen der Funktion und der horizontalen Achse definieren. Der Ansatz besteht nun darin, das Intervall [a, b] in kleine Teilintervalle zu zerlegen und die Fl¨ache als Summe kleiner Rechtecke zu n¨ahern. Eine Unterteilung in Teilintervalle schreiben wir als
240 III. Grundlagen der klassischen Analysis
(5.3)
D = {x0 , x1 , x2 , . . . , xn }
(wobei a = x0 < x1 < . . . < xn = b ist) und die L¨ange eines Teilintervalls ist δi = xi − xi−1 . Wir definieren dann die untere und obere Darboux-Summe (siehe Abb. 5.1) durch (5.4)
s(D) =
n X
fi δ i ,
S(D) =
i=1
n X
Fi δi
i=1
mit (5.5)
fi =
inf
xi−1 ≤x≤xi
f (x),
Fi =
sup
f (x).
xi−1 ≤x≤xi
Rb Offenbar gilt s(D) ≤ S(D) und jede sinnvolle Definition des Integrals a f (x) dx muss einen Wert zwischen s(D) und S(D) liefern. Eine Unterteilung D′ von [a, b] heißt Verfeinerung von D, wenn sie alle Punkte von D enth¨alt, d.h. falls D′ ⊃ D ist. Fi
(Fi −fi )δi
fi
x0 δi
xnx0 δi s(D)
S(D)
xnx0 δi S(D) − s(D)
ABB. 5.1. Darboux-Summen
s(D)
s(D′ )
S(D′ )
ABB. 5.2. Verfeinerung einer Unterteilung
S(D)
xn
III.5 Das Riemann-Integral 241
(5.1) Lemma. Wenn D ′ eine Verfeinerung von D ist, dann ist s(D) ≤ s(D′ ) ≤ S(D′ ) ≤ S(D). Beweis. Das Hinzuf¨ugen eines einzelnen Punktes zur Unterteilung D erh¨oht die untere Darboux-Summe (oder ver¨andert sie nicht) und verringert die obere Summe (oder ver¨andert sie nicht, Abb. 5.2). Wiederholtes Hinzuf¨ugen von Punkten liefert die Behauptung. ⊓ ⊔ (5.2) Lemma. Es seien D1 und D2 zwei beliebige Unterteilungen, dann gilt s(D1 ) ≤ S(D2 ). Beweis. Wir w¨ahlen D′ = D1 ∪ D2 , also diejenige Unterteilung, die s¨amtliche Punkte beider Unterteilungen enth¨alt (dabei werden doppelt auftretende Punkte nur einfach gez¨ahlt). Da D′ eine Verfeinerung sowohl von D1 als auch von D2 ist, folgt die Behauptung aus Lemma 5.1. ⊓ ⊔ Lemma 5.2 besagt unter anderem, dass die Menge der unteren DarbouxSummen einer festen Funktion f : [a, b] → R nach oben durch jede obere Darboux-Summe beschr¨ankt ist (und umgekehrt): s(D) (5.6)
S(D)
| || | |||
|
{z ?
}
||| | ||| ||
.
Nach Satz 1.12 macht es also Sinn, das Supremum der unteren Summen und das Infimum der oberen Summen zu betrachten. In der Tradition Darboux’ (1875) notieren wir diese als Z b (5.7) f (x) dx = inf S(D) das obere Integral, D
a
(5.8)
Z
a
b
f (x) dx = sup s(D)
das untere Integral.
D
(5.3) Definition. Eine Funktion f : [a, b] → R, die (5.2) erf¨ullt, heißt integrierbar (im Riemann-Sinn), falls die oberen und unteren Integrale (5.7) und (5.8) u¨ bereinstimmen. In diesem Fall entfernen wir die Balken in (5.7) und (5.8) und erhalten das Riemann-Integral“. ” (5.4) Satz. Eine Funktion f : [a, b] → R ist genau dann integrierbar, wenn gilt: (5.9)
e ∀ε > 0 ∃D
e − s(D) e < ε. S(D)
Beweis. Nach Definition ist eine Funktion f (x) genau dann integrierbar, wenn die beiden Mengen in (5.6) einander beliebig nahe kommen. Das heißt, dass es f¨ur ein
242 III. Grundlagen der klassischen Analysis
gegebenes ε > 0 zwei Unterteilungen D1 und D2 gibt, so dass S(D2 ) − s(D1 ) < e = D1 ∪ D2 und wenden Lemma 5.1 an, so erhalten wir die ε ist. W¨ahlen wir D Behauptung. ⊓ ⊔ (5.5) Beispiel. Betrachten wir die Funktion f (x) = x auf einem Intervall [a, b]. F¨ur eine a¨ quidistante Unterteilung Dn = {xi = a + ih | i = 0, 1, . . . , n, h = (b − a)/n} finden wir nach (I.1.28): s(Dn ) =
n X i=1
S(Dn ) =
n X i=1
xi−1 · (xi − xi−1 ) = xi · (xi − xi−1 ) =
b 2 a2 (b − a)2 − − 2 2 2n
b 2 a2 (b − a)2 − + , 2 2 2n
so dass S(Dn ) − s(Dn ) = (b − a)2 /n ist. F¨ur gen¨ugend großes n ist dieser Ausdruck kleiner als ein beliebig vorgegebenes ε > 0. Daher ist die Funktion integrierbar und das Integral lautet b2 /2 − a2 /2. (5.6) Beispiel. Dirichlets Funktion f : [0, 1] → R ist definiert als (siehe (3.3)) f (x) =
1
x rational
0
x irrational,
und ist nicht integrierbar im Riemann-Sinn, da es in jedem Teilintervall rationale und irrationale Zahlen gibt, so dass fi = 0 und Fi = 1 f¨ur alle i gilt. Folglich ist s(D) = 0, S(D) = 1 f¨ur alle Unterteilungen. (5.7) Beispiel. Die Funktion f : [0, 1] → R (siehe (3.4)) f (x) =
0 1/q
x irrational oder x = 0 x = p/q gek¨urzter Bruch
ist unstetig an jeder positiven rationalen Zahl x. Allerdings erf¨ullt f¨ur ein festes ε > 0 nur eine endliche Anzahl (sagen wir k) Werte f¨ur x die Bedingung f (x) > ε. Wir w¨ahlen nun eine Unterteilung D mit maxi δi < ε/k, so dass diejenigen xWerte mit f (x) > ε im Inneren der Teilintervalle liegen. Aufgrund von f (x) ≤ 1 f¨uhrt dies zu S(D) ≤ ε + k · max δi < 2ε. i
Da s(D) = 0 ist, stellen wir fest, dass unsere Funktion integrierbar ist mit R1 f (x) dx = 0. 0
III.5 Das Riemann-Integral 243
Der Satz von Du Bois-Reymond und Darboux. Ich f¨uhle indessen, dass die Art, wie das Criterium der Integrirbarkeit formulirt wurde, etwas zu w¨unschen u¨ brig l¨asst. (Du Bois-Reymond 1875, S. 259)
(5.8) Satz (Du Bois-Reymond 1875, Darboux 1875). Eine Funktion f (x), die (5.2) erf¨ullt, ist genau dann integrierbar, wenn ∀ ε > 0 ∃ δ > 0 ∀ D ∈ Dδ
S(D) − s(D) < ε
gilt. Dabei ist Dδ die Menge aller Unterteilungen mit maxi δi ≤ δ.
a)
b)
e 0 fest vorgegeben und es sei D e e e d.h. die graue Fl¨ache ∆ = S(D)−s(D) in Abb. 5.3a ist kleiner als ε. Der relevante e = {e Punkt ist nun der, dass D x0 , x e1 , . . . , x en˜ } nur aus endlich vielen Punkten besteht. Wir w¨ahlen eine beliebige Unterteilung D ∈ Dδ (siehe Abb. 5.3b) und setzen ∆ = S(D) − s(D). Wir m¨ussen beweisen, dass ∆ beliebig klein wird, wenn δ gegen 0 strebt. e der zwei Unterteilungen und Wir betrachten die Vereinigung D′ = D ∪ D setzen ∆′ = S(D′ ) − s(D′ ) (siehe Abb. 5.3c). Die Darboux-Summen von D ′ e enthalten und D sind u¨ berall gleich, außer auf jenen Intervallen, die Punkte aus D (Abb. 5.3d). Da wir h¨ochstens n e − 1 solcher Intervalle haben, da ihre L¨ange ≤ δ ist, und da −M ≤ f (x) ≤ M gilt, finden wir ∆ ≤ ∆′ + 2(e n − 1)δM.
(5.10)
e < ε (wir stellen fest, dass D′ eine Verfeinerung von D e Zusammen mit ∆′ ≤ ∆ ist), f¨uhrt diese Absch¨atzung zu ∆ < 2ε unter der Annahme δ ≤ ε/(2(e n − 1)M ). ⊓ ⊔ Riemann-Summen. Wir betrachten eine Unterteilung (5.3) und w¨ahlen ξ1 , ξ2 , . . . , ξn so, dass x0 ≤ ξ1 ≤ x1 ≤ ξ2 ≤ x2 ≤ ξ3 ≤ . . . erf¨ullt ist. Dann nennen wir (5.11)
σ=
n X i=1
f (ξi ) · δi
eine Riemann-Summe. Aufgrund von (5.5) gilt fi ≤ f (ξi ) ≤ Fi , also s(D) ≤ σ ≤ S(D). Aus Satz 5.8 folgt daher, dass Z b n X (5.12) f (ξi ) · δi → f (x) dx f¨ur max δi → 0 i=1
i
a
gilt, vorausgesetzt, dass f : [a, b] → R eine integrierbare Funktion ist. Riemann-Summen sind sehr n¨utzlich, wenn man Eigenschaften des Integrals beweisen m¨ochte. Beispielsweise f¨uhrt der Grenzwert maxi δi → 0 der trivialen Identit¨at n X i=1
n n X X c1 f1 (ξi ) + c2 f2 (ξi ) · δi = c1 f1 (ξi ) · δi + c2 f2 (ξi ) · δi i=1
i=1
auf (II.4.13), sofern die beteiligten Funktionen integrierbar sind.
III.5 Das Riemann-Integral 245
Integrierbare Funktionen Wir wollen nun untersuchen, welche Klassen von Funktionen integrierbar sind. (5.9) Satz. Es seien f und g zwei integrierbare Funktionen auf [a, b] und es sei λ eine reelle Zahl. Dann sind die Funktionen f + g,
λ · f,
f · g,
|f |,
f /g (falls |g(x)| ≥ C > 0 )
ebenfalls integrierbar. Beweis. Wir werden im gesamten Beweis die Tatsache verwenden, dass Fi −fi die kleinste obere Schranke f¨ur Differenzen von Funktionswerten f (x) auf [xi−1 , xi ] darstellt, also (5.13)
sup x,y∈[xi−1 ,xi ]
|f (x) − f (y)| = Fi − fi .
Sei n¨amlich ε > 0 eine vorgegebene Zahl. Nach Definition von Fi und fi gibt es dann ξ, η ∈ [xi−1 , xi ] mit f (ξ) > Fi − ε, f (η) < fi + ε und daher gilt f (ξ) − f (η) > Fi − fi − 2ε. Entsprechend ist Fi − fi nicht nur eine obere Schranke f¨ur |f (x) − f (y)|, sondern auch die kleinste obere Schranke. a) Es sei h(x) = f (x) + g(x). Wir notieren mit Fi , Gi , Hi bzw. fi , gi , hi die Suprema bzw. Infima der Funktionen f , g, h auf [xi−1 , xi ] (siehe (5.5)). Wenden wir dann die Dreiecksungleichung und (5.13) an, so finden wir f¨ur x, y ∈ [xi−1 , xi ]: (5.14)
|h(x) − h(y)| ≤ |f (x) − f (y)| + |g(x) − g(y)| ≤ (Fi − fi ) + (Gi − gi ).
Gleichung (5.13), angewendet auf die Funktion h, zeigt dann, dass (Hi − hi ) ≤ (Fi − fi ) + (Gi − gi ) gilt, und dass die Differenzen der oberen und unteren Darboux-Summen die Ungleichung X X X (5.15) (Hi − hi )δi ≤ (Fi − fi )δi + (Gi − gi )δi
erf¨ullen. Zu einem gegebenen ε > 0 w¨ahlen wir eine Unterteilung D (Satz 5.4), so dass jeder Term der Summe auf der rechten Seite von (5.15) kleiner ist als ε (tats¨achlich haben wir zwei verschiedene Unterteilungen f¨ur f und g, aber wir k¨onnen derenP Vereinigung nehmen und so davon ausgehen, es seien dieselben). Daraus folgt i (Hi − hi )δi < 2ε und die Funktion h(x) = f (x) + g(x) ist integrierbar nach Satz 5.4. b) Die Beweise der verbleibenden Behauptungen sind dem obigen sehr a¨ hnlich. Beispielsweise benutzen wir f¨ur h(x) = λ · f (x) |h(x) − h(y)| = |λ| · |f (x) − f (y)| anstelle von (5.14), schlussfolgern (Hi − hi ) ≤ |λ| · (Fi − fi ) und leiten daraus die Integrierbarkeit wie oben gezeigt ab.
246 III. Grundlagen der klassischen Analysis
F¨ur das Produkt h(x) = f (x) · g(x) benutzen wir |h(x) − h(y)| ≤ |f (x)| · |g(x) − g(y)| + |g(y)| · |f (x) − f (y)| ≤ M · |g(x) − g(y)| + N · |f (x) − f (y)|
(beide Funktionen f (x) und g(x) sind nach Annahme (5.2) beschr¨ankt). F¨ur die letzte Behauptung reicht es schließlich aus zu zeigen, dass 1/g(x) integrierbar ist (wegen f (x)/g(x) = f (x) · (1/g(x)). Wir definieren h(x) = 1/g(x) und ersetzen (5.14) durch |h(x) − h(y)| =
|g(y) − g(x)| |g(x) − g(y)| ≤ . |g(y)| · |g(x)| C2
⊓ ⊔
Da die konstante Funktion und f (x) = x beide integrierbar sind (Beispiel 5.5) folgt aus dem obigen Satz, dass auch Polynome und rationale Funktionen (außerhalb ihrer Singularit¨aten) integrierbar sind. Der folgende Satz wurde von Cauchy (1823) behauptet, aber erst gut 50 Jahre sp¨ater mit dem Begriff der gleichm¨aßigen Stetigkeit streng bewiesen. (5.10) Satz. Wenn f : [a, b] → R stetig ist, dann ist f (x) integrierbar.
Beweis. Der wesentliche Punkt ist, dass f gleichm¨aßig stetig ist (Satz 4.5). Das heißt, dass f¨ur ein gegebenes ε > 0 ein δ > 0 existiert, so dass |x − y| < δ
=⇒
|f (x) − f (y)| < ε
gilt. Wir w¨ahlen eine Unterteilung D, die maxi δi < δ erf¨ullt. F¨ur x, y ∈ [xi−1 , xi ] haben wir dann |f (x) − f (y)| P < ε und nach (5.13) Pauch Fi − fi ≤ ε. Hieraus folgt, dass S(D) − s(D) = ni=1 (Fi − fi )δi ≤ ε ni=1 δi = ε(b − a) sein muss, und Satz 5.4 liefert die Integrierbarkeit von f (x). ⊓ ⊔ (5.11) Satz. Falls f : [a, b] → R monoton ist, dann ist f (x) integrierbar.
Beweis. Der kleinste Wert einer nicht-fallenden Funktion liegt am a¨ ußersten linken Punkt und der gr¨oßte Wert am a¨ ußersten rechten Punkt des Intervalls [xi−1 , xi ]. Daher ist fi = f (xi−1 ), Fi = f (xi ) und somit fi+1 = Fi f¨ur alle i = 1, . . . , n−1. Der Ansatz besteht nun darin, eine a¨ quidistante Unterteilung zu betrachten, in der alle Teilintervalle δ lang sind. Wir finden dann X (Fi −fi)δ = F1 δ−f1 δ+F2 δ−f2 δ+F3 δ−f3 δ+. . . = f (xn )−f (x0 ) ·δ < ε, wenn δ gen¨ugend klein gew¨ahlt wird. Dies beweist die Integrierbarkeit von f (x). ⊓ ⊔
(5.12) Bemerkung. Wenn wir eine integrierbare Funktion an einer endlichen Zahl an Punkten ab¨andern, so bleibt die Funktion integrierbar und der Wert des Integrals a¨ ndert sich nicht. Dies folgt aus einem a¨ hnlichen Argument wie dem in Beispiel 5.7 oben.
III.5 Das Riemann-Integral 247
(5.13) Bemerkung. Es seien a < b < c und wir nehmen an, dass f : [a, c] → R eine Funktion ist, deren Einschr¨ankungen auf [a, b] und [b, c] jeweils integrierbar sind. Dann ist f auch auf [a, c] integrierbar, und wir finden Z c Z b Z c (5.16) f (x) dx = f (x) dx + f (x) dx. a
a
b
Dies gilt, weil die Addition von Darboux-Summen der Einschr¨ankungen auf [a, b] und [b, c] zu einer Darboux-Summe auf [a, c] f¨uhrt. F¨ur a > b oder a = b definieren wir Z b Z a Z a (5.17) f (x) dx = − f (x) dx und f (x) dx = 0, a
b
a
so dass Gl. (5.16) f¨ur jedes Tripel (a, b, c) gilt.
Ungleichungen und der Mittelwertsatz Die folgenden Ungleichungen sind oftmals sehr n¨utzlich, wenn man Integrale absch¨atzen will. Wir haben sie bereits in Abschnitt II.10 benutzt, um die Absch¨atzungen (II.10.15) zu erhalten. (5.14) Satz. Wenn f (x) und g(x) auf [a, b] integrierbare Funktionen sind (mit a < b), und wenn f (x) ≤ g(x) f¨ur alle x ∈ [a, b] gilt, dann ist Z b Z b f (x) dx ≤ g(x) dx. a
a
Pn
Pn Beweis. Die Riemann-Summen erf¨ullen i=1 f (ξi )δi ≤ i=1 g(ξi )δi wegen δi > 0. F¨ur maxi δi → 0 erhalten wir die obige Ungleichung (siehe (5.12) und Satz 1.6). ⊓ ⊔ (5.15) Korollar. F¨ur integrierbare Funktionen folgt Z b Z b f (x) dx ≤ |f (x)| dx. a
a
Beweis. Wir wenden Satz 5.14 auf −|f (x)| ≤ f (x) ≤ |f (x)| an.
⊓ ⊔
Wenn wir Korollar 5.15 auf das Produkt f (x) · g(x) zweier integrierbarer Funktionen anwenden und |f (x) · g(x)| ≤ M · |g(x)| benutzen, wobei M = supx∈[a,b] |f (x)| ist, so erhalten wir die folgende, n¨utzliche Absch¨atzung: Z b Z b (5.18) f (x) · g(x) dx ≤ sup |f (x)| · |g(x)| dx. a
x∈[a,b]
a
Die n¨achste Ungleichung a¨ hnelt (5.18), behandelt aber die zwei Funktionen f und g auf symmetrische Art und Weise.
248 III. Grundlagen der klassischen Analysis
(5.16) Die Cauchy-Schwarz-Ungleichung (Cauchy 1821 f¨ur Rn , Bunyakovski 1859 f¨ur Integrale, Schwarz 1885, §15, f¨ur Doppelintegrale). F¨ur integrierbare Funktionen f (x) und g(x) gilt: s Z b sZ b Z b 2 (5.19) f (x)g(x) dx ≤ f (x) dx · g 2 (x) dx· a
a
a
Beweis. Nach Satz 5.9 wissen wir, dass f ·g, f und g integrierbar sind. Benutzen wir Satz 5.14 und die Linearit¨at des Integrals, so finden wir Z b 2 0≤ f (x) − γg(x) dx 2
a
=
Z
a
b
f 2 (x) dx − 2γ
Z
2
b
f (x)g(x) dx + γ 2
a
Z
b
g 2 (x) dx. a
Rb Rb Rb Wir setzen A = a f 2 (x) dx, B = a f (x)g(x) dx, C = a g 2 (x) dx und sehen, dass A − 2γB + γ 2 C ≥ 0 f¨ur alle reellen γ gilt. Aus C = 0 folgt B = 0. F¨ur C 6= 0 kann die Diskriminante der quadratischen Gleichung nicht positiv sein (siehe (I.1.10)). Daher muss B 2 ≤ AC sein, und das ist (5.19). ⊓ ⊔ (5.17) Der Mittelwertsatz (Cauchy 1821). Wenn f : [a, b] → R eine stetige Funktion ist, dann gibt es ein ξ ∈ [a, b] mit Z b (5.20) f (x) dx = f (ξ) · (b − a). a
Beweis. Es seien m und M das Minimum bzw. Maximum von f (x) auf [a, b] (siehe Satz 3.6), d.h. es gelte m ≤ f (x) ≤ M f¨ur alle x ∈ [a, b]. Wir wenden Satz 5.14 an und teilen durch (b − a), mit dem Ergebnis Z b 1 m≤ · f (x) dx ≤ M. b−a a Rb Der Wert a f (x) dx/(b − a) liegt zwischen m = f (u) und M = f (U ). Aus dem Satz von Bolzano (Zwischenwertsatz 3.5) leiten wir nun die Existenz eines ξ ∈ [a, b] ab, f¨ur das der Wert gerade f (ξ) gleicht. Damit ist Gl. (5.20) erf¨ullt. ⊓ ⊔ (5.18) Satz (Cauchy 1821). Es sei f : [a, b] → R stetig und es sei g : [a, b] → R eine integrierbare Funktion, die u¨ berall positiv (oder u¨ berall negativ) ist. Dann gibt es ein ξ ∈ [a, b] mit Z b Z b (5.21) f (x)g(x) dx = f (ξ) g(x) dx. a
a
Beweis. Angenommen, es gilt g(x) ≥ 0 f¨ur alle x (ansonsten ersetzen wir g durch −g). In diesem Fall ist
III.5 Das Riemann-Integral 249
m · g(x) ≤ f (x)g(x) ≤ M · g(x)
f¨ur alle
x ∈ [a, b],
wobei m und M Minimum und Maximum von f (x) sind. Der Rest des Beweises gleicht dem des Mittelwertsatzes. ⊓ ⊔
Integration unendlicher Reihen Bis in die neueste Zeit glaubte man, es sei das Integral einer convergenten Reihe . . . gleich der Summe aus den Integralen der einzelnen Glieder, und erst Herr Weierstrass hat bemerkt . . . (Heine 1870, Ueber trig. Reihen, J. f. Math., Band 70, S. 353)
Wir haben bereits o¨ fter die sehr n¨utzliche termweise Integration einer unendlichen Reihe eingesetzt (beispielsweise in der Herleitung der Mercator-Reihe (I.3.13) und in den Beispielen von Abschnitt II.6). Der Hintergrund ist dabei, dass wir die Integration eigentlich mit einer Grenzwertbildung von Funktionen vertauscht haben. Hier wollen wir nun untersuchen, unter welchen Umst¨anden dies erlaubt ist. Erstes Beispiel. Es sei r1 , r2 , r3 , r4 , . . . eine Folge, die alle rationalen Zahlen zwischen 0 und 1 enth¨alt, beispielsweise 1 1 2 1 2 3 1 2 3 4 1 , , , , , , , , , , , ... . 2 3 3 4 4 4 5 5 5 5 6 Wir definieren nun 1 falls x ∈ {r1 , r2 , r3 , . . . , rn } (5.22) fn (x) = 0 sonst. Nach Bemerkung 5.12 ist jede der Funktionen fn : [0, 1] → R integrierbar mit Integral Null. Jedoch ist die Grenzfunktion f (x), welche mit Dirichlets Funktion aus Beispiel 5.6 u¨ bereinstimmt, nicht integrierbar. (Das Lebesgue-Integral l¨ost dieses Problem.) Zweites Beispiel. Die Graphen der Funktionen 2 0 ≤ x ≤ 1/n n x 2 (5.23) fn (x) = 2n − n x 1/n ≤ x ≤ 2/n 0 2/n ≤ x ≤ 2 sind Dreiecke mit fallender Basis und wachsender H¨ohe und der Eigenschaft Z 2 fn (x) dx = 1 f¨ur alle n.
4
3
2
n=4
n=3
n=2
0
Jedoch ist die Grenzfunktion f (x) = 0 f¨ur alle x ∈ [0, 1]. Nun ist f (x) zwar integrierbar, aber Z 2 Z 2 lim fn (x) dx 6= lim fn (x) dx. n→∞
0
0 n→∞
n=1
1
0 0
1
2
250 III. Grundlagen der klassischen Analysis
(5.19) Satz. Wir betrachten eine Folge fn (x) integrierbarer Funktionen und nehmen an, sie konvergiert gleichm¨aßig auf [a, b] gegen eine Funktion f (x). Dann ist f : [a, b] → R integrierbar mit Z b Z b lim fn (x) dx = f (x) dx. n→∞
a
a
Beweis. Gleichm¨aßige Konvergenz bedeutet, dass es f¨ur ein gegebenes ε > 0 eine ganze Zahl N gibt, so dass f¨ur jedes n ≥ N und f¨ur alle x ∈ [a, b] gilt |fn (x) − f (x)| < ε. Folglich haben wir nun f¨ur alle x, y ∈ [a, b]: |f (x) − f (y)| ≤ |fN (x) − fN (y)| + 2ε. Mit (5.13) finden wir (Fi − fi ) ≤ (FN i − fN i ) + 2ε, wobei wir wie in (5.5) die Notation FN i = supxi−1 ≤x≤xi fN (x) und fN i = inf xi−1 ≤x≤xi fN (x) benutzen. Die Funktion fN (x) ist integrierbar, so dass f¨ur eine geeignete Unterteilung P von [a, b] die Differenz zwischen oberer und unterer Darboux-Summe, also i (FN i −fN i )δi , kleiner ist als ε (Satz 5.4). Hieraus folgt P (F − f )δ < ε 1 + 2(b − a) und f (x) ist mithin integrierbar. i i i i Sobald die Integrierbarkeit der Grenzfunktion f (x) gesichert ist, folgt aus Korollar 5.15, dass f¨ur n ≥ N Z b Z b Z b fn (x) − f (x) dx ≤ ε(b − a) fn (x) dx − f (x) dx ≤ a
a
a
gilt. Hieraus folgt die Behauptung des Satzes.
⊓ ⊔
(5.20) Korollar. Es sei P∞fn (x) eine Folge integrierbarer Funktionen und wir nehmen an, die Reihe n=0 fn (x) konvergiert gleichm¨aßig auf [a, b]. Dann gilt Z bX ∞ Z b ∞ X fn (x) dx = fn (x) dx. n=0
a
a n=0
Riemanns Beispiel.
Da diese Functionen noch nirgends betrachtet sind, wird es gut sein, von einem bestimmten Beispiele auszugehen. (Riemann 1854, Werke, S. 228)
Riemann (1854) schlug das folgende Beispiel zur Demonstration der St¨arke seiner Integrationstheorie vor, eine Funktion, die in jedem Intervall unstetig ist (siehe Abb. 5.4): ∞ X B(nx) x − hxi falls x 6= k/2 (5.24) f (x) = , mit B(x) = 0 falls x = k/2, n2 n=1
III.5 Das Riemann-Integral 251
.5
.5
B(x)
f(x)
B(2x)/4 B(3x)/9 0
1
−.5
0
1
−.5
ABB. 5.4. Riemanns Beispiel einer integrierbaren Funktion
wobei hxi die an x am n¨ahesten liegende ganze Zahl ist. Diese Funktion ist unstetig bei x = 1/2, 1/4, 3/4, 1/6, 3/6, 5/6, . . . , und doch konvergiert die Reihe (5.24) nach Satz 4.3 gleichm¨aßig. Die Funktionen fn (x) sind nach Bemerkung 5.13 integrierbar. Folglich ist auch f integrierbar.
¨ Ubungen 5.1 Konstruieren Sie f¨ur die Funktion 1 falls x = 0, 12 , 13 , 14 , 15 , . . . f (x) = x sonst und ein gegebenes ε > 0, beispielsweise ε = 0,01, explizit eine Unterteilung D mit S(D) − s(D) < ε. Dies verdeutlicht, dass f im Riemann-Sinn integrierbar ist. 5.2 Betrachten Sie die Funktion f (x) = x2 auf dem Intervall [0, 1]. Berechnen Sie die oberen und unteren Darboux-Summen f¨ur die a¨ quidistanten Unterteilungen xi = i/n, i = 0, 1, . . . , n. Schließen Sie aus den Ergebnissen, dass f integrierbar ist. 5.3 Zeigen Sie, dass die numerischen N¨aherungen, die man mit der Trapezregel Z b f (ξ ) f (ξN ) 0 f (x) dx ≈ h + f (ξ1 )+ f (ξ2 )+f (ξ3 )+ . . .+ f (ξN−1 )+ 2 2 a
(h = (b − a)/N und ξi = a + ih) erh¨alt (siehe Abschnitt II.6), sowie jene aus der Simpson-Regel (N gerade) Z b h f (x) dx ≈ f (ξ0 ) + 4f (ξ1 ) + 2f (ξ2 ) + 4f (ξ3 ) + . . . + f (ξN ) , 3 a
252 III. Grundlagen der klassischen Analysis
Riemann-Summen f¨ur bestimmte Unterteilungen D darstellen. Daher ist die Konvergenz dieser Methoden f¨ur N → ∞ f¨ur s¨amtliche im Riemann-Sinn integrierbare Funktionen gesichert. 5.4 (Dini 1878, Kap. 13). Zeigen Sie Z π ln 1 − 2α cos x + α2 dx = 0 f¨ur α2 < 1, Z0 π ln 1 − 2α cos x + α2 dx = π ln α2 f¨ur α2 > 1, 0
indem Sie Riemann-Summen f¨ur a¨ quidistante Unterteilungen xi = iπ/n berechnen, wobei ξi der linke Endpunkt xi−1 sein soll. Die Riemann-Summen werden so zum Logarithmus eines uns wohlbekannten Produktes (siehe Abschnitt I.5).
5.5 F¨ur die Funktion f : [a, b] → R gelte: i) f ist stetig, ii) ∀x ∈ [a, b] ist f (x) ≥ 0 und iii) ∃x0 ∈ (a, b) mit f (x0 ) > 0. Zeigen Sie Z
(5.25)
b
f (x) dx > 0. a
Beweisen Sie mit Hilfe von Gegenbeispielen, dass jede der drei Behauptungen i), ii) und iii) zum Beweis von (5.25) notwendig ist. 5.6 Berechnen Sie die Integrale Z
π/2
sin2n x dx =
0
Z
π 1 · 3 · 5 · . . . · (2n − 1) · , 2 2 · 4 · 6 · . . . · 2n
π/2
sin2n+1 x dx =
0
2 · 4 · 6 · . . . · 2n . 3 · 5 · 7 · . . . · (2n + 1)
Benutzen Sie dann 0 < sin x < 1 f¨ur 0 < x < π/2 sowie Satz 5.14, um Z
π/2
sin2n x dx >
0
Z
0
π/2
sin2n+1 x dx >
Z
π/2
sin2n+2 x dx
0
zu beweisen. Die obigen Werte, eingesetzt in diese Ungleichungen, f¨uhren auf einen Beweis des Wallisschen Produktes (I.5.27) mit rigider Fehlerabsch¨atzung. 5.7 Beweisen Sie Z Z 1 4 Z 1 1 1 4 x (1 − x)4 x (1 − x)4 dx ≤ dx ≤ x4 (1 − x)4 dx. 2 2 0 1 + x 0 0 Die tats¨achliche Berechnung dieser Integrale f¨uhrt auf ein am¨usantes Resultat (alte Souvenirs aus Abschnitt I.6). R1 4 ¨ Hinweis. Um x (1 − x)4 dx zu berechnen, siehe Ubung II.4.3. 0
III.5 Das Riemann-Integral 253
5.8 Zeigen Sie, dass die Reihe 1 = 1 − x2 + x4 − x6 + x8 − . . . 1 + x2 auf A = [−b, b] f¨ur jedes b mit 0 < b < 1 gleichm¨aßig konvergiert. Folglich kann diese Reihe termweise auf A = [0, b] (oder A = [−b, 0]) integriert werden und f¨uhrt auf die wohlbekannte Reihe f¨ur arctan b. a)
b)
n=4
1
1 n=3
n=2 n=1
n=1
n=2 0
1
0
1
ABB. 5.5. Vertauschen von Limes und Integral
5.9 Berechnen Sie f¨ur folgende Funktionsfolgen fn : [0, 1] → R (Abb. 5.5) a)
fn (x) =
nx , (1 + n2 x2 )2
b)
fn (x) =
n2 x , (1 + n2 x2 )2
den Grenzwert limn→∞ fn (x) (unterscheiden Sie die F¨alle x = 0 und x 6= 0). Finden Sie das Maximum von fn (x) und entscheiden Sie, ob die Konvergenz gleichm¨aßig ist. Pr¨ufen Sie schließlich, ob folgende Gleichungen erf¨ullt sind: Z 1 Z 1 lim fn (x) dx = lim fn (x) dx. n→∞
0
0 n→∞
254 III. Grundlagen der klassischen Analysis
III.6 Differenzierbare Funktionen . . . die Strenge, welche ich mir in meiner Cours d’analyse als Gebot auferlegte, . . . (Cauchy 1829, Lec¸ons) Die vollst¨andige Ver¨anderung f (x + h) − f (x) . . . l¨asst sich im allgemeinen in zwei Teile zerlegen . . . (Weierstraß 1861)
Die Ableitung einer Funktion wurde von uns in Abschnitt II.1 eingef¨uhrt und untersucht. Nun, da uns der Begriff des Grenzwertes zur Verf¨ugung steht, k¨onnen wir auch eine genaue Definition angeben. (6.1) Definition (Cauchy 1821). Es sei I ein Intervall und x0 ∈ I. Die Funktion f : I → R ist differenzierbar bei x0 , wenn der Grenzwert f ′ (x0 ) = lim
(6.1)
x→x0
f (x) − f (x0 ) x − x0
existiert. Dieser Grenzwert f ′ (x0 ) heißt die Ableitung von f bei x0 . Falls die Funktion f an jedem Punkt von I differenzierbar ist, und falls f ′ : I → R stetig ist, so heißt f stetig differenzierbar. Manchmal ist es vorteilhaft, x = x0 + h zu setzen, also (6.2)
f ′ (x0 ) = lim
h→0
f (x0 + h) − f (x0 ) . h
Man kann auch f¨ur ein festes x0 die Funktion r : I → R betrachten, die durch r(x0 ) = 0 und (6.3)
r(x) =
f (x) − f (x0 ) − f ′ (x0 ) x − x0
f¨ur x 6= x0
definiert ist. Dann ist Gl. (6.1) a¨ quivalent zu limx→x0 r(x) = 0 und wir erhalten das folgende Kriterium. (6.2) Formulierung von Weierstraß (Weierstraß 1861, siehe obiges Zitat). Eine Funktion f (x) ist differenzierbar bei x0 genau dann, wenn es eine Zahl f ′ (x0 ) und eine Funktion r(x) gibt, so dass r(x) stetig bei x0 mit r(x0 ) = 0 ist und gilt: (6.4)
f (x) = f (x0 ) + f ′ (x0 )(x − x0 ) + r(x)(x − x0 ).
⊓ ⊔
Gleichung (6.4) besitzt den Vorteil, dass sie nicht auf den Begriff des Grenzwertes zur¨uckgreifen muss (dieser wird gegen die Stetigkeit von r(x) eingetauscht) und die Gleichung y = f (x0 ) + f ′ (x0 )(x − x0 ) der Tangente an f (x) im Punkt x = x0 einbringt. Außerdem ist sie die Grundlage f¨ur die Theorie der differenzierbaren Funktionen in mehreren Variablen. Noch einfachere Formeln und Beweise erh¨alt man, wenn man die zwei hinteren Terme in Gl. (6.4) zusammenf¨ugt durch: (6.5)
ϕ(x) = f ′ (x0 ) + r(x).
III.6 Differenzierbare Funktionen 255
(6.3) Formulierung von Carath´eodory (Carath´eodory 1950, S. 121). Eine Funktion f (x) ist differenzierbar bei x0 genau dann, wenn es eine Funktion ϕ(x) gibt, die bei x0 stetig ist, so dass gilt: (6.6)
f (x) = f (x0 ) + ϕ(x)(x − x0 ).
Der Wert ϕ(x0 ) ist die Ableitung f ′ (x0 ) von f bei x0 . Wir sehen sofort aus (6.6), dass, falls f bei x0 differenzierbar ist, f auch stetig bei x0 sein muss. Dar¨uber hinaus folgt aus (6.5) und (6.3) (oder auch direkt aus (6.6)), dass (6.7)
ϕ(x) =
f (x) − f (x0 ) x − x0
f¨ur x 6= x0
eindeutig bestimmt ist (nat¨urlich nur f¨ur x 6= x0 ), und daher auch die Ableitung f ′ (x0 ) eindeutig bestimmt sein muss, sofern sie u¨ berhaupt existiert. Bemerkungen und Beispiele. 1. Offensichtlich sind die Funktionen f (x) = 1 und f (x) = x differenzierbar. Die Differenzierbarkeit von f (x) = x2 folgt beispielsweise aus (6.6) mit Hilfe der Identit¨at x2 − x20 = (x + x0 )(x − x0 ) (siehe auch Abschnitt II.1). 2. Wir wollen betonen, dass die Differenzierbarkeit bei x0 eine lokale Eigen¨ schaft ist. Andern wir n¨amlich die Funktion außerhalb von (x0 − ε, x0 + ε) f¨ur irgendein ε > 0 ab, a¨ ndert sich weder die Differenzierbarkeit bei x0 , noch die Ableitung f ′ (x0 ). 3. Ist I = [a, b] ein abgeschlossenes Intervall und x0 = a, dann sollte (6.1) durch den rechtsseitigen Grenzwert ersetzt werden. 4. Betrachten wir die Funktion f (x) = |x| (Betragsfunktion). Bei x0 > 0 ist sie differenzierbar mit f ′ (x0 ) = 1; bei x0 < 0 ist sie ebenfalls differenzierbar, jedoch mit der Ableitung f ′ (x0 ) = −1. Diese Funktion ist bei x0 = 0 nicht differenzierbar, da f (x)/x = |x|/x keinen Grenzwert f¨ur x → 0 besitzt. 5. Die Funktion 0 falls x irrational oder ganzzahlig ist f (x) = 2 1/q falls x = p/q (gek¨urzter Bruch) ist unstetig bei jeder nicht-ganzzahligen rationalen Zahl x0 . Jedoch ist sie differenzierbar bei x0 = 0, da die Funktion ϕ(x) von Gl. (6.6) die Form ϕ(x) = f (x)/x annimmt. Wegen |f (x)| ≤ |x|2 gilt somit limx→0 ϕ(x) = 0 und damit f ′ (x0 ) = 0.
0
(6.4) Satz. Falls f : (a, b) → R bei x0 ∈ (a, b) differenzierbar ist, und f ′ (x0 ) > 0 gilt, dann gibt es ein δ > 0 mit f (x) > f (x0 ) f (x) < f (x0 )
f¨ur alle x mit x0 < x < x0 + δ, f¨ur alle x mit x0 − δ < x < x0 .
Falls f ein Maximum oder Minimum bei x0 annimmt, so ist f ′ (x0 ) = 0.
256 III. Grundlagen der klassischen Analysis
Beweis. f ′ (x0 ) > 0 bedeutet, dass ϕ(x0 ) > 0 ist (siehe (6.6)). Aufgrund der Stetigkeit gilt ϕ(x) > 0 in einer Umgebung von x0 . Die behaupteten Ungleichungen folgen nun aus (6.7). Falls die Funktion ein Maximum bei x0 annimmt, so finden wir f (x) ≤ f (x0 ) auf beiden Seiten von x0 . Dies ist nur m¨oglich, wenn f ′ (x0 ) = 0 ist. ⊓ ⊔ (6.5) Bemerkung. Die Aussage von Satz 6.4 impliziert keineswegs, dass eine Funktion, die f ′ (x0 ) > 0 erf¨ullt, in einer Umgebung von x0 monoton w¨achst. Als Gegenbeispiel betrachten wir die Funktion f (x) (siehe Abb. 6.1), die durch f (0) = 0 und f (x) = x + x2 sin 1/x2 f¨ur x 6= 0.
definiert ist. Sie ist u¨ berall differenzierbar mit f ′ (0) = 1 (da f (x) = x + r(x) · x mit |r(x)| ≤ |x|). F¨ur x 6= 0 oszilliert die Ableitung 1 2 1 f ′ (x) = 1 + 2x sin 2 − cos 2 x x x in der N¨ahe des Ursprungs sehr stark. Obwohl also f (x) zwischen zwei Parabeln eingesperrt ist, gibt es beliebig nahe am Ursprung stets Punkte mit negativer Ableitung. Nach Satz 6.4 gibt es daher beliebig nahe an 0 Punkte ξ1 < ξ2 mit f (ξ1 ) > f (ξ2 ). Wir werden sp¨ater sehen (Korollar 6.12), dass, falls f ′ (x) > 0 f¨ur alle x ∈ (a, b) gilt, die Funktion dort monoton w¨achst. Das obige Gegenbeispiel ist also nur m¨oglich, da f nicht stetig differenzierbar ist.
0,5
f′
50
f
0
0,5
0
0,5
ABB. 6.1. Graph der Funktion y = x + x2 sin(1/x2 ) und ihrer Ableitung
(6.6) Satz. Sind f und g bei x0 differenzierbar, so auch f + g,
f · g,
f /g ( falls g(x0 ) 6= 0).
Die Formeln aus Abschnitt II.1 f¨ur ihre Ableitungen sind korrekt.
III.6 Differenzierbare Funktionen 257
Beweis. Wir wollen zwei verschiedene Beweise f¨ur das Produkt f · g pr¨asentieren. F¨ur f + g und f /g sind die Beweise a¨ hnlich. Der erste Beweis gr¨undet auf der Identit¨at f (x)g(x) − f (x0 )g(x0 ) g(x) − g(x0 ) f (x) − f (x0 ) = f (x) + g(x0 ) , x − x0 x − x0 x − x0 die man durch Addition und Subtraktion des Terms f (x)g(x0 ) erh¨alt. Verbinden wir die Stetigkeit von f bei x0 aus (Gl. (6.4)) und die Differenzierbarkeit von f und g mit Satz 1.5, so sehen wir, dass f¨ur x → x0 der Ausdruck auf der rechten Seite den endlichen Grenzwert f (x0 )g ′ (x0 ) + g(x0 )f ′ (x0 ) besitzt. Daher ist das Produkt f · g bei x0 differenzierbar. Unser zweiter Beweis basiert auf der Formulierung 6.3 von Carath´eodory. Nach Voraussetzung gilt: (6.8)
f (x) = f (x0 ) + ϕ(x)(x − x0 ), g(x) = g(x0 ) + ψ(x)(x − x0 ),
ϕ(x0 ) = f ′ (x0 ), ψ(x0 ) = g ′ (x0 ).
Multiplizieren wir beide Gleichungen von (6.8), so erhalten wir f (x)g(x) = f (x0 )g(x0 ) + f (x0 )ψ(x) + g(x0 )ϕ(x) + ϕ · ψ · (x − x0 ) (x − x0 ).
Die Funktion in den großen Klammern ist offenbar stetig bei x0 und ihr Wert bei x = x0 betr¨agt f (x0 )g ′ (x0 ) + g(x0 )f ′ (x0 ). ⊓ ⊔ (6.7) Satz (Kettenregel f¨ur zusammengesetzte Funktionen). Wenn y = f (x) bei x0 differenzierbar und z = g(y) bei y0 = f (x0) differenzierbar ist, so ist die zusammengesetzte Funktion (g ◦ f )(x) = g f (x) bei x0 differenzierbar, und es gilt: (6.9)
(g ◦ f )′ (x0 ) = g ′ (y0 ) · f ′ (x0 ). Viele unserer Studenten werden die pr¨agnante Eleganz dieses Beweises zu Sch¨atzen wissen. (Kuhn 1991)
Beweis. Wir benutzen Gl. (6.6), um die Voraussetzung in der Form f (x) − f (x0 ) = ϕ(x)(x − x0 ), g(y) − g(y0 ) = ψ(y)(y − y0 ),
ϕ(x0 ) = f ′ (x0 ), ψ(y0 ) = g ′ (y0 )
zu notieren. Setzen wir nun y − y0 = f (x) − f (x0 ) aus der ersten Gleichung in die zweite ein, so finden wir g f (x) − g f (x0 ) = ψ f (x) ϕ(x)(x − x0 ). Die Funktion ψ f (x) ϕ(x) ist wiederum stetig bei x0 und ihr Wert bei x = x0 betr¨agt g ′ f (x0 ) · f ′ (x0 ). ⊓ ⊔
258 III. Grundlagen der klassischen Analysis
(6.8) Satz (Umkehrfunktionen). Es sei f : I → J bijektiv, stetig und bei x0 ∈ I differenzierbar. Angenommen, es gilt f ′ (x0 ) 6= 0. Dann ist die Umkehrfunktion f −1 : J → I differenzierbar bei y0 = f (x0 ) und es gilt: (f −1 )′ (y0 ) =
(6.10)
1 . f ′ (x0 )
Beweis. Nach Carath´eodorys Formulierung (6.6) haben wir nach Voraussetzung ϕ(x0 ) = f ′ (x0 ).
f (x) − f (x0 ) = ϕ(x)(x − x0 ),
Wir ersetzen x und x0 durch f −1 (y) und f −1 (y0 ), sowie f (x) und f (x0 ) durch y und y0 , und finden: y − y0 = ϕ f −1 (y) f −1 (y) − f −1 (y0 ) .
Aus dem Beweis von Satz 3.9 folgern wir, dass f −1 (y) beiy0 stetig ist. Aufgrund −1 der Voraussetzung ϕ f (y0 ) 6= 0 gilt daher ϕ f −1 (y) 6= 0 in einer Umgebung von y0 , und wir d¨urfen durch diesen Term teilen, mit dem Ergebnis f −1 (y) − f −1 (y0 ) =
1 ϕ
(y − y0 ).
f −1 (y)
Dies beschließt den Beweis, da die Funktion 1/ϕ f −1 (y) bei y0 stetig ist.
⊓ ⊔
Der Hauptsatz der Differential- und Integralrechnung Formel (II.4.6) ist das zentrale Resultat aller Berechnungen in Abschnitt II.4. Wir wollen nun einen strengen Beweis f¨ur diese Formel liefern. Insbesondere werden wir zeigen, dass jede stetige Funktion f (x) eine Stammfunktion besitzt, die bis auf eine additive Konstante eindeutig ist. (6.9) Satz (Existenz einer Stammfunktion). Es sei f : [a, b] → R eine stetige Funktion. Dann ist die Funktion Z x (6.11) F (x) = f (t) dt a
(die nach Satz 5.10 existiert) auf (a, b) differenzierbar und erf¨ullt F ′ (x) = f (x). Folglich ist sie eine Stammfunktion von f (x). Beweis. Nach Gl. (5.16) gilt (6.12)
F (x) − F (x0 ) =
Z
x
f (t) dt. x0
Wenden wir den Mittelwertsatz 5.17 hierauf an, so finden wir F (x) − F (x0 ) = f (ξ)(x − x0 ),
III.6 Differenzierbare Funktionen 259
wobei ξ = ξ(x, x0 ) zwischen x und x0 liegt. F¨ur x → x0 strebt der Wert ξ(x, x0 ) notwendigerweise gegen x0 . Da f bei x0 stetig ist, haben wir somit limx→x0 f (ξ) = f (x0 ). Dies beweist die Differenzierbarkeit von F (x) (siehe (6.6)) und es ist F ′ (x0 ) = f (x0 ). ⊓ ⊔ Eindeutigkeit der Stammfunktion. Dies gestattet nun der Mittelwertsatz; und es ist der große Verdienst Cauchys, diese zentrale Stellung voll erkannt und demgem¨aß den Mittelwertsatz an die Spitze der Differentialrechnung gestellt zu haben; es ist nicht zuviel gesagt, wenn man ihn deshalb als Begr¨under der exakten Infinitesimalrechnung im modernen Sinne feiert. (F. Klein 1908, 3.III.1, oder S. 465 in der Autographie) Siehe den wundervollen Beweis dieses Satzes durch Mr. O. Bonnet, in Trait´e de Calcul diff´erentiel et int´egral von Mr. Serret, Band I, S. 17. (Darboux 1875, S. 111)
Unser n¨achstes Ziel soll sein, die Eindeutigkeit der Stammfunktion (bis auf eine additive Konstante) zu beweisen. Die folgende Aneinanderreihung von S¨atzen, die den gesuchten Beweis bewerkstelligt, wurde seit Serrets Buch (1868; Serret schreibt diese Ideen O. Bonnet zu; siehe Zitate) zu einem Eckstein der Grundlagen der Analysis. (6.10) Satz (Rolle 1690). Es sei f : [a, b] → R stetig auf [a, b], differenzierbar auf (a, b) und es gelte f (a) = f (b). Dann gibt es ein ξ ∈ (a, b) mit (6.13)
f ′ (ξ) = 0.
Beweis. Dank Satz 3.6 wissen wir, dass es u, U ∈ [a, b] gibt, so dass f (u) ≤ f (x) ≤ f (U ) f¨ur alle x ∈ [a, b] gilt. Wir unterscheiden nun zwei m¨ogliche F¨alle. Falls f (u) = f (U ) ist, dann ist die Funktion f (x) konstant und ihre Ableitung ist u¨ berall Null. Falls f (u) < f (U ) ist, so unterscheidet sich zumindest einer dieser zwei Werte von f (a) = f (b), sagen wir f (U ). Es gilt dann a < U < b und nach Satz 6.4 folgt f ′ (U ) = 0. ⊓ ⊔ (6.11) Satz (Lagrange 1797). Es sei f : [a, b] → R stetig auf [a, b] und differenzierbar auf (a, b). Dann gibt es eine Zahl ξ ∈ (a, b) mit (6.14)
f (b) − f (a) = f ′ (ξ)(b − a).
Beweis. Der Ansatz besteht darin, von der Funktion f (x) die gerade Linie zu subtrahieren, die die Punkte (a, f (a)) und (b, f (b)) verbindet. Diese besitzt die Stei gung f (b)−f (a) /(b−a). Danach wenden wir den Satz von Rolle an (Abb. 6.2). Wir definieren f (b) − f (a) (6.15) h(x) = f (x) − f (a) + (x − a) . b−a
260 III. Grundlagen der klassischen Analysis
Aufgrund von h(a) = h(b) = 0 und h′ (x) = f ′ (x) −
f (b) − f (a) b−a
folgt Gl. (6.14) aus h′ (ξ) = 0 (Satz 6.10).
⊓ ⊔
f(b) f(b)
f(a)
a
b
a f(a)
b
ABB. 6.2. Beweis der S¨atze von Rolle und Lagrange
(6.12) Korollar. Es seien f, g : [a, b] → R stetig auf [a, b] und differenzierbar auf (a, b). Es gilt dann: a) b) c) d)
Ist f ′ (ξ) = 0 f¨ur alle ξ ∈ (a, b), so ist f (x) = C (konstant); ist f ′ (ξ) = g ′ (ξ) f¨ur alle ξ ∈ (a, b), so ist f (x) = g(x) + C; ist f ′ (ξ) > 0 f¨ur alle ξ ∈ (a, b), so ist f (x) streng monoton wachsend, d.h. f (x1 ) < f (x2 ) f¨ur alle a ≤ x1 < x2 ≤ b; und ist |f ′ (ξ)| ≤ M f¨ur alle ξ ∈ (a, b), so ist |f (x1 ) − f (x2 )| ≤ M |x1 − x2 | f¨ur alle x1 , x2 ∈ [a, b].
Beweis. Wenden wir Gl. (6.14) auf das Intervall [a, x] an, so erhalten wir Aussage (a) mit C = f (a). Aussage (b) folgt direkt aus (a). Die verbleibenden Aussagen erh¨alt man, wenn man Satz 6.11 auf das Intervall [x1 , x2 ] anwendet. ⊓ ⊔ (6.13) Der Hauptsatz der Differential- und Integralrechnung. Es sei f (x) eine stetige Funktion auf [a, b]. Dann gibt es eine Stammfunktion F (x) von f (x), die bis auf eine additive Konstante eindeutig ist, und es gilt (6.16)
Z
a
b
f (x) dx = F (b) − F (a).
Beweis. Die Existenz von F (x) ist die Aussage von Satz 6.9. Eindeutigkeit (bis auf eine Konstante) folgt aus Korollar R x 6.12b. Ist F (x) nun eine beliebige Stammfunktion von f (x), so ist F (x) = a f (t) dt + C. Setzen wir x = a, so erhalten wir C = F (a) und Gl. (6.16) durch Einsetzen von x = b. ⊓ ⊔
III.6 Differenzierbare Funktionen 261 Hauptsatz der Differential- und Integralrechnung
Satz 6.11 Lagrange
Satz 5.10R Existenz
Satz 6.10 Rolle
R cBem. R b5.13R c a
=
a
+
Satz 6.4 f ′ > 0 ⇒ ...
b
RSatz 5.14 R f≤
g
Satz 1.6 lim ↔≤ Satz 1.5 lim ↔ +
Satz 5.17 Mittelwert
Satz 3.5 Zwischenwert
Satz 1.12 ∃ sup
Satz 4.5 Gleichm. Stet.
Satz 3.6 Max, Min
Satz 1.17 Bolz. Weier.
Satz 3.3 stet. Funk.
Satz 1.8 Cauchy Folg. konv.
Def. der reellen Zahlen, Def. des Limes, Logik ABB. 6.3. Stammbaum des Hauptsatzes
Abb. 6.3 zeigt den beeindruckenden Stammbaum der S¨atze, die wir f¨ur einen strengen Beweis des Hauptsatzes verwendet haben. H¨atte Leibniz von diesem Diagramm gewusst, h¨atte er vielleicht nicht den Mut gehabt, den Hauptsatz zu formulieren und zu benutzen. Der Hauptsatz der Differential- und Integralrechnung“ erlaubt es uns, S¨atze ” der Differentialrechnung (Abschnitt III.6) als S¨atze der Integralrechnung (Abschnitt III.5) zu formulieren und umgekehrt. Diese Eigenschaft wurde bereits in Abschnitt II.4 an verschiedenen Stellen ausgenutzt. Die Substitutionsregel der Integration (Gl. (II.4.14)) und die partielle Integration (Gl. (II.4.20)) basieren hierauf und haben nun ein sicheres Fundament. Man muss nur voraussetzen, dass die betrachteten Funktionen stetig sind, so dass ihre Integrale existieren.
262 III. Grundlagen der klassischen Analysis
Die Regeln von de L’Hospital . . . ganz u¨ ber dem unn¨utzen Ruhm, den die Mehrzahl der Wissenschaftler so gierig sucht . . . (Fontenelles Meinung u¨ ber Guillaume-Franc¸ois-Antoine de L’Hospital, Marquis de SainteMesme et du Montellier, Comte d’Antremonts, Seigneur d’Ouques, 1661– 1704) Desweiteren bekenne ich, dass ich den Einsichten der Bernoulli-Br¨uder sehr viel verdanke, insbesondere dem j¨ungeren, der derzeit Professor in Groningen ist. Ich habe mich ihrer Entdeckungen ohne Scham bedient. . . . (de L’Hospital 1696)
Wir beginnen mit folgender Verallgemeinerung des Satzes 6.11 von Lagrange. (6.14) Satz (Cauchy 1821). Es seien f : [a, b] → R und g : [a, b] → R stetig auf [a, b] und differenzierbar auf (a, b). Falls g ′ (x) 6= 0 f¨ur alle a < x < b gilt, so ist g(b) 6= g(a) und es gibt ein ξ ∈ (a, b) mit f (b) − f (a) f ′ (ξ) = ′ . g(b) − g(a) g (ξ)
(6.17)
Beweis. Zun¨achst stellen wir fest, dass nach dem Satz von Rolle g(b) 6= g(a) gilt, da g ′ (ξ) 6= 0 f¨ur alle ξ ∈ (a, b) ist. Dann bemerken wir, dass sich f¨ur g(x) = x die Aussage auf Satz 6.11 zur¨uckf¨uhren l¨asst. Lassen wir uns vom Beweis dieses Satzes inspirieren und ersetzen (6.15) durch f (b) − f (a) (6.18) h(x) = f (x) − f (a) + g(x) − g(a) . g(b) − g(a) Die Voraussetzungen des Satzes 6.10 von Rolle sind erf¨ullt und folglich gibt es ein ξ ∈ (a, b) mit h′ (ξ) = 0. Dies ist a¨ quivalent zu (6.17) ⊓ ⊔ Problem. Nehmen wir an, wir wollen den Grenzwert eines Quotienten f (x)/g(x) berechnen. Falls beide Funktionen f (x) und g(x) f¨ur x → b gegen 0 oder ∞ streben, so sind wir mit unbestimmten Ausdr¨ucken der Form 0 ∞ oder 0 ∞ konfrontiert. Die folgenden S¨atze und Beispiele zeigen uns, wie man mit solchen Situationen umgehen kann. (6.15) Satz (Joh. Bernoulli 1691/92, de L’Hospital 1696). Es seien f : (a, b) → R und g : (a, b) → R differenzierbar auf (a, b) und es gelte g ′ (x) 6= 0 f¨ur alle a < x < b. Falls (6.19)
lim f (x) = 0
x→b−
und
lim g(x) = 0
x→b−
erf¨ullt sind, und falls lim f ′ (x)/g ′ (x) = λ existiert, so ist x→b−
(6.20)
f (x) f ′ (x) = lim ′ . x→b− g(x) x→b− g (x) lim
III.6 Differenzierbare Funktionen 263
Beweis. Die Existenz des Grenzwertes von f ′ (x)/g ′ (x) f¨ur x → b− bedeutet, dass zu jedem gegebenen ε > 0 ein δ > 0 existiert, so dass gilt: (6.21)
f ′ (ξ) − λ < ε ′ g (ξ)
f¨ur
b − δ < ξ < b.
F¨ur u, v ∈ (b − δ, b) folgt dann aus Satz 6.14: (6.22)
f (u) − f (v) f ′ (ξ) − λ = ′ − λ < ε. g(u) − g(v) g (ξ)
In dieser Formel lassen wir nun v → b− streben, benutzen (6.19), und erhalten |f (u)/g(u) − λ| ≤ ε f¨ur b − δ < u < b. Damit ist (6.20) bewiesen. ⊓ ⊔ (6.16) Bemerkung. Mit kleinen Modifikationen am Beweis findet man, dass – der Satz auch f¨ur b = +∞ gilt; – der Satz auch f¨ur λ = +∞ oder λ = −∞ gilt; und – der Satz auch f¨ur den Grenzwert x → a+ gilt. (6.17) Satz. Unter den Voraussetzungen von Satz 6.15 gilt (6.20) auch dann, wenn (6.19) ersetzt wird durch (6.23)
lim f (x) = ∞
x→b−
Beweis. Wir multiplizieren (6.22) mit (6.24)
und
lim g(x) = ∞.
x→b−
g(v) − g(u) g(u) = 1− , was uns g(v) g(v)
f (v) − f (u) g(u) g(u) −λ 1− < ε 1 − g(v) g(v) g(v)
liefert. Wir wollen nun den Ausdruck |f (v)/g(v) − λ| auf der linken Seite frei stellen. Hierzu verwenden wir die abgewandelte Dreiecksungleichung |A|−|B| ≤ |A − B| (bzw. |A| ≤ |A − B| + |B|) und finden f (v) g(u) f (u) − λg(u) − λ < ε 1 − + . g(v) g(v) g(v)
Nun halten wir u fest und lassen v → b− streben. Aufgrund von (6.23) strebt dann der rechtsseitige Ausdruck gegen ε. Daher ist |f (v)/g(v) − λ| < 2ε, sobald v gen¨ugend nahe an b ist. Dies beweist die Behauptung. ⊓ ⊔ Beispiele. Der Quotient der Funktionen f (x) = sin x und g(x) = x liefert f¨ur x → 0 den unbestimmten Ausdruck 0/0. Mit Satz 6.15 berechnen wir nun: (6.25)
lim
x→0
sin x cos x = lim = 1. x→0 x 1
264 III. Grundlagen der klassischen Analysis
Offenbar m¨ussen die Gleichungen dabei von rechts nach links gelesen werden: Nur weil limx→0 cos x = 1 existiert, existiert auch limx→0 sin x/x und ist 1. Jetzt betrachten wir f (x) = eαx (α > 0) und g(x) = xn , die beide f¨ur x → ∞ gegen ∞ streben. Wiederholte Anwendung von Satz 6.17 (und Bemerkung 6.16) zeigt uns: (6.26)
eαx αeαx α2 eαx αn eαx = lim = lim = . . . = lim = ∞. x→∞ xn x→∞ n xn−1 x→∞ n(n − 1)xn−2 n! Damit ist bewiesen, dass die Exponentialfunktion eαx (f¨ur x → ∞) schneller anw¨achst als jedes Polynom. F¨ur a > 0 erhalten wir aus Satz 6.17 und Bemerkung 6.16: lim
ln x 1/x 1 = lim = lim = 0. a a−1 x→∞ x→∞ x ax axa Folglich w¨achst jedes nicht-konstante Polynom schneller als jeder Logarithmus. Unbestimmte Ausdr¨ucke der Form (6.27)
lim
x→∞
oder
0·∞
00
oder
∞0
k¨onnen wie in den folgenden Beispielen behandelt werden:
ln x 1/x = lim = lim (−x) = 0, 1/x x→0+ −1/x2 x→0 (6.29) lim xx = lim exp(x ln x) = exp lim x ln x = exp(0) = 1, x→0+ x→0+ x→0+ √ ln x (6.30) lim x x = lim x1/x = exp lim = exp(0) = 1. x→∞ x→∞ x→∞ x In den letzten beiden Beispielen haben wir die Stetigkeit der Exponentialfunktion eingesetzt. (6.28) lim (x · ln x) = lim x→0+
x→0+
Ableitungen einer unendlichen Reihe Wo ist bewiesen, dass man die Ableitung einer unendlichen Reihe dadurch erh¨alt, dass man die Ableitung f¨ur jeden Term berechnet? (Abel, Janv. 16, 1826, Oeuvres, Band 2, S. 258)
Die termweise Differentiation einer unendlichen Reihe wird durch den folgenden Satz gerechtfertigt. (6.18) Satz. Es sei fn : (a, b) → R eine Folge stetig differenzierbarer Funktionen. Falls i) lim fn (x) = f (x) auf (a, b) ist und n→∞
ii)
lim fn′ (x) = p(x) ist, wobei die Konvergenz auf (a, b) gleichm¨aßig ist,
n→∞
dann ist f (x) auf (a, b) stetig differenzierbar und f¨ur alle x ∈ (a, b) gilt (6.31)
lim f ′ (x) n→∞ n
= f ′ (x).
III.6 Differenzierbare Funktionen 265
Beweis. Wie wir leicht erraten k¨onnen, ist die Hauptzutat“ f¨ur diesen Beweis ” (abgesehen vom Hauptsatz der Differential- und Integralrechnung) Satz 5.19 u¨ ber die Vertauschbarkeit von Grenzwerten mit Integralen. Wir halten x0 ∈ (a, b) fest. Da {fn′ (x)} auf (a, b) gleichm¨aßig konvergiert, finden wir Z x Z x p(t) dt = lim fn′ (t) dt = lim fn (x) − fn (x0 ) = f (x) − f (x0 ). x0
n→∞
n→∞
x0
Nach Satz 6.9 zeigt dies, dass p(x) = f ′ (x) ist, und dass (6.31) gilt. Die Stetigkeit von f ′ (x) folgt aus Satz 4.2. ⊓ ⊔ 2
n=1
−1
0
n=1
1
n=2 1
−2
n=2 0
2
−1 −2 ABB. 6.4. Gleichm¨aßige Konvergenz mit lim fn′ 6= (lim fn )′
(6.19) Gegenbeispiele. Die Funktionen (siehe Abb. 6.4) (6.32)
fn (x) =
x 1 + n 2 x2
und
fn (x) =
1 sin(nx) n
zeigen, dass Voraussetzung (i) alleine (selbst unter gleichm¨aßiger Konvergenz) nicht ausreicht, um (6.31) zu beweisen.
¨ Ubungen 6.1 Gegeben sei eine positive ganze Zahl n. Wir definieren fn : R → R durch fn (x) =
xn sin(1/x3 ) 0
falls x 6= 0, falls x = 0.
Wie oft ist fn differenzierbar und welche der Ableitungen von fn sind stetig? 6.2 Zeigen Sie auf zwei verschiedene Weisen (n¨amlich unter Verwendung von (6.11), sowie der Formulierung (6.6) von Carath´eodory), dass, falls f (x) bei x0 differenzierbar ist mit g(x0 ) 6= 0, die Funktion 1/g(x) ebenfalls bei x0 differenzierbar sein muss.
266 III. Grundlagen der klassischen Analysis 1,00 0,75 0,50 0,25
0
1/3
2/3
1
ABB. 6.5. Die Teufelstreppe
6.3 Zeigen Sie, dass die Funktion x · 2 − cos(ln x) − sin(ln x) f (x) = 0
0 ̺, und wir finden gleichm¨aßige Konvergenz auf jedem Intervall [−η, η] mit 0 < η < ̺. Beweis. Es sei x ein Wert mit |x| < ̺. Dann gibt es ein x e mit |x| < |e x| < ̺, so dass (7.1) f¨ur x e konvergiert (man setze ε = (̺ − |x|)/2 in Definition 1.11). Nach Lemma 7.1 finden wir dann f¨ur x Konvergenz. Die gleichm¨aßige Konvergenz auf [−η, η] sieht man auf dieselbe Weise. ⊓ ⊔
III.7 Potenzreihen und Taylorreihen 269
Dieser Satz sagt nichts aus u¨ ber die Konvergenz bei x = −̺ und x = ̺. Tats¨achlich kann an diesen Punkten alles passieren, wie wir im folgenden Beispiel sehen werden. (7.4) Beispiel. Die Reihe (7.3)
∞ X xn x x2 x3 x4 = α + α + α + α +... α n 1 2 3 4 n=1
ist (abgesehen vom ersten Term; Beispiel 2.2) f¨ur α = 0 schlicht die geometrische Reihe, reduziert sich f¨ur α = 1 auf −ln(1 − x) (siehe Gl. (I.3.14)), und wird f¨ur α = 2 zu Eulers Dilogarithmus“ (Euler 1768, Inst. Calc. Int., Sectio Prima, Ca” put IV, Exemplum 2). Unabh¨angig von α betr¨agt der Konvergenzradius von (7.3) stets ̺ = 1 (siehe Beispiel 7.6 unten). F¨ur α = 0 divergiert die Reihe an beiden Enden des Konvergenzintervalls. F¨ur α = 1 finden wir eine Divergenz nur bei x = +1 (harmonische Reihe), aber Konvergenz bei x = −1 (nach dem LeibnizKriterium). F¨ur α = 2 konvergiert die Reihe sowohl f¨ur x = +1 als auch x = −1 (siehe Lemma 2.6).
Bestimmung des Konvergenzradius Die folgenden S¨atze liefern n¨utzliche Formeln f¨ur die Berechnung von Konvergenzradien. (7.5) Satz (Cauchy 1821). Falls lim |cn /cn+1 | existiert (oder ∞ ist), so gilt: n→∞
(7.4)
c n ̺ = lim . n→∞ cn+1
Beweis. Wir wenden das Quotientenkriterium 2.10 auf die Reihe cn xn an. Wegen
P
n
an mit an =
a c c c . n+1 n+1 xn+1 n+1 n lim = |x| lim = |x| lim = lim n→∞ n→∞ n→∞ n→∞ cn+1 an cn xn cn
konvergiert die Reihe (7.1) im Fall |x| < lim |cn /cn+1 |. F¨ur |x| > lim |cn /cn+1 | divergiert sie. Daraus folgt Gl. (7.4). ⊓ ⊔ (7.6) Beispiele. Setzen wir cn = 1/nα in Reihe (7.3) ein, so gilt |cn /cn+1 | = (1+1/n)α → 1 f¨ur n → ∞. Daher ist der Konvergenzradius ̺ = 1. Analog finden wir f¨ur die Binomialreihe f¨ur (1+x)a (Satz I.2.2) |cn /cn+1 | = (n+1)/|a−n| → 1 und ̺ = 1. F¨ur die Reihenentwicklungen von ex (siehe Satz I.2.3), sin x und cos x (siehe Gleichungen (I.4.16) und (I.4.17)) haben wir die Konvergenz bereits f¨ur alle
270 III. Grundlagen der klassischen Analysis
reellen x bewiesen (Abschnitt III.2). Folglich sind ihre Konvergenzradien ̺ = ∞. Ein Beispiel f¨ur eine Reihe mit ̺ = 0 ist 1 + x + 2! x2 + 3! x3 + 4! x4 + . . . . Hier ist cn = n! und |cn /cn+1 | = 1/(n + 1) → 0. Die Formel aus Satz 7.5 l¨asst sich nicht direkt auf die Reihe (7.5)
arctan x = x −
x3 x5 x7 + − +... 3 5 7
anwenden, da |cn /cn+1 | abwechselnd die Werte 0 und ∞ annimmt. Wenn wir durch x teilen und x2 durch P die neue Variable z ersetzen, dann wird die durch x dividierte Reihe (7.5) zu n cn z n mit cn = (−1)n /(2n + 1). F¨ur diese Reihe finden wir ̺ = 1 nach Satz 7.5. Infolgedessen konvergiert die Reihe (7.5) f¨ur |x2 | < 1 (also |x| < 1) und es ist ̺ = 1. W¨ahrend Gl. (7.4) noch die Existenz des Grenzwertes ben¨otigt, gilt das ¨ n¨achste Resultat ohne Einschr¨ankungen (siehe auch Ubung 7.1 unten). (7.7) Satz (Hadamard 1892). Der Konvergenzradius der Reihe (7.1) betr¨agt (7.6)
̺=
1 lim sup n→∞
p . n |cn |
Beweis. Wir wenden das Wurzelkriterium 2.11 auf die Reihe cn xn an. Damit ist p p lim sup n |an | = |x| · lim sup n |cn | n→∞
P
n an
mit an =
n→∞
und wir sehen, dass die Reihe (7.1) p f¨ur |x| < 1/ lim sup divergiert f¨ur |x| > 1/ lim sup n |cn |.
p n |cn | konvergiert. Sie ⊓ ⊔
Stetigkeit Es sei D der Konvergenzbereich, definiert als (7.7) D = x | Reihe (7.1) konvergiert ,
womit die Reihe (7.1) eine Funktion f : D → R beschreibt, die ihrerseits gegeben ist durch ∞ X (7.8) f (x) = cn xn f¨ur x ∈ D. n=0
Aus der gleichm¨aßigen Konvergenz auf [−η, η] f¨ur jedes 0 < η < ̺ (siehe S¨atze 7.3 und 4.2) schließen wir, dass f (x) auf dem offenen Intervall (−̺, ̺) eine stetige Funktion ist. Der folgende ber¨uhmte Satz von Abel behandelt die Frage der Stetigkeit an den Endpunkten des Konvergenzintervalls.
III.7 Potenzreihen und Taylorreihen 271
(7.8) Satz (Abel 1826). Angenommen, die Reihe (7.8) konvergiert f¨ur x0 = ̺ (oder f¨ur x0 = −̺). Dann ist die Funktion f (x) stetig bei x0 = ̺ (bzw. bei x0 = −̺).
Beweis. Der Einfachheit halber nehmen wir an, dass ̺ = 1 und x0 = +1 ist. Ansonsten strecken oder stauchen wir das Konvergenzintervall und kehren es gegebenenfalls um, indem wir x0 durch ±x0 /̺ ersetzen. Nach Voraussetzung finden wir Konvergenz bei x0 = 1 vor, daher folgt aus Lemma 2.3, dass f¨ur n ≥ N und k ≥ 1 gilt: (7.9)
|cn+1 + cn+2 + . . . + cn+k | < ε.
Nun sei x eine beliebige Zahl in [0, 1]. Dann finden wir f¨ur fn (x) = (7.10)
Pn
i i=0 ci x :
fn+k (x) − fn (x) = cn+1 xn+1 + cn+2 xn+2 + . . . + cn+k xn+k .
Falls alle ci ≥ 0 sind, so wird aus Gl. (7.9) offensichtlich, dass |fn+k (x) − fn (x)| < ε ist. Ansonsten spalten wir (7.10) etwas vorsichtiger auf (hier einmal f¨ur k = 4): cn+1 xn+4
+
cn+2 xn+4
+
cn+3 xn+4
+cn+4 xn+4
+cn+1 (xn+3 −xn+4 )+cn+2 (xn+3 −xn+4 )+cn+3 (xn+3 −xn+4 ) +cn+1 (xn+2 −xn+3 )+cn+2 (xn+2 −xn+3 ) +cn+1 (xn+1 −xn+2 )
¨ (diesen Prozess nennt man Abelsche partielle Summation, siehe Ubung 7.2). In jeder Spalte k¨onnen wir nun einen gemeinsamen (positiven) Faktor xn+k , xn+k−1 − xn+k , . . . ausklammern und erhalten nach (7.9) und mittels der Dreiecksungleichung, dass |fn+k (x) − fn (x)| < ε · (xn+k + xn+k−1 −xn+k + . . . + xn+1 −xn+2 ) ≤ ε gleichm¨aßig auf [0, 1] erf¨ullt ist. Somit folgt die Stetigkeit von f (x) bei x0 = 1 aus Satz 4.2. ⊓ ⊔
Differentiation und Integration √ Da n n → 1 strebt f¨ur n → ∞ (siehe Gl. (6.30)), folgt aus Satz 7.7, dass die (termweise) abgeleiteten und integrierten Potenzreihen denselben Konvergenzradius wie die urspr¨ungliche Reihe besitzen. Wir finden dann das folgende Resultat. P∞ n (7.9) Satz. Die Funktion f (x) = ur |x| < ̺ differenzierbar n=0 cn x ist f¨ (wobei ̺ der Konvergenzradius und ̺ > 0 ist) und es gilt: (7.11)
f ′ (x) =
∞ X
n=1
ncn xn−1 .
272 III. Grundlagen der klassischen Analysis
Die Funktion f (x) besitzt eine Stammfunktion auf (−̺, ̺), die gegeben ist durch: Z x ∞ X xn+1 (7.12) f (t) dt = cn . n+1 0 n=0 Beweis. F¨ur 0 ≤ η < ̺ ist die Konvergenz der Reihe auf [−η, η] gleichm¨aßig (und nat¨urlich auch auf (−η, η)). Sodann folgt aus Satz 6.18, dass die Funktion f (x) auch auf (−η, η) differenzierbar ist, und dass ihre Ableitung durch (7.11) gegeben ist. In a¨ hnlicher Weise folgt Gl. (7.12) aus Korollar 5.20. ⊓ ⊔ (7.10) Bemerkung. Falls die Reihe (7.1) konvergiert, beispielsweise bei x = ̺, so muss die abgeleitete Reihe (7.11) dort keineswegs auch konvergieren. Dies ist z.B. der Fall f¨ur α = 2 in Reihe (7.3). Die Konvergenz von (7.1) bei x = ̺ ¨ impliziert jedoch die Konvergenz von (7.12) bei x = ̺ (siehe Ubung 7.3). Mit Satz 7.8 sehen wir damit, dass die Identit¨at (7.12) f¨ur alle x ∈ D erf¨ullt ist. (7.11) Beispiel. Die geometrische Reihe (Beispiel 2.2) besitzt den Konvergenzradius ̺ = 1. Termweise Integration, Satz 7.9 und die Definition des ln (siehe Abschnitt I.3) liefern dann f¨ur x ∈ (−1, 1) Z x dt x2 x3 x4 x5 (7.13) ln(1 + x) = =x− + − + − ... . 2 3 4 5 0 1+t Desweiteren konvergiert Reihe (7.13) f¨ur x = 1 und nach Satz 7.8 erhalten wir somit abermals ln 2 = 1 − 1/2 + 1/3 − 1/4 + . . . , dieses Mal aber mit strengen Mitteln.
Taylorreihen . . . und um die Gr¨oße des Restes dieser Reihe abzusch¨atzen. Dieses Problem, eines der wichtigsten in der Theorie der Reihen, wurde bislang nicht gel¨ost . . . (Lagrange 1797, Oeuvres, Band 9, S. 42–43, 71)
Im Jahr 1797 (zweite Auflage 1813) schrieb Lagrange eine ganze Abhandlung, in der er die Taylorreihenentwicklung von Funktionen (siehe Gl. (II.2.8)), (7.14)
f (x) =
∞ X (x − a)i i=0
i!
f (i) (a),
als Grundlage der Analysis nutzte. Dies erlaubte es ihm, so dachte er zumindest, unendlich kleine Gr¨oßen, Grenzwerte und Fluxione aus dem Kalk¨ul zu entfernen ( d´egag´es de toute consid´eration d’infiniment petits, d’´evanouissans, de limites ou ” de fluxions“). Dieser Traum w¨ahrte jedoch gerade mal 25 Jahre. Betrachten wir x − a als neue Variable, so ist die obige Reihe von der Form (7.1) und die vorigen Resultate u¨ ber die Konvergenz der Reihe lassen sich anwenden. Das erste Problem besteht darin, dass es unendlich oft ableitbare Funktionen
III.7 Potenzreihen und Taylorreihen 273
¨ gibt, f¨ur die die Reihe (7.14) f¨ur kein x 6= a konvergiert (siehe Ubung 7.6 unten). Aber selbst die Konvergenz der Reihe (7.14) bedeutet nicht zwangsl¨aufig, dass die Identit¨at (7.14) gilt, wie wir im folgenden Gegenbeispiel sehen werden. (7.12) Gegenbeispiel. . . . Taylors Formel, die nicht l¨anger als allgemein g¨ultig betrachtet werden kann . . . (Cauchy 1823, R´esum´e, S. 1)
f ′′/2
−3
−2
−1
0
f
f′
1
0
1
−1
2
3
f ′′′/6 2
ABB. 7.1. Graph der Funktion e−1/x und ihrer Ableitungen
Cauchy (1823) betrachtete die Funktion −1/x2 e (7.15) f (x) = 0
falls x 6= 0
falls x = 0,
welche u¨ berall stetig ist. Diese Funktion ist im Ursprung so ungeheuer flach (siehe Abb. 7.1), dass f¨ur alle i die i-ten Ableitungen f (i) (0) = 0 sind. Tats¨achlich folgt aus den Ableitungsregeln (f¨ur x 6= 0) 6 2 2 2 4 f ′ (x) = 3 · e−1/x , f ′′ (x) = − 4 + 6 · e−1/x x x x 2
und wir sehen, dass f (i) (x) ein Polynom in 1/x ist, multipliziert mit e−1/x . Da 2 die Funktionen x−n e−1/x f¨ur alle n und x → 0 gegen Null streben (siehe die Beispiele nach Satz 6.17), gilt f (i) (x) → 0 f¨ur x → 0. Da sogar f (i) (x)/x → 0 f¨ur x → 0 ist, bedeutet dies f (i+1) (0) = limh→0 f (i) (h)/h = 0. Doch damit ist die Taylorreihe der Funktion f (x) in (7.15) einfach 0 + 0 + 0 + . . . und konvergiert offensichtlich f¨ur alle x. Nach Formel (7.14) ist sie jedoch falsch f¨ur alle x 6= 0. Um nun Gl. (7.14) f¨ur bestimmte Funktionen zu etablieren, m¨ussen wir Partialsummen der Taylorreihen betrachten und ihre Restglieder bestimmen. Eine n¨utzliche Formel haben wir in diesem Zusammenhang bereits am Ende von Abschnitt II.4 hergeleitet. Sie ist in folgendem Satz zusammengefasst.
274 III. Grundlagen der klassischen Analysis
(7.13) Satz. f (x) sei k + 1-fach stetig differenzierbar auf [a, x] (oder auf [x, a] falls x < a). Dann gilt: f (x) =
k X (x − a)i
i!
i=0
f (i) (a) +
Z
a
x
(x − t)k (k+1) f (t) dt. k!
⊓ ⊔
Die binomische Reihe. . . . aber derjenige Artikel, der mir am meisten Freude bereitet . . . u¨ ber die einfache Reihe m(m − 1) 2 1 + mx + x + ... 2 Ich wage zu behaupten, dass dies der erste strenge Beweis f¨ur die binomische Formel ist . . . (Abel, Brief an Holmboe 1826, Oeuvres, Band 2, S. 261)
Ein strenger Beweis des binomischen Lehrsatzes (1 + x)a = 1 + ax +
(7.16)
a(a − 1) 2 a(a − 1)(a − 2) 3 x + x + ... 2! 3!
f¨ur |x| < 1 und beliebige a wurde zuerst von Abel im Jahr 1826 gesucht. Ein Beweis auf der Basis der Taylorreihen findet sich in der Vorlesung von Weierstraß von 1861 (siehe Weierstraß 1861). Setzen wir f (x) = (1 + x)a und berechnen die Ableitungen f ′ (x) = a(1 + a−1 x) , f ′′ (x) = a(a − 1)(1 + x)a−2 , . . . , so stellen wir fest, dass die Reihe (7.16) einfach die Taylorreihe von f (x) = (1 + x)a ist. Ihr Konvergenzradius wurde in Beispiel 7.6 als ̺ = 1 berechnet. Um nun die Gleichheit (7.16) f¨ur |x| < 1 zu beweisen, m¨ussen wir zeigen, dass das Restglied (siehe Satz 7.13) (7.17)
Rk (x) =
Z
0
x
(x − t)k a(a − 1) · . . . · (a − k)(1 + t)a−k−1 dt k!
f¨ur k → ∞ gegen Null konvergiert. Benutzen wir Satz 5.17 und setzen ξ = θk x mit 0 < θk < 1, so erhalten wir (x − θk x)k a(a − 1) · · · (a − k)(1 + θk x)a−k−1 · x k! k (a − 1)(a − 2) · · · (a − k) k 1 − θk = ·x · · (1 + θk x)a−1 · ax. k! 1 + θk x
Rk (x) =
Der Faktor ax ist eine Konstante; (1 + θk x)a−1 liegt zwischen (1 + x)a−1 und 1 und ist beschr¨ankt; wegen 0 < 1 − θk < 1 + θk x f¨ur alle x mit |x| < 1 ist auch k der Faktor (1 − θk )/(1 + θk x) durch 1 beschr¨ankt. Da der verbleibende Faktor (a − 1)(a − 2) · · · (a − k) k ·x k!
III.7 Potenzreihen und Taylorreihen 275
f¨ur |x| < 1 der allgemeine Term einer konvergenten Reihe ist, strebt er nach (2.3) gegen Null. Folglich ist Rk (x) → 0 f¨ur k → ∞ und die Identit¨at (7.16) ist f¨ur |x| < 1 bewiesen. Wann immer die Reihe (7.16) f¨ur x = +1 oder x = −1 konvergiert, beschreibt sie eine stetige Funktion und enstpricht also auch (1 + x)a an diesen Punkten (Satz 7.8). Absch¨atzung des Restgliedes ohne Integralrechnung. Die Versuche Lagranges (1797), das Restglied in der Taylorformel zu berechnen, wurden von den folgenden eleganten Formeln gekr¨ont ( ce th´eor`eme nouveau et remarquable par sa ” simplicit´e et sa g´en´eralit´e . . .“): f (x) = f (a) + (x−a)f ′ (ξ) (7.18)
(x−a)2 ′′ f (ξ) 2! (x−a)2 ′′ (x−a)3 ′′′ f (x) = f (a) + (x−a)f ′ (a) + f (a) + f (ξ), 2! 3! f (x) = f (a) + (x−a)f ′ (a) +
etc., wobei ξ eine unbekannte Zahl zwischen a und x ist. (7.14) Satz (Lagrange 1797). Es sei f (x) stetig auf [a, x] und k + 1-fach differenzierbar auf (a, x). Dann gibt es ein ξ ∈ (a, x) mit f (x) =
k X (x − a)i i=0
i!
f (i) (a) +
(x − a)k+1 (k+1) f (ξ). (k + 1)!
Bemerkung. Man kann diesen Satz aus Satz 7.13 mit Hilfe von Satz 5.18 erhalten. Aber wir wollen den folgenden eleganten Einfall von Cauchy den Lesern nicht ¨ vorenthalten. F¨ur den Originalbeweis von Lagrange verweisen wir auf Ubung 7.8 unten. Beweis. Wir benutzen hier einen Ansatz von Cauchy (1823), schreiben das Restglied als (7.19)
Rk (x) = f (x) −
k X (x − a)i i=0
i!
f (i) (a)
und vergleichen es mit der Funktion Sk (x) = (x − a)k+1 /(k + 1)! . Es ist Rk (a) = 0, (i)
Rk′ (a) = 0,
...
(k)
, Rk (a) = 0
und analog Sk (a) = 0 f¨ur i = 0, 1, . . . , k. Wenden wir nun Satz 6.14 wiederholt an, so finden wir
276 III. Grundlagen der klassischen Analysis
Rk (x) − Rk (a) R′ (ξ1 ) R′ (ξ1 ) − Rk′ (a) Rk (x) = = ′k = k′ Sk (x) Sk (x) − Sk (a) Sk (ξ1 ) Sk (ξ1 ) − Sk′ (a) (k+1)
(7.20)
=
Rk (ξk+1 ) Rk′′ (ξ2 ) Rk′′ (ξ2 ) − Rk′′ (a) = = . . . = (k+1) , ′′ ′′ ′′ Sk (ξ2 ) Sk (ξ2 ) − Sk (a) Sk (ξk+1 )
wobei ξ1 zwischen x und a liegt, ξ2 zwischen ξ1 und a und so weiter. Da (k+1) (k+1) Sk (x) = 1 und Rk (x) = f (k+1) (x) ist, folgt aus (7.20), dass Rk (x) = Sk (x) · f (k+1) (ξ) mit ξ = ξk+1 gilt. Damit ist der Beweis des Satzes vollst¨andig.
⊓ ⊔
¨ Ubungen 7.1 Bestimmen Sie den Konvergenzradius der Reihe f (x) = 1 + 2x + x2 + 2x3 + x4 + 2x5 + . . . und zeigen Sie, dass Satz 7.5 nicht anwendbar ist, Satz 7.7 aber sehr wohl. 7.2 (Partielle Summation, Abel 1826). Es seien {an} und {bn } zwei Folgen. Beweisen Sie N X
n=0
an bn =
N X
n=0
An (bn − bn+1 ) + AN bN +1 − A−1 b0 ,
wobei A−1 = α eine beliebige Konstante und An = α + a0 + a1 + . . . + an ist. Hinweis. Benutzen Sie die Gleichung an bn = (An − An−1 )bn = An (bn − bn+1 ) − An−1 bn + An bn+1 . 7.3 Betrachten Sie die Reihen ∞ X
n=1
cn
und
∞ X cn . n n=1
Beweisen Sie, dass die Konvergenz der ersten Reihe die Konvergenz der zweiten Reihe bedingt. Im Beweis werden Sie dabei auf ein Problem stoßen, das dem im Beweis von Satz 7.8 a¨ hnelt, und das mit einer a¨ hnlichen Idee ¨ gel¨ost werden kann (partielle Summation, siehe vorhergehende Ubung).
III.7 Potenzreihen und Taylorreihen 277
7.4 Untersuchen Sie die Konvergenz der Newton-Gregory-Reihe arcsin(x) = x +
1 x3 1 · 3 x5 1 · 3 · 5 x7 + + +... 2 3 2·4 5 2·4·6 7
f¨ur x = 1 und x = −1. Hinweis. Das Wallissche Produkt erweist sich als n¨utzlich, wenn man das asymptotische Verhalten der Koeffizienten verstehen m¨ochte. 7.5 Es sei D ′ der Konvergenzbereich der Reihe in Gleichung (7.11). Zeigen Sie, dass die Identit¨at in Gl. (7.11) f¨ur alle x ∈ D′ erf¨ullt ist. 7.6 Unendlich oft differenzierbare Funktion, deren Taylorreihe nicht konvergiert (siehe Lerch 1888, Pringsheim 1893); zeigen Sie, dass die Reihe
cos 2x cos 4x cos 8x cos 16x + + + +... 1! 2! 3! 4! und alle ihre Ableitungen gleichm¨aßig in R kon- −1
1
f (x) =
0 0
1
vergieren. Zeigen Sie, dass ihre Taylorreihe im Ursprung f (0) + f ′ (0)x + . . . = (e − 1) −
e4 − 1 2 e16 − 1 4 e64 − 1 6 x + x − x +... 2! 4! 6!
ist und f¨ur alle x 6= 0 divergiert. Dennoch erweisen sich zur Berechnung von beispielsweise f (0,01) (korrekter Wert f (0,01) = 1,71572953) die ersten zwei Glieder der Reihe als n¨utzlich. Warum? 7.7 Untersuchen Sie die Konvergenz der Reihe (7.16) f¨ur x = 1 und x = −1. 7.8 Folgen Sie den Fußspuren Lagranges und finden Sie die Formeln (7.18) durch Einsatz eines, wie wir heute sagen w¨urden, Homotopie-Arguments“. ” Hinweis. Definieren Sie (7.21) f (x) = f (x − zx) + zxf ′ (x − zx) +
z 2 x2 ′′ x3 f (x − zx) + R(z), 2! 3!
wobei z eine Variable zwischen 0 und 1 ist, und wobei x als feste Konstante angesehen wird. W¨ahlen Sie z = 0, so finden Sie R(0) = 0, und f¨ur z = 1 sehen Sie, dass (x3 /3!)R(1) der Fehlerterm ist, nach dem Sie suchen. Leiten Sie nun (7.21) bez¨uglich z ab mit dem Ergebnis R′ (z) = 3z 2 f ′′′ (x − zx) . Integrieren Sie dies nun von 0 bis 1 und wenden Sie Satz 5.18 an. P P 7.9 (Abel 1826). Zeigen Sie, dass, falls die Reihen i ai , j bj und ihr CauchyProdukt konvergieren, Gleichung (2.19) gilt. Hinweis. Wenden P Sie den Satz 7.8 von P Abel auf die Funktion f (x) · g(x) an, wobei f (x) = i ai xi und g(x) = j bj xj ist.
278 III. Grundlagen der klassischen Analysis
III.8 Uneigentliche Integrale Rb Die Theorie des Riemann-Integrals a f (x) dx in Abschnitt III.5 basiert auf den Annahmen, dass [a, b] ein endliches Intervall und die Funktion f (x) auf diesem Intervall beschr¨ankt ist. Wir wollen zeigen, wie man diese Beschr¨ankungen umgehen kann. Sofern zumindest eine dieser zwei Annahmen verletzt ist, sprechen wir von einem uneigentlichen Integral.
Beschr¨ankte Funktionen auf unendlichen Intervallen (8.1) Definition. Es sei f : [a, ∞) → R auf jedem Intervall [a, b] mit b > a integrierbar. Falls der Grenzwert Z ∞ Z b f (x) dx := lim f (x) dx b→∞
a
a
existiert, dann sagen wir, dass f (x) auf [a, ∞) integrierbar und konvergentes Integral ist.
R∞ a
f (x) dx ein
Nur Feiglinge machen den allgemeinen Fall. Wahre Lehrer l¨osen Beispiele. (Parlett, siehe Math. Intelligencer, Band 14, Nr. 1, S. 35)
(8.2) Beispiele. Betrachten wir zun¨achst die Exponentialfunktion auf dem Intervall [0, ∞). Nach Definition 8.1 ist Z ∞ Z b b e−x dx = lim e−x dx = lim −e−x = lim (1 − e−b ) = 1. 0
b→∞
b→∞
0
0
b→∞
Sobald wir uns einmal an diese Definition gew¨ohnt haben, schreiben wir einfach Z ∞ ∞ (8.1) e−x dx = −e−x = 1. 0
0
Als n¨achstes betrachten wir die Funktion x auf [1, ∞): Z ∞ Z ∞ divergiert dx x1−α ∞ −α (8.2) = x dx = = α x 1−α 1 (α − 1)−1 1 1 −α
falls α < 1 falls α > 1 .
F¨ur α = 1 lautet eine Stammfunktion ln x und das uneigentliche Integral divergiert. Aber wie k¨onnen wir die Integrabilit¨at auf [a, ∞) nachweisen, wenn wir keine Stammfunktion explizit kennen? (8.3) Lemma. Es sei f : [a, ∞) → R integrierbar auf jedem Intervall [a, b]. R∞ a) Falls |f (x)| ≤ g(x) f¨ur alle x ≥ a gilt und a g(x) dx konvergent ist, so ist R∞ auch a f (x) dx konvergent. R∞ b) Falls 0 ≤ g(x) ≤ f (x) f¨ur alle x ≥ a gilt und a g(x) dx divergent ist, so R∞ ist auch a f (x) dx divergent.
III.8 Uneigentliche Integrale 279
Beweis. Aussage (a) folgt aus dem Cauchy-Kriterium (Satz 3.12) in Verbindung R bb R bb R bb mit Satz 5.14, da | b f (x) dx| ≤ b |f (x)| dx ≤ b g(x) dx < ε f¨ur hinreichend große b < bb ist. Aussage (b) ist offensichtlich. ⊓ ⊔ (8.4) Beispiel. F¨ur α > 0 betrachten wir die Funktion (1+xα )−1 auf dem Intervall [0, ∞). Wir spalten das Integral auf gem¨aß Z ∞ Z 1 Z ∞ dx dx dx (8.3) = + . α α 1+x 1 + xα 0 0 1+x 1 Das erste Integral ist eigentlich“. F¨ur das zweite Integral benutzen wir die Ab” sch¨atzungen 1 1 1 ≤ ≤ α f¨ur x ≥ 1. 2xα 1 + xα x Somit folgt aus Lemma 8.3 und Gl. (8.2), dass das Integral (8.3) f¨ur α > 1 konvergiert und f¨ur α ≤ 1 divergiert. 1
sin x x + 0
+ π
–
2π
3π
–
4π
+
ABB. 8.1. Graph von sin x/x
(8.5) Beispiel. Lassen Sie uns die Existenz des Integrals Z ∞ sin x (8.4) dx. x 0 untersuchen. Die Funktion f (x) = sin x/x ist bei x = 0 stetig, wenn man f (0) = 1 setzt, und bereitet uns somit keine Probleme an diesem R ∞Punkt. Die Absch¨atzung | sin x| ≤ 1 w¨are f¨ur uns ohne Nutzen, da das Integral 1 x−1 dx divergiert. Aber der Graph von f (x) (siehe Abb. 8.1) zeigt, dass das Integral als alternierende Folge der Form a0 − a1 + a2 − a3 + . . . geschrieben werden kann, mit Z π Z 2π Z 3π sin x sin x sin x a0 = dx, a1 = − dx, a2 = dx, . . . . x x x 0 π 2π Diese Folge konvergiert nach dem Leibniz-Kriterium (Satz 2.4). Die Bedingung ai+1 ≤ ai kann man mit Hilfe der Ersetzung x 7→ x − π verifizieren und ai → 0 folgt aus der einfachen Absch¨atzung 0 < ai ≤ 1/i.
280 III. Grundlagen der klassischen Analysis
(8.6) Satz (Maclaurin 1742). Es sei f (x) ≥ 0 eine nicht-steigende Funktion auf [1, ∞). Dann gilt: ∞ X
f (n)
konvergiert
Z
⇐⇒
n=1
∞
f (x) dx
konvergiert .
g
g
1
f g
1
g h
g h
0
1
2
h 3
h 4
h 5
6
ABB. 8.2. Majorante und Minorante f¨ur f (x)
Beweis. Es seien g(x) = f ([x]) und h(x) = f ([x] + 1) die Treppenfunktionen, die in Abb. 8.2 dargestellt sind (dabei steht [x] f¨ur die gr¨oßte ganze Zahl, die nicht gr¨oßer ist als x). Diese Funktionen sind auf endlichen Intervallen integrabel (Satz 5.11) und wir finden, weil f (x) monoton ist, dass h(x) ≤ f (x) ≤ g(x) f¨ur alle x gilt. Folglich ist Z N N N −1 X X f (n) ≤ f (x) dx ≤ f (n) n=2
1
n=1
und die Behauptung folgt aus Satz 1.13, da f (x) ≥ 0 ist.
⊓ ⊔
Da Integrale sich oftmals leichter berechnen lassen als Summen, ist dieser Satz a¨ ußerst n¨utzlich, will man die Konvergenz einer Reihe bestimmen. Beispielsweise liefert die Berechnung von Gl. (8.2) einen eleganten und neuen Beweis f¨ur Lemma 2.6. P Wenn wir untersuchen wollen, zwischen“ der divergenten Reihe 1/n P was ” und den konvergenten Reihen 1/nα (f¨ur α > 1) geschieht, werden wir auf das Studium der Reihen (8.5)
∞ X
1 n(ln n)β n=2
III.8 Uneigentliche Integrale 281
gelenkt (f¨ur große n und beliebige α > 1 und β > 0 ist n < n(ln n)β < nα nach Gl. (6.27)). Mit Hilfe der Transformation u = ln x finden wir Z ∞ Z ∞ dx du = β β x · (ln x) u 2 ln 2 und Satz 8.6 in Verbindung mit Gl. (8.2) beweist, dass die Reihe (8.5) f¨ur β > 1 konvergiert, f¨ur β ≤ 1 jedoch divergiert. Integrale von −∞ nach +∞. Es w¨are un¨uberlegt, die Definition Z ∞ Z r (8.6) f (x) dx = lim f (x) dx r→∞
−∞
−r
zu treffen (selbst wenn der Grenzwert existiert). Diese Festlegung w¨urde Unsinn hervorbringen, beispielsweise, wenn man die Transformationsformel (II.4.14) mit z = x + 1 (dz = dx) anwenden will. Nach obiger Definition w¨are beispielsweise Z +∞ Z +∞ z dz = 0, aber (x + 1) dx = ∞. −∞
−∞
(8.7) Definition. Es sei f : R → R auf jedem beschr¨ankten Intervall [a, b] integrierbar. Dann sagen wir, dass Z ∞ Z 0 Z ∞ f (x) dx := f (x) dx + f (x) dx −∞
0
−∞
existiert, wenn die beiden uneigentlichen Integrale der rechten Seite existieren. Die zwei Integrale Z ∞
−∞
dx 1 + x2
Z
und
∞
2
e−x dx
−∞
konvergieren im Sinne der Definition 8.7. Das erste strebt gegen π (eine Stammfunktion ist arctan x). Die Konvergenz des zweiten Integrals sieht man anhand 2 von Lemma 8.3 ein, wenn man e−x ≤ e−x f¨ur x ≥ 1 benutzt.
Unbeschr¨ankte Funktionen auf endlichen Intervallen (8.8) Definition (Gauß 1812, §36). Falls f : (a, b] → R auf jedem Intervall der Form [a + ε, b] integrierbar ist, so schreiben wir Z
b
f (x) dx := lim
a
falls der Grenzwert existiert.
ε→0+
Z
b
a+ε
f (x) dx,
282 III. Grundlagen der klassischen Analysis
Diese Definition umfasst solche F¨alle, in denen |f (x)| → ∞ strebt f¨ur x → a. Eine a¨ hnliche Definition ist m¨oglich, wenn |f (x)| → ∞ strebt f¨ur x → b. Um die Integrabilit¨at einer solchen Funktion zu pr¨ufen, kann Lemma 8.3 problemlos angepasst werden. (8.9) Beispiele. F¨ur die Funktion x−α gilt auf dem Intervall (0, 1]: (8.7) 1 Z 1 Z 1 divergiert falls α > 1 dx dx x1−α = lim = lim = (1 − α)−1 α α ε→0+ ε→0+ x x 1 − α falls α < 1. 0 ε ε
Der Fall α = 1 f¨uhrt ebenfalls auf ein divergentes Integral. Damit ist die Hyperbel y = 1/x (also α = 1) der Grenzfall, mit unendlicher Fl¨ache sowohl links (f¨ur 0 < x ≤ 1) als auch rechts (f¨ur x ≥ 1). Ist α auch nur geringf¨ugig gr¨oßer, wird die linke Fl¨ache endlich, ist α dagegen kleiner als 1, so wird die rechte Fl¨ache endlich. Das Integral Z 1 Z 1 sin x sin x 1 dx = · α−1 dx α x x x 0 0 konvergiert dann und nur dann, wenn α − 1 < 1, also α < 2, ist. Dies liegt darin begr¨undet, dass f (x) = sin x/x bei Null stetig ist mit f (0) = 1.
Die Eulersche Gammafunktion Sein ganzes Leben lang hat sich Euler daf¨ur interessiert, die Fakult¨at 0! = 1, 1! = 1, 2! = 2, 3! = 6, 4! = 24, . . . f¨ur nicht-ganze Zahlen zu interpolieren“. ” Er schrieb hierf¨ur 1 · 2 · 3 · 4 · . . . · x ( De Differentiatione Functionum Inexplica” bilium“, siehe 1755, Caput XVI in Inst. Calc. Diff., Opera, Band X). Schließlich fand er 1781 die Definition, die wir noch heute verwenden (und zwar vollst¨andig explicabilium“): Man wende partielle Integration auf das folgende Integral an ” (mit u(x) = xn , v ′ (x) = e−x ): Z ∞ Z ∞ ∞ n −x n −x (8.8) x e dx = −x e + n xn−1 e−x dx. 0
0
0
Der Term xn e−x verschwindet f¨ur x = 0 (n > 0) als auch f¨ur x → ∞, also folgt mit Induktion nach n: Z ∞ (8.9) xn e−x dx = n! . 0
Nun ist es f¨ur uns kein Problem mehr, n durch eine nicht-ganze, reelle Zahl zu ersetzen: (8.10) Definition. F¨ur α > 0 definieren wir Z ∞ (8.10) Γ (α) := xα−1 e−x dx. 0
III.8 Uneigentliche Integrale 283 6
Γ(x)
3!
5 4 3 2
2!
1 −4
−3
−2
−1
0
0
0!
1!
1
2
3
4
−1 −2 −3 −4
ABB. 8.3. Gammafunktion
Wir m¨ussen zeigen, dass das Integral in Gl. (8.10) konvergiert. Es gibt hier zwei Schwierigkeiten: Die integrierte Funktion ist unbeschr¨ankt f¨ur x → 0 (falls α < 1) und das Integrationsintervall ist unendlich groß. Daher spalten wir das Integral auf in die Summe Z 1 Z ∞ (8.11) xα−1 e−x dx + xα−1 e−x dx. 0
1
Aus der Absch¨atzung xα−1 e−x ≤ xα−1 , aus Lemma 8.3 und aus Gl. (8.7) folgt, dass das erste Integral in (8.11) f¨ur α > 0 konvergiert. F¨ur das zweite Integral in (8.11) benutzen wir die Absch¨atzung xα−1 e−x = xα−1 e−x/2 · e−x/2 ≤ M e−x/2 (vgl. die Beispiele nach Satz 6.17) und abermals Satz 8.3. Gleichung (8.9) und die Berechnung in Gl. (8.8) zeigen uns (8.12)
Γ (n + 1) = n!,
Γ (α + 1) = αΓ (α)
f¨ur α > 0.
Mit Hilfe der zweiten Identit¨at in (8.12) k¨onnen wir die Definition von Γ (α) auf negative α (allerdings α 6= −1, −2, −3, . . . ) ausdehnen, indem wir (8.13)
Γ (α − 1) =
Γ (α) α−1
fordern (siehe Abb. 8.3). Wir werden in Abschnitt IV.5 sehen, dass Γ (1/2) = ist.
√
π
284 III. Grundlagen der klassischen Analysis
¨ Ubungen 8.1 Zeigen Sie, dass die Fresnelschen Integrale (siehe Abb. II.6.2) Z ∞ Z ∞ 2 sin x dx , cos x2 dx 0
0
konvergieren (Sie k¨onnen auch einen Koordinatenwechsel nutzen, um ein Integral in der Art von (8.4) zu finden; vergleichen Sie mit Abb. 8.1). 8.2 Zeigen Sie, dass f¨ur die Folge n X √ 1 √ an = 2 n − k k=1
der Grenzwert limn→∞ an Rexistiert √ und 1 ≤ √ limn→∞ an ≤ 2 erf¨ullt (es kann hilfreich sein, sich an (1/ x) dx = 2 x zu erinnern).
8.3 Berechnen Sie das Gauß-Integral mit Hilfe eines geeigneten Koordinatenwechsels: Z ∞ 2 1 1 e−x dx = Γ . 2 2 0
III.9 Zwei S¨atze u¨ ber stetige Funktionen 285
III.9 Zwei S¨atze u¨ ber stetige Funktionen Dieser Abschnitt widmet sich zwei Resultaten von Weierstraß. Das erste beweist die Existenz stetiger Funktionen, die nirgends differenzierbar sind. Das zweite zeigt, dass eine stetige Funktion f : [a, b] → R beliebig genau durch Polynome approximiert werden kann.
Stetige, aber nirgends differenzierbare Funktionen Bis auf die neueste Zeit hat man allgemein angenommen, dass eine . . . continuirliche Function . . . auch stets eine erste Ableitung habe, deren Werth nur an einzelnen Stellen unbestimmt oder unendlich gross werden k¨onne. Selbst in den Schriften von Gauss, Cauchy, Dirichlet findet sich meines ¨ Wissens keine Ausserung, aus der unzweifelhaft hervor ginge, dass diese Mathematiker, welche in ihrer Wissenschaft die strengste Kritik u¨ berall zu u¨ ben gewohnt waren, anderer Ansicht gewesen seien. (Weierstraß 1872) Vor hundert Jahren w¨are eine solche Funktion als Beleidigung des gesunden Menschenverstands aufgefasst worden. (Poincar´e 1899, L’oeuvre math. de Weierstrass, Acta Math., Band 22, S. 5)
n=3
n=1
0,05
n=2
n=4
3,1
π
3,2
−0,05
ABB. 9.1. Riemanns Funktion (9.1) nahe x = π
¨ Riemanns und Weierstraß’ glaubte man gemeinhin, dass jede stetige Vor der Ara Funktion auch u¨ berall differenzierbar sein m¨usse, vielleicht mit Ausnahme einiger vereinzelter Punkte (siehe Zitate). 1806 ver¨offentlichte A.-M. Amp`ere (ein Ihnen sicherlich bekannter Name) gar einen Beweis“ dieser Annahme (J. Ecole Polyt., ” Band 6, S. 148). Der erste Schock war Riemanns Beispiel (5.24), welches, nach Integration, eine Funktion hervorbringt, die an einer u¨ berall dichten Menge an Punkten nicht differenzierbar ist. Dies ebnete der Suche nach Funktionen den Weg, die nirgends differenzierbar sind. Etwa um 1861 (siehe Weierstraß 1872) dachte Riemann, dass die Funktion (siehe Gl. (3.7)) (9.1)
f (x) =
∞ X sin(n2 x) 1 1 = sin x + sin(4x) + sin(9x) + . . . , 2 n 4 9 n=1
286 III. Grundlagen der klassischen Analysis
die aufgrund der gleichm¨aßigen Konvergenz der Reihe stetig ist (siehe S¨atze 4.3 und 4.2), nirgends differenzierbar ist. Weierstraß erkl¨arte sich daraufhin außerstande, diese Behauptung zu beweisen und tats¨achlich fand Gerver (1970), dass (9.1) an ausgew¨ahlten Punkten tats¨achlich differenzierbar ist, beispielsweise bei x = π (siehe Abb. 9.1). (9.1) Satz (Weierstraß 1872). Es gibt stetige Funktionen, die nirgends differenzierbar sind. Beweis. Weierstraß zeigte nach zwei Seiten Rechnungen, dass die Reihe (9.2)
f (x) =
∞ X
bn cos(an x),
n=1
welche f¨ur b < 1 gleichm¨aßig konvergiert, f¨ur ab > 1 + 3π/2 eine nirgends differenzierbare Funktion beschreibt. Viele Forscher fanden sp¨ater, fasziniert von diesem Ph¨anomen, weitere Beispiele; zu nennen sind hier Dini (1878, Kap. 10), von Koch (1906, siehe Abb. IV.5.6 unten), Hilbert (1891, siehe Abb. IV.2.3 unten) und Takagi (1903). Takagis Funktion wurde ein zweites Mal von Tall (1982) gefunden und Blancmange-Funktion“ getauft. Diese Funktion ist wie folgt definiert: ” Wir betrachten die Funktion x 0 ≤ x ≤ 1/2 (9.3) K(x) = 1−x 1/2 ≤ x ≤ 1 und setzen sie periodisch fort (d.h. K(x + 1) = K(x) f¨ur alle x), so dass wir eine stetige Zick-Zack-Funktion erhalten. Dann definieren wir (siehe Abb. 9.2) (9.4) f (x) =
∞ X 1 1 1 1 K(2n x) = K(x)+ K(2x)+ K(4x)+ K(8x)+. . . . n 2 2 4 8 n=0
Da |K(x)| ≤ 1/2 ist und 1 + 1/2 + 1/4 + 1/8 + . . . konvergiert, sehen wir, dass Reihe (9.4) gleichm¨aßig konvergiert (Satz 4.3) und eine stetige Funktion f (x) darstellt (Satz 4.2). Um nun zu zeigen, dass diese Funktion nirgends differerenzierbar ist, benutzen wir ein elegantes Argument von de Rham (1957). Es sei x0 ein beliebiger Punkt. Der Ansatz besteht nun in der Wahl αn = i/2n und βn = (i + 1)/2n , wobei i diejenige ganze Zahl ist, die αn ≤ x0 < βn erf¨ullt, und dann den folgenden Quotienten zu betrachten: (9.5)
rn =
f (βn ) − f (αn ) . βn − αn
Da die SummeP (9.4) an den Punkten αn und βn endlich ist, ist rn die Steigung der n−1 Partialsumme j=0 21j K(2j x) auf dem Intervall (αn , βn ) (siehe Abb. 9.2, in die die Steigungen f¨ur x0 = 1/3 eingetragen sind, und zwischen 0 und 1 wechseln). Mit wachsendem n finden wir stets rn+1 = rn ± 1, so dass die Folge {rn } nicht konvergieren kann.
III.9 Zwei S¨atze u¨ ber stetige Funktionen 287
2/3
0
1
1/3 ABB. 9.2. Die Blancmange-Funktion“ ”
Andererseits ist {rn } der Mittelwert der Steigungen rn = λn
f (βn ) − f (x0 ) f (x0 ) − f (αn ) + (1 − λn ) βn − x0 x0 − αn
mit λn = (βn − x0 )/(βn − αn ) ∈ (0, 1] (f¨ur αn = x0 ist λn = 1 und der zweite Term entf¨allt). Differenzierbarkeit bei x0 w¨urde daher erfordern, dass |rn − f ′ (x0 )| < λn ε + (1 − λn )ε = ε f¨ur gen¨ugend große n ist, was einen Widerspruch darstellt.
⊓ ⊔
Der Approximationssatz von Weierstraß Dies ist der von Weierstraß begr¨undete fundamentale Satz. (Borel 1905, S. 50)
¨ Wir haben gerade die erste von Weierstraß’ Uberraschungen verdaut, welche die Existenz stetiger Funktionen ohne Ableitung ist; nun kommt die zweite: Wir k¨onnen sie so oft differenzierbar machen, wie wir wollen, sogar zu Polynomen, solange wir nur einen beliebig kleinen Fehler ε erlauben. (9.2) Satz (Weierstraß 1885). Es sei f : [a, b] → R eine stetige Funktion. Zu jedem ε > 0 gibt es ein Polynom p(x), so dass gilt: (9.6)
|p(x) − f (x)| < ε
f¨ur alle
x ∈ [a, b].
288 III. Grundlagen der klassischen Analysis
Mit anderen Worten: f (x) − ε ≤ p(x) ≤ f (x) + ε, d.h. das Polynom p(x) ist auf dem gesamten Intervall [a, b] nach unten und oben beschr¨ankt durch f (x) − ε und f (x) + ε. Die Liste der Mathematiker, die Beweise f¨ur diesen Satz gefunden haben, von Borel (1905, S. 50) und Meinardus (1964, S. 7) zusammengestellt, demonstriert, wie fasziniert die Mathematiker von diesem Resultat sind: Weierstraß (1885), Picard (1890, S. 259), Lerch 1892, Volterra 1897, Lebesgue 1898, Mittag-Leffler 1900, Landau (1908), D. Jackson 1911, S. Bernstein 1912, P. Montel 1918, Marchand 1927, W. Gontscharov 1934. Dieser Satz, der mit der Approximation durch trigonometrische Polynome verwandt ist, wurde auch auf verschiedene Weisen verallgemeinert (siehe Meinardus 1964, §2). Der folgende Beweis gr¨undet auf der Idee der, wie wir heute sagen w¨urden, Dirac-Folgen“. ” ¨ Dirac-Folgen. In Ubereinstimmung mit Landau (1908, siehe Abb. 9.3a) setzen wir µn (1 − x2 )n falls −1 ≤ x ≤ 1 (9.7) ϕn (x) = 0 sonst, wobei der Faktor (9.8)
µn =
so gew¨ahlt ist, dass
1 · 3 · 5 · 7 · . . . · (2n + 1) 2 · 2 · 4 · 6 · . . . · 2n Z
(9.9)
+∞
ϕn (x) dx = 1
−∞
¨ gilt (siehe Ubung II.4.3). Diese Funktionen sammeln f¨ur zunehmendes n mehr und mehr ihrer Masse“ im Ursprung an: ” (9.3) Lemma. Es sei ϕn (x) gegeben durch (9.7). Zu jedem ε > 0 und jedem δ > 0 mit 0 < δ < 1 gibt es eine ganze Zahl N , so dass f¨ur alle n ≥ N (siehe Abb. 9.3b) gilt: Z δ (9.10) 1−ε< ϕn (x) dx ≤ 1, (9.11)
Z
−δ
−1
−δ
ϕn (x) dx +
Z
1
ϕn (x) dx < ε.
δ
Beweis. Wir beginnen mit dem Beweis von (9.11). Da 1 − x2 ≥ 1 − x f¨ur 0 ≤ R1 R1 x ≤ 1 ist, haben wir 0 (1 − x2 )n dx ≥ 0 (1 − x)n dx = 1/(n + 1), und daher µn ≤ 12 (n + 1). Folglich gilt f¨ur δ ≤ |x| ≤ 1: 0 ≤ ϕn (x) ≤ ϕn (δ) ≤ 12 (n + 1) · (1 − δ 2 )n .
III.9 Zwei S¨atze u¨ ber stetige Funktionen 289 n = 20
n = 30
ϕn (x)
ϕn (x) 2
2
>1−ε 1
1
n=1
< ε/2
−1
0
1
ABB. 9.3a. Dirac-Folge (9.7)
< ε/2 0
−1
1
δ
ABB. 9.3b. Massen-Konzentration
Nun sei q := 1 − δ 2 < 1. Dann f¨allt (1 − δ 2 )n = q n exponentiell ab, so dass (n + 1) · (1 − δ 2 )n → 0 strebt (siehe (6.26)). Hieraus folgt, dass f¨ur n gen¨ugend groß 0 ≤ ϕn (x) ≤ ε/2 f¨ur δ ≤ |x| ≤ 1 sein muss, und Gl. (9.11) ist dann eine Folgerung aus Satz 5.14. Die Absch¨atzung (9.10) erh¨alt man dann, indem man (9.11) von (9.9) subtrahiert. ⊓ ⊔ Ein Beweis des Approximationssatzes von Weierstraß. Wir d¨urfen annehmen, dass 0 < a < b < 1 ist (der allgemeine Fall reduziert sich auf diesen durch eine Transformation der Art x 7→ α+βx mit geeignet gew¨ahlten Konstanten α und β ). Sodann dehnen wir f (x) zu einer stetigen Funktion auf [0, 1] aus, beispielsweise indem wir f (x) = f (a) f¨ur 0 ≤ x < a und f (x) = f (b) f¨ur b < x ≤ 1 setzen. Dann definieren wir f¨ur ξ ∈ [a, b] (9.12)
pn (ξ) :=
Z
1 0
f (x)ϕn (x − ξ) dx = µn
Z
1 0
f (x) 1 − (x − ξ)2
n
dx.
Wenn wir den Faktor (1 − (x − ξ)2 )n mit dem binomischen Lehrsatz ausmultiplizieren, erhalten wir ein Polynom in ξ vom Grad 2n, dessen Koeffizienten Funktionen von x sind. Setzen wir dies in (9.12) ein, so finden wir, dass pn (ξ) ein Polynom vom Grad 2n ist. Motivation. Zu einem festen ξ ∈ [a, b] wird sich die Spitze der verschobenen Funktion ϕn (x − ξ) am Punkt ξ befinden (Abb. 9.4). Desweiteren vervielfacht das
290 III. Grundlagen der klassischen Analysis
ϕn(x−ξ) f 1
ε
δ 0 0
ξ−δ
a
ξ
ξ+δ
b
1
ABB. 9.4. Landaus Beweis
Produkt f (x) · ϕn (x − ξ) die Spitze (mehr oder weniger) um den Faktor f (ξ). Daher erwarten wir aufgrund von (9.9), dass das Integral (9.12) nahe bei f (ξ) liegen wird. Fehlerabsch¨atzung. F¨ur die Differenz zwischen pn (ξ) und f (ξ) wollen wir die Dreiecksungleichung wie folgt anwenden: Z ξ+δ Z 1 |pn (ξ) − f (ξ)| ≤ f (x)ϕn (x − ξ) dx − f (x)ϕn (x − ξ) dx (9.13)
Z +
0 ξ+δ
ξ−δ
Z + f (ξ)
ξ−δ Z ξ+δ
f (x)ϕn (x − ξ) dx − ξ+δ
ξ−δ
ξ−δ
f (ξ)ϕn (x − ξ) dx
ϕn (x − ξ) dx − f (ξ) .
Wir halten ein ε > 0 fest. Da f auf [0, 1] stetig ist, ist f dort auch gleichm¨aßig stetig (Satz 4.5). Daher existiert ein δ > 0, das unabh¨angig von ξ ist und (9.14)
|f (x) − f (ξ)| < ε
f¨ur
|x − ξ| < δ
erf¨ullt. Dieses δ k¨onnen wir, falls n¨otig, weiter verringern, bis es auch δ ≤ a und δ ≤ 1 − b erf¨ullt. Somit gilt stets [ξ − δ, ξ + δ] ⊂ [0, 1]. Desweiteren ist die Funktion f (x) beschr¨ankt, d.h. sie gen¨ugt |f (x)| ≤ M f¨ur x ∈ [0, 1] (Satz 3.6).
III.9 Zwei S¨atze u¨ ber stetige Funktionen 291
Die drei Terme auf der rechten Seite von Gl. (9.13) k¨onnen wir nun wie folgt absch¨atzen: F¨ur den ersten benutzen wir die Beschr¨anktheit von f (x) und Gl. (9.11) und finden, dass er durch M ε beschr¨ankt wird; auf a¨ hnliche Weise benutzen wir Gl. (9.10), um zu zeigen, dass der dritte Term ebenfalls durch M ε beschr¨ankt wird; schließlich folgt aus (9.14) und (9.9), dass der zweite Term durch ε beschr¨ankt wird. Zusammenfassend finden wir also |pn (ξ) − f (ξ)| ≤ (2M + 1)ε f¨ur hinreichend große n. Da diese Absch¨atzung auf ganz [a, b] gilt, ist der Satz bewiesen. ⊓ ⊔ 1,0
0,8
0,6
n = 100
0,4 n = 10 n = 1000 0,2
0,0
0,25
0,50
0,75
1,00
ABB. 9.5. Konvergenz der Polynome (9.12) gegen f (x) aus (9.15)
(9.4) Beispiel. Wir betrachten die Funktion f : [1/8, 7/8] → R, die definiert ist als −3,2x + 0,8 falls 1/8 ≤ x ≤ 1/4 , p 1/64 − (x − 3/8)2 falls 1/4 ≤ x ≤ 1/2 , p (9.15) f (x) = 2 7 · 1/64 − (x − 5/8) falls 1/2 ≤ x ≤ 3/4 , 7,6x − 5,7 falls 3/4 ≤ x ≤ 7/8 .
Wie im obigen Beweis erweitern wir sie zu einer stetigen Funktion auf [0, 1]. Die Polynome pn (ξ) aus Gl. (9.12) sind in Abb. 9.5 dargestellt f¨ur n = 10, 100, and 1000. Wir k¨onnen feststellen, dass sie auf [1/8, 7/8] gleichm¨aßig konvergieren, jedoch nicht auf [0, 1]. Dies liegt daran, dass bei ξ = 0 und ξ = 1 jeweils die
292 III. Grundlagen der klassischen Analysis
H¨alfte der Spitze von ϕn (x) in (9.12) abgeschnitten wird. Die Annahme 0 < a < b < 1 im obigen Beweis kann daher nicht umgangen werden. Die Graphen in Abb. 9.5 wurden genau genommen numerisch durch Auswertung des Integrals (9.12) f¨ur 400 Werte von ξ mit einer Methode a¨ hnlich der in Abschnitt II.6 beschriebenen berechnet. Es w¨are Zeitverschwendung, die 2000 Koeffizienten des Polynoms zu berechnen.
¨ Ubungen 9.1 Zeigen Sie mit Hilfe des Wallisschen Produkts, dass sich die Faktoren µn p in (9.8) f¨ur n → ∞ asymptotisch wie n/π verhalten, und dass die Absch¨atzung im Beweis von Lemma 9.3 ein wenig grob ist. 9.2 Zeigen Sie, dass r n −nx2 (9.16) ϕn (x) = e , n = 1, 2, 3, . . . π eine Dirac-Folge ist, d.h. die Gleichungen ud (9.11) erf¨ullt (wir R ∞ (9.9),2 (9.10) √ werden in Abschnitt IV.5 sehen, dass −∞ e−x dx = π ist). Dies ist die Folge, auf der Weierstraß seinen urspr¨unglichen Beweis aufbaute.
9.3 Finden Sie Konstanten cn derart, dass ( πx n cn cos (9.17) ϕn (x) = 2 0
−1 ≤ x ≤ 1, sonst
¨ eine Dirac-Folge ist (siehe Ubung 5.6). Diese Folge f¨uhrt mit Hilfe trigonometrischer Formeln wie (I.4.4′) zu Approximationen durch trigonometrische Polynome auf [−π, π]. 9.4 Es sei ϕn (x) =
n
falls |x| ≤ 1/(2n),
0 sonst. Zeigen Sie, dass f¨ur jede stetige Funktion f (x) gilt: Z b lim ϕn (x − ξ)f (x) dx = f (ξ) f¨ur alle a < ξ < b. n→∞
a
9.5 Multiplizieren Sie (1 − (x − ξ)2 )3 in Potenzen von ξ aus und zeigen Sie, dass √ Z 1 3 4 + cos(x4 + x) − sin(3x) 2 1 − (x − ξ) dx 72 ln(x + 1) + xx 0 ein Polynom in ξ ist.
IV Differentialrechnung in mehreren Variablen
Zeichnung von K. Wanner Der Einfluss der Physik auf die Motivation, mathematische Objekte wie die Quaternionen, Grassmannsche Hyperzahlen und Vektoren zu erschaffen, ist nicht zu untersch¨atzen. Diese Objekte wurden Teil der Mathematik. (M. Kline 1972, S. 791)
Funktionen mehrerer Variablen haben ihren Ursprung in der Geometrie (z.B. in Form von Kurven, die von Parametern abh¨angen (Leibniz 1694a)) und in der Physik. Ein im ganzen 17ten Jahrhundert ber¨uhmtes Problem bestand in der Berechnung der Bewegung einer schwingenden Saite (d’Alembert 1748, Abb. 0.1). Der Ort einer Saite u(x, t) ist tats¨achlich sowohl eine Funktion von x, der Ortskoordinate, als auch von t, der Zeit. Ein wichtiger Durchbruch f¨ur das systematische Studium solcher Funktionen gelang in der Mitte des 19ten Jahrhunderts, und besteht in der Idee, Paare (und sp¨ater n-Tupel) (x1 , x2 ) = : x
(x1 , x2 , . . . , xn ) = : x
E. Hairer, G. Wanner, Analysis in historischer Entwicklung, Springer-Lehrbuch, DOI 10.1007/978-3-642-13767-9_4, © Springer-Verlag Berlin Heidelberg 2011
294 IV. Differentialrechnung in mehreren Variablen
durch einen einzigen Buchstaben zu notieren und sie gemeinsam als neues mathematisches Objekt zu betrachten. Sie wurden von Graßmann (1844, 1862) exten” sive Gr¨ossen“ genannt, von Peano (1888) Komplexe“ und von Hamilton (1853) ” Vektoren“. ” 5
t
0 x 1 ABB. 0.1. Bewegung einer schwingenden Saite (Cembalo)
Der erste Abschnitt IV.1 wird Normen im n-dimensionalen Raum einf¨uhren, die es uns erlauben, die Definitionen und S¨atze u¨ ber Konvergenz und Stetigkeit recht einfach zu u¨ bertragen (Abschnitt IV.2). Jedoch f¨uhren die Differentialrechnung (Abschnitte IV.3 und IV.4) ebenso wie die Integralrechnung (Abschnitt IV.5) in mehreren Variablen zu neuen Problemen (Vertauschbarkeit partieller Ableitungen, von Integrationen untereinander und Vertauschbarkeit von Integrationen mit Ableitungen).
IV.1 Topologie des n-dimensionalen Raumes 295
IV.1 Topologie des n-dimensionalen Raumes Es mag auffallend erscheinen, dass diese so einfache Idee, welche im Grunde genommen in weiter nichts besteht, als dass eine Vielfachsumme verschiedener Gr¨ossen (als welche hiernach die extensive Gr¨osse erscheint) als selbstst¨andige Gr¨osse behandelt wird, in der That zu einer neuen Wissenschaft sich entfalten soll; . . . (Grassmann 1862, Ausdehnungslehre, S. 5) . . . es ist sehr n¨utzlich, komplexe“ Zahlen oder Zahlen mit verschiedenen Einheiten zu betrachten”. . . (Peano 1888a, Math. Ann., Band 32, S. 450)
Paare reeller Zahlen wollen wir als (x1 , x2 ) schreiben, n-Tupel entsprechend als (x1 , x2 , . . . , xn ), und wir nennen sie Vektoren. Die Menge aller Paare ist (1.1) R2 = R × R = (x1 , x2 ) ; x1 , x2 ∈ R und die Menge aller n-Tupel schreiben wir als (1.2) Rn = R × R × . . . × R = (x1 , x2 , . . . , xn ) ; xk ∈ R, k = 1, . . . , n .
Vektoren kann man (komponentenweise) addieren und mit einer festen reellen Zahl multiplizieren. Rn , zusammen mit diesen zwei Operationen, nennen wir einen n-dimensionalen reellen Vektorraum.
Abst¨ande und Normen Man kann sich den zweidimensionalen Raum R2 als Ebene vorstellen, die Komponenten x1 und x2 sind dann die kartesischen Koordinaten. Der Abstand zwischen zwei Punkten x = (x1 , x2 ) und y = (y1 , y2 ) ist nach dem Satz des Pythagoras (Abb. 1.1) p (1.3) d(x, y) = (y1 − x1 )2 + (y2 − x2 )2 .
Dieser Abstand h¨angt nur von p der Differenz y − x ab und wird daher als ky − xk2 bezeichnet, wobei kzk2 = z12 + z22 f¨ur z = (z1 , z2 ) gesetzt ist. Im dreidimensionalen Raum erh¨alt man den Abstand zwischen den Vektoren x = (x1 , x2 , x3 ) und y = (y1 , y2 , y3 ), indem man den Satz des Pythagoras zweimal anwendet (zun¨achst auf das Dreieck DEF, dann auf ABC, p siehe Abb. 1.2). Auf diese Weise erhalten wir d(x, y) = ky − xk2 , wobei kzk2 = z12 + z22 + z32 ist. F¨ur den n-dimensionalen Raum Rn definieren wir nun ganz analog q (1.4) kzk2 = z12 + z22 + . . . + zn2 , und nennen dies die euklidische Norm von z = (z1 , z2 , . . . , zn ). Der Abstand zwischen x ∈ Rn und y ∈ Rn ist dann definiert als d(x, y) = ky − xk2 .
296 IV. Differentialrechnung in mehreren Variablen F = (y1, y2, y3) y2
y3−x3
D = (x1, x2, x3)
y2−x2 x2
E
y1−x1
A
1 x1
y2−x2
y1
ABB. 1.1. Abstand im R2
B C
y1−x1
2
ABB. 1.2. Abstand im R3
(1.1) Satz. Die euklidische Norm (1.4) besitzt die folgenden Eigenschaften: (N1) kxk ≥ 0 und kxk = 0 ⇔ x = 0, (N2) kλxk = |λ| · kxk f¨ur λ ∈ R, (N3) kx + yk ≤ kxk + kyk (Dreiecksungleichung).
Beweis. Eigenschaft (N1) ist trivial. Wegen λx = (λx1 , . . . , λxn ) ist kλxk22 = (λx1 )2 + . . . + (λxn )2 = |λ|2 · kxk22 , womit auch (N2) bewiesen ist. Um (N3) zu beweisen, rechnen wir wie folgt: kx + yk22 = ≤
n X
(xk + yk )2 =
k=1
kxk22
n X
x2k + 2
k=1
+ 2kxk2 kyk2 +
n X
xk yk +
k=1
kyk22
n X
yk2
k=1
= (kxk2 + kyk2 )2 .
⊓ ⊔
Bemerkung. Im obigen Beweis haben wir die Absch¨atzung v v u n X uX uX n u n 2 t t (1.5) x y ≤ x · yk2 , k k k k=1
k=1
k=1
eingesetzt, Pnwelche als Cauchy-Schwarz-Ungleichung bezeichnet wird. Man erh¨alt sie aus k=1 (xk − γyk )2 ≥ 0 auf genau die gleiche Weise wie (III.5.19). Mit der Notation n X (1.6) hx, yi := xk y k k=1
f¨ur das Skalarprodukt zweier Vektoren x und y kann Ungleichung (1.5) k¨urzer geschrieben werden in der Form (1.5′ )
|hx, yi| ≤ kxk2 · kyk2 .
Im weiteren werden wir nur selten die explizite Formel (1.4) ben¨otigen. Zumeist reichen uns die allgemeineren Eigenschaften (N1) bis (N3).
IV.1 Topologie des n-dimensionalen Raumes 297
(1.2) Definition. Eine Abbildung k · k : Rn → R, die (N1), (N2) und (N3) erf¨ullt, heißt Norm auf Rn . Der Raum Rn zusammen mit einer Norm nennen wir normierten Vektorraum. Beispiele (Jordan 1882, Cours d’Analyse, Band I, S. 18, Peano 1890b, Fußnote auf S. 186, Fr´echet 1906). Neben der euklidischen Norm (1.4) gibt es auch (1.7) (1.8) (1.9)
kxk1 =
n X
k=1
ℓ1 -Norm,
|xk |
kxk∞ = max |xk | k=1,...,n
kxkp =
X n
k=1
|xk |p
Maximumsnorm,
1/p
ℓp -Norm, p ≥ 1.
Die Best¨atigung der Eigenschaften (N1) und (N2) f¨ur all diese Normen ist, ebenso wie der Beweis von (N3) f¨ur (1.7) und (1.8), recht einfach. Wir werden sp¨ater sehen ( H¨older-Ungleichung“, siehe (4.42)), dass die Dreiecksungleichung (N3) ” auch f¨ur (1.9) f¨ur beliebige p ≥ 1 erf¨ullt ist. (1.3) Satz. F¨ur ein beliebiges x ∈ Rn gilt (1.10)
kxk∞ ≤ kxk2 ≤ kxk1 ≤ n · kxk∞ .
Beweis. Wir beweisen nur die zweite Ungleichung (die u¨ brigen Ungleichungen sind sehr einfach, wir u¨ berspringen sie daher). Quadriert man Gl. (1.7) zu P kxk21 und multipliziert die Formel aus, so erhalten wir die Summe der Quadrate x2k (was kxk22 ist), zuz¨uglich den gemischten Produkten |xk | · |xl |, welche alle nichtnegativ sind. Daraus folgt kxk21 ≥ kxk22 . ⊓ ⊔ Jede dieser Normen l¨asst sich durch jede der anderen von oben wie von unten absch¨atzen (durch Wahl eines gen¨ugend großen positiven Faktors). Dies zeigt, dass die Normen kxk1 , kxk2 und kxk∞ alle im folgenden Sinn a¨ quivalent sind. (1.4) Definition. Zwei Normen k · kp und k · kq heißen a¨ quivalent, wenn es positive Konstanten C1 und C2 gibt, so dass (1.11)
C1 · kxkp ≤ kxkq ≤ C2 · kxkp
f¨ur alle
x ∈ Rn
gilt.
Konvergenz von Vektorfolgen Unser n¨achstes Ziel besteht darin, die Definitionen und Resultate aus Abschnitt III.1 auf unendliche Folgen von Vektoren zu verallgemeinern. Wir betrachten also {xi }i≥1 , wobei jedes xi seinerseits ein Vektor ist, d.h. (1.12)
xi = (x1i , x2i , . . . , xni ),
i = 1, 2, 3, . . . .
298 IV. Differentialrechnung in mehreren Variablen
(1.5) Definition. Wir sagen, dass die durch (1.12) gegebene Folge {xi }i≥1 gegen den Vektor a = (a1 , a2 , . . . , an ) ∈ Rn konvergiert, wenn ∀ε > 0 ∃N ≥ 1 ∀i ≥ N
kxi − ak < ε
erf¨ullt ist. Wie im eindimensionalen Fall schreiben wir dann lim xi = a. i→∞
x21 x22
x1
x2 x3
x23 a2
x13
x12
a1
x11
ABB. 1.3. Konvergente Folge in R2
Diese Definition gleicht (III.1.4) in jeder Hinsicht, außer dass die Betragsstriche durch die Norm ersetzt wurden. (1.6) Bemerkung. Um genau zu sein, m¨usste man die in Definition 1.5 benutzte Norm spezifizieren, z.B. auf die euklidische Norm zur¨uckgreifen. Falls jedoch k · kp zu k · kq a¨ quivalent ist, gilt (1.13)
Konvergenz in k · kp
⇐⇒
Konvergenz in k · kq .
Tats¨achlich folgt aus kxi − akp < ε und (1.11), dass kxi − akq < C2 ε ist. Da ε > 0 in Definition 1.5 beliebig ist, k¨onnen wir ε durch ε′ = C2 ε ersetzen und finden, dass die Konvergenz in k · kp die Konvergenz in k · kq nach sich zieht. Satz 1.3 sagt aus, dass k · k1 , k · k2 und k · k∞ zueinander a¨ quivalent sind und sp¨ater werden wir in Satz 2.4 sehen, dass alle Normen auf Rn a¨ quivalent sind. Folglich k¨onnen wir in Definition 1.5 jede beliebige Norm w¨ahlen; die Konvergenz der Folge {xi } bleibt von der konkreten Wahl der Norm unabh¨angig. (1.7) Satz. F¨ur eine Folge von Vektoren (1.12) finden wir lim xi = a
i→∞
⇐⇒
lim xki = ak
i→∞
f¨ur
k = 1, 2, . . . , n,
d.h. Konvergenz in Rn ist gleichbedeutend mit komponentenweiser Konvergenz.
IV.1 Topologie des n-dimensionalen Raumes 299
Beweis. F¨ur die Maximumsnorm (1.8) gilt (1.14) kxi − ak∞ < ε
⇐⇒
|xki − ak | < ε
f¨ur
k = 1, 2, . . . , n.
W¨ahlen wir k · k∞ als Norm in Definition 1.5, folgt die Behauptung.
⊓ ⊔
Mit den obigen Vorbereitungen f¨allt es uns nun leicht, die verbleibenden Definitionen und Resultate aus Abschnitt III.1 auf den h¨oherdimensionalen Fall auszudehnen. Beispielsweise heißt eine Folge {xi }i≥1 von Vektoren beschr¨ankt, falls es eine Zahl B ≥ 0 gibt, so dass kxi k ≤ B f¨ur alle i ≥ 1 ist. Wiederum ist Beschr¨anktheit von der konkreten Wahl einer Norm unabh¨angig. Und wie in Satz III.1.3 k¨onnen wir beweisen, dass konvergente Folgen von Vektoren beschr¨ankt sind. Eine Folge {xi }i≥1 heißt Cauchy-Folge, falls gilt: (1.15)
∀ε > 0 ∃N ≥ 1 ∀i ≥ N ∀ℓ ≥ 1
kxi − xi+ℓ k < ε.
Durch Einsatz der Maximumsnorm in (1.15) k¨onnen wir diesen Fall wieder auf den komponentenweisen Fall zur¨uckf¨uhren: {xi }i≥1 ist eine Cauchy-Folge genau dann, wenn die reellen Folgen {xki }i≥1 f¨ur jedes k = 1, . . . , n Cauchy-Folgen sind. Damit finden wir auch sofort die folgende Verallgemeinerung von Satz III.1.8. (1.8) Satz. Eine Folge von Vektoren in Rn ist genau dann konvergent, wenn sie eine Cauchy-Folge ist. ⊓ ⊔ Die Verallgemeinerung des Satzes von Bolzano-Weierstraß ist allerdings etwas komplizierter. (1.9) Satz (Bolzano-Weierstraß). Jede beschr¨ankte Folge von Vektoren in Rn besitzt eine konvergente Teilfolge. Beweis. Es sei {xi }i≥1 unsere beschr¨ankte Folge. Zun¨achst betrachten wir die Folge {x1i }i≥1 der ersten Komponenten. Sie ist ebenfalls eine beschr¨ankte Folge, so dass wir nach Satz III.1.17 eine konvergente Teilfolge extrahieren k¨onnen, beispielsweise (1.16)
x1,1 , x1,5 , x1,9 , x1,22 , x1,37 , x1,58 , x1,238 , x1,576 , . . . .
Sodann betrachten wir die zweiten Komponenten. Die wesentliche Idee besteht nun aber darin, anstelle der gesamten Folge nur noch die zweiten Komponenten derjenigen Folgenmitglieder zu betrachten, deren erste Komponenten bereits die in (1.16) erw¨ahlte Teilfolge bilden. Diese Folge ist beschr¨ankt, und wiederum k¨onnen wir Satz III.1.17 anwenden, um eine konvergente Teilfolge zu bestimmen, beispielsweise (1.17)
x2,1 , x2,9 , x2,58 , x2,576 , . . . .
300 IV. Differentialrechnung in mehreren Variablen
Nun konvergiert die Folge x1 , x9 , x58 , x576 , . . . in der ersten und zweiten Komponente. F¨ur n = 2 ist der Beweis damit vollst¨andig. Ansonsten betrachten wir nun die dritten Komponenten, die zu (1.17) korrespondieren, und so weiter. Nach der n-ten Wahl einer konvergenten Teilfolge werden noch immer unendlich viele Folgenglieder verbleiben und wir finden eine Folge, die in jeder Komponente konvergiert. ⊓ ⊔
Umgebungen, offene und abgeschlossene Mengen Unter einer Menge“ verstehen wir jede Zusammenfassung M von be” stimmten wohlunterschiedenen Objekten m unserer Anschauung oder unseres Denkens (welche die Elemente“ von M genannt werden) zu einem ” Ganzen. (G. Cantor 1895, Werke, S. 282) Aus dem Paradies, das Cantor uns geschaffen, soll uns niemand vertreiben k¨onnen. (Hilbert, Math. Ann., Band 95, S. 170)
Als Dedekind (um 1871) und Cantor (um 1875) erstmals Mengen von Punkten als ¨ der Mathematik an. neue mathematische Objekte einf¨uhrten, brach eine neue Ara n F¨ur Mengen A, B in R wollen wir die folgenden Symbole benutzen: (1.18) (1.19) (1.20) (1.21) (1.22)
A⊂B
falls alle Elemente von A auch zu B geh¨oren,
A ∩ B = {x ∈ Rn ; x ∈ A und x ∈ B}, A ∪ B = {x ∈ Rn ; x ∈ A oder x ∈ B}, A \ B = {x ∈ Rn ; x ∈ A aber x 6∈ B}, ∁A = {x ∈ Rn ; x ∈ 6 A}.
Die Rolle der offenen Intervalle wird im mehrdimensionalen Fall von den Mengen (1.23) Bε (a) = x ∈ Rn ; kx − ak < ε gespielt, welche wir Scheiben (oder Kugelumgebungen) vom Radius ε um den Mittelpunkt a nennen wollen (siehe Abb. 1.4).
p = 1,0
p = 1,5
p = 2,0
p = 3,0
p = 100,0
ABB. 1.4. Scheiben vom Radius ε = 1, 1/2, 1/4 f¨ur kxkp , p = 1, 32 , 2, 3, 100
(1.10) Definition (Hausdorff 1914, Kap. VII, §1; siehe auch S. 456). Es sei a ∈ Rn gegeben. Eine Menge V ⊂ Rn heißt Umgebung von a, falls es ein ε > 0 gibt, so dass Bε (a) ⊂ V ist.
IV.1 Topologie des n-dimensionalen Raumes 301
Die Scheiben Bε (a) h¨angen von der gew¨ahlten Norm ab; (k · k1 , k · k2 oder k · k∞ , . . .); die Definition der Umgebung“ jedoch ist von der Wahl der Norm un” abh¨angig, solange die verwendeten Normen a¨ quivalent sind. Jedes zu einer Norm geh¨orige Bε (a) wird stets in einem Bε′ (a) jeder anderen a¨ quivalenten Norm enthalten sein (Abb. 1.5). (1.11) Definition (Weierstraß, Hausdorff 1914, S. 215). Eine Menge U ⊂ Rn heißt offen (urspr¨unglich: ein Gebiet“), falls U eine Umgebung all seiner Punkte ist, ” d.h. U offen ⇐⇒ ∀ x ∈ U ∃ ε > 0 Bε (x) ⊂ U.
ABB. 1.5. Umgebungen
(1.12) Definition (G. Cantor 1884, S. 470; siehe Ges. Abhandlungen, S. 226). Eine Menge F ⊂ Rn ist abgeschlossen, falls der Grenzwert jeder konvergenten Folge {xi }i≥1 mit xi ∈ F ebenfalls in F liegt, d.h. F abgeschlossen
⇐⇒
aus a = lim xi i→∞
und xi ∈ F
folgt a ∈ F.
Beispiele in R. Das sogenannte offene Intervall“ (a, b) = {x ∈ R ; a < x < b} ” ist eine offene Menge. Tats¨achlich ist f¨ur jedes x ∈ (a, b) die Zahl ε = min(x − a, b − x) strikt positiv und es gilt Bε (x) ⊂ (a, b). Andererseits ist die Folge {a + 1/i} (f¨ur i ≥ 1) konvergent, ihre Elemente liegen in (a, b) f¨ur hinreichend großes i, aber ihr Grenzwert liegt nicht in (a, b). Daher ist die Menge (a, b) nicht abgeschlossen. Die Menge [a, b] = {x ∈ R ; a ≤ x ≤ b} ist abgeschlossen (siehe Satz III.1.6). Jedoch besitzt weder a noch b eine Umgebung, die komplett in [a, b] enthalten ist. Folglich ist [a, b] nicht offen. Das Intervall A = [a, b) ist weder offen noch abgeschlossen, da a keine Umgebung in [a, b) besitzt und sich andererseits der Grenzwert der konvergenten Folge {b − 1/i} nicht in [a, b) befindet.
302 IV. Differentialrechnung in mehreren Variablen
Schließlich ist die Menge R = (−∞, +∞) sowohl offen als auch abgeschlossen. Dasselbe gilt f¨ur die leere Menge ∅. (1.13) Lemma. a) b)
Die Menge A = {x ∈ Rn ; kxk < 1} ist offen.
Die Menge A = {x ∈ Rn ; kxk ≤ 1} ist abgeschlossen.
p = 1,0
p = 1,5
p = 2,0
ABB. 1.6. Offene Mengen
p = 1,0
p = 1,5
p = 3,0
p = 100,0
x ∈ R2 ; kxkp < 1
p = 2,0
ABB. 1.7. Abgeschlossene Mengen
p = 3,0
p = 100,0
x ∈ R2 ; kxkp ≤ 1
Beweis. a) F¨ur ein festes a ∈ A w¨ahlen wir ε = 1 − kak, was offenbar positiv ist. Mit dieser Wahl ist Bε (a) ⊂ A (siehe Abb. 1.6), denn aufgrund der Dreiecksungleichung gilt f¨ur jedes x ∈ Bε (a): kxk = kx − a + ak ≤ kx − ak + kak < ε + kak = 1. Folglich ist A offen. b) Es sei {xi }i≥1 eine Folge mit xi ∈ A (f¨ur alle i), die gegen a konvergiert. Wir m¨ussen zeigen, dass a ∈ A ist. Angenommen, dies gilt nicht, also a 6∈ A (d.h. kak > 1, siehe Abb. 1.7), so w¨ahlen wir ε = kak − 1. F¨ur dieses ε gibt es ein N ≥ 1, so dass kxi −ak < ε f¨ur i ≥ N ist. Benutzen wir die Dreiecksungleichung ¨ (oder besser noch Ubung 1.1), so k¨onnen wir kxi k = kxi − a + ak ≥ kak − kxi − ak > kak − ε = 1 f¨ur hinreichend großes i herleiten. Dies widerspricht jedoch der Voraussetzung, dass xi ∈ A ist f¨ur alle i. Folglich ist A = {x ∈ Rn ; kxk ≤ 1} abgeschlossen. ⊓ ⊔ Weitere Beispiele. Die Menge A = {x ∈ R2 ; x1 , x2 ∈ Q, kxk ≤ 1} ist weder offen noch abgeschlossen. Tats¨achlich enth¨alt jede Scheibe irrationale Punkte und ein Limes rationaler Punkte kann durchaus irrational sein.
IV.1 Topologie des n-dimensionalen Raumes 303
0
ABB. 1.8. Cantor-Menge
1
Die ber¨uhmte Cantor-Menge (1883, s. Werke, S. 207, Beispiel 11; Abb. 1.8) ist definiert als A = [0, 1] \ (1/3, 2/3) ∪ (1/9, 2/9) ∪ (7/9, 8/9) ∪ . . . ∞ n o X (1.24) = x= ai 3−i ; ai ∈ {0, 2} . i=1
Sie ist nicht offen (beispielsweise hat x = 1/3 keine Umgebung in A), ist jedoch abgeschlossen (siehe Bemerkung 1.16 unten). Das Sierpi´nski-Dreieck (Abb. 1.9) und der Sierpi´nski-Teppich (Abb. 1.10) (siehe Sierpi´nski 1915, 1916) sind zweidimensionale Verallgemeinerungen der CantorMenge. Die Zeichnungen in den Abbildungen 1.9 und 1.10 wirken nicht nur unter a¨ sthetischen Gesichtspunkten ansprechend, sondern erinnern uns auch daran, dass Mengen sehr komplizierte Objekte sein k¨onnen.
ABB. 1.9. Sierpi´nski-Dreieck
ABB. 1.10. Sierpi´nski-Teppich
(1.14) Satz. Es gilt: i) ii)
F abgeschlossen U offen
=⇒ =⇒
∁F offen, ∁U abgeschlossen.
304 IV. Differentialrechnung in mehreren Variablen
Beweis. i) Angenommen ∁F ist nicht offen. Dann gibt es ein a ∈ ∁F (d.h. a 6∈ F ), so dass f¨ur jedes ε > 0 gilt Bε (a) 6⊂ ∁F . W¨ahlen wir ε = 1/i, so k¨onnen wir eine Folge {xi }i≥1 mit xi ∈ F und kxi − ak < 1/i w¨ahlen. Da F abgeschlossen ist, folgt a ∈ F , was der Annahme widerspricht. ii) Angenommen ∁U ist nicht abgeschlossen. Das bedeutet, dass es eine Folge xi ∈ ∁U (also xi 6∈ U ) gibt, die gegen ein a 6∈ ∁U (also a ∈ U ) konvergiert. Da U offen ist, gibt es ein ε > 0 mit Bε (a) ⊂ U . Damit ist xi 6∈ Bε (a) f¨ur alle i, was der Annahme widerspricht. ⊓ ⊔ (1.15) Satz (Hausdorff 1914, S. 216). F¨ur eine endliche Zahl an Mengen gilt: i) U1 , U2 , . . . , Um offen =⇒ U1 ∩ U2 ∩ . . . ∩ Um ist offen, ii) F1 , F2 , . . . , Fm abgeschlossen =⇒ F1 ∪F2 ∪. . .∪Fm ist abgeschlossen. F¨ur eine beliebige Familie von Mengen (mit Indexmenge Λ) gilt: S n iii) Uλ offen f¨ur alle λ ⇒ λ∈Λ Uλ = {x ∈ R ; ∃ λ ∈ Λ, x ∈ Uλ } ist offen, T n iv) Fλ abgeschlossen f¨ur alle λ ⇒ λ∈Λ Fλ = {x ∈ R ; ∀ λ ∈ Λ, x ∈ Fλ } ist abgeschlossen. Beweis. Wir beginnen damit, (i) zu beweisen. Es sei x ∈ U1 ∩ . . . ∩ Um , so dass x ∈ Uk f¨ur alle k = 1, . . . , m ist. Da Uk offen ist, gibt es ein εk > 0 mit Bεk (x) ⊂ Uk . W¨ahlen wir ε = min(ε1 , . . . , εm ), so haben wir ein positives ε gefunden, f¨ur das Bε (x) ⊂ U1 ∩ . . . ∩ Um gilt. Der Beweis von (iii) ist noch einfacher, wir u¨ berspringen ihn deshalb. Die ¨ Aquivalenzen (i) ⇔ (ii) und (iii) ⇔ (iv) folgen nunmehr aus den De Mor” gan’schen Gesetzen“ ∁ U1 ∩ U2 = ∁U1 ∪ ∁U2 (1.25) ∁ U1 ∪ U2 = ∁U1 ∩ ∁U2 in Kombination mit Satz 1.14.
⊓ ⊔
(1.16) Bemerkung. Mittels dieses Satzes k¨onnen wir beweisen, dass die CantorMenge aus Gl. (1.24) abgeschlossen ist. Tats¨achlich ist ihr Komplement ∁A = (−∞, 0) ∪ (1, ∞) ∪ (1/3, 2/3) ∪ (1/9, 2/9) ∪ (7/9, 8/9) ∪ . . . eine unendliche Vereinigung offener Intervalle und laut Satz 1.15 also offen. (1.17) Bemerkung. Die Behauptungen (i) und (ii) in Satz 1.15 gelten nicht f¨ur unendlich viele Mengen. Wir k¨onnen beispielsweise die Familie n o (1.26) Ui = x ∈ R2 ; kxk < 1 + 1/i offener Mengen betrachten; ihre Schnittmenge U2 ∩ U3 ∩ U4 ∩ . . . = 2 R ; kxk ≤ 1 ist nicht offen (Abb. 1.11).
x ∈
IV.1 Topologie des n-dimensionalen Raumes 305
U2 U3 U4 U5 F2
ABB. 1.11. Offene Mengen mit abgeschlossener Schnittmenge
F3 F4 F 5
ABB. 1.12. Abgeschlossene Mengen mit offener Vereinigung
Analog ist die Vereinigung der Familie n o (1.27) Fi = x ∈ R2 ; kxk ≤ 1 − 1/i
abgeschlossener Mengen (Abb. 1.12) F2 ∪ F3 ∪ F4 ∪ . . . = x ∈ R2 ; kxk < 1 , was nicht abgeschlossen ist.
Kompakte Mengen Wir haben bereits auf die Wichtigkeit der kompakten Mengen hingewiesen und werden sie im Verlauf dieses Buches immer wieder sehen. Alle, die mit der allgemeinen Analysis befasst sind, haben erkannt, dass es unm¨oglich ist, ohne sie auszukommen. (Fr´echet 1928, Espaces abstraits, S. 66)
(1.18) Definition (Fr´echet 1906). Eine Menge K ⊂ Rn heißt kompakt, wenn jede Folge {xi }i≥1 , deren Elemente aus K sind, eine Teilfolge besitzt, die gegen ein Element a ∈ K konvergiert. (1.19) Satz. F¨ur K ⊂ Rn gilt: K kompakt
⇐⇒
K beschr¨ankt und abgeschlossen.
Beweis. Es sei K eine abgeschlossene und beschr¨ankte Menge (d.h. es ist kxk ≤ B f¨ur alle x ∈ K). Wir w¨ahlen dann eine Folge {xi }i≥1 mit Elementen aus K. Diese Folge ist beschr¨ankt und besitzt nach Satz 1.9 eine konvergente Teilfolge. Der Grenzwert dieser Teilfolge liegt in K, da K abgeschlossen ist. Folglich ist K kompakt.
306 IV. Differentialrechnung in mehreren Variablen
Sei nun andererseits K eine kompakte Menge. Dann ist K abgeschlossen, da jede Teilfolge einer konvergenten Folge gegen denselben Grenzwert konvergiert. Um zu zeigen, dass K beschr¨ankt ist, gehen wir zun¨acht vom Gegenteil aus, d.h. wir nehmen an, dass es eine Folge {xi } gibt mit xi ∈ K f¨ur alle i und kxi k → ∞. Offenbar ist es unm¨oglich, eine konvergente Teilfolge zu bestimmen, so dass K in diesem Fall nicht kompakt sein kann. ⊓ ⊔ (1.20) Bemerkung. Kompakte Mengen sind nach Definition 1.18 genau diejenigen Mengen, in denen der Satz von Bolzano-Weierstraß angewendet werden kann. Da dieser Satz die Grundlage aller tieferen Ergebnisse u¨ ber gleichm¨aßige Konvergenz, gleichm¨aßige Stetigkeit, Maximum und Minimum bildet, hat Fr´echet in seinem obigen Zitat nicht u¨ bertrieben. (1.21) Satz (Heine 1872, Borel 1895). Es sei K eine kompakte Menge und es sei {Uλ }λ∈Λ eine Familie offener Mengen Uλ mit [ ¨ (1.28) Uλ ⊃ K (offene Uberdeckung). λ∈Λ
Dann gibt es eine endliche Zahl an Indizes λ1 , λ2 , . . . , λm , so dass gilt: Uλ1 ∪ Uλ2 ∪ . . . ∪ Uλm ⊃ K. Gegenbeispiele. Bevor wir mit dem Beweis des Satzes fortfahren, wollen wir zeigen, dass auf keine der Voraussetzungen verzichtet werden kann. Im Beispiel n o K = x ; kxk < 1 , Ui = x ; kxk < 1 − 1/i , i = 1, 2, . . .
¨ ist es nicht m¨oglich, eine endliche Uberdeckung von K zu finden. Dies liegt daran, dass K nicht abgeschlossen ist. Im Fall K = Rn , Ui = x ; kxk < i , i = 1, 2, . . . ,
ist die Menge K nicht beschr¨ankt. Wiederum ist es nicht m¨oglich, eine endliche ¨ Uberdeckung von K zu finden. Folglich ist auch die Beschr¨anktheit von K notwendig. Schließlich wollen wir die kompakte Menge K = x ; kxk ≤ 1 betrachten, u¨ berdecken sie jedoch mit Mengen Ui , die nicht offen sind: Ui =
n
(r cos ϕ, r sin ϕ) ; 0 ≤ r ≤ 1,
1 2i+1
≤
ϕ 1 o ≤ i . 2π 2
¨ Keine der Mengen Ui ist in der Uberdeckung {Ui }i≥1 verzichtbar (Abb. 1.13).
IV.1 Topologie des n-dimensionalen Raumes 307
K1
U2
U1
K2
U3 U4 U5 U6
K3
K
K4
U0
I ¨ ABB. 1.13. Nicht-offene Uberdeckung von K
ABB. 1.14. Heines Beweis
Beweis. Wir orientieren uns an Heine (1872) und umschließen die kompakte Menge K mit einem n-dimensionalen W¨urfel I (ein Quadrat f¨ur n = 2; siehe Abb. 1.14). Wir nehmen an, wir ben¨otigen unendlich viele der Uλ , um K zu u¨ berdecken. Der Ansatz besteht nun darin, I in 2n kleinere W¨urfel zu zerlegen, indem wir die Seitenl¨angen halbieren (hier I1 , I2 , I3 , I4 ). Mindestens eine der Mengen K ∩ Ij (j = 1, . . . , 2n ) ben¨otigt eine unendliche Zahl an Uλ zu ihrer ¨ Uberdeckung. Diese sei K ∩ Iℓ und nennen sie K1 . Wiederum zerlegen wir Iℓ in 2n kleinere W¨urfel, und so weiter. Auf diese Weise erhalten wir eine Folge von Mengen K ⊃ K1 ⊃ K2 ⊃ K 3 ⊃ . . . , ¨ von denen jede einer unendlichen Zahl an Uλ zur Uberdeckung bedarf. In jedem Ki w¨ahlen wir nun nach Belieben ein xi ∈ Ki . Die Folge {xi } ist eine Cauchy-Folge, da die Durchmesser der Ki gegen Null streben. Nach Satz 1.8 muss die Folge daher konvergieren, den Grenzpunkt nennen wir a. Da K kompakt ist (und folglich abgeschlossen) ist a ∈ K. Nach (1.28) gibt es ein λ mit a ∈ Uλ . Da dieses Uλ offen ist, gibt es ein ε > 0 mit Bε (a) ⊂ Uλ . Wenn wir jetzt einsetzen, dass die Durchmesser der Ki gegen Null streben, schlussfolgern wir, dass Km ⊂ Bε (a) ⊂ Uλ f¨ur hinreichend große m gelten muss. Folglich wird Km von einem einzigen Uλ u¨ berdeckt. Dies widerspricht jedoch der Annahme, K k¨onne nicht mit einer endlichen Zahl an Uλ u¨ berdeckt werden. ⊓ ⊔
308 IV. Differentialrechnung in mehreren Variablen
¨ Ubungen 1.1 Es sei k · k eine Norm auf Rn . Beweisen Sie: kxk − kyk ≤ kx − yk.
Hinweis. Wenden Sie die Dreiecksungleichung auf kxk = kx − y + yk an.
1.2 Zeigen Sie, dass gilt:
kxk2 ≤ kxk1 ≤
√
∀ x ∈ Rn .
n · kxk2
Zeigen Sie dann, dass diese Absch¨atzungen auch optimal“ sind, d.h. falls ” ∀ x ∈ Rn
c · kxk2 ≤ kxk1 ≤ C · kxk2 erf¨ullt ist, dann ist auch c ≤ 1 und C ≥
√
n.
1.3 Herr C.L. Ever k¨onnte auf die Idee kommen, die Norm“ ” n X 2 kxk1/2 = |xi |1/2 i=1
zu definieren. Zeigen Sie, dass diese Norm“ dieDreiecksungleichung nicht ” erf¨ullt. Untersuchen Sie auch die Menge B = x ∈ R2 ; kxk1/2 ≤ 1 und zeigen Sie, dass diese nicht konvex ist.
1.4 Definieren Sie f¨ur jede Menge A in Rn ihr Inneres A◦ als ◦ A= {x A ist Umgebung von x}
und ihren Abschluss A als A = {x der Schnitt von A mit jeder Umgebung von x ist nicht leer}.
Zeigen Sie, dass A eine abgeschlossene Menge ist (tats¨achlich sogar die ◦
kleinste abgeschlossene Menge, die A enth¨alt), und dass A eine offene Menge ist (die gr¨oßte offene Menge, die in A enthalten ist). 1.5 Zeigen Sie, dass f¨ur zwei beliebige Mengen A und B in Rn gilt: ◦
A ∪ B = A ∪ B,
z }| { ◦ ◦ A ∩ B =A ∩ B .
Finden Sie zwei Mengen A und B in R mit
◦
A ∩ B 6= A ∩ B
z }| { ◦ ◦ A ∪ B 6=A ∪ B .
IV.1 Topologie des n-dimensionalen Raumes 309
1.6 (Sierpi´nski-Dreieck 1915). Es seien a, b, c drei Punkte in R2 , die ein gleichseitiges Dreieck bilden. Betrachten Sie die Menge ∞ ∞ ∞ n X X X λi µi νi o T = λa + µb + νc ; λ = , µ = , ν = , 2i 2i 2i i=1 i=1 i=1
wobei λi , µi , νi jeweils 0 oder 1 sind, so dass λi + µi + νi = 1 gilt f¨ur alle i. Bestimmen Sie die Form von T . Ist diese Menge offen, abgeschlossen, kompakt? 1.7 Zeigen Sie, dass 2 1 kxk = |x1 | + |x2 | + max |x1 |, |x2 | 3 3 eine Norm auf R2 beschreibt. Bestimmen Sie f¨ur diese Norm die Form der Einheitsscheibe“ ” B1 (0) = x ∈ R2 ; kxk ≤ 1 .
1.8 Beweisen Sie, dass die Abbildung N : R2 −→ R, die durch q N (x1 , x2 ) = ax21 + 2bx1 x2 + cx22
definiert ist, genau dann eine Norm auf R2 ist, wenn a > 0 und ac − b2 > 0 erf¨ullt ist. 1.9 Leiten Sie den Satz von Bolzano-Weierstraß aus dem Satz von Heine-Borel ab. Hinweis. Nehmen Sie an, {xn } ist eine Folge mit kxn k ≤ M , aber ohne H¨aufungspunkt. Dann gibt es f¨ur jedes a mit kak ≤ M ein ε > 0, so dass Bε (a) nur eine endliche Zahl an Folgengliedern von {xn } enth¨alt. 1.10 Beweisen Sie, dass Rn und ∅ die einzigen Untermengen von Rn sind, die sowohl offen als auch abgeschlossen sind.
310 IV. Differentialrechnung in mehreren Variablen
IV.2 Stetige Funktionen . . . ist die Schwierigkeit, welche nach dem Urtheile aller Mathematiker . . . das Studium jenes Werkes wegen seiner . . . mehr philosophischen als mathematischen Form dem Leser bereitet . . .. Jene Schwierigkeit nun zu beheben, war daher eine wesentliche Aufgabe f¨ur mich, wenn ich wollte, dass das Buch nicht nur von mir, sondern auch von anderen gelesen und verstanden werde. (Grassmann 1862, Professor am Gymnasium zu Stettin“) ”
Sei A eine Untermenge des Rn . Eine Funktion
f : A → Rm
(2.1)
bilde den Vektor x = (x1 , . . . , xn ) ∈ A auf den Vektor y = (y1 , . . . , ym ) ∈ Rm ab. Jede Komponente von y ist eine Funktion von n unabh¨angigen Variablen. Daher schreiben wir
(2.2)
y = f (x)
oder
y1 = f1 (x1 , . . . , xn ) .. . ym = fm (x1 , . . . , xn ).
y
y2
y1
x1 ABB. 2.1a. Die Funktion y = x21 + x22
x
x2 ABB. 2.1b. y1 = cos 10x, y2 = sin 10x, 0 ≤ x ≤ 3
Beispiele. a) Eine Funktion (m = 1) von zwei Variablen (n = 2) kann als Oberfl¨ache im R3 interpretiert werden. Beispielsweise stellt die Funktion y = x21 + x22 einen Paraboloiden dar (Abb. 2.1a). b) Zwei Funktionen (m = 2) von nur einer Variablen (n = 1) repr¨asentieren eine Kurve im R3 . Beispielsweise wird die Spirale aus Abb. 2.1b durch y1 = cos 10x, y2 = sin 10x beschrieben. Wenn wir die Kurve auf die (y1 , y2 )-Ebene projizieren, erhalten wir eine parametrische Darstellung“ einer Kurve im R2 (in ” unserem Beispiel von einem Kreis).
IV.2 Stetige Funktionen 311
(2.1) Definition. Eine Funktion f : A → Rm , A ⊂ Rn heißt stetig bei x0 ∈ A, wenn gilt: ∀ ε > 0 ∃ δ > 0 ∀ x ∈ A : kx − x0 k < δ
kf (x) − f (x0 )k < ε.
Dies entspricht exakt der Definition III.3.2, wenn man die Betragsstriche durch Normen ersetzt. Unsere Definition h¨angt nicht von der konkret gew¨ahlten Norm ab, solange diese zueinander a¨ quivalent sind (hier gilt dasselbe Argument wie in Bemerkung 1.6). Wenn wir im Rm die Maximumsnorm verwenden, so finden wir in Analogie zu Satz 1.7 das folgende Resultat. (2.2) Satz. Eine Funktion f : A → Rm , A ⊂ Rn mit den Bezeichnungen aus (2.2) ist genau dann stetig bei x0 ∈ A, wenn die Funktionen fj : A → R bei x0 f¨ur alle j = 1, . . . , m stetig sind. ⊓ ⊔ Als Konsequenz dieses Satzes reicht es also aus, sich auf den Fall m = 1 zu beschr¨anken, wenn man Stetigkeit studieren will. Eine konstante Funktion f (x) = c ist offensichtlich u¨ berall stetig. Die Projektion von x = (x1 , . . . , xn ) auf die k-te Koordinate, also p(x) = xk , ist ebenfalls in jedem Punkt x0 = (x10 , . . . , xn0 ) stetig, da |xk − xk0 | ≤ kx − x0 k ist (w¨ahle δ = ε in Definition 2.1). Es ist nahezu trivial, Definition III.3.10 (Grenzwert einer Funktion) und die Aussagen der S¨atze III.3.3 und III.3.4 auf den Fall mehrerer Variablen auszudehnen, solange Produkt und Quotient noch Sinn machen (man ersetze einfach die Betragsstriche durch Normen). Folglich sind Polynome mehrerer Variablen wie beispielsweise f (x1 , x2 , x3 ) = x41 x52 − x1 x32 x3 + 4x52 − 1 u¨ berall stetig, und rationale Funktionen sind an allen Punkten stetig, an denen ihr Nenner nicht verschwindet.
y
y x2
x1
x2 x1
ABB. 2.2. Stereogramm der unstetigen Funktion f (x1 , x2 ) aus Gl. (2.3). (Halten Sie das Bild nahe an Ihre Augen (20 cm) und fokussieren Sie durch das Papier hindurch einen Punkt 20 cm hinter dem Papier an. Dann werden die zwei Bilder zu einem dreidimensionalen Eindruck verschmelzen.)
Beispiel. Betrachten Sie die Funktion f : R2 → R, die durch ( x1 x2 falls x21 + x22 > 0 (2.3) y = f (x1 , x2 ) = x21 + x22 0 falls x1 = x2 = 0
312 IV. Differentialrechnung in mehreren Variablen
definiert ist (siehe Abb. 2.2). Sie ist stetig an allen Punkten mit x21 +x22 > 0. Um ihr Verhalten in der N¨ahe des Ursprungs zu erkl¨aren, benutzen wir Polarkoordinaten x1 = r cos ϕ, x2 = r sin ϕ, so dass (f¨ur r > 0) gilt: y=
r2 cos ϕ sin ϕ 1 = sin 2ϕ. 2 r 2
Folglich ist die Funktion konstant entlang allen Geraden, die durch den Ursprung gehen, wobei die Konstante vom Winkel ϕ abh¨angt. In jeder Umgebung von (0, 0) nimmt nun die Funktion (2.3) s¨amtliche Werte zwischen +1/2 und −1/2 an. Als Konsequenz kann sie bei (0, 0) nicht stetig sein. Das Interessante an diesem Beispiel ist, dass die partiellen Funktionen x1 7→ f (x1 , 0) und x2 7→ f (0, x2 ) sehr wohl im Ursprung stetig sind. Das bedeutet, dass es kein Analogon zu Satz 2.2 f¨ur die unabh¨angigen Variablen x geben kann, wie Cauchy (1821, S. 37) noch dachte. Er wurde von Peano (1884, Annotazione ” N. 99“) mittels Beispielen wie dem obigen widerlegt.
Stetige Funktionen und Kompaktheit Wir fahren damit fort, die Ergebnisse aus Abschnitt III.3 auf Funktionen mehrerer Variablen zu verallgemeinern. Viele dieser Verallgemeinerungen sind unkompliziert. Beispielsweise liest sich das Analogon von Satz III.3.6 wie folgt: (2.3) Satz. Es sei K ⊂ Rn eine kompakte Menge und f : K → R stetig auf K. Dann ist die Funktion f auf K beschr¨ankt und nimmt ihr Maximum und ihr Minimum an, d.h. es gibt Vektoren u ∈ K und U ∈ K mit f¨ur alle
f (u) ≤ f (x) ≤ f (U )
x ∈ K.
⊓ ⊔
Mit diesem Satz l¨asst sich das folgende Resultat beweisen, das wir bereits in Bemerkung 1.6 angek¨undigt haben. (2.4) Satz. Alle Normen im Rn sind a¨ quivalent. Ist also N : Rn → R eine Abbildung, die die folgenden Bedingungen (N1) bis (N3) aus Satz 1.1 erf¨ullt, (N1) (N2) (N3)
N (x) ≥ 0
und
N (λx) = |λ| N (x)
N (x) = 0 ⇔ x = 0, f¨ur
N (x + y) ≤ N (x) + N (y)
λ ∈ R,
(Dreiecksungleichung),
so gibt es Zahlen C1 > 0 und C2 > 0 mit (2.4)
C1 kxk2 ≤ N (x) ≤ C2 kxk2
f¨ur alle
x ∈ Rn .
Beweis. Wir wollen zun¨achst zeigen, dass N (x) stetig ist. Daf¨ur schreiben wir x = x1 e1 + x2 e2 + . . . + xn en , wobei e1 = (1, 0, . . . , 0), e2 = (0, 1, 0, . . . , 0) etc. ist. Dann folgt aus (N3), (N2) und der Cauchy-Schwarz-Ungleichung (1.5)
IV.2 Stetige Funktionen 313
(2.5)
N (x) = N (x1 e1 + . . . + xn en ) ≤ N (x1 e1 ) + . . . + N (xn en ) ≤ |x1 | · N (e1 ) + . . . + |xn | · N (en ) ≤ kxk2 · C2 ,
p mit C2 = N (e1 )2 + . . . + N (en )2 . Damit ist die zweite Ungleichung von (2.4) bewiesen. Die Stetigkeit von N (x) sieht man nun wie folgt: N (x) − N (x0 ) = N (x − x0 + x0 ) − N (x0 )
≤ N (x − x0 ) + N (x0 ) − N (x0 ) ≤ C2 kx − x0 k2
und entsprechend N (x0 ) − N (x) = . . . ≤ C2 kx0 − xk2 , so dass (2.6)
|N (x) − N (x0 )| ≤ C2 kx − x0 k2
erf¨ullt ist. Wir betrachten nun die Funktion N (x) auf der kompakten Menge K = x ∈ Rn ; kxk2 = 1 . Nach Satz 2.3 nimmt sie f¨ur ein u ∈ K ihr Minimum an, d.h. (2.7)
N (z) ≥ N (u)
f¨ur alle
z ∈ K.
Setzen wir C1 = N (u), was nach (N1) positiv sein muss, so gilt f¨ur ein beliebiges x ∈ Rn (x 6= 0), dass x/kxk2 ∈ K ist und folglich x 1 C1 ≤ N = N (x) kxk2 kxk2 sein muss. Damit ist auch die erste Ungleichung von (2.4) bewiesen.
⊓ ⊔
Gleichm¨aßige Stetigkeit und gleichm¨aßige Konvergenz Genauso wie in Abschnitt III.4 nennen wir eine Funktion f : A → Rm , A ⊂ Rn gleichm¨aßig stetig, wenn sie auf A stetig ist und das δ in Definition 2.1 unabh¨angig von x0 ∈ A gew¨ahlt werden kann. Dann gilt die folgende Verallgemeinerung von Satz III.4.5. (2.5) Satz (Heine 1872). Es sei f : K → Rm eine auf K stetige Funktion und es sei K ⊂ Rn eine kompakte Menge. Dann ist f gleichm¨aßig stetig auf K.
Beweis. Die zwei Beweise von Satz III.4.5 k¨onnen leicht an den Fall mehrerer ¨ Variablen angepasst werden. Zum Vergn¨ugen und auch als Ubung pr¨asentieren wir nun einen dritten Beweis, der den Satz 1.21 von Heine-Borel verwendet. Nach Voraussetzung wissen wir (2.8) ∀ x0 ∈ K ∀ ε > 0 ∃ δ > 0 ∀ x ∈ K : kx − x0 k < δ kf (x) − f (x0 )k < ε. Der Ansatz besteht nun darin, die Gesamtheit aller Scheiben {Bδ (x0 )}x0 ∈K als ¨ ¨ offene Uberdeckung von K zu betrachten, und daraus eine endliche Uberdeckung
314 IV. Differentialrechnung in mehreren Variablen
zu gewinnen. Wir werden allerdings schnell feststellen, dass dieser Ansatz noch Probleme bereitet. Seien wir darum etwas vorsichtiger. Wir halten ein ε > 0 fest. Wir definieren f¨ur jedes a ∈ K die offene Menge Ua = x ; kx − ak < δ/2 wobei δ wie in (2.8) von x0 = a abh¨angt .
¨ Diese Mengen bilden eine offene Uberdeckung von K. Da K kompakt ist, reicht bereits eine endliche Zahl an Mengen Ua1 , . . . , UaN aus, um K zu u¨ berdecken. Es seien δ1 , . . . , δN die zugeh¨origen Werte f¨ur δ und wir setzen δ = min δ1 /2, δ2 /2, . . . , δN /2 . Nun seien x ∈ K und y ∈ K beliebige Punkte, die kx − yk < δ erf¨ullen. Wir wollen zeigen, dass kf (x) − f (y)k < 2ε gilt. Da x ∈ K ist, gibt es einen Index i mit x ∈ Uai , also kx − ai k < δi /2. Aus kx − yk < δ ≤ δi /2 und der Dreiecksungleichung folgt dann ky − ai k < δi . Nach (2.8) finden wir also kf (x) − f (y)k ≤ kf (x) − f (ai )k + kf (ai ) − f (y)k < ε + ε = 2ε,
womit die Aussage bewiesen ist.
⊓ ⊔
S¨amtliche Definitionen und Ergebnisse aus Abschnitt III.4, die sich mit der gleichm¨aßigen Konvergenz einer Folge von Funktionen befassen, lassen sich unmittelbar auf den Fall mehrerer Dimensionen ausdehnen. Wenn also eine Folge stetiger Funktionen fk : A → Rm , A ⊂ Rn auf A gleichm¨aßig gegen eine Funktion f (x) konvergiert, so ist diese Grenzfunktion stetig (eine direkte Verallgemeinerung von Satz III.4.2). Wir betrachten hierf¨ur ein interessantes Beispiel. Die Peano-Hilbert-Kurve. Eine stetige Kurve kann Fl¨achenst¨ucke enthalten: das ist eine der merkw¨urdigsten Tatsachen der Mengenlehre, deren Entdeckung wir G. Peano verdanken. (Hausdorff 1914, S. 369)
Cantor (1878) fand das sensationelle Ergebnisse, dass es eine eineindeutige Korrespondenz zwischen den Punkten eines Intervalls und jenen eines Quadrates gibt. Jedoch war Cantors Abbildung nicht stetig. Peano (1890) fand dann durch gekonnte Manipulation der Koordinaten in Basis 3 eine stetige Kurve, die das ganze Quadrat ausf¨ullt. Wenig sp¨ater entdeckte Hilbert (1891) Kurven dieser Art durch eine wundervolle geometrische Anschauung“: Er unterteilte die Quadrate ” wiederholt in vier kleinere Quadrate und benannte ihre Mittelpunkte nach der Richtung, die die vorhergehende Kurve durchlief (siehe Abb. 2.3). Noch eine Konstruktion. Es sei ϕ(t) = (x(t), y(t)), 0 ≤ t ≤ 1 eine beliebige stetige Kurve, die die Punkte A = (0, 0) f¨ur t = 0 und B = (1, 0) f¨ur t = 1 miteinander verbindet (siehe Abb. 2.4). Sodann definieren wir eine neue Kurve Φϕ durch 1 y(4t), x(4t) falls 0 ≤ t ≤ 14 2 1 x(4t − 1), 1 + y(4t − 1) falls 14 ≤ t ≤ 24 (Φϕ)(t) = 21 1 + x(4t − 2), 1 + y(4t − 2) falls 24 ≤ t ≤ 34 2 1 falls 34 ≤ t ≤ 1. 2 2 − y(4t − 3), 1 − x(4t − 3)
IV.2 Stetige Funktionen 315 6
2
7
10
22
11
3
21
5
8 3
4
1
13
4 1
2
15
16
27
25 19 30
38
28 37 29 36 32
17 16
14
24
20
12
9
23 26
14
2
3
9
46
34
47
10 55 7
8
48 52
58
56
57
44 45
53
5 4
41 35
11 54 12
15
1
40
43
33
18 31 13
39 42
49
51
50
62
63
60 6
59
61
64
ABB. 2.3. Die Peano-Hilbert-Kurve
Φψ Φψ
ψ
Φψ Φψ
Φϕ
ψ
Φϕ Φψ
Φϕ
ϕ
Φψ Φψ
Φϕ
Φψ
A
BA
BA
B
ABB. 2.4. Aufbau der Kurve von Hilbert
Dies liefert wiederum eine stetige Kurve, die A = (0, 0) f¨ur t = 0 und B = (1, 0) f¨ur t = 1 miteinander verbindet (siehe zweites Bild in Abb. 2.4), so dass die Prozedur wiederholt werden kann (drittes Bild in Abb. 2.4). Dies f¨uhrt zu einer Folge von Funktionen ϕ0 = ϕ, ϕ1 = Φϕ0 , ϕ2 = Φϕ1 und so weiter. Wenn wir von einer anderen Startkurve ψ(t) mit kϕ(t) − ψ(t)k∞ ≤ K f¨ur t ∈ [0, 1] ausgehen, so ist kΦϕ(t) − Φψ(t)k∞ ≤ K/2 (siehe Abb. 2.4). Daraus folgt (2.9)
kϕk (t) − ψk (t)k ≤ K · 2−k
316 IV. Differentialrechnung in mehreren Variablen
und wenn man ψ(t) = ϕm (t) und K = 1 einsetzt, findet man kϕk (t) − ϕk+m (t)k ≤ 2−k .
(2.10)
Aus (2.10) sehen wir, dass die Folge ϕk (t) gleichm¨aßig konvergiert (CauchyKriterium (III.4.4)) und folglich eine stetige Grenzfunktion ϕ∞ (t) besitzt (siehe Satz III.4.2). Desweiteren folgt aus (2.9), dass die Grenzfunktion von der urspr¨unglichen Funktion ϕ0 (t) unabh¨angig ist. Hilberts Kurve aus Abb. 2.3 besitzt im Vergleich zu den Kurven aus Abb. 2.4 kleine Ver¨anderungen an den Endpunkten der Intervalle [i/4k , (i + 1)/4k ], die aber f¨ur k → ∞ verschwinden. ¨ Es ist im Ubrigen interessant, dass die beiden Koordinaten x(t) und y(t) neue Beispiele f¨ur stetige Funktionen sind, die nirgends differenzierbar sind (vgl. Abschnitt III.9).
Lineare Abbildungen Lineare Abbildungen sind wichtige Beispiele f¨ur gleichm¨aßig stetige Funktionen. Sei A eine Matrix a11 a12 . . . a1n a21 a22 . . . a2n (2.11) A= . .. .. ... . . am1
am2
. . . amn
Wir betrachten die Abbildung x 7→ y = Ax mit (2.12)
yi =
n X
aij xj ,
i = 1, 2, . . . , m
j=1
(wenn wir mit Matrizen arbeiten, ist es bequemer, Vektoren als Spaltenvektoren zu schreiben, so dass (2.12) einfach das gew¨ohnliche Produkt zweier Matrizen ist). (2.6) Satz (Peano 1888a, S. 454). In der euklidischen Norm gilt f¨ur alle x ∈ Rn v uX n um X (2.13) kAxk2 ≤ M · kxk2 mit M =t a2ij . i=1 j=1
Beweis. Wenden wir die Cauchy-Schwarz-Ungleichung (1.5) auf die Summe in Gleichung (2.12) an, also yi2 ≤
n X j=1
a2ij
n X j=1
x2j ,
und summieren die Terme von i = 1 bis m, erhalten wir die Behauptung.
⊓ ⊔
IV.2 Stetige Funktionen 317
Als Folgerung aus der Linearit¨at von Ax finden wir kAx − Ax0 k ≤ M · kx − x0 k, wobei M wie in Satz 2.6 definiert ist. Dies zeigt, dass die Abbildung x 7→ Ax auf Rn gleichm¨aßig stetig ist (man w¨ahle δ = ε/M unabh¨angig von x0 ). Beispiel. Wir betrachten die zweidimensionale Matrix √ q √ 2 + 1 √1 A= mit M = 6 + 2 2 = 2,9713. 0 2 In Abb. 2.5 sind die Mengen {x ; kxk2 ≤ 1} und {y = Ax ; kxk2 ≤ 1} dargestellt. Wir stellen fest, dass die zweite Menge im Inneren der Scheibe vom ¨ Radius M liegt, in Ubereinstimmung mit der Absch¨atzung (2.13). Allerdings stellen wir auch fest, dass der Wert M nicht optimal ist. x2
M
2
y2 2
f −2
0 0
2
x1
−2
−2
0 0
−2
2
y1
kAk2
ABB. 2.5. Majorisierung einer linearen Funktion
Die Matrix-Norm. Die kleinstm¨ogliche Zahl M , die die Ungleichung (2.13) erf¨ullt, heißt die Norm (oder Matrix-Norm) von A. Sie wird bezeichnet mit (2.14)
kAk2 := sup{kAxk2 ; kxk2 ≤ 1}.
Offensichtlich ist kAk2 ≤ M mit dem M aus (2.13) und außerdem gilt (2.15)
kAxk2 ≤ kAk2 kxk2
f¨ur alle Vektoren x. Die genaue Berechnung von kAk Eigenwerte q2 ben¨otigt die p √ √ von AT A und liefert im obigen Beispiel kAk2 = 3+ 2+ 5+2 2 = ¨ 2,6855 (siehe Abb. 2.5 und Ubung 4.9).
318 IV. Differentialrechnung in mehreren Variablen
Hausdorffs Charakterisierung stetiger Funktionen Wir interessieren uns f¨ur eine weitere Charakterisierung von Stetigkeit, die eleganter ist als die, die wir in Definition 2.1 benutzt haben. Anstelle mit Normen zu arbeiten, wollen wir daf¨ur Umgebungen und offene Mengen benutzen. F¨ur eine gegebene Funktion f : Rn → Rm und f¨ur Mengen U ⊂ Rn , V ⊂ Rm bezeichnen wir mit (2.16) f (U ) = f (x) ∈ Rm ; x ∈ U das Bild von U , −1 n (2.17) f (V ) = x ∈ R ; f (x) ∈ V das Urbild von V . (2.7) Beispiel. Wir w¨ahlen eine Funktion f : R2 → R2 , die gem¨aß y u=x+ , 2
(2.18)
3 x v = (x + 2)y 3 − (x + 1)y + 2 4
(x, y) auf (u, v) abbildet. Diese Funktion ist f¨ur −1,1 ≤ x,y ≤ 1,1 in Abb. 2.6 skizziert. F¨ur eine Untermenge U (hellgraues Tier der Spezies Katze“ 1 ) haben ” wir die Menge f (U ) und f¨ur V (dunkles Tier der Spezies Katze“) die Menge ” f −1 (V ) gezeichnet. Wir stellen fest, dass das Urbild einer zusammenh¨angenden Menge nicht notwendigerweise wieder zusammenh¨angend sein muss. Dies liegt daran, dass in unserem Beispiel die Funktion f nicht bijektiv ist.
y
v
1 f −1(V)
0
−1
0
1
f 1
x
−1
0 0
V
1
u
f −1(V)
U −1
f(U)
−1
ABB. 2.6. Bild und Urbild der Funktion (2.18)
Charakterisierung von Stetigkeit mittels Umgebungen. Die Menge aller x ∈ Rn , die kx − x0 k < δ erf¨ullen, heißt Bδ (x0 ) (siehe Gl. (1.23)), die Menge der x ∈ Rn mit kf (x) − y0 k < ε ist also f −1 Bε (y0 ) . Wenn also y0 = f (x0 ) und A = Rn ist, so l¨asst sich die Bedingung von Definition 2.1 folgendermaßen ausdr¨ucken: 1
Kot ArnoƩda.
IV.2 Stetige Funktionen 319
(2.19)
∀ε > 0 ∃δ > 0
Bδ (x0 ) ⊂ f −1 Bε (y0 ) .
Da eine Umgebung V von y0 durch die Existenz eines ε > 0 mit Bε (y0 ) ⊂ V definiert ist, muss (2.19) a¨ quivalent sein zu (2.20)
f¨ur jede Umgebung V von y0 ist f −1 (V ) eine Umgebung von x0 .
Diese Interpretation der Stetigkeit bei x0 ist nicht nur eleganter, sondern l¨asst sich auch in allgemeineren topologischen R¨aumen“ einsetzen. ” Die Charakterisierung einer u¨ berall stetigen Funktion f : Rn → Rm mit Hilfe von offenen und abgeschlossenen Mengen ist ebenfalls m¨oglich, wie der folgende Satz demonstriert. (2.8) Satz (siehe Hausdorff 1914, S. 361). F¨ur eine Funktion f : Rn → Rm sind die folgenden drei Aussagen a¨ quivalent: i) f ist stetig auf Rn ; ii) f¨ur jede offene Menge V ⊂ Rm ist die Menge f −1 (V ) in Rn offen; iii) f¨ur jede abgeschlossene Menge F ⊂ Rm ist f −1 (F ) in Rn abgeschlossen. Beweis. (i) ⇒ (ii): Sei V ⊂ Rm eine offene Menge. Wir w¨ahlen x0 ∈ f −1 (V ) so, dass f (x0 ) ∈ V ist. Da V offen ist, ist dies eine Umgebung von f (x0 ) und nach (2.20) ist f −1 (V ) eine Umgebung von x0 . Dies gilt f¨ur alle x0 ∈ f −1 (V ). Daher ist f −1 (V ) nach Definition 1.11 offen. (ii) ⇒ (i): Unter der Annahme, dass (ii) erf¨ullt ist, wollen wir zeigen, dass f an einem beliebigen Punkt x0 ∈ Rn stetig ist. Daf¨ur sei ε > 0 gegeben und wir setzen y0 = f (x0 ). Die Menge Bε (y0 ) ist offen, so dass nach Annahme (ii) f −1 (Bε y0 ) ebenfalls offen ist. Definition 1.11 liefert dann die Existenz eines δ > 0 mit Bδ (x0 ) ⊂ f −1 (Bε y0 ) . Aber dies ist einfach die Stetigkeit von f bei x0 (siehe (2.19)). ¨ (ii) ⇔ (iii): der Aussagen (ii) und (iii) folgt aus der Gleich Die Aquivalenz heit f −1 ∁V = ∁ f −1 (V ) in Kombination mit Satz 1.14. ⊓ ⊔ (2.9) Beispiel. Sei f : R → R definiert als f (0) = 0 und (2.21)
f (x) = sin(1/x2 )
f¨ur
x 6= 0.
Diese Funktion ist nicht stetig bei x = 0. Wir wollen zeigen, dass f¨ur unstetige Funktionen die Bedingungen (ii) und (iii) im allgemeinen nicht gelten. Beispielsweise ist die Menge V = (1/3, 2/3) offen und ihr Urbild f −1 (V ) = (x2 , x1 ) ∪ (x4 , x3 ) ∪ . . . ist ebenso offen (siehe Abb. 2.7). Jedoch ist die Menge F = [1/3, 2/3] abgeschlossen, w¨ahrend f −1 (F ) = [x2 , x1 ] ∪ [x4 , x3 ] ∪ . . . nicht abgeschlossen ist, da der Grenzwert der Folge {xi } nicht in f −1 (F ) liegt. Das Urbild der offenen Menge V = (−1/2, 1/2) ist f −1 (V ) = (x0 , ∞) ∪ (x2 , x1 ) ∪ . . . ∪ {0} und nicht offen, da sie keine Umgebung der 0 ist (siehe Abb. 2.8). Dagegen ist das Urbild der abgeschlossenen Menge F = [−1/2, 1/2], also f −1 (F ) = [x0 , ∞) ∪ [x2 , x1 ] ∪ . . . ∪ {0}, wiederum abgeschlossen.
320 IV. Differentialrechnung in mehreren Variablen 1
V 0 0
x5
x4x3
1
x2
x1
−1
ABB. 2.7. Urbild der Funktion (2.21) 1
V
0 0
x4x3
x2 x1
x0
1
−1
ABB. 2.8. Urbild der Funktion (2.21)
(2.10) Beispiel. Unser letztes Beispiel soll demonstrieren, dass ein Analogon von Satz 2.8 f¨ur Bildmengen nicht gilt. Wir betrachten daf¨ur die stetige Funktion f : R → R, die gegeben ist durch (siehe Abb. 2.9) (2.22)
f (x) =
2x . 1 + x2
Das Bild der offenen Menge U = (3/4, 2) ist f (U ) = (4/5, 1], was offensichtlich nicht offen ist; das Bild der abgeschlossenen Menge F = [3, ∞) wiederum ist f (F ) = (0, 3/5], was nicht abgeschlossen ist. 1
f(U)
f(F) 1
U
ABB. 2.9. Bild der Funktion (2.22)
F
...
IV.2 Stetige Funktionen 321
Integrale mit Parametern Angenommen, wir haben eine Funktion f (x, p) von zwei Variablen, die auf dem Rechteck x ∈ [a, b], p ∈ [c, d] definiert ist. Wenn wir diese Funktion bez¨uglich x integrieren, so erhalten wir eine Funktion von p: Z b (2.23) F (p) = f (x, p) dx, a
Die Frage lautet nun, unter welchen Voraussetzungen F (p) stetig ist. ¨ (2.11) Gegenbeispiele. In Formel (b) von Ubung III.5.9 ersetzen wir n2 einmal durch 1/p und einmal durch p, (2.24)
f (x, p) =
x/p , (1 + x2 /p)2
p > 0, 0 ≤ x ≤ 1,
(2.25)
f (x, p) =
px , (1 + px2 )2
p > 0, 0 ≤ x < ∞,
und setzen außerdem in beiden F¨allen f (x, p) = 0 f¨ur p = 0. Im ersten Fall entspricht p → 0 dem Grenzwert n → ∞ in Abb. III.5.5.b, R1 weshalb F (p) = 0 f (x, p) dx gegen eine nicht verschwindende Konstante strebt, wohingegen F (0) = 0 ist. Wir stellen fest, dass f (x, p) u¨ berall stetig ist, außer im Punkt x = p = 0. Im zweiten Fall beschreibt die Funktion f (x, p) einen Buckel, der f¨ur p → 0 unter Ausdehnung ins Unendliche abflacht, w¨ahrend er seine Fl¨ache beibeh¨alt. Wiederum ist F (p) bei p = 0 nicht stetig. Dieses Mal jedoch ist f (x, p) u¨ berall stetig, allerdings ist der Integrationsbereich unbeschr¨ankt. Ist nun f (x, p) u¨ berall stetig, als auch der Integrationsbereich ein kompaktes Intervall, so wissen wir, dass f (x, p) gleichm¨aßig stetig ist (Satz 2.5), und es ist ¨ eine einfache Ubung, den folgenden Satz zu beweisen (vergleiche den Beweis von Satz 3.11 unten). (2.12) Satz. Falls f (x, p) eine auf [a, b] × [c, d] stetige Funktion ist, so ist Z b F (p) = f (x, p) dx a
eine auf [c, d] stetige Funktion.
⊓ ⊔
322 IV. Differentialrechnung in mehreren Variablen
¨ Ubungen 2.1 Zeigen Sie, dass es drei verschiedene Werte f¨ur t gibt, f¨ur die die Hilbertkurve ϕ∞ (t) gleich (1/2, 1/2) ist. 2.2 Beweisen Sie, dass die Matrix-Norm“ (2.14) tats¨achlich eine Norm auf ” Rn·m ist.
ABB. 2.10. Peanos Kurve
2.3 a) Abb. 2.10 zeigt Peanos urspr¨ungliche Formeln (siehe Peano 1890), programmiert und ausgedruckt. Erkl¨aren Sie ihre Konstruktion in der Art der Erkl¨arung zu Abb. 2.4 (Sie werden ein Tier ben¨otigen, dass entgegengesetzte Ecken eines Quadrates verbindet). b) Im letzten Satz seines Artikels behauptet Peano ohne weitere Begr¨undung, dass x und y als Funktionen von t an keiner Stelle differenzierbar sind ( Ces ” x et y, fonctions continues de la variable t, manquent toujours de d´eriv´ee“). Beweisen Sie diese Aussage. Hinweis. Passen Sie den Beweis von Satz III.9.1 von de Rham an, indem Sie αn = i/9n und βn = (i + 1)/9n w¨ahlen. F¨ur diese Wahl liegt die PeanoKurve in entgegengesetzten Ecken eines Quadrates mit Seitenl¨ange 3−n , so dass rn = 3n ist. 2.4 Zeigen Sie, dass f¨ur kompaktes K ⊂ Rn und stetiges f : K −→ Rm die Menge f (K) ⊂ Rm ebenfalls kompakt ist. 2.5 Die Funktion f : R2 −→ R, die durch 2 x1 − x22 f (x1 , x2 ) = x21 + x22 0
f¨ur x21 + x22 > 0 f¨ur x1 = x2 = 0
definiert ist, ist unstetig bei (0, 0) (warum?). Finden Sie eine offene Menge U ⊂ R und eine abgeschlossene Menge F ⊂ R, so dass f −1 (U ) nicht offen und f −1 (F ) nicht abgeschlossen ist.
2.6 Definieren Sie eine Abbildung P : R2 −→ R2 (mit dem Namen Projektion) durch P (x1 , x2 ) = (x1 , 0).
IV.2 Stetige Funktionen 323
a) Zeigen Sie, dass P stetig ist. b) Finden Sie eine offene Menge U ⊂ R2 , f¨ur die P (U ) nicht offen ist. c) Finden Sie eine abgeschlossene Menge F ⊂ R2 , f¨ur die P (F ) nicht abgeschlossen ist. Bemerkung. (b) ist sehr einfach, (c) jedoch ist schwieriger. Aufgrund von ¨ Ubung 2.4 m¨ussen Sie nach einer unbeschr¨ankten Menge F suchen.
z y x
ABB. 2.11. Graph von (cos x − cos y)/(x − y)
2.7 Ein naiver Benutzer eines Computeralgebrasystems (wie bspw. Maple“) ” m¨ochte einen dreidimensionalen Graphen der Funktion g(x, y) =
cos x − cos y x−y
− 8 ≤ x ≤ 8, −8 ≤ y ≤ 8
anfertigen und erh¨alt ein Resultat in der Art von Abb. 2.11. Wie muss g f¨ur x = y definiert werden, um eine stetige Funktion zu erhalten? Pr¨ufen Sie dann die Bedingungen von Definition 2.1 f¨ur die Stetigkeit einer Funktion von zwei Variablen.
324 IV. Differentialrechnung in mehreren Variablen
IV.3 Differenzierbare Funktionen von mehreren Variablen Wir Deutsche gebrauchen statt dessen nach Jacobi’s Vorgange f¨ur partielle Ableitungen das runde ∂. (Weierstraß 1874)
Unser n¨achstes Ziel besteht darin, den Begriff der Differenzierbarkeit f¨ur Funktionen einzuf¨uhren, die von mehr als einer Variablen abh¨angen. Da die Division durch den Vektor x − x0 keinen Sinn macht, gibt es keinen direkten Weg, Definition III.6.1 zu verallgemeinern. Partielle Ableitungen. Wenn wir bei einer Funktion f : U → R, U ⊂ Rn s¨amtliche Variablen bis auf eine festhalten und f als Funktion von nur dieser einen Variablen betrachten, k¨onnen wir Definition III.6.1 anwenden. Beispielsweise k¨onnen wir eine Funktion y = f (x1 , x2 ) von zwei Variablen in der Umgebung des Vektors (x10 , x20 ) betrachten. Wir schreiben dann ihre Ableitungen als ∂f f (x10 + h, x20 ) − f (x10 , x20 ) =: x10 , x20 h→0 h ∂x1 f (x10 , x20 + h) − f (x10 , x20 ) ∂f lim =: x10 , x20 h→0 h ∂x2 lim
(3.1)
und nennen sie partielle Ableitungen von f bez¨uglich x1 bzw. x2 . Weitere Notationen lauten u.a. fxi (x10 , x20 ), Di f (x10 , x20 ) und ∂i f (x10 , x20 ). Geometrisch kann man diese partiellen Ableitungen wie folgt verstehen: Die Funktion y = f (x1 , x2 ) beschreibt eine Oberfl¨ache im R3 (mit Koordinaten x1 , x2 und y). Deren Schnitt mit der Ebene x2 = x20 ist eine Kurve x1 7→ f (x1 , x20 ). Folglich ist die partielle Ableitung ∂f /∂x1 die Steigung dieser Kurve und ∂f y = f (x10 , x20 ) + x10 , x20 (x1 − x10 ) ∂x1 ist die Tangente an diese Kurve bei (x10 , x20 ). In a¨ hnlicher Weise ist die Tangente der Kurve x2 7→ f (x10 , x2 ) einfach y = f (x10 , x20 ) + ∂f /∂x2 x10 , x20 (x2 − x20 ) und die Ebene, die von beiden Tangenten aufgespannt wird, lautet (3.2) y = f (x10 , x20 ) +
∂f ∂f x10 , x20 (x1 − x10 ) + x10 , x20 (x2 − x20 ). ∂x1 ∂x2
Die Funktion f (x1 , x2 ) nennen wir differenzierbar bei (x10 , x20 ), wenn die Ebene (3.2) eine gute“ N¨aherung an f (x1 , x2 ) in einer ganzen Umgebung von ” (x10 , x20 ) ist und nicht nur entlang der Geraden x1 = x10 und x2 = x20 . 2
2
(3.1) Beispiel. Die Oberfl¨ache der Funktion y = e−x1 −x2 ist in Abb. 3.1 skizziert. Die partiellen Ableitungen dieser Funktion lauten 2 2 ∂f (x1 , x2 ) = −2x1 e−x1 −x2 , ∂x1
2 2 ∂f (x1 , x2 ) = −2x2 e−x1 −x2 . ∂x2
IV.3 Differenzierbare Funktionen von mehreren Variablen 325
In dem wir diese Ableitungen bei (x10 , x20 ) = (0,8, 1,0) auswerten, finden wir die Tangentialebene an diesen Punkt mit Hilfe von Gl. (3.2). Sie ist ebenfalls in Abb. 3.1 dargestellt.
x1
x2
x2
x1
2
2
ABB. 3.1. Tangentialebene an die Fl¨ache y = e−x1 −x2 (Stereogramm)
Zwei abh¨angige Variablen. Haben wir zwei Funktionen zu je zwei Variablen, (3.3)
y1 = f1 (x1 , x2 ),
y2 = f2 (x1 , x2 ),
so k¨onnen wir (3.2) f¨ur jede der zwei Funktionen aufschreiben: (3.4) ∂f1 ∂f1 y1 = f1 (x10 , x20 ) + x10 , x20 (x1 − x10 ) + x10 , x20 (x2 − x20 ), ∂x1 ∂x2 ∂f2 ∂f2 y2 = f2 (x10 , x20 ) + x10 , x20 (x1 − x10 ) + x10 , x20 (x2 − x20 ). ∂x1 ∂x2 Diese Formel schreibt sich bequem in Vektorschreibweise als (3.4′ )
y = f (x0 ) + f ′ (x0 )(x − x0 ),
wobei f ′ (x0 ) nun eine Matrix ist, die sogenannte Jacobi-Matrix (s. Jacobi 1841): ∂f1 ∂f1 (x0 ) ∂x (x0 ) ′ ∂x1 2 (3.5) f (x0 ) = ∂f2 . ∂f2 ∂x1 (x0 ) ∂x2 (x0 ) Diese Schreibweise erlaubt es uns, die meisten Formeln aus Abschnitt III.6 auf den Fall mehrerer Variablen zu u¨ bertragen. (3.2) Beispiel. Wir betrachten die Funktion f : R2 → R2 , die gegeben ist durch √ f1 (x1 , x2 ) 2x1 + sin(x1 + x2 ) √ (3.6) f (x) = = . f2 (x1 , x2 ) 2x2 + cos(x1 − x2 ) Diese Funktion bildet den Ursprung (x1 , x2 ) = (0, 0) auf den Punkt (y1 , y2 ) = (0, 1) ab, Geraden bildet sie auf Kurven ab und kleine Quadrate auf Mengen, die Parallelogrammen a¨ hneln (siehe Abb. 3.2). Die Jacobi-Matrix von (3.6) lautet
326 IV. Differentialrechnung in mehreren Variablen
f ′ (x) =
(3.7)
√
2 + cos(x1 + x2 ) − sin(x1 − x2 )
√ cos(x1 + x2 ) 2 + sin(x1 − x2 )
,
und Gl. (3.4) wird f¨ur x0 = (0, 0)T und y0 = f (x0 ) zu: √ y1 − y10 2 + 1 √1 x1 − x10 (3.8) = . y2 − y20 0 2 x2 − x20
Die lineare Abbildung, die zu (3.8) geh¨ort, ist gerade die aus Abb. 2.5. Vergleicht man die zwei Bilder, sieht man, dass die nichtlineare Abbildung (3.6) in einer kleinen Umgebung von x0 durch die lineare Abbildung gen¨ahert wird, die durch die Jacobi-Matrix beschrieben wird. Wir stellen fest, dass f¨ur kleine √ Werte von x − x0 die x1 -Achse (also x2 = x20 = 0) auf ein Vielfaches von ( √2 + 1, 0)T abgebildet wird, w¨ahrend die x2 -Achse auf ein Vielfaches von (1, 2)T abgebildet wird (vgl. die Pfeile in Abb. 3.2). Folglich sind die Spaltenvektoren der Jacobi-Matrix die Bilder der infinitesimalen Einheitsvektoren“. ” x2
y2
f
5
−5
5
x1
5
−5
−5
5
y1
−5
ABB. 3.2. Graph der Abbildung (3.6)
Differenzierbarkeit . . . daß Weierstraß’ unmittelbarer Unterricht die Spontanit¨at der H¨orer zu sehr unterdr¨uckte und in der Tat nur f¨ur den voll verst¨andlich war, der schon anderweitig mit dem Stoff sich vertraut gemacht hatte. Die gr¨oßeren Werke sind von Ausl¨andern geschrieben . . . Wohl das erste stammt von meinem Freunde S t o l z (Innsbruck): Vorlesungen u¨ ber all” gemeine Arithmetik“ . . .. (F. Klein 1926, Entwicklung der Math., S. 291)
Wir betrachten eine Funktion (3.9)
f : U → Rm ,
U ⊂ Rn
und einen Punkt x0 ∈ U , der ein innerer Punkt von U ist (d.h. U ist eine Umgebung von x0 ).
IV.3 Differenzierbare Funktionen von mehreren Variablen 327
(3.3) Definition (Stolz 1887, Fr´echet 1906). Die Funktion (3.9) ist differenzierbar bei x0 , wenn es eine lineare Abbildung f ′ (x0 ) : Rn → Rm und eine Funktion r : U → Rm gibt, die bei x0 stetig ist und r(x0 ) = 0 erf¨ullt, so dass gilt: (3.10)
f (x) = f (x0 ) + f ′ (x0 )(x − x0 ) + r(x)kx − x0 k.
(3.4) Bemerkung. Falls eine Funktion bei x0 differenzierbar ist, so ist sie in diesem Punkt auch stetig. Desweiteren existieren alle ihre partiellen Ableitungen bei x0 . Dies folgt aus der Tatsache, dass Gl. (3.10) f¨ur x − x0 = hej (mit ej = (0, . . . , 0, 1, 0, . . . , 0)T , d.h. die j-te Komponente ist 1) zu f (x0 + hej ) − f (x0 ) |h| = f ′ (x0 )ej + r(x0 + hej ) h h wird. Da r(x) bei x0 stetig ist, existiert der Grenzwert f¨ur diesen Ausdruck f¨ur h → 0 und ist gleich ∂f ∂fi (x0 ) = f ′ (x0 )ej , wobei (x0 ) = fi′ (x0 )ej ∂xj ∂xj ist (mit f (x) = f1 (x), . . . , fm (x) ). Folglich ist die lineare Abbildung eindeutig bestimmt. (3.11)
Das folgende Lemma ist ein Analogon zu Carath´eodorys Formulierung (Gl. (6.6) in Abschnitt III.6). (3.5) Lemma. Die Funktion f (x) aus (3.9) ist genau dann differenzierbar bei x0 , wenn es eine matrix-wertige Funktion ϕ(x) gibt, die von x0 abh¨angt und bei x0 stetig ist, so dass (3.12)
f (x) = f (x0 ) + ϕ(x)(x − x0 )
erf¨ullt ist. Die Ableitung von f (x) bei x0 ist dann f ′ (x0 ) = ϕ(x0 ). Beweis. F¨ur eine gegebene Funktion ϕ(x) setzen wir f ′ (x0 ) := ϕ(x0 ),
(x − x0 ) r(x) := ϕ(x) − ϕ(x0 ) kx − x0 k
und stellen fest, dass (3.10) gilt. Da (x − x0 )/kx − x0 k durch 1 beschr¨ankt ist, folgt aus der Stetigkeit von ϕ(x) bei x0 , dass r(x) → 0 strebt f¨ur x → x0 . Nehmen wir nun andererseits an, dass (3.10) gilt. Wir definieren ϕ(x0 ) := f ′ (x0 ) und f¨ur x 6= x0 (3.13)
ϕ(x) := f ′ (x0 ) + r(x)
(x − x0 )T kx − x0 k
(wir stellen fest, dass das Produkt des Spaltenvektors r(x) mit dem Zeilenvektor (x − x0 )T eine Matrix liefert) und finden ϕ(x)(x − x0 ) = f ′ (x0 )(x − x0 ) + r(x)kx − x0 k. Die Funktion ϕ(x) ist stetig bei x0 , da kϕ(x) − f ′ (x0 )k ≤ kr(x)k nach Satz 2.6 gilt und kr(x)k → 0 strebt f¨ur x → x0 . ⊓ ⊔
328 IV. Differentialrechnung in mehreren Variablen
Das folgende Resultat gibt uns eine hinreichende Bedingung f¨ur Differenzierbarkeit an die Hand, f¨ur die es ausreicht, partielle Ableitungen zu berechnen. (3.6) Satz. Wir betrachten eine Funktion f : U → R und x0 ∈ U (innerer Punkt). Wenn alle partiellen Ableitungen ∂f /∂xi in einer Umgebung von x0 existieren und bei x0 stetig sind, so ist f bei x0 differenzierbar. Beweis. Wir wollen den Beweis nur f¨ur den Fall n = 2 angeben. Der allgemeine Fall f¨ur beliebige n geht genauso. Der Ansatz besteht darin, f (x) − f (x0 ) als f (x1 , x2 )−f (x10 , x20 ) = f (x1 , x2 )−f (x10 , x2 ) + f (x10 , x2 )−f (x10 , x20 )
zu schreiben und Lagranges Satz III.6.11 auf jede der Differenzen anzuwenden. Wir erhalten auf diese Weise ∂f ∂f ξ1 , x2 (x1 − x10 ) + x10 , ξ2 (x2 − x20 ). ∂x1 ∂x2 ∂f ∂f Die Wahl ϕ(x1 , x2 ) = ξ1 , x2 , x10 , ξ2 erf¨ullt bereits (3.12). Die ∂x1 ∂x2 Stetigkeit von ϕ(x) bei x0 folgt aus den Annahmen. ⊓ ⊔ f (x1 , x2 ) − f (x10 , x20 ) =
T Eine vektor-wertige Funktion f (x) = f1 (x), . . . , fm (x) ist nach Definition 3.3 genau dann differenzierbar bei x0 , wenn fi (x) bei x0 f¨ur alle i = 1, . . . , m differenzierbar ist. Somit folgt aus Satz 3.6, dass Funktionen, deren Komponenten Polynome in x1 , . . . , xn , rationale Funktionen oder elementare Funktionen sind, an jedem Punkt differenzierbar sind, an denen sie auch wohldefiniert sind.
Gegenbeispiele Unstetige Funktion, deren partielle Ableitungen uberall ¨ existieren. Wir betrachten die durch ( x1 x2 falls x21 + x22 > 0 (3.14) f (x1 , x2 ) = x21 + x22 0 falls x1 = x2 = 0 definierte Funktion f : R2 → R (siehe Abb. 2.2). Ihre partiellen Ableitungen verschwinden im Ursprung, da f (x1 , 0) = 0 f¨ur alle x1 und f (0, x2 ) = 0 f¨ur ¨ alle x2 ist. Uberall sonst ist die Existenz der partiellen Ableitungen offensichtlich. Dennoch ist die Funktion (3.14) nicht stetig im Ursprung (siehe Abschnitt IV.2). Unstetige Funktion, deren Richtungsableitungen uberall ¨ existieren. Partielle Ableitungen sind ein Spezialfall f¨ur sogenannte Richtungsableitungen. Wir betrachten eine Funktion f : R2 → R und einen Vektor v der L¨ange 1 (also kvk2 = 1). Dann beschreibt g(t) := f (x0 +tv) diejenige Kurve, die als Schnitt der Oberfl¨ache y = f (x1 , x2 ) mit der vertikalen Ebene {(x, y) | x = x0 + tv, t ∈ R} entsteht. Ihre Ableitung schreiben wir als
IV.3 Differenzierbare Funktionen von mehreren Variablen 329
(3.15)
f (x0 + hv) − f (x0 ) ∂f (x0 ) := lim h→0 ∂v h
und nennen sie Richtungsableitung von f (in Richtung von v ). Die partiellen Ableitungen sind die Richtungsableitungen f¨ur v = (1, 0)T und v = (0, 1)T . Nun w¨ahlen wir als Beispiel die Funktion 2 x1 x2 falls x21 + x22 > 0 (3.16) f (x1 , x2 ) = x41 + x22 0 falls x1 = x2 = 0. F¨ur v = (cos θ, sin θ)T finden wir
g(t) = f (tv) =
t cos2 θ sin θ . t2 cos4 θ + sin2 θ
Diese Funktion ist f¨ur jeden Wert von θ differenzierbar bei t = 0 (f¨ur sin θ = 0 stellen wir fest, dass g(t) = 0 ist f¨ur alle t). Folglich existieren alle Richtungsableitungen. Jedoch ist die Funktion entlang der Parabel x2 = ax21 konstant, n¨amlich f (x1 , ax21 ) = a/(1 + a2 ), und s¨amtliche Werte zwischen −1/2 und 1/2 werden in jeder Umgebung des Ursprungs angenommen (siehe Abb. 3.3). Folglich kann die Funktion dort nicht stetig sein.
y
x1
y
x2
x1
x2
ABB. 3.3. Die Funktion (3.16) (Stereogramm)
Eine geometrische Interpretation des Gradienten F¨ur eine Funktion f : U → R, also im Fall m = 1 und n beliebig, ist die Matrix f ′ (x0 ) aus (3.5) ein Zeilenvektor. Er wird u¨ blicherweise bezeichnet als (3.17) grad f =
∂f ∂f ∂f ∂ ∂ ∂ , ,..., = , ,..., f = ∇f. ∂x1 ∂x2 ∂xn ∂x1 ∂x2 ∂xn
In diesem Zusammenhang nennt man den formalen Vektor (Hamilton 1853, Art. 620) ∂ ∂ ∂ ∇= , ,..., ∂x1 ∂x2 ∂xn
330 IV. Differentialrechnung in mehreren Variablen
¨ Nabla angesichts ihrer vorgestellten Ahnlichkeit mit einer assyrischen Harfe“ ” (J.W. Gibbs 1907, S. 138). Gleichung (3.10) schreibt sich nun (3.18)
f (x) = f (x0 ) + grad f (x0 ) · (x − x0 ) + r(x)kx − x0 k
und die Gleichung y = f (x0 ) + grad f (x0 ) · (x − x0 ) der Tangentialebene an die Oberfl¨ache y = f (x) (siehe (3.2)) taucht wieder auf. Um nun die Funktion f (x) in einer Umgebung von x0 zu untersuchen, setzen wir x = x0 + tv und vernachl¨assigen den letzten Term in (3.18). Wir finden (3.19)
f (x0 + tv) = f (x0 ) + t grad f (x0 ) · v + . . . .
Nehmen wir an, dass v ein Vektor der L¨ange 1 ist, so k¨onnen wir die folgenden Eigenschaften herleiten: • Der Vektor grad f (x0 ) steht senkrecht auf der H¨ohenlinie {x ; f (x) = f (x0 )}. Dies folgt aus (3.19) f¨ur t → 0, denn aus f (x0 +tv) = f (x0 ) folgt grad f (x0 )· v = 0. • Die Funktion w¨achst in jene Richtungen v an, f¨ur die grad f (x0 ) · v > 0 gilt. v = grad f (x0 )/k grad f (x0 )k ist aufgrund der Cauchy-SchwarzUngleichung (1.5) diejenige Richtung, in die f (x) am schnellsten w¨achst. Die Richtung des steilsten Abstiegs ist entsprechend der entgegengesetzte Vektor v = − grad f (x0 )/k grad f (x0 )k. • Falls f (x) ein Maximum (oder Minimum) bei x0 besitzt, so erhalten wir die notwendige Bedingung grad f (x0 ) = 0. x2
−1
0 0
1
x1
ABB. 3.4. H¨ohenlinien und Gradienten der Funktion (3.20)
Abb. 3.4 zeigt die H¨ohenlinien f (x) = C (mit C = i/20; i = 1, . . . , 30) der Funktion (3.20)
f (x1 , x2 ) = x21 − 4x1 x2 + 5x22 .
Ihr Gradient grad f (x1 , x2 ) = (2x1 −4x2 , −4x1 +10x2 ) ist durch Pfeile skizziert. Wir stellen fest, dass der Gradient senkrecht auf den H¨ohenlinien steht, und dass die L¨ange von grad f (x0 ) die Steigung der Oberfl¨ache y = f (x) beschreibt.
IV.3 Differenzierbare Funktionen von mehreren Variablen 331
10
t 0,6
−0,8 −0,6 −0,4 −0,2
ϕ
0,6
y
0,4
0,2 0,0
5
0,4
0,2
0,4
f
0,2
0,6
g 1,0
1,2
1,4
0,8
r
−0,2
1,0
−0,4
1,2
−0,6
1,4
0
1,6
x
ABB. 3.5. Bewegung eines elastischen Pendels
Die Kettenregel. Wir betrachten zwei Funktionen Rn x
f −−− − −→ 7−→
Rm y
g −−− − −→ 7−→
Rp z
und untersuchendie Differenzierbarkeit der zusammengesetzten Funktion (g ◦ f )(x) = g f (x) . Wie in Abschnitt III.6 verwenden wir Carath´eodorys Charakterisierung (hier Lemma 3.5). Unter der Annahme, dass f bei x0 und g bei y0 = f (x0 ) differenzierbar ist, gilt f (x) = f (x0 ) + ϕ(x)(x − x0 ),
g(y) = g(y0 ) + ψ(y)(y − y0 ).
Setzen wir y = f (x), y0 = f (x0 ) und f¨ugen die erste Gleichung in die zweite ein, so erhalten wir (3.21) g f (x) = g f (x0 ) + ψ f (x) ϕ(x)(x − x0 ). Da das Produkt ψ f (x) ϕ(x) bei x0 stetig ist, ist die Ableitung von g ◦ f , ausgewertet bei x0 , also (3.22)
(g ◦ f )′ (x0 ) = g ′ (y0 ) · f ′ (x0 ).
Ausgeschrieben in Koordinaten stellt sich das Produkt (3.22) dar als m
(3.23)
X ∂zi ∂yj ∂zi = · , ∂xk ∂yj ∂xk j=1
was die Formel von Leibniz verallgemeinert (Gl. (II.1.16)).
332 IV. Differentialrechnung in mehreren Variablen
Beispiel. Angenommen die Bewegung eines elastischen Pendels ist in PolarkoorT dinaten f (t) = r(t), ϕ(t) gegeben, siehe Abb. 3.5.1 Wir wollen die Geschwindigkeit in kartesischen Koordinaten x r cos ϕ (3.24) = g(r, ϕ) = y r sin ϕ berechnen. Hierf¨ur m¨ussen wir x und y bez¨uglich t ableiten. Da die Jacobi-Matrix von (3.24) gegeben ist als cos ϕ −r sin ϕ ′ (3.25) g (r, ϕ) = , sin ϕ r cos ϕ erhalten wir aus (3.22) die Beziehungen x˙ = cos ϕ · r˙ − r sin ϕ · ϕ, ˙
y˙ = sin ϕ · r˙ + r cos ϕ · ϕ˙
(die Ableitungen bez¨uglich der Zeit t sind mit einem Punkt notiert). Dies erlaubt beispielsweise die Berechnung der kinetischen Energie m m 2 T (t) = (x˙ 2 + y˙ 2 ) = r˙ + r2 ϕ˙ 2 . 2 2
Der Mittelwertsatz Wir wollen die Formel f (b) − f (a) = f ′ (ξ)(b − a) aus dem Satz von Lagrange (Abschnitt III.6) auf den Fall mehrerer Variablen ausdehnen. Der Fall m = 1. Wir betrachten eine Funktion f : Rn → R, sowie zwei gegebene Punkte a ∈ Rn und b ∈ Rn . Der Ansatz besteht nun darin, die beiden Punkte durch die gerade Strecke x = a + (b − a)t,
0≤t≤1
zu verbinden und dann g(t) := f a + (b − a)t
zu definieren. Wenn f (x) an jedem Punkt der Strecke {a+(b−a)t ; t ∈ (0, 1)} differenzierbar ist, so ist auch g(t) differenzierbar, und aus (3.22) folgt
t=1
b2
t=0
a2 a1
b1
g ′ (t) = f ′ a + (b − a)t (b − a).
Wegen g(0) = f (a) und g(1) = f (b) l¨asst sich Satz III.6.11 auf die Funktion g(t) anwenden und liefert g(1) − g(0) = g ′ (τ )(1 − 0), insbesondere also auch (3.26) 1
f (b) − f (a) = f ′ (ξ)(b − a),
Die Kurven in dieser Abbildung sind die L¨osungen von Differentialgleichungen und wurden mit numerischen Methoden berechnet (siehe Abschnitt II.9).
IV.3 Differenzierbare Funktionen von mehreren Variablen 333
wobei ξ ein Punkt auf der Verbindungsstrecke zwischen a und b ist. Gleichung (3.26) a¨ hnelt (III.6.14), jedoch ist nun f ′ (ξ)(b − a) das Skalarprodukt zwischen zwei Vektoren. Der allgemeine Fall. Auf eine Funktion f : Rn → Rm k¨onnen wir (3.26) komponentenweise anwenden. Wir erhalten so ∂f1 ∂f1 (ξ ) . . . ∂x (ξ1 ) b1 − a1 f1 (b) − f1 (a) ∂x1 1 n .. .. .. .. , (3.27) = . . . . ∂fm ∂fm bn − an fm (b) − fm (a) ∂x1 (ξm ) . . . ∂xn (ξm ) wobei s¨amtliche ξi ∈ Rn auf der Strecke zwischen a und b liegen. Der Nachteil dieser Formel ist, dass das Argument ξi in jeder Zeile verschieden sein kann. Es besteht auch keine Hoffnung, dass (3.26) f¨ur alle Funktionen f : Rn → m R wahr sein kann. Ein Gegenbeispiel hierf¨ur ist f1 (x) = cos x, f2 (x) = sin x, a = 0, b = 2π. Solange wir uns mit einer Ungleichung abfinden k¨onnen, ist die Situation die folgende. (3.7) Satz. Es sei f : U → Rm , U ⊂ Rn an allen Punkten der offenen“ Strecke ” (a, b) := {x = a + (b − a)t ; 0 < t < 1} differenzierbar (wir nehmen an, diese Punkte sind innere Punkte von U ) und in der Norm (2.14) gelte kf ′ (x)k ≤ M
f¨ur alle x ∈ (a, b).
Dann gilt (3.28)
kf (b) − f (a)k ≤ M · kb − ak.
Beweis. Die Idee besteht in der Wahl der Funktion (3.29)
g(t) :=
m X i=1
ci fi a + (b − a)t = cT f a + (b − a)t ,
wobei die Koeffizienten c1 , . . . , cm vorerst beliebig sein sollen. Die Ableitung von g(t) lautet g ′ (t) =
m X i=1
ci
n X ∂fi a + (b − a)t (bj − aj ) = cT f ′ a + (b − a)t (b − a). ∂xj j=1
Satz III.6.11 l¨asst sich darauf anwenden mit dem Ergebnis (3.30) cT f (b) − f (a) = g(1) − g(0) = g ′ (τ ) = cT f ′ (ξ)(b − a),
wobei ξ = a + (b − a)τ auf der Verbindungsstrecke (a, b) liegt. Wir w¨ahlen nun c = f (b) − f (a) geschickt so, dass der Ausdruck auf der linken Seite von (3.30) so groß wie m¨oglich wird. Wenden wir dann die Cauchy-Schwarz-Ungleichung auf die rechte Seite von Gl. (3.30) an, erhalten wir zusammen mit (2.15): kf (b) − f (a)k2 ≤ kf (b) − f (a)k · M · kb − ak.
334 IV. Differentialrechnung in mehreren Variablen
Nach Division durch kf (b) − f (a)k haben wir damit Behauptung (3.28) bewiesen (f¨ur kf (b) − f (a)k = 0 gilt Aussage (3.28) bereits offensichtlich). ⊓ ⊔
Der Satz von der impliziten Funktion Implizite Gleichungen f (x, y) = C waren das zentrale Thema von Descartes’ G´eom´etrie“ von 1637 (siehe beispielsweise Gl. (I.1.18)). Niemand zweifelte ” daran, dass solche Gleichungen geometrische Kurven y = y(x) definieren w¨urden und Leibniz wusste sogar, wie man solche Funktionen ableitet. Erst die Mathe¨ (siehe Genocchi-Peano 1884, S. 149–151) fanden es matiker der Weierstraß-Ara notwendig, einen etwas strengeren Beweis zu finden, der garantieren kann, dass f (x, y) = C in einer Umgebung des Punktes (x0 , y0 ) mit f (x0 , y0 ) = C zu y = y(x) a¨ quivalent ist. Wir sagen dann, dass die implizite Gleichung f (x, y) = C nach y aufgel¨ost werden kann. Nehmen wir beispielsweise die Kreise x2 + y 2 = C und halten einen √ Punkt (x0 , y0 ) fest, der x20 + y02 = C√ erf¨ullt. Ist y0 > 0, so finden wir y(x) = C − x2 , f¨ur y0 < 0 dagegen y(x) = − C − x2 , jedoch ist es f¨ur y0 = 0 unm¨oglich, eine Funktion y(x) zu finden, die x2 + y(x)2 = C f¨ur s¨amtliche x in einer Umgebung von x0 erf¨ullt. Im folgenden setzen wir F (x, y) = f (x, y) − C und ersetzen die Bedingung f (x, y) = C durch F (x, y) = 0. (3.8) Satz von der impliziten Funktion. Gegeben sei eine Funktion F : R2 → R und ein Punkt (x0 , y0 ) ∈ R2 . Angenommen, die partiellen Ableitungen ∂F/∂x und ∂F/∂y existieren und sind stetig in einer Umgebung von (x0 , y0 ). Falls außerdem (3.31)
F (x0 , y0 ) = 0
und
∂F (x0 , y0 ) 6= 0 ∂y
gelten, so gibt es Umgebungen U von x0 und V von y0 , sowie eine eindeutige Funktion y : U → V , so dass y(x0 ) = y0 ist mit (3.32) F x, y(x) = 0 f¨ur alle x ∈ U. Die Funktion y(x) ist differenzierbar in U und erf¨ullt ∂F/∂x x, y(x) ′ . (3.33) y (x) = − ∂F/∂y x, y(x)
Beweis. Wir d¨urfen annehmen, dass ∂F/∂y(x0 , y0 ) > 0 ist (ansonsten arbeiten wir mit −F anstelle von F ). Aufgrund der Stetigkeit von ∂F/∂y gibt es ein δ > 0 und ein β > 0, so dass (3.34)
∂F (x, y) ≥ β > 0 ∂y
f¨ur |x − x0 | ≤ δ
und |y − y0 | ≤ δ
IV.3 Differenzierbare Funktionen von mehreren Variablen 335
y δ1 δ
y(x)
x
(x0, y0) δ1
ABB. 3.6. Beweis des Satzes von der impliziten Funktion
gilt. Dies impliziert, dass F (x0 , y) eine monoton wachsende Funktion von y ist, und aufgrund von F (x0 , y0 ) = 0 ist also F (x0 , y0 − δ) < 0 < F (x0 , y0 + δ). Aus der Stetigkeit von F folgt nun die Existenz eines δ1 > 0 (mit δ1 ≤ δ), so dass gilt (siehe Abb. 3.6): F (x, y0 − δ) < 0 < F (x, y0 + δ)
f¨ur
|x − x0 | ≤ δ1 .
Nun setzen wir U = (x0 − δ1 , x0 + δ1 ), V = (y0 − δ, y0 + δ) und wenden Bolzanos Satz III.3.5 auf F (x, y) f¨ur jedes x ∈ U an, dabei verstehen wir F (x, y) als Funktion von y. So zeigen wir die Existenz einer Funktion y : U → V , die (3.32) erf¨ullt. Die Eindeutigkeit von y(x) in V folgt aus der Monotonizit¨at von F (x, y) als Funktion von y. Wir m¨ussen aber noch beweisen, dass y(x) an jedem beliebigen Punkt x1 ∈ U differenzierbar ist. Wie im Beweis von Satz 3.6 benutzen wir hierf¨ur die Beziehung ∂F ∂F F x, y(x) = F (x1 , y1 ) + ξ, y(x) (x − x1 ) + x1 , η y(x) − y1 , ∂x ∂y dabei ist y1 = y(x1 ), ξ liegt zwischen x und x1 , und η zwischen y(x) und y1 . Aus (3.32) und (3.34) folgern wir somit ∂F/∂x ξ, y(x) (3.35) y(x) − y1 = ϕ(x)(x − x1 ), ϕ(x) = − . ∂F/∂y x1 , η
Die Funktion ∂F/∂x ist stetig und folglich beschr¨ankt f¨ur |x − x0 | ≤ δ1 und |y − y0 | ≤ δ, sagen wir mit Schranke M . Zusammen mit (3.34) erhalten wir daraus |ϕ(x)| ≤ M/β und die Stetigkeit von y(x) ist eine Schlussfolgerung aus (3.35). Sobald die Stetigkeit von y(x) bewiesen ist, ist ϕ(x) auch stetig bei x1 , so dass y(x) bei x1 differenzierbar sein muss. Formel (3.33) erh¨alt man aus der Berechnung von limx→x1 ϕ(x). ⊓ ⊔ Bemerkung. Wenn die Differenzierbarkeit der Funktion y(x) gesichert ist, erh¨ a lt man Gl. (3.33) durch Ableiten der Gleichung F x, y(x) = 0. Diese Methode heißt implizites Ableiten und wurde von uns bereits am Ende von Abschnitt II.1 eingesetzt.
336 IV. Differentialrechnung in mehreren Variablen
y
p
y
p
x
x
ABB. 3.7. Die Funktion (3.38) (Stereogramm)
Differenzierbarkeit von Integralen bez¨uglich eines Parameters Wir wollen nun wissen, ob ein Integral, das einen Parameter p enth¨alt (siehe Gl. (2.23)), eine differenzierbare Funktion von p darstellt; und, falls ja, ob ihre Ableitung durch Vertauschen von Integration und Ableitung berechnet werden kann, d.h. durch die Integration von ∂f /∂p. (3.9) Beispiel. Das Integral Z π/2 eaπ/2 − a (3.36) eax cos x dx = a2 + 1 0
R π/2 l¨asst sich am einfachsten berechnen, indem man den Realteil von 0 e(a+i)x dx bestimmt. Wenn wir beide Seiten von (3.36) mehrfach bez¨uglich a ableiten, so finden wir Z π/2 d n eaπ/2 − a (3.37) xn eax cos x dx = . da a2 + 1 0 Diese Formel ließe sich mit anderen Mitteln nur deutlich schwerer finden.
(3.10) Gegenbeispiel. Schauen wir uns Abb. III.5.5a an, so stellen wir fest, dass sich das Integral von fn (x) f¨ur n → ∞ wie C/n verh¨alt. Dies motiviert die Definition (3.38)
f (x, p) =
x/p xp3 = (1 + x2 /p2 )2 (p2 + x2 )2
f¨ur
p 2 + x2 > 0
und f (0, 0) = 0. Dann besitzt (3.39)
F (p) =
Z
1
f (x, p) dx = 0
p 2(p2 + 1)
die Ableitung F ′ (0) = 1/2. Andererseits ist aber limp→0 (siehe Abb. 3.7).
∂f (x, p) ∂p
identisch Null
IV.3 Differenzierbare Funktionen von mehreren Variablen 337
(3.11) Satz. Es sei f : [a, b] × [c, d] → R eine Funktion, deren partielle Ableitungen ∂f (x, p) auf [a, b] × [c, d] existieren und stetig sind. Falls das Integral ∂p (3.40)
Z
F (p) :=
b
f (x, p) dx
a
f¨ur alle p ∈ [c, d] existiert, so ist F (p) differenzierbar auf (c, d) mit der Ableitung (3.41)
F ′ (p0 ) =
Z
b
a
∂f (x, p0 ) dx. ∂p
Beweis. Wir betrachten die Differenz Z b (3.42) F (p) − F (p0 ) = f (x, p) − f (x, p0 ) dx. a
Wir wenden den Satz von Lagrange (III.6.11) auf die rechte Seite an und finden F (p) − F (p0 ) =
Z
|a
b
∂f (x, η) dx · (p − p0 ). ∂p {z } ϕ(p)
Dabei h¨angt η von x ab und liegt zwischen p und p0 . Da ∂f /∂p auf der kompakten Menge [a, b] × [c, d] stetig ist, sehen wir im Beweis von Satz 2.12, dass ϕ(p) bei p0 stetig sein muss. Die Behauptung folgt nun aus Gl. (III.6.6). ⊓ ⊔
¨ Ubungen 3.1 Betrachten Sie die Funktion f : R2 −→ R (siehe Abb. 3.8a) mit 3 x1 + x32 falls x21 + x22 > 0 f (x1 , x2 ) = x21 + x22 0 falls x1 = x2 = 0.
Ist f stetig? Besitzt f im Ursprung alle Richtungsableitungen? Sind die partiellen Ableitungen ∂f /∂x1 und ∂f /∂x2 stetig? Ist f differenzierbar? p 3.2 Die gleiche Frage wie zuvor f¨ur die Funktion f (x1 , x2 ) = |x1 x2 | (siehe Abb. 3.8c; das Opernhaus von Sydney). 3.3 Zeigen Sie, dass f : R2 −→ R, 1 x x sin 1 2 f (x1 , x2 ) = x21 + x22 0
falls x21 + x22 > 0 falls x1 = x2 = 0
338 IV. Differentialrechnung in mehreren Variablen y
y
x2
x2 x1
x1
y
y x2
x2 x1
x1
y
y
x1
x1
¨ ABB. 3.8. Stereogramme zu den Ubungen 3.1, 3.2 und 3.3
(siehe Abb. 3.8b) u¨ berall differenzierbar ist, die partiellen Ableitungen aber im Ursprung nicht stetig sind. Diese Funktion ist ein zweidimensionales Analogon der Funktion aus Abb. III.6.1. 3.4 Zu einer festen Konstanten a definieren wir f : R2 −→ R durch |x1 x2 |a falls x1 x2 6= 0 f (x1 , x2 ) = 0 falls x1 x2 = 0. Bestimmen Sie diejenigen Werte f¨ur den Parameter a, f¨ur die f a) stetig ist und b) differenzierbar ist. 3.5 Gegeben sei eine konstante n × n-Matrix A. Zeigen Sie, dass die Ableitung der Funktion f : Rn → R mit f (x) = xT Ax bestimmt ist durch f ′ (x) = xT (A + AT ) (falls Sie auf Probleme stoßen, schreiben Sie die Komponenten von f f¨ur den Fall n = 2 explizit auf). 3.6 Es sei V (x, y) eine differenzierbare Funktion und W (r, ϕ) := V (r cos ϕ, r sin ϕ). Wenden Sie die Kettenregel an, um folgende Identit¨at zu zeigen: ∂V 2 ∂x
+
∂V 2 ∂y
=
∂W 2 ∂r
+
1 ∂W 2 . r2 ∂ϕ
IV.3 Differenzierbare Funktionen von mehreren Variablen 339
3.7 Wir nennen eine differenzierbare Funktion f : Rn → R homogen vom Grad p, falls a > 0, x ∈ Rn p erf¨ullt ist. Zeigen Sie, dass die Funktionen tan(x1 /x2 ), 2x21 + 3x22 + 4x23 und x41 − 5x1 x32 + x21 x22 homogen sind (von welchem Grad?), und zeigen Sie weiter, dass homogene Funktionen die folgende Identit¨at erf¨ullen, die im Eulerschen Satz u¨ ber homogene Funktionen auftritt: (3.43)
f (ax) = ap f (x)
x1
f¨ur
∂f ∂f (x) + . . . + xn (x) = pf (x). ∂x1 ∂xn
Hinweis. Leiten Sie (3.43) bez¨uglich a ab. 3.8 Studieren Sie die Funktionen y(x), die durch die implizite Gleichung (x2 + y 2 )2 − 2x2 + 2y 2 = C
(3.44)
definiert sind. F¨ur C = 0 ist dies Jak. Bernoullis (1694) ber¨uhmte Lem” niskate“ (s. Abb. 3.9). Bestimmen Sie die Positionen aller Punkte, an denen ∂F/∂y = 0 gilt, d.h. diejenigen Punkte, an denen der Satz von der impliziten Funktion nicht angewendet werden kann. Finden Sie auch die Positionen der Maximalwerte der L¨osungen von (3.44), d.h. diejenigen Punkte, an denen y ′ (x) = 0 ist, und zeigen Sie, dass diese auf einem Kreis liegen.
−1
0
1
ABB. 3.9. Bernoullis Lemniskate und Cassinische Kurven
3.9 Gleiche Frage f¨ur das folium cartesii“ ” x3 + y 3 = 3xy (siehe Abb. 4.2 unten). 3.10 Berechnen Sie die Punkte x ∈ R2 , an denen die Spalten der Matrix f ′ (x) aus (3.7) Vektoren mit derselben Richtung sind (d.h. det f ′ (x) = 0). Diese Punkte sind in Abb. 3.2 jeweils durch ◦“ und ד markiert. ” ” Antwort. (k+l+3/4)π, (k−l+1/4)π und (k+l+3/4)π, (k−l−3/4)π f¨ur k, l ∈ Z.
340 IV. Differentialrechnung in mehreren Variablen
3.11 Welches der zwei folgenden Integrale ist Ihrer Meinung nach leichter zu berechnen: Z 1 Z 1 2 2 ln x dx oder xa ln x dx ? 0
0
Nun, das zweite l¨asst sich bez¨uglich des Parameters a ableiten. Machen Sie dies (nach Rechtfertigung) und berechnen Sie damit beide Integrale.
3.12 Berechnen Sie unter Zuhilfenahme der Formel Z π dx π = √ 2−1 a − cos x a 0 die zwei Integrale √ Z π dx 5 6π = 2 288 0 (5 − cos x)
und
Z
π 0
f¨ur
a>1
√ dx 11 5π = . (6 − 4 cos x)3 1000
3.13 Zeigen Sie, dass gilt: Z α log (1 + αx) 1 dx = arctan(α) · log(1 + α2 ) 2+1 x 2 0
f¨ur
α ≥ 0.
Hinweis. Leiten Sie nach einer Rechtfertigung das Integral bez¨uglich α ab. 3.14 Beweisen Sie Z ∞ sin x π dx = . x 2 0
Hinweis. Zeigen Sie mit Hilfe von Definition III.8.1, den S¨atzen 3.11 und ¨ III.6.18, sowie Ubung II.4.2.h, dass Z ∞ Z ∞ sin x −1 F (α) = e−αx dx ⇒ F ′ (α) = − e−αx sin x dx = x 1 + α2 0 0 f¨ur α > 0 gilt. Beweisen Sie schließlich durch eine Modifikation des Beweises von Beispiel III.8.5, dass F (α) bei α = 0+ einseitig stetig ist.
IV.4 H¨ohere Ableitungen und Taylorreihen 341
IV.4 H¨ohere Ableitungen und Taylorreihen Jetzt sieht man leicht ein, dass Differentiale dieser Art ihren Wert behalten, wenn man die Reihenfolge der Ableitungen bez¨uglich der verschiedenen Variablen ver¨andert. (Cauchy 1823, R´esum´e, S. 76)
Zun¨achst wollen wir uns Funktionen f (x, y) von zwei Variablen anschauen. Partielle Ableitungen, wie beispielsweise ∂f /∂x, sind wiederum Funktionen von zwei Variablen, so dass wir abermals ihre partiellen Ableitungen berechnen k¨onnen, wie in folgendem Diagramm dargestellt: f (x, y) ∂ ∂y
| | | ↓
∂f ∂y ∂ ∂y
| | | ↓
∂ 2f ∂y 2
∂ ∂x
∂f ∂x | ∂ | ∂y | ↓
−−− − −→
∂ ∂x
−−− − −→
∂2f ? ∂ 2f = ∂x∂y ∂y∂x ∂ ∂y
∂ ∂x
−−− − −→
∂ ∂x
−−− − −→
∂ ∂x
−−− − −→
| | | ↓
∂3f ? ∂ 3f = 2 ∂x∂y 2 ∂y ∂x
∂ ∂x
−−− − −→
∂ 2f ∂x2
...
...
... .
Es stellt sich die Frage, ob diese Ableitungen von der Reihenfolge der Differentiationen abh¨angen. (4.1) Beispiel. Wie einst Euler (1734, p Comm. Acad. Petrop., Band VII, S. 177) betrachten wir die Funktion f (x, y) = x2 + ny 2 und berechnen ihre partiellen Ableitungen (f¨ur x2 + ny 2 > 0): ∂f x (x, y) = p , 2 ∂x x + ny 2 ∂f ny (x, y) = p , ∂y x2 + ny 2
∂ 2f −nxy (x, y) = 2 , ∂y∂x (x + ny 2 )3/2 ∂ 2f −nxy (x, y) = 2 . ∂x∂y (x + ny 2 )3/2
Euler hat danach behauptet (siehe auch Euler 1755, §226), dass auch allgemein (4.1)
∂ 2f ∂2f (x, y) = (x, y) ∂y∂x ∂x∂y
gilt. Dies ist jedoch ohne weitere Voraussetzungen falsch, wie man an folgendem Gegenbeispiel sehen kann. (4.2) Gegenbeispiel. H.A. Schwarz (1873) fand ein erstes, eher kompliziertes ¨ Gegenbeispiel zu (4.1) (siehe Ubung 4.1). Ein einfacheres Gegenbeispiel geht auf
342 IV. Differentialrechnung in mehreren Variablen
Peano (1884, Annotazione N. 103“) zur¨uck. Dieses basiert auf einer Funktion der ” Form (4.2)
f (x, y) = x y g(x, y),
wobei g(x, y) in einer Umgebung des Ursprungs beschr¨ankt (nicht notwendigerweise stetig) sein soll. F¨ur diese Funktion ist ∂f f (x, y) − f (0, y) (0, y) = lim = lim y g(x, y). x→0 x→0 ∂x x Die Ableitung dieses Ausdrucks bez¨uglich y lautet (4.3)
∂ 2f (0, 0) = lim lim g(x, y) , y→0 x→0 ∂y∂x
sofern der Grenzwert existiert. Analog gilt (4.4)
∂ 2f (0, 0) = lim lim g(x, y) . x→0 y→0 ∂x∂y
Wir m¨ussen nun nur noch eine Funktion g(x, y) finden, f¨ur die die Grenzwerte in (4.3) und (4.4) verschieden sind. Dies ist beispielsweise f¨ur (4.5)
g(x, y) =
x2 − y 2 x2 + y 2
falls
x2 + y 2 > 0
der Fall, mit limx→0 g(x, y) = −1 f¨ur alle y 6= 0 und limy→0 g(x, y) = +1 f¨ur alle x 6= 0. Folglich sind die gemischten partiellen Ableitungen ∂2f (0, 0) = −1 ∂y∂x
und
∂2f (0, 0) = 1 ∂x∂y
f¨ur die durch (4.2) und (4.5) definierte Funktion f (x, y) verschieden. (4.3) Satz. Es sei f : R2 → R eine Funktion, f¨ur die die partiellen Ableitungen 2 ∂f ∂f ∂2f , , ∂ f in einer Umgebung von (x0 , y0 ) existieren, und f¨ur die ∂y∂x bei ∂x ∂y ∂y∂x (x0 , y0 ) stetig ist. Dann existiert auch
∂2f ∂x∂y
bei (x0 , y0 ) und es gilt
∂2f ∂ 2f (x0 , y0 ) = (x0 , y0 ). ∂x∂y ∂y∂x Beweis. Der Ansatz besteht darin, ein kleines Rechteck der Seitenl¨angen h und k zu betrachten. Die Werte von f an den Eckpunkten seien f00 , f01 , f10 und f11 . N¨aherungsweise sind die partiellen Ableitungen bestimmt durch
y0 + k
f01
f11
f00
f10
k y0
x0
h
x0 + h
IV.4 H¨ohere Ableitungen und Taylorreihen 343
(4.6)
∂f f10 − f00 (x0 , y0 ) ≈ , ∂x h ∂f f11 − f01 (x0 , y0 + k) ≈ , ∂x h
(4.7)
∂ 2f ≈ ∂y∂x
∂f ∂x (x0 , y0
+ k) − k
∂f ∂x (x0 , y0 )
(x0 + h, y0 ) −
∂f (x0 , y0 ) ∂y
≈
f11 − f01 − f10 + f00 h·k
≈
f11 − f10 − f01 + f00 . k·h
und analog (4.8)
∂2f ≈ ∂x∂y
∂f ∂y
h
Die Ausdr¨ucke auf der rechten Seite von (4.7) und (4.8) stimmen u¨ berein (Euler, . . . huius theorematis veritatem exercitati facile perspiciant . . .“) und die Behaup” tung des Satzes scheint offensichtlich zu sein. Um nun diesen Ansatz zu einem strengen Beweis zu formen, sollten wir die Differenzen in (4.6) mit Hilfe des Satzes III.6.11 von Lagrange ersetzen. Es gibt allerdings ein kleines Problem, da die Zwischenpunkte ξ nicht f¨ur beide Differenzen dieselben sind. Um dieses Problem zu u¨ berwinden, betrachten wir stattdessen die Funktion (4.9)
g(x) := f (x, y0 + k) − f (x, y0 ),
wenden den Satz von Lagrange in der Form g(x0 + h) − g(x0 ) = hg ′ (ξ) an, und finden ∂f ∂f f11 − f10 − f01 + f00 = h (ξ, y0 + k) − (ξ, y0 ) . ∂x ∂x Dabei liegt ξ zwischen x0 und x0 + h. Als n¨achstes wenden wir den Satz von Lagrange auf ∂f (ξ, y) an, was wir als Funktion von y verstehen wollen, und er∂x halten: (4.10)
f11 − f10 − f01 + f00 ∂2f = (ξ, η) h·k ∂y∂x
(η liegt zwischen y0 und y0 + k). ∂2 f Aufgrund der Stetigkeit von ∂y∂x bei (x0 , y0 ) folgt aus (4.10), dass es zu jedem ε > 0 ein δ > 0 gibt, so dass f¨ur alle h und k mit h2 + k 2 < δ 2 f − f − f + f ∂2f 11 10 01 00 − (x0 , y0 ) < ε h·k ∂y∂x erf¨ullt ist. F¨ur k → 0 streben die Differenzen (f11 − f10 )/k und (f01 − f00 )/k gegen ∂f (x0 + h, y0 ) bzw. ∂f (x0 , y0 ). F¨ur |h| < δ folgt somit: ∂y ∂y 1 ∂f ∂f ∂2f (x0 + h, y0 ) − (x0 , y0 ) − (x0 , y0 ) ≤ ε. h ∂y ∂y ∂y∂x
344 IV. Differentialrechnung in mehreren Variablen
Dies bedeutet jedoch, dass lim
h→0
1 ∂f ∂f ∂ 2f (x0 + h, y0 ) − (x0 , y0 ) = (x0 , y0 ) h ∂y ∂y ∂y∂x
gilt, womit die Behauptung des Satzes gezeigt ist.
⊓ ⊔
Wenn wir diesen Satz mehrfach anwenden, k¨onnen wir nun h¨ohere Ableitungen miteinander vertauschen. Beispielsweise ist ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ f= f= f = ... . ∂x ∂y ∂x ∂x ∂y ∂x ∂x ∂y ∂x ∂y ∂x ∂x ∂x ∂y ∂y | {z } | {z } | {z } |{z} g տր տր g
Der Satz l¨asst sich auch auf Funktionen von mehr als zwei Variablen anwenden. Tats¨achlich k¨onnen wir stets zwei partielle Ableitungen vertauschen, da die u¨ brigen Variablen als konstant angesehen werden k¨onnen.
Taylorreihen in zwei Variablen Unser n¨achstes Ziel besteht darin, die Taylorreihen von Funktionen von zwei Variablen zu verstehen. Der Ansatz (Cauchy 1829, S. 244) besteht darin, das Problem auf eine Variable zur¨uckzuf¨uhren, indem man die Punkte (x0 , y0 ) und (x0 + h, y0 + k) durch ein gerades Streckenst¨uck verbindet. Wir betrachten also die Funktion (4.11)
g(t) := f (x0 + th, y0 + tk)
und wenden Gl. (III.7.18) an (Taylorreihe in einer Variablen). Hierf¨ur m¨ussen wir die Ableitungen von g(t) berechnen. Falls f (x, y) gen¨ugend oft ableitbar ist, liefert die Kettenregel (4.12)
g ′ (t) =
∂f ∂f (x0 + th, y0 + tk) h + (x0 + th, y0 + tk) k ∂x ∂y
und eine weitere Ableitung liefert (4.13)
g ′′ (t) =
∂ 2f ∂2f ∂ 2f ∂ 2f (·)hh + (·)hk + (·)kh + (·)kk. 2 ∂x ∂y∂x ∂x∂y ∂y 2
Dabei steht (·) f¨ur das Argument (x0 + th, y0 + tk). Die zwei mittleren Terme in (4.13) sind nach Satz 4.3 gleich (weitere Ableitungen lassen analog die Binomialkoeffizienten in Erscheinung treten). Setzen wir die obigen Ableitungen von g(t) beispielsweise in g(1) = g(0) + g ′ (0) + ein (mit 0 < θ < 1), so finden wir
1 ′′ 1 g (0) + g ′′′ (θ) 2 6
IV.4 H¨ohere Ableitungen und Taylorreihen 345
∂f ∂f (x0 , y0 )h + (x0 , y0 )k ∂x ∂y 1 ∂ 2f ∂2f ∂ 2f 2 2 + (x , y )h + 2 (x , y )hk + (x , y )k 0 0 0 0 0 0 2 ∂x2 ∂x∂y ∂y 2 3 3 1 ∂ f ∂ f + (ξ, η)h3 + 3 2 (ξ, η)h2 k 6 ∂x3 ∂x ∂y ∂ 3f ∂ 3f 2 3 +3 (ξ, η)hk + (ξ, η)k , ∂x∂y 2 ∂y 3
f (x0 + h, y0 + k) = f (x0 , y0 ) +
(4.14)
wobei ξ = x0 + θh und η = y0 + θk die Zwischenpunkte sind. Es ist nat¨urlich ebenso m¨oglich, Satz III.7.13 mit dem Restglied in Integralform zu verwenden. (4.4) Beispiel. Wir betrachten die Funktion f (x, y) = e−x Ihre partiellen Ableitungen lauten
2
−y 2
¨ (vgl. Ubung 3.1).
2 2 2 2 ∂f ∂f (x, y) = −2xe−x −y , (x, y) = −2ye−x −y , ∂x ∂y 2 2 2 2 ∂2f ∂2f (x, y) = (4x2 − 2)e−x −y , (x, y) = (4y 2 − 2)e−x −y , 2 ∂x ∂y 2 2 2 ∂ 2f ∂ 2f (x, y) = (x, y) = 4xye−x −y . ∂x∂y ∂y∂x
Wenn wir das Restglied in (4.14) vernachl¨assigen und x0 = 0,9, y0 = 1,2 w¨ahlen, erhalten wir die quadratische Approximation f (0,9 + h, 1,2 + k) ≈ e−2,25 1 − 1,8h − 2,4k + 0,62h2 + 4,32hk + 1,88k 2 .
Abb. 4.1 zeigt einen Vergleich zwischen dieser N¨aherung und der Funktion f (x, y). Der dargestellte Definitionsbereich ist dabei das Rechteck −1 ≤ x ≤ 2, −1 ≤ y ≤ 2.
y x
y x
ABB. 4.1. Zweite Taylor-N¨aherung f¨ur f (x, y) = e−x
2
−y 2
346 IV. Differentialrechnung in mehreren Variablen
Taylorreihen in n Variablen Wir verallgemeinern nun unsere Formeln auf Funktionen f : Rn → Rm ,
T wobei f (x) = f1 (x), . . . , fm (x) aus m reellen Funktionen von x ∈ Rn zusammengesetzt ist. Wir halten x0 ∈ Rn und h ∈ Rn fest und wenden die Resultate aus Abschnitt III.7 auf g(t) := fi (x0 + th) an. Wir erhalten so zum Beispiel fi (x0 + h) = fi (x0 ) +
n n n X ∂fi 1 X X ∂ 2 fi (x0 )hj + (x0 ) hj hk ∂xj 2! j=1 ∂xj ∂xk j=1 k=1
(4.15)
+
1 3!
n X n X n X j=1 k=1 ℓ=1
3
∂ fi (x0 + θi h) hj hk hℓ . ∂xj ∂xk ∂xℓ
Wir k¨onnen noch weiter gehen und schreiben (formal, ohne die Konvergenz zu ber¨ucksichtigen): fi (x0 + h) = fi (x0 ) +
∞ n n n X 1 X X X ∂ q fi (x0 ) ... hj . . . hjq . q! j =1 j =1 j =1 ∂xj1 ∂xj2 . . . ∂xjq 1 q=1 1
q
2
Diese Formeln sind ziemlich sperrig und rufen nach einer kompakteren Schreibweise, die, in den Worten Dieudonn´es, die Index-Horden verjagt“. Der lineare ” Term in (4.15) ist gerade die i-te Komponente des Produktes f ′ (x0 )h (JacobiMatrix angewendet auf den Vektor h). Um den quadratischen Term zu vereinfachen, betrachten wir die bilineare Abbildung f ′′ (x) : Rn × Rn → Rm , deren i-te Komponente, angewendet auf ein Paar von Vektoren u und v, definiert ist als
(4.16)
f ′′ (x)(u, v)
i
:=
n X n X ∂ 2 fi (x) uj vk . ∂xj ∂xk j=1 k=1
Daher ist der quadratische Term in (4.15) der i-te Eintrag im Vektor f ′′ (x0 )(h, h). Wir k¨onnen diese Notation fortsetzen, indem wir h¨ohere Ableitungen als entsprechende multilineare Abbildungen verstehen. Beispielsweise ist f ′′′ (x) : Rn × Rn × Rn → Rm definiert als (4.17)
n X n X n X f ′′′ (x)(u, v, w) := i
j=1 k=1 ℓ=1
∂ 3 fi (x) uj vk wℓ . ∂xj ∂xk ∂xℓ
Mit dieser Schreibweise wird aus Gleichung (4.15): (4.18)
f (x0 + h) = f (x0 ) + f ′ (x0 )h +
1 ′′ f (x0 )(h, h) + R3 . 2!
IV.4 H¨ohere Ableitungen und Taylorreihen 347
F¨ur den Rest R3 d¨urfen wir allerdings nicht R3 = (1/3!)f ′′′ (x0 + θh)(h, h, h) schreiben, da die Zwischenpunkte x0 + θi h in (4.15) f¨ur jede Komponente verschieden sein k¨onnten. Jedoch k¨onnen wir die Integraldarstellung (Satz III.7.13) nutzen, mit dem Ergebnis Z 1 (1 − t)2 ′′′ (4.19) R3 = f (x0 + th)(h, h, h) dt. 2! 0 T (4.5) Bemerkung. F¨ur eine vektor-wertige Funktion g(t) = g1 (t), . . . , gm (t) verwenden wir die Notation Z 1 Z 1 Z 1 T (4.20) g(t) dt := g1 (t) dt, . . . , gm (t) dt . 0
0
0
Desweiteren nutzen wir im folgenden die Absch¨atzung
Z 1
Z 1
(4.21) g(t) dt ≤ kg(t)k dt,
0
0
die mittels Dreiecksungleichung und Riemann-Summen erschließt: Pman wie folgtP k i g(ξi )δi k ≤ i kg(ξi )kδi .
Absch¨atzung des Restglieds. Angenommen, wir wollen den Rest R3 in (4.19) absch¨atzen. Angesichts der Ungleichung (4.21) m¨ussen wir daf¨ur nur den Ausdruck kf ′′′ (x)(h, h, h)k absch¨atzen. F¨ur die euklidische Norm ist dies durch wiederholte Anwendung der Cauchy-Schwarz-Ungleichung m¨oglich. Schreiben wir den Ausdruck aus Gl. (4.17) als ai , so finden wir ai := bij := cijk :=
n X
j=1 n X
k=1 n X
a2i ≤
bij uj ,
b2ij ≤
cijk vk ,
c2ijk ≤
dijkℓ wℓ ,
ℓ=1
n X j=1
n X k=1
n X ℓ=1
b2ij kuk2 ,
c2ijk kvk2 ,
d2ijkℓ kwk2 ,
3
fi (x) wobei dijkℓ = ∂x∂j ∂x ist. Setzen wir aus der letzten Ungleichung c2ijk in k ∂xℓ die vorhergehende ein, und setzen wir danach b2ij in die erste Ungleichung ein, so erhalten wir n X n X n X a2i ≤ d2ijkℓ kuk2 kvk2 kwk2 . j=1 k=1 ℓ=1
Wir k¨onnen nun die Summe (4.22)
P
2 i ai
und ihre Quadratwurzel berechnen:
kf ′′′ (x)(u, v, w)k ≤ M (x) kuk kvk kwk
348 IV. Differentialrechnung in mehreren Variablen
mit (4.23)
v uX n X n X n um X M (x) = t i=1 j=1 k=1 ℓ=1
2 ∂ 3 fi (x) . ∂xj ∂xk ∂xℓ
(4.6) Lemma. Es sei f : Rn → Rm dreimal differenzierbar; dann gilt f¨ur das Restglied R3 in Gl. (4.18) kR3 k ≤
khk3 sup M (x0 + th), 3! t∈[0,1]
wobei M (x) in (4.23) definiert ist. Beweis. Wenden wir die Absch¨atzung (4.21) auf (4.19) an, so finden wir Z 1 (1 − t)2 ′′′ kR3 k ≤ kf (x0 + th)(h, h, h)k dt. 2! 0 Aufgrund von (4.22) ist der Ausdruck kf ′′′ (x0 + th)(h, h, h)k h¨ochstens gleich supt∈[0,1] M (x0 + th)khk3 und die Behauptung folgt aus Gl. (III.5.18). ⊓ ⊔
Optimierungsprobleme Unser n¨achstes Ziel besteht darin, die Ergebnisse aus Abschnitt II.2 u¨ ber notwendige und hinreichende Bedingungen f¨ur lokale Maxima (und Minima) auf Funktionen z = f (x, y) von zwei Variablen auszudehnen. Wir haben bereits in Abschnitt IV.3 (geometrische Interpretation des Gradienten) gesehen, dass grad f (x0 , y0 ) = 0 ist, d.h. (4.24)
∂f (x0 , y0 ) = 0, ∂x
∂f (x0 , y0 ) = 0 ∂y
ist eine notwendige Bedingung f¨ur ein Maximum (oder Minimum). Punkte, die (4.24) erf¨ullen, heißen station¨are Punkte von f (x, y). In einer gen¨ugend kleinen Umgebung eines station¨aren Punktes (x0 , y0 ) (wenn also |x − x0 | und |y − y0 | gen¨ugend klein sind), kann man das Restglied in (4.14) vernachl¨assigen und die Bedingung (4.25)
∂ 2f ∂ 2f ∂2f (x0 , y0 )h2 + 2 (x0 , y0 )hk + (x0 , y0 )k 2 > 0 2 ∂x ∂x∂y ∂y 2
garantiert einem, dass f (x0 + h, y0 + k) > f (x0 , y0 ) ist (falls die Funktion nur zweimal stetig differenzierbar ist, nehmen wir einen Term weniger aus der Taylorreihe und nutzen die Stetigkeit der zweiten partiellen Ableitungen aus). Folglich finden wir ein lokales Minimum vor, wenn (4.25) f¨ur alle (h, k) 6= (0, 0) gilt.
IV.4 H¨ohere Ableitungen und Taylorreihen 349
Falls der Ausdruck in Gl. (4.25) f¨ur alle (h, k) 6= (0, 0) negativ ist, haben wir entsprechend ein lokales Maximum vorliegen. Falls (4.25) abh¨angig von (h, k) sowohl positive als auch negative Werte annehmen kann, hat die Funktion einen Sattelpunkt bei (x0 , y0 ), d.h. es gibt Richtungen, in denen die Funktion w¨achst und andere Richtungen, in denen sie abnimmt. Um zu u¨ berpr¨ufen, ob eine quadratische Form Ah2 + 2Bhk + Ck 2 f¨ur s¨amtliche Werte (h, k) 6= (0, 0) positiv ist, setzen wir λ = h/k ein und betrachten Aλ2 + 2Bλ + C. Dieses Polynom nimmt nur positive Werte an, falls A > 0 und AC − B 2 > 0 erf¨ullt sind, und nur negative Werte im Fall A < 0 und AC − B 2 > 0. Wir haben damit das folgende Resultat bewiesen, welches aus dem allerersten Artikel des jungen Lagrange stammt. (4.7) Satz (Lagrange 1759). Es sei f : R2 → R eine zweimal stetig differenzierbare Funktion. Außerdem sei (4.24) erf¨ullt. a)
Der Punkt (x0 , y0 ) ist ein lokales Minimum, falls bei (x0 , y0 ) gilt: (4.26)
b)
und
∂ 2 f ∂ 2 f ∂ 2 f 2 − > 0. ∂x2 ∂y 2 ∂x∂y
Der Punkt (x0 , y0 ) ist ein lokales Maximum, falls bei (x0 , y0 ) gilt: (4.27)
c)
∂2f >0 ∂x2
∂2f 0. ∂x2 ∂y 2 ∂x∂y
Falls ∂ 2 f ∂ 2 f ∂ 2 f 2 − 0 f¨ur alle h 6= 0 erf¨ullt, dann ist der Punkt x0 ein lokales Minimum. Ein station¨arer Punkt x0 ist ein lokales Maximum, wenn H(x0 ) negativ-definit“ ” ist, also hT H(x0 )h < 0 f¨ur alle h 6= 0 ist. Um festzustellen, ob eine Matrix der Dimension ≥ 3 positiv- (bzw. negativ-)definit ist, verweisen wir auf die Standardliteratur u¨ ber lineare Algebra, beispielsweise Halmos (1958, S. 141, 153).
IV.4 H¨ohere Ableitungen und Taylorreihen 351
Extrema mit Nebenbedingungen (Lagrange-Multiplikatoren) Problem. Gesucht ist ein lokales Maximum (oder Minimum) einer Funktion f (x, y) unter der Nebenbedingung g(x, y) = 0. Wenn wir die H¨ohenlinien von g mit A = {(x, y) | g(x, y) = 0} notieren, so suchen wir also (x0 , y0 ) ∈ A, so dass f (x, y) ≤ f (x0 , y0 ) f¨ur alle (x, y) ∈ A gilt. Ein direkter Ansatz besteht darin, die Gleichung g(x, y) = 0 nach y aufzul¨osen, mit Satz 3.8 von der impliziten Funktion also y = G(x) zu erhalten, und dann nach einem Extremum von F (x) = f x, G(x) zu suchen. Allgemein k¨onnten wir versuchen, eine Parametrisierung x(t), y(t) der H¨ohenlinie A zu finden und die Funktion F (t) = f x(t), y(t) zu betrachten. Eine notwendige Bedingung an ein Extremum bei (x0 , y0 ) = x(t0 ), y(t0 ) ist dann F ′ (t0 ) = 0, also (4.32)
∂f ∂f (x0 , y0 )x′ (t0 ) + (x0 , y0 )y ′ (t0 ) = 0. ∂x ∂y
Dies ist eine Gleichung f¨ur t0 und sucht alle denkbaren Kandidaten f¨ur die L¨osung heraus. Allerdings ist dieser Ansatz selten praktikabel, da eine geeignete Parametrisierung meist schwer zu finden ist. Lagranges Idee (Lagrange 1788, premi`ere partie, Abschnitt IV, §1, Oeuvres, Band 11, S. 78). Gleichung (4.32) l¨asst sich dahingehend interpretieren, dass grad f (x0 , y0 ) senkrecht auf dem Tangentialvektor x′ (t0 ), y ′ (t0 ) der H¨ohenlinie A steht. Nach Abschnitt IV.3 zeigen daher bei einem lokalen Extremum die Vektoren grad f (x0 , y0 ) und grad g(x0 , y0 ) in dieselbe Richtung (siehe Abb. 4.3), und wir finden die notwendige Bedingung (4.33)
grad f (x0 , y0 ) = λ grad g(x0 , y0 ),
g(x0 , y0 ) = 0
(falls grad f (x0 , y0 ) 6= 0 ist). Der Parameter λ heißt Lagrange-Multiplikator. Die Gleichungen (4.33) entsprechen zusammen drei Bedingungen an die drei Parameter x0 , y0 und λ. Mit Hilfe der Funktion (4.34)
L(x, y, λ) := f (x, y) − λg(x, y)
l¨asst sich Bedingung (4.33) also wie folgt elegant ausdrucken: (4.35)
grad L(x0 , y0 , λ) = 0.
(4.9) Beispiel. Es seien die positiven Zahlen a, b und p > 1 gegeben. Wir suchen das Maximum von (4.36)
f (x, y) = ax + by
im Bereich x > 0, y > 0 unter der Nebenbedingung g(x, y) = xp + y p − 1 = 0 (siehe Abb. 4.3). Benutzen wir Lagranges Idee, so m¨ussen wir die Funktion
352 IV. Differentialrechnung in mehreren Variablen grad g
y
grad f
grad f und grad g
max
grad g
grad f
grad f
x
grad g
grad f
Geraden ax+by=const
grad f
min grad g
grad g
ABB. 4.3. Maximum mit Nebenbedingung f¨ur f (x, y) = x + 2y, p = 3
L(x, y, λ) = ax + by − λ(xp + y p − 1) betrachten, und aus der notwendigen Bedingung (4.35) wird (4.37)
a − pλxp−1 = 0, 0
b − pλy0p−1 = 0,
xp0 + y0p = 1.
Die ersten zwei Gleichungen liefern (4.38)
x0 =
a 1/(p−1) , λp
y0 =
b 1/(p−1) . λp
Setzen wir diese Werte in die letzte Gleichung in (4.37) ein, finden wir a q b q + =1 λp λp
(4.39) mit (4.40)
q=
p p−1
bzw.
1 1 + = 1. p q
Gleichung (4.39) erlaubt es uns nun, λ zu berechnen. Setzen wir das Ergebnis in (4.38) ein, finden wir schließlich die L¨osung (4.41)
x0 =
aq/p aq + b
, q 1/p
y0 =
bq/p aq + bq
1/p .
In Abb. 4.3 sehen wir, dass dies das gesuchte Maximum ist.
IV.4 H¨ohere Ableitungen und Taylorreihen 353
H¨oldersche Ungleichung (H¨older 1889). Es seien ξ, η und p > 1 positive Zahlen. Dann erf¨ullen ξ η x= y= 1/p , 1/p ξp + ηp ξp + ηp die Bedingung xp + y p = 1 und aus Beispiel 4.9 folgt
aξ + bη aq + bq = ax + by ≤ ax + by = 0 0 1/p . ξ p + η p )1/p aq + bq
Wir erhalten also die Ungleichung
aξ + bη ≤ ξ p + η p )1/p aq + bq
1/q
,
wobei p und q nach (4.40) zusammenh¨angen. Durch Induktion nach n l¨asst sich diese Ungleichung verallgemeinern zu n X
(4.42)
i=1
xi y i ≤
n X i=1
xpi
n 1/p X
yiq
i=1
1/q
f¨ur beliebige positive Zahlen xi und yi . Dies ist die sogenannte H¨older-Ungleichung. Der Spezialfall p = q = 2 ist wieder die Cauchy-Schwarz-Ungleichung (1.5). Mittels (4.42) k¨onnen wir nun die Dreiecksungleichung f¨ur die Normen kxkp aus Gl. (1.9) beweisen: Gegeben zwei Vektoren x, y ∈ Rn gilt n¨amlich kx + ykpp =
n X i=1
|xi + yi |p ≤
n X i=1
|xi | · |xi + yi |p−1 +
n X i=1
|yi | · |xi + yi |p−1 .
Wenden wir (4.42) auf die zwei Summen auf der rechten Seite der Ungleichung an, finden wir: n X i=1
p−1
|xi | · |xi + yi |
≤
n X i=1
|xi |
p
n 1/p X i=1
|xi + yi |q(p−1)
1/q
= kxkp · kx + ykp−1 . p Dies f¨uhrt auf kx + ykpp ≤ kxkp + kykp · kx + ykp−1 und es folgt die Dreiecksp ungleichung kx + ykp ≤ kxkp + kykp .
354 IV. Differentialrechnung in mehreren Variablen
¨ Ubungen 4.1 (H.A. Schwarz 1873). Zeigen Sie, dass die zweiten Ableitungen der Funktion 2 x arctan xy − y 2 arctan xy falls xy 6= 0 f (x, y) = 0 falls xy = 0, ∂ 2f ∂ 2f 6= . ∂x∂y ∂y∂x 4.2 Zeigen Sie, dass die Taylor-Formel (4.14) nur dann gilt, wenn alle beteiligten Ableitungen stetig sind. Dies steht im Kontrast zum Fall mit nur einer Variablen (siehe bspw. Satz III.6.11). Wir betrachten das folgende Gegenbeispiel von Peano (1884, Annotazione N. 109“), ” ( xy p falls x2 + y 2 6= 0 f (x, y) = x2 + y 2 0 sonst im Ursprung voneinander abweichen:
am Punkt x0 = y0 = −a, h = k = a + b. Schreiben wir Gl. (4.14) mit dem Fehlerterm erster Ordnung f (x0 + h, y0 + k) = f (x0 , y0 ) +
∂f ∂f (ξ, η)h + (ξ, η)k ∂x ∂y
mit den Zwischenpunkten ξ = x0 + θh und η = y0 + θk, so sehen wir anhand von Peanos Gegenbeispiel, dass diese Gleichung nicht immer erf¨ullt ist. Dieses Beispiel verbesserte einen Fehler in Serrets Buch. 4.3 Analysieren Sie in Beispiel 4.4 die Schnittmengen des Graphen der Funktion f (x, y) mit dem Graphen ihrer Taylorn¨aherung zweiten Grades in einer Umgebung von (x0 , y0 ), und erkl¨aren Sie die sternf¨ormigen Kurven (siehe Abb. 4.1). Was war Ihrer Meinung nach die Intention des Autors, den Punkt (0,9; 1,2) f¨ur die Grafik zu w¨ahlen, und nicht etwa, wie in Abb. 3.1, den Punkt (0,8; 1,0)? Hinweis. Benutzen Sie die Fehler-Formel in (4.14). 4.4 Es sei f : R2 → R eine differenzierbare Funktion, die grad f (x) = g(x) · xT f¨ur eine Funktion g : R2 → R erf¨ullt. Zeigen Sie, dass f auf dem Kreis {x ∈ R2 ; kxk = r} konstant ist.
4.5 Zeigen Sie, dass U = (x2 + y 2 + z 2 )−1/2 die Differentialgleichung von Laplace erf¨ullt: ∂ 2U ∂2U ∂ 2U + + =0 2 2 ∂x ∂y ∂z 2
f¨ur
x2 + y 2 + z 2 > 0.
IV.4 H¨ohere Ableitungen und Taylorreihen 355
4.6 Finden Sie die station¨aren Punkte der Funktion 2 f (x, y) = x2 + y 2 − 8xy
und studieren Sie die H¨ohenkurven f (x, y) = Const in deren Umgebungen. ¨ (Jede Ahnlichkeit zwischen diesen Kurven und bereits bekannten Kurven ist beabsichtigt.) √ 4.7 Finden Sie den Maximalwert von 3 xyz unter der Nebenbedingung (x + y + z)/3 = 1 . Welche Schlussfolgerung kann man aus dem Ergebnis ziehen? (Wir haben bereits in Beispiel 4.9 gesehen, dass die Berechnung eines Maximums mit Nebenbedingungen ein ausgezeichnetes Werkzeug ist, um interessante Ungleichungen zu erzeugen.) 4.8 Finden Sie die Maxima und Minima von x2 + y 2 + z 2 unter den Nebenbedingungen x2 y2 z2 + + =1 und z = x + y. 4 9 25 Bemerkung. Wenn es zwei Nebenbedingungen zu erf¨ullen gibt, m¨ussen Sie auch zwei Lagrange-Multiplikatoren einf¨uhren. 4.9 Es sei A=
√
2+1 0
√1 2
die Matrix aus dem Beispiel in Abschnitt IV.2. Finden Sie das Maximum der Funktion f (x) = kAxk22 unter der Nebenbedingung kxk22 − 1 = 0. Das Ergebnis ist der Wert kAk2 , wie er in Gl. (2.14) definiert wurde.
4.10 Zeigen Sie, dass die Funktion f : R2 → R,
f (x, y) = (y − x2 )(y − 2x2 ), im Ursprung einen station¨aren Punkt besitzt, jedoch kein lokales Minimum. Jedoch besitzt die Funktion ein lokales Minimum auf jeder Geraden, die durch den Ursprung geht. Mit diesem Gegenbeispiel berichtigte Peano (1884, Annotazioni N. 133–136“) einen weiteren Fehler in Serrets Buch. Der” art respektlose Kritik eines 25-j¨ahrigen italienischen Niemand“ am Werk ” der gr¨oßten franz¨osischen Mathematiker wurde nicht von allen begeistert aufgenommen (siehe bspw. Peanos Opere, S. 40–46).
356 IV. Differentialrechnung in mehreren Variablen
IV.5 Mehrdimensionale Integrale Wir wissen, dass die Auswertung oder auch nur die Zur¨uckf¨uhrung eines Vielfachintegrals im allgemeinen sehr große Probleme aufwirft . . . (Dirichlet 1839, Werke, Band I, S. 377)
Das Riemann-Integral einer Funktion von einer Variablen (Abschnitt III.5) misst die Fl¨ache zwischen der Funktion und der x-Achse. Wir wollen dieses Konzept auf Funktionen f : A → R (mit A ⊂ R2 ) von zwei Variablen erweitern, dabei soll das Integral das Volumen zwischen der Oberfl¨ache z = f (x, y) und der (x, y)Ebene messen. Viele Definitionen und Ergebnisse aus Abschnitt III.5 k¨onnen dann direkt u¨ bertragen werden. Allerdings treten zus¨atzliche technische Probleme auf, da beliebige Bereiche im R2 oft deutlich komplizierter sind als beliebige Bereiche in R (siehe Abb. 5.1). Die Verallgemeinerung auf Funktionen von mehr als zwei Variablen ist dann mehr oder minder offensichtlich.
d
I
A A
c a
b
Rechteck
nicht konvex
nicht zusammenh¨angend
ABB. 5.1. M¨ogliche Integrationsbereiche im R2
Doppelintegrale u¨ ber ein Rechteck Wir beginnen mit Funktionen f : I → R, deren Definitionsbereich I = [a, b] × [c, d] = {(x, y) | a ≤ x ≤ b, c ≤ y ≤ d} ein abgeschlossenes und beschr¨anktes Rechteck im R2 ist. Dar¨uber hinaus soll die Funktion beschr¨ankt sein, also es soll gelten: (5.1)
∃ M ≥ 0 ∀ (x, y) ∈ I
Wir betrachten Unterteilungen (5.2)
Dx = {x0 , x1 , . . . , xn } Dy = {y0 , y1 , . . . , ym }
|f (x, y)| ≤ M. von [a, b], von [c, d],
mit a = x0 < x1 < . . . < xn = b und c = y0 < y1 < . . . < ym = d, bezeichnen die kleinen in Abb. 5.2 dargestellten Rechtecke mit Iij = [xi−1 , xi ] × [yj−1 , yj ] und ihre Fl¨achen mit (5.3)
µ(Iij ) = (xi − xi−1 )(yj − yj−1 ).
IV.5 Mehrdimensionale Integrale 357
ym=d
yj Iij yj−1 : y1 c a
x1
x2 . . .
xi−1
xi
xn = b
ABB. 5.2. Unterteilung eines Rechtecks und ein Iij
Mit der Notation (5.4)
fij =
inf
(x,y)∈Iij
f (x, y),
Fij =
sup
f (x, y)
(x,y)∈Iij
lassen sich obere und untere Summen definieren: n X m n X m X X (5.5) s(Dx × Dy ) = fij µ(Iij ), S(Dx × Dy ) = Fij µ(Iij ). i=1 j=1
i=1 j=1
Wenn wir der Unterteilung Dx (oder Dy ) Punkte hinzuf¨ugen, wird die untere Summe nicht weniger und die obere Summe nicht mehr (vgl. Lemma III.5.1). Außerdem kann eine untere Summe niemals gr¨oßer sein als eine obere Summe (Lemma III.5.2). Somit macht die folgende Definition Sinn. (5.1) Definition. Die Funktion f : I → R erf¨ulle (5.1). Falls (5.6)
sup s(Dx × Dy ) =
(Dx ,Dy )
inf
(Dx ,Dy )
S(Dx × Dy )
ist, dann ist f (x, y) auf I integrierbar und wir bezeichnen den Wert (5.6) mit Z ZZ (5.7) f (x, y) d(x, y) oder f (x, y) d(x, y). I
I
Als direkte Folgerung aus dieser Definition und den oben genannten Eigenschaften sehen wir, dass f : I → R genau dann integrierbar ist, wenn gilt (siehe Satz III.5.4): (5.8)
∀ε > 0
e x, D e y ) S(D ex × D e y ) − s(D ex × D e y ) < ε. ∃ (D
Der Satz von Du Bois-Reymond (Satz III.5.8) besitzt ebenfalls ein Analogon.
358 IV. Differentialrechnung in mehreren Variablen
(5.2) Satz. Es sei Dδ die Menge aller Paare von Unterteilungen (Dx , Dy ) mit maxi (xi − xi−1 ) < δ und maxj (yj − yj−1 ) < δ. Eine Funktion f : I → R, die (5.1) erf¨ullt, ist genau dann integrierbar, wenn gilt: ∀ε > 0
∃ δ > 0 ∀ (Dx , Dy ) ∈ Dδ
S(Dx × Dy ) − s(Dx × Dy ) < ε.
e x, D e y ) wie in (5.8). Diese Unterteilung Beweis. F¨ur ein gegebenes ε > 0 sei (D definiert ein Gitter im Inneren von [a, b] × [c, d]. Die Gesamtl¨ange aller Strecken im Gitter betr¨agt L = (e n − 1)(d − c) + (m e − 1)(b − a) (siehe Abb. 5.3 links). Wir w¨ahlen nun eine beliebige Unterteilung (Dx , Dy ) ∈ Dδ , setzen ∆ = S(Dx × e x , D ′ = Dy ∪ D e y und ∆′ = S(D′ × Dy ) − s(Dx × Dy ) sowie Dx′ = Dx ∪ D y x Dy′ ) − s(Dx′ × Dy′ ). Genauso wie in Gl. (III.5.10) erhalten wir dann (sieh Abb. 5.3 rechts) ∆ ≤ ∆′ + L · δ · 2M. Die Schlussfolgerung ist nun dieselbe wie im Beweis von Satz III.5.8.
⊓ ⊔
ex × D ey (links), Unterteilung Dx′ × Dy′ , Elemente Iij von ABB. 5.3. Unterteilung D ex × D e y schneiden (rechts) Dx′ × Dy′ , die D
Es seien ξ1 , . . . , ξn und η1 , . . . , ηm derart, dass xi−1 ≤ ξi ≤ xi und yj−1 ≤ ηj ≤ yj ist. Dann folgt aus Satz 5.2, dass unter der Voraussetzung maxi (xi − xi−1 ) < δ und maxj (yj − yj−1 ) < δ (5.9)
X ZZ m n X f (ξi , ηj )(xi − xi−1 )(yj − yj−1 ) − f (x, y) d(x, y) < ε i=1 j=1
I
sein muss. Die Ungleichung gr¨undet darauf, dass sowohl die Summe als auch das Integral in (5.9) zwischen s(Dx × Dy ) und S(Dx × Dy ) liegen. Pm Iterierte Integrale. Die innere Summe in Gl. (5.9), also j=1 f (ξi , ηj )(yj − yj−1 ), ist eine Riemann-Summe der Funktion f (ξi , y). Wenn wir annehmen, dass
IV.5 Mehrdimensionale Integrale 359
diese Funktion f¨ur alle i (im Sinne der Definition III.5.3) integrierbar ist, erhalten wir aus (5.9): n Z d ZZ X (5.10) f (ξi , y) dy (xi − xi−1 ) − f (x, y) d(x, y) ≤ ε. c
i=1
I
Wieder werden wir hier Rmit einer Riemann-Summe konfrontiert, doch dieses Mal d f¨ur die Funktion x 7→ c f (x, y) dy. Die Absch¨ RRatzung (5.10) dr¨uckt daher die Tatsache aus, dass die Riemann-Summen gegen I f (x, y) d(x, y) konvergieren, ¨ falls maxi (xi − xi−1 ) → 0 strebt. Folglich gilt (siehe Ubung 5.1) Z b Z d ZZ (5.11) f (x, y) dy dx = f (x, y) d(x, y) a
c
I
und wir haben den folgenden Satz bewiesen. (5.3) Satz (Stolz 1886, S. 93). Es sei f : I → R integrierbar und die Funktion y 7→ f (x, y) sei f¨ur jedes x ∈ [a, b] auf [c, d] integrierbar. Dann ist auch die Rd Funktion x 7→ c f (x, y) dy auf [a, b] integrierbar und die Gleichheit (5.11) gilt. ⊓ ⊔ Somit l¨asst sich die Berechnung eines Doppelintegrals auf die Berechnung zweier einfacher (iterierter) Integrale zur¨uckf¨uhren, so dass wir die Techniken einsetzen k¨onnen, die wir in den Abschnitten II.4, II.5 und III.5 entwickelt haben. Aus Symmetriegr¨unden gilt nat¨urlich auch Z d Z b ZZ (5.12) f (x, y) dx dy = f (x, y) d(x, y), c
a
I
vorausgesetzt, f : I → R ist integrierbar und die Funktion x 7→ f (x, y) ist f¨ur jedes y ∈ [c, d] auf [a, b] integrierbar. Die zwei Identit¨aten (5.11) und (5.12) zusammen zeigen, dass das iterierte Integral (unter den genannten Voraussetzungen) von der Reihenfolge der Integration unabh¨angig ist. Gegenbeispiele. Wir wollen zeigen, dass die Existenz eines der Integrale in (5.11) keineswegs die Existenz des jeweils anderen erzwingt. 1) Es sei f : [0, 1] × [0, 1] → R definiert als (Abb. 5.4a) (5.13) 1 falls (x, y) = ( 2k−1 , 2ℓ−1 ) mit ganzen Zahlen n, k, ℓ, 2n 2n f (x, y) = 0 sonst. F¨ur ein festes x ∈ [0, 1] gibt es nur endlich viele Punkte mit f (x, y) 6= 0. Folglich R1 ist 0 f (x, y) dy = 0 und das iterierte Integral auf der linken Seite von (5.11) existiert. Jedoch enth¨alt jedes Rechteck [xi−1 , xi ] × [yj−1 , yj ] sowohl Punkte mit f (x, y) = 1 als auch Punkte mit f (x, y) = 0. Entsprechend gilt f¨ur s¨amtliche Unterteilungen s(Dx × Dy ) = 0 und S(Dx × Dy ) = 1 und das Integral auf der rechten Seite von (5.11) existiert nicht.
360 IV. Differentialrechnung in mehreren Variablen
ABB. 5.4a. Nichtintegrierbare Funktion
ABB. 5.4b. Integrierbare Funktion
2) Die Funktion (Abb. 5.4b) 1 falls (x = 0 oder x = 1) und y ∈ Q (5.14) f (x, y) = 1 falls (y = 0 oder y = 1) und x ∈ Q 0 sonst
ist integrierbar, da die Punkte mit f (x, y) 6= 0 eine vernachl¨assigbare Menge bilden (siehe unten). Jedoch ist die Funktion y 7→ f (x, y) f¨ur x = 0 oder x = 1 die Dirichlet-Funktion aus Beispiel III.5.6 und daher nicht integrierbar.
Nullmengen und unstetige Funktionen Stetige Funktionen f : I → R sind gleichm¨aßig stetig (I ist kompakt, Satz 2.5) und folglich integrierbar. Der Beweis ist in der Tat analog zum Beweis von Satz III.5.10. Im folgenden wollen wir die Integrierbarkeit von Funktionen beweisen, deren Menge der Unstetigkeitsstellen nicht zu groß ist. (5.4) Definition. Eine Menge X ⊂ I ⊂ R2 heißt Nullmenge, wenn es zu jedem ε > 0 endlich viele Rechtecke Ik = [ak , bk ] × [ck , dk ], (k = 1, . . . , n) gibt, so dass gilt: (5.15)
X⊂
n [
k=1
Ik
und
n X
µ(Ik ) < ε.
k=1
Typische Nullmengen sind die R¨ander normaler“ Mengen, also R¨ander von ” Dreiecken, Scheiben, Polygonen etc. (siehe das Beispiel in Abb. 5.51 ). Dies ist eine Konsequenz des folgenden Lemmas. 1
Nat¨urlich nur eine Nullmenge im streng-mathematischen Sinn!
IV.5 Mehrdimensionale Integrale 361
1
1
0
1
δ=
1 10 ,
1
2 0
Σµ = 0,880
1
δ=
1 20 ,
2 0
Σµ = 0,475
1
δ=
1 40 ,
2
Σµ = 0,263
ABB. 5.5. Eine Nullmenge
(5.5) Lemma. Eine Kurve in der Ebene sei beschrieben durch ϕ : [0, 1] → R2 und es gelte (5.16)
f¨ur alle s, t ∈ [0, 1].
kϕ(s) − ϕ(t)k∞ ≤ M · |s − t|
Dann ist die Bildmenge ϕ [0, 1] eine Nullmenge.
Beweis. Wir unterteilen [0, 1] in n a¨ quidistante Intervalle J1 , J2 , . . . , Jn der L¨ange 1/n. F¨ur s, t ∈ Jk finden wir kϕ(s) − ϕ(t)k∞ ≤ M/n, also ist ϕ(Jk ) im Quadrat Ik der Seitenl¨ange ≤ 2M/n enthalten. Entsprechend ist die gesamte Kurve enthalten in einer Vereinigung von n Quadraten I1 , . . . , In , deren Gesamtfl¨ache beschr¨ankt ist durch n X
k=1
µ(Ik ) ≤
n X 2M 2 k=1
n
=
4M 2 < ε, n
f¨ur gen¨ugend großes n. Damit ist (5.15) bewiesen.
⊓ ⊔
Bedingung (5.16) ist hinreichend, jedoch nicht notwendig f¨ur eine Kurve, um Nullmenge zu sein. Beispielsweise ist die Koch-Kurve (von Koch 1906) aus ¨ Abb. 5.6 eine Nullmenge (siehe Ubung 5.5) mit unendlicher Gesamtl¨ange (deshalb kann (5.16) nicht erf¨ullt werden). Die Kurve von Peano-Hilbert (Abb. 2.3) ist nat¨urlich keine Nullmenge. Dagegen sind Sierpi´nski-Dreick und -Teppich (Abb. 1.9 und Abb. 1.10) interessante Beispiele f¨ur Nullmengen. (5.6) Satz. Es sei f : I → R eine beschr¨ankte Funktion (die also (5.1) erf¨ullt). Wir definieren X = (x, y) ∈ I ; f ist nicht stetig bei (x, y) .
Falls X eine Nullmenge ist, dann ist die Funktion f (x, y) integrierbar.
362 IV. Differentialrechnung in mehreren Variablen
ABB. 5.6. Die Koch-Kurve, eine Nullmenge
Sn ¨ Beweis. Es sei ε > 0 gegeben und k=1 Ik eine endliche Uberdeckung von X, die (5.15) erf¨ullt. Wir vergr¨oßern Ik geringf¨ u gig und betrachten offene Rechtecke Pn J1 , .S. . , Jn mit Jk ⊃ Ik f¨ur alle k und k=1 µ(Jk ) < 2ε. Die Menge H := n I \ k=1 Jk ist dann abgeschlossen (S¨atze 1.15 und 1.14) und folglich kompakt (Satz 1.19). Die Funktion f (x, y), eingeschr¨ankt auf H, ist gleichm¨aßig stetig (Satz 2.5), weshalb ein δ > 0 existieren muss, so dass |f (x, y) − f (ξ, η)| < ε ist, wann immer |x − ξ| < δ und |y − η| < δ erf¨ullt sind. Wir beginnen nun mit einem Gitter Dx × Dy , das s¨amtliche Eckpunkte der Rechtecke J1 , . . . , Jn enth¨alt, und verfeinern es solange, bis die Abst¨ande xi − xi−1 und yj − yj−1 kleiner sind als δ. Sodann spalten wir die Differenz S(Dx × Dy ) − s(Dx × Dy ) auf in die zwei Summen X
Iij ⊂H
X Fij − fij µ(Iij ) + Fij − fij µ(Iij ). Iij 6⊂H
Die Summe auf der linken Seite ist ≤ εµ(I), da f (x, y) auf H gleichm¨aßig stetig ist; die Summe auf der rechten Seite ist S ≤ 4M ε, weil die Vereinigung der Rechtecke Iij (die nicht in H liegen) in nk=1 Jk enthalten ist, was seinerseits einen Fl¨acheninhalt < 2ε hat. Beide Absch¨atzungen zusammen zeigen, dass S(Dx × Dy ) − s(Dx × Dy ) beliebig klein gemacht werden kann. ⊓ ⊔
IV.5 Mehrdimensionale Integrale 363
Beliebige beschr¨ankte Integrationsbereiche Besonderen Stolz legte Dirichlet auf seine Methode des diskontinuierlichen Faktors zur Bestimmung vielfacher Integrale. Er pflegte zu sagen, es ist das ein sehr einfacher Gedanke, und schmunzelnd hinzuzuf¨ugen, aber man muss ihn haben. (H. Minkowski, Jahrber. DMV, 14 (1905), S. 161)
Es sei A ⊂ R2 ein beschr¨anktes Gebiet, das in einem Rechteck I enthalten ist (d.h. A ⊂ I), und es sei f : A → R eine beschr¨ankte Funktion. Wir wollen das Volumen unter der Fl¨ache z = f (x, y) bestimmen, wobei (x, y) auf A eingeschr¨ankt sein soll. Der Ansatz (Dirichlet 1839) besteht darin, die wie folgt definierte Funktion F : I → R zu betrachten: (5.17)
F (x, y) =
f (x, y) falls (x, y) ∈ A 0 sonst.
Falls F im Sinne der Definition 5.1 integrierbar ist, definieren wir ZZ
(5.18)
f (x, y) d(x, y) = A
ZZ
F (x, y) d(x, y). I
In einer typischen Situation ist f : A → R auf A stetig und der Rand von A, also die Menge (5.19)
∂A :=
jede Umgebung von (x, y) enth¨alt (x, y) ∈ R , Elemente von A und von ∁A 2
ist eine Nullmenge. In diesem Fall befinden sich s¨amtliche Unstetigkeitsstellen von F in ∂A und aus Satz 5.6 folgt die Integrierbarkeit von F . Iterierte Integrale. Die Menge A ist oftmals von einer der folgenden Formen: (5.20) (5.21)
A = {(x, y) | a ≤ x ≤ b, ϕ1 (x) ≤ y ≤ ϕ2 (x) }, A = {(x, y) | c ≤ y ≤ d, ψ1 (y) ≤ x ≤ ψ2 (y) },
wobei ϕi (x) und ψj (y) bekannte Funktionen sind (siehe Abb. 5.7). Unter dieser Voraussetzung liefern die Formeln (5.11) und (5.12) zusammen mit (5.18) (5.22) (5.23)
ZZ ZZ
f (x, y) d(x, y) = A
a
f (x, y) d(x, y) = A
Z b Z
f (x, y) dy dx,
ϕ1 (x)
Z d Z c
ϕ2 (x)
ψ2 (y) ψ1 (y)
f (x, y) dx dy.
364 IV. Differentialrechnung in mehreren Variablen
d ϕ2(x)
A
A
ψ1(y) ϕ1(x)
a
A
ψ2(y)
c
b Typ (5.20)
Typ (5.21)
Nicht vom Typ (5.20)
ABB. 5.7. Gebiete im R2
Beispiele. 1) F¨ur die Menge A = (x, y) | − a ≤ x ≤ a, x2 ≤ y ≤ a2 wollen wir den Schwerpunkt RR y d(x, y) 3a2 y = RRA = d(x, y) 5 A berechnen. Wir haben die Wahl zwischen (5.22) und (5.23): ZZ Z a Z a2 4a5 (5.22) y d(x, y) = y dy dx = , 5 2 A −a | x {z } a4 /2 − x4 /2
−a
a
a2 4a3 dx dy = . √ 3 A 0 − y | {z } √ 0 2 y 2) Wir berechnen das Tr¨agheitsmoment der Scheibe A = (x, y) | x2 +y 2 ≤ a2 , die um einen ihrer Durchmesser rotiert: ZZ Z a Z √a2 −x2 2 (5.24) I= y d(x, y) = y 2 dy dx. √
ZZ
(5.23) d(x, y) =
A
Z
a2
Z
√ y
−a
− a2 −x2
Der Wert des inneren Integrals betr¨agt 23 (a2 − x2 )3/2 , so dass wir f¨ur das a¨ ußere √ Integral die Substitution x = a sin t, dx = a cos t dt, a2 − x2 = a cos t ansetzen k¨onnen. Wir erhalten so Z π/2 2 4 π I= a cos4 t dt = a4 . 4 −π/2 3 Der folgende Hauptsatz u¨ ber Koordinatenwechsel wird die Berechnung von Integralen wie (5.24) deutlich vereinfachen (siehe Beispiel 5.8 unten).
IV.5 Mehrdimensionale Integrale 365
Die Transformationsformel f¨ur Doppelintegrale RR
. . . dies funktioniert f¨uRR r jede andere Formel Zdxdy, da sie durch dieselben Substitutionen in Z(V R − ST ) dtdu u¨ berf¨uhrt werden kann . . . (Euler 1769b)
Integration durch Substitution gem¨aß Gl. (II.4.14), also Z g(b) Z b f (x) dx = f g(u) g ′ (u) du, g(a)
a
ist ein wichtiges Werkzeug, wenn man Integrale berechnen m¨ochte. Falls g : [a, b] → [c, d] bijektiv (und stetig differenzierbar) ist, l¨asst sich diese Formel auch schreiben als Z d Z b f (x) dx = f g(u) |g ′ (u)| du, c
a
wobei die Betragsstriche das Vorzeichen korrigieren, falls g ′ (u) < 0 eintritt (und damit ja auch g(b) < g(a)). Der folgende Satz stellt ein Analogon f¨ur Doppelintegrale dar. (5.7) Satz (Euler 1769b, Opera, Band XVII, S. 303 f¨ur n = 2; Lagrange 1773, Oeuvres, Band 3, S. 624 f¨ur n = 3; und Jacobi 1841, Werke, Band 3, S. 436 f¨ur beliebige n). Es sei f : A → R eine stetige Funktion, g : U → R2 (U ⊂ R2 offen) stetig differenzierbar und wir setzen voraus: i) A = g(B); die Mengen A, B ⊂ R2 sind kompakt; ∂A, ∂B sind Nullmengen; ii) g ist injektiv auf B \ N , wobei N eine Nullmenge ist. Dann gilt: ZZ ZZ f (x, y) d(x, y) = f g(u, v) det g ′ (u, v) d(u, v). (5.25) A
B
Polarkoordinaten. Eine der wichtigsten Anwendungen von Satz 5.7 ist der Fall (5.26)
g(r, ϕ) = (x, y),
x = r cos ϕ,
y = r sin ϕ
(Polarkoordinaten, siehe Abschnitt I.5) mit A = {(x, y) | x2 + y 2 ≤ R2 }. Durch die Wahl B = [0, R] × [0, 2π] ist Voraussetzung (i) von Satz 5.7 erf¨ullt. Die Funktion g aus (5.26) ist nicht injektiv auf B (es ist g(r, 0) = g(r, 2π) f¨ur alle r, und g(0, ϕ) = (0, 0) f¨ur alle ϕ), jedoch k¨onnen wir von B die Nullmenge N = ({0} × [0, 2π]) ∪ ([0, R] × {2π}) abziehen (siehe Abb. 5.8b), die Funktion g ist dann injektiv auf B \ N . Wegen cos ϕ −r sin ϕ det g ′ (r, ϕ) = det =r sin ϕ r cos ϕ folgt aus Satz 5.7 und Gl. (5.11) ZZ Z (5.27) f (x, y) d(x, y) = x2 +y 2 ≤R2
0
2π
Z
0
R
f (r cos ϕ, r sin ϕ) r dr dϕ.
366 IV. Differentialrechnung in mehreren Variablen
2π
ϕ
N
6
y
2
g
B
3
−2
1 0
−1
A 0
1
2
x
−1
N 0 0
R
1
ABB. 5.8a. Fl¨acheninhalt eines Parallelogramms
r
−2
ABB. 5.8b. Polarkoordinaten
y 2 v 2
B
g
A
Jβ
b
g(Jβ)
(uβ, vβ)
a
u 0
2
δ
x 0
2
ABB. 5.9. Transformation eines Gitters
Beweis von Satz 5.7. Grundideen. Wir u¨ berdecken B mit abgeschlossenen Quadraten Jβ der Seitenl¨ange δ (siehe Abb. 5.9, links), w¨ahlen B = {β | Jβ ∩ B 6= ∅} und definieren (uβ , vβ ) als den unteren linken Eckpunkt von Jβ . Wir nehmen an, dass δ hinreichend klein ist, so dass s¨amtliche Jβ (β ∈ B) noch immer in U liegen. Die Bildmenge g(Jβ ) von Jβ ist n¨aherungsweise ein Parallelogramm mit den Seitenl¨angen (Abb. 5.9, rechts; Abb. 5.10) (5.28)
a=
∂g (uβ , vβ ) δ, ∂u
b=
∂g (uβ , vβ ) δ ∂v
(siehe Beispiel 3.2). Aus der Elementargeometrie wissen wir, dass der Fl¨achenin-
IV.5 Mehrdimensionale Integrale 367
halt dieses Parallelogramms gleich der Determinante ist2 a1 b1 (5.29) Parall.-Fl¨ache = | det(a b)| = det = |a1 b2 − a2 b1 | a2 b2 und inspiriert von Gl. (5.9) sehen wir ZZ X f (x, y) d(x, y) ≈ f g(uβ , vβ ) · Fl¨acheninhalt von g(Jβ ) A
β∈B
≈ ≈
X
β∈B
ZZ
B
f g(uβ , vβ ) det g ′ (uβ , vβ ) µ(Jβ ) f g(u, v) det g ′ (u, v) d(u, v).
Dies sollte die G¨ultigkeit von Gl. (5.25) motivieren.
Strenge Absch¨atzungen. Die Integranden in Gl. (5.25) sind jeweils auf A und B stetig. Da A und B kompakt sind, sind diese Funktionen außerdem beschr¨ankt. Dar¨uber hinaus sind ∂A und ∂B Nullmengen, so dass nach (5.18) die zwei Integrale in Gl. (5.25) existieren. Im folgenden wollen wir den Definitionsbereich von f auf den ganzen R2 ausdehnen, indem wir f (x, y) = 0 außerhalb von A setzen. Um nun die genaue Bedeutung des linken Integrals in (5.25) zu verstehen, f¨uhren wir zus¨atzlich zur obigen Unterteilung von B eine weitere Unterteilung von A in Quadrate Iα ein, setzen A = {α | Iα ∩A 6= ∅} und w¨ahlen (xα , yα ) ∈ Iα ∩A (dies sind die Fischaugen“ in Abb. 5.10). Wir werden Gleichung (5.25) beweisen, ” indem wir zeigen, dass die Differenz der Riemann-Summen der zwei Integrale (siehe Satz 5.2 und Gl. (5.9)) X X (5.30) f (xα , yα ) µ(Iα ) − f g(uβ , vβ ) det g ′ (uβ , vβ ) µ(Jβ ) α∈A
β∈B
f¨ur jedes gegebene ε > 0 kleiner ist als ε (oder zumindest ≤ Const· ε). Dabei stellt sich heraus, dass die Seitenl¨angen der Quadrate Iα kleiner als δ sein m¨ussen (die Seitenl¨ange von Jβ ). Wir w¨ahlen sie als ≤ ε · δ.
Unterteilung von A. Die linke Summe in (5.30) umfasst wesentlich mehr Terme als die rechte. Um nun einander entsprechende Terme in dieser Differenz miteinander zu vergleichen, zerlegen wir die Menge A gem¨aß [ A= Pβ (disjunkte Vereinigung) β∈B
mit folgenden Bedingungen: 2 Die zwei Ausdr¨ucke auf der linken und rechten Seite von (5.29) sind i) invariant unter Transformationen des Typs b 7→ b + λa (Prinzip von Cavalieri) und ii) offensichtlich gleich f¨ur achsenparallele Rechtecke ≡ Diagonalmatrizen; siehe Abb. 5.8a. F¨ur weitere Details siehe Strang (1976, S. 164).
368 IV. Differentialrechnung in mehreren Variablen
Rβ+ g(Jβ)
Rβ −
b
g(uβ, vβ)
Rβ
2√2εδ 2√2εδ
a
ABB. 5.10. Quadrate Iα , f¨ur die α zu Pβ geh¨ort
(5.31a) (5.31b)
(xα , yα ) ∈ g(Jβ ) falls α ∈ Pβ ,
α ∈ Pβ falls Iα ⊂ g(Jβ ) und Jβ ⊂ B \ N
(siehe Fig. 5.10). S Zu einem gegebenen α ∈ A k¨onnen wir nun wegen (xα , yα ) ∈ A = g(B) ⊂ β∈B g(Jβ ) stets ein β finden, dass (5.31a) erf¨ullt. Um außerdem (5.31b) zu erf¨ullen, m¨ussen wir noch zeigen, dass es h¨ochstens ein β ∈ B gibt mit Jβ ⊂ B \ N und Iα ⊂ g(Jβ ). Angenommen, es ist Iα ⊂ g(Jβ ) ∩ g(Jβ ′ ) f¨ur ein β 6= β ′ . Da g auf B \ N injektiv ist, haben wir g(Jβ ) ∩ g(Jβ ′ ) ⊂ g(Jβ ∩ Jβ ′ ), so dass auch Iα ⊂ g(Jβ ∩ Jβ ′ ) ist. Doch Jβ ∩ Jβ ′ ist entweder leer, ein einzelner Punkt oder ein Streckenabschnitt, so dass g(Jβ ∩ Jβ ′ ) nach Lemma 5.5 in jedem ′ Fall eine Nullmenge ist. Folglich ist Iα ⊂ g(Jβ ∩ Jβ ′ ) nicht P m¨oglich P f¨ur βP6= β . Mit den so bestimmten Mengen Pβ k¨onnen wir nun α∈A = β∈B α∈Pβ P einsetzen, schreiben den Ausdruck aus Gl. (5.30) als β∈B Dβ mit X (5.32) Dβ = f (xα , yα ) µ(Iα ) − f g(uβ , vβ ) det g ′ (uβ , vβ ) µ(Jβ ) α∈Pβ
und sch¨atzen diese Terme ab. F¨ur den Anfang betrachten wir nur die sogenannten inneren“ Jβ , d.h. wir nehmen an, dass Jβ ⊂ B \ N ist. Wir schreiben Dβ in der ” Form X (5.33a) Dβ = f (xα , yα ) − f g(uβ , vβ ) µ(Iα ) α∈Pβ
(5.33b)
+ f g(uβ , vβ )
X
α∈Pβ
µ(Iα ) − det g ′ (uβ , vβ ) µ(Jβ )
und sch¨atzen die beiden Ausdr¨ucke separat ab.
IV.5 Mehrdimensionale Integrale 369
Absch¨atzung von (5.33a). Da g(u, v) stetig differenzierbar ist, ist g ′ (u, v) auf der kompakten Menge B beschr¨ankt (Satz 2.3), also kg ′ (u, v)k ≤ M1
(5.34)
f¨ur
(u, v) ∈ B.
Damit liefert der Mittelwertsatz 3.7 √
(xα , yα )T − g(uβ , vβ ) ≤ M1 · δ · 2
f¨ur
α ∈ Pβ
(tats¨achlich liegt √ (xα , yα ) in g(Jβ ) und die Punkte von Jβ liegen h¨ochstens im Abstand δ · 2 von (uβ , vβ )). Sodann folgt aus der gleichm¨aßigen Stetigkeit f (xα , yα ) − von f auf A (f ist stetig auf der kompakten Menge A), dass f g(uβ , vβ ) < ε f¨ur hinreichend kleines δ sein muss (wir erinnern uns daran, dass g(Jβ ) ⊂ A ist, da wir Jβ als innen liegend annehmen). Folglich ist (5.35)
X X f (x , y ) − f g(u , v ) µ(I ) µ(Iα ). α α β β α ≤ε α∈Pβ
α∈Pβ
Absch¨atzung von (5.33b). Wir m¨ussen uns nun ernsthafter mit der Frage auseinandersetzen, wie genau die Menge g(Jβ ) durch das Parallelogramm angen¨ahert wird, das von den Vektoren a und b in (5.28) aufgespannt wird. Wir nennen diese Menge n o ∂g ∂g Rβ = g(uβ , vβ ) + (uβ , vβ ) s + (uβ , vβ ) t s ∈ [0, δ], t ∈ [0, δ] . ∂u ∂v
Wir berechnen folgendermaßen den Abstand zwischen zwei einander entspre∂g chenden Punkten g(uβ + s, vβ + t) in g(Jβ ) und g(uβ , vβ ) + ∂u (uβ , vβ ) s + ∂g (u , v ) t in R : Setzen wir in Gleichung (III.6.16) F (τ ) = g(u +τ s, vβ +τ t) β β β β ∂v ein, so folgt g(uβ + s, vβ + t) − g(uβ , vβ ) =
Z
1
s g (uβ + τ s, vβ + τ t) · dτ. t ′
0
Davon ziehen wir ∂g/∂u(uβ , vβ ) · s + ∂g/∂v(uβ , vβ ) · t auf beiden Seiten ab, wir erhalten
∂g ∂g
(uβ , vβ ) s + (uβ , vβ ) t
g(uβ + s, vβ + t) − g(uβ , vβ ) + ∂u ∂v
Z 1 s
√ = g ′ (uβ + τ s, vβ + τ t) − g ′ (uβ , vβ ) · dτ ≤ 2εδ t 0
f¨ur 0 ≤ s, t ≤ δ. Die letzte Absch¨atzung folgt aus der gleichm¨aßigen Stetigkeit von g ′ auf der kompakten Menge B (wieder setzen wir ein, dass Jβ im Inneren liegt).
370 IV. Differentialrechnung in mehreren Variablen
Als n¨achstes umfassen wir Rβ mit zwei Mengen Rβ− ⊂ Rβ ⊂ Rβ+ , die definiert sind als (siehe Abb. 5.10) √ Rβ+ = Menge aller Punkte mit Abstand ≤ 2 2εδ vom n¨achsten Punkt in Rβ √ Rβ− = Menge aller Punkte in Rβ mit Abstand ≥ 2 2εδ vom Rand .
√ √ Wir haben den Abstand 2 2εδ in dieser Definition als Doppeltes von 2εδ gew¨ahlt, welches einerseits der maximale Abstand zwischen einander entsprechenden Punkten von g(Jβ ) und Rβ ist, und andererseits auch der maximale Durchmesser der Quadrate Iα ist. Durch diese Wahl enthalten die Mengen Rβ− und Rβ+ aufgrund von (5.31a) und (5.31b) auch die Vereinigung aller Iα mit α ∈ Pβ (siehe wiederum Abb. 5.10): [ Rβ− ⊂ Iα ⊂ Rβ+ . α∈Pβ
√ Da Rβ+ \ Rβ− ein Ring“ der L¨ange ≤ 4M1 δ (siehe (5.34)) und Dicke“ ≤ 4 2εδ ” ” ist, f¨uhren die obigen Inklusionen zu der Absch¨atzung X √ µ(Iα ) − µ(Rβ ) ≤ µ Rβ+ \ Rβ− ≤ (4M1 δ)(4 2εδ). α∈Pβ
Infolgedessen ist (5.36) X µ(Iα ) − det g ′ (uβ , vβ ) µ(Jβ ) ≤ Cεδ 2 = Cεµ(Jβ ) f g(uβ , vβ ) α∈Pβ
√ mit C = M · 4M1 · 4 2.
Fazit. Falls Jβ 6⊂ B \ N ist (so dass Jβ die Nullmenge ∂B ∪ N schneidet), k¨onnen wir Dβ aus Gl. (5.32) mittels |Dβ | ≤ M2 µ(Jβ ) absch¨atzen, dabei ist M2 eine Konstante, die von den Schranken von f und g ′ abh¨angt. Ist δ hinreichend klein, folgt dann aus (5.15), dass die Summe dieser |Dβ | kleiner oder gleich M2 ε sein muss. F¨ur die verbleibenden Jβ benutzen wir (5.35) und (5.36) zusammen mit (5.33) und finden X |Dβ | ≤ ε µ(Iα ) + Cεµ(Jβ ). α∈Pβ
Alles in allem ist die Differenz (5.30) der Riemann-Summen, also beliebig klein (≤ Const · ε).
P
β∈B
Dβ , ⊓ ⊔
(5.8) Beispiel. Es sei A = {(x, y) | x2 + y 2 ≤ R2 } die Scheibe vom Radius R. Ihr Fl¨acheninhalt l¨asst sich elegant berechnen durch
IV.5 Mehrdimensionale Integrale 371
ZZ
A
1 · d(x, y) =
Z
2π 0
Z
R
r dr dϕ = 0
R2 · 2π = R2 π. 2
Ihr Tr¨agheitsmoment bez¨uglich einer Rotation um einen Durchmesser ist ZZ Z 2π Z R R4 π 2 y d(x, y) = r2 sin2 ϕ · r dr dϕ = . 4 A 0 0
Das Tr¨agheitsmoment bez¨uglich einer Rotation um die senkrechte Achse durch ihren Mittelpunkt betr¨agt ZZ Z 2π Z R R4 π (x2 + y 2 ) d(x, y) = r2 · r dr dϕ = . 2 A 0 0 z
r sinθ dϕ
θ ϕ
r r dθ
dr
y x ABB. 5.11. Sph¨arische Koordinaten
Sph¨arische Koordinaten. Die Ergebnisse dieses Abschnitts lassen sich ohne gr¨oßere M¨uhen auf h¨ohere Dimensionen verallgemeinern. Als Beispiel wollen wir eine interessante Anwendung der Transformationsformel (5.25) in drei Dimensionen vorstellen. Wir betrachten sph¨arische Koordinaten g(r, ϕ, θ) = (x, y, z), wie sie durch (siehe Abb. 5.11) (5.37)
x = r cos ϕ sin θ,
y = r sin ϕ sin θ,
z = r cos θ
definiert sind, und interessieren uns f¨ur Dreifachintegrale u¨ ber eine Kugel A = {(x, y, z) | x2 + y 2 + z 2 ≤ R2 }. Mit B = [0, R] × [0, 2π] × [0, π] und N = ∂B sind s¨amtliche Voraussetzungen f¨ur Satz 5.7 erf¨ullt. Wir berechnen die JacobiMatrix von g, cos ϕ sin θ −r sin ϕ sin θ r cos ϕ cos θ g ′ (r, ϕ, θ) = sin ϕ sin θ r cos ϕ sin θ r sin ϕ cos θ , cos θ 0 −r sin θ
372 IV. Differentialrechnung in mehreren Variablen
und finden ihre Determinante det g ′ (r, ϕ, θ) = −r2 sin θ, also ist (Lagrange 1773) ZZZ ZZZ (5.38) f (x, y, z) d(x, y, z) = fe(r, ϕ, θ) r2 sin θ d(r, ϕ, θ) A
B
e ϕ, θ) = f (r cos ϕ sin θ, r sin ϕ sin θ, r cos θ). Angesichts von Abb. 5.11 mit f(r, kann diese Formel auch, wie Lagrange sagt, directement sans aucun calcul“ ” eingesehen werden. Das Volumen der Kugel finden wir durch die Wahl f (x, y, z) = 1: ZZZ Z π Z 2π Z R 4R3 π 1 · d(x, y, z) = r2 sin θ dr dϕ dθ = . 3 A 0 0 0 Das Tr¨agheitsmoment bez¨uglich einer Rotation durch ihren Mittelpunkt betr¨agt ZZZ Z π Z 2π Z R 8R5 π 2 2 (x + y ) d(x, y, z) = r2 sin2 θ · r2 sin θ dr dϕ dθ = . 15 A 0 0 0
Integrale mit unbeschr¨anktem Integrationsbereich Gelegentlich findet man sich damit konfrontiert, ein Integral mit unbeschr¨anktem Integrationsbereich berechnen zu m¨ussen. Wie in Abschnitt III.8 (uneigentliche ¨ Integrale) kann man dies durch Ubergang zu einem Grenzwert bewerkstelligen. Wir wollen dies an einigen interessanten Beispielen veranschaulichen. R∞ 2 Das Gauß-Integral. Angenommen, wir wollen I = 0 e−x dx berechnen. Der Ansatz besteht darin, das Quadrat von I zu betrachten und in ein Doppelintegral zu u¨ berf¨uhren, (5.39) 2
I = lim
R→∞
Z
R
−x2
e 0
Z dx
0
R
e
−y 2
dy = lim
R→∞
ZZ
2
e−x
−y 2
d(x, y),
AR
wobei AR = [0, R] × [0, R] ist. Der Integrand des Doppelintegrals l¨adt dazu ein, zu Polarkoordinaten u¨ berzugehen. Wir setzen DR = {(x, y) | x2 + y 2 ≤ R2 , x ≥ 0, y ≥ 0} und finden ZZ Z π/2 Z R 2 2 2 π (5.40) lim e−x −y d(x, y) = lim e−r r dr dϕ = . R→∞ R→∞ 0 4 DR 0 Das zus¨atzliche r“ stammt hier aus Gl. (5.27) und ist uns a¨ ußerst willkom” men, da es die Integration des inneren Integrals durch eine einfache Substitution erm¨oglicht. Die Frage lautet nun, ob die zwei Grenzwerte in (5.39) und (5.40) gleich sind. Falls f (x, y) ≥ 0 ist (wie in unserem Fall), ist ZZ ZZ ZZ f (x, y) d(x, y) ≤ f (x, y) d(x, y) ≤ f (x, y) d(x, y) DR
AR
D√2 R
IV.5 Mehrdimensionale Integrale 373
eine Folgerung aus der Inklusion DR ⊂ AR ⊂ D√2 R (siehe kleine Skizze rechts). Daher folgt aus der Existenz von 1 RR limR→∞ DR f (x, y) d(x, y) die Existenz des RR Grenzwerts limR→∞ AR f (x, y) d(x, y), und beide m¨ussen √ denselben Wert besitzen. Folglich ist I = π/2. Es gibt auch einen interessanten Zusammenhang zur Gammafunktion: 1 Z ∞ Z ∞ 0 √ −x2 −t dt (5.41) π = 2I = 2 e dx = e √ = Γ (1/2) t 0 0 (siehe Definition III.8.10).
v
y
4
4
3
3
2
2
1
1
5
5
1
2
3
4
5
6
7
u
1
2
3
4
5
6
7
x
¨ ABB. 5.12. Uberlegungen zur Transformation (5.43)
Eine Produktformel fur ¨ die Gammafunktion. Nach Definition III.8.10 ist Z ∞ Z ∞ −x α−1 Γ (α) = e x dx, Γ (β) = e−y y β−1 dy, 0
0
so dass (siehe Jacobi 1834, Werke, Band VI, S. 62) ZZ (5.42) Γ (α)Γ (β) = lim e−x−y xα−1 y β−1 d(x, y) R→∞
AR
ist, wobei AR = [0, R] × [0, R] wie oben gew¨ahlt wurde. Dieses Mal verwenden wir die Transformation (Abb. 5.12) x+y =u x u−v (5.43) bzw. = g(u, v) = , y v y=v 1 −1 deren Jacobi-Matrix die Determinante det g ′ (u, v) = det = 1 besitzt. 0 1 Mit BR = {(x, y) | x ≥ 0, y ≥ 0, x + y ≤ R} finden wir ZZ Z R Z u −x−y α−1 β−1 −u lim e x y d(x, y) = lim e (u − v)α−1 vβ−1 dv du
R→∞
(5.44)
R→∞
BR
= lim
R→∞
Z
0
0
0
R
e−u uα+β−1 du ·
Z
1
0
(1 − t)α−1 tβ−1 dt,
374 IV. Differentialrechnung in mehreren Variablen
wobei wir die Substitution v = u · t (0 ≤ t ≤ 1) eingesetzt haben. Dasselbe Argument wie beim Gauß-Integral garantiert nun, dass die zwei Grenzwerte (5.42) und (5.44) u¨ bereinstimmen. In (5.44) taucht die sogenannte Betafunktion (5.45)
B(α, β) :=
Z
1
0
(1 − t)α−1 tβ−1 dt
auf, so dass wir unser Ergebnis in der Formel (5.46)
B(α, β) =
Γ (α)Γ (β) Γ (α + β)
zusammenfassen k¨onnen. Sie verallgemeinert Gleichung (II.4.34) auf beliebige Exponenten. Gegenbeispiel. Die Funktion f (x, y) = (x − y)/(x + y)3 ist stetig auf A = ¨ [1, ∞] × [1, ∞]. Dennoch gilt (siehe auch Ubung 5.3) (5.47)
Z
|1
∞
Z
∞
1
Z ∞Z ∞ x−y x−y dx dy 6= dy dx , (x + y)3 (x + y)3 1 {z } |1 {z } +1/2 −1/2
was den Gleichungen (5.11) und (5.12) widerspricht. Dieses Ph¨anomen ist nur m¨oglich, wenn eine Funktion f u¨ ber einen unbeschr¨ankten Integrationsbereich A integriert werden soll und auf A ihr Vorzeichen wechselt.
¨ Ubungen 5.1 Es sei g : [a, b] → R eine beschr¨ankte Funktion, deren Riemann-Summen f¨ur maxi (xi − xi−1 ) → 0 alle gegen den festen Wert α konvergieren. Beweisen Rb Sie, dass g(x) (im Riemann-Sinn) integrierbar und a g(x) dx = α ist. 5.2 Definieren Sie f : I → R f¨ur I := [0, π] × [0, 1] durch f (x, y) =
n
cos x 0
falls y ∈ Q sonst.
Welches der zwei Integrale Z 1 Z 0
0
π
f (x, y) dx dy
und
Z π Z 0
existiert? Ist die Funktion f : I → R integrierbar?
1 0
f (x, y) dy dx
IV.5 Mehrdimensionale Integrale 375
5.3 Zeigen Sie Z
1
|0
Z
Z 1Z 1 x−y x−y dx dy 6= dy dx (x + y)3 (x + y)3 {z } |0 0 {z } −1/2 +1/2
1 0
(Abb. 5.13). Steht diese Beziehung im Widerspruch zu den Gleichungen (5.11) und (5.12)? ∂ −x x−y Hinweis. Nutzen Sie = . ∂x (x + y)2 (x + y)3
x
x y
ABB. 5.13. Funktion
x−y (x+y)3
y
mit nicht vertauschbaren iterierten Integralen (Stereogramm)
5.4 Versuchen Sie, das folgende Integral zu berechnen:
I=
Z π Z 0
0
R
−2 cos ϕ + 2r dr dϕ, 1 − 2r cos ϕ + r2
0 0 bis B, vertauschen Sie die Reihenfolge der Integration im iterierten Integral und betrachten Sie die Grenzwerte B → ∞ und A → 0. Rechtfertigen Sie alle Schritte. Bemerkung. Mit tieferen Einblicken in die komplexe Analysis wird dieses ¨ Integral zu einer einfachen Ubung.
Anhang: Originalzitate Seite 1: Seite 2:
Seite 4:
Seite 6:
Seite 8:
Seite 17:
Seite 18:
Seite 23:
Seite 34: Seite 40:
. . . our students of mathematics would profit much more from a study of Euler’s Introductio in Analysin Infinitorum, rather than of the available modern textbooks. (Andr´e Weil 1979, zitiert nach J.D. Blanton 1988, S. xii) Tant que l’Alg`ebre et la G´eom´etrie ont e´ t´e s´epar´ees, leurs progr`es ont e´ t´e lents et leurs usages born´es; mais lorsque ces deux sciences se sont r´eunies, elles se sont prˆet´e des forces mutuelles et ont march´e ensemble d’un pas rapide vers la perfection. C’est a` Descartes qu’on doit l’application de l’Alg`ebre a` la G´eom´etrie, application qui est devenue la clef des plus grandes d´ecouvertes dans toutes les branches des Math´ematiques. (Lagrange 1795, Oeuvres, Band 7, S. 271) Diophante peut eˆ tre regard´e comme l’inventeur de l’Alg`ebre; . . . (Lagrange 1795, Oeuvres, Band. 7, S. 219) Tartalea exposa sa solution en mauvais vers italiens . . . (Lagrange 1795, Oeuvres, Band 7, S. 22) . . . trovato la sua regola generale, ma per al presente la voglio tacere per piu rispetti. (Tartaglia 1530, siehe M. Cantor 1891, Band II, S. 485) Le Logistique Numerique est celuy qui est exhib´e & trait´e par les nombres, le Specifique par especes ou formes des choses: comme par les lettres de l’Alphabet. (Vi`ete 1600, Algebra nova, Franz¨osische Ausgabe 1630) ALGEBRA is a general Method of Computation by certain Signs and Symbols which have been contrived for this Purpose, and found convenient. (Maclaurin 1748, A Treatise of Algebra, S. 1) Ou ie vous prie de remarquer en passant, que le scrupule, que faisoient les anciens d’vser des termes de l’Arithmetique en la Geometrie, qui ne pouuoit proceder, que de ce qu’ils ne voyoient pas ass´es clairement leur rapport, causoit beaucoup d’obscurit´e, & d’embaras, en la fac¸on dont ils s’expliquoient. (Descartes 1637) Here it will be proper to observe, that I make use of x−1 , x−2√ , x−3 ,√x−4 , &c. √ √ 1 3 5 1 2 for x1 , x12 , x13 , x14 , &c. of x 2 , x 2 , x 2 , x 3 ,x 3 , &c. for x, x3 , x5 , 3 x, √ 1 2 1 3 1 1 x2 , &c. and of x− 2 , x− 3 , x− 4 &c. for √1x , √ 3 2, √ 4 x , &c. And this by rule x of Analogy, as may be apprehended from such Geometrical Progressions as 5 3 1 1 3 these; x3 , x 2 , x2 , x 2 , x, x 2 , x0 , (or 1;) x− 2 , x−1 , x− 2 , x−2 , &c. (Newton 1671, Fluxiones, Engl. Ver¨offentl. 1736, S. 3) Quoy que cette proposition ait vne infinit´e de cas, i’en donneray vne demonstration bien courte, en supposant 2 lemmes. Le 1. qui est evident de soy-mesme, que cette proportion se rencontre dans la seconde base; car il est bien visible que ϕ est a` σ comme 1, a` 1. Le 2. que si cette proportion se trouue dans vne base quelconque, elle se trouuera necessairement dans la base suivante. (Pascal 1654, einer der ersten Induktionsbeweise) All this was in the two plague years of 1665 and 1666, for in those days I was in the prime of my age for invention, and minded mathematics and philosophy more than at any other time since. (Newton, zitiert nach Kline 1972, S. 357) Mense Septembri 1668, Mercator Logarithmotechniam edidit suam, quae specimen hujus Methodi (i.e., Serierum Infinitarum) in unica tantum Figura, nempe, Quadratura Hyperbolæ continet. (Brief an Collins, 26. Juli 1672) Sybil: It goes back to the dawn of civilization. (J. Cleese & C. Booth 1979, Fawlty Towers, The Psychiatrists)
E. Hairer, G. Wanner, Analysis in historischer Entwicklung, Springer-Lehrbuch, DOI 10.1007/978-3-642-13767-9, © Springer-Verlag Berlin Heidelberg 2011
Anhang: Originalzitate 379 Seite 52:
Seite 57:
Seite 58: Seite 61: Seite 62: Seite 68:
A friend that hath a very excellent genius to those things, brought me the other day some papers, wherein he hath sett downe methods of calculating the dimensions of magnitudes like that of Mr Mercator concerning the hyperbola, but very generall. . . His name is Mr Newton; a fellow of our College, & very young . . . but of an extraordinary genius & proficiency in these things. (Brief von Barrow an Collins 1669, zitiert aus Westfall 1980, S. 202) . . . vous ne laisserez pas d’avoir trouv´e une propriet´e du cercle tres remarquable, ce qui sera celebre a jamais parmi les geometres. (Brief von Huygens an Leibniz, 7. Nov. 1674) Theref. the Diameter is to the Periphery, as 1,000,&c. to 3.141592653.589 7932384.6264338327.9502884197.1693993751.0582097494.4592307816 .4062862089.9862803482.5342117067.9+, True to above a hundred Places; as Computed by the Accurate and Ready Pen of the Truly Ingenious Mr. John Machin: Purely as an Instance of the Vast advantage Arithmetical Calculations receive from the Modern Analysis, in a Subject that has bin of so Engaging a Nature, as to have employ’d the Minds of the most Eminent Mathematicians, in all Ages, to the Consideration of it. . . . But the Method of Series (as improv’d by Mr. Newton, and Mr. Halley) performs this with great Facility, when compared with the Intricate and Prolix Ways of Archimedes, Vi`ete, Van Ceulen, Metius, Snellius, Lansbergius, &c. (W. Jones 1706) Au reste tant les vrayes racines que les fausses ne sont pas tousiours reelles; mais quelquefois seulement imaginaires; c’est a dire qu’on peut bien tousiours en imaginer autant que iay dit en chasque Equation; mais qu’il n’y a quelquefois aucune quantit´e, qui corresponde a celles qu’on imagine. (Descartes 1637, S. 380) . . . quomodo quantitates exponentiales imaginariae ad sinus et cosinus arcuum realium reducantur. (Euler 1748, Introductio, §138) The shortest path between two truths in the real domain passes through the complex domain. (Jacques Hadamard; zitiert nach Kline (1972), S. 626) 1 . . . et ie voy d´eja la route de trouver la somme de cette rang´ee 11 + 14 + 19 + 16 etc. (Joh. Bernoulli, 22. Mai 1691, in einem Brief an seinen Bruder) La Th´eorie des fractions continues est une des plus utiles de l’Arithm´etique . . . comme elle manque dans les principaux Ouvrages d’Artihm´etique et d’Alg`ebre, elle doit eˆ tre peu connue des g´eom`etres . . . je serai satisfait si je puis contribuer a` la leur rendre un peu plus famili`ere. (Lagrange 1793, Oeuvres, Band 7, S. 6–7) We say therefore; that the Circle is to the Square of the Diameter, as 1 to 1 × 9 × 25 × 49 × 81 ×&c, infinitely. Or as 1 to 8 24 48 80 1 +
1
2+
9 2+
25 2+
49
81 2 + &c, infinitely. How these Approximations were obtained . . . would be too long here to insert; but may by those be seen, who please to consult that Treatise. (J. Wallis 1685, A Treatise of Algebra, S. 318) L’´etendu¨e de ce calcul est immense: il convient aux Courbes m´ecaniques, comme aux g´eometriques; les signes radicaux luy sont indifferens, & mˆeme souvent commodes; il s’´etend a` tant d’ind´etermin´ees qu’on voudra; la comparaison des infiniment petits de tous les genres luy est e´ galement facile. Et de l`a naissent une infinit´e de d´ecouvertes surprenantes par rapport aux Tangentes tant courbes que droites, aux questions De maximis & minimis, aux 2+
Seite 80:
380 Anhang: Originalzitate points d’infl´exion & de rebroussement des courbes, aux D´evelop´ees, aux Caustiques par r´efl´exion ou par r´efraction, &c. comme on le verra dans cet ouvrage. (Marquis de L’Hospital 1696, Analyse des infiniment petits) Seite 81: Et j’ose dire que c’est cecy le probl´esme le plus utile, & le plus general non seulement que ie sc¸ache, mais mesme que i’aye iamais desir´e de sc¸auoir en Geometrie . . . (Descartes 1637, S. 342) Isaac Newton was not a pleasant man. His relations with other academics were notorious, with most of his later life spent embroiled in heated disputes . . . A serious dispute arose with the German philosopher Gottfried Leibniz. Both Leibniz and Newton had independently developed a branch of mathematics called calculus, which underlies most of modern physics . . . Following the death of Leibniz, Newton is reported to have declared that he had taken great satisfaction in ‘breaking Leibniz’s heart’. (Hawking 1988, A brief history of time, Bantam Editors, New York) Quel m´epris pour les non-Anglois! Nous les avons trouv´e ces methodes, sans aucun secours des Anglois. (Joh. Bernoulli 1735, Opera, Band IV, S. 170) Ce que tu me rapportes a` propos de Bernard Niewentijt n’est que quincaillerie. Qui pourrait s’empˆecher de rire devant les ratiocinations si ridicules qu’il bˆatit sur notre calcul, comme s’il e´ tait aveugle a` ses avantages. (Brief von Joh. Bernoulli, zitiert aus Parmentier 1989, S. 316). Nous appellerons la fonction f x, fonction primitive, par rapport aux fonctions f ′ x, f ′′ x, &c. qui en d´erivent, et nous appellerons celles-ci, fonctions d´eriv´ees, par rapport a` celle-l`a. (Lagrange 1797) Seite 91: But the velocities of the velocities, the second, third, fourth, and fifth velocities, &c., exceed, if I mistake not, all human understanding. The further the mind analyseth and pursueth these fugitive ideas the more it is lost and bewildered; ... (Bishop Berkeley 1734, The Analyst, siehe Struik 1969, Source Book, S. 335) . . . our modern analysts are not content to consider only the differences of finite quantities: they also consider the differences of those differences, and the differences of the differences of the first differences. And so on ad infinitum. That is, they consider quantities infinitely less than the least discernible quantity; and others infinitely less than those infinitely small ones; and still others infinitely less than the preceding infinitesimals, and so without end or limit . . . Now to conceive a quantity infinitely small . . . is, I confess, above my capacity. But to conceive a part of such infinitely small quantity that shall be still infinitely less than it, and consequently though multiplied infinitely shall never equal the minutest finite quantity, is, I suspect, an infinite difficulty to any man whatsoever; . . . (Bishop Berkeley 1734, The Analyst) Seite 92: Je desire seulement qu’il sache que nos questions de maximis et minimis et de tangentibus linearum curvarum sont parfaites depuis huit ou dix ans et que plusieurs personnes qui les ont vues depuis cinq ou six ans le peuvent t´emoigner. (Brief von Fermat an Descartes, Juni 1638, Oeuvres, Band 2, S. 154–162) When a Quantity is the greatest or the least that it can be, at that moment it neither flows backward or forward. For if it flows forward, or increases, that proves it was less, and will presently be greater than it is. . . . Wherefore find its Fluxion, by Prob. 1 and suppose it to be nothing. (Newton 1671, engl. Ver¨off. 1736, S. 44) Seite 98: Mon Fr´ere, Professeur a` Bˆale, a pris de l`a occasion de rechercher plusieurs courbes que la Nature nous met tous les jours devant les yeux . . . (Joh. Bernoulli 1692) Je suis tres persuad´e qu’il n’y a gueres de geometre au monde qui vous puisse eˆ tre compar´e. (de L’Hospital 1695, Brief an Joh. Bernoulli) Seite 102: There are few Problems concerning Curves more elegant than this, or that give a greater Insight into their nature. (Newton 1671, engl. Ver¨off. 1736, S. 59)
Anhang: Originalzitate 381
R Seite 107: And whereas Mr Leibnits præfixes the letter to the Ordinate of a curve to denote the Summ of the Ordinates or area of the Curve, I did some years before represent the same thing by inscribing the Ordinate in a square . . . My symbols therefore . . . are the oldest in the kind. (Newton, Brief an Keill, 20. April 1714) Seite 112: The fluxion of the Length is determin’d by putting it equal to the square-root of the sum of the squares of the fluxion of the Absciss and of the Ordinate. (Newton 1736, Fluxions, S. 130) Seite 118: La quantit´e cy dessus ppads qqss − ppaa se reduit immediatement, sans autre changement, a` deux fractions logarithmicales, en la partageant ainsi 1 1 pds pds ppads = 2 − 2 ... qqss − ppaa qs − pa qs + pa (Anhang an einen Brief von Joh. Bernoulli, 1699, siehe Briefwechsel, Band 1, S. 212) Problema 3: Si X denotet functionum quamcunque rationalem fractam ipsius x, methodum describere, cuius ope formulae Xdx integrale investigari conveniat. (Euler 1768, Opera Omnia, Band XI, S. 28) Seite 126: Bien que le probl`eme (des quadratures) ait une dur´ee de deux cents ans a` peu pr`es, bien qu’il e´ tait l’objet de nombreuses recherches de plusieurs g´eom`etres : Newton, Cotes, Gauss, Jacobi, Hermite, Tch´ebychef, Christoffel, Heine, Radeau [sic], A. Markov, T. Stitjes [sic], C. Poss´e, C. Andr´eev, N. Sonin et d’autres, il ne peut eˆ tre consid´er´e, cependant, comme suffisamment e´ puis´e. (Steklov 1918)
R
x
On s’assurera ais´ement par notre m´ethode que l’int´egrale e xdx , dont les G´eom`etres se sont beaucoup occup´es, est impossible sous forme finie . . . (Liouville 1835, S. 113) Seite 135: Claudius Perraltus Medicus Parisinus insignis, tum & Mechanicis atque Architectonicis studiis egregius, & Vitruvii editione notus, idemque in Regia scientiarum Societate Gallica, dum viveret, non postremus, mihi & aliis ante me multis proposuit hoc problema, cujus nondum sibi occurrisse solutionem ingenue fatebatur . . . (Leibniz 1693) Seite 136: Mais pour juger mieux de l’excellence de vostre Algorithme j’attens avec impatience de voir les choses que vous aurez trouv´ees touchant la ligne de la corde ou chaine pendante, que Mr. Bernouilly vous a propos´e a` trouver, dont je luy scay bon gr´e, parce que cette ligne renferme des proprietez singulieres et remarquables. Je l’avois consider´ee autre fois dans ma jeunesse, n’ayant que 15 ans, et j’avois demontr´e au P. Mersenne, que ce n’estoit pas une Parabole ... (Brief von Huygens an Leibniz, 9. Okt. 1690) Les efforts de mon frere furent sans succ`es, pour moi, je fus plus heureux, car je trouvai l’adresse . . . Il est vrai que cela me couta des meditations qui me deroberent le repos d’une nuit entiere . . . (Joh. Bernoulli, siehe Briefwechsel, Band 1, S. 98) Seite 137: Datis in plano verticali duobus punctis A et B assignare mobili M , viam AM B per quam gravitate sua descendens et moveri incipiens a puncto A, brevissimo tempore perveniat ad alterum punctum B. (Joh. Bernoulli 1696) Ce probl`eme me paroist des plus curieux et des plus jolis que l’on ait encore propos´e, et je serois bien aise de m’y appliquer, mais pour cela il seroit necessaire que vous me l’envoyassiez r´eduit a` la mathematique pure, car le phisique m’embarasse . . . (de L’Hospital, Brief an Joh. Bernoulli, 15. Juni 1696)
382 Anhang: Originalzitate Seite 140: En v´erit´e rien n’est plus ingenieux que la solution que vous donnez de l’´egalit´e de Mr. votre frere; & cette solution est si simple qu’on est surpris que ce problˆeme ait paru si difficile: c’est l`a ce qu’on appelle une e´ l´egante solution. (P. Varignon, Brief an Joh. Bernoulli “6 Aoust 1697”) Per liberare la premessa formula dalle seconde differenze, . . . , chiamo p la sunnormale BF. (Riccati 1712) Seite 154: PROBLEMA 85: Proposita aequatione differentiali quacunque eius integrale completum vero proxime assignare. (Euler 1768, §650) Seite 156: PROBLEMA 86: Methodum praecedentem aequationes differentiales proxime integrandi magis perficere, ut minus a veritate aberret. (Euler 1768, §656) Seite 160: J’ai ici un gros cyclope de g´eom`etre . . . il ne reste plus qu’un oeil a` notre homme, et une courbe nouvelle, qu’il calcule a` pr´esent, pourrait le rendre aveugle tout a` fait. (Friedrich II., siehe Spiess 1929, S. 165–166.) Seite 170: . . . et je ne r´eponds pas que je fasse encore de la g´eom´etrie dans dix ans d’ici. Il me semble aussi que la mine est presque d´ej`a trop profonde et . . . il faudra tˆot ou tard l’abandonner. La physique et la chimie offrent maintenant des richesses plus brillantes et d’une exploitation plus facile . . . (Lagrange, 21. Sept. 1781, Brief an d’Alembert, Oeuvres, Band 13, S. 368) Seite 172: On dit qu’une grandeur est la limite d’une autre grandeur, quand la seconde peut approcher de la premi`ere plus pr`es que d’une grandeur donn´ee, si petite qu’on la puisse supposer, . . . (D’Alembert 1765, Encyclop´edie, tome neuvieme, a` Neufchastel) Lorsqu’une quantit´e variable converge vers une limite fixe, il est souvent utile d’indiquer cette limite par une notation particuli`ere, c’est ce que nous ferons, en plac¸ant l’abr´eviation lim devant la quantit´e variable dont il s’agit . . .
(Cauchy 1821, Cours d’Analyse) Seite 181: . . . jusqu’`a pr´esent on a regard´e ces propositions comme des axiomes. (M´eray 1869, siehe Dugac 1978, S. 82) Seite 184: Une chose e´ tonnante, je trouve, c’est que Monsieur Weierstrass et Monsieur Kronecker peuvent trouver tant d’auditeurs — entre 15 et 20 — pour des cours si difficiles et si e´ lev´es. (Brief von Mittag-Leffler 1875, siehe Dugac 1978, S. 68) Seite 188: Je consacrerai toutes mes forces a` r´epandre de la lumi`ere sur l’immense obscurit´e qui r`egne aujourd’hui dans l’Analyse. Elle est tellement d´epourvue de tout plan et de tout syst`eme, qu’on s’´etonne seulement qu’il y ait tant de gens qui s’y livrent — et ce qui pis est, elle manque absolument de rigueur. (Abel 1826, Oeuvres, Band 2, S. 263) Cauchy est fou, et avec lui il n’y a pas moyen de s’entendre, bien que pour le moment il soit celui qui sait comment les math´ematiques doivent eˆ tre trait´ees. Ce qu’il fait est excellent, mais tr`es brouill´e . . . (Abel 1826, Oeuvres, Band 2, S. 259) Seite 202: On appelle ici Fonction d’une grandeur variable, une quantit´e compos´ee de quelque mani´ere que ce soit de cette grandeur variable & de constantes. (Joh. Bernoulli 1718, Opera, Band 2, S. 241) Quocirca, si f ( xa + c) denotet functionem quamcunque . . . (Euler 1734, Opera, Band XXII, S. 59) Seite 204: . . . f (x) sera fonction continue, si . . . la valeur num´erique de la diff´erence f (x + α) − f (x) d´ecroˆıt ind´efiniment avec celle de α . . . (Cauchy 1821, Cours d’Analyse, S. 43)
Anhang: Originalzitate 383 Seite 206: Ce th´eor`eme est connu depuis longtemps . . . (Lagrange 1807, Oeuvres, Band 8, S. 19, siehe auch S. 133) Seite 213: Dans l’ouvrage de M. Cauchy on trouve le th´eor`eme suivant: “Lorsque les diff´erens termes de la s´erie u0 + u1 + u2 + . . . sont des fonctions . . . continues, . . . la somme s de la s´erie est aussi . . . fonction continue de x.” Mais il me semble que ce th´eor`eme admet des exceptions. Par exemple la s´erie sin x −
1 2
sin 2x + 13 sin 3x . . .
est discontinue pour toute valeur (2m + 1)π de x, . . . (Abel 1826, Oeuvres, Band 1, S. 224–225) Seite 221: L’illustre g´eom`etre [Riemann] . . . g´en´eralise, par une de ces vues qui n’appartiennent qu’aux esprits de premier ordre, la notion de l’int´egrale d´efinie, . . . (Darboux 1875) Seite 235: . . . la rigueur, dont je m’´etais fait une loi dans mon Cours d’analyse, . . . (Cauchy 1829, Lec¸ons) Seite 238: Many of our students will appreciate the pithy elegance of this proof. (Kuhn 1991) Seite 240: Voir la belle d´emonstration de ce th´eor`eme, donn´ee par M. O. Bonnet, dans le Trait´e de Calcul diff´erentiel et int´egral de M. Serret, t. I, p. 17. (Darboux 1875, S. 111) Seite 242: . . . tout a` fait au-dessus de la vaine gloire, que la plupart des Sc¸avans recherchent avec tant d’avidit´e . . . (Fontenelles Meinung u¨ ber Guillaume-Franc¸ois-Antoine de L’Hospital, Marquis de SainteMesme et du Montellier, Comte d’Antremonts, Seigneur d’Ouques, 1661– 1704) Au reste je reconnois devoir beaucoup aux lumieres de Mrs Bernoulli, sur tout a` celles du jeune presentement Professeur a` Groningue. Je me suis servi sans fac¸on de leurs d´ecouvertes . . . (de L’Hospital 1696) Seite 245: O`u est-il d´emontr´e qu’on obtient la diff´erentielle d’une s´erie infinie en prenant la diff´erentielle de chaque terme? (Abel, Janv. 16, 1826, Oeuvres, Band 2, S. 258) Seite 248: After a scientific meeting at which Cauchy presented his theory on the convergence of series Laplace hastened home and remained there in reclusion until he had examined the series in his M´ecanique c´eleste. Luckily every one was found to be convergent. (M. Kline 1972, S. 972) Seite 252: . . . et de juger de la valeur du reste de la s´erie. Ce probl`eme, l’un des plus importants de la th´eorie des s´eries, n’a pas encore e´ t´e r´esolu . . . (Lagrange 1797, Oeuvres, Band 9, S. 42–43, 71) . . . la formule de TAYLOR, cette formule ne pouvant plus eˆ tre admise comme g´en´erale . . . (Cauchy 1823, R´esum´e, S. 1) Seite 253: . . . mais celui qui me fait le plus de plaisir c’est un m´emoire . . . sur la simple s´erie 1 + mx +
m(m − 1) 2 x + ... 2
J’ose dire que c’est la premi`ere d´emonstration rigoureuse de la formule binˆome ... (Abel, Brief an Holmboe 1826, Oeuvres, Band 2, S. 261) Seite 257: Only wimps do the general case. True teachers tackle examples. (Parlett, siehe Math. Intelligencer, Band 14, Nr. 1, S. 35)
384 Anhang: Originalzitate Seite 263: Il y a cent ans, une pareille fonction eut e´ t´e regard´ee comme un outrage au sens commun. (Poincar´e 1899, L’oeuvre math. de Weierstrass, Acta Math., Band 22, S. 5) Seite 266: Telle est la proposition fondamentale qui a e´ t´e e´ tablie par Weierstrass. (Borel 1905, S. 50) Seite 271: The influence of physics in stimulating the creation of such mathematical entities as quaternions, Grassmann’s hypernumbers, and vectors should be noted. These creations became part of mathematics. (M. Kline 1972, S. 791) Seite 273: . . . il est tr`es utile d’introduire la consid´eration des nombres complexes, ou nombres form´es avec plusieurs unit´es, . . . (Peano 1888a, Math. Ann., Band 32, S. 450) Seite 283: Nous avons d´ej`a signal´e et nous reconnaˆıtrons dans tout le cours de ce Livre l’importance des ensembles compacts. Tous ceux qui ont eu a` s’occuper d’Analyse g´en´erale ont vu qu’il e´ tait impossible de s’en passer. (Fr´echet 1928, Espaces abstraits, S. 66) Seite 316: Or il est facile de voir que les diff´erentielles de cette esp`ece conservent les mˆemes valeurs quand on intervertit l’ordre suivant lequel les diff´erentiations relatives aux diverses variables doivent eˆ tre effectu´ees. (Cauchy 1823, R´esum´e, S. 76) Seite 330: On sait que l’´evaluation ou mˆeme la r´eduction des int´egrales multiples pr´esente g´en´eralement de tr`es grandes difficult´es . . . (Dirichlet RR 1839, Werke, Band I, S. 377) Seite 338: . . . locum habet pro quacunque alia formula Zdxdy, quippe quae per easRR dem substitutiones transformatur in hac Z(V R − ST ) dtdu . . . (Euler 1769b)
Literaturverzeichnis Kursive Zahlen in eckigen Klammern, die auf eine Referenz folgen, beziehen sich auf die Abschnitte, in denen aus dieser Referenz zitiert wird. A. Aaboe (1954): Al-Kashı’s iteration method for the determination of sin 1◦ , Scripta math. 20 (1954), S. 24–29. [I.4] A. Aaboe (1964): Episodes from the early history of mathematics, Random House, New Math. Library, Yale Univ. 1964. [I.4] N.H. Abel (1826): Recherches sur la s´erie 1 + m x + m(m−1) x2 + m(m−1)(m−2) x3 + . . . , 1 1·2 1·2·3 ¨ Oeuvres 1, S. 219–250; deutsche Ubers. Journal reine u. angew. Math. (Crelle), 1 (1826), S. 311–339. [III.2], [III.4], [III.7] N.H. Abel (1881): Oeuvres compl`etes, ver¨off. von L. Sylow und S. Lie, 2 B¨ande, Christiania, MDCCCLXXXI. [III.2], [III.4], [III.6] ` J. le Rond d’Alembert (1748): Suite des recherches sur le calcul int´egral, quatrieme partie: M´ethodes pour int´egrer quelques e´ quations diff´erentielles, Hist. Acad. Berlin, Band IV, S. 275–291. [II.8], [IV.0] J. le Rond d’Alembert (1754): Calcul diff´erentiel, Artikel unter D“ in der ber¨uhmten Encyclop´edie ou Dictionnaire raisonn´e des sciences, des” arts et des m´etiers, mis en ordre et publi´e par M. Diderot & par M. D’Alembert, tome quatrieme, S. 985, a` Paris, MDCCLIV. [II.1] J. le Rond d’Alembert (1765): Limite, Artikel unter L“ in der Encyclop´edie, tome neuvieme, S. 542, a` Neufchastel, MDCCLXV.”[III.1] Al-Khowˆarizmˆı (830): Al-jabr w’al muqˆabala, siehe: Robert von Chester (1145) und F. Rosen (1831). [I.1] ¨ Archimedes (∼ 240 B.C.): Uber die Vermessung des Kreises, (A̺χιµηδης, ´ K υκλoυ ´ µετ ´ ̺ησις), zahlreiche Ausgaben, insbesondere: J.L. Heiberg, Leipzig 1880; T.L. Heath, The works of Archimedes, Cambridge University Press, 1897. [I.4], [I.6] I. Barrow (1860): The mathematical works, Herausg. W. Whewell, xx+320 Seiten + 220 Abb. Cambridge 1860, Neuauflage G. Olms Verlag, 1973. [I.2] Jak. Bernoulli (1689): Positiones arithmeticae de seriebus infinitas, earumque summa finita, Basileae, 1689, Opera 1, S. 375–402. [I.2] Jak. Bernoulli (1690): Analysis problematis ante hac propositi, de inventione lineæ descensus a corpore gravi percurrendæ uniformiter, sic ut temporibus æqualibus æquales altitudines emetiatur: & alterius cujusdam Problematis Propositio, Acta Eruditorum 9, MDCLXXXX, S. 217–219. [II.4], [II.7] Jak. Bernoulli (1694): Constructio curvae accessus & recessus aequabilis, ope rectificationis curvae cujusdam algebraicae, Acta Eruditorum 13 (1694), S. 336–338, Opera 2 S. 608–612. [IV.3] Jak. Bernoulli (1702): Section ind´efinie des arcs circulaires, en telle raison qu’on voudra; Avec la mani´ere d’en d´eduire les Sinus, &c., Hist. Acad. Sciences de Paris (1702), S. 281; Opera, S. 921. [I.4] Jak. Bernoulli (1705): Ars conjectandi, opus posthumum, published posthumously Basileæ MDCCXIII; Werke 3, S. 107–286, Basel, 1975. [I.1] Jak. Bernoulli (1744): Opera, 2 B¨ande, VIII+48+1139 Seiten, Herausg. G. Cramer, Genava 1744. Joh. Bernoulli (1691): Solutio problematis funicularii, exhibita a Joh. Bernoulli, Basil. Med. Cand., Acta Eruditorum 10, MDCXCVI, S. 274–276; Opera I, S. 48–51. [II.7] Joh. Bernoulli (1691/92): Die Differentialrechnung von Johann Bernoulli, Nach der in der Basler Universit¨atsbibliothek befindlichen Handschrift u¨ bersetzt von Paul Schafheitlin, Akademische Verlagsgesellschaft Leipzig, 1924. [II.1], [II.2], [III.6] Joh. Bernoulli (1691/92b): Lectiones Mathematicæ, de methodo integralium, aliisque, consrciptæ in usum Ill. Marchionis Hospitalii, ver¨offentlicht 1742 in Opera 3, S. 385–558. [II.3]
386 Literaturverzeichnis Joh. Bernoulli (1692): Solutio curvæ causticæ per vulgarem geometriam Cartesianam; aliaque, Acta Erud. Lips. 11 (1692), S. 30; Opera I, S. 52–59. [II.3] Joh. Bernoulli (1694): Modus generalis construendi æquationes differentiales primi gradus, Acta Erud. Lips. 13 (1694), S. 435; Opera I, S. 123–125. [II.9] Joh. Bernoulli (1694b): Effectionis omnium quadraturam & rectificationum curvarum per seriem quandam generalissimam, Acta Erud. Lips. 13 (1694); Additamentum“ ” zum Artikel Joh. Bernoulli (1694). [II.4] Joh. Bernoulli (1696): Problema novum ad cuius solutionem Mathematici invitantur, Acta Eruditorum 15, MDCXCVI, S. 264–269. Opera I, S. 155–161. [II.7] Joh. Bernoulli (1697): Principia calculi exponentialium, seu percurrentium, Acta Erud. Lips. 16 (1697), S. 125; Opera I, S. 179–187; siehe auch Opera III, S. 376. [I.3], [II.6] Joh. Bernoulli (1697b): De Conoidibus et Sphaeroidibus quaedam. Solutio analytica Aequationis in Actis A. 1695, pag. 553 propositae (A Fratre Jac. Bernoullio), Acta Eruditorum 16, MDCXCVII, S. 113–118. Opera I, S. 174–179. [II.7] Joh. Bernoulli (1697c): Solutioque Problematis a se in Actis 1696, p. 269, proposit, de invenienda Linea Brachystochrona, Acta Eruditorum 16, MDCXCVII, S. 206; Opera I, S. 187–193. [II.7] Joh. Bernoulli (1702): Solution d’un probl`eme concernant le calcul int´egral, avec quelques abreg´es par raport a` ce calcul, Histoire de l’Acad. Royale des Sciences a` Paris, Ann´ee MDCCII, M´emoire, S. 289–297. (1697), S. 125; Opera I, S. 393–400. [II.5] Joh. Bernoulli (1742): Opera Omnia, 4 B¨ande, Lausannæ & Genavæ 1742; Nachdruck (Curavit J.E. Hofmann) 1968, Georg Olms Verlag Hildesheim. [III.3] Joh. Bernoulli (1955,1988): Der Briefwechsel von Johann Bernoulli, 2 B¨ande, Birkh¨auser Verlag Basel. [II.3], [II.5], [II.7] ¨ J.D. Blanton (1988): Introduction to analysis of the infinite, Englische Ubersetzung von Euler (1748), Springer-Verlag New York, 1988. [I.1] B. Bolzano (1817): Rein analytischer Beweis des Lehrsatzes, dass zwischen je zwei Werthen, die ein entgegengesetztes Resultat gew¨ahren, wenigstens eine reelle Wurzel der Gleichung liege, Prag 1817; Ostwald’s Klassiker #153, 1905 (siehe auch Stolz 1881). [III.0], [III.3] E. Borel (1895): Sur quelques points de la th´eorie des fonctions, Th`ese, parue aux Ann. Ecole normale sup. 3e s´erie, 12 (1895), S. 9–55; Oeuvres 1, S. 239–285. Der Satz von ” Paris, Heine-Borel“ befindet sich in einer Anmerkung“ am Ende der Arbeit. ” 1905. [IV.1] E. Borel (1905): Lec¸ons sur les fonctions de variables r´eelles et les d´eveloppements en s´eries de polynomes, r´edig´ees par M. Fr´echet, Gauthier-Villars, Paris 1905. [III.9] H. Briggs (1624): Arithmetica Logarithmica, Londini, Excudebat Gulielmus Iones, 1624. [I.2], [I.3] R.C. Buck (1980): Sherlock Holmes in Babylon, Am. Math. Monthly 87, Nr. 5 (1980), S. 335–345. [II.5] V. Buniakowsky (1859): Sur quelques in´egalit´es concernant les int´egrales ordinaires et les int´egrales aux diff´erences finies, M´emoires de l’Acad. de St-P´etersbourg (VII), 1 (1859), Nr. 9. [III.5] J. B¨urgi (1620): Arithmetische und geometrische Progress-Tabulen, Prag, 1620. [I.3] G. Cantor (1870): Beweis, dass f¨ur jeden Werth von x durch eine trigonometrische Reihe gegebene Function f (x) sich nur auf eine einzige Weise in dieser Form darstellen l¨asst, Journal reine u. angew. Math. (Crelle), 72 (1870), S. 139–142; siehe insbesondere die Fußnote auf S. 141. Gesammelte Abhandlungen, S. 80–83. [III.3] ¨ G. Cantor (1872): Uber die Ausdehnung eines Satzes aus der Theorie der trigonometrischen Reihen, Math. Annalen 5 (1872), S. 123–132. Gesammelte Abhandlungen, S. 92– 102. [III.1] G. Cantor (1878): Ein Beitrag zur Mannigfaltigkeitslehre, Journal reine u. angew. Math. (Crelle), 84 (1878), S. 242–258. Gesammelte Abhandlungen, S. 119–133. [IV.2] G. Cantor (1880): Fernere Bemerkung u¨ ber trigonometrische Reihen, Math. Annalen 16 (1880), S. 267–269. Gesammelte Abhandlungen, S. 104–106. [III.4]
Literaturverzeichnis 387 G. Cantor (1883): Ueber unendliche, lineare Punktmannichfaltigkeiten, Nr. 5, Math. Annalen 21 (1883), S. 545–591. Gesammelte Abhandlungen, S. 165–209. [IV.1] G. Cantor (1884): Ueber unendliche, lineare Punktmannichfaltigkeiten, Nr. 6, Math. Annalen 23 (1884), S. 453–488. ( Fortsetzung folgt“); Gesammelte Abhandlungen, ” S. 210–246. [IV.1] G. Cantor (1889): Bemerkung mit Bezug auf den Aufsatz: Zur Weierstraß - Cantorschen Theorie der Irrationalzahlen, Math. Annalen 33 (1889), S. 476, Gesammelte Abhandlungen, S. 114. [III.1] G. Cantor (1932): Gesammelte Abhandlungen, Herausg. E. Zermelo, Springer-Verlag, Berlin, 1932. [IV.1] M. Cantor (1880–1908): Vorlesungen u¨ ber Geschichte der Mathematik, Band I 1880, Band II 1891, Band III 1898, Band IV 1908; viele weitere Ausgaben und Nachdrucke, Teubner Verlag, Leipzig. [I.1], [I.4] C. Carath´eodory (1950): Funktionentheorie, Erster Band, Verlag Birkh¨auser Basel, 1950, 288 S. [III.6] H. Cardano (1545): Ars magna de rebus algebraicis, N¨urnberg, 1545. [I.1], [I.2], [I.5] A.L. Cauchy (1821): Cours d’analyse alg´ebrique, Oeuvres s´erie 2, Band III. [II.4], [III.1], [III.2], [III.3], [III.4], [III.5], [III.6], [III.7], [IV.2] A.L. Cauchy (1823): R´esum´e des lec¸ons sur le calcul infinit´esimal, Oeuvres s´erie 2, Band IV, S. 1–261. [II.1], [III.5], [III.7], [IV.4] A.L. Cauchy (1824): R´esum´e des Lec¸ons donn´ees a` l’Ecole Royale Polytechnique. Suite du Calcul Infinit´esimal; ver¨off.: Equations diff´erentielles ordinaires, Herausg. Chr. Gilain, Johnson, 1981. [II.3], [II.9] A.L. Cauchy (1829): Lec¸ons sur le calcul diff´erentiel, Oeuvres s´erie 2, Band IV, S. 265– 572. [III.6], [IV.4] L. van Ceulen (1596, 1616): Van de Circkel, daarin geleert wird te finden de naeste proportie des Circkels diameter tegen synen Omloop, Delft. [I.4] ´ G. Darboux (1875): M´emoire sur les fonctions discontinues, Annales. Ecole norm. sup. S´er. 2, 4 (1875), S. 57–112. [III.4], [III.5], [III.6] R. Dedekind (1872): Stetigkeit und irrationale Zahlen, erste Auflage 1872, vierte Auflage ¨ 1912, englische Ubersetzung Continuity and irrational numbers in Essays on the theory of numbers, Dover, 1963; Werke 3, S. 314–343. [III.1] R. Descartes (1637): La Geometrie, Anhang zu Discours de la methode, Paris 1637, eng¨ lische Ubersetzung, mit einem Nachdruck der ersten Auflage, D. E. Smith & M. L. Latham, The Oper Court Publishing Comp., 1925, Nachdruck 1954 durch Dover. [I.1], [I.2], [I.5], [II.1], [IV.3] U. Dini (1878): Fondamenti per la teoria delle funzioni di variabili reali, Pisa, 1878, ¨ deutsche Ubersetzung von L¨uroth und Schepp, Teubner Leipzig, 1892. [III.5], [III.9] ¨ G.L. Dirichlet (1837): Uber die Darstellung ganz willk¨urlicher Functionen durch Sinusund Cosinusreihen, Rep. der Physik, 1837; auch: Ostwald’s Klassiker Nr. 116, Leipzig, 1900; Werke 1, S. 133–160. [III.3] G.L. Dirichlet (1837b): Beweis des Satzes, dass jede unbegrenzte arithmetische Progression, deren erstes Glied und Differenz ganze Zahlen ohne gemeinschaftlichen Factor sind, unendlich viele Primzahlen enth¨alt, Abh. der K¨onigl. Preussischen Acad. der Wiss. Berlin, 1837, Werke 1, S. 313–342. [III.2] ¨ G.L. Dirichlet (1839): Uber eine neue Methode zur Bestimmung vielfacher Integrale, Ber. u¨ ber die Verh. der K¨onigl. Preussischen Acad. der Wiss. Berlin, 1839, S. 18– 25; Werke 1, S. 381–390. [IV.5] P. Du Bois-Reymond (1875): Ueber eine ver¨anderte Form der Bedingung f¨ur die Integrirbarkeit der Functionen, Journal reine u. angew. Math. (Crelle), 79 (1875), S. 259–262. [III.5] P. Dugac (1978): Sur les fondements de l’analyse, Th`ese, Paris 1978; siehe auch Fondements de l’analyse, Kapitel VI von Abr´eg´e d’histoire des math´ematiques 17001900 sous la direction de Jean Dieudonn´ee, Hermann e´ diteurs, Paris, 1978. [III.1]
388 Literaturverzeichnis A. D¨urer (1525): Underweysung der messung, mit dem zirckel u˜n richtscheyt, in Linien ebnen unnd gantzen corporen, durch Albrecht D¨urer zu samen getzog˜e, und zu nutz all˜e kunstlieb habenden mit zu geh¨origen figuren, in truck gebracht, im jar. M.D.XXV. Nachdruck im Verlag Dr. Alfons Uhl, N¨ordlingen, 1983. [I.4], [II.3] ¨ Euklid (∼ 300 B.C.): Die Elemente, (EYKΛEI∆OY, ΣTOIXEIA); viele Ubersetzungen und Ausgaben, erstes je gedrucktes Buch u¨ ber Mathematik (Venedig 1482); der heutige, endg¨ultige Text geht zur¨uck auf J.L. Heiberg 1883–1888; englische ¨ Ubersetzung mit Kommentaren: Sir Thomas L. Heath 1908 und 1925; Nachdruck 1956 durch Dover Publications in drei B¨anden. [I.1], [I.4], [I.6], [III.1] L. Euler (1734): Additamentum ad dissertationem de infinitis curvis eiusdem generis, (Enestr. 45), Comm. ac. sc. Petrop. 7 (1734/5), 1740, S. 184–200; Opera 22, S. 57– 75. [III.3] L. Euler (1736): Methodus universalis series summandi ulterius promota, (Enestr. 55), Comm. acad. scient. Petrop., Band 8, S. 147–158; Opera Omnia 14, S. 124– 137. [II.10] L. Euler (1736b): Mechanica, sive motus scientia analytice exposita: instar supplementi ad commentar, (Enestr. 15, 16), Acad. scient. Petrop. 1736; Opera Omnia, Ser. 2, 1,2. [I.2] [III.0] L. Euler (1737): De variis modis circuli quadraturam numeris proxime exprimendi, (Enestr. 74), Comm. ac. sc. Petrop. 9 (1737), S. 222–236; Opera 14, S. 245–259. [I.4] L. Euler (1737b): De fractionibus continuis dissertatio, (Enestr. 71), Comm. ac. sc. Petrop. 9 (1737), S. 98–137; Opera 14, S. 187–215. [I.6] L. Euler (1740): De summis serierum reciprocarum, (Enestr. 41), Comm. ac. sc. Petrop. 7 (1734/5), 1740, S. 123–134; Opera 14, S. 73–86. [I.5] L. Euler (1743): De summis serierum reciprocarum ex potestatibus numerorum naturalium ortarum dissertatio altera in qua eaedem summationes ex fonte maxime diverso derivantur, (Enestr. 61), Miscellanea Berolinensia 7 (1743), S. 172–192; Opera 14, S. 138–155. [I.5] L. Euler (1743b): De integratione aequationum differentialium altiorum graduum, (Enestr. 62), Miscellanea Berolinensia, Band 7, S. 193–242; Opera Omnia 22, S. 108–149. Siehe auch: Brief von Euler an Joh. Bernoulli, 15. Sept. 1739. [II.8] L. Euler (1744): Methodus inveniendi lineas curvas maximi minimive proprietate gaudentes sive solutio problematis isoperimetrici latissimo sensu accepti, (Enestr. 65), Lausannae & Genevae, Opera Omnia (intr. by Carath´eodory) 24, S. 1–308. [III.0] L. Euler (1748): Introductio in analysin infinitorum, (Enestr. 101), Tomus primus, Lau¨ ¨ sannæ MDCCXLVIII, Opera 8. Franz. Ubers. 1785, 1796; deutsche Ubers. 1788, ¨ 1885 (Nachdruck Springer 1983); englische Ubers. Blanton (1988). [I.0], [I.2], [I.3], [I.4], [I.5], [I.6], [III.0], [III.3] L. Euler (1750): Animadversiones in rectificationem ellipsis, (Enestr. 154), Opuscula varii argumenti 2 (1750), S. 121–166; Opera 20, S. 21–55. [II.6] L. Euler (1750b): Methodus aequationes differentiales altiorum graduum integrandi ulterius promota, (Enestr. 188), Novi Comment. acad. scient. Petrop., Band 3, S. 3–35; Opera Omnia 22, S. 181–213. [II.8] L. Euler (1751): De la controverse entre Mrs. Leibniz et Bernoulli sur les logarithmes des nombres n´egatifs et imaginaires, (Enestr. 168), M´em. ac. sc. Berlin 5 (1751), S. 139–179; Opera 17, S. 195–232. [I.5] L. Euler (1755): Institutiones calculi differentialis cum eius vsu in analysi finitorum ac doctrina serierum, (Enestr. 212), Imp. Acad. Imper. Scient. Petropolitanae, Opera 10. [I.2], [I.5], [II.1], [II.2], [II.10], [III.0], [III.8], [IV.4] L. Euler (1755b): Principes g´en´eraux du mouvement des fluides, (Enestr. 226), M´em. ac. sc. Berlin 11 (1755), S. 274–315; Opera Ser. II, 12, S. 54–91. [III.0] L. Euler (1768): Institutiones Calculi Integralis, (Enestr. 342), Volumen Primum, Opera 11. [II.4], [II.5], [II.9], [III.0], [III.7] L. Euler (1769): Institutiones Calculi Integralis, (Enestr. 366), Volumen Secundum, Opera 12. [II.8], [III.0] L. Euler (1769b): De formulis integralibus duplicatis, (Enestr. 391), Novi comm. acad. scient. Petrop. 14 (1769): I, 1770, S. 72–103; Opera 17, S. 289–315. [IV.5]
Literaturverzeichnis 389 L. Euler (1770): Vollst¨andige Anleitung zur Algebra, (Enestr. 387, 388), von Hrn. Leonhard Euler, St. Petersburg. gedruckt bey der Kays. Acad. der Wissenschaften, 1770; Opera 1. [I.1], [III.0] L. Euler (1911–): Opera Omnia, mehr als 80 B¨ande in 4 Serien, Serie I enth¨alt die mathematischen Arbeiten, Teubner Leipzig und Berlin, sp¨ater F¨ussli, Z¨urich. [I.1], [III.0], [III.8] E.A. Fellmann (1983): Leonhard Euler, ein Essay u¨ ber Leben und Werk, in: Leonhard Euler 1707–1783, Gedenkband des Kantons Basel-Stadt, Birkh¨auser Verlag Basel, 1983. [II.10] P. Fermat (1636): De Aequationum localium transmutatione et emendatione ad multimodam curvilineorum inter se vel cum rectilineis comparationem, cui annectitur proportionis geometricae in quadrandis infinitis parabolis et hyperbolis ¨ usus, Oeuvres, Band 1, S. 255–288; franz. Ubers. Oeuvres, Band 3, S. 216. [I.3] P. Fermat (1638): Methodus ad disquirendam maximam et minimam, Oeuvres Band 1, ¨ S. 133–179; franz. Ubers. Oeuvres, Band 3, S. 121–156. [II.2] P. Fermat (1891, 1894, 1896): Oeuvres, 3 B¨ande, Gauthier-Villars Paris. D. de Foncenex (1759): Reflexions sur les quantit´es imaginaires, Miscellanea Phil.-Math. Soc. Taurinensis, 1 Torino, 1759, S. 113–146. [I.4] J.B.J. Fourier (1822): La th´eorie analytique de la chaleur, Paris, 1822; ein Manuskript von 1807 mit dem Titel Sur la propagation de la chaleur wurde aufgrund von Einw¨anden von Lagrange nicht ver¨offentlicht. [II.4] M. Fr´echet (1906): Sur quelques points du calcul fonctionnel, Palermo Rend. 22, S. 1–74, Th`ese Paris, 1906. [IV.1], [IV.3] A. Fresnel (1818): M´emoire sur la diffraction de la lumi`ere, M´em. Acad. sc. 5, Paris, 1818, S. 339. [II.6] G. Galilei (1638): Discorsi e dimonstrazioni matematiche, intorno a` due nuove scienze, attenenti alla mecanica & i movimenti locali, del Signor Galileo Galilei Linceo, Filosofo e matematico primario del Serenissimo Grand Duca di Toscana, in Leida M.D.C.XXXVIII. [II.1], [II.7] C.F. Gauß (1799): Demonstratio nova theorematis omnem functionem algebraicam rationalem integram unius variabilis in factores reales primi vel secundi gradus resolvi posse, Helmstadii MDCCLXXXXIX, Werke, 3, S. 1–31. [I.5], [III.0] C.F. Gauß (1812): Disquisitiones generales circa seriem infinitam αβ 1 + 1·γ x + α(α+1)β(β+1) xx + α(α+1)(α+2)β(β+1)(β+2) x3 + etc, 1·2·γ(γ+1) 1·2·3·γ(γ+1)(γ+2) Werke, 3, S.123–162. [III.0] C.F. Gauß (1863–1929): Werke, Herausg. K¨onigl. Ges. der Wiss. G¨ottingen, 12 B¨ande, Nachdruck Georg Olms Verlag, 1973. [I.4] A. Genocchi & G. Peano (1884): Calcolo differenziale e principii di calcolo integrale, pub” blicato con aggiunte dal Dr. Giuseppe Peano“ Torino, 1884; deutsche Ausgabe (G. Bohlmann & A. Schepp), 1899. [IV.3] J. Gerver (1970): The differentiability of the Riemann function at certain rational multiples of π, Amer. J. of Math. 92 (1970), S. 33–55. [III.9] J.W. Gibbs (1907): Vector analysis, ein Lehrbuch f¨ur den Gebrauch durch Studenten der Mathematik und Physik, basierend auf den Vorlesungen von J.W. Gibbs, von E.B. Wilson. New York 1907, 436 S. [IV.3] H.H. Goldstine (1977): A history of numerical analysis from the 16th through the 19th century, Springer-Verlag New York, 1977, 348 S. [I.1], [II.6] I.S. Gradshteyn & I.M. Ryzhik (1980): Table of Integrals, Series, and Products, 1156 ¨ S., Academic Press; erste englische Ubers. 1965; russ. Ausgabe: I.S. Gradxtein, I.M. Ryжik, Tablicy Integralov, summ, rdov i proizvedenii, Fizmatgiz, Moskva, 1962. [II.4] H.G. Grassmann (1844, 1862): Die lineare Ausdehnungslehre, 1844, Nachdruck 1894 von Teubner, Leipzig ( mit dem Bildnis Graßmanns in Holzschnitt“); u¨ berarbeitete ” Ausgabe Die Ausdehnungslehre, 1862, Nachdruck Teubner, 1896. [IV.0], [IV.1], [IV.2] J. Gregory (1668): Exercitationes geometricae. Appendicula ad veram circuli et hyperbolae quadraturam, London, 1668. [I.3] W. Gr¨obner & N. Hofreiter (1949): Integraltafel, erster Teil: unbestimmte Integrale, 166 S., Springer-Verlag, Wien und Innsbruck, 1949. [II.4]
390 Literaturverzeichnis J. Hadamard (1892): Essai sur l’´etude des fonctions donn´ees par leur d´eveloppement de Taylor, J. de Math. (4), 8 (1892), S. 101–186. [III.7] E. Hairer, S.P. Nørsett, G. Wanner (1993): Solving ordinary differential equations I. Nonstiff problems, Springer-Verlag Berlin Heidelberg, 1987, zweite Auflage 1993, 528 S. [II.9] E. Halley (1694): A new, exact, and easy method, of finding the roots of any equations generally, and that without any previous reduction, von Edm. Halley, Savilischer Lehrstuhl f¨ur Geometrie, Philosophical Transactions, Nr. 210, A.D. 1694; neuver¨offentlicht als Anhang zu Newtons Universal Arithmetick, MDCCXXVIII, S. 258. [II.2] P.R. Halmos (1958): Finite-dimensional vector spaces, zweite Auflage, Van Nostrand, 1958, Springer UTM, 1974, 200 S. [IV.4] W.R. Hamilton (1853): Lectures on quaternions, ver¨offentlicht 1853, erweiterte Ausgabe ¨ Elements of quaternions 1866, deutsche Ubersetzung, 1882. [IV.0], [IV.3] F. Hausdorff (1914): Grundz¨uge der Mengenlehre, dem Sch¨opfer der Mengenlehre HERRN GEORG CANTOR in dankbarer Verehrung gewidmet, Leipzig, 1914; englische ¨ Ubersetzung: Chelsea, 1957. [IV.1], [IV.2] T. Hayashi (1902): The values of π used by the Japanese mathematicians of the 17th and 18th centuries, Bibliotheca mathematica, Ser. 3, 3 (1902), S. 273–275. [I.6] E. Heine (1870): Ueber trigonometrische Reihen, J. Reine und Angew. Math. (Crelle) 71 (1870), S. 353–365. [III.4], [III.5] E. Heine (1872): Die Elemente der Funktionenlehre, J. Reine und Angew. Math. (Crelle) 74 (1872), S. 172–188. [III.1], [III.4], [IV.1], [IV.2] ´ Ch. Hermite (1873): Cours d’Analyse de l’Ecole Polytechnique, Paris, Gauthier-Villars, 1873; Oeuvres 3, S. 35–54. [II.5] O. Hesse (1857): Ueber die Criterien des Maximums und Minimums der einfachen Integrale, J. Reine und Angew. Math. (Crelle) 54 (1857), S. 227–273. [IV.4] D. Hilbert (1891): Ueber die stetige Abbildung einer Linie auf ein Fl¨achenst¨uck, Math. Annalen 38 (1891), S. 459–460. [III.9], [IV.2] D. Hilbert (1932–1935): Gesammelte Abhandlungen, erste Auflage Springer-Verlag, Berlin, 1932–1935, Nachdruck Chelsea, 1965, zweite Auflage Springer-Verlag, 1970. [III.3] O. H¨older (1889): Ueber einen Mittelwertsatz, G¨ott. Nachr. 1889, S. 38–47. [IV.4] G. de L’Hospital; siehe unter L“. ” A. Hurwitz (1962, 1963): Mathematische Werke, hrsg. Abtlg. Math. Phys. ETH Z¨urich, 2 B¨ande, Birkh¨auser Verlag Basel und Stuttgart, 1962, 1963. [I.6] C. Huygens (1673): (Christiani Hugenii Zulichemii) Horologium oscillatorium, sive de motu pendulorum ad horologia aptato demonstrationes geometricæ, Paris, 1673. [II.1], [II.3], [II.7] C.G.J. Jacobi (1827): De singulari quadam duplicis integralis transformatione, J. Reine und Angew. Math. (Crelle) 2 (1827), S. 234–242; Werke 3, S.57–66. [II.3] C.G.J. Jacobi (1834): De usu legitimo formulae summatoriae Maclaurinianae, J. Reine und Angew. Math. (Crelle) 12 (1834), S. 263–272; Werke 6, S. 64–75. [II.10] C.G.J. Jacobi (1841): De determinantibus functionalibus, J. Reine und Ang. Math. (Crelle) 22 (1841), S. 319–359; Werke 3, S. 393–438. [IV.3], [IV.5] C.G.J. Jacobi (1881–1891): Gesammelte Werke, 8 B¨ande, hrsg. C.W. Borchardt, Berlin, 1881–1891, Neubearbeitung Chelsea New York, 1969. [I.1], [IV.5] W. Jones (1706): Synopsis palmariorum matheseos: or, New introduction to the mathematics: containing principles of arithmetic & geometry, demonstrated, in a short and easie method . . ., London, 1706. [I.4] C. Jordan (1882): Cours d’analyse de l’Ecole ploytechnique, Paris, 1882–1887 (3 B¨ande). [IV.1] ¨ W. Kaunzner (1980): Uber Regiomontanus als Mathematiker, S. 125–145 in: Regiomon¨ tanus-Studien, hrsg. G. Hamann, Osterr. Akad. der Wiss., Wien, 1980. [I.4] J. Kepler (1615): Nova stereometria doliorum vinariorum, in primis Austriaci, figuræ omnium aptissimæ, Authore Ioanne Kepplero, imp. Cæs. Matthiæ I. ejusq; fidd. Ordd. Austriæ supra Anasum Mathematico, Lincii, Anno M.DC.XV. [II.4]
Literaturverzeichnis 391 F. Klein (1908): Elementarmathematik vom h¨oheren Standpunkte aus, Band 1 Arithmetik, Algebra, Analysis; dritte Auflage 1924, Grundlehren, Band XIV, SpringerVerlag Berlin; als Autographie, ausgearbeitet von E. Hellinger, B. G. Teubner. [II.1], [II.2], [III.6] F. Klein (1926, 1927): Vorlesungen u¨ ber die Entwicklung der Mathematik im 19. Jahrhundert, 2 B¨ande, Springer-Verlag Berlin 1926, 1927, Nachdruck in einem Band Chelsea New York 1967, Springer-Verlag 1979. [IV.3] M. Kline (1972): Mathematical thought from ancient to modern times, New York, Oxford Univ. Press, 1238 S. [I.2], [I.3], [I.5], [II.6], [III.7], [IV.0] K. Knopp (1922): Theorie und Anwendung der unendlichen Reihen, Grundlagen, Bd. 2, Springer-Verlag, Berlin, 1922, zweite Aufl. 1924, dritte Aufl. 1931, vierte Aufl. 1947. [III.2] D.E. Knuth (1962): Euler’s constant to 1271 places, Math. of Comput. 16 (1962), S. 275– 281. [II.10] H. von Koch (1906): Une m´ethode g´eom´etrique e´ l´ementaire pour l’´etude de certaines questions de la th´eorie des courbes planes, Acta Mathematica 30, (1906), S. 145– 174. [III.9], [IV.5] S. Kuhn (1991): The derivative a` la Carath´eodory, Math. Monthly 98, Nr. 1 (1991), S. 40– 44. [III.6] J.L. de Lagrange (1759): Recherches sur la m´ethode de maximis et minimis, Misc. Taurinensia, Torino 1 (1759), Oeuvres I, S. 3–20. [II.2], [IV.4] J.L. de Lagrange (1773): Sur l’attraction des sph´ero¨ıdes elliptiques, Nouv. M´em. Acad. royale Berlin ann´ee 1773, Oeuvres 3, S. 619–649. [IV.5] J.L. de Lagrange (1775): Recherche sur les Suites R´ecurrentes, Nouveaux M´em. de l’Acad. royale des Sciences et Belles-Lettres, Berlin. Oeuvres 4, S. 159. [II.8] J.L. de Lagrange (1788): M´echanique analitique, Par M. de la Grange, Paris, MDCC.LXXXVIII, Oeuvres 11 und 12. [II.8], [III.0], [IV.4] J.L. de Lagrange (1797, 1813): Th´eorie des fonctions analytiques, contenant les principes du calcul diff´erentiel, d´egag´es de toute consid´eration d’infiniment petits, d’´evanouissans, de limites ou de fluxions, et r´eduits a` l’analyse alg´ebrique des quantit´es finies, A Paris, de l’imprimerie de la r´epublique, Prairial an V (1797), deuxi`eme e´ dition: Gauthier-Villars, 1813. [II.1], [III.0], [III.6], [III.7] J.L. de Lagrange (1867–1882): Oeuvres, 14 B¨ande, hrsg. J.-A. Serret und G. Darboux, Paris 1867–1882, Nachdruck 1973, Georg Olms Verlag Hildesheim. [I.1], [III.7] J.H. Lambert (1768): M´emoire sur quelques propri´et´es remarquables des quantit´es transcendantes circulaires et logarithmiques, M´em. Acad. sc. Berlin 17 (1768), S. 265–322, Opera II, S. 112–159. [I.6] J.H. Lambert (1770a): Vorl¨aufige Kenntnisse f¨ur die, so die Quadratur und Rectification des Circuls suchen, Berlin 1770, Opera I, S. 194–212. [I.6] J.H. Lambert (1770b): Observations trigonom´etriques, M´em. Acad. sc. Berlin 24 (1770), S. 327–357, Opera II, S. 245–269. [I.4] J.H. Lambert (1770c): Algebraische Formeln f¨ur die Sinus von drey zu drey Graden, Berlin, 1770, Opera I, S. 189–193. [I.4] J.H. Lambert (1946, 1948): Opera Mathematica, 2 B¨ande, Orell F¨ussli Verlag Z¨urich. ¨ E. Landau (1908): Uber die Approximation einer stetigen Funktion durch eine ganze rationale Funktion, Rendiconti di Palermo 25 (1908), S. 337–346; Collected Works 3, S. 402–410. [III.9] E. Landau (1930): Grundlagen der Analysis, Akad. Verlagsges. Leipzig (1930), 134 S. amerik. Bearb. mit u¨ bers. Vorworten 1945, 1947, Chelsea Pub. Comp. [III.1] P.-S. de Laplace (1812): Th´eorie analytique des probabilit´es, Paris, 1812, zweite Auflage 1814, dritte Auflage 1820. [II.6] A.-M. Legendre (1794): El´ements de g´eom´etrie, erste Auflage 1794, vierte Auflage 1806, zahlreiche sp¨atere Auflagen. [I.6] D.H. Lehmer (1940): On the maxima and minima of Bernoulli polynomials, Amer. Math. Monthly 47 (1940), S. 533–538. [II.10] G.W. Leibniz3 (1682): De vera proportione circuli ad quadratum circumscriptum in numeris rationalibus expressa, Acta Eruditorum 1, 1682, S. 41–46. [I.4], [III.2] 3
Leibniz usually signed, in Latin, G. G. L. (Gothofredo Gulielmo Leibnitio).
392 Literaturverzeichnis G.W. Leibniz (1684): Nova methodus pro maximis et minimis, itemque tangentibus, quæ nec fractas, nec irrationales quantitates moratur, & singulare pro illis calculi genus, Acta Eruditorum 3, 1684, S. 467. [I.2], [II.1], [II.2] G.W. Leibniz (1686): De geometria recondita et analysi indivisibilium atque infinitorum, Acta Eruditorum 5, Juni 1686, S. 292–300. [II.4] G.W. Leibniz (1689): De linea isochrona in qua grave sine acceleratione descendit et de controversia cum DN. Abbate D. C., Acta Eruditorum 8, 1689, S. 195. [II.7] G.W. Leibniz (1691): Quadratura arithmetica communis sectionum conicarum quae centrum habet, indeque ducta trigonometria canonica ad quantamcunque in numeris exactis exactitudinem a tabularum necessitate liberata, cum usu speciali ad lineam rhomborum nauticam, aptatumque illi planisphaerium, Acta Eruditorum 10, April 1691, S. 178–182. [I.4] G.W. Leibniz (1691b): De linea in quam flexile se pondere proprio curvat, ejusque usu insigni adinveniendas quotcunque medias proportionales & logarithmos, Acta Eruditorum 10, 1691, S. 277–281 und 435–439. [II.7] G.W. Leibniz (1693): Supplementum geometriæ dimensoriæ, seu generalissima omnium tetragonismorum effectio per motum: similiterque multiplex constructio linea ex data tangentium conditione, Acta Eruditorum 12, 1693, S. 385–392. [II.7] G.W. Leibniz (1694a): Nova calculi differentialis applicatio et usus ad multiplicem linearum constructionem ex data tangentium conditione, Acta Eruditorum 13, Juli 1694. [II.3], [IV.0] G.W. Leibniz (1694b): Constructio propria problematis de curva isochrona paracentrica, ubi et generaliora quaedam de natura et calculo differentiali osculorum, et de constructione linearum transcendentium, una maxime geometrica, altera mechanica quidem, sed generalissima. Accessit modus reddendi inventiones transcendentium linearum universales, ut quemvis casum comprehendant, et transeant per punctum datum, Acta Eruditorum 13, August 1694. [II.6] G.W. Leibniz (1702): Specimen novum analyseos pro scientia infinita circa summas et quadraturas, Acta Eruditorum 21, Mai 1702. [II.5] G.W. Leibniz (1710): Symbolismus memorabilis calculi algebraici et infinitesimalis in comparatione potentiarum et differentiarum, et de lege homogeneorum transcendantali, Miscellanea Berolinensia ad incrementum scientiarum, 1710. [II.2] ¨ M. Lerch (1888): Uber die Nichtdifferentiirbarkeit gewisser Functionen, J. Reine und Angew. Math. (Crelle) 103 (1888), S. 126–138. [III.7] G. de L’Hospital (1696): Analyse des infiniment petits, pour l’intelligence des lignes courbes, A Paris, de l’Imprimerie Royale. M.DC.XCVI. [II.1], [III.6] J. Liouville (1835): M´emoire sur l’int´egration d’une classe de fonctions transcendantes, J. Reine und Angew. Math. (Crelle) 13 (1835), S. 93–118. [II.6] J. Liouville (1841): Remarques nouvelles sur l’´equation de Riccati, J. de Math. pures et appl. (Liouville) 6 (1841), S. 1–13. [II.9] G. Lochs (1963): Die ersten 968 Kettenbruchnenner von π, Monatsh. f. Math. 67 (1963) S. 311–316. [I.6] J. L¨uroth (1873): Bemerkung u¨ ber gleichm¨assige Stetigkeit, Math. Ann. 6 (1873) S. 319– 320. [III.4] C. Maclaurin (1742): A treatise of fluxions, in zwei B¨uchern, Edinburgh, MDCCXLII. [II.1], [II.2], [II.10], [III.8] G. Meinardus (1964): Approximation von Funktionen und ihre numerische Behandlung, ¨ Springer Tracts in Nat. Phil., 180 S., Springer, 1964, engl. Ubers., Springer, 1967. [III.9] Ch. M´eray (1872): Nouveau pr´ecis d’analyse infinit´esimale, Paris, 1872. [III.1] N. Mercator (= Kaufmann) (1668): Logarithmo-technia; sive methodus construendi logarithmos nova, accurata, et facilis; . . ., geschr. 1667, ver¨off. London, 1668. [I.3] F. Mertens (1875): Ueber die Multiplicationsregel f¨ur zwei unendliche Reihen, J. Reine und Angew. Math. (Crelle) 79 (1875), S. 182–184. [III.2] G. Miel (1983): Of calculations past and present: the Archimedean algorithm, Amer. Math. Monthly 90 (1983), S. 17–35. [I.4] A. de Moivre (1730): Miscellania analytica de seriebus et quadraturis, Londini, 1730. [I.4] J. Napier (1614): Mirifici logarithmorum canonis descriptio, Edinburgi, 1614. [I.3]
Literaturverzeichnis 393 ¨ J. Napier (1619): Mirifici logarithmorum canonis constructio, Edinburgi 1619, engl. Ubers.: The construction of the wonderful canon of logarithms, von William Rae MacDonald, 1888. [I.3] I. Newton (1665): Annotations from Wallis, Manuskript von 1665, ver¨off. in The mathematical papers of Isaac Newton 1, Cambridge University Press, 1967. [I.2], [II.2] I. Newton (1669): De analysi per æquationes numero terminorum infinitas, Manuskript von 1669, ver¨off. in Newton (1711) von W. Jones, S. 1–21; Works 2, S. 165–173. [I.3], [I.4] I. Newton (1671): Methodus Fluxionum et Serierum Infinitarum, Manuskript von 1671, ver¨off. translated from the author’s Latin original not yet made publick, London ” ¨ 1736“; Opuscula mathematica, Band I; franz. Ubers. par M.de Buffon, Paris MDCCXL“; Nachdruck hrsg. Albert Blanchard, Paris,”1966. [I.2], [I.3], [I.4], [II.1], [II.2], [II.3], [II.6] I. Newton (1676): Methodus differentialis, Manuskript wurde in einem Brief vom Okt. 1676 an Oldenburg erw¨ahnt, ver¨off. in Newton (1711) von W. Jones, S. 93–101. [I.1] I. Newton (1686): Philosophiæ naturalis principia mathematica, Autore IS. NEWTON, ¨ Londini, 1686, zweite Aufl. 1713, dritte Aufl. 1726, engl. Ubers. 1803, franz¨os. ¨ Ubers. par feue Madame la Marquise du Chastellet“ a` Paris, 1756. [II.1] I. Newton (1711): ”Analysis per quantitatum series, fluxiones, ac differentias, ver¨offentlicht von W. Jones, London 1711. [I.4] I. Newton (1736): siehe Newton (1671). V. Notari (1924): L’equazione di quarto grado, Periodico di Matematiche, Ser. 4, Band 4 (Bologna 1924), S. 327–334. [I.1] M. Parmentier (1989): G.W. Leibniz, la naissance du calcul diff´erentiel, 26 articles des Acta Eruditorum, Mathesis, Paris, Librairie Philosophique J. Vrin, 1989. [II.1] B. Pascal (1654): Trait´e du triangle arithm´etique, avec quelques autres petits traitez sur la mesme matiere, geschrieben 1654, posthum ver¨off., Paris, 1665. [I.2] L. di Pasquale (1957): Le equazioni di terzo grado nei “Questi et inventioni diverse” di Nicol`o Tartaglia, Periodico di Matematiche, Ser. 4, Band 35 (Bologna 1957), S. 79–93. [I.1] G. Peano (1884): “Annotazioni” al trattato di calcolo del 1884, (siehe Genocchi & Peano 1884), Opere scelte I, S. 47–73. [IV.2], [IV.4] G. Peano (1888): Calcolo geometrico, secondo l’Ausdehnungslehre di H. Grassmann, Torino 1888; dt. Ausg.: Die Grundzuege des geometrischen Calculs, Teubner Leipzig, 1891; siehe auch: Math. Annalen 32 (1888), S. 451. [IV.0] G. Peano (1888a): Int´egration par s´eries des e´ quations diff´erentielles lin´eaires, Math. Annalen 32 (1888), S. 450–456. [IV.1], [IV.2] G. Peano (1890): Sur une courbe, qui remplit toute une aire plane, Math. Annalen 36 (1890), S. 157–160. [IV.2] G. Peano (1890b): D´emonstration de l’int´egrabilit´e des e´ quations diff´erentielles ordinaires, Math. Annalen 37 (1890), S. 182–228. [IV.1] G. Peano (1957–1959): Opere scelte, 3 B¨ande, Edizioni Cremonese, Roma 1957–1959. [IV.4] O. Perron (1913): Die Lehre von den Kettenbr¨uchen, Teubner Leipzig und Berlin, 520 S., zahlreiche sp¨atere Auflagen. [I.6] E. Picard (1890): Trait´e d’Analyse, Band I, Gauthier-Villars, Paris 1890, 2`eme e´ dition 1901. [III.9] A. Pringsheim (1893): Zur Theorie der Taylor’schen Reihe und der analytischen Functionen mit beschr¨anktem Existenzbereich, Math. Annalen 42 (1893), S. 153–184. [III.7] A. Pringsheim (1899): Grundlagen der allgemeinen Funktionenlehre, in: Encyklop¨adie der math. Wiss. II.1.1, (1899), S. 1–53. [III.3], [III.4] Cl. Ptolem¨aus (∼ 150): µεγ αλη ´ σ υντ ´ αξις (= Great Collection = Almagest = Al µεγ ι´στ η), ¨ latein. Ubers. G. Peurbach & Regiomontanus (Epitoma almagesti per Magistrum Georgium de Peurbach et eius Discipulum Magistrum Jo. de K¨unigsperg . . .), vervollst¨andigt 1462, gedruckt 1496. [I.4] J. Regiomontanus = Johannes M¨uller aus K¨onigsberg (1464): De triangulis omnimodis libri quinque, geschrieben 1464, gedruckt 1533. [I.4]
394 Literaturverzeichnis G. de Rham (1957): Sur un exemple de fonction continue sans d´eriv´ee, L’Enseignement Math´ematique 3, (1957), S. 71–72; Oeuvres, S. 714–715. [III.9] J. Riccati (1712): Soluzione generale del Problema inverso intorno a` raggi osculatori,.., determinar la curva, a cui convenga una tal’espressione, Giornale de’Letterati d’Italia, 11 (1712), S. 204–220. [II.7] N. Richert (1992): Strang’s strange figures, Amer. Math. Monthly 99, Nr. 2, S. 101–107. [I.4] B. Riemann (1854): Ueber die Darstellbarkeit einer Function durch eine trigonometrische Reihe, Habilitation, G¨ottingen, 1854, Werke, S. 227–271. [III.2], [III.5] Robert von Chester (1145): Liber algebre et almuchabolae de questionibus arithmeti¨ cis et geometricis, erste lateinische Ubersetzung von Al-Khowˆarizmˆı’s Al-jabr, krit. Neubearb.: B.B. Hughes, Steiner Verlag Wiesbaden, Stuttgart, 1989. [I.1] M. Rolle (1690): Trait´e d’Algebre, ov principes generaux pour resoudre les questions de Mathematique, Livre second, Kap. VI, S. 124f. (1690). [III.6] ¨ F. Rosen (1831): The Algebra of Mohammed ben Musa, Ubers. und hrsg. von Frederic Rosen, London 1831, Nachdruck Georg Olms Verlag, 1986. [I.1] H.A. Schwarz (1873): Ueber ein vollst¨andiges System von einander unabh¨angiger Voraus ∂f (x,y) ∂f (x,y) ∂ ∂ setzungen zum Beweise des Satzes ∂y = ∂x , Verhandlun∂x ∂y gen der Schweizerischen Naturf. Ges. (1873), S. 259–270; Werke 2, S. 275–284. [IV.4] H.A. Schwarz (1885): Ueber ein die Fl¨achen kleinsten Fl¨acheninhaltes betreffendes Problem der Variationsrechnung, Acta soc. scient. Fenn. 15 (1885), S. 315–362; Werke 1, S. 223–269. [III.5] L. Seidel (Philipp Ludwig von) (1848): Note u¨ ber eine Eigenschaft der Reihen, welche discontinuirliche Functionen darstellen, Denkschriften der M¨unchener Akademie, Jahrgang 1848. [III.4] J.A. Serret (1868): Cours de calcul diff´erentiel et int´egral, Paris, 1868 (siehe insbesondere ¨ S. 17–19), dt. Ubers. Teubner, 1884. [III.6], [IV.4] D. Shanks & J.W. Wrench Jr. (1962): Calculation of π to 100000 decimals, Math.Comp. 16 (1962), S. 76–99. [I.4] W. Sierpi´nski (1915): Sur une courbe dont tout point est un point de ramification, ver¨off. auf polnisch in Prace Mat.-Fiz. 27 (1916), S. 77–86; franz. Zusammenf.: C.R. 160 ¨ (1915), S. 302–305; franz. Ubers. Oeuvres choisies, Band II, S. 99–106. [IV.1] W. Sierpi´nski (1916): Sur une courbe cantorienne qui contient une image biunivoque et continue de toute courbe donn´ee, ver¨off. auf russisch in Matematiqeskii sbornik 30 (1916), S. 267–287; franz. Zusammenfassung: C.R. 162 (1916), ¨ S. 629–632; franz. Ubers. Oeuvres choisies, Band II, S. 107–119. [IV.1] T. Simpson (1743): Math. dissertations on a variety of physical and analytical subjects . . ., London, 1743. [II.6] O. Spiess (1929): Leonhard Euler, Ein Beitrag zur Geistesgeschichte des XVIII. Jahrhunderts, Verlag von Huber, Frauenfeld, Leipzig, 1929. [II.8], [II.10] V. Steklov (1918): Remarques sur les quadratures, Bull. de l’Acad. des Sciences de Russie (6), Band 12, (1918), S. 99–118. [II.6] M. Stifel (1544): Arithmetica integra, N¨urnberg, 1544. [I.2], [I.3] J. Stirling (1730): Methodus differentialis: sive tractatus de summatione et interpolatione serierum infinitarum, Londini, MDCCXXX. [II.10] O. Stolz (1881): B. Bolzano’s Bedeutung in der Geschichte der Infinitesimalrechnung, Math. Ann. 18 (1881), S. 255–279. [III.1] O. Stolz (1886): Die gleichm¨assige Convergenz von Functionen mehrerer Ver¨anderlichen zu den dadurch sich ergebenden Grenzwerthen, dass einige derselben constanten Werthen sich n¨ahern, Math. Ann. 26 (1886), S. 83–96. [IV.5] O. Stolz (1887): Bemerkungen zur Theorie der Functionen von mehreren unabh¨angigen Ver¨anderlichen, Innsbrucker Berichte; siehe auch O. Stolz, Grundz¨uge der Differential- und Integralrechnung, Teubner Leipzig, 1893. [IV.3] G. Strang (1976): Linear algebra and its applications, Academic Press, New York, 1976, 374 S. [IV.5] G. Strang (1991): Calculus, Wellesley-Cambridge Press, Wellesley, Mass., 1991. [I.4]
Literaturverzeichnis 395 D.J. Struik (1969): A source book in mathematics 1200-1800, Harvard University Press, Cambridge, Mass., 1969. [II.1], [II.2], [III.2] T. Takagi (1903): A simple example of the continuous function without derivative, Tokio math. soc. 1 (1903), S. 176–177. [III.9] D. Tall (1982): The blancmange function, continuous everywhere but differentiable nowhere, Math. Gazette 66, Nr. 435 (1982), S. 11–22. [III.9] B. Taylor (1715): Methodus incrementorum directa & inversa, Auctore Brook Taylor, LL.D. & Regiæ Societatis Secretario, Londini, MDCCXV. [II.2] P.F. Verhulst (1845): Recherches math´ematiques sur la loi d’accroissement de la population, Nuov. Mem. Acad. Roy. Bruxelles, 18 (1845), S. 3–38. [II.7] F. Vi`ete (1591): In artem analyticam isagoge, Tours 1591, Opera, hrsg. Franciscus van Schooten, 1646, S. 1–12. [I.1] F. Vi`ete (1591a): De aequationem recognitione et emendatione, posthum ver¨off. 1615, Opera, hrsg. Franciscus van Schooten, 1646, S. 84–158. [I.1], [I.5] F. Vi`ete (1593): Ad angulares sectiones theoremata KAΘOΛIKΩT EP A, posth. ver¨off. 1615, Opera, hrsg. Franciscus van Schooten, 1646, S. 287–304. [I.1], [I.2] ¨ F. Vi`ete (1600): Algebra nova, franz. kommentierte Ubers.: Introduction en l’art analytique ov novvelle Algebra, oeuvre dans lequel sont veus les plus miraculeux effects des sciences Mathematiques, pour l’inuention & solution, tant des Problemes, que Theoremes, 1630. [I.1] B.L. van der Waerden (1954): Science awakening I, Egyptian, Babylonian, and Greek Mathematics, Kluwer Acad. Publ. Dordrecht, The Netherlands; engl. Ausgaben 1961, 1969, 1975, 1988. [I.2] ¨ B.L. van der Waerden (1957): Uber die Einf¨uhrung des Logarithmus im Schulunterricht, Elemente der Math. 12 (1957), S. 1–8. [I.3] J. Wallis (1655): Arithmetica infinitorum, sive nova methodus inquirendi in curvilineorum quadraturam, aliaque difficiliora matheseos problemata, Anno 1655 typis edita; Opera mathematica I (1695), S. 355–478; Nachdruck Georg Olms Verlag, 1972. [I.5], [I.6] G. Wanner (1988): Les e´ quations diff´erentielles ont 350 ans, L’Enseignement Math´ematique 34 (1988), S. 365–385. [II.7] K. Weierstraß (1841): Zur Theorie der Potenzreihen, Manuskript 1841, ver¨off. 1894 in Werke 1, S. 67–74. [III.4] K. Weierstraß (1861): Differential Rechnung, Vorlesung an dem K¨oniglichen Gewerbeinstitute, Manuskript 1861, maschinengeschrieben von H.A. Schwarz, Math. Bibl. Humboldt Universit¨at Berlin. [III.3], [III.4], [III.6], [III.7] ¨ K. Weierstraß (1872): Uber continuirliche Functionen eines reellen Arguments, die f¨ur keinen Werth des letzteren einen bestimmten Differentialquotienten besitzen, K¨onigl. Akad. der Wiss. Berlin, Werke 2, S. 71–74. [III.3], [III.9] K. Weierstraß (1874): Theorie der analytischen Funktionen, Vorlesung an der Univ. Berlin 1874, Manuskript (ausgearbeitet von G. Valentin), Math. Bibl. Humboldt Universit¨at Berlin. [III.1], [III.3], [IV.3] ¨ K. Weierstraß (1885): Uber die analytische Darstellbarkeit sogenannter willk¨urlicher Functionen reeller Argumente, K¨onigl. Akad. der Wiss. Berlin, Werke 3, S. 1–37. [III.9] K. Weierstraß (1894–1927): Mathematische Werke, 7 B¨ande, Berlin und Leipzig, 1894– 1927. [III.1] R.S. Westfall (1980): Never at rest; a biography of Isaac Newton, Cambridge Univ. Press, 908 S. [I.4] W. Wirtinger (1902): Einige Anwendungen der Euler-Maclaurin’schen Summenformel, insbesondere auf eine Aufgabe von Abel, Acta Mathematica 26 (1902), S. 255–271. [II.10]
Symbolverzeichnis ◦
A A a0 + a1 + a2 + . . . (a, b) [a, b] a + ib arccos x arcsin x arctan x arcosh x arsinh x B(α, β) Bε (a) Bk Bk (x) cos x cosh x D det dx, dy d(x, y) dy/dx e ex exp x f (U ) f −1 (V ) f ′ (x) f ′′ (x) f (k) (x) grad f inf X L(y) limn→∞ sn limx→x0 f (x) lim inf n→∞ sn lim supn→∞ sn ln x loga x n! n j
Inneres von A 308 Abschluss von A 308 unendliche Reihe 204 offenes Intervall 219 abgeschlossenes Intervall 219 komplexe Zahl 61 Arkuscosinus 52 Arkussinus 52 Arkustangens 52 Areacosinus Hyperbolicus 60 Areasinus Hyperbolicus 60 Betafunktion 374 Scheibe (oder Kugelumgebung) mit Radius ε und Mittelpunkt a300 Bernoulli-Zahl 175 Bernoulli-Polynom 177 Cosinus 44 Cosinus Hyperbolicus 60 Unterteilung eines Intervalls 239f. Determinante 365, 367 unendlich kleine Gr¨oßen 89 Abstand zwischen x und y 295 Ableitung von y 89 Eulersche Zahl 27 Exponentialfunktion 27f. Exponentialfunktion 27f. Bild(menge) von U 318 Urbild(menge) von V 318 Ableitung der Funktion f (x) 91 zweite Ableitung von f (x) 99 k-te Ableitung von f (x) 103 Gradient von f 329 gr¨oßte untere Schranke (Infimum) 199 Differentialoperator 157 Grenzwert einer Folge 188 Grenzwert einer Funktion 227 kleinster H¨aufungspunkt (Limes inferior) 201 gr¨oßter H¨aufungspunkt (Limes superior) 201 nat¨urlicher Logarithmus (Logarithmus naturalis) 37 Logarithmus zur Basis a 32 Fakult¨at von n 21 Binomialkoeffizient 21
Symbolverzeichnis 397
Q R Rn |s| s(D) S(D) sin x sinh x {sn } sup X tan x x∈A (x1 , . . . , xn ) y′ y ′′ ∆y0 , ∆2 y0 , . . . ϕn (x) Φ(x) γ Γ (α) κ µ(I) π ̺ ∂A ∂f /∂x1 ∇f kAk2 kzk1 kzk2 kzkp kzk P∞∞ P a , i≥0 ai R i=0 i f (x) dx Rb f (x) dx Ra f (x, y) d(x, y) I A⊂B A∩B A∪B A\B ∁A ∀ ∃