135 102 2MB
German Pages 319 Year 2007
Fritz Ehlotzky Angewandte Mathematik f¨ur Physiker
Fritz Ehlotzky
Angewandte Mathematik für Physiker ¨ Mit Abbildungen, Ubungsaufgaben und durchgerechneten Anwendungsbeispielen
123
Professor Dr. Fritz Ehlotzky Universit¨at Innsbruck Institut Theoretische Physik Technikerstraße Innsbruck Austria Email: [email protected]
Bibliografische Information der Deutschen Bibliothek Die Deutsche Bibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet u¨ ber http://dnb.d-nb.de abrufbar.
ISBN ---- Springer Berlin Heidelberg New York ¨ Dieses Werk ist urheberrechtlich gesch¨utzt. Die dadurch begr¨undeten Rechte, insbesondere die der Ubersetzung, des Nachdrucks, des Vortrags, der Entnahme von Abbildungen und Tabellen, der Funksendung, der Mikroverfilmung oder der Vervielf¨altigung auf anderen Wegen und der Speicherung in Datenverarbeitungsanlagen, bleiben, auch bei nur auszugsweiser Verwertung, vorbehalten. Eine Vervielf¨altigung dieses Werkes oder von Teilen dieses Werkes ist auch im Einzelfall nur in den Grenzen der gesetzlichen Bestimmungen des Urheberrechtsgesetzes der Bundesrepublik Deutschland vom . September in der jeweils geltenden Fassung zul¨assig. Sie ist grunds¨atzlich verg¨utungspflichtig. Zuwiderhandlungen unterliegen den Strafbestimmungen des Urheberrechtsgesetzes. Springer ist ein Unternehmen von Springer Science+Business Media springer.de © Springer-Verlag Berlin Heidelberg Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, daß solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten w¨aren und daher von jedermann benutzt werden d¨urften. Text und Abbildungen wurden mit gr¨oßter Sorgfalt erarbeitet. Verlag und Autor k¨onnen jedoch f¨ur eventuell verbliebene fehlerhafte Angaben und deren Folgen weder eine juristische Verantwortung noch irgendeine Haftung u¨ bernehmen. Satz und Herstellung: LE-TEX Jelonek, Schmidt & V¨ockler GbR, Leipzig Einbandgestaltung: WMXDesign GmbH, Heidelberg SPIN:
//YL -
Gedruckt auf s¨aurefreiem Papier
Vorwort
An vielen Universit¨ aten und Hochschulen wird als Vorkurs zu den Vorlesungen aus Theoretischer Physik und anderen theoretisch orientierten F¨achern eine Einf¨ uhrung in die mathematischen Methoden der Physik und verwandter Gebiete angeboten. Das vorliegende Buch ist aus einer solchen Lehrveranstaltung hervorgegangen, die sich u ¨ ber zwei Semester erstreckt hat. Im Titel dieses Buches wurde absichtlich Bezug auf die ,,Angewandte Mathematik“ genommen, da weniger auf die mathematische Pr¨azision als vielmehr auf die praktische Anwendbarkeit der verschiedenen Methoden auf die L¨osung physikalischer und technischer Probleme Wert gelegt wurde. F¨ ur das Verst¨andnis des dargebotenen Stoffes wird angenommen, dass der Leser ausreichende Kenntnisse der Differenzial- und Integralrechnung mehrerer Ver¨anderlicher und der linearen Algebra besitzt, doch sind in einem Anhang kurze Zusammenfassungen zu diesen F¨ achern angegeben, um dem Leser die Lekt¨ ure des Buches zu erleichtern. Es wurde versucht, neben rein rechnerischen auch sol¨ che Beispiele und Ubungsaufgaben einzuf¨ ugen, die sich auf die mathematische Formulierung und L¨ osung physikalischer und technischer Probleme beziehen, um dem Leser zu zeigen, wie die behandelten Methoden f¨ ur die Bew¨ altigung physikalischer und technischer Aufgaben von praktischem Nutzen sind. Am Ende des Buches wurden f¨ ur etwas ambitioniertere Leser einige weiterf¨ uhrende B¨ ucher u ¨ ber mathematische Methoden angegeben. Fritz Ehlotzky
Inhaltsverzeichnis
1
Vektoranalysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Vektoralgebra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.1 Vektoraddition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.2 Das Skalarprodukt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.3 Das Vektorprodukt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Vektordifferenzialoperationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3.1 Differenziation nach einem Parameter . . . . . . . . . . . . . . 1.3.2 Der Gradientoperator . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3.3 Die Divergenz eines Vektorfeldes . . . . . . . . . . . . . . . . . . 1.3.4 Die Rotation eines Vektorfeldes . . . . . . . . . . . . . . . . . . . 1.3.5 Mehrfache Differenzialoperationen . . . . . . . . . . . . . . . . . 1.4 Vektorintegraloperationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4.1 Der Gauß’sche Satz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4.2 Der Green’sche Satz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4.3 Der Stokes’sche Satz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.5 Orthogonale krummlinige Koordinaten . . . . . . . . . . . . . . . . . . . . 1.5.1 Zylinderkoordinaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.5.2 Kugelkoordinaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.6 Tensoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.6.1 Andere Definition eines Vektors . . . . . . . . . . . . . . . . . . . 1.6.2 Definition eines Tensors . . . . . . . . . . . . . . . . . . . . . . . . . . 1.6.3 Diagonalisierung eines Tensors . . . . . . . . . . . . . . . . . . . . 1.6.4 Differenzial- und Integraloperationen . . . . . . . . . . . . . . .
1 1 2 2 3 4 9 10 14 16 18 20 21 21 23 24 30 32 34 35 35 40 41 44
2
Komplexe Zahlen und Dirac’s δ-Funktion . . . . . . . . . . . . . . . . . 2.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Komplexe Zahlen und elementare Funktionen . . . . . . . . . . . . . . 2.2.1 Komplexe Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.2 Elementare Rechenregeln . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.3 Die Gauß’sche Zahlenebene . . . . . . . . . . . . . . . . . . . . . . .
49 49 49 50 50 51
VIII
Inhaltsverzeichnis
2.2.4 Potenzen und Wurzeln komplexer Zahlen . . . . . . . . . . . 2.2.5 Exponentialfunktion und trigonometrische Funktionen 2.2.6 Die hyperbolischen Funktionen . . . . . . . . . . . . . . . . . . . . 2.2.7 Der Logarithmus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.8 Abschließende Bemerkungen . . . . . . . . . . . . . . . . . . . . . . 2.3 Die Dirac’sche δ-Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.1 Definition der δ-Funktion . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.2 Rechenregeln der δ-Funktion . . . . . . . . . . . . . . . . . . . . . .
54 56 57 58 59 62 62 64
3
Der 3.1 3.2 3.3 3.4
Funktionenraum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Fourier-Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Das Fourier-Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Orthogonale Funktionensysteme . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4.1 Das Skalarprodukt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4.2 Reihen nach orthogonalen Funktionen . . . . . . . . . . . . . . 3.4.3 Operatoren im Hilbert-Raum . . . . . . . . . . . . . . . . . . . . . 3.5 Das Sturm-Liouville’sche Eigenwertproblem . . . . . . . . . . . . . . . .
71 71 71 76 79 79 81 83 89
4
Partielle Differenzialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Lineare partielle Differenzialgleichungen der Physik . . . . . . . . . 4.3 Die Separationsmethode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.1 Beispiel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.2 Separation der Helmholtz-Gleichung . . . . . . . . . . . . . . . 4.4 Die Methode der Green-Funktion . . . . . . . . . . . . . . . . . . . . . . . . . 4.4.1 Allgemeine Betrachtungen . . . . . . . . . . . . . . . . . . . . . . . . 4.4.2 Eigenschaften der Green-Funktion . . . . . . . . . . . . . . . . . 4.4.3 Auffindung der Green-Funktion . . . . . . . . . . . . . . . . . . . 4.4.4 Die Green-Funktion der Helmholtz-Gleichung . . . . . . .
99 99 99 102 102 104 108 108 111 113 115
5
Spezielle Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2 Die Gammafunktion und Verwandtes . . . . . . . . . . . . . . . . . . . . . 5.3 Gew¨ ohnliche lineare Differenzialgleichungen . . . . . . . . . . . . . . . . 5.3.1 L¨ osung von Differenzialgleichungen durch Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3.2 Differenzialgleichungen mit periodischen Koeffizienten 5.4 Kugelfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.4.1 Die Legendre-Polynome . . . . . . . . . . . . . . . . . . . . . . . . . . 5.4.2 Zweite Definition der Legendre-Polynome . . . . . . . . . . . 5.4.3 Orthogonalit¨ at der Legendre-Polynome . . . . . . . . . . . . . 5.4.4 Die zugeordnenten Legendre-Polynome . . . . . . . . . . . . . 5.4.5 Die Kugelfl¨ achenfunktionen . . . . . . . . . . . . . . . . . . . . . . . 5.4.6 Das Additionstheorem der Kugelfl¨achenfunktionen . . .
129 129 129 137 137 145 148 149 151 156 157 159 161
Inhaltsverzeichnis
6
7
IX
5.5 Bessel-Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.5.1 Reihenl¨ osung der Bessel’schen Differenzialgleichung . . 5.5.2 Bessel-Funktionen mit ganzzahligem Index . . . . . . . . . . 5.5.3 Rekursionsformeln und Verwandtes . . . . . . . . . . . . . . . . 5.5.4 Sph¨ arische Bessel-Funktionen . . . . . . . . . . . . . . . . . . . . . 5.5.5 Modifizierte Bessel-Funktionen . . . . . . . . . . . . . . . . . . . . 5.5.6 Das Sturm-Liouville-Problem der Bessel-Funktionen . 5.6 Die Hermite- und Laguerre-Funktionen . . . . . . . . . . . . . . . . . . . . 5.6.1 Die Hermite-Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . 5.6.2 Die Laguerre-Funktionen . . . . . . . . . . . . . . . . . . . . . . . . .
167 168 170 173 175 179 181 189 190 195
Variationsrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2 Die Euler-Gleichung der Variationsrechnung . . . . . . . . . . . . . . . 6.3 Variationsproblem mit mehreren abh¨angigen Ver¨anderlichen . 6.4 Variationsproblem mit mehreren unabh¨angigen Ver¨ anderlichen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.5 Die isoperimetrischen Probleme . . . . . . . . . . . . . . . . . . . . . . . . . . 6.5.1 Isoperimetrische Probleme mit mehreren abh¨angigen Ver¨ anderlichen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.5.2 Isoperimetrische Probleme mit mehreren unabh¨ angigen Ver¨ anderlichen . . . . . . . . . . . . . . . . . . . . .
205 205 205 211
Theorie komplexer Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2 Die analytischen Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2.1 Die Cauchy-Riemann’schen Differenzialgleichungen . . 7.2.2 Die konforme Abbildung . . . . . . . . . . . . . . . . . . . . . . . . . 7.2.3 Elementare Rechenoperationen analytischer Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2.4 Singularit¨ aten analytischer Funktionen . . . . . . . . . . . . . 7.2.5 Der unendlich ferne Punkt . . . . . . . . . . . . . . . . . . . . . . . . 7.3 Integration im komplexen Gebiet . . . . . . . . . . . . . . . . . . . . . . . . . 7.3.1 Linienintegrale in der komplexen Zahlenebene . . . . . . . 7.3.2 Der Fundamentalsatz von Cauchy . . . . . . . . . . . . . . . . . 7.3.3 Der Fundamentalsatz f¨ ur mehrfach zusammenh¨ angende Bereiche . . . . . . . . . . . . . . . . . . . . . . 7.3.4 Die Integralformel von Cauchy . . . . . . . . . . . . . . . . . . . . 7.3.5 Analytische Fortsetzung . . . . . . . . . . . . . . . . . . . . . . . . . . 7.3.6 Der Cauchy’sche Residuensatz . . . . . . . . . . . . . . . . . . . . 7.3.7 Anwendungen des Residuensatzes . . . . . . . . . . . . . . . . . . 7.3.8 Berechnung bestimmter Integrale . . . . . . . . . . . . . . . . . . 7.4 Die Laplace-Transformation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.4.1 Vorbemerkungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
223 223 223 224 226
213 216 217 220
227 228 231 231 231 233 241 243 247 248 249 252 262 262
X
Inhaltsverzeichnis
7.4.2 7.4.3
Definition der Laplace-Transformation . . . . . . . . . . . . . 262 Drei wichtige Theoreme . . . . . . . . . . . . . . . . . . . . . . . . . . 263
8
Wahrscheinlichkeit und Statistik . . . . . . . . . . . . . . . . . . . . . . . . . . 8.1 Einleitende Bemerkungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.2 Kombinatorik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.2.1 Permutationen und Kombinationen . . . . . . . . . . . . . . . . 8.2.2 Die Binomialkoeffizienten . . . . . . . . . . . . . . . . . . . . . . . . . 8.3 Wahrscheinlichkeitstheorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.3.1 Definition der Wahrscheinlichkeit . . . . . . . . . . . . . . . . . . 8.3.2 Mittelwert und quadratische Abweichung . . . . . . . . . . . 8.4 Spezielle Verteilungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.4.1 Die Bernoulli-Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . 8.4.2 Die Gauß-Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.4.3 Die Poisson-Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . .
269 269 269 269 272 274 274 275 277 277 278 281
A
Differenzial- und Integralrechnung . . . . . . . . . . . . . . . . . . . . . . . . A.1 Differenzialrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.1.1 Die Ableitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.1.2 Die partielle Ableitung . . . . . . . . . . . . . . . . . . . . . . . . . . . A.1.3 Elementare Ableitungsregeln . . . . . . . . . . . . . . . . . . . . . . A.1.4 Ableitung trigonometrischer und inverser Funktionen A.1.5 Ableitung hyperbolischer und inverser Funktionen . . . A.1.6 Differenziale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.1.7 Maxima und Minima einer Funktion . . . . . . . . . . . . . . . A.1.8 Mittelwerts¨ atze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.1.9 Unbestimmte Formen . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.1.10 Der Taylor’sche Satz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.1.11 Reihen elementarer Funktionen . . . . . . . . . . . . . . . . . . . . A.1.12 Differenziation von Integralen . . . . . . . . . . . . . . . . . . . . . A.2 Integralrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.2.1 Das unbestimmte Integral . . . . . . . . . . . . . . . . . . . . . . . . A.2.2 Integration von Polynomen . . . . . . . . . . . . . . . . . . . . . . . A.2.3 Integration rationaler Funktionen . . . . . . . . . . . . . . . . . . A.2.4 Integration trigonometrischer Funktionen . . . . . . . . . . . A.2.5 Exponentialfunktion und hyperbolische Funktionen . . A.2.6 Integration von Wurzelausdr¨ ucken . . . . . . . . . . . . . . . . . A.2.7 Integration von Produkten . . . . . . . . . . . . . . . . . . . . . . . . A.2.8 Das bestimmte Integral . . . . . . . . . . . . . . . . . . . . . . . . . . A.2.9 Ungleichungen zwischen Integralen . . . . . . . . . . . . . . . . . A.2.10 Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . A.2.11 Bestimmte Integrale von Funktionen . . . . . . . . . . . . . . . A.2.12 Variablentransformation bei Mehrfachintegralen . . . . . A.3 Elementare Differenzialgleichungen . . . . . . . . . . . . . . . . . . . . . . . A.3.1 Methode der Variablentrennung . . . . . . . . . . . . . . . . . . .
283 283 283 283 284 285 285 285 286 286 287 287 288 289 289 289 290 290 291 291 292 292 293 294 294 295 295 296 296
Inhaltsverzeichnis
A.3.2 A.3.3 A.3.4 A.3.5 A.3.6
XI
Methode der Variablensubstitution . . . . . . . . . . . . . . . . Lagrange-Methode der Variation der Konstanten . . . . Methode von Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . Erniedrigung des Grades einer Differenzialgleichung . . Vollst¨ andiges Differenzial . . . . . . . . . . . . . . . . . . . . . . . . .
296 297 297 297 298
B
Lineare Algebra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B.1 Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B.1.1 Matrixdefinition und Multiplikation . . . . . . . . . . . . . . . . B.1.2 Matrixtypen und Rechenregeln . . . . . . . . . . . . . . . . . . . . B.1.3 Matrizen mit komplexen Elementen . . . . . . . . . . . . . . . . B.2 Determinanten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B.2.1 Definition einer Determinante . . . . . . . . . . . . . . . . . . . . . B.2.2 Rechenregeln f¨ ur Determinanten . . . . . . . . . . . . . . . . . . . B.3 L¨ osung eines linearen Gleichungssystems . . . . . . . . . . . . . . . . . . B.3.1 Inhomogenes Gleichungssystem . . . . . . . . . . . . . . . . . . . . B.3.2 Homogenes Gleichungssystem . . . . . . . . . . . . . . . . . . . . .
299 299 299 300 302 304 304 304 305 305 306
C
Einige erg¨ anzende B¨ ucher . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 309
Index . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 311
1 Vektoranalysis
1.1 Einleitung Die Methoden der Vektoranalysis finden vielf¨ altigste Anwendungen zur theoretischen Beschreibung physikalischer Vorg¨ ange und sollen daher in diesem ersten Kapitel eingehend behandelt werden. Ein großer Teil physikalischer Prozesse l¨asst sich durch folgende drei Arten von Gr¨oßen beschreiben: 1) durch Skalare, 2) durch Vektoren und 3) durch Tensoren. Skalare Gr¨oßen lassen sich durch eine einzige Zahl charakterisieren, w¨ahrend die Vektoren durch Betrag und Richtung im Raum bestimmt sind, wozu drei Zahlen angegeben werden m¨ ussen. Schließlich stellen die Tensoren einen linearen Zusammenhang zwischen den Vektoren her und zu ihrer Bestimmung sind neun Zahlenangaben erforderlich. Wenn die betrachteten Gr¨oßen im dreidimensionalen Raum von Ort zu Ort verschiedene Werte annehmen, entstehen, wie man sagt, skalare, vektorielle und tensiorelle Felder. Bei vielen physikalischen Problemstellungen k¨ onnen diese Felder dann auch noch Funktionen der Zeit sein. Paradebeispiele f¨ ur skalare und vektorielle Gr¨oßen sind dem Leser sicherlich aus den Grundvorlesungen gel¨ aufig. Zum Beispiel sind Temperatur, Druck, Masse, Energie etc. Skalare, hingegen Kraft, Impuls, Geschwindigkeit, elektrische und magnetische Feldst¨ arke vektorielle Gr¨oßen. Tensoren treten etwa bei der Beschreibung der Spannungen in einem elastischen Medium auf. In den folgenden Abschnitten werden zun¨achst die Methoden der Vektoralgebra dargelegt, die wahrscheinlich dem Leser bereits bekannt sein d¨ urften und danach schließt sich die Besprechung der verschiedenen S¨atze der Vektoranalysis an. Zum Abschluss wird auf die Tensorrechnung nur kurz eingegangen werden, da sie in den Grundvorlesungen der theoretischen Physik nur in geringem Maße ben¨ otigt wird. Im Laufe der Pr¨asentation der verschiedenen Rechenregeln der Vektor- und Tensorrechnung werden eine Reihe von Beispielen aus der Physik vorgef¨ uhrt werden, die zur Erl¨auterung und Vertiefung des Stoffes beitragen sollen.
2
1 Vektoranalysis
1.2 Vektoralgebra 1.2.1 Vektoraddition Bereits Isaac Newton hat als Korollar zu seinen Axiomen der Mechanik das Gesetz der Vektoraddition durch Bildung des Vektorparallelogramms formuliert. Bezeichnen wir im folgenden Vektoren durch fettgedruckte Großbuchstaben, dann gilt, wenn A und B zwei Vektoren sind, f¨ ur den resultierenden Vektor C (vgl. Abb. 1.1) A+B =C . (1.1) Diese Beziehung ist kommutativ, d. h. B + A = C, wie aus Abb. 1.1 ersichtlich, und die Vektoraddition ist auch assoziativ. Wenn also D ein weiterer, resultierender Vektor ist, gilt A + (B + C) = (A + B) + C = D. Solange Vektoren im Raum parallel verschoben werden, sind sie einander ¨aquivalent. Diese Eigenschaft liegt der obigen Vektoraddition zugrunde. In vielen F¨allen ist es zweckm¨ aßig, im Raum ein Kartes’sches Achsenkreuz zugrunde zu legen und einen Vektor A durch seine Komponenten in Bezug auf dieses Koordinatensystem darzustellen. Wenn wir l¨ angs der x-, y- und z-Achse jeweils die Einheitsvektoren i, j und k einf¨ uhren, so k¨ onnen wir ansetzen A = Ax i + Ay j + Az k ,
(1.2)
wo die Komponenten Ax , Ay und Az durch senkrechte Projektion des Vektors A auf die drei Koordinatenachsen erhalten werden (vgl. Abb. 1.2). Betrachtet man die Dreiecke in Abb. 1.2, die sich durch Projektion des Vektors A auf die drei Koordinatenachsen ergeben, so findet man mithilfe des Pythagoras’schen Lehrsatzes, dass der Betrag des Vektors A durch den folgenden Ausdruck gegeben ist 1 (1.3) |A| = A = A2x + A2y + A2z 2 .
Abbildung 1.1. Vektoraddition
1.2 Vektoralgebra
3
Abbildung 1.2. Komponentenzerlegung eines Vektors
Die Multiplikation eines Vektors mit −1 f¨ uhrt zu einer Umkehr der Richtung des Vektors und die Multiplikation mit einem positiven Skalar a zu einer Verl¨ angerung oder Verk¨ urzung des Vektors ohne seine Richtung zu ¨andern. 1.2.2 Das Skalarprodukt Das skalare Produkt eines Vektors A mit einem Vektor B f¨ uhrt, wie der Name sagt, auf ein Skalar, das durch den folgenden Ausdruck definiert ist A · B = AB cos ϕ ,
(1.4)
wo ϕ der Winkel ist, der von den beiden Vektoren A und B eingeschlossen wird (vgl. Abb. 1.1). Beim skalaren Produkt wird also entweder der Vektor A senkrecht auf den Vektor B projiziert oder umgekehrt, der Vektor B auf den Vektor A. Damit stehen dann zwei Vektoren aufeinander senkrecht, wenn A · B = 0 ist. Das Skalarprodukt ist ersichtlich kommutativ. Ferner ist es auch distributiv, d. h. wenn C ein weiterer Vektor ist, so gilt C · (A + B) = A · C + B · C. Die drei Basisvektoren des Kartes’schen Koordinatensystems sind zueinander orthogonal und sie sind ferner, wie man sagt, zu Eins normiert. Es gilt n¨ amlich aufgrund der Definition des Skalarproduktes (1.4) i·i= j ·j = k·k = 1 ,
i·j = j ·k = k·i = 0.
(1.5)
Folglich k¨ onnen wir das Skalarprodukt zweier Vektoren A und B durch ihre Komponenten in folgender Form ausdr¨ ucken A · B = (Ax i + Ay j + Az k) · (Bx i + By j + Bz k) = Ax Bx + Ay By + Az Bz
(1.6)
und als Spezialfall ergibt sich daraus f¨ ur die L¨ ange eines Vektors A der Aus1 druck (1.3), was auch in der Form ausgedr¨ uckt werden kann A = (A · A) 2 .
4
1 Vektoranalysis
Vielfach erweist es sich als zweckm¨ aßiger, anstelle der Basisvektoren i, j und k die Koordinatenindizierung 1, 2, 3 einzuf¨ uhren, da dies dann eine Verallgemeinerung auf einen h¨ oher dimensionalen Vektorraum gestattet, auf den wir sp¨ ater (in Abschn. 4.4) noch ausf¨ uhrlicher zu sprechen kommen werden. Wir f¨ uhren also die Basisvektoren e1 , e2 , e3 ein, die aufgrund ihrer Definition den Orthogonalit¨ atsrelationen ei · ej = δi,j gen¨ ugen, wo δi,j das KroneckerSymbol ist, welches den Wert 1 hat, wenn i = j ist und den Wert 0, wenn i = j gilt, wobei die Indizes i, j = 1, 2, 3 durchlaufen. Damit kann dann die Zerlegung eines Vektors A in seine Komponenten eleganter so ausgedr¨ uckt werden 3 Ai ei = Ai ei , (1.7) A = A1 e1 + A2 e2 + A3 e3 = i=1
wobei wir zus¨ atzlich noch die Einstein’sche Summenkonvention eingef¨ uhrt haben, wonach u ¨ ber gleiche Indizes zu summieren ist, also in unserem Fall u ¨ber den Index i. Diese sehr clevere Konvention wollen wir im Folgenden beibehalten. 1.2.3 Das Vektorprodukt Dieses Produkt definiert, wie der Name sagt, einen Vektor. Gelegentlich wird dieses Produkt auch Kreuzprodukt genannt. Doch dieser Vektor hat im Gegensatz zu den bisher betrachteten, sogenannten polaren Vektoren, die Eigenschaft eines axialen Vektors, da er eine Rotationsachse ganz bestimmten Drehsinns definiert. Sind zum Beispiel A und B zwei polare Vektoren in der (x, y)-Ebene, dann ist der axiale Vektor C, der durch Bildung des Vektorproduktes entsteht, ein Vektor, der in Richtung der positiven z-Achse weist und dem ein Drehsinn entgegen dem Uhrzeigersinn in der (x, y)-Ebene zugeordnet ist. Die L¨ ange dieses Vektors C ist durch den Fl¨acheninhalt des von den beiden Vektoren A und B aufgespannten Parallelogramms bestimmt (vgl. Abb. 1.3). Man schreibt also C =A×B ,
C = AB sin ϕ .
(1.8)
Aufgrund der letzten Beziehung verschwindet das Vektorprodukt, wenn die beiden Vektoren parallel oder antiparallel orientiert sind, da sin(0, π) = 0 ist. Wenn der Drehsinn umgekehrt wird, erhalten wir B × A = −C und dieser Vektor weist dann in die negative z-Richtung. Das Vektorprodukt ist also nicht kommutativ. Es ist aber distributiv, denn wir erhalten A × (B + C) = A × B + A × C. Mithilfe dieser Definitionen des Vektorproduktes bekommen wir dann f¨ ur die Vektorprodukte der drei Basisvektoren i, j, k folgende Relationen, mit deren Hilfe sich schließlich die Komponenten von C berechnen lassen, wenn die Vektoren A und B nicht notwendig in der (x, y)-Ebene gelegen sind. Wir finden i×j = k,
j×k =i,
k×i=j
i×i = j×j =k×k =0,
(1.9)
1.2 Vektoralgebra
5
Abbildung 1.3. Vektorprodukt
wie der Leser leicht nachpr¨ ufen kann und damit folgt dann f¨ ur die Komponentendarstellung des Vektorproduktes Cx i + Cy j + Cz k = (Ax i + Ay j + Az k) × (Bx i + By j + Bz k) = (Ay Bz − Az By ) i + (Az Bx − Ax Bz ) j + (Ax By − Ay Bx ) k .
(1.10)
Dieses Resultat l¨ asst sich elegant durch eine Determinante ausdr¨ ucken, in deren erster Zeile die Basisvektoren e1 , e2 , e3 und in der zweiten und dritten Zeile die Komponenten der Vektoren A und B stehen, wobei die Determinante nach den Elementen der ersten Zeile zu entwickeln ist, also (siehe Anh. B.2 (B.35)) e1 e2 e3 C = A1 A2 A3 . (1.11) B1 B2 B3 ¨ Es bleibt als Ubung dem Leser u ufen, ob aus der Ent¨ berlassen, nachzupr¨ wicklung der Determinante (1.11) sich die Komponenten (1.10) des Vektors C ergeben. Um die Schreibweise noch eleganter und kompakter zu gestalten, f¨ uhren wir schließlich noch das ,,Permutationssymbol“ εijk ein, das durch folgende Regeln definiert ist ⎧ ⎫ ur i = j , −i = k , −j = k ⎬ ⎨ 0 f¨ ur i = j = k , zyklisch εijk = +1 f¨ . (1.12) ⎩ ⎭ −1 f¨ ur i = j = k , antizyklisch Bei der zyklischen Vertauschung der Zahlen 1, 2, 3 gibt es die beiden weiteren Kombinationen 2, 3, 1 und 3, 2, 1, dagegen sind die antizyklischen Kombinationen 3, 1, 2 , 1, 3, 2 und 3, 1, 2. Mihilfe dieser Eigenschaften des Permuta-
6
1 Vektoranalysis
tionssymbols erhalten wir f¨ ur die Basisvektoren e1 , e2 , e3 die Vektoridentit¨at ei × ej = εijk ek
(1.13)
und diese Relation ist ¨ aquivalent mit den Beziehungen (1.9). Mithilfe von onnen wir nun auch die Komponenten des ¨außeren Produktes (1.11) in εijk k¨ der Form ausdr¨ ucken Ai Bj εijk = Ck . (1.14) Wie zu Anfang dieses Abschnittes angedeutet wurde, kann das a¨ußere Produkt zur Definition eines gerichteten Fl¨ achenelementes herangezogen werden. Diese M¨ oglichkeit wird im Folgenden bei der Diskussion der Integrals¨ atze der Vektoranalysis, in Abschn. 1.4, von Interesse sein. Hier wol¨ len wir vorausschauend folgende Uberlegungen anstellen. Wir denken uns im Raum ein beliebig gekr¨ ummtes Fl¨ achenst¨ uck F , das wir mit einem Netz gekr¨ ummter Koordinatenlinien u ugend dicht ¨ berspannen. Wenn das Netz gen¨ ist, k¨ onnen wir uns vorstellen, dass die Oberfl¨ache in lauter kleine, nahezu ebene Fl¨ achenelemente zerlegt wurde, die wir uns im Sinne des Vektorproduktes durch infinitesimale Vektoren du und dv aufgespannt denken (wobei wir von du nach dv durch Rotation entgegen dem Uhrzeigersinn gelangen wollen), sodass ihr ¨ außeres Produkt ein gerichtetes Fl¨achenelement df = du × dv definiert. Wenn bei diesem Vorgang die Koordinatenlinien u und v u ummte Fl¨ ache stets in gleichbleibender Orien¨ ber die gesamte gekr¨ tierung durchlaufen werden, erh¨ alt die gesamte Fl¨ache einen Richtungssinn, d. h. eine Oberseite aus der alle df herausschauen und eine Unterseite. Damit erh¨ alt die Oberfl¨ ache aber auch l¨ angs ihrer Berandung einen Umlaufsinn, der, wenn wir auf die Oberseite blicken, entgegen dem Uhrzeigersinn orientiert ist. N¨ utzliche Vektorrelationen Wir wollen hier eine Reihe von Vektorbeziehungen anf¨ uhren, die bei den physikalischen Anwendungen der Vektorrechnung h¨ aufig auftreten. Wir beginnen mit dem sogenannten Spatprodukt. Sind A, B und C drei r¨ aumlich nicht parallele Vektoren, so liefert das Spatprodukt, definiert durch A · (B × C) = C · (A × B) = B · (C × A) ,
(1.15)
das Volumen eines Parallelepipeds, das von den drei Vektoren im Raum aufgespannt wird. Wenn wir zum Beispiel von der Grundfl¨ache B×C ausgehen und darauf durch Bildung des Skalarproduktes den Vektor A projizieren, so haben wir diese Grundfl¨ ache mit der H¨ ohe des Parallelepipeds multipliziert und damit sein Volumen berechnet. Die anderen beiden Ausdr¨ ucke sagen einfach, dass es egal ist, von welcher Grundfl¨ ache wir ausgehen, doch dass es auf die Reihenfolge der Vektoren im Vektorprodukt ankommt, deren Vertauschung das entgegengesetzte Vorzeichen liefert. Als Anwendung des Spatproduktes
1.2 Vektoralgebra
7
betrachten wir die drei Basisvektoren e1 , e2 , e3 und finden mit ihrer Hilfe eine n¨ utzliche Darstellung des Permutationssymbols εijk = ei · (ej × ek ) .
(1.16)
Als n¨ achstes betrachten wir das zweifache Vektorprodukt, wobei es allerdings auf die Reihenfolge der beiden Vektoroperationen ankommt. Es gilt A × (B × C) = B (A · C) − C (A · B) .
(1.17)
Das Zustandekommen dieser Beziehung ist anschaulich leicht einzusehen. Der Vektor B × C steht senkrecht auf der Ebene, die von diesen beiden Vektoren aufgespannt wird. Wird nun mit A ¨ außerlich multipliziert, entsteht ein Vektor, der senkrecht auf A und B × C steht, also in der Ebene von A, B zu liegen kommt und daher in seine beiden Komponenten in Bezug auf B und C zerlegt werden kann, wie (1.17) ausdr¨ uckt. Nat¨ urlich k¨onnen die Beziehungen (1.15) und (1.17) am elegantesten mit dem Permutationssymbol ¨ nachgewiesen werden, was wir als Ubungsaufgabe dem Leser u ¨ berlassen. Aus den Vektorbeziehungen (1.15) und (1.17) ergeben sich eine Reihe weiterer, komplizierterer Relationen, die wir nun anf¨ uhren. Es gilt (A × B) · (C × D) = A · [B × (C × D)] = A · [(B · D)C − (B · C)D] = (A · C)(B · D) − (A · D)(B · C) (A × B) × (C × D) = [(A × B) · D]C − [(A × B) · C]D A × [B × (C × D)] = (B · D)(A × C) − (B · C)(A × D)
(1.18)
Beispiele 1. Gleichung einer Ebene im Raum: Wir betrachten eine beliebig im Raum orientierte Gerade und w¨ ahlen an einer beliebigen Stelle auf dieser Geraden unseren Ursprung O des Koordinatensystems. Von diesem ausgehend w¨ahlen wir einen Vektor k l¨ angs der Geraden. An einer beliebig gew¨ahlten Stelle der Geraden errichten wir eine Ebene, die auf der Geraden senkrecht steht und zeichnen vom Ursprung O aus den Ortsvektor x zu einem beliebigen Punkt der Ebene. Dann lassen sich alle Punkte der Ebene durch die folgende Gleichung beschreiben (vgl. Abb. 1.4) k · x = kx cos θ = const. ,
(1.19)
da alle Ortsvektoren x zu den Punkten der Ebene dieselbe senkrechte Projektion auf den Vektor k haben. Dieses Resultat findet Anwendung bei der Darstellung einer ebenen elektromagnetischen Welle, die sich in einer beliebigen Richtung im Raum fortpflanzt. Bei einer solchen Welle herrscht in jedem Punkt einer Ebene senkrecht zur Fortpflanzungsrichtung der Welle dieselbe augenblickliche Schwingungsphase. Eine solche Welle l¨asst sich in der Form
8
1 Vektoranalysis
Abbildung 1.4. Gleichung einer Ebene im Raum
darstellen E(r, t) = E sin(ωt − k · x) ,
(1.20)
wo E eine konstante Vektoramplitude der Welle ist und zwischen der Frequenz ω und dem Wellenvektor k der Welle die Beziehung besteht kc = ω, wobei c die Lichtgeschwindigkeit, k = 2π λ die Wellenzahl und ω = 2πν die Kreisfrequenz sind, w¨ ahrend λ und ν die Wellenl¨ange und Frequenz der Welle bedeuten. 2. Das Bravais- und das reziproke Gitter: In der Theorie der kristallinen Festk¨ orper wird ein idealisiertes, unendlich ausgedehntes dreidimensionales Punktgitter eingef¨ uhrt, dessen Gitterpunkte zun¨achst nicht von Atomen oder Ionen eines realen Kristalls besetzt sind. Ein solches Gitter nennt man ein ,,Bravais-Gitter“. Zur Beschreibung eines solchen Bravais-Gitters kann man von einem beliebigen Gitterpunkt ausgehend zu drei n¨achst benachbarten uhren, die im Gitterpunkten ein System von Basisvektoren a1 , a2 , a3 einf¨ allgemeinen nicht zu 1 normiert sind und auch nicht aufeinander senkrecht stehen. In Abb. 1.5 ist dies f¨ ur ein ebenes Bravais-Netz angedeutet. Diese drei Basisvektoren definieren die Einheitszelle des Gitters mit dem Volumen des Spatproduktes (1.21) Vd = a1 · (a2 × a3 ) . Ein beliebiger Gitterpunkt l¨ asst sich dann vom beliebig gew¨ahlten Ursprung 0 aus durch den Vektor Rn = n1 a1 + n2 a2 + n3 a3
(1.22)
erreichen, wo n1 , n2 , n3 beliebige ganze positive oder negative Zahlen sind. Diese Gittervektoren Rn charakterisieren auch die Translationssymmetrie des Bravais-Gitters. In der Festk¨ orperphysik wird nun neben diesem direkten Gitter auch noch das sogenannte reziproke Gitter eingef¨ uhrt, dessen Einheitszelle durch folgende Basisvektoren b1 , b2 , b3 definiert ist, die durch ¨außeres Produkt aus den Basisvektoren a1 , a2 , a3 hervorgehen bi =
2π (aj × ak ) , Vd
(1.23)
1.3 Vektordifferenzialoperationen
9
Abbildung 1.5. Das Bravais-Gitter
wo i, j, k zyklisch die Werte 1, 2, 3 durchlaufen. Im Nenner ist dabei Vd von (1.21) aus Normierungsgr¨ unden eingef¨ uhrt. Berechnet man n¨amlich das Volumen der Einheitszelle des reziproken Gitters, so ergibt sich Vb = b1 · (b2 × b3 ) =
(2π)3 , Vd
(1.24)
wie der Leser selbst nachpr¨ ufen m¨ oge. Jeder beliebige Punkt des reziproken Gitters wird dann durch den reziproken Gittervektor K m = m1 b1 + m2 b2 + m3 b3
(1.25)
erfasst, wo m1 , m2 , m3 beliebige ganze Zahlen sind. Dabei hat der Raum des reziproken Gitters dieselbe Translationssymmetrie wie der Raum des direkten Gitters. Bildet man das Skalarprodukt K m · Rn erh¨alt man die wichtige Relation K m · Rn = 2π , (1.26) wo eine beliebige ganze Zahl ist. Schließlich f¨ uhrt die Bildung des reziproken Gitters aus dem reziproken Gitter wieder zum urspr¨ unglichen Gitter zur¨ uck.
1.3 Vektordifferenzialoperationen Um die Vektordifferenzialoperationen anwenden zu k¨onnen, wird es notwendig sein, von nun an anzunehmen, dass die betrachteten skalaren und vektoriellen Gr¨ oßen Feldcharakter haben, d. h. im allgemeinen vom Ort, charakterisiert durch den Ortsvektor r und von der Zeit t, oder einem anderen Parameter, abh¨ angen werden. Die wichtigsten Vektordifferenzialoperationen
10
1 Vektoranalysis
sind die Differenziation nach einem Parameter, die Bildung des Gradienten, der Divergenz und der Rotation, die wir im Folgenden der Reihe nach besprechen wollen. Die Differenziation eines Vektors nach einem Parameter, in den meisten F¨ allen nach der Zeit, ist bei der Behandlung von Problemen in der Mechanik der Massenpunkte von besonderem Interesse, w¨ahrend die skalaren und vektoriellen Felder haupts¨ achlich in der Elektrodynamik und in der Mechanik der Kontinua, wie etwa der Hydro- und Aeromechanik, zur Beschreibung der physikalischen Vorg¨ ange notwendig sind. 1.3.1 Differenziation nach einem Parameter Da ein Parameter eine skalare Gr¨ oße ist, wird bei der Differenziation eines Vektors A nach einem Parameter dessen Vektorcharakter nicht ge¨andert und es lassen sich daher hier auf Vektorgr¨ oßen dieselben Differenziationsregeln anwenden, wie sie in der gew¨ ohnlichen Analysis gezeigt werden (Siehe Anh. A.1). Wenn also ein Vektor A etwa nach der Zeit differenziert wird, so gilt die Beziehung dA A(t + Δt) − A(t) = lim . Δt→0 dt Δt
(1.27)
F¨ ur die Summe oder Differenz zweier Vektoren A und B gilt analog, wenn wir die Differenziation nach der Zeit durch einen Punkt bezeichnen und jene nach einem anderen Parameter durch einen Strich (A ± B )˙ = A˙ ± B˙ .
(1.28)
Wenn ein Vektor A(t) mit einem Skalar b(t) multipliziert wird, lautet die Differenziationsregel ˙ + Ab˙ (Ab)˙ = Ab (1.29) und f¨ ur die Differenziation des skalaren und vektoriellen Produktes gilt analog (A · B )˙ = A˙ · B + A · B˙ (A × B )˙ = A˙ × B + A × B˙
(1.30)
Beispiele: 1. Bewegung eines Massenpunktes l¨angs einer Kurve C In Bezug auf ein Kartes’sches Koordinatensystem befinde sich der Massenpunkt an einem Ort der Kurve C, der durch den Ortsvektor r bestimmt ist (vgl. Abb. 1.6), und er habe dort l¨ angs der Kurve die Geschwindigkeit v. F¨ uhrt man l¨angs der Kurve das Linienelement ds = |dr| = (dx2 + dy 2 + dz 2 )1/2 ,
(1.31)
1.3 Vektordifferenzialoperationen
11
Abbildung 1.6. Bewegung eines Massenpunktes l¨ angs C
anstelle des Differenzials dt der Zeit, als neue skalare Variable ein, so kann man die Geschwindigkeit v des Massenpunktes auf die Form bringen v = |v|t , |v| =
1 ds 2 = x˙ + y˙ 2 + z˙ 2 2 , dt
(1.32)
wo t = dr angs der Kurve C ist und ds ds ein Tangenteneinheitsvektor l¨ dt der Betrag der Geschwindigkeit des Massenpunktes an der Stelle r. Wenn wir daher durch zweimalige Ableitung nach der Zeit die Beschleunigung a des Massenpunktes berechnen, so erhalten wir mithilfe der Kettenregel der Differenziation (siehe Anh. A.1.3 (A.6)) a=
d dt ds d2 s dv = (t|v|) = +t 2 , dt dt dt dt dt
dt ds dt = . dt ds dt
(1.33)
dt dt dϕ Nun kann man aber umformen und schreiben ds = dϕ ds . Dabei ist ϕ der Winkel zwischen den Tangentenvektoren t und t + dt an einem infinitesimal dt = n stellt einen Normaleneinbenachbarten Punkt der Kurve C und dϕ heitsvektor dar, der senkrecht zu t nach innen gerichtet ist, denn bei der dt ange Ableitung von t nach ϕ ¨ andert sich wegen d(t·t) dϕ = 2t · dϕ = 0 nicht die L¨ des Einheitsvektors, sondern nur seine Richtung und die ist in der Abb. 1.6 1 ummung der Kurve an dieser nach innen orientiert. Ferner ist dϕ ds = ρ die Kr¨ Stelle, wobei ρ den Kr¨ ummungsradius der Kurve an diesem Punkt darstellt, d. h. der Radius jenes Kreises, der an diesem Ort die Kurve ber¨ uhrt. Somit ergibt sich f¨ ur die Beschleunigung a 2 ds n d2 s , (1.34) a= 2t+ dt dt ρ
12
1 Vektoranalysis
wonach die Beschleunigung an jedem Punkt der Kurve in zwei Anteile zerlegt werden kann, n¨ amlich in eine tangentiale und in eine normale Beschleunigung, wobei die letztere auch Zentripetalbeschleunigung genannt wird. Der Leser m¨ oge sich das oben gesagte anhand der Bewegung eines Massenpunktes auf einem Kreis vom Radius R veranschaulichen. Bei dieser ist der Kr¨ ummungsradius stets derselbe ρ = R, und der Normaleneinheitsvektor n weist stets auf den Mittelpunkt des Kreises hin. 2. Die Coriolis-Beschleunigung Die Gesetze der Newton’schen Mechanik gelten nur in Bezug auf Koordinatensysteme, die sich relativ zueinander mit konstanter Geschwindigkeit bewegen, d. h. sogenannte Inertialsysteme. Daher ist die rotierende Erde kein solches Inertialsystem und es treten daher auf der Erde als Bezugssystem Beschleunigungen auf, die in der Erdrotation ihren Ursprung haben, die sogenannten Coriolis-Beschleunigungen. Zur Veranschaulichung der durch diese hervorgerufenen Effekte betrachten wir einen kleinen ,,K¨ afer“, der sich auf einer rotierenden ebenen Scheibe bewegen kann. Die Rotation der Scheibe erfolge mit konstanter Winkelgeschwindigkeit ˙ entgegen dem Uhrzeigersinn. Um die Geschwindigkeit und Beω = dϕ dt = ϕ schleunigung des K¨ afers auf der rotierenden Scheibe zu beschreiben, f¨ uhren wir auf der Scheibe ein Kartes’sches Koordinatensystem (x, y) ein, dessen Ursprung in der Rotationsachse liegt. In Bezug auf dieses System sei der Ortsvektor des K¨ afers durch r = xi + yj
(1.35)
gegeben. Die Geschwindigkeit v des K¨ afers in Bezug auf das Laborsystem als Inertialsystem ist dann v = r˙ = (xi + yj )˙ = ix˙ + j y˙ + x(i)˙ + y(j )˙ ,
(1.36)
wobei die letzten beiden Terme die Rotation des auf der Scheibe fixierten Koordinatensystems in Bezug auf das Laborsystem beschreiben. Da i und di ω = jω und j Einheitsvektoren sind, k¨ onnen wir aber setzen (i)˙ = dϕ dj ˙ ω = −iω, wie sich aus den Ergebnissen des vorangehenden Bei(j ) = dϕ
spiels schließen l¨asst. Daher nimmt der Ausdruck f¨ ur die Geschwindigkeit des K¨ afers die Gestalt an v = (x˙ − ωy)i + (y˙ + ωx)j .
(1.37)
F¨ ur die Beschleunigung des K¨ afers erh¨ alt man analog y + 2ω x˙ − ω 2 y)j . a = v˙ = (¨ x − 2ω y˙ − ω 2 x)i + (¨
(1.38)
Demnach besteht die Beschleunigung des K¨ afers aus drei Anteilen a = a1 + a2 + a3 , wo a1 = x¨i + y¨j ;
a2 = 2ω(−yi ˙ + xj) ˙ ;
a3 = −ω 2 r .
(1.39)
1.3 Vektordifferenzialoperationen
13
Der erste Anteil beschreibt die Beschleunigung des K¨afers in Bezug auf das rotierende Koordinatensystem. Der zweite Anteil ist die ,,Coriolis-Beschleunigung“. Diese h¨ angt ersichtlich von der Winkelgeschwindigkeit ω der rotierenden Scheibe und von der Relativgeschwindigkeit v r des K¨afers in Bezug auf das rotierende Koordinatensystem ab und es gilt a2 · v r = 0, d. h. die Coriolis-Beschleunigung steht senkrecht auf der Relativgeschwindigkeit. Der dritte Term ist schließlich die Zentripetalbeschleunigung, die proportional ω 2 ist und auf das Rotationszentrum zuweist. Die Coriolis-Beschleunigung ist zum Beispiel verantwortlich f¨ ur die Westabweichung der senkrecht von der Erde startenden Rakete oder die Rosettenbewegung eines ,,Foucault’schen Pendels“. 3. Der Cosinus-Satz der sph¨arischen Trigonometrie Wir betrachten eine Kugel vom Radius R = 1. Auf dieser Kugel sei ein sph¨arisches Dreieck eingezeichnet, das von drei Bogenelementen gebildet wird, die Teile von Großkreisen sind (vgl. Abb. 1.7). Da die Kugel den Radius R = 1 hat, k¨onnen wir diese Bogenelemente durch die Winkel θ, ϑ und ϑ bezeichnen, wobei die Bogenelemente ϑ, ϑ den Winkel ϕ einschließen sollen. Vom Zentrum der Kugel zeichnen wir zu den Endpunkten des Dreiecks die Vektoren a, b und c und betrachten folgende Vektoroperationen (vgl. Abb. 1.7) |a × b| = sin ϑ ;
|a × c| = sin ϑ .
(1.40)
Da die durch die Vektorpaare (a, b) und (a, c) bestimmten Ebenen bei A den Winkel ϕ einschließen, muss wegen (1.40) gelten (a × b) · (a × c) = sin ϑ sin ϑ cos ϕ .
Abbildung 1.7. Der Cosinussatz
(1.41)
14
1 Vektoranalysis
Nun ist aber gem¨ aß Abb. 1.7, a · b = cos ϑ, b · c = cos θ und a · c = cos ϑ . Daher kann man anstelle von (1.41) mithilfe der ersten Beziehung von (1.18) auch schreiben (a × b) · (a × c) = (a · a)(b · c) − (a · c)(a · b) = cos θ − cos ϑ cos ϑ (1.42) und daher ergibt sich durch gleichsetzen mit (1.41) der Cosinus-Satz der sph¨ arischen Trigonometrie cos θ = cos ϑ cos ϑ + sin ϑ sin ϑ cos ϕ .
(1.43)
1.3.2 Der Gradientoperator Wir betrachten eine skalare Funktion Φ(r), die im Raum ein skalares Feld als Funktion des Ortes r definiert. Die Gr¨oßen Φ(r) = C definieren als Funktion der beliebig w¨ ahlbaren Konstanten C Scharen von Fl¨achen, den ,,Niveaufl¨ achen“ des skalaren Feldes. F¨ ur alle Orte r auf diesen Fl¨achen hat daher Φ denselben Wert. R¨ uckt man infinitesimal von einer Niveaufl¨ache zur n¨ achsten vor, so a ¨ndert sich Φ um den Wert, der durch das totale Differenzial gegeben ist ∂Φ ∂Φ ∂Φ ∂Φ dx + dy + dz = dxi . (1.44) dΦ(r) = ∂x ∂y ∂z ∂xi Doch wenn dr = dxi + dyj + dzk ein infinitesimales Vektorelement darstellt, k¨ onnen wir (1.44) auch als Skalarprodukt von dr mit dem Vektor ∂Φ ∂Φ ∂Φ ∂Φ i+ j+ k= ei = gradΦ(r) ∂x ∂y ∂z ∂xi
(1.45)
darstellen, den wir den Gradientvektor nennen, und daher setzen dΦ(r) = dr · gradΦ(r) .
(1.46)
Der Gradientvektor ist ein Maß f¨ ur den Anstieg oder das Gef¨alle des skalaren Feldes an einem bestimmten Punkt. Ist der Vektor dr in einer Niveaufl¨ache gelegen, dann ist dΦ(r) = 0, da wir dann nicht zu einer benachbarten Niveaufl¨ ache fortschreiten. Daraus folgt aber nach (1.46), dass dann der Vektor dr auf dem Vektor gradΦ(r) senkrecht steht und folglich das Vektorfeld A(r) = gradΦ(r) eine Schar von Feldlinien definiert, welche die Niveaufl¨achen senkrecht durchstoßen. Zur Vereinfachung der Rechnungen in der Vektoranalysis ist es oft zweckm¨ aßig, den sogenannten ,,Nabla-Operator“ einzuf¨ uhren, der durch folgenden vektoriellen Differenzialoperator definiert ist ∇=
∂ ∂ ∂ ∂ i+ j+ k = ei . ∂x ∂y ∂z ∂xi
(1.47)
Damit kann man dann abgek¨ urzt schreiben dΦ(r) = (∇Φ) · dr. Ferner sei noch der ,,Normaleneinheitsvektor“ n auf eine Niveaufl¨ache eingef¨ uhrt. Da
1.3 Vektordifferenzialoperationen
15
∇Φ auf den Niveaufl¨ achen senkrecht steht, ist der Normaleneinheitsvektor gegeben durch ∇Φ . (1.48) n= |∇Φ| Wenn wir senkrecht zu einer Niveaufl¨ ache um dn fortschreiten, dann ist dn = ¨ n·dr. Folglich, wenn wir die Anderung von Φ l¨ angs n betrachten, gilt dΦ =
∂Φ ∂Φ dn = n · dr = ∇Φ · dr ∂n ∂n
(1.49)
und daher k¨ onnen wir setzen ∇Φ = ∂Φ ∂n n. Diese Relation kommt bei den Integrals¨ atzen der Vektoranalysis in Abschn. 1.4 zur Anwendung. Schließlich sei noch bemerkt, dass der Nabla-Operator in der einfachen Form (1.47) nur in rechtwinkligen Kartes’schen Koordinaten zur Anwendung gelangen kann. Beispiele: 1. Der Energiesatz der Mechanik Viele Kr¨ afte der Mechanik lassen sich aus einer Potenzialfunktion V (r), also aus einem skalaren Feld, durch Gradientbildung ableiten. Daher lautet in diesem Fall die Newton’sche Bewegungsgleichung f¨ ur einen Massenpunkt, der sich in diesem Feld bewegt m
dv = −gradV (r) , dt
(1.50)
wo a = dv dt die Beschleunigung ist. Wenn man diese Gleichung auf beiden Seiten skalar mit v multipliziert, dann l¨ asst sich, in Koordinaten ausgedr¨ uckt, die resultierende Gleichung in der Form angeben mvi v˙ i = −
∂V x˙ i , ∂xi
(1.51)
da vi = x˙ i ist. Mithilfe der Kettenregel der Differenziation (A.6) ist dies aber das Resultat der Ausrechnung von d 1 2 mv + V (r) = 0 (1.52) dt 2 und somit ist die Summe der kinetischen Energie 12 mv 2 und der potenziellen Energie V (r), unabh¨ angig von der Zeit, gleich einer Konstanten, der Gesamtenergie E des Systems. 2. Der Drehimpulssatz der Mechanik Wenn die potenzielle Energie V (r) nur vom Betrag r = |r| des Ortsvektors abh¨ angt, dann finden wir f¨ ur die zeit¨ liche Anderung des Drehimpulses, definiert durch L = r × mv, mithilfe der Newton’schen Bewegungsgleichung (1.50) dv dV d L = v × mv + r × m = 0 − r × gradV (r) = −r × gradr . (1.53) dt dt dr
16
1 Vektoranalysis
Doch es ist
ei xi r ∂ √ 2 (1.54) x = √ = , 2 ∂xi r x also ein Einheitsvektor in Richtung r. Folglich verschwindet das ¨außere Produkt auf der rechten Seite von (1.53) und somit ist der Drehimpuls L eine Konstante der Bewegung. Beide Erhaltungss¨atze sind zum Beispiel bei der Planetenbewegung um die Sonne erf¨ ullt, da das Newton’sche Gravitationsgesetz durch ein Potenzial V (r) beschrieben wird und aus den beiden Erhaltungss¨ atzen folgen die drei ,,Kepler’schen Gesetze“. gradr = ei
1.3.3 Die Divergenz eines Vektorfeldes Wir betrachten ein Vektorfeld A(r) und bilden das Skalarprodukt mit dem Nabla-Operator ∇. Dies liefert ein skalares Feld, die Divergenz von A(r) ∇ · A(r) =
∂Ay ∂Az ∂Ax + + = divA(r) . ∂x ∂y ∂z
(1.55)
Diese Differenzialoperation findet zum Beispiel wichtige Anwendungen in der Hydromechanik und in der Elektrodynamik und wird uns bei der Behandlung des ,,Gauß’schen Integralsatzes“ wiederbegegnen. Beispiel Die Kontinuit¨atsgleichung Es sei ein bestimmtes Raumgebiet von einer Fl¨ ussigkeit erf¨ ullt, deren Massendichteverteilung durch ρ(r, t) und Geschwindigkeitsverteilung durch v(r, t) gegeben ist. Dann wird der Massenfluss der Fl¨ ussigkeit durch das Vektorfeld V (r, t) = ρ(r, t)v(r, t)
(1.56)
bestimmt sein. Ist F ein vektorielles Fl¨ achenelement in der Fl¨ ussigkeit (vgl. Abb. 1.8), dann wird der Massenfluss Φ(r, t) durch dieses Fl¨achenelement pro Zeiteinheit gegeben sein durch den Ausdruck Φ(r, t) = V (r, t) · F ,
(1.57)
wobei wir unsere Definition eines vektoriellen Fl¨achenelementes verwendet haben, die bei der Diskussion des ¨ außeren Produktes in Abschn. 1.2.3 eingef¨ uhrt wurde. Nun betrachten wir in der Fl¨ ussigkeit einen kleinen, r¨aumlich festen W¨ urfel der Kantenl¨ angen dx, dy, dz (vgl. Abb. 1.9). Dann ist die Menge an Fl¨ ussigkeit, die durch das Fl¨ achenelement F1 pro Zeiteinheit fließt, gegeben durch (1.58) Vy dxdz = (ρv)y dxdz
1.3 Vektordifferenzialoperationen
17
Abbildung 1.8. Der Massenfluss
Abbildung 1.9. Zum differenziellen Massenfluss
und jene, die aus dem Fl¨ achenelement F2 herausfließt, ist
∂Vy Vy+dy dxdz = Vy + dy dxdz . ∂y
(1.59)
Damit ist dann der Massenzuwachs an Fl¨ ussigkeit pro Zeiteinheit im Raumw¨ urfel
∂Vy ∂Vy Vy dxdz − Vy + dy dxdz = − dxdydz . (1.60) ∂y ∂y Wenn man analog den Massenzuwachs durch die anderen vier gegen¨ uberliegenden W¨ urfelfl¨ achen betrachtet, so erh¨ alt man insgesamt als Massen¨anderung pro Zeiteinheit im Raumw¨ urfel
∂Vx ∂Vy ∂Vz − + + dxdydz = − (∇ · V ) dxdydz . (1.61) ∂x ∂y ∂z
18
1 Vektoranalysis
Es gilt jedoch in der Hydromechanik aus Erfahrung der Satz von der Erhaltung der Materie. Daher muss das obige Ergebnis gleich sein dem zeitlichen Zuwachs an Materie im Raumw¨ urfel, also gleich sein ρ(r, ˙ t)dxdydz. Es gilt also ∂ρ(r, t) dxdydz (1.62) −(∇ · V )dxdydz = ∂t und daraus folgt die sogenannte ,,Kontinuit¨ atsgleichung“ der Hydromechanik ∂ρ + divV = 0 . ∂t
(1.63)
Ist insbesondere die Fl¨ ussigkeit inkompressibel, dann ist divV = 0. Der Name ,,Divergenz“ r¨ uhrt von dieser Interpretation von divV her. Denn da −divV ¨ den Uberschuss an Einw¨ artsfluss gegen¨ uber dem Ausw¨artsfluss an Materie im ¨ Raumw¨ urfel darstellt, ist umgekehrt divV der Uberschuss an Ausw¨artsfluss, also die ,,Divergenz“ an Fl¨ ussigkeit. Eine zu (1.63) analoge Gleichung dr¨ uckt in der Elektrodynamik den Satz von der Ladungserhaltung aus. 1.3.4 Die Rotation eines Vektorfeldes Die meisten Fl¨ ussigkeiten der Natur sind mit der Eigenschaft der Reibung behaftet. Dies f¨ uhrt unter anderem zur Bildung von Wirbeln in str¨omenden Fl¨ ussigkeiten, wie jedermann vom Umr¨ uhren seines Kaffees oder Tees her weiß. Zur theoretischen Beschreibung der Eigenschaft der Wirbelbildung einer str¨ omenden Fl¨ ussigkeit wurde der Begriff der Rotation eines Vektorfeldes eingef¨ uhrt. Sei A(r) ein gegebenes Vektorfeld, dann ist die Rotation von A, rotA genannt, in Kartes’schen Koordinaten definiert durch das ¨außere Produkt des Nabla-Operators mit dem Vektorfeld A, d. h. rotA(r) = ∇ × A(r)
∂Az ∂Ay ∂Ax ∂Az ∂Ay ∂Ax − − − =i +j +k (1.64) , ∂y ∂z ∂z ∂x ∂x ∂y oder durch eine Determinante ausgedr¨ uckt, in Analogie zu (1.11) e1 e 2 e 3 ∂ ∂ ∂ rotA(r) = ∂x1 ∂x2 ∂x3 = ei εijk ∇j Ak , A1 A2 A3
(1.65)
wobei die letzte Form der Darstellung der Rotation die kompakteste ist. Wenn insbesondere das Vektorfeld A(r) durch Gradientbildung aus einem skalaren Feld Φ(r) erhalten wird, dann folgt rotA = rot gradΦ = ∇ × ∇Φ = (∇ × ∇)Φ = 0 ,
(1.66)
da formal gesehen die beiden Nabla-Operatoren zueinander parallel sind, also ihr ¨ außeres Produkt verschwindet. Wir schließen daraus, dass ein Gradientfeld wirbelfrei ist und dass das Str¨ omungsfeld einer reibungsfreien Fl¨ ussigkeit
1.3 Vektordifferenzialoperationen
19
Abbildung 1.10. Zur Rotation eines Vektorfeldes
aus einem Potenzial abgeleitet werden kann. Um einzusehen, dass die Rotation eines Vektorfeldes in der Tat etwas mit einer Wirbelbildung zu tun hat, betrachten wir folgendes einfaches Problem. Gegeben sei ein rechteckiges Fl¨ achenst¨ uck in der (x, y)-Ebene mit den Kantenl¨angen Δx und Δy. Dieses Fl¨achenelementsei in ein Str¨ omungsfeld A(r, t) eingebettet. Wir betrachten den Wert von A · Δs bei einem einmaligen Umlauf um das Rechteck entgegen dem Uhrzeigersinn (vgl. Abb. 1.10). Von A nach B, von B nach C etc. gehend, erhalten wir der Reihe nach aufsummiert folgendes Resultat
∂Ay Δx Δy A · Δs = Ax Δx + Ay + ∂x
∂Ax − Ax + Δy Δx − Ay Δy , (1.67) ∂y wobei angenommen wurde, dass die Kantenl¨ angen Δx und Δy infinitesimal sind. Doch die explizite Ausrechnung von (1.67) liefert
∂Ay ∂Ax − (1.68) A · Δs = ΔxΔy = (∇ × A)z · df z . ∂x ∂y Dabei wurde beachtet, dass rotA als ein ¨ außeres Produkt auf ∇ und A senkrecht steht und df nach unserer Definition ein vektorielles Fl¨achenelement darstellt. W¨ are also unser Fl¨ achenelement beliebig im Raum orientiert, dann w¨ urde allgemein gelten A · Δs = (∇ × A) · df . (1.69) Das Resultat (1.69) wird uns bei der Herleitung des Stokes’schen Integralsatzes von Nutzen sein.
20
1 Vektoranalysis
1.3.5 Mehrfache Differenzialoperationen Bei vielen Problemen der Vektoranalysis haben wir es mit der Anwendung des Nabla-Operators auf Mehrfachprodukte von Vektorfeldern zu tun und es sollen hier die wichtigsten dieser Beziehungen besprochen, bzw. angef¨ uhrt werden: Zun¨ achst ist der Gradient des Produktes zweier skalarer Felder nach der gew¨ ohnlichen Produktregel der Analysis (siehe Anh. A.1.3 (A.10)) zu berechnen, also ∇(ΦΨ ) = Ψ ∇Φ + Φ∇Ψ . (1.70) ahnlich wird die Divergenz des Produktes eines skalaren mit einem Vektorfeld ¨ berechnet divΦA = A · gradΦ + ΦdivA (1.71) und ebenso die Rotation des Produktes von einem skalaren mit einem Vektorfeld rot(ΦA) = ∇ × (ΦA) = gradΦ × A + ΦrotA , (1.72) wobei es ersichtlich darauf ankommt, ob der Nabla-Operator auf eine skalare oder eine Vektorfunktion wirkt. Als n¨ achstes wenden wir den Operator ∇ skalar auf das ¨ außere Produkt zweier Vektorfelder an. Dabei k¨onnen wir die zyklische und antizyklische Vertauschbarkeit der Elemente in einem Spatprodukt A · (B × C) verwenden und erhalten so div(A × B) = ∇ · (A × B) = B · rotA − A · rotB ,
(1.73)
wobei zu beachten ist, dass bei einer antizyklischen Vertauschung sich das Vorzeichen ¨ andert. Nun betrachten wir den etwas komplexeren Fall der Rotation eines ¨ außeren Produktes. Dabei haben wir die Regel A × (B × C) = B(A·C)−C(A·B) zu verwenden und finden nach einigen Zwischenschritten rot(A × B) = (B · ∇)A − BdivA + AdivB − (A · ∇)B .
(1.74)
Dabei ist der Operator (B · ∇) ein symbolisches Skalarprodukt von der Form ∂ Bi ∂x , das auf alle Komponenten von A anzuwenden ist. Schließlich bleibt i noch die Beziehung grad(A · B) = (B · ∇)A + (A · ∇)B + BrotA + ArotB .
(1.75)
Es wird dem Leser empfohlen, die obigen Formeln zu verifizieren. In der Hydromechanik und Elektrodynamik kommen auch noch einige Vektordifferenzialoperationen vor, die eine zweifache Anwendung des Nabla-Operators beinhalten. Dies ist die folgende rot gradΦ = ∇ × ∇Φ = (∇ × ∇)Φ = 0 ,
(1.76)
1.4 Vektorintegraloperationen
21
welche ausdr¨ uckt, dass ein Gradientfeld wirbelfrei ist. Ferner gilt div rotA = ∇ · (∇ × A) = (∇ × ∇)A = 0 .
(1.77)
Demnach ist ein Wirbelfeld divergenzfrei. Hingegen erh¨alt man f¨ ur die Divergenz eines Gradientfeldes div gradΦ = (∇ · ∇)Φ =
∂ ∂ Φ = ΔΦ ∂xi ∂xi
(1.78)
und dies liefert den sogenannten Laplace-Operator Δ=
∂2 ∂2 ∂2 + 2+ 2 . 2 ∂x ∂y ∂z
(1.79)
Schließlich betrachten wir noch die zweifache Rotation eines Vektorfeldes rot rotA = ∇ × (∇ × A) = grad divA − ΔA ,
(1.80)
wobei die letzte Gleichung als die Definition von ΔA angesehen werden kann. Es ist zu beachten, dass all diese Vektorrelationen in krummlinigen Koordinaten weitaus komplizierter sind, worauf wir sp¨ ater, in Abschn. 1.5, zu sprechen kommen werden.
1.4 Vektorintegraloperationen Unter den Vektorintegraloperationen sind von besonderem Interesse der Gauß’sche, der Green’sche und der Stokes’sche Integralsatz. Der Gauß’sche Integralsatz liefert einen Zusammenhang zwischen einem Volumsintegral und einem geschlossenen Oberfl¨ achenintegral und der Stokes’sche Satz stellt einen Zusammenhang zwischen einem geschlossenen Linienintegral und einem offenen Oberfl¨ achenintegral her. Der Green’sche Satz schließlich kann als Sonderfall des Gauß’schen Satzes behandelt werden. Alle drei Integrals¨atze werden wir im Folgenden diskutieren und Anwendungen aus der Physik betrachten. 1.4.1 Der Gauß’sche Satz Wir beginnen mit der Einf¨ uhrung des sogenannten Oberfl¨achenintegrals. Dazu betrachten wir eine beliebige geschlossene Oberfl¨ache F , die ein Volumen V umh¨ ullt. Die Oberfl¨ ache u ¨berspannen wir mit einem System von Koordinatenlinien u und v l¨ angs denen wir infinitesimale Vektoren du und dv errichten, deren ¨ außere Produkte vektorielle Fl¨ achenelemente df = du × dv definieren, die senkrecht auf der Oberfl¨ ache stehen und aus der Oberfl¨ache herausragen. Die Oberfl¨ ache sei zum Beispiel in das vorhin betrachtete Str¨omungsfeld V (r, t) von Abb. 1.8 eingebettet. An jedem Ort der Oberfl¨ache berechnen wir
22
1 Vektoranalysis
den infinitesimalen Fluss dΦ(r, t) = V (r, t) · df des Feldes durch die Oberfl¨ achenelemente df . Wenn wir u ¨ ber alle Oberfl¨achenelemente aufsummieren, k¨onnen wir den Gesamtfluss Φ(t) des Feldes V (r, t) durch die geschlossene H¨ ulle F berechnen und finden auf diese Weise V (r, t) · df = (Vx dfx + Vy dfy + Vz dfz ) , (1.81) Φ(t) = F
F
wo die Komponenten von df durch Projektion des Ober߬achenelementes in die drei Koordinatenebenen erhalten werden, also df = i(dydz) + j(dzdx) + k(dxdy) .
(1.82)
Nun denken wir uns das Volumen V , das von der H¨ ulle F umschlossen wird, in lauter infinitesimale W¨ urfel mit den Kantenl¨angen dx, dy und dz zerlegt. Auf alle diese W¨ urfel k¨ onnen wir die im Zusammenhang mit der Abb. 1.9 ¨ angestellten Uberlegungen und deren Resultate (1.58) bis (1.61) anwenden. Demnach gen¨ ugt es, um den gesamten Vektorfluss Φ(t) durch das Volumen V zu erhalten, die Vektordivergenzen der einzelnen Volumselemente aufzuaddieren. Also gilt anstelle (1.81) ebenso Φ(t) = divV (r, t)dxdydz . (1.83) V
Daher folgt aus (1.81) und (1.83) ganz allgemein f¨ ur ein beliebiges Vektorfeld A(r, t), das nichts mehr mit einer Fl¨ ussigkeitsstr¨omung zu tun haben muss, der Gauß’sche Integralsatz divAdv = A · df , (1.84) V
F
wo das Volumselement dv = dxdydz ist. Aus dem Gauß’schen Integralsatz folgt nun auch eine koordinatenfreie Definition der Divergenz eines Vektorfeldes F A · df , (1.85) divA = lim ΔV →0 ΔV wo F die beliebig gestaltete, kleine geschlossene H¨ ulle ist, die das Volumen ΔV umgibt. Beispiel Die Differenzialgleichung der W¨armeleitung Das experimentell gefundene Gesetz der W¨ armeleitung besagt, dass die W¨armestromdichte J , d. h. der W¨ armestrom pro Fl¨ achen- und Zeiteinheit, parallel aber entgegengesetzt orientiert ist zum Gradienten der Temperatur T , also J = −k∇T ,
(1.86)
1.4 Vektorintegraloperationen
23
wo die Konstante k die thermische Leitf¨ ahigkeit des Mediums genannt wird. Ferner definieren wir die W¨ armemenge pro Volumseinheit des Mediums durch q = CρT , wo ρ die Massendichte und C die spezifische W¨arme des Mediums sind, die beide als konstant angenommen werden. Daher ist in einem beliebigen Raumgebiet vom Volumen V die gesamte W¨armemenge gegeben durch CρT (r, t)dv (1.87) Q= V
und folglich ist die Abnahme von W¨ arme im Volumen V dQ ∂T =− dv , Cρ dt ∂t V
(1.88)
wobei das Volumen V als konstant angenommen wird und daher unter dem Integralzeichen partiell nach der Zeit differenziert werden kann (Siehe Anh. A.1.12 (A.50)). Gem¨ aß dem ,,Ersten Hauptsatz der Thermodynamik“ ist aber W¨ arme eine Form der Energie, die erhalten bleiben muss. Daher muss, wenn im Volumen V keine W¨ armequellen vorhanden sind, die Abnahme von Q im Volumen V ihre Ursache im Abfließen von W¨arme durch die Oberfl¨ ache F nach außen haben, die durch dQ = J · df = divJdv (1.89) dt F V gegeben ist, wobei der Gauß’sche Satz (1.84) zur Anwendung kam. Die Gleichsetzung von (1.88) mit (1.89) liefert dann mithilfe von (1.86) wegen div gradT = ΔT
∂T dv kΔT − Cρ =0. (1.90) ∂t V Da das Volumen V beliebig gew¨ ahlt werden kann, muss aus (1.90) mit κ = Cρ k folgen ∂T =0 (1.91) ΔT − κ ∂t und dies ist die gesuchte W¨ armeleitungsgleichung. Diese partielle Differenzialgleichung gilt auch bei der Behandlung von Diffusionsprozessen und die Schr¨ odinger-Gleichung in der Quantentheorie ist von ¨ahnlichem Charakter. Auf Ihre Behandlung kommen wir im Kapitel 4, Abschn. 4.2 u ¨ ber partielle Differenzialgleichungen zur¨ uck. 1.4.2 Der Green’sche Satz Dieser Satz hat wichtige Anwendungen in der Elektrodynamik und Hydromechanik sowie bei der L¨ osung partieller Differenzialgleichungen. Man erh¨alt die beiden m¨ oglichen Formen des Green’schen Satzes durch spezielle Wahl des Vektorfeldes A(r) im Gauß’schen Satz (1.84).
24
1 Vektoranalysis
1. Green’scher Satz Wir w¨ ahlen zwei skalare Felder Φ(r) und Ψ (r) und bilden daraus das Vektorfeld A = Φ∇Ψ . Dann liefert die Divergenzbildung gem¨aß (1.71) divA = ∇ · (Φ∇Ψ ) = ∇Φ · ∇Ψ + ΦΔΨ
(1.92)
und daher f¨ uhrt in diesem Fall der Gauß’sche Satz auf die Integralbeziehung (∇Φ · ∇Ψ + ΦΔΨ )dv = Φ∇Ψ · df . (1.93) V
F
2. Green’scher Satz Hier w¨ ahlt man bei der Anwendung des Gauß’schen Satzes das spezielle Vektorfeld A = Φ∇Ψ − Ψ ∇Φ und findet durch Divergenzbildung divA = ∇ · (Φ∇Ψ − Ψ ∇Φ) = ΦΔΨ − Ψ ΔΦ
(1.94)
und daher folgt bei Anwendung des Gauß’schen Satzes die zweite Integralbeziehung (ΦΔΨ − Ψ ΔΦ) dv = V
(Φ∇Ψ − Ψ ∇Φ) · df .
(1.95)
F
1.4.3 Der Stokes’sche Satz Wir beginnen mit der Einf¨ uhrung des Linienintegrals.Dazu betrachten wir ein einfaches Problem aus der Mechanik. In einem bestimmten Raumgebiet soll das Kraftfeld K(r) herrschen, das beispielsweise das Gravitationsfeld der Sonne sein kann. Es interessiert uns die Arbeit A, die das Kraftfeld leistet, wenn sich eine Masse l¨ angs einer beliebigen Bahnkurve C bewegt. Der infinitesimale Zuwachs der Arbeit bei dieser Bewegung ist durch das Skalarprodukt dA = K(r) · ds(r) gegeben, wo ds das infinitesimale vektorielle Wegelement tangential zur Bahnkurve darstellt. Daher ist die gesamte, l¨angs des Weges C von einem Punkt P zu einem Punkt Q vom Kraftfeld an der Masse geleistete Arbeit Q Q Q dA = K · ds = (Kx dx + Ky dy + Kz dz) . (1.96) P
P
P
Wenn das Kraftfeld K(r) aus einem Potenzialfeld V (r) durch Gradientbildung abgeleitet werden kann, wie dies beim Gravitationsfeld der Fall ist, dann erhalten wir f¨ ur die geleistete Arbeit anstelle (1.96) Q Q Q dA = K · ds = − gradV (r) · ds P
P
P Q
=−
dV = V (P ) − V (Q) . P
(1.97)
1.4 Vektorintegraloperationen
25
Abbildung 1.11. Zum Stokes’schen Satz
Demnach ist die in einem Potenzialfeld geleistete Arbeit unabh¨angig vom Weg C, der von P nach Q durchlaufen wird, sondern nur abh¨angig von der Potenzialdifferenz zwischen P und Q. Ferner erkennen wir auch, dass die Kurvenintegrale (1.96) und (1.97) ihr Vorzeichen umkehren, wenn wir die Kurve C in umgekehrter Richtung von Q nach P durchlaufen. Wenn wir daher in einem Potenzialfeld zun¨ achst l¨ angs einer Kurve C1 von P nach Q gelangen und dann l¨ angs eines anderen Weges C2 nach P zur¨ uckkehren, dann ist die l¨ angs dieses geschlossenen Weges C = C1 + C2 geleistete Arbeit gleich K · ds = − dV = 0 . (1.98) C
C
Gelegentlich nennt man ein Linienintegral l¨ angs eines geschlossenen Weges ein Ringintegral. Es ist nun nahe liegend, den eben anhand der Arbeit eines K¨ orpers in einem Kraftfeld gepr¨ agten Begriff des Linienintegrals auch auf andere Vektorfelder A(r, t) zu u ¨ bertragen, wobei diese Felder sowohl vom Ort als auch von der Zeit abh¨ angen k¨ onnen. Damit haben wir alle Vorbereitungen getroffen, um den Stokes’schen Satz der Vektoranalysis herzuleiten. Wir betrachten im Raum eine geschlossene Kurve C, die in ein Vektorfeld A(r, t) eingebettet ist. Die Kurve C sei die Berandung einer beliebig gew¨ olbten Fl¨ ache F . Die Fl¨ ache F u ¨ berspannen wir mit einem Netz von orthogonalen Koordinatenlinien und zerteilen so die Fl¨ache in lauter infinitesimale, vektorielle Fl¨ achenelemente df , wie wir dies bereits fr¨ uher, in Abschn. 1.4.1, besprochen haben. Nach unserer Konvention ragen diese Vektoren df aus der Fl¨ ache F heraus und die Kurve C hat gleichzeitig einen positiven Umlaufsinn entgegen der Uhrzeigerbewegung. F¨ ur so ein infinitesimales rechteckiges Fl¨ achenst¨ uck haben wir bereits mit Bezug auf Abb. 1.10
26
1 Vektoranalysis
in (1.68) und (1.69) das infinitesimale, geschlossene Linienintegral bei einmaligem Umlauf des Fl¨ achenelementes berechnet und fanden A · ds = rotA · df . (1.99) Wenn wir zwei benachbarte Rechtecke betrachten, dann wird ihre gemeinsame Berandung f¨ ur jedes Fl¨ achenelement entgegengesetzt durchlaufen und sich daher ihr Beitrag zur Summe auf der linken Seite von (1.99) gegenseitig wegheben. In gleicher Weise finden wir bei der Aufsummierung der Beitr¨age von (1.99) u achenelemente, dass sich die Beitr¨age der aneinander ¨ ber alle Fl¨ anschließenden Linienelemente alle gegenseitig aufheben und nur der Beitrag zum Linienintegral l¨ angs der Kurve C u ¨brig bleibt. Daraus folgt im Limes Δs → 0 der Stokes’sche Integralsatz A(r, t) · ds = rotA(r, t) · df . (1.100) C
F
Der Wert des Integrals auf der rechten Seite dieser Gleichung ist dabei der gleiche, egal welche Fl¨ ache F in der Kurve C eingespannt wurde, nur m¨ ussen die Fl¨ achennormalen dieselbe Orientierung haben. Wenn wir daher zwei Fl¨ achen F1 und F2 betrachten, die in die gleiche Kurve C eingespannt sind, und wir machen bei der Fl¨ ache F2 eine Umorientierung, dann wird gelten rotA(r, t) · df = − rotA(r, t) · df . (1.101) F1
F2
Daraus folgt aber f¨ ur eine geschlossene H¨ ulle F1 + F2 , bei der die Fl¨achenelemente df alle nach außen ragen, bei Anwendung des Gauß’schen Satzes (1.84) rotA(r, t) · df = div rotAdv = 0 , (1.102) F
V
wo nun V das Volumen ist, das von der H¨ ulle F umschlossen wird. Da aber F und damit V beliebig waren, muss allgemein gelten div rotA = 0
(1.103)
und dies bedeutet, dass ein Wirbelfeld divergenzfrei ist. Ebenso haben wir vorhin gesehen, dass A · ds = rotA · df = 0 (1.104) C
F
ist, wenn das Feld A(r) aus einem Potenzial Φ(r) abgeleitet werden kann, sodass allgemein gelten muss rot gradΦ(r) = 0 .
(1.105)
Also ist ein Gradientfeld rotationsfrei. Schließlich k¨onnen wir die Beziehung (1.99) noch dazu verwenden, um eine koordinatenfreie Definition der Rotation
1.4 Vektorintegraloperationen
27
eines Vektorfeldes anzugeben. Wir schreiben rotA · df = (rotA)n df , indem wir rotA auf den Normalenvektor n = df achenelementes projizieren df des F¨ und erhalten auf diese Weise A · ds , (1.106) (rotA)n = lim C df →0 df wo C das beliebig kleine Fl¨ achenelement df umschließt. Beispiele 1. Die Poisson’sche Differenzialgleichung der Potenzialtheorie In der Elektrostatik liefert das Experiment den folgenden Erfahrungssatz. Umschließt man eine beliebige Menge ruhender, positiver Ladung Q mit einer H¨ ulle F und berechnet den Fluss des elektrostatischen Feldes E(r) durch diese H¨ ulle, wenn alle anderen Ladungen gen¨ ugend weit weg sind, dann gilt E · df = αQ , (1.107) F
wo α eine Konstante ist, die von der Wahl des Maßsystems abh¨angt. Ist die Ladungsmenge Q kontinuierlich verteilt, dann kann man die Ladungsdichte ρ(r) einf¨ uhren und, nachdem man auf der linken Seite von (1.107) den Gauß’schen Satz verwendet hat, folgern, dass (divE − αρ)dv = 0 (1.108) V
ist, wo V das Volumen der Ladungsmenge Q darstellt. Da V beliebig sein kann, folgt als eine der Grundgleichungen der Elektrodynamik divE = αρ. Also hat die Divergenz des elektrostatischen Feldes ihren Ursprung in der Ladungsdichte oder allgemeiner, hat die Divergenz eines Feldes A ihren Ursprung in den Quellen ρ. Da aber f¨ ur ein Wirbelfeld gilt divrotA = 0, ist ein Wirbelfeld quellenfrei. Nach dieser Zwischenbemerkung kehren wir zu unserem elektrostatischen Problem zur¨ uck. Hier besagt eine weitere experimentelle Erfahrung, dass die Arbeit, die an einer Probeladung q durch das elektrostatische Feld E geleistet wird gleich Null ist, wenn der durchlaufene Weg C eine geschlossene Kurve darstellt. Daher gilt nach dem Stokes’schen Satz E · ds = rotE · df = 0 . (1.109) C
F
Also ist das elektrostatische Feld wirbelfrei, d. h. rotE = 0, und wir k¨onnen ansetzen E = −gradΦ, wo Φ(r) das elektrostatische Potenzial genannt wird. Zusammenfassend gelangen wir demnach zu der Gleichung divE = −div gradΦ = −ΔΦ = αρ
(1.110)
und letzteres ist die Poisson’sche Differenzialgleichung. Im ladungsfreien Raum gilt dann entsprechend die Laplace’sche Differenzialgleichung ΔΦ = 0. Ganz analoge Differenzialgleichungen gelten auch f¨ ur das Gravitationsfeld einer beliebigen Massenverteilung, da auch dieses Feld wirbelfrei ist.
28
1 Vektoranalysis
2. Das Faraday’sche Induktionsgesetz Wenn man nach Faraday den einen Pol ¨ eines Stabmagneten auf die Offnung einer Drahtschleife C zubewegt oder von ihr wegbewegt, kann man mit einem Galvanometer an der Drahtschleife einen induzierten Strom messen. Dieser Strom hat seine Ursache in der Induktion eines elektromagnetischen Feldes E(r, t) in der Drahtschleife, hervorgerufen ¨ durch die zeitliche Anderung des magnetischen Induktionsflusses Φ durch die Fl¨ ache F der Drahtschleife beim hin- und herbewegen des Stabmagneten. Es gilt also d dΦ = −γ E · ds = − B · df , (1.111) dt dt C F wo B(r, t) das magnetische Induktionsfeld des Stabmagneten in der Drahtschleife ist und das negative Vorzeichen die Richtung des induzierten Stromes in der Drahtschleife angibt. Bei Anwendung des Stokes’schen Satzes auf der ¨ linken Seite von (1.111) finden wir also, da die Drahtschleife beliebige Offnung haben kann und diese sich mit der Zeit nicht ¨ andert, dass rotE = −γ
∂B ∂t
(1.112)
gilt. Dies ist die differenzielle Form des Faraday’schen Induktionsgesetzes, wobei γ eine vom Maßsystem abh¨ angige Konstante darstellt. 3. Die d’Alembert’sche Wellengleichung Dieser Gleichung gen¨ ugen viele Wellenph¨ anomene der Physik, seien es die Wellenbewegungen einer schwingenden Saite, die Schallwellen oder die elektromagnetischen Wellen. Wir wollen sie hier aus den Maxwell’schen Gleichungen der Elektrodynamik herleiten. Zwei der Maxwell’schen Gleichungen kennen wir bereits, n¨amlich (1.110) achstes kommt das Oersted’sche divE = αρ und (1.112) rotE = −γ ∂B ∂t . Als n¨ Gesetz hinzu, wonach einer von einem elektrischen Strom J durchflossener Leiter von einem magnetischen Induktionsfeld B, bestehend aus lauter geschlossenen Feldlinien, umschlungen ist. Daraus folgt zun¨achst, dass dieses Feld B quellenfrei ist, also divB(r, t) = 0
(1.113)
gilt, wobei das Induktionsfeld auch zeitlich ver¨ anderlich sein kann, wenn etwa der Strom im Leiter sich zeitlich ¨ andert. Ferner ergibt sich aus dem Oersted’schen Experiment, dass B · ds = βJ (1.114) C
ist, wenn die Kurve C den Leiter umschließt. Die Konstante β ist neuerlich durch das gew¨ ahlte Maßsystem bestimmt. Ist der Strom J durch eine kontinuierliche Stromverteilung j(r, t) darstellbar und ist F die Fl¨ache, die von der Kurve C berandet wird, so k¨ onnen wir mithilfe des Stokes’schen Satzes
1.4 Vektorintegraloperationen
(1.100) die Gleichung (1.114) auf folgende Gestalt bringen B · ds = rotB · df = β j · df C
F
29
(1.115)
F
und da C und F beliebig sind, k¨ onnen wir allgemein schließen rotB = βj +
β ∂ E, α ∂t
(1.116)
wobei wir sogleich den sogenannten Maxwell’schen Verschiebungsstrom j V = 1 ∂ ugt haben, um das System der Maxwell’schen Gleichungen zu α ∂t E hinzugef¨ vervollst¨ andigen. Dieser Zusatzterm folgt aus der Bedingung, dass der Satz von der Erhaltung der Ladung ∂ρ ullt sein soll. Wenn wir den ∂t + divj = 0 erf¨ Fall betrachten, dass keine Ladungen ρ und keine Str¨ome j vorliegen, wir uns also im Vakuum befinden, f¨ uhren die Maxwell’schen Gleichungen auf die d’Alembert’sche Wellengleichung f¨ ur die Felder E und B, wie wir nun zeigen. Die Anwendung der Rotation auf die letzte Gleichung (1.116) mit j = 0 f¨ uhrt aufgrund des Induktionsgesetzes (1.112) und divB = 0 auf die Beziehung rot rotB = grad divB − ΔB =
γβ ∂ 2 β ∂ rotE = − B α ∂t α ∂t2
(1.117)
und daraus folgt die d’Alembert’sche Wellengleichung ΔB −
1 ∂2 B=0 c2 ∂t2
(1.118)
f¨ ur das Induktionsfeld B(r, t). Dabei ist unabh¨angig vom Maßsystem c2 = α βγ , wo c die Lichtgeschwindigkeit bedeutet. Eine entsprechende Gleichung findet man auch f¨ ur das elektrische Feld E(r, t), indem man auf das Induktionsgesetz (1.112) die Rotation anwendet und dann die Gleichung (1.116) ¨ ben¨ utzt. Dies nachzuvollziehen u Auch ¨ berlassen wir dem Leser als Ubung. die inhomogene d’Alembert’sche Wellengleichung kommt in der Physik h¨aufig vor, wo auf der rechten Seite der Gleichung eine Quellfunktion steht. Die oben diskutierten Gleichungen werden im Kap. 4 u ¨ ber partielle Differenzialgleichungen n¨ aher behandelt. 4. Der Stokes’sche Satz in der Ebene Diesen Satz werden wir bei der Herleitung des Fundamentalsatzes der Funktionentheorie in Kap. 7, Abschn. 7.3.2 ben¨ otigen und er soll daher hier als Beispiel aus dem r¨aumlichen Stokes’schen Satz (1.100) hergeleitet werden. Wenn wir den Stokes’schen Satz in die (x, y)Ebene projizieren, wird die geschlossene Kurve C eine ebene Kurve und die Fl¨ache F kommt ganz in der (x, y)-Ebene zu liegen. Daher bleiben vom Kurvenintegral nur die x- und y-Komponenten u ¨ brig und vom Fl¨achenintegral nur die z-Komponente. Wir erhalten also
∂Ay ∂Ax − (Ax dx + Ay dy) = dxdy . (1.119) ∂x ∂y C F
30
1 Vektoranalysis
Nun ist es u ¨ blich, beim Stokes’schen Satz in der Ebene die Vektorkomponenten in folgender Weise umzutaufen Ax = P (x, y) und Ay = Q(x, y), sodass die endg¨ ultige Form des Stokes’schen Satzes in der Ebene lautet ∂Q(x, y) ∂P (x, y) − [P (x, y)dx + Q(x, y)dy] = dxdy . (1.120) ∂x ∂y C F Damit dF (x, y) = P (x, y)dx + Q(x, y)dy ein vollst¨andiges Differenzial darstellt, also das Kurvenintegral auf der linken Seite von (1.120) verschwindet, muss die folgende Integrabilit¨ atsbedingung erf¨ ullt sein (siehe auch Anh. A.3.6) ∂P (x, y) ∂Q(x, y) = . ∂x ∂y
(1.121)
1.5 Orthogonale krummlinige Koordinaten Bei vielen praktischen Rechenproblemen ist es nicht sehr zielf¨ uhrend, Kartes’sche Koordinaten zu verwenden, vielmehr ist es zweckm¨aßig, an das Problem angepasste Koordinaten einzuf¨ uhren, welche die Symmetrien des Systems ber¨ ucksichtigen. Unter diesen angepassten Koordinaten spielen die krummlinigen Orthogonalkoordinaten eine besonders wichtige Rolle, da in ihnen die Probleme eine vergleichbar einfache Gestalt annehmen. Die neuen Koordinaten seien durch u1, u2 , u3 bezeichnet. Diese sind dann definiert, wenn wir den Zusammenhang mit den Kartes’schen Koordinaten herstellen, d. h. die Beziehungen x = x(u1 , u2 , u3 ) ;
y = y(u1 , u2 , u3 ) ;
z = z(u1 , u2 , u3 )
(1.122)
angeben. Dabei wollen wir uns auf solche Systeme beschr¨anken, f¨ ur welche die drei Scharen von Koordinatenfl¨ achen u1 = const., u2 = const. und u3 = const. aufeinander senkrecht stehen. In diesem Fall hat das elementare Wegelement oder Linienelement ds die Gestalt ds2 = h21 du21 + h22 du22 + h23 du23 ,
(1.123)
wo die Koeffizienten h1 , h2 und h3 Funktionen von u1 , u2 und u3 sein k¨onnen. Wir verlangen auch, dass das neue Koordinatensystem genauso wie das Kartes’sche ein rechtsh¨ andiges sein soll. Wir betrachten nun das infinitesimale Parallelepiped von Abb. 1.12, dessen Diagonale durch ds gegeben ist und dessen Koordinatenfl¨ achen durch u1 = const., u2 = const. und u3 = const. bestimmt sind. Die Kantenl¨ angen des Parallelepipeds sind dann ersichtlich h1 du1 , h2 du2 und h3 du3 . Nun betrachten wir eine skalare Funktion Φ(u1 , u2 , u3 ) und ein Vektorfeld A(u1 , u2 , u3 ) mit den Komponenten A1 , A2 , angs denen u1 , u2 und u3 anwachsen. Die und A3 in den drei Richtungen l¨
1.5 Orthogonale krummlinige Koordinaten
31
Abbildung 1.12. Krummlinige Orthogonalkoordinaten
u1 -Komponente des Gradienten von Φ k¨ onnen wir sogleich berechnen, denn nach ihrer Definition ist (gradΦ)1 = lim
du1 →0
1 ∂Φ Φ(A) − Φ(O) = h1 du1 h1 ∂u1
(1.124)
und es werden analoge Beziehungen f¨ ur die Richtungen 2 und 3 gelten. Um die Divergenz des Vektorfeldes A zu berechnen, wenden wir den Gauß’schen Satz auf das Parallelepiped an. Der Beitrag zum Oberfl¨achenintegral durch die Fl¨ ache OBHC bei Beachtung, dass die Fl¨achennormale nach außen gerichtet ist, ergibt zusammen mit dem entsprechenden Beitrag von der gegen¨ uberliegenden Fl¨ ache −A1 h2 h3 du2 du3 + A1 h2 h3 du2 du3 +
∂ (A1 h2 h3 )du2 du3 . ∂u1
(1.125)
Durch zyklische Vertauschung der Indices erh¨ alt man dann die Beitr¨age der restlichen Paare gegen¨ uberliegender Seiten des Parallelepipeds zum Oberfl¨ achenintegral. Wir erhalten daher bei Anwendung des Gauß’schen Satzes auf das Parallelepiped vom Abb. 1.12 lim divAdv = divA h1 h2 h3 du1 du2 du3 = A · df , (1.126) V →0
V
F
wobei die Beitr¨ age zum Oberfl¨ achenintegral durch drei Terme der Form (1.125) gegeben sind und daher der Ausdruck f¨ ur die Divergenz in krummlinigen Orthogonalkoordinaten die Gestalt hat ∂ ∂ ∂ 1 (A1 h2 h3 ) + (A2 h3 h1 ) + (A3 h1 h2 ) . (1.127) divA = h1 h2 h3 ∂u1 ∂u2 ∂u3
32
1 Vektoranalysis
Wenn insbesondere das Vektorfeld ein Gradientfeld ist, d. h. A = gradΦ, dann ergibt sich mithilfe von (1.124) div gradΦ = ΔΦ
1 ∂ h2 h3 ∂Φ h3 h1 ∂Φ h1 h2 ∂Φ ∂ ∂ = + + . h1 h2 h3 ∂u1 h1 ∂u1 ∂u2 h2 ∂u2 ∂u3 h3 ∂u3 (1.128) Ganz ¨ ahnlich erhalten wir die Komponenten der Rotation eines Vektorfeldes A mithilfe des Stokes’schen Satzes, angewandt zum Beispiel auf das Fl¨ achenelement OBHC von Abb. 1.12. Wir berechnen in Analogie zu un¨ seren Uberlegungen bei der Herleitung des Stokes’schen Satzes mithilfe von Abb. 1.10 und (1.68) das Linienintegral ∂ ∂ A · ds = (A3 h3 ) − (A2 h2 ) du2 du3 . (1.129) ∂u2 ∂u3 OBHC Aufgrund des Stokes’schen Satzes ist dies aber gleich der ersten Komponente von rotA, multipliziert mit der Fl¨ ache des Elementes OBHC, also ∂ ∂ (A3 h3 ) − (A2 h2 ) du2 du3 . (1.130) (rotA)1 h2 h3 du2 du3 = ∂u2 ∂u3 Daraus lassen sich durch zyklische Vertauschung der Indices 1, 2 und 3 die beiden anderen Komponenten von rotA finden. F¨ uhrt man l¨angs der Richtungen 1, 2 und 3 die Einheitsvektoren e1 , e2 , e3 ein, so kann man das Resultat a¨hnlich wie in Kartes’schen Koordinaten durch eine Determinante darstellen h 1 e1 h 2 e2 h 3 e3 ∂ 1 ∂ ∂ (1.131) rotA = ∂u1 ∂u2 ∂u3 . h1 h2 h3 h1 A1 h2 A2 h3 A3 Ersichtlich ergibt sich daraus der Ausdruck in Kartes’schen Koordinaten, wenn man setzt h1 = h2 = h3 und ui = xi (i = 1, 2, 3). Im Folgenden wenden wir die obigen allgemeinen Formeln auf die speziellen F¨alle der Zylinderund Kugelkoordinaten an, da viele Probleme der Physik durch ein zylinderoder kugelsymmetrisches System approximiert werden kann. 1.5.1 Zylinderkoordinaten In diesem Fall wird die Lage eines Punktes im Raum durch die Zylinderkoordinaten beschrieben, die mit den Kartes’schen Koordinaten in folgendem einfachen Zusammenhang stehen (vgl. Abb. 1.13) x = ρ cos ϕ, y = ρ sin ϕ, z = z .
(1.132)
1.5 Orthogonale krummlinige Koordinaten
33
Abbildung 1.13. Zylinderkoordinaten
Daher ist dx =
∂x ∂x dρ + dϕ = cos ϕdρ − ρ sin ϕdϕ ∂ρ ∂ϕ
(1.133)
und analog dy = sin ϕdρ + ρ cos ϕdϕ, dz = dz .
(1.134)
Damit erhalten wir f¨ ur das Linienelement ds2 = dρ2 + ρ2 dϕ2 + dz 2 ,
(1.135)
woraus wir ablesen k¨ onnen u 1 = ρ h1 = 1 u 2 = ϕ h2 = ρ . u 3 = z h3 = 1
(1.136)
Daher erhalten wir der Reihe nach mithilfe von (1.124), (1.127), (1.128) und (1.131) ∂Φ 1 ∂Φ ∂Φ gradΦ = e1 + e2 + e3 , ∂ρ ρ ∂ϕ ∂z 1 ∂(ρA1 ) ∂A2 ∂A3 divA = + +ρ , ρ ∂ρ ∂ϕ ∂z 1 ∂2Φ ∂2Φ 1 ∂ ∂Φ (ρ ) + +ρ 2 ΔΦ = ρ ∂ρ ∂ρ ρ ∂ϕ2 ∂z
(1.137) (1.138) (1.139)
34
und
1 Vektoranalysis
e1 e 2 e 3 1 ∂ ∂ ∂ rotA = ∂ρ ∂ϕ ∂z . ρ A1 ρA2 A3
(1.140)
1.5.2 Kugelkoordinaten Im Fall der Kugelkoordinaten lautet der Zusammenhang mit den Kartes’schen Koordinaten (vgl. Abb. 1.14) x = r sin ϑ cos ϕ ,
y = r sin ϑ sin ϕ ,
z = r cos ϑ
(1.141)
und wir erhalten wie oben durch ausdifferenzieren die Differenziale f¨ ur dx, dy, dz als Funktion von ρ, ϑ, ϕ mit denen man f¨ ur das Linienelement erh¨ alt (1.142) ds2 = dr2 + r2 dϑ2 + r2 sin2 ϑdϕ2 , ¨ wie der Leser als Ubung selbst nachpr¨ ufen m¨oge. Daher ist f¨ ur dieses orthogonale Koordinatensystem u1 = r u2 = ϑ
h1 = 1 h2 = r
u3 = ϕ
h3 = r sin ϑ
Abbildung 1.14. Kugelkoordinaten
(1.143)
1.6 Tensoren
35
und wir finden wieder aus den Beziehungen (1.124), (1.127), 1.128) und (1.131) ∂Φ 1 ∂Φ 1 ∂Φ + e2 + e3 , (1.144) ∂r r ∂ϑ r sin ϑ ∂ϕ ∂A3 1 ∂(r2 A1 ) ∂(sin ϑA2 ) + +r divA = 2 sin ϑ , (1.145) r sin ϑ ∂r ∂ϑ ∂ϕ
∂Φ 1 ∂ ∂ ∂Φ 1 ∂ 2Φ (1.146) ΔΦ = 2 sin ϑ r2 + sin ϑ + r sin ϑ ∂r ∂r ∂ϑ ∂ϑ sin ϑ ∂ϕ2
gradΦ = e1
und e1 e 2 e3 ∂ ∂ 1 ∂ . rotA = 2 ∂r ∂ϑ ∂ϕ r sin ϑ A1 rA2 r sin ϑA3
(1.147)
1.6 Tensoren Die Tensorrechnung ist eine Verallgemeinerung der Vektorrechnung. Im einfachsten Fall stellt ein Tensor eine lineare Beziehung zwischen den Komponenten zweier Vektoren her. Doch gibt es neben solchen einfachen algebraischen Tensoroperationen auch die allgemeineren Tensor Differenzial- und Integraloperationen. Wir wollen uns hier nur mit den einfachen Kartes’schen Tensoren besch¨ aftigen, die im dreidimensionalen Kartes’schen Raum definiert sind. Verallgemeinerungen auf den vierdimensionalen Raum der r¨aumlichen und zeitlichen Koordinaten, wie sie zur Beschreibung der Vorg¨ange in der allgemeinen Relativit¨ atstheorie verwendet werden, sollen hier nicht diskutiert werden, da in den meisten Grundvorlesungen aus theoretischer Physik, dieses Gebiet nicht eingehend behandelt wird und die hier erw¨ahnten S¨atze der Tensorrechnung f¨ ur die Beschreibung der speziellen Relativit¨atstheorie ausreichen sollten. In der klassischen theoretischen Physik treten die Tensoren haupts¨ achlich in der Mechanik, der Elastizit¨atstheorie, der Elektrodynamik und der Optik auf und wir werden einige Beispiele aus diesen Gebieten anf¨ uhren. 1.6.1 Andere Definition eines Vektors Am Beginn dieses Kapitels haben wir einen Vektor als eine Gr¨oße definiert, die durch Betrag und Richtung im Raum definiert ist. Eine andere Definition besteht nun darin, dass man angibt, wie sich die Komponenten eines Vektors andern, wenn man eine beliebige Rotation des Kartes’schen Achsenkreuzes ¨ durchf¨ uhrt und so von einem Koordinatensystem K zu einem neuen System K u ¨ bergeht. Wenn wir die alten Koordinaten eines Ortsvektors mit xi und
36
1 Vektoranalysis
seine neuen mit xi bezeichnen, dann wird zwischen ihnen folgender linearer Zusammenhang bestehen x1 = a11 x1 + a12 x2 + a13 x3 x2 = a21 x1 + a22 x2 + a33 x3 , x3 = a31 x1 + a32 x2 + a33 x3
(1.148)
wobei die Koeffizienten ai j (i, j = 1, 2, 3) durch die Projektionen der neuen Basisvektoren (e1 , e2 , e3 ) auf die alten Basisvektoren (e1 , e2 , e3 ) gegeben sind, also ai j = cos(ei , ej ). Das Gleichungssystem (1.148) k¨onnen wir auch in ¨ aquivalenter Weise in Matrixform anschreiben (siehe Anh. B) ⎛ ⎞ ⎛ ⎞⎛ ⎞ x1 a11 a12 a13 x1 ⎝ x2 ⎠ = ⎝ a21 a22 a23 ⎠ ⎝ x2 ⎠ , (1.149) x3 a31 a32 a33 x3 wobei auf der rechten Seite dieser Gleichung die Zeilen der Matrix mit dem Spaltenvektor zu multiplizieren sind. Wir haben also die M¨oglichkeit, einen Vektor durch seine Komponenten in Form einer Matrix mit einer Spalte darzustellen. Die letzten beiden Beziehungen k¨onnen wir aber mithilfe der Einstein’schen Summenkonvention (siehe (1.7)) eleganter in folgende Form zusammenfassen xi = ai j xj , (1.150) wo (i, j = 1, 2, 3) ist. Bei der soeben betrachteten linearen Transformation wird sich aber die L¨ ange eines Ortsvektors nicht ¨andern, da bei einer beliebigen Rotation des Koordinatensystems, der Abstand vom Ursprung O zu einem Punkt P im Raum derselbe bleiben wird. Also muss zwischen den alten und neuen Koordinaten des Ortsvektors die Beziehung bestehen 2 2 2 2 2 x2 1 + x2 + x3 = x1 + x2 + x3
(1.151)
oder, wenn wir auf der linken Seite die Transformation (1.150) anwenden, muss gelten (1.152) xi xi = ai j ai k xj xk = xj xk δj k = xj j , woraus wir schließen, dass die Koeffizienten ai j der Transformationsmatrix der folgenden Bedingung gen¨ ugen m¨ ussen ai j ai k = δ j k .
(1.153)
Dies ist die charakteristische Eigenschaft der Koeffizienten einer orthogonalen Transformation, bei der die L¨ ange eines Ortsvektors unver¨andert bleibt. Schließlich finden wir noch die Koeffizienten der Umkehrtransformation f¨ ur ¨ den Ubergang von den neuen zu den alten Koordinaten, also xi = bi j xj = bi j aj k xk = δik xk ,
(1.154)
1.6 Tensoren
37
woraus wir schließen, dass b i j aj k = δ i k
(1.155)
sein muss und folglich bei Vergleich mit (1.153) die Matrixelemente der Umkehrtransformation durch (1.156) b i j = aj i gegeben sein m¨ ussen. Dies bedeutet, dass in der Matrix der Umkehrtransformation die Zeilen und Spalten der Ausgangstransformation miteinander vertauscht sind. Wenn wir daher die Matrix der Koeffizienten ai k mit a bezeichnen und jene der Koeffizienten bi k mit b benennen, so gilt daher b = aT ,
(1.157)
wo aT die transponierte Matrix von a genannt wird. Dieser Zusammenhang ist charakteristisch f¨ ur eine orthogonale Transformation. Wenn wir den Ortsvektor mit den Komponenten xi mit der Spaltenmatrix x bezeichnen und den transformierten Vektor mit x , dann kann die Transformation (1.150) und ihre Umkehrtransformation in folgender Form geschrieben werden x = ax , x = aT x .
(1.158)
Wenn wir schließlich die Matrix mit den Elementen δi j des KroneckerSymbols mit I bezeichnen, dann k¨ onnen wir die Beziehung (1.153) zwischen den Koeffizienten der Transformationsmatrix in die Matrixgestalt bringen a aT = a T a = I ,
(1.159)
wobei die Einheitsmatrix I mit a und aT kommutiert, d. h. ihre Reihenfolge der Anwendung vertauscht werden kann. I hat auf der Hauptdiagonale lauter Einser stehen und alle anderen Matrixelemente sind Null, wie es das Kronecker-Symbol angibt. Da im allgemeinen die Multiplikation von Matrizen nicht kommutativ ist, kommt es bei der Aufeinanderfolge zweier orthogonaler Transformationen auf die Reihenfolge der zur Ausf¨ uhrung gelangenden Transformationen an. Ferner ist das Matrixprodukt zweier orthogonaler Transformationen wiederum eine orthogonale Transformation und es gibt die Einheitsmatrix I als die Einheitstransformation bei der nichts geschieht. Schließlich gibt es zu jeder Transformation die entsprechende Umkehrtransformation. Ein System von Elementen, welche diese Eigenschaft besitzen bilden eine Gruppe. Diese Gruppe der orthogonalen Transformationen spielt in der Physik eine wichtige Rolle, doch k¨ onnen wir sie hier nicht behandeln. Wir definieren nun einen Kartes’schen Vektor durch die Eigenschaft, dass sich seine Komponenten bei einer orthogonalen Transformation genau so transformieren, wie jene eines Ortsvektors. Wenn also A ein beliebiger Vektor ur seine transformierten Komponenmit den Komponenten Ai ist, dann gilt f¨ ten Ai Ai = ai k Ak . (1.160)
38
1 Vektoranalysis
Wenn C eine skalare Gr¨ oße ist, bleibt sie bei einer orthogonalen Transformation unver¨ andert, d. h. sie ist eine Invariante gegen¨ uber solchen Transformationen. So ist ebenso wie die L¨ ange eines Ortsvektors x auch die L¨ange eines beliebigen Vektors A eine Invariante, denn Ai Ai = ai k ai l Ak Al = δk l Ak Al = Ak Ak .
(1.161)
Allgemeiner gilt dies auch f¨ ur das Skalarprodukt zweier Vektoren A und B, also Ai Bi = Ak Bk , wovon sich der Leser selbst u ¨ berzeugen m¨oge. Beispiele 1. Drehung um die z-Achse: Der elementarste Fall einer orthogonalen Transformation ist zum Beispiel die Drehung des Koordinatensystems um die zAchse, wie in Abb. 1.15 gezeigt. Aus dieser Abbildung lesen wir folgendes Transformationsgesetz ab x = x cos ϕ + y sin ϕ y = −x sin ϕ + y cos ϕ z = z ,
(1.162)
welches sich in Matrixschreibweise auf folgende Gestalt bringen l¨asst ⎛ ⎞ ⎛ ⎞⎛ ⎞ x1 cos ϕ sin ϕ 0 x1 ⎝ x2 ⎠ = ⎝ − sin ϕ cos ϕ 0 ⎠ ⎝ x2 ⎠ (1.163) x3 x3 0 0 1 ¨ und die wir f¨ ur die folgenden Uberlegungen abgek¨ urzt in der Form schreiben wollen X = aϕ X. Man kann sich dann durch explizite Ausmultiplikation leicht zeigen, dass in der Tat aϕ aTϕ = I ist.
Abbildung 1.15. Drehung des Koordinatensystems
1.6 Tensoren
39
2. Die Euler’schen Winkel Bei der Untersuchung der Bewegung eines starren K¨ orpers, der in einem Punkt festgehalten wird (zum Beispiel der momentane Auflagepunkt eines Kinderkreisels) ist es zweckm¨aßig, neben dem raumfesten uhren. Koordinatensystem X ein k¨ orperfestes Koordinatensystems X einzuf¨ Der Zusammenhang zwischen diesen beiden Koordinatensystemen wird durch die Aufeinanderfolge dreier Rotationen der Koordinatenachsen herbeigef¨ uhrt, die durch die Euler’schen Winkel ϕ, ϑ, ψ bestimmt sind (vgl. Abb. 1.16). Gem¨ aß der Abbildung erfolgt zun¨ achst eine Rotation um die raumfeste zAchse um den Winkel ϕ . Dies liefert die Rotationsmatrix aϕ . Danach wird uhrt, dargestellt um die neue x -Achse eine Rotation um den Winkel ϑ ausgef¨ durch die Rotationsmatrix aϑ und schließlich erfolgt eine Rotation um den Winkel ψ um die z -Achse mit der Rotationsmatrix aψ , um so schließlich das k¨ orperfeste Koordinatensystem X zu erreichen. Also gilt f¨ ur diese Transformation X = aψ aϑ aϕ X oder explizit ausgeschrieben unter Heranziehung der Schreibweise von Beispiel (1) ⎛ ⎞ ⎛ ⎞⎛ ⎞ cos ψ sin ψ 0 x1 1 0 0 ⎝ x2 ⎠ = ⎝ − sin ψ cos ψ 0 ⎠ ⎝ 0 cos ϑ sin ϑ ⎠ x3 0 0 1 0 − sin ϑ cos ϑ ⎛ ⎞⎛ ⎞ cos ϕ sin ϕ 0 x1 (1.164) × ⎝ − sin ϕ cos ϕ 0 ⎠ ⎝ x2 ⎠ . x3 0 0 1 Die sukzessive Ausrechnung der Matrixmultiplikationen ist etwas aufwendig ¨ aber nicht kompliziert und soll dem Leser als Ubung u ¨ berlassen werden.
Abbildung 1.16. Euler’sche Winkel
40
1 Vektoranalysis
1.6.2 Definition eines Tensors Wir betrachten die Produkte aller Komponenten zweier Vektoren A und B untereinander und f¨ uhren eine orthogonale Transformation des Koordinatensystems durch. Dann erhalten wir Ai Bj = ai k aj l Ak Al
(1.165)
und wir definieren einen Kartes’schen Tensor zweiter Stufe Tij durch die Vorschrift, dass er sich nach diesem Gesetz transformieren m¨oge, d. h. Ti j = ai k aj l Tk l .
(1.166)
¨ Eine solche Transformation nennen wir eine Ahnlichkeitstransformation, denn der transformierte Tensor hat dieselben Eigenschaften wie der urspr¨ ungliche. Dieses Transformationsgesetz k¨onnen wir auch in Matrixform schreiben und erhalten mit der bereits eingef¨ uhrten Bezeichnungsweise T = aT aT .
(1.167)
Die Summe der Diagonalelemente eines Tensors nennt man die ,,Spur“ des Tensors SpT = Tii = inv. (1.168) Diese Spur ist eine Invariante ebenso wie das Skalarprodukt zweier Vektoren. Wenn wir einen Tensor T skalar mit einem Vektor A multiplizieren, so erhalten wir einen Vektor B, d. h. Bi = Ti k Ak ,
(1.169)
doch ist das Resultat abh¨ angig davon, u ¨ ber welchen Index summiert wird. Also ist im allgemeinen Ti k Ak = Ak Tk i . Man nennt den betrachteten Rechenvorgang ,,Verj¨ ungung“ eines Tensors, wodurch seine Stufe um eins erniedrigt wird. Somit ist klar, dass die zweifache Verj¨ ungung des obigen Tensors mit den Vektoren A und B auf eine skalare Invariante f¨ uhren wird. Ein Tensor heißt symmetrisch, wenn Ti j = Tj i ist und ein Tensor heißt schiefsymmetrisch, wenn Ti j = −Tj i ist. Demnach verschwinden alle Diagonalelemente eines schiefsymmetrischen Tensors, da Ti i = −Ti i = 0 ist. Ferner kann ein symmetrischer Tensor nur sechs voneinander unabh¨angige Elemente haben und ein schiefsymmetrischer Tensor nur drei, wie man sich leicht u ¨berzeugt. Im allgemeinen ist ein Tensor weder symmetrisch noch schiefsymmetrisch, doch kann man jeden Tensor in eine symmetrische und eine schiefsymmetrische Komponente zerlegen, denn wir brauchen nur zu setzen Ti k =
1 1 (Ti k + Tk i ) + (Ti k − Tk i ) 2 2
(1.170)
und erkennen sofort, dass die beiden Komponenten die gew¨ unschte Eigenschaft haben.
1.6 Tensoren
41
1.6.3 Diagonalisierung eines Tensors F¨ ur die praktische Anwendung der Tensorrechnung ist es sehr n¨ utzlich zu wis¨ sen, dass durch eine passende Ahnlichkeitstransformation jeder symmetrische Tensor auf Diagonalform gebracht werden kann. Darunter ist zu verstehen, dass die Matrix des transformierten Tensors nur auf der Hauptdiagonale von Null verschiedene Elemente hat, w¨ ahrend alle anderen Elemente Null sind. Die Elemente auf der Hauptdiagonale nennt man die Eigenwerte des Tensors. Gelegentlich nennt man die Diagonalisierung eines symmetrischen Tensors auch eine Hauptachsentransformation. Dieser Ausdruck ist der Theorie der Kegelschnitte entnommen und wir werden auf diesen Zusammenhang noch zur¨ uckkommen. Wir suchen also jene orthogonale Transformation, die bewirkt, dass der transformierte Tensor die Gestalt hat (siehe Anh. B.3.2) Tij = λi δi j ,
(1.171)
wo λi die gesuchten Eigenwerte sind. Wenn wir das Transformationsgesetz (1.166) f¨ ur den Tensor heranziehen, k¨ onnen wir den letzten Ausdruck auf folgende Form bringen (1.172) ai k aj l Tk l = λi δi j . Nun multiplizieren wir diese Gleichung mit ai m und summieren u ¨ ber den Index i. Dann erhalten wir mithilfe der Orthogonalit¨atsrelation (1.155) (ai m ai k )aj l Tk l = δm k aj l Tk l = aj l Tm l = λi ai m δi j = λj aj m = λj aj l δm l .
(1.173)
Wenn wir hier den dritten und den letzten Term zusammenfassen und auf eine Seite bringen, erhalten wir die Gleichung (Tm l − λj δm l )aj l = 0 .
(1.174)
Dies ist ein homogenes, lineares Gleichungssystem zur Bestimmung der Koeffizienten aj l jener orthogonalen Transformation, die es gestattet, den Tensor T auf Diagonalform zu bringen. In Matrixform l¨asst sich dieses Gleichungssystem in folgender Weise ausdr¨ ucken ⎞⎛ ⎞ ⎛ T13 aj1 T11 − λj T12 ⎝ T21 T22 − λj T23 ⎠ ⎝ aj2 ⎠ = 0 , (1.175) T31 T32 T33 − λj aj3 wo j = 1, 2, 3 ist. Dieses Gleichungssystem hat nur dann eine nichttriviale L¨ osung, wenn die Determinante der Koeffizienten verschwindet, also T11 − λj T12 T13 T21 T22 − λj T23 = 0 (1.176) T31 T32 T33 − λj
42
1 Vektoranalysis
ist. Die Ausrechnung dieser Determinante, die gelegentlich S¨akulardeterminante genannt wird, liefert eine algebraische Gleichung dritten Grades, deren gesuchte Wurzeln λ1 , λ2 , λ3 im allgemeinen voneinander verschieden sind. Sind zwei oder alle Eigenwerte λj einander gleich, so spricht man von Entartung des Eigenwertproblems. Zu jeder Wurzel λj erhalten wir eine L¨osung des homogenen Gleichungssystems (1.175) in der Form eines Spaltenvektors. Diese Vektoren werden die zugeh¨ origen Eigenvektoren des Problems genannt. Diese Eigenvektoren bilden gleichzeitig die Spaltenvektoren der gesuchten orthogonalen Transformation. Bei der Diskussion des unit¨aren Vektorraumes und des Funktionenraumes in Kap. 3 werden wir von den hier angestellten ¨ Uberlegungen eingehend Gebrauch machen, denn eine Vielfalt physikalischer Problemstellungen f¨ uhrt auf die L¨ osung von Eigenwertproblemen. Beispiel Der Tr¨agheitstensor eines starren K¨orpers Wir betrachten einen starren K¨ orper, der in einem Punkt O festgehalten wird. Zu einem bestimmten Zeitpunkt kann der K¨ orper mit der Winkelgeschwindigkeit ω = ϕ˙ um eine instantane Achse durch O rotieren, wobei wir bereits diskutiert haben, dass diese Winkelgeschwindigkeit ein axialer Vektor ist. Jeder Punkt P im starren K¨ orper rotiert dann um diese Achse auf einem Kreis mit einer Geschwindigkeit v = r˙ = ω × r , (1.177) wie in Abb. 1.17 angedeutet. Der Drehimpuls eines einzelnen Massenpunktes des starren K¨ orpers ist dann l = r × mv = mr × (ω × r) und wenn wir den starren K¨ orper durch eine kontinuierliche Massenverteilung der Massendichte μ beschreiben, erhalten wir den Gesamtdrehimpuls des starren K¨orpers, indem wir l u ¨ ber die gesamte Massenverteilung integrieren, also (1.178) L = ldτ = μ[r × (ω × r)]dτ = μ[r2 ω − (r · ω)r]dτ . Wenn wir nun in Bezug auf O ein ortsfestes Kartes’sches Koordinatensystem w¨ ahlen und die Vektoren L, r und ω in ihre Komponenten zerlegen, erhalten wir nach Integration u ¨ ber den Ortsvektor r eine lineare Vektorbeziehung zwischen L und ω, die wir in Form einer Matrixgleichung darstellen k¨onnen ⎛ ⎞ ⎛ ⎞⎛ ⎞ L1 I11 I12 I13 ω1 ⎝ L2 ⎠ = ⎝ I21 I22 I23 ⎠ ⎝ ω2 ⎠ , (1.179) L3 I31 I32 I33 ω3 in welcher die Komponenten des sogenannten Tr¨agheitstensors durch folgende Ausdr¨ ucke definiert sind (1.180) Ii i = μ(x2j + x2k )dτ , Ii j = − μxi xj dτ = Ij i ,
1.6 Tensoren
43
Abbildung 1.17. Der Tr¨ agheitstensor
wobei im ersten Integral die Indizes i, j, k zyklisch die Werte 1, 2, 3 durchlaufen und im zweiten Fall i = j alle Werte von 1 bis 3 annehmen k¨onnen. agheitsmomente des starren K¨orpers und Die Ausdr¨ ucke Ii i heißen die Tr¨ die Ii j werden die Deviationsmomente genannt. Wie man sieht, ist der Tr¨ agheitstensor ein symmetrischer Tensor. Nun wird in der Mechanik gezeigt, dass die kinetische Energie der Rotation durch den Ausdruck TR = 12 Li ωi gegeben ist. Verwendet man zur Berechnung des Skalarproduktes die in (1.179) gegebenen Komponenten des Drehimpulses, so findet man folgende homogene quadratische Form in den Komponenten der Winkelgeschwindigkeit 1 I11 ω12 + I22 ω22 + I33 ω32 + 2I12 ω1 ω2 + 2I23 ω2 ω3 + 2I31 ω3 ω1 . 2 (1.181) Nun haben wir bereits gesehen, dass es zweckm¨aßig ist, neben dem raumfesten ein k¨ orperfestes Koordinatensystem einzuf¨ uhren, da in Bezug auf dieses System sich die Tr¨ agheits- und Deviationsmomente im Laufe der Bewegung ¨ des starren K¨ orpers nicht a zwischen beiden Sys¨ndern werden. Der Ubergang temen erfolgt durch Einf¨ uhrung der Euler’schen Winkel. Die Winkel dieser Koordinatentransformation k¨ onnen nun so gew¨ahlt werden, dass im neuen Koordinatensystem die Deviationsmomente stets gleich Null sind, d. h. wir k¨ onnen den Tr¨ agheitstensor diagonalisieren. In diesem neuen Koordinatensystem, dessen Achsen die Hauptachsen genannt werden, wird die Rotation des starren K¨ orpers um eine dieser Achsen L = Iω sein. Wir haben also, wie bereits allgemein diskutiert, folgendes Eigenwertproblem zu l¨osen, um die Haupttr¨ agheitsmomente I1 , I2 , I3 zu finden ⎞⎛ ⎞ ⎛ I13 ω1 I11 − I I12 ⎠ ⎝ ω2 ⎠ = 0 . ⎝ I21 I22 − I I23 (1.182) I31 I32 I33 − I ω3 TR =
44
1 Vektoranalysis
Durch Nullsetzen der Determinante der Koeffizienten erhalten wir eine kubische Gleichung, die im Fall des starren K¨orpers drei positive Wurzeln I1 , I2 , I3 hat. Wenn ein starrer K¨ orper Rotationssymmetrie besitzt, dann ist die entsprechende Symmetrieachse stets eine Hauptachse. Wenn wir die Drehimpulse und Winkelgeschwindigkeiten in Bezug auf die Hauptachsen mit L1 , L2 , L3 und ω1 , ω2 , ω3 bezeichnen, dann gilt Li = Ii ωi und wir erhalten f¨ ur die kinetische Energie der Rotation TR =
1 I1 ω12 + I2 ω22 + I3 ω32 . 2
(1.183)
Schließlich f¨ uhren wir einen Einheitsvektor n in Richtung der Winkelgeschwindigkeit ω ein und k¨ onnen dann setzen ω = ωn = ω(ni ei ), wo die ei die Einheitsvektoren in Richtung der Hauptachsen sind. Dann k¨onnen wir die kinetische Energie der Rotation auf die Gestalt bringen 1 1 1 (Ii ωi2 ) = ω 2 (Ii n2i ) = ω 2 I , 2 2 2
(1.184)
wo wir Ii n2i = I getauft haben. Jetzt definieren wir einen neuen Vektor ω e X = ωi√Ii , dessen Komponenten wir auf der linke Seite von (1.184) einset2
zen, nachdem wir die Gleichung durch ω2 I dividiert haben. Dies liefert die Gleichung des Tr¨ agheitsellipsoids in Bezug auf die Hauptachsen I1 X12 + I2 X22 + I3 X32 = 1 .
(1.185)
1.6.4 Differenzial- und Integraloperationen Eine eingehende Diskussion der Tensoranalysis w¨ urde uns hier zu weit f¨ uhren. Sie ist vor allem f¨ ur die allgemeine Relativit¨ atstheorie von Interesse, wie eingangs angef¨ uhrt. Doch die Angabe einfacher Differenzial- und Integraloperationen f¨ ur Kartes’sche Tensoren ist f¨ ur einfache Anwendungen von Nutzen. Wir beginnen mit dem Nachweis, dass der Gradientoperator mit unserer Definition eines Vektors u ¨bereinstimmt. Dazu gehen wir von einer skalaren Funktion Φ(r) aus und betrachten die Komponenten des Gradienten dieser Funktion bei Ausf¨ uhrung einer orthogonalen Transformation, die von den urspr¨ unglichen Koordinaten xi zu den neuen Koordinaten xi f¨ uhrt. Mit der Kettenregel f¨ ur die partielle Differenziation (A.4) erhalten wir wegen des Transformationsgesetzes (1.154,1.156) ∂Φ ∂Φ ∂Φ ∂Φ ∂xj = = bj i = ai j . ∂xi ∂xj ∂xi ∂xj ∂xj
(1.186)
Da aber Φ(r) = Φ(r ) eine skalare Invariante ist, gilt f¨ ur die Komponenten des Gradientoperators das Transformationsgesetz eines Vektors ∂ ∂ = ai j . ∂xi ∂xj
(1.187)
1.6 Tensoren
45
Wenn wir daher auf ein Vektorfeld A(r) mit den Komponenten Aj den Gradientoperator anwenden, haben wir zwei M¨ oglichkeiten: entweder wir verj¨ ungen u ¨ber den Index j, dann erhalten wir die uns bereits bekannte Divergenz von A, oder wir erhalten einen Tensor zweiter Stufe Ti j =
∂ Aj = Aj, i , ∂xi
(1.188)
wo zur Vereinfachung der Schreibweise die Differenziation durch ein Komma angedeutet wird. Analog erhalten wir entsprechend durch Anwendung des Gradientoperators auf einen Tensor zweiter Stufe Ti j entweder die Tensordivergenz ∂ Aj = Ti j , (1.189) ∂xi also ein Vektorfeld, wenn wir u ungen, oder ohne Verj¨ un¨ ber den Index i verj¨ gung einen Tensor dritter Stufe Ri j k = Ti j, k .
(1.190)
Bei der Berechnung der Tensordivergenz kommt es im allgemeinen darauf an, u ungen, es sei denn, der Tensor ist symmetrisch. ¨ber welchen Index wir verj¨ Bei Verallgemeinerung des Gauß’schen Satzes f¨ ur ein Vektorfeld k¨onnen wir auch sofort den Gauß’schen Satz f¨ ur ein Tensorfeld angeben ∂ Ti j dv = Ti j ni df , (1.191) V ∂xi F wobei das vektorielle Oberfl¨ achenelement df in Komponentenform gegeben onnen wir auch in Analogie zur ist durch df = ndf = (ni ei )df . Schließlich k¨ Rotation eines Vektorfeldes, die Rotation eines Tensorfeldes definieren und so ein axiales Tensorfeld erhalten, das auch Pseudotensor genannt wird. Dazu verwenden wir das Permutationssymbol εi j k (1.12) und setzen Pi l = εi j k
∂ Tk l ∂xj
und es gilt dann der Stokes’sche Integralsatz in der Form Pi l ni df = Tk l dsk . F
(1.192)
(1.193)
C
Mit diesen kurzen Bemerkungen zur Tensoranalysis im Kartes’schen Raum wollen wir das gegenw¨ artige Kapitel verlassen und uns einem neuen Thema zuwenden. ¨ Ubungsaufgaben ¨ Es wird dem Leser dringend empfohlen, die folgenden Ubungen durchzuarbeiten, um sich mit dem Stoff dieses Kapitels besser vertraut zu machen.
46
1 Vektoranalysis
1. Wenn man beide Seite der Gleichung A = B − C quadriert und das Resultat geometrisch interpretiert, kann man den Cosinus-Satz der ebenen Geometrie beweisen. 2. Wenn A = i cos α + j sin α und B = i cos β + j sin β Einheitsvektoren in der (x, y)-Ebene sind, die mit der x-Achse die Winkel α bzw. β einschließen, so leite man mithilfe des Skalarproduktes die Formel f¨ ur cos(α − β) her. 3. Wenn A ein konstanter Vektor und r ein Ortsvektor zu einem Punkt P , so zeige, dass (r − A) · r = 0 die Gleichung einer Kugel ist. 4. Beweise den Sinus-Satz der ebenen Geometrie mithilfe des Vektorproduktes von A − C = B. 5. Sind A, B, C Vektoren vom Ursprung zu den Punkten A, B, C , so zeige, dass der Vektor A × B + B × C + C × A senkrecht auf der Ebene ABC steht. 6. Gegeben sei die skalare Funktion Φ = αi j xi xj , wo αi j konstante Koeffizienten sind. Zeige, dass die Komponenten des Gradienten durch ∂Φ ∂xk = (αk i + αi k )xi gegeben sind. 7. Zeige, dass das Permutationssymbol sich in der Form εi j k = ei (ej × ek ) darstellen l¨ asst. 8. Zeige mithilfe von Aufgabe 7, dass man setzen kann C = A × B = Ai Bj εk j i ek . 9. Zeige analog, dass (A × B) · C = εi j k Ai Bj Ck dargestellt werden kann. 10. Beweise mit den vorhergehenden S¨ atzen, dass (ei × ej ) · (ek × el ) = εi j m εk l m ist. 11. Zeige schließlich, dass gilt εi j m εk l m = δi k δj l − δi l δj k . 12. Zeige, dass div( rr3 ) = 0 ist, daher Δ 1r = 0 und rotr = 0 sind und schließlich (A · ∇)r = A gilt. ˙ 13. Zeige zun¨ achst, dass ∇r = rr ist und beweise damit divA(r) = A·r r , wobei der Punkt die totale Ableitung des Vektorfeldes A nach r bedeutet. ˙ 14. Zeige analog, dass rotA(r) = r×rA ist und rot[Φ(r)r] = 0 gilt. 15. Zeige, dass ∇(A·r) = A ist, wenn A ein konstanter Vektor, und verwende ˙ daraus dieses Resultat, um zu zeigen, dass ∇(A(r) · r) = A + rr (r · A) folgt. ˙ ˙ ¨ 16. Mit analogen Uberlegungen finde, dass div[Φ(r)A(r)] = Φr (r·A)+ Φr (r·A) ˙ Φ Φ ˙ ist und dass gilt rot[Φ(r)A(r)] = r (r × A) + r (r × A). 17. Die Quellenfreiheit des magnetischen Induktionsfeldes B wird durch die Beziehung divB = 0 charakterisiert. Warum kann man dann ein neues Vektorpotenzial A(r, t) einf¨ uhren und B = rotA setzen? Mache diese Substitution im Faraday’schen Induktionsgesetz und zeige, dass dann E = −gradΦ − γ A˙ ist, wo ein skalares Potenzial Φ(r, t) eingef¨ uhrt werden kann. Beachte, dass bei dieser Rechnung eine Gr¨oße aufscheint, deren Rotation verschwindet. 18. Setze B = rotA in jene Maxwell’sche Gleichung ein, die das Oersted’sche Experiment wiedergibt, und vernachl¨ assige den Maxwell’schen Verschie-
1.6 Tensoren
47
bungsstrom. Zeige, dass dann mit der Nebenbedingung divA = 0 das Vektorpotenzial der Poisson’schen Differenzialgleichung ΔA = −γj gen¨ ugt. 19. Aus der Grundvorlesung in Physik ist dem Leser sicher die Beziehung zwischen Spannung, Stromst¨ arke und Widerstand in einem Leiter gel¨aufig, d. h. U = I R. Nun ist aber U = E , wo E die elektrische Feldst¨arke im Leiter und die L¨ ange des Leiterst¨ ucks darstellt. Ferner ist I = q j, wo q der Querschnitt des Leiters und j die Stromdichte im Leiter ist. Schließ , wo λ die spezifische lich ist der Widerstand des Leiterst¨ ucks R = qλ Leitf¨ ahigkeit des Leiters bezeichnet. Setzt man obige Ausdr¨ ucke in das Ohmsche Gesetz ein, erh¨ alt man seine differenzielle Form j = λE. Damit leite, unter Vernachl¨ assigung des Verschiebungsstromes, aus den beiden Maxwell’schen Gleichungen f¨ ur rotE und rotB die Differenzialgleichung 2 f¨ ur das elektrische Feld im Leiter, ΔE − βγλ ∂∂tE 2 = 0 ab. 20. F¨ uhre, bei Beibehaltung des Maxwell’schen Verschiebungsstromes, in die obigen beiden Maxwell’schen Gleichungen das Vektorpotenzial A und das skalare Potenzial Φ ein und leite, unter Ber¨ ucksichtigung der Neur das Vektorpotenzial die inhomogene benbedingung divA + αβ Φ˙ = 0, f¨ 2 ,,d’Alembert’sche Wellengleichung“ ΔA − c12 ∂∂tA 2 = −βj ab.
2 Komplexe Zahlen und Dirac’s δ-Funktion
2.1 Einleitung Obgleich die physikalisch messbaren Gr¨ oßen reelle Parameter sind, ist es dennoch von Nutzen, zur Beschreibung physikalischer Prozesse die Methoden der komplexen Analysis heranzuziehen, da in vielen F¨allen sich das gew¨ unschte Resultat weitaus einfacher auf dem Wege u ¨ ber die komplexen Funktionen erreichen l¨ asst. Da wir in den folgenden Kapiteln nur die Kenntnisse der elementaren Rechenregeln f¨ ur komplexe Zahlen und Funktionen ben¨otigen werden, sollen diese im vorliegenden kurzen Kapitel behandelt werden. Sp¨ater werden wir uns eingehender mit den Methoden der Funktionentheorie zu besch¨ aftigen haben und dabei sehen, wie n¨ utzlich diese Methoden zur L¨osung physikalischer Problemstellungen sind. Quasi als Anwendung der vorhergehenden Diskussion der komplexen Zahlen werden wir uns in diesem Kapitel eingehender mit der Definition und den Eigenschaften der Dirac’schen δ-Funktion besch¨aftigen. Diese Funktion dient vornehmlich zur Beschreibung des singul¨ aren Verhaltens irgendwelcher physikalischer Gesetze oder Vorg¨ ange, die durch Idealisierung realer Gegebenheiten erhalten werden. Dieses singul¨ are Verhalten spiegelt sich dann auch in den entsprechenden mathematischen Strukturen wieder. Die Einf¨ uhrung einer Punktladung in der Elektrostatik oder eines Massenpunktes in der Mechanik stellen solche Idealisierungen dar.
2.2 Komplexe Zahlen und elementare Funktionen Wir behandeln zun¨ achst die elementaren Gesetze f¨ ur das Rechnen mit komplexen Zahlen und wenden diese dann auf eine Reihe wichtiger, in der Physik h¨ aufig vorkommender, einfacher Funktionen an, welche komplexe Verallgemeinerungen bekannter Funktionen der reellen Analysis sind.
50
2 Komplexe Zahlen und Dirac’s δ-Funktion
2.2.1 Komplexe Zahlen Auf die komplexen Zahlen wird man etwa gef¨ uhrt, wenn man die L¨osung der folgenden quadratischen Gleichung finden will x2 + 1 = 0 . (2.1) √ Diese hat die beiden L¨ osungen x = ± −1 und man definiert die imagin¨are Einheit durch √ (2.2) i = −1 , i2 = −1 . Eine beliebige komplexe Zahl, bestehend aus einem Realteil x und einem Imagin¨ arteil y, ist dann bestimmt durch z = x + iy ,
(2.3)
wo x und y reelle Zahlen sind. Wenn y = 0 ist, erhalten wir eine rein reelle Zahl und wenn x = 0 ist, wird die Zahl rein imagin¨ar. Somit sind die reellen Zahlen eine Unterklasse der komplexen Zahlen. 2.2.2 Elementare Rechenregeln Nachdem wir die komplexen Zahlen definiert haben, m¨ ussen wir auch ihre Rechenregeln angeben. Die beiden Grundregeln lauten: 1. Eine komplexe Zahl z = x + i y ist nur dann gleich Null, wenn x = 0 und y = 0 sind. 2. Die komplexen Zahlen gen¨ ugen den gew¨ ohnlichen Regeln der Algebra mit dem Zusatz i2 = −1. Aus diesen beiden Regeln folgen die Formeln f¨ ur die Addition, Subtraktion und Multiplikation komplexer Zahlen. 1. Es gilt also z1 ± z2 = (x1 + iy1 ) ± (x2 + iy2 ) = (x1 ± x2 ) + i(y1 ± y2 )
(2.4)
und z1 · z2 = (x1 + iy1 ) · (x2 + iy2 ) = (x1 x2 − y1 y2 ) + i(x1 y2 + x2 y1 ) . (2.5) 2. Der Quotient zweier komplexer Zahlen z1 x1 + iy1 = z2 x2 + iy2
(2.6)
l¨ asst sich unter der Voraussetzung, dass x2 + iy2 = 0 ist, am einfachsten dadurch finden, dass man auf der rechten Seite Z¨ahler und Nenner mit
2.2 Komplexe Zahlen und elementare Funktionen
51
x2 − iy2 multipliziert. Dies ergibt dann z1 x1 x2 + y1 y2 (x1 + iy1 )(x2 − iy2 ) x2 y1 − x1 y2 = = +i . z2 (x2 + iy2 )(x2 − iy2 ) x21 + y22 x21 + y22
(2.7)
Also sind die Summe, das Produkt und der Quotient zweier komplexer Zahlen wiederum komplexe Zahlen. 3. Wenn zwei komplexe Zahlen einander gleich sind, also x1 + iy1 = x2 + iy2
(2.8)
(x1 − x2 ) + i(y1 − y2 ) = 0
(2.9)
ist, so ist wegen (2.4)
und daher wegen der obigen Regel 1. x1 − x2 = 0 und y1 − y2 = 0 oder x1 = x2 und y1 = y2 . Daraus k¨ onnen wir schließen, dass zwei komplexe Zahlen nur dann einander gleich sind, wenn die beiden Realteile und Imagin¨ arteile miteinander identisch sind. 4. Zwei komplexe Zahlen, die sich nur durch das Vorzeichen der beiden Imagin¨ arteile unterscheiden, heißen zueinander konjugiert komplex, also sind z1 = x + iy , z2 = x − iy (2.10) die beiden zueinander konjugiert komplexen Zahlen und man schreibt symbolisch z2 = z1∗ und entsprechend z1 = z2∗ . Durch Ausmultiplizieren finden wir auch sofort, dass z · z ∗ = (x + iy)(x − iy) = x2 + y 2
(2.11)
ist. Schließlich wird die folgende Schreibweise verwendet x = Rez =
1 (z + z ∗ ) , 2
y = Imz =
1 (z − z ∗ ) 2i
(2.12)
um den Realteil und den Imagin¨ arteil einer komplexen Zahl zu bezeichnen. 2.2.3 Die Gauß’sche Zahlenebene Obgleich die komplexen Zahlen algebraische Gr¨oßen sind, lassen sie nach Gauß eine geeignete geometrische Interpretation zu, die sich im Folgenden als sehr n¨ utzlich erweisen wird. Wir f¨ uhren mithilfe der Abb. 2.1 eine Ebene der komplexen Zahlen ein. L¨ angs der Abszisse werden die reellen Zahlen x und l¨ angs der Ordinate die imagin¨ aren Zahlen iy eingetragen. Dem Punkt P in der Ebene entspricht dann die komplexe Zahl z = x + iy .
(2.13)
52
2 Komplexe Zahlen und Dirac’s δ-Funktion
Abbildung 2.1. Gauß’sche Zahlenebene
Nun ist es zweckm¨ aßig, wie in der Abbildung gezeigt, ebene Polarkoordinaten einzuf¨ uhren, sodass gilt x = r cos ϕ ,
y = r sin ϕ
(2.14)
und somit z = r(cos ϕ + i sin ϕ) .
(2.15)
Dies nennt man die Polarkoordinaten-Darstellung der komplexen Zahl z. Der Radius r ist stets positiv und heißt der Modul oder absolute Betrag der komplexen Zahl und ist durch die L¨ ange des Vektors zum Punkt P gegeben, also √ (2.16) |z| = r = x2 + y 2 = z · z ∗ . Der Winkel ϕ heißt die Phase oder das Argument von z und ist durch die Beziehung gegeben y y tan ϕ = , ϕ = arctan . (2.17) x x In der Analysis erf¨ ahrt der Leser, dass die Funktionen cos ϕ, sin ϕ und eu die folgenden Reihendarstellungen besitzen ϕ4 ϕ6 ϕ2 + − + ··· 2! 4! 6! ϕ3 ϕ5 ϕ7 sin ϕ = ϕ − + − + ··· 3! 5! 7! u2 u3 u eu = 1 + + + + ··· 1! 2! 3!
cos ϕ = 1 −
(2.18)
2.2 Komplexe Zahlen und elementare Funktionen
53
und wir erhalten daher cos ϕ + i sin ϕ = 1 + iϕ +
(iϕ)3 (iϕ)4 (iϕ)2 + + + ··· , 2! 3! 4!
(2.19)
sodass gem¨ aß (2.18) folgt cos ϕ + i sin ϕ = eiϕ ,
(2.20)
wobei die Beziehungen i2 = −1, i3 = −i, i4 = 1, etc angewandt wurden. Die Gleichung (2.20) wird meist die Euler’sche Formel genannt. Analog finden wir (2.21) cos ϕ − i sin ϕ = e−iϕ , woraus sich sofort die weiteren Beziehungen ergeben cos ϕ =
eiϕ + e−iϕ , 2
sin ϕ =
eiϕ − e−iϕ . 2i
(2.22)
Diese Formeln zeigen eine bemerkenswerte und sehr n¨ utzliche Beziehung zwischen der Exponentialfunktion und den trigonometrischen Funktionen, die in der Physik h¨ aufig zur Anwendung kommen. Mithilfe der S¨atze u ¨ ber die Multiplikation von Reihen l¨ asst sich zeigen, dass selbst f¨ ur komplexe Exponenten die Beziehung gilt ex1 ex2 = ex1 +x2 (2.23) und daher erhalten wir ex+iy = ex eiy = ex (cos y + i sin y) . Ferner gilt wegen (2.23) f¨ ur ganzzahlige Werte von n, dass iϕ n = einϕ e
(2.24)
(2.25)
ist und wir finden daher mithilfe von (2.20) die weitere Beziehung (cos ϕ + i sin ϕ)n = cos nϕ + i sin nϕ .
(2.26)
Wenn wir die Gleichungen (2.15) und (2.20) kombinieren, k¨onnen wir eine komplexe Zahl auf eine sehr n¨ utzliche Form bringen z = x + iy = r(cos ϕ + i sin ϕ) = reiϕ .
(2.27)
Diese Darstellung ist sehr n¨ utzlich, wenn zwei komplexe Zahlen miteinander multipliziert oder durch einander dividiert werden sollen, denn wir finden (2.28) z1 · z2 = r1 eiϕ1 r2 eiϕ2 = r1 r2 ei(ϕ1 +ϕ2 ) . Also sind zur Multiplikation zweier komplexer Zahlen ihre beiden Moduli miteinander zu multiplizieren, um den Modul des Produktes zu erhalten und
54
2 Komplexe Zahlen und Dirac’s δ-Funktion
Abbildung 2.2. Summe komplexer Zahlen
es sind die beiden Phasen zu addieren, um die Phase des Produktes zu finden. Bei der Division zweier komplexer Zahlen erhalten wir hingegen z1 r1 eiϕ1 r1 = = ei(ϕ1 −ϕ2 ) . z2 r2 eiϕ2 r2
(2.29)
Hier werden also die beiden Moduli der komplexen Zahlen dividiert und ihre beiden Argumente subtrahiert. Zur Veranschaulichung der Summe zweier komplexer Zahlen z1 und z2 betrachten wir in Abb. 2.2 die beiden entsprechenden Punkte in der komplexen Zahlenebene. Mithilfe der Regeln (2.4) u ¨ ber die Addition komplexer Zahlen finden wir sofort, dass ihre Summe z1 + z2 durch den Punkt P3 dargestellt wird, der durch Konstruktion des Parallelogramms aus den Vektoren OP1 und OP2 gewonnen werden kann. Aus der Abbildung ist sofort ersichtlich, dass die folgende Beziehung gilt |z1 + z2 | ≤ |z1 | + |z2 | .
(2.30)
Hier gilt das Gleichheitszeichen nur dann, wenn die beiden Vektoren in gleicher Richtung orientiert sind. Dabei ist zu beachten, dass im Gegensatz zur Addition und Subtraktion komplexer Zahlen, die den elementaren Gesetzen der Vektoralgebra gen¨ ugen, dies f¨ ur das Produkt und den Quotienten zweier komplexer Zahlen nicht der Fall ist. 2.2.4 Potenzen und Wurzeln komplexer Zahlen Der Wert von z n , wo n eine positive ganze Zahl ist, l¨asst sich durch sukzessive Multiplikation von z mit sich selbst finden. Da z = x + iy ist, k¨onnen wir
2.2 Komplexe Zahlen und elementare Funktionen
55
durch Anwendung des Binominaltheorems (x + iy)n berechnen. Auf diese Weise erhalten wir
und
z 2 = (x + iy)2 = x2 − y 2 + 2ixy
(2.31)
z 3 = (x + iy)3 = x3 − 3xy 2 + i 3x2 y − y 3 .
(2.32)
Eine einfache Methode, um allgemein Potenzen einer komplexen Zahl zu finden, besteht in der Anwendung der Polardarstellung von z. Wir erhalten dann mithilfe von (2.27) n z n = reiϕ = rn einϕ . (2.33) Wenn die Zahl z in der komplexen Zahlenebene auf einem Einheitskreis um den Ursprung z = 0 liegt, dann ist r = 1 und wir gelangen so zum de Moivre’schen Theorem iϕ n e = (cos ϕ + i sin ϕ)n = cos nϕ + i sin nϕ . (2.34) In diesem Zusammenhang haben wir zu beachten, dass wir zum Polarwinkel ϕ jedes beliebige Vielfache von 2π hinzuaddieren k¨onnen, ohne den Wert der Zahl z zu ¨ andern, denn es gilt z = r(cos ϕ + i sin ϕ) = r [cos(ϕ + 2kπ) + i sin(ϕ + 2kπ)] = rei(ϕ+2kπ) . (2.35) Dies ist daher die allgemeinste Form der komplexen Zahl z, und wie wir sehen, ist sie 2π-periodisch. Als n¨ achstes betrachten wir die Umkehrfunktion der Potenz z n , n¨amlich 1 die Wurzel w = z n und dies ist gleichfalls eine komplexe Zahl, die zur n-ten Potenz erhoben, die Zahl z liefert. Mithilfe der allgemeinen Form (2.35) von z erhalten wir ϕ + 2kπ ϕ + 2kπ 1 1 + i sin wk = z n = r n cos . (2.36) n n 1
n , wo k sukzessive die Demnach ergeben sich n verschiedene Werte wk = z√ 1 n n Werte 0, 1, 2, 3, · · · n − 1 annimmt. Dabei ist r = r gleich der positiven Wurzel der positiven Zahl r . Wir nennen wk die n Zweige der n-deutigen 1 komplexen Funktion w = z n und der Punkt z = 0 heißt der Verzweigungspunkt dieser Funktion, da sich in ihm alle n Zweige treffen. Hat der Punkt z in der komplexen Zahlenebene einmal eine geschlossene Kurve C um den Punkt z durchlaufen, dann ist der Punkt w in der komplexen w-Ebene erst um einen Zweig weiterger¨ uckt und erst nach n Uml¨aufen in der z-Ebene hat der Bildpunkt w in der w-Ebene alle Zweige wk durchlaufen und ist zum Ausgangspunkt zur¨ uckgekehrt. Die hier, anhand des vorliegenden Beispiels, eingef¨ uhrte Begriffsbildung der Abbildung der komplexen z-Ebene auf die
56
2 Komplexe Zahlen und Dirac’s δ-Funktion 1
komplexe w-Ebene mithilfe der komplexen Funktion w = z n erweist sich ganz allgemein in der Funktionentheorie als eine sehr n¨ utzliche Veranschaulichung funktionentheoretischer Zusammenh¨ange. Wenn wir r = 1 setzen, k¨ onnen wir insbesondere die Wurzeln der Gleichung wn = 1
(2.37)
finden, denn es ist mithilfe von (2.36) 1
wk = 1 n = ei(
0+2kπ n
) = cos 2kπ + i sin 2kπ , n n
(2.38)
wo k = 0, 2, 3, · · · n − 1. Damit liegen die n Wurzeln auf einem Einheitskreis um den Punkt w = 0 im ¨ aquidistanten Winkelabstand 2π n . 2.2.5 Exponentialfunktion und trigonometrische Funktionen Wir definieren die Exponentialfunktion und die trigonometrischen Funktionen f¨ ur komplexe Argumente z durch dieselben Reihen wie im reellen Gebiet z2 z3 zn z + + + ··· + ··· 1! 2! 3! n! z3 z5 z 2n−1 sin z = z − + − · · · + (−1)n−1 + ··· 3! 5! (2n − 1)! z2 z4 z 2n−2 cos z = 1 − + − · · · + (−1)n−1 + ··· . 2! 4! (2n − 2)! ez = 1 +
(2.39) (2.40) (2.41)
Mithilfe von (2.39) erhalten wir e0 = 1 , ez1 ez2 = ez1 +z2 .
(2.42)
Dies sind die grundlegenden Eigenschaften der Exponentialfunktion. Aus den Gleichungen (2.39, 2.40, 2.41) gewinnen wir ferner eiz = cos z + i sin z ,
e−iz = cos z − i sin z
(2.43)
und daraus durch Addition oder Subtraktion cos z =
eiz + e−iz , 2
sin z =
eiz − e−iz . 2i
(2.44)
Schließlich ergeben sich mithilfe der Beziehungen (2.42, 2.43) die weiteren Relationen sin(z1 ± z2 ) = sin z1 cos z2 ± cos z1 sin z2 (2.45) cos(z1 ± z2 ) = cos z1 cos z2 ∓ sin z1 sin z2 in Analogie zu den elementaren Relationen der ebenen Trigonometrie. Von dort wissen wir auch, dass die trigonometrischen Funktionen 2π-periodisch
2.2 Komplexe Zahlen und elementare Funktionen
57
sind. ¨ ahnliches gilt auch f¨ ur die Exponentialfunktion und die trigonometrischen Funktionen im komplexen Gebiet, denn ez+i2kπ = ez ei2kπ = ez (cos 2kπ + i sin 2kπ) = ez
(2.46)
und daraus folgt durch Kombination mit (2.44) sin(z + 2kπ) = sin z ,
cos(z + 2kπ) = cos z .
(2.47)
Demnach ist die Exponentialfunktion periodisch mit der imagin¨aren Periode 2πi und die Sinus- und Cosinus-Funktionen sind periodisch mit der reellen Periode 2π. 2.2.6 Die hyperbolischen Funktionen Die hyperbolischen Sinus- und Cosinus-Funktionen sind f¨ ur komplexe Werte z ihres Arguments durch die Beziehungen definiert sinh z =
ez − e−z , 2
cosh z =
ez + e−z 2
(2.48)
mit deren Hilfe wir erhalten sinh iz =
eiz − e−iz = i sin z , 2
cosh iz =
eiz + e−iz = cos z 2
(2.49)
und analog sinh z = −i sin iz ,
cosh z = cos iz .
(2.50)
Wir sehen also, dass die hyperbolischen Funktionen im wesentlichen trigonometrische Funktionen mit komplexem Argument sind. Daher gewinnen wir auch aus den Beziehungen zwischen den trigonometrischen Funktionen die entsprechenden Relationen zwischen den hyperbolischen Funktionen. So gilt zum Beispiel cosh2 z − sinh2 z = 1 (2.51) und die Beziehungen sinh(z1 + z2 ) = sinh z1 cosh z2 + cosh z1 sinh z2 cosh(z1 + z2 ) = cosh z1 cosh z2 − sinh z2 sinh z2 ,
(2.52)
deren Nachweis wir dem Leser u ¨ berlasen. Wenn wir in der letzten Gleichung z2 = i2kπ setzen, so ergibt sich mithilfe von (2.49) sinh(z + i2kπ) = sinh z cosh(z + i2kπ) = cosh z .
(2.53)
Daraus ist zu schließen, dass ¨ ahnlich wie die Exponentialfunktion auch die hyperbolischen Funktionen die imagin¨ are Periode 2πi haben.
58
2 Komplexe Zahlen und Dirac’s δ-Funktion
2.2.7 Der Logarithmus Der Logarithmus sei auch im komplexen Gebiet die Umkehrfunktion der Exponentialfunktion. Wenn also (2.54) z = ew ist, dann soll gelten w = ln z .
(2.55)
Aus dieser Definition ergeben sich mithilfe der Beziehungen (2.42) f¨ ur die Exponentialfunktion die folgenden grundlegenden Eigenschaften des Logarithmus ln(z1 · z2 ) = ln z1 + ln z2 , ln zz12 = ln z1 − ln z2 (2.56) und ln z n = n ln z ,
ln 1 = 0 .
(2.57)
Der Logarithmus einer komplexen Zahl z kann in folgender Weise in seinen Real- und Imagin¨ arteil zerlegt werden. Mithilfe der Euler’schen Formel (2.27) k¨ onnen wir herleiten ln z = ln reiϕ = ln r + ln eiϕ = ln r + iϕ y 1 (2.58) = ln(x2 + y 2 ) + i arctan . 2 x In dieser Gleichung ist ln r der gew¨ ohnliche reelle Logarithmus f¨ ur positive Zahlen r, wie man ihn in Logarithmentafeln finden kann. Nun l¨asst sich aber auch der Logarithmus einer reellen negativen Zahl finden. Zum Beispiel erhalten wir f¨ ur ln(−5), wegen −5 = 5eiπ das Resultat ln(−5) = ln 5 + iπ = 1.6094 + iπ
(2.59)
ln(−1) = iπ .
(2.60)
und insbesondere Schließlich haben wir noch hervorzuheben, dass der Logarithmus einer komplexen Zahl z eine unendlich vieldeutige Funktion ist, deren einzelne Zweige sich um ein Vielfaches von 2πi unterscheiden, denn wir erhalten mit z = rei(ϕ+2kπ) w = ln z = ln r + i(ϕ + 2kπ) ,
k = 0, ±1, ±2, ±3, · · · .
(2.61)
In diesem Fall nennt man den Punkt z = 0 den Windungspunkt von ln z, da sich um diesen Punkt alle unendlich vielen Zweige der komplexen Funktion herumwinden und sie sich alle im Punkt z = 0 treffen. Analog kann man zeigen, dass auch die Umkehrfunktionen der trigonometrischen und hyperbolischen Funktionen, also arcsin z, arccos z, arc sinhz, arc cosh z unendlich vieldeutige Funktionen sind. Dies ist verst¨ andlich, da sie u ¨ ber die Exponentialfunktion eng mit dem Logarithmus zusammenh¨angen. Die Vieldeutigkeit der betrachteten Funktionen, d. h. der Wurzel, des Logarithmus und der verwandten Funktionen ist eine Folge der Periodizit¨at der Ausgangsfunktionen in der komplexen Zahlenebene.
2.2 Komplexe Zahlen und elementare Funktionen
59
2.2.8 Abschließende Bemerkungen Wir haben anhand der elementaren komplexen Funktionen z n , ez , sin z, cos z, etc. gesehen, dass sie sich durch Ausmultiplizieren der Produkte und Reihen in ihre Real- und Imagin¨ arteile zerlegen lassen, d. h. allgemein kann eine komplexe Funktion f (z) in der Form angesetzt werden f (z) = u(x, y) + iv(x, y) ,
(2.62)
wo u(x, y) und v(x, y) reelle Funktionen der Ver¨ anderlichen x und y sind. Man kann sich also vorstellen, dass durch die Funktion w = f (z) alle Punkte z = x + iy der z-Ebene auf Punkte w = u + iv der komplexen w-Ebene abgebildet werden. Wie wir gesehen haben, k¨ onnen solche Abbildungen eindeutig oder mehrdeutig sein. In diesem Buch werden wir uns in Kap. 7 vornehmlich mit eindeutigen komplexen Funktionen besch¨ aftigen. In den folgenden Kapiteln werden wir es h¨ aufig mit dem Spezialfall von komplexen Funktionen zu tun haben, die nur l¨ angs der reellen x-Achse definiert sind, also f (x) = u(x) + iv(x) .
(2.63)
Beispiele 1. Ebene elektromagnetische Wellen Unter den Beispielen von Abschn. 1.4 haben wir die d’Alembert’sche Wellengleichung (1.118) hergeleitet, der im Vakuum sowohl das elektrische Feld E(r, t) als auch das magnetische Induktionsfeld B(r, t) gen¨ ugen. Wenn wir eine ebene, monochromatische elektromagnetische Welle betrachten, so l¨ asst sich diese in reeller Form so ausdr¨ ucken E(r, t) = E sin(ωt − k · r) ,
(2.64)
wo E die elektrische Feldamplitude, ω die Frequenz der Welle und k = ωc n den Wellenvektor darstellen. Dabei ist n der Einheitsvektor der Fortpflanzungsrichtung der Welle. In vielen F¨ allen ist es jedoch weitaus vorteilhafter, die komplexe Schreibweise zu verwenden und die L¨osung anzusetzen E(r, t) = Eeiϕ , ϕ = ωt − k · r ,
(2.65)
wo E eine reelle konstante Vektoramplitude und ϕ die Phase der Welle sind. Diese Welle muss der d’Alembert’schen Wellengleichung gen¨ ugen, also muss bei unserem Beispiel gelten ΔE(r, t) −
1 ∂2 E(r, t) = 0 . c2 ∂t2
(2.66)
Mithilfe der Leibniz’schen Kettenregel (A.6) liefert die zweimalige Ableiur die Anwendung des Latung von (2.65) nach der Zeit −ω 2 E(r, t) und f¨
60
2 Komplexe Zahlen und Dirac’s δ-Funktion
place’schen Operators in (2.66) beachten wir, dass ∂eiϕ ∂ϕ ∂eiϕ = = −iki eiϕ ∂xi ∂ϕ ∂xi
(2.67)
ist und folglich nach zweimaliger Anwendung der Differenziation ΔE(r, t) = −k 2 E(r, t) resultiert. Also liefert das Einsetzen von (2.65) in (2.66)
ω2 −k 2 + 2 E(r, t) = 0 (2.68) c und es ist daher unsere ebene Welle eine L¨ osung der d’Alembert’schen Welullt lengleichung, wenn die sogenannte ,,Dispersionsrelation“ ω 2 = (ck)2 erf¨ die Wellenzahl der Welist, wo ω = 2πν die Kreisfrequenz und k = 2π λ le sind, wobei λ die Wellenl¨ ange darstellt. Daraus ergibt sich die dem Leser bekannte elementare Beziehung λν = c. Ein analoges Resultat erhalten wir, wenn wir f¨ ur das magnetische Induktionsfeld den L¨osungsansatz machen B(r, t) = Beiϕ , wo ϕ dieselbe Phase wie in (2.65) ist. Bei der Behandlung der Beispiele in Abschn. 1.4.2 haben wir auch gesehen, dass im ladungsfreien Raum gilt divB(r, t) = 0 , divE(r, t) = 0 . (2.69) Wenn wir in diese Beziehungen die obigen Ans¨atze f¨ ur E(r, t) und B(r, t) einsetzen, so erhalten wir, da die Amplituden konstante Vektoren sind, mithilfe von (2.67) ∇E(r, t) = E ∇eiϕ = −ik · E(r, t) = 0 ∇B(r, t) = −ik · B(r, t) = 0 .
(2.70)
Also stehen in ebenen elektromagnetischen Wellenfeldern die Feldvektoren E und B stets senkrecht zur Fortpflanzungsrichtung n = kk der Welle. Im gleichen Abschn. 1.4.2 haben wir auch das Faraday’sche Induktionsgesetz kennen gelernt, das besagt rotE = −γ
∂ B. ∂t
(2.71)
Wenn wir hier unsere ebenen Wellenans¨ atze einsetzen und beachten, dass die Feldamplituden konstante Vektoren sind, so erhalten wir wegen (2.67) ∇ × E(r, t) = ∇eiϕ × E = −ik × E(r, t) = −iωγB(r, t) und da k = nk und k = hung
ω c
(2.72)
sind, schließen wir aus (2.72) die wichtige Bezie-
n × E(r, t) = cγB(r, t) .
(2.73)
Also stehen in einem elektromagnetischen Wellenfeld die Feldvektoren E und B senkrecht zueinander und beide senkrecht auf der Fortpflanzungsrichtung n, d. h. das elektromagnetische Wellenfeld ist transversal.
2.2 Komplexe Zahlen und elementare Funktionen
61
2. Die Fourier-Funktionen Als Fourier-Funktionen wollen wir jenes Funktionensystem bezeichnen, das im folgenden Kapitel bei der Diskussion der Fourier’schen Reihen von Interesse sein wird. Als Ausgangspunkt w¨ahlen wir die elementare komplexe Funktion f (ϕ) = aeiϕ = a(cos ϕ + i sin ϕ) ,
(2.74)
von der wir bereits gesehen haben, dass sie 2π-periodisch ist. Nun betrachten wir allgemeiner das Funktionensystem fn (ϕ) = an einϕ = an (cos nϕ + i sin nϕ) ,
(2.75)
wo n = 0, ±1, ±2, ±3, · · · ist. Von diesem System k¨onnen wir uns leicht u ¨berzeugen, dass es auch 2π-periodisch ist, denn fn (ϕ + 2kπ) = an ein(ϕ+2kπ) = an [cos n(ϕ + 2kπ) + i sin n(ϕ + 2kπ)] = fn (ϕ) ,
(2.76)
da ei2nkπ = 1 ist. Anstelle die Funktionen fn (ϕ) in der komplexen Zahlenebene auf einem Kreis vom Radius an zu betrachten, ist es bei den physikalischen Anwendungen meist interessanter, in einem Kartes’schen Koordinatensystem l¨ angs der Abszisse den Winkel ϕ aufzutragen und l¨angs der Ordinate den Real- und Imagin¨ arteil von fn (ϕ). Die in der Natur vorkommenden periodischen Vorg¨ ange, wie mechanische Schwingungen, Oszillationen in Schaltkreisen der Elektrotechnik, oder elektromagnetische Wellen, etc., haben in den wenigsten F¨ allen die Periode 2π, sondern eher eine r¨aumliche Periodenl¨ ange 2 oder eine zeitliche Periode 2T , wobei wir hier den Faktor 2 nur aus Zweckm¨ aßigkeit eingef¨ uhrt haben. Um nun von den Funktionen fn (ϕ) zu den analogen Funktionen fn (x), bzw. fn (t) zu gelangen, haben wir zum Beispiel ϕ = αx zu setzen und den Dehnungsfaktor α zu bestimmen. So erhalten wir mit ϕ = 2π und x = 2 f¨ ur α = π . Also werden die 2 -periodischen Funktionen fn (x) anstelle von (2.75) lauten nπ nπ x + i sin x] (2.77) fn (x) = an [cos
und bei zeitlicher Abh¨ angigkeit lautet das Argument dieser Funktionen analog nπ T t. Diese Funktionen haben nun folgende wichtige Eigenschaften: 1. Sie bilden ein System orthogonaler Funktionen und zwar in folgender Weise. Wir bilden das Produkt zweier Funktionen der Form (2.77) mit den Indizes n und k und integrieren das Resultat u ¨ ber eine Periode von x = λ bis x = λ + 2 , wo λ beliebig gew¨ ahlt werden kann. Dann erhalten wir λ+2 fn∗ (x)fk (x)dx (2.78) λ λ+2
=
λ
=
an ak e−i
(n−k)π x
dx =
i an ak −i (n−k)π x λ+2 e |λ (n − k)π
ilan ak −i (n−k)π λ −i2(n−k)π e (e − 1) = 0 , (n − k)π
fu ¨ r k = n .
2 Komplexe Zahlen und Dirac’s δ-Funktion
62
Hingegen ergibt sich f¨ ur k = n λ+2 λ+2 fn∗ (x)fn (x)dx = |fn (x)|2 dx = a2n (λ + 2 − λ) = a2n 2 . λ
λ
(2.79) 2. Oft ist es zweckm¨ aßig, die Funktionen fn (x) zu normieren, derart, dass das Integral (2.79) den Wert eins hat. Dazu gen¨ ugt es, an = √12 zu w¨ ahlen. Damit bilden dann die Funktionen fn (x) das ,,Orthonormalsystem“ der Fourier-Funktionen und wir erhalten λ+2 1 λ+2 −i (n−k)π x ∗ fn (x)fk (x)dx = e dx = δn,k , (2.80) 2 λ λ wo δn, k das Kronecker-Symbol ist. Dabei durchlaufen n und k alle ganzen Zahlen im Bereich (−∞, +∞). Solche orthogonale Funktionensysteme spielen in der Physik eine wichtige Rolle und wir werden uns in den folgenden Kapiteln noch eingehender mit ihnen besch¨aftigen.
2.3 Die Dirac’sche δ-Funktion Am Anfang dieses Kapitels wurde bereits auf die N¨ utzlichkeit der Dirac’schen δ-Funktion in vielen Bereichen der Theoretischen Physik hingewiesen. Diese Funktion wird im Folgenden zun¨ achst definiert und daran schließt sich eine Diskussion ihrer verschiedenen Darstellungen und Eigenschaften an. 2.3.1 Definition der δ-Funktion Die Dirac’sche δ-Funktion ist eine im u ¨blichen Sinne sehr uneigentliche Funktion und findet ihre tiefere Begr¨ undung im Rahmen der Distributionstheorie, worauf wir aber hier nicht eingehen wollen. Diese Funktion sei durch folgende Eigenschaften definiert. Wir nehmen an, f (x) sei eine in der Umgebung von x0 beliebig oft stetig differenzierbare Funktion. Dann soll gelten b f (x0 ), f¨ ur a < x0 < b δ(x − x0 )f (x)dx = , (2.81) 0, f¨ ur x0 < a oder x0 > b a wobei das Gleichheitszeichen unter den obigen Bedingungen auszuschließen ist. Wenn wir f (x) = f (x0 ) setzen, folgt daraus
b
δ(x − x0 )dx = 1,
{f¨ ur a < x0 < b und δ(x − x0 ) = 0, f¨ ur x = x0 .}
a
(2.82) Also strebt die δ-Funktion in infinitesimaler Umgebung von x0 in dem Maße gegen unendlich, dass stets das Integral u ¨ ber sie den Wert 1 hat. Dies k¨ onnen wir durch folgenden Grenzprozess veranschaulichen, der auch eine der
2.3 Die Dirac’sche δ-Funktion
63
Abbildung 2.3. Zur δ-Funktion
m¨ oglichen Darstellungen der δ -Funktion liefert. Wir betrachten die Funktion (vgl. Abb. 2.3) 1 , |x| < ε δε (x) = 2ε (2.83) 0, |x| > ε und integrieren diese im Intervall (−∞ < x < +∞). Dies ergibt
+∞
−∞
δε (x)dx =
1 2ε
+ε
dx = 1 .
(2.84)
−ε
Wenn daher f (x) eine beliebige, im Intervall (−ε, +ε) integrable Funktion ist, so liefert der Mittelwertsatz der Integralrechnung (siehe Anh. A.2.8 (A.89))
+∞ −∞
1 δε (x)f (x)dx = 2ε
+ε
f (x)dx = f (κε) , −ε
fu ¨ r |κ| ≤ 1 .
(2.85)
Wir k¨ onnen daher die δ-Funktion durch den Grenz¨ ubergang definieren δ(x) = lim δε (x) ε→0
(2.86)
und erhalten dann aus (2.83, 2.84) im Limes ε → 0 die anfangs genannte urlich gibt es eiEigenschaft (2.82), wenn wir x durch x − x0 ersetzen. Nat¨ ne Reihe anderer Darstellungen der δ-Funktion, die im Grenzfall dieselben Eigenschaften erf¨ ullen und die in der Physik h¨aufig Anwendung finden. Eine dieser Darstellungen werden wir bei der Besprechung der Vollst¨andigkeit orthogonaler Funktionensysteme im n¨ achsten Kapitel kennen lernen. Hier
64
2 Komplexe Zahlen und Dirac’s δ-Funktion
soll noch eine sehr n¨ utzliche und vielfach verwendete Darstellung besprochen werden. Dazu betrachten wir das Integral 1 2π
+L
e −L
ik(x−x0 )
+L eik(x−x0 ) sin L(x − x0 ) dk = −i = 2π(x − x0 ) −L π(x − x0 )
(2.87)
und behaupten, dass dieses Integral im Grenzfall L → ∞ eine Darstellung der δ-Funktion liefert. Dazu berechnen wir f¨ ur a < x0 < b b L(b−x0 ) 1 sin L(x − x0 ) sin y 1 dy . (2.88) dx = π a x − x0 π L(a−x0 ) y Von diesem Integral werden wir im Kapitel 7 u ¨ ber die Funktionentheorie zeigen, dass es f¨ ur L → ∞ den Wert 1 hat. Andererseits hat der Integrand f¨ ur x → x0 den Wert πL und strebt daher mit wachsendem L gegen unendlich, w¨ ahrend die Nullstellen xn des Integranden, aufgrund der Bedingung L(xn − x0 ) = nπ, mit wachsendem L immer n¨ aher beisammen liegen. Damit wird sich der Beitrag der raschen Oszillationen des Integranden zum Integral im Mittel wegheben. Also haben wir folgende Darstellung der δ-Funktion gefunden +L 1 sin L(x − x0 ) . (2.89) eik(x−x0 ) dk = lim δ(x − x0 ) = lim L→∞ 2π −L L→∞ π(x − x0 ) Eine andere, h¨ aufig verwendete Darstellung der δ-Funktion ist durch den Ausdruck gegeben ε 1 . 2 ε→0 π ε + (x − x0 )2
δ(x − x0 ) = lim
(2.90)
Die Verwendung der δ-Funktion macht nur einen Sinn im Zusammenhang mit einer Integration. Aus den betrachteten Darstellungen erkennen wir auch, dass δ(x−x0 ) eine symmetrische Funktion ist. Im folgenden Abschnitt wollen wir einige wichtige Rechenregeln f¨ ur den Gebrauch der δ-Funktion behandeln. 2.3.2 Rechenregeln der δ-Funktion Die folgenden Rechenregeln sind stets im Zusammenhang mit einer Integration zu sehen und die transformierten Ausdr¨ ucke f¨ ur die δ-Funktion sind so zu verstehen, dass bei einer Integration der transformierte Ausdruck dasselbe Resultat liefert als der urspr¨ unglich. Da die δ-Funktion eine symmetrische Funktion ist, gilt (2.91) δ(x − x0 ) = δ(x0 − x) . Wenn wir in der Definition (2.81) der δ-Funktion f (x) durch x − x0 ersetzen, so resultiert die Beziehung (x − x0 )δ(x − x0 ) = 0 .
(2.92)
2.3 Die Dirac’sche δ-Funktion
65
Wir betrachten ferner mithilfe der Substitution y = αx, α > 0, das Integral b 1 αb y 1 δ(y − y0 )dy = f (x0 ) f (x)δ[α(x − x0 )]dx = f (2.93) α αa α α a ¨ und schließen daraus die Aquivalenz δ[α(x − x0 )] =
1 δ(x − x0 ) , α
α>0.
(2.94)
Ebenso erhalten wir aufgrund der Definition (2.81) f (x)δ(x − x0 ) = f (x0 )δ(x − x0 )
(2.95)
δ(x − x0 )δ(x − x1 )dx = δ(x0 − x1 ) und mithilfe von (2.94) ergibt sich f¨ ur α > 0 δ(x2 − α2 ) = δ[(x − α)(x + α)] =
1 [δ(x − α) + δ(x + α)] . 2α
(2.96)
Zur Verallgemeinerung der Formel (2.94) betrachten wir eine eindeutig differenzierbare Funktion ϕ(x), die an der Stelle x = x0 eine Nullstelle haben m¨ oge, und entwickeln in der infinitesimalen Umgebung dieser Stelle die Funktion in eine Taylor’sche Reihe ϕ(x) = ϕ(x0 ) + (x − x0 )ϕ (x0 ) + · · · ∼ = (x − x0 )ϕ (x0 ) .
(2.97)
Dann folgt mit ϕ (x0 ) = 0
b
f (x)δ[ϕ(x)]dx = a
b
f (x)δ[ϕ (x0 )(x − x0 )]dx
a
=
1 |ϕ (x0 )|
b
f (x)δ(x − x0 )dx = a
f (x0 ) |ϕ (x0 )|
(2.98)
und wenn die Funktion ϕ(x) allgemeiner im Intervall (a, b) in den Punkten xi , i = 1, 2, 3, · · · n Nullstellen besitzt, bei denen ϕ (xi ) = 0 ist, so ergibt sich die Beziehung n δ(x − xi ) δ[ϕ(x)] = . (2.99) |ϕ (xi )| i=1 Die Ableitung der δ-Funktion definieren wir mithilfe der zu Anfang gemachten Annahme, dass die Funktion f (x) beliebig oft differenzierbar sein soll und wir daher eine partielle Integration (A.58) vornehmen d¨ urfen, also
b
f (x)δ (x − x0 )dx = f (x)δ(x − a
x0 )|ba
−
b
f (x)δ(x − x0 )dx = −f (x0 ) ,
a
(2.100)
66
2 Komplexe Zahlen und Dirac’s δ-Funktion
wobei der erste Term der partiellen Integration verschwindet. Setzen wir insbesondere f (x) = x − x0 , so erhalten wir die Beziehung (x − x0 )δ (x − x0 ) = −δ(x − x0 ) .
(2.101)
Da die Funktion δ(x−x0 ) eine gerade Funktion von x−x0 ist, ist die Ableitung δ (x − x0 ) eine ungerade Funktion, d. h. δ (x − x0 ) = −δ (x0 − x) und weil die δ-Funktion eine gerade Funktion ist, gilt ⎧ ⎫ 1 ⎪ a ⎨ ⎬ , f¨ ur a > 0 ⎪ 2 . δ(x)dx = ⎪ ⎪ 0 ⎩ − 1 , f¨ ur a < 0 ⎭ 2
(2.102)
(2.103)
Die dreidimensionale δ-Funktion k¨ onnen wir als Verallgemeinerung von (2.89) durch die folgende Gleichung definieren ∞ 1 δ(r − r 0 ) = δ(x − x0 )δ(y − y0 )δ(z − z0 ) = exp[ik · (r − r 0 )]d3 k (2π)3 −∞ (2.104) und es gilt dann, wenn r 0 im Integrationsbereich liegt f (r)δ(r − r 0 )dv = f (r 0 ) , (2.105) wo dv = dxdydz ist. Beispiele 1. Das Fourier-Integraltheorem Mit diesem Theorem werden wir uns im folgenden Kapitel noch eingehender besch¨ aftigen und es auf einem anderen Wege als Grenzfall einer Fourier-Reihe herleiten. Hier sei als Beispiel f¨ ur die Anwendung der δ-Funktion folgende einfache Herleitung angegeben. Wir betrachten eine in (−∞, +∞) integrable Funktion f (x), die wir in folgender Weise mithilfe von (2.81) und (2.89) umformen +∞ +∞ +∞ 1 ik(x−x ) f (x) = f (x )δ(x − x )dx = f (x ) e dk dx 2π −∞ −∞ −∞ +∞ = F (k)eikx dk , (2.106) −∞
wobei wir die Fourier-Transformierte F (k) von f (x) durch das folgende Integral definiert haben +∞ 1 F (k) = f (x )e−ikx dx . (2.107) 2π −∞
2.3 Die Dirac’sche δ-Funktion
67
Dabei wurde angenommen, dass sich die beiden Integrationen u ¨ ber k und x in (2.106) miteinander vertauschen lassen. Die letzten beiden Gleichungen bilden das genannte Integraltheorem, das in der Physik vielfache Anwendungen findet. Ist zum Beispiel in der Wellentheorie f (x) ein r¨aumlich begrenzter Wellenimpuls, so stellt F (k) das Spektrum der entsprechenden Wellenzahlen k = 2π λ dar und wenn f (t) einen zeitlichen Impuls darstellt, dann ist F (ω) das m¨ ogliche Frequenzspektrum mit ω = 2π T . 2. L¨osung der Poisson-Gleichung In Abschn. 1.4.3 lernten wir die Poisson’sche Differenzialgleichung der Potenzialtheorie kennen ΔΦ = −αρ ,
(2.108)
wo ρ zum Beispiel eine beliebige, r¨ aumlich begrenzte Ladungsverteilung sein kann. Zur L¨ osung dieser Gleichung betrachten wir zun¨achst eine Punktquelle der Ladungsmenge q, die sich an der Stelle r0 befinden soll. Dann k¨onnen wir f¨ ur diese spezielle Ladungsverteilung ansetzen ρ(r) = qδ(r − r0 ) ,
(2.109)
denn die Integration u ¨ ber diese Verteilung liefert den Wert q. Jetzt betrachten wir die L¨ osung der Gleichung ΔΦ(r) = −αqδ(r − r 0 ) .
(2.110)
Hier kann man sich durch Anwendung des Laplace-Operators u ¨berzeugen, dass A Δ = 0 , R = |r − r 0 | (2.111) R sein wird, solange r = r 0 ist, wobei A eine noch zu bestimmende Konstante darstellt. Diesen L¨ osungsansatz (2.111) f¨ ur Φ setzen wir in die Gleichung (2.110) ein und integrieren diese Gleichung u ¨ber das Volumen einer Kugel um das Zentrum bei r0 . Dies liefert mithilfe des Gauß’schen Integralsatzes (1.84) auf der linken Seite von (2.111) A A 1 div grad dv = grad df = −A n · df 2 R R V F F R = −4πA = −αq δ(r − r0 )dv = −αq , (2.112) V
wobei beachtet wurde, dass auf der Oberfl¨ ache einer Kugel vom Radius R , 2 die Fl¨ achennormale n = R und df = nR dΩ sind, wobei dΩ = sin ϑdϑdϕ R das Oberfl¨ achenelement auf einer Kugel vom Radius R = 1 darstellt. Aus der letzten Gleichung (2.112) schließen wir auch noch auf den Wert der unalt man schließlich mit dem bekannten Konstanten A, zu A = αq 4π . Damit erh¨ Ansatz Φ = A und der Gleichung (2.110) die Beziehung R Δ
1 = −4πδ(r − r 0 ) R
(2.113)
68
2 Komplexe Zahlen und Dirac’s δ-Funktion
1 und man nennt G(r − r 0 ) = − 4π|r−r die Green’sche Funktion der Po0| tenzialtheorie. Andererseits liefert unsere Rechnung f¨ ur das Potenzial einer Punktladung αq , R = |r − r0 | . (2.114) Φ= 4πR Nach demselben Verfahren k¨ onnen wir nun das Potenzial einer Ansammlung von Punktladungen berechnen, die sich an den Orten r i mit den Ladungsmengen qi befinden, wo i = 1, · · · N ist, also N α qi , Φ= 4π i=1 Ri
Ri = |r − r i |
(2.115)
und wenn wir uns die Punktladungen qi r¨ aumlich zur kontinuierlichen Ladungsdichte ρ(r ) verschmiert denken, so lautet das Potenzial α ρ(r ) dv , R = |r − r | . Φ(r) = (2.116) 4π V R Das letzte Resultat k¨ onnen wir mithilfe der oben definierten Green’schen Funktion G(r − r ) auch in folgender Form ausdr¨ ucken Φ(r) = −α G(r − r )ρ(r )dv . (2.117) V
Man nennt daher die Green’sche Funktion G gelegentlich den l¨osenden Kern der Poisson’schen Differenzialgleichung. Mit der Methode der Green’schen Funktion zur L¨ osung inhomogener partieller Differenzialgleichungen werden wir uns in den folgenden Kapiteln noch eingehender zu besch¨aftigen haben. ¨ Ubungsaufgaben 1. Zeige, dass die Summe zweier konjugiert komplexer Zahlen reell ist und ihre Differenz rein imagin¨ ar. Zeige, dass ihr Produkt reell ist und wann wird ihr Quotient reell sein? 2. Bestimme die Wurzeln der Gleichung z 5 = 2 + i4 und mache eine Skizze in der komplexen Zahlenebene. 3. Finde analog die kubischen Wurzeln von −1 und mache eine Skizze. 4. Dr¨ ucke das Polynom x4 + a4 durch das Produkt seiner Linearfaktoren, bzw. seiner quadratischen Faktoren aus. π 5. Zeige, dass eiπ = −1 und ei 2 = i ist. 1+i 6. Dr¨ ucke e in der Form a + ib aus und berechne a und b auf vier Dezimalen genau. 7. Zeige, dass |ez | = ex und dass |eiϕ | = 1 sind, wo z = x + iy und ϕ reell ist. 8. Finde alle m¨ oglichen Werte von ii . 9. Bestimme alle Werte von π π .
2.3 Die Dirac’sche δ-Funktion
69
10. Finde alle Werte von ln(2 + i3) durch Umschreiben in die Form a + ib, wo a und b reell sind. n irz 11. Berechne die geometrische Summe . Aus dem Resultat folgt r=1 e auch sofort der entsprechende Ausdruck, wenn z durch −z ersetzt wird. Zeige, dass aus beiden Summen folgende Beziehung berechnet werden n 1 kann r=1 sin rz = 2 sin(z/2) [cos(z/2) − cos{(n + 1/2)z}]. Etwas sehr ahnliches erh¨ alt man f¨ ur eine Summe u ¨ ¨ber cos rz. 12. Man dr¨ ucke sin(i + π/4) in der Form a + ib aus, wo a und b reell sind. 13. Gegeben sei x + iy = tan(α + iβ), wo x, y, α, β reell sind. Man dr¨ ucke (x, y) durch (α, β) aus. √ 14. Berechne i1+i in der Form a + ib und ( 3 + i)i . 15. Berechne die Fourier-Transformierte F (ω) der Funktion f (t) = e−ε|t| , ε > 0 und zeige, dass sie mit der Darstellung (2.90) der δ-Funktion u ¨bereinstimmt. 16. Berechne das Fourier-Spektrum F (ω ) der ged¨ampften Schwingung mit ur t ≥ 0, wobei γ > 0 ist. f (t) = 0 f¨ ur t < 0 und f (t) = e−γt cos ωt, f¨
3 Der Funktionenraum
3.1 Einleitung Im vorangehenden Abschn. 2.2.8 haben wir das System der orthogonalen Fourier-Funktionen kennen gelernt. Es erweist sich nun als sehr n¨ utzlich, die geometrische Vorstellung einzuf¨ uhren, dass dieses System von Funktionen ein unendliches orthogonales System von Einheitsvektoren im abstrakten, unendlich dimensionalen Raum der periodischen Funktionen definiert. Es gibt aber neben den Fourier-Funktionen noch eine ganze Reihe weiterer orthogonaler Funktionensysteme, die f¨ ur die Physik sehr n¨ utzlich sind und deren Eigenschaften wir kennen lernen wollen, da sie bei der L¨osung von Randwertproblemen partieller Differenzialgleichungen auftreten. Als solche partielle Differenzialgleichungen haben wir im Abschn. 1.4 etwa die Laplace’sche, Poisson’sche, d’Alembert’sche und W¨ armeleitungsgleichung besprochen. Ferner ist der Formalismus des Funktionenraumes, auch Hilbert-Raum genannt, der viele Analogien mit den Rechenoperationen von Vektoren und Tensoren im dreidimensionalen Kartes’schen Raum aufweist (siehe Anh. B), die mathematische Basis, auf der die Quantenmechanik aufgebaut ist.
3.2 Die Fourier-Reihen In der Physik gibt es sehr viele periodische Vorg¨ange, wie die Bewegung der Planeten, elektrische Schwingkreise, elektromagnetische Wellen und so fort. In den seltensten F¨ allen lassen sich diese periodischen Vorg¨ange durch die elementaren Sinus- und Cosinus-Funktionen beschreiben. Nun erkannte J. J. Fourier zu Anfang des 19. Jahrhunderts, dass eine große Klasse periodischer Funktionen sich in Form einer Reihe, bestehend aus Sinus- und CosinusFunktionen, oder ¨ aquivalent aus komplexen Exponentialfunktionen darstellen l¨ asst. Der Allgemeinheit wegen betrachten wir eine komplexe Funktion f (x),
72
3 Der Funktionenraum
welche die Periode 2 haben soll, d. h. f (x) = u(x) + iv(x) = f (x + 2 )
(3.1)
und versuchen, diese durch eine Reihe nach den orthogonalen, komplexen Fourier-Funktionen fn (x) darzustellen, die wir in Abschn. 2.2.8 als Beispiel betrachtet haben f (x) ∼ = S(x) =
+∞
+∞ nπ 1 cn fn (x) = √ cn e i x 2 n=−∞ n=−∞
(3.2)
und fragen unter welchen Bedingungen f (x) = S(x) ist, also in (3.2) das Gleichheitszeichen gilt. Zur Berechnung der Entwicklungskoeffizienten cn setzen wir voraus, dass die Reihe (3.2) gleichm¨ aßig konvergiert und wir daher Summation und Integration miteinander vertauschen k¨onnen. Wir multiplizieren die Reihe von links auf beiden Seiten mit fr∗ (x) und integrieren u ¨ber eine Periode (λ, λ + 2 ), wie wir dies in Abschn. 2.2.8 bereits vorgef¨ uhrt haben. Dann erhalten wir wegen der Orthogonalit¨atsrelation (2.80) f¨ ur die amlich Funktionen fn (x), n¨ λ+2 1 λ+2 −i (r−n)π x ∗ fr (x)fn (x)dx = e dx = δr, n , (3.3) 2 λ λ das folgende Resultat
λ+2
λ
fr∗ (x)f (x)dx =
+∞
λ+2
cn
n=−∞
fr∗ (x)fn (x)dx =
λ
+∞
cn δr, n = cr
n=−∞
(3.4) und nennt die so berechneten Koeffizienten 1 λ+2 −i nπ x cn = e f (x)dx 2 λ
(3.5)
die Fourier-Koeffizienten der Fourier-Reihe (3.2). F¨ ur die Berechenbarkeit der Integrale (3.5) gen¨ ugt es, anzunehmen, dass die Funktionen f (x) absolut integrabel sind, also λ+2 |f (x)|dx < ∞ (3.6) λ
ist, d. h. das Integral existiert und einen endlichen Wert hat. F¨ ur die folgenden ¨ Uberlegungen wollen wir aber voraussetzen, dass die Funktionen f (x) auch quadratintegrabel sind und folglich λ+2 |f (x)|2 dx < ∞ (3.7) λ
ur S(x) sein soll. Setzt man die Fourier-Koeffizienten cn in die Reihe (3.2) f¨ ein, so l¨ asst sich die Konvergenz dieser Reihe untersuchen. Ohne auf einen
3.2 Die Fourier-Reihen
73
Beweis einzugehen, wollen wir hier die beiden von L. Dirichlet formulierten hinreichenden Bedingungen f¨ ur die Konvergenz angeben, die bei den meisten physikalischen Problemstellungen erf¨ ullt sind. Danach konvergiert S(x), wenn die Funktion f (x) eine der folgenden Bedingungen erf¨ ullt: a) In λ ≤ x ≤ λ + 2 sei f (x) entweder stetig oder besitzt h¨ochstens eine endliche Anzahl von Unstetigkeitsstellen, wo f (x) um einen endlichen Wert springt. Ferner soll f (x) st¨ uckweise monoton sein, d. h. das Intervall in endlich viele Teilintervalle zerlegbar sein, sodass in jedem Intervall f (x) monoton ansteigt oder abf¨ allt. b) Anstelle der st¨ uckweisen Monotonie der Funktion f (x) kann auch die Bedingung treten, dass f (x) st¨ uckweise glatt ist, d. h. in den Teilintervallen f (x) und f (x) existieren und nur eine endliche Anzahl von endlichen Sprungstellen von f (x) und f (x) vorhanden sind. Unter einer der genannten Bedingungen liefert S(x) eine gleichm¨aßig konvergente Fourier-Reihe, die in den Bereichen des Intervalls λ ≤ x ≤ λ + 2 , wo f (x) stetig ist, diese Funktion darstellt, w¨ ahrend an den Sprungstellen S(x) einen Mittelwert liefert, n¨ amlich +∞
+∞ nπ 1 √ cn fn (x) = cn e i x S(x) = 2 n=−∞ n=−∞ ⎫ ⎧ f (x) , wo f (x) stetig ⎬ ⎨ 1 = [f (x + 0) + f (x − 0)] , wo f (x) unstetig . 2 ⎭ ⎩1 [f (λ + 0) + f (λ + 2
− 0)] , an den Intervallenden 2
(3.8)
Wenn f (x) eine rein reelle Funktion ist, kann man auch zu einer rein reellen Darstellung der Fourier-Reihe u ¨ bergehen. In diesem Fall muss gelten f ∗ (x) = f (x), denn dann ist f (x) reell. wenn wir dies in (3.8) einsetzen, folgt +∞ +∞ 1 ∗ −i nπ x 1 ∗ i nπ x cn e = √ c−n e S ∗ (x) = √ 2 n=−∞ 2 n=−∞ +∞ nπ 1 = S(x) = √ cn e i x , 2 n=−∞
(3.9)
wo in der zweiten Summe der Summationsindex n durch −n ersetzt werden konnte, da die Summe u ¨ ber (−∞ < n < +∞) zu erstrecken ist. Aus der Gleichung (3.9) folgt daher durch Koeffizientenvergleich zwischen der zweiten und dritten Summe, dass f¨ ur eine reelle Funktion f (x) f¨ ur die Koeffizienten der Fourier-Reihe gelten muss c−n = c∗n .
(3.10)
74
3 Der Funktionenraum
Wenn wir daher cn in Realteil und Imagin¨ arteil zerlegen und setzen cn =
1 (an − ibn ) , 2
so erhalten wir nach einsetzen in S(x) bei Beachtung von (3.10) " ! ∞ nπ nπ 1 a0 S(x) = √ an cos + x + bn sin x ,
2 2 n=1
(3.11)
(3.12)
n und Bn = √bn2 wobei es oft zweckm¨ aßiger ist, neue Koeffizienten An = √a2 einzuf¨ uhren. Mithilfe der Definition (3.5) der Fourier-Koeffizienten k¨onnen wir dann setzen λ+2 nπ nπ 1 1 cn = (an − ibn ) = √ cos x − sin x f (x)dx , (3.13) 2
2 λ
woraus sich f¨ ur die neuen Fourier-Koeffizienten An und Bn ergibt nπ 1 λ+2 A0 1 λ+2 = x dx , f (x)dx , An = f (x) cos 2 2 λ
λ
nπ 1 λ+2 Bn = x dx . (3.14) f (x) sin
λ
Daraus ist ersichtlich, dass A20 den Mittelwert der Funktion f (x) u ¨ ber das Periodenintervall darstellt. Da die Wahl von λ im Periodenintervall willk¨ urlich ist, k¨ onnen wir λ = − w¨ ahlen und das Periodenintervall (− ≤ x ≤ + ) betrachten. Dann k¨ onnen wir aus der Gleichung (3.14) folgendes schließen: Ist f (x) eine gerade Funktion, d. h. f (x) = f (−x), so verschwinden alle Koeffizienten Bn , da sin( nπ x) eine ungerade Funktion darstellt und folglich das Integral u ¨ber eine resultierende ungerade Funktion gleich Null ist. Wenn dagegen ¨ f (x) eine ungerade Funktion ist, verschwinden aus ¨ahnlichen Uberlegungen alle Koeffizienten An . Wir erhalten also im ersten Fall eine reine CosinusReihe und im zweiten Fall eine reine Sinus-Reihe. Beispiel Fourier-Reihe der Funktion f (x) = x: Wir wollen die Funktion f (x) = x im Intervall − ≤ x ≤ + in eine Fourier-Reihe entwickeln. Obgleich diese Funktion an sich nicht periodisch ist, k¨ onnen wir uns vorstellen, dass sie außerhalb des betrachteten Intervalls periodisch fortgesetzt wird. Im obigen Intervall wird dann die Fourier-Reihe mit f (x) u ¨bereinstimmen, da die Funktion dort monoton und stetig ist, doch in den Endpunkten des Intervalls wird S(x) = 0 sein, da dort die periodische Ersatzfunktion einen Sprung hat (vgl. Abb. 3.1). Probleme dieser Art, dass eine an sich aperiodische Funktion, die in einem bestimmten Bereich der x-Achse durch eine Fourier-Reihe dargestellt
3.2 Die Fourier-Reihen
75
Abbildung 3.1. Zur Fourier-Reihe der Funktion f (x) = x
werden soll, durch eine periodische Ersatzfunktion S(x) approximiert wird, treten in der Physik relativ h¨ aufig auf und wir werden sp¨ater noch Beispiele dieser Art kennen lernen. Da f (x) = x eine ungerade Funktion ist, erhalten wir eine reine Sinus-Reihe und die Fourier-Koeffizienten sind nπ 1 + x dx x sin Bn =
−
+ nπ nπ 1 2
1 + = − x cos x |− + x dx = (−1)n+1 . (3.15) cos nπ
nπ −
nπ Also lautet die Fourier-Reihe f (x) = x = S(x) =
∞ nπ 2 (−1)n+1 sin x π n=1 n
(3.16)
und wir stellen fest, dass f¨ ur x = ± , f (x) = ± = S(± ) = 0, in ¨ Ubereinstimmung mit der Dirichlet-Bedingung (3.8). Die Verallgemeinerung der Fourier-Reihen auf den zwei- oder dreidimensionalen Fall bereitet keine Schwierigkeiten unter der Annahme, dass in allen zwei oder drei Raumrichtungen dieselbe Periodenl¨ange 2 vorgegeben ist. Wir erhalten dann zum Beispiel die dreidimensionalen, normierten FourierFunktionen 1 i π (rx+sy++tz) (3.17) fr, s, t (x, y, z) = 3 e (2 ) 2 und die Fourier-Reihe lautet f (x, y, z) =
+∞
1 (2 )
3 2
r,s,t=−∞
π
cr,s,t ei (rx+sy++tz)
(3.18)
76
3 Der Funktionenraum
mit den Fourier-Koeffizienten λ+2 μ+2 ν+2 π 1 cr,s,t = e−i (rx+sy++tz) f (x, y, z)dxdydz . (3.19) 3 (2 ) 2 λ μ ν In den folgenden Abschnitten wollen wir nun zeigen, wie wir auf einem anderen Wege als in Abschn. 2.3.2 durch den Grenz¨ ubergang → ∞ von den Fourier’schen Reihen zum Fourier-Integral gelangen.
3.3 Das Fourier-Integral Zur Herleitung des Fourier-Integrals gehen wir von der Fourier-Reihe in folgender Form aus ! " +∞ ∞ + nπ 1 π 1 i nπ x cn e = f (ξ)dξ ei (x−ξ) , (3.20) f (x) = √ 2π n=−∞
2 n=−∞ − wobei wir auf der rechten Seite den Ausdruck (3.5) f¨ ur die Fourier-Koeffizienten explizit eingesetzt haben und λ = − aus gleich ersichtlichen Gr¨ unden = k nennen und dann w¨ ahlten. Wenn wir nun π = Δk taufen und nπ den Grenz¨ ubergang → ∞ durchf¨ uhren, d. h. zu einer unendlich großen Periodenl¨ ange u ¨ bergehen, so erhalten wir die Fourier’sche Integralidentit¨at +∞ +∞ 1 dkeikx e−ikξ f (ξ)dξ (3.21) f (x) = 2π −∞ −∞ ¨ und wir nennen in Ubereinstimmung mit Abschn. 2.3.2 +∞ 1 F (k) = e−ikξ f (ξ)dξ 2π −∞
(3.22)
die Fourier-Transformierte von f (x), wobei dann f (x) in der Form ausgedr¨ uckt wird +∞ f (x) = eikx F (k)dk . (3.23) −∞
Gelegentlich wird, ¨ ahnlich wie bei den Fourier-Reihen der Faktor 2 , auch hier der Faktor 2π auf die beiden Integrale (3.22,3.23) gleichm¨aßig als Vorfaktor √12π aufgespalten. Wenn f (x) eine reelle Funktion ist, dann ist wieder f (x) = f ∗ (x) und wir schließen daher aus der Gleichung (3.21), dass dann das Fourier’sche Integraltheorem lautet +∞ +∞ 1 dk cos[k(x − ξ)]f (ξ)dξ (3.24) f (x) = 2π −∞ −∞
3.3 Das Fourier-Integral
77
und da der Cosinus eine gerade Funktion darstellt, erhalten wir mithilfe des Additionstheorems der trigonometrischen Funktionen ∞ f (x) = [A(k) cos kx + B(k) sin kx]dk (3.25) 0
mit den reellen Fourier-Transformierten 1 +∞ 1 +∞ A(k) = cos(kξ)f (ξ)dξ , B(k) = sin(kξ)f (ξ)dξ . π −∞ π −∞
(3.26)
Die Fourier-Integraltransformation eignet sich also zur Darstellung aperiodischer Funktionen. F¨ ur die Konvergenz der auftretenden Integrale gen¨ ugt es, f¨ ur f (x) und F (k) Quadratintegrabilit¨ at vorauszusetzen und es sollen ahnliche Stetigkeitsbedingungen gelten, wie bei den Fourier-Reihen, also die ¨ Dirichlet-Bedingungen. Schließlich wollen wir noch zwei Beziehungen herleiten, die f¨ ur die praktischen Anwendungen des Fourier-Integrals in der Physik sehr n¨ utzlich sind. Dazu betrachten wir die zwei komplexen Funktionen f (x) und g(x) und bilden das Integral +∞ +∞ +∞ f ∗ (x)g(x)dx = f ∗ (x) eikx G(k)dk dx −∞
−∞ +∞
=
−∞
#
$ eikx f ∗ (x)dx G(k)dk
−∞
+∞
= 2π
F ∗ (k)G(k)dk ,
(3.27)
−∞
wobei wir zun¨ achst die Fourier-Transformation f¨ ur g(x) und danach, mit Vertauschung der Integrationsfolge, die Fourier-Umkehrtransformation f¨ ur f ∗ (x) angewandt haben. Die Identit¨ at (3.27) nennt man den ,,Parseval’schen Satz“ der Fourier-Analysis. Wenn insbesondere f (x) = g(x) ist, folgt der Spezialfall
+∞
−∞
|f (x)|2 dx = 2π
+∞
−∞
|F (k)|2 dk ,
(3.28)
der etwa in der Strahlungstheorie dazu dient, die Gesamtintensit¨at eines zeitlich begrenzten Wellenimpulses f (t) in die zugeordneten spektralen Intensit¨ aten |F (ω)|2 zu zerlegen. Dazu untersuchen wir folgendes Beispiel Fourier-Spektrum eines einfachen Wellenimpulses: Wir betrachten die einfache Funktion A , in − T ≤ t ≤ +T f (t) = . (3.29) 0 , außerhalb
78
3 Der Funktionenraum
Dann erhalten wir f¨ ur die Fourier-Transformierte F (ω) F (ω) =
A 2π
+T
−T
e−iωt dt = i
AT sin ωT A −iωT e . − eiωT = 2πω π ωT
(3.30)
Diese Funktion hat ihren maximalen Wert AT ur ωT → 0 und ihre ersten π f¨ Nullstellen bei ωT = ±π. Wenn man diese Funktion aufzeichnet, stellt man fest, dass sie außerhalb dieser ersten Nullstellen sehr rasch abklingt. Also ist der maximale Beitrag von F (ω) zum Spektrum des Impulses f (t) im Bereich − Tπ ≤ ω ≤ + Tπ . Wir erkennen daraus, dass mit wachsender Breite 2T des Wellenimpulses das Frequenzspektrum immer schmaler wird, und wir umgekehrt f¨ ur einen schmalen Impuls ein breites Frequenzspektrum erhalten. Dieses Resultat beinhaltet eine allgemeine Aussage der Fourier-Analysis. Wenn wir mit Δt die Breite eines beliebigen Wellenimpulses bezeichnen und mit Δω die Breite des korrespondierenden Fourier-Spektrums, so gilt stets Δω · Δt ∼ =1.
(3.31)
Dieses Resultat f¨ uhrt zum Beispiel in der Quantentheorie zu einer wichtigen Aussage. Nach de Broglie ist jedem Teilchen der Energie E durch die Beziehung E = ω eine Welle der Frequenz ω zugeordnet. Multipliziert man die h , so ergibt Gleichung (3.31) mit dem Planckschen Wirkungsquantum = 2π sich die Beziehung ΔE · Δt ∼ (3.32) =. Dies ist die Heisenberg’sche Unsch¨ arferelation zwischen Energie- und Zeitmessung an einem quantenmechanischen System. Doch ist die Beziehung (3.31) auch in der klassischen Wellenoptik von Interesse, da sie besagt, dass nur einer zeitlich unendlich ausgedehnten Welle eine scharfe Frequenz zuge¨ ordnet werden kann. H¨ atten wir schließlich unsere obigen Uberlegungen f¨ ur einen r¨ aumlich begrenzten Impuls f (x) im Bereich −X ≤ x ≤ +X angestellt aren und das Fourier-Spektrum F (k) der Wellenzahlen k = 2π λ berechnet, so w¨ ¨ wir durch analoge Uberlegungen zu der Beziehung zwischen der r¨aumlichen Breite des Impulses, Δx, und der Breite Δk des Wellenzahl-Spektrums gelangt, n¨ amlich Δk · Δx ∼ (3.33) =1, die mit der zweiten de Broglie-Beziehung zwischen dem Impuls und der Wellenzahl eines Teilchens, p = k, die zweite Heisenberg’sche Unsch¨arferelation Δp · Δx ∼ =
(3.34)
liefert, die eine Aussage u ¨ ber die gleichzeitige Impuls- und Ortsmessung an einem System macht. Eine wichtige Verallgemeinerung des Parseval’schen Theorems stellt der ,,Faltungssatz“ dar. Dieser hat betr¨ achtliche Bedeutung, etwa in der Nachrichtentechnik, wo es um die Angabe eines Maßes f¨ ur die Verzerrung eines
3.4 Orthogonale Funktionensysteme
79
u ¨bermittelten Signals geht. Zur Herleitung dieses Satzes betrachten wir das Integral u aumlich verschobene Funktionen und wenden auf dieses ¨ber zwei r¨ das Fourier-Theorem an, genau wie bei der Herleitung des Parseval’schen Satzes. Dann gilt +∞ +∞ +∞ f ∗ (x)g(ξ − x)dx = f ∗ (x) eik(ξ−x) G(k)dk dx −∞
−∞
−∞
+∞
= 2π
eikξ F ∗ (k)G(k)dk .
(3.35)
−∞
In der Physik wird nat¨ urlich nicht nur das eindimensionale Fourier-Theorem in Raum und Zeit ben¨ otigt, sondern auch die mehrdimensionale Verallgemeinerung, die jedoch leicht zu finden ist. So erhalten wir im dreidimensionalen Fall +∞ f (x, y, z) = ei(kx x+ky y+kz z) F (kx , ky , kz )d3 k (3.36) −∞
und die entsprechende Umkehrtransformation +∞ 1 F (kx , ky , kz ) = e−i(kx x+ky y+kz z) f (x, y, z)dv . (2π)3 −∞
(3.37)
3.4 Orthogonale Funktionensysteme Neben den bereits besprochenen Fourier-Funktionen fn (x) gibt es eine Reihe weiterer orthogonaler Funktionensysteme, durch welche beliebige Funktionen, jedenfalls solche, die den Dirichlet-Bedingungen gen¨ ugen, in einem bestimmten Intervall dargestellt werden k¨ onnen. Der von diesen Funktionen gewissermaßen als Einheitsvektoren aufgespannte Funktionenraum hat bestimmte Eigenschaften, die jenen des dreidimensionalen Kartes’schen Raumes und den in ihm definierten Vektoren und Tensoren sehr ¨ahnlich sind und wir wollen uns im Folgenden mit diesen Eigenschaften eingehender besch¨aftigen. 3.4.1 Das Skalarprodukt Wir betrachten in einem Intervall a ≤ x ≤ b zwei integrable komplexe Funktionen f (x) und g(x) und definieren in Analogie zur Vektorrechnung ihr Skalarprodukt durch das Integral b f ∗ (x)g(x)dx . (3.38) (f, g) = a
Dieses Integral ist f¨ ur komplexe Funktionen nicht kommutativ, denn man findet durch Vertauschung von f und g sofort, dass (g, f ) = (f, g)∗ ist. Doch ist dieses Skalarprodukt distributiv, denn man kann leicht zeigen, dass (f, g +
80
3 Der Funktionenraum
h) = (f, g) + (f, h) gilt, wenn h(x) eine weitere, im obigen Intervall definierte, Funktion ist. Wenn wir in (3.38), g = f setzen, erhalten wir b b (f, f ) = f ∗ (x)f (x)dx = |f (x)|2 dx ≥ 0 . (3.39) a
a
Wir setzen also voraus, dass die betrachteten Funktionen quadratintegrabel sein sollen. Man nennt (f, f ) die Norm von f oder bildlich gesprochen, die L¨ ange des Vektors f im Funktionenraum. Zu dieser Vorstellung gelangen wir in folgender Weise. Wir denken uns das Intervall [a, b] in N gleiche Teilintervalle Δx zerlegt und betrachten in jedem Intervall Mittelwerte fi , gi ; i = 1, · · · N der Funktionen f (x) und g(x). Dann k¨onnen wir das Integral (3.38) durch die Summe approximieren (f, g) ∼ =
N
fi∗ gi Δx
(3.40)
i=1
und dies ist als das Skalarprodukt zweier Vektoren mit komplexen Komponenten in einem N -dimensionalen Vektorraum aufzufassen (ein sogenannter unit¨ arer Vektorraum). Wenn dann N → ∞ geht und Δx → 0, wird die obige anschauliche Sprechweise verst¨ andlich. Im dreidimensionalen Kartes’schen Raum fanden wir f¨ ur das Skalarprodukt zweier Vektoren A und B: A · B = AB cos ϕ, woraus sich die Bedingung ergibt: A2 B 2 ≥ (A · B)2 , wobei das Gleichheitszeichen nur dann gilt, wenn A parallel oder antiparallel zu B orientiert ist. Eine ganz ¨ ahnliche Beziehung gilt auch hier im Funktionenraum und diese wird die ,,Cauchy-Schwarz’sche Ungleichung“ genannt. Zur Herleitung dieser Beziehung betrachten wir das folgende Skalarprodukt, gebildet aus der Linearkombination zweier Funktionen f und g in der Form f + λg, wo λ ein reeller Parameter ist (f + λg, f + λg) = (f, f ) + λ[(f, g) + (g, f )] + λ2 (g, g) ≥ 0 .
(3.41)
Wir untersuchen nun, f¨ ur welchen Wert von λ dieser Ausdruck den kleinsten Wert hat und setzen daher die Ableitung der Gleichung (3.41) nach λ gleich Null. Dies liefert nach elementarer Rechnung λ=−
(f, g) + (g, f ) 2(g, g)
(3.42)
und daher nach einsetzen in (3.41) (f, f )(g, g) ≥
1 [(f, g) + (g, f )]2 4
(3.43)
und wenn insbesondere f (x) und g(x) reelle Funktionen sind, sodass (f, g) = (g, f ) ist, so erhalten wir (f, f )(g, g) ≥ (f, g)2
(3.44)
3.4 Orthogonale Funktionensysteme
81
¨ in Ubereinstimmung mit der elementaren Formel der Vektoralgebra. In beiden F¨ allen (3.43,3.44) gilt das Gleichheitszeichen nur dann, wenn g = αf ist, wo α eine beliebige reelle Zahl sein kann. 3.4.2 Reihen nach orthogonalen Funktionen Als n¨ achstes sei angenommen, es existiert im Intervall [a, b] ein orthonormales Funktionensystem ϕn (x) derart, dass
b
ϕ∗m (x)ϕn (x)dx = δm,n
(3.45)
a
ist, wo m, n = 1, 2, · · · sind und wir wollen eine beliebige in [a, b] definierte Funktion f (x) durch eine Summe von der Form SN (x) =
N
an ϕn (x)
(3.46)
n=1
m¨ oglichst gut approximieren. Wir w¨ ahlen dazu die Bedingung, dass das mittlere Fehlerquadrat ein Minimum sein soll. Dies ist definiert durch (siehe Abschn. 8.3.2) 1 b−a
b
∗
[f (x) − Sn (x)] [f (x) − Sn (x)] dx = Min.
(3.47)
a
Setzen wir hier den Ansatz (3.46) f¨ ur Sn (x) ein, und multiplizieren die beiden Klammern aus, so erhalten wir ! " N N N 1 ∗ ∗ 2 (f, f ) − cn a n − cn a n + |an | = Min. , (3.48) b−a n=1 n=1 n=1 ∗ wobei wir im letzten Summanden zur Ausrechnung des Integrals u SN ¨ber SN die Orthogonalit¨ atsrelation (3.45) der ϕn (x) verwendet haben und zur Berechnung der beiden anderen Summen die verallgemeinerten Fourier-Koeffizienten cn durch die Gleichung definierten
b
cn =
ϕ∗n (x)f (x)dx .
(3.49)
a
Die drei letzten Summen in (3.48) k¨ onnen wir aber zusammenfassen, wenn wir die folgende Identit¨ at verwenden: (an − cn )∗ (an − cn ) = |an |2 − c∗n an − cn a∗n + |cn |2 . Damit erhalten wir dann ! " N 1 2 2 (f, f ) − |an − cn | − |cn | = Min. . (3.50) b−a n=1
82
3 Der Funktionenraum
Das mittlere Fehlerquadrat hat also seinen minimalen Wert, wenn die zun¨achst unbekannten Koeffizienten an mit den Fourier-Koeffizienten cn u ¨ bereinstimmen. Da aber aufgrund seiner Definition der Ausdruck (3.50) positiv oder gleich Null ist, erhalten wir die sogenannte Bessel’sche Ungleichung (f, f ) ≥
N
|cn |2 .
(3.51)
n=1
Nun ist die Frage von Interesse: Kann man in [a, b] ein orthogonales Funktionensystem finden, derart, dass ! " N 2 lim (f, f ) − |cn | = 0 (3.52) N →∞
n=1
ist. Wenn diese Bedingung erf¨ ullt ist, sagt man Sn (x) konvergiert im Mittel gegen f (x). Diese Art der Konvergenz unterscheidet sich wesentlich von der ur gleichm¨ aßigen Konvergenz, welche limN →∞ SN (x) = f (x) gleichm¨aßig f¨ alle x verlangt. Hat man ein solches System ϕn (x) gefunden, das nun aus unendlich vielen Funktionen besteht, so gilt wegen (3.52) (f, f ) =
∞
|cn |2
(3.53)
n=1
und man nennt diese Relation die Vollst¨ andigkeitsbeziehung oder den Parseval’schen Satz., den wir f¨ ur das Fourier-Integral, (3.27,3.28), bereits kennen gelernt haben. Zur Veranschaulichung dieser Beziehung, erinnern wir daran, dass man in der Vektorrechnung eine orthogonale Basis als vollst¨andig bezeichnet, wenn die Zahl der zueinander orthogonalen Basisvektoren gleich der Zahl der Dimensionen des Raumes ist. Denn dann k¨onnen wir, wie wir dies in der elementaren, dreidimensionalen Vektorrechnung in Abschn. 1.1 getan haben, jeden weiteren Vektor durch die Vektoren der Basis darstellen. Entsprechend kennzeichnet der Parseval’sche Satz die M¨oglichkeit, jede in a ≤ x ≤ b quadratisch integrable Funktion durch das Orthonormalsystem andige Funktionensystem, dessen Funktionen ϕn (x) darzustellen. Jedes vollst¨ gem¨ aß (3.45) eine endliche Norm besitzen, spannt einen unendlich dimensionalen Raum auf, den man Hilbert-Raum nennt. Den Parseval’schen Satz kann man auch als verallgemeinerten Satz von Pythagoras f¨ ur den Hilbert-Raum interpretieren, wo auf der linken Seite das Quadrat der L¨ange des Vektors f steht. Zusammenfassend gilt f¨ ur den Hilbert-Raum der Satz von Frigyes Riesz. Ist ein vollst¨ andiges, orthonormales Funktionensystem ϕn (x) vorgegeben und berechnet man f¨ ur irgend eine Funktion f (x), welche endliche Fourier-Koeffizienten cn , so wird Norm (f, f ) besitzt, die verallgemeinerten ∞ die Funktion f (x) genau durch die Reihe n=1 cn ϕn (x) dargestellt, wenn ∞ 2 |c | konvergiert, was dann nach dem Parseval’schen Satz gleich (f, f ) n n=1
3.4 Orthogonale Funktionensysteme
ist. Man schreibt dann f (x) =
∞
cn ϕn (x) ,
83
(3.54)
n=1
wobei das Gleichheitszeichen aber im Sinne der mittleren Konvergenz zu verstehen ist. Die Darstellung (3.54) einer Funktion f (x) gestattet die Herleitung einer anderen Form der Vollst¨ andigkeitsrelation eines Funktionensystems, die bei physikalischen Problemstellungen sehr h¨ aufig zur Anwendung kommt. Dazu setzen wir in (3.54) den expliziten Ausdruck (3.49) f¨ ur die verallgemeinerten Fourier-Koeffizienten ein und nehmen an, die Reihe sei gleichm¨aßig konvergent, was bei vielen Problemen der Fall ist. Dann k¨onnen wir Summation und Integration miteinander vertauschen und erhalten ! " ∞ b ϕ∗n (ξ)f (ξ)dξ ϕn (x) f (x) = a
n=1
b
f (ξ)dξ
= a
!
∞
" ϕn (x)ϕ∗n (ξ)
.
(3.55)
n=1
Dies kann aber nur dann eine Identit¨ at in f (x) sein, wenn gilt ∞
ϕn (x)ϕ∗n (ξ) = δ(x − ξ)
(3.56)
n=1
und wir schließen daraus, dass jedes vollst¨ andige Funktionensystem eine m¨ oglich Darstellung der Dirac’schen δ-Funktion liefert. 3.4.3 Operatoren im Hilbert-Raum Bei den physikalischen Anwendungen der Hilbert-Raum Theorie, insbesondere in der Quantenmechanik, sind von besonderem Interesse die unit¨aren und Hermite’schen Operatoren. Warum das so ist, wollen wir im Folgenden behandeln. Bei der Diskussion der elementaren Vektorrechnung in den Abschn. 1.2 ¨ und 1.6 haben wir gesehen, dass der Ubergang von einem Kartes’schen Achsenkreuz zu einem anderen, ¨ aquivalenten Basissystem durch eine orthogonale Transformation vermittelt wird, welch die L¨ ange eines Vektors invariant l¨asst (siehe auch Anh. B). Ganz analog fragen wir im Hilbert-Raum, welche Transformation die Norm eines Vektors f invariant l¨ asst. Dazu nehmen wir an, im Intervall [a, b] gebe es neben der vollst¨ andigen Basis der Funktionen ϕn (x) noch ein zweites, a ¨quivalentes System χr (x), das unseren Hilbert-Raum in gleicher Weise aufspannt. Wir haben daher die beiden Reihenentwicklungen f (x) =
∞ n=1
cn ϕn (x) =
∞ r=1
dr χr (x)
(3.57)
84
3 Der Funktionenraum
und k¨ onnen die Koeffizienten cn und dr als die Komponenten des Vektors f in Bezug auf die beiden Basissysteme auffassen. Nun entwickeln wir auf der rechten Seite die Basisfunktion χr in eine Reihe nach den Funktionen ϕs und erhalten mit den Entwicklungskoeffizienten Us, r ∞
cn ϕn (x) =
n=1
∞
dr
r=1
∞
Us, r ϕs (x) .
(3.58)
s=1
Jetzt multiplizieren wir die ganze Gleichung von links mit ϕ∗ (x) und integrieren u ¨ber das Intervall [a, b]. Dann liefert die Orthogonalit¨atsrelation der ϕn (x) ∞ U, r dr . (3.59) c = r=1
Nun berechnen wir das Quadrat der Norm des Vektors f und erhalten mithilfe von (3.59) (f, f ) =
∞
|c | = 2
∞ ∞ ∞
U,∗ r U, s d∗r ds
=1 r=1 s=1
=1
=
∞
|dr |2 ,
(3.60)
r=1
wobei die letzte Summe in (3.60) gelten muss, da sie, gem¨aß (3.57) das Quadrat der Norm von f in der Basis der χr (x) liefert. Daraus schließen wir, dass die Matrixelemente des Operators U der Bedingung gen¨ ugen m¨ ussen ∞ =1
U,∗ r U, s =
∞
U+ r, U, s = δr, s ,
(3.61)
=1
wonach U ein unit¨ arer Operator ist, der die Eigenschaft besitzt dass U +U = U U + = I
(3.62)
gilt, wo I den Einheitsoperator darstellt (siehe Anh. B.1.3). Aus (3.61) ist ersichtlich, dass die Matrixelemente des Operators U + erhalten werden, indem man in der Matrix von U Zeilen und Spalten miteinander vertauscht und von allen Matrixelementen den konjugiert komplexen Wert nimmt. Der unit¨ are Operator U hat also im Funktionenraum dieselbe Wirkung oder Bedeutung, wie die orthogonale Transformation im dreidimensionalen Kartes’schen Raum. Ein Vektor f im Hilbert-Raum ist also dadurch charakterisiert, dass seine Norm gegen¨ uber einer unit¨ aren Transformation invariant ist, ¨ bzw. der Ubergang von einer Basis ϕn zu einer anderen, ¨aquivalenten Basis χr durch eine unit¨ are Transformation vollzogen wird. Eine unit¨are Transformation muss nicht notwendig durch eine diskrete Matrixrelation von der Form (3.60) charakterisiert sein. Dies ist nur dann der Fall, wenn man von einer diskreten Basis zu einer anderen diskreten Basis u ¨ bergeht. Wenn dagegen die beiden Basen jeweils durch einen kontinuierlichen Parameter dargestellt werden k¨ onnen, so h¨ angt die unit¨ are Transformation kontinuierlich
3.4 Orthogonale Funktionensysteme
85
von den beiden Parametern ab. Ein wichtiges Paradebeispiel ist die FourierIntegraltransformation, da auch sie die Norm eines Vektors im Hilbert-Raum invariant l¨ asst, wie durch den Parseval’schen Satz ausgedr¨ uckt wird. Nachdem wir den Vektorbegriff so fruchtbringend aus dem dreidimensionalen Kartes’schen Raum in den Funktionenraum u ¨ bertragen konnten, ist es nahe liegend, auch das Analogon des Tensorbegriffes von Abschn. 1.6 im Funktionenraum aufzusuchen. In der Tensorrechnung in Abschn. 1.6 fanden wir, dass ein Tensor eine lineare Beziehung zwischen zwei Vektoren vermittelt, also symbolisch B = T A ist, wo A und B Vektoren sind. Im Hilbert-Raum setzen wir analog g = Of (3.63) und nennen O einen Operator, der einer zum Hilbert-Raum geh¨orenden Funktion f (x) eine andere, ebenfalls zu diesem Raum geh¨orende Funktion g(x) zuordnet. Die Menge aller Funktionen des Hilbert-Raumes, die in (3.63) an die Stelle von f gesetzt werden k¨ onnen, bilden den Definitionsbereich des Operators O. Die Menge der Funktionen g, die durch obige Relation dem Definitionsbereich zugeordnet werden, bilden den Wertebereich des Operators O. Besteht der Wertebereich von O nur aus reellen oder komplexen Zahlen, so nennt man O ein Funktional. Aus der Tensorrechnung u ¨ bernehmen wir ferner die lineare Beziehung O(αf + βh) = αOf + βOh ,
(3.64)
wo f und h zwei Vektoren des Hilbert-Raumes sind, die dem Definitionsbereich von O angeh¨ oren, w¨ ahrend α und β beliebige komplexe Zahlen sein k¨onnen. Wenn die Beziehung (3.64) erf¨ ullt ist, nennen wir O einen linearen Operator. Diese linearen Operatoren spielen in der Physik eine wichtige Rolle. Der oben diskutierte unit¨ are Operator ist ein solcher linearer Operator. Hinter der Linearit¨ at versteckt sich das f¨ ur die Physik so wichtige Superpositionsprinzip von L¨ osungen eines physikalischen Problems, insbesondere in der Wellenlehre, wie etwa bei den Schallwellen, den elektromagnetischen Wellen, den Gravitationswellen, den de Broglie-Wellen, etc. Da wir in der Tensorrechnung fanden, dass ein Tensor eine lineare Beziehung zwischen den Komponenten zweier Vektoren vermittelt, wollen wir die analoge Beziehung im Hilbert-Raum auffinden, die durch den Operator O zwischen den Vektoren f und g herbeigef¨ uhrt wird. Dazu w¨ ahlen wir im Hilbert-Raum eine beliebige Basis {ϕn } und entwickeln die beiden Vektoren f und g nach dieser Basis. Dann finden wir mithilfe der Linearit¨ at von O g(x) = dn ϕn (x) = Of (x) = cr Oϕr (x) . (3.65) n
r
Nun multiplizieren wir diese Gleichung von links mit ϕ∗ (x) und integrieren u ¨ber den Definitionsbereich. Dann erhalten wir mithilfe der Definition des
86
3 Der Funktionenraum
Skalarproduktes (3.38) und wegen der Orthogonalit¨at (3.45) der ϕn (ϕ , g) = dn (ϕ , ϕn ) = dn δ, n = (ϕ , Of ) = cr (ϕ , Oϕr ) . (3.66) n
n
r
Nun definieren wir die Matrixelemente des Operators O in der Basis der ϕn durch die Beziehung O,r = (ϕ , Oϕr ) =
b
ϕ∗ (x)Oϕr (x)dx
(3.67)
a
und erhalten daher aus (3.66) die gesuchte lineare Vektorbeziehung im Hilbert-Raum d = O, r cr (3.68) r
als Analogon zur Tensorrelation im dreidimensionalen Raum. Dabei sind die Fourier-Koeffizienten cr und d durch Beziehungen der Form (3.49) bestimmt. Da wir in der Tensorrechnung in Abschn. 1.6 erfahren haben, dass eine lineare Relation der Form B = T A ihre G¨ ultigkeit nicht ¨andert, wenn wir zu einem neuen orthogonalen Koordinatensystem u ¨ bergehen, ist zu vermuten, dass im Hilbert-Raum eine ¨ ahnliche Aussage gilt. Wenn wir n¨amlich die Vektoren f und g nach einer anderen ¨ aquivalenten Basis {χs (x)} entwickeln, so werden wir statt (3.68) eine Beziehung der Form erhalten = Om, (3.69) dm t ct , t
wo sich die gestrichenen Gr¨ oßen auf die neue Basis beziehen. Nun haben wir aber oben schon gesehen, dass ¨ aquivalente Basen durch eine unit¨are Transformation U miteinander verkn¨ upft sind. Daher gilt gem¨aß (3.59) Ur, s cs , d = U, n dn . (3.70) cr = s
n
Setzen wir dies in (3.68) ein, so folgt U, n dn = O, r Ur, t ct . n
r
(3.71)
t
+ Nun multiplizieren wir diese Gleichung von links mit Um, , summieren u ¨ber
und beachten die Beziehung (3.61) der unit¨ aren Transformation. Dann ergibt sich ! " ! " + + Um, U,n dn = dm = Um, O, r Ur, t ct (3.72) n
t
r
3.4 Orthogonale Funktionensysteme
87
und daraus schließen wir durch Vergleich mit (3.69) das Transformationsgesetz f¨ ur den Operator O beim Basis¨ ubergang + = Um, O,r Ur,t , (3.73) Om,t
r
was wir symbolisch in der Form ausdr¨ ucken k¨ onnen O = U + OU .
(3.74)
uhren Analog k¨ onnen wir ansetzen f = U f und g = U g, sodass sich nach einf¨ in (3.63) und Multiplikation von links mit U + ergibt g = U + OU f ,
(3.75)
also das oben etwas m¨ uhsam hergeleitete Resultat, was die N¨ utzlichkeit symbolischer Rechenoperationen verdeutlicht. Wenn wir einen Operator O = H betrachten, dessen Matrixelemente in einer beliebigen Basis die Eigenschaft haben, dass ∗ Hi,j = Hj,i (3.76) gilt, also die Matrixelemente auf der Hauptdiagonale reell sind und die Matrixelemente, die in Bezug auf die Hauptdiagonale zueinander spiegelsymmetrisch liegen, zueinander konjugiert komplex sind, dann nennt man diese Matrix Hermite’sch und H einen Hermite’schen Operator (siehe Anh. B). Allgemein nennt man einen Operator Hermite’sch, wenn f¨ ur beliebige Elemente f und g seines Definitionsbereiches gilt (f, Hg) = (Hf, g) .
(3.77)
Genau genommen ist in einem unendlich dimensionalen Raum ein HermiteOperator nicht unbedingt selbstadjungiert. Ein Operator H heißt selbstadjungiert, wenn er Hermite’sch ist und wenn bei Anwendung der Operatoren H ± iI, wo I der Einheitsoperator, auf den Definitionsbereich von H ein Wertebereich erzeugt wird, der den gesamten Hilbert-Raum bildet. Die HermiteOperatoren bilden eine wichtige Klasse, denn sie lassen sich h¨aufig, wenn auch nur in einem erweiterten Sinne, diagonalisieren. Sie bilden im Hilbert-Raum das Analogon zu den symmetrischen Tensoren im dreidimensionalen Kartes’schen Raum, von denen wir im Abschn. 1.6 gesehen haben, dass sie sich durch eine orthogonale Transformation diagonalisieren, bzw. auf Hauptachsen transformieren lassen. Nach dem bisher gesagten, ist zu erwarten, dass im Hilbert-Raum ein Hermite-Operator durch eine unit¨are Transformation diagonalisiert werden kann. Jene Basis von Funktionen ψn (x) im Hilbert-Raum, in welcher die Matrixdarstellung von H Diagonalform annimmt, wird dann das System von Eigenfunktionen des Hermite-Operators sein, also die L¨osung des Eigenwertproblems (3.78) Hψn (x) = hn ψn (x) ,
88
3 Der Funktionenraum
wo ψn (x) die Eigenfunktionen und hn die Eigenwerte genannt werden. Die L¨ osung dieses Eigenwertproblems im Hilbert-Raum ist also identisch mit der Auffindung der ,,Hauptachsen des Tensorellipsiods“ im Hilbert-Raum. Je nach der Basis, die der L¨ osung des Eigenwertproblems (3.78) zugrunde gelegt wird, kann man auf eine Matrixgleichung, eine Differenzialgleichung oder eine Integralgleichung gef¨ uhrt werden, wobei man bei den meisten physikalischen Problemen, insbesondere in der Quantentheorie auf die L¨osung von Matrixgleichungen oder Differenzialgleichungen gef¨ uhrt wird. In der sogenannten urlich die Matrixdarstellung diagonal, d. h. Eigenbasis ψn (x) von H ist nat¨ (ψn , Hψm ) = Hn,m = hn (ψn , ψm ) = hn δn, m ,
(3.79)
denn mithilfe von (3.77) k¨ onnen wir leicht zeigen, dass die Eigenfunktionen eines Hermite-Operators zueinander orthogonal sind, da (Hψn , ψm ) = hn (ψn , ψm ) = (ψn , Hψm ) = hm (ψn , ψm )
(3.80)
ist, woraus folgt (hn − hm )(ψn , ψm ) = 0
(3.81)
und wenn hn = hm ist, muss daher das Skalarprodukt der beiden Eigenfunktionen gleich Null sein. W¨ aren wir hingegen zur L¨osung des Eigenwertproblemes (3.78) von einer anderen Basis ϕn (x) im Hilbert-Raum ausgegangen, so w¨ aren wir auf eine Matrixgleichung ¨ ahnlich wie in der elementaren Tensorrechnung gef¨ uhrt worden. Denn wenn wir mithilfe einer unit¨aren Transformation die ψn (x) nach den ϕr (x) entwickeln und in (3.78) einsetzen, so erhalten wir Un, r Hϕr (x) = hn Un, r ϕr (x) . (3.82) r
r
Nun multiplizieren wir diese Gleichung von links skalar mit ϕs (x) und finden, nachdem wir alles auf eine Seite geschafft haben [(ϕs , H ϕr ) − hn (ϕs , ϕr )]Un, r = [Hs, r − hn δs, r ]Un, r = 0 , (3.83) r
r
wo s = 0, 1, 2, · · · ∞ ist. Die Beziehung (3.83) stellt also im Hilbert-Raum ein unendliches, homogenes lineares Gleichungssystem dar, dessen L¨osung, wie in der elementaren Tensorrechnung, einerseits die Bestimmung der Eigenwerte osung der ,,S¨ akulargleichung“ (siehe Anh. B) hn durch L¨ det[Hs, r − hn δs, r ] = 0
(3.84)
gestattet und gleichzeitig die Komponenten Un, r der zugeh¨origen Eigenvektoren in der Basis der {ϕr (x)} liefert, indem man das unendliche, homogene lineare Gleichungssystem (3.83) l¨ ost. Diese Eigenvektoren bilden aber gleichzeitig die Spalten der unit¨ aren Transformationsmatrix Un, r . Neben diesem, insbesondere f¨ ur die Quantentheorie so wichtigen Resultat, dass die L¨osung
3.5 Das Sturm-Liouville’sche Eigenwertproblem
89
des Eigenwertproblems eines linearen Hermite’schen Operators einerseits, im Sinne von (3.52,3.56) ein vollst¨ andiges und andererseits gem¨aß (3.79,3.81) ein orthonormales Funktionensystem liefert, haben diese Operatoren noch eine andere sehr wichtige Eigenschaft. Im allgemeinen werden zwei HermiteOperatoren H1 und H2 nicht miteinander kommutieren, d. h. wenn f ein beliebiger Vektor im Hilbert-Raum ist, wird gelten H1 H2 f = H2 H1 f .
(3.85)
Es wird also auf die Reihenfolge der beiden Operationen ankommen. Wenn aber der sogenannte Kommutator der beiden Operatoren verschwindet, also f¨ ur einen beliebigen Vektor f gilt [H1 , H2 ] f = (H1 H2 − H2 H1 ) f = 0 ,
(3.86)
dann besitzen die beiden Hermite-Operatoren ein gemeinsames System von Eigenfunktionen. Um dies nachzuweisen, gehen wir vom Eigenwertproblem (1) von H1 mit den Eigenfunktionen ψn (x) und Eigenwerten hn aus und wenden darauf den Operator H2 unter Ber¨ ucksichtigung von (3.86) an. Dann ergibt sich (3.87) H2 H1 ψn (x) = H1 H2 ψn (x) = h(1) n H2 ψn (x) , (1)
da ja der Eigenwert hn mit dem Operator H2 vertauscht werden kann. Aus dem letzten Teil der Gleichung schließen wir aber, dass nicht nur ψn (x) eine (1) Eigenfunktion von H1 zum Eigenwert hn ist, sondern auch H2 ψn (x) zum selben Eigenwert. Nun wollen wir aber annehmen, die Eigenwerte seien nicht entartet, d. h. es soll zu jedem Eigenwert nur eine Eigenfunktion geben. Dann kann aber (3.87) nur gelten, wenn H2 ψn (x) = αψn (x) ist, wo α eine Proportionalit¨ atskonstante darstellt. Dies bedeutet aber nichts anderes, als dass (2) ψn (x) auch Eigenfunktion von H2 ist mit dem Eigenwert α = hn , wobei im (1) (2) allgemeinen die beiden Eigenwertfolgen hn und hn der beiden Operatoren H1 und H2 nicht miteinander gleich sind. Der hier dargelegte Formalismus im Hilbert-Raum bildet die mathematische Basis der Quantentheorie.
3.5 Das Sturm-Liouville’sche Eigenwertproblem Die wichtigsten orthogonalen Funktionensysteme, die bei der L¨osung physikalischer Problemstellungen auftreten, sind Spezialf¨alle von L¨osungen der Sturm-Liouville’schen Differenzialgleichung, die folgendermaßen lautet d dy(x) p(x) − [q(x) − λr(x)]y(x) = 0 . (3.88) dx dx Sie ist eine gew¨ ohnliche, lineare Differenzialgleichung zweiter Ordnung, deren Koeffizienten p(x), q(x) und r(x) vorgegebene Funktionen der Koordinate x
90
3 Der Funktionenraum
sind. Diese Funktionen und somit die Differenzialgleichung sind in einem vorgegebenen Intervall [a, b] definiert. Wir wollen diese Differenzialgleichung in eine etwas andere Gestalt bringen, um den Zusammenhang mit dem vorangehenden Eigenwertproblem eines Hermite’schen Operators herzustellen. Dazu definieren wir den Sturm-Liouville-Operator d d L(x) = p(x) − q(x) (3.89) dx dx und k¨ onnen dann die Sturm-Liouville-Gleichung in der Form ausdr¨ ucken L(x)y(x) = −λr(x)y(x) .
(3.90)
Nun wollen wir zeigen, unter welchen Bedingungen der Operator L(x) ein selbstadjungierter Differenzialoperator ist, also f¨ ur zwei beliebige, in [a, b] definierte, reelle Funktionen f (x) und g(x), die wir als quadratisch integrabel voraussetzen, gelten soll b b [L(x)f (x)]g(x)dx = f (x)[L(x)g(x)]dx . (3.91) a
a
Setzt man hier den Ausdruck (3.89) f¨ ur L(x) ein, sieht man sofort, dass sich der Term mit q(x) auf beiden Seiten weghebt. Es bleibt also nur die Wirkung des Differenzialoperators zu untersuchen. Dazu betrachten wir die linke Seite von (3.91) und finden durch partielle Integration, dass b b b df (x) dg(x) d df (x) df (x) dx . − p(x) p(x) g(x)dx = p(x)g(x) dx dx a dx dx a dx a (3.92) Wenn wir dieselbe Rechenoperation auf der rechten Seite von (3.91) ausf¨ uhren, erhalten wir andererseits b b b d df (x) dg(x) dg(x) dg(x) f (x) p(x) p(x) dx = p(x)f (x) dx . − dx dx dx dx dx a a a (3.93) Also werden die beiden Ausdr¨ ucke (3.92) und (3.93) sich nur dann gegenseitig aufheben, wenn die Funktionen f (x) und g(x) folgende allgemeinen Randbedingungen in den Endpunkten des Intervalls [a, b] gen¨ ugen p(x)f (x)g(x)|a = p(x)f (x)g (x)|a b
b
(3.94)
und somit L(x) einen selbstadjungierten Differenzialoperator darstellt. Das Sturm-Liouville-Problem ist daher nur dann eindeutig definiert, wenn die Funktionen p(x), q(x) und r(x) in einem Intervall [a, b] eindeutig definiert sind und die L¨ osungen y(x) des Sturm-Liouville-Problems (3.88) ganz bestimmte Randbedingungen in den Endpunkten des Intervalls erf¨ ullen. Bei den praktischen Anwendungen sind am h¨ aufigsten die sogenannten homogenen Randbedingungen, wonach die L¨ osungen y(x) der Sturm-Liouville-Gleichung einer der folgenden Bedingungen gen¨ ugen m¨ ussen:
3.5 Das Sturm-Liouville’sche Eigenwertproblem
91
1. In den Intervallenden gilt y(a) = y(b) = 0, die sogenannte DirichletBedingung, oder y (a) = y (b) = 0, die sogenannte Neumann-Bedingung oder schließlich αy(a) + βy (a) = αy(b) + βy (b) = 0, die gemischte Bedingung mit α und β als vorgegebene Konstanten. 2. Wenn p(a) = 0 oder p(b) = 0 ist, gen¨ ugt es, in einem dieser Endpunkte y und y als endlich anzunehmen und im anderen Endpunkt eine der Bedingungen in Punkt 1. 3. Wenn p(b) = p(a) ist, k¨ onnen wir verlangen, dass y(b) = y(a) und y (b) = y (a) sind. Nun wollen wir zeigen, dass bei Erf¨ ullung einer dieser Randbedingungen, die L¨ osungen der Sturm-Liouville-Gleichung zueinander orthogonal sind. Dazu gen¨ ugt es, in die nun erf¨ ullte Bedingung (3.91) anstelle der Funktionen f (x) und g(x) zwei L¨ osungen yn (x) und ym (x) zu den Eigenwerten λn und λm einzusetzen. Dann erhalten wir mithilfe der Eigenwertgleichung (3.90)
b
{[L(x)yn (x)] ym (x) − yn (x) [L(x)ym (x)]} dx a
b
= −(λn − λm )
r(x)yn (x)ym (x)dx = 0 .
(3.95)
a
Da man aber zeigen kann, dass die Eigenwerte λn der Sturm-LiouvilleGleichung nicht entartet sind, d. h. es gibt zu jedem Eigenwert λn nur eine Eigenfunktion yn (x), schließen wir aus (3.95) auf die Orthogonalit¨atsrelation
b
r(x)yn (x)ym (x)dx = 0 ,
fu ¨ r n = m .
(3.96)
a
Ferner erf¨ ullen die Eigenfunktionen yn (x) das Normierungsintegral
b
r(x)[yn (x)]2 dx = Nn > 0 .
(3.97)
a
Wenn wir daher die L¨ osungen yn (x) normieren und die normierten Funktioonnen wir (3.96, 3.97) zusammenfassen und nen mit φn (x) benennen, so k¨ setzen b
r(x)φn (x)φm (x)dx = δn, m .
(3.98)
a
In den meisten praktischen F¨ allen, insbesondere wenn p(x), q(x) und r(x) regul¨ are Funktionen sind, d. h. in [a, b] keine Singularit¨aten aufweisen, und wenn p(x) und r(x) > 0 sind, dann erhalten wir f¨ ur eine der oben angegebenen Randbedingungen und f¨ ur ein endliches Intervall eine unendliche diskrete Folge von reellen Eigenwerten λn und Eigenfunktionen φn (x). Ferner sind diese Eigenfunktionen (außer im Fall (3) der periodischen Randbedingungen) nicht entartet. Diese Funktionensysteme sind auch vollst¨andig und spannen
92
3 Der Funktionenraum
daher einen Hilbert-Raum auf, in welchem das verallgemeinerte Skalarprodukt durch den Ausdruck b (f, g) = r(x)f (x)g(x)dx (3.99) a
definiert ist, wo r(x) eine Konvergenz erzeugende Gewichtsfunktion darstellt. Eine beliebige in [a, b] definierte Funktion f (x), die etwa den Dirichlet’schen Stetigkeitsbedingungen von Abschn. 3.2 gen¨ ugt, ist dann im Mittel durch folgende Reihe darstellbar cn φn (x) (3.100) f (x) = n
mit den verallgemeinerten Fourier-Koeffizienten b cn = (φn , f ) = r(x)φn (x)f (x)dx
(3.101)
a
und der Parseval’sche Satz hat nun die Gestalt b ∞ 2 r(x)[f (x)] dx = c2n , a
(3.102)
n=1
w¨ ahrend die Vollst¨ andigkeit des Funktionensystems nun auch durch die Beziehung ausgedr¨ uckt werden kann r(x)φn (x)φn (ξ) = δ(x − ξ) , (3.103) n
¨ wie, nach allem bisher gesagten, der Leser zur Ubung selbst nachpr¨ ufen m¨oge. Beispiele 1. Die Fourier-Funktionen Wir betrachten folgendes einfache Sturm-Liouville-Problem. Gegeben sei die Differenzialgleichung d2 y + k2 y = 0 . dx2
(3.104)
Sie ist eine gew¨ohnliche, lineare Differenzialgleichung zweiter Ordnung mit dem konstanten Koeffizienten k 2 > 0. Wir k¨onnen sie als eine SturmLiouville-Gleichung betrachten mit den Koeffizienten p = 1, q = 0, r = 1 und λ = k 2 . Um das Problem zu einem eindeutigen Randwertproblem zu machen, w¨ ahlen wir als Randbedingung die periodische Bedingung y(x) = y(x + 2 ). Die obige Gleichung kann mit dem Euler-Ansatz y = aeαx gel¨ost werden (siehe Abschn. 5.3.1). Wir erhalten beim einsetzen in (3.104) (α2 + k 2 )eαx = 0 ,
α = ±ik .
(3.105)
3.5 Das Sturm-Liouville’sche Eigenwertproblem
93
Die beiden L¨ osungen der Differenzialgleichung y = ae±ikx m¨ ussen nun der periodischen Randbedingung gen¨ ugen, d. h. ae±ikx = ae±ik(x+2) . Damit hier die beiden Seiten f¨ ur beliebige Werte x einander gleich sind, muss die Eigenullt sein. Wir haben aber in Abschn. 2.2 gelernt, wertbedingung e±ik2 = 1 erf¨ dass dies dann der Fall ist, wenn ±k2 = 2πn ist, wo n eine beliebige positive oder negative ganze Zahl sein kann. Damit lauten die gesuchten L¨osungen des Eigenwertproblems yn (x) = an ei
nπ x
,
n = ±1, ±2, · · ·
(3.106)
und dies sind die uns bereits wohlbekannten Fourier-Funktionen, wobei wir uhren k¨onnen. Damit sind dann noch den Normierungsfaktor an = √12 einf¨ die allgemeinsten L¨ osungen der Differenzialgleichung (3.104), welche den periodischen Randbedingungen gen¨ ugen jene, die mit den im Abschn. 3.2 dieses Kapitels besprochenen Fourier’schen Reihen identisch sind. Wir wollen noch darauf hinweisen, dass in diesem Beispiel mit periodischen Randbedingungen, das Eigenwertproblem in der Tat zweifach entartet ist, denn zu den Eigen 2 werten λ = k 2 = nπ geh¨ oren die beiden Eigenfunktionen mit n = ±|n|. 2. Ein einfaches inhomogenes Eigenwertproblem Da wir es sp¨ater mehrfach mit inhomogenen Eigenwertproblemen zu tun haben werden, denn viele physikalische Problemstellungen f¨ uhren auf solche Eigenwertaufgaben, wollen wir hier ein einfaches Beispiel behandeln, das uns auch gestattet neue Begriffsbildungen einzuf¨ uhren, die von viel allgemeinerer G¨ ultigkeit sind. Wir gehen dazu von der obigen Differenzialgleichung (3.104) aus, die nun aber einen linearen, harmonischen Oszillator beschreiben soll, der von einer ¨außeren periodischen Kraft K(t) = K(t+T ) angetrieben wird. Diese Differenzialgleichung lautet dann d2 y + ω02 y = K(t) , (3.107) d t2 achst wo ω0 = 2π T0 die Eigenfrequenz des Oszillators ist. Nun wollen wir zun¨ das homogene Eigenwertproblem d2 y + ω2y = 0 d t2
(3.108)
mit der periodischen Randbedingung y(t) = y(t + T ) l¨osen. Mit dem EulerAnsatz finden wir y = ae±iωt und mithilfe der Randbedingung und analogen ¨ Uberlegungen wie in Beispiel 1 ergeben sich nun die Frequenzen ωn = 2πn T . Daher erhalten wir f¨ ur die gesuchten Eigenfunktionen nach entsprechender Normierung 1 yn (t) = √ eiωn t , (3.109) T ugen. Wenn wir die wegen ihrer Normierung der Relation (yn , ym ) = δn, m gen¨ daher die gesuchte L¨ osung y(t) und die periodische Kraft K(t) der inhomogenen Gleichung (3.107) nach diesen Eigenfunktionen entwickeln und in die
94
3 Der Funktionenraum
Differenzialgleichung einsetzen, so erhalten wir −ωn2 + ω02 cn yn (t) = Kn yn (t) , n
(3.110)
n
wo die Kn = (yn , K) als die im Prinzip bekannten Fourier-Koeffizienten der periodischen Kraft anzusehen sind, w¨ ahrend die cn die unbekannten FourierKoeffizienten der gesuchten L¨ osung y(t) sind. Multipliziert man die Gleichung (3.110) von links mit ym (t) und integriert die Gleichung u ¨ ber das Periodenintervall [0, T ], dann erh¨ alt man mithilfe der Orthogonalit¨atsrelation der yn f¨ ur die unbekannten Fourier-Koeffizienten cn =
Kn − ωn2
ω02
und damit lautet die gesuchte L¨ osung Kn y(t) = yn (t) ω02 − ωn2 n
(3.111)
(3.112)
und wir erkennen, dass es f¨ ur eine bestimmte Eigenfrequenz ωn der periodischen Kraft zu einer Resonanzanregung kommen kann. Wenn wir schließlich in die L¨ osung (3.112) die explizite Form der Fourier-Koeffizienten Kn einsetzen, so erhalten wir bei Vertauschung von Integration und Summation die L¨ osung y(t) in der Form T yn (t)yn (t ) (3.113) y(t) = 2 − ω 2 K(t )dt ω 0 n 0 n und man nennt G(t − t ) =
yn (t)yn (t ) ω02 − ωn2
n
(3.114)
die Green’sche Funktion des inhomogenen Eigenwertproblems oder auch den ,,l¨ osenden Kern“ des Problems. Wir k¨ onnen daher die L¨osung (3.113) auch in der Form ausdr¨ ucken T G(t − t )K(t )dt (3.115) y(t) = 0 2
und wenn wir darauf den Operator ( ddt2 + ω02 ) anwenden, so soll sich die Quellfunktion K(t) ergeben. Das kann aber nur dann der Fall sein, wenn die Green’sche Funktion der Differenzialgleichung gen¨ ugt
2 d + ω02 G(t − t ) = δ(t − t ) . (3.116) d t2 Wenn wir das inhomogene Eigenwertproblem (3.107) mit dessen L¨osung (3.115) vergleichen, erkennen wir die Analogie mit folgenden Operatorrelationen im Hilbert-Raum. Wenn Of = g ist, sodass O−1 O = I erf¨ ullt ist, so
3.5 Das Sturm-Liouville’sche Eigenwertproblem
95
lautet die Umkehr der vorhergehenden Operatorgleichung f = O−1 g. Also hat in Analogie die Green-Funktion die Bedeutung eines inversen Operators im Hilbert-Raum. 3. Die Schr¨odinger-Gleichung im Impulsraum Der Einfachheit wegen betrachten wir im Koordinatenraum die zeitunabh¨ angige Schr¨odinger-Gleichung des linearen harmonischen Oszillators. Diese lautet −
2 d2 ψ κ + x2 ψ = Eψ , 2m dx2 2
(3.117)
h wo = 2π die Plancksche Konstante, m die Masse des Teilchens, κ die Konstante der r¨ ucktreibenden Kraft des Oszillators, E der Eigenwertparameter der Energie und ψ(x) die Wellenfunktion oder Zustandsfunktion im Koordinatenraum. Ersichtlich handelt es sich um eine Differenzialgleichung vom Sturm-Liouville’schen Typ, die wir in Abschn. 5.6.1 l¨osen werden. Wir wenden auf die Gleichung (3.117) die Fourier-Integraltransformation an und beachten dabei, dass nach de Broglie dem Impuls p eines Teilchens eine Wellenzahl k durch die Beziehung p = k zugeordnet ist. Daher k¨onnen wir die Fourier-Integraltransformation in der Form ansetzen i (3.118) ψ(x) = φ(p)e px dp .
Beim Einsetzen in die obige Schr¨ odinger-Gleichung ergibt sich bei Vertauschung von Integration und Differenziation i κ 2 2 d2 px x + − E e − φ(p)dp = 0 . (3.119) 2m dx2 2 Nun ist aber wegen der Identit¨ at i
x2 e px = −2
d2 i px e dp2
(3.120)
die Gleichung (3.119) a ¨quivalent mit 2 p 2 κ d2 i px − −E e φ(p)dp = 0 . 2m 2 dp2
(3.121)
In der letzten Gleichung bezieht sich die Differenziation nach p zun¨achst auf die Exponentialfunktion. Doch da bei entsprechenden Randbedingungen f¨ ur d2 φ(p) an den Grenzen (+∞, −∞) der Differenzialoperator dp2 selbstadjuni
giert ist, k¨ onnen wir in (3.121) die Differenziation nach p von e px auf φ(p) hin¨ uberschaffen und erhalten nach dieser Transformation die Integralbedingung 2 p 2 κ d2 i px − − E φ(p) = 0 . (3.122) e dp 2m 2 dp2
96
3 Der Funktionenraum i
Nun multiplizieren wir diese Gleichung von links mit e− p x und integrieren dann die Gleichung u ¨ ber x, wobei wir die Reihenfolge der Integrationen u ¨ber x und p miteinander vertauschen. Dies ergibt 2 κ d2 p2 − E φ(p)δ(p − p ) = 0 , 2π dp − + (3.123) 2 dp2 2m denn es gilt aufgrund der Definition der δ-Funktion i e (p−p )x dx = 2πδ(p − p ) .
(3.124)
Also lautet schließlich die Fourier-Transformierte der Schr¨odinger-Gleichung im Impulsraum 2 κ d2 p2 − E φ(p) = 0 (3.125) − + 2 dp2 2m und diese hat ersichtlich ¨ ahnliche Struktur wie die Ausgangsgleichung und man findet in der Tat, dass die Schr¨ odinger-Gleichung des harmonischen Oszillators im Koordinaten- und Impulsraum dieselben L¨osungen besitzt. Der Leser m¨ oge versuchen, nachzuvollziehen, dass wir hier im kontinuierlichen Spektrum der x- und p-Werte eine ganz ¨ ahnliche unit¨are Transformation durchgef¨ uhrt haben, wie sie im vorhergehenden Abschn. 3.4.3 im diskreten Spektrum dargelegt wurde. ¨ Ubungsaufgaben 1. Entwickle die Funktion f (x) = x2 im Intervall − ≤ x ≤ + in eine Fourier-Reihe. 2 2. Berechne die Fourier-Transformierte der Funktion f (x) = e−αx , wo α > 0 ist und zeige, dass auch hier eine Beziehung der Form Δk · Δx ∼ = 1 gilt. 3. Berechne durch dreidimensionale Fourier-Integraltransformation die Sinusverteilung eines Elektrons im Grundzustand des Wasserstoffatoms. Die entsprechende Zustandsfunktion im Koordinatenraum ist gegeben durch 1 −3 − r ψ(r) = √ a0 2 e a0 , π 2
wo a0 = me 2 der Bohrsche Radius ist, wenn m die Masse und −e die Ladung des Elektrons sind. 4. Bestimme die Eigenwerte und normierten Eigenfunktionen des folgenden Eigenwertproblems. Gegeben sei die Differenzialgleichung y + k 2 y = 0, deren L¨ osungen im Intervall [0, L] zu suchen sind, die den Randbedingungen y(0) = 0 und y(L) = 0 gen¨ ugen. 5. Gegeben sei das inhomogene Eigenwertproblem y + k02 y = lx − x2 . Man finde die L¨ osung des inhomogenen Problems mithilfe der Eigenfunktionen der vorangehenden Aufgabe und berechne die Green’sche Funktion.
3.5 Das Sturm-Liouville’sche Eigenwertproblem
97
6. Wir fanden unter den Beispielen von Abschn. 2.2.5, dass das elektrische Feld einer ebenen elektromagnetischen Welle von der Form E(r, t) = Eeiϕ mit ϕ = ωt − k · x der d’Alembert’schen Wellengleichung gen¨ ugt. Schreibt man den Wellenvektor k in der Form k =kn, wo n ein Einheitsvektor in Fortpflanzungsrichung der Welle ist und beachtet, dass ucken k = ωc gilt, so kann man die Phase ϕ auch in der Form ausdr¨ ). Zeige mithilfe der Fourier-Integraltransformation, dass ϕ = ω(t − n·r c das E-Feld einer ebenen elektromagnetischen Welle aus Wellen beliebiger Frequenzen und Amplituden in die Form gebracht werden kann Ex(r, t) = E(t − n·r c ) und verifiziere durch direkte Ausrechnung, dass dieser Ausdruck in der Tat eine L¨ osung der d’Alembert’schen Wellengleichung ist. 7. Betrachte eine schwingende Saite, die von außen durch eine Kraft K(t) = K0 cos ω0 t periodisch angetrieben wird. Die Saite hat die L¨ange L und ist in ihren Endpunkten eingespannt. Ihre Differenzialgleichung lau¨ = K(t). Bestimme zun¨achst die Eigenschwintet ψ (x, t) − c12 ψ(x.t) gungen des homogenen Problems mit K(t) = 0 und finde anschließend die L¨ osung des inhomogenen Problems mithilfe der Methode der Green-Funktion. Beachte dazu die Anfangsbedingungen, dass f¨ ur t = 0, ˙ = 0) = 0 sind. K(t = 0) = K0 und K(t
4 Partielle Differenzialgleichungen
4.1 Einleitung Bei der Behandlung mehrdimensionaler physikalischer Problemstellungen wird man h¨ aufig auf partielle Differenzialgleichungen gef¨ uhrt. Unter diesen Differenzialgleichungen spielen die linearen partiellen Differenzialgleichungen zweiter Ordnung eine besonders wichtige Rolle, da hier das Superpositionsprinzip erf¨ ullt ist. Dies bedeutet, wenn φ1 und φ2 zwei L¨osungen der Differenzialgleichung sind, dann ist auch ψ = aφ1 + bφ2 eine L¨osung, wo a und b beliebige Konstanten sind. Im allgemeinen haben diese Differenzialgleichungen nur dann eine eindeutige L¨ osung, wenn bestimmte Rand- und oder Anfangsbedingungen vorgegeben sind. In den vorangehenden Kapiteln haben wir bereits anhand von Beispielen die f¨ ur die Physik wichtigsten partiellen Differenzialgleichung hergeleitet, die wir im Folgenden etwas eingehender behandeln wollen.
4.2 Lineare partielle Differenzialgleichungen der Physik Die in der Physik am h¨ aufigsten auftretenden partiellen Differenzialgleichungen sind die folgenden: 1. Die Laplace’sche und Poisson’sche Differenzialgleichung ΔΦ = 0 ,
ΔΦ = −αρ ,
(4.1)
2. Die Helmholtz’sche Amplitudengleichung ΔΦ + k 2 Φ = 0 ,
ΔΦ + k 2 Φ = −αρ ,
(4.2)
3. Die d’Alembert’sche Wellengleichung ΔΦ −
1 ∂2 Φ=0, c 2 ∂ t2
ΔΦ −
1 ∂2 Φ = −αρ , c 2 ∂ t2
(4.3)
100
4 Partielle Differenzialgleichungen
4. Die Diffusions- und W¨ armeleitungsgleichung ΔΦ − κ
∂ Φ=0, ∂t
ΔΦ − κ
∂ Φ = −αρ , ∂t
Die Schr¨ odinger-Gleichung ∂ 2 Δ + V (r, t) − i − Φ=0. 2m ∂t
(4.4)
(4.5)
Wie bereits fr¨ uher anhand von Beispielen in Kap. 1 und Kap. 3 diskutiert, werden die Funktionen ρ(r) oder ρ(r, t) Quellfunktionen der Differenzialgleichung genannt. Ist ρ = 0 heißt die partielle Differenzialgleichung homogen. Wenn hingegen ρ = 0 ist, wird die Gleichung inhomogen genannt. Die aufgelisteten Differenzialgleichungen geh¨ oren verschiedenen Typen an. Je nach Typus, sind f¨ ur eine eindeutige L¨ osung verschiedene Rand- und/oder Anfangsbedingungen zu erf¨ ullen. Diese Typeneinteilung lautet: 1. Die elliptischen Differenzialgleichungen: Hierzu geh¨ oren die Laplace-, die Poisson- und die Helmholtz-Gleichung. F¨ ur eine eindeutige L¨ osung muss das betrachtete Fl¨achen- oder Raumgebiet durch eine geschlossene Kurve oder Oberfl¨ache begrenzt sein, die gelegentlich auch ins Unendliche verschoben werden kann. Auf dieser Begrenzung m¨ ussen entweder a) Dirichlet-Randbedingungen vorgegeben sein, d. h. Φ = F (r) ist auf der Berandung bekannt oder b) Neumann-Bedingungen, wenn man ∇Φ = G(r) am Rand kennt. c) Den Fall einer gemischten Randbedingung wollen wir erst sp¨ater diskutieren. 2. Die hyperbolischen Differenzialgleichungen: Dazu geh¨ ort insbesondere die d’Alembert’sche Wellengleichung. In diesem Fall muss das Raumgebiet offen sein, also etwa ein St¨ uck der x-Achse oder der (x, y)-Ebene und dort muss zu einer bestimmten Zeit, etwa t = 0, Φ(t = 0) = F (r) und ∂∂t Φ(t = 0) = G(r) vorgegeben sein, wo F (r) und G(r) Funktionen sind, die sich aus der physikalischen Problemstellung ergeben. Wir haben es hier mit einer sogenannten Cauchy’schen Anfangsbedingung zu tun. Dies ist ¨ ahnlich wie bei den gew¨ohnlichen linearen Differenzialgleichungen zweiter Ordnung, wo auch zwei Anfangswerte f¨ ur eine eindeutige L¨ osung anzugeben sind, nur dass wir hier Anfangsfunktionen vorzugeben haben. 3. Die parabolische Differenzialgleichung: Dazu geh¨ oren die Diffusions- oder W¨ armeleitungsgleichung und die Schr¨odinger-Gleichung. Hier muss die Berandung gleichfalls offen sein, doch da es sich um eine Differenzialgleichung 1. Ordnung in der Zeit handelt, gen¨ ugt eine Anfangsfunktion Φ(t = 0) = F (r).
4.2 Lineare partielle Differenzialgleichungen der Physik
101
Die Bezeichnungen elliptisch, hyperbolisch und parabolisch haben ihren Ursprung in gewissen Verwandtschaften der Struktur dieser Differenzialgleichungen mit der quadratischen Form, aus der die Einteilung der Kegelschnitte folgt, doch soll auf diesen Zusammenhang nicht n¨ aher eingegangen werden. Um einzusehen, dass in vielen F¨allen bei der Behandlung von Anfangswertproblemen der d’Alembert-Gleichung und W¨ armeleitungsgleichung noch weitere Randbedingungen vorzugeben sind, leiten wir aus der d’Alembert-Gleichung durch Fourier-Transformation die Helmholtz-Gleichung her. Wir gehen aus von der inhomogenen d’Alembert-Gleichung ΔΦ −
1 ∂2 Φ = −αρ c 2 ∂ t2
und machen die Fourier-Integralans¨ atze +∞ Φ= eiω t Φ(x, y, z; ω)dω , ρ = −∞
+∞
(4.6)
eiω t ρ(x, y, z; ω)dω .
(4.7)
−∞
Geht man mit diesen Ans¨ atzen in die d’Alembert’sche Wellengleichung ein und schafft alles auf eine Seite, so ergibt sich
+∞ ω2 e−iωt Δ + 2 Φ(x, y, z, ω) + αρ(x, y, z, ω) dω = 0 . (4.8) c −∞
Doch wenn wir diese Gleichung von links mit e+iω t multiplizieren und u ¨ber t integrieren, dann liefert diese Integration 2πδ(ω − ω ), sodass man schließlich durch Integration u ur die Fourier-Transformierte ¨ ber ω f¨ Φ(x, y, z, ω) die Helmholtz’sche Differenzialgleichung (4.2) erh¨alt, deren L¨ osungen weitere Randbedingungen zu erf¨ ullen haben. Analog kann man zeigen, dass sich die W¨ armeleitungsgleichung auf die HelmholtzGleichung zur¨ uckf¨ uhren l¨ asst. Dies kann etwa mithilfe der LaplaceTransformation erfolgen, die wir erst in Abschn. 7.4 u ¨ ber die Theorie komplexer Funktionen behandeln werden. Je nachdem ob das physikalische Problem auf eine homogene oder inhomogene partielle Differenzialgleichung der obigen Typen f¨ uhrt, bieten sich verschiedene L¨osungsmethoden an, von denen wir die wichtigsten nennen, die in diesem Buch zur Anwendung kommen werden: A) Die Differenzialgleichung ist homogen und die L¨osungen gen¨ ugen homogenen Randbedingungen, d. h. die Quellfunktion ρ = 0 und die Randfunktionen F (r) und G(r) haben den Wert Null oder sind Konstante. F¨ ur einige Koordinatensysteme k¨onnen dann die partiellen Differenzialgleichungen durch die Methode der Separation gel¨ost werden und man wird meist auf Sturm-Liouville’sche Eigenwertprobleme gef¨ uhrt. Im unendlichen Raumgebiet f¨ uhren auch die Fourier- und Laplace-Transformationen zum Ziel.
102
4 Partielle Differenzialgleichungen
B) Die Differenzialgleichungen sind inhomogen und/oder erf¨ ullen inhomogene Randbedingungen. In diesem Fall ist ein geeignetes L¨osungsverfahren die Methode der Green-Funktion, doch kann man auch mit Fourier- oder Laplace-Transformation in manchen F¨allen die L¨osung finden.
4.3 Die Separationsmethode Zur Erl¨ auterung der Separationsmethode betrachten wir zun¨achst ein einfaches Beispiel, um anschließend die homogene Helmholtz-Gleichung in Kartes’schen Koordinaten, Kugelkoordinaten und Zylinderkoordinaten zu separieren, da wir so auf die wichtigsten speziellen Funktionen der Physik gef¨ uhrt werden. 4.3.1 Beispiel L¨osung der eindimensionalen homogenen Diffusionsgleichung: Wir betrachten die Gleichung ∂Φ ∂2Φ , (4.9) a 2 = ∂x ∂t wo gem¨ aß (4.4) a = κ1 gesetzt wurde und wir suchen die L¨osung Φ(x, t) dieser Gleichung f¨ ur t ≥ 0 im Intervall 0 ≤ x ≤ L, wo die L¨osung der Randbedingung Φ(0, t) = Φ(L, t) = 0 gen¨ ugen soll. Ferner sei f¨ ur t = 0 die Anfangsbedingung Φ(x, 0) = F (x) vorgegeben. Zur L¨osung der Gleichung versuchen wir den Separationsansatz Φ(x, t) = y(x)T (t) .
(4.10)
Wenn wir dies in die Differenzialgleichung einsetzen und die Gleichung durch den Ansatz dividieren, so erhalten wir 1 dT (t) 1 d2 y(x) . = 2 y(x) dx aT (t) dt
(4.11)
Sobald diese Gleichung f¨ ur beliebige Werte x und t gelten soll, kann dies nur dann erf¨ ullt sein, wenn beide Seiten gleich einer Konstanten sind. Der Bequemlichkeit wegen nennen wir diese Konstante −k 2 . Damit zerf¨allt die partielle Differenzialgleichung in zwei gew¨ ohnliche Differenzialgleichungen, n¨ amlich dT (t) d2 y(x) = −ak 2 T (t) . + k 2 y(x) = 0 , (4.12) dx2 dt
4.3 Die Separationsmethode
103
Die zweite dieser Gleichungen k¨ onnen wir elementar l¨osen, denn wir erhalten durch Variablentrennung (siehe Anh. A.3.1) dT = d ln T = −ak 2 d t , T
T (t) = T0 e−ak
2
t
,
(4.13)
wobei die m¨ oglichen Werte von k 2 noch zu bestimmen sind. Dies geschieht mithilfe der ersten Gleichung in (4.12), denn sie bildet, wie wir bereits aus dem vorangehenden Abschn. 3.5 wissen, ein elementares Sturm-Liouville’sches Problem. Mithilfe des Euler’schen L¨ osungsansatzes fanden wir dort die beiden L¨ osungen y(x) = e±ikx , oder y(x) = A cos kx + B sin kx .
(4.14)
Wegen der beiden zu Anfang gestellten Randbedingungen Φ(0, t) = 0 und Φ(L, t) = 0, muss zun¨ achst jedenfalls der Koeffizient A = 0 sein, da die Cosinus-Funktion bei x = 0 nicht verschwindet. Die Erf¨ ullung der zweiten Randbedingung erfordert sin kL = 0 ,
kL = nπ ,
n = 1, 2, 3, · · · .
(4.15)
Daher sind die gesuchten Eigenfunktionen des Problems yn (x) = Bn sin
nπ x, L
(4.16)
wobei die Werte n = −1, −2, −3, · · · keine neuen L¨osungen ergeben und eine partikul¨ are L¨ osung der Diffusionsgleichung lautet dann 2
Φn (x, t) = T0 e−ak t Bn sin
nπ x. L
(4.17)
Also kann die gesuchte allgemeine L¨ osung in der Form einer Fourier-SinusReihe ausgedr¨ uckt werden, indem wir T0 mit Bn zu einem Koeffizienten verschmelzen ∞ nπ 2 nπ x. (4.18) Bn e−a( L ) t sin Φ(x, t) = L n=1 Schließlich haben wir noch die Anfangsbedingung zu erf¨ ullen. Es muss also gelten ∞ nπ Φ(x, 0) = F (x) = x. (4.19) Bn sin L n=1 Wir multiplizieren diese Gleichung von links mit sin mπ ¨ ber L x und integrieren u das Intervall [0, L]. Dies liefert
L
dx sin 0
L ∞ nπ nπ mπ x F (x) = x sin x dx . Bn sin L L L 0 n=1
(4.20)
104
4 Partielle Differenzialgleichungen
Doch kann man mithilfe des Additionstheorems der Cosinus-Funktionen (2.45) in Abschn. 2.2.5 leicht zeigen, dass L nπ mπ x sin x dx sin L L 0 ! " L L 1 L (m − n)π (m + n)π = x− x = δm,n (4.21) dx cos dx cos 2 0 L L 2 0 ist und daher erhalten wir f¨ ur die Fourier-Koeffizienten nπ 2 L x F (x) . Bn = dx sin L 0 L
(4.22)
Wenn wir zum Beispiel zur Zeit t = 0 einen Farbtropfen an der Stelle x0 in eine Fl¨ ussigkeit einbringen, k¨ onnen wir dessen Anfangsverteilung n¨ aherungsweise durch F (x) = F0 δ(x − x0 ) beschreiben. Dann k¨onnen die Koeffizienten Bn sofort berechnet werden und wir erhalten als L¨osung des Diffusionsproblems ∞ nπ nπ 2 2F0 −a( nπ L ) t sin x0 sin x . (4.23) e Φ(x, t) = L n=1 L L 4.3.2 Separation der Helmholtz-Gleichung Separation in Kartes’schen Koordinaten In Kartes’schen Koordinaten (x, y, z) lautet die Helmholtz-Gleichung
2 ∂2 ∂2 ∂ + 2 + 2 Φ(x, y, z) + k 2 Φ(x, y, z) = 0 . (4.24) ∂x2 ∂y ∂z Wir machen den Separationsansatz Φ(x, y, z) = X(x)Y (y)Z(z) ,
k 2 = kx2 + ky2 + kz2
(4.25)
und erhalten so die drei Differenzialgleichungen X + kx2 X = 0 ,
Y
+ ky2 Y = 0 ,
Z + kz2 Z = 0 .
(4.26)
Wenn etwa periodische Randbedingungen vorgegeben sind, also X(x) = X(x + 2Lx ) ,
Y (y) = Y (y + 2Ly ) ,
Z(z) = Z(z + 2Lz ) , (4.27)
dann lautet eine partikul¨ are L¨ osung der Differenzialgleichung “
Φnx ,ny ,nz (x, y, z) = Anx ,ny ,nz e
iπ
nx Lx
n
nz x+ Ly y+ L z y z
”
und die allgemeine L¨ osung ist dann
nx ny nz Φ(x, y, z) = Anx ,ny ,nz exp iπ x+ y+ z . Lx Ly Lz n ,n ,n x
y
z
(4.28)
(4.29)
4.3 Die Separationsmethode
105
Separation in Kugelkoordinaten Die Kugelkoordinaten haben wir in Abschn. 1.5.2 eingef¨ uhrt und dort den Laplace-Operator in diesen Koordinaten angegeben. Die Helmholtz-Gleichung lautet dann
1 ∂ ∂2 1 ∂ ∂ 1 2 ∂ Φ(r, ϑ, ϕ) r + sin ϑ + r2 ∂r ∂r sin ϑ ∂ϑ ∂ϑ sin2 ϑ ∂ϕ2 +k 2 Φ(r, ϑ, ϕ) = 0 . (4.30) Zuerst machen wir den Separationsansatz Φ(r, ϑ, ϕ) = R(r)Y (ϑ, ϕ) ,
(4.31)
setzen dies in die Differenzialgleichung ein und dividieren wie im Beispiel von Abschn. 4.3.1 durch den L¨ osungsansatz. Dies liefert nach Trennung in den radialen und in den winkelabh¨ angigen Anteil 1 d d R(r) r2 + k 2 r2 R(r) d r dr
1 ∂ 1 ∂Y (ϑ, ϕ) 1 ∂ 2 Y (ϑ, ϕ) =− . (4.32) sin ϑ + Y (ϑ, ϕ) sin ϑ ∂ϑ ∂ϑ ∂ϕ2 sin2 ϑ Damit diese Gleichung f¨ ur alle r, ϑ, ϕ erf¨ ullt ist, m¨ ussen beide Seiten gleich einer Konstanten sein, die wir zweckm¨ aßig ( + 1) taufen, wo = 0, 1, 2, · · · sein kann, wie wir in Abschn. 5.4 n¨ aher begr¨ unden werden. Danach erhalten wir die beiden Differenzialgleichungen 2
( + 1) R(r) = 0 (4.33) R (r) + R (r) + k 2 − r r2 und 1 ∂ sin ϑ ∂ϑ
∂Y (ϑ, ϕ) 1 ∂ 2 Y (ϑ, ϕ) + ( + 1)Y (ϑ, ϕ) = 0 . (4.34) sin ϑ + ∂ϑ ∂ϕ2 sin2 ϑ
Da in der ersten Gleichungen (4.33) k = 2π uhrt man λ die Wellenzahl ist, f¨ zweckm¨ aßig eine dimensionslose Variable ρ = kr ein und erh¨alt mit R = R(ρ) die Gleichung 2
( + 1) R + R + 1 − R=0 (4.35) ρ ρ2 und wenn wir hier die weitere Transformation machen R(ρ) = resultiert die folgende Differenzialgleichung ( + 12 )2 1 Z + Z + 1 − Z=0. ρ ρ2
Z(ρ) ρ ,
dann
(4.36)
106
4 Partielle Differenzialgleichungen
Dies ist die Differenzialgleichung der Bessel- oder Zylinderfunktionen von halbzahligem Index. Ihre beiden linear unabh¨angigen L¨osungen bezeichnet man mit J+ 12 (ρ) und J−(+ 12 ) (ρ), die wir im n¨achsten Abschn. 5.5 eingehender behandeln werden. Als n¨ achstes wenden wir uns der zweiten Differenzialgleichung, (4.34), zu und verlangen aus physikalischen Gr¨ unden, dass ihre L¨ osungen in Bezug auf die Variable ϕ die folgende Periodizit¨atseigenschaft haben soll Y (ϑ, ϕ) = Y (ϑ, ϕ + 2π). Also muss diese L¨osung in Bezug auf ϕ eine Fourier-Funktion auf dem Einheitskreis sein und wir k¨onnen ansetzen Y (ϑ, ϕ) = P (ϑ)eimϕ , wo m = 0, ±1, ±2, ±3, · · · sein kann. Mit diesem Ansatz erhalten wir f¨ ur die noch unbekannte Funktion P (ϑ) die Differenzialgleichung
1 d dP ϑ m2 sin ϑ + ( + 1) − P (ϑ) = 0 , (4.37) sin ϑ dϑ dϑ sin2 ϑ oder wenn wir cos ϑ = z setzen, lautet die transformierte Gleichung f¨ ur P (z) m2 P (z) = 0 . (4.38) (1 − z 2 )P (z) − 2zP (z) + ( + 1) − 1 − z2 Dies ist die Differenzialgleichung der sogenannten zugeordneten LegendrePolynome Pm (cos ϑ), die wir im Abschn. 5.4 n¨aher untersuchen werden. Zusammenfassend lautet eine partikul¨ are L¨ osung der Helmholtz-Gleichung in Kugelkoordinaten & 1 % Φ,m (r, ϑ, ϕ) = √ A,m J+ 12 (kr) + B,m J−(+ 12 ) (kr) Pm (cos ϑ)eimϕ kr (4.39) und die allgemeine L¨ osung ist dann eine Superposition der L¨osungen (4.39). Schließlich behandeln wir noch den Sonderfall, dass k 2 = 0 ist, der auf die Laplace’sche Differenzialgleichung f¨ uhrt. Dann lautet die radiale Gleichung (4.33) 2
( + 1) R=0. (4.40) R + R − ρ ρ2 Diese Gleichung gestattet den einfachen L¨ osungsansatz R(r) = rα . Damit ergibt sich durch Einsetzen in (4.40) [α(α − 1) + 2α − ( + 1)]rα = 0 ,
(4.41)
woraus folgt, dass α(α − 1) = ( + 1) sein muss mit den beiden L¨osungen α = und α = −( +1). Daher k¨ onnen wir die allgemeine L¨osung der LaplaceGleichung in Kugelkoordinaten sofort angeben
∞ + 1 Φ(r, ϑ, ϕ) = A,m r + B,m +1 Pm (cos ϑ)eimϕ . r = 0 m= −
(4.42)
4.3 Die Separationsmethode
107
Separation in Zylinderkoordinaten Den Laplace-Operator in Zylinderkoordinaten haben wir in Abschn. 1.5.1 angegeben. Demnach lautet die Helmholtz-Gleichung in diesen Koordinaten 1 ∂ ∂ 1 ∂2 ∂2 (r ) + 2 + (4.43) Φ(r, ϕ, z) + k 2 Φ(r, ϕ, z) = 0 . r ∂r ∂r r ∂ϕ2 ∂z 2 Wir verlangen wiederum die Eindeutigkeit der L¨osungen in Bezug auf die Koordinate ϕ und machen daher den Ansatz Φ(r, ϕ, z) = ψ(r, z)ei m ϕ .
(4.44)
Dies ergibt beim einsetzen in die Differenzialgleichung und nach Trennung in radiale und achsige Abh¨ angigkeiten
1 ∂ m2 ∂ 2 ψ(r, z) ∂ 2 (4.45) r + k − 2 ψ(r, z) = − r ∂r ∂r r ∂z 2 und mithilfe des weiteren Separationsansatzes ψ(r, z) = R(r)Z(z)
(4.46)
erhalten wir nach Division der Gleichung (4.45) durch diesen Ansatz und Einf¨ uhrung der Separationskonstanten kz2 die folgenden beiden Gleichungen 2
1 d d m2 d 2 2 2 + kz Z(z) = 0 . (4.47) r + k − kz − 2 R(r) = 0 , r dr dr r dz 2 uhren eine neue dimensionslose Schließlich benennen wir k 2 − kz2 = κ2 und f¨ Variable ρ = κr ein. Dann lautet die erste der beiden Gleichungen in (4.47)
d2 R(ρ) 1 dR(ρ) m2 (4.48) + + 1 − 2 R(ρ) = 0 dρ2 ρ dρ ρ und dies ist wiederum die Bessel’sche Differenzialgleichung mit den beiden linear unabh¨ angigen L¨ osungen Jm (ρ) und Ym (ρ), den sogenannten Bessel- und Neumann-Funktionen von ganzzahligem Index m. Die L¨osungen der zweiten Gleichung in (4.47) h¨ angen wieder von der Wahl der Randbedingungen ab. Wenn etwa periodische Randbedingungen vorliegen, sodass Z(z) = Z(z + 2 ) gilt, erhalten wir die uns bereits bekannten Fourier-Funktionen mit den kosungen Zn (z) = eikn z . In diesem Fall lautet Werten kz = kn = nπ und den L¨ dann eine partikul¨ are L¨ osung der Helmholtz-Gleichung in Zylinderkoordinaten (4.49) Φm,n (ρ, ϕ, z) = [An, m Jm (ρ) + Bn, m Ym (ρ)]eimϕ eikn z und die allgemeine L¨ osung ist dann eine lineare Superposition dieser L¨osungen. Wenn wir es mit einem ebenen Problem zu tun haben, bei dem keine
108
4 Partielle Differenzialgleichungen
z-Abh¨ angigkeit vorliegt, erhalten wir entsprechend f¨ ur die allgemeine L¨osung Φ(ρ, ϕ) =
∞
[Am Jm (ρ) + Bm Ym (ρ)]eimϕ .
(4.50)
m=0
Wenn wir es ferner mit der ebenen Potenzialtheorie zu tun haben, also k 2 = 0 ist, dann geht die radiale Gleichung in (4.47) u ¨ ber in 1 d d m2 r − 2 R(r) = 0 , (4.51) r dr dr r die wiederum eine L¨ osung der Form R(r) = rα gestattet, was nach einsetzen in die Differenzialgleichung die beiden L¨ osungen liefert α = ±m und daher finden wir als L¨ osung der Laplace’schen Differenzialgleichung in ebenen Polarkoordinaten Φ(r, ϕ) =
∞
Am rm eim ϕ ,
m = 0 .
(4.52)
m= − ∞
Der Fall m = 0 liefert einen weiteren Sonderfall, denn dann lautet die radiale Gleichung (rR ) = 0 mit der L¨ osung R(r) = A ln r + B.
4.4 Die Methode der Green-Funktion 4.4.1 Allgemeine Betrachtungen Die Methode der Green-Funktion ist ein außerordentlich n¨ utzliches Verfahren zur L¨ osung von Randwertaufgaben der theoretischen Physik. Wir haben bereits in den beiden Kapiteln 2 und 3 anhand von zwei Beispielen die N¨ utzlichkeit und anschauliche Bedeutung der Green-Funktion kennen gelernt. Hier wollen wir diese Methode von einem etwas allgemeineren Standpunkt betrachten, obwohl wir uns bei der Anwendung der Green’schen Methode auf die inhomogene Helmholtz-Gleichung beschr¨ anken werden. Das Verfahren ist jedoch von weitaus gr¨ oßerer Allgemeinheit. Wir gehen aus von einer etwas allgemeineren Form der inhomogenen Helmholtz-Gleichung (4.2) Δr Φ(r ) + P (r )Φ(r ) = −αρ(r ) ,
(4.53)
wo P (r) eine beliebige beschr¨ ankte Funktion ist. Daneben definieren wir die Green-Funktion des Problems durch die Differenzialgleichung Δr G(r, r ) + P (r )G(r, r ) = −δ(r − r ) ,
(4.54)
wobei wir mit r die Koordinaten des Aufpunktes bezeichnen wollen, wo wir die L¨ osung suchen, und mit r die Koordinaten der Quellpunkte, u ¨ ber die zu
4.4 Die Methode der Green-Funktion
109
integrieren sein wird. Nun ziehen wir den 2. Green’schen Satz heran, der in Abschn. 1.4.2 hergeleitet wurde (ΦΔΨ − Ψ ΔΦ) dv = (Φ∇Ψ − Ψ ∇Φ) · df (4.55) V
F
und setzen hier Φ(r ) gleich unserer gesuchten L¨osungsfunktion von (4.53) und identifizieren Ψ (r ) mit der Green-Funktion G(r, r ). Dann erhalten wir mithilfe der beiden Differenzialgleichungen (4.53,4.54) zur Berechnung des Volumsintegrals auf der linken Seite von (4.55) die folgende Gleichung
∂Φ ∂G [−Φδ(r − r ) + αGρ(r )]dv = (4.56) Φ − G df , ∂n ∂n V F wobei auf der linken Seite sich der Term mit P (r ) weggehoben hat. Das erste Integral auf der linken Seite von (4.56) k¨ onnen wir sofort berechnen und das zweite Integral auf die rechte Seite der Gleichung schaffen. Dann erhalten wir als formale L¨ osung der inhomogenen Helmholtz-Gleichung ∂G ∂Φ Φ(r) = α G(r, r )ρ(r )dv − Φ(r ) − G(r, r ) df . ∂n ∂n V F (4.57) Dabei haben wir die in Abschn. 1.3.2 abgeleitete Beziehung (1.49) verwen det, wonach ∇Φ = ∂Φ ∂n n ist und df = ndf gilt. Bei der Interpretation der letzten Gleichung haben wir zu beachten, dass die inhomogene HelmholtzGleichung vom elliptischen Typ ist. Daher bezieht sich die L¨osung Φ(r) auf einen ,,Aufpunkt“ im Inneren der geschlossenen H¨ ulle F . Dort liegt auch das ,,Quellgebiet“ ρ(r ), welches das Volumen V innerhalb F ganz oder teilweise ausf¨ ullt. Ersichtlich ist die L¨ osung aus zwei Teilen zusammengesetzt: einem Anteil, der seinen Ursprung in den Quellen hat und einem anderen, der von den Oberfl¨ achenbedingungen herr¨ uhrt. Da die betrachtete Differenzialgleichung vom elliptischen Typ ist, wird die zun¨achst formale L¨osung (4.57) nur dann eine eindeutige L¨ osung der inhomogenen Helmholtz-Gleichung darur stellen, wenn auf der Berandung F die erforderlichen Randbedingungen f¨ die elliptischen Differenzialgleichungen erf¨ ullt sind, n¨amlich (a) die Dirichlet’schen Randbedingungen oder (b) die Neumann’schen Randbedingungen oder (c) die gemischte Randbedingungen, wie wir bereits in Abschn. 4.2 diskutiert haben. Daraus ergeben sich dann, wie wir jetzt zeigen wollen, ganz bestimmte Randbedingungen f¨ ur die Green-Funktion. a) Dirichlet’sche Randbedingungen: Wenn Φ(r ) auf F vorgegeben ist, wird ∂Φ gleichzeitig u keine Aussage gemacht. Daher muss im Ober¨ber ∂n auf F fl¨ achenintegral von (4.57) der entsprechende Term verschwinden. Dies wird dann der Fall sein, wenn wir an die Green-Funktion des Dirichlet-Problems die Bedingung stellen GD (r, r ) = 0 auf F . Dann lautet die L¨osung des Dirichlet-Problems ∂GD Φ(r) = α GD (r, r )ρ(r )dv − Φ(r ) df . (4.58) ∂n V F
110
4 Partielle Differenzialgleichungen
Folglich, wenn wir die Differenzialgleichung (4.54) f¨ ur die Dirichlet’sche Green-Funktion mit der Randbedingung GD = 0 auf F gel¨ost haben, werden die beiden Integrale auf der rechten Seite von (4.58) nur bekannte Gr¨oßen enthalten. Dann ist die L¨ osung Φ f¨ ur Punkte r innerhalb des Volumens V durch G, durch die Quellfunktion ρ und durch die Randwerte von Φ auf F eindeutig bestimmt. Der Vorteil dieses L¨ osungsverfahrens liegt also darin, dass nun das Problem der L¨ osung des inhomogenen Randwertproblems f¨ ur Φ auf die L¨ osung des homogenen Randwertproblems f¨ ur G zur¨ uckgef¨ uhrt wurde. Es ist auch wichtig zu bemerken, dass bei physikalischen Problemstellungen der Funktion Φ meist eine physikalische Bedeutung zukommt, w¨ahrend die Green-Funktion G eine reine ,,Geometriefunktion“ darstellt, die von der Geometrie des betrachteten Problems abh¨ angt und daher bei verschiedenen physikalischen Problemen gleicher geometrischer Voraussetzungen dieselbe sein wird. ∂Φ b) Neumann’sche Randbedingung: Wenn ∂n eine vorgegebene Funktion auf F ist, dann kann u ¨ber Φ(r ) auf F keine Aussage gemacht werden und wir w¨ ahlen daher f¨ ur die Neumann’sche Green-Funktion GN (r, r ) die homogene N osung Randbedingung ∂G ∂n = 0 auf F . In diesem Fall lautet dann die L¨ ∂ΦN GN (r, r )ρ(r )dv − GN (r, r )df . (4.59) Φ(r) = α ∂n V F Dabei gilt wieder, sobald wir das homogene Randwertproblem f¨ ur die Neumann’sche Green-Funktion GN gel¨ ost haben, ist die L¨osung Φ(r) des inhomo∂Φ genen Problems durch GN , die Quellen ρ und durch die Randwerte von ∂n darstellbar. Doch die obige Wahl der Randbedingung f¨ ur die Neumann’sche Green-Funktion l¨ asst sich nicht anwenden, wenn bei endlichem Volumen V in (4.53, 4.54) die Funktion P (r ) = 0 ist, also die Poisson’sche Differenzialgleichung vorliegt. Der Grund daf¨ ur ist leicht zu finden, wenn wir die Differenzialgleichung (4.54) f¨ ur die Green-Funktion u ¨ ber V integrieren und auf das Volumsintegral u ber ΔG den Gauß’schen Integralsatz (1.84) aus Ab¨ schn. 1.4.1 anwenden, um es in ein Oberfl¨ achenintegral umzuwandeln. Dann erhalten wir ∂GN df + P GN dv = − δ(r − r )dv = −1 . (4.60) F ∂n V V N Daher w¨ urde f¨ ur P = 0 die Wahl ∂G ∂n = 0 auf F die Beziehung 0 = −1 liefern. Zur Vermeidung dieses Widerspruchs w¨ahlt man daher im Fall der 1 N Poisson-Gleichung die Neumann-Bedingung in der Form ∂G ∂n = F , wo F der Betrag der Oberfl¨ ache des Volumens V ist. Dabei wird bei einem unendlichen oder einseitig unendlichen Bereich F → ∞ streben und wir erhalten wiederum die urspr¨ ungliche Randbedingung f¨ ur GN . Auch wird mit der allge1 N meineren Randbedingung ∂G = der erste Term im Oberfl¨achenintegral ∂n F von (4.57) einen konstanten Beitrag liefern, sodass bei einer Neumann’schen Randbedingung die L¨ osung der Poisson-Gleichung nur bis auf eine beliebige, additive Konstante bestimmt sein wird.
4.4 Die Methode der Green-Funktion
111
c) Die gemischte Randbedingung: Als Randbedingung f¨ ur Φ(r ) auf F k¨onnen wir schließlich auch die Kombination w¨ ahlen aΦ(r ) +
∂Φ = h(r ) , ∂n
(4.61)
wo a eine beliebige Konstante ist und h(r ) eine gegebene Funktion darstellt. ∂Φ L¨ ost man die Gleichung nach ∂n auf und setzt dies in den allgemeinen Ausdruck (4.57) f¨ ur Φ(r) auf der rechten Seite ein, so folgt f¨ ur eine eindeutige ugen muss L¨ osung, dass G (r, r ) der homogenen Randbedingung gen¨ aG(r, r ) +
∂G =0 ∂n
und die gesuchte L¨ osung lautet dann Φ(r) = α G (r, r )ρ(r )dv − V
F
G (r, r )h(r )df .
(4.62)
(4.63)
Wiederum ist die gesuchte L¨ osung des Problems eindeutig durch G (r, r ), h(r ) und ρ(r ) eindeutig bestimmt. Der Vorteil der Methode der Green-Funktion besteht also darin, dass wir ein Problem mit inhomogenen Randbedingungen durch ein solches mit homogenen Bedingungen ersetzen k¨ onnen. Das letztere Problem ist dann in vielen F¨ allen mithilfe der Methode der Integraltransformationen oder der Separation der Ver¨ anderlichen l¨ osbar (siehe die Abschn. 3.3 und 4.3.2). Die Methode der Green-Funktion ist aber auch auf homogene Probleme anwendbar, sei es eine homogene Differenzialgleichung oder homogene Randbedingungen oder beides. Die N¨ utzlichkeit der Methode ist dann darin zu suchen, dass manchmal die Green-Funktion G in geschlossener Form berechnet werden kann und dasselbe dann auch f¨ ur die gesuchte L¨ osung Φ der Fall ist, da diese nun mit den oben hergeleiteten Integralausdr¨ ucken berechnet werden kann. Gegen Ende dieses Kapitels werden wir eine Reihe Beispiele diskutieren, welche die ¨ hier angestellten allgemeinen Uberlegungen n¨ aher erl¨autern sollen. 4.4.2 Eigenschaften der Green-Funktion Wir betrachten nun einige der grundlegenden Eigenschaften der GreenFunktion unseres Problems, der inhomogenen Helmholtz-Gleichung (4.53). Zun¨ achst beweisen wir die wichtige Symmetrieeigenschaft G(r, r ) = G(r , r), wonach Quellpunkt und Aufpunkt miteinander vertauscht werden k¨onnen. Dazu betrachten wir die folgenden beiden Gleichungen ΔG(r, r1 ) + P (r)G(r, r1 ) = −δ(r − r 1 ) (4.64) ΔG(r, r2 ) + P (r)G(r, r2 ) = −δ(r − r 2 ) .
112
4 Partielle Differenzialgleichungen
Nun multiplizieren wir die erste der beiden Gleichungen von links mit G(r, r 2 ) und die zweite mit G(r, r 1 ) und subtrahieren dann die beiden Gleichungen. Dabei wird der Term, welcher P (r) enth¨ alt wegfallen. Wenn wir dann die resultierende Gleichung auf beiden Seiten u ¨ber das Volumen V integrieren und auf der linken Seite den 2. Green’schen Satz von Abschn. 1.4.2 (1.95, 4.55) anwenden, so erhalten wir ∂G ∂G − G(r, r 2 ) (4.65) G(r, r1 ) df = G(r 1 , r 2 ) − G(r 2 , r 1 ) , ∂n ∂n F wobei das Resultat auf der rechten Seite dieser Gleichung aus der Integration u ¨ber die δ-Funktion resultiert. Da auf der linken Seite der Gleichung sowohl G(r, r1 ) als auch G(r, r 2 ) auf der H¨ ulle F dieselben Randbedingungen erf¨ ullen, verschwindet dieses Integral und es ergibt sich die bereits genannte Symmetrieeigenschaft der Green-Funktion G(r, r ) = G(r , r) .
(4.66)
Nun betrachten wir als n¨ achstes die Art der Singularit¨at von G(r, r ) bei r = r , die durch die Quellfunktion δ(r − r ) der Green-Funktion nahe gelegt wird. Dabei sei angenommen, dass im gesamten betrachteten Raumgebiet sich die Funktion P (r) regul¨ ar verh¨ alt, also keine Singularit¨aten besitzt. Dann aherungsweise setzen P (r) ∼ k¨ onnen wir nahe r = r n¨ = P (r ) = P = const. und die Gleichung f¨ ur die Green-Funktion lautet dann ΔG(r, r ) + P G(r, r ) = −δ(r − r ) .
(4.67)
Da die singul¨ are Quelle nur von der Differenz r − r abh¨angt, wird auch die Green-Funktion nur von dieser Differenz abh¨angen und wir k¨onnen als neue uhren. Da P nahe der Singularit¨at eine Konstante Variable R = r − r einf¨ ist, wird dort die L¨ osung von (4.67) kugelsymmetrisch sein. Bei Einf¨ uhrung des Laplace-Operators in Kugelkoordinaten, den wir in Abschn. 1.5.2 (1.146) angegeben haben, erhalten wir wegen der Kugelsymmetrie und damit der Unabh¨ angigkeit des Problems von den Winkelvariablen (ϑ, ϕ) anstelle der Gleichung (4.67) die Differenzialgleichung
1 d 2 dG(R) R + P G(R) = −δ(R) . (4.68) R2 dR dR Doch wenn G bei R = 0 singul¨ ar ist, dann sind die Ableitungen G und G nach R bei R = 0 noch st¨ arker singul¨ ar und wir k¨onnen daher nahe der Singularit¨ at in (4.68) den Term P G(R) weglassen. Also gilt nahe R = 0
1 d 2 dG(R) R = −δ(R) . (4.69) R2 dR dR Nun integrieren wir beide Seiten dieser Gleichung u ¨ ber eine Kugel vom Radius R. Dabei beachten wir, dass das Volumselement in Kugelkoordinaten durch
4.4 Die Methode der Green-Funktion
113
dv = R2 dR sin ϑdϑdϕ gegeben ist, wie in Abschn. 1.5.2 angegeben wurde. Damit erhalten wir
2π π R d 2 dG(R ) dϕ sin ϑdϑ dvδ(R) = −1 . R dR = − dR 0 0 0 dR K (4.70) Die Winkelintegration auf der linken Seite liefert den Faktor 4π und die radiale Integration ist elementar. Nach Ausf¨ uhrung der Integrationen ergibt sich die einfache Differenzialgleichung f¨ ur G dG(R) 1 =− , dR 4πR2
(4.71)
die wir nochmals u ur ¨ber das Intervall (R, ∞) integrieren. Damit finden wir f¨ das asymptotische Verhalten der Green-Funktion nahe der Singularit¨at bei R=0 1 , R = |r − r | . G(R) ∼ (4.72) =− 4πR F¨ ur P (r) = 0 ist (4.72) die Green-Funktion der Poisson’schen Differenzialgleichung. Diese Differenzialgleichung haben wir in Abschn. 1.4.3 (1.110) bereits hergeleitet. Das obige Verfahren ist in vielen F¨allen der Grundgedanke zur L¨ osung der Gleichung f¨ ur die Green-Funktion. Wenn wir die Gleichung f¨ ur die Green-Funktion (4.67) betrachten, so sehen wir, dass sie f¨ ur r = r eine homogene Helmholtz-Gleichung darstellt. Diese Tatsache ist Ausgangspunkt f¨ ur die gleich zu besprechende ,,Methode der Bilder“ zur L¨osung inhomogener Randwertprobleme. Ein anderes Verfahren ist die Methode der Eigenfunktionen, die wir anhand des durch eine periodisch Kraft angetriebenen harmonischen Oszillators bereits in Abschn. 3.5 kennen gelernt haben. 4.4.3 Auffindung der Green-Funktion Zur Berechnung der Green-Funktion haben wir im Volumen V , in welchem sie definiert ist, die inhomogene Gleichung zu l¨ osen ΔG(r, r ) + P (r)G(r, r ) = −δ(r − r ) ,
(4.73)
wo G einer der oben genannten homogenen Randbedingungen auf der H¨ ulle F zu gen¨ ugen hat. Eine der M¨ oglichkeiten, die gesuchte Green-Funktion zu finden, ist die Methode der Eigenfunktionen. Wir nehmen an, es sei gelungen, das dreidimensionale Eigenwertproblem zu l¨ osen (Δ + P )φn = αn φn ,
(4.74)
wo αn die Eigenwerte sind und die Eigenfunktionen φn (r) bereits normiert seien, sodass die Orthogonalit¨ atsrelation lautet (φm , φn ) = δm,n . Dabei sollen die Eigenfunktionen dieselben homogenen Randbedingungen erf¨ ullen, wie die Green-Funktion G. Dieses Eigenwertproblem kann etwa gel¨ost werden,
114
4 Partielle Differenzialgleichungen
wenn sich die Gleichung (4.74) in bestimmten Koordinaten separieren l¨asst und man so auf eindimensionale Sturm-Liouville’sche Eigenwertgleichungen gef¨ uhrt wird. In diesem Sinne fassen die Eigenwertparameter αn einen ganzen Satz von solchen Parametern symbolisch zusammen. Nun entwickeln wir die Green-Funktion nach diesen Eigenfunktionen, indem wir ansetzen cn φn (r) (4.75) G(r, r ) = n
und setzen dies in die Differenzialgleichung der Green-Funktion ein. Unter Ber¨ ucksichtigung der Eigenwertgleichung (4.74) und der Tatsache, dass jedes vollst¨ andige Funktionensystem eine m¨ ogliche Darstellung der Dirac’schen δFunktion liefert, wie in Abschn. 3.4.2 besprochen wurde, erhalten wir cn αn φn (r) = − φn (r)φn (r ) . (4.76) n
n
Wenn wir diese Gleichung von links mit φm (r) multiplizieren, u ¨ ber das Volumen V integrieren und die Orthogonalit¨ atsrelation (φm , φn ) = δm,n beachten, so erhalten wir f¨ ur die Entwicklungskoeffizienten der Green-Funktion cn = −
1 φn (r ) , αn
(4.77)
sodass die Reihendarstellung der Green-Funktion lautet G(r, r ) = −
1 φn (r)φn (r ) . α n n
(4.78)
Im unendlich ausgedehnten Integrationsgebiet V kann die obige diskrete Summe in eine Integration ausarten und so zu einer Integraltransformation f¨ uhren, etwa einer Fourier-Transformation. Beispiele dieser Art werden wir sp¨ater noch kennen lernen. Eine andere Methode zur Auffindung der Green-Funktion entspringt einer allgemeinen Eigenschaft der inhomogenen Helmholtz-Gleichung. Die allgemeinste L¨ osung der inhomogenen Gleichung (4.73) f¨ ur G(r, r ) l¨asst sich stets als Summe einer partikul¨ aren L¨ osung der inhomogenen Gleichung und einer beliebigen L¨ osung der homogenen Gleichung darstellen (siehe Abschn. 5.3.1). Dies ist analog den Verh¨ altnissen bei den gew¨ohnlichen linearen Differenzialgleichungen. Beide zusammen erst besitzen gen¨ ugend freie Parameter, um die homogenen Randbedingungen f¨ ur G auf der H¨ ulle F befriedigen zu k¨onnen. are L¨ osung der inhomogenen Gleichung, die aber Sei g(r, r ) eine partikul¨ nicht die Randbedingungen auf F erf¨ ullt und sei χ(r, r ) eine L¨osung der homogenen Gleichung Δχ + P χ = 0 (4.79) dann ist
G(r, r ) = g(r, r ) + χ(r, r )
(4.80)
4.4 Die Methode der Green-Funktion
115
die gesuchte Green-Funktion, sobald sie den homogenen Randbedingungen auf F gen¨ ugt. In einigen F¨ allen l¨ asst sich dies besonders leicht erreichen. Wir betrachten zun¨ achst den Spezialfall des unendlich ausgedehnten Raumgebietes. F¨ ur dieses Gebiet wollen wir die Green-Funktion mit g(r, r ) bezeichnen. Hier wird f¨ ur r → ∞ die Green-Funktion wie g → r1 im Unendlichen gegen Null abfallen, wie (4.72) andeutet. Diese Funktion kann also dann im allgemeinen auf einer beliebigen, endlichen H¨ ulle F keine bestimmten Randbedingungen erf¨ ullen. Wir betrachten daher f¨ ur das endliche Raumgebiet den folgenden L¨ osungsansatz f¨ ur die Green-Funktion G(r, r ) = g(r, r ) + aj g(r j , r ) . (4.81) j
ulle F liegen, Da r und r innerhalb des endlichen Volumens V oder auf der H¨ ist g(r, r ) eine L¨ osung der Gleichung (4.73). Der zweite Term in (4.81) wird jedoch in Bezug auf r eine L¨ osung der homogenen Gleichung (4.79) innerhalb ulle F liegen. Wenn des Volumens V sein, wenn die Punkte rj außerhalb der H¨ es daher gelingt, die Koeffizienten aj und die Koordinaten r j so zu w¨ahlen, dass der Ansatz (4.81) auf F die gew¨ unschten homogenen Randbedingungen erf¨ ullt, so kann auf diese Weise die gesuchte Green-Funktion f¨ ur das endliche Gebiet gefunden werden. In manchen F¨ allen, wo der Bereich V gewisse Symmetrieeigenschaften besitzt, kann dieses Verfahren zum Ziel f¨ uhren. Auf diese Weise kann die Green-Funktion f¨ ur ein endliches Gebiet aus jener f¨ ur das unendliche Gebiet zusammengesetzt werden. Dies ist der grundlegende Gedanke der ,,Methode der Bilder“. Der Name hat seinen Ursprung in der Elektrostatik und wir werden Beispiele betrachten, die dies veranschaulichen. 4.4.4 Die Green-Funktion der Helmholtz-Gleichung Die inhomogene Helmholtz-Gleichung geht aus (4.53) hervor, wenn dort P (r) = k 2 gesetzt wird und entsprechend lautet dann gem¨aß (4.54) die zugeh¨ orige Differenzialgleichung der Green-Funktion ΔG(r, r ) + k 2 G(r, r ) = −δ(r − r ) .
(4.82)
Wir betrachten das unendliche Gebiet. Die Green-Funktion wird dann wiederum, wie im allgemeinen Fall, kugelsymmetrisch sein und nur von R = |r − r | abh¨ angen. Auch ist ihr singul¨ ares Verhalten bei R = 0 durch die N¨aherung (4.72) bestimmt. Wir machen daher den L¨ osungsansatz G(R) = −
f (R) , 4πR
(4.83)
wo f (R) nur mehr eine regul¨ are Funktion ist, und wir setzen dies in die Differenzialgleichung (4.82) in Kugelkoordinaten ein. Dies ergibt
1 d f (R) 2 d f (R) = 4πδ(R) (4.84) R + k2 2 R dR dR R R
116
4 Partielle Differenzialgleichungen
und wir erhalten nach dem Ausdifferenzieren f (R) + k 2 f (R) = −4πRδ(R) = 0 ,
(4.85)
denn gem¨ aß Abschn. 2.3.2, (2.92), ist xδ(x) = 0. Die letzte Gleichung hat die m¨ oglichen L¨ osungen f (R) = eikR ,
f (R) = e−ikR ,
f (R) = cos kR ,
(4.86)
hingegen ist die L¨ osung f (R) = sin kR auszuschließen, da sie das singul¨are Verhalten der Green-Funktion bei R = 0 kompensieren w¨ urde, da bekanntlich limx→0 sinx x = 1 ist. Welche der genannten L¨osungen (4.86) von physikalischem Interesse ist, h¨ angt von den asymptotischen Bedingungen ab, die der Green-Funktion f¨ ur R → ∞ auferlegt werden. Man nennt, wie wir sp¨ater noch zeigen werden, die mithilfe des Ansatzes (4.83) und mit (4.86) gefundene L¨ osung eikR (4.87) , R = |r − r | G(+) (R) = 4πR die retardierte Green-Funktion, welche eine nach Unendlich auslaufende Kugelwelle beschreibt und entsprechend ist G(−) (R) =
e−ikR , 4πR
R = |r − r |
(4.88)
die avancierte Green-Funktion, welche eine einlaufende Kugelwelle darstellt. Die dritte Variante, die sich aus (4.83,4.86) ergibt, beschreibt dann die Superposition einer ein- und auslaufenden Kugelwelle, somit eine stehende Welle. Beispiele 1. L¨osung der Poisson’schen Differenzialgleichung Die L¨osung der PoissonGleichung f¨ ur das unendliche Raumgebiet haben wir bereits in Abschn. 2.3 als Anwendungsbeispiel f¨ ur die δ-Funktion betrachtet. Wegen der Wichtigkeit dieser Differenzialgleichung bei physikalischen Anwendungen, wie in der Beschreibung statischer elektrischer Felder und in der Gravitationstheorie beliebiger Massenverteilungen, wollen wir diese Gleichung hier nochmals unter den inzwischen hinzugewonnenen Aspekten betrachten. Ausgangspunkt ist also die Gleichung ΔΦ(r) = −αρ(r) . (4.89) Wir untersuchen ihre L¨ osung im unendlichen Raumgebiet, nehmen aber an, dass die Quellverteilung ρ(r) r¨ aumlich auf ein vergleichsweise kleines Gebiet beschr¨ ankt sein m¨ oge. Da beim betrachteten Problem die H¨ ulle F , die das Raumgebiet umschließt, im Unendlichen liegt, hat dort die L¨osung Φ der Poisson-Gleichung eine ganz bestimmte Randbedingung zu erf¨ ullen. Wir w¨ ahlen als Randbedingung, die physikalisch durch das Coulomb-Gesetz, bzw. durch das Gravitationsgesetz begr¨ undet werden kann, dass asymptotisch f¨ ur
4.4 Die Methode der Green-Funktion
117
r → ∞ die gesuchte L¨ osung Φ ∼ 1r → 0 streben soll. Dasselbe asymptotische Verhalten haben wir bereits f¨ ur die zugeh¨ orige Green-Funktion in (4.72) gefunden. Daher wird das Oberfl¨ achenintegral in (4.57) beim einsetzen des asymptotischen Verhaltens von Φ und G verschwinden, denn asymptotisch ∼ ∂Φ ∼ 1 achenelement df = r2 dΩ, wird Φ ∂G ∂n = G ∂n = r 3 sein, hingegen das Oberfl¨ wo dΩ = sin ϑdϑdϕ das Oberfl¨ achenelement auf der Einheitskugel darstellt. Also k¨ onnen wir f¨ ur die gesuchte L¨ osung der Poisson’schen Differenzialgleichung den Ansatz machen G(r, r )ρ(r )dv . (4.90) Φ(r) = α V
Wenn wir auf diese Gleichung den Laplace-Operator anwenden, so erhalten wir Δr G(r, r )ρ(r )dv . (4.91) ΔΦ(r) = −αρ(r) = α V
Damit also beide Seiten einander gleich sind, muss die Green-Funktion der Differenzialgleichung Δr G = −δ(r−r ) gen¨ ugen, wie wir schon in Abschn. 3.5 anhand eines einfachen Beispiels festgestellt und erl¨autert haben. Nach Einsetzen des bereits gefundenen Ausdrucks (4.72) f¨ ur die Green-Funktion der Poisson’schen Differenzialgleichung erhalten wir die L¨osung ρ(r ) α dv . (4.92) Φ(r) = − 4π V |r − r | Wenn wir uns in großer Entfernung vom Quellgebiet befinden und den Ursprung des Koordinatensystems in das Quellgebiet setzen, dann werden wir onnen und vor das Integral ziehen d¨ urfen, sodass in R = |r − r | ∼ = r setzen k¨ ur das Potenzial erhalten diesem asymptotischen Bereich, wo r >> r ist, wir f¨ Φ(r) ∼ =−
α Q , 4π r
(4.93)
wo Q die gesamte aufintegrierte Ladung oder Masse der Quellverteilung ist. Dies ist zum Beispiel der Grund, warum in erster N¨aherung bei der Berechnung der Planetenbewegung um die Sonne sowohl die Sonne als auch die Planeten als Massenpunkte betrachtet werden k¨onnen. 2. L¨osung der inhomogenen Helmholtz-Gleichung Zur L¨osung der inhomogenen Helmholtz-Gleichung im unendlichen Raumgebiet machen wir gleichfalls die Annahme, dass aus physikalischen Gr¨ unden das Quellgebiet r¨aumlich beschr¨ ankt ist und wir machen denselben L¨ osungsansatz (4.90). Um hier zu erreichen, dass im Unendlichen das Oberfl¨ achenintegral verschwindet, gen¨ ugt es nicht der L¨ osung der Helmholtz-Gleichung die asymptotische Bedingung Φ ∼ = 1r eikr aufzuerlegen, denn wenn wir dies gemeinsam mit der asymptotischen Form der retardierten Green-Funktion G ∼ = 1r eikr in das Oberfl¨ achenintegral in (4.57) einsetzen, so wird dieses f¨ ur r → ∞ nicht verschwinden. Dies wird erst dann der Fall sein, wenn wir die Wellenzahl durch einen
118
4 Partielle Differenzialgleichungen
kleinen imagin¨ aren Anteil zu k+iε erg¨ anzen, wo ε → 0 strebt. Auf diesen notwendigen Rechentrick, um die Konvergenz zu erzwingen, werden wir sp¨ater in Kap. 7, Abschn. 7.3.8, nochmals zu sprechen kommen. Unter den genannten Bedingungen erhalten wir dann mithilfe der Green-Funktion G(+) (R) von (4.87) als L¨ osung der inhomogenen Helmholtz-Gleichung im unendlichen Gebiet α eikR ρ(r )dv , R = |r − r | . (4.94) Φ(r) = − 4π V R Auch hier betrachten wir die L¨ osung in großer Entfernung vom Quellgebiet und erhalten f¨ ur r >> r Φ(r) ∼ =−
αQ eikr . 4π r
(4.95)
3. L¨osung der inhomogenen d’Alembert-Gleichung In Abschn. 4.2 dieses Kapitels haben wir gesehen, wie durch die Fourier-Integraltransformation (4.7) aus der inhomogenen d’Alembert’schen Wellengleichung die inhomogene Helmholtz-Gleichung (4.8) hergeleitet werden kann. Dort machten wir die Ans¨ atze −iωt dω , ρ(r, t) = ρ(r, ω)e−iωt dω . (4.96) Φ(r, t) = Φ(r, ω)e Nun k¨ onnen wir auf der rechten Seite der ersten dieser beiden Gleichungen unter dem Integralzeichen unsere L¨ osung (4.94) der inhomogenen HelmholtzGleichung einsetzen und beachten, dass diese L¨osung nun auch von der Frequenz ω abh¨ angen wird, ebenso wie die Quellfunktion ρ. Dies liefert, da die Wellenzahl k = ωc ist α Φ(r, t) = − 4π
V
dv R
R
ρ(r , ω)e−iω(t− c ) dω
(4.97)
und durch Vergleich mit der zweiten Gleichung von (4.96) erkennen wir, dass die letzte Formel auch in folgender Weise ausgedr¨ uckt werden kann
dv R α ρ r , t − Φ(r, t) = − . (4.98) 4π V R c Dies ist die sogenannte retardierte L¨ osung der d’Alembert’schen Wellengleichung. Sie ist von grundlegender Bedeutung f¨ ur die Behandlung von Ausstrahlungsproblemen in der Elektrodynamik, Akustik und Quantenfeldtheorie, sowie in der Theorie der Gravitationswellen. Ihre physikalische Interpretation ist die folgende. Ist t der Zeitpunkt der Emission eines Signals vom Quellpunkt r und t der Zeitpunkt des Empfangs im Aufpunkt r des | die Zeit, die wegen der endlichen Beobachters, so ist t − t = Rc = |r−r c Ausbreitungsgeschwindigkeit c von Licht oder Schall verstreicht, damit das
4.4 Die Methode der Green-Funktion
119
Signal vom Quellpunkt zum Aufpunkt gelangen kann. Diese Retardierungszeit ist Ausdruck des Kausalit¨ atsprinzips, wonach die Ursache vor der Wirkung zu suchen ist. Wenn das Quellgebiet ausreichend klein ist im Vergleich zur Entfernung des Beobachters, wird die Retardierungszeit u ¨ ber das ganze Quellgebiet n¨ aherungsweise dieselbe sein. Wir k¨onnen dann R = |r − r | ∼ =r setzen, wenn wir den Ursprung unseres Koordinatensystems wieder in das Quellgebiet verlegen. In diesem Fall erhalten wir f¨ ur die retardierte L¨osung Φ(r, t) = −
α Q(t − rc ) , 4π r
(4.99)
dabei ist Q(t − rc ) die gesamte u ¨ ber r aufintegrierte Quellverteilung. Mithilfe der δ-Funktion k¨ onnen wir die retardierte L¨ osung (4.98) in ¨aquivalenter Form auch folgendermaßen ausdr¨ ucken δ t − t − Rc α ρ(r , t ) Φ(r, t) = − dv d t (4.100) 4π V R und daraus die retardierte Green-Funktion der d’Alembert’schen Wellengleichung ablesen
1 R δ t−t − G (r − r ; t − t ) = − . (4.101) 4πR c 2
∂ Bei Anwendung des d’Alembert-Operators Δ − c12 ∂t 2 auf die Gleichung ¨ (4.100) erkennen wir dann sofort, wie bei fr¨ uheren Uberlegungen, dass diese Green-Funktion der folgenden Differenzialgleichung gen¨ ugen muss 1 ∂2 (4.102) Δ − 2 2 G (r − r ; t − t ) = δ (r − r ; t − t ) . c ∂t
4. Das quantenmechanische Streuproblem Wir betrachten die Streuung von Teilchen, z. B. von Elektronen, an einem Atom. In vielen praktischen F¨allen kann die Struktur des Atoms vernachl¨ assigt werden und man kann die Einwirkung des Atoms auf die streuenden Teilchen durch ein Potenzial V (r) beschreiben. Bei der Streuung von Teilchen an einem Potenzial ¨andert sich p2 , nicht. Dabei ist p = |p| der Betrag des die kinetisch Energie, E = 2m Teilchenimpulses. Bei der Potenzialstreuung ¨ andert sich nur die Bewegungsrichtung der Teilchen. Zur Beschreibung des Streuvorganges w¨ahlen wir als Ausgangspunkt die Schr¨ odinger-Gleichung (4.5) f¨ ur das hier betrachtete, zeitunabh¨ angige kugelsymmetrische Potenzial V (r) ∂Φ 2 Δ + V (r) Φ = i . (4.103) − 2m ∂t
120
4 Partielle Differenzialgleichungen
Da der Operator auf der linke Seite nur raumabh¨angig ist und jener auf der rechten Seite nur zeitabh¨ angig, k¨ onnen wir den Separationsansatz machen Φ(r, t) = ψ(r)f (t) .
(4.104)
Setzt man dies in die Schr¨ odinger-Gleichung ein, so erh¨alt man nach Separation die beiden Gleichungen 2 df − Δ + V (r) ψ = Eψ , i = Ef . (4.105) 2m dt Dabei wurde als Separationsparameter sogleich der Energieparameter E eingef¨ uhrt. Die L¨ osung der zweiten Gleichung ist elementar und liefert f (t) = i e− Et . Diese bestimmt die Zeitabh¨ angigkeit der sogenannten station¨aren Zust¨ ande des Teilchens, dessen Energie sich mit der Zeit nicht ¨andert. Wir interessieren uns f¨ ur die L¨ osung der ersten Gleichung, die den Zustand eines Teilchens konstanter Energie beschreibt. Wir multiplizieren diese Gleichung mit 2m 2 , schaffen den Potenzialterm auf die rechte Seite und den Energieterm auf die linke Seite. Dies liefert die Gleichung [Δ + k 2 ]ψ =
2m V (r)ψ , 2
(4.106)
wobei wir verwendet haben, dass nach de Broglie zwischen der Wellenzahl und dem Impuls eines Teilchens die Beziehung gilt p = k und sich daher die 2 2 k . Nun Energie der Streuteilchen in folgender Form ausdr¨ ucken l¨asst E = 2m legen wir der Streul¨ osung von (4.106) folgende asymptotische Bedingung auf lim ψ = eikz + f (θ)
r→∞
eikr . r
(4.107)
Folglich soll die Streuwelle (vgl. Abb. 4.1) asymptotisch aus einer in zRichtung durch eine Blende (B) einfallenden ebenen Welle bestehen, welche das auf das Atom bei (T) einfallende Teilchen beschreibt, und aus einer durch den Streuvorgang modifizierten auslaufenden Kugelwelle, die das gestreute Teilchen (Z) repr¨ asentiert. f (θ) nennt man die vom Streuwinkel θ abh¨ angige Streuamplitude. Um der Bedingung (4.107) zu gen¨ ugen, betrachten wir formal die rechte Seite der Gleichung (4.106) als Quellfunktion einer inhomogenen Helmholtz-Gleichung, deren partikul¨are L¨osung im unendlichen Gebiet wir bereits kennen. Daher k¨ onnen wir mithilfe von (4.94) die gesuchte Streul¨ osung formal in der Form ansetzen ikR m e V (r )ψ(r )dv , (4.108) ψ(r) = eikz − 2π2 R wobei in unserem Fall der Parameter α = − 2m 2 zu setzen ist. Die so gefundene Gleichung ist die Integralgleichung der Streutheorie. Eine Integralgleichung
4.4 Die Methode der Green-Funktion
121
Abbildung 4.1. Quantenmechanischer Streuprozess
ist sie deswegen, weil rechts unter dem Integralzeichen gleichfalls die gesuchte L¨ osung ψ steht. Die Theorie der Integralgleichungen ist ein sehr umfangreiches Gebiet der Mathematik, mit dem wir uns hier nicht n¨aher besch¨aftigen wollen. Die Gleichung (4.108) k¨ onnen wir n¨ aherungsweise iterativ l¨osen, wenn das Streupotenzial schwach gegen¨ uber der Energie der einfallenden Teilchen ist. Dann k¨ onnen wir in unserer Integralgleichung rechts unter dem Integralzeichen in nullter N¨ aherung die ungest¨ orte ebene Welle des einfallenden Teilchens einsetzen. Dies liefert dann als erste N¨aherung f¨ ur die Streul¨osung ikR m e V (r )eikz dv . (4.109) ψ(r) = eikz − 2π2 R Um hieraus in erster N¨ aherung die Streuamplitude zu erhalten, m¨ ussen wir auf der rechten Seite unter dem Integralzeichen r → ∞ streben lassen. Dabei k¨ onnen wir im Nenner R ∼ = r setzen, doch in der Exponentialfunktion m¨ ussen wir R etwas genauer ann¨ ahern, damit die Winkelabh¨angigkeit des Streuprozesses sichtbar wird. Dazu entwickeln wir R nach Potenzen von rr und behalten nur den linearen Term bei. Das ergibt ' 2 r r · r r · r 2 + ··· . R = |r − r | = (r − r ) = r 1 + −2 2 ∼ =r− r r r (4.110) Nun ist aber rr = n ein Einheitsvektor, der in die radiale Richtung der auslaufenden Streuwelle weist. Daher finden wir f¨ ur r >> r die N¨aherung kR = kr − k n · r + · · · = kr − k · r + · · · .
(4.111)
Setzen wir diese N¨ aherung in die Streul¨ osung (4.109) ein, so erhalten wir ikr m e ikz i(kz −k ·r ) ∼ . (4.112) dv V (r )e ψ(r) = e − 2 2π r
122
4 Partielle Differenzialgleichungen
Aus dieser Formel k¨ onnen wir durch Vergleich mit (4.109) die sogenannte erste Born’sche N¨ aherung f¨ ur die Streuamplitude f (θ) ablesen. Dabei k¨onnen wir setzen kz − k · r = (k − k ) · r = K · r . Hier stellt Q = K den bei der Streuung der Teilchen an das Potenzial (Atom) u ¨ bertragenen Impuls dar. Ferner ist der Streuwinkel θ der Winkel zwischen dem Impuls k der auf das Atom einfallenden Teilchen und dem Impuls k der gestreuten Teilchen. Also folgt k · k = k 2 cos θ, wobei zu beachten ist, dass sich bei der Streuung der Betrag des Teilchenimpulses nicht ¨ andert. Damit lautet schließlich die Streuamplitude in erster Born’scher N¨ aherung m f (θ) = − (4.113) dv V (r )eiK·r . 2π2 Daraus erkennen wir, dass bis auf den Vorfaktor m2 die Streuamplitude in erster Born’scher N¨ aherung durch die Fourier-Transformierte des Streupotenzials gegeben ist. 5. Das elektrostatische Influenzproblem Wird eine kleine positive Ladung +q im Abstand z0 vor eine geerdete metallische Platte gesetzt, so wird in dieser Platte eine negative Ladungsverteilung influenziert. Wir wollen das elektrostatische Feld dieser Ladungsverteilung bestimmen. Dazu haben wir das elektrostatische Potenzial dieser Ladungsverteilung zu berechnen. Auf der geerdeten Platte ist das Potenzial Φ = 0. Dies ist die Dirichlet’sche Randbedingung mit der wir die Poisson’sche Differenzialgleichung mit der Ladungsverteilung osen haben, wo r0 = z0 ez ist. Die geometrische Anρ(r) = qδ(r − r 0 ) zu l¨ ordnung unseres Dirichlet-Problems ist in Abb. 4.2 skizziert. Der Halbraum rechts von der Platte ist unser Innengebiet, der linke Halbraum das Außengebiet. Wir denken uns die Platte unendlich ausgedehnt und im Unendlichen zu
Abbildung 4.2. Influenzproblem der Elektrostatik
4.4 Die Methode der Green-Funktion
123
einer H¨ ulle geschlossen. Die Normale n auf dieser H¨ ulle weist nach außen, wie in der Skizze angedeutet ist. Wir haben also das folgende Dirichlet-Problem zu l¨ osen Φ(r) = α
GD (r, r )ρ(r )dv + 0 ,
(4.114)
da das Oberfl¨ achenintegral u ulle F wegen der Randbedingung ver¨ber die H¨ schwindet. Zur Auffindung der Green-Funktion, die auf F der Dirichlet’schen Randbedingung GD = 0 gen¨ ugen muss, verwenden wir die Methode der Bilder. Wenn wir in (4.114) die angegebene Ladungsverteilung f¨ ur die Punktladung q bei z0 einsetzen, so liefert das (4.115) Φ(r) = αq GD (r, r )δ(r − r 0 )dv = αqGD (r, r 0 ) . W¨ are keine leitende Platte da, so w¨ are die L¨ osung der Poisson-Gleichung f¨ ur αq . Um der Dirichlet-Bedingung f¨ u r die Greendie Punktladung Φ = 4π|r−r 0| Funktion zu gen¨ ugen, machen wir daher gem¨ aß (4.81) den L¨osungsansatz ! " 1 1 a GD = + (4.116) 4π x2 + y 2 + (z − z0 )2 x2 + y 2 + (z − z1 )2 und bestimmen a und z1 so, dass GD (x, y, z = 0) = 0 ist. Dabei muss z1 im Außengebiet liegen. Ersichtlich ist die Dirichlet-Bedingung erf¨ ullt, wenn z1 = −z0 und a = −1 gew¨ ahlt werden. Damit lautet dann die gesuchte L¨ osung der Poisson-Gleichung unseres Problems ! " 1 1 αq − . (4.117) Φ(x, y, z) = 4π x2 + y 2 + (z − z0 )2 x2 + y 2 + (z + z0 )2 Ersichtlich wurde die gew¨ unschte L¨ osung gefunden, indem an der Stelle z = −z0 eine fiktive Ladungsmenge −q gesetzt wurde. Daher der Name Methode der Bilder oder ,,Spiegelbilder“. Durch Gradientbildung k¨onnen wir dann aus (4.117) das elektrostatische Feld E berechnen und stellen dabei fest, dass dieses auf der Platte senkrecht steht. Ebenso kann man berechnen, dass die gesamte auf der Platte induzierte negative Ladungsmenge genau der Spiegelladung −q entspricht. 6. Potenzial einer Punktladung vor einer isolierten Metallkugel Dieses Problem ist etwas komplizierter als das vorhergehende, doch kann es auch mithilfe der Methode der Bildladungen gel¨ ost werden. Wir betrachten folgende Anordnung (vgl. Abb. 4.3). Eine geerdete Metallkugel kann durch Aufladung auf das Potenzial Φ = V gebracht werden. Vor ihr steht im Abstand z0 eine Punktladung der Ladungsmenge q. Das Innengebiet ist in diesem Fall das ¨außere der Kugel und die L¨ osung Φ der Poisson- Gleichung verschwindet im Unendlichen wie Φ ∼ 1r . Als Außengebiet ist das Innere der Kugel zu betrachten, in welche die Oberfl¨achennormale nach innen hinein weist. Die Kugel habe den
124
4 Partielle Differenzialgleichungen
Abbildung 4.3. Influenz auf metallischer Kugel
Radius R. Wir machen die z-Achse zur Polarachse, um f¨ ur einen beliebigen Punkt r im Innengebiet Kugelkoordinaten r, θ, ϕ einzuf¨ uhren. Ein beliebiullten Raum und auf der Kugel hat dann analog ger Punkt r im ladungserf¨ die Koordinaten r , θ , ϕ . Wir haben die Poisson’sche Differenzialgleichung mit den obigen Randbedingungen zu l¨ osen und die Green-Funktion muss der Dirichlet-Bedingung GD = 0 auf der Kugel gen¨ ugen. Die allgemeine L¨osung unseres Dirichlet-Problems lautet also ∂GD Φ(r) = α GD (r, r )ρ(r )dv + V R2 dΩ . (4.118) ∂r r =R V K Dabei wurde bereits ber¨ ucksichtigt, dass hier die Oberfl¨achennormale n ins Innere der Kugel weist, sodass das Oberfl¨ achenintegral, im Gegensatz zu (4.58), positives Vorzeichen erh¨ alt. Ferner ist angedeutet, dass das Oberfl¨ achenintegral u ¨ ber die Kugel vom Radius R zu erstrecken ist. Wir betrachten zun¨ achst den Fall der geerdeten Kugel. Dann ist V = 0 auf der Kugel. F¨ ur die Punktladung ist die Ladungsverteilung wieder ρ(r ) = qδ(r − r 0 ) und die L¨ osung der Poisson-Gleichung lautet dann Φ1 (r) = αqGD (r, r0 ). Zur Auffindung der Green-Funktion machen wir wieder den Ansatz (4.116) und dr¨ ucken ihn in Kugelkoordinaten aus. Dies ergibt ! " 1 1 a + . GD (r, r 0 ) = 4π r2 + z02 − 2rz0 cos θ r2 + z12 − 2rz1 cos θ (4.119) Im Gegensatz zum ebenen Problem vermuten wir hier, dass die Abbildung nach dem Verh¨ altnis der ,,reziproken Radien“ erfolgt, dass also gilt z1 z0 = R2 . Denn wenn die Punktladung auf der Kugel liegt, ist z1 = z0 = R und wenn 2 z0 → ∞ strebt, geht gleichzeitig z1 → 0. Setzt man daher in (4.119) z1 = Rz0
4.4 Die Methode der Green-Funktion
125
und betrachtet Punkte r auf der Kugel, so muss gelten ⎡ ⎤ 1 1 ⎣ a ⎦=0, GD (R, θ) = +* 3 R4 4π 2 R2 + z02 − 2Rz0 cos θ R + z2 − 2 Rz0 cos θ 0
(4.120) woraus die Beziehung folgt ! 2 " 2 R 2 a − R + z02 − 2Rz0 cos θ = 0 z0
(4.121)
und daher muss a = − zR0 gesetzt werden, da die andere L¨osung der quadratischen Gleichung nicht zum gew¨ unschten Ziel f¨ uhrt. Daher erhalten wir f¨ ur den Fall der geerdeten Kugel als L¨ osung der Poisson-Gleichung Φ1 (r, θ) = αqGD (r, θ, z0 ) ⎤ ⎡ R 1 αq ⎣ z0 ⎦ . (4.122) −* = 2 4π R2 2 2 r2 + z02 − 2rz0 cos θ R + ( z0 ) − 2r Rz0 cos θ Nun betrachten wir den allgemeinen Fall, bei dem die Kugel isoliert aufgestellt ist und auf ihr das Potenzial Φ = V = 0 ist. Zur Berechnung des Oberfl¨ achenintegrals in (4.118) ben¨ otigen wir die allgemeinere Form der GreenFunktion, wenn der Quellpunkt r nicht auf der z-Achse sondern, wie in der Abb. 4.3 angedeutet, in beliebiger Richtung liegt. Diese Green-Funktion k¨ onnen wir aber leicht finden, indem wir in (4.122) die Koordinate z0 durch r ersetzen und gleichzeitig den Polarwinkel θ durch den Winkel Θ zwischen den beiden Vektoren r und r . Damit lautet dann die allgemeine Form der Green-Funktion f¨ ur die Kugel in Polarkoordinaten f¨ ur das Dirichlet-Problem ⎡ ⎤ R 1 1 r ⎣√ ⎦ . −* GD (r, r ) = 4π R2 2 R2 r2 + r 2 − 2rr cos Θ 2 r + ( ) − 2r cos Θ r
r
(4.123) Nun berechnen wir das Oberfl¨ achenintegral in (4.118). Dazu erhalten wir nach einfacher Rechnung 1 r 2 − R2 ∂GD = (4.124) ∂r r =R 4πR (r2 + R2 − 2rR cos Θ) 32 und finden damit nach einsetzen in (4.118) f¨ ur das Oberfl¨achenintegral, das wir Φ2 bezeichnen wollen,
∂GD Φ2 = r2 sin ΘdΘdϕ ∂r r =R K +1 VR 2 VR dζ 2 = r −R . (4.125) 3 = 2 2 2 r 2 −1 (r + R − 2rRζ)
126
4 Partielle Differenzialgleichungen
Dabei konnte die Integration u uhrt werden und lieferte den ¨ ber ϕ sofort ausgef¨ Faktor 2π, w¨ ahrend f¨ ur die Integration u ¨ ber Θ die neue Variable ζ = cos Θ eingef¨ uhrt wurde. Die L¨ osung unseres Dirichlet-Problems ergibt sich somit aus (4.122) und (4.125) zu Φ(r, θ) = Φ1 + Φ2 = αqGD (r, θ, z0 ) +
VR . r
(4.126)
W¨ are die Ladung q = 0, so w¨ urden wir das Potenzial Φ = VrR erhalten. αQ Wenn wir dies mit dem Potenzial Φ = 4πr einer Punktladung vergleichen, so αQ ¨ erhalten wir die Aquivalenz 4π = V R. Wir h¨ atten also das Potenzial Φ2 auch erhalten k¨ onnen, indem wir in das Zentrum der Kugel eine fiktive Ladung R gesetzt h¨ atten. Dies w¨ are der elementare Weg zur L¨osung unseres Q = 4πV α inhomogenen Randwertproblems gewesen. ¨ Ubungsaufgaben 1. Betrachte die homogene d’Alembert’sche Wellengleichung in einer Raumdimension und setze ct = y. Zur L¨ osung der gefundenen Gleichung in x und y f¨ uhre man neue Ver¨ anderliche durch die Beziehungen x = ξ + η und y = ξ − η ein und finde die allgemeine L¨osung der neuen Gleichung. Nach R¨ ucktransformation auf die Ver¨ anderlichen x und t mache man eine Fourier-Integraltransformation in Bezug auf die Zeit t und zeige, dass die gefundenen L¨ osungen eine Superposition von ebenen Wellen darstellen, die sich in positiver und negativer x-Richtung fortpflanzen. Wie werden diese L¨ osungen aussehen, wenn man durch Rotation des Koordinatensystems erreicht, dass sich die Wellen in beliebiger Raumrichtung fortpflanzen? 2. Man l¨ ose das Problem der schwingenden Saite, die in den Endpunkten bei x = 0 und x = L eingespannt ist, derart, dass dort die L¨osung f¨ ur alle Zeiten verschwindet. Zur Zeit t = 0 wird die Saite bei x = L2 angeschlagen (Klavierhammer). Zu l¨ osen ist also die d’Alembert’sche Wellengleichung mit der homogenen Randbedingung Φ(0, t) = Φ(L, t) = 0 und der AnL osung fangsbedingung Φ(x, t = 0) = 0, ∂Φ(x,t) ∂t |t=0 = Aδ(x − 2 ). Die L¨ erh¨ alt man mit einem Separationsansatz und Aufsuchung der Eigenfunktionen des Randwertproblems. 3. Gesucht ist die L¨ osung des r¨ aumlich eindimensionalen homogenen Diffusionsproblems im unendlichen Gebiet mit der Anfangsbedingung Φ(x, t = 0) = f (x) = Aδ(x). Zur L¨ osung verwende man die FourierIntegraltransformation in Bezug auf die Ver¨anderliche x. 4. Man finde die vollst¨ andige L¨ osung der Laplace’schen Differenzialgleichung in ebenen Polarkoordinaten mithilfe des Separationsansatzes Φ(r, ϕ) = R(r)f (ϕ). Als Anwendung l¨ ose man folgendes einfache Randwertproblem. Gegeben sei ein konzentrischer Hohlzylinder von unendlicher Ausdehnung in z-Richtung mit den Radien R1 < R2 . Auf diesen Zylindern sollen entsprechend die Potenziale V1 und V2 herrschen.
4.4 Die Methode der Green-Funktion
127
5. Man finde die Eigenfunktionen der Helmholtz-Gleichung f¨ ur ein Quadrat der Kantenl¨ ange L mit der Randbedingung, dass die L¨osungen an den Kanten des Quadrates verschwinden und in einer der Ecken des Quadrats sich der Ursprung des Koordinatensystems befindet. Man l¨ose das inhomogene Randwertproblem ΔΦ(x, y) + k 2 Φ(x, y) = f (x, y) mithilfe der Methode der Green-Funktion, wobei die Quellfunktion f (x, y) denselben Randbedingungen gen¨ ugt. 6. Man l¨ ose die Laplace’sche Differenzialgleichung in einem Kreis vom Radius R. Innerhalb des Kreises soll die L¨osung regul¨ar sein und auf dem Kreis sei Φ(R, ϕ) = U (ϕ) eine vorgegebene periodische Funktion U (ϕ) = U (ϕ+2π). Aus den Randbedingungen berechne man die FourierKoeffizienten und setze diese wieder in die L¨osungsreihe ein, um einen komplizierten Integralausdruck f¨ ur die L¨ osung Φ(r, ϕ) zu erhalten. 7. Man berechne die avancierte L¨ osung der inhomogenen d’Alembert-Gleichung und leite aus ihr die avancierte Green-Funktion ab. 8. Berechne die retardierte L¨ osung der inhomogenen d’Alembert’schen Wellengleichung f¨ ur eine Quellverteilung von der Form ρ(r , t ) = qδ(r − r 0 (t )), welche die Bewegung einer Punktladung q auf einer vorgegebenen Bahn r0 (t ) beschreibt. Zur Integration der retardierten L¨osung der d’Alembert-Gleichung u ¨ ber die Raum- und Zeitkoordinaten, ist es uhren. Die L¨osung ist zweckm¨ aßig, die Variable u = t − | r−rc0 (t ) | einzuf¨ der skalare Anteil der Lienard-Wichert-Potenziale der Elektrodynamik. 9. Zwei Metallplatten werden l¨ angs einer geraden Kante zu einem rechten Winkel zusammengef¨ ugt, sodass die beiden Platten l¨angs der x- und yAchse orientiert sind. Durch Erdung werden die Platten auf das Potenzial Φ = 0 gebracht. Innerhalb des Winkelbereiches wird im Abstand a von der x-Achse und Abstand b von der y-Achse eine Punktladung q gesetzt. Man bestimme mit der Methode der Bilder die Dirichlet’sche Green-Funktion und das Potenzial Φ(r) dieser Ladungsverteilung im Winkelbereich.
5 Spezielle Funktionen
5.1 Einleitung Auf die speziellen Funktionen wird man vor allem bei der Separation homogener, linearer partieller Differenzialgleichungen zweiter Ordnung gef¨ uhrt, wie wir anhand der Separation der Helmholtz-Gleichung im vorangehenden Abschn. 4.3 gezeigt haben. Die wichtigsten unter diesen Funktionen, die hier behandelt werden sollen, sind zun¨ achst die Kugelfunktionen und die BesselFunktionen, welche sowohl bei Problemen der Elektrodynamik als auch in der Quantentheorie auftreten. In der Quantentheorie werden daneben bei einzelnen Beispielen die Hermite- und Laguerre-Funktionen angetroffen. Ferner sind noch die Euler’sche Gammafunktion und einige damit verwandte Funktionen von Interesse, wie wir im n¨ achsten Abschnitt zeigen werden.
5.2 Die Gammafunktion und Verwandtes Die Gammafunktion wurde von Leonhard Euler eingef¨ uhrt, um bei der Berechnung von n! = 1·2·3·· · · n, Fakult¨ at genannt, zwischen den ganzen Zahlen interpolieren zu k¨onnen. Zur Herleitung der Gammafunktion Γ (x) finden wir zun¨ achst eine Integraldarstellung von n!. Dazu w¨ahlen wir als Ausgangspunkt das Parameterintegral ∞ ∞ e−αt 1 −αt (5.1) e dt = − = , α>0. α 0 α 0 Dieses Integral ist f¨ ur α > 0 konvergent und diese Konvergenz gilt auch f¨ ur die allgemeinere Funktion tn e−αt , wobei n ≥ 0 ist. Daher d¨ urfen wir das Integral (5.1) n-mal nach α differenzieren und die Differenziation mit der Integration vertauschen (siehe Anh. A.1.12). Dies ergibt zun¨achst ∞ ∞ 1 d d 1 −αt −αt e dt = − te dt = (5.2) =− 2 . dα 0 dα α α 0
130
5 Spezielle Funktionen
Nun sei angenommen, es gelte ∞
tn e−αt dt =
0
n! . αn+1
Dann erhalten wir ∞ ∞ d (n + 1)! n −αt t e dt = − tn+1 e−αt dt = − n+2 , dα 0 α 0
(5.3)
(5.4)
womit durch den u ¨blichen Schluss von n auf n + 1 die Richtigkeit der Formel nachgewiesen ist. Nun setzen wir α = 1 und finden f¨ ur n! die Integraldarstellung ∞
n! =
tn e−t dt .
(5.5)
0
Nach Euler taufen wir nun n! = Γ (n+1) und definieren als Verallgemeinerung f¨ ur beliebige Werte von x = n ∞ Γ (x) = tx−1 e−t dt . (5.6) 0
Diese Definition ist f¨ ur alle reellen Werte von x sinnvoll, f¨ ur die das Integral konvergiert. F¨ ur alle Werte von x sorgt der Faktor e−t f¨ ur die Konvergenz des Integrals f¨ ur t → ∞. Nahe t = 0 ist das Verhalten des Integrals durch x−1 t dt bestimmt, welches f¨ ur x > 0 konvergiert. Doch l¨asst sich zeigen, 0 dass das Integral (5.6) auch die Funktion Γ (z) f¨ ur komplexe Werte z = x + iy definiert, vorausgesetzt die Konvergenzbedingung Re z > 0 ist erf¨ ullt. Wenn wir den Ausdruck f¨ ur Γ (x) partiell integrieren, so ergibt sich ∞ ∞ 1 x −t ∞ tx−1 e−t dt = t(x+1)−1 e−t dt (5.7) t e 0 + x 0 0 und da f¨ ur x > 0 der erste Term auf der rechten Seite dieser Gleichung verschwindet, erhalten wir f¨ ur die Γ -Funktion folgende Rekursionsformel Γ (x + 1) = xΓ (x) ,
(5.8)
welche eine Verallgemeinerung der Beziehung n! = n(n − 1)! darstellt. Aus der Rekursionsformel folgt auch f¨ ur x > 0 und einer ganzen Zahl m > 0 Γ (x + m) = (x + m − 1)(x + m − 2) · · · (x + 2)(x + 1)xΓ (x) .
(5.9)
Damit haben wir eine einfache M¨ oglichkeit, die Definition von Γ (x) auch in den Bereich x < 0 fortzusetzen, indem wir annehmen, dass die Beziehung (5.9) auch f¨ ur x < 0 G¨ ultigkeit hat. Genauer gesagt, wenn x > −m, wo m eine ganze Zahl mit m > 0 ist, dann ist jedenfalls x + m > 0 und daher ur Γ (x) und der Substitution x → x + m Γ (x + m) mithilfe der Formel (5.6) f¨
5.2 Die Gammafunktion und Verwandtes
131
definiert. Daher l¨asst sich die Beziehung Γ (x) =
Γ (x + m) x(x + 1)(x + 2) · · · (x + m − 2)(x + m − 1)
(5.10)
zur Definition von Γ (x) f¨ ur x < 0 heranziehen und diese Funktion ist dann u are Funktion, außer an den offensichtlichen Polen bei x = ¨berall eine regul¨ 0, −1, −2, −3, · · · wo die Funktion divergiert. Bei der Behandlung der sph¨ arischen Bessel-Funktionen in Abschn. 5.5.4 werden wir insbesondere die Werte von Γ (n + 12 ) ben¨otigen, wo n eine ganze Zahl ist. Aufgrund unserer vorangehenden Formeln lassen sich diese alle uckf¨ uhren. Mit der Substitution rekursiv auf die Berechnung von Γ ( 12 ) zur¨ t = s2 , dt = 2sds erhalten wir ∞ ∞ √ 2 1 1 t− 2 e−t dt = 2 e−s ds = π . (5.11) Γ = 2 0 0 Zur Berechnung des letzten Integrals, dem sogenannten vollst¨andigen Gauß’schen Fehlerintegral, betrachten wir das Integral ∞ ∞ π2 ∞ 2 2 2 2 ∞ 4I 2 = 4 e−x dx e−y dy = 4 dϕ e−r rdr = −πe−r = π , 0
0
0
0
0
(5.12) wobei die Integration u ber den ersten Quadranten des (x, y)-Koordinaten¨ systems in ebene Polarkoordinaten (r, ϕ) umgerechnet wurde, sodass nun x2 + y√2 = r2 und dxdy = rdrdϕ sind. Aus dem Integral (5.12) folgt dann 2I = π dem Wert von Γ ( 12 ). Mithilfe von (5.11) l¨asst sich dann allgemein Γ (n + 12 ) f¨ ur n ≥ 0 in folgender Form ausdr¨ ucken
1 1 3 5 3 1√ π (5.13) Γ n+ = n− n− n− ··· 2 2 2 2 22 und analog f¨ ur n ≤ −1
√ 1 π . Γ n+ = 1 3 2 n + 2 n + 2 n + 52 · · · − 32 − 21
(5.14)
Als n¨ achstes leiten wir eine wichtige Beziehung zwischen Gammafunktionen her. Dazu betrachten wir f¨ ur (x, y > 0) das Produkt von Gammafunktionen ∞ ∞ tx−1 e−t dt sy−1 e−s ds (5.15) Γ (x)Γ (y) = 0
0
und setzen t + s = u, um das Doppelintegral in t und u auszudr¨ ucken. Dies liefert u ∞ du dt tx−1 (u − t)y−1 e−u . (5.16) Γ (x)Γ (y) = 0
0
132
5 Spezielle Funktionen
Nun setzen wir t = uτ und erhalten 1 ∞ du e−u ux+y−1 dτ τ x−1 (1 − τ )y−1 = Γ (x + y)B(x, y) , Γ (x)Γ (y) = 0
0
(5.17) wobei die Betafunktion B(x, y) durch folgende Beziehung definiert ist 1 Γ (x)Γ (y) = dτ τ x−1 (1 − τ )y−1 . (5.18) B(x, y) = Γ (x + y) 0 Die in der letzten Gleichung angegebene Integraldarstellung der Betafunktion gilt f¨ ur Werte (x, y)> 0, w¨ ahrend die vorangehende Beziehung zwischen den Gammafunktionen f¨ ur alle Werte (x, y) G¨ ultigkeit hat. An der obigen Relation erkennt man auch die Symmetrie der Betafunktion B(x, y) = B(y, x). Einen interessanten Spezialfall erh¨ alt man f¨ ur y = 1 − x. Dann ergibt sich aus (5.18) 1 τ x−1 (1 − τ )−x dτ . (5.19) Γ (x)Γ (1 − x) = Γ (1)B(x, 1 − x) = 0
Wenn wir in dieser Gleichung τ =
t 1−t
Γ (x)Γ (1 − x) = 0
setzen, so ergibt sich
∞
π tx−1 dt = . 1+t sin πx
(5.20)
Die Berechnung dieses Integrals erfolgt mit Methoden, die wir in Abschn. 7.3.8 bei der Behandlung der Theorie der Integration in der komplexen Zahlenebene kennen lernen werden. Der Integrand hat bei t = −1 einen Pol erster Ordnung und bei t = 0 einen Verzweigungspunkt. Die bisherige Ableitung gilt nur f¨ ur 0 < x < 1, doch sind beide Seiten regul¨are Funktionen bis auf Pole erster Ordnung bei x = 0, ±1, ±2, · · · . Eine andere wichtige Anwendung der Betafunktion f¨ uhrt auf die Gauß’sche Definition der Gammafunktion, die mit Π(x) = Γ (x + 1) bezeichnet wird. Wenn wir in der entsprechenden Definition der Betafunktion 1 Π(x)Π(y) = τ x (1 − τ )y dτ (5.21) B(x + 1, y + 1) = Π(x + y + 1) 0 f¨ ur y eine ganze Zahl n w¨ ahlen und τ = np setzen, so ergibt dies n 1 p n Π(x)n! = x+1 dp px 1 − . Π(x + n + 1) n n 0
(5.22)
Nun lassen wir n → ∞ gehen, sodass (1 − np )n → e−p strebt und damit das Integral auf der rechten Seite dieser Gleichung die Funktion Π(x) ergibt. Mithilfe der Substitution x → x − 1 erhalten wir dann aus (5.22) f¨ ur x > 0 n!nx =1 n→∞ Π(x + n) lim
(5.23)
5.2 Die Gammafunktion und Verwandtes
133
und mit der Beziehung (5.9) folgt schließlich f¨ ur die Gauß’sche Definition der Faktoriellen n!nx . (5.24) Π(x) = lim n→∞ (x + 1)(x + 2) · · · (x + n) Dieser Grenzwert enth¨ alt ersichtlich nur einfache algebraische Ausdr¨ ucke. Der Grenzwert existiert und ist endlich f¨ ur alle reellen x außer f¨ ur x = −1, −2, −3, · · · und wir k¨ onnen daher diesen Ausdruck als die allgemeine Definition der Funktion Π(x) betrachten. F¨ ur x > 0 stimmt die Definition (5.24) jedenfalls mit der fr¨ uher gegebenen, Euler’schen Definition u ¨ berein, doch l¨ asst sich durch analytische Fortsetzung (siehe Abschn. 7.3.5) in der ¨ komplexen Zahlenebene der Beweis der Ubereinstimmung auch f¨ ur x < 0 erbringen. Die logarithmische Ableitung von Π(x) nennt man die ,,Digammafunktion“ ψ(x) und wir finden mithilfe der Gauß’schen Definition von Π(x) 1 1 1 1 d ln Π(x) = lim ln n − − − ···− . ψ(x) = n→∞ dx x+1 x+2 x+3 x+n (5.25) Wenn m eine ganze Zahl ist, erhalten wir dann ψ(x + m) = ψ(x) +
1 1 1 1 + + ···+ . x+1 x+2 x+3 x+m
Ferner ergibt sich aus (5.25) f¨ ur x = 0 1 1 1 ψ(0) = lim ln n − 1 − − · · · − = −γ . n→∞ 2 3 n
(5.26)
(5.27)
Man kann zeigen, dass dieser Limes einen endlichen Wert hat, der mit γ bezeichnet wird und die ,,Euler’sche Konstante“ heißt. Ihr Wert ist γ = 0,577215 . . . und die Existenz dieses Grenzwertes ergibt sich aus folgender Absch¨ atzung sn =
n 1 =0
− ln n < 1
n
dx − ln n + 1 = 1 x
(5.28)
und daher ist limn→∞ sn = γ < 1. Die Gammafunktion, die Pifunktion und die Euler’sche Konstante werden uns bei der Darstellung der BesselFunktionen in Abschn. 5.5 begegnen. Schließlich leiten wir noch eine N¨ aherung f¨ ur die Pifunktion Π(x) ab. Als Ausgangspunkt w¨ ahlen wir die Integraldarstellung (5.6) von Γ (x) f¨ ur x→x+1 ∞ Π(x) = tx e−t dt (5.29) 0
134
5 Spezielle Funktionen
√ und machen die Variablentransformation t = x + τ x, sodass ∞ √ √ √ Π(x) = √ (x + τ x)x e−(x+τ x) xdτ
(5.30)
− x
wird. Zieht man in dieser Gleichung die τ -unabh¨angigen Terme vor das Integral, so kann man setzen
x ∞ √ Π(x) τ −τ x e dτ 1+ √ 1 = √ x e−x xx+ 2 − x
∞ √ τ = √ exp −τ x + x ln 1 + √ dτ . (5.31) x − x Hier l¨ asst sich der zweite Integralausdruck√in zwei √ Anteile aufgespalten, n¨ amlich in ein √ Integral mit den Grenzen (− x, + x) und ein weiteres mit den Grenzen ( x, ∞), wobei im ersten dieser Integrale der Logarithmus in eine Reihe nach √τx entwickelt wird. Dies ergibt
τ τ2 + ··· dτ = √ exp −τ x + x √ − x 2x − x
∞ √ τ + √ exp −τ x + x ln 1 + √ dτ . x x
Π(x) 1
e−x xx+ 2
√
x
√
(5.32)
F¨ ur x → ∞ strebt das zweite Integral gegen Null, kann also f¨ ur große Werte von x vernachl¨ assigt werden. Im ersten Integral heben sich in der Exponentialfunktion die beiden ersten Terme gegenseitig weg und es bleibt daher das Integral ∞ 2 √ Π(x) − τ2 = e dτ = 2π , (5.33) 1 e−x xx+ 2 −∞ wobei das letzte Integral wie in (5.12) berechnet wurde. Wenn nun x = n eine sehr große ganze Zahl ist, erhalten wir mithilfe (5.33) wegen Π(n) = n! die ,,Stirling’sche N¨ aherung“ f¨ ur n!, n¨ amlich √ 1 n! = 2πe−n nn+ 2 . (5.34) Diese Formel liefert u ur kleine ganze Zah¨ berraschend genaue Werte selbst f¨ len n. Wenn zum Beispiel n = 3 ist und daher n! = 6, wird die Stirling-Formel die N¨ aherung n! ∼ ur n = 10 ist n! = 3.628.800 w¨ahrend = 5.836 ergeben. F¨ nach Stirling n! ∼ = 3.598.695, 618 ist, entsprechend einer Genauigkeit von 1%. Die Stirling-Formel findet daher wichtige Anwendungen in der Wahrscheinlichkeitstheorie großer Zahlen, also in der Physik ganz besonders in der Statistischen Thermodynamik und der Quantenstatistik (vgl. Kap. 8). ¨ Den Ubergang zu einer Reihe von Funktionen, die mit der Gammafunktion verwandt sind, gestattet die unvollst¨ andige Gammafunktion. Diese wird
5.2 Die Gammafunktion und Verwandtes
f¨ ur x > 0 und y ≥ 0 durch folgendes Integral definiert ∞ Γ (x, y) = tx−1 e−t dt
135
(5.35)
y
welches mithilfe von (5.6) auf die Gestalt gebracht werden kann ∞ y Γ (x, y) = tx−1 e−t dt − tx−1 e−t dt . 0
(5.36)
0
Setzen wir in (5.35) x = 0, so erhalten wir f¨ ur y > 0 die Definition des ,,Exponentialintegrals“ ∞ −t e dt (5.37) ei(y) = t y −y und wenn wir in diesem Integral t = − ln u, dt = − du =z u setzen und e nennen, so ergibt sich z 0 du du = = li(z) , (5.38) ei(y) = − e−y ln u 0 ln u
wo die Funktion li(z) den sogenannten ,,Integrallogarithmus“ bezeichnet. Wenn wir ferner im Integral (5.37) die Substitution t → −it machen aber die Integrationsgrenzen nicht ¨ andern, so erhalten wir ∞ ∞ ∞ it e cos t sin t dt = − dt − i dt = ci(y) + isi(y) (5.39) − t t t y y y und diese Funktionen werden der ,,Integralcosinus“ und der ,,Integralsinus“ genannt, wobei genau genommen Si(y) = si(y) + π2 definiert ist. Auf das unvollst¨ andige Gauß’sche Fehlerintegral oder die Gauß’sche Fehlerfunktion werden wir gef¨ uhrt, wenn wir in der unvollst¨ andigen Gammafunktion (5.35) x = 12 setzen. Dies ergibt nach der Transformation t = u2 , dt = udu
∞ ∞ 2 1 1 ,y = Γ t− 2 e−t dt = √ e−u du 2 y y √ ∞ √y √y 2 π −u2 −u2 = − e du − e du = e−u du , (5.40) 2 0 0 0 wobei wir das Resultat (5.11) f¨ ur das vollst¨ andige Gauß’sche Fehlerintegral verwendet haben. Um dieses letzte Integral auf 1 zu normieren, definiert man die ,,Gauß’sche Fehlerfunktion“ durch z 2 2 erf(z) = √ e−u du (5.41) π 0
136
5 Spezielle Funktionen
und ihr Komplement erf c(z) = 1 − erf(z) ist dann gegeben durch ∞ 2 2 e−u du . erf c(z) = 1 − erf(z) = √ π z
(5.42)
Diese Fehlerfunktionen sind bei der L¨ osung von partiellen Differenzialgleichungen in der Diffusions- und W¨ armeleitungstheorie von Interesse, aber von ganz besonderer Bedeutung in der Wahrscheinlichkeitstheorie und in der Statistik (siehe Abschn. 8.4.2). Außerdem werden alle zuletzt angegebenen Funktionen bei der Laplace-Transformation angetroffen, auf die wir in Abschn. 7.4 zur¨ uckkommen werden. F¨ ur die Fehlerfunktion und die anderen speziellen Funktionen lassen sich asymptotische Darstellungen f¨ ur große Werte von x angeben. Um dies zu zeigen, betrachten wir erf c(z) und erhalten nach Erweiterung von Z¨ ahler und Nenner durch die Variable u und anschließender partieller Integration ∞ ∞ 2 2 du 2 2 e−u du = √ ue−u erf c(z) = √ π z π z u 2 ∞ ∞ 2 du e−u 1 = −√ − √ e−u 2 , (5.43) πu π z u z
sodass in erster N¨ aherung bei Vernachl¨ assigung des zweiten Terms 2
e−z erf c(z) = √ πz
(5.44)
gesetzt werden kann. F¨ uhrt man in (5.43) beim letzten Term nach dem selben Schema eine neuerliche partielle Integration durch, so erhalten wir anstelle (5.44)
2 e−z 1 erf c(z) = √ (5.45) 1 − 2 + ··· πz 2z und die N¨ aherung f¨ ur erf c(z) wird umso besser, je mehr Terme der Potenzreihe in z12 berechnet werden. Bei den anderen betrachteten Funktionen kann man ganz analog vorgehen. Abschließend nennen wir noch die ,,Fresnel’schen Integrale“ C(x) und S(x), die bei der Wellenausbreitung, insbesondere bei der Theorie der Beugung auftreten. Sie sind ersichtlich mit der Fehlerfunktion erf(z) verwandt und durch das Integral definiert x x x π π π 2 u2 du+i u2 du = C(x)+iS(x) . (5.46) ei 2 u du = cos sin 2 2 0 0 0 Die Eigenschaften aller Funktionen, die in diesem Abschnitt genannt wurden, sind eingehend untersucht und der Leser findet in den am Ende des Buches genannten Tabellenwerken detailliertere Angaben.
5.3 Gew¨ ohnliche lineare Differenzialgleichungen
137
5.3 Gew¨ ohnliche lineare Differenzialgleichungen F¨ ur die eingehende Diskussion der speziellen Funktionen, die aus der Separation linearer partieller Differenzialgleichungen hervorgehen, ben¨otigen wir einige Kenntnisse u osung gew¨ ohnlicher, linearer Differenzialgleichun¨ ber die L¨ gen zweiter Ordnung mit variablen Koeffizienten. Darunter sind auch solche Differenzialgleichungen von physikalischem Interesse, deren Koeffizienten periodische Funktionen des Ortes x oder der Zeit t sind. Der eingehenden Diskussion der L¨osung solcher Differenzialgleichungen sind die folgenden Abschnitte gewidmet. 5.3.1 L¨ osung von Differenzialgleichungen durch Potenzreihen a) Lineare Differenzialgleichungen mit konstanten Koeffizienten Im Folgenden diskutieren wir einige allgemeine Eigenschaften gew¨ohnlicher, linearer Differenzialgleichungen, insbesondere jener zweiter Ordnung, und deren L¨ osungen mithilfe der Methode der Potenzreihen. Als Ausgangspunkt unserer Betrachtungen w¨ ahlen wir die homogene lineare Differenzialgleichung zweiter Ordnung mit konstanten Koeffizienten p, q, r in der Form py (x) + qy (x) + ry(x) = 0 .
(5.47)
Diese l¨ asst sich durch den Euler’schen Ansatz y(x) = Ceαx l¨osen, wo C eine beliebige Konstante und α ein noch zu bestimmender Parameter ist. Das Einsetzen des Ansatzes und die Ausf¨ uhrung der Differenziationen liefert (pα2 + qα + r)Ceαx = 0 .
(5.48)
Da diese Gleichung f¨ ur beliebige Werte von x erf¨ ullt sein soll, kann dies nur der Fall sein, wenn der Ausdruck in der Klammer verschwindet. Also erhalten wir eine quadratische Gleichung f¨ ur die Bestimmung der beiden m¨oglichen Werte von α. Hat diese Gleichung zwei voneinander verschiedene Wurzeln α1 und α2 , so lautet die allgemeine L¨ osung der Differenzialgleichung, da diese linear ist y(x) = C1 y1 (x) + C2 y2 (x) = C1 eα1 x + C2 eα2 x (5.49) und die beiden linear unabh¨ angigen L¨ osungen y1,2 (x) = eα1,2 x nennt man ein Fundamentalsystem der Differenzialgleichung. Dieses System hat die Eigenschaft, dass seine Wronski-Determinate nicht gleich Null ist. Dabei ist diese ,,Wronski-Determinante“ folgendermaßen definiert y (x) y2 (x) eα1 x eα2 x = (α2 − α1 )e(α1 +α2 )x . (5.50) Δ = 1 = y1 (x) y2 (x) α1 eα1 x α2 eα2 x Dieses Nichtverschwinden der Wronski-Determinante ist ein Ausdruck f¨ ur die lineare Unabh¨ angigkeit der beiden L¨ osungen y1 (x) und y2 (x). Da jede
138
5 Spezielle Funktionen
beliebige L¨ osung einer linearen Differenzialgleichung zweiter Ordnung durch Vorgabe von y0 und y0 an einer beliebigen Stelle x0 eindeutig bestimmt ist, denn dann lassen sich alle h¨ oheren Ableitungen bei x0 aus der Differenzialgleichung berechnen und somit die L¨ osung in Form einer Taylor-Reihe angeben. Somit k¨ onnen wir auch nach Auffindung eines Fundamentalsystems aus den beiden Gleichungen y0 = C1 y1 (x0 ) + C2 y2 (x0 ) ,
y0 = C1 y1 (x0 ) + C2 y2 (x0 )
(5.51)
wegen Δ = 0 die beiden Koeffizienten C1 und C2 eindeutig berechnen und damit ist die in (5.49) gefundene Darstellung tats¨achlich die allgemeine L¨osung der Differenzialgleichung. Hat die charakteristische Gleichung, die aus (5.48) folgt, f¨ ur den Parameter α zwei gleiche Wurzeln α1 = α2 , dann kann neben angige L¨ osung gefunden werden, indem y1 (x) = eα1 x eine zweite linear unabh¨ man folgenden Limes betrachtet eα2 x − eα1 x d αx e = = xeα1 x . (5.52) lim α2 →α1 α2 − α1 dα α=α1 Dann bilden y1 (x) = eα1 x und y2 (x) = xeα1 x ein Fundamentalsystem, da dann Δ = e2α1 x = 0 ist. Wir betrachten nun die L¨ osung der inhomogenen linearen Differenzialgleichung (5.53) py (x) + qy (x) + ry(x) = fˆ(x) , wo fˆ(x) physikalisch irgend eine Quellfunktion darstellt, wie sie fr¨ uher in Abschn. 3.5 schon besprochen wurden. Wie sich zeigen l¨asst, besteht die allgemeine L¨ osung dieser Gleichung aus der allgemeinen L¨osung der homogenen Gleichung und einem partikul¨ aren Integral yˆ(x) der inhomogenen Gleichung, d. h. (5.54) y(x) = C1 y1 (x) + C2 y2 (x) + yˆ(x) , wobei die L¨ osung wieder eindeutig bestimmt ist, wenn an einer Stelle x0 die Werte y0 und y0 gegeben sind, sodass die Koeffizienten C1 und C2 berechnet werden k¨ onnen. Die u ¨bliche Methode zur Auffindung des partikul¨aren Integrals der inhomogenen Gleichung besteht in der Variation der Konstanten, d. h. man macht den L¨ osungsansatz yˆ(x) = C1 (x)y1 (x) + C2 (x)y2 (x) .
(5.55)
Dieser liefert beim einsetzen in die Differenzialgleichung (5.53) p[C1 y1 + C2 y2 + 2(C1 y1 + C2 y2 )] + q(C1 y1 + C2 y2 ) + r(C1 y1 + C2 y2 ) = fˆ(x) .
(5.56)
5.3 Gew¨ ohnliche lineare Differenzialgleichungen
139
Diese Gleichung gen¨ ugt jedoch nicht zur eindeutigen Festlegung der Funktionen C1 (x) und C2 (x). Dies geschieht mithilfe der zweiten Bedingung C1 y1 + C2 y2 = 0 ,
(5.57)
sodass dann auch (C1 y1 + C2 y2 ) = 0 ist. Mit dieser letzten Bedingung folgt dann aus der Differenzialgleichung (5.53) C1 y1 + C2 y2 =
fˆ(x) p
(5.58)
und die beiden Gleichungen (5.57) und (5.58) k¨onnen dann zur Berechnung der Funktionen C1 (x) und C2 (x) dienen. Im Fall der konstanten Koeffizienten p, q, r liefert dann die Aufl¨ osung und Integration (wenn α1 = a2 ist) x x y2 (t) eα1 t C1 (x) = dt = dt (5.59) fˆ(t) fˆ(t) Δ(t) α2 − α1
und C2 (x) = −
x
y1 (t) dt = fˆ(t) Δ(t)
x
eα2 t dt , fˆ(t) α2 − α1
(5.60)
wobei die beliebigen Integrationskonstanten weggelassen wurden. b) Lineare Differenzialgleichungen mit variablen Koeffizienten Die soeben angegebenen S¨ atze f¨ ur die L¨ osung linearer Differenzialgleichungen mit konstanten Koeffizienten gelten auch allgemeiner f¨ ur Gleichungen der Form p(x)y (x) + q(x)y (x) + r(x)y(x) = fˆ(x) . (5.61) Wichtig ist auch hier die Bestimmung eines Fundamentalsystems der homogenen Differenzialgleichung mit fˆ(x) = 0. Da aber hier die L¨osungen im allgemeinen nicht durch elementare Funktionen wie eαx darstellbar sind, da der Euler’sche L¨ osungsansatz versagt, suchen wir eine Darstellung der L¨osungen in Form von Potenzreihen, durch welche dann eine ganze Klasse von f¨ ur die Physik wichtigen Funktionen definiert werden kann. Diese Methode stammt von ,,Frobenius“. Dieser zeigte, dass sich viele lineare, homogene Differenzialgleichungen durch einen L¨ osungsansatz von der Form y(x) = xs
∞
cn xn
(5.62)
n=0
behandeln lassen, wo s nicht notwendig eine ganz Zahl ist, die aber auch Null sein kann. Zur Erl¨ auterung des Verfahrens betrachten wir ein elementares Problem.
140
5 Spezielle Funktionen
Beispiel Gegeben sei die Differenzialgleichung dT (t) + αT (t) = 0 , dt
(5.63)
wo α > 0 ein konstanter Parameter ist. Diese Gleichung ist etwa von Bedeutung bei der Beschreibung des radioaktiven Zerfalls instabiler Atomkerne. Wir machen den L¨ osungsansatz T (t) = t
s
∞
c n tn .
(5.64)
n=0
Beim einsetzen in die Differenzialgleichung erh¨alt man c0 sts−1 +
∞
{(s + k)ck + αck−1 }ts+k−1 = 0 .
(5.65)
k=1
Damit diese Gleichung f¨ ur alle Werte von t erf¨ ullt ist, ist notwendig, dass die Koeffizienten aller Potenzen von t einzeln gleich Null sind. Also folgt s = 0 sein muss. Aus aus dem ersten Term, wenn c0 = 0 sein soll, dass dem Verschwinden der einzelnen Koeffizienten der k schließen wir, dass kck + αck−1 = 0 ist. Dies liefert zur Bestimmung der Koeffizienten ck die Rekursionsformel α ck = − ck−1 , k
ck = c 0
(−1)k αk , k!
(5.66)
wobei die letzte Beziehung f¨ ur die Koeffizienten ck sich ergibt, wenn man die Rekursionsformel sukzessive anwendet. Also lautet die L¨osungsreihe der betrachteten Differenzialgleichung T (t) = c0
∞ (−α)n n t . n! n=0
(5.67)
Dies ist aber die Reihe, durch welche die Exponentialfunktion (vom Argument −αt) definiert wird. Also lautet die L¨ osung der obigen Differenzialgleichung T (t) = c0 e−αt .
(5.68)
Ganz ¨ ahnlich lassen sich andere spezielle Funktionen der Physik durch ihre Differenzialgleichung und deren L¨ osungsreihen definieren. Mit der gleichen Methode k¨ onnen wir auch die L¨ osung folgender Differenzialgleichung behandeln (5.69) y (x) + k 2 y(x) = 0 . Hier zeigt sich, wie der Leser selbst nachpr¨ ufen m¨oge, dass die L¨osungsreihe f¨ ur y(x) zwei unbestimmte Koeffizienten c0 und c1 enth¨alt, von denen jede
5.3 Gew¨ ohnliche lineare Differenzialgleichungen
141
eine andere Reihe definiert, welche die Cosinus- und die Sinus-Funktionen darstellen. Also bestimmt hier die Wahl c0 = 1, c1 = 0 und c0 = 0, c1 = 1 ein Fundamentalsystem der Differenzialgleichung, d. h. die Cosinus- und die Sinus-Funktionen stellen zwei linear unabh¨ angige L¨osungen dar. Nun kehren wir zur allgemeinen Form (5.61) der homogenen linearen Differenzialgleichung mit fˆ(x) = 0 zur¨ uck, dividieren diese durch p(x) und setzen q(x) r(x) p(x) = Q(x) und p(x) = R(x) und betrachten die nun homogene Gleichung y (x) + Q(x)y (x) + R(x)y(x) = 0 .
(5.70)
Die Gleichung l¨ asst eine L¨ osung mithilfe der Methode von Frobenius zu, wenn eine der folgenden Bedingungen erf¨ ullt ist: I: Der regul¨are Punkt. Die Stelle x = a heißt ein regul¨arer Punkt der Differenzialgleichung, wenn die Funktionen Q(x) und R(x) in der Umgebung |x − a| < R sich regul¨ ar verhalten, d. h. nicht unendlich werden. Man kann zeigen, dass dann auch jede L¨ osung y(x) in derselben Umgebung eine regul¨are Funktion ist, also im Bereich |x − a| < R durch eine konvergente Potenzreihe y(x) =
∞
cn (x − a)n
(5.71)
n=0
dargestellt werden kann. Sind insbesondere Q(x) und R(x) Polynome in x, so gilt diese Darstellung f¨ ur alle |x| < ∞. Die Koeffizienten cn erh¨alt man rekursiv nach Einsetzen des L¨ osungsansatzes (5.71) in die Differenzialgleichung. II: Der singul¨are Punkt. Die Stelle x = a heißt ein singul¨arer Punkt der Differenzialgleichung, wenn eine der beiden Funktionen Q(x) und R(x) sich bei x = a nicht regul¨ ar verh¨ alt. Hat jedoch Q(x) bei x = a h¨ochstens einen Pol A , erster Ordnung, d. h. in der Umgebung der singul¨aren Stelle ist Q(x) ∼ x−a und R(x) h¨ ochstens einen Pol zweiter Ordnung, also nahe der Singularit¨at B R(x) ∼ (x−a) 2 , so kann man die Differenzialgleichung in folgender Form ansetzen g(x) h(x) y (x) + y (x) + y(x) = 0 , (5.72) x−a (x − a)2 wo g(x) und h(x) bei x = a regul¨ ar sind. In diesem Fall nennt man die Stelle x = a eine außerwesentliche Singularit¨ at der Differenzialgleichung. Alle anderen Punkte der Differenzialgleichung mit Divergenzen h¨oherer Ordnung nennt man wesentliche Singularit¨ aten der Differenzialgleichung. Ist x = a eine außerwesentliche Singularit¨ at der Differenzialgleichung so gilt das ,,Fuchs’sche Theorem“, wonach mindestens eine L¨osung der folgenden Form existiert ∞ s cn (x − a)n . (5.73) y(x) = (x − a) n=0
Verhalten sich g(x) und h(x) in |x − a| < R regul¨ar, so konvergiert die Darstellung f¨ ur y(x) im selben Bereich. Macht man f¨ ur g(x) und h(x) die
142
5 Spezielle Funktionen
Potenzreihenans¨ atze g(x) =
∞
g (x − a) ,
h(x) =
=0
∞
h (x − a)
(5.74)
=0
und setzt dies gemeinsam mit dem L¨ osungsansatz (5.73) in die Differenzialgleichung ein, so liefert der Koeffizient von (x − a)s gleich Null gesetzt die sogenannte Fundamental- oder Indexgleichung c0 s(s − 1) + g0 c0 s + h0 c0 = 0 ,
(5.75)
sodass wir f¨ ur c0 = 0 die folgende quadratische Gleichung zur Bestimmung von s erhalten (5.76) s2 + (g0 − 1)s + h0 = 0 . Setzt man analog die Koeffizienten von (x − a)s+n gleich Null, so erh¨alt man eine zweigliedrige Rekursionsformel zur sukzessiven Bestimmung der angen. Da die Indexgleichung (5.76) Koeffizienten cn , die auch noch von s abh¨ stets zwei Wurzeln s1 und s2 hat, ergeben sich zwei Folgen von Koeffizienten (1) (2) cn und cn und daher die beiden L¨ osungsreihen y1 (x) =
∞
s1 +n c(1) , n (x − a)
y2 (x) =
n=0
∞
s2 +n c(2) . n (x − a)
(5.77)
n=0
Je nach Beschaffenheit der beiden Wurzeln der Indexgleichung sind drei verschiedene F¨ alle zu unterscheiden (I):
(II):
s1 − s2 = 0, bzw. = , wo eine ganze Zahl ist. Dann sind die beiden obigen L¨ osungen y1 (x) und y2 (x) linear unabh¨angig und bilden ein Fundamentalsystem der Differenzialgleichung. s1 = s2 . In diesem Fall sind die beiden L¨osungen y1 (x) und y2 (x) (meist bis auf einen konstanten Faktor) mit einander identisch. Hier kann man zeigen, dass ein Fundamentalsystem durch folgende beiden Reihen gegeben ist y1 (x) = (x − a)s1
∞
n c(1) n (x − a)
(5.78)
n=0
und y2 (x) = y1 (x) ln(x − a) + (x − a)
s1
∞ n=0
-
(1)
∂cn ∂s
. (x − a)n . (5.79) s=s1
(III): s1 − s2 = , wo > 0 und eine ganze Zahl ist. Hier sind alle Koeffizienten cn in der Reihe f¨ ur s2 < s1 ab einer gewissen Stelle entweder unendlich oder unbestimmt. Doch kann man nachweisen, dass die bei-
5.3 Gew¨ ohnliche lineare Differenzialgleichungen
143
den folgenden Reihen y1 (x) = (x − a)s1
∞
n c(1) n (x − a)
(5.80)
n=0
und y2 (x) = Cy1 (x) ln(x − a) + (x − a)s2
∞
bn (x − a)n
(5.81)
n=0
ein Fundamentalsystem liefern. C ist dabei eine Konstante, die auch Null sein kann. In diesem Fall fehlt das logarithmische Glied. In den F¨ allen (II) und (III) kann man sich die zweite L¨osung y2 (x) in folgender Weise verschaffen und dabei auch das Auftreten des logarithmischen Anteils verstehen. Dazu betrachten wir die Wronski-Determinante (5.50) Δ(x) = y1 (x)y2 (x) − y1 (x)y2 (x) .
(5.82)
Wenn wir diese nach x differenzieren und beachten, dass y1 (x) und y2 (x) L¨ osungen der Differenzialgleichungen sein sollen, dann erhalten wir f¨ ur Δ(x) (gem¨ aß (5.70)) die folgende Differenzialgleichung und deren L¨osung x Δ (x) + Q(x)Δ(x) = 0 , Δ(x) = Δ(x0 ) exp − Q(x )dx . (5.83) x0
Andererseits kann man aber durch Ausdifferenzieren leicht nachweisen, dass Δ(x) auch in folgender Form als Differenzialgleichung ausgedr¨ uckt werden kann, deren L¨ osung leicht anzugeben ist
x Δ(x ) d y2 (x) 2 y1 (x) (5.84) = Δ(x) , y2 (x) = y1 (x) 2 dx . dx y1 (x) x0 y1 (x ) Damit ergibt sich ein Weg mithilfe der Kenntnis von Δ(x), wegen der Gleichung (5.83), und der L¨ osung y1 (x) eine zweite, linear unabh¨angige L¨osung y2 (x) der Differenzialgleichung zu finden, die bei der expliziten Ausrechnung das angegebene Verhalten zeigt. Um dies direkt nachzuweisen, betrachten wir folgendes Beispiel einer Differenzialgleichung vom Fuchs’schen Typ. Beispiel Gegeben sei folgende Differenzialgleichung y (x) −
1 1 y (x) + 2 y(x) = 0 . x x
(5.85)
Die Gleichung hat bei x = 0 eine außerwesentliche Singularit¨at. Eine L¨osung an dieser Stelle kann durch den Ansatz y(x) = xλ gefunden werden. Einsetzen
144
5 Spezielle Funktionen
in die Differenzialgleichung liefert f¨ ur die Bestimmung von λ die Gleichung [λ(λ − 1) − λ + 1]xλ = 0 ,
(λ − 1)2 = 0 .
(5.86)
Wir erhalten also auf diesem Wege eine Doppelwurzel λ = 1 und daher nur eine L¨ osung y1 (x) = x. Zur Berechnung der zweiten L¨osung beachten wir, dass hier Q(x) = − x1 ist und wir finden daher mithilfe von (5.83) x x dx (5.87) Δ(x) = Δ(x0 ) exp = Δ(x0 )eln x0 = Cx x x0 und daher beim einsetzen der L¨ osung f¨ ur Δ(x) in die Gleichung (5.84) x dx y2 (x) = Cx = Cx ln x + Dx = y1 (x) ln x + F (x) . (5.88) x0 x ¨ Das erhaltene Fundamentalsystem ist dann in Ubereinstimmung mit (5.79). Es sei noch bemerkt, dass man in den F¨ allen (II) und (III) auch eine zweite L¨ osung durch den Ansatz y2 (x) = u(x)y1 (x) finden kann. Setzt man n¨ amlich diesen Ansatz in die Differenzialgleichung (5.72) ein und beachtet, dass y1 (x) eine L¨ osung der Differenzialgleichung ist, so erh¨alt man eine Differenzialgleichung erster Ordnung f¨ ur die Funktion u(x) und nach deren L¨osung bilden die so gefundenen Funktionen y1 (x) und y2 (x) ein Fundamentalsystem. III: Der unendlich ferne Punkt. Bei vielen Problemen sucht man L¨osungen der betrachteten Differenzialgleichung (5.70), die f¨ ur große Werte von x gelten. Dazu betrachtet man eine unendliche Reihe in x1 . Mithilfe der Transformation x = 1ξ gelangt der unendlich ferne Punkt in den Nullpunkt der ξ-Achse. Bei dieser Variablentransformation geht die Gleichung (5.70) in folgende Gleichung u ¨ ber 2 1 1 1 dy 1 d2 y + Q R − + y=0. (5.89) dξ 2 ξ ξ2 ξ dξ ξ4 ξ Sind die Koeffizienten von y (ξ) und y(ξ) f¨ ur ξ → 0 analytisch, so ist ξ = 0 ein regul¨ arer Punkt der Differenzialgleichung und man nennt dann x = ∞ einen regul¨ aren Punkt der urspr¨ unglichen Differenzialgleichung. Kehrt man zu dieser Gleichung und der Variablen x zur¨ uck, so zeigt sich, dass im Unendlichen ein regul¨ arer Punkt der Differenzialgleichung vorliegt, wenn die Bedingung erf¨ ullt ist 1 1 2 , R(x) = O , x→∞, (5.90) Q(x) = + O 2 x x x4 wo O die ,,Ordnung“ andeutet. Dann haben die L¨osungen der Differenzialgleichung (5.70) die Form y(x) =
∞ n=0
cn
1 . xn
(5.91)
5.3 Gew¨ ohnliche lineare Differenzialgleichungen
145
Ebenso heißt der Punkt im Unendlichen ein außerwesentlich singul¨arer Punkt der Differenzialgleichung, wenn f¨ ur x → ∞ 1 1 Q0 R0 +O Q(x) = , R(x) = 2 + O (5.92) x x2 x x3 und wo Q0 und R0 Konstante sind. Die entsprechende Indexgleichung hat dann die Form s2 + (1 − Q0 )s + R0 = 0 . (5.93) Wenn s1 und s2 die Wurzeln dieser Gleichung sind, so haben f¨ ur große Werte von x die beiden L¨ osungen der Differenzialgleichung die Form y1 (x) =
∞ 1 (1) 1 c , xs1 n=0 n xn
y2 (x) =
∞ 1 (2) 1 c . xs2 n=0 n xn
(5.94)
5.3.2 Differenzialgleichungen mit periodischen Koeffizienten Diese Differenzialgleichungen sind von Bedeutung bei der Beschreibung der periodischen Bewegung der Gestirne, bei der Diskussion der Teilchenbahnen in zirkularen Beschleunigungsanlagen, zur Beschreibung der Bewegung der Elektronen im periodischen Potenzial der Ionen in einem Kristall, bei Problemstellungen in der Laserphysik und ¨ ahnliches mehr. Daher sollen die Grundz¨ uge der L¨ osungen solcher Differenzialgleichungen hier behandelt werden. Der Einfachheit wegen betrachten wir die folgende Differenzialgleichung, die in den meisten F¨ allen angetroffen wird y (x) + R(x)y(x) = 0 .
(5.95)
Da in dieser Gleichung der Koeffizient Q(x) = 0 ist, wird wegen der Gleichung (5.83) die Wronski-Determinante Δ eine Konstante, d. h. unabh¨angig ¨ von der Koordinate x sein. Dies ist f¨ ur die folgenden Uberlegungen von Bedeutung. Der Koeffizient R(x) habe die Periode a, sodass R(x) = R(x + a) osungen der Differenzialgleichung, die ein ist. Es seien y1 (x) und y2 (x) zwei L¨ Fundamentalsystem bilden. Da sich die Differenzialgleichung nicht ¨andert, wenn wir x durch x + a ersetzen, werden auch y¯1 (x) = y1 (x + a) und y¯2 (x) = y2 (x + a) ein Fundamentalsystem darstellen, denn wenn eine lineare Beziehung c1 y¯1 + c2 y¯2 = 0 best¨ unde, so w¨ urde mit der Substitution x → x− a auch eine solche Beziehung zwischen y1 und y2 bestehen, im Gegensatz zur Annahme der linearen Unabh¨ angigkeit. Zwischen den L¨osungen y¯1 , y¯2 und y1 , y2 wird aber ein linearer Zusammenhang folgender Form bestehen y¯1 = a11 y1 + a12 y2 , y¯2 = a21 y1 + a22 y2
(5.96)
wobei die Determinante der reellen Koeffizienten aik ungleich Null sein wird, da sonst zwischen den L¨ osungen y¯1 und y¯2 ein linearer Zusammenhang
146
5 Spezielle Funktionen
best¨ unde. Anstelle des Fundamentalsystems y1 und y2 f¨ uhren wir nun ein anderes System Y1 , Y2 ein, das bei der Vermehrung von x um die Periode a eine m¨ oglichst einfache Transformation erf¨ ahrt. Wir versuchen dazu zwei Konstanten γ1 und γ2 so zu bestimmen, dass die Funktion Y (x) = γ1 y1 (x) + γ2 y2 (x) in die Funktion Y¯ (x) = γ1 y¯1 (x) + γ2 y¯2 (x) = sY (x) u ¨bergeht, wo s eine noch zu bestimmende Konstante ist. Dr¨ ucken wir hier y¯1 und y¯2 mithilfe der linearen Substitution (5.96) durch y1 und y2 aus, so liefert dies die Gleichung γ1 (a11 y1 + a12 y2 ) + γ2 (a21 y1 + a22 y2 ) − s(γ1 y1 + γ2 y2 ) = 0 .
(5.97)
Da aber laut Voraussetzung zwischen y1 und y2 keine lineare Beziehung besteht, m¨ ussen in der letzten Gleichung nach der Ausmultiplikation die Koefuhrt auf das folgende homogene fizienten von y1 und y2 verschwinden. Dies f¨ lineare Gleichungssystem (a11 − s)γ1 + a21 γ2 = 0 . a12 γ1 + (a22 − s)γ2 = 0
(5.98)
Damit dieses System eine L¨ osung (γ1 , γ2 ) besitzt, ist notwendig und hinreichend, dass die Determinante der Koeffizienten des Gleichungssystems verschwindet, also a11 − s a21 2 (5.99) a12 a22 − s = s − (a11 + a22 )s + (a11 a22 − a12 a21 ) = 0 . Diese Gleichung wird wesentlich vereinfacht, wenn wir beachten, dass in unserem Fall die Wronski-Determinante unabh¨ angig von x, also eine Konstante ist. Dann folgt n¨ amlich, dass in (5.99) die Determinante a11 a22 − a12 a21 = 1 ist. Zum Nachweis betrachten wir die Wronski-Determinate von (¯ y1 , y¯2 ) und verwenden die linearen Beziehungen (5.96). Dies ergibt mithilfe der Regeln f¨ ur die Multiplikation von Determinanten (vgl. Anh. B.2.2.5) y¯1 y¯1 a11 y1 + a12 y2 a11 y1 + a12 y2 = y¯2 y¯2 a21 y1 + a22 y2 a21 y1 + a22 y2 a a y y y y = 11 12 · 1 1 = 1 1 , (5.100) a21 a22 y2 y2 y2 y2 woraus die Behauptung folgt. Da aber die quadratische Gleichung (5.99) mithilfe ihrer beiden Wurzeln s1 und s2 auch auf folgende Form gebracht werden kann (s − s1 )(s − s2 ) = s2 − (s1 + s2 ) + s1 s2 = 0, ist nach dem Vorhergehenden s1 s2 = 1. Diese Gleichung l¨ asst sich erf¨ ullen, wenn wir s1 = eμa 1 −μa und s2 = s1 = e setzen. Wenn der Parameter μ = 0 ist, erhalten wir so zwei verschiedene Wurzeln der quadratischen Gleichung. Entsprechend liefert das homogene, lineare Gleichungssystem (5.98) die beiden L¨osungen
5.3 Gew¨ ohnliche lineare Differenzialgleichungen (1)
(1)
(2)
147
(2)
(γ1 , γ2 ) und (γ1 , γ2 ) und daher die beiden L¨osungen der Differenzialgleichung (5.95) (i)
(i)
Yi (x) = γ1 y1 (x) + γ2 y2 (x) ,
i = 1, 2 ,
(5.101)
die bei der Substitution x → x + a in die L¨osungen Y¯i (x) = si Yi (x) (i = 1, 2) u ¨bergehen. Die beiden Funktionen (5.101) bilden ein Fundamentalsystem der Differenzialgleichung, denn wenn zwischen ihnen eine lineare unde, so w¨ urde nach der SubBeziehung der Form C1 Y1 + C2 Y2 = 0 best¨ stitution x → x + a folgen, dass s1 = s2 sein muss, entgegen der Voraussetzung. Die beiden L¨ osungen Y1 (x), Y2 (x) lassen sich folgendermaßen darstellen. Wenn wir in der Funktion eμx , x → x + a ersetzen, so geht diese Funktion in eμx eμa u ¨ber und wenn in e−μx , x → x + a gesetzt wird, so folgt −μx −μa −μx e e = s2 e . Daher bleiben bei den Transformationen Y¯i = si Yi die Funktionen Y1 (x) Y2 (x) (5.102) u1 (x) = μx , u2 (x) = −μx e e unver¨ andert und daher hat die Differenzialgleichung (5.95) f¨ ur s1 = s2 ein Fundamentalsystem der Form Y1 (x) = eμx u1 (x) ,
Y2 (x) = e−μx u2 (x) ,
(5.103)
wo u1 (x) und u2 (x) periodische Funktionen von x mit der Periode a sind. Wenn insbesondere der Koeffizient R(x) in der Differenzialgleichung (5.95) symmetrisch ist, d. h. wenn R(x) = R(−x) ist, dann ¨andert sich die Differenzialgleichung nicht, wenn x durch −x ersetzt wird. In diesem Fall geht in (5.103) die L¨ osung Y2 (x) aus Y1 (x) durch die Substitution x → −x hervor und daher ist dann u2 (x) = u1 (−x). Beide L¨ osungen bleiben aber dennoch voneinander linear unabh¨ angig und die vollst¨ andige L¨osung der Differenzialgleichung lautet dann Y (x) = C1 eμx u(x) + C2 e−μx u(−x) .
(5.104)
Die L¨ osungen (5.103) und (5.104) werden das ,,Floquet-Theorem“ genannt. Da die Koeffizienten aik der Transformation (5.96) reell sind, ist in der quadratischen Gleichung (5.99) a11 + a22 = s1 + s2 = eμa + e−μa reell. Dies kann auf zweierlei Weise verwirklicht werden. Wenn |a11 + a22 | ≥ 2 ist, muss μ reell sein, denn dann ist |s1 + s2 | = 2| cosh μa| ≥ 2. In diesem Fall sind die L¨ osungen (5.103) der Differenzialgleichung instabil, da sie f¨ ur x → ±∞ divergieren. Wenn dagegen |a11 + a22 | ≤ 2 ist, muss μ = ik also imagin¨ar sein, da dann |s1 + s2 | = 2| cos ka| ≤ 2 ist und damit sind die L¨osungen der Differenzialgleichung (5.95) stabil, da sie dann periodisch als Funktion von x oszillieren und folglich beschr¨ ankt bleiben. Die allgemeine L¨osung einer Differenzialgleichung mit periodischen Koeffizienten besitzt daher stabile und instabile Zonen der L¨ osung. An den Zonengrenzen ist |s1 + s2 | = 2 und die L¨ osungen der Differenzialgleichung sind periodische Funktionen von x mit der Periode a.
148
5 Spezielle Funktionen
5.4 Kugelfunktionen Die Kugelfunktionen sind f¨ ur die Behandlung einer großen Anzahl physikalischer Problemstellungen, insbesondere Rand- und Eigenwertaufgaben, im Bereich der klassischen Physik und der Quantenphysik von Bedeutung. Dazu z¨ ahlen etwa Multipolentwicklungen in der Gravitationstheorie, der Elektrostatik und der Strahlungstheorie, Str¨ omungsprobleme bei Gasen und Fl¨ ussigkeiten, Analyse der quantenmechanischen Drehimpulseigenschften von Atomen und Molek¨ ulen, in der quantenmechanischen Streutheorie etc. Daher soll hier der Diskussion dieser Funktionen breiterer Raum gewidmet werden. Als Ausgangspunkt unserer Betrachtungen w¨ahlen wir die in Abschn. 4.3.2 durch Separation der homogenen Helmholtz-Gleichung erhaltene Differenzialgleichung (4.34) f¨ ur den winkelabh¨ angigen Anteil der L¨osung
∂Y (ϑ, ϕ) 1 ∂ 2 Y (ϑ, ϕ) 1 ∂ + ( + 1)Y (ϑ, ϕ) = 0 (5.105) sin ϑ + sin ϑ ∂ϑ ∂ϑ ∂ϕ2 sin2 ϑ und machen den weiteren Separationsansatz Y (ϑ, ϕ) = P (ϑ)Φ(ϕ). Beim Einsetzen in die Differenzialgleichung und Ausf¨ uhrung der Separation mit der Separationskonstanten C 2 , erhalten wir zun¨ achst die Gleichung d2 Φ + C2Φ = 0 dϕ2
(5.106)
¨ mit den beiden L¨ osungen Φ(ϕ) = e±iCϕ . Aus physikalischen Uberlegungen u unschte Eindeutigkeit der L¨ osungen als Funktion des Azimuts ¨ber die gew¨ ϕ, verlangen wir, dass Φ(ϕ) = Φ(ϕ + 2π) sein soll. Dann muss e±iC2π = 1 sein, oder 2πC = 2πm. Daher sind die normierten azimutalen L¨osungen 1 Φ(ϕ) = √ eimϕ , 2π
m = 0, ±1, ±2, ±3, · · ·
(5.107)
und dies sind die uns wohlbekannten Fourier-Funktionen auf dem Einheitskreis. Als zweite Differenzialgleichung liefert dann die Separation
1 d dP (ϑ) m2 P (ϑ) = 0 , (5.108) sin ϑ + ( + 1) − sin ϑ dϑ dϑ sin2 ϑ oder wenn wir cosϑ = z setzen, sodass das Variablenintervall 0 ≤ ϑ ≤ π in das Intervall −1 ≤ z ≤ 1 u ur ¨ bergeht, lautet die transformierte Gleichung f¨ P (z) m2 P (z) = 0 . (5.109) (1 − z 2 )P (z) − 2zP (z) + ( + 1) − 1 − z2 Dies ist die Differenzialgleichung der zugeordneten Legendre-Funktionen P (z) ¨ und ist der Ausgangspunkt der folgenden Uberlegungen.
5.4 Kugelfunktionen
149
5.4.1 Die Legendre-Polynome Wir betrachten zun¨ achst den Fall m = 0 und erhalten so die Legendre’sche Differenzialgleichung P (z) −
2z
( + 1) P (z) + P (z) = 0 . 2 1−z 1 − z2
(5.110)
Diese Gleichung hat ersichtlich bei z = ±1 eine außerwesentliche Singularit¨at und ist daher gem¨ aß Abschn. 5.3.1 vom Fuchs’schen Typus. Wir erwarten also, dass eine der beiden L¨ osungen der Differenzialgleichung bei z = ±1 singul¨ ar sein wird. Die Stelle z = 0 hingegen ist ein regul¨arer Punkt der Differenzialgleichung und wir k¨ onnen daher dort zur L¨osung einen Potenzreihenansatz machen ∞ cn z n . (5.111) P (z) = n=0
Setzen wir dies in die Differenzialgleichung ein, nachdem wir diese mit (1−z 2 ) multipliziert haben, und ordnen nach gleichen Potenzen von z, so ergibt sich ∞
{(n + 2)(n + 1)cn+2 + [ ( + 1) − n(n + 1)]cn }z n = 0 ,
(5.112)
n=0
woraus wir f¨ ur die Koeffizienten cn die zweigliedrige Rekursionsformel ablesen cn+2 =
( + 1) − n(n + 1) cn . (n + 2)(n + 1)
(5.113)
Aus dieser Rekursionsformel ist ersichtlich, dass die Koeffizienten c0 und c1 willk¨ urlich gew¨ ahlt werden k¨ onnen, entsprechend den beiden beliebigen Konstanten in der allgemeinen L¨ osung der Legendre’schen Differenzialgleichung. ahlen, sind alle ungeraden Koeffizienten c3 , c5 , · · · = 0. Wenn wir c1 = 0 w¨ Die resultierende L¨ osung ist dann eine Reihe mit geraden Potenzen von z, urliche Konstante ist. Analog liefert die Wahl von wobei c0 die einzige willk¨ c0 = 0, c1 = 0 eine Reihe mit ungeraden Potenzen von z. Solange der Parameter beliebige Werte annehmen kann, folgt aus der Rekursionsformel, ur große Werte von n wird cn+2 ∼ dass alle cn = 0 sein werden und f¨ = cn sein. Damit werden die beiden L¨ osungsreihen ab einer gewissen Potenz z r die asymptotische Form P (z) ≈ z
r
∞ s=0
(z 2 )s =
zr 1 − z2
(5.114)
haben. In diesem Fall divergieren die beiden L¨ osungsreihen bei z = ±1, entsprechend den beiden Polarwinkeln ϑ = 0 und ϑ = π. Bei den meisten physikalischen Problemstellungen sind aber L¨ osungen, die l¨angs der Polarachse divergieren, uninteressant. Vielmehr suchen wir L¨osungen, die f¨ ur alle Werte
150
5 Spezielle Funktionen
in 0 ≤ ϑ ≤ π, bzw. in −1 ≤ z ≤ +1 endlich bleiben. Wir k¨onnen solche L¨ osungen nur dann finden, wenn der Reihenansatz (5.111) f¨ ur P (z) bei einer bestimmten Potenz abbricht, d. h. einer der Koeffizienten cn = 0 wird. Dies ist dann der Fall, wenn in der Legendre’schen Differenzialgleichung (5.110) der Parameter ganze positive Zahlen = 0, 1, 2, 3, · · · durchl¨auft, da dann aufgrund der Rekursionsformel (5.113) der Koeffizient c+2 = 0 wird. Wenn
gerade ist, endet die L¨ osungsreihe mit geraden Potenzen und wir w¨ahlen entsprechen c1 = 0. Wenn hingegen ungerade ist, wird entsprechend c0 = 0 gesetzt. Diese Polynoml¨ osungen der Legendre’schen Differenzialgleichung werden Legendre-Polynome genannt. Bei diesen Polynomen hat der Index n die Werte 0, 2, 4, · · · , wenn gerade ist und hat die Werte 1, 3, 5, · · · wenn
ungerade ist. Beide Summationen lassen sich zusammenfassen, wenn wir w¨ ahlen n = − 2k. Dann ergeben sich f¨ ur gerades wie f¨ ur ungerades die oben genannten n-Werte, wenn wir k = 0, 1, 2, · · · [ 2 ] durchlaufen lassen, wo oßte Ganze von 2 bedeutet, d. h. es ist gleich 2 , wenn gerade ist [ 2 ] das gr¨ und es ist gleich −1 2 , wenn eine ungerade Zahl darstellt. Das Verhalten der Koeffizienten mit den Indizes k − 1, bzw. k ist dann wegen der Rekursionsformel (5.113) gegeben durch dk−1 cn+2 2k(2 − 2k + 1) = =− , cn ( − 2k + 2)( − 2k + 1) dk
(5.115)
wobei zu beachten ist, dass zunehmendes n gleichzeitig abnehmendes k bedeutet. Dieses Verh¨ altnis der Koeffizienten wird genau dann erhalten, wenn die Legendre-Polynome die folgende Gestalt haben
P (z) =
[2] k=0
dk z
−2k
=
[2] k=0
(−1)k (2 − 2k)! z −2k . 2k k!( − k)!( − 2k)!
(5.116)
Dabei wurden die Koeffizienten c0 und c1 der geraden und ungeraden Polynome so gew¨ ahlt, dass der Koeffizient zur h¨ochsten Potenz z den Wert (2)! uhrt auf eine zweckm¨ aßige Normierung der Legendre2 (!)2 annimmt. Dies f¨ Polynome, wie wir sp¨ ater noch sehen werden. Die ersten vier Polynome haben die folgende Form P0 (z) = 1 , 1 P2 (z) = (3z 2 − 1) , 2
P1 (z) = z 1 P3 (z) = (5z 3 − 3z) . 2
(5.117)
Eine elegante Darstellung der Legendre-Polynome erhalten wir, wenn wir die Funktion v(z) = (z 2 − 1) -mal nach z ableiten. Wenn wir diese -malige Ableitung mit v (z) bezeichnen, so stellt sich heraus, dass diese Funktion der Legendre’schen Differenzialgleichung (5.110) gen¨ ugt. Also ist P (z) = Cv (z) und nach Berechnung der Konstante C ergibt sich die elegante Formel
5.4 Kugelfunktionen
151
von ,,Rodrigues“ 1 d 2 (z − 1) . (5.118) 2 ! dz Bisher haben wir f¨ ur eine feste ganzer Zahl nur die L¨osung P (z) der Legendre’schen Differenzialgleichung (5.110) gefunden. Macht man in der Umgebung der singul¨ aren Stelle z = ±1 einen Frobenius-Ansatz f¨ ur die L¨osung der Differenzialgleichung, so zeigt sich, dass die beiden L¨osungen s1 und s2 der Indexgleichung sich um eine ganze Zahl unterscheiden. Daher ist zu erwarten, dass die zweite L¨ osung einen logarithmischen Term enthalten wird, wie in Abschn. 5.3.1 besprochen wurde. Diese zweite L¨osung wird mit Q (z) bezeichnet und Legendre-Funktion zweiter Art genannt. Sie kann durch folgenden L¨ osungsansatz gefunden werden P (z) =
Q (z) = u(z)P (z) .
(5.119)
Setzt man dies in die Legendre’sche Differenzialgleichung ein und beachtet, alt man die folgende Differenzialgleichung dass P (z) eine L¨osung ist, so erh¨ erster Ordnung zur Bestimmung der Funktion u(z) u (z) =
C 2 P (z)(1 −
z2)
,
(5.120)
wo C eine Integrationskonstante ist. F¨ ur = 0 und = 1 l¨asst sich diese Gleichung leicht l¨ osen. Man findet Q0 (z) =
C0 1 + z ln , 2 1−z
Q1 (z) =
C1 z 1 + z ln − C1 . 2 1−z
(5.121)
Die genauere Rechnung liefert allgemein Q (z) =
1 1+z P (z) ln + p−1 (z) , 2 1−z
(5.122)
wo p−1 (z) ein Polynom − 1-ter Ordnung in z darstellt. Mit diesen zweiten L¨osungen der Legendre’schen Differenzialgleichung wollen wir uns aber nicht n¨ aher besch¨ aftigen. 5.4.2 Zweite Definition der Legendre-Polynome Zu einer zweiten Definition der Legendre-Polynome gelangen wir durch folgende Betrachtung. In Abschn. 4.4.4 fanden wir als Beispiel in (4.92) die L¨ osung der Poisson’schen Differenzialgleichung in der Form 1 α ρ(r )dv , (5.123) Φ(r) = 4π V R wo R = |r − r | ist. Nun w¨ ahlen wir folgende spezielle Ladungsverteilung (vgl. Abb. 5.1). An der Stelle ak l¨ angs der z-Achse, die wir als Polarachse w¨ ahlen, befinde sich eine Punktladung, die durch die Ladungsverteilung
152
5 Spezielle Funktionen
Abbildung 5.1. Zur Erzeugenden der Legendre-Polynome
ρ(r ) = qδ(r − ak) beschrieben wird. Dann lautet das Potenzial dieser speziellen Ladungsverteilung nach Ausrechnung des Integrals (5.123) Φ(r) =
αq , 4πR
R = |r − ak| .
(5.124)
F¨ uhren wir, wie in der Abbildung eingezeichnet, Polarkoordinaten (r, θ) ein, so nimmt das Potenzial der Punktladung q folgende Gestalt an Φ(r) =
αq 1 √ . 4π r2 + a2 − 2ar cos θ
(5.125)
Wenn r > a ist, k¨ onnen wir r vor die Wurzel ziehen. Nun taufen wir ar = t und cos θ = z und betrachten nach weglassen der Vorfaktoren den Wurzelausdruck 1 . (5.126) E(z, t) = √ 1 − 2tz + t2 Wenn wir diesen in eine binomische Reihe nach Potenzen von t entwickeln, so stellt sich heraus, dass die Entwicklungskoeffizienten mit den LegendrePolynomen P (z) u ¨bereinstimmen. Es gilt also E(z, t) =
∞
P (z)t
(5.127)
=0
und wir nennen daher E(z, t) die erzeugende Funktion der Legendre-Polynome. Um diese Identit¨ at nachzuweisen, f¨ uhren wir die binomische Entwicklung der erzeugenden Funktion explizit durch. Dies liefert ∞ (− 21 )(− 32 ) · · · ( 12 − m) m 1 = t (t−2z)m , (5.128) E(z, t) = m! 1 + t(t − 2z) m=0
5.4 Kugelfunktionen
wo die Koeffizienten der Entwicklung die Binomialkoeffizienten
153
1
−2 m
sind.
Analog liefert der binomische Satz (siehe Abschn. 8.2.2) (t − 2z)
m
=
m m k=0
k
tk (−2z)m−k .
(5.129)
Daher ist der Koeffizient von t in der Entwicklung (5.127) (− 1 )(− 3 ) · · · ( 1 − m) m! 2 2 2 (−2z)m−k . m! k!(m − k)!
(5.130)
m+k= 0≤k≤m
Wenn wir wegen der Nebenbedingung m = − k setzen, erhalten wir "
−k [ 2 ] ! 1 · 3 · 5 · · · (2 − 2k − 3)(2 − 2k − 1) 1 −2k (−2) − z −2k 2 k!( − 2k)! k=0 (5.131) und nach Vereinfachung ist der Koeffizient von t mit dem Polynom (5.116) ¨ identisch. Dies best¨ atigt die Aquivalenz der beiden Definitionen der LegendrePolynome. Mithilfe der erzeugenden Funktion (5.126) und ihrer Reihenentwicklung (5.127) lassen sich eine Reihe sehr n¨ utzlicher Rekursionsformeln der Legendre-Polynome herleiten. Wenn wir E(z, t) partiell nach t differenzieren, erhalten wir ∞ z−t
P (z)t−1 . (5.132) 3 = [1 − 2tz + t2 ] 2 =1 In dieser Gleichung k¨ onnen wir auf der linken Seite einen der Wurzelfaktoren nach den P (z) entwickeln und danach die Gleichung folgendermaßen umschreiben (z − t)
∞ =0
∞ P (z)t = 1 − 2tz + t2
P (z)t−1 .
(5.133)
=1
Nach Ausmultiplizieren auf der linken und rechten Seite dieser Gleichung, schaffen wir alle Terme auf eine Seite und ordnen nach gleichen Potenzen t . Dies ergibt die Gleichung [(2 + 1)zP (z) − ( + 1)P+1 (z) − P−1 (z)]t = 0 (5.134)
und da dies f¨ ur beliebige Werte von t im Intervall 0 < t < 1 wegen der Annahme a < r gelten soll, m¨ ussen die einzelnen Koeffizienten von t verschwinden und wir erhalten so die erste Rekursionsformel (2 + 1)zP (z) − ( + 1)P+1 (z) − P−1 (z) = 0 .
(5.135)
154
5 Spezielle Funktionen
Wenn wir als n¨achstes die Erzeugende E(z, t) partiell nach z differenzieren, so ergibt sich in analoger Weise die zweite Rekursionsformel 2zP (z) − P+1 (z) − P−1 (z) + P (z) = 0 .
(5.136)
Aus diesen beiden Formel erh¨ alt man durch Kombination eine Reihe weiterer Rekursionsformeln. Wenn wir etwa (5.135) nach z differenzieren und (5.136) mit multiplizieren und dann die resultierenden Gleichungen voneinander abziehen, ergibt sich P+1 (z) − zP (z) = ( + 1)P (z) .
(5.137)
Wenn wir diese Beziehung mit 2 multiplizieren und zur Gleichung (5.136) addieren, folgt die weitere Formel P+1 (z) − P−1 (z) = (2 + 1)P (z)
(5.138)
und wenn wir diese von der vorhergehenden Gleichung abziehen, resultiert zP (z) − P−1 (z) = P (z) .
(5.139)
Eine letzte Formel erhalten wir schließlich, wenn wir die vorangehende Beziehung mit z multiplizieren und davon (5.137) nach vorheriger Substitution
→ l − 1 abziehen (z 2 − 1)P (z) = zP (z) − P−1 (z) .
(5.140)
Wenn man schließlich diese letzte Gleichung nach z differenziert und mit (5.139) kombiniert, so findet man auf anderem Wege, dass die durch die Reihenentwicklung von E(z, t) definierten Funktionen P (z) der Legendre’schen Differenzialgleichung gen¨ ugen, also bis auf einen konstanten Faktor mit den Legendre-Polynomen identisch sein m¨ ussen. Ferner erhalten wir mithilfe der Erzeugenden E(z, t) Information u ¨ber den Werteverlauf der Polynome P (z) im Intervall −1 ≤ z ≤ +1. Dazu betrachten wir zun¨achst E(z, t) an den Stellen z = ±1 und finden die Reihe ∞
1 = P (±1)t . 1∓t
(5.141)
=0
1 nach Potenzen von t mithilfe des BinomialtheoWenn wir andererseits 1∓t rems entwickeln und die Koeffizienten von t mit (5.141) vergleichen, so ergibt sich (5.142) P (1) = 1 , P (−1) = (−1) , = 0, 1, 2, 3, · · · .
5.4 Kugelfunktionen
155
Um Information u ur |z| < 1 zu erhalten, setzen wir ¨ ber die Werte von P (z) f¨ z = cos θ und machen folgende Reihenentwicklung von E(cos θ, t) 1 1 1 √ √ = √ 2 iθ 1 − 2t cos θ + t 1 − te 1 − te−iθ !∞ "! ∞ " iθ r −iθ s = αr (te ) αs (te ) , r=0
(5.143)
s=0
wobei die Koeffizienten der binomischen Entwicklung αr = 1·2·3····(2r+1) alle 2r+1 r! positive Werte haben. Der Koeffizient von t dieser Entwicklung, welcher P (cos θ) darstellt, ist daher durch die Summe gegeben P (cos θ) = αr αs eiθ(r−s) = αr αs cos(r − s)θ . (5.144) r+s= r,s≥o
r+s= r,s≥o
ur Da alle Terme dieser Summe positive Koeffizienten haben, hat P (cos θ) f¨ 0 ≤ θ ≤ π seinen maximalen Wert, wenn θ = 0 oder π ist, denn dann haben alle Summenglieder das gleiche Vorzeichen und jedes Glied hat seinen maximalen Wert. Daraus schließen wir, dass f¨ ur alle z im Intervall (−1, +1) gilt (5.145) |P (z)| ≤ |P (±1)| = 1 . Eine weitere Folgerung aus diesem Resultat besagt, dass die Reihenentwicklung der Erzeugenden E(z, ur t < 1 konvergiert, wie durch Vergleich mit t)∞f¨ der geometrischen Reihe =0 t zu ersehen ist. Daher ergibt sich f¨ ur das Potenzial (5.125) der Punktladungsanordnung von Abb. 5.1 Φ=
∞ a P (cos θ) , +1 r
a r ist, indem wir a und r miteinander vertauschen, also ∞ r Φ= P (cos θ) , a+1
a>r.
(5.147)
=0
Aus den beiden Eigenschaften (5.142) der Legendre-Polynome ist ersichtlich, dass keine der beiden Reihenentwicklungen (5.146, 5.147) konvergiert, wenn r = a und θ = 0 oder π ist.
156
5 Spezielle Funktionen
5.4.3 Orthogonalit¨ at der Legendre-Polynome Die Legendre’sche Differenzialgleichung in der Form d dP (1 − z 2 ) + ( + 1)P (z) = 0 dz dz
(5.148)
mit den Randbedingungen (5.142) in den Endpunkten des Intervalls (−1, +1) bildet ersichtlich ein Sturm-Liouville’sches Eigenwertproblem, wie in Abschn. 3.5 diskutiert wurde. Daher ist zu erwarten, dass die Legendre-Polynome zueinander orthogonal sind und dass sie im obigen Intervall ein vollst¨andiges Funktionensystem bilden. Um die Orthogonalit¨at nachzuweisen, multiplizieren wir die Gleichung (5.148) von links mit Pn (z) und integrieren dann u ¨ber das Intervall (−1, +1). Dies ergibt +1 dz[Pn (z)(1 − z 2 )P (z) − 2zPn (z)P (z) + ( + 1)Pn (z)P (z)] = 0 . −1
(5.149) In diesem Ausdruck integrieren wir den ersten Term partiell. Dann wird an den Grenzen der ausintegrierte Anteil verschwinden und der neue Integralanteil negatives Vorzeichen haben. Dies ergibt beim Einsetzen in (5.149) +1 dz[−(1 − z 2 )Pn (z)P (z) + ( + 1)Pn (z)P (z)] −1
+1
+ −1
dz[2zPn (z)P (z) − 2zPn (z)P (z)] = 0 .
(5.150)
Ersichtlich heben sich in dieser Gleichung die beiden Terme des zweiten Integrals gegenseitig auf. Beim ersten Term machen wir eine nochmalige partielle Integration, bei welcher wiederum der ausintegrierte Anteil verschwindet und der neue Integralanteil nun positives Vorzeichen hat. Dies ergibt +1 d dPn dz P (z) (1 − z 2 ) + ( + 1)Pn (z)P (z) dz dz −1 +1 = [ ( + 1) − n(n + 1)] dzPn (z)P (z) = 0 , (5.151) −1
wobei im ersten Term des ersten Integrals die Differenzialgleichung (5.148) mit der Substitution → n verwendet wurde. Wenn also n = ist, folgt aus dem Verschwinden des zweiten Integrals die Orthogonalit¨at der LegendrePolynome. Zur Berechnung der Normierung dieser Funktionen verwenden wir die Rekursionsformel (5.135) mit → − 1. Dies ergibt f¨ ur das Normierungsintegral +1 +1 +1 P2 (z)dz = (2 −1) zP−1 (z)P (z)dz−( −1) P−2 (z)P (z)dz ,
−1
−1
−1
(5.152)
5.4 Kugelfunktionen
157
wo wegen der nachgewiesenen Orthogonalit¨ at, rechts das zweite Integral verschwindet. Auf die restliche Gleichung wenden wir nach Division durch
nochmals die Rekursionsformel (5.135) an. Wir multiplizieren diese Beziehung mit P (z) und erhalten so
+1 −1
P2 (z)dz =
2( − 1) + 1
(2 + 1)
=
2( − 1) + 1 (2 + 1)
+1
−1 +1 −1
P−1 (z)[( + 1)P+1 (z) + P−1 (z)]dz 2 P−1 (z)dz .
(5.153)
Dabei wurde neuerlich die Orthogonalit¨ at der P herangezogen. Das letzte Integral kann in derselben Weise behandelt werden, indem man in (5.135)
→ − 1 ersetzt. Auf diesem Weg kann man fortfahren bis schließlich P02 = 1 erreicht wird und wir schließlich erhalten +1 +1 1 2 . (5.154) P2 (z)dz = · · · = P 2 (z)dz = 2 + 1 −1 0 2 + 1 −1 Da offenbar die Legendre-Polynome nicht auf eins normiert sind, lautet ihre Orthogonalit¨ atsrelation +1 2 δ,n P (z)Pn (z)dz = (5.155) 2
+1 −1 und die entsprechende Vollst¨ andigkeitsrelation der Legendre-Polynome hat die Gestalt ∞ 2 P (z)P (ζ) = δ(z − ζ) . (5.156) 2 + 1 =0
Folglich kann eine beliebige Funktion f (z), die in −1 ≤ z ≤ 1 definiert ist und den Dirichlet-Bedingungen gen¨ ugt, in eine Reihe nach Legendre-Polynomen entwickelt werden, also f (z) =
∞ =0
c P (z) ,
2 + 1 c = 2
+1
−1
P (z)f (z)dz .
(5.157)
5.4.4 Die zugeordnenten Legendre-Polynome Wir kehren zur Differenzialgleichung (5.109) der zugeordneten LegendreFunktionen zur¨ uck und betrachten nun den Fall m = 0. Auch diese Gleichung hat bei z = ±1 eine außerwesentliche Singularit¨at. Da z = 0 ein regul¨arer Punkt der Differenzialgleichung ist, k¨ onnen wir in seiner Umgebung einen Potenzreihenansatz wie (5.111) machen, doch die L¨osungsreihen divergieren bei z = ±1, wenn nicht weiterhin eine ganze Zahl ist. Wir werden so auf uhrt. Um einen Ausdruck f¨ ur die zugeordneten Legendre-Polynome Pm (z) gef¨
158
5 Spezielle Funktionen
diese Polynome zu erhalten, machen wir den Ansatz m
Pm (z) = (1 − z 2 ) 2 fm (z)
(5.158)
und setzen diesen in die Legendre’sche Differenzialgleichung der zugeordneten Funktionen (5.109) ein. Dies ergibt f¨ ur die Funktionen fm (z) die Gleichung (1−z 2 )fm (z)−2(m+1)zfm (z)+[ ( +1)−m(m+1)]fm (z) = 0 . (5.159) Wenn wir andererseits die Legendre’sche Differenzialgleichung (5.148) m(m) mal nach z differenzieren, dann gen¨ ugen die m-ten Ableitungen P (z) der Legendre-Polynome P (z) genau der Differenzialgleichung (5.159). Al(m) so k¨ onnen wir fm (z) = P (z) setzen und daher lassen, bei Beachtung der Formel (5.118) von Rodrigues, die zugeordneten Legendre-Polynome folgende Darstellung zu m
m
Pm (z) = (1 − z 2 ) 2 P (z) = (1 − z 2 ) 2
1 d+m 2 (z − 1) . 2 ! dz +m
(5.160)
Damit haben wir f¨ ur gegebenes und m nur eine L¨osung der LegendreGleichung f¨ ur die zugeordneten Funktionen gefunden. Die zweite L¨osung, die an den Stellen z = ±1 singul¨ ar wird, kann durch den Ansatz Qm (z) = m u(z)P (z) gefunden werden, wenn dieser in die Gleichung (5.109) eingesetzt wird, um so zu einer Differenzialgleichung erster Ordnung f¨ ur die Funktion (z) sind jedoch von geringeu(z) zu gelangen. Diese zweiten L¨ osungen Qm rem physikalischen Interesse und sollen hier nicht weiter behandelt werden. m Durch Multiplikation mit dem Faktor (1−z 2 ) 2 und m -malige Differenziation k¨ onnen aus den Rekursionsformeln der Legendre-Polynome die entsprechenden Rekursionsformeln der zugeordneten Polynome abgeleitet werden. Dies werden wir hier nicht weiter ausf¨ uhren. Die einfachsten dieser Beziehungen sind m m (z) − ( + m)P−1 (z) = 0 , (2 + 1)zPm (z) − ( − m + 1)P+1
(5.161)
wobei diese Rekursionsformel eine Verallgemeinerung von (5.135) darstellt. Analog ist die Beziehung m (z 2 − 1)Pm (z) = ( + 1)P+1 (z) − ( + 1)zPm (z)
(5.162)
mit (5.140) verwandt. Auch die zugeordneten Legendre-Polynome Pm (z) bilden im Intervall (−1 ≤ z ≤ +1) f¨ ur = m, m + 1, m + 2, · · · ∞ ein vollst¨ andiges Orthogonalsystem. Man beachte, dass wegen (5.160) f¨ ur l < m at der zugeordneten Funktionen ist alle Pm (z) = 0 sind. Die Orthogonalit¨ leicht zu zeigen. Dazu betrachten wir die Differenzialgleichung (5.109) der ur Pnm (z) und multiplizugeordneten Funktionen einmal f¨ ur Pm (z) und dann f¨ m zieren die erste dieser Gleichungen von links mit Pn (z) und die zweite analog
5.4 Kugelfunktionen
159
mit Pm (z). Dann subtrahieren wir die resultierenden Gleichungen voneinander und integrieren diesen Ausdruck u ¨ ber das Intervall (−1 ≤ z ≤ +1). Dies ergibt
+1 m m d d m 2 dP (z) m 2 dPn (z) dz Pn (z) (1 − z ) − P (z) (1 − z ) dz dz dz dz −1 +1 =− [ ( + 1) − n(n + 1)]Pm (z)Pnm (z)dz . (5.163) −1
Bei partieller Integration der beiden Terme auf der linken Seite, verschwinden die ausintegrierten Anteile an den Integrationsgrenzen und die resultierenden neuen Integralterme heben sich gegenseitig auf. Daraus folgt, dass das Integral auf der rechten Seite verschwindet und somit f¨ ur = n die Pm (z) zueinm ander orthogonal sind. Die Normierung der P (z) kann auf ganz ¨ahnlichem Wege gefunden werden, wie wir das f¨ ur die Pn (z) gezeigt haben. Bei wiederholter Anwendung der Rekursionsformel (5.161) kann sukzessive im Normierungsintegral der Wert des Index herabgesetzt werden, bis man schließlich folgendes Resultat erh¨ alt +1 2 ( + m)! δ,n . Pm (z)Pnm (z)dz = (5.164) 2
+ 1 ( − m)! −1 Ferner ist aus der verallgemeinerten Rodrigues-Formel (5.160) der zugeordneten Legendre-Polynome ersichtlich, dass diese Polynome auch f¨ ur negative Werte von m definiert sind und sich in den Endpunkten des Intervalls (−1, +1) regul¨ ar verhalten. Ebenso kann man zeigen, dass zwischen den Polynomen mit positivem Index m und jenen mit negativem m folgender Zusammenhang besteht P−m (z) = (−1)m
( − m)! m P (z) . ( + m)!
(5.165)
Reihenentwicklungen nach den zugeordneten Legendre-Polynomen Pm (z) allein sind physikalisch weniger interessant und wir wollen sie daher nicht explizit anf¨ uhren. Weitaus wichtiger hingegen sind die Kugelfl¨achenfunktionen, denen wir uns im folgenden Abschnitt zuwenden. 5.4.5 Die Kugelfl¨ achenfunktionen Wir kehren zur Differenzialgleichung (5.105) zur¨ uck. Jene L¨osungen dieser Gleichung, die auf der Oberfl¨ ache einer Kugel vom Radius R = 1 sich u ¨berall regul¨ ar verhalten, haben wir in den vorangehenden Abschnitten gefunden. Im Separationsansatz Y (ϑ, ϕ) = P (ϑ)Φ(ϕ) ist der azimutale Anteil Φ(ϕ) durch die Fourier-Funktionen (5.107) bestimmt und der laterale Anteil P (ϑ) ist durch die zugeordneten Legendre-Polynome (5.160) gegeben. Wenn wir die Normierung der Funktionen Φ(ϕ) in (5.107) und der Funktionen P (ϑ) in
160
5 Spezielle Funktionen
(5.164) ber¨ ucksichtigen, so erhalten wir folgendes orthonormales Funktionensystem auf der Einheitskugel ' 2 + 1 ( − m)! m P (cos ϑ)eimϕ . (5.166) Ym (ϑ, ϕ) = 4π ( + m)! Diese Funktionen spielen in der Physik eine wichtige Rolle und werden die Kugelfl¨ achenfunktionen genannt. Ihre Orthogonalit¨atsrelation lautet 2π π dϕ sin ϑdϑYm∗ (ϑ, ϕ)Ynm (ϑ, ϕ) = δ,n δm,m , (5.167) 0
0
wobei die folgende Beziehung zwischen den Kugelfl¨achenfunktionen Ym (ϑ, ϕ) und ihrem konjugiert komplexen Ausdruck zu ber¨ ucksichtigen ist Ym∗ (ϑ, ϕ) = (−1)m Y−m (ϑ, ϕ)
(5.168)
und die Beziehung (5.165) beachtet wurde. Die Funktionen niedrigster Ordnung lassen sich elementar leicht ausrechnen und wir erhalten 1 Y00 (ϑ, ϕ) = √ 4π / 3 sin ϑeiϕ Y11 (ϑ, ϕ) = 8π / 3 0 cos ϑ
= 1 , Y1 (ϑ, ϕ) = 4π / 3 Y1−1 (ϑ, ϕ) = − sin ϑe−iϕ . 8π
=0,
(5.169)
(5.170)
Da die Differenzialgleichung (5.105) ein Sturm-Liouville’sches Eigenwertproblem mit dem Eigenwertparameter λ = ( + 1) und den Eigenl¨osungen Ym (ϑ, ϕ) definiert, ist ersichtlich, dass zum Eigenwert λ = ( + 1) jene Kugelfl¨ achenfunktionen geh¨ oren, deren Index m die Werte − , − + 1, − + 2, · · · 0, 1, 2, · · · − 2, − 1, annimmt. Daher ist der betreffende Eigenwert 2 + 1-fach entartet. Da die Kugelfl¨ achenfunktionen ein vollst¨andiges Funktionensystem darstellen, kann eine beliebige Funktion F (ϑ, ϕ), die auf der Kugeloberfl¨ ache den Dirichlet-Bedingungen gen¨ ugt, in eine Reihe nach den Ym (ϑ, ϕ) entwickelt werden, also F (ϑ, ϕ) =
∞ + =0 m= −
c,m Ym (ϑ, ϕ) ,
c,m =
dΩYm ∗ (ϑ, ϕ)F (ϑ, ϕ) ,
Ω
(5.171) wo zur Berechnung der verallgemeinerten Fourier-Koeffizienten c,m u ¨ber die gesamte Oberfl¨ ache Ω der Einheitskugel integriert wurde und dΩ =
5.4 Kugelfunktionen
161
sin ϑdϑdϕ das Oberfl¨ achenelement auf der Einheitskugel darstellt. Setzt man den Ausdruck f¨ ur die Fourier-Koeffizienten c,m wieder in die Reihenentwicklung ein, nachdem man neue Integrationsvariable ϑ , ϕ eingef¨ uhrt hat, so l¨ asst sich, ¨ ahnlich wie in Abschn. 3.4.2 (3.55) gezeigt wurde, folgende Vollst¨ andigkeitsrelation der Kugelfl¨ achenfunktionen herleiten + ∞
Ym (ϑ, ϕ)Ym∗ (ϑ , ϕ ) =
=0 m= −
1 δ(ϑ − ϑ )δ(ϕ − ϕ ) . sin ϑ
(5.172)
5.4.6 Das Additionstheorem der Kugelfl¨ achenfunktionen Da die Kugelfl¨ achenfunktionen auf der Oberfl¨ ache der Einheitskugel definiert sind und es wegen der Kugelsymmetrie egal sein wird, in welcher Richtung vom Kugelzentrum ausgehend wir unsere Polarachse w¨ahlen und in Bezug auf welche Ebene durch diese Polarachse wir das Azimut messen, wird zwischen den Kugelfl¨ achenfunktionen in Bezug auf zwei verschiedene Koordinatensysteme auf der Kugel ein linearer Zusammenhang bestehen m¨ ussen. Da die Differenzialgleichung (5.105) der Y (ϑ, ϕ) in Bezug auf zwei verschiedene Systeme (ϑ, ϕ) und (θ, φ) dieselbe Gestalt haben wird und in beiden F¨allen der Eigenwertparameter denselben Wert λ = ( + 1) annehmen wird, kann der lineare Zusammenhang nur solche Kugelfl¨ achenfunktionen umfassen, die zum gleichen Wert aber zu verschiedenem m mit − ≤ m ≤ + geh¨oren. Wir betrachten auf der Einheitskugel einen Winkel θ, dessen Endpunkte von einem anderen Koordinatensystem aus gemessen, die Koordinaten ϑ, ϕ und ur das so definierte sph¨arische Dreieck fanden wir in ϑ , ϕ haben werden. F¨ Abschn. 1.3.1 unter (1.43) den Cosinus-Satz der sph¨arischen Trigonometrie, den wir hier nochmals anf¨ uhren cos θ = cos ϑ cos ϑ + sin ϑ sin ϑ cos(ϕ − ϕ) .
(5.173)
Wenn wir daher in Bezug auf das Koordinatensystem θ, φ das LegendrePolynom P (cos θ) betrachten, so wird sich dieses wegen (5.173) sowohl in Bezug auf die Koordinaten (ϑ, ϕ) als auch (ϑ , ϕ ) in eine Reihe nach Kugelfl¨ achenfunktionen entwickeln lassen, deren Index m die Werte − ≤ m ≤
durchl¨ auft. Dies ergibt zum Beispiel P (cos θ) =
+
cm (ϑ , ϕ )Ym (ϑ, ϕ) .
(5.174)
m= −
Da aber die Fourier-Koeffizienten cm von ϑ , ϕ abh¨angen werden, k¨onnen diese in eine Reihe nach den Ym (ϑ , ϕ ) entwickelt werden. Jedoch in (5.173) taucht nur die Differenz ϕ −ϕ auf. Daher wird m durch −m zu ersetzen sein, da dann in der Reihe in Bezug auf das Azimut nur Faktoren eim(ϕ−ϕ ) auf−m treten werden. Da aber wegen (5.168) Y (ϑ , ϕ ) ≈ Ym∗ (ϑ , ϕ ) ist, k¨onnen
162
5 Spezielle Funktionen
wir die Reihe auf folgende Form bringen P (cos θ) =
+
Cm Ym∗ (ϑ , ϕ )Ym (ϑ, ϕ) .
(5.175)
m= −
Zur Berechnung der noch unbekannten Koeffizienten Cm , suchen wir in (5.175) mithilfe der Orthogonalit¨ atseigenschaften die Fourier-Koeffizienten der Reihe bez¨ uglich den Ym (ϑ, ϕ) und finden m∗ dΩYm ∗ (ϑ, ϕ)P (cos θ) . (5.176) Cm Y (ϑ , ϕ ) = Ω
Nun entwickeln wir auf der rechten Seite die Ym ∗ (ϑ, ϕ) in eine Reihe nach Yr ∗ (θ, φ) in Bezug auf die Koordinaten θ, φ und erhalten Ym ∗ (ϑ, ϕ) =
+
ar Yr ∗ (θ, φ) .
(5.177)
r= −
Daraus ergibt sich zun¨ achst f¨ ur ϑ = ϑ und ϕ = ϕ , dass θ = 0 und φ = 0 sind und daher wegen (5.166) gelten muss / / + 2 + 1 2 + 1 m∗ r∗ P0 (0) = a0 . (5.178) Y (ϑ, ϕ) = ar Y (0, 0) = a0 4π 4π r= −
Setzen wir andererseits die Reihe (5.177) auf der rechten Seite von (5.176) ein, so ergibt dies / / + 4π 4π m∗ r∗ r Cm Y (ϑ , ϕ ) = , ar dΩY (θ, φ)Y (θ, φ) = a0 2 + 1 2
+1 Ω r= −
(5.179) wobei die Orthogonalit¨ at der Kugelfl¨ achenfunktionen beachtet wurde. Kombiniert man das letzte Resultat mit dem Ergebnis (5.178), welches f¨ ur 4π ϑ = ϑ , ϕ = ϕ gilt, so folgt dass Cm = 2+1 sein muss und das Additionstheorem der Kugelfl¨ achenfunktionen lautet daher P (cos θ) =
+ 4π Ym∗ (ϑ , ϕ )Ym (ϑ, ϕ) . 2 + 1
(5.180)
m= −
Dieses Theorem findet in der Physik vielf¨ altige Anwendungen, wie die Beispiele zeigen werden. Beispiele 1. Die Multipolentwicklung: Die Multipolentwicklung ist f¨ ur viele Probleme der Physik von Interesse, wo die Potenziale ungleichm¨aßiger Ladungsverteilungen zu behandeln sind. So kann man etwa bei der Beschreibung der Planetenbewegung um die Sonne in erster N¨ aherung die Himmelsk¨orper durch
5.4 Kugelfunktionen
163
Abbildung 5.2. Zur Multipolentwicklung
Massenpunkte beschreiben. Wenn aber die Bewegung eines Satelliten nahe an einem solchen K¨ orper vorbeif¨ uhrt, hat man den Einfluss der ungleichm¨aßigen Massenverteilung eines solchen K¨ orpers zu ber¨ ucksichtigen. Die Beschreibung solcher Effekte gelingt mithilfe der Multipolentwicklung. Wir werden sp¨ater sehen, dass die Multipolentwicklung aber auch bei der Behandlung von Strahlungsprozessen von einigem Interesse ist. Ausgangspunkt unserer Herleitung der Multipolentwicklung ist etwa das Potenzial einer beliebigen Ladungsverteilung in der Elektrostatik. Dazu kehren wir zur Potenzialgleichung (5.123) zur¨ uck und betrachten die Abb. 5.2. Den Ursprung eines Polarkoordinatensystems legen wir in die Ladungsverteilung. Orte innerhalb der Verteilung seien durch die Polarkoordinaten r , ϑ , ϕ bestimmt und der Aufpunkt des Beobachters habe die Koordinaten r, ϑ, ϕ. Die Ortsvektoren r und r, die beziehungsweise zum Quellpunkt und zum Aufpunkt f¨ uhren, m¨ogen den Winkel θ einschließen. Dann finden wir f¨ ur den Abstand R zwischen Quellpunkt und * √ 2 2 Aufpunkt R = |r − r | = r + r − 2rr cos θ = r 1 − 2 rr cos θ + ( rr )2 , wobei wir ber¨ ucksichtigt haben, dass in den meisten F¨allen r >> r ist, also das Quellgebiet klein gegen¨ uber dem Abstand des Beobachters ist. Damit k¨ onnen wir dann mithilfe von (5.127) das Potenzial nach LegendrePolynomen entwickeln, also α Φ(r) = 4π
V
∞ r ρ α dv = dv ρ P (cos θ) . R 4πr r V
(5.181)
=0
Nun verwenden wir das Additionstheorem (5.180) der Kugelfl¨achenfunktionen und dr¨ ucken P (cos θ) durch die Polarwinkel ϑ , ϕ des Quellpunktes und ϑ, ϕ
164
5 Spezielle Funktionen
des Aufpunktes aus. Das ergibt folgende Multipoldarstellung des Potenzials Φ(r) = α
+ ∞ =0 m= −
q,m Y m (ϑ, ϕ) , (2 + 1)r+1
(5.182)
wo die q,m , die sogenannten Multipolmomente, durch folgenden Ausdruck gegeben sind q,m = ρ(r , ϑ , ϕ )r(+2) dr Ym∗ (ϑ , ϕ ) sin ϑ dϑ dϕ . (5.183) V
Wegen der Eigenschaft (5.168) der Kugelfl¨ achenfunktionen gilt f¨ ur die Multipolmomente die Symmetriebeziehung ∗ = (−1)m q,− m . q,m
(5.184)
Die Darstellung des Potenzials Φ(r) als eine Summe von Multipolpotenzialen gestattet in geeigneter Weise die Abweichungen von der Kugelsymmetrie der Potenzialverteilung zu beschreiben. Die Berechnung der einzelnen Multipolkomponenten zeigt, dass die einzelnen Multipolpotenziale verschiedene charakteristische Winkelverteilungen besitzen und dass der Einfluss der einzelnen Komponenten mit zunehmendem Abstand r rasch abklingt. Die explizite Ausrechnung liefert f¨ ur die ersten Multipolkomponenten zun¨achst den Monopol Q , (5.185) ρ(r , ϑ , ϕ )Y00 (ϑ , ϕ )r2 dr dΩ = q0,0 = 4π V wo Q die Gesamtladung ist und als n¨ achstes die Dipolkomponenten / / 3 3 −iϕ 3 r dr dΩ = q1,1 = ρ sin ϑ e ρ(x − iy )dv 8π 8π / 3 (px − ipy ) = 8π / / / 3 3 3 3 (5.186) ρ cos ϑ r dr dΩ = ρz dv = pz q1,0 = 4π 4π 4π / / 3 3 iϕ 3 q1,−1 = − ρ sin ϑ e r dr dΩ = − ρ(x + iy )dv 8π 8π / 3 (px + ipy ) , =− 8π dabei wurde im zweiten Teil der Integration zu Kartes’schen Koordinaten u ¨bergegangen, in welchen das vektorielle Dipolmoment in folgender Weise definiert ist dv ρ(r )r . (5.187) p= V
5.4 Kugelfunktionen
165
In ¨ ahnlicher Weise kann man auch die Quadrupolkomponenten q2,±2 , q2;±1 , q2,0 berechnen und in Kartes’schen Koordinaten den Quadrupoltensor durch den Ausdruck definieren Qi,j = dv ρ(r )(3xi xj − r 2 δi,j ) , (5.188) sodass in Kartes’schen Koordinaten die ersten Terme der Multipolentwicklung die Gestalt haben Qi,j xi xj α Q pi xi + 3 + + ··· . (5.189) Φ= 4π r r r5 Dasselbe Resultat kann man auch erhalten, wenn man die Green-Funktion in (5.181) in Kartes’schen Koordinaten in eine Taylor-Reihe nach Potenzen von ur h¨ohere Terme sehr umst¨andlich xi entwickelt, doch wird diese Entwicklung f¨ und die Entwicklung nach Kugelfl¨ achenfunktionen Ym ist weitaus eleganter. Aus (5.189) geht explizit hervor, dass jede beliebige, begrenzte Ladungsverteilung (oder Massenverteilung) in großer Entfernung das Potenzial einer Punktquelle liefert. Das Dipolpotenzial tritt nur bei Ladungsverteilungen verschiedener Polarit¨ at auf. Bei Massenverteilungen fehlt dieser Term und da das Quadrupolpotenzial rasch mit der Entfernung abklingt, ist die Approximation durch Punktmassen eine sehr gute N¨ aherung. 2. Ein Dirichlet’sches Randwertproblem In Abschn. 4.3.2 haben wir unter (4.42) die L¨ osung der Laplace’schen Differenzialgleichung in Kugelkoordinaten angegeben. In Kugelfl¨ achenfunktionen ausgedr¨ uckt lautet diese L¨osung Φ(r, ϑ, ϕ) =
+ ∞ A,m r + B,m r−(+1) Ym (ϑ, ϕ) .
(5.190)
=0 m= −
Wir betrachten nun zwei konzentrische Kugeln mit den Radien R1 und R2 , wobei R1 < R2 sein soll. Auf den beiden Kugeloberfl¨achen seien verschiedene Potenzialverteilungen vorgegeben. Es sei Φ(R1 , ϑ, ϕ) = 0 und Φ(R2 , ϑ, ϕ) = F0 cos ϑ. Zur L¨ osung dieses elementaren Dirichlet’schen Randwertproblems, setzen wir die obigen Bedingungen in (5.190) ein. Dies ergibt −(+1) Ym (ϑ, ϕ) 0 = ,m A,m R1 + B,m R1 . (5.191) −(+1) Ym (ϑ, ϕ) F0 cos ϑ = ,m A,m R2 + B,m R2 Zur Berechnung der Koeffizienten A,m und B,m multiplizieren wir beide Gleichungen von links Ym ∗ (ϑ, ϕ) und integrieren u ¨ ber dΩ. Dies ergibt wegen der Orthogonalit¨ at und Normiertheit der Kugelfl¨achenfunktionen f¨ ur die erste dieser Gleichungen
−( +1)
0 = A ,m R1 + B ,m R1
,
−(2 +1)
A ,m = −B ,m R1
(5.192)
166
5 Spezielle Funktionen
und f¨ ur die zweite Gleichung
/
4π −( +1) δ ,1 δm ,0 = A ,m R2 + B ,m R2 . 3 (5.193) Aus beiden Gleichungen schließen wir zun¨ achst f¨ ur = 1, m = 0, dass die ussen, da sonst im Gegensatz zur Koeffizienten A ,m = B ,m = 0 sein m¨ Annahme, R1 = R2 sein m¨ usste. Aus den restlichen Gleichungen erhalten wir die Beziehungen / 4π −3 F0 = A1,0 R2 + B1,0 R2−2 , (5.194) A1,0 = −B1,0 R1 , 3 dΩYm ∗ (ϑ, ϕ)F0
cos ϑ =
mit denen sich A1,0 und B1,0 berechnen lassen und somit die L¨osung des Problems schließlich lautet /
4π R2 R3 F0 3 2 3 r − 21 Y10 (ϑ, ϕ) Φ(r, ϑ, ϕ) = 3 R2 − R1 r
2 3 R R = F0 3 2 3 r − 21 cos ϑ . (5.195) R2 − R1 r Die Erf¨ ullung der Randbedingungen l¨ asst sich leicht nachpr¨ ufen. Da die zweite Randbedingung rotationssymmetrisch ist, h¨atten wir sogleich einen L¨ osungsansatz f¨ ur die Laplace-Gleichung in der Form Φ(r, ϑ) =
∞ A r + B r−(+1) P (cos ϑ)
(5.196)
=0
machen k¨ onnen, was wir uns im n¨ achsten Beispiel zunutze machen werden. 3. Str¨omung einer Fl¨ ussigkeit um eine Kugel Das Geschwindigkeitsfeld einer reibungsfreien Fl¨ ussigkeit l¨ asst sich aus einem Str¨omungspotenzial herleiten, das bei Abwesenheit von Quellen der Laplace’schen Differenzialgleichung gen¨ ugt. Hier gilt v(r) = −∇Φ(r) . (5.197) Wir betrachten nun die Umstr¨ omung einer Kugel vom Radius R. Es ist anschaulich verst¨ andlich, dass senkrecht zur Kugeloberfl¨ache die Str¨omungsgeschwindigkeit gleich Null sein wird. Dies f¨ uhrt auf die Neumann’sche Randbedingung ∂Φ =0. (5.198) v r = − ∂r r=R In großer Entfernung von der Kugel wird diese keinen Einfluss auf die Str¨ omung haben und wir nehmen daher an, dort herrsche Parallelstr¨omung v = v0 k in Richtung der z-Achse, die wir zu unserer Polarachse machen und welche durch das Kugelzentrum verl¨ auft. Das Potenzial der Parallelstr¨omung
5.5 Bessel-Funktionen
167
kann leicht angegeben werden Φ → −v0 z = −v0 r cos ϑ . r→∞
(5.199)
Dies ist unsere zweite, Dirichlet’sche Randbedingung. Wir wenden zuerst die Randbedingung (5.198) auf den L¨ osungsansatz (5.196) an. Dies ergibt 0=
∞ % & A R−1 − B ( + 1)R−(+2) P (cos ϑ) .
(5.200)
=0
Nach Multiplikation dieser Gleichung mit Pn (cos ϑ) und Integration u ¨ ber das Intervall (0, π), erhalten wir wegen der Orthogonalit¨at der LegendrePolynome n R2n+1 . (5.201) Bn = An n+1 Setzen wir die zweite Randbedingung (5.199) auf der linken Seite von (5.196) ein, multiplizieren diese Gleichung mit Pn (cos ϑ) und integrieren u ¨ber (0, π), so erhalten wir f¨ ur r → ∞ die Beziehung −v0 rδn,1 = An rn .
(5.202)
Aus (5.201) und (5.202) schließen wir f¨ ur n = 1, dass A1 = −v0 und B1 = − v20 R3 ist und dass f¨ ur n = 1 die Koeffizienten An = Bn = 0 sind. Daher lautet das Potenzial der die Kugel umstr¨ omenden reibungsfreien Fl¨ ussigkeit
R3 Φ(r, ϑ) = −v0 r + 2 cos ϑ . (5.203) 2r Der Leser erkennt an den letzten beiden Beispielen, dass man mit ein wenig Routine von Anfang an einen passenden L¨ osungsansatz machen kann und sich so viel Rechenarbeit erspart. Der hier beschriebene Weg ist jedenfalls der sichere.
5.5 Bessel-Funktionen Neben den Kugelfunktionen z¨ ahlen die Bessel-Funktionen zu den wichtigsten speziellen Funktionen der Physik und treten haupts¨achlich bei zylindrischen Problemstellungen auf, weshalb sie auch Zylinderfunktionen genannt werden. Je nach der physikalischen Problemstellung, gibt es f¨ ur diese Funktionen verschiedene Varianten, deren wichtigste wir der Reihe nach diskutieren wollen. Unter gewissen Bedingungen definieren die Bessel-Funktionen ein Sturm-Liouville’sches Eigenwertproblem und Funktionen k¨onnen dann in eine Fourier-Bessel-Reihe entwickelt werden.
168
5 Spezielle Funktionen
5.5.1 Reihenl¨ osung der Bessel’schen Differenzialgleichung In Abschn. 4.3.2 wurden wir bei der Separation der Helmholtz-Gleichung in Kugel- und Zylinderkoordinaten auf die Bessel’sche Differenzialgleichung gef¨ uhrt. Ausgangspunkt unserer Betrachtungen sei ihre allgemeine Form
1 ν2 Z (x) + Z (x) + 1 − 2 Z(x) = 0 , (5.204) x x wo ν ein beliebiger reeller Parameter sein soll. Ersichtlich ist die Gleichung vom Fuchs’schen Typus und hat bei x = 0 eine außerwesentliche Singularit¨at. Daher k¨ onnen wir zur L¨ osung der Gleichung in der Umgebung dieser Stelle einen Frobenius-Ansatz machen (vgl. Abschn. 5.3.1) Z(x) = xs
∞
c x .
(5.205)
=0
Setzen wir dies in die Differenzialgleichung ein und ordnen nach gleichen Potenzen von x, so erhalten wir ∞ #
( + s) − ν 2
2
$
s+
c x
+
=0
∞
c−2 xs+ = 0 .
(5.206)
=2
Da diese Gleichung f¨ ur beliebige Werte von x gleich Null sein soll, erhalten wir f¨ ur = 0, 1 (s2 + ν 2 )c0 = 0 ,
[(s + 1)2 − ν 2 ]c1 = 0
(5.207)
und f¨ ur ≥ 2 ergibt sich folgende zweigliedrige Rekursionsformel f¨ ur die Koeffizienten c c =
c−2 c−2 . = ( + s)2 − ν 2 ( + s + ν)( + s − ν)
(5.208)
Wegen der Beziehungen (5.207) k¨ onnen wir entweder c0 = 0, c1 = 0 w¨ahlen oder umgekehrt, da sonst s u are. Wir w¨ahlen den ersten Fall ¨ berbestimmt w¨ und die Indexgleichung hat dann die beiden L¨osungen s1,2 = ±ν. Dann sind alle Koeffizienten c2k+1 = 0 und alle c2k (k = 0, 1, 2, · · · ) durch c0 ausdr¨ uckbar. Wir betrachten zuerst den Fall s1 = ν. Durch sukzessive Anwendung finden wir mithilfe der Rekursionsformel (5.208) c2k =
(−1)k c0 . 22k (k + ν)(k + ν − 1) · · · (k + 1)k(k − 1) · · · 2 · 1
(5.209)
Aus Zweckm¨ aßigkeit ist es u ¨ blich, den Koeffizienten c0 folgendermaßen zu w¨ ahlen, sodass die Koeffizienten c2k lauten c0 =
( 12 )ν , Γ (ν + 1)
c2k =
(−1)k ( 12 )ν+2k , Γ (ν + k + 1)k!
(5.210)
5.5 Bessel-Funktionen
169
wo Γ (ν + 1) die in Abschn. 5.2 (5.6) definierte Euler’sche Gammafunktion ist. Damit lautet eine erste L¨ osung der Bessel-Gleichung (5.204) Jν (x) =
∞ (−1)k ( x2 )ν+2k Γ (ν + k + 1)k!
(5.211)
k=0
und diese wird die Bessel-Funktion 1. Art von der Ordnung ν genannt. Diese L¨ osung ist eine bei x = 0 regul¨ are Funktion. Sie hat f¨ ur x > |r | ist. In diesem Fall k¨ Seite der Gleichung R ∼ = r setzen und als Faktor vor das Integral ziehen. Die in der Exponentialfunktion auftretenden Retardierungseffekte von den verschiedenen Quellpunkten sind jedoch vorsichtiger zu behandeln, da sie zu Interferenzerscheinungen f¨ uhren, die f¨ ur die Multipolentwicklung maßgeblich sind. Hier machen wir die folgende N¨ aherung R = r2 + r 2 − 2rr cos θ ' 2 r r ∼ (5.324) =r 1−2 cos θ + = r − r cos θ + · · · , r r wobei der Winkel zwischen den Vektoren r und r mit θ bezeichnet wurde. Setzen wir diese N¨ aherungen in den monochromatischen Spezialfall von
5.6 Die Hermite- und Laguerre-Funktionen
(5.323) ein, so erhalten wir mit Φ(r, t) =
ω c
189
=k
α ei(kr−ωt) 4π r
V
dv ρ(r )e−ikr
cos θ
.
(5.325)
Hier k¨ onnen wir auf die Exponentialfunktion unter dem Integralzeichen die soeben gefundene Reihenentwicklung (5.321) anwenden, wobei wir die imagin¨ are Einheit i hier durch −i zu ersetzen haben. Dies ergibt f¨ ur das Integral ∞ dv ρ(r ) (2 + 1)(−i) j (kr )P (cos θ) . (5.326) V
=0
Nun bezeichnen wir die Punkte des Quellgebietes durch die Kugelkoordinaten (r , ϑ , ϕ ) und den Aufpunkt durch die Koordinaten (r, ϑ, ϕ). Daher k¨ onnen wir in (5.326) auf P (cos θ) das Additionstheorem (5.180) der Kugelfl¨ achenfunktionen anwenden und die letzte Gleichung folgendermaßen neu darstellen + ∞ m (−1) Y (ϑ, ϕ) r2 dr dΩ ρ(r , ϑ , ϕ )j (kr )Ym∗ (ϑ , ϕ ) . 4π =0 m= −
V
(5.327) Wenn wir in dieser Gleichung, in Analogie zur statischen Multipolentwicklung (5.183), die einzelnen Integralausdr¨ ucke als Multipolmomente q,m definieren, so k¨ onnen wir schließlich die Multipolentwicklung der asymptotischen L¨osung (5.325) der inhomogenen d’Alembert’schen Wellengleichung in folgender Weise ausdr¨ ucken Φ(r, ϑ, ϕ, t) = α
∞ + ei(kr−ωt) (−i) q,m Ym (ϑ, ϕ) . r
(5.328)
=0 m= −
Offenbar haben die einzelnen Komponenten der Multipolentwicklung verschiedene Winkelabh¨ angigkeiten, die in praktischen F¨allen experimentell nachgewiesen werden k¨ onnen.
5.6 Die Hermite- und Laguerre-Funktionen Die Hermite- und Laguerre-Funktionen sind von besonderem Interesse f¨ ur die L¨ osung der Schr¨ odinger-Gleichung des linearen harmonischen Oszillators bzw. des Wasserstoffatoms in der Quantenmechanik. Wir wollen daher diese Funktionen anhand der L¨ osung dieser beiden Probleme einf¨ uhren und ihre Eigenschaften diskutieren. In Abschn. 4.2 haben wir die Schr¨odinger-Gleichung ¨ unter (4.5) angef¨ uhrt. F¨ ur die folgenden Uberlegungen wollen wir sie nochmals angeben ∂ 2 Δ + V (x, y, z, t) − i Φ=0. (5.329) − 2m ∂t
190
5 Spezielle Funktionen
Wenn das Potenzial V nicht explizit von der Zeit t abh¨angt, k¨onnen wir folgenden Separationsansatz machen i
Φ = ψ(x, y, z)e− Et ,
(5.330)
wo E den Energieparameter darstellt. Beim Einsetzen dieses Ansatzes in die Gleichung (5.329) erhalten wir die zeitunabh¨ angige Schr¨odinger-Gleichung 2 Δ + V (x, y, z) ψ(x, y, z) = Eψ(x, y, z) . (5.331) − 2m Diese Gleichung ist nach Schr¨ odinger mit der Bedingung zu l¨osen, dass |ψ(x, y, z)|2 dv < ∞ (5.332) ∞
ist, wobei die Integration u ¨ ber den gesamten unendlichen Raum zu erstrecken ist. Diese Bedingung besagt nichts anderes, als dass die L¨osungen der Schr¨ odinger-Gleichung quadratisch integrabel sein m¨ ussen. Die folgenden beiden Probleme haben wir unter diesen Bedingungen zu l¨osen. 5.6.1 Die Hermite-Funktionen In der klassischen Mechanik gen¨ ugt der lineare harmonische Oszillator der elementaren Newton’schen Bewegungsgleichung ..
mx = K = −κx .
(5.333)
Die r¨ ucktreibende Kraft K = −κx = −∇V (x) k¨onnen wir aus dem Potenzial V (x) = κ2 x2 herleiten. Daher lautet die entsprechende Schr¨odinger-Gleichung des linearen harmonischen Oszillators 2 d2 κ 2 x − + ψ(x) = Eψ(x) . (5.334) 2m dx2 2 Die L¨ osungen dieses Sturm-Liouville’schen Eigenwertproblems sind im Intervall −∞ < x < +∞ unter Beachtung der Bedingung (5.332) zu suchen. Es ist zweckm¨ aßig, folgende neue Ver¨ anderliche und folgende Abk¨ urzungen einzuf¨ uhren / mκ − 14 κ 2E , ω= . (5.335) x, λ= ξ= 2 ω m Dabei ist ω die Kreisfrequenz des harmonischen Oszillators und λ misst die Eigenwerte der Energie in den Einheiten ω = hν, wo ν die klassische Frequenz des Oszillators und h das Plancksche Wirkungsquantum sind. Mit den neuen Variablen und Parametern lautet das zu l¨osende Eigenwertproblem d2 ψ(ξ) + (λ − ξ 2 )ψ(ξ) = 0 . dξ 2
(5.336)
5.6 Die Hermite- und Laguerre-Funktionen
191
Diese Gleichung hat f¨ ur ξ → ∞ eine außerwesentliche Singularit¨at, wie man durch die Transformation ξ = η1 nachweisen kann, wenn man auf diese Weise gem¨ aß Abschn. 5.3.1 die Singularit¨ at in den Ursprung verlegt. Wir betrachten daher zun¨ achst das asymptotische Verhalten der L¨osungen von (5.336) f¨ ur ξ → ∞. In diesem Fall gen¨ ugt es, die folgende Gleichung zu betrachten ψ (ξ) − ξ 2 ψ(ξ) = 0 .
(5.337)
Wie wir durch einsetzen nachweisen k¨ onnen, wird diese Gleichung asymptotisch durch folgenden Ansatz ψ(ξ) ∼ = e±
ξ2 2
(5.338)
¨ gel¨ ost. Wegen der Bedingung (5.332) ist f¨ ur die folgenden Uberlegungen in der asymptotischen L¨ osung (5.338) jedenfalls das positive Vorzeichen auszuschließen. Wir machen daher zur L¨ osung der Eigenwertgleichung (5.336) den L¨ osungsansatz ψ(ξ) = H(ξ)e−
ξ2 2
.
(5.339)
Dieser Ansatz f¨ uhrt beim einsetzen in (5.336) auf die folgende Differenzialgleichung f¨ ur H(ξ) H (ξ) − 2ξH (ξ) + (λ − 1)H(ξ) = 0 .
(5.340)
Die Stelle ξ = 0 ist jedenfalls ein regul¨ arer Punkt dieser Differenzialgleichung. Daher k¨ onnen wir zur L¨ osung den Potenzreihenansatz machen H(ξ) =
∞
c ξ .
(5.341)
=0
Dies ergibt beim einsetzen in die Differenzialgleichung 1 = 0
( − 1)c ξ −2 +
∞ [( + 2)( + 1)c+2 − (2 + 1 − λ)c ]ξ = 0 . (5.342) =2
Aus den ersten beiden Termen der Reihe schließen wir, dass entweder c0 = 0 und c1 = 0 oder umgekehrt, gew¨ ahlt werden kann. Wir w¨ahlen den ersten Fall. Aus der zweiten Summe erhalten wir, in der inzwischen gel¨aufigen Schlussweise, die folgende zweigliedrige Rekursionsformel zur Berechnung der Koeffizienten c 2 + 1 − λ c+2 = (5.343) c . ( + 2)( + 1) F¨ ur große Werte von schließen wir daraus, dass c+2 ∼ = 2 c ist und wenn c0 ∼ wir = 2k setzen, so ergibt sich rekursiv c2k = k! und daher strebt H(ξ)
192
5 Spezielle Funktionen
nach folgender N¨ aherung H(ξ) → c0
∞ ξ 2k k=0
k!
2
= c0 e ξ .
(5.344)
Dieses Resultat w¨ urde aber zusammen mit dem Ansatz (5.339) bedeuten, dass die gesuchte L¨ osung ψ(ξ) im Unendlichen divergiert, entgegen der Voraussetzung. Um dies zu vermeiden, muss daher die Reihe f¨ ur H(ξ) f¨ ur einen bestimmten Index = n abbrechen, sodass aufgrund der Rekursionsformel cn+2 = 0 ist. Dies wird erreicht, wenn der Parameter λ die folgenden diskreten Werte annimmt λn = 2n + 1 , n = 0, 1, 2, 3, · · · (5.345) und daher lauten, wegen der Definition (5.335) des Parameters λ, die Energieeigenwerte des linearen harmonischen Oszillators
1 En = ω n + . (5.346) 2 Die L¨ osungen H(ξ), die der Differenzialgleichung (5.340) gen¨ ugen, sind nun aß (5.345) die Differenzialgleichung die Hermite-Polynome Hn (ξ), die gem¨ erf¨ ullen (5.347) Hn (ξ) − 2ξHn (ξ) + 2nHn (ξ) = 0 und durch die Polynome Hn (ξ) =
n
c ξ
(5.348)
= 0
bestimmt sind, deren Koeffizienten sich aus (5.343) mit λ = 2n + 1 berechnen lassen, wobei die noch frei zu w¨ ahlende Konstante mit c0 = 2n festgelegt wird. Die Eigenfunktionen der Schr¨ odinger-Gleichung des harmonischen Oszillators sind dann die Hermite-Funktionen ψn (ξ) = Hn (ξ)e−
ξ2 2
,
(5.349)
deren Eigenschaften wir nun diskutieren. Wir beginnen mit den HermitePolynomen. Diese haben die erzeugende Funktion 2
F (ξ, t) = e2tξ−t =
∞ Hn (ξ) n t , n! n=0
(5.350)
welche sich in folgender Weise umschreiben und in eine Taylor-Reihe entwickeln l¨ asst
∞ n n ∂ F (ξ, t) t ξ 2 −(ξ−t)2 = . (5.351) F (ξ, t) = e e n! ∂tn t= 0 n=0
5.6 Die Hermite- und Laguerre-Funktionen
193
Demnach sind die Hermite-Polynome durch folgende Formel bestimmt n n 2 ∂ −(ξ−t)2 ξ2 n ξ2 d e = (−1) e e−ξ , (5.352) Hn (ξ) = e n n ∂t dξ t=0 wobei im letzten Ausdruck die Differenziation nach t mit jener nach ξ vertauscht wurde, was den Vorfaktor (−1)n mit sich brachte. F¨ ur die ersten Hermite-Polynome finden wir durch Ausrechnung H0 (ξ) = 1 ,
H1 (ξ) = 2ξ ,
H2 (ξ) = 4ξ 2 − 2 , · · · .
(5.353)
Bisher wissen wir aber noch gar nicht, ob die so definierten Polynome in der Tat der Hermite’schen Differenzialgleichung gen¨ ugen. Dies k¨onnen wir verifizieren, indem wir aus der Erzeugenden F (ξ, t) durch Differenziation nach ξ und t die Rekursionsformeln herleiten. Die Differenziation nach ξ ergibt 2
2te2ξ t−t = 2
∞ ∞ Hn−1 (ξ) n Hn (ξ) n t = t . (n − 1)! n! n=1 n=0
(5.354)
Der Vergleich der Koeffizienten von tn auf beiden Seiten dieser Beziehung liefert die erste Rekursionsformel 2nHn−1 (ξ) = Hn (ξ) .
(5.355)
Als n¨ achstes differenzieren wir die Erzeugende nach t. Dies ergibt 2
2(ξ − t)e2ξ t−t = 2
∞ ∞ ∞ Hn−1 (ξ) n Hn−1 (ξ) n Hn (ξ) n t −2 t = t , ξ n! (n − 1)! n! n= 0 n= 1 n= −1
woraus wir u ¨ ber den Koeffizienten von schließen k¨ onnen
tn n!
(5.356) auf die zweite Rekursionsformel
2ξHn (ξ) − 2nHn−1 (ξ) = Hn+1 (ξ) .
(5.357)
Addieren wir die beiden Rekursionsformeln (5.355, 5.357), so erhalten wir eine dritte Formel H n (ξ) = 2ξHn (ξ) − Hn+1 (ξ) . (5.358) Wenn wir schließlich diese Rekursionsformel nach ξ differenzieren und mit der ersten Rekursionsformel (5.355) nach der Substitution n → n + 1 kombinieren, so finden wir, dass die durch die Erzeugende F (ξ, t) definierten Polynome in der Tat der Hermite’schen Differenzialgleichung (5.347) gen¨ ugen. Mithilfe der soeben gefundenen Rekursionsformeln der Hermite-Polynome Hn (ξ) k¨ onnen wir sogleich die entsprechenden Rekursionsformeln der HermiteFunktionen ψn (ξ) =e−
ξ2 2
Hn (ξ) (5.339) herleiten. Wenn wir ψn (ξ) nach ξ
194
5 Spezielle Funktionen
differenzieren und danach mit der Rekursionsformel (5.355) kombinieren, so erhalten wir die erste Rekursionsformel f¨ ur ψn (ξ) ψn (ξ) = 2nψn−1 (ξ) − ξψn (ξ) . Multiplizieren wir die Gleichung (5.357) mit e− Rekursionsformel
ξ2 2
(5.359)
, so ergibt sich die zweite
2ξψn (ξ) − 2nψn−1 (ξ) = ψn+1 (ξ) .
(5.360)
Schließlich liefert die Addition der beiden letzten Formeln die dritte Rekursionsformel (5.361) ψn (ξ) = ξψn (ξ) − ψn+1 (ξ) . Diese Rekursionsformeln k¨ onnen wir gleich dazu verwenden, um die Orthogonalit¨ at und Normierung der Hermite-Funktionen zu bestimmen. Setzen wir in (5.336) λ = 2n+1, so lautet die Differenzialgleichung der Hermite-Funktionen ψn (ξ) + (2n + 1 − ξ 2 )ψ(ξ) = 0 .
(5.362)
Zum Nachweis der Orthogonalit¨ at der Hermite-Funktionen multiplizieren wir diese Gleichung von links mit ψm (ξ) und setzen eine analoge Differenzialgleichung f¨ ur ψm (ξ) an, die wir dann von links mit ψn (ξ) multiplizieren. Die resultierenden Gleichungen ziehen wir dann voneinander ab und integrieren das Resultat u ¨ber (−∞, +∞). Dies ergibt +∞ +∞ ! [ψn (ξ)ψm (ξ) − ψm (ξ)ψn (ξ)]dξ = 0 = 2(n − m) ψn (ξ)ψm (ξ)dξ . −∞
−∞
(5.363) Die linke Seite dieser Gleichung ist aber Null, wie angedeutet, denn wenn wir dort partiell integrieren, dann verschwindet der ausintegrierte Anteil an den Grenzen (−∞, +∞) und die Argumente des restlichen Integrals heben sich gegenseitig auf. Daher folgt aus dieser Gleichung f¨ ur n = m die Orthogonalit¨ at der Hermite-Funktionen ψn (ξ). Zur Herleitung der Normierung dieser Funktionen betrachten wir folgendes Integral und wenden die zweite Rekursionsformel (5.360) an +∞ 2ξψn (ξ)ψn−1 (ξ)dξ −∞
+∞
= 2n −∞
ψn−1 (ξ)ψn−1 (ξ)dξ +
+∞
ψn+1 (ξ)ψn−1 (ξ)dξ .
−∞
(5.364)
Das Integral auf der linken Seite k¨ onnen wir aber auch mithilfe der Rekursionsformel (5.360) f¨ ur n → n − 1 so ausdr¨ ucken +∞ ψn (ξ)[2ξψn−1 (ξ)]dξ −∞
= 2(n − 1)
+∞
−∞
ψn (ξ)ψn−2 (ξ)dξ +
+∞
−∞
ψn (ξ)ψn (ξ)dξ .
(5.365)
5.6 Die Hermite- und Laguerre-Funktionen
195
Da die Integrale auf der linken Seite der beiden letzten Formeln miteinander identisch sind, gilt dies auch f¨ ur ihre rechten Seiten. Dabei f¨allt jeweils eines der dortigen Integrale wegen der bereits bewiesenen Orthogonalit¨at der ψn (ξ) weg und wir finden f¨ ur das Normierungsintegral die folgende Rekursionsformel +∞ +∞ ψn (ξ)ψn (ξ)dξ = 2n ψn−1 (ξ)ψn−1 (ξ)dξ = 2nIn−1,n−1 . In,n = −∞
−∞
(5.366) Wenn wir mit der Rekursion fortfahren, erhalten wir schließlich wegen des vollst¨ andigen Gauß’schen Fehlerintegrals (5.11) In,n = 2nIn−1,n−1 = 22 n(n − 1)In−2,n−2 = · · · +∞ +∞ √ 2 ψ0 (ξ)ψ0 (ξ)dξ = 2n n! e−ξ dξ = 2n n! π . (5.367) = 2n n! −∞
−∞
Somit lauten die normierten Eigenfunktionen des linearen harmonischen Oszillators ξ2 1 Hn (ξ)e− 2 . (5.368) ψn (ξ) = √ 2n n! π 5.6.2 Die Laguerre-Funktionen Das Wasserstoffatom besteht aus einem Proton der Masse M und der Ladung +e und aus einem Elektron der Masse m und der Ladung −e. Da M ∼ = 1000m ist, k¨ onnen wir die Mitbewegung des Atomkerns in erster N¨aherung vernachl¨ assigen und annehmen, das Proton bef¨ ande sich als Kraftzentrum im Ursprung des Koordinatensystems. Die elektrostatische Kraft, die das Proton auf das Elektron aus¨ ubt, ist durch das Coulomb’sche Gesetz bestimmt. Das elektrostatische Potenzial dieser Kraft ist kugelsymmetrisch und durch folgenden Ausdruck gegeben V (r) = −
e2 , r
(5.369)
aus dem durch K = −∇V (r) die Coulomb’sche Kraft berechnet werden kann. Wegen der Kugelsymmetrie und Zeitunabh¨ angigkeit der Kraftwirkung wird es zweckm¨ aßig sein, die Schr¨ odinger-Gleichung der station¨aren Zust¨ande des Wasserstoffatoms in Kugelkoordinaten auszudr¨ ucken. Mithilfe des Ausdrucks (1.146) in Abschn. 1.5.2 f¨ ur den Laplace-Operator in Kugelkoordinaten und mit dem Potenzial (5.369) erh¨ alt die Schr¨ odinger-Gleichung (5.331) die Gestalt
∂ 2 1 ∂ ∂ 2 ∂ − r + sin ϑ 2mr2 ∂r ∂r sin ϑ ∂ϑ ∂ϑ ∂2 e2 1 − + ψ(r, ϑ, ϕ) = Eψ(r, ϑ, ϕ) . (5.370) r sin2 ϑ ∂ϕ2
196
5 Spezielle Funktionen
Durch einen Vergleich mit der L¨ osung der Helmholtz-Gleichung in Kugelkoordinaten in Abschn. 4.3.2, k¨ onnen wir auch hier sofort den L¨osungsansatz (4.31) machen (5.371) ψ,m (r, ϑ, ϕ) = R (r)Ym (ϑ, ϕ) , wodurch wir beim Einsetzen in (5.370) auf die radiale Schr¨odinger-Gleichung gef¨ uhrt werden
2m 2 e2
( + 1) (5.372) E + R (r) = 0 . R (r) + R (r) + − r 2 r r2 Wir betrachten zun¨ achst das asymptotische Verhalten der L¨osungen dieser Gleichung f¨ ur r → ∞. Dann erhalten wir aus (5.372) die gen¨aherte Gleichung R (r) +
2m ER (r) = 0 . 2
(5.373)
Hier haben wir nun zwei L¨ osungsf¨ alle zu unterscheiden, je nachdem ob der Energieparameter E > 0 oder E < 0 ist. Dies ergibt die beiden asymptotischen L¨ osungsm¨oglichkeiten E>0,
R (r) ∼ = e±i
√ 2mE
r
,
E 0 aus folgender erzeugenden Funktion herleiten xt ∞ Ln (x) n e− 1−t = t , (5.391) F (x, t) = 1−t n! n=0
5.6 Die Hermite- und Laguerre-Funktionen
199
wonach die Ln (x) ersichtlich die Differenzialkoeffizienten der Taylor’schen Reihenentwicklung von F (x, t) sind. Setzt man auf beiden Seiten der Gleichung (5.391) x = 0, so kann man die linke Seite in eine geometrische Reihe nach tn entwickeln und schließt beim Vergleich der beiden Seiten, dass Ln (0) = n! ist. Wenn man die Exponentialfunktion in (5.391) etwas umschreibt, so zeigt sich, dass die Laguerre-Polynome durch die folgende Formel gegeben sind . x n − 1−t n e d x d = e (xn e−x ) , (5.392) Ln (x) = ex dtn 1 − t dxn t=0
¨ wobei die Aquivalenz der beiden letzten Formeln f¨ ur n = 1 leicht nachzuweisen ist und die allgemeine G¨ ultigkeit durch den Induktionsschluss von n auf n + 1 gefunden werden kann. Differenziert man die Erzeugende F (x, t) nach x, so ergibt sich −
∞ ∞ t t Ln (x) n Ln (x) n F (x, t) = − t = t 1−t 1 − t n=0 n! n! n=0
(5.393)
und hieraus folgert man nach Umordnung auf gleiche Potenzen von t die erste Rekursionsformel Ln (x) − nLn−1 (x) + nLn−1 (x) = 0 .
(5.394)
Wenn wir die erzeugende Funktion nach t differenzieren, so erhalten wir ∞ ∞ 1−t−x 1 − t − x Ln (x) n Ln (x) n−1 t t F (x, t) = = (1 − t)2 (1 − t)2 n=0 n! (n − 1)! n=0
(5.395)
und daraus ergibt sich nach Umordnung die zweite Rekursionsformel (2n + 1 − x)Ln (x) − Ln+1 (x) − n2 Ln−1 (x) = 0 .
(5.396)
Wird die zweite Rekursionsformel zwei mal nach x differenziert und ersetzt man n durch n + 1, so folgt daraus Ln+2 (x) + (x − 2n − 3)Ln+1 (x) + (n + 1)2 Ln (x) + 2Ln+1 (x) = 0 . (5.397) Nun kann man in der ersten Rekursionsformel (5.394) n durch n + 1 bzw. durch n + 2 ersetzen und anschließend differenzieren. Dies ergibt Ausdr¨ ucke, die es gestatten in (5.397) die Terme Ln+2 , Ln+1 und Ln+1 zu eliminieren und man gelangt auf diese Weise zur Differenzialgleichung (5.390) der LaguerrePolynome, womit dann nachgewiesen ist, dass die durch die erzeugende Funktion (5.391) definierten Funktionen bis auf einen konstanten Faktor mit den Laguerre-Polynomen identisch sind.
200
5 Spezielle Funktionen
b) Die Laguerre-Funktionen Die soeben behandelten Laguerre-Polynome sind aber nicht die Eigenfunktionen eines Sturm-Liouville’schen Eigenwertproblems. Man definiert dazu unter Bezug auf (5.377) die Laguerre-Funktionen durch die Gleichung x
φn (x) = e− 2 Ln (x) .
(5.398)
Diese Funktionen bilden dann im Intervall (0 ≤ x < ∞) ein vollst¨andiges orthogonales Funktionensystem und gen¨ ugen in selbstadjungierter Form (vgl. Abschn. 5.3.1) der Differenzialgleichung
d dφn (x) 1 x (5.399) x + n+ − φn (x) = 0 . dx dx 2 4 Zum Nachweis der Orthogonalit¨ at der L¨ osungen φn (x) gehen wir in bereits bekannter Weise vor. Wir multiplizieren die letzte Gleichung von links mit φm (x) und betrachten eine analoge Gleichung, in der n und m vertauscht wurden. Dann subtrahieren wir diese beiden Gleichungen und integrieren das Resultat u ¨ber das Definitionsintervall (0 ≤ x < ∞). Dies ergibt
∞ d d dφn (x) dφm (x) φm (x) x − φn (x) x dx dx dx dx 0 (5.400) + (n − m)φm (x)φn (x) dx = 0 . Bei der partiellen Integration der ersten beiden Terme in dieser Gleichung verschwindet der ausintegrierte Anteil an den Integrationsgrenzen und die resultierenden Integrale der partiellen Integration heben sich gegenseitig auf. Daraus folgt f¨ ur m = n die Orthogonalit¨at der Laguerre-Funktionen φn (x). Zur Berechnung ihrer Normierung gehen wir von folgendem Integral aus, bei welchem wir hintereinander zweimal die zweite Rekursionsformel (5.396) der Laguerre-Polynome anwenden. Dies ergibt mithilfe der Orthogonalit¨ atsrelation (5.400) ∞ ∞ ∞ φn (x)φn (x)dx = e−x Ln (x)Ln (x)dx = n2 φn−1 (x)φn−1 (x)dx . 0
0
0
(5.401) Daraus k¨ onnen wir rekursiv das Normierungsintegral berechnen und erhalten schließlich die Orthogonalit¨ atsrelation der Laguerre-Funktionen ∞ φn (x)φm (x)dx = (n!)2 δn,m . (5.402) 0
Daher sind die normierten Laguerre-Funktionen durch folgenden Ausdruck gegeben 1 x φ¯n (x) = e− 2 Ln (x) . (5.403) n!
5.6 Die Hermite- und Laguerre-Funktionen
201
Ferner sind die zugeordneten Laguerre-Polynome definiert durch die k-te Ableitung der Laguerre-Polynome (5.392) n dk dk k x d n −x Ln (x) = Ln (x) = (x e ) (5.404) e dxk dxk dxn und diese gen¨ ugen der Differenzialgleichung xLkn (x) + (k + 1 − x)Lkn (x) + (n − k)Lkn (x) = 0 ,
(5.405)
wie sich durch k-malige Differenziation von (5.390) nachweisen l¨asst. Die bereits betrachtete Gleichung (5.387) stellt demnach einen speziellen Fall von (5.405) dar. c) Die zugeordneten Laguerre-Funktionen Eine erzeugende Funktion der zugeordneten Laguerre-Polynome kann man durch k-malige Differenziation der erzeugenden Funktion (5.391) nach x herleiten. Dies ergibt F (k) (x, t) = (−1)k
∞ xt tk Lkn (x) n − 1−t e = t , (1 − t)k+1 n!
(5.406)
n= k
wobei zu beachten ist, dass n ≥ k sein muss. Von physikalischem Interesse sind die bereits in (5.389) angegebenen radialen Zustandsfunktionen Rn, (ρ), welche den zugeordneten Laguerre-Funktionen ¨aquivalent sind. Zur Berechnung des Normierungsintegrals dieser Funktionen, welches durch den Ausdruck gegeben ist ∞ ∞ % &2 (2+1) 2 2 [Rn, (ρ)] ρ dρ = e−ρ ρ2 L+n (ρ) ρ2 dρ In, = 0
0
2n[(n + )!]3 , = (n − − 1)!
(5.407)
verwenden wir die erzeugende Funktion F (k) (x, t) der zugeordneten LaguerrePolynome und betrachten die folgende Summe (2+1) (2+1) ∞ L+1 (ρ)L+1 (ρ) n+ n + t τ (n + )!(n + )! n= +1 n = +1 ρt ρτ exp − 1−t − 1−τ 2+1 2+1 = t τ . 2+2 2+2 (1 − t) (1 − τ ) ∞
(5.408)
Nun werden beide Seiten dieser Gleichung mit e−ρ ρ2+2 multipliziert und u ¨ber das Intervall (0, ∞) integriert. Die Integration u ¨ ber die Exponentialfunktionen auf der rechten Seite ist elementar und wir erhalten mithilfe des
202
5 Spezielle Funktionen
binomischen Satzes
∞ ρt ρτ (tτ )2+1 ρ2+2 e−ρ− 1−t − 1−τ dρ 2+2 2+2 (1 − t) (1 − τ ) 0 ∞ (2 + r + 2) (tτ )2+r+1 . = (1 − t − τ − tτ ) r! r= 0
(5.409)
Vergleicht man nun den Koeffizienten von (tτ )n+1 auf der rechten Seite von (5.409) mit jenem auf der linken Seite von (5.408), so erh¨alt man sofort den Ausdruck f¨ ur das Normierungsintegral (5.407). Folglich lauten schließlich die normierten Eigenfunktionen der station¨ aren Zust¨ande des Wasserstoffatoms mithilfe von (5.375), (5.386), (5.388), (5.389) und (5.407) i
Φn,,m (r, ϑ, ϕ, t) = ψn,,m (r, ϑ, ϕ)e− En t ,
En = −
me4 , 22 n
(5.410)
wobei die normierten Zustandsfunktionen ψn,,m (r, ϑ, ϕ) durch folgenden Ausdruck gegeben sind ρ
m ψn,,m (r, ϑ, ϕ) = Nn, e− 2 ρ L2+1 n+ (ρ)Y (ϑ, ϕ) ,
ρ=
2r r0
(5.411)
und die Normierungskonstanten Nn, lauten ! Nn, =
2 na0
3
(n − − 1)! 2n[(n + )!]3
" 12 .
(5.412)
2
Darin ist r0 = na0 , wo a0 = me 2 der Bohrsche Radius des Wasserstoffatoms ist. Schließlich sei darauf hingewiesen, dass die Zust¨ande (5.410) n2 -fach entartet sind.
¨ Ubungsaufgaben 1. Eine leitende Kugel wird in ein homogenes statisches elektrisches Feld eingebettet. Man berechne das elektrostatische Potenzial und die Feldverteilung in der Umgebung der Kugel mit den Randbedingungen, dass im Unendlichen das Feld homogen ist und auf der Kugeloberfl¨ache das Potenzial konstant, Φ(R, ϑ) = V , ist. Es ist zweckm¨aßig die z-Achse zur Polarachse von Kugelkoordinaten zu machen, und das homogene elektrische Feld in die z-Richtung zu orientieren. Man beachte die Rotationssymmetrie um die z-Achse. 2. Am einen Ende einer masselosen Stange der L¨ange R ist eine Masse M montiert. Das andere Ende ist im Ursprung O eines Koordinatensystems fixiert, sodass die Masse frei auf einer Kugel vom Radius R rotieren kann. Man stelle die Schr¨ odinger-Gleichung dieses Rotators auf und finde die Eigenwerte und Eigenfunktionen.
5.6 Die Hermite- und Laguerre-Funktionen
203
3. Man betrachte ein Elektron im Grundzustand des Wasserstoffatoms. Die Zustandsfunktion ψ1,0,0 , welche (5.411) und (5.412) entnommen werden kann, definiert eine Ladungsverteilung ρ(r ) = e|ψ1,0,0 |2 . Man berechne das Potenzial dieser Ladungsverteilung in einem beliebigen Aufpunkt r. 4. Auf einer Kugel vom Radius R ist das Potenzial Φ = A cos ϑ cos ϕ vorgegeben. Man bestimme das Potenzial außerhalb der Kugel mit der Randbedingung Φ → 0 f¨ ur r → ∞. 5. Man berechne die allgemeine L¨ osung der Laplace’schen Differenzialgleichung im Inneren einer Kugel vom Radius R, wenn auf der Kugel das Potenzial Φ(R, ϑ, ϕ) = U (ϑ, ϕ) vorgegeben ist. Zur L¨osung verwendet man das Additionstheorem der Kugelfl¨ achenfunktionen. 6. Betrachte den r¨ aumlichen harmonischen Oszillator in der Quantentheorie. Das Potenzial ist in diesem Fall V = κ2 r2 = κ2 (x2 + y 2 + z 2 ). Die Schr¨ odinger-Gleichung kann sowohl in Kugel- als auch in Kartes’schen Koordinaten gel¨ ost werden. Finde in beiden F¨allen die Eigenfunktionen und Eigenwerte und vergleiche die Resultate. 7. Betrachte die L¨ osung der Laplace’schen Differenzialgleichung in ebenen Polarkoordinaten und wende sie auf die Berechnung des Potenzials eines Zylinderkondensators an. Dieser besteht aus zwei idealisiert unendlich langen konzentrischen Zylindern der Radien R1 und R2 auf denen die Potenziale V1 und V2 herrschen. Betrachte auch den allgemeineren Fall wo V2 = V2 (ϕ) ist. 8. L¨ ose die Laplace’sche Differenzialgleichung innerhalb eines Kreises vom Radius R. Auf dem Kreis herrsche das Potenzial Φ(R, ϕ) = U (ϕ) und innerhalb des Kreises sei die L¨ osung regul¨ ar. 9. Betrachte einen unendlich langen Zylinder vom Radius R, der senkrecht zur Zylinderachse von einer reibungsfreien Fl¨ ussigkeit umstr¨omt wird. Finde das Str¨ omungspotenzial. Im Unendlichen herrsche Parallelstr¨ omung und auf dem Zylinder verschwindet die senkrechte Geschwindigkeitskomponente der Str¨ omung. 10. Der Fluss einer inkompressiblen Fl¨ ussigkeit kann durch ein Potenzial u(r, θ, φ) beschrieben werden derart, dass das Str¨omungsfeld v(r, θ, φ) = −∇u(r, θ, φ) ist. Suche das Potenzial f¨ ur die Str¨omung um eine Kugel mit den Randbedingungen u(r → ∞) = −v0 z = −v0 r cos θ und ∂u ∂r = vr = 0 f¨ ur r = R, wo R der Radius der Kugel, die ihr Zentrum im Ursprung O des Koordinatensystems hat. Das Problem ist rotationssymmetrisch um die z-Achse, daher kann ein vereinfachter Ansatz f¨ ur das Potenzial u R3 gemacht werden. (L¨ osung: u(r, θ) = −v0 (r + 2r 2 ) cos θ). 11. Bestimme das Potenzial im Inneren eines Zylinders vom Radius R und der H¨ ohe a. Auf der Oberfl¨ ache des Zylinders m¨ogen folgende Randbedingungen herrschen Φ(r, ϕ, 0) = Φ(r, ϕ, a) = 0 und Φ(R, ϕ, z) = V . Das Potenzial im Inneren des Zylinders soll regul¨ar sein. 12. L¨ ose die Laplace’sche Differenzialgleichung zwischen zwei unendlich ausgedehnten parallelen Platten, die im Abstand a senkrecht zur z-Achse
204
13.
14.
15.
16.
17.
18.
5 Spezielle Funktionen
stehen. Auf der Platte bei z = 0 herrsche das Potenzial U (r, ϕ) und auf der Platte bei z = a das Potenzial V (r, ϕ). Man finde die Eigenwerte und Eigenfunktionen der Schr¨odinger-Gleichung f¨ ur einen zylindrischen, unendlich hohen Potenzialtopf vom Radius R. Auf der Oberfl¨ ache des Zylinders gilt die Randbedingung ψ(R, ϕ) = 0. Man l¨ ose das zu Beispiel 12 analoge Problem f¨ ur einen Zylinder vom Radius R und der H¨ ohe a mit der Randbedingung dass ψ = 0 ist auf der Oberfl¨ ache des Zylinders. Eine Schallwelle wird an einem unendlich langen Zylinder gestreut. Die in z-Richtung senkrecht zur Zylinderachse einfallende ebene monochromatische Welle zusammen mit der auslaufenden monochromatischen Streuwelle m¨ ussen auf dem Zylinder vom Radius R der Randbedingung ∂Φ(r,ϕ,t) | ugen. Man entwickelt die ebene Welle nach Zylinr=R = 0 gen¨ ∂r derwellen und macht einen Ansatz f¨ ur die Streuwelle nach auslaufenden Zylinderwellen (Hankel-Funktionen 1. Art). Mithilfe der Randbedingungen k¨ onnen die unbekannten Entwicklungskoeffizienten gefunden werden. ¨ Ahnlich geht man vor bei der Streuung von Schallwellen an einer Kugel. Hier ist die einfallende Welle nach Kugelwellen zu entwickeln und die Streuwelle nach auslaufenden Kugelwellen, deren radialer Anteil durch die sph¨ arischen Hankel-Funktionen 1. Art beschrieben wird. F¨ ur r → ∞ kann man dann die Streuamplitude f (ϑ) ablesen. (vgl. das in Abschn. 4.4.4 unter den Beispielen behandelte Streuproblem, insbesondere (4.112)). Finde die Eigenfunktionen und Eigenwerte der Schr¨odinger-Gleichung f¨ ur ein Teilchen in einer Kugel vom Radius R mit der Randbedingung, dass ψ(R, ϑ, ϕ) = 0 ist. Finde die allgemeine L¨ osung der Schr¨ odinger-Gleichung in einem unendlich hohen zylindrischen Potenzialkasten in welchem das Potenzial V = 0 herrscht. Nach einem Separationsansatz der Form ψ(r, θ)e−iEt/ wird man auf die Eigenwertgleichung Δu(r, θ)+ k 2 u(r, θ) = 0 gef¨ uhrt, deren Eigenwerte und Eigenfunktionen aus der Randbedingung u(R, φ) = 0 auf der Oberfl¨ ache des Zylinders vom Radius R zu bestimmen sind. Da die L¨ osung im Inneren des Zylinders regul¨ar sein soll und die Randbedingung rotationssymmetrisch ist, folgen sofort der L¨osungsansatz und die Eigenwertbedingung f¨ ur die zul¨ assigen Teilchenenergien. (L¨osung −iEn t/ A J (k r)e ). ψ(r, t) = ∞ n 0 n n=0
6 Variationsrechnung
6.1 Einleitung Die Variationsrechnung ist eine sehr elegante mathematische Methode zur Formulierung physikalischer Problemstellungen. Sie findet nicht nur Anwendung in der klassischen Newton’schen Mechanik, sondern ist von weitaus gr¨ oßerer Bedeutung f¨ ur die Formulierung von klassischen und quantenmechanischen Feldtheorien und daraus resultierenden Eigenwertproblemen. W¨ ahrend in der elementaren Analysis die Extrema einer differenzierbaren Funktion untersucht werden, wof¨ ur als notwendige Bedingung das Verschwinden der ersten Ableitung einer Funktion f (x) anzusehen ist (siehe Anh. A.1.7), untersucht die Variationsrechnung die Extrema einer Funktionenfunktion oder eines Funktionals. Es werden also die Extrema von Funktionen Φ[y] untersucht, wobei Φ ein ganz bestimmtes Integral u ¨ ber eine gewisse Klasse von Funktionen y¯(x) darstellt und es wird jene Funktion y(x) unter diesen Funktionen gesucht, welche Φ zu einem Extremum macht. Dabei wollen wir uns hier nur mit der Auffindung der notwendigen Bedingung f¨ ur die ¨ Extrema besch¨ aftigen, wobei dann meist aus physikalischen Uberlegungen festgestellt werden kann, ob es sich um ein Maximum, Minimum oder einen station¨ aren Wert von Φ handelt. Die Variationsrechnung ist dabei nur ein bestimmtes Teilgebiet der Funktionalanalysis.
6.2 Die Euler-Gleichung der Variationsrechnung ¨ Ausgangspunkt unserer Uberlegungen ist das folgende einfache Problem. Wir betrachten eine Funktion F [y(x), y (x), x], die in einem bestimmten Gebiet der (x, y)-Ebene definiert sei und dort stetige Ableitungen sowohl nach y als auch nach y und x habe, wobei y (x) = dy(x) dx ist. Wir suchen eine notwendige Bedingung daf¨ ur, dass das folgende Integral ein Extremum oder einen
206
6 Variationsrechnung
Abbildung 6.1. Zur Variationsrechnung
station¨ aren Wert besitzt
x2
Φ[y] =
F [y(x), y (x), x]dx .
(6.1)
x1
Der Integrand F ist dabei eine Funktion der unabh¨angigen Ver¨anderlichen x und der beiden abh¨ angigen Ver¨ anderlichen y(x) und y (x). Wir nehmen an, die Endpunkte der Integration x1 und x2 seien festgehalten und y(x) und y (x) haben demnach dort feste Werte. Der Wert des Integrals Φ[y] wird von der gew¨ ahlten Funktion y¯(x) abh¨ angen, welche die beiden Endpunkte verbindet. Wir nehmen an, wir h¨ atten jene Funktion y(x) gefunden, welche das Integral zu einem Extremum macht und betrachten daneben eine infinitesimal benachbarte Vergleichsfunktion y¯(x) (vgl. Abb. 6.1). Wir definieren dann die beiden Variationen δy(x) = y¯(x) − y(x) ,
δF = F [¯ y (x), y¯ (x), x] − F [y(x), y (x), x] .
(6.2)
Sie stellen die Abweichungen der wahren L¨ osungen von den Vergleichsl¨osungen dar und die entsprechenden Unterschiede in den Argumenten des Integrals. Es ist dabei zu beachten, dass sich die Variation ,,δ“ nicht auf die Koordinate x bezieht. Aus der Definition der Variationen folgt dann, dass δ
d¯ y (x) dy(x) d d dy(x) = − = [¯ y(x) − y(x)] = δy(x) dx dx dx dx dx
(6.3)
ist, wonach die Differenziation mit der Variation vertauscht werden darf. Da y(x) und y¯(x) infinitesimal benachbart sind, folgt dann aus der zweiten
6.2 Die Euler-Gleichung der Variationsrechnung
207
Beziehung in (6.2), dass δF [y, y , x] = F [y + δy, y + δy , x] − F [y, y , x] =
∂F ∂F δy + δy ∂y ∂y
(6.4)
ist. Also sind die formalen Regeln f¨ ur die Berechnung der Variationen dieselben wie jene f¨ ur die Berechnung von Differenzialen. Damit k¨onnen wir nun die Variation der Funktionals Φ[y] in (6.1) berechnen und gelangen damit zu dem Schluss, dass das Funktional Φ[y] station¨ ar wird, wenn x2 F [y(x), y (x), x]dx = 0 (6.5) δΦ[y] = δ x1
ist. Dies bedeutet, dass das Integral f¨ ur die Funktionen y(x) und y(x) + δy(x) denselben Wert hat. Also ist dies ganz analog zum Ergebnis in der elementaren Analysis, dass dy = f (x)dx = 0 wird, wenn die Funktion f (x) ein Extremum hat, wo f (x) = 0 ist. Da wir annehmen, dass die Funktionen y(x) an den Grenzen des Intervalls (x1 , x2 ) nicht variiert werden, k¨onnen wir die Variation mit der Integration vertauschen und erhalten somit wegen der beiden Variationsregeln (6.3) und (6.4) x2 ∂F ∂F d δy + (δy) dx = 0 . (6.6) ∂y ∂y dx x1 In diesem Ausdruck ist es nun zweckm¨ aßig, den zweiten Term unter dem Integralzeichen partiell zu integrieren. Dies ergibt x 2 x2 x2 ∂F d d ∂F ∂F (δy) dx = − δy . (6.7) δydx + ∂y dx dx ∂y ∂y x1 x1 x1 Hier verschwindet aber der ausintegrierte Anteil, da wir angenommen haben, dass in den Endpunkten des Integrationsintervalls (x1 , x2 ) die Variationen δy = 0 sind. Also erhalten wir anstelle (6.6) die Extremalbedingung x2 d ∂F ∂F − δydx = 0 . (6.8) ∂y dx ∂y x1 Obgleich man im allgemeinen aus dieser Bedingung nicht schließen kann, dass daher der Integrand dieses Integrals verschwinden muss, k¨onnen wir dies dennoch unter Vorbehalten tun und gelangen damit zur Euler’schen Differenzialgleichung der Variationsrechnung d ∂F ∂F − =0. ∂y dx ∂y
(6.9)
Die obige Schlussweise ist deshalb erlaubt, da die Bedingung (6.8) auch dann gilt, wenn der Integrand mit einer infinitesimal kleinen, doch sonst beliebigen Funktion δy(x) multipliziert ist. Denn wenn die linke Seite von (6.9) nicht
208
6 Variationsrechnung
f¨ ur alle Werte von x verschwinden w¨ urde, m¨ usste sie f¨ ur ein stets positives δy f¨ ur einzelne Teile des Integrationsintervalls positiv und f¨ ur andere negativ sein, damit das Integral (6.8) gleich Null wird. Wir k¨onnten dann aber das Vorzeichen von δy stets so w¨ ahlen, dass der Integrand von (6.8) stets positiv ist und damit w¨ urde das Integral nicht verschwinden, entgegen unserer Voraussetzung. Eine Funktion y(x), welche der Euler’schen Differenzialgleichung gen¨ ugt, nennt man eine ,,Extremale“. Welche von diesen Extremalen das, in den meisten F¨ allen, gesuchte Minimum des Funktionals Φ[y] liefert, ¨ ist aus physikalischen Uberlegungen festzustellen, wenn ein solches Minimum u ¨berhaupt existiert. Die Euler’sche Gleichung k¨onnen wir auch in folgende ¨aquivalente Form transformieren d ∂F ∂F − =0. (6.10) F −y ∂x dx ∂y ¨ Die Aquivalenz k¨ onnen wir leicht durch explizites Ausdifferenzieren des Ausdrucks in der eckigen Klammer nachweisen, denn wir erhalten d ∂F ∂F ∂F ∂F d ∂F ∂F ∂F ∂F − − − y − y + y + y = F −y ∂x dx ∂y ∂x ∂x ∂y ∂y ∂y dx ∂y d ∂F ∂F − = −y =0, (6.11) ∂y dx ∂y wobei vorauszusetzen ist, dass y (x) = 0 ist. Die zweite Form (6.10) der EulerGleichung eignet sich besonders dann, wenn die Funktion F (y, y ) nicht explizit von x abh¨ angt. Es sei noch bemerkt, dass bei unserer Wahl der Funktion F (y, y , x) die resultierende Euler-Gleichung eine Differenzialgleichung zweiter Ordnung ist, also keine h¨ oheren Ableitungen als y enth¨alt. Da aber die meisten in der Physik auftretenden gew¨ ohnlichen und partiellen Differenzialgleichungen von zweiter Ordnung sind, ist unsere Wahl der Funktion F nahe ¨ liegend. Dies gilt auch f¨ ur unsere sp¨ ateren Uberlegungen, bei denen wir Variationsprobleme mit mehreren abh¨ angigen Ver¨anderlichen sowie Probleme, die auf partielle Differenzialgleichungen f¨ uhren, betrachten werden. Beispiele 1. Die geod¨atische Linie: Auf einer beliebig gekr¨ ummten Fl¨ache nennt man die k¨ urzeste Verbindung zweier Punkte eine geod¨atische Linie. Auf einer Kugel ist sie ein St¨ uck eines Großkreises als Schnittlinie einer Ebene mit der Kugel durch ihren Mittelpunkt. Im gekr¨ ummten Raum der allgemeinen Relativit¨ atstheorie spielen diese geod¨ atischen Linien eine wichtige Rolle. In der Euklid’schen Geometrie betrachten wir es als selbstverst¨andlich, dass die k¨ urzeste Verbindung zweier Punkte eine Gerade ist. Wir wollen diese Extremale mit der Variationsrechnung auffinden. Wir betrachten dazu in der (x, y)-Ebene zwischen zwei Punkten P1 und P2 ein beliebiges, stetig differenzierbares Kurvenst¨ uck y(x) (vgl. Abb. 6.2). Das infinitesimale Linienelement
6.2 Die Euler-Gleichung der Variationsrechnung
209
Abbildung 6.2. Zur geod¨ atischen Linie
dieser Kurve ist dann ds = dx2 + dy 2 = 1 + y 2 (x)dx. Daher lautet die Bedingung f¨ ur ein Extremum der Kurve P2 x2 δΦ[y] = δ ds = δ 1 + y 2 (x)dx (6.12) P1
x1
und daher ist gem¨ aß (6.9) die Euler’sche Gleichung dieses Problems ∂ d 2 (x) = 0 , 1 + y dx ∂y
(6.13)
deren elementare Integration ergibt y (x) =C . 1 + y 2 (x)
(6.14)
Nach Quadrieren dieser Gleichung erhalten wir y 2 (x) = C 2 [1 + y 2 (x)] oder C2 y 2 (x) = 1−C 2 . Also ist y (x) = const. Folglich ist die gesuchte Extremale y(x) = cx+d, wo die Konstanten c und d den Koordinaten der Punkte P1 und P2 anzupassen sind. Die Variationsrechnung best¨atigt also, dass die minimale Verbindung zweier Punkte in der Ebene durch eine Gerade gegeben ist. 2. Die Brachystochrone Dieses Problem war historisch f¨ ur die Entwicklung der Variationsrechnung von Bedeutung. Es behandelt die Frage welche Kurve gew¨ ahlt werden muss, damit ein Massenpunkt reibungsfrei l¨angs einer Kurve von einem h¨ oheren Punkt A nach einem tieferen Punkt B unter der Einwirkung der Gravitation in k¨ urzester Zeit gelangt. Wir lassen den Punkt A mit dem Ursprung des Koordinatensystems zusammenfallen, w¨ahlen die x-Achse
210
6 Variationsrechnung
Abbildung 6.3. Die Brachystochrone
nach abw¨ arts orientiert und die y-Achse nach rechts. Der Endpunkt B habe die Koordinaten (x1 , y1 ) (vgl. Abb. 6.3). Die potenzielle Energie des K¨orpers der Masse m werde vom Punkt A ausgehend gemessen. Daher sind dann zur Zeit t = 0 die kinetische Energie als auch die potenzielle Energie des K¨orpers gleich Null. Zu einem sp¨ ateren Zeitpunkt, wenn die Masse ein St¨ uck die Kurve C hinuntergeglitten ist, hat dieser K¨ orper dann die potenzielle Energie mgx, wo g die Konstante der Erdbeschleunigung bezeichnet, und die kinetische Energie 12 mv 2 , wo v die augenblickliche Geschwindigkeit des K¨orpers ist. Wegen des Energieerhaltungssatzes muss daher gelten 1 mv 2 = mgx . 2 Da v =
ds dt
und ds =
(6.15)
1 + y 2 (x)dx ist, erhalten wir die Gleichung v=
ds = dt
1 + y 2 (x)dx = 2gx dt
(6.16)
und aus dieser Beziehung finden wir durch Aufl¨osung nach dt das Variationsproblem x1 / T 1 + y 2 (x) dx = 0 . (6.17) dt = δ δΦ[y] = δ 2g x 0 0 Da dieses Integral nicht von y(x) abh¨ angt, lautet die entsprechende EulerGleichung d ∂F y (x) d = =0, (6.18) dx ∂y dx x[1 + y 2 (x)]
6.3 Variationsproblem mit mehreren abh¨ angigen Ver¨ anderlichen
welche sogleich einmal integriert werden kann, sodass / y 2 (x) Cx = C , y (x) = x[1 + y 2 (x)] 1 − Cx
211
(6.19)
ist, wo C eine Integrationskonstante darstellt. Die zweite Integration k¨onnen wir in folgender Weise ausf¨ uhren. Wir setzen Cx = ξ und f¨ uhren mit ξ = sin2 θ2 die neue Variable θ ein. Dann ist 1−ξ = cos2 θ2 und dξ = 2 sin θ2 cos θ2 d θ2 und folglich liefert die zweite Integration ' 1 ξ θ 1 y−C = dξ = sin2 dθ C 1−ξ C 2 1 1 = (θ − sin θ) . (6.20) (1 − cos θ)dθ = 2C 2C Nun setzen wir C1 = 2a und erhalten folgende Parameterdarstellung der ,,Brachystochrone“ y = a(θ − sin θ) + C ,
x=
ξ = a(1 − cos θ) . C
(6.21)
Dies ist aber die Parameterdarstellung einer Zykloide. Wir erhalten eine anschauliche Darstellung dieser Zykloide, wenn ein Massenpunkt auf einem Kreis vom Radius a betrachtet wird, w¨ ahrend der Kreis l¨angs der y-Achse abrollt. Damit der Massenpunkt f¨ ur θ = 0 die Koordinaten x = y = 0 hat, muss offenbar die Konstante C = 0 sein. Der Radius a des abrollenden Kreises muss so gew¨ ahlt werden, dass die Zykloide durch den Punkt B mit den Koordinaten x1 , x2 hindurchgeht.
6.3 Variationsproblem mit mehreren abh¨ angigen Ver¨ anderlichen Das bisher betrachtete Variationsproblem l¨ asst sich in mehrerer Hinsicht verallgemeinern. In diesem Abschnitt wollen wir den Fall betrachten, bei dem die Funktion F von einer unabh¨ angigen Ver¨anderlichen x und mehreren abh¨ angigen Ver¨ anderlichen yi (x), i = 1, 2, 3, · · · n und ihren ersten Ableitungen nach x abh¨ angt. Wir betrachten also das Variationsproblem x2 δΦ[y1 , y2 , · · · yn ] = δ F [y1 (x), · · · yn (x); y1 (x), · · · yn (x); x]dx = 0 . x1
(6.22) Da wir wiederum annehmen wollen, dass die Variationen δy1 , δy2 , · · · δyn in den Endpunkten des Integrationsintervalls (x1 , x2 ) verschwinden, haben wir
212
6 Variationsrechnung
die Variation unter dem Integralzeichen auszuf¨ uhren und erhalten auf diese Weise n n ∂F ∂F δyi + (6.23) δF = δyi . ∂y ∂y i i i=1 i=1 Setzen wir dies in das Integral (6.22) ein und integrieren den zweiten Term von (6.23) partiell, so erhalten wir als eine Verallgemeinerung von (6.6) und (6.7) n x 2 x2 n ∂F ∂F d ∂F δyi dx + − δyi =0. (6.24) ∂yi dx ∂yi ∂yi x1 i=1 i=1 x1
Da aber angenommen wurde, dass die Variationen in den Endpunkten des Integrationsintervalls verschwinden, f¨ allt der ausintegrierte Anteil in der letzten Gleichung weg und da im ersten Term dieser Gleichung die Variationen unter dem Integralzeichen beliebig sind, k¨ onnen wir z.B. annehmen, dass eine der Variationen δyi = 0 ist und alle anderen verschwinden. Daher k¨onnen wir genau wie im elementaren Fall in Abschn. 6.2 schließen, dass der entsprechende Ausdruck in den eckigen Klammern gleich Null sein muss und wir erhalten auf diese Weise das System von Euler-Gleichungen d ∂F ∂F − =0, ∂yi dx ∂yi
i = 1, 2, 3, · · · n .
(6.25)
Beispiel Das Hamilton’sche Prinzip der kleinsten Wirkung: In der Mechanik der Massenpunkte wird gezeigt, dass sich die Bewegungsgleichungen eines beliebigen mechanischen Systems am elegantesten aus einem Variationsproblem herleiten lassen. Dies ist das Hamilton’sche Prinzip. Es besagt, dass die Wirkung eines mechanischen Systems ein Minimum sein muss. Zur Formulierung des Hamilton’schen Prinzips beschreiben wir ein mechanisches System von f Freiheitsgraden durch f verallgemeinerte Koordinaten q1 , q2 , · · · qf und verallgemeinerte Geschwindigkeiten q˙1 , q˙2 , · · · q˙f , wo der Punkt die Ableitung nach der Zeit bedeutet. Dann definieren wir die Lagrange-Funktion L durch den Ausdruck (6.26) L(qk , q˙k ) = T (qk , q˙k ) − V (qk ) . Dabei ist T die kinetische Energie und V die potenzielle Energie des Systems von Massenpunkten ausgedr¨ uckt in verallgemeinerten Koordinaten qk und Geschwindigkeiten q˙k . Das Hamilton’sche Prinzip besagt nun, dass t2 δW [qk ] = δ L(qk , q˙k )dt = 0 (6.27) t1
sein muss, wobei W die Wirkung des mechanischen Systems genannt wird. Nimmt man an, dass die Variationen δqk in den Endpunkten des Integrations-
6.4 Variationsproblem mit mehreren unabh¨ angigen Ver¨ anderlichen
213
intervalls (t1 , t2 ) verschwinden, so liefert die Variation in (6.27) die folgenden Euler-Lagrange’schen Bewegungsgleichungen ∂L(qk , q˙k ) d ∂L(qk , q˙k ) − =0. ∂qi dqi ∂ q˙i
(6.28)
Um zu zeigen, dass wir solcherart in Kartes’schen Koordinaten f¨ ur einen einzelnen Massenpunkt auf die elementaren Newton’schen Bewegungsgleichungen gef¨ uhrt werden, haben wir zun¨ achst f¨ ur diesen Fall die LangrangeFunktion anzugeben, n¨ amlich m 2 x˙ − V (xk ) . 2 i=1 i 3
L(xk , x˙ k ) =
(6.29)
Daraus ergeben sich die Euler-Lagrange-Gleichungen −
∂V (xk ) − m¨ xi = 0 ∂xi
(6.30)
¨ in Ubereinstimmung mit den Newton’schen Bewegungsgleichungen.
6.4 Variationsproblem mit mehreren unabh¨ angigen Ver¨ anderlichen Dieser Fall ist besonders interessant, wenn wir feldtheoretische Probleme mithilfe der Variationsrechnung behandeln wollen. Wir betrachten nur den Fall einer skalaren Feldfunktion ψ(x, y, z, t), die von den Koordinaten und der Zeit abh¨ angt und untersuchen das Variationsproblem x2 ,y2 ,z2 t2 F [ψ, ψx , ψy , ψz , ψt ; x, y, z, t]dvdt = 0 , (6.31) δΦ[ψ] = δ x1 ,y1 ,z1
t1
wo ψx = ∂ψ ∂x etc. bedeutet. Wenn wir wieder annehmen, dass die Endpunkte der Integration nicht variiert werden, liefert die Ausf¨ uhrung der Variation δF =
∂F ∂F ∂F ∂F ∂F δψ + δψx + δψy + δψz + δψt ∂ψ ∂ψx ∂ψy ∂ψz ∂ψt
(6.32)
und wenn wir dies in das Integral (6.31) einsetzen, k¨onnen wir wieder die letzten vier Terme partiell integrieren und erhalten damit bei Integration u ¨ber das Volumen V und die Zeit T ∂F ∂ ∂F ∂ ∂F ∂ ∂F ∂ ∂F − − − − δψ dvdt ∂ψ ∂x ∂ψx ∂y ∂ψy ∂z ∂ψz ∂t ∂ψt V,T (6.33) ∂F ∂F ∂F ∂F + + + + =0 δψ ∂ψx ∂ψy ∂ψz ∂ψt V,T
214
6 Variationsrechnung
und sobald wir wieder annehmen, dass die Variationen auf der Oberfl¨ache des Volumens V und in den Endpunkten des Zeitintervalls T verschwinden, wird der ausintegrierte Anteil in (6.33) gleich Null sein und es ergibt sich dann aus dem restlichen Integral die folgende Euler’sche Gleichung ∂ ∂F ∂F ∂ ∂F ∂ ∂F ∂ ∂F − − − − =0. ∂ψ ∂x ∂ψx ∂y ∂ψy ∂z ∂ψz ∂t ∂ψt
(6.34)
Beispiele 1. Die Laplace’sche Differenzialgleichung: Wie wir am Ende von Abschn.1.4.3 unter den Beispielen diskutiert haben, l¨ asst sich das elektrostatische Feld aus einem Potenzial herleiten, n¨ amlich E = −∇Φ. In der Elektrostatik wird gezeigt, dass die gesamte elektrische Feldenergie durch folgenden Ausdruck bestimmt ist 1 1 2 E dv = (∇Φ)2 dv W = 8π V 8π V ! 2 2 2 " ∂Φ ∂Φ ∂Φ 1 = + + dv . (6.35) 8π V ∂x ∂y ∂z Wenn wir uns daher die Frage stellen, ob die elektrostatische Feldenergie im Volumen V ein Extremum hat und die Variation δW = 0 betrachten, so erhalten wir gem¨ aß (6.34) mit F = (∇Φ)2 gesetzt als entsprechende EulerGleichung ΔΦ(x, y, z) = 0 (6.36) also die Laplace’sche Differenzialgleichung. 2. Das Hamilton-Prinzip im Kontinuum: Anhand des Beispiels eines schwingenden elastischen Mediums zeigen wir, wie das Hamilton’sche Prinzip auf Probleme kontinuierlicher Medien angewandt werden kann. Dazu betrachten wir eine Kette von n Massenpunkten oder Atomen der identischen Massen m, die in gleichen Abst¨ anden a durch gewichtslose Federn miteinander elastisch verkn¨ upft sind. Diese Kette sei in den Endpunkten bei x = 0 und x = L festgehalten und die einzelnen Massen seien geringf¨ ugig aus ihren Ruhelagen ausgelenkt. Diese Auslenkungen wollen wir mit ψi , i = 1, 2, · · · n bezeichnen. (vgl. Abb. 6.4). Die einzelnen Massenpunkte gen¨ ugen dann der Bewegungsgleichung eines harmonischen Oszillators mψ¨i = −κ(2ψi − ψi+1 − ψi−1 ) ,
(6.37)
wo ψi − ψi+1 die relative Auslenkung benachbarter Massenpunkte ist und κ die Konstante der r¨ ucktreibenden Kraft in Analogie zur Bewegungsgleichung eines einzelnen harmonischen Oszillators, der in Abschn. 5.6.1 (5.333) betrachtet wurde. Wir erhalten also eine Kette von gekoppelten linearen harmonischen Oszillatoren. Die potenzielle und kinetische Energie dieser Oszillatoren k¨ onnen wir leicht angeben und damit die Lagrange-Funktion des
6.4 Variationsproblem mit mehreren unabh¨ angigen Ver¨ anderlichen
215
Abbildung 6.4. Oszillationen einer Kette gekoppelter Atome
gekoppelten Systems von Massenpunkten 1 ˙2 L(ψk , ψ˙ k ) = [mψi − κ(ψi+1 − ψi )2 ] . 2 i= 1 n
(6.38)
¨ Nun machen wir den Ubergang zu einer kontinuierlichen Massenverteilung. Dazu dr¨ ucken wir die Lagrange-Funktion in folgender Weise aus !
2 " n ψi+1 − ψi 1 m ˙2 L=a ψ − κa Λi , Λi = (6.39) 2 a i a i=1 und lassen n → ∞ gehen und gleichzeitig a → 0 streben. Dann k¨onnen wir folgende Substitutionen machen L n ψi+1 − ψi ∂ψ(x) m → ρ , κa → E , → . (6.40) a→ dx , a a ∂x 0 i=1 Dabei ist ρ die lineare Massendichte, d. h. die Masse pro L¨angeneinheit, und wir k¨ onnen E als den Young’schen Elastizit¨ atsmodul betrachten. Dann lautet in diesem Limes das Hamilton’sche Prinzip des elastischen Mediums T L T ˙ t)]dxdt = 0 , Ldt = δ Λ[ψx (x, t), ψ(x, (6.41) δW = δ 0
0
0
wo Λ die Lagrange’sche Dichte des kontinuierlichen Mediums darstellt. Nach Durchf¨ uhrung des obigen Grenz¨ uberganges ist diese Dichte durch folgenden Ausdruck gegeben ˙ t)] = 1 [ρψ˙ 2 (x, t) − Eψ 2 (x, t)] Λ[ψx (x, t), ψ(x, x 2
(6.42)
und diese Funktion sieht der Lagrange-Funktion eines gew¨ohnlichen linearen harmonischen Oszillators sehr ¨ ahnlich. Bei der Ausf¨ uhrung der Variation in (6.41) haben wir wieder zu beachten, dass die Variationen in den Endpunkten des Raum- und Zeitintervalls verschwinden sollen. Dann liefert die Ausf¨ uhrung der Variationen ˙ ψ˙ − Eψx δψx . δΛ = ρψδ
(6.43)
216
6 Variationsrechnung
Setzen wir dies in das Integral (6.41) ein und machen dann eine partielle Integration in Bezug auf t und x, so erhalten wir
T
L
¨ t) − Eψxx (x, t)]δψ}dxdt = 0 , {[ρψ(x, 0
(6.44)
0
da der ausintegrierte Anteil verschwindet. Da in dieser Gleichung δψ beliebig ist, k¨ onnen wir wieder schließen, dass die longitudinalen Wellen im elastischen Medium der d’Alembert’schen Wellengleichung gen¨ ugen, welche die Euler-Lagrange-Gleichung des betrachteten Hamilton-Prinzips im Kontinuum darstellt. Wir erhalten ' E 1 ∂ 2 ψ(x, t) ∂ 2 ψ(x, t) , (6.45) − 2 =0, v= ∂x2 v ∂t2 ρ wo v die Phasengeschwindigkeit im elastischen Medium darstellt. Die Anwendungsm¨ oglichkeiten des Hamilton’schen Prinzips auf Kontinua geht weit u ¨ber das hier betrachtete Beispiel hinaus. So k¨onnen die Maxwell’schen Gleichungen der Elektrodynamik aus einem Variationsprinzip hergeleitet werden und die Quantenfeldtheorien der Elementarteilchenphysik gehen von solchen Variationsprinzipien aus.
6.5 Die isoperimetrischen Probleme Bei diesen Problemen handelt es sich um die L¨osung von Variationsaufgaben, bei denen die Extremalen eines Funktionals Φ gesucht werden, wenn gleichzeitig gewisse Nebenbedingungen zu erf¨ ullen sind. Historisch war eines der ersten Probleme dieser Art, jene geschlossene ebene Kurve zu finden, die bei gegebenem Umfang den gr¨ oßten Fl¨ acheninhalt besitzt. Seither werden solche Variationsaufgaben mit Nebenbedingungen ,,isoperimetrische Probleme“ genannt. In der elementaren Analysis wird bei der Untersuchung der Maxima und Minima von Funktionen mehrerer Ver¨anderlicher gezeigt, wie die Auffindung der Extrema solcher Funktionen bei der Vorgabe von Nebenbedingungen elegant mithilfe der Methode der Lagrange’schen Multiplikatoren gel¨ ost werden kann. Wir demonstrieren das Verfahren an einem einfachen Beispiel. Gegeben sei eine Funktion f (x, y). Wenn wir ihre Extrema aufsuchen, ohne dass Nebenbedingungen vorliegen, haben wir ∂f ∂x = fx = 0 und ∂f = f = 0 unabh¨ a ngig voneinander zu betrachten. Wenn hingegen eine y ∂y Nebenbedingung von der Form g(x, y) = C vorliegt, m¨ ussen wir anders vorgehen. Dazu betrachten wir, wann das Differenzial df = fx dx + fy dy = 0 ist. W¨ aren dx und dy unabh¨ angig voneinander, so k¨onnten wir wie oben auf fx = 0 und fy = 0 schließen. Doch nun ist wegen der Nebenbedingung dg = gx dx + gy dy = 0 und daher sind die Differenziale dx und dy nicht mehr f voneinander linear unabh¨ angig. Vielmehr ist nun fgxx = gyy . Wenn wir dieses
6.5 Die isoperimetrischen Probleme
217
Verh¨ altnis mit λ bezeichnen, erhalten wir die Gleichungen fx − λgx = 0 ,
fy − λgy = 0 .
(6.46)
Dies w¨ aren aber genau jene Gleichungen, die wir erhalten w¨ urden, wenn wir die Extrema von f − λg aufsuchten, ohne dass eine Nebenbedingung vorliegt und λ eine beliebige Konstante ist. Man nennt diese Konstante λ einen ,,Lagrange-Multiplikator“. Die L¨ osungen werden dann nat¨ urlich von λ abh¨ angen und der Multiplikator wird so zu w¨ ahlen sein, dass g(x, y) den Wert C annimmt. Dieses Verfahren l¨ asst sich auf Funktionen mit beliebig vielen Ver¨ anderlichen und Nebenbedingungen verallgemeinern und kann auch bei den vorliegenden Variationsproblemen zur Anwendung kommen. 6.5.1 Isoperimetrische Probleme mit mehreren abh¨ angigen Ver¨ anderlichen Wir beginnen mit dem Variationsproblem (6.22), das wir nochmals anschreiben x2 δΦ[y1 , y2 , · · · yn ] = δ F [y1 (x), · · · yn (x); y1 (x), · · · yn (x); x]dx = 0 , x1
(6.47) doch sollen nun die folgenden Nebenbedingungen erf¨ ullt sein x2 Gi [y1 (x), · · · yn (x); y1 (x), · · · yn (x); x]dx = Ci , i = 1, 2, · · · . (6.48) x1
Wir ber¨ ucksichtigen diese Nebenbedingungen mithilfe der Methode der Lagrange-Multiplikatoren. Dazu betrachten wir eine neue zu variierende Funktion H, die durch folgenden Ausdruck gegeben ist H[yk , yk ; x] = F [yk , yk ; x] +
λi Gi [yk , yk ; x]
(6.49)
i= 1
und deren Variation lautet δH =
n ∂H r=1
∂H δyr + δyr ∂yr ∂yr
.
(6.50)
Setzt man dies anstelle δF in (6.47) ein und f¨ uhrt im zweiten Term der Summe von (6.50) die gewohnte partielle Integration durch, so erhalten wir anstelle (6.24) n x 2 x 2 n ∂H ∂H d ∂H − δy =0. (6.51) δyr dx + ∂yr dx ∂yr ∂yr r x1 r=1 r=1 x1
218
6 Variationsrechnung
Der ausintegrierte Anteil wird wieder gleich Null sein, wenn wir weiterhin annehmen, dass die Variationen in den Endpunkten des Integrationsintervalls verschwinden. Da jetzt wegen der Nebenbedingungen (6.48), wie oben im elementaren Fall diskutiert, die einzelnen Variationen δyr nicht mehr voneinander linear unabh¨ angig sind, werden nun die einzelnen Terme in den eckigen Klammern unter dem Integralzeichen nur dann jeder f¨ ur sich einzeln gleich Null sein, wenn die Lagrange-Multiplikatoren geeignet gew¨ahlt werden. Wir erhalten somit als die Euler-Gleichungen des Variationsproblems ∂H(yk , yk ; x) d ∂H(yk , yk ; x) − =0. ∂yi dx ∂yi
(6.52)
Durch die Nebenbedingungen wird die Zahl der Freiheitsgrade des betrachteten physikalischen Problems eingeschr¨ ankt. Rein formal lassen sich die Lagrange-Multiplikatoren mithilfe der Nebenbedingungen (6.48) eliminieren, doch ihre anschauliche Bedeutung und ihre Werte lassen sich meist im Laufe der Losungen der Euler’schen Gleichungen finden. Beispiele 1. Das klassische Isoperimetrische Problem: Wir betrachten eine geschlossene ebene Kurve C, die den Umfang U hat und die Fl¨ache F umschließt. Gefragt ist nach der maximalen Fl¨ ache F bei gegebenem Umfang U . Wir legen den Koordinatenursprung in die Fl¨ ache F und f¨ uhren ebene Polarkoordinaten (r, ϕ) ein. Dann ist, wie in der Abbildung 6.5 gezeigt, ein infinitesimales Fl¨ achenelement durch den Ausdruck gegeben df =
1 2 r (ϕ)dϕ 2
und somit die gesamte Fl¨ ache F gleich 1 2π 2 F = r (ϕ)dϕ . 2 0
(6.53)
(6.54)
Das ebene Linienelement l¨ angs der Kurve C l¨ asst sich aus dem abgebildeten kleinen, nahezu rechtwinkligen Dreieck berechnen. Wir erhalten 2 + r2 )dϕ2 , ds2 = dr2 + r2 dϕ2 = (rϕ
wo rϕ =
dr dϕ
(6.55)
ist. Daher erhalten wir f¨ ur den gesamten Umfang der Kurve C U=
2π
* 2 + r2 dϕ rϕ
(6.56)
0
und somit lautet unser Variationsproblem ⎧ ⎫ '
2 ⎬ 2π ⎨ dr(ϕ) 1 2 r (ϕ) + λ r2 (ϕ) + δ[F + λU ] = δ dϕ . ⎩ ⎭ 2 dϕ 0
(6.57)
6.5 Die isoperimetrischen Probleme
219
Abbildung 6.5. Das isoperimetrische Problem
Wenn wir annehmen, dass in den Endpunkten des Integrationsintervalls (0,2π) die Variation δr = 0 ist, so lautet die Euler-Gleichung des Variationsproblems d λr(ϕ) λr(ϕ) * − =0. r(ϕ) + * dϕ 2 2 2 2 (ϕ) r (ϕ) + rϕ (ϕ) r (ϕ) + rϕ
(6.58)
Wenn wir in dieser Gleichung den letzten Term ausdifferenzieren, k¨onnen wir die Gleichung durch λr(ϕ) dividieren und erhalten 2 rrϕϕ − 2rϕ − r2 1 = . 3 λ 2 2 r2 + rϕ
(6.59)
In Abschn. 1.3.1 haben wir im Beispiel (1) gezeigt, dass ρ1 = dθ ds die Kr¨ ummung einer Kurve in einem beliebigen Punkt ist, wo ds das infinitesimale Linienelement der Kurve und dθ der Winkel zwischen benachbarten dy = tan θ die Steigung der Kurve in eiTangentenvektoren. Doch es ist dx nem Punkt und ds2 = dx2 + dy 2 das Quadrat des entsprechenden Linienelements. Wir berechnen aus der Umkehrfunktion des Tangens und mit ds = 1 + y 2 (x)dx dθ y (x) = , dx 1 + y 2 (x)
1 dθ y (x) = = 3 . ρ ds [1 + y 2 (x)] 2
(6.60)
Wenn man jetzt in der zweiten Gleichung von (6.60) ebene Polarkoordinaten (r, ϕ) einf¨ uhrt und ϕ als die unabh¨ angige Ver¨ anderliche betrachtet, so geht diese Gleichung genau in die Gleichung (6.59) u ¨ ber. Demnach ist ρ = λ und da λ = const. ist, hat die gefundene Extremale konstante Kr¨ ummung, d. h. sie ist ein Kreis vom Radius R = λ. Das Resultat dieses isoperimetrischen Problems ist auch intuitiv einzusehen.
220
6 Variationsrechnung
2. Das Sturm-Liouville’sche Eigenwertproblem: Die Sturm-Liouville’sche Differenzialgleichung von Abschn. 3.5 (3.88) k¨ onnen wir aus folgendem Variationsproblem herleiten b δΦ[y] = δ [p(x)y 2 (x) + q(x)y 2 (x)]dx = 0 (6.61) a
mit der Nebenbedingung, dass die gesuchten L¨osungen im Intervall (a, b) quadratisch integrabel sein sollen, d. h. b r(x)y 2 (x)dx = C . (6.62) a
Daher haben wir den Ausdruck zu variieren H = p(x)y 2 (x) + q(x)y 2 (x) − λr(x)y 2 (x)
(6.63)
und diese Variation ergibt δH = 2[q(x) − λr(x)]y(x)δy(x) + 2p(x)y (x)δy (x) .
(6.64)
Beim Einsetzen in (6.61) und nach partieller Integration finden wir wegen der Randbedingungen des Sturm-Liouville-Problems b d [p(x)y (x)] δy(x)dx = 0 . (6.65) [q(x) − λr(x)]y(x)]y(x) − dx a Folglich muss der Ausdruck in der geschlungenen Klammer in diesem Integral gleich Null sein, da ja δy(x), laut Voraussetzung, beliebig ist. Bei diesem Problem hat also der Lagrange-Multiplikator die Bedeutung des Eigenwertparameters. 6.5.2 Isoperimetrische Probleme mit mehreren unabh¨ angigen Ver¨ anderlichen Wir betrachten nochmals das Variationsproblem (6.31) x2 ,y2 ,z2 t2 δΦ[ψ] = δ F [ψ, ψx , ψy , ψz , ψt ; x, y, z, t]dvdt = 0 , x1 ,y1 ,z1
jedoch mit der Nebenbedingung x2 ,y2 ,z2 t2 G[ψ, ψx , ψy , ψz , ψt ; x, y, z, t]dvdt = C . x1 ,y1 ,z1
(6.66)
t1
(6.67)
t1
Jetzt haben wir die Funktion H = F + λG zu variieren und finden nach Einsetzen in das entsprechende Integral und partieller Integration unter denselben Bedingungen wie oben die Euler-Gleichung ∂H ∂ ∂H ∂ ∂H ∂ ∂H ∂ ∂H − − − − =0. ∂ψ ∂x ∂ψx ∂y ∂ψy ∂z ∂ψz ∂t ∂ψt
(6.68)
6.5 Die isoperimetrischen Probleme
221
Beispiel Die Schr¨odinger-Gleichung Wir leiten die Schr¨odinger-Gleichung der station¨ aren Zust¨ ande aus einem Variationsprinzip ab. In vielen F¨allen ist es erlaubt, die Wellenfunktion ψ(x, y, z) als reell anzunehmen. Wir betrachten die Variation des Funktionals 2 2 2 (∇ψ) + V (x, y, z)ψ dv = 0 δΦ[ψ] = δ (6.69) V →∞ 2m mit der Nebenbedingung ψ 2 (x, y, z)dv = C .
(6.70)
V →∞
Wir haben zu variieren δH = 2[V − λ]ψδψ + 2
2 ∇ψδ∇ψ 2m
(6.71)
und erhalten nach dem Einsetzen dieses Ergebnisses in (6.69) und partieller Integration unter Ber¨ ucksichtigung der Randbedingungen im Unendlichen 2 Δψ δψdv = 0 , (6.72) [V − λ]ψ − 2m V →∞ woraus die Schr¨ odinger-Gleichung folgt. Der Lagrange-Multiplikator hat hier die Bedeutung des Eigenwertparameters der Energie (vgl. Abschn. 5.6.2). ¨ Ubungsaufgaben 1. Zwischen zwei horizontal gelegenen Punkten A und B, die sich im Abstand L voneinander befinden, ist locker ein Seil der Massendichte μ und der L¨ ange gespannt. Man bestimme aus dem Extremum der potenziellen Energie des Seils im Gravitationsfeld der Erde mit der Nebenbedingung, dass die L¨ ange des Seils vorgegeben ist, die Form der Seilkurve. 2. Man betrachte ein ebenes Pendel der Pendell¨ange und der Masse m, das vom Ursprung O eines Koordinatensystems herabh¨angt und in Bezug auf die Vertikale die Auslenkung ϕ hat. Man bestimme die kinetische und potenzielle Energie des Pendels in ebenen Polarkoordinaten, schreibe die Lagrange-Funktion an und bestimme die Euler-Lagrange’sche Bewegungsgleichung des Pendels. 3. In der (x, y)-Ebene hat ein Punkt P von der x-Achse den Abstand R1 und ein Punkt Q den Abstand R2 . Beide Punkte sind durch eine Kurve C verbunden. Nun lasse man dieses Gebilde um die x-Achse rotieren, sodass eine geschlossene Rotationsfl¨ ache entsteht. Man bestimme die Rotationsfl¨ ache mit der minimalen Oberfl¨ ache.
222
6 Variationsrechnung
4. Betrachte nochmals das Problem der Brachystochrone und zeige, dass die Zeit die von einem Teilchen ben¨ otigt wird, um reibungsfrei vom Anfangs* punkt A zum Endpunkt B zu gelangen gleich T = π2 ag ist, wobei dieser Wert unabh¨ angig von den Anfangskoordinaten ist. 5. Gegeben sei eine geschlossene r¨ aumliche H¨ ulle von gegebener Fl¨ache F , die ein Volumen V umschließt. Finde die Form der H¨ ulle, die bei gegebenem F das gr¨ oßte Volumen umschließt. 6. Berechne die Ausmaße jenes Parallelepipeds von maximalem Volumen, das (a) von einer Kugel vom Radius R umschrieben wird und (b) von einem Ellipsoid mit den Halbachsen a, b und c. 7. Bestimme das Verh¨ altnis von Radius R und H¨ohe H eines Zylinders von vorgegebenem Volumen V derart, dass die Oberfl¨ache F am kleinsten ist. 8. Gegeben sei die Funktion F = (∇ψ)2 . Man suche im gegebenen Volumen V das Extremum von F und damit die resultierende Euler-Gleichung mit der Nebenbedingung, dass die Funktion ψ(x, y, z) quadratisch integrabel sein soll. 9. Gegeben sei die Lagrange-Dichte Λ = 12 [φ˙ 2 −(∇φ)2 −m2 φ2 ], wo φ(x, y, z, t) eine Feldfunktion ist. Man finde die zugeh¨orige Feldgleichung mithilfe des Hamilton’schen Prinzips.
7 Theorie komplexer Funktionen
7.1 Einleitung In Abschn. 2.2 haben wir bereits die elementaren Gesetze des Rechnens mit komplexen Zahlen behandelt und einige wichtige Funktionen in der komplexen Zahlenebene untersucht, die in der Physik relativ h¨aufig Verwendung finden. Wir haben auch bereits darauf hingewiesen, dass jede beliebige Funktion einer komplexen Ver¨ anderlichen z sich stets in der Form f (z) = u(x, y) + iv(x, y) darstellen l¨ asst, wo u(x, y) und v(x, y) reelle Funktionen zweier reeller Ver¨ anderlicher sind, und dass diese Darstellung als eine Abbildung der komplexen z-Ebene auf die komplexe w-Ebene aufgefasst werden kann, wo w = u + iv ist. Im vorliegenden Kapitel sollen nun die f¨ ur die physikalischen Anwendungen wichtigsten mathematischen Eigenschaften solcher Funktionen diskutiert und auf physikalische und technischen Problemstellungen beispielhaft angewandt werden, um die N¨ utzlichkeit funktionentheoretischer Methoden dem Leser n¨ aher zu bringen.
7.2 Die analytischen Funktionen Grenzwerte und Stetigkeit komplexer Funktionen k¨onnen ¨ahnlich analysiert werden wie im reellen Gebiet und wir wollen hier nicht n¨aher darauf eingehen. Wichtig ist jedoch die Untersuchung der Differenzierbarkeit komplexer Funktionen. In der Analysis reeller Funktionen ist die Ableitung einer Funktion durch folgenden Grenzwert definiert (siehe Anh. A.1) f (x + Δx) − f (x) df (x) = f (x) = lim . Δx→0 dx Δx
(7.1)
Analog k¨ onnen wir in der Analysis komplexer Funktionen den folgenden Grenzwert betrachten df (z) f (z + Δz) − f (z) = f (z) = lim , Δz→0 dz Δz
(7.2)
224
7 Theorie komplexer Funktionen
doch ist in der komplexen Zahlenebene Δz = Δx + iΔy ein infinitesimaler Δy Vektor, der aus einer beliebigen Richtung Δx auf den Punkt z zustreben kann. Daraus ergibt sich die Frage, unter welchen Bedingungen ist der durch (7.2) definierte Differenzialquotient unabh¨ angig von der Richtung von Δz. ¨ Dies f¨ uhrt uns auf folgende Uberlegungen. 7.2.1 Die Cauchy-Riemann’schen Differenzialgleichungen ¨ Wir betrachten die infinitesimale Anderung der Funktion f (z) = u(x, y) + ¨ iv(x, y) bei einer Anderung von z um dz. Dies f¨ uhrt auf die Berechnung des folgenden Differenzials df (z) = du(x, y) + idv(x, y) .
(7.3)
Nun nehmen wir an, was sp¨ ater gerechtfertigt werden wird, dass die Funktionen u(x, y) und v(x, y) stetig differenzierbar sind. Dann k¨onnen wir die Differenziale du und dv leicht als Funktion von dx und dy berechnen. Wir erhalten ∂u ∂u ∂v ∂v du = dx + dy , dv = dx + dy (7.4) ∂x ∂y ∂x ∂y und daher l¨ asst sich das Differenzial df leicht als Funktion von dx und dy berechnen. Wir untersuchen nun das Verh¨ altnis df dz und wollen es die Ableitung der Funktion f (z) nach z an der Stelle z nennen. Wir erhalten nach einsetzen von (7.4) in (7.3) ∂u ∂v ∂u ∂v dy + i + + i ∂x ∂x ∂y ∂y dx du + idv df (z) f (z) = = = , (7.5) dy dz dx + idy 1 + i dx wobei wir Z¨ ahler und Nenner durch dx dividiert haben. Im allgemeinen wird dy also diese Ableitung f (z) von dx abh¨ angen, d. h. von der Richtung unter der wir auf den Punkt z zustreben. In diesem Fall ist dann der Wert der Ableitung an der Stelle z nicht eindeutig definiert. Eindeutig wird daher die Ableitung im Punkt z nur dann sein, wenn im Ausdruck f¨ ur f (z) der Z¨ahler ein Vieldy faches des Nenners ist. Dann kann n¨ amlich die Richtung dx herausdividiert werden. Dies ist ersichtlich dann der Fall, wenn folgende Verh¨altnisrelation gilt
∂v ∂u ∂v ∂u +i +i :1= :i, (7.6) ∂x ∂x ∂y ∂y woraus sich die Beziehung ergibt
∂u ∂v ∂v ∂u + − +i =0. ∂y ∂x ∂y ∂x
(7.7)
7.2 Die analytischen Funktionen
225
Da aber eine komplexe Zahl nur dann gleich Null ist, wenn Real- und Imagin¨ arteil jeder f¨ ur sich verschwindet, so muss gelten ∂v(x, y) ∂u(x, y) = , ∂x ∂y
∂v(x, y) ∂u(x, y) =− . ∂x ∂y
(7.8)
Dies sind die Cauchy-Riemann’schen partiellen Differenzialgleichungen der Funktionentheorie. Wenn diese Differenzialgleichungen erf¨ ullt sind, nennt man u(x, y) und v(x, y) zueinander konjugierte Funktionen. Nur wenn diese Funktionen den Cauchy-Riemann’schen Differenzialgleichungen gen¨ ugen, hat die Funktion f (z) an der Stelle z eine eindeutige Ableitung f (z) und es gilt dann (7.2). Wenn eine komplexe Funktion f (z) = w(z) = u(x, y) + iv(x, y) in einem Bereich B der komplexen Zahlenebene den Cauchy-Riemann’schen Differenzialgleichungen gen¨ ugt, so heißt sie analytisch in diesem Bereich. Ist eine analytische Funktion f (z) obendrein eindeutig, so heißt sie regul¨ar analytisch oder regul¨ ar. Wir werden uns hier vornehmlich mit regul¨aren Funktionen besch¨ aftigen. Sind die Funktionen u(x, y) und v(x, y) zweimal stetig differenzierbar, so folgt durch nochmalige Differenziation der Cauchy-RiemannGleichungen nach x bzw. y ∂2v ∂2v ∂2u ∂2u , = =− 2 2 ∂x ∂x∂y ∂x ∂x∂y 2 2 2 ∂ v ∂ 2u ∂ v ∂ u = =− 2 . , 2 ∂x∂y ∂y ∂x∂y ∂y
(7.9)
Diese vier Gleichungen m¨ ussen also kreuzweise miteinander identisch sein, woraus sich f¨ ur u(x, y) und v(x, y) die folgenden beiden Laplace’schen Differenzialgleichungen ergeben ∂2u ∂2u + 2 =0, ∂x2 ∂y
∂ 2v ∂2v + =0. ∂x2 ∂y 2
(7.10)
Die beiden L¨ osungen u(x, y) und v(x, y) der Laplace-Gleichung nennt man harmonische Funktionen. Sie definieren nur dann eine analytische Funktion f (z), wenn sie die Cauchy-Riemann-Differenzialgleichungen erf¨ ullen. Aus einer einzigen Funktion u(x, y), welche der Laplace’schen Differenzialgleichung gen¨ ugt, kann man eine analytische Funktion konstruieren, indem man die konjugierte Funktion v(x, y) durch Integration der Cauchy-RiemannDifferenzialgleichungen findet. Die Laplace-Gleichung in zwei Ver¨anderlichen ist bei der L¨ osung hydrodynamischer und elektrostatischer Probleme in zwei Dimensionen von Interesse, wenn aus Symmetriegr¨ unden die Abh¨angigkeit von der dritten Dimension unber¨ ucksichtigt bleiben kann. Beispiele sind etwa die Str¨ omung einer reibungsfreien Fl¨ ussigkeit, die in einer Raumrichtung unendlich ausgedehnt ist, oder das elektrostatische Potenzial zwischen zwei unendlich langen und parallelen geladenen Dr¨ ahten. Die Anwendung der funktionentheoretischen Methoden auf diese Problemstellungen wollen wir hier
226
7 Theorie komplexer Funktionen
nicht weiter diskutieren, sondern nur auf eine wichtige Eigenschaft analytischer Funktionen eingehen, wonach sie eine lokal winkel- und linientreue Abbildung vermitteln. 7.2.2 Die konforme Abbildung Die von analytischen Funktionen vermittelten Abbildungen der z-Ebene auf die w-Ebene haben eine besondere Eigenschaft, die wir nun untersuchen wollen. Wir nehmen an, an der Stelle z sei f (z) = 0 und wir bewegen uns in einer bestimmten Richtung vom Punkte z aus um das infinitesimale, vektorielle Wegst¨ uck dz = dx + idy fort. Sein Betrag und Argument sind dann durch die Ausdr¨ ucke gegeben (vgl. Abschn. 2.2.3) |dz| =
dx2 + dy 2 ,
ω = arg(dz) = arctan
dy . dx
(7.11)
Durch die Abbildung w = f (z) ist dann dem infinitesimalen vektoriellen Linienelement dz in der w-Ebene das vektorielle Element dw zugeordnet. F¨ ur den Modul und das Argument von dw = du + idv erhalten wir entsprechend die Beziehungen |dw| =
du2 + dv 2 ,
Ω = arg(dw) = arctan
dv . du
(7.12)
Wegen der G¨ ultigkeit der Cauchy-Riemann-Differenzialgleichungen (7.8) stehen aber die Differenziale von u und v mit jenen von x und y in folgendem Zusammenhang ∂u dx + ∂x ∂v dv = dx + ∂x
du =
∂u ∂v ∂v dy = dx − dy ∂y ∂y ∂x ∂v ∂u ∂u dy = − dx + dy . ∂y ∂y ∂x
(7.13)
Also k¨ onnen wir entweder die partiellen Ableitungen von u(x, y) oder jene von v(x, y) eliminieren. Tun wir ersteres so ergibt sich du2 + dv 2 = vy2 dx2 + vx2 dy 2 − 2vx vy dxdy + vx2 dx2 + vy2 dy 2 + 2vx vy dxdy = (vx2 + vy2 )(dx2 + dy 2 )
(7.14)
und wir erhalten somit folgenden Zusammenhang zwischen den Betr¨agen der Linienelemente in der w-Ebene und der z-Ebene * * |dw| = du2 + dv 2 = vx2 + vy2 dx2 + dy 2 = vx2 + vy2 |dz| . (7.15) Andererseits k¨ onnen wir zwischen den Argumenten Ω und ω von dw und dz eine Beziehung herstellen. Mithilfe der obigen Formeln (7.13) f¨ ur du und dv
7.2 Die analytischen Funktionen
finden wir
227
vx
tan Ω =
dy vx + vy dx dv v + tan ω = . = y vx dy du 1 − vy tan ω vy − vx dx
Wenn wir nun mithilfe der Definition tan φ = einf¨ uhren, so ergibt sich tan Ω =
vx vy
(7.16)
einen neuen Winkel φ
tan φ + tan ω = tan(φ + ω) 1 − tan φ tan ω
(7.17)
und es ist daher bis auf ein ganzes Vielfaches von π Ω =φ+ω ,
arg(dw) = φ + arg(dz) .
(7.18)
Betrachten wir nun in der z-Ebene zwei infinitesimale Linienelemente dz1 und dz2 , die vom Punkt z ausgehen, so sind ihnen durch die Funktion f (z) ur diese gilt nun in der w-Ebene die Elemente dw1 und dw2 zugeordnet. F¨ wegen der abgeleiteten Beziehungen (7.15) und (7.18) zwischen den Moduli und Argumenten von dw und dz |dw1 | |dz1 | = , |dw2 | |dz2 |
arg(dw1 ) − arg(dw2 ) = arg(dz1 ) − arg(dz2 ) ,
da sowohl der Modul von f (z), |f (z)| =
(7.19)
* vx2 + vy2 als auch das Argument
von f (z), arg[f (z)] = φ = arctan( vvxy ) infolge der Analytizit¨at von f (z) richtungsunabh¨ angig sind. Wir ersehen daraus, dass jede analytische Funktion an Stellen, wo f (z) = 0 ist eine zwar von Ort zu Ort sich a¨ndernde aber im Infinitesimalen strecken- und winkeltreue Abbildung liefert. Solche Abbildungen nennt man konform. Alle Strecken |dz| werden in jedem Punkt um dz um den Winkel den gleichen Faktor |f (z)| gedehnt und alle Richtungen |dz| φ = arg[f (z)] verdreht. 7.2.3 Elementare Rechenoperationen analytischer Funktionen Sind zwei Funktionen f1 (z) und f2 (z) analytisch, so kann man zeigen, dass ur dasselbe auch f¨ ur f1 ± f2 und ff12 gilt, solange im letzten Fall f2 = 0 ist. F¨ diese analytischen Funktionen gelten dieselben elementaren Differenziationsregeln, wie im reellen Gebiet (siehe Anh. A.1.3). Es gilt also (f1 + f2 ) = f 1 + f 2 , (f1 · f2 ) = f 1 · f2 + f1 · f 2 f1 f · f2 − f1 · f 2 = 1 , f2 = 0 . f2 f22
(7.20)
228
7 Theorie komplexer Funktionen
Insbesondere gilt auch die Leibniz’sche Kettenregel der Differenziation. Wenn w2 = f2 (w1 ) und w1 = f1 (z) sind, so erhalten wir dw2 dw1 dw2 = . · dz dw1 dz
(7.21)
Aus diesen Regeln folgt dann, abgesehen von einzelnen Punkten oder Folgen solcher Punkte in der komplexen Zahlenebene, dass alle Potenzen z n von z, wo n positive oder negative ganze Zahlen sind, sowie Summen beliebiger Vielfacher solcher Potenzen, ja unendliche Reihen solcher Potenzen, wenn sie absolut und gleichm¨ aßig konvergieren, regul¨ar analytische Funktionen von z darstellen. Sp¨ ater werden wir sehen, dass analytische Funktionen beliebig oft differenziert werden k¨ onnen. Elementare Funktionen dieser Art sind alle Polynome in z, d. h. n ai z i , (7.22) Pn (z) = i= 0
wo die Koeffizienten ai beliebige komplexe Zahlen sein k¨onnen. Dasselbe gilt f¨ ur rationale Funktionen n i Pn (z) 0 ai z R(z) = = i= , (7.23) m i Qm (z) i= 0 bi z solange der Nenner nicht verschwindet. Auch die in Abschn. 2.2.4–2.2.6 diskutierten elementaren transzendenten Funktionen geh¨oren zu dieser Klasse regul¨ arer Funktionen, solange |z| < M ist und M < ∞ bleibt. 7.2.4 Singularit¨ aten analytischer Funktionen Alle Punkte in der z-Eben in denen eine komplexe Funktion f (z) keine Ableitung besitzt, also nicht analytisch ist, heißen singul¨are Punkte der Funktion f (z). Wir wollen uns hier haupts¨ achlich mit den singul¨aren Punkten einer eindeutigen Funktion besch¨ aftigen. In diesem Fall haben wir es mit zwei wichtigen Arten von Singularit¨ aten zu tun. Angenommen, die sonst regul¨are Funktion f (z) habe an der Stelle z0 in der komplexen Zahlenebene eine singul¨ are Stelle von der Art, dass die Funktion g(z) = (z − z0 )n f (z)
(7.24)
an der Stelle z0 regul¨ ar ist und daher in einer gewissen Umgebung |z −z0 | < R der Stelle z0 in eine absolut und gleichm¨ aßig konvergente Potenzreihe entwickelt werden kann. Dabei heißt R der Konvergenzradius, der genau bis zur n¨achsten Singularit¨ at von f (z) reicht. Also k¨onnen wir ansetzen g(z) =
∞ i= 0
ai (z − z0 )i .
(7.25)
7.2 Die analytischen Funktionen
229
Daher besitzt die Funktion f (z) in der Umgebung von z0 die Reihenentwicklung ∞ g(z) f (z) = = ai (z − z0 )i−n (7.26) (z − z0 )n i= 0 und wenn wir i − n = k setzen, so ist f (z) =
∞
ak+n (z − z0 )k =
k= −n
∞
ck (z − z0 )k
k= −n
c−n c−n+1 c−1 = + + ··· + c0 + c1 (z − z0 ) + · · · , (7.27) n n−1 (z − z0 ) (z − z0 ) z − z0 nachdem wir ak+n = ck getauft haben und wir nennen diese Potenzreihe die ,,Laurent’sche Reihenentwicklung“ der Funktion f (z) in der Umgebung von z0 . Eine Funktion f (z), die in der Umgebung von z0 eine Laurent’sche Reihenentwicklung mit n Gliedern von negativen Potenzen von z − z0 besitzt, hat an der Stelle z0 einen sogenannten ,,Pol“, oder eine außerwesentliche Singularit¨ at n-ter Ordnung. Die Funktion f (z) strebt also an diesem Pol c−n maximal wie (z−z n gegen Unendlich, wenn z → z0 geht. Man nennt die 0) ersten n Glieder der Laurent-Reihe, also jene mit negativen Potenzen von z − z0 , den Hauptteil der Funktion f (z). Betrachten wir die (n − 1)-te Ableitung der regul¨ aren Funktion g(z), so ergibt sich aus ihrer Potenzreihenentwicklung dn−1 dn−1 g(z) = n−1 (z − z0 )n f (z) = an−1 (n − 1)! + · · · n−1 dz dz
(7.28)
und wir erhalten daher f¨ ur z = z0 c−1 = an−1 =
n−1 1 d n (z − z ) f (z) . 0 (n − 1)! dz n−1 z= z0
(7.29)
Man nennt den Koeffizienten c−1 der Laurent’schen Reihenentwicklung von f (z) in der Umgebung der singul¨ aren Stelle z0 das ,,Residuum“ der Funktion f (z) an dieser Stelle. Handelt es sich um einen Pol erster Ordnung, so ist das Residuum einfach durch c−1 = [(z − z0 )f (z)]z=z0
(7.30)
gegeben. Die Bedeutung der Residua werden wir im Zusammenhang mit den Integrals¨ atzen der Funktionentheorie im n¨ achsten Abschnitt kennen lernen. Beispiel Als einfaches Beispiel f¨ ur die Berechnung der Residuen betrachten wir die rationale Funktion 1 f (z) = . (7.31) z(z − 1)2
230
7 Theorie komplexer Funktionen
Diese Funktion hat bei z = 0 einen Pol 1. Ordnung und bei z = 1 einen Pol zweiter Ordnung. Die Residuen von f (z) an diesen Stellen sind d (1) (2) 2 = −1 . (7.32) (z − 1) f (z) c−1 = [zf (z)]z= 0 = 1 , c−1 = dz z= 1 Diese Residuen k¨ onnen wir nat¨ urlich auch den Laurent’schen Reihenentwicklungen von f (z) an den beiden Polen entnehmen, also aus der Entwicklung f (z) =
1 1 1 (1−z)−2 = (1+2z +3z 2 +4z 3 +· · · ) = +2+3z +4z 2 +· · · (7.33) z z z
und aus der Reihe
1 1 1 1 = f (z) = (z − 1)2 z (z − 1)2 1 + z − 1 1 [1 − (z − 1) + (z − 1)2 − (z − 1)3 + · · · ] = (z − 1)2 1 1 = + 1 − (z − 1) + (z − 1)2 − · · · . − 2 (z − 1) z−1
(7.34)
Eine sonst regul¨ are Funktion f (z), welche im Endlichen keine anderen Singularit¨ aten besitzt als Pole, heißt meromorph oder von der Natur einer rationalen Funktion. Eine zweite Art der Singularit¨ aten einer sonst regul¨aren Funktion f (z) ist dadurch gekennzeichnet, dass sich keine an der singul¨aren Stelle z0 regul¨ are Funktion g(z) von der Form (7.25) finden l¨asst, wie groß immer man auch n w¨ ahlen mag. Die Laurent-Reihe von f (z) muss daher an dieser Stelle unendlich viele Glieder mit negativen Potenzen von (z − z0 ) besitzen, also f (z) =
+∞
ck (z − z0 )k .
(7.35)
k= −∞
Auch hier nennt man den Teil der Summe mit negativen Potenzen von (z−z0 ) den Hauptteil der Funktion und den Koeffizienten c−1 das Residuum von f (z) an der Stelle z0 . Wenn f (z) im Punkt z0 diese Eigenschaft besitzt, so sagt man, die Funktion habe dort eine wesentliche Singularit¨at. Als Beispiel nen1 nen wir die Funktion f (z) = e z . Sie hat an der Stelle z = 0 eine wesentliche Singularit¨ at, denn 0 1 zk z . (7.36) f (z) = e = |k|! k=− ∞
1 z
Die Laurent-Reihe von e hat also unendlich viele Glieder mit negativen Potenzen von z. Eine wesentliche Singularit¨at ist dadurch gekennzeichnet, dass in diesem Punkt z0 die Funktion f (z) jeden beliebigen Wert annehmen kann.
7.3 Integration im komplexen Gebiet
231
7.2.5 Der unendlich ferne Punkt Um das analytische Verhalten einer sonst regul¨ aren Funktion f¨ ur große Werte |z|, d. h. im unendlich fernen Punkt, zu untersuchen, ist es zweckm¨aßig, das Verhalten einer anderen Funktion φ(ζ) im Ursprung ζ = 0 zu betrachten, indem wir setzen z = 1ζ , sodass f¨ ur |z| → ∞ gleichzeitig ζ → 0 strebt. Wir brauchen also nur zu setzen 1 f (z) = f = φ(ζ) . (7.37) ζ Wenn dann φ(ζ) bei ζ = 0 regul¨ ar ist, so sagt man, f (z) ist im Unendlichen regul¨ ar. Wenn φ(ζ) im Punkt ζ = 0 einen Pol n-ter Ordnung oder eine wesentliche Singularit¨ at hat, so heißt das, dasselbe gilt f¨ ur f (z) im ,,Punkt z = ∞“. So kann man zum Beispiel sofort zeigen, dass f (z) = z1 sich im Unendlichen regul¨ ar verh¨ alt, dass f (z) = z 2 bei z = ∞ einen Pol zweiter Ordnung hat und dass schließlich f (z) = ez aufgrund unserer vorangegangen Diskussion im unendlich fernen Punkt eine wesentliche Singularit¨at besitzt, 1 da f ( 1ζ ) = e ζ = φ(ζ) eine solche bei ζ = 0 hat. Die Bezeichnung unendlich ferner Punkt der z-Ebene oder z = ∞ hat keine irgendwie geartete geometrische Bedeutung, da alle Punkte f¨ ur die |z| → ∞ geht, denselben Punkt z = ∞ bedeuten. Man sagt, durch den Punkt z = ∞ wird die komplexe Zahlenebene ,,abgeschlossen“. Nach einem bemerkenswerten Theorem von Liouville ist eine in der abgeschlossenen z-Ebene u ¨ berall regul¨are Funktion f (z) eine Konstante. Oder, jede nicht konstante regul¨ are Funktion muss mindestens eine Singularit¨ at besitzen. Daraus folgt ferner, wenn h(z) = f (z) − g(z) in der abgeschlossenen Zahlenebene regul¨ ar ist, sich f (z) und g(z) nur durch eine Konstante unterscheiden k¨ onnen.
7.3 Integration im komplexen Gebiet Die Integrals¨ atze der Funktionentheorie spielen f¨ ur die physikalischen Anwendungen eine wichtige Rolle. F¨ ur die Herleitung dieser S¨atze ben¨otigen wir die Einf¨ uhrung von Linienintegralen in der komplexen Zahlenebene. Wir k¨ onnen dabei auf die Diskussion reeller Linienintegrale in Abschn. 1.4.3 (1.120) zur¨ uckgreifen. 7.3.1 Linienintegrale in der komplexen Zahlenebene Es sei f (z) eine im Bereich B der z-Ebene definierte stetige Funktion von z und es sei in B eine orientierte stetige Kurve C gegeben, welche die Punkte a = x1 + iy1 und b = x2 + iy2 verbindet und durch die Parameterdarstellung z(t) = x(t) + iy(t) bestimmt ist, wo der Parameter t die Werte t0 ≤ t ≤ T durchl¨ auft (vgl. Abb. 7.1). Man definiert dann das komplexe Linienintegral,
232
7 Theorie komplexer Funktionen
Abbildung 7.1. Integration in der komplexen Zahlenebene
erstreckt u ¨ber die Kurve C, ganz analog wie im reellen Gebiet als Grenzwert J der durch Unterteilung des Intervalls gebildeten N¨aherungssumme, n¨amlich n J= f (z)dz = lim Sn = lim f (ξk )(zk − zk−1 ) . (7.38) n→∞
C
n→∞
k=1
Dies muss f¨ ur beliebige, unendlich feine Einteilungen t0 < t1 < t2 < · · · < T des Parameterintervalls (t0 , T ) gelten, wobei die Werte zk = z(tk ) und ξk = z(τk ) mit tk−1 < τk < tk zu betrachten sind, analog den Definitionen im reellen Gebiet. Das in (7.38) definierte Integral J existiert insbesondere dann, was bei den physikalischen Anwendungen stets erf¨ ullt ist, wenn die Kurve C ,,rektifizierbar“ ist, also eine wohldefinierte endliche L¨ange besitzt. Dies ist insbesondere dann der Fall, wenn die Parameterdarstellung z(t) stetig differenzierbar ist. Dann k¨ onnen wir das komplexe Linienintegral auf die Form eines gew¨ ohnlichen Integrals bringen und zwar T f (z)dz = f [z(t)]z (t)dt . (7.39) C
0
Entsprechend kann dann auch das komplexe Integral als eine Summe von reellen Linienintegralen ausgedr¨ uckt werden, indem wir f (z) in seinen Realund Imagin¨ arteil zerlegen, f (z) = u(x, y) + iv(x, y), sodass wir erhalten f (z)dz = (u+iv)(x +iy )dt = (udx−vdy)+i (vdx+udy) . (7.40) C
C
C
C
Auf diesem Wege k¨ onnen wir dann alle im Reellen abgeleiteten elementaren Regeln der Integration ins Komplexe u ¨bernehmen. So ¨andert etwa das Integral sein Vorzeichen, wenn die Kurve C in umgekehrter Richtung durchlaufen
7.3 Integration im komplexen Gebiet
233
wird und es ist die Summe und das Produkt zweier integrabler Funktionen f1 (z) und f2 (z) gleichfalls integrabel. Insbesondere gilt auch im komplexen Gebiet, wenn die Funktion f (z, α) bez¨ uglich α stetig differenzierbar ist und l¨ angs C u ¨ ber z integriert werden kann, dass sich dann Differenziation und Integration miteinander vertauschen lassen, also (siehe Anh. A.1.12) d d f (z, α)dz (7.41) F (α) = f (z, α)dz = dα C dα C und es ist somit l¨ angs C die Funktion F (α) eine analytische Funktion von α, wobei es gleichg¨ ultig ist, ob α einen reeller oder komplexer Parameter darstellt. Mit den obigen Untersuchungen haben wir alle n¨otigen Vorbereitungen getroffen, um uns mit den sehr bedeutungsvollen Integrals¨atzen der Funktionentheorie besch¨ aftigen zu k¨ onnen. 7.3.2 Der Fundamentalsatz von Cauchy Bei der Diskussion der reellen Linienintegrale in der Vektoranalysis in Abschn. 1.4.3 haben wir unter den Beispielen den Stokes’schen Satz in der Ebene unter (1.120) hergeleitet. Dieser besagt, dass f¨ ur zwei stetig differenzierbare Funktionen P (x, y) und Q(x, y) im Bereich B, der einfach zusammenh¨angend von einer Kurve C in positivem Sinne umschlossen ist, (d. h. entgegen dem Uhrzeigersinn und der Bereich B zur linken liegend) der folgende Zusammenhang zwischen Kurven- und Fl¨ achenintegral besteht
∂Q ∂P − [P (x, y)dx + Q(x, y)dy] = dxdy . (7.42) ∂x ∂y C B Ist insbesondere dF (x, y) = P (x, y)dx + Q(x, y)dy ein exaktes Differenzial, ∂P dann gilt die ,,Integrabilit¨ atsbedingung“ ∂Q ∂x = ∂y und daher ist dann das Integral auf der rechten Seite von (7.42) gleich Null. Damit ist aber dann der Wert des Linienintegrals vom Weg unabh¨ angig. Nun wenden wir diese S¨atze auf unsere beiden komplexen Linienintegrale (7.40) an, wobei wir voraussetzen, dass u(x, y) und v(x, y) in einem gewissen Bereich B der komplexen Zahlenebene stetig differenzierbar sind und ein einfach zusammenh¨angender Teilbereich B von einer Kurve C in positivem Sinne umschlossen wird, sodass gelten muss (vgl. Abb. 7.2) f (z)dz = (udx − vdy) + i (vdx + udy) C
∂u ∂v ∂u ∂v − dxdy + i − dxdy . (7.43) − = ∂x ∂y ∂x ∂y B B Im allgemeinen werden auch hier die beiden Fl¨ achenintegrale in der zweiten Zeile dieser Gleichung von Null verschieden sein. Wenn aber die beiden Linienintegrale in der ersten Zeile u ¨ ber zwei totale Differenziale dF (x, y) und
234
7 Theorie komplexer Funktionen
Abbildung 7.2. Zum Fundamentalsatz von Cauchy
dG(x, y) erstreckt werden, m¨ ussen innerhalb der geschlossenen Kurve C die Integrabilit¨ atsbedingungen erf¨ ullt sein, also ∂u ∂v =− , ∂x ∂y
∂u ∂v = . ∂x ∂y
(7.44)
Dies sind aber gerade die Cauchy-Riemann-Differenzialgleichungen als notwendige und hinreichende Bedingung daf¨ ur, dass f (z) im Bereich B , welches von C umschlossen wird, sich regul¨ ar verh¨ alt. Gilt dies f¨ ur alle Kurven C, die Teilbereiche B von B umschließen, so ist f (z) in B regul¨ar und es gilt dann f (z)dz = 0 (7.45) C
f¨ ur jede Kurve C, die ganz in B liegt und einen einfach zusammenh¨angenden Teilbereich B von B umschließt. Dies ist der Cauchy’sche ,,Fundamentalsatz“ der Funktionentheorie. Die Umkehr dieses Satzes wurde sp¨ater von Morera bewiesen. Ist also die Funktion f (z) regul¨ ar im Bereich B, so ist der Wert des komplexen Linienintegrals zwischen zwei Punkten z0 und z aus B unabh¨angig vom Weg, d. h. z
f (z )dz =
z0 ,C1
z
f (z )dz
(7.46)
z0 ,C2
und daher f (z)dz = dF (z) ein exaktes Differenzial, sodass z f (z )dz = z0
(7.47)
z
z0
dF (z) = F (z) − F (z0 )
(7.48)
7.3 Integration im komplexen Gebiet
235
erf¨ ullt ist und daher die Funktion F (z) eine Stammfunktion von f (z) im Bereich B darstellt. In diesem Fall kann also die gleichfalls regul¨are Stammfunktion nach den gleichen Methoden, wie bei der Integralrechnung im reellen Gebiet, gefunden werden, also z F (z) = f (z )dz + C (7.49) und die Integration erscheint als die Umkehr der Differenziation dF (z) = F (z) = f (z) . dz
(7.50)
Diese Kenntnis gestattet, eine ganze Reihe von Integralen im reellen Gebiet in elementarer Weise zu berechnen, d. h. die Stammfunktion F (x) der Funktion f (x) zu finden, wenn diese Funktionen eine sogenannte ,,analytische Fortsetzung“ f (z) in die komplexe Zahlenebene besitzen und deren Stammfunktionen F (z) leicht berechenbar sind, was in vielen F¨allen m¨oglich ist. Beispiele 1. Berechnung von Parameterintegralen: Ein in der Physik h¨aufig auftretendes Parameterintegral ist von der Form epx sin qxdx . (7.51) Zu seiner Berechnung betrachten wir die Funktion f (z) = epz+iqz = e(p+iq)z ,
(7.52)
die jedenfalls regul¨ ar ist, wobei p und q auch komplex sein k¨onnen. Durch Integration erhalten wir die Stammfunktion e(p+iq)z F (z) = e(p+iq)z dz = +C . (7.53) p + iq F¨ uhren wir nun die Integration l¨ angs der x-Achse aus und w¨ahlen p und q reell, so ist px+iqx px F (x) = U (x) + iV (x) = e dx = e cos qxdx + i epx sin qxdx =
p − iq px (e cos qx + iepx sin qx) + C1 + iC2 p2 + q 2
(7.54)
und wenn wir in Real- und Imagin¨ arteil trennen, so ergibt sich px px U (x) = e cos qxdx = p2e+q2 (p cos qx + q sin qx) + C1 V (x) =
epx sin qxdx =
epx
p2 +q2
. (p sin qx − q cos qx) + C2
(7.55)
236
7 Theorie komplexer Funktionen
2. Berechnung der Fresnel’schen Integrale: In Abschn. 5.2 (5.46) hatten wir die Fresnel’schen Integrale C(x) und S(x) angegeben. In der Beugungstheorie ist es von Nutzen, die Werte C(∞) und S(∞) zu kennen. Dies bedeutet, wir haben folgendes Integral zu berechnen ∞ π 2 ei 2 x dx . (7.56) C(∞) + iS(∞) = 0 π
2
Da die Funktion f (z) = ei 2 z eine regul¨ are Funktion ist, erhalten wir f¨ ur einen beliebigen, einfach zusammenh¨ angenden Bereich in der komplexen Zahlenebene π 2 (7.57) ei 2 z dz = 0 . Nun w¨ ahlen wir die geschlossene Kurve C in spezieller Weise, wie in Abb. 7.3 skizziert. In diesem Fall liefert das Integral (7.57), in die einzelnen Anteile zerlegt und nach Einf¨ uhrung von Polarkoordinaten, die einzelnen Beitr¨ age
R
π
2
ei 2 x dx+iR 0
0
π 4
π
2
ei 2 R
(cos 2ϕ+i sin 2ϕ) iϕ
0
e dϕ+
π
2
π
e− 2 r ei 4 dr = 0 . (7.58)
R
Wenn nun R → ∞ strebt, geht das erste Integral in dieser Gleichung in (7.56) u ¨ber, das zweite Integral u ¨ber den Kreisbogen vom Radius R verschwindet, da die Exponentialfunktion den D¨ ampfungsanteil exp[− π2 R2 sin 2ϕ] enth¨alt. Das dritte Integral ist im wesentlichen das vollst¨ andige Gauß’sche Fehlerintegral, das wir in Abschn. 5.2 (5.11) berechnet haben. Nach einfacher Variablen-
Abbildung 7.3. Berechnung der Fresnel’schen Integrale
7.3 Integration im komplexen Gebiet
* transformation mit r = ρ
R
0
da cos π4 = sin π4 =
2 π
erhalten wir daher
π 2 1 π ei 2 x dx = √ ei 4 , 2
√1 2
237
C(∞) = S(∞) =
1 , 2
(7.59)
ist.
3. L¨osung der Schr¨odinger-Gleichung eines freien Teilchens: F¨ ur die freie, eindimensionale Bewegung eines Elektrons lautet die Schr¨odinger-Gleichung 2 ∂ 2 Φ(x, t) ∂Φ(x, t) . = i 2m ∂x2 ∂t
(7.60)
In Abschn. 4.2 haben wir erfahren, dass die Schr¨odinger-Gleichung vom parabolischen Typ ist und wir daher zu ihrer L¨osung im freien Raum eine Anfangsbedingung ben¨ otigen. Wir nehmen an, f¨ ur t = 0 habe die L¨osung die Form einer Gauß’schen Funktion, und zwar 2
Φ(x, t = 0) = Ae−α
x2
,
(7.61)
wo A und α reelle Konstanten sind. Da die Gauß-Funktion quadratisch integrabel ist, k¨ onnen wir sie normieren. Das Normierungsintegral ist mithil/ * fe von (5.11) leicht berechenbar und ergibt A = α π2 . Zur L¨osung der Schr¨ odinger-Gleichung (7.60) mit der Anfangsbedingung (7.61) machen wir einen Fourier-Integralansatz +∞ Φ(x, t) = Φ(k, t)eikx dk . (7.62) −∞
Dies ergibt beim Einsetzen in die Schr¨ odinger-Gleichung +∞ 2 2 k ˙ t) eikx dk = 0 , Φ(k, t) − i Φ(k, − 2m −∞
(7.63)
woraus wir wegen der Orthogonalit¨ at der Fourier-Funktionen schließen k¨ onnen, dass ˙ Φ(k, t) k 2 = −i , Φ(k, t) 2m
k2
Φ(k, t) = Φ(k, 0)e−i 2m t ,
(7.64)
wobei die angegebene L¨ osung f¨ ur die Fourier-Transformierte Φ(k, t) leicht zu finden ist, da die linke Seite der ersten Gleichung in (7.64) die logarithmische Ableitung der Fourier-Transformierten nach t ist. Wir k¨onnen also mithilfe von (7.62) die gesuchte L¨ osung berechnen, wenn wir Φ(k, 0) durch inverse Fourier-Transformation aus der Anfangsbedingung (7.61) berechnet haben.
238
7 Theorie komplexer Funktionen
Abbildung 7.4. Zur Berechnung des Gauß’schen Fehlerintegrals
Also A 2π
Φ(k, 0) =
+∞
2
e−α
x2 −ikx
dx =
−∞
A − k22 e 4α 2π
+∞
2
e−α
2 k (x+i 2α 2)
dx , (7.65)
−∞
wobei wir im Argument der Exponentialfunktion in folgender Weise auf ein k2 Quadrat erg¨ anzt haben −α2 x2 − ikx = −α2 (x + i 2αk 2 )2 − 4α 2 , wie der Leser leicht nachpr¨ ufen kann. Das letzte Integral berechnen wir nun mithilfe des Cauchy’schen Fundamentalsatzes. Da die Funktion f (z) = exp(−α2 z 2 ) eine regul¨ are Funktion ist, k¨ onnen wir den Fundamentalsatz auf folgenden Bereich in der komplexen Zahlenebene anwenden, wie er in Abb. 7.4 eingezeichnet ist. Dies ergibt die folgende Zerlegung des geschlossenen Linienintegrals 2 2 e−α z dz C +R
e
=
−α2 x2
dx + i
−R
k 2α2
0 −R
+ R
2
e−α
2 k (x+i 2α 2)
2
e−α
dx + i
(R+iy)2 0 k 2α2
dy 2
e−α
(−R+iy)2
(7.66) dy = 0 .
Wenn wir nun R → ∞ streben lassen, verschwindet auf der rechten Seite das zweite und das letzte Integral in dieser Gleichung und wir erhalten aus der Summe des ersten und dritten Integrals die Identit¨at √ +∞ +∞ 2 k π −α2 (x+i 2α −α2 x2 2) . (7.67) e dx = e dx = α −∞ −∞ Setzen wir dieses Resultat in (7.65) ein, so erhalten wir f¨ ur die gesuchte Fourier-Transformierte A − k22 √ e 4α . Φ(k, 0) = (7.68) 2α π
7.3 Integration im komplexen Gebiet
239
Diesen Ausdruck k¨ onnen wir nun zusammen mit (7.64) in den L¨osungsansatz (7.62) einsetzen und dies ergibt A √ Φ(x, t) = 2α π
+∞
1
t
e−( 4α2 +i 2m )k
2
+ikx
dk .
(7.69)
−∞
t ein und F¨ ur die weitere Rechnung f¨ uhren wir als Abk¨ urzung β 2 = 4α1 2 + i 2m erg¨ anzen wie vorhin den Exponenten zu einem Quadrat. Dies ergibt −
x2
Ae 4β2 √ Φ(x, t) = 2α π
+∞
e
−β 2 (k−i 2βx2 )2
dk .
(7.70)
−∞
Nun beachten wir, dass β komplex ist und setzen im Integral β = ρeiφ . Dies ergibt f¨ ur das Integral
+∞
e
2 x x −β 2 [k− 2ρ 2 sin 2φ−i 2ρ2 cos 2φ]
+∞
dk =
e
−∞
x −β 2 [κ−i 2ρ 2 cos 2φ]
dκ .
(7.71)
−∞
Dabei haben wir l¨ angs der reellen k-Achse eine Translation gemacht und die neue Variable κ = k − 2ρx2 sin 2φ eingef¨ uhrt, wodurch sich das Integral im Intervall (−∞, +∞) nicht ¨ andert. Zur Berechnung des letzten Integrals gehen 2 2 wir ¨ ahnlich vor wie vorhin. Die Funktion f (z) = e−β z ist jedenfalls regul¨ar und wir k¨ onnen in der unteren H¨ alfte der z-Ebene wiederum ein Rechteck im Intervall −R ≤ κ ≤ +R betrachten, wo bei festem R in y-Richtung u ¨ ber 0 ≥ y ≥ − 2ρx2 cos 2φ zu integrieren ist. Dies ergibt
+R
e
−β 2 κ2
dκ + i
−R
x − 2ρ 2 cos 2φ
e−β
0 +R
e
+
2 x −β 2 [κ−i 2ρ 2 cos 2φ]
dκ + i
−R
2
(r+iy)2
dy
0
x − 2ρ 2 cos 2φ
e−β
2
(−R+iy)2
(7.72) dy = 0 .
Da aber β = ρeiφ ist, wird das zweite und das letzte Integral dieser Gleichung verschwinden, wenn R → ∞ geht, solange φ = π2 ist. Anstelle des zweiten Integrals in (7.71) haben wir daher ersichtlich nur mehr das erste Integral in (7.72) zu berechnen. Hier k¨ onnen wir ¨ ahnlich vorgehen, wie bei der Berechnung der Fresnel’schen Integrale in Beispiel 2. Zun¨achst k¨onnen wir wegen 2 2 der Symmetrie der Funktion e−β κ setzen
+∞
−∞
e−β
2
κ2
dκ = 2
+∞
e−β
2
κ2
dκ
(7.73)
0
und dann das geschlossene Linienintegral der Abb. 7.5 betrachten. Dabei setzen wir nun explizit β = ρeiφ und f¨ uhren in der komplexen κ-Ebene ebene
240
7 Theorie komplexer Funktionen
Abbildung 7.5. Rotation in der Gauß’schen Zahlenebene
Polarkoordinaten ein. Dies ergibt die Folge von Integralen ∞ −φ −β 2 κ2 −ρ2 R2 e2i(φ+ϕ) iϕ −iφ 2 e dκ + 2i e R e dϕ + 2e 0
0
0
2 2
e−ρ
r
dr = 0 .
R
(7.74) F¨ ur R → ∞ strebt das mittlere Integral gegen Null und wir erhalten daher √ ∞ 2 2 π 2e−iφ ∞ −s2 . (7.75) e−β κ dκ = e ds = 2 ρ β 0 0 Bei Beachtung der Gleichungen (7.71) bis (7.74) ist das letzte Integral aber identisch mit dem Integral in (7.70). Daher erhalten wir f¨ ur die gesuchte L¨ osung der Schr¨ odinger-Gleichung (7.60) mithilfe der Normierungsamplitude A und der Definition von β 4 * 5 2 x2 5 α 2 2 − α2α x 2 A − 4β2 π 6 t 1+i m e Φ(x, t) = = . (7.76) e 2 2αβ 1 + i 2αm t Ersichtlich zerfließt das zur Zeit t = 0 vorgegebene Wellenpaket (7.61) im Laufe der Zeit. Die Amplitude nimmt ab und die Breite des Paketes nimmt zu. Dieses Zerfließen war von Bedeutung bei der Entwicklung der Quantentheorie und ihrer Interpretation. Aus den vorgef¨ uhrten Beispielen ist ersichtlich, dass man sich zur Vereinfachung der Rechnungen bei der L¨ osung physikalischer Probleme komplexer Funktionen und Integrale bedient. Dabei wird angenommen, dass die reellen Funktionen der Physik regul¨ are Fortsetzungen ins komplexe Gebiet besitzen. Vielfach haben dann sowohl Realteil als auch Imagin¨arteil dieser Funktionen oder Integrale physikalische Bedeutung. Ein Paradebeispiel dieser Art sind die ,,Dispersionsrelationen“, die wir sp¨ ater kennen lernen werden. (Siehe ¨ Abschn. 7.4.3, Ubungsaufgabe 13)
7.3 Integration im komplexen Gebiet
241
7.3.3 Der Fundamentalsatz f¨ ur mehrfach zusammenh¨ angende Bereiche Wir betrachten den in Abb. 7.6 dargestellten Bereich B, der zweifach zusammenh¨ angend ist und durch die a ¨ußere geschlossene Kurve C1 und die innere Kurve C2 begrenzt ist. Wir fragen, wie auf den Bereich B zwischen den beiden Kurven der Cauchy’sche Fundamentalsatz angewandt werden kann. Dazu f¨ uhren wir an irgend einer Stelle einen Steg S zwischen den beiden Kurven ein und betrachten folgendes, geschlossenes Linienintegral. Wir durchlaufen vom Steg S ausgehend die Kurve C1 entgegen dem Uhrzeigersinn, d. h. wir haben den Bereich B zu unserer Linken, bis wir wieder zu S zur¨ uckkehren. und umlaufen diese im Dann gelangen wir u ber den Steg S zur Kurve C ¨ 2 Uhrzeigersinn. Dabei haben wir jedenfalls wieder den umlaufenen Bereich B zu unserer Linken und gelangen so zum Steg zur¨ uck auf dem wir zu uckkehren. Durch diesen Trick haben wir aus einem zweifach zusamC1 zur¨ menh¨ angenden Bereich einen einfach zusammenh¨angenden konstruiert. Nun sei in der betrachteten z-Ebene eine regul¨ are Funktion f (z) gegeben und wir berechnen u ¨ ber f (z) das oben angegebene geschlossene Linienintegral, auf welches wir nun den Cauchy’schen Fundamentalsatz anwenden k¨onnen. Dann erhalten wir z2 z1 f (z)dz + f (z)dz + f (z)dz + f (z)dz = 0 . (7.77) C1
z1
C2
z2
Die beiden Integrale u ¨ber den Steg heben sich aber gegenseitig auf, da sie in entgegengesetzter Richtung durchlaufen werden. Schließlich ¨andern wir beim Integral u ¨ber C2 den Umlaufsinn, sodass diese Kurve nun auch im positiven Sinn umlaufen wird. Dabei ¨ andert das dritte Integral sein Vorzeichen und wir
Abbildung 7.6. Fundamentalsatz bei zusammenh¨ angendem Bereich
242
7 Theorie komplexer Funktionen
erhalten schließlich die sehr wichtige Beziehung f (z)dz = f (z)dz . C1
(7.78)
C2
Dieses Resultat kann leicht dadurch verallgemeinert werden, dass wir innerhalb einer geschlossenen Kurve C aus dem umlaufenen Bereich B mehrere L¨ ocher ausschneiden, die von den geschlossenen Kurven C1 , · · · Cn umlaufen werden. Dann brauchen wir nur die entsprechende Anzahl von Stegen ochern und und der ¨außeren Kurve einzuf¨ uhren S1 , · · · Sn zwischen den L¨ und die obige Vorgangsweise zu wiederholen. Auf diese Weise erhalten wir das Resultat n f (z)dz = f (z)dz , (7.79) C
k= 1
Ck
das von großem praktischen Nutzen ist, wie wir gleich sehen werden. Als wichtiges Anwendungsbeispiel des soeben gefundenen Resultates betrachten wir die Funktion f (z) = (z − z0 )n f¨ ur ganzzahliges n. Diese Funktion ist regul¨ ar f¨ ur n ≥ 0, jedoch meromorph f¨ ur n < 0 mit einem Pol n-ter Ordnung bei z = z0 . Wir betrachten das Linienintegral f (z)dz = (z − z0 )n dz (7.80) C
C
l¨ angs einer beliebigen geschlossenen Kurve C, die den Punkt z0 umschließt (vgl. Abb. 7.7). Um den Punkt z0 legen wir einen Kreis vom Radius ε und errichten einen Steg zwischen der Kurve C und dem Kreis K. Auf den so entstandenen zweifach zusammenh¨ angenden Bereich zwischen C und K wenden wir nun das Resultat (7.78) an. Zur Berechnung des Linienintegrals l¨angs des Kreises f¨ uhren wir Polarkoordinaten (r, ϕ) ein mit dem Ursprung bei z0 . Da z − z0 = εeiϕ und dz = iεeiϕ dϕ ist, erhalten wir 2π (z − z0 )n dz = (z − z0 )n dz = iεn+1 ei(n+1)ϕ dϕ C
K
0
& εn+1 % i2π(n+1) = e −1 =0, n+1
Dagegen erhalten wir f¨ ur n = −1 2π dz =i dϕ = 2πi . 0 C z − z0
n = −1 .
(7.81)
(7.82)
Damit haben wir das bemerkenswerte Resultat, dass das betrachtete Linienintegral f¨ ur alle ganzzahlige n verschwindet, außer f¨ ur n = −1, und dass der Wert dieses Integrals unabh¨ angig von ε → 0 ist. Dieses Ergebnis ist aufgrund der Beziehung verst¨ andlich, dass dz = d ln(z − z0 ) z − z0
(7.83)
7.3 Integration im komplexen Gebiet
243
Abbildung 7.7. Zum Fundamentalsatz bei einer Singularit¨ at
das totale Differenzial des Logarithmus darstellt. Wir haben aber bereits in Abschn. 2.2.7 erfahren, dass der Logarithmus in der komplexen Zahlenebene unendlich vieldeutig ist und sich in unserem Fall bei einmaligem, positivem Umlauf um den Windungspunkt z0 um den Wert 2πi vermehrt. 7.3.4 Die Integralformel von Cauchy Das letzte Ergebnis k¨ onnen wir sogleich dazu verwenden, um die Integralformel von Cauchy herzuleiten. Dazu betrachten wir eine im Bereich B der z-Ebene regul¨ are Funktion f (z) und bilden mit ihr die folgende meromorphe Funktion f (z) g(z) = , (7.84) z−ζ die an der Stelle z = ζ einen Pol erster Ordnung besitzt. Wir bilden das geschlossene Linienintegral u angs einer beliebigen Kurve C, die ganz ¨ber g(z) l¨ in B liegt und den Punkt ζ umschließt. Den Punkt ζ umschließen wir mit einem kleinen Kreis vom Radius ε und f¨ uhren dort Polarkoordinaten z − ζ = εeiϕ ein. Dann k¨ onnen wir die Beziehungen (7.78) und (7.82) anwenden und erhalten 2π f (z) f [ζ + (z − ζ)] dz = d(z − ζ) = i g(z)dz = f (ζ + εeiϕ )dϕ . z − ζ z − ζ 0 C C K (7.85) Da jedoch f (z) regul¨ ar ist, k¨ onnen wir setzen f (ζ +εeiϕ ) = f (ζ)+f (ζ)εeiϕ + iϕ ur ε → 0 die Integralformel von Cauchy δ(ζ)εe und wir erhalten daher f¨ f (z) 1 dz , (7.86) f (ζ) = 2πi C z − ζ
244
7 Theorie komplexer Funktionen
wonach die Werte einer regul¨ aren Funktion f (z) im Inneren einer geschlossenen Kurve C in der komplexen Zahlenebene aus ihren Werten l¨angs C berechnet werden k¨ onnen. Es ist jedoch zu beachten, dass man die Randwer1 f¨ ur z = ζ te auf C nicht willk¨ urlich vorschreiben kann. Da die Funktion z−ζ eine regul¨ are Funktion ist, k¨ onnen wir die Cauchy’sche Integralformel unter dem Integralzeichen nach ζ differenzieren. So erhalten wir 1 f (z) dz . (7.87) f (ζ) = 2πi C (z − ζ)2 Die Funktion unter dem Integralzeichen l¨ asst sich aber neuerlich nach ζ differenzieren und wir k¨ onnen damit beliebig oft fortfahren. Damit gelangen wir allgemein zur n-ten Ableitung f (z) n! dz , n = 1, 2, · · · , (7.88) f (n) (ζ) = 2πi C (z − ζ)n+1 d. h. eine regul¨ are Funktion l¨ asst sich beliebig oft differenzieren. Daher erhebt sich die Frage, kann man eine regul¨ are Funktion in der Umgebung des Punktes ζ in eine Taylor-Reihe entwickeln. Dazu betrachten wir die Funkti1 , die wir auch im komplexen Gebiet in folgender Weise in eine on [z−(ζ+h)] gleichm¨ aßig konvergente geometrische Reihe entwickeln k¨onnen ∞ 1 1 hn 1 1 = = h z − (ζ + h) z − ζ 1 − z−ζ z − ζ n= 0 (z − ζ)n
(7.89)
vorausgesetzt, dass |h| < min |z − ζ| ist, d. h. der Kreis vom Radius R = |h| an einer Stelle z in minimalem Abstand die Kurve C ber¨ uhrt. Dieser Kreis ist dann der Konvergenzkreis der Reihenentwicklung. Setzen wir die Reihe (7.89) in die Cauchy’sche Integralformel ein und vertauschen wegen der gleichm¨ aßigen Konvergenz der Reihe die Summation mit der Integration, so erhalten wir mithilfe von (7.88) die Taylor’sche Reihenentwicklung in der komplexen Zahlenebene f (ζ + h) =
∞ f (n) (ζ) n h . n! n= 0
(7.90)
Damit haben wir im Nachhinein auch eine Rechtfertigung f¨ ur unsere Reihenentwicklung bei der Untersuchung der singul¨aren Punkte in Abschn. 7.2.4 gefunden. Cauchy’s Integralformel (7.86) gestattet auch noch die Herleitung zweier interessanter Resultate. Dazu w¨ ahlen wir als geschlossene Kurve C einen Kreis vom Radius R um den Punkt ζ und f¨ uhren Polarkoordinaten ein. Dies ergibt mit z − ζ = Reiϕ f (ζ) =
1 2π
2π 0
f (ζ + R eiϕ )dϕ .
(7.91)
7.3 Integration im komplexen Gebiet
245
Dieses Ergebnis besagt, dass der Wert der Funktion im Zentrum des Kreises gleich ist dem Mittelwert der Funktion auf dem Umfang des Kreises. Wenn nun |f (ζ + R eiϕ )| ≤ M ist, wo M der maximale Wert der Funktion auf dem Kreis, so folgt |f (ζ)| ≤ M , d. h. das Maximum der Funktion f (ζ) kann nicht innerhalb des Kreises liegen, ausgenommen die Funktion f (z) ist eine Konstante. Als n¨achstes betrachten wir die Ableitung der Funktion f (ζ) im Zentrum des Kreises vom Radius R. Dies ergibt wegen (7.87) f (ζ) =
1 2πR
2π
f (ζ + R eiϕ )e−iϕ dϕ
(7.92)
0
und wenn |f (ζ + R eiϕ )e−iϕ | ≤ M ist, so folgt |f (ζ)| ≤ M R . Angenommen, die Funktion f (ζ) sei in der abgeschlossenen komplexen Zahlenebene regul¨ar, also u onnen wir bei endlichem M (R), R → ∞ ¨berall endlich und stetig. Dann k¨ streben lassen und erhalten so die Aussage, dass dann f¨ ur einen beliebigen Punkt ζ in der abgeschlossenen komplexen Zahlenebene f (ζ) = 0 ist. Also ist eine in der abgeschlossenen Zahlenebene u ¨berall regul¨are Funktion eine Konstante. Dies ist der bereits erw¨ ahnte Satz von Liouville. Beispiel Das Poisson’sche Integral: In Abschn. 4.2 haben wir die Randbedingungen kennen gelernt, unter denen eine partielle Differenzialgleichung vom elliptischen Typus eine eindeutige L¨ osung besitzt. Eine dieser Randbedingungen war die Dirichlet-Bedingung, wonach auf einer geschlossenen Berandung f¨ ur die L¨ osung, etwa der Laplace’schen Differenzialgleichung, bestimmte Werte vorgegeben werden k¨ onnen. Die Cauchy’sche Integralformel (7.86) macht f¨ ur eine Funktion f (z) in der komplexen Zahlenebene eine ¨ahnliche Aussage. Da wir sahen, dass die Real- und Imagin¨ arteile u(x, y) und v(x, y) einer analytischen Funktion der Laplace’schen Differenzialgleichung gen¨ ugen, ist anzunehmen, dass zwischen dem Dirichlet-Problem in der Ebene und der Cauchy’schen Integralformel ein enger Zusammenhang besteht. Um dies zu zeigen, wenden wir die Cauchy’sche Integralformel auf einen Kreis vom Radius R an, dessen Zentrum mit dem Ursprung der z-Ebene zusammenf¨allt. Punkte auf dem Umfang des Kreises werden durch die Polarkoordinaten Z = R eiφ beschrieben (vgl. Abb. 7.8) und Punkte im Inneren des Kreises durch z = reiϕ . Dann lautet in diesem Fall die Cauchy’sche Integralformel 2π f (Reiφ ) 1 f (reiϕ ) = R eiφ dφ . (7.93) 2π 0 Reiφ − reiϕ Ferner w¨ ahlen wir außerhalb des Kreises einen Punkt z1 = r1 eiϕ , dessen Ra2 dius im Verh¨ altnis reziproker Radien gew¨ ahlt wurde, d. h. r1 = Rr . Da dieser Punkt außerhalb des Kreises liegt, ist entsprechend innerhalb des Kreises f (Z) regul¨ ar und daher liefert der Cauchy’sche Fundamentaldie Funktion Z−z 1
246
7 Theorie komplexer Funktionen
Abbildung 7.8. Zum Poisson-Integral
satz 1 2π
2π 0
f (Reiφ ) R eiφ dφ = 0 . Reiφ − r1 eiϕ
(7.94)
Jetzt subtrahieren wir das Integral (7.94) vom Integral (7.93) und erhalten 2π 1 1 1 − f (reiϕ ) = f (Reiφ )R eiφ dφ . (7.95) 2π 0 Reiφ − reiϕ Reiφ − r1 eiϕ Nun machen wir bei den beiden Summanden unter dem Integral zun¨achst den Nenner reell, indem wir mit dem jeweiligen konjugiert komplexen Ausdruck 2 multiplizieren und beachten, dass r1 = Rr ist. Dann k¨onnen wir beide Terme auf gleichen Nenner bringen. Dies ergibt 2π R2 − r 2 1 f (Reiφ )dφ . (7.96) f (reiϕ ) = 2 2 2π 0 R + r − 2Rr cos(φ − ϕ) Schließlich zerlegen wir beide Seiten in Real- und Imagin¨arteil und finden auf diese Weise f¨ ur den Realteil 2π R2 − r 2 1 u(R, φ)dφ . (7.97) u(r, ϕ) = 2π 0 R2 + r2 − 2Rr cos(φ − ϕ) Dies ist das Poisson’sche Integral. Es stellt die L¨osung des Dirichlet-Problems der Laplace’schen Differenzialgleichung f¨ ur den Kreis dar. Wenn auf dem Kreis die Werte u(R, φ) vorgegeben sind, so l¨asst sich mit der Formel (7.97) die L¨ osung f¨ ur Punkte im Inneren des Kreises berechnen. Insbesondere er-
7.3 Integration im komplexen Gebiet
halten wir f¨ ur das Zentrum des Kreises 2π 1 u(0, 0) = u(R, φ)dφ . 2π 0
247
(7.98)
Demnach ist das Potenzial im Zentrum des Kreises gleich dem Mittelwert seiner Werte l¨ angs der Peripherie. Daraus k¨ onnen wir auch schließen, dass wegen der Stetigkeit von u(R, φ) diese Funktion in einem endlichen Bereich ein Maximum und ein Minimum haben muss und wegen (7.98) diese Extrema auf der Peripherie des Bereiches liegen m¨ ussen. Da aber ein Minimum des Potenzials im Gravitationsfeld wie im elektrostatischen Feld die Existenz eines stabilen Gleichgewichts bedeutet, kann es im Inneren eines Bereiches, wo ΔΦ = 0 erf¨ ullt ist, kein stabiles Gleichgewicht geben. 7.3.5 Analytische Fortsetzung Im Anschluss an unsere Diskussion der Taylor’schen Reihenentwicklung der Funktion f (z + h), gem¨ aß (7.90), in einem Bereich B der komplexen Zahlenebene k¨ onnen wir noch eine Bemerkung u ¨ ber die analytische Fortsetzung einer regul¨ aren Funktion machen. Wir betrachten in Abb. 7.9 die Taylor’schen Entwicklungen in der Umgebung zweier Punkte z1 und z2 mit den Konvergenzradien R1 und R2 . Wegen des Eindeutigkeitssatzes der Funktionentheorie ¨ m¨ ussen im Uberlappungsgebieten die beiden Taylor’schen Entwicklungen dieselben Funktionswerte ergeben. Auf diese Weise kann man eine analytische Funktion aus einem Gebiet in ein Nachbargebiet ausdehnen. Dieser Sachverhalt f¨ uhrt in der Physik zu der Annahme, dass physikalisch reelle Funktionen in die komplexe Zahlenebene analytisch fortgesetzt werden k¨onnen.
Abbildung 7.9. Zur analytischen Fortsetzung
248
7 Theorie komplexer Funktionen
7.3.6 Der Cauchy’sche Residuensatz Wir betrachten in einem Bereich B eine meromorphe Funktion f (z) und w¨ahlen eine geschlossene Kurve C derart, dass sich im Inneren von C etwa bei z = z0 ein Pol n-ter Ordnung der Funktion f (z) befinden m¨oge. Alle weiteren m¨ oglichen Pole der Funktion bei zi (i = 1, 2, 3, . . .) sollen außerhalb von C zu liegen kommen (siehe Abb. 7.10). Nun bilden wir l¨angs C das geschlossene Linienintegral u ¨ ber f (z) und entwickeln f (z) in der Umgebung von z0 gem¨aß (7.27) in die entsprechende Laurent-Reihe. Dies ergibt mithilfe von (7.81) und (7.82) f (z)dz =
∞ ν=− n
(z − z0 )n dz =
a(0) n C
∞
(0)
a(0) n Kε
ν=− n
(z − z0 )n dz = 2πia−1 . (7.99)
Dies ist der Residuensatz f¨ ur den einfachsten Fall eines einzigen Pols innerhalb der Kurve C. Eine einfache Verallgemeinerung ergibt sich, wenn die meromorphe Funktion f (z) innerhalb von C Pole an den Stellen z1 , z2 , z3 , . . . besitzt. Dann heben sich wiederum die Beitr¨ age der Stege, die zu den Kreisen uhren, gegenseitig auf und wir erhalten als VerallgeKεi (i = 1, 2, 3, . . .) f¨ meinerung von (7.99) f (z)dz = 2πi C
N
(j)
a−1 ,
j=1
Abbildung 7.10. Zum Residuensatz
(7.100)
7.3 Integration im komplexen Gebiet
249
wobei sich die Residuen f¨ ur Pole n-ter Ordnung in folgender Weise leicht berechnen lassen nj −1 d 1 (j) nj (z − z ) f (z) , (7.101) a−1 = j (nj − 1)! dz nj −1 z=zj w¨ ahrend wir f¨ ur Pole 1-ter Ordnung zu berechnen haben (j)
a−1 = [(z − zj )f (z)]z=zj .
(7.102)
7.3.7 Anwendungen des Residuensatzes Der Residuensatz stellt ein wichtiges Hilfsmittel dar, um bestimmte Integrale in der Physik berechnen zu k¨ onnen. Wenn wir es mit der Berechnung von Residuen im Unendlichen zu tun haben, ist es zweckm¨aßig, durch die Transformation z = ζ1 den Pol bei z = ∞ in der ζ-Ebene an die Stell ζ = 0 zu bringen und dort die weiteren Untersuchungen vorzunehmen. Ein anderer, f¨ ur die Physik interessanter Fall ist, wenn ein Pol bei z = z0 auf der geschlossenen Kurve C zu liegen kommt (siehe Abb. 7.11). In diesem Fall haben wir zwei M¨ oglichkeiten, den Beitrag dieses Pols zu ber¨ ucksichtigen. Entweder wir schließen durch einen kleinen Halbkreis Kε den Beitrag dieses Pols bei der Berechnung des geschlossenen Linienintegrals l¨angs C ein, wobei der Halbkreis im positiven Sinn (entgegen dem Uhrzeigersinn) durchlaufen wird, oder wir schließen den Beitrag dieses Pols durch einen kleinen Halbkreis von der Integration aus, wobei der Halbkreis dann in negativem Sinn (im Uhrzeiger-
Abbildung 7.11. Zum Residuensatz mit Pol bei z0 auf C
250
7 Theorie komplexer Funktionen
sinn) durchlaufen wird. Da bei diesem Verfahren nur ein halber Kreisumfang bei der Integration ber¨ ucksichtigt wird, ist der Beitrag des Residuums zum Integral (7.100) f¨ ur einen Pol auf der Kurve C durch (0)
±iπa−1 ,
+ bei Einschluss − bei Ausschluss
(7.103)
gegeben. Dasselbe Resultat kann auch erzielt werden, indem man den Pol bei z0 infinitesimal um den Betrag ε 0 in das Innere oder das ¨außere des ¨ Integrationsgebietes verschiebt. Diesen Uberlegungen liegen die Rechnungen zugrunde, welche auf die Beziehung (7.99) f¨ uhrten. Bei einigen Anwendungen des Residuensatzes auf physikalische Probleme ist von besonderem Interesse, wenn ein Teil des Integrationsweges der Kurve C durch die reelle x-Achse bestimmt wird und wir u ¨ber eine meromorphe Funktion f (z) zu integrieren haben, die auf der reellen Achse bei x = x0 einen Pol 1. Ordnung besitzt und entweder in der oberen oder unteren komplexen Halbebene eine Reihe weiterer Pole bei z1 , z2 , z3 , · · · hat. Wir betrachten den Fall, bei dem die geschlossene Kurve C durch die reelle x-Achse und einen Halbkreis in der oberen komplexen Zahlenebene bestimmt ist (vgl. Abb. 7.12). Dann ist das Residuum f¨ ur den Pol auf der x-Achse entsprechend (7.102) gegeben durch (0) (7.104) a−1 = [(z − x0 )f (z)]z=x0 und der Residuensatz f¨ ur den betrachteten Fall lautet dann (0) f (z)dz = P f (z)dz ± iπa−1 C
C(ε→0)
= 2πi
(0)
a−1 +
N (j) a−1 , j=1 (j) N j=1 a−1 ,
bei positivem Umlauf bei negativem Umlauf
(7.105) des Kε .
Abbildung 7.12. Residuensatz bei einem Pol auf der x-Achse
7.3 Integration im komplexen Gebiet
251
Daraus ergibt sich dann f¨ ur den sogenannten Cauchy’schen Hauptwert des Integrals l¨ angs der Kurve C ⎤ ⎡ (0) N a−1 (j) + (7.106) f (z)dz = 2πi ⎣ a−1 ⎦ . P 2 C(ε→0) j=1 Dieser stellt den Mittelwert der Integration l¨ angs C dar, bei welcher der Beitrag des Residuums auf der reellen x-Achse nur zur H¨alfte ber¨ ucksichtigt wird. Analog geht man bei der Berechnung eines Linienintegrals vor, wenn als Integrationsweg neben der reellen x-Achse ein Halbkreis in der unteren H¨alfte der komplexen Zahlenebene ber¨ ucksichtigt wird. Dabei ist dann zu beachten, dass in diesem Fall die geschlossene Kurve C in negativem Sinn durchlaufen wird, was beim Residuensatz zu einer Vorzeichen¨anderung f¨ uhrt. Einen interessanten Spezialfall liefert die Funktion f (z) =
g(z) , z − (x0 ± iε)
(7.107)
bei welcher die Funktion g(z) entweder in der oberen oder unteren komplexen Zahlenebene eine regul¨ are Funktion darstellt und der Nenner z − (x0 ± iε) bewirkt, dass die Funktion f (z) auf der reellen x-Achse bei x0 einen Pol erster Ordnung besitzt, dessen Residuum jeweils dadurch bei der Integration zur H¨ alfte ber¨ ucksichtigt werden kann, indem man zu x0 einen infinitesimalen imagin¨ aren Anteil ±iε hinzuf¨ ugt, der f¨ ur ε → 0 dazu f¨ uhrt, dass der Beitrag des Residuum bei der Integration entweder zur H¨alfte hinzugef¨ ugt oder abgezogen wird. In diesem Fall ergibt dann die Anwendung des Residuensatzes, da sich jetzt weder in der oberen noch in der unteren komplexen Zahlenebene weitere Singularit¨ aten befinden, als Spezialfall von (7.105) g(z) g(z) dz = P f (z)dz = dz ± iπg(x0 ) C C z − (x0 ± iε) C(ε→0) z − x0 g(x0 ) bei Einschluss + iε = 2πi . (7.108) 0 bei Ausschluss − iε Daher ist der Cauchy’sche Hauptwert des Integrals g(z) dz = iπg(x0 ) . P C(ε→0) z − x0 Daraus folgt unter anderem, dass das elementare Integral b b − x0 dx = ln f¨ ur b > x0 > a x − x a − x0 0 a
(7.109)
(7.110)
nur als Cauchy’scher Hauptwert definiert ist, d. h. die Singularit¨at bei x = x0 muss durch x0 ± iε von der Integration ausgeschlossen werden, bevor nach der Integration der Limes ε → 0 betrachtet wird.
252
7 Theorie komplexer Funktionen
7.3.8 Berechnung bestimmter Integrale Eine Anzahl von Integralen im reellen Gebiet lassen sich durch Ausf¨ uhrung geschlossener Linienintegrale in der komplexen Zahlenebene berechnen. Dabei liegt die Annahme zugrunde, die reelle Funktion habe eine analytische Fortsetzung in das komplexe Gebiet. Als geschlossene Kurve C in der komplexen Zahlenebene w¨ ahlt man, dem Problem entsprechend, neben der reellen x-Achse, oder Teilen davon, einen Halbkreis in der oberen oder unteren komplexen Halbebene, oder auch ein Kreissegment. In manchen F¨allen f¨ uhrt auch ein Vollkreis zum Ziel. Dabei wird der Kreis oder das Kreissegment so gew¨ ahlt, dass entweder der Wert des Linienintegrals l¨angs des Kreises vom Radius R bekannt ist, oder das Linienintegral l¨angs des Kreises f¨ ur R → ∞ verschwindet. a) Integration l¨angs des Einheitskreises Wir betrachten Integrale von der Form 2π F (cos ϑ, sin ϑ)dϑ ,
(7.111)
0
wo F eine rationale Funktion von cos ϑ und sin ϑ ist. Zur Erl¨auterung betrachten wir das Beispiel π dϑ I= , a, b > 0 . (7.112) a + b cos ϑ 0 Der Wert dieses Integrals ist aus Integraltabellen bekannt und gleich √a2π+b2 . Zur Berechnung beachten wir zun¨ achst, dass cos ϑ = cos(−ϑ) ist und setzen ϑ = ϑ − π. Dies ergibt 2π π dϑ dϑ = 2I = . (7.113) a − b cos ϑ −π a + b cos ϑ 0
Nun setzen wir z = eiϑ , sodass dz = izdϑ und cos ϑ = 12 (eiϑ + e−iϑ ) = 1 1 2 (z+ z ) sind und wir erhalten damit, wobei wir in der komplexen Zahlenebene l¨ angs eines Kreises vom Radius R = 1 integrieren dz dz 2 # $ 2I = = b 1 i 2az − bz 2 − b C=R=1 iz a − 2 (z + z ) 2 dz =− . (7.114) ib z 2 − 2( ab )z + 1 Nun berechnen wir die Residuen. Aus der quadratischen Gleichung z 2 −2( ab )z + 1 = 0 erhalten wir die Lage der Pole bei ! " / a b 2 1± 1−( ) z1,2 = b a
7.3 Integration im komplexen Gebiet
253
und schließen ferner, dass z1 · z2 = 1 ist und daher z1 > 1 und z2 < 1 sein * m¨ ussen. Daher ist nur der Pol bei z2 = ab 1 − 1 − ( ab )2 von Interesse, da er innerhalb des Kreises vom Radius R = 1 liegt. Die Berechnung des Residuums an der Stelle z2 liefert daher ⎧⎡ ⎛ ⎞⎤ ' 2 ⎨ b a (2) ⎠⎦ a−1 = ⎣z − ⎝1 − 1 − ⎩ b a ⎫ ⎪ ⎪ ⎬ 1
* * 2 2 ⎪ ⎪ ⎭ z − ab 1 − 1 − ab · z − ab 1 + 1 − ab z=z2
=−
b
b
* b 2 = − 2√a2 − b2 . 2a 1 − a (7.115)
Somit ist der Wert des Integrals l¨ angs des Einheitskreises b dz = −2πi √ a 2 2 z − 2( b )z + 1 2 a − b2 und daher
2 b 2π 2I = − (−2πi) √ = √ qed. bi 2 a2 − b 2 a2 − b 2
(7.116)
(7.117)
b) Integration bestimmter Integrale im Intervall −∞ < x < +∞ Die betrachteten Integrale sind von der Gestalt
+∞ −∞
f (x)dx = ±2πi
N j=1
(j)
a−1 ,
+ f¨ ur C in der oberen H.E. . − f¨ ur C in der unteren H.E.
(7.118)
Dabei hat die Funktion f (z) folgende Bedingungen zu erf¨ ullen: 1. f (z) muss meromorph in der oberen oder unteren komplexen Halbebene sein. 2. f (z) darf keine Pole auf der reellen x-Achse haben 3. zf (z) muss gleichm¨ aßig → 0 streben, wenn |z| = R → ∞ geht, f¨ ur 0 ≤ arg( zz∗ ) ≤ π. 4. xf (x) muss → 0, f¨ ur x → ±∞, was gleichbedeutend mit der Konvergenz des Integrals. Zur Demonstration betrachten wir das einfache Integral, welches elementar berechnet werden kann +∞ +∞ π dx dx =π. (7.119) =2 = 2 arctan x|∞ 0 = 2 2 2 1+x 2 −∞ 1 + x 0
254
7 Theorie komplexer Funktionen
Zur Integration in der komplexen Zahlenebene haben wir entsprechend die Funktion f (z) =
1 1 mit zf (z) → 0 , = 2 1+z (z + i)(z − i)
f¨ ur R → ∞ .
(7.120)
Die Funktion ist meromorph mit den beiden Polen bei z = ±i. Daher sind ihre Residua i 1 (±) (7.121) a−1 = [(z ∓ i)f (z)]z=±i = ± = ∓ . 2i 2 Wir k¨ onnen zum Beispiel den Halbkreis u ¨ber die obere komplexe Halbebene w¨ ahlen. Dann erhalten wir f¨ ur das Integral +∞ π dz dx R eiϕ f (z)dz = = + i lim dϕ 2 2 R→∞ 0 1 + R 2 ei2ϕ −∞ 1 + x C C 1+z
i (+) = 2πia−1 = 2πi − =π, (7.122) 2 wobei das Integral l¨ angs des Halbkreises verschwindet. Dasselbe Resultat h¨ atten wir auch mithilfe eines Halbkreises in der unteren komplexen Zahlenebene erhalten. c) Das Jordan’sche Lemma: Dieses gestattet die Berechnung folgender Integrale
+∞ −∞
f (x)eimx dx = 2πi
N
(j)
a−1
j=1
mit der oberen H.E. wenn m > 0 . mit der unteren H.E. wenn m < 0 (7.123)
Dabei muss f (z) folgende Bedingungen erf¨ ullen: 1. Die Funktion muss in der oberen oder unteren komplexen Zahlenebene meromorph sein. 2. Es muss f (z) → 0 streben, wenn |z| = R → ∞ geht, wobei 0 < arg( zz∗ ) < π. 3. m > 0 muss erf¨ ullt sein, wenn u ¨ ber die obere komplexe Halbebene integriert wird und m < 0 muss bei Integration u ¨ ber die untere Halbebene gelten, denn dann ist eimz f (z)dz = 0 . (7.124) lim R→∞
C=R
Von besonderem Interesse sind komplexe Funktionen von der Form f (z) = Pλ (z)/Qν (z), wobei ν > λ ist und die Funktionen Pλ (z) und Qν (z) Polynome darstellen, sodass f (z) eine rationale Funktion ist. Die Funktion f (z) darf auch Pole auf der x-Achse haben.
7.3 Integration im komplexen Gebiet
255
Als Beispiel w¨ ahlen wir die Berechnung des bekannten Integrals ∞ 1 +∞ sin x π sin x dx = dx = . (7.125) x 2 −∞ x 2 0 iz
In diesem Fall w¨ ahlen wir f (z) = ez und das Jordan’sche Lemma kann, da m = 1 > 0 und Pλ = 1, Qν = z sind angewandt werden. Die Funktion (0) f (z) hat bei z = 0 einen Pol erster Ordnung mit a−1 = [zf (z)]z=0 = 1. Der Integrationsweg ist neben der x-Achse ein Halbkreis vom Radius R in der oberen komplexen Halbebene. Wir schließen das Residuum bei z = 0 durch einen kleinen Halbkreis aus. Dann liefert der Residuensatz +∞ ix π iR eiϕ e e (0) dx + lim i f (z)dz = dϕ − iπa−1 = 0 . (7.126) iϕ R→∞ x −∞ 0 Re C− 12 Kε Hier verschwindet der Beitrag des Halbkreises vom Radius R → ∞ u ¨ ber die iϕ ur R → ∞, obere komplexe Zahlenebene, denn eiR e = eiR cos ϕ−R sin ϕ → 0 f¨ (0) und der negative Beitrag des Halbkreises Kε liefert −iπa−1 = −iπ. Also erhalten wir schließlich f¨ ur den Cauchy’schen Hauptwert des Integrals das Resultat +∞ +∞ +∞ ix e cos x sin x dx = P dx + iP dx = iπ (7.127) P x x x −∞ −∞ −∞ und schließen daraus nach Trennung in Real- und Imagin¨arteil +∞ +∞ cos x sin x P dx = 0 , P dx = π . x x −∞ −∞
(7.128)
−iz
Ganz ¨ ahnlich kann man auch die Funktion f (z) = e z betrachten, bei der m = −1 ist und demnach die Integration l¨ angs der x-Achse durch die Integration u ¨ber einen Halbkreis mit R → ∞ in der unteren komplexen Zahlenebene erg¨ anzt werden muss. In diesem Fall kann der Pol bei z = 0 auch durch einen Halbkreis Kε eingeschlossen werden und man findet als Endergebnis dasselbe Resultat (7.128). Beispiele 1. Die Green-Funktion der Helmholtz-Gleichung: Ein f¨ ur die Physik interessantes Anwendungsbeispiel des Jordan’schen Lemmas ist die Auffindung der Green-Funktion der Helmholtz’schen Differenzialgleichung. Wir haben bereits in Abschn. 4.4.4 gesehen, dass diese Green-Funktion der Differenzialgleichung (4.82) gen¨ ugt und wir schreiben sie f¨ ur das folgende nochmals an (7.129) ΔG(r, r ) + k 2 G(r, r ) = −δ(r − r )
256
7 Theorie komplexer Funktionen
und l¨ osen diese Gleichung im unendlichen Raum mithilfe der Fourier-Integraltransformation. Gem¨ aß Abschn. 3.3 (3.23) machen wir die Fourier-Ans¨atze und ber¨ ucksichtigen dabei, dass G nur von r − r abh¨angen kann +∞ 1 G(r − r ) = eik ·(r−r ) F (k )dk , 3 (2π) −∞ (7.130) +∞ 1 ik ·(r−r ) e dk . δ(r − r ) = (2π)3 −∞ Dabei haben wir die Definition (2.104) der Dirac’schen δ-Funktion verwendet. Setzt man dies in die obige Differenzialgleichung der Green-Funktion ein und wendet den Laplace-Operator unter dem Integralzeichen an, so ergibt sich die Beziehung +∞ 1 [(−k 2 + k 2 )F (k ) + 1]eik ·(r−r ) dk = 0 . (7.131) (2π)3 −∞ wobei alle Terme auf die linke Seite der Integralbeziehung geschafft wurden. Diese Gleichung k¨ onnen wir nun mit e−ik ·(r−r ) multiplizieren, r − r = R taufen und u ¨ber R integrieren. Dies ergibt beim einsetzen in (7.131) +∞ [(−k 2 + k 2 )F (k ) + 1]δ(k − k )dk = (−k 2 + k 2 )F (k ) + 1 = 0 −∞
(7.132)
und daher ist F (k ) =
k 2
1 . − k2
(7.133)
Wenn wir dies in die Fourier-Integraldarstellung der Green-Funktion (7.130) einsetzen, erkennen wir sogleich, dass es zweckm¨aßig ist, im k-Raum Kugeluhren, da die Funktion F (k ) = F (k ) winkelunkoordinaten k , θ, φ einzuf¨ abh¨ angig ist und die verbleibende Winkelintegration elementar durchgef¨ uhrt werden kann. Wir erhalten, indem wir r − r zur Polarachse der Winkelintegration machen G(|r − r |) =
1 (2π)3
0
∞
k 2 dk k 2 − k 2
2π
dφ 0
π
eik |r−r | cos θ sin θdθ (7.134)
0
und sehen sogleich, dass die Integration u ¨ ber φ den Faktor 2π liefert, w¨ahrend f¨ ur die Integration u uhren k¨onnen. ¨ ber θ wir die neue Variable ξ = cos θ einf¨ Dies ergibt f¨ ur die Integration u ¨ ber θ 0
π
eik |r−r | cos θ sin θdθ =
+1
−1
eik |r−r |ξ dξ =
eik |r−r | − e−ik |r−r | . ik |r − r | (7.135)
7.3 Integration im komplexen Gebiet
257
Setzen wir die Resultate der Winkelintegration in (7.134) ein, so erhalten wir ∞ k dk ik |r−r | −i −ik |r−r | e . (7.136) G(|r − r |) = − e (2π)2 |r − r | 0 k 2 − k 2 Schließlich k¨ onnen wir bei der Integration u ¨ ber die zweite Exponentialfunktion k durch −k ersetzen und gelangen dabei zu folgender Integraldarstellung der Green-Funktion der Helmholtz-Gleichung ∞ k dk ik |r−r | −i e . (7.137) G(|r − r |) = (2π)2 |r − r | −∞ k 2 − k 2 Zur Berechnung dieses Integrals betrachten wir die komplexe Funktion f (z) =
z eiz|r−r | z 2 − k2
(7.138)
und wenden in der komplexen Zahlenebene auf das geschlossene Linienintegral zdz iz|r−r | e (7.139) 2 2 C z −k das Jordan’sche Lemma an. Als geschlossene Kurve C w¨ahlen wir neben der reellen x-Achse einen Halbkreis in der oberen komplexen Halbebene und beachten, dass f (z) auf der reellen x-Achse bei x = ±k Pole erster Ordnung hat. Den Beitrag des Pols bei x = −k schließen wir durch eine infinitesimale Verschiebung um −iε von der Integration aus und den Beitrag des Pols bei x = +k ber¨ ucksichtigen wir durch eine infinitesimale Verschiebung +iε. Wir betrachten also in der komplexen Zahlenebene den Integrationsweg der Abbildung 7.13 Da der Pol bei x = −k − iε durch einen kleinen Halbkreis in der oberen komplexen Zahlenebene ausgeschlossen wurde, haben wir nur das
Abbildung 7.13. Zur Green-Funktion der Helmholtz-Gleichung
258
7 Theorie komplexer Funktionen
Residuum f¨ ur den Pol bei x = k + iε zu berechnen. Wir erhalten (0)+
a−1 = {[z − (k + iε)]f (z)}z=k0 +iε zeiz|r−r | = [z − (k + iε)] [z − (k + iε)][z + (k + iε)]
z=k+iε
1 (k + iε)ei(k+iε)|r−r | = eik|r−r | . = 2(k + iε) 2
(7.140)
Folglich liefert der Residuensatz zdz iz|r−r | f (z)dz = e 2 2 C+ 12 Kε C+ 12 Kε z − k +∞ k dk ik |r−r | =P e 2 2 −∞ k − k 2π R2 ei2ϕ dϕ iR eiϕ |r−r | 1 + lim i e + iπ eik|r−r | 2 i2ϕ 2 R→∞ R e −k 2 0 1 ik|r−r | = 2iπ e (7.141) 2 und wir erhalten f¨ ur das gesuchte Integral +∞ k dk ik |r−r | P e = iπeik|r−r | , 2 2 k − k −∞
(7.142)
sodass schließlich mit (7.137) die gesuchte Green-Funktion der HelmholtzGleichung lautet
G(+) (r, r ) =
−i eik|r−r | iπeik|r−r | = 2 (2π) |r − r | 4π|r − r |
(7.143)
¨ und dieses Resultat ist in Ubereinstimmung mit dem Resultat (4.87) von Abschn. 4.4.4 f¨ ur die retardierte Green-Funktion der Helmholtz-Gleichung. H¨ atten wir bei der Integration in Abb. 7.13 den Pol bei z = k0 − iε in die Integration eingeschlossen und jenen bei z = −k0 + iε von der Integration ausgeschlossen, w¨ aren wir zur avancierten Green’schen Funktion
G(−) (r, r ) =
−i e−ik|r−r | (−i)πe−ik|r−r | = − 2 (2π) |r − r | 4π|r − r |
(7.144)
gelangt, die wir auch in Abschn. 4.4.4 bereits angegeben haben. 2. Die Green-Funktion der d’Alembert’schen Wellengleichung: Wir betrachten die d’Alembert-Gleichung f¨ ur den unendlichen Raum 1 ∂2 Δ − 2 2 ϕ(r, t) = −ρ(r, t) (7.145) c ∂t
7.3 Integration im komplexen Gebiet
259
mit der Annahme, dass die Quelldichte ρ(r, t) ∼ 1r → 0 f¨ ur r → ∞. Mit dem L¨ osungsansatz ϕ(r, t) = G(r, t; r , t )ρ(r , t )dr dt (7.146) erhalten wir bei Anwendung des d’Alembert-Operators Δ − Green-Funktion die Differenzialgleichung 1 ∂2 Δ − 2 2 G(r, t; r , t ) = −δ(r − r)δ(t − t) . c ∂t
1 ∂2 c2 ∂t2
f¨ ur die
(7.147)
Es gilt jedoch −δ(r − r)δ(t − t) = −
1 (2π)4
dkdωeik(r−r ) eiω(t−t ) ,
sodass wir f¨ ur die Green-Funktion den Ansatz machen k¨onnen 1 G(r − r ; t − t ) = dkdωG(k, ω)eik(r−r ) eiω(t−t ) (2π)4
(7.148)
(7.149)
und wenn wir beides in die Differenzialgleichung (7.147) einsetzen, erhalten wir die Beziehung
ω2 2 (7.150) dkdω −k + 2 G(k, ω) + 1 eik(r−r ) eiω(t−t ) = 0 , c woraus wir schließen G(k, ω) =
ω2
c2 , − (kc)2
sodass die Green-Funktion die Integraldarstellung besitzt c2 eiω(t−t ) ik(r−r ) G(r − r ; t − t ) = . dke dω (2π)4 ω 2 − (kc)2
(7.151)
(7.152)
Da dk = k 2 dkdΩ = k 2 dk sin ϑdϑdϕ und k(r − r ) = k|r − r | cos ϑ, k¨onnen wir wie in (7.135) die Winkelintegration ausf¨ uhren und erhalten +1 2πi ik|r−r | −ik|r−r | . e dΩeik(r−r ) = 2π dξeik|r−r |ξ = − − e |r − r | −1 (7.153) Setzen wir dies in (7.152) ein, so erhalten wir G(r − r ; t − t )
eiω(t−t ) kdk eik|r−r | − e−ik|r−r | dω 2 ω − (kc)2 0 ∞ c2 eiω(t−t ) ik|r−r | = −i kdke . (7.154) dω (2π)3 |r − r | −∞ ω 2 − (kc)2
= −i
c2 3 (2π) |r − r |
∞
260
7 Theorie komplexer Funktionen
Nun betrachten wir in diesem Ausdruck das Integral u uhren es in ¨ ber ω und f¨ eine geschlossene Linienintegration in der komplexen Zahlenebene u ¨ ber, also
+∞
dω −∞
eiω(t−t ) = ω 2 − (kc)2
dz C
eiz(t−t ) 2 z − (kc)2
(7.155)
und wenden darauf das Jordan’sche Lemma an. Um den Integrationsweg zu einem geschlossenen Linienintegral zu erg¨ anzen, w¨ahlen wir entweder einen Halbkreis in der oberen oder in der unteren H¨alfte der komplexen Zahlenebene (siehe Abb. 7.14). Auch hier haben wir es wieder mit der Berechnung einer retardierten oder einer avancierten Green-Funktion zu tun. Wir betrachten zuerst die retardierte Green-Funktion. Diese ist durch die folgende Anfangsbedingung gekennzeichnet: Gret (r − r ; t − t ) = 0 , Gret (r − r ; t − t ) = 0 ,
f¨ ur t − t > 0 , f¨ ur t − t < 0 ,
m = 1 , C1 (t − t > 0) m = −1 , C2 (t − t < 0) (7.156) und daher sind f¨ ur die Anwendung des Jordan-Lemmas die entsprechenden Halbkreise C1 , bzw. C2 zu w¨ ahlen, also f¨ ur m = 1 in der oberen H¨alfte der z-Ebene und f¨ ur m = −1 in der unteren H¨ alfte der z-Ebene. Ferner sind die beiden Pole bei x = ±kc um ε in die untere Halbebene verschoben, sodass sie nur f¨ ur t − t < 0 einen Beitrag zum Linienintegral liefern k¨onnen. Physikalisch gesehen ist diese Wahl der Anfangsbedingung ein Ausdruck des klassischen Kausalit¨ atsprinzips, wonach Ursachen vor den Wirkungen zu finden sein m¨ ussen. Die genannten Integrationswege sind in Abb. 7.14 eingezeichnet. Daher liefert das Jordan-Lemma f¨ ur das Integral (7.155) im Fall der ersten
Abbildung 7.14. Zur Green-Funktion der d’Alembert-Gleichung
7.3 Integration im komplexen Gebiet
261
Bedingung in (7.156) f¨ ur t − t > 0
dz C1
eiz(t−t ) =0 2 z − (kc)2
(7.157)
und im Fall der zweiten Bedingung f¨ ur t − t < 0
eiz(t−t ) (−kc) (+kc) dz 2 = −2πi a + a . −1 −1 z − (kc)2 C2
(7.158)
Doch liefert die Berechnung der beiden Residuen eiz(t−t ) 1 −ikc(t−t ) (−kc) a−1 = (z + kc) e =− (z + kc)(z − kc) 2kc z= −kc iz(t−t ) e 1 +ikc(t−t ) (+kc) e a−1 = (z − kc) = , (7.159) (z − kc)(z + kc) 2kc z= +kc
sodass wir erhalten eiz(t−t ) iπ +ikc(t−t ) −ikc(t−t ) e dz 2 = − − e z − (kc)2 kc C2
(7.160)
und folglich ergibt sich f¨ ur die retardierte Green-Funktion aufgrund von (7.154) Gret (r − r ; t − t ) +∞ c ik|r−r | +ikc(t−t ) −ikc(t−t ) e =− 2 dke − e 8π |r − r | −∞ +∞ c ik(|r−r |+c(t−t )) ik(|r−r |−c(t−t )) =− 2 dk e − e 8π |r − r | −∞
|r − r | |r − r | 1 − + =− δ t − t + δ t − t 4π|r − r | c c
1 |r − r | δ t − t − =− , (7.161) 4π|r − r | c da die zweite δ-Funktion wegen t − t > 0 verschwinden muss. In ¨ahnlicher Weise k¨ onnen wir auch die avancierte Green-Funktion auffinden, wenn wir ur t − t < 0 und in als Anfangsbedingung w¨ ahlen Gav (r − r ; t − t ) = 0 f¨ diesem Fall die beiden Pole bei x = ∓k0 in die obere H¨alfte der z-Ebene verschoben werden, damit die Green-Funktion der Anfangsbedingung gen¨ ugt. Die retardierte Green-Funktion ist f¨ ur alle klassischen Ausstrahlungsprozesse, wie Schallwellen, elektromagnetische Wellen und Gravitationswellen von Bedeutung, w¨ ahrend die retardierte als auch die avancierte Green-Funktion
262
7 Theorie komplexer Funktionen
in der Quantenfeldtheorie angetroffen wird. Mithilfe der retardierten GreenFunktion (7.161) k¨ onnen wir nun auch die retardierte L¨osung der d’AlembertGleichung angeben, denn wir setzen die Green-Funktion in (7.146) ein und erhalten
|r − r | 1 dr ρ(r , t ) δ t−t − ϕ(r, t) = dt 4π |r − r | c | dr ρ(r , t − |r−r ) 1 c . (7.162) = 4π |r − r |
7.4 Die Laplace-Transformation 7.4.1 Vorbemerkungen In Abschn. 3.3 haben wir bereits eingehend die Fourier-Integraltransformation (3.22) besprochen und in Abschn. 5.5.6 die Fourier-Bessel-Transformation (5.301) behandelt. Es gibt jedoch h¨ aufig F¨ alle, in denen die Fourier-Transformation nicht existiert. Wenn wir zum Beispiel die Funktion f (x) = a = const. ur die Fourier-Transformierten Inteoder f (x) = x3 betrachten, erhalten wir f¨ grale, welche nicht konvergieren. Bei vielen Funktionen kann aber das Divergenzproblem f¨ ur x → ∞ beseitigt werden, wenn wir die Funktion mit einem Konvergenz erzeugendem Faktor e−cx multiplizieren, wo der reelle Parameter c 0 sein kann. Obgleich dieser Faktor dann f¨ ur x → −∞ die Situation meist verschlechtern wird, gibt es sehr viele F¨ alle, bei denen man ausschließlich an Transformationen f¨ ur x > 0 interessiert ist. Um dies zu erreichen, f¨ uhrt man die Heaviside’sche Stufenfunktion, H(x) oder θ(x) genannt, ein, welche folgende Eigenschaften besitzt 0 f¨ ur x < 0 θ(x) = (7.163) 1 f¨ ur x > 0 und von der wir zeigen werden, dass ihre Ableitung θ (x) = δ(x), gleich der Dirac’schen δ-Funktion ist. 7.4.2 Definition der Laplace-Transformation Wenn wir die Fourier-Transformierte der Funktion f (x)e−cx θ(x) betrachten, so lautet diese gem¨ aß Abschn. 3.3 (3.22) +∞ f (x)e−cx θ(x)e−ikx dx (7.164) F (k) = −∞
und die inverse Transformation ist dann +∞ 1 −cx F (k)eikx dk . f (x)e θ(x) = 2π −∞
(7.165)
7.4 Die Laplace-Transformation
263
Nun ist es zweckm¨ aßig, eine neue Ver¨ anderliche s = c + ik ,
idk = ds
(7.166)
einzuf¨ uhren und die neue Funktion φ(s) ≡ F (k) zu definieren. Dann lauten die beiden vorangegangenen Integrale ∞ 1 φ(s) = f (x)e−sx dx , f (x)θ(x) = φ(s)esx ds , (7.167) 2πi C 0 wo der Integrationsweg l¨ angs C in der komplexen s-Ebene eine Gerade parallel zur iy-Achse darstellt. Die Funktion φ(s) = L[f (x)] nennt man die Laplace-Transformierte der Funktion f (x). Das Integral existiert nur in der rechten H¨ alfte der komplexen s-Ebene f¨ ur Res > c. In diesem Bereich ist φ(s) eine analytische Funktion, doch l¨ asst sie sich meist auch in die linke H¨alfte der Zahlenebene analytisch fortsetzen. Die zweite Formel in (7.167) nennt man die Laplace-Umkehrtransformation. Man beachte, dass f¨ ur x > 0 diese Transformation die Funktion f (x) ergibt, jedoch f¨ ur x < 0 automatisch Null liefert. Von nun an werden wir die Stufenfunktion θ(x) weglassen und die Laplace-Transformation in folgender Weise ausdr¨ ucken c+i∞ 1 φ(s)esx ds , (7.168) f (x) = 2πi c−i∞ wo c 0 der oben eingef¨ uhrte infinitesimale Parameter ist und stets angenommen wird, dass alle Funktionen f (x), deren Laplace-Transformierte aufzusuchen ist, f¨ ur x < 0 verschwinden. 7.4.3 Drei wichtige Theoreme Ihre Kenntnis ist bei der Berechnung der Laplace-Transformierten von Vorteil. 1. Verschiebungstheorem:
Wenn L[f (x)] =
∞
f (x)e−sx dx = φ(s)
(7.169)
0
ist, so ist L[e−ax f (x)] =
∞
f (x)e−(s+a)x dx = φ(s + a) .
(7.170)
0
2. Verschiebungstheorem: Wenn L[f (x)] = φ(s) ist, so ist ∞ dn L[xn f (x)] = xn f (x)e−sx dx = (−1)n n φ(s) , ds 0
(7.171)
wie durch Differenziation nach s unter dem Integralzeichen leicht nachgewiesen werden kann.
264
7 Theorie komplexer Funktionen
3. Der Faltungssatz Wenn L[f (x)] = φ(s) und L[g(x)] = ψ(s) sind, so ist
L
x
f (x − u)g(u)du = φ(s)ψ(s) .
(7.172)
(7.173)
0
Das Integral
x
f (x − u)g(u)du
(7.174)
0
wird gew¨ ohnlich die Faltung von f und g genannt und mit f ∗ g bezeichnet. Man erkennt sogleich an der Beziehung (7.173), dass L[f ∗ g] = L[g ∗ f ] sein muss. Zum Nachweis der G¨ ultigkeit von (7.173), f¨ uhren wir zun¨achst die Laplace-Transformation gem¨ aß (7.169) aus und dies ergibt x ∞ x L f (x − u)g(u)du = e−sx dx f (x − u)g(u)du . (7.175) 0
0
0
Danach vertauschen wir die Integrationsfolge. Dies ergibt zun¨achst eine Integration von x = u bis x = ∞ und dann eine Integration im Intervall (0 ≤ u < ∞). Auf diese Weise erh¨ alt das obige Integral die Gestalt ∞ ∞ g(u)du e−sx f (x − u)dx . (7.176) 0
u
Im zweiten dieser Integrale kann u als konstanter Parameter betrachtet werden. Wenn wir daher x − u = t taufen, so ist dx = dt und das Integral lautet dann ∞ ∞ ∞ ∞ g(u)du e−s(u+t) f (t)dt = g(u)e−su du f (t)e−st dt . (7.177) 0
0
0
0
Die beiden letzten Integrale sind ersichtlich die Laplace-Transformierten φ(s) und ψ(s), womit die G¨ ultigkeit von (7.173) nachgewiesen ist. Beispiel Laplace-Transformation der θ(x)-Funktion und der δ(x)-Funktion: Die Heaviside’sche Stufenfunktion wurde bereits in (7.163) definiert. Hier untersuchen wir den Fall, bei dem die Stufe an der Stelle x = a auftritt, sodass 1, x>a θ(x − a) = (7.178) 0, x a die Funktion das pl¨ otzliche Eintreten des Prozesses wiedergibt. Aus diesen Gr¨ unden ist es zweckm¨ aßig, bei der Anwendung der Laplace-Transformation, die Transformierte von θ(x − a) zu kennen. Wir betrachten daher ∞ θ(x − a)e−sx dx L[θ(x − a)] = 0 ∞ a −sx θ(x − a)e dx + θ(x − a)e−sx dx = 0 a ∞ e−sa , (7.179) = 0+ e−sx dx = s a wobei die Definition von θ(x − a) verwendet wurde. Wenn nun y(x − a) eine Funktion ist, die eine Laplace-Transformation zul¨asst, dann ist ∞ e−sx θ(x − a)y(x − a)dx L[θ(x − a)y(x − a)] = 0 a = e−sx θ(x − a)y(x − a)dx 0 ∞ e−sx θ(x − a)y(x − a)dx + a ∞ e−sx y(x − a)dx , (7.180) = 0+ a
wobei wieder die Definition (7.178) zur Anwendung kam. Taufen wir nun x − a = v, so geht das letzte Integral in den Ausdruck u ¨ ber ∞ e−s(v+a) y(v)dv = e−sa η(s) , (7.181) 0
wo η(s) die Laplace-Transformierte von y(x) bezeichnet. Daher gilt L[θ(x − a)y(x − a)] = e−sa η(s) .
(7.182)
Nun wollen wir als Anwendung uns mit der der Laplace-Transformierten der Dirac’schen δ-Funktion besch¨ aftigen. Die δ-Funktion und ihre Eigenschaften haben wir bereits eingehend in Abschn. 2.3.1 diskutiert. Wie wir bereits wissen, ist diese Funktion durch die Eigenschaften definiert δ(x − a) = 0 f¨ ur x = a und +∞
δ(x − a)dx = 1 ,
(7.183)
δ(x − a)f (x)dx = f (a)
(7.184)
−∞
sodass
+∞
−∞
266
7 Theorie komplexer Funktionen
ist. Wir haben bereits in (2.89,2.90) zwei Funktionen kennen gelernt, die im Limes die Eigenschaften der δ-Funktion besitzen. Eine weitere Funktion dieser Art ist folgendermaßen definiert / n −nx2 e δn (x) = , n = 1, 2, 3, · · · (7.185) π und mithilfe des vollst¨ andigen Gauß’schen Fehlerintegrals (5.11) von Abschn. 5.2 k¨ onnen wir sofort zeigen, dass +∞ / n −nx2 e dx = 1 (7.186) π −∞ ist. Folglich hat δn (x) die Eigenschaft, dass +∞ +∞ δn (x)dx = δ(x)dx = 1 lim n→∞
−∞
(7.187)
−∞
wird und es kann daher die δ-Funktion als der Limes einer Folge von GaußFunktionen betrachtet werden, deren Breite mit zunehmendem n abnimmt und gleichzeitig ihre H¨ ohe zunimmt, sodass der Fl¨acheninhalt unver¨andert gleich 1 bleibt. Wenn wir nun das Integral u ¨ ber die Funktion δ(x − a) im Intervall (−∞, x ) berechnen, so ergibt sich x 0 , f¨ ur x < a δ(x − a)dx = (7.188) = θ(x − a) , 1 , f¨ ur x > a −∞ wobei wir die Definition (7.178) der θ-Funktion ber¨ ucksichtigt haben. Daher erhalten wir durch formale Differenziation der letzten Gleichung nach x die Beziehung d θ(x − a) . (7.189) δ(x − a) = dx Dies zeigt ganz deutlich, dass die δ-Funktion keine Funktion im u ¨ blichen Sinne ist, da auf der rechten Seite dieser Gleichung die formale Differenziation einer unstetigen Funktion durchgef¨ uhrt wird. Schließlich k¨onnen wir auch mit der Eigenschaft (7.184) der δ-Funktion ihre Laplace-Transformierte berechnen und erhalten ∞ L[δ(x − a)] = e−sx δ(x − a)dx = e−sa , a > 0 . (7.190) 0
Mit diesem knappen Exkurs u ¨ ber die Laplace-Transformation wollen wir das Kapitel u ¨ ber die Theorie komplexer Funktionen abschließen. ¨ Ubungsaufgaben: 1. Pr¨ ufe, ob ez , z1 , z ∗ und z · z ∗ den Cauchy-Riemann’schen Differenzialgleichungen gen¨ ugen.
7.4 Die Laplace-Transformation
267
2. Zwei beliebige Funktionen u(x, y) und v(x, y), welche den Laplace-Gleichungen Δu = 0 und Δv = 0 gen¨ ugen, definieren keine analytische Funktion f (z) = u(x, y)+iv(x, y), vielmehr muss etwa die zu u(x, y) konjugierte Funktion v(x, y) mithilfe der Cauchy-Riemann’schen Differenzialgleichungen durch Integration gefunden werden. Berechne als Beispiel die zu u(x, y) =ex cos y konjugierte Funktion. 3. Berechne die Residuen von 2 z 1 exp z 1 f (z) = , , , . z−1 (exp(z) − 1)2 z(z − 1) (z + 2)(z 2 + z − 1) 2π dϕ 2π osung: J = √ ). 4. Berechne das Integral J = 0 2−cos ϕ , (L¨ 3 +∞ dx 5. Berechne das Integral J = −∞ x4 +a4 , a > 0, (L¨osung: J = a3π√2 ). Erg¨ anze zur L¨ osung den Integrationsweg durch einen Halbkreis in der oberen oder unteren komplexen +∞Halbebene. osung: J = 6. Berechne das Integral J = −∞ exp(ax)dx 1+exp x , wo 0 < a < 1, (L¨ π ahnlich dem der sin(aπ) ). Betrachte dazu ein geschlossenes Linienintegral, ¨ Abb. 7.4. +∞ 7. Berechne mit Cauchy’s Fundamentalsatz J = −∞ exp(ix2 )dx, (L¨osung π J = 2 (1 − i)). W¨ ahle einen Integrationsweg, wie der von Abb. 7.5. )dz 8. Berechne das Integral J = C exp(z (L¨ osung J = 2πiez ). z −z 2π dϕ 2π 9. Berechne das Integral J = 0 2−cos ϕ (L¨ osung J = √ ). 3 10. Berechne die Green-Funktion der eindimensionalen Schr¨odinger-Gleichung. Die Differenzialgleichung lautet 2 ∂ 2 ∂ G(x − x ; t − t ) − i G(x − x ; t − t ) = −δ(x − x )δ(t − t ) 2m ∂x2 ∂t (7.191) und die L¨ osung ist mit der Anfangsbedingung G = 0 f¨ ur t − t < 0 zu finden. Der L¨ osungsweg ist ¨ ahnlich dem bei der Auffindung der GreenFunktion der d’Alembert-Gleichung, doch ist hier bei der Integration in der komplexen Zahlenebene nur ein Pol zu umlaufen. L¨osung: / im(x − x )2 m −i exp G(x − x , t − t ) = . (7.192) 2πi(t − t ) 2(t − t ) −
11. Beweise den Mittelwertsatz der analytischen Funktionen. Wende das Cauchy-Integraltheorem auf einen Kreis vom Radius R an, in dessen Mittelpunkt z liegt. F¨ uhre Polarkoordinaten ein und integriere l¨angs des Kreises. Ein Fl¨ achenelement des Kreises ist R2 dϕ = dσ. L¨osung: 1 f (z) = dσf [z + R exp(iϕ)] . (7.193) 2πR2 F 12. Zwei beliebige L¨ osungen u(x, y) und v(x, y) der Laplace-Gleichungen Δu = 0 und Δv = 0 bilden keine analytische Funktion f (z) = u(x, y) +
268
13.
14. 15. 16.
7 Theorie komplexer Funktionen
iv(x, y). Finde zu gegebenem u(x, y) die entsprechende konjugierte Funktion v(x, y) mithilfe der Cauchy-Riemann’schen Differenzialgleichungen. Betrachte die Beziehung (7.108) und nehme an, g(z) sei in der oberen komplexen Halbebene regul¨ ar. Wenn f¨ ur |z| → ∞ gen¨ ugend rasch |g(z)| → 0 strebt, so gilt +∞ +∞ g(x )dx g(x )dx 2πig(x) f¨ ur (+1) = P ± iπg(x) = . 0 f¨ ur (−1) x − x −∞ x − x ∓ iε −∞ (7.194) Leite daraus zwei Integralbeziehungen zwischen Reg(x) und Img(x) ab. Diese Beziehungen werden Hilbert-Transformationen genannt und wurden in der Physik als Kramers-Kr¨ onig-Beziehungen bekannt, oder auch als Dispersionsrelationen. Berechne zu den Funktionen f (x) = 1, xn (n = 0, 1, 2, · · · ), eax , sin(ax), cos(ax), sinh(ax), cosh(ax) die Laplace-Transformierten φ(s). Berechne die Laplace-Transformierten der Ableitungen f (x) und f (x), wenn φ(s) die Laplace-Transformierte von f (x) ist. Finde die L¨ osung des klassischen linearen harmonischen Oszillators x ¨ + ω02 x = a sin ωt mithilfe der Laplace-Transformation.
8 Wahrscheinlichkeit und Statistik
8.1 Einleitende Bemerkungen Die Wahrscheinlichkeitstheorie und Statistik hat vielf¨altige Anwendungen nicht nur in der Physik und den technischen Wissenschaften sondern auch in den diversen Gl¨ ucksspielen, Verkehrsstatistiken, Feuer-, Kranken- und Unfallversicherungen und vieles andere mehr. Wir wollen hier nur die wichtigsten S¨ atze der Theorie behandeln, soweit sie f¨ ur die Physik und Technik von Bedeutung sind.
8.2 Kombinatorik Die Kenntnis der elementaren Gesetze der Kombinatorik ist f¨ ur alle statistischen Untersuchungen von großer Wichtigkeit und diese Gesetze sollen daher in den folgenden beiden Abschnitten eingehender erl¨autert werden. 8.2.1 Permutationen und Kombinationen Als Vorbereitung beginnen wir mit der Herleitung der wichtigsten Formeln der Kombinatorik, die f¨ ur die Anwendung der Wahrscheinlichkeitstheorie in der statistischen Mechanik von großer Bedeutung sind. Die wichtigsten S¨atze lauten folgendermaßen: 1. Die Anzahl der m¨ oglichen Vertauschungen oder Permutationen von N verschiedenen Objekten ist N !. Der einfache Beweis l¨auft etwa wie folgt: Das erste Objekt l¨ asst sich auf N verschiedene Positionen setzen. Sobald eine dieser Stellen besetzt ist, stehen noch N − 1 solche m¨ogliche Positionen f¨ ur das zweite Objekt zur Verf¨ ugung. Folglich k¨onnen diese beiden Objekte auf N (N − 1) verschiedene Weisen aufgeteilt werden, ohne die relative Aufteilung der u ¨ brigen N − 2 Objekte zu st¨oren. Nun kann das dritte Objekt N − 2 verschiedene Pl¨atze einnehmen, und so
270
8 Wahrscheinlichkeit und Statistik
fort. Die Gesamtzahl der m¨ oglichen Verteilungen der N Objekte ist daher N (N − 1)(N − 2) · · · 2 · 1 = N !. 2. Angenommen, es sollen die N Objekte auf R Stapelpl¨atze aufgeteilt werden, wobei die zul¨ assige Zahl der Objekte in jedem Stapel vorgegeben ist. Es sei die Zahl der Objekte auf dem ersten R Stapel gleich N1 , jene auf dem zweiten Stapel N2 , etc., derart dass i=1 Ni = N ist, wo R die obige Anzahl der Stapelpl¨ atze darstellt. Gesucht ist die Anzahl M aller m¨ oglichen Verteilungen dieser Art. Wenn M mit der Zahl der m¨oglichen Permutationen aller Objekte im ersten Stapel multipliziert wird, anschließend mit der Zahl der m¨ oglichen Permutationen der Objekte im zweiten Stapel und so weiter f¨ ur alle weiteren Stapel, m¨ ussen wir am Ende die Gesamtzahl der Permutationen von N Objekten erhalten, also ist M N1 !N2 ! · · · NR ! = N !
(8.1)
N! . N1 !N2 ! · · · NR !
(8.2)
und daher M=
Es gibt aber auch noch eine andere Problemstellung der Kombinatorik, die zum gleichen Resultat f¨ uhrt. Es sei angenommen, die N Objekte geh¨ oren zu R Klassen, deren Objekte alle v¨ollig gleichartig sind, d. h. sie lassen sich in keiner Weise voneinander unterscheiden. Die erste Klasse m¨ oge N1 Objekte enthalten, die zweite Klasse N2 , etc. Wir bemerken sofort, dass die Anzahl der m¨ oglichen unterscheidbaren Verteilungen der N Objekte mithilfe derselben Schlussweise wie oben erhalten werden kann. Folglich stellt M auch die Zahl der Verteilungen von N Elementen auf R Klassen dar, bei denen die Elemente in jeder Klasse untereinander identisch sind. 3. Die Anzahl der M¨ oglichkeiten mit der M Objekte aus einer Menge von ! . Dies folgt aus (8.2), N Objekten ausgew¨ ahlt werden kann ist M!(NN−M)! denn das Herausgreifen von M Objekten ist gleichbedeutend mit einer Aufteilung von N Objekten auf zwei Stapel, von denen der eine M Objekte und der andere M −N Objekte enth¨ alt. Diese Anzahl ist aber gleich N! N ≡ . (8.3) M !(N − M )! M Diese Zahl wird h¨ aufig als die Anzahl der Kombinationen von N Dingen zur M -ten Klasse genannt. Wir bemerken ferner, dass wegen der Identit¨at N N = , derselbe Ausdruck auch die Anzahl der Kombinationen M N −M von N Dingen zur (N − M )-ten Klasse angibt. Die Beziehung (8.3) beantwortet auch eine andere, davon scheinbar verschiedene Fragestellung. Wir nehmen an, wir h¨ atten N Boxen und eine kleine Anzahl M von nicht unterscheidbaren Objekte, welche auf diese Boxen in der Weise aufgeteilt werden sollen, dass keine dieser Boxen mehr als ein Objekt enth¨alt. Die erlaubte Anzahl dieser Verteilungen ist gleichfalls durch (8.3) gegeben,
8.2 Kombinatorik
271
denn die Zuteilung von M Objekten zu N Boxen ist v¨ollig ¨aquivalent mit der Auswahl von M Objekten aus einer Menge von N Objekten. 4. Sobald wir nach Punkt 3 eine gewisse Auswahl von M Objekten getroffen haben, liefert eine Permutation unter diesen M Objekten keine neue Kombination, jedoch f¨ uhrt es auf eine neue Anordnung dieser Objekte. Folglich wird es zu jeder Kombination der Form (8.3), M ! verschiedene Verteilungen der M Objekte geben. Daher ist dann die Gesamtzahl der m¨ oglichen Anordnungen von N Objekten zur M -ten Klasse gleich N N! . (8.4) M! = M (N − M )! Wenn wir bei dem obigen Problem der Aufteilung von M Objekten auf N Boxen mit N ≥ M ferner annehmen, dass die Objekte unterscheidbar sind, sodass wir uns nicht ausschließlich f¨ ur die einzelnen Boxen und deren Belegungen interessieren d¨ urfen, sondern auch auf die spezielle Verteilung der Objekte auf die Boxen achten m¨ ussen, wird jetzt die Beziehung (8.4) anzuwenden sein. Diese Beziehung gibt die Anzahl der M¨oglichkeiten an, mit der M untereinander unterscheidbare Objekte auf N Boxen aufgeteilt werden k¨ onnen, und zwar je ein oder kein Objekt pro Box. 5. Das Problem wird etwas komplizierter, wenn keine Einschr¨ankung vorliegt, wie viele Objekte sich in einer Box befinden d¨ urfen. Dazu bestimmen wir zun¨ achst die Anzahl der M¨ oglichkeiten M nicht unterscheidbare Objekte auf N Boxen aufzuteilen, wobei N ≥ M sein soll und sich dabei eine beliebige Anzahl von Objekten in einer Box befinden darf. Zun¨achst beachten wir, dass sich die Zahl M als eine Summe von T ganzen Zahlen auf
M −1 (8.5) NT = T −1 verschiedene Art und Weise darstellen l¨ asst, wie mithilfe von (8.3) oder durch Induktion nachgewiesen werden kann. Nun sei angenommen, dass die M Objekte auf T Stapel aufgeteilt wurden. Dann k¨onnen diese T voneinander unterscheidbare Stapel von Objekten auf N Boxen, in ¨ verschiedener Art und Weise aufgeUbereinstimmung mit (8.3), in N T teilt werden. Damit k¨ o nnen dann alle Verteilungen auf T Stapel in die N verschiedener Weise verteilt werden. Wenn wir schließBoxen in NT · N T lich dieses Produkt u oglichen T -Werte aufsummieren, erhalten ¨ber alle m¨ wir die gesuchte Anzahl von Verteilungen, n¨amlich
M M N N M −1 NT = . (8.6) T T T −1 T =1
T =1
asst sich diese Summe auch in folgender Weise ausdr¨ ucken Da N0 = 0 ist, l¨
M M N M −1 N M −1 = (8.7) T T T −1 M −T T =0
T =0
272
8 Wahrscheinlichkeit und Statistik
und wie wir sogleich zeigen werden, ist diese Summe gegeben durch
N +M −1 . (8.8) M Dieser Ausdruck stellt die gesamte Anzahl von M¨oglichkeiten dar, mit denen M nicht unterscheidbare Objekte auf N Boxen aufgeteilt werden k¨ onnen. Diese Zahl wird auch als die Anzahl der Kombinationen von Elementen mit Wiederholungen genannt. 6. Die Anzahl der M¨ oglichkeiten mit denen M unterscheidbare Objekte auf N Boxen aufgeteilt werden k¨ onnen ist nat¨ urlich NM ,
(8.9)
denn das erste Objekt kann in eine der N Boxen gesetzt werden. Zu jeder dieser Platzierungen des ersten Objekts gibt es wieder N m¨ogliche Platzierungen des zweiten Objekts und so fort. 8.2.2 Die Binomialkoeffizienten Die in (8.3) eingef¨ uhrten Binomialkoeffizienten sind erstmals in Arbeiten von Newton bei der Reihenentwicklung von (A + B)N zu finden, denn es ist N
(A + B)
N N = AT B N −T , T
(8.10)
T =0
wobei T ganze Zahlen sind. Die G¨ ultigkeit dieser Entwicklung ist nahe liegend, denn die Anzahl der M¨ oglichkeiten mit der T Faktoren A und (N − T ) Faktoren B aus N Faktoren (A + ahlt werden k¨onnen ist aufgrund ausgew¨ B) gegeben. Dabei ergeben sich die Speziunserer Beziehung (8.3) durch N T alf¨ alle N N N =1, =1, =1, (8.11) 0 1 N sodass
N =0, T
sobald ,
T >N
(8.12)
ist und dies beruht auf der Tatsache, dass (N − T )! = ∞ wird. Viele Beziehungen der Wahrscheinlichkeitstheorie gelten f¨ ur jene F¨alle, bei denen N keine ganze Zahl ist. Daher ist es zweckm¨ aßig, eine Verallgemeinerung der Binomialkoeffizienten zu definieren, n¨ amlich X X(X − 1)(X − 2) · · · (X − T + 1) . (8.13) = 1 · 2 · 3···T T Von besonderem Interesse ist auch die folgende Reihenentwicklung nach Bi der Koeffizient nomialkoeffizienten. Aufgrund der Beziehung (8.10) ist N +K R von AR B N +K−R in der Reihenentwicklung von (A+B)N +K . Ebenso gilt aber
8.2 Kombinatorik
!
" !
273
"
N K N K AT B N −T · AS B K−S T S T =0 S=0 K N = (8.14) AT +S B N +K−T −S . S T
(A + B)N (A + B)K =
S,T
Den Koeffizienten von AR B N +K−R in dieser Doppelsumme erhalten wir jedoch, indem wir T + S = R setzen und u ¨ ber T summieren. Daher ist
R N K N +K . = T R−T R
(8.15)
T =0
Diese Beziehung wird das Additionstheorem der Binomialkoeffizienten genannt. Mit seiner Hilfe lassen sich eine ganze Reihe weiterer Relationen herleiten. a) Setzt man K = 1 so folgt
N +1 N N = + . R R R−1
(8.16)
b) Wenn K = R = N wird, so ist
R N 2 N N N 2N . = = T N −T T N T =0
(8.17)
T =0
c) Aufgrund der Identit¨ at
−N R N +R−1 = (−1) , R R
(8.18)
k¨ onnen wir in (8.15) auch K = −1 setzen und erhalten so
R N N −1 R−T (−1) . = T R
(8.19)
T =0
d) Wenn wir schließlich in (8.10) A = B = 1 setzen, so ergibt das N N T =0
T
= 2N
(8.20)
und f¨ ur A = −B liefert Newton’s Formel N
N (−1) =0. T
T =0
T
(8.21)
274
8 Wahrscheinlichkeit und Statistik
8.3 Wahrscheinlichkeitstheorie 8.3.1 Definition der Wahrscheinlichkeit Eine Anzahl von Elementen, wie etwa eine Serie von Messdaten oder eine Folge von Operationen, etwa jene des W¨ urfelspiels, wird ein Wahrscheinlichkeitsaggregat oder eine Menge von Elementarereignissen genannt, sobald es gestattet ist, auf diese Menge die Regeln der Wahrscheinlichkeitsrechnung anzuwenden. Ob diese Anwendung der Regeln der Wahrscheinlichkeitstheorie zul¨ assig ist oder nicht, erfolgt in praktischen F¨allen meist intuitiv. Jedenfalls ist zum Beispiel die Darstellung eines Bruchs zweier ganzer Zahlen in der Form einer Dezimalzahl kein Wahrscheinlichkeitsaggregat, da die Aufeinanderfolge der Ziffern dieser Zahlenreihe durch ganz andere Regeln bestimmt ist, als im Gegensatz dazu die Reihe der Ergebnisse aufeinander folgender W¨ urfe mit einem W¨ urfel. Wann ein Aggregat von Ereignissen ein Wahrscheinlichkeitsaggregat darstellt, l¨ asst sich mathematisch genau pr¨azisieren, doch soll dies hier nicht weiter diskutiert werden. Von jedem Element einer Menge von Elementarereignissen wird angenommen, es habe eine bestimmte Anzahl S unterscheidbarer Eigenschaften. Zum Beispiel ist jeder Wurf eines W¨ urfels ein solches Element und die Zahl, die beim Wurf aufscheint, ist eine solche Eigenschaft, zum Beispiel S = 6. Bei der Messung einer physikalischen Gr¨ oße ist jedes Messergebnis ein Element des Aggregats und jeder Messwert eine Eigenschaft S. Wenn NI die Anzahl ist, mit der die I-te Eigenschaft auftritt und N die Gesamtzahl der Elemente des Aggregats darstellt, so definiert man NI N
(8.22)
als die relative H¨ aufigkeit mit der die Eigenschaft I auftritt. Als Wahrscheinlichkeit WI f¨ ur das Auftreten der Eigenschaft I definiert man dann den Grenzwert NI = WI . (8.23) lim N →∞ N Ohne auf die mathematisch komplexe Frage der Existenz dieses Limes einzugehen, nehmen wir hier an, dass dieser Limes existiert. Die Gesamtheit der Wahrscheinlichkeiten WI nennt man die Wahrscheinlichkeitsverteilung des Aggregats und wegen der Definition (8.23) der Wahrscheinlichkeiten WI ist offenbar I WI = 1. Die Eigenschaften der Elemente eines Aggregats, die wir mit S oder I bezeichnet haben, k¨ onnen diskret (wie beim W¨ urfelspiel) oder kontinuierlich (wie bei den Messergebnissen einer physikalischen Gr¨oße) sein. Im ersten Fall wird die Wahrscheinlichkeitsverteilung gelegentlich als eine arithmetische Verteilung bezeichnet und im zweiten Fall als eine geometrische Verteilung. Wenn wir es mit einer kontinuierlichen Verteilung zu tun haben, ist es zweckm¨ aßiger, eine andere Definition der Wahrscheinlichkeit zu verwenden.
8.3 Wahrscheinlichkeitstheorie
275
Anstelle der diskreten Parameter S oder I f¨ uhren wir den kontinuierlichen Eigenschaftsparameter X ein. Die Definition WX gem¨aß (8.23) ist dann gleich Null, doch die Wahrscheinlichkeit, dass der Parameter X, zum Beispiel bei einer Messung, zwischen X und X + ΔX zu liegen kommt, wird einen endlichen Wert haben und wird u ¨ berdies dem Element ΔX proportional sein, vorausgesetzt, ΔX ist ausreichend klein. Daher k¨onnen wir im Kontinuum der Eigenschaft X die Wahrscheinlichkeit in der Form definieren ΔW = W (X)ΔX
(8.24)
und die Funktion W (X), welche keine dimensionslose Gr¨oße ist und daher keine Wahrscheinlichkeit darstellt, wird als Wahrscheinlichkeitsdichte bezeichnet. Doch es muss gelten W (X)dX = 1 , (8.25) sobald das Integral u ¨ ber den gesamten Bereich der Eigenschaften X erstreckt wurde. 8.3.2 Mittelwert und quadratische Abweichung Wenn eine diskrete, WI , oder kontinuierliche, W (X), Wahrscheinlichkeitsverteilung gegeben ist, lassen sich bestimmte Gr¨oßen berechnen, die f¨ ur die statistischen Theorien von besonderem Interesse sind. Wir diskutieren im Folgenden die wichtigsten dieser Ausdr¨ ucke und formulieren sie gleichzeitig f¨ ur die F¨ alle arithmetischer und geometrischer Verteilungen. F¨ ur den ersten Fall nennen wir die Verteilungen WI und im zweiten Fall W (X). Wenn F (X) eine Funktion darstellt, die f¨ ur alle diskreten XI - oder kontinuierlichen X-Werte definiert ist, f¨ ur welche eine von Null verschiedene Wahrscheinlichkeitsverteilung W (X) existiert, dann ist der Mittelwert (auch Erwartungswert genannt) von F (X) in Bezug auf diese Verteilung durch folgende Ausdr¨ ucke gegeben ⎧ ⎫ ⎪ ⎪ F (XI )WI ⎪ ⎪ ⎨ ⎬ I (8.26) F = ⎪ ⎪ ⎪ ⎩ F (X)W (X)dX ⎪ ⎭ und die quadratische Abweichung vom Mittelwert (auch Streuung genannt) ist dann definiert durch ⎧ ⎫ ⎪ ⎪ [F (XI ) − F ]2 WI ⎪ ⎪ ⎨ ⎬ I 2 . (8.27) (ΔF ) = ⎪ ⎪ ⎪ ⎪ 2 ⎩ [F (X) − F ] W (X)dX ⎭
276
8 Wahrscheinlichkeit und Statistik
Wenn wir als Funktion F (X) die Variable X selbst w¨ahlen, erhalten wir f¨ ur den Erwartungswert ⎧ ⎫ ⎪ XI W (XI ) ⎪ ⎪ ⎪ ⎨ ⎬ I (8.28) X = ⎪ ⎪ ⎪ ⎩ ⎭ XW (X)dX ⎪ und f¨ ur die Streuung der Verteilung W (X) ⎧ ⎫ ⎪ [XI − X]2 W (XI ) ⎪ ⎪ ⎪ ⎨ ⎬ I 2 (ΔX) = . ⎪ ⎪ ⎪ ⎩ [X − X]2 W (X)dX ⎪ ⎭
(8.29)
Man nennt die Gr¨ oße σ = (ΔX)2 die Standardabweichung vom Mittelwert der Verteilung W (X). Aufgrund ihrer Definition ist einsichtig, dass σ ein Maß f¨ ur die Ausdehnung oder Breite von W (X) um seinen Mittelwert ist. Als das R-te Moment einer Verteilung bezeichnet man die Gr¨oße ⎧ ⎫ ⎪ XIR W (XI ) ⎪ ⎪ ⎪ ⎨ ⎬ I R . (8.30) X = ⎪ ⎪ ⎪ ⎩ ⎭ X R W (X)dX ⎪ Bei Verteilungen mit einem unendlichen Bereich von Eigenschaften, lassen sich nicht immer Momente h¨ oherer Ordnung angeben. Die Streuung (ΔX)2 einer Verteilung W (X) l¨ asst sich durch ihre ersten beiden Momente ausdr¨ ucken, denn aufgrund von (8.27) ist (ΔX)2 = X 2 − 2X2 + X2 = X 2 − X2 .
(8.31)
Unter gewissen Bedingungen kann man eine geometrische Wahrscheinlichkeitsverteilung in Gestalt einer Reihe nach ihren Momenten darstellen, vorausgesetzt die Momente der Verteilung existieren. Der Einfachheit wegen betrachten wir diese Momente in Bezug auf den Mittelwert X der Verteilung als Ursprung. Dann l¨ asst sich zeigen, dass die Verteilung W (X) folgende Darstellung zul¨ asst ∞ X2 X 1 CI − 2σ 2 1+ HI , (8.32) W (X) = √ e I! σ σ 2π I=3
wo die HI die I-ten Hermite-Polynome (5.352) von Abschn. 5.6.1 sind und die Koeffizienten CI folgende Werte haben C3 =
X 3 , σ3
C4 =
X 4 −3, σ4
C5 =
X 5 X 3 − 10 . σ5 σ3
(8.33)
8.4 Spezielle Verteilungen
277
Diese Entwicklung von W (X) ist besonders dann von Nutzen, wenn W (X) nicht allzu stark von der Gauß-Verteilung X2 1 W (X) = √ e− 2σ2 σ 2π
(8.34)
abweicht.
8.4 Spezielle Verteilungen Ein Problem, welches in der statistischen Mechanik und in der Fehlertheorie von grundlegender Bedeutung ist, wollen wir noch etwas eingehender untersuchen. Dieses Problem ist auch von einigem historischen Interesse, da zur L¨ osung dieses Problems ber¨ uhmte Mathematiker beigetragen haben. 8.4.1 Die Bernoulli-Verteilung Wir betrachten N Boxen, von denen jede P schwarze und Q weiße Kugeln enth¨ alt. Wir suchen die Wahrscheinlichkeit WN (M ), dass bei der Entnahme von je einer Kugel aus den N Boxen, M dieser Kugeln die Farbe weiß haben werden. Die Wahrscheinlichkeit, aus einer bestimmten Box eine schwarze P = p und jene eine weiße Kugel zu Kugel zu entnehmen, ist jedenfalls P +Q entnehmen P Q ur N = 1 die Wahrscheinlichkeit W1 (0) = p, +Q = q. Daher ist f¨ W1 (1) = q. Wenn N = 2 ist, besteht das Wahrscheinlichkeitsaggregat aus folgenden Kombinationen: SS, SW , W S, W W (S = schwarz, W = weiß) und diese treten mit den folgenden Wahrscheinlichkeiten auf p2 , pq, qp, q 2 . Folglich ist hier W2 (0) = p2 , W2 (1) = 2pq, W2 (2) = q 2 . Im allgemeinen Fall wird also die Wahrscheinlichkeit, dass M weiße Kugeln aus N bestimmten Boxen entnommen werden und gleichzeitig N − M schwarze Kugeln aus den restlichen Boxen, durch folgenden Ausdruck bestimmt sein q M pN −M .
(8.35) N Doch wegen der Anzahl (8.3) m¨ oglicher Kombinationen, gibt es stets M M¨ oglichkeiten der Auswahl von M Boxen aus der Gesamtzahl N solcher Boxen. Daher ist die Antwort auf unser obiges Problem, das erstmals von Newton studiert und sp¨ ater von Bernoulli gel¨ ost wurde N N −M M WN (M ) = p q (8.36) M und wegen der binomischen Formel (8.10) gilt f¨ ur die Summe der Wahrscheinlichkeiten N WN (M ) = 1 , da q + p = 1 . (8.37) M=0
278
8 Wahrscheinlichkeit und Statistik
Nat¨ urlich ist die Gleichung (8.36) von viel allgemeinerer Bedeutung als f¨ ur unser spezielles Beispiel. Dieser Ausdruck stellt die Wahrscheinlichkeit dar, dass M Erfolge bei N Versuchen erzielt wurden, wenn die Wahrscheinlichkeit des Erfolges pro Versuch gleich q ist. Um den Mittelwert von M und die Streuung der arithmetischen Verteilung WN (M ) zu berechnen, betrachten wir die Identit¨at (p + qY )N =
N
WN (M )Y M ,
(8.38)
M=0
wo Y eine Ver¨ anderliche ist. Wenn wir diese Gleichung nach Y differenzieren, erhalten wir N M WN (M )Y M−1 (8.39) N (p + qY )N −1 q = M=0
und setzt man in dieser Gleichung Y = 1, steht auf der rechten Seite der Mittelwert M , sodass wegen q + p = 1 M = N q
(8.40)
ist. Damit ist die mittlere Anzahl der Erfolge, bei der Durchf¨ uhrung von N Versuchen gleich der Erfolgswahrscheinlichkeit q pro Einzelversuch multipliziert mit der Anzahl N der durchgef¨ uhrten Versuche. Um die Streuung der Verteilung zu berechnen, differenzieren wir die Gleichung (8.38) ein zweites Mal nach Y und setzen dann Y = 1. Dies ergibt N (N − 1)q 2 =
N
M (M − 1)WN (M ) = M 2 − M .
(8.41)
M=0
Daraus erhalten wir die Streuung, indem wir auf der rechten Seite den Ausdruck M − M 2 addieren und dies ergibt wegen (8.40) N q − N 2 q 2 , sodass σ 2 = M 2 − M 2 = N q(1 − q) = N qp
(8.42)
ist. Von besonderem Interesse ist der Fall bei dem q p ist, sodass p ∼ =1 wird. In diesem Fall ist dann die Streuung nummerisch identisch mit der mittleren Anzahl der Erfolge. Dies liefert ein Kriterium, welches gelegentlich dazu verwendet werden kann, um herauszufinden, ob die Erfolge tats¨achlich nur statistischen Ursprung haben. Die oben hergeleitet Beziehungen finden unter anderem Anwendung in der Theorie des radioaktiven Zerfalls, bzw. bei der Beschreibung der Zitterbewegung (random walk), wie sie etwa bei der statistischen Interpretation der Brown’schen Bewegung angetroffen wird. 8.4.2 Die Gauß-Verteilung Bei großen Werten von N und M ist der Ausdruck (8.36) f¨ ur die Wahrscheinur die Anwendungen ungeeignet, da es unbequem ist, mit lichkeit WN (M ) f¨
8.4 Spezielle Verteilungen
279
Faktoriellen großer Zahlen zu operieren. Wir wollen daher zeigen, dass in diesem Fall WN (M ) durch die Gauß’sche Fehlerfunktion angen¨ahert werden kann. Dazu betrachten wir zuerst den Grenzfall von WN (M ) f¨ ur N → ∞. Gem¨ aß (8.40) und (8.42) streben sowohl der Erwartungswert M als auch die Streuung σ 2 nach unendlich und zwar derart, dass bei einer grafischen Darstellung von WN (M ) als Funktion von M der Mittelwert M , der bei großem M gleichzeitig das Maximum von WN (M ) darstellt, vom Ursprung aus anwachsen und daher die Verteilung sich ins Unendliche ausbreiten w¨ urde. Wenn wir jedoch eine Gr¨ oße X als die Abweichung vom Mittelwert definieren und diese geeignet normieren, indem wir setzen X=
M − M √ , N
(8.43)
dann wird diese Gr¨ oße endlich bleiben. Wir werden nun zeigen, wie WN (M ) (8.36) sich f¨ ur N → ∞ in eine Verteilung W (X) umwandeln l¨asst. Dazu berechnen wir zuerst mithilfe von (8.3) und (8.36) durch Logarithmierung ln WN (M ) = ln N ! − ln M ! − ln(N − M )! + (N − M ) ln p + M ln q . (8.44) Nun verwenden wir die Stirling’sche N¨ aherung f¨ ur N ! (5.34) (siehe Abschn. 5.2), die f¨ ur große Werte N G¨ ultigkeit hat, wonach 1 1 1 ln N ! = (N + ) ln N − N + ln 2π + 2 2 2N
(8.45)
ist. Mit ihrer Hilfe erhalten wir dann f¨ ur (8.44) im Limes N → ∞ − lim ln WN (M ) N →∞ 2πM (N − M ) N −M 1 M + (N − M ) ln = ln + M ln . 2 N Nq Np
(8.46)
Wir finden aber mithilfe der Definition (8.43) von X und der Gleichung (8.40) f¨ ur den Erwartungswert M die folgenden Beziehungen
X X M = Nq 1 + √ , N − M = Np 1 − √ (8.47) Nq Np und wenn wir diese in die Gleichung (8.46) einsetzen, nimmt dieser Ausdruck f¨ ur die Wahrscheinlichkeitsverteilung W (X) die Gestalt an − ln W (X) =
X2 X2 1 ln 2πN pq + + , 2 2q 2p
(8.48)
280
8 Wahrscheinlichkeit und Statistik
wobei wir die bekannte Reihenentwicklung des Logarithmus (siehe Anh. A.1.11 (A.44)) y2 + ··· (8.49) ln(1 + y) = y − 2 f¨ ur kleine Werte von y verwendet haben und Terme der Ordnung N1 unterdr¨ uckt wurden, da wir ja den Limes N → ∞ betrachten. Somit geht wegen p + q = 1 die Beziehung (8.48) in die Gleichung u ¨ ber − ln W (X) =
X2 1 ln 2πN pq + 2 2pq
(8.50)
und daher ist die Wahrscheinlichkeitsverteilung W (X) in dieser N¨aherung X2 1 W (X) = √ e− 2pq . 2πN pq
(8.51)
Wenn wir diese Beziehung wieder als Funktion von M ausdr¨ ucken, so ergibt sich 2 2 1 1 1 1 e− 2pM (M− M) = √ e− 2σ2 (M− M) . lim WN (M ) = 2πσ 2πpM (8.52) Die am Schluss abgeleiteten Beziehungen haben f¨ ur die Fehlerrechnung bei Messungen besondere Bedeutung, wie sich in folgender Weise begr¨ unden l¨asst. Angenommen, der wahre Wert einer gemessenen Gr¨oße sei A, doch es seien N Fehlerursachen vorhanden, von denen jede zu A die Fehler +ΔA oder −ΔA mit gleicher Wahrscheinlichkeit bewirken kann. Wenn M dieser N Ursachen einen Beitrag zu ΔA liefert, so ist der resultierende Fehler gleich RΔA = [M − (N − M )]ΔA und daher ist die Wahrscheinlichkeit f¨ ur diesen Fehler ur große Werte N wird gleich WN (M ) und es ist dabei M = 12 (N + R). F¨ dann die Verteilung der Fehler durch die Formel (8.52) bestimmt sein, n¨amlich
N →∞
2 1 1 e− 8σ2 (R− R) . W (R) = √ 2πσ
(8.53)
Dabei haben wir aber zu beachten, dass σ 2 nicht mehr die Streuung in Bezug auf die R-Verteilung ist und ebenso W (R) nicht auf 1 normiert sein wird. F¨ ur den Spezialfall, wo p = q = 12 ist, wird M = N2 und R = 0 sein. Wenn wir dann RΔA mit εR bezeichnen, ergibt sich aus (8.53) das Gauß’sche Fehlergesetz, das auch als Normalverteilung bezeichnet wird W (εR ) = const. e−H
2 2 εR
.
(8.54)
Dabei wird die Konstante H, welche von ΔA abh¨angig ist, stets auf empirischem Wege bestimmt und wird h¨ aufig als das ,,Maß“ oder als der ,,Index“ der Genauigkeit bezeichnet. Bei unserer Herleitung der Verteilung (8.51) wurden Gr¨ oßen von der Ordnung N1q und N1pq vernachl¨assigt, wobei die Annahme
8.4 Spezielle Verteilungen
281
gemacht wurde, dass die Parameter p und q beide von der Gr¨oßenordnung 1 sind. Unter diesen Bedingungen f¨ uhren die Erwartungswerte von M und N q auf große Zahlenwerte. Unter diesen Bedingungen ist dann die Verteilung (8.51) anwendbar. 8.4.3 Die Poisson-Verteilung Es kann aber auch der Fall eintreten, dass q klein ist, sogar so klein, dass selbst N q bei bestimmten Anwendungen von der Gr¨oßenordnung 1 sein wird. In diesem Fall wird die Verteilung (8.36) sicherlich ins Unendliche reichen, doch der Erwartungswert der Verteilung wird endlich bleiben. Die resultierende Verteilung wird dann ziemlich asymmetrisch sein. Um auch diesen Fall behandeln zu k¨ onnen, setzen wir a a , p=1− (8.55) q= N N und behandeln a = M als eine Zahl von der Gr¨oßenordnung 1, w¨ahrend N → ∞ strebt. Dies ergibt a N N (N − 1) · · · (N − M + 1) aM 1 − N WN (M ) = M! NM 1 − a M N a N aM 1 1 − N1 · · · 1 − M−1 N · = 1− . (8.56) M N M! 1− a N
Wenn nun N → ∞ strebt, wird der letzte Bruch gegen 1 streben und daher erhalten wir unter diesen Bedingungen lim WN (M ) =
N →∞
aM e−a , M!
(8.57)
da bekanntlich die Exponentialfunktion durch folgenden Grenzwert definiert werden kann a N lim 1 + = ea . (8.58) N →∞ N Die Verteilung (8.57) wurde erstmals von Poisson hergeleitet und tr¨agt daher seinen Namen. Sie findet unter anderem Anwendung in der Theorie des radioaktiven Zerfalls. ¨ Ubungsaufgaben: 1. Eine Urne enth¨ alt 4 weiße und und 2 schwarze Kugeln, die bis auf ihre Farbe v¨ ollig identisch sind. Wie groß ist die Wahrscheinlichkeit, dass man bei zwei Ziehungen a) zwei weiße Kugeln, b) zwei Kugeln gleicher Farbe, c) mindestens eine weiße Kugel zieht? Es wird vorausgesetzt, dass die Kugeln der ersten Ziehung in die Urne I) zur¨ uckgelegt, II) nicht zur¨ uckgelegt wird.
282
8 Wahrscheinlichkeit und Statistik
2. Zwei gleiche W¨ urfel werden gemeinsam ν-mal geworfen. Wie groß ist die Wahrscheinlichkeit, dass der n-te Wurf zum ersten Mal die Nummer 8 liefert. 3. Zwei geometrische Verteilungen sind in Physik und Chemie von betr¨ achtlichem Interesse 2 2 H W1 (X) = √ e−H (X−A) , π
W2 (X) =
1 A . π A2 + X 2
(8.59)
1 a) Zeige, dass f¨ ur W1 , X = A und σ 2 = 2H 2 ist. b) Zeige, dass das R-te 1·3·5···(R−1) Moment von W1 f¨ ur gerades R gleich 2R/2 H R ist und f¨ ur ungerades R gleich Null ist. c) Zeige, dass f¨ ur A = 0 alle Momente von W1 endlich sind. ur den Parameter q = 13 und f¨ ur 4. Mache eine Grafik von WN (M ) f¨ N = 5, 10, 50. Untersuche die Ver¨ anderungen von einer anfangs asymmetrischen f¨ ur kleines N zu schließlich einer symmetrischen Verteilung f¨ ur großes N . Vergleiche damit die Ergebnisse von Poisson’s Verteilung f¨ ur N = 5. 5. Zur Zitterbewegung. Eine Versuchsperson macht Schritte der L¨ange L. Sie soll sich in Vorw¨ artsrichtung wie in R¨ uckw¨artsrichtung mit gleicher Wahrscheinlichkeit bewegen, d. h. q = p = 12 . Zeige, dass nach N Schritten die Versuchsperson sich in Vorw¨ artsrichtung eine Strecke RL mit der Wahrscheinlichkeit
N N 1 (8.60) N +R 2 2
fortbewegt haben wird. Zeige ebenso, dass R = 0 und R2 = N sind. 6. Eine radioaktive Substanz ist ein α-Strahler. Bei einem α-Teilchen Z¨ahlexperiment wird jede Minute die Zahl der α-Teilchen u ¨ ber einen Zeitraum von 50 Stunden registriert. Die Gesamtzahl der beobachteten α-Teilchen betr¨ agt 600. Innerhalb wie viel Ein-Minuten Abst¨anden w¨ urde man kein registriertes α-Teilchen erwarten? Nach wie viel Minuten 1, 2, 3, 4, 5 Teilchen. Mache eine Skizze der entsprechenden Poisson-Verteilung. 7. Angenommen in einem B¨ uro treffen im Mittel pro Tag 4 Telefonanrufe ein. Wie groß ist die Wahrscheinlichkeit, dass an einem bestimmten Tag kein Anruf eintrifft, genau ein Anruf ankommt, oder genau 4 Anrufe eintreffen?
A Differenzial- und Integralrechnung
A.1 Differenzialrechnung A.1.1 Die Ableitung Gegeben sei eine Funktion y = f (x). Ihre Ableitung, falls diese existiert, ist durch den Grenzwert bestimmt f (x + Δx) − f (x) dy = lim . dx Δx→0 Δx
(A.1)
Wird die Funktion f (x) als Kurve in der (x, y)-Ebene dargestellt, beschreibt dy die Ableitung dx die Tangente an die Kurve an der Stelle x. Die weiteren ˙ wenn t ein Bezeichnungsweisen der Ableitung sind f (x), y (x) und y(t), Parameter, z. B. die Zeit ist. H¨ ohere Ableitungen erfolgen nach der Regel d2 y d dy dn y d (n−1) d f f = (x) = f (x) , = (x) = f (n) (x) . = dx2 dx dx dx dxn dx (A.2) A.1.2 Die partielle Ableitung Ist z = f (x, y) eine Funktion zweier Ver¨ anderlicher, dann ist die partielle Ableitung nach x definiert durch ∂z f (x + Δx, y) − f (x, y) ∂z = lim = fx (x, y) = zx = (A.3) ∂x Δx→0 Δx ∂x y ∂z und eine analoge Definition gilt f¨ ur ∂y . Die zweiten partiellen Ableitungen sind dann ∂ ∂z ∂ ∂ ∂z ∂2z ∂z ∂2z ∂2z ∂2z = = = , , = ∂x2 ∂x ∂x ∂y 2 ∂y ∂y ∂x∂y ∂x ∂y ∂y∂x (A.4) und analoge Definitionen gelten f¨ ur h¨ ohere partielle Ableitungen.
284
A Differenzial- und Integralrechnung
A.1.3 Elementare Ableitungsregeln 1. Inverse Funktionen: y = y(x) ,
d2 x
d2 y dy 2 2 . 2 = − d x dx
1 dy = dx , dx dy
x = x(y) ,
(A.5)
dy
2. Leibniz’sche Kettenregel: y = f (u) ,
u = g(x) ,
dy dy du = . dx du dx
(A.6)
3. Ableitung einer impliziten Funktion: ∂f
f (x, y) = 0 ,
dy ∂x = − ∂f . dx ∂y
(A.7)
4. Ableitung der Parameterdarstellung einer Funktion: Gegeben sind y = y(t) und x = x(t). Dann ist y˙ =
dy , dt
x˙ =
dx , dt
dy y˙ = , dx x˙
d2 y x˙ y¨ − y˙ x¨ = . dx2 x˙ 3
(A.8)
5. Linearit¨ at der Ableitungsregel: d du dv (au + bv) = a +b . dx dx dx
(A.9)
6. Produktregel: (uv) = uv + vu ,
(uv) = uv + 2u v + vu .
(A.10)
7. Leibniz Regel: die n-te Ableitung des Produktes uv n! n! u v (n−1) +· · ·+ u(r) v (n−r) +· · · u(n) v . (n − 1)! r!(n − r)! (A.11) 8. Ableitung von Potenzen und Quotienten: u 1 −v vu − uv (un ) = nun−1 u , = (v −1 ) = 2 , = . v v v v2 (A.12) 9. Logarithmische Ableitung: (uv)(n) = uv (n) +
d(ln y) y = . dx y
(A.13)
10. Ableitung von Exponentialfunktion und Logarithmus: dex = ex , dx
dax = (ln a)ax , dx
1 d ln x = . dx x
(A.14)
A.1 Differenzialrechnung
285
A.1.4 Ableitung trigonometrischer und inverser Funktionen d d d sin x = cos x , tan x = sec2 x , sec x = tan x sec x , (A.15) dx dx dx d d d cos x = − sin x , cot x = −cosec2 x , cosec x = − cot x cosec x , dx dx dx (A.16) d 1 1 d arc sin x = √ arctan x = , , 2 dx dx 1 + x2 1−x d 1 −1 d , . arccos x = − √ arccot x = 2 dx dx 1 + x2 1−x
(A.17) (A.18)
A.1.5 Ableitung hyperbolischer und inverser Funktionen d sinh x = cosh x , dx
d tanh x = sech2 x , dx
d sech x = − tanh x sech x , dx (A.19)
d d cosh x = sinh x , coth x = −cosech 2 x , dx dx d cosech x = − coth xcosech x , dx d 1 arsinh x = √ , 2 dx x +1 1 d arcosh x = √ , dx x2 − 1
1 d artanh x = , dx 1 − x2 1 d ar coth x = − 2 . dx x −1
(A.20)
(A.21) (A.22)
A.1.6 Differenziale ¨ 1. Wenn y = f (x) ist und Δx eine infinitesimale Anderung von x, dann ist Δy = f (x)Δx =
dy Δx dx
(A.23)
und f¨ ur die Parameterdarstellung einer Kurve y = y(t) und x = x(t) ist Δx = xΔt ˙ ,
Δy = yΔt ˙ .
(A.24)
2. F¨ ur eine Funktion z = f (x, y) ist das Totale Differenzial definiert durch Δz =
∂z ∂z dx + dy , ∂x ∂y
Δz ∂z Δx ∂z Δy = + Δt ∂x Δt ∂y Δt
(A.25)
und ¨ ahnliches gilt nat¨ urlich f¨ ur eine Funktion u = f (x, y, z) und f¨ ur Funktionen mit einer h¨ oheren Variablenanzahl.
286
A Differenzial- und Integralrechnung
3. Ein Exaktes Differenzial ist durch folgende Eigenschaften ausgezeichnet. Wenn Δz = A(x, y)Δx + B(x, y)Δy (A.26) ist, dann ist Δz ein exaktes Differenzial, wenn zwischen den Koeffizienten A und B die Beziehung besteht. ∂A ∂B = ∂y ∂x
(A.27)
und wenn in drei Dimensionen Δu = A(x, y, z)Δx + B(x, y, z)Δy + C(x, y, z)Δz
(A.28)
ist, dann ist Δu ein exaktes Differenzial, wenn zwischen den Koeffizienten A, B und C die Beziehungen bestehen ∂B ∂C = , ∂y ∂z
∂A ∂C = , ∂z ∂x
∂B ∂A = . ∂x ∂y
(A.29)
A.1.7 Maxima und Minima einer Funktion 1. Sei f (x) eine stetig differenzierbare Funktion im Intervall [a, b]. Dann hat in diesem Intervall die Funktion f (x) an der Stelle x1 ein relatives Maximum, wenn dort f (x) von positiven Werten zu negativen Werten u ¨ bergeht. Hingegen hat f (x) ein relatives Minimum bei x2 , wenn dort f (x) von negativen Werten zu positiven Werten gelangt. Daher werden die gr¨ oßten und kleinsten Werte von f (x) in [a, b] bei f (a), f (b) und bei f (xk ) mit f (xk ) = 0, k = 1, 2 zu finden sein. 2. Die Funktion f (x) wird an einer Stelle x3 in [a, b] ein relatives Minimum haben, wenn in dessen Umgebung f (x) < 0 ist und die Funktion wird hingegen dort ein relatives Maximum haben, wenn in dessen Umgebung andert jedoch an dieser Stelle f (x) sein Vorzeichen, so f (x) > 0 ist. ¨ nennt man die Stelle x3 einen Wendepunkt von f (x). A.1.8 Mittelwerts¨ atze Sind die Funktionen f (x) und F (x) stetig differenzierbare Funktionen in [a, b], dann gilt f¨ ur mindestens einen Punkt xk in a < xk < b 1. Das Theorem von Rolle, wonach f (b) = f (a) + (b − a)f (xk )
(A.30)
ist. 2. Der Mittelwertsatz von Cauchy, wonach f¨ ur F (x) = 0 im obigen Intervall die weitere Beziehung gilt f (xk ) f (b) − f (a) = . F (b) − F (a) F (xk )
(A.31)
A.1 Differenzialrechnung
287
A.1.9 Unbestimmte Formen 1. Wenn f¨ ur die Funktionen f (x) und F (x) die Grenzwerte lim f (x) = 0 und lim F (x) = 0 gelten, wenn x → a strebt, f¨ uhrt der Grenzwert lim Ff (x) (x) 0 f¨ ur x → a auf die unbestimmte Form 0 . Wenn F (x) und f (x) analytisch sind und daher in der Umgebung von x = a in Potenzreihen nach (x − a) entwickelt werden k¨ onnen, ist der gesuchte Grenzwert leicht mithilfe dieser Reihen berechenbar. 2. Regel von de l’Hospital: Falls bei x → a die folgenden Limits existieren f (x) → 0 und F (x) → 0, so ist f (x) f (x) = lim . x→a F (x) x→a F (x) lim
(A.32)
Bei dieser Regel kann auch der Limes einseitig stattfinden, also x → a(+) oder x → a(−) und die Regel ist auch anwendbar, wenn x → +∞ oder x → −∞ zu betrachten ist. Ferner gilt die Regel auch, wenn im Limes x → a die Funktionen f (x) → ∞ und F (x) → ∞ streben. 3. Wenn wir schließlich einen der Faktoren durch f = 1/1 f ersetzen, k¨onnen wir einen Grenzwert 0 · ∞ durch 00 oder ∞ ∞ ersetzen und die de l’Hospital Regel anwenden. Gelegentlich kann auch eine unbestimmte Form ∞ − ∞ in eine solche der Form 00 umgewandelt werden. A.1.10 Der Taylor’sche Satz 1. Wenn f (x) an der Stelle x = a beliebig oft differenzierbar ist, dann gilt die Taylor’sche Reihenentwicklung (x − a) (x − a)2 (x − a)n +f (a) +· · ·+f (n−1) (a) +· · · 1! 2! n! (A.33) und der Rest nach dem Term f (n−1) (a) ist gegeben durch den Faktor f (x) = f (a)+f (a)
Rn = f (n) (x1 )
(x − a)n , n!
(A.34)
wo x1 ein geeigneter Wert im Intervall (a < x1 < x) ist. Eine weitere Form des Taylor’schen Satzes ist die Reihenentwicklung h h2 h3 hn + f (a) + f (a) + · · · + f (n) (a) +··· 1! 2! 3! n! (A.35) und ein spezieller Fall f¨ ur a = 0 liefert die Maclaurin’sche Reihe
f (a + h) = f (a) + f (a)
f (x) = f (0) + f (0)
x x2 x3 xn + f (0) + f (0) + · · · + f (n) (0) + ··· . 1! 2! 3! n! (A.36)
288
A Differenzial- und Integralrechnung
Bei Rechnungen werden diese Reihen gew¨ohnlich mit kleinen Werten von (x− a) oder h verwendet und der Rest hat die Gr¨oßenordnung des letzten Terms, der ber¨ ucksichtigt wurde. 2. Wenn die Funktion F (x, y) in der Umgebung von (a, b) beliebig oft differenzierbar ist, so lautet die Taylor’sche Reihenentwicklung in zwei Ver¨ anderlichen ∂F (a, b) ∂F (a, b) F (x, y) =F (a, b) + (x − a) + (y − b) ∂x ∂y 2 ∂ 2 F (a, b) ∂ F (a, b) 1 + 2(x − a)(y − b) + (x − a)2 2 2! ∂ x ∂x∂y 2 ∂ F (a, b) +(y − b)2 ∂y 2 n 1 ∂ ∂ + ···+ + (y − b) F (x, y)|x=a,y=b + · · · (x − a) n! ∂x ∂y (A.37) und in der anderen Form ∂F (a, b) ∂F (a, b) +k + ··· F (a + h, b + k) = F (a, b) + h ∂x ∂y n 1 ∂ ∂ + +k F (x, y)|x=a,y=b + · · · . (A.38) h n! ∂x ∂y ahnliche Entwicklungen gelten dann f¨ ur Funktionen von beliebiger Anzahl ¨ der Ver¨ anderlichen. A.1.11 Reihen elementarer Funktionen n n 2 ν n (1 ± x) = 1 ± x+ x + · · · (±1) xν + · · · , 1 2 ν n
n > 0 , |x| < 1 , (A.39) 1 1·2 2 1·1·3 3 1 x ± x − · · · , |x| < 1 , (A.40) (1 ± x) 2 = 1 ± x − 2 2·4 2·4·6 1 1·3 2 1·3·5 3 1 x ∓ x + · · · , |x| < 1 , (1 ± x)− 2 = 1 ∓ x + (A.41) 2 2·4 2·4·6 1 = 1 + x + x2 + x3 + · · · , |x| < 1 , geometrische Reihe , 1−x (A.42) x2 x3 xn x + + + ··· + · · · , |x| < ∞ , 1! 2! 3! n! x2 x3 x4 ln(1 + x) = x − + − + · · · , |x| ≤ 1 , 2 3 4 ex = 1 +
(A.43) (A.44)
A.2 Integralrechnung
x5 x2 x4 x6 x3 + − · · · , cos x = 1 − + − + ··· 3! 5! 2! 4! 6! 1 x3 1 · 3 x5 arcsin x = x + + + · · · , |x| < 1 , 2 3 2·4 5 x3 2x5 π tan x = x + + + · · · , |x| < , 3 15 2 x3 x5 x7 arctan x = x − + − + · · · , |x| < 1 . 3 5 7 sin x = x −
289
(A.45) (A.46) (A.47) (A.48)
A.1.12 Differenziation von Integralen Unter gewissen Bedingungen, die in der Physik meist erf¨ ullt sind, k¨onnen Integrale entweder nach Ihren Grenzen oder nach Parametern ihres Arguments differenziert werden. Folgende F¨ alle sind m¨ oglich x x b d d d f (x)dx = f (t)dt = f (x) , f (t)dt = −f (x) , (A.49) dx a dx a dx x b b ∂ d f (x, t)dt , (A.50) f (x, t)dt = dx a ∂x a x x ∂ d f (x, t)dt . (A.51) f (x, t)dt = f (x, x) + dx a a ∂x Wenn f (x, x) unendlich wird, oder sonst singul¨ar ist, lassen sich folgende Beziehungen verwenden x x d ∂f 1 ∂f + (t − a) + f dt , (A.52) f (x, t)dt = (x − a) dx a x−a a ∂x ∂t v(x) v(x) d ∂ f (x, t)dt . f (x, t)dt = v (x)f [x, v(x)] − u (x)f [x, u(x)] + dx u(x) ∂x u(x) (A.53)
A.2 Integralrechnung A.2.1 Das unbestimmte Integral 1. In Bezug auf x, ist das unbestimmte Integral von f (x) gleich F (x) vor ausgesetzt, dass dF dx = F (x) = f (x) ist. Das unbestimmte Integral des Differenzials f (x)dx ist F (x), wenn dF (x) = f (x)dx ist, also f (x)dx = F (x) , wenn , F (x) = f (x) , oder , dF (x) = f (x)dx (A.54)
290
A Differenzial- und Integralrechnung
ist. F¨ ur jede beliebige Konstante C ist F (x) + C gleichfalls ein m¨ogliches unbestimmtes Integral. Wenn wir alle m¨oglichen Werte von C betrachten und irgend eine der Funktionen F (x), so erhalten wir alle m¨oglichen unbestimmten Integrale f (x)dx = F (x) + C . (A.55) 2. Die unbestimmten Integrale von Funktionen sind gegeben durch dF (x) = F (x) + C , d f (x)dx = f (x)dx . (A.56) 3. Die Linearit¨ at der Integration ist charakterisiert durch (au+bv)dx = a udx+b vdx , a oder b mindestens = 0 . (A.57) 4. Die partielle Integration erfolgt nach dem Schema udv = uv − vdu , oder
dv u dx = uv − dx
v
du dx . dx
5. Die Substitution erfolgt nach dem Schema dx f (y) f (y)dx = f (y) dy = dy . dy dy dx A.2.2 Integration von Polynomen 0dx = C , adx = ax + C , bxn dx =
1 bxn+1 n+1
(A.58)
(A.59)
(A.60)
(A.61)
(an xn + · · · + ar xr + · · · + a1 x + a0 )dx =
1 1 1 an xn+1 + · · · + ar xr+1 + · · · + a1 x2 + a0 x + C . (A.62) n+1 r+1 2
A.2.3 Integration rationaler Funktionen A A (x − r)1−k dx = A ln |x − r| + C , + C (A.63) dx = A x−r (x − r)k 1−k
A.2 Integralrechnung
291
A + Bi 2A(x − a) − 2Bb dx dx = 2Re 2 2 (x − a) + b x − a − bi # $ x−b = A ln (x − a)2 + b2 − 2Barc tan +C . b
(A.64)
dx x 1 = arc tan + C , x2 + a2 a a dx 1 x − a + C , ln = 2 2 x −a 2a x + a
dx = ln |x| + C . x
(A.65)
Die Integrale komplexerer rationaler Funktionen entnimmt man am besten Integraltafeln (Siehe das Literaturverzeichnis). A.2.4 Integration trigonometrischer Funktionen
1 x sin 2ax sin axdx = − cos ax + C , sin2 axdx = − + C , (A.66) a 2 4a 1 x sin 2ax cos axdx = sin ax + C , cos2 axdx = + +C . (A.67) a 2 4a 1 ax dx = cosec axdx = ln | tan |+C sin ax a 2 1 = ln |cosec ax − cot ax| + C , (A.68) a ax π 1 dx = sec axdx = ln tan + +C cos ax a 2 4 1 = ln |sec ax + tan ax| + C . (A.69) a dx 1 tan axdx = cos ec2 axdx = − cot ax + C , 2 a sin ax 1 (A.70) = − ln |cos ax| + C , a dx 1 = sec2 axdx = tan ax + C , 2 cos ax a 1 (A.71) cot axdx = ln |sin ax| + C . a A.2.5 Exponentialfunktion und hyperbolische Funktionen
1 ax 1 ax e +C , b +C , bax dx = a a ln b 1 1 cosh axdx = sinh ax + C . sinh axdx = cosh ax + C , a a eax dx =
(A.72) (A.73)
292
A Differenzial- und Integralrechnung
A.2.6 Integration von Wurzelausdr¨ ucken
x x dx √ + C = −arc cos + C1 , = arc sin (A.74) a a a2 − x2 dx √ = ln |x + x2 + A| + C , (A.75) 2 x +A x x 2 a2 (A.76) a2 − x2 dx = a − x2 + arc sin + C , 2 2 a x 2 A x2 + Adx = x + A + ln |x + x2 + A| + C . (A.77) 2 2 √ Wenn A > 0, also A = a2 , dann ist ln(x + x2 + a2 ) = arsinh xa + ln a. Wenn √ A < 0, also A = −a2 , dann ist ln(x + x2 − a2 ) = arcosh xa + ln a. A.2.7 Integration von Produkten
1 eax (a sin bx − b cos bx) + C , a2 + b 2 1 eax cos bxdx = 2 eax (a cos bx + b sin bx) + C , a + b2 1 ax ax xe dx = 2 e (ax − 1) + C , ln axdx = x ln ax − x + C . a eax sin bxdx =
(A.78) (A.79) (A.80)
Die ersten beiden Integrale wurden bereits in Abschn. 7.3.2 (7.55) berechnet. Mit demselben Verfahren k¨ onnen auch Integrale, welche die Faktoren sinh ax und cosh ax enthalten berechnet werden, da diese Funktionen durch uckbar sind. Wenn die Integrale Potenzen xn enthalten, liefert die e±ax ausdr¨ Integration mithilfe partieller Integration (A.58) 1 n (A.81) xn eax dx = xn eax − xn−1 eax dx . a a Diese Reduktionsformel kann wiederholt angewandt werden bis die positiven Potenzen von x verschwunden sind. Wenn die Funktion f (x) ein nat¨ urlicher Logarithmus, oder eine inverse trigonometrische Funktion, oder inverse hyperbolische Funktion, oder eine einfache Funktion von x, wie etwa ln(ax + b), arcsinx, arctanx2 , dann liefert f¨ ur n = 0, 1, 2, · · · die Beziehung 1 1 n n+1 x x f (x)dx = f (x) − (A.82) xn+1 f (x)dx n+1 n+1 recht h¨ aufig auf ein einfacheres Integral. Die Integration komplizierterer Kombinationen von trigonometrischen Funktionen und Exponentialfunktionen entnimmt man am besten einer Integraltafel.
A.2 Integralrechnung
293
A.2.8 Das bestimmte Integral Das Integrationsintervall [a, b] sei durch die Punkte x1 , x2 , · · · xn in Teilintervalle zerlegt, derart dass xk < xk+1 ist und a = x0 und b = xn sind. Es sei δk = xk − xk−1 und δM das Maximum der δk . Dann ist das bestimmte Riemann’sche Integral einer Funktion f (x) definiert durch
b
f (x)dx = lim [f (ξ1 )δ1 + f (ξ2 )δ2 · · · + f (ξn )δn ] δM →0
a
(A.83)
f¨ ur beliebige Einteilungen n und es ist xk−1 < ξk < xk . Dieser Grenzwert existiert jedenfalls f¨ ur stetige und differenzierbare Funktionen f (x). In diesem Fall ist dann b
f (x)dx = F (x)|ba = F (b) − F (a) ,
(A.84)
a
wo F (x) eine Funktion darstellt, deren Ableitung nach x gleich f (x) ist. Das Integral besitzt eine Reihe n¨ utzlicher Eigenschaften: 1. Die Linearit¨ at der Integration ist bestimmt durch die Beziehungen
b
b
[Af (x) + Bg(x)]dx = A
f (x)dx + B
a
a
b
f (x)dx = a
(A.85)
a
f (x)dx = −
g(x)dx , a
b
a
b
f (x)dx , b
c
f (x)dx + a
(A.86)
b
f (x)dx .
(A.87)
c
2. Der Mittelwert der Funktion f (x) im Intervall [a, b] ist gegeben durch f =
1 b−a
b
f (x)dx .
(A.88)
a
3. Der Mittelwertsatz der Integralrechnung besagt, dass es f¨ ur eine in [a, b] stetige Funktion f (x) in diesem Intervall eine Stelle x1 gibt, derart dass f = f (x1 ) ist, bzw. es gilt
b
f (x)dx = (b − a)f (x1 ) .
(A.89)
a
4. Ferner ist der quadratische Mittelwert von f (x) im Intervall [a, b] gegeben durch ' b 1 f 2 = f 2 (x)dx . (A.90) b−a a
294
A Differenzial- und Integralrechnung
A.2.9 Ungleichungen zwischen Integralen 1. Es sei a < b und f (x) < g(x) im Intervall [a, b]. Dann gilt jedenfalls
b
b
f (x)dx