159 40 3MB
German Pages 321 Year 2009
Fredi Tröltzsch Optimale Steuerung partieller Differentialgleichungen
Fredi Tröltzsch
Optimale Steuerung partieller Differentialgleichungen Theorie, Verfahren und Anwendungen 2., überarbeitete Auflage STUDIUM
Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über abrufbar.
Prof. Dr. Fredi Tröltzsch Technische Universität Berlin Institut für Mathematik Straße des 17. Juni 136 10623 Berlin E-Mail: [email protected]
1. Auflage 2005 2., überarbeitete Auflage 2009 Alle Rechte vorbehalten © Vieweg +Teubner | GWV Fachverlage GmbH, Wiesbaden 2009 Lektorat: Ulrike Schmickler-Hirzebruch | Nastassja Vanselow Vieweg +Teubner ist Teil der Fachverlagsgruppe Springer Science+Business Media. www.viewegteubner.de Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlags unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Umschlaggestaltung: KünkelLopka Medienentwicklung, Heidelberg Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier. Printed in Germany ISBN 978-3-8348-0885-1
v
Vorwort Die mathematische Optimierung von Vorg¨ angen, die durch partielle Differentialgleichungen modelliert werden, hat in den letzten Jahren einen beachtlichen Aufschwung genommen. Die Verf¨ ugbarkeit immer besserer Computer erm¨oglichte neue interessante Anwendungen dieses Gebietes in der Praxis, etwa in Str¨omungsmechanik, Mikroelektronik, Kristallz¨ uchtung, Gef¨ aßchirurgie oder Herzmedizin, um nur einige Beispiele zu nennen. Im Zusammenhang damit ist das Interesse von Numerikern und Optimierern an der Verwendung ihrer Methoden in der Optimalsteuerung von partiellen Differentialgleichungen deutlich gestiegen und es gibt mehr Nachfrage von Studenten und Doktoranden der Mathematik nach einer Einf¨ uhrung in Grundideen der zugeh¨origen Theorie. Heute existiert eine Reihe von Monographien zu verschiedenen Aspekten der optimalen Steuerung von partiellen Differentialgleichungen, insbesondere das bekannte Standardwerk von J.L. Lions [144], dem f¨ ur Aufgaben mit linearen Gleichungen und konvexen Zielfunktionalen kaum etwas hinzuzuf¨ ugen ist. Das Interesse am Skript meiner Vorlesungen zur optimalen Steuerung an den technischen Universit¨aten in Chemnitz und Berlin zeigte jedoch den Bedarf an einer Einf¨ uhrung in die Thematik in deutscher Sprache, die auch Aspekte der nichtlinearen Optimierung im Funktionenraum ber¨ ucksichtigt. Das vorliegende Buch soll diesem Anliegen entsprechen und den Leser bef¨ahigen, grundlegende Probleme bzw. Begriffe wie die Existenz von L¨osungen g¨angiger linearer und semilinearer partieller Differentialgleichungen, Existenz optimaler Steuerungen, notwendige Optimalit¨ atsbedingungen und adjungierte Gleichung, hinreichende Optimalit¨atsbedingungen zweiter Ordnung sowie die Konzeption einfacher numerischer Verfahren zu verstehen. Dabei sind generell Schranken an die Steuerfunktionen zugelassen und teilweise auch Restriktionen an den Zustand des betrachteten Systems vorgegeben. Das sind die Schwerpunkte des Buchs. Weitere wichtige Fragestellungen wie Steuerbarkeit, Regelung und Riccati-Gleichungen, Diskretisierung und Fehlerabsch¨atzungen oder HamiltonBellman-Jacobi-Theorie h¨ atten den beabsichtigten Rahmen u ¨ berschritten. Der erste Teil behandelt konvexe Aufgaben mit quadratischem Zielfunktional und linearen elliptischen bzw. parabolischen Gleichungen und damit Resultate, die lange bekannt ¨ sind und umfassender in [144] dargestellt wurden. Zur Uberleitung auf Probleme mit semilinearen Gleichungen sind aber diese Aufgaben am besten geeignet. Es werden auch einige Begriffe der Funktionalanalysis sowie der Theorie linearer elliptischer und parabolischer partieller Differentialgleichungen zusammengestellt, um Lesern das Verst¨andnis zu erleichtern, die kaum Vorkenntnisse auf diesen Gebieten haben. Den Schwerpunkt der Darstellung bilden nichtkonvexe Aufgaben mit semilinearen Gleichungen. Sie erfordern Methoden aus Analysis, Optimierung und Numerik, die bisher vorrangig in Originalarbeiten zu finden sind. Dazu geh¨ oren insbesondere grundlegende Resultate von E. Casas sowie von J.-P. Raymond u ber die Beschr¨ anktheit und Stetigkeit von L¨osungen semili¨ nearer partieller Differentialgleichungen. Das Buch konzentriert sich im Wesentlichen auf die Analysis der Probleme, obwohl auch numerische Verfahren angesprochen werden. Numerische Methoden k¨onnten sicher ein weiteres Buch f¨ ullen. Die Darstellung beschr¨ ankt sich auf kurze Einf¨ uhrungen in entsprechende Grundideen, um dem Leser eine Vorstellung davon zu geben, wie man die Theorie vom Grundsatz her numerisch umsetzen kann. Großer Wert wird auf das Herausarbeiten versteckter mathematischer Schwierigkeiten gelegt, die man erfahrungsgem¨aß leicht u ¨bersieht.
vi
Der gesamte Stoff ist f¨ ur einen vierst¨ undigen einsemestrigen Kurs zu umfangreich, so dass man Teile ausw¨ ahlen muss. Eine zu empfehlende Variante besteht im Durcharbeiten der gesamten elliptischen Theorie (linear-quadratisch und nichtlinear) bei Verzicht auf den parabolischen Teil. Eine solche Vorlesung k¨ onnte sich auf die Abschnitte 1.2–1.4, 2.3– 2.10 und 2.12 zur linear-quadratischen sowie 4.1–4.6, 4.8–4.10 zur nichtlinearen Theorie konzentrieren. Die Kapitel zu elliptischen Problemen ben¨otigen keine Resultate aus denen zu parabolischen Aufgaben. Alternativ kann man sich auf linear-quadratische elliptische und parabolische Aufgaben beschr¨ anken und die Abschnitte 3.3–3.7 zur linear-quadratischen parabolischen Theorie hinzuf¨ ugen. Bei hinreichenden Vorkenntnissen zu Funktionalanalysis und partiellen Differentialgleichungen ist aber ein gr¨ oßerer Umfang zu schaffen. Mit einem Stern gekennzeichnete Abschnitte sind f¨ ur das Verst¨ andnis der nachfolgenden Kapitel nicht unbedingt erforderlich. Sie k¨ onnen daher bei Bedarf ausgelassen werden. Der Leser findet eine Reihe von Formeln eingerahmt. Das betrifft besonders wichtige Aussagen sowie die f¨ ur den jeweiligen Abschnitt maßgebende partielle Differentialgleichung. Die Arbeit am Buch fand das Interesse und die Unterst¨ utzung vieler Fachkollegen. Dazu geh¨ oren die Herren M. Hinze, P. Maaß sowie L. v. Wolfersdorf, die verschiedene Kapitel durchgesehen und zum Teil mit ihren Studenten bzw. Doktoranden behandelt haben. Herr W. Alt hat mir mit Hinweisen zur typographischen Gestaltung geholfen und den ersten Anstoß zum Buch gab Herr T. Grund mit einer in LATEX geschriebenen Vorlesungsmitschrift. Meine Berliner Kollegen C. Meyer, I. Neitzel, U. Pr¨ ufert, T. Slawig, D. Wachsmuth und I. Yousept haben schließlich die Endversion Korrektur gelesen. Allen Genannten bin ich f¨ ur ihre Hilfe sehr dankbar. Außerdem danke ich Frau U. SchmicklerHirzebruch und Frau P. Rußkamp vom Vieweg-Verlag f¨ ur die sehr angenehme Zusammenarbeit bei der Vorbereitung und Umsetzung des Buchprojekts. Berlin, April 2005 Vorwort zur zweiten Auflage. Neben der Korrektur von Schreibfehlern und Unsauberkeiten habe ich einige Passagen u ¨berarbeitet und erg¨anzt. Die Abschnitte zum Gradientenverfahren sind gek¨ urzt, um der primal-dualen Aktive-Mengen-Strategie mehr Raum zu geben. Deren Darstellung f¨ uhrt jetzt bis auf die zu l¨osenden linearen Gleichungssysteme. Auf Wunsch mehrerer Leser werden die verwendeten Greenschen Funktionen mit der Fouriermethode hergeleitet. Manche Quellen sind detaillierter angegeben und einige aktuelle Referenzen zur numerischen Analysis zustandsbeschr¨ankter Aufgaben hinzugef¨ ugt. In der Transliteration russischer Namen bevorzuge ich hier die englische Version. Allen Lesern, die mich mit Hinweisen zu Fehlern und Verbesserungsvorschl¨agen unterst¨ utzt haben, danke ich herzlich, insbesondere Roland Griesse, Markus M¨ uller, Hans Josef Pesch, Uwe Pr¨ ufert, Arnd R¨ osch und Lothar v. Wolfersdorf. Bei der Aktualisierung der Resultate zu partiellen Differentialgleichungen haben mich Eduardo Casas und Jens Griepentrog unterst¨ utzt, denen ich f¨ ur ihre Hilfe sehr dankbar bin. Besonderer Dank gilt ¨ ur die sorgf¨ altige Ubersetzung J¨ urgen Sprekels f¨ des Buchs ins Englische. Seine zahlreichen Anregungen sind auch in die zweite deutsche Auflage eingeflossen. Berlin, April 2009.
Inhaltsverzeichnis 1 Einf¨ uhrung und Beispiele 1.1 Was ist optimale Steuerung? . . . . . . . . . . . . . . . . . . 1.2 Beispiele konvexer Aufgaben . . . . . . . . . . . . . . . . . . . 1.2.1 Optimale station¨ are Aufheizung . . . . . . . . . . . . 1.2.2 Optimale instation¨ are Randtemperatur . . . . . . . . 1.2.3 Optimales Schwingen . . . . . . . . . . . . . . . . . . 1.3 Beispiele nichtkonvexer Probleme . . . . . . . . . . . . . . . . 1.3.1 Aufgaben mit semilinearer elliptischer Gleichung . . . 1.3.2 Probleme mit semilinearer parabolischer Gleichung . . 1.4 Grundkonzepte im endlichdimensionalen Fall . . . . . . . . . 1.4.1 Endlichdimensionale Aufgabe der optimalen Steuerung 1.4.2 Existenz optimaler Steuerungen . . . . . . . . . . . . . 1.4.3 Notwendige Optimalit¨ atsbedingungen erster Ordnung 1.4.4 Adjungierter Zustand und reduzierter Gradient . . . . 1.4.5 Lagrangefunktion . . . . . . . . . . . . . . . . . . . . . 1.4.6 Diskussion der Variationsungleichung . . . . . . . . . . 1.4.7 Formulierung als Karush-Kuhn-Tucker-System . . . .
. . . . . . . . . . . . . . . .
2 Linear-quadratische elliptische Probleme 2.1 Lineare normierte R¨ aume . . . . . . . . . . . . . . . . . . . . . 2.2 Sobolewr¨aume . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.1 Lp -R¨ aume . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.2 Regul¨ are Gebiete . . . . . . . . . . . . . . . . . . . . . . 2.2.3 Schwache Ableitungen und Sobolewr¨aume . . . . . . . . 2.3 Schwache L¨ osungen elliptischer Gleichungen . . . . . . . . . . . 2.3.1 Poissongleichung . . . . . . . . . . . . . . . . . . . . . . 2.3.2 Randbedingung dritter Art . . . . . . . . . . . . . . . . 2.3.3 Differentialoperator in Divergenzform . . . . . . . . . . 2.4 Lineare Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . 2.4.1 Lineare stetige Operatoren und Funktionale . . . . . . . 2.4.2 Schwache Konvergenz . . . . . . . . . . . . . . . . . . . 2.5 Existenz optimaler Steuerungen . . . . . . . . . . . . . . . . . . 2.5.1 Optimale station¨ are Temperaturquelle . . . . . . . . . . 2.5.2 Optimale station¨ are Randtemperatur . . . . . . . . . . 2.5.3 Allgemeinere elliptische Gleichungen und Zielfunktionale 2.6 Differenzierbarkeit in Banachr¨ aumen . . . . . . . . . . . . . . . 2.7 Adjungierte Operatoren . . . . . . . . . . . . . . . . . . . . . . 2.8 Notwendige Optimalit¨ atsbedingungen erster Ordnung . . . . . 2.8.1 Quadratische Optimierungsaufgabe im Hilbertraum . . 2.8.2 Optimale station¨ are Temperaturquelle . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
1 1 2 2 4 5 6 6 7 8 8 9 10 11 13 14 14
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . *. . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . .
17 17 19 19 21 21 24 24 27 30 32 32 35 38 38 42 43 44 47 49 50 51
. . . . . . . . . . . . . . . .
viii
Inhaltsverzeichnis
2.9
2.10 2.11
2.12
2.13
2.14
2.15 2.16
2.8.3 Station¨ are Temperaturquelle und Randbedingung dritter Art . . . 2.8.4 Optimale station¨ are Randtemperatur . . . . . . . . . . . . . . . . 2.8.5 Ein lineares Optimalsteuerungsproblem . . . . . . . . . . . . . . . Konstruktion von Testaufgaben . . . . . . . . . . . . . . . . . . . . . . . . 2.9.1 Bang-Bang-Steuerung . . . . . . . . . . . . . . . . . . . . . . . . . 2.9.2 Verteilte Steuerung und Neumann-Randbedingung . . . . . . . . . Das formale Lagrangeprinzip . . . . . . . . . . . . . . . . . . . . . . . . . Weitere Beispiele * . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.11.1 Differentialoperator in Divergenzform . . . . . . . . . . . . . . . . 2.11.2 Optimale station¨ are Temperaturquelle mit vorgegebener Außentemperatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Numerische Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.12.1 Bedingtes Gradientenverfahren . . . . . . . . . . . . . . . . . . . . 2.12.2 Gradienten-Projektionsverfahren . . . . . . . . . . . . . . . . . . . ¨ 2.12.3 Uberf¨ uhrung in ein endlichdimensionales quadratisches Optimierungsproblem . . . . . . . . . . . . . . . . . . . . . . . . . 2.12.4 Primal-duale Aktive-Mengen-Strategie . . . . . . . . . . . . . . . . Adjungierter Zustand als Lagrangescher Multiplikator * . . . . . . . . . . 2.13.1 Elliptische Gleichungen mit Daten aus V ∗ . . . . . . . . . . . . . . 2.13.2 Anwendung beim Beweis von Optimalit¨atsbedingungen . . . . . . 2.13.3 Adjungierter Zustand als Multiplikator . . . . . . . . . . . . . . . . H¨ ohere Regularit¨ at f¨ ur elliptische Aufgaben * . . . . . . . . . . . . . . . . 2.14.1 Grenzen des Zustandsraums H 1 (Ω) . . . . . . . . . . . . . . . . . . 2.14.2 Sobolew-Slobodetskii-R¨ aume . . . . . . . . . . . . . . . . . . . . . 2.14.3 H¨ ohere Regularit¨ at von L¨ osungen . . . . . . . . . . . . . . . . . . . Regularit¨ at optimaler Steuerungen * . . . . . . . . . . . . . . . . . . . . . ¨ Ubungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3 Linear-quadratische parabolische Probleme 3.1 Einf¨ uhrung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Die Fouriermethode im o ¨rtlich eindimensionalen Fall . . . . . . . . 3.2.1 Eindimensionale Modellprobleme . . . . . . . . . . . . . . . 3.2.2 Integraldarstellung von L¨ osungen – Greensche Funktion . . 3.2.3 Notwendige Optimalit¨ atsbedingungen . . . . . . . . . . . . 3.2.4 Bang-Bang-Prinzip . . . . . . . . . . . . . . . . . . . . . . . 3.3 Schwache L¨ osungen in W21,0 (Q) . . . . . . . . . . . . . . . . . . . . 3.4 Schwache L¨ osungen in W (0, T ) . . . . . . . . . . . . . . . . . . . . 3.4.1 Abstrakte Funktionen . . . . . . . . . . . . . . . . . . . . . 3.4.2 Abstrakte Funktionen und parabolische Gleichungen . . . . 3.4.3 Vektorwertige Distributionen . . . . . . . . . . . . . . . . . 3.4.4 Zugeh¨ origkeit schwacher L¨ osungen aus W21,0 (Q) zu W (0, T ) 3.5 Parabolische Optimalsteuerungsprobleme . . . . . . . . . . . . . . 3.5.1 Optimale instation¨ are Randtemperatur . . . . . . . . . . . 3.5.2 Optimale instation¨ are Temperaturquelle . . . . . . . . . . . 3.6 Notwendige Optimalit¨ atsbedingungen . . . . . . . . . . . . . . . . 3.6.1 Hilfssatz f¨ ur adjungierte Operatoren . . . . . . . . . . . . . 3.6.2 Optimale instation¨ are Randtemperatur . . . . . . . . . . . 3.6.3 Optimale instation¨ are Temperaturquelle . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
59 60 63 63 64 65 67 71 71 72 72 73 76 77 80 85 85 86 88 89 89 89 90 91 93 95 95 99 99 100 102 106 110 113 113 116 116 119 123 123 124 125 126 127 130
Inhaltsverzeichnis
3.6.4 Differentialoperator in Divergenzform * . 3.7 Numerische L¨ osungstechniken . . . . . . . . . . . 3.7.1 Gradienten-Projektionsverfahren . . . . . 3.7.2 Aufstellen des reduzierten Problems . . . 3.8 Herleitung der verwendeten Fourierentwicklungen 3.9 Parabolische Gleichungen in L2 (0, T ; V ∗ ) * . . . ¨ 3.10 Ubungsaufgaben . . . . . . . . . . . . . . . . . .
ix
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
131 134 134 135 138 141 143
4 Steuerung semilinearer elliptischer Gleichungen 4.1 Vorbemerkungen . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Semilineare elliptische Modellgleichung . . . . . . . . . . . . 4.2.1 Motivation des weiteren Vorgehens . . . . . . . . . . 4.2.2 L¨ osungen in H 1 (Ω) . . . . . . . . . . . . . . . . . . . 4.2.3 Stetige L¨ osungen . . . . . . . . . . . . . . . . . . . . 4.2.4 Abschw¨ achung der Voraussetzungen . . . . . . . . . 4.3 Nemytskii-Operatoren . . . . . . . . . . . . . . . . . . . . . 4.3.1 Stetigkeit von Nemytskii-Operatoren . . . . . . . . . 4.3.2 Differenzierbarkeit von Nemytskii-Operatoren . . . . aumen * . . . . . . . . 4.3.3 Ableitungen in weiteren Lp -R¨ 4.4 Existenz optimaler Steuerungen . . . . . . . . . . . . . . . . 4.4.1 Grundvoraussetzungen des Kapitels . . . . . . . . . 4.4.2 Verteilte Steuerung . . . . . . . . . . . . . . . . . . . 4.5 Der Steuerungs-Zustands-Operator . . . . . . . . . . . . . . 4.5.1 Verteilte Steuerung . . . . . . . . . . . . . . . . . . . 4.5.2 Randsteuerung . . . . . . . . . . . . . . . . . . . . . 4.6 Notwendige Optimalit¨ atsbedingungen . . . . . . . . . . . . 4.6.1 Verteilte Steuerung . . . . . . . . . . . . . . . . . . . 4.6.2 Randsteuerung . . . . . . . . . . . . . . . . . . . . . 4.7 Anwendung des formalen Lagrangeprinzips . . . . . . . . . 4.8 Pontrjaginsches Maximumprinzip * . . . . . . . . . . . . . . 4.8.1 Hamiltonfunktionen . . . . . . . . . . . . . . . . . . 4.8.2 Maximumprinzip . . . . . . . . . . . . . . . . . . . . 4.9 Ableitungen zweiter Ordnung . . . . . . . . . . . . . . . . . 4.10 Optimalit¨ atsbedingungen zweiter Ordnung . . . . . . . . . . 4.10.1 Grundideen hinreichender Optimalit¨atsbedingungen 4.10.2 Die Zwei-Norm-Diskrepanz . . . . . . . . . . . . . . 4.10.3 Verteilte Steuerung . . . . . . . . . . . . . . . . . . . 4.10.4 Randsteuerung . . . . . . . . . . . . . . . . . . . . . 4.10.5 Ber¨ ucksichtigung stark aktiver Restriktionen * . . . 4.10.6 F¨ alle ohne Zwei-Norm-Diskrepanz . . . . . . . . . . 4.10.7 Lokale Optimalit¨ at in Lr (Ω) . . . . . . . . . . . . . . 4.11 Numerische Verfahren . . . . . . . . . . . . . . . . . . . . . 4.11.1 Gradienten-Projektionsverfahren . . . . . . . . . . . 4.11.2 Grundidee des SQP-Verfahrens . . . . . . . . . . . . 4.11.3 Das SQP-Verfahren f¨ ur elliptische Probleme . . . . . ¨ 4.12 Ubungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
145 145 146 146 147 151 154 156 156 158 162 163 163 165 168 169 171 171 171 174 176 178 178 179 180 184 184 187 190 198 199 203 204 205 205 205 207 210
x
Inhaltsverzeichnis
5 Steuerung semilinearer parabolischer Gleichungen 5.1 Die semilineare parabolische Modellgleichung . . . . 5.2 Grundvoraussetzungen des Kapitels . . . . . . . . . 5.3 Existenz optimaler Steuerungen . . . . . . . . . . . . 5.4 Steuerungs-Zustands-Operator . . . . . . . . . . . . 5.5 Notwendige Optimalit¨ atsbedingungen . . . . . . . . 5.5.1 Verteilte Steuerung . . . . . . . . . . . . . . . 5.5.2 Randsteuerung . . . . . . . . . . . . . . . . . 5.6 Pontrjaginsches Maximumprinzip * . . . . . . . . . . 5.7 Optimalit¨ atsbedingungen zweiter Ordnung . . . . . . 5.7.1 Ableitungen zweiter Ordnung . . . . . . . . . 5.7.2 Verteilte Steuerung . . . . . . . . . . . . . . . 5.7.3 Randsteuerung . . . . . . . . . . . . . . . . . 5.7.4 Ein Fall ohne Zwei-Norm-Diskrepanz . . . . . 5.8 Testaufgaben . . . . . . . . . . . . . . . . . . . . . . 5.8.1 Testaufgabe mit Steuerungsrestriktionen . . . 5.8.2 Aufgabe mit integraler Zustandsrestriktion * 5.9 Numerische Verfahren . . . . . . . . . . . . . . . . . 5.9.1 Gradientenverfahren . . . . . . . . . . . . . . 5.9.2 Das SQP-Verfahren . . . . . . . . . . . . . . 5.10 Weitere parabolische Probleme * . . . . . . . . . . . 5.10.1 Phasenfeldmodell . . . . . . . . . . . . . . . . 5.10.2 Instation¨ are Navier-Stokes-Gleichungen . . . ¨ 5.11 Ubungsaufgaben . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
211 211 213 214 217 220 221 224 226 227 227 229 233 234 235 236 238 243 243 244 247 247 249 253
6 Optimierungsaufgaben im Banachraum 6.1 Karush-Kuhn-Tucker-Bedingungen . . . . . . 6.1.1 Konvexe Aufgaben . . . . . . . . . . . 6.1.2 Differenzierbare Aufgaben . . . . . . . 6.1.3 Eine semilineare elliptische Aufgabe . 6.2 Steuerprobleme mit Zustandsbeschr¨ ankungen 6.2.1 Konvexe Aufgaben . . . . . . . . . . . 6.2.2 Eine nichtkonvexe Aufgabe . . . . . . ¨ 6.3 Ubungsaufgaben . . . . . . . . . . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
254 254 254 259 263 265 266 273 276
7 Erg¨ anzungen zu partiellen Differentialgleichungen 7.1 Einbettungss¨ atze . . . . . . . . . . . . . . . . . . . . . . . . 7.2 Elliptische Gleichungen . . . . . . . . . . . . . . . . . . . . 7.2.1 Elliptische Regularit¨ at und Stetigkeit von L¨osungen 7.2.2 Methode von Stampacchia . . . . . . . . . . . . . . . 7.2.3 Elliptische Gleichungen mit Maßen . . . . . . . . . . 7.3 Parabolische Gleichungen . . . . . . . . . . . . . . . . . . . 7.3.1 L¨ osungen in W (0, T ) . . . . . . . . . . . . . . . . . . 7.3.2 Stetige L¨ osungen . . . . . . . . . . . . . . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
277 277 278 278 279 284 285 285 293
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
Index
298
Literaturverzeichnis
301
1 Einfu ¨hrung und Beispiele 1.1 Was ist optimale Steuerung? Die mathematische Theorie der optimalen Steuerung hat sich im Zusammenhang mit Berechnungen f¨ ur die Raumfahrt schnell zu einem wichtigen und eigenst¨andigen Gebiet der angewandten Mathematik entwickelt. Die Bewegungsgleichungen von Luft- und Raumfahrzeugen werden durch Systeme von gew¨ohnlichen Differentialgleichungen beschrieben und Aspekte der Optimierung kommen dann ins Spiel, wenn die Bewegungen der Flugk¨ orper optimal ablaufen sollen. Folgendes einfache akademische Beispiel verdeutlicht die Situation: Ein Fahrzeug soll auf einer geraden Strecke aus der Ruhelage in einem Punkt A heraus in k¨ urzester Zeit nach Punkt B bewegt werden und dort wieder zum Stehen kommen. Das Fahrzeug kann dabei in beiden Richtungen mit der gleichen Kraft beschleunigt werden, etwa durch je ein nach vorn und hinten gerichtetes D¨ usentriebwerk. Bezeichnet y(t) ∈ IR die Position des Fahrzeugs zur Zeit t, m seine Masse und u(t) die Schubkraft des Fahrzeugs mit der Kapazit¨ at −1 ≤ u(t) ≤ 1 (+1: volle Kraft voraus, −1: Vollbremsung), dann lautet die Aufgabe mathematisch wie folgt: Minimiere die Zeit T unter den Nebenbedingungen m y (t) = u(t) y(0) = y0 y (0) = 0 y(T ) y (T )
= yT = 0,
in (0, T )
|u(t)| ≤ 1
∀t ∈ [0, T ].
Die Punkte y0 , yT ∈ IR entsprechen den Positionen A, B. Dieses Beispiel wird im Lehrbuch von Macki und Strauss [154] als das Problem des Raketenautos bezeichnet. Es enth¨ alt die wesentlichen Bestandteile eines Optimalsteuerungsproblems. Das sind die zu minimierende Zielfunktion, hier die Fahrtzeit T , die den gesamten Bewegungsprozess modellierende Differentialgleichung m y = u mit Anfangsbedingungen zur Bestimmung des Zustands y, eine Steuerfunktion u sowie zu erf¨ ullende Nebenbedingungen y(T ) = yT , y (T ) = 0, |u| ≤ 1. Die Steuerung u kann innerhalb der gegebenen Schranken frei gew¨ ahlt werden (z.B. per Gaspedal im Raketenauto), w¨ahrend sich der Zustand in Abh¨ angigkeit von der gew¨ ahlten Steuerung eindeutig als L¨osung der Differentialgleichung unter Beachtung der Anfangsbedingungen ergibt. Die Steuerung ist so zu w¨ahlen, dass die Zielfunktion den kleinsten Wert annimmt. Eine solche Steuerung heißt optimal. Beim Beispiel des Raketenautos ist diese intuitiv sofort zu ermitteln. Es wird daher gern zum
2
1 Einf¨ uhrung und Beispiele
Testen der Theorie benutzt. Optimale Steuerung bei gew¨ ohnlichen Differentialgleichungen ist nicht nur f¨ ur die Luftund Raumfahrt von Interesse. Sie ist auch wichtig f¨ ur die Robotik, f¨ ur Bewegungsabl¨aufe im Sport, f¨ ur die Steuerung chemischer Prozesse oder die Kraftwerksoptimierung, um nur einige der vielf¨ altigen Anwendungen zu nennen. Oft k¨onnen die zu optimierenden Prozesse nicht ad¨ aquat durch gew¨ ohnliche Differentialgleichungen modelliert werden, sondern es sind partielle Differentialgleichungen zu ihrer Beschreibung n¨otig. Beispielsweise werden W¨ armeleitung, Diffusion, Schwingungen, elektromagnetische Wellen, Str¨omungen, Erstarrungsvorg¨ ange und andere physikalische Ph¨anomene durch partielle Differentialgleichungen erfasst. Es gibt zahlreiche interessante Optimierungsprobleme, eine Zielfunktion bei Vorgabe einer partiellen Differentialgleichung unter weiteren Nebenbedingungen zu minimieren. Der Unterschied zum obigen Beispiel besteht nur“ darin, dass an Stelle einer gew¨ohnlichen ” eine partielle Differentialgleichung gegeben ist. Im Buch treten als mathematisch vereinfachte Beispiele exemplarisch die optimale Steuerung von Aufheizungsprozessen, Zweiphasenproblemen sowie von Str¨ omungen auf. Die Vielfalt an Typen partieller Differentialgleichungen ist groß. Wir werden hier nur lineare und semilineare elliptische sowie parabolische partielle Differentialgleichungen zulassen. Die Regularit¨ at der L¨ osungen dieser Gleichungen ist gut untersucht. Bei hyperbolischen Differentialgleichungen liegen die Dinge anders. Auch die Behandlung quasilinearer partieller Differentialgleichungen ist deutlich schwieriger und die entsprechende Theorie der optimalen Steuerung noch in mancher Beziehung offen. Wir behandeln am Anfang Probleme mit linearer Gleichung und quadratischem Zielfunktional. Im n¨ achsten Abschnitt sind dazu einfache akademische Modellprobleme formuliert, die im Weiteren zur Illustration der Theorie immer wieder herangezogen werden. F¨ ur die linear-quadratische Theorie reichen Hilbertr¨aume aus, was das Arbeiten erleichtert. Der zweite Teil ist Aufgaben mit semilinearen Gleichungen gewidmet. Hier sind die Beispiele weniger akademisch. Bedingt durch die Nichtlinearit¨aten ist die Theorie aber komplizierter.
1.2 Beispiele konvexer Aufgaben 1.2.1 Optimale station¨ are Aufheizung Optimale Randtemperatur ur einen aufzuheizenden bzw. Gegeben sei ein Ortsgebiet Ω ⊂ IR3 mit Rand Γ, das f¨ abzuk¨ uhlenden K¨ orper steht. An seinem Rand Γ wird eine zeitlich konstante, aber vom Randpunkt x abh¨ angige Temperatur u = u(x) - die Steuerung - angelegt. Ziel der Steuerung ist die bestm¨ ogliche Approximation einer vorgegebenen station¨aren Temperaturverteilung yΩ = yΩ (x) in Ω. Diese Zielstellung f¨ uhrt auf das Problem min J(y, u) :=
1 2
Ω
y(x) − yΩ (x)
2
dx +
λ 2
Γ
u(x)2 ds(x)
1.2 Beispiele konvexer Aufgaben
3
bei den Nebenbedingungen −Δy ∂y ∂ν
= 0
in Ω
= α (u − y)
auf Γ
(Zustandsgleichung) sowie ua (x) ≤ u(x) ≤ ub (x)
auf Γ
(punktweise Beschr¨ankungen an die Steuerung). Schranken an die Steuerung sind wegen beschr¨ ankter Aufheizungs- bzw. Abk¨ uhlungskapazit¨ at einzuhalten. Den Faktor λ kann man als Maß f¨ ur die Energiekosten der Steuerung u interpretieren. Mathematisch gesehen dient dieser Term auch der Regularisierung. Er bewirkt, dass optimale Steuerungen bessere Glattheitseigenschaften aufweisen. Wir bezeichnen generell mit ds das Oberfl¨ achenelement und mit ν = ν(x) den nach außen gerichteten Normalenvektor auf Γ. Die Funktion α steht f¨ ur die W¨ arme¨ ubergangszahl von Ω in das umgebende Medium. Das zu minimierende Funktional J wird Zielfunktional genannt. Der hier enthaltene Faktor 1/2 hat auf die optimale L¨ osung keinen Einfluss und wird nur aus Gr¨ unden der Zweckm¨ aßigkeit gew¨ ahlt. Er kompensiert sp¨ ater den Faktor 2, der sich aus der Ableitung ergibt. Gesucht ist eine optimale Steuerung u = u(x) mit zugeh¨ origem Zustand y = y(x). Das auf den ersten Blick u ussige Minuszeichen vor ¨berfl¨ dem Laplace-Operator hat damit zu tun, dass −Δ, aber nicht Δ koerziv ist.
Ω ·x
ν
y = y(x) u = u(x)
Γ
Randsteuerung
Die Aufgabe hat ein quadratisches Zielfunktional, eine lineare elliptische partielle Differentialgleichung als Zustandsgleichung und eine Steuerung, die auf dem Rand des Ortsgebiets auftritt. Daher geh¨ ort dieses Problem zur Klasse der linear-quadratischen elliptischen Randsteuerungsprobleme. Bemerkung. Die Aufgabenstellung ist stark vereinfacht. Beispielsweise muss bei realistischer Modellierung an Stelle der Laplacegleichung Δy = 0 die station¨ are W¨ armeleitungsgleichung div (a grad y) = 0 betrachtet werden, wobei der Koeffizient a von x und sogar von y abh¨ angen kann. Im Fall a = a(y) oder a = a(x, y) liegt eine quasilineare partielle Differentialgleichung vor. Außerdem wird eine zeitlich instation¨ are Beschreibung oft sinnvoller sein.
Optimale Temperaturquelle Analog kann die Steuerung als Temperaturquelle im Gebiet Ω wirken. Probleme dieser Art treten etwa bei der Aufheizung eines K¨ orpers Ω durch elektromagnetische Induktion
4
1 Einf¨ uhrung und Beispiele
oder Mikrowellen auf. Die Randtemperatur sei zun¨achst gleich null. Dann erhalten wir die Aufgabe 2 1 λ min J(y, u) := y(x) − yΩ (x) dx + u(x)2 dx 2 Ω 2 Ω bei −Δy y
= β u in Ω = 0 auf Γ
ua (x) ≤ u(x) ≤ ub (x)
in Ω.
Hier ist zus¨ atzlich ein Koeffizient β = β(x) vorgegeben. Durch die Wahl β = χΩc kann man u gegebenenfalls nur in einem Teilgebiet Ωc ⊂ Ω wirken lassen (χE ist die charakteristische Funktion einer Menge E). Die Aufgabe ist ein linear-quadratisches elliptisches Steuerproblem mit verteilter Steuerung.
u(x) Ω
Γ
Anstatt die Randtemperatur mit null anzunehmen, kann die Vorgabe einer Außentemperatur ya realistischer sein. Dann modelliert die Zustandsgleichung −Δy ∂y ∂ν
Verteilte Steuerung
= βu
in Ω
= α (ya − y)
auf Γ
den Sachverhalt besser.
1.2.2 Optimale instation¨ are Randtemperatur Ω ⊂ IR3 stehe f¨ ur eine Kartoffel, die wir im Feuer in fest vorgebener Zeit T > 0 braten wollen. Ihre Temperatur sei y = y(x, t), x ∈ Ω, t ∈ [0, T ]. Zu Beginn habe sie die Temperatur y0 = y0 (x) und zum Endzeitpunkt T ist eine mundgerechte Temperaturverteilung unscht. Im Weiteren verwenden wir generell die Bezeichnungen Q := Ω × (0, T ) yΩ gew¨ sowie Σ := Γ × (0, T ). Die Aufgabe lautet damit 1 min J(y, u) := 2
Ω
y(x, T ) − yΩ (x)
2
λ dx + 2
yt − Δy = 0 ∂y = α (u − y) ∂ν y(x, 0) = y0 (x)
T 0
in Q in Σ in Ω
Γ
u(x, t)2 ds(x) dt
1.2 Beispiele konvexer Aufgaben
5
ua (x, t) ≤ u(x, t) ≤ ub (x, t) in Σ. Durch laufendes Drehen des Bratspießes erzeugen wir uns u(x, t). Die Aufheizung wird nun durch die instation¨are W¨armeleitungsgleichung beschrieben, eine parabolische Differentialgleichung. Es liegt ein linear-quadratisches parabolisches Randsteuerungsproblem vor. Hier und im Weiteren bezeichnet yt die partielle Ableitung von y nach t.
1.2.3 Optimales Schwingen Eine Gruppe von Fußg¨ angern l¨ auft u ucke und regt sie (offenbar gezielt) zum ¨ ber eine Br¨ Schwingen an. Stark abstrahiert ergibt sich folgende Konstellation: Ω ⊂ IR2 ist das Gebiet der Br¨ ucke, y = y(x, t) deren vertikale Auslenkung, u = u(x, t) die vertikal wirkende Kraftdichte und yd = yd (x, t) ein gew¨ unschter Schwingungsverlauf. Es ergibt sich die Optimalsteuerungsaufgabe 1 min J(y, u) := 2
T 0
Ω
y(x, t) − yd (x, t)
2
λ dx dt + 2
T 0
Ω
u(x, t)2 dx dt
bei ytt − Δy y(0) yt (0) y
= = = =
u y0 y1 0
in in in in
Q Ω Ω Σ
sowie ua (x, t) ≤ u(x, t) ≤ ub (x, t) in Q. Das ist ein linear-quadratisches hyperbolisches Steuerproblem mit verteilter Steuerung. Hyperbolische Probleme behandeln wir hier nicht und verweisen auf das Standardwerk von Lions [144] sowie auf Ahmed und Teo [4]. Interessante Probleme der Beeinflussung schwingender elastischer Netzwerke werden durch Lagnese et al. [136] behandelt. Eine elementare Einf¨ uhrung in die Steuerbarkeit von Schwingungen findet man in Krabs [127].
u Ω
Im linear-quadratischen Fall hat die Theorie hyperbolischer Aufgaben vieAnregung von Schwingungen le Analogien zu parabolischen Problemen, die in diesem Buch ausf¨ uhrlich behandelt werden. Semilineare hyperbolische Probleme sind aber wegen schwacher Gl¨ attungseigenschaften der L¨ osungsoperatoren deutlich schwieriger. Ein Teil der im Buch verwendeten Methoden geht bei ihnen nicht durch.
6
1 Einf¨ uhrung und Beispiele
1.3 Beispiele nichtkonvexer Probleme Die bis jetzt betrachteten Differentialgleichungen waren linear. F¨ ur viele in der Realit¨at vorkommende Erscheinungen reicht jedoch ein lineares Modell nicht aus. Oft ben¨otigt man quasilineare Gleichungen oder - was einfacher ist - semilineare. Wir nennen eine Gleichung zweiter Ordnung semilinear, wenn die Hauptteile der im Gebiet und auf dem Rand gegebenen Differentialoperatoren, d.h. deren Anteile mit der h¨ochsten Differentiationsordnung, nur linear in Bezug auf die gesuchte L¨osung auftreten. Im semilinearen Fall ist die Theorie der optimalen Steuerung sehr weit entwickelt. Solche Optimalsteuerungsprobleme sind in der Regel nichtkonvex, selbst wenn das Zielfunktional konvex ist. Im Weiteren werden Beispiele solcher Gleichungen erl¨autert. Durch Vorgabe eines Zielfunktionals und entsprechender Beschr¨ankungen erh¨alt man daraus optimale Steuerungsprobleme.
1.3.1 Aufgaben mit semilinearer elliptischer Gleichung Aufheizung mit Strahlungsrandbedingung Bei Ber¨ ucksichtigung der W¨ armeabstrahlung des aufzuheizenden K¨orpers ergibt sich eine Aufgabe mit nichtlinearer Stefan-Boltzmann-Randbedingung. Die Steuerung ist in diesem Beispiel die Außentemperatur u: −Δy ∂y ∂ν
= 0
in Ω
= α (u4 − y 4 ) auf Γ.
Hier tritt die Nichtlinearit¨ at y 4 in der Randbedingung auf, w¨ahrend die W¨armeleitungsgleichung selbst linear ist. Vereinfachte Aufgabe der Supraleitung Das folgende vereinfachte Ginzburg-Landau-Modell der Supraleitung wurde von Ito und Kunisch [113] f¨ ur numerische Verfahren der Optimalsteuerung verwendet: −Δy − y + y 3 y|Γ
= u = 0
in Ω auf Γ.
Wir diskutieren sie aus Gr¨ unden der Analysis vereinfacht in der Form −Δy + y + y 3 = u. Auch diese Gleichung ist von Interesse f¨ ur die Theorie der Supraleitung, [113]. Steuerung station¨ arer Str¨ omungen Zeitlich station¨ are Str¨ omungen inkompressibler Medien in zwei- oder dreidimensionalen Ortsgebieten Ω werden durch die station¨ aren Navier-Stokes-Gleichungen beschrieben, −
1 Δu + (u · ∇) u + ∇p = f Re u = 0 div u = 0
in Ω auf Γ in Ω,
1.3 Beispiele nichtkonvexer Probleme
7
Temam [191], Galdi [73]. Im Gegensatz zu unserer bisherigen Notation bezeichnet hier u = u(x) ∈ IR3 den Geschwindigkeitsvektor des im Ortspunkt x befindlichen Partikels, p = p(x) den Druck und f = f (x) die Dichte der im Gebiet wirkenden Volumenkraft. Mit Re bezeichnet man die sogenannte Reynoldszahl. Die Nichtlinearit¨at steckt im Differentialoperator erster Ordnung (u · ∇) u. Die hier verwendete Kurzschreibweise ist wie folgt zu verstehen: Durch u · ∇ = u1 D1 + u2 D2 + u3 D3 erfolgt die Operatorbildung (Di steht f¨ ur ∂/∂xi ). Dieser Operator wird dann auf u angewendet, also ⎡ ⎤ 3 Di u1 ui ⎣ Di u2 ⎦ . (u · ∇) u = u1 D1 u + u2 D2 u + u3 D3 u = i=1 Di u3 Die Steuerung ist f . Dieses mathematische Modell ist zum Beispiel bei Fl¨ ussigkeiten von Interesse, die auf steuerbare Magnetfelder reagieren. Optimierungsziel kann die Approximation einer gew¨ unschten station¨ aren Zielstr¨ omung sein.
1.3.2 Probleme mit semilinearer parabolischer Gleichung Beispiele aus Abschnitt 1.3.1 Beide Beispiele semilinearer elliptischer Gleichungen aus Abschnitt 1.3.1 k¨onnen ebenso gut zeitlich instation¨ ar formuliert werden. Das erste ergibt ein parabolisches AnfangsRandwertproblem mit Stefan-Boltzmann-Randbedingung f¨ ur die Temperatur y(x, t), yt − Δy ∂y ∂ν y(·, 0)
in Q
= 0
= α (u4 − y 4 ) in Σ = 0
in Ω.
Im Zusammenhang mit der Optimalsteuerung wurde eine solche Aufgabe erstmalig von Sachs [182] betrachtet, siehe auch Schmidt [185]. Analog kann das vereinfachte Modell der Supraleitung zeitlich instation¨ ar betrachtet werden, yt − Δy − y + y 3 y|Γ y(·, 0)
= u = 0 = 0
in Q in Σ in Ω.
Ein Phasenfeldmodell Manche Schmelz- bzw. Erstarrungsprozesse werden durch Systeme von Phasenfeldgleichungen wie das folgende modelliert: ut + ϕt 2 τ ϕt ∂u ∂ν u(·, 0)
= κ Δu + f 2
= ξ Δϕ + g(ϕ) + 2u ∂ϕ = 0, = 0, ∂ν = u0 , ϕ(·, 0) = ϕ0
in Q in Q in Σ in Ω.
8
1 Einf¨ uhrung und Beispiele
Hier ist u = u(x, t) die Temperatur und ϕ = ϕ(x, t) ∈ [−1, 1] die sogenannte Phasenfunktion, die den Erstarrungszustand beschreibt. Die fl¨ ussige Phase entspricht ϕ = 1, die feste ϕ = −1. Die Funktion f stellt eine steuerbare Temperaturquelle dar und −g ist Ableitung eines sogenannten double well“ Potentials G. Oft w¨ahlt man G(z) = 18 (z 2 − 1)2 . Meist ” hat g die Form g(z) = az + bz 2 − cz 3 mit beschr¨ankten Koeffizientenfunktionen a, b und c > 0. Weiter bezeichnet κ die W¨ armeleitzahl, die latente W¨arme, τ die Relaxationszeit und ξ eine L¨ angeneinheit. Hier kann das Ann¨ ahern eines gew¨ unschten Erstarrungs- oder Schmelzverlaufs Ziel der Optimierung sein. Erste Ergebnisse zur Theorie entsprechender Optimalsteuerungsprobleme wurden durch Chen und Hoffmann [56] sowie Hoffmann und Jiang [109] ver¨ offentlicht. Steuerung instation¨ arer Str¨ omungen Zeitvariante Str¨ omungen inkompressibler Medien werden durch die instation¨aren NavierStokes-Gleichungen erfasst: ut −
1 Δu + (u · ∇) u + ∇p Re div u u u(·, 0)
=
f
in Q
= = =
0 0 u0
in Q in Σ in Ω.
Hier wirkt eine Volumenkraft f auf das Medium, das die Anfangsgeschwindigkeit u0 und die Randgeschwindigkeit null hat (Haftbedingung). Je nach Sachverhalt sind auch andere Randbedingungen von Interesse. Eine der ersten Arbeiten zur mathematischen Theorie der Steuerung von Str¨ omungsvorg¨ angen wurde von Abergel und Temam [1] ver¨offentlicht.
1.4 Grundkonzepte im endlichdimensionalen Fall Einige Grundbegriffe der optimalen Steuerung lassen sich sehr einfach an Optimierungsaufgaben im Euklidischen Raum mit endlich vielen Gleichungsrestriktionen erl¨autern. Dieser Abstecher in die endlichdimensionale Optimierung hat den Vorteil, dass die Darstellung nicht durch technische Details partieller Differentialgleichungen und Aspekte der Funktionalanalysis u ¨berlagert wird.
1.4.1 Endlichdimensionale Aufgabe der optimalen Steuerung Es seien eine zu minimierende Zielfunktion J = J(y, u), J : IRn × Rm → IR, eine (n, n)Matrix A, eine (n, m)-Matrix B sowie eine nichtleere Menge Uad ⊂ IRm gegeben ( ad“ ” f¨ ur admissible, zul¨ assig). Wir betrachten die Optimierungsaufgabe min J(y, u) A y = B u,
u ∈ Uad .
(1.1)
1.4 Grundkonzepte im endlichdimensionalen Fall
9
Es sind also Vektoren y und u gesucht, welche die Zielfunktion J unter den Nebenbedingungen A y = B u sowie u ∈ Uad minimieren. Wenn nicht anders vereinbart, sind Vektoren in diesem Buch Spaltenvektoren. Beispiel. Oft werden quadratische Zielfunktionen verwendet, etwa J(y, u) = |y − yd |2 + λ |u|2 , wobei | · | die Euklidische Norm bezeichnet.
Noch hat (1.1) die Form einer normalen Optimierungsaufgabe, bei der y und u gleichberechtigt sind. Jetzt fordern wir zus¨ atzlich, dass A eine invertierbare Matrix ist. Dann kann die Gleichung in (1.1) nach y aufgel¨ ost werden, y = A−1 B u.
(1.2)
Zu beliebigem u ∈ IRm gibt es genau eine L¨ osung y ∈ IRn . Man kann u beliebig w¨ahlen ( steuern“) und immer stellt sich als abh¨ angige Gr¨oße genau ein zugeh¨origes y ein. Wir ” bezeichnen deshalb u als Steuerungsvektor oder kurz als Steuerung und y als den zugeh¨ origen Zustandsvektor bzw. Zustand. Auf diese Weise wird (1.1) zu einer endlichdimensionalen Aufgabe der Optimalsteuerung. Um den Zusammenhang mit Optimalsteuerungsproblemen bei partiellen Differentialgleichungen herzustellen, f¨ uhren wir die Matrix S : IRm → IRn , S = A−1 B, ein. Das ist die L¨osungsmatrix unseres Steuersystems und es gilt y = S u. Mit (1.2) k¨ onnen wir y in J eliminieren und erhalten eine reduzierte Zielfunktion f , J(y, u) = J(S u, u) =: f (u). F¨ ur die quadratische Funktion im obigen Beispiel ergibt sich f (u) = |Su − yd |2 + λ|u|2 . Damit wird (1.1) zur nichtlinearen Optimierungsaufgabe min f (u),
u ∈ Uad .
(1.3)
Bei diesem auf u reduzierten Problem tritt nur die Steuerung u als Unbekannte auf. Wir werden nun einige Grundideen diskutieren, die uns in ¨ahnlicher Form bei der optimalen Steuerung von partiellen Differentialgleichungen immer wieder begegnen werden.
1.4.2 Existenz optimaler Steuerungen Definition. Ein Vektor u ¯ ∈ Uad heißt optimale Steuerung f¨ ur die Aufgabe (1.1), wenn f (¯ u) ≤ f (u) f¨ ur alle u ∈ Uad gilt; y¯ := S u ¯ heißt zu u ¯ geh¨origer optimaler Zustand. ¨ Optimale oder lokal optimale Gr¨ oßen werden wir durch Uberstreichung wie in u ¯ kennzeichnen. Satz 1.1 Ist J stetig auf IRn × Uad , die Menge Uad nichtleer, beschr¨ankt und abgeschlossen sowie die Matrix A invertierbar, dann existiert mindestens eine optimale Steuerung f¨ ur (1.1).
10
1 Einf¨ uhrung und Beispiele
Beweis: Mit J ist auch f stetig auf Uad . Außerdem ist Uad als beschr¨ankte und abgeschlossene Menge eines endlichdimensionalen Raums kompakt. Der bekannte Satz von Weierstraß sichert, dass f sein Minimum in Uad annimmt. Es existiert also ein u ¯ ∈ Uad mit der Eigenschaft f (¯ u) = min f (u). u∈Uad
Bei Optimalsteuerungsproblemen f¨ ur partielle Differentialgleichungen wird dieser Beweis komplizierter, weil beschr¨ ankte und abgeschlossene Mengen in (unendlichdimensionalen) Funktionenr¨ aumen nicht notwendig kompakt sind.
1.4.3 Notwendige Optimalit¨ atsbedingungen erster Ordnung In diesem Abschnitt wird behandelt, welche Bedingungen optimale Vektoren u ¯ und y¯ erf¨ ullen m¨ ussen. Damit verbindet man die Erwartung, aus diesen Bedingungen u¯ und y¯ ermitteln zu k¨ onnen. In der Regel muss das mit numerischen Methoden geschehen. Bezeichnungen. Wir verwenden folgende Bezeichnungen f¨ ur Ableitungen von Funktionen f : IRm → IR: Di
=
f (x)
=
∇f (u) =
∂ ∂ (partielle Ableitungen), , Dx = ∂x ∂x i D1 f (x), . . . , Dm f (x) (Ableitung), f (u)
(Gradient),
mit dem Zeichen f¨ ur Transposition. F¨ ur Funktionen f = f (x, y) : IRm × IRn → IR bezeichnet Dx f den Zeilenvektor der partiellen Ableitungen von f nach x1 , ..., xm und ∇x f den entsprechenden Spaltenvektor. Analog sind Dy f und ∇y f definiert. Weiter bezeichnet
m u , v IRm = u · v = ui vi
i=1
m
das Skalarprodukt in IR . Wir werden aus Gr¨ unden der Zweckm¨aßigkeit beide Bezeichnungen des Skalarprodukts f¨ ur Vektoren verwenden. Die Anwendung von f (u) auf einen Spaltenvektor h ∈ IRm , gegeben durch das Produkt f (u) h, ergibt die Richtungsableitung in Richtung h, f (u) h = ∇f (u) , h IRm = ∇f (u) · h. Wir setzen jetzt zus¨ atzlich voraus, dass die Zielfunktion J stetig partiell nach y und u differenzierbar ist. Die partiellen Ableitungen nach y bzw. u, Dy J(y, u) und Du J(y, u), sollen also stetig in (y, u) sein. Aus der Kettenregel folgt dann die stetige Differenzierbarkeit von f (u) = J(Su, u). 1 λ Beispiel. f (u) = |Su − yd |2 + |u|2 2 2 Hier ergibt sich ∇f (u) = S (Su − yd ) + λ u, f (u) = f (u) h = S (Su − yd ) + λ u , h IRm .
S (Su − yd ) + λ u
1.4 Grundkonzepte im endlichdimensionalen Fall
11
Satz 1.2 Ist u ¯ optimale Steuerung f¨ ur (1.1) und Uad konvex, dann gen¨ ugt u ¯ der Variationsungleichung f (¯ u)(u − u ¯) ≥ 0 ∀u ∈ Uad . (1.4) Diese einfache aber fundamentale Aussage folgt aus dem allgemeineren Lemma 2.21 auf S. 50 und dr¨ uckt die Beobachtung aus, dass die Funktion f an der Stelle eines Minimums in keiner Richtung fallen kann. Mit der Kettenregel und dem Satz u ¨ ber das totale Differential wird die Ableitung f In (1.4) durch f = Dy J S + Du J berechnet, f (¯ u) h = = =
Dy J(S u ¯, u ¯) Sh + Du J(S u ¯, u ¯) h −1 ∇y J(¯ y, u ¯) , A B h IRn + ∇u J(¯ y, u ¯) , h IRm −1 B (A ) ∇y J(¯ y, u ¯) + ∇u J(¯ y, u ¯) , h IRm .
Die Variationsungleichung (1.4) nimmt so die etwas un¨ ubersichtliche Form −1 y, u ¯) + ∇u J(¯ y, u ¯) , u − u ¯ IRm ≥ 0 ∀ u ∈ Uad B (A ) ∇y J(¯
(1.5)
(1.6)
an. Durch Einf¨ uhrung des adjungierten Zustands, einem einfachen, aber f¨ ur die Theorie der optimalen Steuerung entscheidenden Trick, kann man (1.6) deutlich vereinfachen.
1.4.4 Adjungierter Zustand und reduzierter Gradient Wir nehmen zur Motivation an, dass die Verwendung der inversen Matrix A−1 f¨ ur numerische Rechnungen zu aufwendig ist. Das ist bei realistischen Optimalsteuerungsproblemen meist der Fall. Statt dessen soll ein numerisches Verfahren zur L¨osung linearer Gleichungssysteme der Form A y = b verwendet werden, das A−1 nicht direkt benutzt, beispielsweise das konjugierte Gradientenverfahren. Gleiches trifft dann auf A zu. Deshalb ersetzen wir in (1.6) den Ausdruck (A )−1 ∇y J(¯ y, u ¯), durch p¯, p¯ := (A )−1 ∇y J(¯ y, u ¯). Die zum Paar (¯ y, u ¯) geh¨ orige Gr¨ oße p¯ bestimmt sich aus dem Gleichungssystem A p¯ = ∇y J(¯ y, u ¯).
(1.7)
Definition. Die Gleichung (1.7) heißt adjungierte Gleichung. Ihre L¨osung p¯ wird zu (¯ y, u ¯) geh¨origer adjungierter Zustand genannt. Beispiel. F¨ ur die quadratische Funktion J(y, u) = adjungierte Gleichung A p¯ = y¯ − yd ,
1 2
|y − yd |2 + λ2 |u|2 erhalten wir die
denn hier gilt ∇y J(y, u) = y − yd .
Die Einf¨ uhrung des adjungierten Zustands bringt zwei Vorteile. Die notwendigen Bedingungen erster Ordnung werden u ¨bersichtlicher und die Verwendung der inversen Matrix (A )−1 kann vermieden werden. Zun¨ achst vereinfacht sich die Formel f¨ ur den Gradienten von f . Mit y¯ = S u ¯ folgt aus (1.5) ∇f (¯ u) = B p¯ + ∇u J(¯ y, u ¯).
12
1 Einf¨ uhrung und Beispiele
Der Vektor ∇f (¯ u) heißt auch (auf u) reduzierter Gradient. Die Richtungsableitung f (¯ u) h an einer beliebigen Stelle u ¯ ist mit y¯ = S u ¯ durch f (¯ u) h = B p¯ + ∇u J(¯ y, u ¯) , h IRm , gegeben. Diese zwei Darstellungen mit dem adjungierten Zustand p sind unabh¨angig davon, ob u¯ optimal ist oder nicht. Sie werden uns auch bei Steuerungsproblemen mit partiellen Differentialgleichungen immer wieder begegnen. Satz 1.2 vereinfacht sich damit: Satz 1.3 Die Matrix A sei invertierbar, u ¯ optimale Steuerung f¨ ur (1.1) und y¯ der zugeh¨orige optimale Zustand. Dann existiert genau eine L¨osung p¯ der adjungierten Gleichung (1.7) und es gilt B p¯ + ∇u J(¯ y, u ¯) , u − u ¯ IRm ≥ 0 ∀ u ∈ Uad . (1.8) Der Satz folgt direkt aus den obigen Betrachtungen, n¨amlich aus der Variationsungleichung (1.6) und der Definition von p. ¯ Insgesamt haben wir folgendes Optimalit¨atssystem f¨ ur die drei unbekannten Vektoren y¯, u ¯, p¯ hergeleitet, das zur Berechnung der optimalen Steuerung herangezogen werden kann: A y = B u, u ∈ Uad A p = ∇y J(y, u) B p + ∇u J(y, u) , v − u IRm ≥ 0
(1.9) ∀ v ∈ Uad .
Jede L¨ osung (¯ y, u ¯) des Optimalsteuerungsproblems (1.1) muss gemeinsam mit p¯ diesem System gen¨ ugen. Keine Restriktionen an u u jeden Wert h ∈ IRm annehmen, Dieser Fall wird durch Uad = IRm erfasst. Dann kann u−¯ also folgt aus der Variationsungleichung (1.8) die Gleichung y, u ¯) = 0. B p¯ + ∇u J(¯ Beispiel. Gegeben sei J(y, u) =
λ 1 |C y − yd |2 + |u|2 2 2
mit einer (n, n)-Matrix C. Die ben¨ otigten Gradienten sind ∇y J(y, u) = C (C y − yd ),
∇u J(y, u) = λu.
Hier ergibt sich das Optimalit¨ atssystem A y = B u, u ∈ Uad A p = C (Cy − yd ) B p + λ u , v − u IRm ≥ 0
∀ v ∈ Uad .
1.4 Grundkonzepte im endlichdimensionalen Fall
13
Bei Uad = IRm folgt B p¯ + λ¯ u = 0. Im Fall λ > 0 k¨onnen wir dann nach u ¯ aufl¨osen, 1 u ¯ = − B p¯. λ
(1.10)
Durch Einsetzen in die beiden anderen Beziehungen erhalten wir in diesem Fall als Optimalit¨ atssystem 1 A y = − B Bp λ A p = C (Cy − yd ), also ein lineares Gleichungssystem zur Bestimmung der Unbekannten y¯ und p¯. Sind y¯ und p¯ gefunden, dann berechnet man die Steuerung u ¯ aus Beziehung (1.10). Bemerkung. Die Gleichung (1.1) wurde der Einfachheit halber linear gew¨ahlt. Die voll nichtlineare Aufgabe
min J(y, u), T (y, u) = 0, u ∈ Uad
(1.11)
¨ wird in Ubungsaufgabe 2.1, S. 93, diskutiert.
1.4.5 Lagrangefunktion Mit Hilfe der aus der Analysis bekannten Lagrangefunktion kann das Optimalit¨atssystem auch als Lagrangesche Multiplikatorenregel formuliert werden. Definition. Die Funktion L(y, u, p) := J(y, u) − A y − B u , p IRn , L : IR2n+m → IR heißt Lagrangefunktion. Mit L eliminiert man in (1.1) formal die Nebenbedingungen in Gleichungsform, w¨ahrend uhrt wird. die als einfacher angesehene Restriktion u ∈ Uad zun¨achst noch explizit mitgef¨ Ein Vergleich ergibt, dass die zweite und dritte Bedingung des Optimalit¨atssystems a¨quivalent sind mit ∇y L(¯ y, u ¯, p¯) = 0 ∇u L(¯ y, u ¯, p¯) , u − u ¯ IRm ≥ 0 ∀ u ∈ Uad . y, u ¯, p¯) = 0, kann Folgerung. Die adjungierte Gleichung (1.7) ist ¨aquivalent zu ∇y L(¯ also durch Ableitung der Lagrangefunktion nach y aufgestellt werden. Analog erh¨alt man die Variationsungleichung aus L mittels Ableitung nach u. Deshalb erf¨ ullt (¯ y, u ¯) die notwendigen Optimalit¨atsbedingungen der Aufgabe ohne Gleichungsrestriktionen u ∈ Uad , y ∈ IRn . (1.12) min L(y, u, p), y, u
Daraus folgt u y, u ¯) immer als L¨osung der Aufgabe (1.12) numerisch ¨brigens nicht, dass (¯ bestimmt werden kann. Erstens ist das richtige p¯ in der Regel unbekannt und zweitens
14
1 Einf¨ uhrung und Beispiele
kann (1.12) unl¨ osbar sein oder sogar auf falsche L¨osungen f¨ uhren. Der Vektor p¯ ∈ IRn ist auch ein Lagrangescher Multiplikator, er geh¨ ort zur Gleichung Ay − Bu = 0. Die obige Folgerung bleibt auch f¨ ur die voll nichtlineare Aufgabe (1.11) richtig, wenn die Lagrangefunktion durch L(y, u, p) := J(y, u) − T (y, u) , p IRn definiert wird.
1.4.6 Diskussion der Variationsungleichung In den sp¨ ateren Kapiteln zur optimalen Steuerung wird die Menge Uad durch obere und untere Schranken, sogenannte Box-Restriktionen, gegeben sein. Das wollen wir auch hier annehmen, also
Uad = u ∈ IRm : ua ≤ u ≤ ub . (1.13) Dabei sind ua ≤ ub fest vorgegebene Vektoren des IRm und die Ungleichungen komponentenweise als ua,i ≤ ui ≤ ub,i , i = 1, . . . , m, zu verstehen. Wir schreiben die Variationsungleichung (1.8) um, B p¯ + ∇u J(¯ y, u ¯) , u ¯ IRm ≤ B p¯ + ∇u J(¯ y, u ¯) , u IRm ∀ u ∈ Uad . Daher l¨ ost u ¯ die lineare Optimierungsaufgabe m min B p¯ + ∇u J(¯ y, u ¯) , u IRm = min y, u ¯ ) i ui . B p¯ + ∇u J(¯ u∈Uad u∈Uad i=1
Ist Uad in der obigen Form gegeben, dann folgt daraus wegen der Unabh¨angigkeit der einzelnen ui komponentenweise B p¯ + ∇u J(¯ y, u ¯) i u ¯i = min y, u ¯ ) i ui , B p¯ + ∇u J(¯ ua,i ≤ui ≤ub,i
i = 1, . . . , m; also muss u ¯i =
ub,i , ua,i ,
falls falls
y, u ¯)i < 0 B p¯ + ∇u J(¯ B p¯ + ∇u J(¯ y, u ¯) i > 0.
(1.14)
y, u ¯) i = 0 bringt die Variationsungleigelten. F¨ ur die Komponenten mit B p¯ + ∇u J(¯ chung keine Information. Aber die Tatsache, dass die Komponente verschwindet, liefert meist auch eine auswertbare Gleichung.
1.4.7 Formulierung als Karush-Kuhn-Tucker-System Bisher haben wir mit Hilfe der Lagrangefunktion L nur die Bedingungen in Gleichungsform eliminiert. Das kann auch mit den in Uad steckenden Ungleichungsrestriktionen geschehen. Wir definieren einfach μa := B p¯ + ∇u J(¯ y, u ¯) + (1.15) μb := B p¯ + ∇u J(¯ y, u ¯) − , d.h., μa,i = B p¯ + ∇u J(¯ y, u ¯) i , wenn die rechte Seite positiv ist und ansonsten μa,i = 0
y, u ¯) i , wenn die rechte Seite negativ ist und anderenfalls sowie μb,i = B p¯ + ∇u J(¯
1.4 Grundkonzepte im endlichdimensionalen Fall
μb,i = 0. Durch diese Festsetzung ergeben sich gen μa ≥ 0, ua − u ¯ ≤ 0, μb ≥ 0, u ¯ − ub ≤ 0,
15
unter Beachtung von (1.14) die Beziehun-
ua − u ¯ , μa IRm = 0 u ¯ − ub , μb IRm = 0, die aus der Optimierungstheorie unter dem Namen komplement¨are Schlupfbedingungen oder Komplementarit¨atsbedingungen bekannt sind. Die Ungleichungen sind dabei trivial, nur die Schlupfbedingungen muss man sich u ¨ berlegen. Beispielsweise sieht man die erste Orthogonalit¨ atsbeziehung wie folgt ein: Die echte Ungleichung ua,i < u ¯i kann wegen (1.14) nur f¨ ur B p¯ + ∇u J(¯ y, u ¯) i ≤ 0 ¯i ) μa,i = 0. Gilt μa,i > 0, so gelten. Das impliziert nach Definition μa,i = 0, also (u a,i − u folgt nach Definition von μa auch B p¯ + ∇u J(¯ y, u ¯) i > 0, somit ua,i = u ¯i nach (1.14). Wieder folgt (ua,i − u ¯i ) μa,i = 0. Summation u ¯ , μa )IRm = 0. ¨ber i ergibt dann (ua − u Aus (1.15) folgt μa − μb = ∇u J(¯ y, u ¯) + B p¯, also ∇u J(¯ y, u ¯) + B p¯ − μa + μb = 0.
(1.16)
Wir erweitern nun die Lagrangefunktion durch Hinzunahme der Ungleichungsrestriktionen zu L(y, u, p, μa , μb ) := J(y, u) − A y − B u , p IRn + ua − u , μa IRm + u − ub , μb IRm . Dann l¨ asst sich (1.16) in der Form ∇u L(¯ y, u ¯, p¯, μa , μb ) = 0 ausdr¨ ucken. Außerdem ist die adjungierte Gleichung ¨aquivalent zur Beziehung ∇y L(¯ y, u ¯, p¯, μa , μb ) = 0, denn ∇y L = ∇y L. Die Vektoren μa und μb sind damit die Lagrangeschen Multiplikatoren zu den Ungleichungsrestriktionen ua − u ≤ 0 und u − ub ≤ 0 und wir k¨onnen die Optimalit¨ atsbedingungen alternativ wie folgt ausdr¨ ucken: Satz 1.4 Ist u ¯ eine optimale Steuerung f¨ ur (1.1) mit zugeh¨origem Zustand y¯, A invertierbar und Uad von der Form (1.13), dann existieren Lagrangesche Multiplikatoren p¯ ∈ IRn und μi ∈ IRm , i = 1, 2, so dass die folgenden Beziehungen erf¨ ullt sind: ∇y L(¯ y, u ¯, p¯, μa , μb ) = 0 ∇u L(¯ y, u ¯, p¯, μa , μb ) = 0 μa ≥ 0, μb ≥ 0 ua − u ¯ , μa IRm = u ¯ − ub , μb IRm = 0. Das gesamte Optimalit¨ atssystem setzt sich aus den Bedingungen von Satz 1.4 sowie den Nebenbedingungen A y − B u = 0, ua ≤ u ≤ ub zusammen und bildet die nach Karush, Kuhn und Tucker benannten Karush-KuhnTucker-Bedingungen.
16
1 Einf¨ uhrung und Beispiele
Zum Vergleich mit den Ergebnissen in Abschnitt 4.10 formulieren wir noch die hinreichenden Optimalit¨ atsbedingungen zweiter Ordnung, siehe z.B. [88], [74] oder [148]. Dazu f¨ uhren wir die Indexmengen der aktiven Ungleichungsrestriktionen I(¯ u) = Ia (¯ u) ∪ Ib (¯ u) und der stark aktiven Ungleichungsestriktionen A(¯ u) ⊂ I(¯ u) ein, Ia (¯ u) = {i : u ¯i = ua,i },
Ib (¯ u) = {i : u ¯i = ub,i },
sowie den kritischen Kegel C(¯ u) aller h ∈ IR hi = 0 hi ≥ 0 hi ≤ 0
m
A(¯ u) = {i : μa,i > 0 oder μb,i > 0}
mit den Eigenschaften
f¨ ur i ∈ A(¯ u) f¨ ur i ∈ Ia (¯ u) \ A(¯ u) f¨ ur i ∈ Ib (¯ u) \ A(¯ u).
Nach Definition von μa , μb gilt i ∈ A(¯ u) ⇔ |(B p¯ + ∇u J(¯ y, u ¯))i | > 0. Eine aktive Restriktion f¨ ur u ist also genau dann stark aktiv, wenn die entsprechende Komponente des Gradienten von f nicht verschwindet. Satz 1.5 Uad habe die Form (1.13). Erf¨ ullen y¯ und u ¯ gemeinsam das obige Optimalit¨atssystem und gilt y, u ¯, p¯, μa , μb ) Lyu (¯ y, u ¯, p¯, μa , μb ) y y Lyy (¯ >0 Luy (¯ u y, u ¯, p¯, μa , μb ) Luu (¯ y, u ¯, p¯, μa , μb ) u f¨ ur alle (y, u) = (0, 0) mit A y = B u und u ∈ C(¯ u), dann ist (¯ y, u ¯) lokal optimal f¨ ur (1.1). Im Satz bezeichnen Lyy , Lyu und Luu die partiellen Ableitungen zweiter Ordnung Dy2 L, Du Dy L sowie Du2 L. Mit einem bekannten Kompaktheitsschluss folgt, dass die im Satz formulierte Definitheitsbedingung ¨ aquivalent ist zur Existenz eines δ > 0 mit y, u ¯, p¯, μa , μb ) Lyu (¯ y, u ¯, p¯, μa , μb ) y y Lyy (¯ ≥ δ |y|2 + |u|2 Luy (¯ u y, u ¯, p¯, μa , μb ) Luu (¯ y, u ¯, p¯, μa , μb ) u f¨ ur alle entsprechenden (y, u). Ist A invertierbar, dann kommt man sogar mit der Forderung aus, dass die obige quadratische Form nicht kleiner als δ |u|2 ist. Ausblick auf partielle Differentialgleichungen Im Prinzip l¨ auft die Diskussion von Optimalsteuerungsproblemen f¨ ur partielle Differentialgleichungen analog ab. Dort steht die Gleichung A y = B u f¨ ur ein elliptisches oder parabolisches Randwertproblem, wobei A ein gewisser Differentialoperator ist und B einen Koeffizienten oder Einbettungsoperator darstellt. Aus der Matrix S = A−1 B wird der Teil des L¨ osungsoperators der Differentialgleichung, der im Zielfunktional auftritt. Die zugeh¨ origen Optimalit¨ atsbedingungen werden die gleiche Form wie die oben dargestellten haben. Auch bei der Steuerung partieller Differentialgleichungen leisten Lagrangefunktionen gute Dienste. Bei der formalen Lagrangetechnik werden sie als Hilfsmittel dazu verwendet, Optimalit¨ atsbedingungen bequem herzuleiten und einpr¨agsam aufzuschreiben. Ihre nicht ganz einfache Anwendung beim Beweis von Optimalit¨atsbedingungen beruht auf der Karush-Kuhn-Tucker-Theorie von Optimierungsaufgaben im Banachraum und wird erst in Kapitel 6 diskutiert.
2 Linear-quadratische elliptische Steuerungsprobleme 2.1 Lineare normierte R¨ aume Wir beginnen mit der Bereitstellung einiger Begriffe der Funktionalanalysis. Dabei gehen wir nach dem Prinzip vor, immer nur das abzuhandeln, was zum Verst¨andnis des jeweils folgenden Abschnitts unbedingt n¨ otig ist. Die entsprechenden Aussagen werden hier nicht bewiesen. Dazu verweisen wir auf Standardwerke der Funktionalanalysis wie Alt [6], Heuser [101], Kantorowitsch und Akilow [118], Ljusternik und Sobolew [146], Werner [208] oder Yosida [213]. Der Begriff des linearen Raums u orper IR der reellen Zahlen wird als bekannt ¨ber dem K¨ vorausgesetzt. Standardbeispiele daf¨ ur sind der n-dimensionale Vektorraum IRn oder der Raum C[a, b] aller auf [a, b] ⊂ IR definierten und stetigen reellwertigen Funktionen. (Die Bezeichnung C[a, b] ist dabei verbunden mit der unten eingef¨ uhrten Maximumnorm). Ihre Elemente sind Vektoren x = (x1 , . . . , xn ) bzw. Funktionen x : [a, b] → IR. In beiden R¨ aumen ist die Addition +“ zweier Elemente sowie deren Multiplikation mit einer reellen ” Zahl definiert und diese beiden Operationen gen¨ ugen den bekannten Gesetzen, die in einem linearen Raum gelten. Definition. Es sei X ein linearer Raum u ¨ber IR. Eine Abbildung · : X → IR heißt Norm in X, wenn folgende Eigenschaften f¨ ur alle x, y ∈ X und alle λ ∈ IR erf¨ ullt sind: (i) (ii) (iii)
x ≥ 0 und x = 0 ⇔ x = 0 x + y ≤ x + y (Dreiecksungleichung) λ x = |λ| x (Positive Homogenit¨at)
Ist · eine Norm in X, dann heißt {X, · } (reeller) normierter Raum. n 1/2 Der Raum IRn ist, versehen mit der Euklidischen Norm |x| = x2i , ein normierter Raum. C[a, b] wird mit der Maximumnorm von x(·),
i=1
xC[a,b] = max |x(t)|, t∈[a,b]
zu einem normierten Raum. Auch der lineare Raum CL2 [a, b], der die gleichen Funktionen wie C[a, b] umfasst, aber mit der L2 -Norm b 1/2 xCL2 [a,b] = x2 (t) dt a
18
2 Linear-quadratische elliptische Probleme
versehen ist, stellt einen normierten Raum dar. Beide Normen gen¨ ugen den Axiomen ¨ (i)–(iii), Ubungsaufgabe 2.2. Bemerkung. Der Raum X und die darin definierte Norm geh¨oren als ein Paar {X, · X } zusammen. F¨ uhrt man eine andere Norm ein, dann liegt auch ein anderer normierter Raum vor. In der Regel ist aber klar, welche Norm zum definierten Raum geh¨ ort. Deshalb werden wir meist vom Raum X sprechen, ohne die zugeordnete Norm in die Bezeichnung aufzunehmen.
Definition. Eine Folge {xn }∞ n=1 von Elementen eines normierten Raums {X, · } heißt konvergent, wenn ein Grenzelement x ∈ X existiert, so dass lim xn − x = 0
n→∞
gilt. Wir schreiben daf¨ ur lim xn = x. Sie heißt Cauchyfolge, wenn es zu jedem ε > 0 n→∞
eine nat¨ urliche Zahl n0 = n0 (ε) gibt mit xn − xm ≤ ε ∀n > n0 (ε), ∀m > n0 (ε). Jede konvergente Folge ist auch eine Cauchyfolge, aber die Umkehrung gilt nicht in jedem Raum. Beispiel. Wir betrachten im Raum CL2 [0, 2] die Funktionenfolge xn (t) = min{1, tn }, n = 1, 2, . . . Eine leichte Rechnung ergibt
xn −
xm 2C 2 [0,2] L
= 0
=
1
n
m 2
1
(t − t ) dt =
(t2n − 2tn+m + t2m ) dt
0
2 1 2 1 − + ≤ 2n + 1 n + m + 1 2m + 1 2m + 1
f¨ ur m ≤ n. Offenbar ist damit diese Folge eine Cauchyfolge. Sie hat aber keine stetige Grenzfunktion, also kein Grenzelement aus CL2 [0, 2], denn der punktweise Limes ist x(t) = lim xn (t) = n→∞
0 1
0≤t 0 existieren, so dass folgende Eigenschaften erf¨ ullt sind: (i)
Alle hi sind auf dem (N − 1)-dimensionalen abgeschlossenen W¨ urfel
¯ N −1 = y = (y1 , ...yN −1 ) : |yi | ≤ a, i = 1 . . . N − 1 Q k-mal differenzierbar mit Lipschitz-stetigen Ableitungen der Ordnung k.
(ii) Zu jedem P ∈ Γ gibt es ein i ∈ {1, . . . , M }, so dass P im Koordinatensystem Si die Darstellung P = (y, hi (y)), y ∈ QN −1 hat. (iii) Im lokalen Koordinatensystem Si gilt ¯ N −1 , hi (y) < yN < hi (y) + b (y, yN ) ∈ Ω ⇔ y ∈ Q ¯ N −1 , hi (y) − b < yN < hi (y). (y, yN ) ∈ Ω ⇔ y ∈ Q Bedingung (iii) bedeutet anschaulich, dass das Gebiet lokal nur auf einer Seite des Randes liegt. Gebiete bzw. R¨ ander der Klasse C 0,1 heißen Lipschitzgebiet (auch regul¨ares Gebiet) bzw. Lipschitzrand. Einen Rand der Klasse C k,1 nennt man kurz C k,1 -Rand. Innerhalb des lokalen Koordinatensystems Si kann in nat¨ urlicher Weise das Lebesguesche Maß auf Γ eingef¨ uhrt werden: Es sei E ⊂ Γ eine ganz im Bereich des Koordinatensystems ¯ N −1 das vollst¨andige Urbild von E. Die Menge Si liegende Menge und D = (hi )−1 (E) ⊂ Q E heißt messbar, wenn D bez¨ uglich des (N − 1)-dimensionalen Lebesguemaßes messbar ist. Das Maß von E wird definiert durch |E| = 1 + |∇hi (y1 , . . . , yN −1 )|2 dy1 . . . dyN −1 , D
siehe [2] oder [72]. Bei Mengen E, die zu ihrer Darstellung verschiedene lokale Koordinatensysteme erfordern, wird das Maß entsprechend zusammengesetzt“. Außerdem wird ” ausgenutzt, dass die Lipschitzfunktion hi nach dem Satz von Rademacher fast u ¨ berall differenzierbar ist, vgl. [6] oder auch [43]. Nach Definition des Oberfl¨achenmaßes lassen sich in u uhren. Wir ¨blicher Weise messbare und integrierbare Funktionen auf Γ einf¨ bezeichnen das Oberfl¨ achenmaß mit ds(x) bzw. kurz ds.
2.2.3 Schwache Ableitungen und Sobolewr¨ aume In beschr¨ ankten Lipschitzgebieten Ω kann der Gaußsche Integralsatz angewendet werden. ¯ gegeben, dann gilt die Formel der partiellen Integration Sind y, v aus C 1 (Ω) v(x) Di y(x) dx = v(x) y(x) νi (x) ds(x) − y(x) Di v(x) dx. Ω
Γ
Ω
22
2 Linear-quadratische elliptische Probleme
Hier ist νi (x) die i-te Komponente des nach außen gerichteten Einheitsnormalenvektors ν im Punkt x ∈ Γ und ds das Lebesguesche Oberfl¨achenmaß auf Γ. Gilt zus¨atzlich v = 0 auf Γ, dann folgt daraus y(x) Di v(x) dx = − v(x) Di y(x) dx. Ω
Ω
¯ v ∈ C k (Ω) sowie Multiindizes α mit |α| ≤ k nach Allgemeiner ergibt sich f¨ ur y ∈ C k (Ω), 0 mehrmaliger partieller Integration y(x) Dα v(x) dx = (−1)|α| v(x) Dα y(x) dx. Ω
Ω
Diese Beziehung motiviert eine Verallgemeinerung des klassischen Ableitungsbegriffs, die wir im Weiteren erl¨ autern. In der n¨ achsten Definition bezeichnet L1loc (Ω) die Menge aller in Ω lokal integrierbaren Funktionen. Eine Funktion heißt lokal integrierbar in Ω, wenn sie auf jeder kompakten Teilmenge von Ω im Lebesgueschen Sinne integrierbar ist. Definition. Es sei y ∈ L1loc (Ω) gegeben und α ein Multiindex. Existiert eine Funktion w ∈ L1loc (Ω) mit der Eigenschaft y(x) Dα v(x) dx = (−1)|α| w(x)v(x) dx ∀ v ∈ C0∞ (Ω), (2.1) Ω
Ω
so heißt w schwache Ableitung von y und wird mit Dα y bezeichnet. In anderen Worten: w ist schwache Ableitung von y, wenn w an Stelle der (starken) Ableitung Dα y die Formel der partiellen Integration erf¨ ullt. Beispiel. Wir betrachten die Funktion y(x) = |x| in Ω = (−1, 1). Dann besitzt y die schwache Ableitung −1, x ∈ (−1, 0) y (x) := w(x) = +1, x ∈ [0, 1), wie man leicht nachrechnet: F¨ ur alle v ∈ C0∞ (−1, 1) gilt
1
−1
|x| v (x) dx =
1 0
0 (−x) v (x) dx + x v (x) dx = −x v(x) −1 − (−1) v(x) dx −1 0 −1 1 1
1 w(x) v(x) dx. (+1) v(x) dx = − +x v(x) 0 − 0
0
−1
Welchen Wert wir y im Nullpunkt zumessen ist unwichtig, weil ein Punkt eine Menge vom Maß null darstellt.
Eine schwache Ableitung kann, muss aber nicht existieren. Sie kann besseren“ R¨aumen ” als nur L1loc (Ω) angeh¨ oren, beispielsweise dem Raum Lp (Ω). Definition. Es sei 1 ≤ p < ∞, k ∈ IN. Unter W k,p (Ω) versteht man den linearen Raum aller y ∈ Lp (Ω), f¨ ur die alle schwachen Ableitungen Dα y mit |α| ≤ k existieren und zu p L (Ω) geh¨oren, versehen mit der Norm 1/p yW k,p (Ω) = |Dα y(x)|p dx . |α|≤k
Ω
2.2 Sobolewr¨ aume
23
Analog wird W k,∞ (Ω) f¨ ur p = ∞ eingef¨ uhrt mit der Norm yW k,∞ (Ω) = max Dα yL∞ (Ω) . |α|≤k
aume, siehe z.B. [2], [209], und werden als SobolewDie R¨ aume W k,p (Ω) sind Banachr¨ r¨aume bezeichnet. Von besonderem Interesse ist der Fall p = 2. Man setzt H k (Ω) := W k,2 (Ω). ur unsere Zwecke besonders wichtig ist, schreiben wir die obige Weil der Raum H 1 (Ω) f¨ Definition hierf¨ ur noch einmal explizit auf. Es ist
H 1 (Ω) = y ∈ L2 (Ω) : Di y ∈ L2 (Ω), i = 1, . . . , N , versehen mit der Norm yH 1 (Ω) =
Ω
1/2 y 2 + |∇y|2 dx
(dabei gilt |∇y|2 = (D1 y)2 + . . . (DN y)2 ). Durch Einf¨ uhrung des Skalarprodukts u v dx + ∇u · ∇v dx u , v H 1 (Ω) = Ω
Ω
wird H 1 (Ω) zu einem Hilbertraum. Eine etwas versteckte Schwierigkeit besteht in der Definition von Randwerten f¨ ur Funktionen aus Sobolewr¨ aumen. Was soll bei einer Funktion y aus W k,p (Ω) die Aussage y = 0 auf Γ bedeuten? Ist y aus Lp (Ω), so kann man die Werte von y auf Γ beliebig ab¨andern, ohne dass sich y im Sinne des Raums Lp (Ω) ¨ andert. Das liegt daran, dass Γ als Teilmenge von IRN gesehen das Maß null hat. Funktionen, die sich nur auf Mengen vom Maß null unterscheiden, sind aber gleich im Sinne von Lp (Ω). Definition. Die Abschließung von C0∞ (Ω) in W k,p (Ω) bezeichnet man mit W0k,p (Ω). Dieser Raum wird mit der gleichen Norm wie W k,p (Ω) versehen und ist ein abgeschlossener Teilraum von W k,p (Ω). Insbesondere setzen wir H0k (Ω) := W0k,2 (Ω). Die Abschließung einer Menge E ⊂ X besteht aus allen Elementen x ∈ X, die Grenzwerte von Folgen aus E im Sinne der Norm von X sind, d.h. lim x − en X = 0 mit en ∈ E n→∞ f¨ ur alle n ∈ IN. Eine Menge E ⊂ X heißt dicht in X, wenn ihre Abschließung der ganze Raum X ist. Aus der obigen Definition ergibt sich speziell, dass die Menge C0∞ (Ω) dicht in H01 (Ω) ist. Funktionen aus W0k,p (Ω) k¨ onnen als solche angesehen werden, bei denen die Randwerte aller Ableitungen bis zur Ordnung k − 1 verschwinden. Inhomogene Randwerte definiert man durch die Spur von Funktionen aus W k,p (Ω) auf dem Rand. Satz 2.1 (Spursatz) Ist Ω ein beschr¨anktes Lipschitzgebiet und 1 ≤ p ≤ ∞, so existiert eine lineare und stetige Abbildung τ : W 1,p (Ω) → Lp (Γ), die f¨ ur alle y aus W 1,p (Ω) ∩ ¯ die Eigenschaft τ y (x) = y(x) f.¨ C(Ω) u. auf Γ besitzt.
24
2 Linear-quadratische elliptische Probleme
Insbesondere ergibt sich f¨ ur p = 2 die Eigenschaft τ : H 1 (Ω) → L2 (Γ). Bei stetigen Funktionen y f¨ allt also das Bild von τ mit deren Randwerten von y zusammen. Den Beweis des Satzes findet man z.B. in Adams [2], Alt [6], Evans [67], Neˇcas [167] oder Wloka [209]. F¨ ur p > N folgt aus dem Einbettungssatz 7.1 auf S. 277, dass Funktionen aus W 1,p (Ω) ¯ identifiziert werden k¨onnen. Deshalb ist die Spurabbildung τ mit Funktionen aus C(Ω) in diesem Fall stetig von W 1,p (Ω) nach C(Γ). Definition. Das Element τ y heißt Spur von y auf Γ, die Abbildung τ Spuroperator. Bemerkungen. Im Weiteren werden wir der Einfachheit halber an Stelle von τ y die Bezeichnung y|Γ verwenden. In diesem Sinne ist auch y|Γ0 auf messbaren Teilmengen Γ0 ⊂ Γ als Einschr¨ ankung von τ y auf Γ0 definiert.
Die Stetigkeit des Spuroperators ist ¨ aquivalent zu seiner Beschr¨anktheit, also zur Existenz einer Konstanten cτ = cτ (Ω, p), so dass y|Γ Lp (Γ) ≤ cτ yW 1,p (Ω)
∀y ∈ W 1,p (Ω)
gilt. F¨ ur beschr¨ ankte Lipschitzgebiete Ω beweist man H01 (Ω) = {y ∈ H 1 (Ω) : y|Γ = 0}, siehe z.B. [2] oder [209]. Man kann in H01 (Ω) durch |∇y|2 dx y2H 1 (Ω) := 0
Ω
eine Norm einf¨ uhren, die zur oben in H 1 (Ω) eingef¨ uhrten Norm ¨aquivalent ist. Mit positiur alle y ∈ H01 (Ω); ven Konstanten c1 , c2 gilt also c1 yH01 (Ω) ≤ yH 1 (Ω) ≤ c2 yH01 (Ω) f¨ vgl. Absch¨ atzung (2.10) auf S. 27 und die darauf folgende Bemerkung.
2.3 Schwache L¨ osungen elliptischer Gleichungen Eine ausf¨ uhrliche Darstellung der Theorie elliptischer Randwertprobleme w¨ urde den Rahmen dieses Buches sprengen. Statt dessen behandeln wir nur einige wenige Gleichungen, f¨ ur die wir sp¨ ater Grundideen der Optimalsteuerungstheorie entwickeln. Das sind Gleichungen mit dem Laplace-Operator bzw. allgemeiner mit Differentialoperatoren in Divergenzform. In diesem Kapitel ist Ω ⊂ IRN , N ≥ 2, ein beschr¨anktes Lipschitzgebiet mit Rand Γ.
2.3.1 Poissongleichung Wir beginnen mit der elliptischen Randwertaufgabe −Δy y
= f = 0
in Ω auf Γ
(2.2)
in der f ∈ L2 (Ω) gegeben und y gesucht ist. Eine solche Funktion f kann sehr irregul¨ar sein. Man denke an das schachbrettartig unterteilte offene Einheitsquadrat Ω ⊂ IR2 und
2.3 Schwache L¨ osungen elliptischer Gleichungen
25
eine dort definierte Funktion f , die in den schwarzen Feldern den Wert 1 und in den ¨ restlichen den Wert 0 hat. Uber die Werte von f auf den inneren R¨andern brauchen wir uns keine Gedanken zu machen, weil diese R¨ander das Lebesguemaß null haben und Funktionen aus L2 (Ω) auf Mengen vom Maß null nicht unterscheidbar sind. Es leuchtet ¯ der ein, dass man f¨ ur eine solche Funktion keine klassische L¨osung y ∈ C 2 (Ω) ∩ C(Ω) Poissongleichung finden kann. Statt dessen suchen wir y als schwache L¨osung im Raum H01 (Ω). Grundlage ist eine Variationsformulierung der Aufgabe (2.2). Zu deren Herleitung nehmen wir zun¨ achst an, dass f hinreichend glatt und y ∈ C 2 (Ω) eine gen¨ ugend glatte klassische L¨ osung von (2.2) ist, f¨ ur die alle unten auftretenden Ableitungen und Integrale existieren. Das Gebiet Ω wird generell als beschr¨ankt vorausgesetzt. Wir multiplizieren die Poissongleichung in (2.2) mit einer beliebigen aber festen Testfunktion v ∈ C0∞ (Ω), integrieren u ¨ ber Ω und erhalten v Δy dx = f v dx − Ω
Ω
sowie nach partieller Integration ∇y · ∇v dx = f v dx. − v ∂ν y ds + Γ
Ω
Ω
Dabei bezeichnet ∂ν die Normalenableitung, d.h. die Ableitung ∂/∂ν in Richtung der außeren Normalen ν auf Γ. Weil v auf Γ verschwindet, folgt ¨ ∇y · ∇v dx = f v dx. Ω
Ω
Diese Gleichung (2.3) haben wir f¨ ur alle v ∈ C0∞ (Ω) hergeleitet. Da C0∞ (Ω) dicht in 1 H0 (Ω) ist und alle Ausdr¨ ucke in der Gleichung bei gegebenem y ∈ H01 (Ω) stetig von 1 v ∈ H0 (Ω) abh¨ angen, gilt sie auch f¨ ur alle v ∈ H01 (Ω). Umgekehrt kann man unter ¯ wegen der den oben genannten Voraussetzungen an y (insbesondere y ∈ C 2 (Ω) ∩ C(Ω)) Beliebigkeit von v ∈ C0∞ (Ω) aus der eben hergeleiteten Beziehung auf die Gleichung −Δy = f schließen. Alles zusammen rechtfertigt die folgende Definition: Definition. Ein y ∈ H01 (Ω) heißt schwache L¨osung der Randwertaufgabe (2.2), wenn die Variationsformulierung oder schwache Formulierung ∇y · ∇v dx = f v dx ∀ v ∈ H01 (Ω) (2.3) Ω
Ω
erf¨ ullt ist. Man bezeichnet (2.3) auch als Variationsgleichung. Die Randbedingung y|Γ = 0 ist in der Definition des L¨ osungsraums H01 (Ω) enthalten. Es ist bemerkenswert, dass man bei einer Gleichung zweiter Ordnung mit (schwachen) Ableitungen erster Ordnung auskommt. Um allgemeinere Gleichungen als die Poissongleichung in einem einheitlichen Rahmen zu diskutieren, f¨ uhren wir die Bezeichnung V = H01 (Ω) und eine Bilinearform a : V ×V → IR durch a[y, v] := ∇y · ∇v dx (2.4) Ω
ein. Dann kann die Variationsformulierung (2.3) in der abstrakteren Form a[y, v] = f , v L2 (Ω) ∀v ∈ V
26
2 Linear-quadratische elliptische Probleme
aufgeschrieben werden. Wir definieren ein lineares und stetiges Funktional F : V → IR (zu diesem Begriff vgl. Abschnitt 2.4) durch F (v) := f , v L2 (Ω) . So nimmt die Variationsformulierung (2.3) die folgende allgemeine Form an:
a[y, v] = F (v)
∀v ∈ V.
(2.5)
Der Raum aller linearen und stetigen Funktionale auf V , der zu V duale Raum (siehe S. 33), wird mit V ∗ bezeichnet; wir haben also F ∈ V ∗ . Die L¨osbarkeit linearer elliptischer Gleichungen wird oft auf folgende wichtige Aussage zur¨ uckgef¨ uhrt: Lemma 2.2 (Lax und Milgram) Es sei V ein reeller Hilbertraum und a : V ×V → IR eine Bilinearform mit folgenden Eigenschaften: Es existieren positive Konstanten α0 und β0 , so dass f¨ ur alle v, y ∈ V die Beziehungen
a[y, v] a[y, y]
≤
α0 yV vV
≥
β0 y2V
(Beschr¨anktheit)
(2.6)
(V -Elliptizit¨at)
(2.7)
erf¨ ullt sind. Dann hat die Variationsformulierung (2.5) f¨ ur jedes F ∈ V ∗ genau eine L¨osung y ∈ V und es existiert eine von F unabh¨angige Konstante ca , so dass die folgende Ungleichung erf¨ ullt ist: yV ≤ ca F V ∗ . (2.8) Das ist die grundlegende Aussage f¨ ur den Beweis der Existenz und Eindeutigkeit einer schwachen L¨ osung von (2.2) und die anderen hier interessierenden linearen elliptischen Randwertaufgaben. Zur Anwendung bei homogenen Dirichlet-Randbedingungen braucht man die folgende Absch¨ atzung: Lemma 2.3 (Friedrichs’sche-Ungleichung) Ist Ω ein beschr¨anktes Lipschitzgebiet, dann existiert eine nur von Ω abh¨angige Konstante cΩ , so dass die Ungleichung 2 y dx ≤ cΩ |∇y|2 dx Ω
Ω
f¨ ur alle y ∈ H01 (Ω) erf¨ ullt ist. Den Beweis findet man z.B. bei Alt [6], Casas [43], Neˇcas [167] oder Wloka [209]. F¨ ur die Aussage sind homogene Randwerte wie in H01 (Ω) wesentlich. In H 1 (Ω) kann sie nicht gelten, man denke an y(x) ≡ 1. Satz 2.4 Ist Ω ein beschr¨anktes Lipschitzgebiet, so besitzt die Poissongleichung (2.2) f¨ ur jedes f ∈ L2 (Ω) genau eine schwache L¨osung y ∈ H01 (Ω) und es existiert eine von f unabh¨angige Konstante cP , so dass gilt yH 1 (Ω) ≤ cP f L2 (Ω) .
(2.9)
2.3 Schwache L¨ osungen elliptischer Gleichungen
27
Beweis: Wir wenden das Lemma von Lax und Milgram in V = H01 (Ω) an und verifizieren dazu, dass die Bilinearform (2.4) die n¨ otigen Voraussetzungen erf¨ ullt. Da H01 (Ω) Teilraum von H 1 (Ω) ist, verwenden wir die normale H 1 -Norm, vgl. aber Bemerkung (i) nach diesem Beweis. Die Beschr¨ anktheit (2.6) der Bilinearform a ergibt sich mit Hilfe der Ungleichung von Cauchy-Schwarz aus
1/2 1/2
2 ∇y · ∇v dx ≤ |∇y||∇v| dx ≤ |∇y| dx |∇v|2 dx
Ω Ω Ω 1/2Ω 1/2 2 2 2 2 ≤ y + |∇y| dx v + |∇v| dx Ω
≤ yH 1 (Ω) vH 1 (Ω) . Die V –Elliptizit¨ at folgt mit a[y, y] = |∇y|2 dx = Ω
≥ ≥
Ω
1 1 |∇y|2 dx + |∇y|2 dx 2 Ω 2 Ω 1 1 2 |∇y| dx + y 2 dx 2 Ω 2 cΩ Ω 1 1 min 1, y2H 1 (Ω) , 2 cΩ
(2.10)
wobei wir am Ende die Friedrichs’sche Ungleichung angewendet haben. Damit sind die Voraussetzungen von Lemma 2.2 in V = H01 (Ω) erf¨ ullt. Die Beschr¨anktheit des Funktionals F ergibt sich mit der Ungleichung von Cauchy-Schwarz
|F (v)| ≤ f v dx = f , v L2 (Ω) ≤ f L2 (Ω) vL2 (Ω) ≤ f L2 (Ω) vH 1 (Ω) , Ω
also F V ∗ ≤ f L2 (Ω) . Aus Lemma 2.2 erhalten wir die Existenz einer eindeutig bestimmten L¨ osung y von (2.2). Nach Einsetzen der obigen Absch¨atzung f¨ ur F in (2.8) folgt yH 1 (Ω) ≤ ca F V ∗ ≤ ca f L2 (Ω) , womit auch (2.9) bewiesen ist. R
|∇y|2 dx eine Norm in H01 (Ω) von vornherein so normiert, dann sind die Voraussetzungen von Lemma ist. Wird V = 2.2 direkt erf¨ ullt. Deshalb wird diese verk¨ urzte“ Norm oft angewendet. ” (ii) Das Lemma l¨ asst auch allgemeinere lineare stetige Funktionale F zu, die nicht durch f ∈ L2 (Ω) erzeugt werden. Das nutzen wir im n¨ achsten Abschnitt aus.
Bemerkungen. (i) Ungleichung (2.10) zeigt, dass yH01 (Ω) := H01 (Ω)
Ω
2.3.2 Randbedingung dritter Art ¨ Ahnlich kann die Randwertaufgabe −Δy + c0 y ∂ν y + α y
= f = g
in Ω auf Γ
(2.11)
behandelt werden, in der Funktionen f ∈ L2 (Ω) und g ∈ L2 (Γ) sowie nichtnegative Koeffizientenfunktionen c0 ∈ L∞ (Ω), α ∈ L∞ (Γ) vorgegeben sind. Die Randbedingung in (2.11) wird Randbedingung 3. Art oder auch Robin-Randbedingung genannt. Mit ∂ν bezeichnen wir wie bisher die Ableitung in Richtung der ¨außeren Normalen ν auf Γ.
28
2 Linear-quadratische elliptische Probleme
Diese Aufgabe wird a ¨hnlich wie die Poissongleichung behandelt. Durch Multiplikation ¯ ergibt sich unter den gleichen Annahmen wie in mit einer Testfunktion v aus C 1 (Ω) Abschnitt 2.3.1 durch partielle Integration − v ∂ν y ds + ∇y · ∇v dx + c0 y v dx = f v dx. Γ
Ω
Ω
Ω
Nach Einsetzen der Randbedingung ∂ν y = g − α y folgt ∇y · ∇v dx + c0 y v dx + α y v ds = f v dx + g v ds Ω
Ω
Γ
Ω
(2.12)
Γ
¯ Wegen Dichtheit von C 1 (Ω) ¯ in H 1 (Ω) gelangt man schließlich unter f¨ ur alle v ∈ C 1 (Ω). 1 der Annahme y ∈ H (Ω) zur folgenden Definition: Definition. Eine Funktion y ∈ H 1 (Ω) heißt schwache L¨osung der Randwertaufgabe (2.11), wenn sie die Variationsgleichung (2.12) f¨ ur alle v ∈ H 1 (Ω) erf¨ ullt. Die Randbedingung in (2.11) muss nicht im L¨ osungsraum ber¨ ucksichtigt werden. Sie stellt sich f¨ ur hinreichend glatte L¨ osungen automatisch als sogenannte nat¨ urliche Randbedingung ein. Zur Anwendung des Lemmas von Lax und Milgram f¨ uhren wir den L¨osungsraum V := H 1 (Ω) ein sowie die Funktionale F (v) := f v dx + g v ds Γ Ω (2.13) ∇y · ∇v dx + c0 y v dx + α y v ds. a[y, v] := Ω
Ω
Γ
Hier kann F nicht mehr mit einer Funktion f ∈ L2 (Ω) identifiziert werden; F ist von komplizierterer Bauart und nur als Funktional auf V zu verstehen. Die Variationsformulierung (2.12) hat wieder die Form (2.5). Jetzt ben¨otigen wir folgende Ungleichung: Lemma 2.5 Ist Ω ⊂ IRN ein beschr¨anktes Lipschitzgebiet und Γ1 ⊂ Γ eine messbare Menge mit |Γ1 | > 0, so existiert eine von y ∈ H 1 (Ω) unabh¨angige Konstante cΓ1 , so dass 2 2 2 yH 1 (Ω) ≤ cΓ1 (2.14) |∇y| dx + y ds Ω
Γ1
f¨ ur alle y ∈ H 1 (Ω) erf¨ ullt ist. Der Beweis dieser Verallgemeinerung der Friedrichs’schen Ungleichung ist z.B. in [43] oder [209] zu finden, siehe auch [72]. Die Friedrichs’sche Ungleichung ergibt sich als Spezialfall mit Γ1 := Γ f¨ ur Funktionen y ∈ H01 (Ω). Eine analoge Beziehung gilt in Teilmengen von Ω: Ist E ⊂ Ω eine Menge von positivem Maß, dann existiert eine von y ∈ H 1 (Ω) unabh¨ angige Konstante cE , so dass die verallgemeinerte Ungleichung von Poincar´e 2 y2H 1 (Ω) ≤ cE (2.15) |∇y|2 dx + y dx Ω
E
f¨ ur alle y ∈ H 1 (Ω) erf¨ ullt ist, siehe [43] oder [72]. F¨ ur E := Ω erh¨alt man die Poincar´esche Ungleichung.
2.3 Schwache L¨ osungen elliptischer Gleichungen
29
Satz 2.6 Es seien ein beschr¨anktes Lipschitzgebiet Ω sowie fast u ¨berall nichtnegative Funktionen c0 ∈ L∞ (Ω) und α ∈ L∞ (Γ) vorgegeben mit (c0 (x))2 dx + (α(x))2 ds(x) > 0. Ω
Γ
Dann besitzt die Randwertaufgabe (2.11) f¨ ur jedes Paar f ∈ L2 (Ω), g ∈ L2 (Γ) genau 1 eine schwache L¨osung y ∈ H (Ω). Es existiert eine von f und g unabh¨angige Konstante cR , so dass die folgende Ungleichung gilt: (2.16) yH 1 (Ω) ≤ cR f L2 (Ω) + gL2 (Γ) . Beweis: Wir wenden das Lemma von Lax und Milgram in V = H 1 (Ω) an und verifizieren, dass die Bilinearform (2.13) die n¨ otigen Voraussetzungen erf¨ ullt. Im Beweis, wie u ¨ berall in diesem Buch, steht c f¨ ur eine generische Konstante. Man sieht leicht die Ungleichung
a[y, v] =
∇y · ∇v dx + c0 y v dx + α y v ds ≤ α0 yH 1 (Ω) vH 1 (Ω) Ω
Ω
Γ
ein. Insbesondere wird dazu
c0 y v dx ≤ c0 L∞ (Ω) yL2 (Ω) vL2 (Ω) ≤ c0 L∞ (Ω) yH 1 (Ω) vH 1 (Ω) ,
Ω
α y v ds ≤ αL∞ (Γ) yL2 (Γ) vL2 (Γ) ≤ αL∞ (Γ) c yH 1 (Ω) vH 1 (Ω) Γ
verwendet (Spursatz): Damit ist die Beschr¨ anktheit (2.6) erf¨ ullt. Die V -Elliptizit¨at ergibt so: Unsere Voraussetzung sichert c0 = 0 in L∞ (Ω) bzw. α = 0 in L∞ (Γ). Im Fall c0 = 0 existiert eine messbare Teilmenge E ⊂ Ω mit |E| > 0 und ein δ > 0, so dass c0 (x) ≥ δ 2 auf E gilt. Daraus folgt mit (2.15) und der Ungleichung E y dx ≤ c E y 2 dx
a[y, y]
|∇y|2 dx + c0 y 2 dx + α y 2 ds ≥ |∇y|2 dx + δ y 2 dx Ω Ω Ω E Γ min(1, δ) 2 2 2 ≥ min(1, δ) |∇y| dx + y dx ≥ yH 1 (Ω) . cE max(1, |E|) Ω E
=
Im Fall α = 0 existieren eine messbare Teilmenge Γ1 ⊂ Γ von positivem Maß sowie ein δ > 0 mit α(x) ≥ δ auf Γ1 . Mit (2.14) ergibt sich analog a[y, y] ≥
Ω
2
|∇y| ds + δ
Γ1
y 2 ds ≥
min(1, δ) y2H 1 (Ω) . cΓ1 max(1, |Γ1 |)
(2.17)
Damit sind die Voraussetzungen von Lemma 2.2 erf¨ ullt. Ferner gilt |f v| dx + |g v| ds ≤ f L2 (Ω) vL2 (Ω) + gL2 (Γ) vL2 (Γ) |F (v)| ≤ Ω
Γ
≤ f L2 (Ω) vH 1 (Ω) + c gL2 (Γ) vH 1 (Ω) ≤ c˜ f L2 (Ω) + gL2 (Γ) vH 1 (Ω) (Spursatz), also F V ∗ ≤ c˜ f L2 (Ω) +gL2 (Γ) . Aus dem Lemma von Lax und Milgram erhalten wir die behauptete Absch¨ atzung f¨ ur yH 1 (Ω) .
30
2 Linear-quadratische elliptische Probleme
2.3.3 Differentialoperator in Divergenzform Die beiden in den Abschnitten 2.3.1 bzw. 2.3.2 diskutierten Randwertprobleme sind ein Spezialfall der Aufgabenstellung A y + c0 y ∂νA y + α y y
= f = g = 0
in Ω auf Γ1 auf Γ0
(2.18)
in der A ein elliptischer Differentialoperator der Form A y(x) = −
N
Di aij (x) Dj y(x)
(2.19)
i,j=1
ist. Die Koeffizientenfunktionen aij von A sollen zu L∞ (Ω) geh¨oren, der Symmetrieugen und mit einem α0 > 0 die Bedingung der bedingung aij (x) = aji (x) in Ω gen¨ gleichm¨aßigen Elliptizit¨at N
aij (x) ξi ξj ≥ γ0 |ξ|2
∀ ξ ∈ IRN
(2.20)
i,j=1
f¨ ur fast alle x ∈ Ω erf¨ ullen. Mit ∂νA bezeichnen wir in diesem allgemeineren Fall die Ableitung in Richtung der Konormalen νA , definiert durch (νA )i (x) =
N
aij (x) νj (x).
(2.21)
j=1
Fassen wir die Koeffizienten aij zu einer Matrix A zusammen, so gilt νA = A ν. Der Rand Γ ist durch Γ = Γ0 ∪ Γ1 in zwei disjunkte messbare Teilmengen Γ0 und Γ1 aufgeteilt, wobei eine der beiden Teilmengen leer sein kann. Ferner sind fast u ¨ berall nichtnegative Funktionen c0 ∈ L∞ (Ω), α ∈ L2 (Γ1 ) sowie Funktionen f ∈ L2 (Ω) und g ∈ L2 (Γ1 ) gegeben. Der ad¨ aquate L¨ osungsraum f¨ ur diese Gleichung ist
V := y ∈ H 1 (Ω) : y|Γ0 = 0 , d.h. τ y = 0 fast u ¨ berall in Γ0 . Als Bilinearform a definiert man hier a[y, v] :=
N
Ω i,j=1
aij Di y Dj v dx +
Ω
c0 y v dx +
Die schwache L¨ osung y ist definiert durch y ∈ V sowie a[y, v] = f , v L2 (Ω) + g , v L2 (Γ
1)
α y v ds.
(2.22)
Γ1
∀ v ∈ V.
Satz 2.7 Es sei Ω ein beschr¨anktes Lipschitzgebiet, c0 ∈ L∞ (Ω), α ∈ L∞ (Γ1 ). Fast uberall auf Ω bzw. auf Γ1 gelte c0 (x) ≥ 0, α(x) ≥ 0 und eine der zwei folgenden Voraus¨ setzungen sei erf¨ ullt:
2.3 Schwache L¨ osungen elliptischer Gleichungen
(i) (ii)
|Γ0 | > 0 Γ1 = Γ und
Ω
c20 (x) dx
+
31
α2 (x) ds(x) > 0.
Γ
Dann besitzt die Aufgabe (2.18) f¨ ur alle Paare f ∈ L2 (Ω), g ∈ L2 (Γ1 ) genau eine schwache L¨osung y ∈ V. Außerdem gen¨ ugt y mit einer von f und g unabh¨angige Konstanten cA > 0 der Ungleichung yH 1 (Ω) ≤ cA f L2 (Ω) + gL2 (Γ1 ) ∀f ∈ L2 (Ω), ∀g ∈ L2 (Γ1 ). (2.23) ¨ Der Beweis wird wie der von Satz 2.6 mit Lemma 2.2 ausgef¨ uhrt, Ubungsaufgabe 2.4; vgl. auch die Behandlung von Gleichungen der Form (2.18) in [43], [144] oder [209]. Bemerkungen. (i) Die obige Voraussetzung (ii) ist ¨aquivalent zur Existenz einer Menge E ⊂ Ω mit |E| > 0 mit c0 (x) > 0 ∀x ∈ E oder einer Menge D ⊂ Γ mit |D| > 0 und α(x) > 0 ∀x ∈ D. (ii) Dirichlet-Randbedingungen waren in allen drei F¨ allen nur als homogene vorgegeben. Daf¨ ur ur g gibt es gute Gr¨ unde. Erstens folgt aus einer inhomogenen Bedingung der Form y|Γ = g f¨ aume mit gebroautomatisch die Glattheit g ∈ H 1/2 (Γ), falls y im Raum H 1 (Ω) liegt (Sobolewr¨ chenem Exponenten werden in Abschnitt 2.15 definiert). Ist g wie in sp¨ ateren Abschnitten eine ahlt werden. In vielen AnwenSteuerungsfunktion, dann m¨ usste diese a priori aus H 1/2 (Γ) gew¨ dungen ist das nicht sinnvoll. Zweitens kann man f¨ ur inhomogene Dirichlet-Randbedingungen nicht mit der g¨ angigen Variationsformulierung arbeiten. Eine m¨ ogliche Methode besteht in der Zur¨ uckf¨ uhrung auf homogene Randbedingungen, indem eine die inhomogenen DirichletRandbedingungen erf¨ ullende Funktion verwendet wird. Inhomogene Dirichlet-Randbedingungen werden bei elliptischen und parabolischen Aufgaben in Lions [144] mit der Transpositionsmethode behandelt. Im parabolischen Fall verweisen wir auch auf Bensoussan et al. [24], [25], wo mit Halbgruppen und der Formel der Variation der Konstanten gearbeitet wird. Neue Resultate zur Randsteuerung in Dirichlet-Randbedingungen enthalten z.B. [50], [130], [204]. ` ´ (iii) Die bewiesenen Absch¨ atzungen (2.9), (2.16) und (2.23) des Typs y ≤ c f + g sind aquivalent zur Stetigkeit der Abbildung f → y bzw. (f, g) → y in den entsprechenden R¨ aumen. ¨
Vorgaben aus Lp -R¨ aumen mit p < 2 Wir betrachten noch einmal unsere Aufgabe (2.18) auf S. 30 in der Form A y + c0 y ∂νA y + α y
= f = g
in Ω auf Γ
unter den Voraussetzungen von Satz 2.7, Variante (ii). Wir haben bisher f ∈ L2 (Ω) und g ∈ L2 (Γ) vorausgesetzt und zeigen jetzt, dass die obige Aufgabe auch f¨ ur f ∈ Lr (Ω) s 1 und g ∈ L (Γ) mit gewissen r, s < 2 genau eine L¨osung y ∈ H (Ω) besitzt. Dazu fassen wir f und g als Funktionale aus (H 1 (Ω))∗ auf und definieren F1 (v) = f (x)v(x) dx, F2 (v) = g(x)v(x) ds(x). Ω
Γ
ur alle Aus Satz 7.1 auf S. 277 (Sobolewscher Einbettungssatz) folgt H 1 (Ω) → Lp (Ω) f¨ p < ∞ und N = dim Ω = 2 sowie f¨ ur alle p ≤ 2N/(N − 2) und N > 2. Mit der H¨ olderschen Ungleichung erhalten wir |F1 (v)| ≤ f Lr (Ω) vLp (Ω) ,
32
2 Linear-quadratische elliptische Probleme
wenn r gem¨ aß 1/r + 1/p = 1 fixiert wird. Bei N = 2 kann man p beliebig groß w¨ahlen, also r beliebig nahe an 1. Folglich geh¨ ort F1 im Fall N = 2 zu (H 1 (Ω))∗ , wenn f in Lr (Ω) mit r > 1 liegt. F¨ ur N > 2 ergibt sich das kleinstm¨ogliche r aus 1 N −2 + =1 r 2N
⇒
r=
2N . N +2
In diesem Fall hat F1 diese Eigenschaft, falls f zu Lr (Ω) mit r ≥ 2N/(N + 2) geh¨ort. Analog wird F2 unter Beachtung von Satz 7.2 auf S. 277 untersucht. Die Spur τ y geh¨ort im Fall N = 2 f¨ ur alle p < ∞ dem Raum Lp (Γ) an und bei N > 2 f¨ ur alle p ≤ 2(N − 1)/(N − 2). F¨ ur N = 2 folgt F2 ∈ (H 1 (Ω))∗ aus g ∈ Ls (Γ) mit s > 1. Im Fall N > 2 folgt diese Eigenschaft aus s ≥ 2 − 2/N . Das Lemma von Lax und Milgram sichert unter diesen Voraussetzungen Existenz und Eindeutigkeit der L¨ osung y ∈ H 1 (Ω) f¨ ur die obige Gleichung und die Absch¨atzung yH 1 (Ω) ≤ c f Lr (Ω) + gLs (Γ) .
2.4 Lineare Abbildungen 2.4.1 Lineare stetige Operatoren und Funktionale Die ohne Beweis aufgef¨ uhrten S¨ atze dieses Abschnittes finden sich in den meisten Standardwerken der Funktionalanalysis, zum Beispiel in Alt [6], Kantorowitsch und Akilow [118], Ljusternik und Sobolew [146], Heuser [101], Werner [208] oder Yosida [213]. Im Weiteren seien {U, · U } und {V, · V } normierte R¨aume u ¨ber IR. Definition. Eine Abbildung A : U → V heißt linear bzw. linearer Operator, wenn A(u + v) = A u + A v sowie A (λ v) = λ A v f¨ ur alle u, v ∈ U und alle λ ∈ IR gilt. Eine lineare Abbildung f : U → IR heißt lineares Funktional. Reell- oder komplexwertige Abbildungen werden auch Funktional genannt. Definition. Eine Abbildung A : U → V heißt stetig, wenn aus lim un = u in U die n→∞ Konvergenz der Bildfolge gegen A u in V folgt, d.h. lim A un = A u. n→∞
Definition. Ein linearer Operator A : U → V heißt beschr¨ankt, wenn er mit einer von ur alle u ∈ U der folgenden Absch¨atzung gen¨ ugt: u ∈ U unabh¨angigen Konstanten cA f¨ A uV ≤ cA uU . Satz 2.8 Ein linearer Operator ist genau dann beschr¨ankt, wenn er stetig ist. Beispiel. Wir definieren in U = V = C[0, 1] einen Integraloperator A durch
A u (t) =
0
1
et−s u(s) ds,
t ∈ [0, 1].
Offenbar bildet A den Raum U in sich ab und ist linear. Außerdem ist A stetig. Dazu zeigen wir die Beschr¨ anktheit und erhalten die Stetigkeit aus dem letzten Satz. Wir
2.4 Lineare Abbildungen
33
sch¨ atzen ab,
A u (t) ≤ et
0
1
e−s |u(s)| ds ≤ et (1 − e−1 ) max |u(t)| t∈[0,1]
≤ (e − 1) uC[0,1] . Daraus folgt
A uU = max A u (t) ≤ (e − 1) uU , t∈[0,1]
also die Beschr¨ anktheit von A mit cA = e − 1.
Definition. Ist A : U → V ein linearer und stetiger Operator, dann ist die Zahl A = sup
u U =1
A uV
endlich und heißt Norm von A. Sie wird mit AL(U,V ) oder kurz mit A bezeichnet. Da Stetigkeit von A mit Beschr¨ anktheit ¨ aquivalent ist, existiert eine Zahl c, so dass A uV ≤ c uU f¨ ur alle u ∈ U gilt. Die Zahl c = A ist die kleinste Zahl dieser Art; ¨ A erf¨ ullt wirklich die Axiome einer Norm, Ubungsaufgabe 2.5. Definition. Mit L(U, V ) wird der lineare Raum aller linearen und stetigen Operatoren von U nach V bezeichnet, versehen mit der oben eingef¨ uhrten Operatornorm AL(U,V ) . Der Raum L(U, V ) ist bereits vollst¨ andig, also ein Banachraum, wenn nur V vollst¨andig ist. Im Fall U = V schreiben wir L(U, V ) =: L(U ). Beispiel - Multiplikationsoperator. Wir w¨ahlen U = V = L∞ (Ω) und eine feste Funktion a ∈ L∞ (Ω). Als Operator A wird A u (x) = a(x)u(x) f¨ ur fast alle x ∈ Ω definiert. A ist beschr¨ ankt, denn A uV = a(·)u(·)L∞ (Ω) ≤ aL∞ (Ω) uL∞ (Ω) , wobei sich die letzte Absch¨ atzung offenbar nicht verbessern l¨asst. Folglich ist A stetig, d.h. A ∈ L(L∞ (Ω)), und hat die Norm AL(L∞ (Ω)) = aL∞ (Ω) . Zur Illustration betrachten wir den Operator A u (x) = x2 u(x), ankt und hat die Norm 1, denn die Funktion A : L∞ (0, 1) → L∞ (0, 1). Er ist beschr¨ a(x) = x2 ist aus L∞ (0, 1) und hat die Norm 1.
Definition. Der lineare Raum aller auf {U, · U } definierten linearen stetigen Funktionale heißt der zu U duale Raum und wird mit U ∗ bezeichnet. Diesen Raum kann man auch durch U ∗ = L(U, IR) definieren. Die zugeh¨orige Norm ist f U ∗ = sup
u U =1
|f (u)|.
Auf Grund der Vollst¨ andigkeit von IR ist U ∗ stets ein Banachraum.
34
2 Linear-quadratische elliptische Probleme
Beispiel. Wir betrachten im Raum U = C[0, 1] das Funktional f (u) = u beschr¨ ankt, denn 1 |f (u)| = |u( )| ≤ max |u(t)| = 1 · uC[0,1] . 2 t∈[0,1]
1 2
. Es ist
Daraus folgt f U ∗ ≤ 1. Nach Einsetzen von u(t) ≡ 1 folgt |f (u)| = 1 = u und deshalb f U ∗ ≥ 1, insgesamt also f U ∗ = 1.
Die weiteren Ausf¨ uhrungen beziehen sich auf konkrete Darstellungen linearer stetiger Funktionale und damit auf die Charakterisierung des dualen Raums. Ein und dasselbe lineare stetige Funktional kann auf unendlich viele verschiedene Weisen dargestellt werden. Beispielsweise stellen die Ausdr¨ ucke 1 F (v) = ln(exp(3v − 5)) ds + 5, G(x) = 3 v (2.24) 0
das gleiche lineare Funktional auf IR dar, obwohl sie verschieden aussehen. Im Hilbertraum gilt die folgende Aussage: Satz 2.9 (Rieszscher Darstellungssatz) In jedem reellen Hilbertraum {H, (· , ·)H } kann jedes lineare und stetige Funktional F ∈ H ∗ mit Hilfe des Skalarprodukts durch genau ein Element f ∈ H mit F H ∗ = f H in der Form F (v) = f , v H dargestellt werden. In diesem Sinne kann man H ∗ mit H identifizieren und schreibt H = H ∗ . Bei dem durch (2.24) auf H = IR definierten Funktional hat G mit f = 3 ∈ IR die im Satz angegebene kanonische Form. Es sei jetzt U ein reeller Banachraum mit dualem Raum U ∗ . Wird u ∈ U fixiert und f ∈ U ∗ als variabel betrachtet, so ist die durch u erzeugte Abbildung Fu : U ∗ → IR, Fu : f → f (u), ∗
at ist offensichtlich und die Stetigkeit folgt aus linear und stetig auf U . Die Linearit¨ |Fu (f )| = |f (u)| ≤ uU f U ∗ . Deshalb ist dieses durch u erzeugte Funktional Fu ein Element des zu U ∗ dualen Raums (U ∗ )∗ =: U ∗∗ . Die Abbildung u → Fu ist injektiv. Daher kann man im Sinne dieser Konstruktion jedes Element u ∈ U als Funktional aus U ∗∗ auffassen, indem man es mit Fu identifiziert. Der Raum U ∗∗ heißt zu U bidualer Raum. Mit der eben beschriebenen Identifikation gilt immer U ⊂ U ∗∗ . Die Zuordnung u → Fu von U in U ∗∗ heißt kanonische Einbettung oder kanonische Abbildung. Ist diese surjektiv, gilt also U = U ∗∗ , dann heißt der Raum U reflexiv. Bei einem reflexiven Raum gelangt man durch zweifache Dualisierung wieder zum Ausgangsraum zur¨ uck. Wegen des Rieszschen Darstellungssatzes sind alle Hilbertr¨ aume reflexiv. Beispiel. F¨ ur 1 < p < ∞ sind die in Abschnitt 2.1 eingef¨ uhrten R¨aume Lp (E) reflexiv, denn es gilt folgende Darstellung: Jedes lineare stetige Funktional F ∈ Lp (E)∗ kann durch genau eine Funktion f ∈ Lq (E) in der Form f (x) u(x) dx F (u) = E
2.4 Lineare Abbildungen
35
dargestellt werden, wobei der konjugierte Index q durch p1 + 1q = 1 definiert ist. In diesem Sinne gilt also Lp (E)∗ = Lq (E), 1 < p < ∞. uck zu Lp (E). Die SteDurch Dualisierung von Lq (E) gelangt man offenbar wieder zur¨ tigkeit des Funktionals F folgt aus der H¨olderschen Ungleichung f¨ ur Integrale, p1 q1 |u(x)|p dx . (2.25) |f (x)| |u(x)| dx ≤ |f (x)|q dx E
E
E
Bemerkung. Die obige Aussage gilt auch f¨ur p = 1, d.h. L (E) = L (E). Der duale Raum 1
∗
∞
von L∞ (E) ist jedoch nicht der Raum L1 (E); L∞ (E) und L1 (E) sind also nicht reflexiv.
2.4.2 Schwache Konvergenz Der Inhalt dieses Abschnitts wird vor allem f¨ ur den Beweis der Existenz optimaler Steuerungen ben¨ otigt. Leser, die sich zun¨ achst mehr f¨ ur die Grundlagen zur L¨osung von Optimalsteuerungsproblemen interessieren, k¨ onnen diesen Abschnitt zur¨ uckstellen. Im weiteren werden die zugrunde liegenden R¨ aume stets Banachr¨aume sein, auch wenn man deren Vollst¨ andigkeit nicht f¨ ur alle Aussagen ben¨otigt. Definition. Es sei U ein reeller Banachraum. Eine Folge {un }∞ n=1 von Elementen aus U heißt schwach konvergent gegen u ∈ U , wenn f¨ ur n → ∞ f (un ) → f (u)
∀f ∈ U ∗
gilt. Die schwache Konvergenz wird mit gekennzeichnet, d.h. durch un u, n → ∞. Das (schwache) Grenzelement u ist eindeutig bestimmt. Nach dem Satz von Banach und Steinhaus, einer Folgerung aus dem Prinzip der gleichm¨aßigen Beschr¨anktheit, ist f¨ ur jede ∞ in U schwach konvergente Folge {un }∞ die Folge der Normen {u } beschr¨ ankt. n n=1 n=1 Beispiele. (i) Jede in U (stark) gegen u ∈ U konvergente Folge konvergiert auch schwach gegen u, un → u
⇒
un u,
n → ∞.
(ii) Als Folgerung aus dem Rieszschen Satz ist schwache Konvergenz im Hilbertraum {H, (· , ·)} gleichbedeutend mit lim v , un → v , u ∀v ∈ H. n→∞
ur n → Gilt un u und vn → v (starke Konvergenz), so auch vn , un → v , u f¨ ¨ ∞, Ubungsaufgabe 2.8. Das Skalarprodukt einer schwach konvergenten mit einer stark konvergenten Folge konvergiert also gegen das Skalarprodukt der Grenzelemente. (iii) Wir betrachten im Hilbertraum H = L2 (0, 2 π) die Funktionenfolge 1 un (x) = √ sin(nx) π
36
2 Linear-quadratische elliptische Probleme
sowie eine beliebige Funktion f ∈ L2 (0, 2 π). Dann stellt das Skalarprodukt 2π 1 f , un = f (x) √ sin(nx) dx π 0 gerade den n−ten Fourierkoeffizienten der Funktion f bez¨ uglich des Orthonormalsystems √ der Funktionen sin(nx)/ π in L2 (0, 2 π) dar. Wegen der Besselschen Ungleichung bilden diese Koeffizienten eine Nullfolge. Daraus folgt f , un → 0, n → ∞. Weil aber offenbar 0 = f , 0 f¨ ur alle f ∈ H erf¨ ullt ist, erhalten wir 1 un = √ sin(n ·) 0, π
n → ∞.
ur alle n Der schwache Grenzwert der Folge {un } ist die Nullfunktion, aber wir haben f¨ 2π 1 un 2 = sin2 (nx) dx = 1. π 0 Folgerung Es gibt schwach gegen null konvergente Folgen, deren Elemente s¨amtlich der Einheitskugeloberfl¨ache angeh¨oren. Die oben betrachtete Folge von Sinusfunktionen konvergiert schwach gegen null. Diese Funktionen oszillieren aber mit wachsendem n immer st¨arker. Das Beispiel verdeutlicht, dass schwache Konvergenz nur wenig u ¨ber das Konvergenzverhalten aussagt. Deshalb ist die Information, dass eine durch einen Algorithmus berechnete Folge von Funktionen schwach konvergiert, aus numerischer Sicht kaum von Bedeutung. Die schwache Konvergenz entfaltet ihre Kraft beim Beweis von Existenzs¨atzen. Im Weiteren stellen wir einige f¨ ur die Anwendung des Konzepts der schwachen Konvergenz wesentliche Aussagen bereit. Definition. Eine Abbildung F : U → V zwischen zwei reellen Banachr¨aumen U und V heißt schwach folgenstetig, wenn aus der schwachen Konvergenz einer beliebigen Folge {un }∞ n=1 von Elementen aus U gegen u ∈ U die schwache Konvergenz der Bildfolge {F (un )}∞ n=1 gegen F (u) in V folgt, d.h. un u
⇒
F (un ) F (u),
n → ∞.
Beispiele. (i) Jeder lineare stetige Operator A : U → V ist schwach folgenstetig. Das l¨ asst sich leicht nachweisen: Wir haben zu zeigen, dass A un A u aus un u folgt, also f (A un ) → f (A u) f¨ ur alle f ∈ V ∗ . F¨ ur fixiertes f ∈ V ∗ ist das zusammengesetzte Funktional F , definiert durch F (u) := f (A u), linear und stetig auf U , also ein Element aus U ∗ . Deshalb ist wegen der schwachen Konvergenz der Folge {un } die Eigenschaft F (un ) → F (u) erf¨ ullt. Nach Konstruktion von F bedeutet das aber f (A un ) → f (A u). Aus der Beliebigkeit von f folgt A un A u. (ii) Das Funktional f (u) = u ist im Hilbertraum H = L2 (0, 2 π) nicht schwach folgenstetig. Als (Gegen-)Beispiel betrachten wir die bereits eingef¨ uhrte Folge der Funktionen √ un (x) = sin(n x)/ π. F¨ ur n → ∞ gilt un 0 wie wir wissen, aber lim f (un ) = lim un = 1 = 0 = f (0).
n→∞
n→∞
2.4 Lineare Abbildungen
37
Die Norm im Hilbertraum H = L2 (0, 2 π) ist deshalb nicht schwach folgenstetig, ein Problem das in unendlichdimensionalen Banachr¨aumen zu ber¨ ucksichtigen ist. Deshalb arbeitet man mit schwacher Halbstetigkeit nach unten, vgl. das Beispiel nach 2.12.
Definition. Eine Teilmenge M eines reellen Banachraums U heißt schwach folgenabgeschlossen, wenn aus un ∈ M und un u, n → ∞, die Inklusion u ∈ M folgt. M heißt relativ schwach folgenkompakt, wenn jede Folge von Elementen un ∈ M eine in U schwach konvergente Teilfolge enth¨alt. Ist die Menge M zus¨atzlich schwach folgenabgeschlossen, dann wird sie schwach folgenkompakt genannt. ¨ Jede stark konvergente Folge ist schwach konvergent, Ubungsaufgabe 2.7. Die Umkehrung gilt i.a. nicht, man denke an das obige Beispiel der Sinusfunktionen. Deshalb gibt es i.a. mehr schwach konvergente als stark konvergente Folgen. Folgerung. Eine schwach folgenabgeschlossene Menge ist stets (stark) abgeschlossen, aber eine (stark) abgeschlossene Menge muss nicht schwach folgenabgeschlossen sein. Zum Beispiel ist die Einheitskugeloberfl¨ ache im Raum H = L2 (0, 2 π),√ abgeschlossen aber nicht schwach folgenabgeschlossen: Die Funktionenfolge {sin(n x)/ π} geh¨ort der Einheitskugeloberfl¨ ache an, nicht aber deren schwacher Limes, die Nullfunktion. Der n¨ achsten zwei S¨ atze sind z.B. in [6], [208] oder [213] zu finden. Satz 2.10 Jede beschr¨ankte Menge eines reflexiven Banachraums ist relativ schwach folgenkompakt. Es ist vor allem diese Aussage, welche die schwache Konvergenz f¨ ur die Anwendungen so wertvoll macht – die relative schwache Folgenkompaktheit dient in gewissem Sinne als ˇ Ersatz f¨ ur Pr¨ akompaktheit. Aus dem Satz von Eberlein und Smuljan folgt sogar, dass diese Eigenschaft reflexive Banachr¨ aume charakterisiert, [213]. Definition. Eine Teilmenge C eines reellen Banachraums U heißt konvex, wenn mit zwei beliebigen Elementen u, v ∈ U und jedem λ ∈ (0, 1) auch die konvexe Linearkombination λ u + (1 − λ) v zu C geh¨ort. Ein auf C definiertes reellwertiges Funktional f heißt konvex, wenn f (λ u + (1 − λ) v) ≤ λ f (u) + (1 − λ) f (v) f¨ ur alle λ ∈ (0, 1) und alle Elemente u, v ∈ C gilt. Es heißt streng konvex, wenn f¨ ur u = v und λ ∈ (0, 1) die obige Ungleichung mit < an Stelle von ≤ erf¨ ullt ist. Satz 2.11 Jede konvexe und abgeschlossene Menge eines Banachraums ist schwach folgenabgeschlossen. Ist der Raum reflexiv und die Menge zus¨atzlich beschr¨ankt, dann ist sie schwach folgenkompakt. Der erste Teil des Satzes folgt aus dem Satz von Mazur, der aussagt, dass sich der (schwache) Grenzwert einer schwach konvergenten Folge als (starker) Grenzwert konvexer Linearkombinationen von Elementen dieser Folge darstellen l¨asst. Dieser Teil gilt schon in normierten R¨ aumen, [20], [208]. Die zweite Aussage ergibt sich aus Satz 2.10. Satz 2.12 Jedes in einem Banachraum U konvexe und stetige Funktional f ist schwach nach unten halbstetig, d.h. aus un u f¨ ur n → ∞ folgt lim inf f (un ) ≥ f (u). n→∞
38
2 Linear-quadratische elliptische Probleme
Wir verweisen auf [6], [20] oder [208]. Die letzten zwei S¨atze unterstreichen die Bedeutung der Konvexit¨ at f¨ ur die Behandlung von Optimierungsaufgaben in Funktionenr¨aumen. Beispiel. Die Norm ist schwach halbstetig nach unten: Sie ist konvex, weil λu1 + (1 − λ)u2 ≤ λ u1 + (1 − λ) u2
∀λ ∈ [0, 1]
aus Dreiecksungleichung und Homogenit¨ at der Norm folgt. Außerdem ist die Norm stetig. Aus dem letzten Satz folgt deren schwache Halbstetigkeit nach unten.
Bemerkung. Meist werden an Stelle von schwacher Folgenkompaktheit oder schwacher Folgenabgeschlossenheit die Begriffe der schwachen Kompaktheit bzw. schwachen Abgeschlossenheit im Sinne der schwachen Topologie verwendet. Das erschwert das entsprechende Literaturstudium. In reflexiven Banachr¨ aumen sind beide Konzepte a ¨quivalent, vgl. [6], Abschn. 6.7 oder [58].
2.5 Existenz optimaler Steuerungen In Kapitel 2 untersuchen wir Probleme der optimalen Steuerung bei linearen elliptischen Differentialgleichungen. Dabei gehen wir folgenden Grundfragen nach: Existiert eine L¨ osung des Problems, d.h. eine optimale Steuerung mit zugeh¨origem optimalen Zustand? Welchen Optimalit¨ atsbedingungen m¨ ussen optimale L¨osungen gen¨ ugen? Mit welchen numerischen Methoden kann man diese bestimmen? Wir studieren zun¨ achst das Problem der Existenz optimaler Steuerungen und beginnen mit dem einfachsten in Abschnitt 2.3 diskutierten Randwertproblem f¨ ur die Poissongleichung. Gelingt es f¨ ur ein gegebenes Problem nicht, mit g¨angigen Methoden die Existenz einer L¨ osung nachzuweisen, dann verbergen sich dahinter oft Modellierungsfehler, die auch zu numerischen Schwierigkeiten f¨ uhren k¨onnen. Die Aussagen dieses Kapitels beruhen auf folgenden Grundvoraussetzungen an die gegebenen Gr¨ oßen: Das sind ein Ortsgebiet Ω mit Rand Γ, anzusteuernde gew¨ unschte“ ” Funktionen yΩ , yΓ , Koeffizienten α, β sowie Schranken ua , ub , va , vb , die je nach Problemstellung auf E = Ω oder E = Γ definiert sind. Die konkrete Menge E ergibt sich aus dem Zusammenhang heraus. Voraussetzung 2.13 Ω ⊂ IRN sei ein beschr¨anktes Lipschitzgebiet und es seien λ ≥ 0, yΩ ∈ L2 (Ω), yΓ ∈ L2 (Γ), β ∈ L∞ (Ω), α ∈ L∞ (Γ) mit α(x) ≥ 0, f.¨ u. auf Γ, sowie ua , ub , va , vb ∈ L2 (E) mit ua (x) ≤ ub (x) und va (x) ≤ vb (x) f¨ ur fast alle x ∈ E gegeben. Im Weiteren werden wir die Steuerfunktion meist mit u bezeichnen. Diese g¨angige Bezeichnungsweise geht auf das russische Wort upravlenie“ f¨ ur Steuerung zur¨ uck. Treten ” aber in einer Aufgabe sowohl eine verteilte Steuerung als auch eine Randsteuerung auf, dann wird u die Randsteuerung und v die verteilte Steuerung sein.
2.5.1 Optimale station¨ are Temperaturquelle Als ersten Modellfall behandeln wir das Problem der optimalen Temperaturquelle mit homogener Dirichlet-Randbedingung, in Kurzform min J(y, u) :=
1 λ y − yΩ 2L2 (Ω) + u2L2 (Ω) 2 2
(2.26)
2.5 Existenz optimaler Steuerungen
39
bei den Nebenbedingungen −Δy y
= βu = 0
in Ω auf Γ
(2.27)
sowie ua (x) ≤ u(x) ≤ ub (x)
f.¨ u. in Ω.
(2.28)
Zun¨ achst muss gekl¨ art werden, zu welcher Klasse von Funktionen u u ¨ berhaupt geh¨oren soll. Stetige Funktionen scheiden zun¨ achst aus, da die Menge aller stetigen u mit ua ≤ u ≤ ub in der Regel nicht die zum Existenzbeweis n¨ otige Kompaktheit aufweist, z.B. f¨ ur stetige Schranken mit ua (x) < ub (x) auf Ω. Außerdem wird sich herausstellen, dass optimale Steuerungen im Fall λ = 0 Sprungstellen haben k¨onnen. Ein nat¨ urlicher Raum f¨ ur die Steuerfunktionen ist der Hilbertraum L2 (Ω). Wir definieren die Menge der zul¨assigen Steuerungen als
Uad = u ∈ L2 (Ω) : ua (x) ≤ u(x) ≤ ub (x) f.¨ u. in Ω . ¨ Uad ist eine nichtleere, konvexe und abgeschlossene Teilmenge von L2 (Ω), Ubungsaufgabe 2.9. Die Elemente von Uad heißen zul¨assige Steuerungen. Nach Satz 2.4 auf S. 26 existiert zu jedem u ∈ Uad genau eine schwache L¨osung y ∈ H01 (Ω) der Poissongleichung (2.27). Sie heißt zu u geh¨origer Zustand und liegt im Zustandsraum Y := H01 (Ω). Die Zugeh¨ origkeit von y zu u dr¨ ucken wir auch durch y = y(u) aus. Verwechslungen mit ¯ werden durch den Kontext nicht auftreten. dem Funktionswert y(x) an der Stelle x ∈ Ω u) zugeh¨origer optimaler Definition. Eine Steuerung u ¯ ∈ Uad heißt optimal und y¯ = y(¯ Zustand, wenn J(¯ y, u ¯) ≤ J(y(u), u) ∀ u ∈ Uad erf¨ ullt ist. Zur Behandlung der Existenzfrage reformulieren wir die Optimalsteuerungsaufgabe als ein auf u reduziertes Optimierungsproblem. Zu jedem u ∈ L2 (Ω) existiert nach Satz 2.4 genau eine L¨ osung y(u) ∈ H01 (Ω) von (2.27). Definition. Die durch Satz 2.4 auf S. 26 definierte Abbildung G : u → y(u), G : L2 (Ω) → H01 (Ω), nennen wir Steuerungs-Zustands-Operator. G ist linear und stetig. Die Stetigkeit folgt aus Absch¨atzung (2.9). Offenbar ist H 1 (Ω) und damit auch der Teilraum H01 (Ω) linear und stetig eingebettet in L2 (Ω), denn es gilt yL2 (Ω) ≤ yH 1 (Ω) . Deshalb k¨onnen wir G auch als linearen stetigen Operator mit Bild in L2 (Ω) auffassen, was wir im Weiteren tun. Pr¨aziser heißt das, an Stelle von G den Operator EY G zu betrachten, wobei EY : H 1 (Ω) → L2 (Ω) der Einbettungsoperator ist, der jeder Funktion y ∈ Y = H 1 (Ω) die gleiche Funktion in L2 (Ω) zuordnet. Streng genommen m¨ ussten wir EY zun¨achst als Operator von H01 (Ω) in L2 (Ω) auffassen. Aber H01 (Ω) ist ein Teilraum von H 1 (Ω), die Normen beider
40
2 Linear-quadratische elliptische Probleme
R¨ aume sind a ¨quivalent und wir ersparen uns so im Weiteren die Verwendung verschiedener Einbettungsoperatoren. Der Operator EY ist linear und stetig. Wir bezeichnen den so aufgefassten Operator mit S, also S = EY G. Im Folgenden wird S immer f¨ ur den Teil des Zustands y stehen, der im quadratischen Zielfunktional wirklich auftritt. Das kann y selbst sein oder auch die Spur y|Γ . Bei der Aufgabe der station¨ aren Temperaturquelle gilt somit S : L2 (Ω) → L2 (Ω).
S : u → y(u),
Die Verwendung von S hat den Vorteil, dass der adjungierte Operator S ∗ (zur Definition des Begriffs vgl. Abschnitt 2.7) ebenfalls im Raum L2 (Ω) wirkt. Durch S wird das Problem der optimalen Steuerung (2.26)–(2.28) zur quadratischen Optimierungsaufgabe im Hilbertraum L2 (Ω), min f (u) :=
u∈Uad
1 λ S u − yΩ 2L2 (Ω) + u2L2 (Ω) . 2 2
(2.29)
Das eben definierte Funktional f wird (auf u) reduziertes Funktional genannt. F¨ ur Aufgabe (2.29) formulieren wir einen einfach zu beweisenden Existenzsatz, der im Weiteren immer wieder angewendet wird. Satz 2.14 Es seien reelle Hilbertr¨aume {U, · U } und {H, · H }, eine nichtleere, beschr¨ankte, abgeschlossene und konvexe Menge Uad ⊂ U , ein Element yd ∈ H sowie eine Konstante λ ≥ 0 gegeben. Ferner sei S : U → H ein linearer und stetiger Operator. Dann besitzt die quadratische Optimierungsaufgabe im Hilbertraum min f (u) :=
u∈Uad
1 λ S u − yd 2H + u2U 2 2
(2.30)
eine optimale L¨osung u ¯. Ist λ positiv oder S injektiv, dann ist diese eindeutig bestimmt. Beweis: Wegen f (u) ≥ 0 existiert das Infimum j aller m¨oglichen Funktionswerte j := inf f (u). u∈Uad
ur n → ∞. Uad ist beschr¨ankt Damit gibt es eine Folge {un }∞ n=1 aus Uad mit f (un ) → j f¨ und abgeschlossen, jedoch – im Gegensatz zum Existenzsatz 1.1 f¨ ur den endlichdimensionalen Fall – nicht notwendig kompakt. Aber Uad ist als beschr¨ankte, abgeschlossene und konvexe Menge eines Hilbertraums nach Satz 2.11 schwach folgenkompakt (man beachte die Reflexivit¨ at von Hilbertr¨ aumen). Deshalb existiert eine schwach gegen ein u ¯ ∈ Uad konvergente Teilfolge {unk }∞ k=1 , d.h. f¨ ur k → ∞ gilt unk u ¯ u ¯ ∈ Uad . Mit S ist auch f stetig. Es w¨ are nun falsch, aus der Stetigkeit von f auf f (unk ) → f (¯ u) zu schließen. Hier hilft die Konvexit¨ at von f . Sie sichert zusammen mit der Stetigkeit von f die schwache Halbstetigkeit von f nach unten, f (¯ u) ≤ lim inf f (unk ) = j. k→∞
2.5 Existenz optimaler Steuerungen
41
Weil j das Infimum der zul¨ assigen Funktionswerte ist und u ¯ zu Uad geh¨ort, kann f (¯ u) nicht kleiner als j werden, also ist nur f (¯ u) = j m¨oglich. Damit ist u ¯ eine optimale Steuerung. Die zus¨ atzlich behauptete Eindeutigkeit folgt aus der strengen Konvexit¨at von f . F¨ ur λ > 0 erh¨ alt man diese sofort aus dem zweiten Summanden von f . Im Fall λ = 0 sichert ¨ die Injektivit¨ at von S die strenge Konvexit¨ at, Ubungsaufgabe 2.10. Bemerkung. Im Beweis wurde nur die Eigenschaft von f benutzt, konvex und stetig zu sein. Die Existenzaussage gilt deshalb f¨ ur jedes konvexe und stetige Funktional f : U → IR im Hilbertraum U . Das gesamte Resultat bleibt nach Satz 2.11 auch in reflexiven Banachr¨ aumen U g¨ ultig.
Als Folgerung ergibt sich ein Existenzsatz f¨ ur die elliptische Aufgabe (2.26)–(2.28): Satz 2.15 Unter Voraussetzung 2.13 besitzt die Aufgabe (2.26)–(2.28) eine optimale Steuerung u ¯. F¨ ur λ > 0 oder β(x) = 0 f.¨ u. in Ω ist u ¯ eindeutig bestimmt. 2 Beweis: Die Aussage folgt aus dem letzten Satz mit U =
H = L (Ω), yd = yΩ und 2 S = EY G. Die Menge Uad = u ∈ L (Ω) : ua ≤ u ≤ ub ist beschr¨ankt, konvex und abgeschlossen. Damit sind alle Voraussetzungen von Satz 2.14 erf¨ ullt und die zugeordnete Aufgabe (2.30) besitzt eine optimale L¨ osung u ¯. Der Operator S ist unter der obigen Voraussetzung an β im Fall λ = 0 injektiv, denn Su = 0 bedeutet y = 0, woraus nach Einsetzen von y in die Laplace-Gleichung βu = 0 und schließlich u = 0 folgt.
Bemerkung. Im Beweis von Satz 2.14 ist u¯ der Grenzwert einer schwach konvergenten Folge
{unk }. Als stetiger linearer Operator ist der Steuerungs-Zustands-Operator G : L2 (Ω) → H01 (Ω) auch schwach stetig. Daher konvergiert die Zustandsfolge {ynk } in H01 (Ω) schwach gegen y¯ = G¯ u.
Wir lassen jetzt zu, dass eine oder beide der Uad definierenden Ungleichungsrestriktionen fehlen, was formal durch ua = −∞ und/oder ub = +∞ ausgedr¨ uckt werden kann. Dann ist Uad nicht mehr beschr¨ ankt, also auch nicht schwach folgenkompakt. Satz 2.16 Ist λ > 0 und Uad nichtleer, konvex und abgeschlossen, so besitzt die Aufgabe (2.30) genau eine optimale L¨osung. Beweis: Nach Voraussetzung existiert ein u0 ∈ Uad . F¨ ur u2U > 2 λ−1 f (u0 ) gilt 1 λ λ S u − yd 2H + u2U ≥ u2U > f (u0 ). 2 2 2 Folglich kann man sich bei der Suche nach dem Optimum auf die beschr¨ankte, konvexe und abgeschlossene Menge Uad ∩ u ∈ U : u2U ≤ 2 λ−1 f (u0 ) zur¨ uckziehen. Der weitere Beweis verl¨ auft wie beim letzten Satz. f (u) =
Als direkte Folgerung erhalten wir: Satz 2.17 Es sei ua = −∞ und/oder ub = +∞ sowie λ > 0. Dann besitzt die Aufgabe (2.26)–(2.28) der optimalen station¨aren Temperaturquelle unter den gegebenen Voraussetzungen genau eine optimale Steuerung. Optimale station¨ are Temperaturquelle mit vorgegebener Außentemperatur. Wir hatten eine weitere Variante des Problems der optimalen station¨aren Temperaturquelle definiert, bei der an Stelle der homogenen Dirichlet-Randbedingung eine Randbedingung dritter Art gegeben war. Die Zustandsgleichung ist dabei
42
2 Linear-quadratische elliptische Probleme
−Δy ∂ν y
= βu = α (ya − y)
in Ω auf Γ
mit vorgegebener Außentemperatur ya ∈ L2 (Γ) und einer fast u ¨ berall nichtnegativen 2 ∞ Funktion α ∈ L (Γ) mit Γ α ds > 0. Dieses Problem kann weitgehend analog zu dem mit homogener Dirichlet-Randbedingung behandelt werden. Im Unterschied zur letzten Aufgabe ist als Zustandsraum der Raum Y = H 1 (Ω) zu w¨ahlen. Satz 2.6 sichert f¨ ur jedes beliebige Paar u ∈ L2 (Ω), ya ∈ L2 (Γ) genau eine L¨osung y ∈ Y der obigen Randwertaufgabe dritter Art. Mit dem Superpositionsprinzip k¨onnen wir y in der Form y = y(u) + y0 darstellen, wobei y(u) die L¨ osung zum Paar (u, ya = 0) und y0 die L¨osung zum Paar (u = 0, ya ) ist. Die Abbildung G : u → y(u) ist linear und stetig von L2 (Ω) in H 1 (Ω). Wir betrachten G wieder als Operator mit Bild in L2 (Ω), also S = EY G, S : L2 (Ω) → L2 (Ω), so dass der Zustand y in der Form y = S u + y0 geschrieben werden kann. Damit nimmt die Aufgabe die Form min f (u) :=
u∈Uad
1 λ S u − (yΩ − y0 )2L2 (Ω) + u2L2 (Ω) 2 2
(2.31)
an. Die Existenzs¨ atze 2.15 und 2.17 bleiben unter obigen Voraussetzungen offenbar g¨ ultig f¨ ur diese Variante des Problems der station¨ aren Temperaturquelle. Das folgt unmittelbar aus den S¨ atzen 2.14 bzw. 2.16. Es existiert also eine optimale Steuerung, die eindeutig bestimmt ist, falls λ > 0 oder β(x) = 0 f.¨ u. in Ω gilt.
2.5.2 Optimale station¨ are Randtemperatur In gleicher Weise k¨ onnen wir die Aufgabe der optimalen station¨aren Randtemperatur behandeln, 1 λ min J(y, u) := y − yΩ 2L2 (Ω) + u2L2 (Γ) (2.32) 2 2 bei den Nebenbedingungen −Δy ∂ν y
= 0 = α(u − y)
in Ω auf Γ
(2.33)
sowie ua (x) ≤ u(x) ≤ ub (x)
f.¨ u. auf Γ.
(2.34)
F¨ ur Existenz und Eindeutigkeit der L¨ osung der obigen elliptischen Aufgabe fordern wir von α zus¨ atzlich (α(x))2 ds(x) > 0. (2.35) Γ
2.5 Existenz optimaler Steuerungen
43
Die Steuerfunktion u wird in L2 (Γ) gesucht, der zugeh¨orige Zustand y im Zustandsraum Y = H 1 (Ω). Wir definieren
Uad = u ∈ L2 (Γ) : ua (x) ≤ u(x) ≤ ub (x) f. u ¨. auf Γ . Nach Satz 2.6 besitzt Gleichung (2.33) f¨ ur jedes u ∈ L2 (Γ) genau eine schwache L¨osung 1 y ∈ H (Ω), die wir wieder mit y(u) bezeichnen. Der Operator G : u → y(u) ist stetig von L2 (Γ) in H 1 (Ω). Wir fassen G als linearen stetigen Operator von L2 (Γ) in L2 (Ω) auf, verwenden also S = EY G und haben S : L2 (Γ) → L2 (Ω). Es ergibt sich analog zum letzten Satz: Satz 2.18 Unter den Voraussetzungen 2.13 von S. 38 sowie (2.35) besitzt die Aufgabe (2.32)–(2.34) der optimalen station¨aren Randtemperatur eine optimale Steuerung, die f¨ ur λ > 0 eindeutig bestimmt ist. Auch dieser Satz folgt aus Satz 2.14. Die Frage der Eindeutigkeit von u ¯ f¨ ur λ = 0 behandeln wir nicht, um die sonst n¨ otige Diskussion der Bedeutung von ∂ν y zu umgehen. Man kann außerdem Satz 2.16 anwenden, um die letzte Aussage auf unbeschr¨ankte Mengen Uad zu u ¨ bertragen.
2.5.3 Allgemeinere elliptische Gleichungen und Zielfunktionale * Analog l¨ asst sich die allgemeinere Aufgabe min J(y, u, v) :=
λΩ λΓ λv λu y−yΩ 2L2 (Ω) + y−yΓ 2L2 (Γ) + v2L2 (Ω) + u2L2 (Γ1 ) (2.36) 2 2 2 2
bei den Nebenbedingungen A y + c0 y ∂νA y + α y y sowie
va (x) ≤
v(x)
= βΩ v = βΓ u = 0
≤ vb (x)
ua (x) ≤ u(x) ≤ ub (x)
in Ω auf Γ1 auf Γ0
f.¨ u. in Ω f.¨ u. auf Γ1
(2.37)
(2.38)
behandeln. Dabei sind der gleichm¨ aßig elliptische Differentialoperator A und die Mengen Γ0 , Γ1 wie in Abschnitt 2.3.3 auf S. 30 definiert. Voraussetzung 2.19 Es sei Voraussetzung 2.13 von S. 38 erf¨ ullt und zus¨atzlich seien c0 ∈ L∞ (Ω), βΩ ∈ L∞ (Ω), βΓ ∈ L∞ (Γ1 ) sowie nichtnegative Konstanten λΩ , λΓ , λv und λu gegeben. Die Funktionen c0 und α sollen eine der im Existenzsatz 2.7 auf S. 30 enthaltenen Voraussetzungen (i) oder (ii) erf¨ ullen. Unter dieser Voraussetzung ist die Abbildung G : (u, v) → y linear und stetig von L2 (Γ1 ) × L2 (Ω) in H 1 (Ω). Wir verwenden wieder S = EY G, S : L2 (Γ1 ) × L2 (Ω) →
44
2 Linear-quadratische elliptische Probleme
L2 (Ω). Der Operator der Randbeobachtung SΓ : (u, v) → y|Γ , SΓ = τ ◦ G, ist stetig von L2 (Γ1 ) × L2 (Ω) in L2 (Γ). Die Steuerungen sind in den Mengen
Vad = v ∈ L2 (Ω) : va (x) ≤ v(x) ≤ vb (x) f¨ ur fast alle x ∈ Ω
Uad = u ∈ L2 (Γ1 ) : ua (x) ≤ u(x) ≤ ub (x) f¨ ur fast alle x ∈ Γ1 gesucht. Das Zielfunktional J nimmt nach Elimination von y die reduzierte Form J(y, u, v) = f (u, v) =
λΩ λΓ S(u, v) − yΩ 2L2 (Ω) + SΓ (u, v) − yΓ 2L2 (Γ) 2 2 λv λu u2L2 (Γ1 ) + v2L2 (Ω) + 2 2
an. Hier treten gleichzeitig eine verteilte Steuerung v und eine Randsteuerung u auf sowie im Zielfunktional Terme von y im Gebiet und auf dessen Rand (verteilte Beobachtung und Randbeobachtung). Auch dieses Funktional ist konvex und stetig in (v, u), so dass Satz 2.14 von S. 40 angewendet werden kann. Der zweite Term des Zielfunktionals (2.36) wird nur auf Γ1 wirksam, denn auf Γ0 ist y = 0 fest vorgegeben. Wir erhalten die Existenz optimaler Steuerungen u ¯ ∈ L2 (Γ1 ), v¯ ∈ L2 (Ω) wie in Satz 2.14 auf S. 40 und ihre Eindeutigkeit, falls λu und λv gleichzeitig positiv sind (strenge Konvexit¨ at von f ). F¨ ur unbeschr¨ anktes Uad ergibt sich die Existenz mit λu > 0 und λv > 0 wie in Satz 2.16.
2.6 Differenzierbarkeit in Banachr¨ aumen Gˆ ateaux-Ableitungen Zur Herleitung notwendiger Optimalit¨ atsbedingungen ben¨otigt man Verallgemeinerungen des bekannten Ableitungsbegriffs. Wir beginnen hier mit der Einf¨ uhrung von Ableitungen erster Ordnung. Sp¨ ater lernen wir auch Ableitungen h¨oherer Ordnung kennen. Die in diesem Abschnitt verwendeten Bezeichnungen U und V haben keinen Bezug zu ihrer sp¨ ateren Bedeutung bei Optimalsteuerungsproblemen. Im Weiteren sind U und V reelle Banachr¨ aume, U ⊂ U eine offene Menge und F : U ⊃ U → V eine Abbildung von U in V . Definition. Existiert zu gegebenen Elementen u ∈ U, h ∈ U der Grenzwert δF (u, h) := lim t↓0
1 F (u + th) − F (u) t
in V , so heißt dieser Richtungsableitung von F an der Stelle u in Richtung h. Existiert dieser Grenzwert f¨ ur alle h ∈ U , dann heißt die Abbildung h → δF (u, h) erste Variation von F an der Stelle u. Diese Abbildung braucht nicht linear zu sein, wie folgendes Beispiel aus [112] zeigt: Die Funktion f : IR2 → IR, in Polarkoordinaten gegeben durch f (x) = r cos(ϕ), besitzt im Nullpunkt die in h nichtlineare erste Variation δf (0, h) = f (h). Definition. Existieren die erste Variation δF (u, h) an der Stelle u und ein linearer stetiger Operator A : U → V , so dass δF (u, h) = A h
2.6 Differenzierbarkeit in Banachr¨ aumen
45
f¨ ur alle h aus U gilt, dann heißt F an der Stelle u Gˆ ateaux-differenzierbar und A Gˆ ateauxAbleitung von F an der Stelle u. Wir schreiben A = F (u). Aus der Definition folgt, dass man Gˆ ateaux-Ableitungen wie in den folgenden Beispielen als Richtungsableitungen berechnen kann. Ist f : U ⊃ U → IR an der Stelle u Gˆ ateauxdifferenzierbar, dann ist f (u) ein Element des dualen Raumes U ∗ . Manchmal bezeichnet man die Gˆ ateaux-Ableitung nicht mit F (u), etwa durch FG (u), um sie von der Fr´echet-Ableitung F (u) zu unterscheiden. F¨ ur Fr´echet-Ableitungen gilt F (u) = FG (u). Da in allen weiteren Beispielen und Aufgaben die Gˆ ateaux-Ableitungen sogar Fr´echet-Ableitungen sind, verwenden wir der Einfachheit halber die einheitliche Bezeichnung F (u). Beispiele. (i) Nichtlineares Punktfunktional Wir w¨ ahlen U = U = C[0, 1] und definieren f : U → IR durch f u(·) = sin u(1) . Offenbar ist f wohldefiniert. Es sei h = h(x) eine weitere Funktion aus C[0, 1]. Wir berechnen die Richtungsableitung von f an der Stelle u(·) in Richtung h(·): 1 sin u(1) + t h(1) − sin u(1) t→0 t
d = sin u(1) + t h(1) dt t=0
= cos u(1) + t h(1) h(1) = cos u(1) h(1).
1 f (u + t h) − f (u) = t→0 t lim
lim
t=0
Damit gilt δf (u, h) = cos(u(1)) h(1). Die Abbildung h(·) → cos(u(1)) h(1) ist linear und stetig in h ∈ C[0, 1], daher existiert u ateaux-Ableitung f (u) und ist ¨ berall in U die Gˆ gegeben durch f (u) h = cos u(1) h(1). Bemerkung. Hier ist es offenbar nicht direkt m¨oglich, f (u) ohne das Inkrement h aufzuschreiben. Deshalb wird die Bildungsvorschrift f¨ ur f (u) ∈ U ∗ angegeben.
(ii) Norm-Quadrat im Hilbertraum Es sei H ein reeller Hilbertraum mit Skalarprodukt (· , ·)H und Norm · H und f (u) = u2H . F¨ ur die Gˆ ateaux-Ableitung von f folgt 1 u + t h2H − u2H t→0 t 2 t u , h H + t2 h2H = lim t→0 t = 2 u , h H,
1 f (u + t h) − f (u) = t→0 t lim
also
lim
f (u) h = 2 u , h H .
46
2 Linear-quadratische elliptische Probleme
Meist identifiziert man den Dualraum H ∗ von H nach dem Satz von Riesz mit H selbst. Dann folgt f¨ ur f (u) = u2H die einfache Formel f (u) = 2 u. Den nach der Identifikation von f (u) mit einem Element von H entstandenen Ausdruck nennt man Gradient von f . Wir also zwischen der Ableitung, gegeben unterscheiden durch die Vorschrift f (u) h = 2 u , h H , und dem Gradienten f (u) = 2 u. (iii) Anwendung auf die Norm in L2 (Ω) Aus (ii) ergibt sich f¨ ur f (u) := u(·)2L2 (Ω) = die Ableitung f (u) h =
u(x)2 dx
Ω
2 u(x) h(x) dx Ω
∗ oder, nach Identifikation von L2 (Ω) mit L2 (Ω), der Gradient f (u) (x) = 2 u(x).
Alle eben diskutierten Abbildungen haben noch bessere Differentiationseigenschaften. Sie sind sogar Fr´echet-differenzierbar.
Fr´ echet-Ableitungen Es seien wieder {U, · U } und {V, · V } reelle Banachr¨aume und U ⊂ U sei offen. Definition. Eine Abbildung F : U ⊃ U → V heißt an der Stelle u ∈ U Fr´echetdifferenzierbar, wenn ein Operator A ∈ L(U, V ) und eine Abbildung r(u, ·) : U → V mit den folgenden Eigenschaften existieren: F¨ ur alle h ∈ U mit u + h ∈ U gilt F (u + h) = F (u) + A h + r(u, h) und das Restglied r gen¨ ugt der Beziehung r(u, h)V →0 hU
f¨ ur
hU → 0.
A heißt Fr´echet-Ableitung von F an der Stelle u. Wir schreiben A = F (u). Oft ist es einfacher, Fr´echet-Differenzierbarkeit durch die Beziehung F (u + h) − F (u) − A hV →0 hU
f¨ ur hU → 0
(2.39)
zu beweisen. Diese ist offensichtlich ¨ aquivalent zu F (u + h) − F (u) − A h = r(u, h) und ur h → 0. der Eigenschaft r(u, h)V /hU → 0 f¨ Beispiele. (iv) Folgende Funktion aus [112] ist ein Standardbeispiel daf¨ ur, dass Gˆ ateaux-Differenzierbarkeit nicht hinreichend f¨ ur Fr´echet-Differenzierbarkeit ist: Wir definieren f : IR2 → IR durch 1 wenn y = x2 und x = 0 f (x, y) = 0 sonst.
2.7 Adjungierte Operatoren
47
Die Funktion ist Gˆ ateaux-differenzierbar im Nullpunkt, aber dort nicht einmal stetig. Also kann sie im Nullpunkt nicht Fr´echet-differenzierbar sein. (v) f (u) = sin(u(1)) ist Fr´echet-differenzierbar in C[0, 1] . ¨ (vi) f (u) = u2 ist im Hilbertraum Fr´echet-differenzierbar, Ubungsaufgabe 2.11. (vii) Jeder lineare stetige Operator A ist Fr´echet-differenzierbar mit Restglied null, denn A(u + h) = Au + Ah + 0. Die Ableitung eines linearen stetigen Operators ist der Operator selbst.“
” Berechnung von Fr´ echet-Ableitungen. Jede Fr´echet-differenzierbare Abbildung F ist offenbar auch Gˆ ateaux-differenzierbar und beide Ableitungen sind identisch (d.h. FG (u) = F (u), vgl. die Bemerkungen nach der Definition der Gˆ ateaux-Ableitung). Damit kann man die konkrete Form einer Fr´echet-Ableitung u ber die Gˆ ateaux-Ableitung ¨ berechnen, also letztlich als Richtungsableitung. Das wurde auf S. 44 bereits vorgef¨ uhrt. Satz 2.20 (Kettenregel) Es seien U, V und Z Banachr¨aume, U ⊂ U, V ⊂ V offene Mengen und F : U → V sowie G : V → Z an den Stellen u ∈ U bzw. F (u) Fr´ echet differenzierbare Abbildungen. Dann ist auch E = G◦F , definiert durch E(u) = G F (u) , Fr´echet-differenzierbar an der Stelle u und E (u) = G F (u) F (u). Beispiel. Es seien {U, (·, ·)U } sowie {H, (·, ·)H } reelle Hilbertr¨aume, z ∈ H fixiert, S ∈ L(U, H) und E(u) = S u − z2H . In diesem Fall hat E die Darstellung E(u) = G F (u) mit G(v) = v2H und F (u) = S u − z. Wir wissen aus den Beispielen (ii) und (vi) G (v) h = (2 v , h)H ,
F (u) h = S h.
Die Kettenregel ergibt E (u) h = G (F (u))F (u) h = 2 v , F (u) h H = 2 Su−z, Sh H = 2 S ∗ (S u − z) , h U . Dabei ist S ∗ ∈ L(H, U ) der in Abschnitt 2.7 definierte adjungierte Operator zu S.
(2.40)
Bemerkung. Die obigen Aussagen und weitere Informationen zur Differenzierbarkeit von Operatoren und Funktionalen findet zum Beispiel in [41], [112], [116], [118] oder [208].
2.7 Adjungierte Operatoren Ist A eine (m, n)-Matrix, dann gilt (A u , v)IRm = (u , A v)IRn f¨ ur alle u ∈ IRn und m v ∈ IR mit der transponierten Matrix A . Analog kann man in reellen Hilbertr¨aumen U, V einem linearen und stetigen Operator A : U → V den sogenannten adjungierten Operator A∗ zuordnen, der die Umformung (A u , v)V = (u , A∗ v)U f¨ ur alle u ∈ U und
48
2 Linear-quadratische elliptische Probleme
v ∈ V gestattet. Allgemeiner ist die entsprechende Definition in Banachr¨aumen. Dazu seien zwei reelle Banachr¨ aume U und V , ein linearer stetiger Operator A : U → V und ein lineares Funktional f ∈ V ∗ gegeben. Mit f und A definieren wir ein neues Funktional g : U → IR durch g(u) = f (A u). Offenbar ist g linear und die Absch¨ atzung |g(u)| ≤ f V ∗ AL(U,V ) uU zeigt die Beschr¨ anktheit von g, damit auch die Stetigkeit. Folglich ist dieses Funktional g ein Element des dualen Raums U ∗ . F¨ ur dessen Norm gilt gU ∗ = A∗ f U ∗ ≤ AL(U,V ) f V ∗ .
(2.41)
Definition. Die eben definierte Zuordnung f → g heißt zu A adjungierter Operator oder auch dualer Operator und wird hier mit A∗ bezeichnet, A∗ : V ∗ → U ∗ . Bemerkung. Heute wird in vielen Lehrb¨uchern die Schreibweise A f¨ur den adjungierten bzw. dualen Operator bevorzugt. Zur besseren Unterscheidung von der Ableitung verwenden wir hier ur Hilbertr¨ aume reserviert, wir schreiben aber A∗ . Der Begriff des adjungierten Operators ist oft f¨ deshalb unten f¨ ur einen Moment A ; man beachte den typografischen Unterschied zwischen A und A∗ . Bei der Definition des adjungierten bzw. dualen Operators halten wir uns an Alt [6] oder Werner [208].
Mit A ist auch A∗ stetig, denn aus (2.41) folgt A∗ L(V ∗ ,U ∗ ) ≤ AL(U,V ) . Beide Normen sind sogar gleich, vgl. etwa [6], [208]. Der besseren Lesbarkeit halber verwendet man f¨ ur den Wert eines Funktionals f ∈ V ∗ , angewendet auf v ∈ V , gern die folgende, einem Skalarprodukt ¨ ahnelnde Schreibweise (duality pairing) f (v) = f , vV ∗ ,V . Sie verdeutlicht die Bildungsvorschrift des Operators A∗ besser, denn unter Verwendung dieser Klammern folgt f , A uV ∗ ,V = A∗ f , uU ∗ ,U =: u , A∗ f U,U ∗
∀f ∈ V ∗ , ∀u ∈ U.
Diese Form ist einpr¨ agsamer, kann aber zu dem Fehlschluss f¨ uhren, dass A∗ dadurch schon in expliziter Form (wie z.B. in Matrixdarstellung oder als Integraloperator) festgelegt ist. Das ist so nicht zu erwarten, denn ein und dasselbe lineare stetige Funktional f ∈ V ∗ kann ganz verschieden dargestellt werden, vgl. (2.24) auf S. 34. Mit S¨atzen u ¨ber eine konkrete Form linearer stetiger Funktionale wie dem Rieszschen Darstellungssatz kann man explizite Ausdr¨ ucke f¨ ur adjungierte Operatoren ableiten. Wir beschr¨anken uns hier auf die Form adjungierter Operatoren im Hilbertraum. Definition. Es seien {U, (· , ·)U } und {V, (· , ·)V } reelle Hilbertr¨aume und A : U → V ein linearer stetiger Operator. Dann heißt A Hilbertraum-adjungierter Operator bzw. ebenfalls adjungierter Operator zu A, wenn er folgender Beziehung gen¨ ugt: v , A u V = A v , u U ∀ v ∈ V, u ∈ U. (2.42)
2.8 Notwendige Optimalit¨ atsbedingungen erster Ordnung
49
Die Begriffe dual“, adjungiert“ und Hilbertraum-adjungiert“ sind in der Literatur ” ” ” nicht einheitlich definiert. Wir werden in Banach- wie auch in Hilbertr¨aumen den Begriff adjungierter“ Operator verwenden, da sich die Definition aus dem Kontext erschließt. ” Außerdem kennzeichnen wir duale R¨ aume und adjungierte Operatoren generell durch ∗ . Beispiele. (i) Es sei A : IRn → IRm ein durch eine ebenfalls mit A bezeichnete (m, n)-Matrix dargestellter linearer Operator. Dann gilt (v , A u)IRm = (A v , u)IRn f¨ ur alle Vektoren u ∈ IRn und v ∈ IRm . Deshalb kann der (Hilbertraum-) adjungierte Operator A∗ mit der transponierten Matrix A identifiziert werden. (ii) Im Hilbertraum L2 (0, 1) betrachten wir den Integraloperator t A u (t) = e(t−s) u(s) ds. 0
¨ Offenbar wirkt A linear und auch stetig im Raum L2 (0, 1), Ubungsaufgabe 2.12. Den ∗ adjungierten Operator A berechnet man so:
v , A u L2 (0,1)
t
1
=
v(t)
0 1
0
t
v(t) e(t−s) u(s) ds dt
= t=0 1
e(t−s) u(s) ds dt
s=0 1
v(t) e(t−s) u(s) dt ds
=
(Satz von Fubini)
s=0 1 t=s
1 u(s) e(t−s) v(t) dt ds 0 1 1 s = e(s−t) v(s) ds u(t) dt =
0
=
(Variablenaustausch)
t
∗ A v , u L2 (0,1) .
Folglich hat der adjungierte Operator die Darstellung 1 ∗ v(s)e(s−t) ds. A v (t) = t
Die oben angewendete Vertauschung der Integrationsreihenfolge bei Integralen mit ver¨anderlicher oberer Grenze wird zum Beispiel in [65] auf S. 203 erl¨autert.
2.8 Notwendige Optimalit¨ atsbedingungen erster Ordnung Im Abschnitt 2.5 wurde f¨ ur ausgew¨ ahlte Grundtypen elliptischer Optimalsteuerungsprobleme die Existenz und Eindeutigkeit optimaler Steuerungen bewiesen. Hier leiten wir mit Hilfe der ersten Ableitung des Zielfunktionals Bedingungen her, die optimale L¨osungen erf¨ ullen m¨ ussen. Diese notwendigen Bedingungen gestatten weitreichende Schl¨ usse u ¨ber ¨ die Form optimaler Steuerungen sowie die Uberpr¨ ufung numerisch berechneter Steuerungen auf Optimalit¨ at. Sie sind auch Grundlage f¨ ur die Entwicklung numerischer Methoden zur Bestimmung optimaler Steuerungen.
50
2 Linear-quadratische elliptische Probleme
2.8.1 Quadratische Optimierungsaufgabe im Hilbertraum Wir haben zum Nachweis der Existenz optimaler Steuerungen die Steuerungsprobleme in eine auf u reduzierte quadratische Optimierungsaufgabe der Form min f (u) :=
u∈Uad
1 λ Su − yd 2H + u2U 2 2
(2.43)
umgewandelt. Darauf kann folgende grundlegende Aussage angewendet werden, die den Schl¨ ussel f¨ ur die Herleitung notwendiger Optimalit¨atsbedingungen erster Ordnung bei Beschr¨ ankungen an die Steuerung liefert: Lemma 2.21 Es sei U ein reeller Banachraum, C ⊂ U eine konvexe Menge und f ein auf einer C umfassenden offenen Teilmenge von U Gˆ ateaux-differenzierbares reellwertiges Funktional. Mit u ¯ ∈ C sei eine L¨osung der Aufgabe min f (u) u∈C
gegeben. Dann ist die folgende Variationsungleichung erf¨ ullt: f (¯ u)(u − u ¯) ≥ 0
∀u ∈ C.
(2.44)
Ist umgekehrt u ¯ ∈ C eine L¨osung der Variationsungleichung (2.44) und f zus¨atzlich konvex, dann l¨ost u ¯ die Aufgabe minu∈C f (u). Beweis:
Wir w¨ ahlen u ∈ C beliebig aus und betrachten die konvexe Linearkombination u(t) = u ¯ + t (u − u ¯)
f¨ ur beliebiges t ∈ (0, 1]. Die Konvexit¨ at von C sichert u(t) ∈ C. Aus der Optimalit¨at von u ¯ folgt f (u(t)) ≥ f (¯ u), also auch 1 f (¯ u + t(u − u ¯)) − f u ¯) ≥ 0. t u)(u − u ¯) ≥ 0, die Variationsungleichung. Nach Grenz¨ ubergang t ↓ 0 ergibt sich f (¯ Die Umkehrung sieht man wie folgt ein: F¨ ur beliebiges u ∈ C folgt in bekannter Weise aus der Konvexit¨ at f (u) − f (¯ u) ≥ f (¯ u)(u − u ¯). Mit (2.44) ist die rechte Seite der Ungleichung nichtnegativ, woraus f (u) − f (¯ u) ≥ 0, also die Optimalit¨ at von u ¯ folgt. Lemma 2.21 stellt eine notwendige bzw. im Falle der Konvexit¨at auch hinreichende Optimalit¨atsbedingung erster Ordnung dar. Die Aussage bleibt offenbar g¨ ultig, wenn nur die Existenz aller Richtungsableitungen von f vorausgesetzt wird. Es kann sogar sinnvoll sein, nur die Ableitungen f¨ ur Richtungen aus einem dichten Teilraum zu betrachten.
u. in (a, b) Beispiel. Das f¨ ur festes ε > 0 auf Cε = u ∈ L2 (a, b) : u(x) ≥ ε f.¨ wohldefinierte Funktional b f (u) = ln u(x) dx a
2.8 Notwendige Optimalit¨ atsbedingungen erster Ordnung
51
ist an der Stelle u ¯(x) ≡ 1 nicht Gˆ ateaux-differenzierbar im Sinne von L2 (a, b) (es sei ε ∈ (0, 1) angenommen, damit 1 in Cε liegt). Aber die Richtungsableitung existiert in jeder Richtung h ∈ L∞ (a, b), b b h(x) h(x) dx. δf (¯ u, h) = dx = ¯(x) a u a Funktionale dieses Typs treten bei Innere-Punkte-Methoden zur L¨osung von Optimierungsverfahren im Funktionenraum auf.
Wir wenden nun Lemma 2.21 auf die quadratische Optimierungsaufgabe (2.43) an. Satz 2.22 Es seien reelle Hilbertr¨aume U und H, eine nichtleere und konvexe Menge Uad ⊂ U , yd ∈ H sowie eine Konstante λ ≥ 0 gegeben. Ferner sei S : U → H ein linearer und stetiger Operator. Das Element u ¯ ∈ Uad l¨ost genau dann die Aufgabe (2.43), wenn die folgende Variationsungleichung erf¨ ullt ist: ∗ ¯ − yd ) + λ u ¯, u−u ¯ U ≥ 0 ∀u ∈ Uad . (2.45) S (S u Beweis: Der Gradient des Funktionals f in (2.43) ist nach (2.40) u) = S ∗ (S u ¯ − yd ) + λ u ¯. f (¯
(2.46)
Die Aussage folgt unmittelbar aus Lemma 2.21. Oft ist es g¨ unstiger, die Variationsungleichung (2.45) in der ¨aquivalenten Form Su ¯ − yd , Su − S u ¯ H +λ u ¯, u−u ¯ U ≥ 0 ∀u ∈ Uad
(2.47)
∗
aufzuschreiben, die den adjungierten Operator S vermeidet. Wir wenden die obige Variationsungleichung nacheinander auf unsere verschiedenen Optimalsteuerungsprobleme an und folgen dabei dem in Abschnitt 1.4 skizzierten Schema.
2.8.2 Optimale station¨ are Temperaturquelle Die durch (2.26)–(2.28) auf S. 38 definierte Aufgabe mit Randtemperatur lautet min J(y, u) :=
λ 1 y − yΩ 2L2 (Ω) + u2L2 (Ω) 2 2
bei −Δy y
= βu = 0
ua (x) ≤ u(x) ≤ ub (x)
in Ω auf Γ f.¨ u. in Ω.
osungsoperator der Poissongleichung hatten Den als Abbildung in L2 (Ω) aufgefassten L¨ wir mit S bezeichnet. Eine optimale Steuerung u ¯ muss nach (2.45) der Variationsungleichung ∗ S (S u ¯ − yΩ ) + λ u ¯, u−u ¯ L2 (Ω) ≥ 0 ∀u ∈ Uad (2.48) gen¨ ugen. Sie enth¨ alt den Operator S ∗ , der noch zu bestimmen ist. Dazu dient folgender Hilfssatz:
52
2 Linear-quadratische elliptische Probleme
Lemma 2.23 Es seien Funktionen z, u ∈ L2 (Ω), c0 , β ∈ L∞ (Ω) mit c0 ≥ 0 f.¨ u. in Ω gegeben und y bzw. p die schwachen L¨osungen von −Δy + c0 y y
−Δp + c0 p = z p = 0
= βu = 0
Dann gilt
in Ω auf Γ.
z y dx =
Ω
β p u dx.
(2.49)
Ω
Beweis: Wir schreiben die Variationsformulierungen f¨ ur beide obigen Randwertprobleme auf. F¨ ur y folgt mit Testfunktion p ∈ H01 (Ω) ∇y · ∇p + c0 y p dx = β p u dx, Ω
Ω
f¨ ur p gilt mit Testfunktion y ∈ H01 (Ω) ∇p · ∇y + c0 p y dx = z y dx. Ω
Ω
Die linken Seiten sind gleich, also auch die rechten. Daraus folgt die Richtigkeit der Behauptung. Lemma 2.24 Der adjungierte Operator S ∗ : L2 (Ω) → L2 (Ω) ist im Fall der Poissongleichung (2.27) gegeben durch die Vorschrift S ∗ z := β p, wobei p ∈ H01 (Ω) die schwache L¨osung der folgenden Poissongleichung darstellt: −Δp p
= z = 0
in Ω auf Γ.
Beweis: Der Operator S ∗ ist gem¨ aß (2.42) auf S. 48 durch ∗ z , S u L2 (Ω) = S z , u L2 (Ω) ∀z ∈ L2 (Ω),
∀u ∈ L2 (Ω)
festgelegt. Die Aussage folgt aus Lemma 2.23 mit c0 = 0 und y = S u. Wir erhalten z , S u L2 (Ω) = z , y L2 (Ω) = β p , u L2 (Ω) . Die Zuordnung z → β p ist nach Satz 2.4 von S. 26 linear und stetig von L2 (Ω) in L2 (Ω). Da z und u beliebig w¨ ahlbar sind und S ∗ eindeutig bestimmt ist, haben wir S ∗ z = β p bewiesen. Die Konstruktion von S ∗ erfolgte u ¨ ber Lemma 2.23 und ist intuitiv nicht sehr verst¨andlich. Wir werden in Abschnitt 2.10 mit der formalen Lagrangetechnik ein Hilfsmittel kennen lernen, mit dem die Form der partiellen Differentialgleichung zur Ermittlung von S ∗ leicht und zuverl¨ assig zu ermitteln ist. Bemerkungen. Eigentlich wissen wir, dass das Bild von S = EY G im Raum H01 (Ω) liegt. H¨ atten wir an Stelle von S den Operator G : L2 (Ω) → H01 (Ω) betrachtet, dann w¨ are (bei Identifikation von L2 (Ω)∗ mit L2 (Ω)) der adjungierte Operator G∗ : H01 (Ω)∗ → L2 (Ω) aufgetreten. Durch Verwendung von S : L2 (Ω) → L2 (Ω) haben wir den Raum H01 (Ω)∗ umgangen. Das schr¨ ankt die Anwendbarkeit der bisherigen Theorie etwas ein, ist aber einfacher und f¨ ur unsere Zwecke vorerst ausreichend. Das Arbeiten in H01 (Ω)∗ wird kurz in Abschnitt 2.13 behandelt. Man identifiziert dabei aus guten Gr¨ unden H01 (Ω)∗ nicht mit dem Hilbertraum H01 (Ω).
2.8 Notwendige Optimalit¨ atsbedingungen erster Ordnung
53
Adjungierter Zustand und Optimalit¨ atssystem Die Variationsungleichung (2.48) l¨ asst sich bei Kenntnis von S ∗ leicht umformen. Definition. Die schwache L¨osung p ∈ H01 (Ω) der adjungierten Gleichung −Δp = y¯ − yΩ p = 0
in Ω auf Γ
(2.50)
bezeichnet man als den zu y¯ geh¨origen adjungierten Zustand. Die rechte Seite der adjungierten Gleichung ist aus L2 (Ω), denn wir haben yΩ ∈ L2 (Ω) vorausgesetzt und wissen y¯ ∈ Y = H01 (Ω) → L2 (Ω). Nach Satz 2.4 auf S. 26 existiert genau eine L¨ osung p ∈ H01 (Ω) von (2.50). Mit z = y¯ − yΩ erhalten wir aus Lemma 2.24 S ∗ (S u ¯ − yΩ ) = S ∗ (¯ y − yΩ ) = β p, also schließlich nach (2.48) β p + λ¯ u, u − u ¯ L2 (Ω) ≥ 0
∀ u ∈ Uad .
Aus der Variationsungleichung (2.44) folgt deshalb direkt der Satz 2.25 Ist u ¯ optimale Steuerung des Problems der optimalen station¨aren Temperaturquelle (2.26)–(2.28) auf S. 38 und y¯ der zugeh¨orige Zustand, dann existiert genau eine schwache L¨osung p der adjungierten Gleichung (2.50), so dass die Variationsungleichung β(x) p(x) + λ u ¯(x) u(x) − u ¯(x) dx ≥ 0 ∀ u ∈ Uad (2.51) Ω
erf¨ ullt ist. Umgekehrt ist jedes u ¯ ∈ Uad optimal, das mit dem zugeh¨origen Zustand y¯ = y(¯ u) und der L¨osung p von (2.50) der obigen Variationsungleichung (2.51) gen¨ ugt. Die Umkehrung der Aussage gilt wegen der Konvexit¨at von f . Eine Steuerung u ist also genau dann optimal f¨ ur (2.26)–(2.28), wenn sie gemeinsam mit y und p dem folgenden Optimalit¨atssystem gen¨ ugt: −Δy y|Γ
−Δp = y − yΩ p|Γ = 0 u ∈ Uad β p + λ u , v − u L2 (Ω) ≥ 0 ∀v ∈ Uad . = βu = 0
(2.52)
Punktweise Diskussion der Optimalit¨ atsbedingungen Im Weiteren formulieren wir die Variationsungleichung (2.51) um und diskutieren sie vollst¨ andig aus. Nach Umstellen folgt (β p + λ u ¯) u ¯ dx ≤ (β p + λ u ¯) u dx ∀ u ∈ Uad , Ω
Ω
54
also
2 Linear-quadratische elliptische Probleme
(β p + λ u ¯) u ¯ dx = min
u∈Uad
Ω
(β p + λ u ¯) u dx.
(2.53)
Ω
Folgerung Setzen wir den Klammerausdruck in (2.53) als bekannt voraus, dann ergibt sich u ¯ als L¨osung einer linearen Optimierungsaufgabe im Funktionenraum. Diese einfache Beobachtung ist Grundlage des bedingten Gradientenverfahrens, siehe Abschnitt 2.12.1. Es ist intuitiv einleuchtend, dass die Variationsungleichung auch punktweise formuliert werden kann. Lemma 2.26 Die Variationsungleichung Ω die Beziehungen ⎧ ⎨ ua (x), ∈ [ua (x), ub (x)], u ¯(x) = ⎩ ub (x),
(2.51) gilt genau dann, wenn f¨ ur fast alle x ∈ falls falls falls
β(x) p(x) + λ u ¯(x) > 0 β(x) p(x) + λ u ¯(x) = 0 β(x) p(x) + λ u ¯(x) < 0
(2.54)
¨ erf¨ ullt sind. Aquivalent dazu ist die folgende punktweise Variationsungleichung in IR: ur fast alle x ∈ Ω. (2.55) β(x) p(x) + λ u ¯(x) v − u ¯(x) ≥ 0 ∀ v ∈ [ua (x), ub (x)], f¨ Beweis: (i) Wir zeigen zuerst (2.51) ⇒ (2.54) und nehmen dazu an, dass (2.54) nicht erf¨ ullt ist. Dann definieren wir die messbaren Mengen A+ (¯ u)
= {x ∈ Ω : β(x) p(x) + λ u ¯(x) > 0},
A− (¯ u)
= {x ∈ Ω : β(x) p(x) + λ u ¯(x) < 0},
¨ wobei u ¯(·) ein beliebiger Repr¨ asentant der f¨ ur u ¯ stehenden Aquivalenzklasse ist. Analog ¨ asentanten ihrer entsprechenden Aquivalenzklassen. seien ua , ub beliebige aber feste Repr¨ Haben wir die Aussage f¨ ur die so gew¨ ahlten Funktionen ua , ub bewiesen, dann gilt sie ¨ offenbar auch f¨ ur alle anderen Funktionen aus ihren Aquivalenzklassen. u) von positivem Maß mit u ¯(x) > Unter unserer Annahme existiert eine Menge E+ ⊂ A+ (¯ ur alle x ∈ E+ oder eine Menge E− ⊂ A− (¯ u) von positivem Maß mit u ¯(x) < ub (x) ua (x) f¨ f¨ ur alle x ∈ E− . Im ersten Fall definieren wir ur x ∈ E+ , ua (x) f¨ u(x) = u ¯(x) f¨ ur x ∈ Ω \ E+ . Es folgt β(x) p(x) + λ u ¯(x) u(x) − u ¯(x) dx = Ω
E+
β(x) p(x) + λ u ¯(x) ua (x) − u ¯(x) dx < 0,
denn der erste Faktor ist auf E+ positiv und der zweite negativ. Das ist ein Widerspruch zu (2.51). Analog gehen wir im zweiten Fall vor, indem wir u(x) = ub (x) auf E− setzen und u(x) = u ¯(x) in den restlichen Punkten. (ii) Aus (2.54) folgt (2.55): Zum Beispiel gilt fast u u) die Beziehung u ¯(x) = ¨ berall auf A+ (¯ ua (x) und damit f¨ ur jede reelle Zahl v ∈ [ua (x), ub (x)] die Ungleichung v − u¯(x) ≥ 0. Aus β(x) p(x) + λ u ¯(x) > 0 in A+ (¯ u) ergibt sich fast u ¨berall in A+ β(x) p(x) + λ u ¯(x) v − u ¯(x) ≥ 0.
2.8 Notwendige Optimalit¨ atsbedingungen erster Ordnung
55
Analog schließen wir auf diese Ungleichung f.¨ u. in A− (¯ u). Sie gilt erst recht in allen Punkten, in denen β(x) p(x) + λ u ¯(x) verschwindet. Daraus folgt (2.55) fast u ¨ berall in Ω. (iii) (2.55) impliziert (2.51): Wir w¨ ahlen dazu u ∈ Uad beliebig aus. Wir haben u ¯(x) ∈ [ua (x), ub (x)] f¨ ur fast alle x ∈ Ω und aus (2.55) folgt mit v := u(x) β(x) p(x) + λ u ¯(x) u(x) − u ¯(x) ≥ 0 f¨ ur fast alle x ∈ Ω. Nach Integration ergibt sich die Variationsungleichung (2.51). Durch einfaches Umstellen erh¨ alt man aus der punktweisen Variationsungleichung (2.55) (2.56) β(x) p(x) + λ u ¯(x) u ¯(x) ≤ β(x) p(x) + λ u ¯(x) v ∀v ∈ [ua (x), ub (x)] f¨ ur fast alle x ∈ Ω. Hier, wie auch in (2.55), ist v eine reelle Zahl und keine Funktion! ur (2.26)–(2.28), wenn mit Satz 2.27 Eine Steuerung u ¯ ∈ Uad ist genau dann optimal f¨ dem zugeh¨origen adjungierten Zustand p aus (2.50) eine der folgenden zwei Minimumbedingungen f¨ ur fast alle x ∈ Ω erf¨ ullt ist: Das schwache Minimumprinzip min β(x) p(x) + λ u ¯(x) v = β(x) p(x) + λ u ¯(x) u ¯(x) v∈[ua (x),ub (x)]
oder das Minimumprinzip min
v∈[ua (x),ub (x)]
β(x) p(x) v +
λ λ 2 v = β(x) p(x) u ¯(x)2 . ¯(x) + u 2 2
Beweis: Das schwache Minimumprinzip ist weiter nichts als eine Umformulierung von (2.56). Ebenso einfach sieht man das Minimumprinzip ein: Eine reelle Zahl v¯ l¨ost f¨ ur festes x genau dann die (konvexe) quadratische Optimierungsaufgabe in IR, min
v∈[ua (x),ub (x)]
g(v) := β(x) p(x) v +
λ 2 v , 2
v )(v − v¯) ≥ 0 ∀v ∈ [ua (x), ub (x)] erf¨ ullt ist, also wenn die Variationsungleichung g (¯ β(x) p(x) + λ v¯ (v − v¯) ≥ 0 ∀v ∈ [ua (x), ub (x)]. Die Minimumbedingung folgt mit v¯ = u ¯(x). Die hergeleiteten punktweisen Bedingungen k¨ onnen noch weiter ausgewertet werden. Je nach Wahl von λ ergeben sich unterschiedliche Konsequenzen: Fall 1, λ = 0 : Aus (2.54) ergibt sich fast u ¨ berall ua (x), falls β(x) p(x) > 0 u ¯(x) = ub (x), falls β(x) p(x) < 0.
(2.57)
In den Punkten x ∈ Ω mit β(x) p(x) = 0 liefert diese Beziehung keine Aussage u ¨ber u ¯(x). Gilt β(x) p(x) = 0 f.¨ u. auf Ω, dann liegt u¯(x) fast u ¨ berall an der oberen Grenze ub (x) oder an der unteren Grenze ua (x) des zul¨assigen Bereiches. Es liegt eine BangBang-Steuerung vor. So bezeichnet man eine Steuerungsfunktion, die fast u ¨ berall nur die Werte der Schranken ua und ub annimmt.
56
2 Linear-quadratische elliptische Probleme
Fall 2, λ > 0 : Wir interpretieren die zweite Beziehung in (2.54) als u ¯ ist unbestimmt, ” falls λ¯ u + β p = 0“ gilt. Das stimmt eigentlich nicht ganz, denn die Gleichung λ¯ u+βp = 0 liefert mit u ¯(x) = −λ−1 β(x) p(x) zumindest einen Hinweis auf eine vollst¨andige Diskussion der Minimumbedingung: Satz 2.28 Im Fall λ > 0 ist u ¯ genau dann optimale Steuerung der Aufgabe (2.26)– (2.28), wenn mit dem zugeh¨origen adjungierten Zustand p die Projektionsformel 1 u ¯(x) = IP[ua (x),ub (x)] − β(x) p(x) (2.58) λ f¨ ur fast alle x ∈ Ω erf¨ ullt ist. Dabei bezeichnet IP[a,b] f¨ ur a ≤ b ∈ IR die Projektion von IR auf [a, b],
IP[a,b] (u) := min b , max{a , u} . Beweis: Die Aussage folgt direkt aus Satz 2.27: Die L¨osung der im Minimumprinzip formulierten quadratischen Optimierungsaufgabe in IR, min
v∈[ua (x),ub (x)]
β(x)p(x) v +
λ 2
v 2
¨ ist durch die Projektionsformel (2.58) gegeben, Ubungsaufgabe 2.13. Fall 2a, λ > 0 und Uad = L2 (Ω) : Das ist der Fall ohne Beschr¨ankungen an die Steuerung. Hier folgt aus (2.58) oder direkt aus (2.55) 1 u ¯ = − β p. λ
(2.59)
Durch Einsetzen in die Zustandsgleichung erhalten wir das Optimalit¨atssystem −Δy y|Γ
= −λ−1 β 2 p = 0
−Δp p|Γ
= y − yΩ = 0,
ein gekoppeltes System zweier elliptischer Randwertprobleme zur Bestimmung von y = y¯ und p. Nach Berechnung von p ergibt sich die gesuchte optimale Steuerung u ¯ aus (2.59). Formulierung als Karush-Kuhn-Tucker-System Die Variationsungleichung (2.51) kann in den Optimalit¨atssystemen durch Einf¨ uhrung von Lagrangeschen Multiplikatoren als weitere Gleichung formuliert werden. Die zugeh¨ orige Methode wurde bereits in Abschnitt 1.4.7 erl¨autert. Satz 2.29 Die Variationsungleichung (2.51) ist ¨aquivalent zur Existenz von fast ¨ uberall nichtnegativen Funktionen μa , μb aus L2 (Ω), so dass die Gleichung β p + λ¯ u − μa + μb = 0 und die Komplementarit¨atsbedingungen μa (x) ua (x) − u ¯(x) = μb (x) u ¯(x) − ub (x) = 0 fast u ullt sind. ¨berall in Ω erf¨
(2.60)
(2.61)
2.8 Notwendige Optimalit¨ atsbedingungen erster Ordnung
57
Beweis. (i) Wir zeigen zuerst, dass (2.60) und (2.61) aus der Variationsungleichung (2.51) folgen. Dazu definieren wir analog zu Abschnitt 1.4.7 μa (x) := β(x) p(x) + λ¯ u(x) + (2.62) μb (x) := β(x) p(x) + λ¯ u(x) − , wobei f¨ ur s ∈ IR die Werte s+ bzw. s− wie u ¨blich durch s+ =
1 s + |s|), 2
s− =
1 |s| − s) 2
erkl¨ art sind. Dann gilt nach Definition μa ≥ 0, μb ≥ 0 und β p + λ¯ u = μa − μb , also (2.60). Wegen (2.54) sind außerdem f¨ ur fast alle x ∈ Ω folgende Implikationen erf¨ ullt: (β p + λ u ¯)(x) > 0 ⇒ u ¯(x) = ua (x) (β p + λ u ¯)(x) < 0 ⇒ u ¯(x) = ub (x) ua (x) < u ¯(x) < ub (x) ⇒ (β p + λ u ¯)(x) = 0. Deshalb gilt f¨ ur fast alle x ∈ Ω die Beziehung (2.61), denn stets ist in beiden Produkten mindestens einer der Faktoren null. Beispielsweise folgt aus μa (x) > 0 sofort μb (x) = 0, daher (β p+λ u ¯)(x) = μa > 0 und somit u ¯(x)−ua (x) = 0. F¨ ur fast alle x mit u ¯(x) > ua (x) muss (β p+λ u ¯)(x) ≤ 0 erf¨ ullt sein und daher μa (x) = 0 nach (2.62). Deshalb verschwindet das erste Produkt in (2.61) fast u ¨berall. (ii) Umgekehrt seien (2.60)–(2.61) erf¨ ullt mit u ¯ ∈ Uad und es sei u ∈ Uad gegeben. Dann sind f¨ ur x drei verschiedene F¨ alle zu diskutieren: F¨ ur fast alle x mit ua (x) < u ¯(x) < ub (x) folgt aus den Komplementarit¨atsbedingungen (2.61) die Beziehung μa (x) = μb (x) = 0 und aus Gleichung (2.60) (β p + λ u ¯)(x) = 0, somit auch
β(x) p(x) + λ u ¯(x)
u(x) − u ¯(x) ≥ 0.
(2.63)
¯(x) erhalten wir u(x) − u ¯(x) ≥ 0 aus u ∈ Uad . Außerdem ergibt (2.61) Im Fall ua (x) = u sofort μb (x) = 0. Aus Gleichung (2.60) folgt die Beziehung β(x) p(x) + λ¯ u(x) = μa (x) ≥ 0, daher wieder Ungleichung (2.63). Im Fall u¯(x) = ub (x) argumentiert man analog. Somit ist f¨ ur fast alle x ∈ Ω Ungleichung (2.63) erf¨ ullt, woraus sich nach Integration die Variationsungleichung (2.51) ergibt. Als Folgerung erhalten wir das folgende Karush-Kuhn-Tucker-System an Stelle des bisher mit der Variationsungleichung aufgeschriebenen Optimalit¨atssystems (2.52): −Δy y|Γ
= βu −Δp = y − yΩ = 0 p|Γ = 0 β p + λu − μa + μb = 0 ua ≤ u ≤ ub , μa ≥ 0, μb ≥ 0, μa ua − u = μb u − ub = 0.
(2.64)
58
2 Linear-quadratische elliptische Probleme
Die nichtdifferentiellen Beziehungen sind hier f¨ ur fast alle x in Ω zu verstehen. Definition. Die in Satz 2.29 definierten Funktionen μa , μb ∈ L2 (Ω) heißen Lagrangesche Multiplikatoren zu den Ungleichungsrestriktionen ua ≤ u bzw. u ≤ ub . Bemerkung. Dieses System kann auch direkt u¨ber eine Lagrangefunktion hergeleitet werden,
wenn man die Existenz der Multiplikatoren μa , μb ∈ L2 (Ω) voraussetzt, siehe Abschnitt 6.1. Gerade diese ist aber aus der bekannten Karush-Kuhn-Tucker-Theorie im Banachraum nicht ohne Weiteres zu erhalten, weil die Menge der fast u ¨berall nichtnegativen Funktionen in L2 (Ω) kein Inneres besitzt. Diese Schwierigkeit, die ausf¨ uhrlich in Abschnitt 6.1 diskutiert wird, haben wir durch explizite Definition der Multiplikatoren μa , μb umgangen.
Der reduzierte Gradient des Zielfunktionals Der adjungierte Zustand erleichtert die Angabe des reduzierten Gradienten, also des Gradienten von f (u) = J y(u), u . Die im n¨ achsten Lemma enthaltene Darstellung f¨ ur f (u) wird f¨ ur fast alle in diesem Buch behandelten Optimalsteuerungsprobleme zutreffen. Lemma 2.30 Der Gradient des Funktionals 1 λ f (u) = J y(u), u = y − yΩ 2L2 (Ω) + u2L2 (Ω) 2 2 ist gegeben durch
f (u) = β p + λ u,
wobei p ∈ H01 (Ω) die schwache L¨osung der adjungierten Gleichung −Δp = y − yΩ p = 0
in Ω auf Γ
(2.65)
darstellt und y = y(u) der zu u geh¨orige Zustand ist. Beweis: Unter Verwendung von Formel (2.46) auf S. 51 folgt aus Lemma 2.24 f (u) h = S ∗ (S u − yΩ ) + λ u , h L2 (Ω) = β p + λ u , h L2 (Ω) . Nach dem Satz von Riesz wird f (u) mit β p + λ u identifiziert. Bringt man S ∗ auf die rechte Seite des Skalarprodukts in (2.48) auf S. 51, dann erh¨alt man die ¨ aquivalente Form Su ¯ − yΩ , Su − S u ¯ L2 (Ω) + λ u ¯, u−u ¯ L2 (Ω) ≥ 0 ∀u ∈ Uad . (2.66) Mit y¯ = S u ¯, y = Su folgt u)(u − u ¯) = y¯ − yΩ , y − y¯ L2 (Ω) + λ u ¯, u−u ¯ L2 (Ω) ≥ 0. f (¯
(2.67)
Die Form (2.67) der Variationsungleichung gestattet die Anwendung des nachfolgenden Lemmas 2.31 zur Bestimmung von S ∗ . Der Operator S ∗ tritt dort nicht explizit auf, steht aber hinter der Konstruktion. Diese Herangehensweise werden wir im Weiteren bevorzugen.
2.8 Notwendige Optimalit¨ atsbedingungen erster Ordnung
59
2.8.3 Station¨ are Temperaturquelle und Randbedingung dritter Art In diesem Abschnitt behandeln wir das unten stehende Optimalsteuerungsproblem (2.69) –(2.71) und beginnen mit einer zu Lemma 2.23 analogen Aussage, die direkt zur Bestimmung der adjungierten Gleichung angewendet werden kann. Lemma 2.31 Es seien Funktionen aΩ , v ∈ L2 (Ω), aΓ , u ∈ L2 (Γ), c0 , βΩ ∈ L∞ (Ω), α, βΓ ∈ L∞ (Γ) gegeben und fast ¨ uberall α ≥ 0, c0 ≥ 0 erf¨ ullt. Mit y bzw. p seien die schwachen L¨osungen der elliptischen Randwertprobleme −Δy + c0 y ∂ν y + α y bezeichnet. Dann gilt Ω
−Δp + c0 p = aΩ ∂ν p + α p = aΓ
= βΩ v = βΓ u
aΩ y dx +
Γ
aΓ y ds =
Ω
βΩ p v dx +
Γ
βΓ p u ds.
(2.68)
Beweis: Wir schreiben die Variationsformulierungen f¨ ur beide obigen Randwertprobleme auf und setzen y und p wechselseitig als Testfunktion ein. F¨ ur y folgt mit Testfunktion p ∈ H 1 (Ω) ∇y · ∇p + c0 y p dx + α y p ds = βΩ p v dx + βΓ p u ds, Ω
Γ
Ω
Γ
1
f¨ ur p erhalten wir mit Testfunktion y ∈ H (Ω) ∇p · ∇y + c0 p y dx + α p y ds = aΩ y dx + aΓ y ds. Ω
Γ
Ω
Γ
Die linken Seiten sind gleich, also auch die rechten. Daraus folgt die Behauptung. Mit diesem Resultat k¨ onnen wir nun leicht die Aufgabe der optimalen station¨aren Temperaturquelle mit Randbedingung dritter Art behandeln, die wir der Einfachheit halber noch als homogen annehmen. Wir lassen auch einen Randterm im Zielfunktional zu. Die Aufgabe lautet min J(y, u) :=
λΩ λΓ λ y − yΩ 2L2 (Ω) + y − yΓ 2L2 (Γ) + u2L2 (Ω) 2 2 2
(2.69)
bei −Δy ∂ν y + α y
= βu = 0
ua (x) ≤ u(x) ≤ ub (x)
in Ω auf Γ,
(2.70)
f.¨ u. in Ω.
(2.71)
Wir setzen λ, λΩ , λΓ ≥ 0, 0 ≤ α ∈ L∞ (Γ), αL∞ (Γ) = 0, yΩ ∈ L2 (Ω), yΓ ∈ L2 (Γ) voraus. F¨ ur die optimalen Gr¨ oßen u ¯, y¯ lauten die Optimalit¨atsbedingungen (β p + λ u ¯)(u − u ¯) dx ≥ 0 ∀u ∈ Uad , Ω
60
2 Linear-quadratische elliptische Probleme
wobei der adjungierte Zustand p durch −Δp ∂ν p + α p
= λΩ (¯ y − yΩ ) = λΓ (¯ y − yΓ )
in Ω auf Γ
definiert ist. Die Herleitung dieser Beziehungen erfolgt wie im n¨achsten Abschnitt mit ¨ Lemma 2.31; Ubungsaufgabe 2.14.
2.8.4 Optimale station¨ are Randtemperatur Das Randsteuerungsproblem (2.32)–(2.34) von S. 42 lautete min J(y, u) :=
1 λ y − yΩ 2L2 (Ω) + u2L2 (Γ) 2 2
bei −Δy ∂ν y + α y
= 0 = αu
ua (x) ≤ u(x) ≤ ub (x)
in Ω auf Γ, f.¨ u. auf Γ.
Der L¨ osungsoperator G : u → y(u) bildet nach Satz 2.6 den Raum L2 (Γ) linear und stetig in H 1 (Ω) ab, aber wir betrachten ihn wieder als Operator mit Bild in L2 (Ω), also S = EY G : L2 (Γ) → L2 (Ω) mit dem Einbettungsoperator EY : H 1 (Ω) → L2 (Ω). Das Zielfunktional hat damit die Gestalt J(y, u) = f (u) =
1 λ Su − yΩ 2L2 (Ω) + u2L2 (Γ) . 2 2
Die weiteren Schritte verlaufen analog zu Abschnitt 2.8.2. Dazu sei u¯ ∈ Uad optimale Steuerung und y¯ der zugeh¨ orige Zustand. Wir wenden Satz 2.22 von S. 51 an und bringen die entstehende Variationsungleichung wie in (2.67) auf die Form f (¯ u)(u − u ¯) = y¯ − yΩ , y − y¯ L2 (Ω) + λ u ¯, u−u ¯ L2 (Γ) ≥ 0. (2.72) Mit y := y − y¯ hat (¯ y − yΩ , y − y¯) die gleiche Form wie die linke Seite von (2.68), wenn wir dort aΩ = y¯ − yΩ und aΓ = 0 w¨ ahlen. Wir wenden nun Lemma 2.31 mit dieser Wahl und βΩ = 0, βΓ = α, c0 = 0 an und k¨ onnen y − y¯ durch einen Term mit u − u ¯ ersetzen, indem wir p als L¨ osung der folgenden adjungierten Gleichung einf¨ uhren: −Δp = y¯ − yΩ ∂ν p + α p = 0
in Ω auf Γ.
(2.73)
Ein einfaches Rezept zum Aufstellen der adjungierten Gleichung wird uns sp¨ater die Lagrangetechnik liefern. Die rechte Seite der Differentialgleichung ist aus L2 (Ω), denn wir haben yΩ ∈ L2 (Ω) vorausgesetzt und wissen y¯ ∈ Y = H 1 (Ω) → L2 (Ω). Nach Satz 2.6 existiert genau eine L¨ osung p ∈ H 1 (Ω) von (2.73). Als schwache L¨osung ist sie durch ∇p · ∇v dx + α p v ds = (¯ y − yΩ ) v dx ∀ v ∈ H 1 (Ω) (2.74) Ω
Γ
Ω
2.8 Notwendige Optimalit¨ atsbedingungen erster Ordnung
61
definiert. Der optimale Zustand y¯ = S u ¯ ist die schwache L¨osung der Zustandsgleichung zu u ¯, analog geh¨ ort y = S u zu u, also y − y¯ zu u − u ¯ (Linearit¨at der Zustandsgleichung). Nach Lemma 2.31, angewendet auf y = y − y¯, v = u − u ¯ gilt (¯ y − yΩ )(y − y¯) dx = α p (u − u ¯) ds. Ω
Γ
Mit diesem Ergebnis lautet (2.72) u)(u − u ¯) = (λ u ¯ + α p)(u − u ¯) ds ≥ 0 f (¯ Γ
∀ u ∈ Uad .
u) ist unabh¨ angig von der hier angenommenen Optimalit¨at Die Form der Ableitung f (¯ von u ¯. Als Nebenergebnis erhalten wir so die Gestalt des reduzierten Gradienten f (u) an einer beliebigen Stelle u, f (u) = α p|Γ + λ u. (2.75) Dabei l¨ ost der zugeh¨ orige adjungierte Zustand p die adjungierte Gleichung −Δp ∂ν p + α p
= y(u) − yΩ = 0
in Ω auf Γ.
Nach dem Satz von Riesz haben wir die Ableitung f (u) durch ein Element von L2 (Γ), den Gradienten, repr¨ asentiert. Die eben hergeleiteten Ergebnisse fasst folgender Satz zusammen: Satz 2.32 Ist u ¯ optimale Steuerung des Problems (2.32)–(2.34) auf S. 42 und y¯ der zugeh¨orige Zustand, dann existiert genau eine L¨osung p der adjungierten Gleichung (2.73), so dass die Variationsungleichung α(x) p(x) + λ u ¯(x) u(x) − u ¯(x) ds(x) ≥ 0 ∀ u ∈ Uad (2.76) Γ
u) und der erf¨ ullt ist. Umgekehrt ist jede Steuerung u ¯ ∈ Uad optimal, die mit y¯ := y(¯ L¨osung p von (2.73) der Variationsungleichung (2.76) gen¨ ugt. Die weitere Diskussion der Variationsungleichung (2.76) l¨auft wie bei der Poissongleichun ab. Als Ergebnis erhalten wir ⎧ falls α(x) p(x) + λ u ¯(x) > 0 ⎨ ua (x), ∈ [ua (x), ub (x)], falls α(x) p(x) + λ u ¯(x) = 0 u ¯(x) = (2.77) ⎩ ub (x), falls α(x) p(x) + λ u ¯(x) < 0 und das schwache Minimumprinzip α(x) p(x) + λ u ¯(x) v = α(x) p(x) + λ u ¯(x) u ¯(x) min ua (x)≤v≤ub (x)
f¨ ur fast alle x ∈ Γ.
Als Folgerung ergibt sich: Satz 2.33 (Minimumprinzip) Ist u ¯ optimale Steuerung von (2.32)–(2.34) auf S. 42 und p der zugeh¨orige adjungierte Zustand, dann wird f¨ ur fast alle x ∈ Γ das Minimum min
ua (x)≤v≤ub (x)
α(x) p(x) v +
λ 2
v 2
62
2 Linear-quadratische elliptische Probleme
durch v = u ¯(x) angenommen. Daher ist f¨ ur λ > 0 die Projektionsformel 1 u ¯(x) = IP[ua (x),ub (x)] − α(x) p(x) λ
(2.78)
f¨ ur fast alle x ∈ Γ erf¨ ullt. Umgekehrt ist eine Steuerung u ¯ ∈ Uad optimal, wenn sie der Projektionsformel (2.78) mit dem zugeh¨origen adjungierten Zustand p gen¨ ugt. Der Beweis ist identisch mit dem f¨ ur das Problem der station¨aren Temperaturquelle. Im Fall ohne Beschr¨ ankungen an die Steuerfunktion, d.h. ua = −∞ und ub = ∞ erh¨alt man 1 u ¯(x) = − α(x) p(x). λ Im Spezialfall λ = 0 erh¨ alt man u ¯ aus einer Fallunterscheidung analog zu (2.57) auf S. 55. Zur Illustration w¨ ahlen wir ein zweidimensionales Gebiet Ω, dessen Rand Γ wir uns auf ein St¨ uck der reellen Achse abgewickelt denken. Als Schranken sind ua = −1, ub = +1 vorgegeben.
u¯
1
x (Γ abgewickelt auf IR)
α p = α p(¯ u)
-1 Optimale Steuerung f¨ ur λ = 0
Bei λ > 0 ergibt sich u ¯ als Projektion der Funktion −λ−1 α p auf [−1, 1].
1
u¯ x
-1 α u) − p(¯ λ Optimale Steuerung f¨ ur λ > 0
2.9 Konstruktion von Testaufgaben
63
2.8.5 Ein lineares Optimalsteuerungsproblem Wir betrachten die lineare Aufgabe mit verteilter Steuerung v und Randsteuerung u, min J(y, u, v) := (aΩ y + λΩ v) dx + (aΓ y + λΓ u) ds Ω
Γ
bei −Δy ∂ν y + α y
= βΩ v = βΓ u
va (x) ≤ v(x) ≤ vb (x) f.¨ u. in Ω,
in Ω auf Γ
ua (x) ≤ u(x) ≤ ub (x) f.¨ u. auf Γ.
Die gegebenen Funktionen aΩ , λΩ , aΓ , λΓ seien quadratisch integrierbar auf ihren Definitionsgebieten Ω bzw. Γ, βΩ und βΓ seien beschr¨ankt und messbar auf Ω bzw. Γ. Die Schranken va , vb , ua , ub sollen ebenfalls quadratisch integrierbar sein, α sei fast u ¨ berall nichtnegativ und nicht fast u ¨berall gleich null. F¨ ur ein optimales Tripel (¯ y , v¯, u ¯) lauten die Optimalit¨atsbedingungen (βΩ p + λΩ )(v − v¯) dx + (βΓ p + λΓ )(u − u ¯) ds ≥ 0 ∀v ∈ Vad , ∀u ∈ Uad , Ω
Γ
wobei der adjungierte Zustand p durch −Δp = aΩ ∂ν p + α p = aΓ
in Ω auf Γ
¨ definiert ist. Die Herleitung dieser Beziehungen erfolgt in Ubungsaufgabe 2.15. Lineare Steuerungsprobleme entstehen beispielsweise bei der Linearisierung von nichtlinearen Optimalsteuerungsproblemen an einer optimalen Stelle. Dadurch kann man notwendige Optimalit¨ atsbedingungen f¨ ur nichtlineare Aufgaben durch Linearisierung und Anwendung der notwendigen Bedingungen auf die lineare Aufgabe herleiten. Das ist eine der M¨ oglichkeiten, nichtlineare Probleme zu behandeln.
2.9 Konstruktion von Testaufgaben F¨ ur die Validierung numerischer Verfahren zur L¨osung von Problemen der optimalen Steuerung ben¨ otigt man Testbeispiele, von denen die exakte L¨osung bekannt ist. Mit ihnen kann man nachpr¨ ufen, ob die numerische Methode das richtige Ergebnis liefert. Durch Anwendung der bewiesenen notwendigen Optimalit¨atsbedingungen ist es nicht schwer, solche Beipiele zu konstruieren. Dazu muss man bei partiellen Differentialgleichungen andere Wege gehen als bei gew¨ ohnlichen. In der Theorie der optimalen Steuerung bei gew¨ohnlichen Differentialgleichungen kann ¨ die Zustandsgleichung zumindest bei gut gew¨ ahlten Ubungsaufgaben geschlossen gel¨ost werden, wenn ein analytischer Ausdruck f¨ ur die Steuerung vorgegeben ist. Bei partiellen Differentialgleichungen ist das schwieriger. Selbst in einfachen F¨allen bekommt man bestenfalls eine Reihenentwicklung f¨ ur den Zustand y zu gegebenem u. Deshalb gehen wir
64
2 Linear-quadratische elliptische Probleme
hier umgekehrt vor: Wir geben Wunschl¨ osungen u ¯, y¯ und den zugeh¨origen adjungierten Zustand p einfach vor. Dann werden die Zustandsgleichung und das zu minimierende Funktional so angepasst, dass diese drei festgelegten Funktionen das System der notwendigen Optimalit¨ atsbedingungen erf¨ ullen.
2.9.1 Bang-Bang-Steuerung Bang-Bang-Steuerungen ergeben sich unter gewissen Voraussetzungen, wenn der Regularisierungsparameter λ vor u2 verschwindet. Man bezeichnet damit Funktionen, die fast u assigen Menge annehmen. Im betrachteten ¨ berall nur Werte auf dem Rand der zul¨ Beispiel sind das die Werte 1 und −1. Eine solche Steuerung wird hier konstruiert. Wir behandeln das Problem min (y − yΩ )2 dx Ω
bei
−Δy y|Γ
= u + eΩ = 0
und den Beschr¨ ankungen −1 ≤ u(x) ≤ 1. Diese Aufgabe unterscheidet sich von dem in Abschnitt 2.8.2 diskutierten Problem der optimalen station¨ aren Temperaturquelle durch den Term eΩ in der Zustandsgleichung. Es ist jedoch leicht zu u ¨berlegen, dass dieser Ausdruck die adjungierte Gleichung (2.50) ¨ sowie die Variationsungleichung (2.51) nicht beeinflusst; Ubungsaufgabe 2.16. Als Grundgebiet w¨ ahlen wir wieder das Einheitsquadrat Ω = (0, 1)2 und w¨ unschen uns eine Schachbrettfunktion“ u¯ als optimale L¨ osung. Dazu wird das Einheitsquadrat wie ” ein Schachbrett in 8 × 8 = 64 Teilgebiete unterteilt, in denen die optimale Steuerung u¯ abwechselnd gleich 1 und −1 sein soll. Nach der notwendigen Optimalit¨ atsbedingung (2.57) und wegen ua = −1, ub = 1 ist u ¯ genau dann optimal, wenn die Vorzeichenbedingung u ¯(x) = − sign p(x) fast u ullt ist; dabei haben wir sign(0) := [−1, 1] gesetzt. Es liegt auf der ¨ berall in Ω erf¨ Hand, dass ein zum Schachbrettmuster passender adjungierter Zustand durch p(x) = p(x1 , x2 ) = −
1 sin(8 π x1 ) sin(8 π x2 ) 128 π 2
ucke. Die Steuerung u ¯ hat gegeben ist. Der Faktor 1/128 π 2 vereinfacht weitere Ausdr¨ im linken unteren Feld von Ω den Wert 1 und wechselt dann dem Schachbrettmuster entsprechend das Vorzeichen. F¨ ur y¯ w¨ ahlen wir die Funktion y¯(x) = sin(π x1 ) sin(π x2 ), die homogene Randwerte hat. Sie gen¨ ugt der Poissongleichung −Δ¯ y = 2π 2 y¯ = 2π 2 sin(π x1 ) sin(π x2 ).
2.9 Konstruktion von Testaufgaben
65
Damit die Zustandgleichung von y¯ gel¨ ost wird, muss −Δ¯ y=u ¯ + eΩ gelten, also eΩ = −Δ¯ y−u ¯ = 2π 2 sin(π x1 ) sin(π x2 ) + sign − sin(8 π x1 ) sin(8 π x2 ) gew¨ ahlt werden. Der adjungierte Zustand erf¨ ullt entsprechend Δp(x) = 2 (8 π)2 sin(8 π x1 ) sin(8 π x2 )
1 = sin(8 π x1 ) sin(8 π x2 ). 128 π 2
Er muss der Gleichung −Δp p|Γ
= y¯ − yΩ = 0
gen¨ ugen. Dazu passt yΩ = y¯ + Δp, also yΩ (x) = sin(π x1 ) sin(π x2 ) + sin(8 π x1 ) sin(8 π x2 ).
2.9.2 Verteilte Steuerung und Neumann-Randbedingung Wir betrachten die Aufgabe mit homogener Neumann-Randbedingung ∂ν y = 0, 1 1 min J(y, u) := (y − yΩ )2 dx + eΓ y ds + u2 dx 2 Ω 2 Ω Γ
(2.79)
bei −Δy + y ∂ν y
= u + eΩ = 0
und den Beschr¨ ankungen 0 ≤ u(x) ≤ 1. Als Grundgebiet w¨ ahlen wir der Einfachheit halber wieder das Einheitsquadrat Ω = (0, 1)2 mit Mittelpunkt xˆ = (0.5, 0.5) . Die festen Funktionen yΩ , eΩ und eΓ werden so angepasst, dass sich eine gew¨ unschte L¨ osung der Aufgabe einstellt. Im Weiteren wird r = |x− x ˆ| = (x1 − 0.5)2 + (x2 − 0.5)2 gesetzt. Ziel der Konstruktion ist es, die in der Abbildung dargestellte Funktion ⎧ f¨ ur r > 13 ⎪ ⎨ 1 12 r 2 − 13 f¨ ur r ∈ [ 16 , 13 ] u ¯(x) = ⎪ ⎩ 0 f¨ ur r < 16 als optimale Steuerung zu erhalten, kurz
u ¯(x) = min 1 , max{0 , 12 r 2 − 1/3} .
(2.80)
Mit dem adjungierten Zustand p als L¨ osung der Gleichung −Δp + p ∂ν p
= y¯ − yΩ = eΓ
(2.81)
66
2 Linear-quadratische elliptische Probleme
muss u ¯ der Projektionsformel
u ¯(x) = IP[0,1] − p(x)
¨ in Ω gen¨ ugen, Ubungsaufgabe 2.17. Wir legen deshalb als adjungierten Zustand p(x) = −12 |x − x ˆ|2 +
1 1 = −12 r 2 + 3 3
fest. Der Graph von −p ist ein Rotationsparaboloid, das durch die Ebenen p = 0 bzw. p = 1 so abgeschnitten wird, dass die obige Steuerung u ¯ entsteht. Steuerung und adjungierter Zustand sind bereits festgelegt. Als N¨ achstes definieren wir den Zustand y¯, der zu u ¯ geh¨ oren soll. Dessen Normalenableitung muss auf Γ verschwinden. Wir machen es uns einfach durch die Festsetzung y¯(x) ≡ 1. Damit diese Funktion die Zustandsgleichung erf¨ ullt, wird zum Ausgleich die Funktion eΩ = eΩ (x) gebraucht. Wegen Δ¯ y = 0 muss eΩ = 1 − u ¯ definiert werden, also legen wir nach Einsetzen des Ausdrucks (2.80) f¨ ur u ¯
eΩ = 1 − min 1, max{0, 12 r 2 − 13 } fest. Nun sind noch yΩ und eΓ frei, um die adjungierte Gleichung (2.81) an den adjungierten Zustand anzupassen. Die Anwendung des Laplace-Operators auf p ergibt Δp = D12 p + D22 p = −12 {2 + 2} = −48, also wegen yΩ = y¯ + Δp − p, yΩ (x) = 1 − 48 −
1 142 + 12 |x − x ˆ|2 = − + 12 r 2 . 3 3
Einen Haken hat die Sache noch, die Randbedingung von p. Wir brauchen einen adjungierten Zustand, welcher die gew¨ unschte Form der optimalen Steuerung liefert, der die adjungierte Gleichung und gleichzeitig eine homogene Randbedingung erf¨ ullt. Dazu steht das Randintegral im Zielfunktional. Es sichert die Randbedingung der adjungierten Gleichung und eΓ muss der Beziehung ∂ν p = eΓ gen¨ ugen. Wir finden D1 p = −24 (x1 − 0.5), D2 p = −24 (x2 − 0.5).
Konstruierte Steuerung
Damit ergibt sich z.B. am linken Rand x1 = 0 ∂ν p = −D1 p |x1 =0 = 24 (0 − 0.5) = −12. Den gleichen Wert erh¨ alt man auf den anderen Randst¨ ucken, also eΓ (x) = ∂ν p(x) ≡ −12.
2.10 Das formale Lagrangeprinzip
67
2.10 Das formale Lagrangeprinzip Im vorangegangenen Abschnitt haben wir die konkrete Form der adjungierten Gleichung mehr oder weniger intuitiv festgelegt. Die Gleichung kann aber mit Hilfe einer Lagrangefunktion leicht bestimmt werden. Bei der Behandlung des endlichdimensionalen Falls in Abschnitt 1.4 ergab sich die adjungierte Gleichung aus Dy L, der Ableitung der Lagrangefunktion nach y. Das sollte auch hier m¨ oglich sein, wir ben¨otigen nur den richtigen Formalismus. Notwendige Optimalit¨ atsbedingungen kann man im Funktionenraum direkt aus der Karush-Kuhn-Tucker-Theorie f¨ ur Optimierungsaufgaben in Banachr¨aumen herleiten. Auf diese Methode, man k¨ onnte sie exakte Lagrangetechnik nennen, geht Kapitel 6 ein. Ihre Anwendung ist oft schwierig, weil dazu einige Erfahrung mit der Abstimmung von Operatoren, Funktionalen und passenden R¨ aumen erforderlich ist: Die gegebenen Gr¨oßen m¨ ussen in den ausgew¨ ahlten R¨ aumen differenzierbar sein, gewisse adjungierte Operatoren sind zu bestimmen und die Lagrangeschen Multiplikatoren sollen im richtigen Raum existieren. Anwendungsbeispiele dieser Methode werden in den Abschnitten 2.13, 6.1.3 und 6.2 diskutiert. Wir sind bisher anders vorgegangen, indem wir den Zustand y durch die SteuerungsZustands-Abbildung G mit y = G(u) eliminiert haben. Daraus wurde eine Variationsungleichung hergeleitet und durch Einf¨ uhrung eines adjungierten Zustands p vereinfacht. Der adjungierte Zustand ist der Lagrangesche Multiplikator zur partiellen Differentialgleichung nebst Randbedingungen, wenn man das wie in Abschnitt 2.13 oder 6.1.3 definiert. Diese Methode ist ¨ aquivalent zur Anwendung der allgemeinen Karush-KuhnTucker-Theorie, denn eigentlich beweist man so jedesmal eine Regel der Lagrangeschen Multiplikatoren. Aber die Anwendung von Karush-Kuhn-Tucker-S¨atzen kann durch die dazu notwendigen R¨ aume recht kompliziert sein. Diese Bemerkungen bezogen sich auf den Beweis von Optimalit¨atsbedingungen. Eine andere Sache ist deren Aufstellung (z.B. das Bestimmen der adjungierten Gleichung bei komplexeren Problemen) sowie eine m¨ oglichst einpr¨agsame Form der Bedingungen. Dazu eignet sich besonders gut die formale Lagrangetechnik, die wir hier einf¨ uhren. Vom Grundgedanken her ist sie nichts anderes als das (exakte) Lagrangeprinzip, das zum Beispiel in Ioffe und Tichomirov [112] oder Luenberger [147] beschrieben und in Kapitel 6 behandelt wird, insbesondere bei einer Aufgabe mit semilinearer elliptischer Gleichung in Abschnitt 6.1.3. Das formale Lagrangeprinzip unterscheidet sich vom exakten dadurch, dass Differentialoperatoren wie −Δ oder ∂ν formal hingeschrieben und alle Multiplikatoren als Funktionen betrachtet werden, ohne zugeh¨ orige R¨ aume zu spezifizieren. Man nimmt einfach an, dass der Zustand y, die verwendeten Multiplikatoren sowie ihre Ableitungen quadratisch integrierbare Funktionen sind. So umgeht man Funktionale aus allgemeineren Dualr¨aumen und schreibt L2 -Skalarprodukte auf. Obwohl in gewissem Sinne gerechtfertigt, ist die Methode nicht bis ins Detail stichhaltig. Bei ihrer Anwendung geht es uns aber nicht prim¨ar um einen sauberen Beweis, sondern um ein Handwerkszeug zur Ermittlung und zum Aufschreiben der richtigen Optimalit¨atsbedingungen. Sind diese einmal bestimmt, dann ist es nicht so wichtig, auf welche Weise wir sie gefunden haben. Bei sehr komplexen Aufgabenstellungen mit nichtlinearen Systemen von partiellen Differentialgleichungen ist diese Verfahrensweise besonders
68
2 Linear-quadratische elliptische Probleme
hilfreich. Zur Einf¨ uhrung der Technik eignet sich recht gut das Problem der optimalen station¨aren Randtemperatur. Bei der Aufgabe der station¨aren Temperaturquelle kann man die adjungierte Gleichung zu leicht erraten. Wir untersuchen deshalb noch einmal das Problem (2.32)–(2.34), 1 λ min J(y, u) := y − yΩ 2L2 (Ω) + u2L2 (Γ) 2 2 bei −Δy ∂ν y + αy
= 0 = αu
in Ω auf Γ
ua (x) ≤ u(x) ≤ ub (x) f.¨ u. auf Γ. Es sind drei Nebenbedingungen gegeben, zwei komplizierte“ differentielle (die Gleichung ” nebst Randbedingung) und eine harmlose (die punktweise Restriktion u ∈ Uad ). Nun wenden wir das Lagrangeprinzip an und eliminieren nur die Gleichungen durch Lagrangesche Multiplikatoren p1 , p2 . Wir definieren dazu, noch etwas formal, die Lagrangefunktion ∂ν y − α(u − y) p2 ds L = L(y, u, p) = J(y, u) − (−Δy) p1 dx − Ω
Γ
mit auf Ω bzw. Γ definierten Funktionen p1 , p2 , den Lagrangeschen Multiplikatoren, die wir in L mit p := (p1 , p2 ) zusammenfassen. Diese Definition von L enth¨ alt drei mathematische Unsauberkeiten: Wir wissen bisher nur y ∈ H 1 (Ω), also ist Δy nicht notwendig eine Funktion. Ebenso ist ∂ν y nicht notwendig als Funktion definiert. Wir k¨ onnen ohne zus¨ atzliche Kenntnisse u ¨ ber h¨ohere Regularit¨at von ∗ y nur Δy ∈ H 1 (Ω) , ∂ν y ∈ H −1/2 (Γ) erwarten (zur Definition von H −1/2 (Γ) siehe Lions und Magenes [145]). Deshalb sind die Integrale nicht notwendig definiert. Schließlich w¨are zu kl¨ aren, welche Regularit¨ at p1 , p2 haben. Trotzdem lassen wir uns nicht beirren, nehmen einfach hinreichende Glattheit von p1 , p2 an und benutzen die zweite Greensche Formel zur partiellen Integration. Der K¨ urze halber verzichten wir auf die Differentiale unter den Integralen, L(y, u, p) = J(y, u) + p1 ∂ν y − y ∂ν p1 + ∂ν y − α (u − y) p2 . y Δp1 − Γ
Γ
Ω
Γ
Wir erwarten nach dem Lagrangeprinzip, dass das Paar (¯ y, u ¯) mit Lagrangeschen Multiplikatoren p1 , p2 die notwendigen Optimalit¨ atsbedingungen der Aufgabe min L(y, u, p),
y frei, u ∈ Uad
erf¨ ullt. Da jetzt y formal keinen Restriktionen mehr unterworfen ist, muss die Ableitung von L nach y an der optimalen Stelle verschwinden, d.h. Dy L(¯ y, u ¯, p) h = 0
∀ h ∈ Y = H 1 (Ω).
Aus den Box-Restriktionen an u folgt y, u ¯, p)(u − u ¯) ≥ 0 Du L(¯
∀ u ∈ Uad .
2.10 Das formale Lagrangeprinzip
69
F¨ ur Dy L(¯ y, u ¯, p) ergibt sich Dy L(¯ p1 − p2 ) ∂ν h ds (¯ y − yΩ ) + Δp1 h dx + y, u ¯, p) h = Γ Ω ∂ν p1 + α p2 h ds = 0. −
∀ h ∈ Y. (2.82)
Γ
Bei der Berechnung der Ableitung wurde die bereits erw¨ahnte Merkregel angewendet, dass die Ableitung einer linearen Abbildung mit dieser Abbildung identisch ist. Wir w¨ ahlen zun¨ achst h aus C0∞ (Ω) und damit h = ∂ν h = 0 auf Γ. Mit (2.82) folgt (¯ y − yΩ ) + Δp1 h dx = 0 ∀ h ∈ C0∞ (Ω). Ω
Weil
C0∞ (Ω)
2
in L (Ω) dicht liegt, ergibt sich −Δp1 = y¯ − yΩ
in Ω.
Das ist bereits die erste H¨ alfte des vorher nur erratenen adjungierten Systems. Nun verlangen wir nur h|Γ = 0 und variieren ∂ν h (vgl. Bemerkung (iii) auf der n¨achsten Seite). Die mit der Laplace-Gleichung verbundenen Ausdr¨ ucke sind in (2.82) bereits weggefallen. Jetzt folgt (p1 − p2 ) ∂ν h ds = 0 Γ
f¨ ur alle so gew¨ ahlten h und deshalb p1 = p2 auf Γ. Schließlich variieren wir h auf Γ und betrachten den einzigen in (2.82) verbliebenen Term 0=− ∂ν p1 + α p2 h ds = − ∂ν p1 + α p1 h ds. Γ
Γ
Aus der Beliebigkeit von h auf Γ (vgl. Bemerkung (iii) unten) folgt schließlich ∂ν p1 + αp1 = 0 auf Γ. Setzen wir p := p1 und dann p2 := p|Γ , so haben wir die beim Problem der optimalen station¨ aren Randtemperatur intuitiv eingef¨ uhrte adjungierte Gleichung gefunden. Ebenso einfach folgt die Variationsungleichung aus Du L(¯ y, u ¯, p) (u − u ¯) = λu ¯ (u − u ¯) ds + α p (u − u ¯) ds ≥ 0. Γ
Γ
Nun definieren wir die Lagrangefunktion anders, so dass alle Terme sauber erkl¨art sind: ur die Definition. Die Lagrangefunktion L : H 1 (Ω) × L2 (Γ) × H 1 (Ω) → IR wird f¨ Aufgabe (2.32)–(2.34) definiert durch L(y, u, p) := J(y, u) − ∇y · ∇p dx + α (u − y) p ds. (2.83) Ω
Γ
Diese Form entsteht durch einmalige partielle Integration aus der ersten, nur formal richtigen Definition von L. Die ∂ν y enthaltenden Terme heben sich gegenseitig auf. Dann ¨ u ¨berzeugt man sich leicht von folgenden Aquivalenzen: y, u ¯, p) h = 0 ∀ h ∈ H 1 (Ω) Dy L(¯
⇔ schwache Formulierung von (2.73)
Du L(¯ y, u ¯, p) (u − u ¯) ≥ 0 ∀ u ∈ Uad
⇔
Variationsungleichung (2.76).
70
2 Linear-quadratische elliptische Probleme
Folgerung. Durch Verwendung der zuletzt eingef¨ uhrten Lagrangefunktion erh¨alt man die in Abschnitt 2.8.4 bewiesenen Optimalit¨atsbedingungen. Die adjungierte Gleichung ergibt sich durch Ableitung nach dem Zustand y, die Variationsungleichung durch Ableitung nach der Steuerung u. Obwohl L jetzt durch (2.83) sauber definiert ist, bleibt eine Frage offen. Woher wissen wir, dass ein solches p in H 1 (Ω) existiert? Wir haben diese Klippe im letzten Abschnitt dadurch umschifft, dass wir p direkt als L¨ osung der adjungierten Gleichung definiert haben. Unsere obige Methode sollte nur dazu dienen, die richtige adjungierte Gleichung zu ermitteln. Die Existenz von p als Lagrangeschem Multiplikator folgt aber auch direkt aus der Karush-Kuhn-Tucker-Theorie im Banachraum, siehe Abschnitt 2.13. Bemerkungen. (i) Geht man bei der obigen Herleitung von Anfang an davon aus, dass die
ubrigt sich die zweiLagrangeschen Multiplikatoren p1 und p2 auf dem Rand gleich sind, dann er¨ uhrt. Es reicht eine partielle Integration malige partielle Integration, die auf den Term −Δp1 f¨ und man liest die Variationsformulierung f¨ ur die adjungierte Gleichung sofort ab, vgl. die Argumentation im n¨ achsten Abschnitt. Diese vereinfachte Variante f¨ uhrt aber nicht immer zum Ziel, ¨ beispielsweise nicht bei Dirichlet-Randsteuerung, vgl. Ubungsaufgabe 2.19 auf S. 94. (ii) Der Gradient von f (u) = J(y(u), u) ergibt sich durch f (u) = Du L(y, u, p), wenn y = y(u) und p = p(u) gew¨ ahlt werden. Man kann sich also merken, dass dieser reduzierte Gradient durch Ableitung der Lagrangefunktion nach der Steuerung berechnet wird. (iii) Die weitgehende Beliebigkeit von ∂ν h auf Γ f¨ ur h mit h|Γ = 0 folgt aus der Surjektivit¨ at der Abbildung h → (τ h, ∂ν h) von H 2 (Ω) auf H 3/2 (Γ) × H 1/2 (Γ), [2], Thm. 7.53. Die Beliebigkeit von h ist eine Folgerung aus der Surjektivit¨ at der Abbildung τ : H 1 (Ω) → H 1/2 (Γ).
Die Anwendung der Lagrangefunktion wurde f¨ ur die Aufgabe (2.32)–(2.34) vorgef¨ uhrt. Andere Probleme k¨ onnen a hnlich behandelt werden. Schließlich kann man auch die Un¨ gleichungsrestriktionen an die Steuerfunktion eliminieren und mit weiteren Lagrangeschen Multiplikatoren μa , μb in die Lagrangefunktion aufnehmen. Das wurde bereits in Abschnitt 1.4.7 gezeigt. Die Lagrangefunktion (2.83) ist dann wie folgt zu erweitern: L(y, u, p, μa , μb ) := J(y, u) − ∇y · ∇p dx + α (u − y) p ds Ω Γ (2.84) μa (ua − u) + μb (u − ub ) dx. + Γ
Die in diesem Abschnitt beschriebene formale Lagrange-Methode wird uns noch mehrmals gute Dienste leisten, um adjungierte Gleichungen zu bestimmen. Lagrangefunktionen der Form (2.83) oder (2.84) sind das passende Vehikel, um notwendige Optimalit¨ atsbedingungen elegant (und exakt) aufzuschreiben. Wir werden sie auch dazu nutzen, hinreichende Optimalit¨ atsbedingungen zweiter Ordnung (wiederum exakt) in einer einpr¨ agsamen Form darzustellen, die auch in der endlichdimensionalen Optimierung und bei der Formulierung numerischer Methoden u ¨ blich ist.
2.11 Weitere Beispiele *
71
2.11 Weitere Beispiele * 2.11.1 Differentialoperator in Divergenzform In gleicher Weise kann man die allgemeinere Aufgabe (2.36)–(2.38) auf S. 43 mit der Lagrangetechnik diskutieren: min J(y, u, v) :=
λΩ λΓ λv λu y − yΩ 2L2 (Ω) + y − yΓ 2L2 (Γ) + v2L2 (Ω) + u2L2 (Γ1 ) 2 2 2 2
bei A y + c0 y ∂νA y + α y y sowie
= βΩ v = βΓ u = 0
in Ω auf Γ1 auf Γ0
va (x) ≤ v(x) ≤ vb (x) f.¨ u. in Ω ua (x) ≤ u(x) ≤ ub (x) f.¨ u. auf Γ1 .
Da y auf Γ0 verschwindet und deshalb dort fixiert ist, wird bei der Minimierung des Randterms der Zielfunktion nur der Anteil auf Γ1 wirksam. Die Voraussetzung 2.19 von S. 43 sei erf¨ ullt. Als Zustandsraum wird gew¨ ahlt
Y = {y ∈ H 1 (Ω) y|Γ0 = 0}. Die Optimalit¨ atsbedingungen leiten wir wie in Abschnitt 2.8.4 her. Zuerst wird mit Hilfe der Lagrangetechnik die Form der adjungierten Gleichung bestimmt. Die Lagrangefunktion kann durch L(y, u, v, p) = J(y, u, v) − A y + c0 y − βΩ v p dx − ∂νA y + α y − βΓ u p ds, Γ1
Ω
ucksichtigt ist. definiert werden, weil die Randbedingung y|Γ0 = 0 schon im Raum Y ber¨ Außerdem vereinfachen wir die Herleitung etwas, indem wir stillschweigend annehmen, dass der Multiplikator p im Randintegral gerade der Randwert des Multiplikators p des Gebietsintegrals ist. Das ergibt sich hier wie in Abschnitt 2.10. Ansonsten h¨atten wir auch wieder verschiedene Multiplikatoren p1 und p2 w¨ahlen k¨onnen. Nach partieller Integration folgt mit der in (2.22) auf S. 30 definierten Bilinearform a Dy L(¯ y, u ¯, v¯, p) h = λΩ (¯ y − yΩ ) h dx + λΓ (¯ y − yΓ ) h ds − a[h, p] = 0 ∀ h ∈ Y. Ω
Γ
Es ist jetzt nicht mehr n¨ otig, weiter partiell zu integrieren, um den Differentialoperator zweiter Ordnung auf p zu u ¨bertragen. Die eben erhaltene Beziehung ist die Variationsformulierung f¨ ur die schwache L¨ osung der adjungierten Gleichung A p + c0 p ∂νA p + α p p
= λΩ (¯ y − yΩ ) = λΓ (¯ y − yΓ ) = 0
in Ω auf Γ1 auf Γ0 ,
(2.85)
72
2 Linear-quadratische elliptische Probleme
Bemerkung. Die vom Operator A geforderte Symmetriebedingung wird f¨ur die eindeutige L¨ osbarkeit der Zustandsgleichung und f¨ ur die Optimalit¨ atsbedingungen nicht ben¨ otigt. Ohne diese Forderung ist in der adjungierten Gleichung A durch den zu A (formal) adjungierten Differentialoperator A∗ zu ersetzen, der durch A∗ p(x) = −
N X
´ ` Dj aij (x) Di y(x) .
i,j=1
definiert ist. Die Symmetriebedingung wird sp¨ ater f¨ ur gewisse Regularit¨ atsresultate gebraucht, und wurde deshalb generell vorausgesetzt.
Die formale Lagrangetechnik gibt uns den Hinweis, die adjungierte Gleichung gerade so einzuf¨ uhren. Nach Satz 2.7 auf S. 30 existiert genau eine L¨osung p dieser Gleichung in Y , also genau ein adjungierter Zustand zu y¯. Durch Anwendung einer Verallgemeinerung des Lemmas 2.31 von S. 59 zur Bestimmung von S ∗ k¨onnen die notwendigen Optimalit¨ats¨ bedingungen erster Ordnung hergeleitet werden, Ubungsaufgabe 2.18. An Stelle dieser exakten Herleitung verlassen wir uns noch einmal auf die Lagrangetechnik und schreiben die Variationsungleichungen auf, Dv L(¯ y, u ¯, v¯, p)(v − v¯) = (λv v¯ + βΩ p)(v − v¯) dx ≥ 0 ∀ v ∈ Vad Ω Du L(¯ y, u ¯, v¯, p)(u − u ¯) = (λu u ¯ + βΓ p)(u − u ¯) ds ≥ 0 ∀ u ∈ Uad . Γ1
Insgesamt ergeben sich die folgenden notwendigen und hinreichenden Optimalit¨atsbedingungen erster Ordnung: Satz 2.34 Unter Voraussetzung 2.19 sind die Steuerungen v¯ ∈ Vad und u ¯ ∈ Uad genau dann optimal mit zugeh¨origem optimalen Zustand y¯ ∈ Y , wenn mit dem durch (2.85) definierten adjungierten Zustand p ∈ Y die Variationsungleichungen (λv v¯ + βΩ p , v − v¯)L2 (Ω) (λu u ¯ + βΓ p , u − u ¯)L2 (Γ1 )
≥ 0 ≥ 0
∀ v ∈ Vad ∀ u ∈ Uad
erf¨ ullt sind.
2.11.2 Optimale station¨ are Temperaturquelle mit vorgegebener Außentemperatur Dieses auf S. 4 erw¨ ahnte Problem ist ein Spezialfall der obigen allgemeinen Aufgabe mit A := −Δ, c := 0, βΓ := α, βΩ := β und ua = ub = ya . Die Randsteuerung wird so durch ya fixiert. Das Zielfunktional ist sogar allgemeiner und kann durch die Wahl λΓ = λu = 0, λΩ = 1 auf die in Abschnitt 1.2.1 diskutierte Form gebracht werden. Hier spielt die Steuerfunktion v die Rolle von u. Die notwendigen Optimalit¨atsbedingungen folgen direkt aus Satz 2.34.
2.12 Numerische Verfahren In diesem Abschnitt skizzieren wir Grundkonzepte der numerischen L¨osung linear-quadratischer elliptischer Aufgaben. Hier und in anderen Abschnitten zu numerischen Verfahren
2.12 Numerische Verfahren
73
soll der Leser einen Eindruck davon erhalten, wie man prinzipiell an die L¨osung der Optimalsteuerungsprobleme herangehen kann. Die Numerik der Optimalsteuerung partieller Differentialgleichungen ist bereits gut ausgebaut. Es existiert eine Reihe guter numerischer Verfahren, mit denen auch komplexe Probleme erfolgreich gel¨ost werden k¨onnen. Eine auch nur halbwegs vollst¨ andige Darstellung entsprechender Methoden w¨ urde den beabsichtigten Rahmen dieses Buches sprengen. Dazu gibt es zahlreiche Ver¨offentlichungen in der Fachliteratur, insbesondere die Monographien Betts [30], Gruver und Sachs [90], Hinze et al. [108], Kelley [120], Ito und Kunisch [115]. Meist ignorieren wir die Notwendigkeit einer Diskretisierung der Aufgaben, indem wir stillschweigend annehmen, dass die partiellen Differentialgleichungen exakt gel¨ost werden k¨ onnen. Nat¨ urlich muss eine detaillierte numerische Analysis die Diskretisierung der Gleichungen durch Differenzenverfahren oder Methoden der finiten Elemente mit einbeziehen. Die optimierungstheoretischen Aspekte der Verfahren lassen sich aber klarer ohne diese Details darstellen. In den Abschnitten 2.12.3 und 2.12.4 wird jedoch die Anwendung des Differenzenverfahrens bzw. der Finite-Elemente-Methode (FEM) kurz erl¨autert. Wir beginnen mit Gradientenverfahren, die aus historischer Sicht zu den ersten Techniken geh¨ort haben, mit denen Steuerungsprobleme bei partiellen Differentialgleichungen gel¨ost wurden. Diese Verfahren sind langsam, aber einfach zu implementieren. Daher eignen ¨ sie sich gut zu Ubungszwecken und ersten Testrechnungen. Außerdem sind sie bei sehr komplexen oder hoch nichtlinearen Aufgaben oft das Mittel der Wahl. ¨ Danach behandeln wir die direkte Uberf¨ uhrung in ein endlichdimensionales Optimierungsproblem durch Anwendung der Differenzenmethode sowie die Aufstellung des reduzierten Optimalsteuerungsproblems, die sich in gewissen F¨allen lohnen kann. Schließlich wird die Grundidee der primal-dualen Aktive-Mengen-Strategie besprochen, die derzeit zu den leistungsst¨arksten und g¨ angigsten numerischen L¨osungsverfahren geh¨ort.
2.12.1 Bedingtes Gradientenverfahren Wir erw¨ ahnen das bedingte Gradientenverfahrens vor allem aus methodischen Gr¨ unden, weil es sch¨ on die Anwendung notwendiger Optimalit¨atsbedingungen zur Konstruktion ¨ eines numerischen Verfahrens verdeutlicht. Außerdem l¨asst es sich zu Ubungszwecken leicht programmieren. Die Theorie dieses i.a. linear konvergenten Verfahrens wird durch Gruver und Sachs [90] behandelt. Im allgemeinen konvergiert das Gradienten-Projektionsverfahren aber schneller.
Das bedingte Gradientenverfahren im Hilbertraum Wir formulieren das bedingte Gradientenverfahren zuerst allgemein f¨ ur ein Optimierungsproblem im Hilbertraum U , min f (u),
u∈Uad
bei dem f : U → IR ein Gˆateaux-differenzierbares Funktional und Uad ⊂ U eine nichtleere, beschr¨ ankte, konvexe und abgeschlossene Menge sein sollen. Die Iterierten u1 , . . . , un sei bereits bestimmt, so dass un die aktuelle L¨osung ist. Dann sind folgende Schritte durchzuf¨ uhren:
74
2 Linear-quadratische elliptische Probleme
S1 (Richtungssuche) Bestimme eine Richtung vn als L¨osung der Optimierungsaufgabe im Hilbertraum, f (un ) vn = min f (un ) v. v∈Uad
Wegen der Voraussetzungen an Uad ist diese in Bezug auf das Zielfunktional lineare Aufgabe l¨ osbar. Gilt f (un )(vn − un ) ≥ 0, dann erf¨ ullt un die Variationsungleichung (warum?) und wir haben mit un eine L¨ osung gefunden. Das Verfahren wird beendet. Anderenfalls gilt f (un )(vn − un ) < 0, also ist vn − un eine Abstiegsrichtung. S2
(Schrittweitenbestimmung) Finde sn ∈ (0, 1] aus f un + sn (vn − un ) = min f un + s (vn − un ) s∈(0,1]
und setze un+1 := un + sn (vn − un ); n := n + 1, gehe zu S1.
∞ Im konvexen Fall konvergiert die Folge der Funktionswerte f (un ) n=1 monoton fallend gegen den Optimalwert (Abstiegsverfahren). Man beachte, dass mit un und vn auch die konvexe Linearkombination un + sn (vn − un ) zu Uad geh¨ort. Das ist eine wesentliche Grundlage f¨ ur dieses Verfahren. Anwendung auf elliptische Steuerprobleme Als Anwendung des bedingten Gradientenverfahrens diskutieren wir das Problem der optimalen station¨ aren Temperaturquelle: min J(y, u) :=
1 λ y − yΩ 2L2 (Ω) + u2L2 (Ω) 2 2
(2.86)
−Δy y|Γ
(2.87)
= βu = 0
ua (x) ≤ u(x) ≤ ub (x).
(2.88)
Der Raum f¨ ur die Steuerungen ist U = L2 (Ω), Uad definieren wir wie bisher durch die gegebenen Box-Restriktionen (2.88) an u und die reduzierte Zielfunktion f ist erkl¨art durch f (u) = J y(u), u . Die Ableitung f (u) wurde in Lemma 2.30 auf S. 58 berechnet, f (un ) v = (β pn + λ un ) v dx, Ω
wobei pn die L¨ osung der adjungierten Gleichung −Δpn (pn )|Γ ist. Das Verfahren l¨ auft wie folgt ab:
= yn − yΩ = 0
(2.89)
2.12 Numerische Verfahren
75
S1
Bestimme yn zu un aus der Zustandsgleichung (2.87).
S2
Berechne pn aus der adjungierten Gleichung (2.89).
S3
(Richtungssuche) Berechne vn als L¨ osung der linearen Optimierungsaufgabe min (β pn + λun ) v dx. v∈Uad
Ω
Wenn vn in dieser linearen Aufgabe den gleichen Wert wie un liefert, dann bricht das Verfahren ab, vn ist optimal. Numerisch ist dieser Fall so gut wie ausgeschlossen. Man kann zum Beispiel abbrechen, wenn der genannte Wert f¨ ur vn nicht mindestens um ε > 0 kleiner als der f¨ ur un ist. S4
(Schrittweitenbestimmung) Bestimme die Schrittweite sn aus f un + sn (vn − un ) = min f un + s (vn − un ) . s ∈(0,1]
S5
Setze un+1 := un + sn (vn − un ), n := n + 1, und gehe zu S1.
Bemerkungen zur Umsetzung von S3, S4. Beide Schritte k¨onnen analytisch erledigt werden. S3:
Eine sinnvolle Richtung vn ist offenbar ⎧ ⎪ ⎨
ua (x), falls λ un (x) + β(x) pn (x) > 0 1 vn (x) := ⎪ 2 (ua + ub )(x), falls λ un (x) + β(x) pn (x) = 0 ⎩ ub (x), falls λ un (x) + β(x) pn (x) < 0. Der mittlere Fall wird numerisch kaum eintreten. S4:
Wir nutzen aus, dass f eine quadratische Zielfunktion ist.
2 2 1 λ f un + s (vn − un ) = yn + s (wn − yn ) − yΩ L2 (Ω) + un + s (vn − un )L2 (Ω) , 2 2 ande zu vn bzw. un sind. wobei yn = y(un ) bzw. wn = y(vn ) die Zust¨ Da es jetzt nur um die Abh¨ angigkeit von der Schrittweite s geht, setzen wir g(s) := f un + s (vn − un ) und erhalten durch einfaches Umformen g(s) =
1 s2 yn − yΩ 2 2 wn − yn 2 2 + s yn − yΩ , wn − yn L2 (Ω) + L L (Ω) (Ω) 2 2 λ λ 2 2 + un L2 (Ω) + λ s un , vn − un L2 (Ω) + s2 vn − un L2 (Ω) . 2 2
Die Funktion g = g(s) hat die Gestalt g(s) = g0 + g1 s + g2 s2 mit Konstanten gi , die vorher berechnet werden k¨ onnen. Damit l¨ asst sich die Aufgabe sn := arg min g(s) s∈(0,1]
auf dem Papier erledigen. Die L¨ osung ist die Projektion der Nullstelle von g (s) auf das Intervall [0, 1] und wird als exakte Schrittweite bezeichnet.
76
2 Linear-quadratische elliptische Probleme
Das bedingte Gradientenverfahren konvergiert anfangs schnell, dann recht langsam. Das ist charakteristisch f¨ ur Verfahren vom Gradiententyp. Jeder Schritt erfordert die L¨osung von zwei elliptischen Gleichungen. Die M¨ oglichkeit der analytischen Ausf¨ uhrung der Schritte S3 und S4 ist ein Vorteil des Verfahrens. Beim Gradienten-Projektionsverfahren ist die Bestimmung der Schrittweite komplizierter und kann weitere L¨osungen von Differentialgleichungen erfordern. Wie eingangs erw¨ ahnt wurde, kann das Verfahren nur in Verbindung mit einer Diskretisierung durchgef¨ uhrt werden. Die Steuerfunktion u ist zu diskretisieren, etwa durch Treppenfunktionen oder st¨ uckweise linear. Gleiches gilt f¨ ur den Zustand y. Die Durchf¨ uhrung der obigen Schritte ist auch mit Diskretisierung klar. Das Verfahren verlangt de facto nur die L¨ osung der elliptischen Gleichungen sowie Routinen zur Berechnung aller Integrale. Das bedingte Gradientenverfahren kann auch im Fall λ = 0 durchgef¨ uhrt werden.
2.12.2 Gradienten-Projektionsverfahren Man verwendet bei Entscheidung f¨ ur ein Gradientenverfahren besser das GradientenProjektionsverfahren. Wir diskutieren ein solches in Kapitel 3 f¨ ur parabolische Aufgaben. Deshalb erl¨ autern wir hier nur kurz die Unterschiede zum bedingten Gradientenverfahren: Als Abstiegsrichtung verwendet man in Schritt S3 den Antigradienten vn := −(β pn + λ un ). Um Zul¨ assigkeit zu garantieren, wird die Schrittweite sn durch f IP[ua ,ub ] (un + sn vn ) = min f IP[ua ,ub ] (un + s vn ) s>0
bestimmt. Sind keine Restriktionen f¨ ur die Steuerung vorgegeben, dann erh¨alt man die optimale Schrittweite aus f un + sn vn ) = min f (un + s vn ). s>0
Im zugrunde gelegten linear-quadratischen Fall kann sn als exakte Schrittweite leicht berechnet werden, vgl. S. 75. Die neue Steuerung ergibt sich aus un+1 := IP[ua ,ub ] (un + sn vn ), unabh¨ angig davon, wie sn berechnet worden ist. Bei Vorgabe von Restriktionen ist die Bestimmung der Schrittweite nicht trivial. Die exakte Schrittweite ist dann in der Regel nicht zu erhalten und man muss numerisch eine akzeptable Schrittweite finden. Man kann z.B. mit dem Halbierungsverfahren f¨ ur s arbeiten: Ausgehend von einer kleinen Anfangsschrittweite s0 , beispielsweise der letzten erfolgreichen Schrittweite, setzt man nacheinander s = s20 , s40 , s80 etc., bis zu s eine L¨osung gefunden ist, die gegen¨ uber f (un ) die Zielfunktion hinreichend verkleinert. Ansonsten wird nach einer endlichen Zahl von Verkleinerungen der Schrittweite abgebrochen. Sinnvoll kann auch die Anwendung der aus der nichtlinearen Optimierung bekannten Regel zur Schrittweitenbestimmung von Armijo sein, siehe z.B. Alt [7] oder Grossmann und Terno [88], Nocedal und Wright [169] oder Polak [172]. F¨ ur jede neue Schrittweite muss zur Funktionswertbestimmung eine partielle Differentialgleichung gel¨ ost werden und das ist in der Regel teuer. Manchmal zieht man es daher
2.12 Numerische Verfahren
77
sogar vor, mit einer festen, kleinen Schrittweite zu arbeiten und diese solange beizubehalten, wie ein hinreichender Abstieg erzielt wird. Sch¨ one Darstellungen des Gradienten-Projektionsverfahrens und seiner Konvergenzeigenschaften im endlichdimensionalen Raum findet man bei Gruver und Sachs [90], Kelley [120] sowie (mit geometrischer Veranschaulichung) in Nocedal und Wright [169]; im Hilbertraum wird es z.B. durch Hinze et al. [108] behandelt.
¨ 2.12.3 Uberf¨ uhrung in ein endlichdimensionales quadratisches Optimierungsproblem Aufstellen einer diskretisierten Aufgabe Zur numerischen Behandlung von Aufgabe (2.86)–(2.88) sind die partielle Differentialgleichung, die Zustandsfunktion y sowie die Steuerung u zu diskretisieren. Wenn das Ortsgebiet rechtwinklig berandet ist, dann l¨ asst sich die Diskretisierung der partiellen Differentialgleichung am einfachsten durch die Methode der finiten Differenzen bewerkstelligen. Diesen Weg wollen wir hier der Einfachheit halber gehen, auch wenn er aus Sicht der numerischen Analysis unbefriedigend ist. Optimale Steuerungen sind meist nicht so glatt, dass die Konvergenz der Methode der finiten Differenzen gesichert ist oder entsprechende Fehlerabsch¨ atzungen verf¨ ugbar sind. Deshalb wird in einschl¨agigen Arbeiten fast ausschließlich die Methode der finiten Elemente angewendet, deren deren Anwendung wir kurz in Abschnitt 2.12.4 behandeln. Die Differenzenmethode eignet sich aber gut zu ¨ Ubungszwecken, da sie sich schnell programmieren l¨asst. Wir betrachten das Problem der optimalen station¨aren Temperaturquelle (2.86)–(2.88) f¨ ur die Ortsdimension N = 2 im Einheitsquadrat Ω = (0, 1)2 . Dieses wird in n2 gleiche Quadrate zerlegt, ¯= Ω
n
¯ ij , Ω
Ωij =
i,j=1
i − 1 i j − 1 j , × , , n n n n
i, j = 1, . . . , n.
(2.90)
Damit verbunden ist ein Gitter mit der Feinheit h = 1/n und den Gitterpunkten i xij = h , i, j = 0, . . . , n. j Das Differenzenverfahren bestimmt N¨ aherungswerte yij f¨ ur die Werte y(xij ) des Zustands in den Gitterpunkten. Mit dem u ¨blichen 5-Punkte-Stern wird −Δy(xij ) in den inneren Gitterpunkten approximiert durch −Δy(xij ) ∼
4 yij − [y(i−1) j + yi (j−1) + y(i+1) j + yi (j+1) ] , h2
(2.91)
ˆ ij um Mitteli, j = 1 . . . n−1. Außerdem definieren wir offene achsenparallele Quadrate Ω punkte xij und Seitenl¨ ange h, wo wir die Steuerungsfunktion u als konstant annehmen, ˆ ij , i, j = 1, . . . , n−1. Auf dem verbleibenden Randbereich d.h. wir setzen u(x) ≡ uij auf Ω von Ω setzen wir u der Einfachheit halber null. Schließlich nummerieren wir die Werte yij , uij und xij durch (z.B. lexikographisch von der S¨ udwestecke von Ω bis zur Nordostecke) und erhalten so Vektoren y = (y1 , . . . , y(n−1)2 ) ,
78
2 Linear-quadratische elliptische Probleme
u = (u1 , . . . , u(n−1)2 ) und analog x der Dimension (n − 1)2 . Ferner setzen wir yΩ,i = yΩ (xi ), ua,i = ua (xi ), ub,i = ub (xi ) und fassen diese Komponenten in Vektoren ua , ub zusammen. Aus (2.91) entsteht nach Division des Zielfunktionals durch den Faktor h2 , der aus Integralen wie Ωˆ ij y(x) dx ≈ h2 yij resultiert, mit einer (n−1)2 ×(n−1)2 −Matrix Ah das folgende Problem: 2
(n−1) 1 min (yi − yΩ,i )2 + λ u2i 2 i=1
Ah y = Bh u,
ua ≤ u ≤ ub .
Die Matrix Bh ist eine Diagonalmatrix mit den Elementen bii = β(xi ). Bemerkung. Das Aufstellen einer diskre-
k
ˆ ik Ω Ω
tisierten Aufgabe ist analog mit der Methode der finiten Elemente m¨ oglich. Die Matrizen und das Zielfunktional haben dann eine andere Gestalt. Wir erl¨ autern dieses Verfahren im Zusammenhang mit der primal-dualen Aktive-Mengen-Strategie in Abschnitt 2.12.4.
j
Das so entstandene Optimierungsproblem mit Gleichungs- und Ungleichungsrestriktionen kann man nun in ein verf¨ ugbares numerisches L¨osungsverfahren f¨ ur quadratische Optimierungsaufgaben eingeben. In i Matlab steht dazu der Code quadprog Zerlegung von Ω zur Verf¨ ugung. Außerdem werden weitere Programme f¨ ur große Optimierungsaufgaben angeboten, die recht beachtliche Dimensionen verkraften. Eine Auswahl ist unter der Website von NEOS (NEOS Server for Optimization) zu finden. Elliptische Aufgaben in zweidimensionalen Ortsgebieten bereiten kaum Schwierigkeiten, wie die Ergebnisse von Maurer und Mittelmann [157], [158] zu semilinearen elliptischen Aufgaben mit Steuerungs- und Zustandsbeschr¨ ankungen zeigen. Ωij
Bei dieser Methode, die auch discretize then optimize“ genannt wird, sind y und u ” gleichberechtigte Variablen, die Verschiedenheit ihrer Rollen als Zustand und Steuerung wird nicht ausgenutzt. Im n¨ achsten Teilabschnitt erl¨autern wir kurz die Aufstellung eines auf u reduzierten Problems. Es ist von niedrigerer Dimension, so dass Verfahren der quadratischen Optimierung geringere Speicherprobleme haben. Diese Methode ist durchf¨ uhrbar, wenn nur die partielle Differentialgleichung vom Rechner bew¨altigt wird.
Aufstellen einer reduzierten Optimierungsaufgabe Ist die Steuerungsfunktion als Linearkombination relativ weniger Ansatzfunktionen darstellbar, dann ist das Aufstellen einer auf u reduzierten quadratischen Optimierungsaufgabe sinnvoll, die mit verf¨ ugbaren Methoden gel¨ost wird. Die Ansatzfunktionen k¨onnen (wie unten beschrieben) aus einer Diskretisierung resultieren, sie k¨onnen aber auch durch
2.12 Numerische Verfahren
79
die konkrete Anwendung fest vorgegeben sein. Die Steuerfunktion u habe also die Form u(x) =
m
ui ei (x).
(2.92)
i=1
mit endlich vielen gegebenen Funktionen ei : Ω → IR und variablen reellen Zahlen ui . Außerdem seien die Beschr¨ ankungen an die Steuerfunktion u entweder ¨aquivalent zu ua ≤ ui ≤ ub , i = 1, . . . , m, mit gegebenen reellen Zahlen ua < ub oder aber von vornherein in dieser Form gegeben. Beispiel. Im Zusammenhang mit der Zerlegung (2.90) seien die Ansatzfunktionen ij (x) durch j ij (x) =
1 0
x ∈ Ωij sonst
definiert. Ihr Wert auf den R¨ andern zwischen den Teilgebieten ist ohne Belang, weil diese das Maß null haben. Diese Funktionen werden von 1 bis m = n2 durchnummeriert, e1 = 11 , . . . , en = 1n , en+1 = 21 , . . . , em = nn . Es entsteht eine Treppenfunktion u. Zu beachten ist, dass wir ahrend wir im letzten hier die Steuerung auf den Teilgebieten Ωij als konstant annehmen, w¨ ˆ ij benutzt haben. Das lag an der Verwendung des DifferenTeilabschnitt dazu die Hilfsgebiete Ω zenverfahrens zur L¨ osung der Differentialgleichung.
Der Einfachheit halber nehmen wir dazu wieder an, dass wir zu gegebener Steuerfunktion u den Zustand y als L¨ osung der Zustandsgleichung exakt bestimmen k¨onnen. Die Hauptarbeit zur Aufstellung des reduzierten Problems steckt nun in der Berechnung der Funktionen yi (x) := Sei (x), i = 1, . . . , m. osungen von Diese Funktionen yi (x) sind die L¨ −Δy y|Γ
= =
β ei 0.
Deshalb sind m partielle Differentialgleichungen zu l¨osen, wenn man diesen Weg geht. Bei der oben beschriebenen Zerlegung in Quadrate der Seitenl¨ange h = 0.01 w¨aren das immerhin schon 104 . Deshalb lohnt sich das direkte Aufstellen einer auf u reduzierten Aufgabe nur bei relativ kleinem m oder wenn man die gleiche Aufgabe oftmals mit verschiedenen Daten rechnen m¨ ochte. Sind die Funktionen yi einmal bestimmt, dann erh¨alt man den Zustand y = Su mit dem Superpositionsprinzip f¨ ur lineare Gleichungen aus y=
m
ui yi .
(2.93)
i=1
Nach Einsetzen der Darstellungen (2.92), (2.93) in die Zielfunktion entsteht die Zielfunktion m m 2 2 1 λ ui yi − yΩ L2 (Ω) + ui ei L2 (Ω) . fm (u1 , . . . , um ) = 2 i=1 2 i=1
80
2 Linear-quadratische elliptische Probleme
Als endlichdimensionale Approximation des Optimalsteuerungsproblems l¨osen wir (Pm )
min
ua ≤ui ≤ub
fm (u)
zur Bestimmung von u = (u1 , . . . , um ) . Eine Umformung der Zielfunktion ergibt m m m 1 1 yΩ 2 2 − y , u y + u y , u y Ω i i i i j j L (Ω) 2 2 i=1 L2 (Ω) L2 (Ω) i=1 j=1 m m λ + ui ei , uj ej 2 2 i=1 L (Ω) j=1 m m 1 1 yΩ 2 2 y = − u , y + ui uj yi , yj L2 (Ω) i Ω i L2 (Ω) L (Ω) 2 2 i,j=1 i=1 m λ ui uj ei , ej L2 (Ω) . + 2 i,j=1
fm (u) =
2 Folglich ist (Pm ) bis auf die Konstante 12 yΩ L2 (Ω) ¨aquivalent zur endlichdimensionalen quadratischen Optimierungsaufgabe
min
1 2
u C + λD u − a u (2.94)
ua ≤ u ≤ ub mit ua = (ua , . . . , ua ) , ub = auszuberechnen: a C D
(ub , . . . , ub ) . Dazu sind folgende Gr¨oßen numerisch vor= (ai ), ai = (yΩ , yi )L2 (Ω) = (cij ), cij = (yi , yj )L2 (Ω) = (dij ), dij = (ei , ej )L2 (Ω) .
Im Fall der im Beispiel verwendeten Treppenfunktionen gilt (ei , ej )L2 (Ω) = δij ei 2L2 (Ω) . Dann ist D eine Diagonalmatrix, D = diag(ei 2L2 (Ω) ). Zur L¨ osung solcher Aufgaben steht in Matlab das bereits erw¨ahnte Programm quadprog zur Verf¨ ugung. Zahlreiche weitere Codes sind unter der Website von NEOS (NEOS Server for Optimization) im Internet zu finden.
2.12.4 Primal-duale Aktive-Mengen-Strategie Der unendlichdimensionale Fall Wir erl¨ autern diese f¨ ur Steuerprobleme bei partiellen Differentialgleichungen auf Ito und Kunisch [114] zur¨ uckgehende Technik f¨ ur die Aufgabe der optimalen station¨aren Temperaturquelle 1 λ min f (u) := S u − yΩ 2L2 (Ω) + u2L2 (Ω) 2 2
2.12 Numerische Verfahren
bei
81
u. in Ω . u ∈ Uad = u ∈ L2 (Ω) : ua (x) ≤ u(x) ≤ ub (x) f.¨
Dabei ist S : L2 (Ω) → L2 (Ω) der L¨ osungsoperator zu −Δy y|Γ
= =
u 0
(der besseren Lesbarkeit halber wird β(x) = 1 angenommen). Die optimale Steuerung muss mit dem adjungierten Zustand p aus (2.50) von S. 53 die Projektionsbeziehung (2.58) auf S. 56 erf¨ ullen,
u ¯(x) = IP[ua (x),ub (x)] − λ−1 p(x) . Wir definieren μ = −(λ−1 p + u ¯) = −λ−1 f (¯ u). Aus der obigen Projektionsbeziehung folgt dann ⎧ ⎪ falls −λ−1 p(x) < ua (x) (⇔ μ(x) < 0) ⎨ ua (x), −1 −1 −λ p(x), falls −λ p(x) ∈ [ua (x), ub (x)] (⇔ μ(x) = 0) u ¯(x) = ⎪ ⎩ u (x), falls −λ−1 p(x) > ub (x) (⇔ μ(x) > 0). b
(2.95)
Im oberen Fall gilt nach Definition von μ und wegen u ¯ = ua die Ungleichung μ(x) < 0 und daher u ¯(x) + μ(x) < ua (x), im unteren analog u ¯(x) + μ(x) > ub (x). Im mittleren haben wir μ(x) = 0, somit u ¯(x) + μ(x) = −λ−1 p(x) ∈ [ua (x), ub (x)]. Also erf¨ ullt u = u ¯ die Beziehungen ⎧ ⎪ falls u(x) + μ(x) < ua (x) ⎨ ua (x), −1 −λ p(x), falls u(x) + μ(x) ∈ [ua (x), ub (x)] u(x) = (2.96) ⎪ ⎩ u (x), falls u(x) + μ(x) > ub (x). b ugt. Dann erf¨ ullt u die ProjektionsbeUmgekehrt sei ein u ∈ Uad gegeben, das (2.96) gen¨ ziehung und ist deshalb optimal. Beispielsweise folgt aus der obersten Zeile wegen u = ua sofort μ(x) < 0, daher 0 > −λ−1 p − u = −λ−1 p − ua , deshalb −λ−1 p < ua und folglich in diesem Fall u(x) = IP[ua (x),ub (x)] {−λ−1 p(x)}. Analog diskutiert man die anderen F¨ alle. Somit ist die Gr¨oße u + μ ein Indikator f¨ ur Aktivit¨at oder Inaktivit¨ at der Ungleichungsrestriktionen. Diese Vorbemerkungen motivieren die folgende primal-duale Aktive-Mengen-Strategie: Am Anfang werden beliebige Startfunktionen u0 , μ0 aus L2 (Ω) fixiert. Dabei braucht u0 nicht zul¨ assig zu sein. Die Iterierten un−1 und μn−1 seien bereits bestimmt worden. Zur Berechnung von un f¨ uhrt man folgende Schritte aus: S1
(Neue aktive bzw. inaktive Mengen)
Abn = x : un−1 (x) + μn−1 (x) > ub (x)
Aan = x : un−1 (x) + μn−1 (x) < ua (x) In = Ω \ (Abn ∪ Aan ).
82
2 Linear-quadratische elliptische Probleme
Wenn Aan = Aan−1 und Abn = Abn−1 gilt, dann wird das Verfahren wegen Optimalit¨at beendet, ansonsten mit dem n¨ achsten Schritt fortgesetzt. S2
(Neue Steuerung)
L¨ ose das folgende lineare System f¨ ur u ∈ L2 (Ω), y, p ∈ H01 (Ω): ⎧ auf ⎨ ua −Δy = u −λ−1 p auf u= ⎩ −Δp = y − yΩ , ub auf
Aan In Abn .
uhrt den n¨achsten Man definiert un := u, pn := p, μn := −(λ−1 pn + un ), n := n + 1 und f¨ Schritt S1 aus. Die eindeutige L¨ osbarkeit des obigen linearen Systems folgt daraus, dass es die notwendige Optimalit¨ atsbedingung f¨ ur ein l¨osbares linear-quadratisches Optimalsteuerungsproblem ist (L¨ osung der eingangs gestellten Aufgabe bei Fixierung von u durch u = ua auf Aan und u = ub auf Abn ). Das in Schritt S2 zu l¨ osende lineare System schreibt man zweckm¨aßiger Weise etwas anders auf. Mit Hilfe der charakteristischen Funktionen χan und χbn der Mengen Aan bzw. Abn fasst man die obigen Beziehungen f¨ ur u wie folgt zusammen: u + (1 − χan − χbn ) λ−1 p = χan ua + χbn ub . Somit ist in S2 folgendes System bei homogenen Randbedingungen f¨ ur y und p zu l¨osen: −Δp a b (1 − χn − χn ) λ−1 p
−Δy −y
−u = = +u =
0 −yΩ χan ua + χbn ub .
(2.97)
Die Fallunterscheidung (2.95) ¨ andert sich offenbar nicht, wenn man f¨ ur die Funktion μ ein Vielfaches cμ mit einer positiven Konstanten c einsetzt. Deshalb besteht die M¨oglichkeit, in Schritt S1 an Stelle von μn−1 auch mit einem festen Vielfachen cμn−1 zu arbeiten. Das kann numerisch von Vorteil sein und wird z.T. f¨ ur die Konvergenzanalysis genutzt. Zur Analysis des Verfahrens und zu etwas allgemeineren Varianten, in denen z.B. durch eine Multplikatorenverschiebung Zul¨ assigkeit erzwungen wird, verweisen wir auf das Buch Ito und Kunisch [115] sowie auf Ito und Kunisch [114], Bergounioux et al. [26] und Kunisch und R¨ osch [129]. Die Methode ist als halbglattes (semismooth) Newtonverfahren interpretierbar, was ihre i.a. u ¨berlineare Konvergenz erkl¨art, siehe [115] oder [108]. Numerische Umsetzung mit einer FEM-Approximation der Aufgabe Bei der numerischen Anwendung der primal-dualen Aktive-Mengen-Strategie ist eine diskrete Variante zu rechnen. Im Unterschied zu der auf S. 77 beschriebenen Diskretisierung der Poissongleichung durch finite Differenzen gehen wir jetzt von einer Approximation durch die Finite-Elemente-Methode (FEM) aus. Wir setzen Ω ⊂ IR2 als polygonal berandetes Gebiet voraus, das durch eine (regul¨ are) Triangulation in endlich viele Dreiecke mit paarweise disjunktem Inneren zerlegt ist. Dazu geh¨ort eine Menge von st¨ uckweise linearen und stetigen Basisfunktionen {Φ1 , ..., Φ } ⊂ H01 (Ω). Wir beschreiben die regul¨are Triangulation und die Form der Basisfunktionen nicht n¨aher und verweisen auf die B¨ ucher von Braess [37], Brenner und Scott [38], Ciarlet [57] oder Großmann und Roos [87]. F¨ ur Einsteiger ist das Buch von G¨ oring et al. [82] sehr zu empfehlen.
2.12 Numerische Verfahren
83
Die Steuerung sei st¨ uckweise konstant, d.h. u ist konstant auf den einzelnen Dreiecken der Zerlegung. Dazu definieren wir entsprechende Ansatzfunktionen ei , i = 1, ..., m, die identisch gleich eins auf dem Teildreick i sind und null auf den restlichen. Insgesamt verwenden wir damit die Ans¨ atze y(x) =
yi Φi (x),
u(x) =
i=1
m
ui ei (x)
i=1
mit reellen Unbekannten yi , uj , i = 1, . . . , , j = 1, . . . , m. Nach Einsetzen dieser Darstellungen in die schwache Formulierung der Poissongleichung und Wahl von Φj als Testfunktion ergibt sich m yi ∇Φi · ∇Φj dx = ui ei Φj dx Ω i=1
Ω i=1
und schließlich das folgende lineare Gleichungssystem f¨ ur y = (y1 , . . . , y ) und u = (u1 , . . . , um ) : Kh y = Bh u mit der Steifigkeitsmatrix Kh und einer Matrix Bh , deren Elemente durch ∇Φi · ∇Φj dx, bh,ij = Φi ej dx kh,ij = Ω
Ω
definiert sind. Die Zahl h bezeichnet die Gitterweite der Triangulation und ist das Maß f¨ ur deren Feinheit. Nach leichter Rechnung erhalten wir ferner 1 λ 1 λ 1 y − yΩ 2 2 + u2L2 (Ω) = y Mh y − ah y + u Dh u + yΩ 2L2 (Ω) L (Ω) 2 2 2 2 2 mit Massematrizen Mh , Dh und einem Vektor ah , deren Elemente durch Φi Φj dx, dh,ij = ei ej dx, ah,i = Φi yΩ dx mh,ij = Ω
Ω
Ω
definiert sind. Der konstante Term mit yΩ hat auf die Minimierung keinen Einfluss. Weil die Inneren der Teildreiecke zueinander disjunkt sind, ist Dh eine Diagonalmatrix. Als Diskretisierung der eingangs gestellten Optimalsteuerungsaufgabe ist nun das Problem min
1 λ y Mh y − ah y + u Dh u , 2 2 (2.98)
Kh y = Bh u, ua ≤ u ≤ ub osen. mit ua = (ua , . . . , ua ) , ub = (ub , . . . , ub ) zu l¨ Das zugeh¨ orige Optimalit¨ atssystem ist durch Kh y = Bh u,
ua ≤ u ≤ ub ,
Kh p = Mh y − ah , (λ Dh u + Bh p ) (v − u) ≥ 0
∀ ua ≤ v ≤ ub
84
2 Linear-quadratische elliptische Probleme
gegeben. Da Dh eine Diagonalmatrix ist, schließen wir daraus analog zum unendlichdi mensionalen Fall mit μ = − (λDh )−1 Bh p + u f¨ ur den optimalen Vektor u auf ⎧ ⎨ ua , falls ui + μi < ua μi , falls ui + μi ∈ [ua , ub ] ui = ⎩ ub , falls ui + μi > ub , i = 1, . . . , m. Durch Vergleich mit dem unendlichdimensionalen Fall wird damit die folgende primal-duale Aktive-Mengen-Strategie plausibel: Als Startwerte werden Vektoren u0 , μ0 gew¨ ahlt. Im n-ten Schritt sind die Mengen der aktiven bzw. inaktiven Restriktionen durch
Abn = i ∈ {1, . . . , m} : un−1,i + μn−1,i > ub ,
Aan = i ∈ {1, . . . , m} : un−1,i + μn−1,i < ua , In = {1, . . . , m} \ (Abn ∪ Aan ) definiert. Nach Festlegung dieser neuen aktiven Mengen Aan und Abn werden in Analogie zu den auf S. 82 definierten charakteristischen Funktionen χan , χbn Diagonalmatrizen Xna , Xnb mit Diagonalelementen 1, falls i ∈ Aan 1, falls i ∈ Abn a b Xn,ii = Xn,ii = 0, sonst, 0, sonst bestimmt. Wir setzen Eh := (λDh )−1 (I − Xna − Xnb ). Die Diagonalelemente eh,ii von Eh verschwinden genau dann, wenn i ∈ Aan ∪ Abn . Danach ist das folgende lineare Gleichungssystem f¨ ur p, y und u zu l¨ osen: ⎤ ⎡ ⎡ ⎤⎡ ⎤ 0 0 Kh p −Bh ⎥ ⎢ ⎢ ⎥⎢ ⎥ −ah −Mh 0 ⎦ ⎣ y ⎦ = ⎣ (2.99) ⎣ Kh ⎦ a b u Eh Bh 0 I Xn ua + Xn ub . Das Ergebnis sind neue Vektoren un := u und μn := − (λDh )−1 Bh pn + un . Man kann beweisen, dass dieses Verfahren nach endlich vielen Schritten das Optimum findet. Dieser Fall tritt ein, wenn sich erstmalig Aan = Aan−1 und Abn = Abn−1 ergibt. Dann erf¨ ullt der Vektor un alle Restriktionen. In diesem Sinne erzeugt die primal-duale AktiveMengen-Strategie mit Ausnahme des Optimums unzul¨assige Iterierte. Beweise sind in [26], [129] zu finden. Durch Einf¨ uhren einer Multiplikatorenverschiebung l¨asst sich in allen Schritten Zul¨ assigkeit erreichen, [114]. Außerdem kann wie im unendlichdimensionalen Fall cμn an Stelle von μn verwendet werden. Oft wird an Stelle eines st¨ uckweise konstanten Ansatzes f¨ ur die Steuerung der st¨ uckweise lineare Ansatz u = ni=1 ui Φi verwendet. Dann ist Dh keine Diagonalmatrix mehr und die obige Diskussion der Variationsungleichung nicht korrekt. Hier schreibt man meist die in Abschnitt 2.12.4 f¨ ur den stetigen Fall beschriebene Aktive-Mengen-Strategie punktweise in den Gitterpunkten der Triangulierung auf. Man ersetzt also in den Fallunterscheidungen x ∈ Ω durch die Gitterpunkte xi . Bemerkung. Im Zusammenhang mit der FEM-Approximation interessiert die Absch¨atzung des Fehlers zwischen der exakten optimalen Steuerung und der optimalen Steuerung der diskretisierten Aufgabe. Wir verweisen z.B. bei elliptischen Aufgaben auf [14], [48], [49], [105], [108], [160] und im Zusammenhang mit parabolischen auf [155], [178], [193].
2.13 Adjungierter Zustand als Lagrangescher Multiplikator *
85
Andere Aktive-Mengen-Strategien Die eben beschriebene Strategie erzeugt bis vor Erreichen der L¨osung unzul¨assige Steuerungen. Liegt erstmals Zul¨ assigkeit vor, dann ist das Optimum erreicht. Es existieren mit projizierten Newtonverfahren ¨ahnliche Methoden, die generell zul¨assige Steuerungen erzeugen und ein vergleichbares Konvergenzverhalten wie die beschriebene primal-duale Aktive-Mengen-Strategie aufweisen. Sie wurden insbesondere erfolgreich auf parabolische Aufgaben angewendet. Wir verweisen auf die Darstellung der Grundlagen des Verfahrens bei Bertsekas [29] oder Kelley [120] und in Bezug auf die L¨osung parabolischer Optimalsteuerungsprobleme auf Kelley und Sachs [121], [122]. Direkte L¨ osung des Optimalit¨ atssystems Eine weitere empfehlenswerte Methode besteht in der direkten numerischen L¨osung des nichtglatten Optimalit¨ atssystems −Δy y|Γ
= =
β IP[ua ,ub ] {−λ−1 β p} 0
−Δp p|Γ
= y − yΩ = 0.
Dieses Verfahren wird f¨ ur parabolische Probleme auf S. 137 etwas genauer beschrieben.
2.13 Adjungierter Zustand als Lagrangescher Multiplikator * 2.13.1 Elliptische Gleichungen mit Daten aus V ∗ Alle in diesem Kapitel behandelten elliptischen Randwertprobleme wurden mit der Theorie schwacher L¨ osungen auf die allgemeine Form a[y, v] = F (v)
(2.100)
gebracht, in der a : V × V → IR eine stetige Bilinearform und F ein Funktional aus V ∗ ist. Wir betrachten die Bilinearform jetzt aus einer etwas anderen Sicht. F¨ ur fest vorgegebenes y ∈ V und variables v ∈ V ist die Abbildung ay : v → a[y, v] von V in IR linear und stetig. Sie ist damit selbst ein lineares stetiges Funktional auf V , also ein Element aus V ∗ . Die Zuordnung y → ay ist eine lineare Abbildung von V in V ∗ , die wir mit A bezeichnen. Der Operator A : V → V ∗ ist stetig, denn es gilt
A yV ∗ = sup ay (v) = sup a[y, v] ≤
v V =1
sup v V =1
v V =1
α0 yV vV = α0 yV
mit α0 aus Ungleichung (2.6) von S. 26 (Stetigkeit der Bilinearform a). Daraus folgt A ≤ α0 , A ist also beschr¨ ankt, daher stetig und wir haben a[y, v] = ay (v)
∀ y, v ∈ V.
(2.101)
86
2 Linear-quadratische elliptische Probleme
Die Variationsformulierung a[y, v] = F (v) kann man deshalb auch als Gleichung in V ∗ aufschreiben, A y = F. Das Lemma von Lax und Milgram sagt aus, dass diese Gleichung unter den entsprechenden Voraussetzungen f¨ ur jedes Funktional F ∈ V ∗ genau eine L¨osung y ∈ V hat und yV ≤ ca F V ∗ gilt. Deshalb existiert der inverse Operator A−1 : F → y von V ∗ in V und ist stetig. Unsere Betrachtungen fasst das folgende Lemma zusammen: Lemma 2.35 Jede V -elliptische und beschr¨ankte Bilinearform a = a[y, v] erzeugt durch A y , vV ∗ ,V = a[y, v]
∀y, v ∈ V
einen stetigen und bijektiven linearen Operator A : V → V ∗ . Der inverse Operator A−1 : V ∗ → V ist ebenfalls stetig. Die Stetigkeit von A−1 folgt aus dem Lemma von Lax und Milgram, aber auch aus dem bekannten Satz von Banach u ¨ber den inversen Operator, weil A surjektiv ist. Die Anwendung von Lemma 2.35 hat mehrere Vorteile. Man kann mit dem Operator A so arbeiten wie mit der Matrix A im Abschnitt 1.4. Die Darstellung wird symmetrisch, denn f¨ ur den adjungierten Operator A∗ ergibt sich A∗ : (V ∗ )∗ → V ∗ und deshalb A∗ : V → V ∗ im Falle eines reflexiven Raums V , der hier immer vorliegt.
2.13.2 Anwendung beim Beweis von Optimalit¨ atsbedingungen Wir wollen die Vorteile der Anwendung von Lemma 2.35 am Beispiel der optimalen station¨ aren Randtemperatur verdeutlichen, bei dem y ∈ H 1 (Ω) die schwache L¨osung der folgenden Aufgabe ist: −Δy = 0 in Ω ∂ν y + α y = α u auf Γ. Es sei α ≥ 0 und αL∞ (Γ) > 0 vorausgesetzt. Hier wird V = H 1 (Ω) gew¨ahlt und a sowie F sind gegeben durch a[y, v] = ∇y · ∇v dx + α y v ds Ω
F (v)
=
Γ
α u τ v ds, Γ
wobei τ : V → L2 (Γ) der Spuroperator ist. Mit dem von a[y, v] erzeugten Operator A kann die Aufgabe der optimalen Steuerung so aufgeschrieben werden: min J(y, u)
:=
Ay
=
1 λ y − yΩ 2L2 (Ω) + u2L2 (Γ) 2 2 B u, u ∈ Uad .
Dabei ist B : L2 (Γ) → V ∗ = (H 1 (Ω))∗ definiert durch α u τ v ds ∀v ∈ V B u , vV ∗ ,V = Γ
(2.102)
2.13 Adjungierter Zustand als Lagrangescher Multiplikator *
87
Im Weiteren identifizieren wir (L2 (Ω))∗ mit L2 (Ω) aber V ∗ nicht mit V , weil das z.B. die Verwendung des H 1 -Skalarprodukts an Stellen erfordern w¨ urde, wo das nicht sinnvoll ist. Wir definieren den L¨ osungsoperator durch G := A−1 , G : V ∗ → V , also gilt y = GBu. Nun betrachten wir aber G als Operator mit Bild in L2 (Ω), bezeichnet mit S. Das ist wegen V → L2 (Ω) sinnvoll. Wir setzen also wieder S = EV G mit dem Einbettungsoperator EV : V → L2 (Ω); dann folgt S : V ∗ → L2 (Ω) und S = EV A−1 . Der adjungierte Operator bildet S ∗ von L2 (Ω) nach V ab, damit insbesondere in L2 (Ω). Nach Einsetzen von y = EV G B u = S B u in J(y, u) lautet die Aufgabe (2.102) kurz 1 λ min f (u) := S B u − yΩ 2L2 (Ω) + u2L2 (Γ) . 2 2 u ∈ Uad Satz 2.14 von S.40 sichert die Existenz der optimalen Steuerung u¯ und Satz 2.22 auf S. 51 liefert mit (2.45) die entsprechende Variationsungleichung ∗ ∗ B S (¯ y − yΩ ) + λ u ¯, u−u ¯ L2 (Γ) ≥ 0 ∀u ∈ Uad . (2.103) Wir definieren den adjungierten Zustand p durch ∗ y − yΩ ) = A−1 EV∗ (¯ y − yΩ ). p := S ∗ (¯ Dann l¨ ost p die adjungierte Gleichung y − yΩ ). A∗ p = EV∗ (¯
(2.104)
y¯−yΩ sich selbst zu, aber betrachtet als Funktional EV∗ : L2 (Ω) → V ∗ ordnet die Funktion auf V , das durch EV∗ (¯ y − yΩ ) (v) := (¯ y − yΩ , v)L2 (Ω) definiert ist. Jetzt ist noch die konkrete Form von A∗ zu bestimmen, um die Optimalit¨atsbedingungen zu erhalten. Die Bilinearform a[y, v] ist symmetrisch. Deshalb gilt A y , vV ∗ ,V = a[y, v] = a[v, y] = A v , yV ∗ ,V = y , A vV,V ∗
∀y, v ∈ V,
woraus A = A∗ folgt. Die adjungierte Gleichung (2.104) ist deshalb ¨aquivalent zum Randwertproblem −Δp = y¯ − yΩ (2.105) ∂ν p + α p = 0. F¨ ur den adjungierten Operator B ∗ : V → L2 (Γ) ergibt sich B ∗ p = α τ p und so nimmt die Variationsungleichung (2.103) die Form (α τ p + λ u ¯, u−u ¯)L2 (Γ) ≥ 0
∀u ∈ Uad
(2.106)
an. All das hatten wir bereits auf anderem Wege bewiesen. Aber die hier vorgestellte Methode ist allgemeiner. Sie wird insbesondere in der Monographie von Lions [144] angewendet, der wir hier gefolgt sind. Ein Vorteil liegt z.B. in der bereits auf S. 32 erl¨auterten M¨ oglichkeit, als Steuerungen Funktionen aus Lr -R¨aumen mit r < 2 oder allgemeinere Funktionale aus V ∗ zu verwenden. Außerdem kann man mit dieser Methode den adjungierten Zustand p in nat¨ urlicher Weise als Lagrangeschen Multiplikator definieren. Das wird im Abschnitt 2.13.3 erl¨ autert.
88
2 Linear-quadratische elliptische Probleme
2.13.3 Adjungierter Zustand als Multiplikator Das eben erhaltene Ergebnis kann auch mit der Regel der Lagrangeschen Multiplikatoren f¨ ur Optimierungsaufgaben in Banachr¨ aumen hergeleitet werden. Im Vorgriff auf den Inhalt von Kapitel 6 f¨ uhren wir das exemplarisch an der Aufgabe (2.102) vor. Sie ist ein Optimierungsproblem im Banachraum vom Typ (6.1) auf S. 255 mit Gleichungsrestriktion A y − B v = 0 f¨ ur die Unbekannte u := (y, v) ∈ U := Y × L2 (Γ) und Bildraum ∗ Z := Y f¨ ur die Gleichung. Wir bezeichnen hier die Steuerung mit v an Stelle von u und setzen Y := H 1 (Ω), Vad := Uad , um kompatibel mit den Bezeichnungen aus Kapitel 6 zu sein. Wir betrachten somit die Aufgabe 1 1 y − yΩ 2L2 (Ω) + v2L2 (Γ) , A y − B v = 0, v ∈ Vad . 2 2 Die zugeh¨ orige Lagrangefunktion L : Y × U × Y ∗∗ → IR lautet gem¨aß (6.2) auf S. 255 $ % L(y, v, z ∗ ) = J(y, v) + z ∗ , A y − B v Y ∗∗ ,Y ∗ $ % 1 λ = EV y − yΩ 2L2 (Ω) + v2L2 (Γ) + z ∗ , A y − B v Y ∗∗ ,Y ∗ . 2 2 Wegen Reflexivit¨ at gilt nach Identifikation Y ∗∗ = Y und z ∗ kann mit einem Element aus Y identifiziert werden. Der Operator A ist surjektiv und deshalb ist die Regularit¨atsbedingung (6.11) von Zowe und Kurcyusz f¨ ur Gleichungsrestriktionen erf¨ ullt. Laut Satz 6.3 auf S. 260 existiert daher ein Lagrangescher Multiplikator z ∗ ∈ Y . Mit diesem ist die Variationsungleichung (6.13) erf¨ ullt, also in unserem Falle min J(y, v) :=
D(y,v) L(¯ y , v¯, z ∗ )(y − y¯, v − v¯) ≥ 0 Weil y frei w¨ ahlbar ist, folgt also
∀(y, v) ∈ Y × Vad .
Dy L(¯ y , v¯, z ∗ ) = 0, EV∗ (EV y¯ − yΩ ) + A∗ z ∗ = 0
und mit p := −z ∗ sowie EV y¯ = y¯ schließlich die Gleichung (2.104), y − yΩ ). A∗ p = EV∗ (¯ Die L¨ osung dieser Gleichung ist eindeutig bestimmt und schwache L¨osung der Aufgabe (2.105). Auf diese Weise haben wir folgendes Resultat erhalten: Lemma 2.36 Der adjungierte Zustand p zur optimalen Steuerung v¯ des Problems der optimalen station¨aren Temperaturquelle ist Lagrangescher Multiplikator zur gegebenen Zustandsgleichung A y − B v = 0. Als solcher ist er eindeutig bestimmt. Der Vollst¨ andigkeit halber erw¨ ahnen wir noch, dass aus Dv L(¯ y , v¯, z ∗ )(v − v¯) ≥ 0 f¨ ur alle v ∈ Vad wie erwartet die Variationsungleichung (2.106) folgt, formuliert mit v an Stelle von u. Auf diese Weise k¨ onnen auch alle anderen Aufgaben bei linearen elliptischen Gleichungen behandelt werden. Eine ¨ ahnliche Vorgehensweise ist f¨ ur parabolische Gleichungen sinnvoll. Schwierigkeiten ergeben sich allerdings bei gewissen Klassen nichtlinearer Gleichungen (siehe Kapitel 4), weil rechte Seiten v ∈ Y ∗ nur die Regularit¨at y ∈ H 1 (Ω) ergeben. Bei unseren nichtlinearen Aufgaben werden wir aber die Beschr¨anktheit des Zustands y ben¨ otigen, die in H 1 (Ω) nicht gew¨ahrleistet ist. Zur Untersuchung von Zu¯ standsbeschr¨ ankungen brauchen wir sp¨ ater sogar die Regularit¨at y ∈ C(Ω).
2.14 H¨ ohere Regularit¨ at f¨ ur elliptische Aufgaben *
89
2.14 H¨ ohere Regularit¨ at f¨ ur elliptische Aufgaben * 2.14.1 Grenzen des Zustandsraums H 1 (Ω) In diesem Kapitel wurde der Zustand generell im Raum H 1 (Ω) betrachtet. Das ist f¨ ur ¨ g¨ angige linear-quadratische Aufgaben ausreichend. Schon bei einfachen Anderungen st¨oßt man aber auf Schwierigkeiten, die in H 1 (Ω) nicht zu beheben sind. Die n¨achsten zwei Beispiele verdeutlichen das. Minimierung eines Punktfunktionals An Stelle des bisher verwendeten quadratischen Integralfunktionals soll der Wert des Zustands an einem fixierten Punkt x0 ∈ Ω minimiert werden. Wir betrachten also die Aufgabe min y(x0 ) bei
−Δy + y ∂ν y + α y
= =
0 u
in Ω auf Γ
und den Restriktionen an die Steuerfunktion u ∈ L2 (Γ), ua (x) ≤ u(x) ≤ ub (x). Diese Aufgabe ist in H 1 (Ω) nicht korrekt gestellt, denn der Wert y(x0 ) ist erst bei Stetigkeit von y definiert. Hat Ω mindestens die Dimension 2, dann ist diese Eigenschaft ¯ im Abschnitt 6.2.1. nicht gesichert. Wir behandeln die Aufgabe in Y = H 1 (Ω) ∩ C(Ω) Bestm¨ ogliche Approximation in der Maximumnorm ¨ Ahnlich liegen die Dinge bei der Aufgabe min J(y, u) := y − yΩ C(Ω) ¯ +
λ u2L2 (Γ) 2
mit den gleichen Restriktionen wie im Fall des Punktfunktionals. Hier soll y den Zielzustand yΩ nicht im quadratischen Mittel, sondern gleichm¨aßig approximieren. Auch in diesem Fall ist H 1 (Ω) nicht der passende Zustandsraum, denn y muss wieder stetig sein, damit J definiert ist. Außerdem ist J zwar konvex, aber nicht differenzierbar. ¨ Wir behandeln die Aufgabe durch Uberf¨ uhrung in ein Problem mit differenzierbarem Funktional und punktweisen Zustandsbeschr¨ ankungen in Abschnitt 6.2.1.
2.14.2 Sobolew-Slobodetskii-R¨ aume Wir geben hier einige wenige Erl¨ auterungen zu Sobolewr¨aumen mit gebrochener Ableitungsordnung. Diese R¨ aume sind f¨ ur die Theorie der partiellen Differentialgleichungen sehr wichtig, werden hier aber nur im Abschnitt 2.15 zum Nachweis benutzt, dass die optimale Steuerung des Problems der optimalen station¨aren Randtemperatur im Raum H 1 (Γ) liegt. In der folgenden Definition halten wir uns an Adams [2], Thm. 7.48.:
90
2 Linear-quadratische elliptische Probleme
Definition. Es sei Ω ⊂ IRN ein beschr¨anktes Gebiet, s > 0 nicht ganz und λ = s − [s] der nichtganze Anteil von s. Unter H s (Ω) versteht man den normierten Raum aller Funktionen v ∈ H [s] (Ω) mit der Eigenschaft Dα v(x) − Dα v(y) 2 dx dy < ∞. |x − y|N +2λ Ω Ω |α|=[s]
Dieser Raum wird versehen mit der Norm v2H s (Ω) = v2H [s] (Ω) +
Dα v(x) − Dα v(y) 2 dx dy. |x − y|N +2λ Ω Ω
|α|=[s]
Um H s (Γ) zu definieren, ben¨ otigt man die Darstellung des Randes yN = hi (y) mit y ∈ QN −1 in allen lokalen Koordinatensystemen Si , die zur Definition von C k,1 -Gebieten in Abschnitt 2.2.2 verwendet wurde. Eine Funktion v geh¨ort zu H s (Γ), wenn alle Funktionen vi (y) = v(y, hi (y)) im Raum H s (QN −1 ) liegen. Die dazu n¨otigen Grundlagen sind ausf¨ uhrlich in Wloka [209], Kap. 1, §4, dargestellt. Sie sind auch bei Adams [2] oder Alt [6] nachzulesen. In gleicher Weise wird H k (Γ) f¨ ur ganze k in C k−1,1 -Gebieten durch den k uhrt, vgl. Gajewski et al. [72]. Sobolewraum H (QN −1 ) eingef¨ Diese Sobolew-Slobodetskii-R¨aume sind – versehen mit dem entsprechenden Skalarprour p = 2, dukt – Hilbertr¨ aume. In ¨ ahnlicher Weise definiert man die R¨aume W s,p (Ω) f¨ vgl. [2]. Als Spezialfall ergibt sich H s (Ω) = W s,2 (Ω).
2.14.3 H¨ ohere Regularit¨ at von L¨ osungen Die Beispiele des Abschnitts 2.14.1 zeigen, dass f¨ ur wichtige Klassen von Aufgaben H 1 L¨ osungen der elliptischen Randwertprobleme nicht ausreichen. Unter geeigneten Zusatzvoraussetzungen an die Glattheit des Randes und/oder die gegebenen Daten kann h¨ohere Regularit¨ at gezeigt werden. Hier sind einige aus der Literatur bekannte Standardaussagen zusammengestellt. Randwertprobleme in C 1,1 -Gebieten. Wir betrachten das Dirichlet-Problem Ay + λy y
= f = g
in Ω auf Γ
(2.107)
Ay + λy ∂νA y
= f = g
in Ω auf Γ
(2.108)
sowie das Neumannproblem
mit dem in (2.19) auf S.30 definierten elliptischen Operator A, welcher der Symmetriebedingung f¨ ur die Koeffizienten aij sowie der Elliptizit¨atsbedingung (2.20) gen¨ ugt. Wir ¯ f¨ setzen zus¨ atzlich aij ∈ C 0,1 (Ω) ur alle i, j ∈ {1, . . . , N } voraus und fordern, dass Ω ein beschr¨ anktes C 1,1 -Gebiet ist. Ferner ist λ ∈ IR vorgegeben. Homogene Randdaten: Hier folgt aus Grisvard, [86], Thm. 2.2.2.3 sowie 2.2.2.5: F¨ ur g = 0, λ ≥ 0 und f ∈ L2 (Ω) geh¨ort die schwache L¨osung y des Dirichlet-Problems (2.107) zu H 2 (Ω). Gleiches gilt f¨ ur das Neumannproblem (2.108) mit λ > 0.
2.15 Regularit¨ at optimaler Steuerungen *
91
Inhomogene Randdaten: Aus [86], Thm. 2.4.2.5 und 2.4.2.7 folgt: Es sei 1 < p < ∞. F¨ ur g ∈ W 2−1/p,p (Γ), λ ≥ 0 und f ∈ Lp (Ω) geh¨ort die schwache L¨osung y des Dirichlet-Problems (2.107) zu W 2,p (Ω). Gleiches gilt f¨ ur das Neumannproblem (2.108) mit λ > 0, falls g ∈ W 1−1/p,p (Γ). Die aus [86] angewendeten S¨ atze sind f¨ ur etwas allgemeinere Randoperatoren bewiesen worden und umfassen insbesondere das dritte Randwertproblem. Die Aussagen f¨ ur homogene Randwerte sind ein Spezialfall der W 2,p -Resultate, weil g = 0 beliebig glatt ist. Lipschitzgebiete. F¨ ur Lipschitzgebiete gibt es folgendes interessante Resultat von Jerison und Kenig [117]: F¨ ur A = −Δ, λ > 0, f = 0 sowie g ∈ L2 (Γ) geh¨ort die schwache L¨osung y des Neumannproblems zu H 3/2 (Ω). Konvexe Gebiete. Ist Ω ein beschr¨anktes und konvexes Gebiet, dann bleiben die f¨ ur C 1,1 -Gebiete formulierten Aussagen f¨ ur homogene Randdaten g¨ ultig, d.h. aus g = 0, f ∈ L2 (Ω) und λ ≥ 0 bzw. λ > 0 folgt y ∈ H 2 (Ω). Das ist eine Folgerung aus den S¨ atzen 3.2.1.2 sowie 3.2.1.3 in [86]. Weitere Regularit¨atsresultate findet man f¨ ur C ∞ -R¨ ander in Triebel [194]. Unter etwas schw¨acheren Voraussetzungen ist mit der Stampacchia-Methode Beschr¨anktheit bzw. Stetigkeit der L¨osung y beweisbar. Wir behandeln das in den Abschnitten 4.2 und 7.2.2.
2.15 Regularit¨ at optimaler Steuerungen * Die Steuerungen geh¨ orten bei den bisher behandelten Aufgaben dem Hilbertraum L2 (Γ) 2 bzw. L (Ω) an, so dass wir von optimalen Steuerungen zun¨achst nicht mehr als die Regularit¨ at von L2 -Funktionen erwarten k¨ onnen. Es zeigt sich jedoch, dass Optimalit¨at im Fall eines positiven Regularisierungsparameters λ h¨ohere Glattheit mit sich bringt.
Optimale station¨ are Temperaturquelle Wir behandeln das Problem mit Randtemperatur null, analog wird die Regularit¨at bei vorgegebener Außentemperatur und Randbedingung dritter Art diskutiert. Das Optimalit¨ atssystem der entsprechenden Aufgabe (2.26)–(2.28) auf S. 38 ist −Δy y|Γ
= βu = 0,
−Δp p|Γ
= y − yΩ = 0,
u = IP[ua ,ub ] −λ−1 β p . ¯ und geh¨oren die Schranken ua , ub zu Satz 2.37 Ist die Funktion β Lipschitz-stetig auf Ω H 1 (Ω) sowie yΩ zu L2 (Ω), dann ist die optimale Steuerung des Problems der optimalen station¨aren Temperaturquelle (2.26)–(2.28) auf S. 38 eine Funktion aus H 1 (Ω). Beweis. Auf der rechten Seite der adjungierten Gleichung steht mit y − yΩ eine Funktion aus L2 (Ω). Die L¨ osung p geh¨ ort deshalb zu H01 (Ω). Das Produkt β(x) p(x) hat diese
92
2 Linear-quadratische elliptische Probleme
Eigenschaft aber nur f¨ ur hinreichend glattes β. Wir haben deshalb zus¨atzlich die Lip¯ vorausgesetzt, d.h. β ∈ C 0,1 (Ω). ¯ Dann geh¨ort β p ebenfalls schitzstetigkeit von β auf Ω H01 (Ω) an, siehe Grisvard [86], Thm. 1.4.1.2. Außerdem wissen wir ua , ub aus H 1 (Ω). Das Bild des Projektionsoperators IP[ua ,ub ] , angewandt auf Funktionen aus H 1 (Ω), liegt wieder in H 1 (Ω). Das folgt mit einem Ergebnis aus Stampacchia und Kinderlehrer [123] ¯ u ¨ber die Stetigkeit der Abbildung u(·) → |u(·)| in H 1 (Ω). Die optimale Steuerung u = u ist also ein Element von H 1 (Ω).
Optimale station¨ are Randtemperatur Das Optimalit¨ atssystem f¨ ur diese Aufgabe lautet −Δy ∂ν y + α y
−Δp = ∂ν p + α p =
= 0 = α u,
y − yΩ 0,
u = IP[ua ,ub ] −λ−1 α p|Γ . Wendet man die gleiche Methode wie eben an, dann erh¨alt man nicht die erwartete Regularit¨ at. Aus der adjungierten Gleichung folgt wieder p ∈ H 1 (Ω). In der Projektionsbeziehung f¨ ur u steht aber die Spur von p und diese geh¨ort laut Satz 7.3 nur H 1/2 (Γ) an. Bestenfalls k¨ onnten wir auf diese Weise u ∈ H 1/2 (Γ) erwarten. Unter nat¨ urlichen Voraussetzungen ist h¨ ohere Regularit¨ at beweisbar. Satz 2.38 Es sei Ω ein beschr¨anktes C 1,1 -Gebiet, α Lipschitz-stetig und ua , ub seien aus H 1 (Γ). Dann geh¨ort die optimale Steuerung u ¯ des Problems der optimalen station¨aren Randtemperatur dem Raum H 1 (Γ) an. Beweis: Wir schreiben die adjungierte Gleichung in der Form −Δp + p ∂ν p
= y − yΩ + p = −α p
auf. Die gegebene L¨ osung p = p1 + p2 setzt sich additiv aus zwei Anteilen zusammen. Dabei ist p1 die L¨ osung von −Δp1 + p1 = f, ∂ν p1 = 0 zur rechten Seite f := y − yΩ + p. Der Anteil p2 l¨ ost −Δp2 + p2 = 0, ∂ν p2 = g mit g := −α p. Weil Ω ein C 1,1 -Gebiet ist, 2 folgt p1 ∈ H (Ω) aus den Regularit¨ atsaussagen zum homogenen Neumann-Problem aus [86], die in Abschnitt 2.14.3 zusammengestellt sind. Auch p2 liegt in H 2 (Ω): Zun¨ achst wissen wir p ∈ H 1 (Ω), deshalb p|Γ ∈ H 1/2 (Γ) nach Spursatz 7.3 auf S. 277. Damit liegt das Produkt g = −α p|Γ nach [86], Satz 1.4.1.2, ebenfalls in H 1/2 (Γ). Durch Anwendung der in Abschnitt 2.14.3 enthaltenen Regularit¨ atsaussage u ¨ ber das inhomogene Neumannproblem in C 1,1 -Gebieten ist die Abbildung g → p2 stetig von H 1/2 (Γ) = W 1−1/2,2 (Γ) nach W 2,2 (Ω) = H 2 (Ω). Insgesamt gilt p ∈ H 2 (Ω) und deshalb hat p laut Satz 7.3 zumindest Randwerte in H 1 (Γ). Der Rest folgt aus der Projektionsformel f¨ ur u ¯ und der Stetigkeit der Abbildung u(·) → |u(·)| in H 1 (Γ) , weil das Produkt der Lipschitzfunktion α und der H 1 (Γ)-Funktion p|Γ in H 1 (Γ) liegt, vgl. [86], Satz 1.4.1.2.
¨ 2.16 Ubungsaufgaben
93
¨ 2.16 Ubungsaufgaben 2.1 Wir skizzieren zuerst die Behandlung der nichtlinearen Aufgabe min J(y, u) T (y, u) = 0,
u ∈ Uad ,
in der neben den in Abschnitt 1.4.1 auf S. 8 definierten Gr¨ oßen J sowie Uad eine stetig y, u ¯) differenzierbare Abbildung T : IRn × IRm → IRn gegeben ist. Die Jacobi-Matrix Dy T (¯ sei an der optimalen Stelle (¯ y, u ¯) invertierbar. Die L¨ osung z der bei (¯ y, u ¯) linearisierten Gleichung y, u ¯)(z − y¯) + Du T (¯ y, u ¯)(u − u ¯) = 0 Dy T (¯ verh¨ alt sich in einer Umgebung von (¯ y, u ¯) bis auf einen Fehler h¨ oherer Ordnung als u− u ¯ wie die L¨ osung y der Gleichung T (y, u) = 0. Im Vergleich mit der linearen Zustandsgleiy, u ¯) die Rolle von A und Du T (¯ y, u ¯) die von B. chung (1.1) von S. 8 u ¨bernimmt Dy T (¯ Es ist deshalb plausibel, dass das Paar (¯ y, u ¯) an Stelle von (1.9) auf S. 12 folgendem Optimalit¨ atssystem gen¨ ugen muss: T (y, u) = 0, u ∈ Uad , Dy T (y, u) p = ∇y J(y, u), ` ´ Du T (y, u) p + ∇u J(y, u) , v − u IRm ≥ 0
(2.109) ∀ v ∈ Uad .
Beweisen Sie diese Aussage mit dem Satz u ¨ber implizite Funktionen. 2.2 Weisen Sie nach, dass die in Abschnitt 2.1 definierten Normen xC[a,b] (Maximumnorm) ullen. sowie xCL2 [a,b] die Axiome einer Norm erf¨ p ˘ ¯ 2.3 Zeigen Sie, dass jeder Pr¨ a-Hilbertraum H, (· , ·) mit der Norm u := (u , u) zu einem normierten Raum wird. 2.4 Beweisen Sie Satz 2.7 auf S. 30. 2.5 Beweisen Sie, dass durch AL(U,V ) =
sup
uU =1
A uV im Raum L(U, V ) der linearen
stetigen Operatoren von U nach V eine Norm definiert ist. 2.6 Berechnen Sie die Norm des Integraloperators A : C[0, 1] → C[0, 1], Z 1 ` ´ e(t−s) u(s) ds, t ∈ [0, 1]. A u (t) = 0
2.7 Zeigen Sie, dass jede stark konvergente Folge in einem normierten Raum auch schwach konvergent ist. ˘ ¯ 2.8 Beweisen Sie im Hilbertraum H, (· , ·) folgende wichtige Aussage: Aus un u und ur n → ∞. vn → v folgt (un , vn ) → (u , v) f¨ 2.9 Weisen Sie nach, dass unter Voraussetzung 2.13 von S. 38 die Menge ¯ ˘ u. in Ω u ∈ L2 (Ω) : ua (x) ≤ u(x) ≤ ub (x) f.¨ konvex und abgeschlossen ist. Nutzen Sie die bekannte Aussage, dass aus un L2 (Ω) → 0 die Existenz einer fast u ¨berall punktweise gegen 0 konvergenten Teilfolge von {un } folgt. ¯ ˘ ¯ ˘ aume, yd ∈ Y , λ ≥ 0 und ein linearer stetiger 2.10 Es seien Y, · Y und U, · U Hilbertr¨ Operator S : U → Y gegeben. Beweisen Sie die strenge Konvexit¨ at des Funktionals f (u) = S u − yd 2Y + λ u2U , falls λ positiv oder S injektiv ist.
94
2 Linear-quadratische elliptische Probleme
2.11 Weisen Sie nach, dass die folgenden Funktionale stetig Fr´echet-differenzierbar sind: ` ´ a) f (u) = sin u(1) in C[0, 1], ˘ ¯ b) f (u) = u2H im Hilbertraum H, (· , ·) . 2.12 Zeigen Sie, dass der Integraloperator Z ` ´ A u (t) =
1
0
e(t−s) u(s) ds,
t ∈ [0, 1]
im Raum H = L2 (0, 1) definiert ist und H stetig in H abbildet. 2.13 L¨ osen Sie die quadratische Optimierungsaufgabe in IR, min
˘
v∈[ua ,ub ]
β pv +
λ 2¯ v 2
bei gegebenen reellen Werten ua , ub , β, p sowie λ > 0, indem Sie eine Projektionsformel des Typs (2.58) auf S. 56 herleiten. 2.14 Beweisen Sie die notwendigen Optimalit¨ atsbedingungen zu Aufgabe (2.69)–(2.71) auf S. 59. 2.15 Leiten Sie die notwendigen Optimalit¨ atsbedingungen zum linearen Optimalsteuerungsproblem von S. 63 her. Hinweis: Nutzen Sie die Nichtnegativit¨ at der Differenz der Zielfunktionswerte einer beliebigen und einer optimalen L¨ osung und schreiben Sie die Differentialgleichung f¨ ur die Differenz der beiden L¨ osungen auf. 2.16 Gegeben seien ein beschr¨ anktes Lipschitzgebiet Ω ⊂ IRN , yΩ ∈ L2 (Ω), eΩ ∈ L2 (Ω) und eΓ ∈ L2 (Γ). Die Funktion eΓ sei Randwert einer Funktion y ∈ H 2 (Ω). Leiten Sie die notwendigen Optimalit¨ atsbedingungen f¨ ur die Aufgabe Z (y − yΩ )2 dx min Ω
bei
−Δy = u + eΩ ,
y|Γ = eΓ
und den Box-Restriktionen −1 ≤ u(x) ≤ 1 her.
2.17 Bestimmen Sie die notwendigen Optimalit¨ atsbedingungen f¨ ur das folgende, auf Seite 65 definierte Problem: Z Z Z 1 1 min J(y, u) := (y − yΩ )2 dx + eΓ y ds + u2 dx 2 2 Ω Γ Ω
bei
−Δy + y = u + eΩ ,
∂ν y = eΓ
und den Box-Restriktionen
0 ≤ u(x) ≤ 1.
2.18 Beweisen Sie Satz 2.34 auf S. 72, d.h. die notwendigen Optimalit¨ atsbedingungen erster Ordnung, die in Abschnitt 2.11.1 f¨ ur die Aufgabe (2.36)–(2.38) von Seite 43 nur mit der formalen Lagrangetechnik hergeleitet wurden. 2.19 Bestimmen Sie die f¨ ur die Aufgabe mit Dirichlet-Randsteuerung Z Z (y − yΩ )2 dx + λ u2 ds min Ω
bei
Γ
−Δy y|Γ
= =
0 u
und −1 ≤ u(x) ≤ 1 zu erwartenden notwendigen Optimalit¨ atsbedingungen mit Hilfe der formalen Lagrangetechnik. ur die LaplaceHinweis: Arbeiten Sie mit unterschiedlichen Multiplikatoren p1 bzw. p2 f¨ Gleichung bzw. die Randbedingung.
3 Linear-quadratische parabolische Steuerungsprobleme 3.1 Einf¨ uhrung Vorbetrachtungen Elliptische Differentialgleichungen beschreiben zeitlich station¨are physikalische Vorg¨ange wie z.B. W¨ armeleitprozesse mit einer Temperaturverteilung im Gleichgewichtszustand. Liegt diese Stationarit¨ at nicht vor, dann kommt als weiterer physikalischer Parameter die Zeit ins Spiel. Wir betrachten als Modellfall die Aufgabe der optimalen zeitlich instation¨ aren Randtemperatur aus Abschnitt 1.2.2, wo ein Ortsgebiet Ω, ausgehend von einer Anfangstemperaturverteilung y0 (x), in endlicher Zeit T auf die gew¨ unschte Endtemperaturverteilung yΩ (x) gebracht werden soll. Mathematisch vereinfacht handelt es sich um die Aufgabe 1 min J(y, u) := 2
Ω
y(x, T ) − yΩ (x)
yt − Δy ∂ν y + α y y(x, 0)
2
λ dx + 2
T 0
Γ
u(x, t)2 ds(x)dt
= 0 in Q := Ω × (0, T ) = βu in Σ := Γ × (0, T ) = y0 (x) in Ω
ua (x, t) ≤ u(x, t) ≤ ub (x, t)
f.¨ u. in Σ.
(3.1)
(3.2)
(3.3)
Im Unterschied zu elliptischen Problemen l¨ auft der Prozess im Orts-Zeit-Zylinder Q := Ω×(0, T ) ab, w¨ ahrend die Steuerfunktion u = u(x, t) im obigen Beispiel auf den Ortsrand Γ einwirkt und damit auf Σ := Γ × (0, T ) definiert ist. In diesem Kapitel werden wir die gleichen Schritte absolvieren wie im elliptischen Fall. Erstens zeigen wir, dass zu jeder vorgegebenen Steuerfunktion u = u(x, t) genau eine L¨ osung y = y(x, t) der W¨ armeleitgleichung (3.2) in einem geeigneten Raum existiert. Danach kl¨ aren wir die L¨ osbarkeit der Optimalsteuerungsaufgabe, also die Existenz einer optimalen Steuerung u ¯ mit zugeh¨ origem optimalen Zustand y¯. Diese folgt wieder aus der Stetigkeit des L¨ osungsoperators G : u → y. Schließlich werden notwendige Optimalit¨atsbedingungen hergeleitet.
96
3 Linear-quadratische parabolische Probleme
Die prinzipielle Vorgehensweise ist aus Sicht der Optimierung identisch mit der im elliptischen Fall, aber die Theorie der schwachen L¨osungen parabolischer Gleichungen ist etwas komplizierter. Neben Ableitungen zweiter Ordnung nach den Ortsvariablen tritt noch eine Ableitung von y nach der Zeit auf, die nur von erster Ordnung ist. Das erfordert einen anderen L¨ osungsraum und f¨ uhrt auch dazu, dass als adjungierte Gleichung eine R¨ uckw¨ artsgleichung bez¨ uglich t zu betrachten ist. Formale Herleitung der Optimalit¨ atsbedingungen Um schon vorab eine Vorstellung davon zu haben, welche Optimalit¨atsbedingungen wir hier erwarten k¨ onnen, wenden wir wieder die formale Lagrangetechnik an. Sie liefert das richtige Ergebnis, wie wir sp¨ ater sehen werden. Dazu wird f¨ ur die Aufgabe (3.1)–(3.3) die Lagrangefunktion L eingef¨ uhrt, L(y, u, p) = J(y, u) − ∂ν y + α y − β u) p2 dsdt, (yt − Δy) p1 dxdt − Σ
Q
in der wir die komplizierten“ differentiellen Nebenbedingungen verankert haben, w¨ah” rend wir die Anfangsbedingung sowie die Ungleichungen an u explizit mitf¨ uhren und deshalb nicht durch Lagrangesche Multiplikatoren eliminieren. Hier k¨amen wir auch zum Ziel, wenn wir in beiden Integralen die gleiche Funktion p w¨ahlen w¨ urden. Aber bei manchen Aufgabenstellungen f¨ uhrt das zu Schwierigkeiten und deshalb arbeiten wir vorsichtshalber mit zwei verschiedene Funktionen p1 , p2 . Am Ende erhalten wir auf Σ doch noch die Beziehung p1 = p2 . Diese Verfahrensweise sollte man in Zweifelsf¨allen stets anwenden. Im Weiteren schreiben wir oft y(·, t) oder k¨ urzer y(t), um die Schreibweise zu vereinfachen. Sp¨ ater sehen wir y meist als abstrakte Funktion von t an (zur Definition dieses Begriffes siehe S. 113). In der ersten Form y(·, t) wird die Abh¨angigkeit von x angedeutet. Die Menge der zul¨assigen Steuerfunktionen wird hier definiert durch Uad = u ∈ L2 (Σ) : ua (x, t) ≤ u(x, t) ≤ ub (x, t) f.¨ u. in Σ . uckAls zus¨ atzliche Nebenbedingung f¨ ur y ist die Anfangsbedingung y(·, 0) = y0 zu ber¨ sichtigen. Daher folgt aus dem Lagrangeprinzip zun¨achst die Variationsungleichung Dy L(¯ y, u ¯, p)(y − y¯) ≥ 0 f¨ ur alle hinreichend glatten y mit y(·, 0) = y0 . Nach Substitution y := y − y¯ folgt daraus Dy L(¯ y, u ¯, p)y ≥ 0 f¨ ur alle y mit y(·, 0) = 0 und schließlich Dy L(¯ y, u ¯, p)y = 0, denn mit y geh¨ ort auch −y zu dieser Menge. Bez¨ uglich u folgt aus dem Lagrangeprinzip wieder die bereits bekannte Variationsungleichung. Wir erwarten deshalb die notwendigen Optimalit¨ atsbedingungen Dy L(¯ y, u ¯, p) y Du L(¯ y, u ¯, p) (u − u ¯)
f¨ ur alle y mit y(0) = 0 f¨ ur alle u ∈ Uad .
= 0 ≥ 0
Die Auswertung der ersten Beziehung f¨ uhrt auf die adjungierte Gleichung: Wir erhalten yt −Δy p1 dxdt− ∂ν y +αy p2 dsdt. y¯(T )−yΩ y(T ) dx− y, u ¯, p) y = Dy L(¯ Ω
Q
Σ
3.1 Einf¨ uhrung
97
Dabei wurde verwendet, dass die Ableitung der linearen stetigen Abbildung y → y(·, T ) wieder diese Abbildung ist. Nach partieller Integration (bez¨ uglich t in yt und x bei Δy) folgt aus der Greenschen Formel 0= y¯(T ) − yΩ y(T )dx − y(T ) p1 (T )dx + y p1,t dxdt + p1 ∂ν ydsdt Ω Ω Q Σ − y ∂ν p1 dsdt + y Δp1 dxdt − p2 ∂ν ydsdt − αy p2 dsdt Σ
Σ
Q
Σ
f¨ ur alle hinreichend glatten y mit y(0) = 0. Der y(0) enthaltende Term ist wegen y(0) = 0 weggefallen. Wir sortieren nach Integrationsgebieten und erhalten y¯(T ) − yΩ − p1 (T ) y(T ) dx + p1,t + Δp1 y dxdt Ω Q ∂ν p1 + αp2 y dsdt + p1 − p2 ∂ν y dsdt = 0. − Σ
Σ
Zuerst w¨ ahlen wir y beliebig in C0∞ (Q). Dann verschwinden y(T ), y(0) in Ω und y sowie ∂ν y auf Σ, also gilt p1,t + Δp1 y dxdt = 0 ∀ y ∈ C0∞ (Q). Q
Aus der Beliebigkeit von y in Q (Dichtheit von C0∞ (Q) in L2 (Q)) folgt p1,t + Δp1 = 0 in Q. Damit f¨ allt das Integral u ¨ber Q bereits weg. Nun verzichten wir auf die Forderung y(T ) = 0 und erhalten y¯(T ) − yΩ − p1 (T ) y(T ) dx = 0. Ω
Die m¨ oglichen Werte von y(T ) liegen dicht in L2 (Ω), was wir nicht weiter diskutieren. Uns geht es nur um eine formale Herleitung. In gleicher Weise verwenden wir weiter unten die Dichtheit der Randwerte glatter Funktionen y bzw. ihrer Normalenableitungen in L2 (Σ) ohne Kommentar. Deshalb muss p1 (T ) = y¯(T ) − yΩ
in Ω
gelten. Schließlich fordern wir auch nicht mehr y|Σ = 0 und gelangen zu (∂ν p1 + α p2 ) y dsdt = 0 Σ
f¨ ur alle zugelassenen y, also zu ∂ν p1 + α p2 = 0 in Σ. Nun lassen wir auch ∂ν y frei variieren und betrachten den letzten verbliebenen Term p1 − p2 ∂ν y dsdt = 0 Σ
98
3 Linear-quadratische parabolische Probleme
f¨ ur alle hinreichend glatten y. Aus der Dichtheit der Werte ∂ν y in L2 (Σ) folgt schließlich p2 = p1 auf Σ. Wir setzen daher p := p1 und erhalten p2 = p auf Σ. Insgesamt haben wir auf diesem formalen Weg das System −pt = Δp ∂ν p + α p = 0 p(T ) = y¯(T ) − yΩ
in Q in Σ in Ω
(3.4)
gefunden, die adjungierte Gleichung. Die Auswertung der Variationsungleichung f¨ ur Du L ergibt y, u ¯, p)(u − u ¯) Du L(¯
= λ u ¯ (u − u ¯) dsdt + β p (u − u ¯) dsdt Σ Σ (λ u ¯ + β p)(u − u ¯) dsdt ≥ 0. = Σ
Deshalb muss die Variationsungleichung Σ
(λ u ¯ + β p)(u − u ¯) dsdt ≥ 0
∀ u ∈ Uad
(3.5)
erf¨ ullt sein. Diese Herleitung erfolgte sehr formal, ohne R¨ ucksicht auf mathematische Strenge. Beispielsweise haben wir die Zeitableitungen yt und pt als normale Funktionen verwendet und keine Aussagen u aume getroffen, in denen y und p sowie ihre Ableitungen ¨ber die R¨ liegen sollen. Auch die sorglose Verwendung der Anfangs- bzw. Endwerte von y und p ist zumindest leichtsinnig. Die mehrmals verwendete Dichtheit der Randwerte von y bzw. ∂ν y ist ohne konkrete Voraussetzungen an die Glattheit des Randes von Ω nicht immer richtig. Wir k¨ onnen also an dieser Stelle lediglich vermuten, dass unser Ergebnis richtig ist. Die mathematisch saubere Herleitung der gefundenen Optimalit¨atsbedingungen erfolgt in diesem Kapitel. Die Lagrangefunktion liefert aber bei sinnvoller Anwendung in jedem Fall eine bequeme und einpr¨ agsame Formulierung dieser Bedingungen. Empfohlene Reihenfolge f¨ ur das Lesen der weiteren Abschnitte Im weiteren Verlauf dieses Kapitels werden wir den Begriff der schwachen L¨osung linearer parabolischer Gleichungen definieren, die Existenz und Eindeutigkeit solcher L¨osungen zeigen und danach die optimierungstheoretischen Fragen kl¨aren. Zuerst wird aber der ¨ ortlich eindimensionale parabolische Fall mit Hilfe der Fouriermethode behandelt. Diese Methode kommt ohne die Theorie schwacher L¨osungen parabolischer Gleichungen aus und ist deshalb von Vorteil f¨ ur solche Leser, die diese Theorie erst sp¨ater studieren wollen. Die Fouriermethode ist aber auch f¨ ur sich interessant, da sie ¨aquivalent zur Anwendung von stark stetigen Halbgruppen ist. Außerdem erhalten wir so auf relativ elementare Weise das bekannte Bang-Bang-Prinzip f¨ ur optimale Steuerungen bei reinem Endwert-Funktional.
3.2 Die Fouriermethode im ¨ ortlich eindimensionalen Fall
99
Leser, die sich lieber gleich mit der Theorie schwacher L¨osungen vertraut machen wollen, k¨onnen den Abschnitt 3.2 zun¨ achst u ¨berspringen und sofort mit Abschnitt 3.3 fortsetzen, der Abschnitt 3.2 nicht voraussetzt.
3.2 Die Fouriermethode im ¨ ortlich eindimensionalen Fall 3.2.1 Eindimensionale Modellprobleme Ein Randsteuerungsproblem Im Weiteren interpretieren wir die gestellten Aufgaben wieder als Aufheizungsprobleme, um einen physikalischen Hintergrund vor Augen zu haben. Wir betrachten die optimale Aufheizung des eindimensionalen Ortsgebiets Ω = (0, 1) durch eine als Steuerung am rechten Rand x = 1 wirkende Steuerung u = u(t), min J(y, u) :=
1 2
0
1
y(x, T ) − yΩ (x)
2
dx +
λ 2
0
T
u(t)2 dt
(3.6)
bei yt (x, t) yx (0, t) yx (1, t) y(x, 0)
= = = =
yxx (x, t) 0 β u(t) − α y(1, t) 0
in in in in
(0, 1) × (0, T ) (0, T ) (0, T ) (0, 1)
(3.7)
und den Beschr¨ ankungen an die Steuerung u. in (0, T ). ua (t) ≤ u(t) ≤ ub (t) f.¨
(3.8)
Voraussetzung 3.1 Gegeben sind reelle Zahlen T > 0 (Aufheizungsdauer), α ≥ 0 u. auf (0, T ), (W¨arme¨ ubergangszahl), λ ≥ 0 sowie Funktionen β ∈ L∞ (0, T ), β(t) ≥ 0 f.¨ yΩ ∈ L2 (0, 1) (gew¨ unschte Endtemperaturverteilung) sowie ua , ub ∈ L2 (0, T ) mit ua (t) ≤ ub (t) f.¨ u. in (0, T ). Die gesuchte Steuerung u geh¨ ore zu L2 (0, T ). Falls ua und ub beschr¨ankte und messbare Funktionen sind, dann ist jede zul¨ assige Steuerung automatisch essentiell beschr¨ankt. Aus physikalischer Sicht ist eigentlich β = α zu setzen, denn die Randbedingung am rechten Rand lautet physikalisch richtig yx (1, t) = α u(t) − y(1, t) (der Temperaturanstieg yx (1, t) ist am Rand proportional zur Differenz zwischen Außentemperatur u(t) und Randtemperatur y(1, t)). Durch unsere Formulierung der Randbedingung k¨onnen wir aber mit der Wahl α = 0 auch Neumannsche Randbedingungen betrachten. Aus mathematischen Gr¨ unden ist es ebenfalls sinnvoll, α und β zu entkoppeln. Bemerkungen. Insgesamt ist diese Aufgabenstellung aus physikalischer Sicht akademisch. Die Betrachtung eines eindimensionalen Ortsgebiets Ω, d.h. eines Intervalls der reellen Achse, ist nicht realistisch. Man kann sich die Aufheizung eines sehr d¨ unnen Stabes der L¨ ange 1 vorstellen, der mit Ausnahme des rechten Endes x = 1 vollst¨ andig temperaturisoliert ist. Die Randbedinur eine gung yx = 0 am linken Ende x = 0 modelliert Temperaturisolation. Analog kann sie f¨
100
3 Linear-quadratische parabolische Probleme
Symmetriebedingung stehen, wenn der Stab die L¨ ange 2 hat (rechtes Ende x = −1, rechtes Ende x = 1) und die Aufheizung links und rechts mit der gleichen Temperatur u(t) erfolgt. Etwas realistischer ist die Interpretation als Aufheizung einer unendlich ausgedehnten Platte der Dicke 1 (ihre beiden Oberfl¨ achen seien orthogonal zur x-Achse), bei der die rechte Oberfl¨ ache durch u(t) aufgeheizt wird und die linke temperaturisoliert ist. Analog kann man sich eine Platte der Dicke 2 mit linker und rechter Randtemperatur u(t) vorstellen. Außerdem nimmt dieses Modell an, dass die W¨ armeausbreitung im Inneren der Platte mit der Temperaturleitzahl 1 erfolgt. Auch das ist nicht realistisch. Es geht uns aber hier nicht prim¨ ar um eine Darstellung von W¨ armeleitprozessen, sondern um die Erl¨ auterung von Grundprinzipien der optimalen Steuerung. Das funktioniert am besten f¨ ur vereinfachte, akademische Modelle. Die Wahl einer homogenen Anfangstemperatur erfolgte nur aus methodischen Gr¨ unden.
Ein Problem mit steuerbarer Temperaturquelle Auch die Steuerung einer Temperaturquelle innerhalb des Ortsgebiets ist physikalisch sinnvoll, z.B. bei induktiver Aufheizung von Metallen. Zur Abwechslung betrachten wir eine andere Zielfunktion. Hier geht es um die Verfolgung eines gew¨ unschen instation¨aren Temperaturverlaufs yQ (x, t) in Q = (0, 1) × (0, T ). Die Aufgabe lautet min J(y, u) :=
1 2
0
T
1
0
y(x, t) − yQ (x, t)
2
dxdt +
λ 2
T
0
0
1
u(x, t)2 dxdt
(3.9)
bei yt (x, t) yx (0, t) yx (1, t) + α y(1, t) y(x, 0)
= = = =
yxx (x, t) + u(x, t) 0 0 0
in in in in
(0, 1) × (0, T ) (0, T ) (0, T ) (0, 1)
(3.10)
und den Beschr¨ ankungen an die Steuerung ua (x, t) ≤ u(x, t) ≤ ub (x, t)
f.¨ u. in Q.
(3.11)
Es sind homogene Neumann-Randbedingungen gegeben (Temperaturisolation). Analog h¨ atten feste Randtemperaturen in Randbedingungen dritter Art vorgegeben werden k¨ onnen. Die Funktionen yQ sowie ua ≤ ub sind in L2 (Q) fixiert.
3.2.2 Integraldarstellung von L¨ osungen – Greensche Funktion Die L¨ osungen linearer parabolischer Anfangs-Randwertprobleme k¨onnen unter gewissen Voraussetzungen mit Hilfe von Fourier-Reihen angegeben werden, die man durch Trennung der Ver¨ anderlichen herleiten kann. Diese Methode kommt ohne die Theorie schwacher L¨ osungen aus und ist daher relativ einfach. Allerdings ist sie in ihrer Anwendbarkeit auf Ortsgebiete einfacher Geometrie begrenzt (z.B. f¨ ur N > 1 auf Quader oder Kugeln, vgl. aber Glashoff und Weck [76]). Dazu behandeln wir die Anfangs-Randwertaufgabe f¨ ur die ¨ortlich eindimensionale W¨armeleitungsgleichung
3.2 Die Fouriermethode im ¨ ortlich eindimensionalen Fall
yt (x, t) − yxx (x, t) yx (0, t) yx (1, t) + α y(1, t) y(x, 0)
= = = =
101
f (x, t) 0 u(t) y0 (x)
(3.12)
in Q = (0, 1) × (0, T ), wobei f ∈ L2 (Q), y0 ∈ L2 (0, 1), u ∈ L2 (0, T ) und eine Konstante α ≥ 0 gegeben sind. F¨ ur hinreichend glatte Vorgaben f, y0 , u hat die Gleichung eine klassische L¨ osung y, die mittels einer Greenschen Funktion G = G(x, ξ, t) in der Gestalt y(x, t) =
1 0
G(x, ξ, t) y0 (ξ) dξ + t
+ 0
t 0
0
1
G(x, ξ, t − s) f (ξ, s) dξds (3.13)
G(x, 1, t − s) u(s) ds
dargestellt werden kann. In den f¨ ur uns aus physikalischer Sicht interessanten F¨allen f¨ ur die Konstante α hat G die Form einer Fourier-Reihe ⎧ ∞ ⎪ ⎪ 1 + 2 cos(nπx) cos(nπξ) exp(−n2 π 2 t) f¨ ur α = 0 ⎪ ⎨ n=1 G(x, ξ, t) = (3.14) ∞ ⎪ 1 ⎪ 2 ⎪ cos(μn x) cos(μn ξ) exp(−μn t) f¨ ur α > 0. ⎩ Nn n=1 Dabei bezeichnet μn ≥ 0 die nach wachsender Gr¨oße geordneten L¨osungen von μ tan μ = α und Nn = 1/2+sin(2μn )/(4μn ) sind gewisse Normierungsfaktoren. Die Zahlen n π bzw. μn sind die Eigenwerte des Operators ∂ 2 /∂x2 bei den in (3.12) formulierten Randbedingungen mit homogener rechter Seite, w¨ ahrend die Funktionen cos(nπx) bzw. cos(μn x) die zugeh¨ origen Eigenfunktionen sind. Die obigen Reihenentwicklungen werden in Abschnitt 3.8 hergeleitet. Wir verweisen auch auf Tychonoff und Samarski [200]. Die Greensche Funktion ist nichtnegativ, symmetrisch in den Variablen x und ξ und wird f¨ ur x = ξ singul¨ ar bei t = 0. In (x = ξ, t = 0) liegt eine sogenannte schwache Singularit¨at vor. Man erh¨ alt y ∈ L2 (Q), wenn die Vorgaben f ∈ L2 (Q), y0 ∈ L2 (0, 1) und 2 u ∈ L (0, T ) gegeben sind. Die entsprechende Absch¨atzung ist in [196] unter Verwendung von Absch¨ atzungen u ¨ ber die Greensche Funktion aus Friedman [70] erl¨autert. Definition. Die durch (3.13) mit gegebenen quadratisch integrierbaren Funktionen f , u und y0 dargestellte Funktion y nennen wir verallgemeinerte L¨osung von (3.12). Die drei Summanden in (3.13) k¨ onnen einzeln als lineare Operatoren sinnvoll definiert werden. F¨ ur die Diskussion der Anfangs-Randwertaufgabe (3.12) interessieren uns folgende zwei F¨ alle: (i) u := β u, f = y0 = 0 (Randsteuerung): Im Zielfunktional (3.9) tritt nur der Endwert y(x, T ) auf. Aus (3.13) ergibt sich T G(x, 1, T − s) β(s) u(s) ds =: Su (x). y(x, T ) = 0
(3.15)
102
3 Linear-quadratische parabolische Probleme
Der Integraloperator S stellt den Teil des Zustands y dar, der im Zielfunktional auftritt, hier den Endwert y(T ). Er bildet den Raum L2 (0, T ) stetig in L2 (0, 1) ab, [196]. Dieses Raumpaar legen wir der Definition zugrunde, S : L2 (0, T ) → L2 (0, 1). ¨ Die Abbildungseigenschaft folgt auch aus der Aquivalenz mit schwachen L¨osungen und deren Eigenschaften, siehe Satz 3.13 auf S. 121. (ii) u = y0 = 0 (verteilte Steuerung): Dieser Fall tritt im Problem der gesteuerten Temperaturquelle auf. Aus (3.13) folgt die Darstellung t 1 y(x, t) = G(x, ξ, t − s) f (ξ, s) dξds =: S f (x, t). (3.16) 0
0
S bildet den Raum L (Q) = L2 (0, 1) × (0, T ) linear und stetig in sich ab. Wir legen dieses Raumpaar der Definition von S zugrunde, aber S ist sogar linear und stetig von L2 (Q) in C [0, T ], L2 (0, 1) , [196]. Das ist ein Raum abstrakter Funktionen, den wir im Abschnitt 3.4.1 auf S. 114 einf¨ uhren. Er beinhaltet eine gewisse Stetigkeit in der Variablen t, die insbesondere die Konvergenz y(x, t) → 0 f¨ ur t ↓ 0 sichert. Wir halten fest: 2
S : L2 (Q) → L2 (Q). Diese Eigenschaften folgen auch aus Satz 3.13 auf S. 121 u ¨ ber schwache L¨osungen.
3.2.3 Notwendige Optimalit¨ atsbedingungen Mit den angegebenen Integraldarstellungen lassen sich die ¨ortlich eindimensionalen parabolischen Optimalsteuerungsprobleme sehr einfach theoretisch behandeln. Randsteuerungsproblem Wir untersuchen zuerst die Aufgabe (3.6)–(3.8), in Kurzform min J(y, u) := bei u ∈ Uad und
λ 1 y(T ) − yΩ 2L2 (0,1) + u 2L2 (0,T ) 2 2
yt (x, t) yx (0, t) yx (1, t) + α y(1, t) y(x, 0)
= = = =
yxx (x, t) 0 β(t) u(t) 0,
u. in (0, T ) . Zur Vereinfachung des mit Uad = u ∈ L2 (0, T ) : ua (t) ≤ u(t) ≤ ub (t) f.¨ Problems setzen wir die Integraldarstellung (3.15) f¨ ur y(x, T ) in das Zielfunktional ein, d.h. S u = y(·, T ), und erhalten die quadratische Optimierungsaufgabe im Hilbertraum min f (u) :=
u∈Uad
1 λ S u − yΩ 2L2 (0,1) + u 2L2 (0,T ) . 2 2
3.2 Die Fouriermethode im ¨ ortlich eindimensionalen Fall
103
Darauf ist der allgemeine Existenzsatz 2.14 von S.40 anwendbar, denn S : L2 (0, T ) → L2 (0, 1) ist stetig. Er sichert die Existenz mindestens einer optimalen Steuerung u¯ f¨ ur das Randsteuerungsproblem (3.6)–(3.8), die im Fall λ > 0 eindeutig bestimmt ist. Die zugeh¨ orige verallgemeinerte L¨ osung sei y¯. Aus Satz 2.22 auf S. 51 erhalten wir als notwendige und hinreichende Optimalit¨ atsbedingung die Variationsungleichung (2.45) von S. 51, hier ∗ S (S u ¯ − yΩ ) + λ u ¯, u−u ¯ L2 (0,T ) ≥ 0 ∀u ∈ Uad . (3.17) Sie enth¨ alt den adjungierten Operator S ∗ . Unsere Erfahrungen mit elliptischen Problemen lassen vermuten, dass dieser mit einer adjungierten Differentialgleichung zusammenh¨ angen muss. Dazu bestimmen wir die Form des adjungierten Integraloperators S ∗ . Er ist eindeutig festgelegt durch die Beziehung v , S u L2 (0,1) = S ∗ v , u L2 (0,T )
∀ u ∈ L2 (0, T ), ∀ v ∈ L2 (0, 1).
Wir geben u ∈ L2 (0, T ), v ∈ L2 (0, 1) beliebig aber fest vor und rechnen wie folgt:
v , Su L2 (0,1)
1
=
0
1
v(x)
= 0
0
T
T
0
G(x, 1, T − s) β(s) u(s) ds dx
u(s) β(s) G(x, 1, T − s) v(x) ds dx
1
u(s) β(s) G(x, 1, T − s) v(x) dx ds = 0 0 = u , S ∗ v L2 (0,T ) = S ∗ v , u L2 (0,T ) .
Wir haben somit
T
S ∗ v (t) = β(t)
1
0
(Satz v. Fubini)
G(ξ, 1, T − t) v(ξ) dξ.
(3.18)
Lemma 3.2 Es gilt S ∗ v (t) = β(t) p(1, t), wobei p die verallgemeinerte L¨osung des folgenden parabolischen Endwertproblems ist: −pt (x, t) px (0, t) px (1, t) + α p(1, t) p(x, T )
= = = =
pxx (x, t) 0 0 v(x).
Beweis: Aus Formel (3.18) folgt mit der Symmetrie der Greenschen Funktion
S ∗ v (t) = β(t)
0
1
G(1, ξ, T − t) v(ξ) dξ.
Wir definieren nun p : [0, 1] × [0, T ] → IR durch p(x, t) :=
0
1
G(x, ξ, T − t) v(ξ) dξ
104
3 Linear-quadratische parabolische Probleme
und f¨ uhren nach der Zeittransformation τ = T − t die Funktion p˜(x, τ ) = p(x, t) = p(x, T − τ ) ein. Dann hat p˜ die Form p˜(x, τ ) =
1
0
G(x, ξ, τ ) v(ξ) dξ
und l¨ ost nach Formel (3.13) die Aufgabe p˜τ (x, t) p˜x (0, τ ) p˜x (1, τ ) + α p˜(1, τ ) p˜(x, 0)
= = = =
p˜xx (x, t) 0 0 v(x).
Nach Ausf¨ uhrung der R¨ ucksubstitution p˜(x, τ ) = p(x, t) ergibt sich unter Beachtung von Dτ p˜(x, τ ) = Dτ p(x, T − τ ) = −Dt p(x, t) die zu beweisende Gleichung f¨ ur p. Bemerkung. Die Gleichung f¨ur p ist in Bezug auf t eine R¨uckw¨artsgleichung. Aber sie ist korrekt gestellt, denn dazu passend ist eine Endbedingung vorgegeben und keine Anfangsbedingung, was f¨ ur inkorrekt gestellte r¨ uckw¨ arts-parabolische Gleichungen aus der Theorie inverser Probleme charakteristisch w¨ are. Nun k¨ onnen die notwendigen – und wegen Konvexit¨at auch hinreichenden – Optimalit¨ atsbedingungen formuliert werden: Satz 3.3 Eine Steuerung u ¯ ∈ Uad mit zugeh¨origem Zustand y¯ ist genau dann optimal f¨ ur das ¨ortlich eindimensionale Randsteuerungsproblem (3.6)-(3.8), wenn mit der verallgemeinerten L¨osung p ∈ L2 (Q) der adjungierten Gleichung −pt (x, t) px (0, t) px (1, t) + α p(1, t) p(x, T )
= = = =
pxx (x, t) 0 0 y¯(x, T ) − yΩ (x)
(3.19)
die folgende Variationsungleichung erf¨ ullt ist: 0
T
β(t) p(1, t) + λ u ¯(t) u(t) − u ¯(t) dt ≥ 0
∀u ∈ Uad .
(3.20)
Beweis: Die Behauptung ergibt sich direkt durch Einsetzen der Darstellung von S ∗ aus Lemma 3.2 in die Variationsungleichung (3.17). Wir wenden sie mit v := y¯(T ) − yΩ an. Die Funktion p heißt adjungierter Zustand zu (¯ u, y¯). Analog zu Lemma 2.26 auf S. 54 erhalten wir: Lemma 3.4 Die Variationsungleichung (3.20) gilt genau dann, wenn f¨ ur fast alle t ∈ [0, T ] die folgende Variationsungleichung in IR erf¨ ullt ist: β(t) p(1, t) + λ u ¯(t) v − u ¯(t) ≥ 0 ∀ v ∈ [ua (t), ub (t)]. (3.21)
3.2 Die Fouriermethode im ¨ ortlich eindimensionalen Fall
105
Folgerung. Im Fall λ > 0 muss die optimale Steuerung fast u ¨berall in [0, T ] der Projektionsbeziehung β(t) u ¯(t) = IP[ua (t),ub (t)] − p(1, t) λ gen¨ ugen. F¨ ur λ = 0 ist u ¯(t) in allen Punkten t ∈ (0, T ) mit β(t) p(1, t) = 0 festgelegt, ua (t), falls β(t) p(1, t) > 0 u ¯(t) = ub (t), falls β(t) p(1, t) < 0. Der Beweis verl¨ auft wie f¨ ur den elliptischen Fall auf S. 56. Verteilte Steuerung Das Problem (3.9)–(3.11) auf S. 100 wird analog behandelt. Die Existenz einer optimalen Steuerung u ¯ folgt aus Satz 2.14 auf S. 40. Sie ist eindeutig bestimmt, da hier S injektiv ist. Zur Anwendung der notwendigen Optimalit¨atsbedingung (2.45) auf S. 51 bestimmen wir wieder den adjungierten Operator S∗ in L2 (Q). Die Darstellung von S∗ findet man wie bei der Randsteuerung. Es gilt T 1 t 1
v , Su L2 (Q) = u(ξ, s) G(x, ξ, t − s) v(x, t) dξds dxdt 0
0
T
0
0
T 1
u(x, t) G(ξ, x, s − t) v(ξ, s) dξds dxdt t 0 0 0 = u , S∗ v L2 (Q) .
1
=
Die eben verwendete Vertauschung der Integrationsreihenfolge bei Integralen mit ver¨anderlicher oberer Grenze ist z.B. bei Emmrich [65], S. 203, erl¨autert. Daraus folgt T 1 ∗ S v (x, t) = G(ξ, x, s − t) v(ξ, s) dξds. 0
t
Lemma 3.5 Die Funktion
p(x, t) = t
T
0
1
G(ξ, x, s − t) v(ξ, s) dξds
ist verallgemeinerte L¨osung von −pt (x, t) px (0, t) px (1, t) + α p(1, t) p(x, T )
= = = =
pxx (x, t) + v(x, t) 0 0 0.
Beweis: Wir verwenden die Greensche Funktion (3.14) und substituieren τ = T − t, σ = T − s. Dann l¨ auft die Integrationsvariable σ von T − t = τ nach 0, also von τ nach 0. Außerdem gilt dσ = −ds. Wir erhalten 0 1 p(x, T − τ ) = − G(ξ, x, τ − σ) v(ξ, T − σ) dξdσ
τ τ
= 0
0
1
0
G(x, ξ, τ − σ) v(ξ, T − σ) dξdσ =: p˜(x, τ ).
106
3 Linear-quadratische parabolische Probleme
Die Funktion p˜ ist nach Formel (3.13) die verallgemeinerte L¨osung der (vorw¨arts-) parabolischen Gleichung p˜τ = p˜xx +v(x, T −τ ), p˜(x, 0) = 0 bei homogenen Randbedingungen. Aus p˜τ = −pt (x, T − τ ) = −pt (x, t) folgt die Aussage des Lemmas. Insgesamt ergeben sich damit folgende notwendige Optimalit¨atsbedingungen: Satz 3.6 Eine Steuerung u ¯ ∈ Uad mit zugeh¨origem Zustand y¯ ist genau dann optimal f¨ ur die Aufgabe der optimalen Temperaturquelle (3.9)-(3.11) auf S. 100, wenn mit der L¨osung p ∈ L2 (Q) der adjungierten Gleichung −pt (x, t) px (0, t) px (1, t) + α p(1, t) p(x, T )
= = = =
pxx (x, t) + y¯(x, t) − yQ (x, t) 0 0 0
die Variationsungleichung (p + λ u ¯) (u − u ¯) dxdt ≥ 0
∀u ∈ Uad
Q
bzw. f¨ ur fast alle (x, t) ∈ Q die folgende punktweise Beziehung erf¨ ullt ist: p(x, t) + λ u ¯(x, t) v − u ¯(x, t) ≥ 0 ∀ v ∈ [ua (x, t), ub (x, t)]. Daraus erhalten wir wie im elliptischen Fall explizite Ausdr¨ ucke zur Bestimmung von u ¯: F¨ ur λ > 0 muss die optimale Steuerung fast u ¨ berall in Q der Projektionsbeziehung 1 u ¯(x, t) = IP[ua (x,t),ub (x,t)] − p(x, t) λ gen¨ ugen. F¨ ur λ = 0 gilt fast u ¨ berall ua (x, t), u ¯(x, t) = ub (x, t),
p(x, t) > 0 p(x, t) < 0.
falls falls
(3.22)
3.2.4 Bang-Bang-Prinzip Wir diskutieren noch einmal das Problem der optimalen Randsteuerung (3.6)–(3.8), jetzt aber ohne Regularisierungsparameter, also f¨ ur λ = 0. Das Fehlen des regularisierenden Anteils wird sich in geringerer Regularit¨ at der optimalen Steuerung niederschlagen. Der ¨ besseren Ubersichtlichkeit halber w¨ ahlen wir die Schranken ua = −1, ub = 1, fixieren β(t) ≡ 1, α ≥ 0 sowie yΩ ∈ L2 (0, 1). Gegeben sei die Aufgabe 2 1 1 y(x, T ) − yΩ (x) dx min 2 0 bei yt (x, t) yx (0, t) yx (1, t) y(x, 0)
= = = =
yxx (x, t) 0 u(t) − α y(1, t) 0
in in in in
(0, 1) × (0, T ) (0, T ) (0, T ) (0, 1)
3.2 Die Fouriermethode im ¨ ortlich eindimensionalen Fall
107
und |u(t)| ≤ 1 Aus (3.22) folgt
u ¯(t) =
1, −1,
in (0, T ). falls p(1, t) < 0 falls p(1, t) > 0.
Diese Beziehung liefert aber keine Information in den Punkten t mit p(1, t) = 0. Es zeigt sich nun bei Aufgaben des obigen Typs, dass dies unter Voraussetzung eines positiven Optimalwerts nur isolierte Punkte betreffen kann. Satz 3.7 (Bang-Bang-Prinzip) Es sei u ¯ optimale Steuerung des Randsteuerungsproblems (3.6)–(3.8) auf S. 99 mit den Daten λ = 0, ua = −1, ub = 1 und β = 1. Wenn ¯ y (·, T ) − yΩ 2L2 (0,1) > 0 erf¨ ullt ist, dann hat die Funktion p(1, t) h¨ochstens abz¨ahlbar viele Nullstellen, die sich nur bei t = T h¨aufen k¨onnen. Folglich gilt |¯ u(t)| = 1
f.¨ u. auf (0, T )
und u ¯ ist st¨ uckweise konstant gleich ±1 mit h¨ochstens abz¨ahlbar vielen Umschaltpunkten in den Nullstellen von p(1, t).
u¯ 1 t T -1 Bang-Bang-Steuerung
Beweis: Wir nehmen α > 0 an, so dass die untere Darstellung aus (3.14) f¨ ur G zu verwenden ist. Im Fall α = 0 verl¨ auft der Beweis v¨ollig analog mit der oberen Formel. Wir setzen d := y¯(·, T )−yΩ . Dann gilt laut Voraussetzung d L2 (0,1) = 0. Der adjungierte Zustand p¯ hat nach (3.18) und Satz 3.3 bei x = 1 die Darstellung 1 ∗ G(ξ, 1, T − t) d(ξ) dξ p(1, t) = S d (1, t) = 0 1 ∞ 1 1 2 √ √ = cos(μn ) exp(−μn (T − t)) cos(μn ξ) d(ξ) dξ . Nn Nn n=1 0 =dn
uglich des Orthonormalsystems der Dabei sind die dn die Fourierkoeffizienten von d bez¨ 1 Eigenfunktionen √N cos(μn x), vgl. S. 101. Die Folge {dn }∞ n=1 ist nach der Besselschen n
108
3 Linear-quadratische parabolische Probleme
Ungleichung quadratisch summierbar. Die μn verhalten sich f¨ ur n → ∞ asymptotisch wie (n − 1)π. Daher klingt der Term exp(−μ2n (T − t)) f¨ ur alle t < T exponentiell ab, dass f¨ ur t < T s¨ amtliche Zeitableitungen beliebiger Ordnung der obigen unendlichen Reihe existieren. Die Glieder der beliebig oft abgeleiteten Reihe fallen ebenfalls exponentiell f¨ ur n → ∞. Man sieht auf diese Weise, dass die Fortsetzung ins Komplexe, ϕ(z) :=
∞ n=1
√
1 cos(μn ) exp − μ2n (T − z) dn , Nn
eine analytische Funktion der komplexen Variablen z in der Halbebene Re(z) < T ist. Nun gibt es zwei verschiedene M¨ oglichkeiten: (i) ϕ(z) ≡ 0 : Dann kann ϕ wegen des Identit¨atssatzes f¨ ur analytische Funktionen in jedem kompakten Teilbereich der Halbebene Re(z) < T nur endlich viele Nullstellen besitzen, insbesondere auch in jedem Intervall [0, T − ε], 0 < ε < T , der reellen Achse. (ii) ϕ(z) ≡ 0 : Hier gilt auch p(1, t) ≡ 0 in (−∞, T ), d.h. ∞ n=1
√
1 cos(μn ) exp − μ2n (T − t) dn = 0 ∀ t < T. Nn
Multiplikation dieser Gleichung mit exp(μ21 (T − t)) ergibt ∞ 1 1 √ √ cos(μ1 ) d1 + cos(μn ) exp − (μ2n − μ21 )(T − t) dn = 0. Nn N1 n=2
Der Grenz¨ ubergang t → −∞ liefert d1 = 0. Nach Multiplikation mit exp(μ22 (T − t)) und erneutem Grenz¨ ubergang erh¨ alt man analog d2 = 0. Fortf¨ uhrung des Prozesses ergibt dn = 0 ∀ n ∈ IN. Also muss d = 0 im Fall (ii) gelten, was der Voraussetzung d = 0 widerspricht. Fall (ii) kann demnach nicht eintreten und es bleibt nur Fall (i) u ¨brig, in dem die Behauptung des Satzes stimmt. Folgerung. Unter den Voraussetzungen des Bang-Bang-Prinzips (λ = 0, positiver Optimalwert) ist die optimale Steuerung eindeutig bestimmt. Beweis: Es seien u ¯1 , u ¯2 zwei verschiedene optimale Steuerungen mit zugeh¨origen optimalen Zust¨ anden y¯1 , y¯2 und j der optimale Wert f¨ ur y(T ) − yΩ . Dann ist auch u := (¯ u1 + u ¯2 )/2 optimal: Zu u geh¨ ort der Zustand y = (¯ y1 + y¯2 )/2. Wegen Konvexit¨ at von Uad geh¨ ort u zu Uad und aus der Dreiecksungleichung folgt y(T ) − yΩ L2 (0,1)
Also muss
1 = y¯1 (T ) + y¯2 (T ) − yΩ L2 (0,1) 2 1 y¯1 (T ) − yΩ L2 (0,1) + 1 y¯2 (T ) − yΩ 2 ≤ = j. L (0,1) 2 2 y(T ) − yΩ 2 =j L (0,1)
gelten, denn kleiner als der Optimalwert kann das Funktional an der Stelle u = (¯ u1 + u ¯2 )/2 nicht sein. Nach dem letzten Satz m¨ ussen u ¯1 , u ¯2 Bang-Bang-L¨osungen sein. F¨ ur (¯ u1 + u ¯2 )/2 kann das nicht auch noch zutreffen, im Widerspruch zum letzten Satz.
3.2 Die Fouriermethode im ¨ ortlich eindimensionalen Fall
109
Beispiel. F¨ ur die von Schittkowski [183] gestellte Aufgabe 1 min 2
1
0
y(x, T ) − yΩ (x)
2
dx
bei yt (x, t) yx (0, t) yx (1, t) y(x, 0)
= = = =
yxx (x, t) 0 u(t) − y(1, t) 0,
|u(t)| ≤ 1, 1 bestimmt man unter Vorgabe von yΩ (x) = (1 − x2 ), T = 1.58, numerisch eine L¨osung 2 mit einem Umschaltpunkt. Dieser liegt bei 1.329, vgl. die Abbildung.
1
u¯ t T
-1 Berechnete Bang-Bang-Steuerung
Mit einer Kombination aus numerischer Berechnung und sorgf¨altigen Absch¨atzungen der Fourier-Reihen l¨ asst sich zeigen, dass der Optimalwert positiv ist und die optimale Steuerung genau einen Umschaltpunkt in [1.329, 1.3294] besitzt, [61]. Literaturhinweise. Weitere Ergebnisse zur Theorie des Bang-Bang-Prinzips in der Steuerung parabolischer Gleichungen sind in [90] zusammengestellt sowie in den Arbeiten [75], [76], [125], [182], [184], [185], [196], um nur einige der zahlreichen Beitr¨ age zu nennen. In [119] wurde bewiesen, dass f¨ ur den Fall der Maximumnorm an Stelle der L2 -Norm die optimale Steuerung bei positivem Optimalwert nur endlich viele Umschaltpunkte haben kann. Numerische Anwendungen durch Berechnung von Umschaltpunkten werden zum Beispiel in [66], [152] angegeben oder im Fall gemischter Steuerungs-Zustandsrestriktionen in [195]. Das Arbeiten mit Greenschen Funktionen ist auch im mehrdimensionalen Fall m¨ oglich. Darauf wird hier nicht eingegangen. Wir verweisen auf [76] sowie auf die Anwendung der Integralgleichung f¨ ur semilineare Gleichungen in [196]. Eine Verallgemeinerung besteht in der Verwendung von stark stetigen Halbgruppen, die im Hinblick auf die Steuerungstheorie detailliert in [24], [25] oder [68] dargestellt ist.
110
3 Linear-quadratische parabolische Probleme
3.3 Schwache L¨ osungen in W21,0 (Q) Wir betrachten als Muster f¨ ur parabolische Gleichungen das parabolische Gegenst¨ uck zur Aufgabe (2.11) auf S. 27, yt − Δy + c0 y ∂ν y + α y y(·, 0)
= f in Q = Ω × (0, T ) = g in Σ = Γ × (0, T ) = y0 (·) in Ω
(3.23)
und beschr¨ anken uns von vornherein auf Randbedingungen dritter Art. Es ist unproblematisch, Γ in Γ0 und Γ1 aufzuspalten und auf Γ0 homogene Dirichlet-Daten vorzugeben, vgl. (2.11) auf S. 27. Die Vorgabe inhomogener nichtglatter Dirichlet-Daten ist komplizierter und wird hier nicht besprochen. Solche Randwertaufgaben werden beispielsweise in [144] oder mit Hilfe der Theorie stark stetiger Halbgruppen in [24], [25] bzw. [68] behandelt. Ein approximativer Zugang u ¨ber schwache L¨osungen mit Randbedingung dritter Art ist in [15], [23] dargestellt. Wir stellen folgende Forderungen: Voraussetzung 3.8 Es seien ein beschr¨anktes Lipschitzgebiet Ω ⊂ IRN mit Rand Γ, eine Endzeit T > 0 sowie Funktionen c0 ∈ L∞ (Q), α ∈ L∞ (Σ), α(x, t) ≥ 0 f. u ¨. in Σ, fest vorgegeben. Die Funktionen c0 , α, f , g h¨ angen s¨ amtlich von (x, t) ab. Rechte Seiten“ sind f ∈ L2 (Q), ” 2 2 g ∈ L (Σ), y0 ∈ L (Ω). Wir erl¨ autern zur Einstimmung kurz die Schwierigkeiten, die bei der Festlegung des L¨ osungsbegriffs f¨ ur die parabolische Gleichung (3.23) auftreten. Von einer klassischen L¨ osung y = y(x, t) fordert man die Existenz aller auftretenden Ableitungen und deren Stetigkeit im Inneren des Orts-Zeit-Zylinders Q = Ω×(0, T ), also y ∈ C 2,1 (Q). Das ist zu viel verlangt f¨ ur Probleme der optimalen Steuerung, bei denen die gegebenen Steuerungen aus L2 -R¨ aumen gew¨ ahlt werden. F¨ ur elliptische Aufgaben wurde von y = y(x) nur die Existenz der schwachen partiellen Ableitungen Di = ∂/∂xi erster Ordnung nach der Ortsvariablen x gefordert und die Gleichung in Variationsform u uhrt. Die andere ¨ berf¨ H¨ alfte der Ableitungen trug die Testfunktion v = v(x). Bei parabolischen Gleichungen gehen wir zun¨ achst ¨ ahnlich vor. Auch hier f¨ uhren wir eine Variationsformulierung ein und fordern von y = y(x, t) die Existenz der schwachen partiellen Ableitungen Di = ∂/∂xi erster Ordnung. Die andere H¨ alfte der Ableitung nach x u ¨bernimmt die Testfunktion v = v(x, t). Zus¨ atzlich ist jetzt noch die Zeit t zu ber¨ ucksichtigen. Bez¨ uglich t kommt ebenfalls nur eine schwache Ableitung in Frage. Jetzt gibt es zwei M¨oglichkeiten. Entweder man fordert die Existenz der schwachen Ableitung yt , dann braucht man sie nicht bei der Testfunktion v. Oder man verlangt von y keine Zeitableitung und u ¨ bertr¨agt diese auf v. Die Forderung der Existenz von yt in einem Funktionenraum, etwa yt ∈ L2 (Q), ist meist zu stark. Daher bleibt f¨ ur den Anfang nur die zweite Variante u ¨brig. Allerdings steckt darin die Quelle einer Asymmetrie in der Behandlung von y und v, welche die Steuerungstheorie erschwert. Am Ende werden wir doch noch die Existenz von yt bekommen, allerdings nicht als Funktion sondern als Funktional.
3.3 Schwache L¨ osungen in W21,0 (Q)
111
Wir beginnen mit zwei gebr¨ auchlichen R¨ aumen zur Behandlung parabolischer Gleichungen, die in Ladyzhenskaya et al. [134] verwendet werden: ¨ Definition. W21,0 (Q) ist der normierte Raum aller (Aquivalenzklassen von) Funktionen 2 y ∈ L (Q), die alle schwachen partiellen Ableitungen erster Ordnung nach x1 , ..., xN im Raum L2 (Q) besitzen, versehen mit der Norm y W 1,0 (Q) =
T
2
0
Ω
(y(x, t)2 + |∇y(x, t)|2 ) dxdt
1/2
,
wobei ∇ f¨ ur den Gradienten bez¨ uglich x steht, also ∇ := ∇x . Kurz: 1,0 W2 (Q) = y ∈ L2 (Q) : Di y ∈ L2 (Q) ∀ i = 1, . . . , N. 1,0 Der Raum W21,0 (Q) wird 1 in der Fachliteratur auch mit H (Q) bezeichnet und f¨allt 2 zusammen mit L 0, T ; H (Ω) . Dieser Raum abstrakter Funktionen wird im Abschnitt 3.4.1 eingef¨ uhrt. Folgender Hinweis ist angebracht: In der Bezeichnung W21,0 (Q) stehen oben die Ordnungen der Ableitungen nach x und t und die Integrationsordnung ist im unteren Index angezeigt. Im Gegensatz dazu gibt der zweite obere Index in W k,p (Ω) die Integrationsordnung wieder. Verwechslungen sollten aber durch den Zusammenhang und die unterschiedlichen Gebiete Q bzw. Ω ausgeschlossen sein.
Funktionen aus W21,0 (Q) besitzen also alle Ortsableitungen erster Ordnung als schwache Ableitungen. Diese sind wie folgt definiert: Es existieren Funktionen wi ∈ L2 (Q), so dass die Beziehung y(x, t) Di v(x, t) dxdt = − wi (x, t) v(x, t) dxdt ∀ v ∈ C0∞ (Q) Q
Q
erf¨ ullt ist. Dann setzen wir Di y(x, t) := wi (x, t). Der Raum W21,0 (Q) ist mit dem in nat¨ urlicher Weise entstehenden Skalarprodukt ein Hilbertraum, siehe [134]. Definition. Der normierte Raum W21,1 (Q) wird durch W21,1 (Q) = y ∈ L2 (Q) : yt ∈ L2 (Q) und Di y ∈ L2 (Q) ∀ i = 1, . . . , N eingef¨ uhrt und versehen mit der Norm T
1/2 (y(x, t)2 + |∇y(x, t)|2 + yt (x, t)2 ) dxdt . y W 1,1 (Q) = 2
0
Ω
uglich x zu verstehen. Dabei ist unter ∇ := ∇x wieder der Gradient bez¨ W21,1 (Q) wird mit dem entsprechenden nat¨ urlichen Skalarprodukt zu einem Hilbertraum. F¨ ur diesen Raum ist auch die Bezeichnung H 1,1 (Q) u ¨blich. Die Funktionen besitzen hier neben den schwachen partiellen Ableitungen nach xi auch die schwache partielle Ableitung nach t. Es existiert also eine Funktion w ∈ L2 (Q), so dass y(x, t) vt (x, t) dxdt = − w(x, t) v(x, t) dxdt Q
Q
f¨ ur alle v ∈ C0∞ (Q) erf¨ ullt ist; hier hat man yt := w.
112
3 Linear-quadratische parabolische Probleme
Wir u uhren nun (3.23) in eine Variationsformulierung, indem wir die parabolische ¨ berf¨ ¯ multiplizieren und u partielle Differentialgleichung mit einer Testfunktion v ∈ C 1 (Q) ¨ber Q integrieren. Das geschieht zun¨ achst formal, denn noch wissen wir z.B. nicht, in welchem Sinne (3.23) durch y gel¨ ost wird. F¨ ur die Herleitung wird eine klassischen L¨osung y angenommen, f¨ ur die alle unten verwendeten Integrale existieren. Insbesondere soll y ¯ sein. Am Ende soll die Variationsformulierung aber auch f¨ stetig auf Q ur y ∈ W21,0 (Q) sinnvoll sein. In diesem Raum ist y als schwache L¨osung gesucht. Nach Integration folgt T
yt v dxdt −
Ω
0
T 0
Ω
v Δy dxdt +
T 0
Ω
c0 y v dxdt =
T 0
Ω
f v dxdt
(3.24)
¯ Wir integrieren partiell und erhalten f¨ ur alle v ∈ C 1 (Q). T y vt −∇y·∇v−c0 y v dxdt− v ∂ν y dsdt = f v dxdt. y(x, t) v(x, t) dx − 0
Ω
Σ
Q
Q
In dieser Formulierung treten y(x, 0) und y(x, T ) auf. F¨ ur Funktionen y aus W21,0 (Q) sind diese Werte wegen nicht garantierter Stetigkeit in t nicht notwendig definiert. F¨ ur y(x, 0) k¨ onnen wir den gegebenen Anfangswert y0 (x) einsetzen, aber y(x, T ) kann man so nicht ¯ vorausgesetzt. eliminieren. Die Testfunktion v = v(x, t) ist glatter, bis jetzt aus C 1 (Q) Aber wir k¨ onnen die gleichen Umformungen sogar f¨ ur v ∈ W21,1 (Q) durchf¨ uhren. Die Werte v(x, 0) und v(x, T ) sind f¨ ur alle v ∈ W21,1 (Q) wohldefiniert als Spuren in L2 (Ω), siehe [134]. Folglich ist es sinnvoll, v(x, T ) = 0 f¨ ur v zu fordern. Dieser Trick schaltet y(x, T ) aus. Setzen wir noch ∂ν y = g − α y ein, so folgt f¨ ur alle v ∈ W21,1 (Q) mit v(x, T ) = 0 Q
− y vt + ∇y · ∇v + c0 y v dxdt + α y v dsdt = Σ g v dsdt + y0 v(·, 0) dx. = f v dxdt + Σ
Q
(3.25)
Ω
Damit gelangt man schließlich zu folgender Definition: Definition. Eine Funktion y ∈ W21,0 (Q) heißt schwache L¨osung der Anfangs-Randwertaufgabe (3.23), wenn die Variationsgleichung (3.25) f¨ ur alle v ∈ W21,1 (Q) erf¨ ullt ist, die der zus¨atzlichen Forderung v(·, T ) = 0 gen¨ ugen. Bemerkung. Offenbar sind alle Terme in (3.25) f¨ur y ∈ W21,0 (Q) sowie v ∈ W21,1 (Q) definiert. Die von y geforderte Regularit¨ at l¨ asst aber zun¨ achst keine R¨ uckschl¨ usse auf die Existenz des Anfangswerts y(·, 0) zu.
Satz 3.9 Unter Voraussetzung 3.8 besitzt die parabolische Aufgabe (3.23) genau eine schwache L¨osung in W21,0 (Q). Es existiert eine von f, g, y0 unabh¨angige Konstante cp , so dass max y(·, t) L2 (Ω) + y W 1,0 (Q) ≤ cp f L2 (Q) + g L2 (Σ) + y0 L2 (Ω) (3.26) t∈[0,T ]
2
ullt ist. f¨ ur alle f ∈ L2 (Q), g ∈ L2 (Σ), y0 ∈ L2 (Ω) erf¨
3.4 Schwache L¨ osungen in W (0, T )
113
Der Satz ist ein Spezialfall des allgemeineren Satzes 7.9 aus Abschnitt 7.3.1. Er sichert insbesondere die Stetigkeit von y, aufgefasst als abstrakte Funktion auf [0, T ] mit Werten in L2 (Ω), d.h. y ∈ C [0, T ], L2 (Ω) . Dieser Raum wird im n¨achsten Abschnitt eingef¨ uhrt. Deshalb sind die Norm max y(·, t) L2 (Ω) sowie die Werte y(·, 0) und y(·, T ) definiert. t∈[0,T ]
Daraus folgt auch die erwartete Erf¨ ullung der Anfangsbedingung y(·, 0) = y0 . 2 2 2 Folgerung. Die Abbildung (f, g, y0) → y ist linear und stetig von L (Q)×L (Σ)×L (Ω) 1,0 2 1 2 in W2 (Q) bzw. in L 0, T ; H (Ω) ∩ C [0, T ], L (Ω) .
Die Variationsformulierung (3.25) hat einen gravierenden Nachteil. Die Testfunktion v muss dem Raum W21,1 (Q) angeh¨ oren und v(·, T ) = 0 ist gefordert. Sp¨ater soll aber f¨ ur v der adjungierte Zustand p eingesetzt werden k¨onnen. Dieser ist in der Regel keine Funktion aus W21,1 (Q) und erf¨ ullt auch nicht notwendig p(·, T ) = 0. Deshalb st¨ort die Asymmetrie zwischen den Forderungen an y und die Testfunktion v in der Theorie der optimalen Steuerung. Man braucht einen etwas anderen Zugang. Als Fazit bleibt festzustellen, dass sich W21,0 (Q) nur bedingt f¨ ur die optimale Steuerung eignet.
3.4 Schwache L¨ osungen in W (0, T ) 3.4.1 Abstrakte Funktionen Das Konzept der abstrakten Funktionen ist ein grundlegendes Hilfsmittel zur Beschreibung zeitlich instation¨ arer Gleichungen (Evolutionsgleichungen) und ist gar nicht so abstrakt, wie es klingt. Wir behandeln hier nur abstrakte Funktionen, die auf einem kompakten Intervall [a, b] ⊂ IR definiert sind. Definition. Eine Abbildung von [a, b] ⊂ IR in einen Banachraum X heißt abstrakte Funktion oder auch vektorwertige Funktion. Beispiele. Je nach Wahl des Raumes X ergeben sich folgende Spezialf¨alle: (i) X = IR Eine abstrakte Funktion y : [a, b] → IR ist eine reellwertige Funktion einer Ver¨anderlichen. (ii) X = IRn Eine abstrakte Funktion y : [a, b] → IRn ist eine (n-dimensional-) vektorwertige Funktion einer Ver¨ anderlichen, ⎡ ⎤ y1 (t) ⎢ ⎥ y(t) = ⎣ ... ⎦ ∈ IRn . yn (t) (iii) X = H1 (Ω) Bei einer abstrakten Funktion y : [a, b] → H 1 (Ω) ist der Funktionswert y(t) f¨ ur jedes t ∈ [a, b] ein Element von H 1 (Ω), also selbst eine Funktion – eine von x ∈ Ω abh¨angige. Folglich gilt y(t) = y(·, t) ∈ H 1 (Ω) f¨ ur jedes feste t ∈ [a, b], d.h. die Funktion x → y(x, t) geh¨ ort zu H 1 (Ω). Die L¨ osung y ∈ W21,0 (Q) unseres parabolischen Problems ist von dieser Bauart.
114
3 Linear-quadratische parabolische Probleme
Wir stellen im Weiteren einige wichtige R¨ aume abstrakter Funktionen bereit. Definition. Es sei {X, · X } ein reeller Banachraum. Eine abstrakte Funktion y : [a, b] → X heißt stetig im Punkt t ∈ [a, b], wenn aus τ → t, τ ∈ [a,b], die Konvergenz y(τ ) → y(t) in X folgt, d.h. lim y(τ ) − y(t) X = 0. Mit C [a, b], X wird der Banachτ →t
raum aller stetigen (abstrakten) Funktionen y : [a, b] → X bezeichnet, versehen mit der Norm y C([a,b],X) = max y(t) X . t∈[a,b]
oren alle in Ω×[0, T ] messbaren reellwertigen Beispiel. Dem Raum C [0, T ], L2 (Ω) geh¨ Funktionen y = y(x, t) an, die an jeder Stelle t ∈ [0, T ] in x ∈ Ω quadratisch integrierbar sind und stetig bez¨ uglich t in der Norm von L2 (Ω). F¨ ur jedes t ∈ [0, T ] gilt y(x, t)2 dx < ∞, Ω
und f¨ ur τ → t folgt y(τ ) − y(t) L2 (Ω) =
Ω
y(x, τ ) − y(x, t)
Die Norm von y ist y C([0,T ],L2 (Ω)) = max y(t) L2 (Ω) = max t∈[0,T ]
t∈[0,T ]
2
Ω
dx
1/2
→ 0.
y(x, t)2 dx
1/2
.
b F¨ ur eine abstrakte Funktion y ∈ C [a, b], X wird das Riemann-Integral I = a y(t) dt als Grenzwert (Netzlimes) Riemannscher Integralsummen k
y(ξi ) (ti − ti−1 )
i=1
definiert, mit beliebigen Zwischenstellen ξi ∈ [ti−1 , ti ] bei unbegrenzt feiner werdender Zerlegung a = t0 < t1 < . . . < tk = b des Intervalls [a, b], analog zu reell- oder vektorwertigen Funktionen. Das Integral I ist ein Element der Raums X, Hille und Phillips [103]. Definition. Eine abstrakte Funktion y : [a, b] → X heißt Treppenfunktion, wenn endlich viele Elemente yi ∈ X und Lebesgue-messbare, paarweise disjunkte Mengen Mi ⊂ [a, b], i = 1, . . . , m, existieren mit [a, b] = ∪m ur alle t ∈ i=1 Mi und y(t) = yi f¨ Mi , i = 1, . . . , m. Definition. Ein abstrakte Funktion y : [a, b] → X heißt messbar, wenn eine Folge {yk }∞ ur k=1 von Treppenfunktionen yk : [a, b] → X existiert, so dass y(t) = lim yk (t) f¨ k→∞
fast alle t ∈ [a, b] gilt. Nun k¨ onnen wir Lp -R¨ aume abstrakter Funktionen einf¨ uhren.
Definition. Unter Lp (a, b; X), 1 ≤ p < ∞, versteht man den linearen Raum aller ¨ (Aquivalenzklassen von) messbaren abstrakten Funktionen y : [a, b] → X mit der Eigenschaft b y(t) pX dt < ∞. a
3.4 Schwache L¨ osungen in W (0, T )
115
Der Raum wird versehen mit der Norm y Lp (a,b;X) :=
a
b
y(t) pX dt
1/p
.
¨ Der Raum L∞ (a, b; X) besteht aus allen (Aquivalenzklassen von) messbaren Funktionen y : [a, b] → X mit y L∞ (a,b;X) := ess sup y(t) X < ∞. [a,b]
In beiden R¨ aumen werden Funktionen, die sich nur auf einer Teilmenge von [a, b] mit ¨ Lebesguemaß null unterscheiden, als gleich angesehen. Sie geh¨oren zur gleichen Aquivalenzklasse. et ort f¨ ur jedes T > 0 zu C [0, T ], L1 (0, 1) , Beispiel. Die Funktion y(x, t) = √ geh¨ x deshalb auch zu Lp 0, T ; L1 (0, 1) f¨ ur alle 1 ≤ p ≤ ∞. ur alle p ∈ [1, ∞] Banachr¨aume. Der umfassendste unter Die R¨ aume Lp (a, b; X) sind f¨ ur ihnen ist L1 (a, b; X). In diesem Raum, und damit in allen anderen auch, kann man f¨ jede abstrakte Funktion das Bochner-Integral einf¨ uhren. F¨ ur Treppenfunktionen y ist es durch b m y(t) dt := yi |Mi | a
i=1
definiert, wobei yi ∈ X der Funktionswert von y auf Mi ist und |Mi | wie bisher das Lebesguemaß der Menge Mi . Das Integral ist offenbar ein Element aus X. Ist y ∈ L1 (a, b; X) allgemein vorgegeben, so existiert wegen der Messbarkeit von y eine Folge {yk }∞ k=1 von Treppenfunktionen, die fast u berall auf [a, b] gegen y(t) konvergiert. Das Bochner-Integral ¨ von y wird durch b a y(t) dt = lim yk (t) dt b
k→∞
a
definiert. Dieser Grenzwert ist unabh¨ angig von der Auswahl der Folge {yk }∞ k=1 , siehe Hille und Phillips [103] oder Pazy [170]. Das Bochner-Integral ist das Analogon zum Lebesgue-Integral bei X = IR. Beispiel. Wir betrachten L2 0, T ; H 1 (Ω) . Die Elemente des Raumes sind abstrakte Funktionen, k¨ onnen aber gleichzeitig als reellwertige Funktionen der Variablen x und t aufgefasst werden, also y = y(x, t), mit x ∈ Ω und t ∈ [0, T ]. F¨ ur jedes t ist y bez¨ uglich x eine Funktion aus H 1 (Ω). Die Norm ist definiert durch
1/2 T
1/2 T 2 y L2 (0,T ;H 1 (Ω)) = y(x, t)2 + |∇x y(x, t)|2 dxdt y(t) H 1 (Ω) dt = . 0
0
Ω
Es f¨ allt auf, dass die Normen in W21,0 (Q) und L2 0, T ; H 1 (Ω) identisch sind. Sind es auch die R¨ aume? In der Tat sind sie zueinander isometrisch und isomorph, d.h. W21,0 (Q) ∼ = L2 0, T ; H 1 (Ω) . Man kann zeigen, dass jede Funktion y ∈ W21,0 (Q) durch Ab¨anderung auf einer Menge vom Maß null zu einer Funktion aus L2 0, T ; H 1 (Ω) wird und umgekehrt. Die Beweiskonstruktion findet man in [103].
116
3 Linear-quadratische parabolische Probleme
Mehr u ¨ber abstrakte Funktionen findet man z.B. in Emmrich [65], Gajewski et al. [72], Hille und Phillips [103], Pazy [170], Tanabe [190] oder Wloka [209].
3.4.2 Abstrakte Funktionen und parabolische Gleichungen Wir leiten nochmals eine Variationsformulierung der parabolischen Gleichung (3.23) auf S. 110 her und gehen ¨ ahnlich vor wie bei der Aufstellung von (3.25). Aber wir multiplizieren (3.23) mit v ∈ H 1 (Ω) = V , d.h. mit v = v(x), integrieren nur u ¨ber Ω und halten t ∈ (0, T ) fest. Noch ist unklar, wie die Zeitableitung yt definiert sein soll. Deshalb haben wir f¨ ur alle t ∈ [0, T ] zun¨ achst nur formal f (t) − c0 (t) y(t) v dx yt (t) v dx = − ∇y(t) · ∇v dx + Ω Ω Ω (3.27) g(t) − α(t) y(t) v ds, + Γ
wobei wir die Abh¨ angigkeit von x unterdr¨ uckt haben. Wegen L2 (Q) ∼ =L2 0, T ; L2 (Ω) onnen wir f, g, y als abstrakte Funktionen von t und analog L2 (Σ) ∼ = L2 0, T ; L2 (Γ) k¨ auffassen, die fast u ¨berall mit den entsprechenden reellen Funktionen u ¨ bereinstimmen. Beispielsweise geh¨ ort nach dem Satz von Fubini die Funktion x → f (t, x) f¨ ur fast alle t ∈ (0, T ) dem Raum L2 (Ω) an. Definiert man sie f¨ ur die restlichen t entsprechend um (etwa durch null), so liegt die abstrakte Funktion t → f (t, ·) in L2 0, T ; L2 (Ω) . F¨ ur fast alle festen t ∈ (0, T ) wird auf der rechten Seite jedem v ∈ H 1 (Ω) linear und stetig eine reelle Zahl zugeordnet. Daher ist die rechte Seite f¨ ur fast jedes t ein lineares und stetiges Funktional F = F (t), angewandt auf v ∈ H 1 (Ω), yt (t) v dx = F (t) v f. u (3.28) ¨. auf [0, T ]. Ω
Dieses Funktional F = F (t) ∈ H 1 (Ω)∗ ist durch die rechte Seite von (3.27) definiert. Gleiches sollte f¨ ur die linke Seite gelten, also muss yt (t) ein lineares stetiges Funktional auf H 1 (Ω) sein, d.h. yt (t) ∈ H 1 (Ω)∗ f¨ ur fast alle t ∈ (0, T ). Jede schwache L¨ osung y aus W21,0 (Q) k¨ onnen wir nach Ab¨anderung auf einer Menge vom Maß null als abstrakte Funktion in L2 0, T ; H 1 (Ω) auffassen. Im Beweis von Satz 3.12 werden wir daraus auf T
F (t) 2H 1 (Ω)∗ dt < ∞, schließen, also auf F ∈ L2 0, T ; H 1 (Ω)∗ . Durch Vergleich mit der linken Seite von (3.28) sollte daher gelten yt ∈ L2 0, T, H 1 (Ω)∗ . (3.29) 0
Diese Betrachtung gibt einen Hinweis auf den Raum, in dem wir die Ableitung yt zu suchen haben. Allerdings wissen wir noch nicht, wie diese Ableitung aufzufassen ist. Sie ist definiert im Sinne einer vektorwertigen Distribution.
3.4.3 Vektorwertige Distributionen Im Folgenden sei V ein Banachraum, wobei wir als konkrete Anwendung den Hilbertraum V = H 1 (Ω) im Auge haben. Zu gegebenem y ∈ L2 (0, T ; V ) definieren wir eine
3.4 Schwache L¨ osungen in W (0, T )
117
vektorwertige Distribution T : C0∞ (0, T ) → V durch T ϕ :=
0
T
y(t) ϕ(t) dt
∀ϕ ∈ C0∞ (0, T )
und identifizieren die Funktion y mit T . An Stelle von y untersuchen wir das Verhalten der von y erzeugten Distribution T , die wir auch mit Ty bezeichnen k¨onnten. Wir verwenden ¨ diese Schreibweise aber der Ubersichtlichkeit halber nicht. Die Ableitung T wird nun ebenfalls als vektorwertige Distribution eingef¨ uhrt und zwar durch das Bochner-Integral T ϕ := −
T
0
y(t) ϕ (t) dt.
T In gleicher Weise definiert man nun T durch T ϕ := 0 y(t) ϕ (t) dt usw. Man beachte, dass y eine abstrakte Funktion ist, ϕ aber eine reellwertige. Existiert eine abstrakte Funktion w = w(t) in L1 (0, T ; V ) mit T ϕ = −
0
T
y(t) ϕ (t) dt =
T
0
w(t) ϕ(t) dt
∀ ϕ ∈ C0∞ (0, T ),
so k¨ onnen wir T mit w identifizieren, denn T wird dann durch w erzeugt. Da T mit der erzeugenden Funktion y identifiziert wurde und T mit w, verf¨ahrt man ebenso mit den erzeugenden Funktionen und definiert y (t) := w(t). In diesem Sinne haben wir hier y ∈ L1 (0, T ; V ). Dahinter verbirgt sich die Formel der partiellen Integration, die f¨ ur alle stetig differenzierbaren y : [0, T ] → V und alle ϕ ∈ C0∞ (0, T ) gilt,
T 0
T y(t) ϕ (t) dt = y(t) ϕ(t)0 −
T 0
y (t) ϕ(t) dt = −
0
T
y (t) ϕ(t) dt.
Bemerkung. Die in Abschnitt in (2.1) auf S. 22 eingef¨uhrten schwachen Ableitungen kann man
in gleicher Weise definieren. Man betrachtet dazu die reellwertige Distribution T : C0∞ (Ω) → IR, Z y(x) ϕ(x) dx ∀ϕ ∈ C0∞ (Ω) T ϕ := Ω
und fasst y als Distribution auf. So ist Dα y zuerst als distributionelle Ableitung definiert. Schwache Ableitungen sind dann solche distributionellen Ableitungen, die durch lokal integrierbare Funktionen erzeugt werden. Diesen Zugang verwenden die meisten Darstellungen zu Sobolewr¨ aumen. Die obige Funktion w ist das Analogon zur schwachen Ableitung w = Dα y in (2.1).
L¨age w sogar in L2 (0, T ; V ), so w¨ urde y zur Menge aller Funktionen aus L2 (0, T ; V ) mit 2 regul¨ arer Ableitung in L (0, T ; V ) geh¨ oren. Diese Klasse von Funktionen ist aber f¨ ur unsere Zwecke zu eng. Beziehung (3.29) zeigt im Fall V = H 1 (Ω), dass die Ableitung y = yt in der parabolischen Gleichung (3.23) dem gr¨ oßeren Raum L2 (0, T ; V ∗ ) angeh¨oren wird. 1 Im Weiteren sei V ein H0 (Ω) umfassender Teilraum von H 1 (Ω). In der n¨achsten Definition fassen wir y als abstrakte Funktion aus L2 (0, T ; V ∗ ) auf, so dass ihre vektorwertige
118
3 Linear-quadratische parabolische Probleme
Distribution in V ∗ abbildet. Das ist m¨ oglich, denn V ist stetig in V ∗ eingebettet wie wir weiter unten begr¨ unden. Definition. Unter W (0, T ) versteht man den Raum aller y ∈ L2 (0, T ; V ) mit (distributioneller) Ableitung y in L2 (0, T ; V ∗ ), versehen mit der Norm y W (0,T ) = Kurz:
T
0
1/2 . y(t) 2V + y (t) 2V ∗ dt
W (0, T ) = y ∈ L2 (0, T ; V ) : y ∈ L2 (0, T ; V ∗ ) .
Der Raum W (0, T ) wird mit dem Skalarprodukt u , v W (0,T ) =
T
0
u(t) , v(t)
V
dt +
0
T
u (t) , v (t)
V∗
dt
zu einem Hilbertraum. Das Skalarprodukt F , G V ∗ definiert man durch J F , J G V , wobei J : V ∗ → V die nach dem Satz von Riesz existierende Dualit¨atsabbildung ist, die jedem Funktional F aus V ∗ diejenige Funktion f ∈ V zuordnet, mit der F identifiziert wird. Zum Verst¨ andnis des Weiteren brauchen wir die Konstruktion des sogenannten Gelfandschen Dreiers. In unserem Anwendungsfall sieht die Situation wie folgt aus: V = H 1 (Ω) ist stetig und dicht eingebettet in den Hilbertraum H = L2 (Ω). Den Raum H ∗ identifiziert man nach dem Satz von Riesz mit H. Der Raum V ist auch ein Hilbertraum und k¨ onnte ebenfalls mit seinem Dualraum V ∗ identifiziert werden. Das tut man aber aus naheliegenden Gr¨ unden nicht, denn z.B. wird bei partieller Integration stillschweigend das Skalarprodukt von H verwendet und nicht das von V , das der Identifikation von V mit V ∗ zugrunde liegen w¨ urde. Jedes Element f ∈ H kann durch v → (f , v)H ∈ IR
∀v ∈ V
als ein lineares und stetiges Funktional auf V aufgefasst werden, damit als Element von V ∗ . In diesem Sinne gilt V ⊂ H = H ∗ ⊂ V ∗. Die Einbettung H ⊂ V ∗ ist ebenfalls dicht und stetig, Wloka [209], S.253 ff. Die Kette stetiger und dichter Einbettungen V ⊂H ⊂V∗ heißt Gelfandscher Dreier. Funktionale F ∈ V ∗ k¨onnen genau dann vom kleineren Raum V stetig auf H fortgesetzt werden, wenn sie die Form F (v) = (f , v)H mit einem festen f ∈ H haben (Rieszscher Satz). Im Fall V = H 1 (Ω), H = L2 (Ω) bedeutet das H 1 (Ω) ⊂ L2 (Ω) ⊂ H 1 (Ω)∗
3.4 Schwache L¨ osungen in W (0, T )
119
und F ∈ H 1 (Ω)∗ ist genau dann stetig auf L2 (Ω) fortsetzbar, wenn ein f ∈ L2 (Ω) existiert, so dass f¨ ur alle v ∈ H 1 (Ω) die Beziehung F (v) = f (x) v(x) dx = f , v L2 (Ω) Ω
erf¨ ullt ist. Wesentlich f¨ ur unsere Zwecke sind die folgenden in Wloka [209] oder Zeidler [215] zu findenden Aussagen, die in jedem Gelfandschen Dreier G¨ ultigkeit besitzen: Satz 3.10 Jedes y ∈ W (0, T ) kann, nach Ab¨anderung auf einer Menge gegebenenfalls vom Maß null, als Funktion aus C [0, T ], H angenommen werden. In diesem Sinne gilt die Einbettung W (0, T ) → C [0, T ], H und diese ist stetig. Insbesondere folgt aus diesem Satz f¨ ur alle y ∈ W (0, T ) die Existenz der Werte y(0) und y(T ) in H. Die Stetigkeit der Einbettung ist ¨ aquivalent zur Existenz einer Konstanten cE , so dass gilt: y C([0,T ],H) ≤ cE y W (0,T ) ∀y ∈ W (0, T ). Satz 3.11 F¨ ur alle y, p aus W (0, T ) ist die Formel der partiellen Integration erf¨ ullt,
T 0
y (t) , p(t)
V
∗ ,V
dt = y(T ) , p(T )
H
− y(0) , p(0) H −
0
T
p (t) , y(t)
V ∗ ,V
dt.
Hierbei haben wir die f¨ ur F ∈ V ∗ und v ∈ V gebr¨auchliche Schreibweise (F , v)V ∗ ,V := F (v) angewendet, die an ein Skalarprodukt erinnert. Folgerung. In W(0,T) gilt die n¨ utzliche Beziehung 0
T
y (t) , y(t)
V ∗ ,V
dt =
1 1 y(T ) 2H − y(0) 2H . 2 2
Sie ergibt sich aus der Formel der partiellen Integration kann deshalb formal auch so rechnen: T T 1 d y(t) 2H dt = y (t) , y(t) V ∗ ,V dt = 2 dt 0 0
(3.30)
nach Einsetzen von p = y. Man 1 1 y(T ) 2H − y(0) 2H . 2 2
3.4.4 Zugeh¨ origkeit schwacher L¨ osungen aus W21,0 (Q) zu W (0, T ) Wir weisen in diesem Abschnitt nach, dass schwache L¨osungen unserer parabolischen Aufgaben in W (0, T ) liegen. Dazu betrachten wir unter Voraussetzung 3.8 noch einmal die parabolische Gleichung (3.23) auf S. 110 yt − Δy + c0 y ∂ν y + α y y(0)
= f = g = y0
in Q in Σ in Ω.
120
3 Linear-quadratische parabolische Probleme
Satz 3.12 Die nach Satz 3.9 in W21,0 (Q) existierende schwache L¨osung y von (3.23) geh¨ort, ggf. nach Ab¨anderung auf einer Menge vom Maß null, dem Raum W (0, T ) an. Beweis: Aus der Variationsformulierung (3.25) folgt − y vt dxdt = − ∇y · ∇v dxdt − c0 y v dxdt − α y v dsdt Q
+ Ω
Q
Q
y0 v(0) dx +
Σ
f v dxdt +
Σ
Q
g v dsdt
f¨ ur alle v ∈ W21,1 (Q) mit v(T ) = 0. Speziell k¨ onnen wir alle v der Form v(x, t) := v(x)ϕ(t) mit ϕ ∈ C0∞ (0, T ) und v ∈ V = H 1 (Ω) einsetzen. Das ergibt mit H = L2 (Ω) und H N = H × H × . . . × H (n-mal) T T T y(t) ϕ (t) , v H dt = − ∇y(t) , ∇v H N ϕ(t) dt − c0 y(t) , v H ϕ(t) dt − 0 0 T 0 T T α(t) y(t) , v L2 (Γ) ϕ(t) dt + f (t) , v H ϕ(t) dt + g(t) , v L2 (Γ) ϕ(t) dt. − 0
0
0
Wegen ϕ(0) = 0 f¨ allt die Anfangsbedingung weg. Nach Definition von W21,0 (Q) haben 2 ort die Funktion y(x, t) nach dem Satz von Fubini f¨ ur fast wir y ∈ L (Q). Deshalb geh¨ jedes t bez¨ uglich x zu L2 (Ω). Weiterhin folgt Di y ∈ L2 (Q), i = 1, . . . , N , und somit ∇y(·, t) ∈ (L2 (Ω))N = H N f¨ ur fast alle t. Schließlich wissen wir y(·, t) ∈ H 1 (Ω) und 2 deshalb y(·, t) ∈ L (Γ) f¨ ur fast alle t. Diese Aussagen galten jeweils f¨ ur fast alle t ∈ (0, T ). In den restlichen Werten t k¨ onnen wir das auf der rechten Seite stehende y(t) durch null festsetzen, ohne die abstrakte Funktion y im Sinne von L2 -R¨aumen zu ¨andern. Unter den Integralen stehen damit f¨ ur alle festen t jeweils lineare Funktionale Fi (t) : H 1 (Ω) → IR, der Reihe nach F1 (t) : v → ∇y(t) , ∇v H N F2 (t) : v → c0 (t) y(t) , v H F3 (t) : v → α(t) y(t) , v L2 (Γ) (3.31) F4 (t) : v → f (t) , v H F5 (t) : v → g(t) , v L2 (Γ) . Die eben definierten linearen Funktionale sind in allen t ∈ (0, T ) stetig. Ein lineares Funktional F auf V ist genau dann stetig, wenn es beschr¨ankt ist, wenn also eine Konstante cF existiert, so dass |F (v)| ≤ cF v V ∀v ∈ V gilt. Wir pr¨ ufen das exemplarisch f¨ ur F1 und F3 nach: |∇y(t)| |∇v| dx ≤ y(t) H 1 (Ω) v H 1 (Ω) . |F1 (t)v| ≤ Ω
Hier ist die (nat¨ urlich von t abh¨ angige) Konstante cF durch y(t) H 1 (Ω) gegeben. Die reellwertige Funktion t → y(t) H 1 (Ω) geh¨ ort zu L2 (0, T ) und cF = y(t) H 1 (Ω) ist nach ¨ Konstruktion u wird F3 abgesch¨atzt, ¨ berall endlich. Ahnlich |α(t)| |y(t)| |v| ds ≤ α L∞ (Σ) y(t) L2 (Γ) v L2 (Γ) |F3 (t)v| ≤ Γ
≤ c˜ α L∞ (Σ) y(t) H 1 (Ω) v H 1 (Ω) .
3.4 Schwache L¨ osungen in W (0, T )
121
F¨ ur dieses Funktional ist cF durch cF = c˜ α L∞ (Σ) y(t) H 1 (Ω) gegeben. Wir erhalten auf diese Weise Fi (t) ∈ V ∗ = H 1 (Ω)∗ f¨ ur alle t, i = 1, . . . , 5, und schließlich mit einer gewissen Konstanten c 5
Fi (t) V ∗ ≤ c y(t) H 1 (Ω) + f (t) L2 (Ω) + g(t) L2 (Γ) .
(3.32)
i=1
Die rechts stehenden Funktionen sind alle in t quadratisch integrierbar, folglich auch die links stehenden. Damit haben wir Fi ∈ L2 (0, T ; V ∗ ) f¨ ur alle i = 1, . . . , 5. Das Funktional F auf der rechten Seite der Variationsformulierung ist die Summe aller Fi . Daraus ergibt sich F ∈ L2 (0, T ; V ∗ ). Schreiben wir die Variationsformulierung unter Verwendung von F um, −
T
0
so erhalten wir −
T
0
y(t) ϕ (t) , v
L2 (Ω)
y(t) ϕ (t) dt , v
dt =
T
0
T
=
L2 (Ω)
F (t) ϕ(t) , v
0
V ∗ ,V
F (t) ϕ(t) dt , v
dt
V ∗ ,V
∀ v ∈ V,
∀v ∈ V
und deshalb −
0
T
y(t) ϕ (t) dt =
T
0
∀ ϕ ∈ C0∞ (0, T )
F (t) ϕ(t) dt
als Gleichung im Raum V ∗ . Das heißt aber y = F im Sinne vektorwertiger Distributionen, also y ∈ L2 (0, T ; V ∗ ) und deshalb y ∈ W (0, T ). Satz 3.13 Die schwache L¨osung y der Gleichung (3.23) gen¨ ugt der Absch¨atzung y W (0,T ) ≤ cw f L2 (Q) + g L2 (Σ) + y0 L2 (Ω) (f, g, y0) mit einer von f, g, y0 unabh¨angigen Konstanten cw > 0. Damit ist die Abbildung → y stetig von L2 (Q)×L2 (Σ)×L2 (Ω) nach W (0, T ), insbesondere nach C [0, T ], L2 (Ω) . Beweis: Wir sch¨ atzen die Norm y W (0,T ) ab, genauer y 2W (0,T ) = y 2L2 (0,T ;H 1 (Ω)) + y 2L2 (0,T ;H 1 (Ω)∗ ) . F¨ ur den ersten Anteil erh¨ alt man sofort aus Satz 3.9 auf S. 112, y 2L2 (0,T ;H 1 (Ω)) = y 2W 1,0 (Q) ≤ c f L2 (Q) + g L2 (Σ) + y0 L2 (Ω) . 2
(3.33)
Der zweite erfordert nur unwesentlich mehr Aufwand: Mit den in (3.31) definierten Fi ergibt sich 5 Fi y L2 (0,T ;H 1 (Ω)∗ ) = i=1
L2 (0,T ;H 1 (Ω)∗ )
≤
5 i=1
Fi L2 (0,T ;H 1 (Ω)∗ ) .
122
3 Linear-quadratische parabolische Probleme
Wir wollen nicht alle Fi absch¨ atzen, sondern exemplarisch nur F1 : Aus (3.32) und (3.33) folgt mit einer generischen Konstanten c T T F1 2L2 (0,T ;V ∗ ) = F1 (t) 2V ∗ dt ≤ c y(t) 2H 1 (Ω) dt 0 0 2 ≤ c y 2W 1,0 (Q) ≤ c f L2 (Q) + g L2 (Σ) + y0 L2 (Ω) . 2
Analog k¨ onnen F2 , . . . , F5 abgesch¨ atzt werden. Insgesamt ergibt sich schließlich die zu beweisende Ungleichung. Damit ist die Existenz der Ableitung yt := y hergeleitet und es besteht die M¨oglichkeit, die Variationsgleichung (3.25) umzuformulieren. Wir k¨onnen in (3.25), S. 112, y ∈ W (0, T ) voraussetzen und den nun wohldefinierten Endwert y(T ) mitf¨ uhren. Mit (3.24) auf S. 112 haben wir f¨ ur alle v ∈ W21,1 (Q) − y vt + ∇y · ∇v + c0 y v + αyv Q Q Q Σ = fv+ gv + y0 v(·, 0) − y(·, T ) v(·, T ). Σ
Q
Ω
Ω
Auf die Angabe der Differentiale in den Integralen wurde der K¨ urze halber verzichtet. Weiter k¨ onnen wir die Informationen y, v ∈ W (0, T ) sowie y(0) = y0 ausnutzen. Dann folgt aus der Formel der partiellen Integration auf S. 119 f¨ ur alle v ∈ W (0, T ) T fv+ gv yt , v V ∗ ,V + ∇y · ∇v + c0 y v + αyv = 0
Q
Q
Σ
y(0) =
y0 ,
Q
Σ
(3.34) wobei yt eine abstrakte Funktion aus L2 (0, T ; V ∗ ) ist. Die Erweiterung von v ∈ W 1,1 (Q) zu v ∈ W (0, T ) erfolgte mit einem Dichtheitsargument, denn alle obigen Integrale sind stetig in v in W (0, T ) und die als Elemente von W (0, T ) interpretierten Funktionen aus W 1,1 (Q) liegen dicht in W (0, T ). Diese Variationsformulierung gilt sogar f¨ ur alle v ∈ L2 (0, T ; V ), denn alle verwendeten Ausdr¨ ucke bleiben auch stetig in diesem Raum. Daher k¨ onnen wir (3.34) ¨ aquivalent wie folgt aufschreiben: 0
T
∇y · ∇v + c y v dxdt + α y v dsdt = 0 V Q Σ f v dxdt + g v dsdt ∀v ∈ L2 (0, T ; V ), =
yt , v
∗ ,V
Q
y(0) = y0 .
dt +
(3.35)
Σ
Die L¨ osungsabbildung (f, g, y0 ) → y zum Anfangs-Randwertproblem (3.23), yt − Δy + c0 y = f ∂ν y + α y = g y(·, 0) = y0
in Q = Ω × (0, T ) in Σ = Γ × (0, T ) in Ω
hat die Struktur y = GQ f + GΣ g + G0 y0
(3.36)
3.5 Parabolische Optimalsteuerungsprobleme
123
mit linearen stetigen Operatoren GQ : L2 (Q) → W (0, T ), GΣ : L2 (Σ) → W (0, T ) und G0 : L2 (Ω) → W (0, T ), die durch GQ : f → y bei g = 0, y0 = 0, GΣ : g → y bei f = 0, y0 = 0 und G0 : y0 → y bei f = 0, g = 0 definiert sind. Die Grundlage dieser Darstellung ist Satz 3.13.
3.5 Parabolische Optimalsteuerungsprobleme ¨ Analog zum elliptischen Fall beginnen wir mit der Uberf¨ uhrung ausgew¨ahlter linearquadratischer parabolischer Probleme der optimalen Steuerung in ein quadratisches Optimierungsproblem im Hilbertraum und beweisen zuerst die L¨osbarkeit der Aufgaben, das heißt die Existenz optimaler Steuerungen. Wir stellen zun¨ achst die Grundvoraussetzungen an die gegebenen Gr¨oßen zusammen, um deren st¨ andige Wiederholung zu vermeiden. Gegeben sind das Ortsgebiet Ω mit Rand Γ, die Zeitdauer T > 0, anzusteuernde Funktionen yΩ , yQ oder yΣ , eine Anfangsverteilung y0 , Koeffizienten α, β sowie Schranken ua , ub , va , vb , die je nach Problemstellung auf E = Q = Ω × (0, T ) oder E = Σ = Γ × (0, T ) definiert sind. Die Menge E ergibt sich jeweils aus dem Sinn der Aufgabenstellung. Voraussetzung 3.14 Es seien ein beschr¨anktes Lipschitzgebiet Ω ⊂ IRN mit Rand Γ, yΩ ∈ L2 (Ω), yQ ∈ L2 (Q), yΣ ∈ L2 (Σ), α, β ∈ L∞ (E), ua , ub , va , vb ∈ L2 (E) mit ua (x, t) ≤ ub (x, t) sowie va (x, t) ≤ vb (x, t) f¨ ur fast alle (x, t) in E sowie eine Konstante λ ≥ 0 gegeben. Dabei ist E je nach Problemstellung durch E = Q oder E = Σ definiert.
3.5.1 Optimale instation¨ are Randtemperatur Wir betrachten die Aufgabe (3.1)–(3.3) auf S. 95, 2 λ 1 min J(y, u) := y(x, T ) − yΩ (x) dx + u(x, t)2 ds(x)dt 2 Ω 2 Σ
bei yt − Δy ∂ν y + α y y(0)
= 0 = βu = 0
in Q in Σ in Ω
sowie ua (x, t) ≤ u(x, t) ≤ ub (x, t)
f.¨ u. in Σ.
atzen 3.13 auf S. 121 und 3.12 von S. 120 Jeder Steuerung u ∈ L2 (Σ) wird nach den S¨ genau eine schwache L¨ osung y ∈ W (0, T ) der (obigen) W¨armeleitungsgleichung (3.2) auf S. 95 zugeordnet. Gem¨ aß (3.36) hat y die Darstellung y = GΣ β u. Im Zielfunktional tritt aber nicht y selbst auf, sondern nur der Endwert y(T ). Der Beobachtungsoperator“ ET : y → y(T ) ist linear und stetig von W (0, T ) in L2 (Ω), ”
124
3 Linear-quadratische parabolische Probleme
denn die Einbettung W (0, T ) → C [0, T ], L2 (Ω) ist linear und stetig. Daraus folgt y(T ) L2 (Ω) ≤ y C([0,T ],L2 (Ω)) ≤ c y W (0,T ) und wir erhalten y(T ) = ET GΣ β u =: S u. S ist wieder der Anteil des Zustands, der im Zielfunktional auftritt. Insgesamt resultiert aus der Verkettung u → y → y(T ) eine lineare und stetige Abbildung S : u → y(T ) von L2 (Σ), dem Raum f¨ ur u, nach L2 (Ω), dem Raum f¨ ur y(T ). Wir ersetzen im Zielfunktional (3.1) den Ausdruck y(T ) durch S u. Auf diese Weise ist die partielle Differentialgleichung (3.2) eliminiert, nat¨ urlich nur theoretisch. Die Aufgabe der optimalen Steuerung (3.1)–(3.3) wird zur quadratischen Optimierungsaufgabe im Hilbertraum U = L2 (Σ), min f (u) :=
u∈Uad
mit
1 λ Su − yΩ 2L2 (Ω) + u 2L2 (Σ) 2 2
(3.37)
u. auf Σ . Uad = u ∈ L2 (Σ) : ua (x, t) ≤ u(x, t) ≤ ub (x, t) f.¨
Die L¨ osbarkeit kann wieder mit dem allgemeinen Existenzsatz 2.14 auf S. 40 erledigt werden. Das Funktional f ist konvex und stetig, Uad konvex, abgeschlossen, nichtleer und beschr¨ ankt im Hilbertraum L2 (Σ). Aus Satz 2.14 folgt: Satz 3.15 Unter Voraussetzung 3.14 von S. 123, mit E := Σ, besitzt das Problem (3.37) und damit die Aufgabe der optimalen instation¨aren Randtemperatur (3.1)–(3.3 auf S. 95 mindestens eine optimale Steuerung u ¯ ∈ Uad . Diese ist f¨ ur λ > 0 eindeutig bestimmt. Das eben behandelte Problem war ein parabolisches Randsteuerungsproblem mit Endwertfunktional. Als N¨ achstes behandeln wir in gleicher Weise ein Problem mit im Gebiet Ω wirkender Temperaturquelle als Steuerung, wobei wir zur Abwechslung ein Funktional des Randtemperaturverlaufs ( Randbeobachtung“) minimieren und Temperaturisolation ” auf dem Rand annehmen.
3.5.2 Optimale instation¨ are Temperaturquelle Gegenstand dieses Abschnitts ist die Aufgabe 2 1 λ min J(y, u) := y(x, t) − yΣ (x, t) ds(x) dt + u(x, t)2 dxdt 2 2 Σ Q
(3.38)
bei yt − Δy = ∂ν y = y(0) =
βu 0 0
in Q in Σ in Ω
(3.39)
und ua (x, t) ≤ u(x, t) ≤ ub (x, t)
f.¨ u. in Q.
(3.40)
3.6 Notwendige Optimalit¨ atsbedingungen
125
Hier geht es um die Bestimmung einer optimalen Temperaturquelle u mit dem Ziel der bestm¨ oglichen Approximation eines gew¨ unschten Randtemperaturverlaufs yΣ , wobei die Kosten der Steuerung durch den Term 12 λ u 2 ber¨ ucksichtigt sind. Man kann dieses Problem auch als inverse Aufgabe auffassen: Es ist eine unbekannte Temperaturquelle u im Inneren des K¨ orpers Ω aus Messungen des Temperaturverlaufs y|Σ an der Oberfl¨ache Γ zu bestimmen. Dabei - und auch bei der Interpretation als Steuerungsproblem - wirkt λ > 0 als Regularisierungsparameter. Zun¨ achst sichern uns die S¨ atze 3.13 auf S. 121 sowie 3.12, S. 120, angewendet mit f := β u, g = 0 und y0 = 0, zu gegebenem u ∈ L2 (Q) die Existenz genau einer schwachen L¨osung y ∈ W (0, T ) der Gleichung (3.39). Die Abbildung u → y ist wegen y(x, 0) = 0 linear und stetig von L2 (Q) nach W (0, T ), insbesondere nach L2 0, T ; H 1 (Ω) aufgrund der Definition von W (0, T ). Sie hat die Gestalt y = GQ (β u) mit dem in (3.36) definierten Steuerungs-Zustands-Operator GQ : L2 (Q) → W (0, T ). Im Zielfunktional treten aber nur die Randwerte y(x, t)|Σ auf. Die Spurabbildung y → y|Γ 1 2 ist stetig von H1 (Ω)nach L (Γ), deshalb ist die Abbildung EΣ : y → y|Σ linear und stetig 2 von L 0, T ; H (Ω) nach L2 0, T ; L2 (Γ) . So erhalten wir die Stetigkeit der Abbildung u → y → y|Σ , d.h. des Operators S : u → y|Σ von L2 (Q), dem Raum f¨ ur u, nach L2 0, T ; L2 (Γ) ∼ = L2 (0, T ) × Γ = L2 (Σ), dem Raum f¨ ur y|Σ . Mit den eben eingef¨ uhrten Operatoren hat S die Form S u = EΣ GQ (β u).
(3.41)
Durch Einsetzen von y = S u in das Zielfunktional J(y, u) eliminieren wir die parabolische Gleichung und gelangen zur quadratischen Optimierungsaufgabe im Hilbertraum U = L2 (Q), λ 1 min f (u) := Su − yΣ 2L2 (Σ) + u 2L2 (Q) . (3.42) u∈Uad 2 2 Aus Satz 2.14 folgt die Existenz optimaler Steuerungen, also die L¨osbarkeit des Problems. Satz 3.16 Unter Voraussetzung 3.14 auf S. 123 mit E = Q besitzt die Aufgabe der instation¨aren optimalen Temperaturquelle (3.38)–(3.40) eine optimale Steuerung u ¯, die im Fall λ > 0 eindeutig bestimmt ist.
3.6 Notwendige Optimalit¨ atsbedingungen F¨ ur die in den Abschnitten 3.5.1 und 3.5.2 aufgestellten Probleme geben wir hier die notwendigen Optimalit¨ atsbedingungen an. Zuerst wird eine Variationsungleichung hergeleitet, die noch den Zustand y enth¨ alt. Dieser wird anschließend mit Hilfe eines adjungierten Zustands eliminiert, um eine Variationsungleichung f¨ ur die Steuerung zu erhalten. Wir beweisen dazu einen entsprechenden Hilfssatz.
126
3 Linear-quadratische parabolische Probleme
3.6.1 Hilfssatz f¨ ur adjungierte Operatoren Dazu betrachten wir zun¨ achst die parabolische Aufgabe −pt − Δp + c0 p = ∂ν p + α p = p(·, T ) =
aQ aΣ aΩ
(3.43)
mit beschr¨ ankten und messbaren Koeffizienten c0 , α und vorgegebenen Funktionen aQ ∈ L2 (Q), aΣ ∈ L2 (Σ) und aΩ ∈ L2 (Ω). Wir definieren die Bilinearform ∇y · ∇v + c0 (·, t) y v dx + α(·, t) y v ds. a[t; y, v] := Γ
Ω
Lemma 3.17 Die Aufgabe (3.43) besitzt genau eine schwache L¨osung p ∈ W21,0 (Q), definiert durch die Beziehung T p vt dxdt + a[t; p, v] dt = aΩ v(T ) dx + aQ v dxdt + aΣ v dsdt Q
Ω
0
Σ
Q
f¨ ur alle v ∈ W21,1 (Q) mit v(·, 0) = 0. Die L¨osung p geh¨ort zu W (0, T ) und mit einer von den gegebenen Funktionen unabh¨angigen Konstanten ca > 0 gilt p W (0,T ) ≤ ca aQ L2 (Q) + aΣ L2 (Σ) + aΩ L2 (Ω) . Beweis: Wir f¨ uhren mit τ ∈ [0, T ] die Zeittransformation p˜(τ ) := p(T − τ ), v˜(τ ) := v(T − τ ) aus. Dann haben wir die Beziehungen p˜(0) = p(T ), p˜(T ) = p(0), v˜(0) = v(T ), v˜(T ) = v(0), a ˜Q (·, t) := aQ (·, T − τ ) usw. und p vt dxdt = − p˜ v˜τ dxdτ. Q
Q
Deshalb ist die im Lemma aufgeschriebene Variationsformulierung ¨aquivalent zur Definition der schwachen L¨ osung der (vorw¨ arts-) parabolischen Gleichung p˜τ − Δ˜ p + c0 p˜ = a ˜Q ∂ν p˜ + α p˜ = a ˜Σ p˜(0) = aΩ . Der Rest folgt wieder aus den S¨ atzen 3.9 auf S. 112 (Existenz der schwachen L¨osung p˜) und 3.12 auf S. 120 (Zugeh¨ origkeit von p˜ zu W (0, T )). Der Beweis wird durch R¨ ucktransformation vervollst¨ andigt. Wegen p ∈ W (0, T ) k¨ onnen wir analog zu (3.35) auf S. 122 die Variationsformulierung der adjungierten Gleichung nach partieller Integration k¨ urzer so formulieren:
T 0
− pt , v V ∗ ,V + a[t; p, v] dt
aQ v dxdt +
=
p(T ) =
Q
∀v ∈ L2 (0, T ; V ), aΩ .
Σ
aΣ v dsdt (3.44)
Wie im elliptischen Fall ben¨ otigen wir zur Herleitung der adjungierten Gleichung die n¨ achste, etwas farblose Aussage:
3.6 Notwendige Optimalit¨ atsbedingungen
127
Satz 3.18 Es sei y ∈ W (0, T ) die L¨osung von yt − Δy + c0 y = bQ v ∂ν y + α y = bΣ u y(0) = bΩ w, mit Koeffizienten c0 , bQ ∈ L∞ (Q), α, bΣ ∈ L∞ (Σ), bΩ ∈ L∞ (Ω) sowie Steuerungen v ∈ L2 (Q), u ∈ L2 (Σ) und w ∈ L2 (Ω). Außerdem seien quadratisch integrierbare Funktionen aΩ , aQ , aΣ gegeben. Dann gilt mit der durch (3.43) definierten Funktion p ∈ W (0, T ) aΩ y(·, T ) dx + aQ y dxdt + aΣ y dsdt Ω Q Σ = bΣ p u dsdt + bQ p v dxdt + bΩ p(·, 0) w dx. Σ
Ω
Q
Beweis: Wir schreiben zun¨ achst die Variationsformulierungen f¨ ur y und p auf. F¨ ur y lautet sie mit Testfunktion p T yt , p V ∗ ,V + a[t; y, p] dt = bQ p v dxdt + bΣ p u dsdt (3.45) 0
Σ
Q
bei Vorgabe der Anfangsbedingung y(0) = bΩ w. Analog folgt f¨ ur p mit Testfunktion y T − pt , y V ∗ ,V + a[t; p, y] dt = aQ y dxdt + aΣ y dsdt (3.46) 0
Q
Σ
bei Endbedingung p(T ) = aΩ . Nach partieller Integration in (3.45) erhalten wir T − pt , y V ∗ ,V + a[t; y, p] dt = − y(T ) , aΩ L2 (Ω) + bΩ w , p(0) L2 (Ω) + 0 bQ p v dxdt + bΣ p u dsdt. + Q
(3.47)
Σ
Die linke Seite dieser Gleichung ist identisch mit der von (3.46), also m¨ ussen auch die rechten Seiten von (3.46) und (3.47) gleich sein. Daraus ergibt sich die Behauptung.
3.6.2 Optimale instation¨ are Randtemperatur Wir behandeln nun die notwendigen Optimalit¨atsbedingungen f¨ ur die Aufgabe (3.1)– (3.3) auf S. 95, 1 λ min J(y, u) := y(T ) − yΩ 2L2 (Ω) + u 2L2 (Σ) , 2 2 yt − Δy = 0 ∂ν y + α y = β u y(0) = y0 , ua ≤ u ≤ u b .
128
3 Linear-quadratische parabolische Probleme
Jetzt ist ein inhomogener Anfangszustand y0 ∈ L2 (Ω) zugelassen, was wir bisher aus Gr¨ unden der einfacheren Darstellung vermieden haben. Aus dem letzten Abschnitt wissen wir, dass diese Aufgabe mit y0 = 0 eine optimale Steuerung u ¯ mit zugeh¨origem optimalem ¨ Zustand y¯ besitzt. Der Fall y0 = 0 wird analog behandelt, Ubungsaufgabe 3.2 auf S. 143. Der L¨ osung ordnen wir folgenden adjungierten Zustand p zu, die L¨osung der adjungierten Gleichung −pt − Δp = ∂ν p + α p = p(T ) =
0 0 y¯(T ) − yΩ
in Q in Σ in Ω.
(3.48)
Mit der formalen Lagrangetechnik kann diese adjungierte Gleichung leicht ermittelt werden. Unsere Erfahrungen mit elliptischen Problemen gestatten es aber schon, diese direkt von der Aufgabenstellung abzulesen und sofort aufschreiben: Die einzelnen Terme der Ableitung des Zielfunktionals J nach dem Zustand y treten als rechte Seiten der adjungierten Gleichung auf. Dabei muss das Definitionsgebiet dieser Terme zu dem Gebiet passen, in dem die entsprechende Bedingung der adjungierten Gleichung erkl¨art ist. Im vorgelegten Fall ist die Ableitung des Zielfunktionals nach y die auf Ω definierte Funktion y¯(T ) − yΩ . Sie muss in derjenigen Bedingung der adjungierten Gleichung stehen, die auf Ω vorgegeben ist. Das ist die Bedingung f¨ ur p(T ). Satz 3.19 Eine Steuerung u ¯ ∈ Uad mit zugeh¨origem Zustand y¯ ist genau dann optimal f¨ ur die Aufgabe der optimalen instation¨aren Randtemperatur (3.1)–(3.3) auf S. 95 wenn mit dem zugeh¨origen adjungierten Zustand p ∈ W (0, T ) aus (3.48) die Variationsungleichung β(x, t) p(x, t) + λ u ¯(x, t)) (u(x, t) − u ¯(x, t) ds(x)dt ≥ 0 ∀ u ∈ Uad (3.49) Σ
erf¨ ullt ist. Beweis: Es sei S : L2 (Σ) → L2 (Ω) der lineare und stetige Operator, der bei homogener Anfangsbedingung y0 = 0 der Steuerung u den Endwert y(T ) der schwachen L¨osung y der Zustandsgleichung zuordnet. Zum fest gegebenen y0 = 0 und u = 0 geh¨ore die Funktion yˆ = G0 y0 . Mit dieser Aufteilung folgt aus dem Superpositionsprinzip f¨ ur lineare Gleichungen y(T ) − yΩ = S u + (G0 y0 )(T ) − yΩ = S u − z, wenn wir z := yΩ − G0 y0 (T ) setzen. So nimmt die Aufgabe die Gestalt min f (u) :=
u∈Uad
1 λ Su − z 2L2 (Ω) + u 2L2 (Σ) 2 2
an. Aus der allgemeinen Variationsungleichung (2.47) von S. 51 folgt 0
Su ¯ − z , S(u − u ¯) L2 (Ω) + λ u ¯, u−u ¯ L2 (Σ) y¯(T ) − yΩ y(T ) − y¯(T ) dx + λ u ¯ (u − u ¯) dsdt = ≤
Ω
Σ
(3.50)
3.6 Notwendige Optimalit¨ atsbedingungen
129
f¨ ur alle u ∈ Uad . Dabei haben wir Su − S u ¯ = Su + G0 y0 (T ) − G0 y0 (T ) − S u ¯ = y(T ) − y¯(T ) sowie wieder z = yΩ − G0 y0 (T ) verwendet. Wir setzen y˜ := y − y¯ und wenden Satz 3.18 mit folgenden Gr¨ oßen an: aΩ = y¯(T ) − yΩ , aQ = 0, aΣ = 0, bΣ = β, v = 0, w = 0, y := y˜ und u ˜ := u − u ¯. Es gilt w = 0, da Su nach Definition einen homogenen Anfangswert hat (der zu y0 geh¨ orige Anteil wird durch z ber¨ ucksichtigt). So ergibt sich y¯(T ) − yΩ , y˜(T ) L2 (Ω) = β pu ˜ dsdt. Σ
Einsetzen dieses Resultats in Ungleichung (3.50) liefert 0 ≤ y¯(T ) − yΩ y(T ) − y¯(T ) dx + λ u ¯ (u − u ¯) dsdt Σ Ω β p (u − u ¯) dsdt + λ u ¯ (u − u ¯) dsdt = (β p + λ u ¯) (u − u ¯) dsdt, = Σ
Σ
Σ
also die zu beweisende Variationsungleichung. Mit der auf S. 55 f¨ ur elliptische Aufgaben vorgef¨ uhrten Methode erhalten wir eine Reihe von Aussagen u ¨ ber die Form optimaler Steuerungen: Satz 3.20 Eine Steuerung u ¯ ∈ Uad mit zugeh¨origem Zustand y¯ ist genau dann optimal f¨ ur die Aufgabe der optimalen instation¨aren Randtemperatur (3.1)–(3.3) auf S. 95, wenn mit dem zugeh¨origen adjungierten Zustand p aus (3.48) f¨ ur fast alle (x, t) ∈ Σ die folgenden Beziehungen erf¨ ullt sind: β(x, t) p(x, t) + λ u ¯(x, t) v − u ¯(x, t) ≥ 0 ∀v ∈ ua (x, t), ub (x, t) , (3.51) λ λ u ¯(x, t)2 = min β(x, t) p(x, t) v + v 2 2 2 v∈[ua (x,t),ub (x,t)] sowie im Fall λ > 0 die Projektionsformel ! 1 u ¯(x, t) = IP[ua (x,t),ub (x,t)] − β(x, t) p(x, t) . λ β(x, t) p(x, t) u ¯(x, t) +
(3.52)
(3.53)
Beweis: Die Aussagen ergeben sich mit der gleichen Folge von Schritten aus der Variationsungleichung (3.49), die im elliptischen Fall ausgehend von Satz 2.25 auf S. 53 zu Satz 2.27, S. 55 gef¨ uhrt haben. Die Beziehungen (3.51) bzw. (3.52) nennt man schwaches Minimumprinzip bzw. Minimumprinzip. Folgerung. F¨ ur λ > 0 gen¨ ugt das Tripel (¯ u, y¯, p) dem Optimalit¨atssystem yt − Δy = ∂ν y + α y = y(0) =
0 βu y0
−pt − Δp = 0 ∂ν p + α p = 0 p(T ) = y(T ) − yΩ
1 u = IP[ua ,ub ] − β p . λ
(3.54)
130
3 Linear-quadratische parabolische Probleme
Im Fall λ = 0 muss die Projektionsformel durch die folgende ersetzt werden: falls β(x, t) p(x, t) > 0 ua (x, t), u(x, t) = ub (x, t), falls β(x, t) p(x, t) < 0. Spezialfall. ua = −∞, ub = ∞ (keine Beschr¨ankung an die Steuerung) Hier ergibt die Projektionsformel u = −λ−1 β p. Dadurch kann man u in der Zustandsgleichung eliminieren und erh¨ alt ein Vorw¨arts-R¨ uckw¨artssystem zweier parabolischer Gleichungen f¨ ur die Unbekannten y, p: yt − Δy = 0 ∂ν y + α y = −β 2 λ−1 p y(0) = y0
−pt − Δp = ∂ν p + α p = p(T ) =
0 0 y(T ) − yΩ .
(3.55)
¨ Die L¨ osung solcher Systeme ist nicht einfach. Ahnliche Gleichungen entstehen als Hamiltonsche Systeme bei der optimalen Steuerung von gew¨ohnlichen Differentialgleichungen und werden dort im nichtlinearen Fall numerisch mit Schießverfahren behandelt. Bei partiellen Differentialgleichungen kommt als zus¨atzliche Schwierigkeit die große Zahl von Variablen hinzu, die aus der Ortsdiskretisierung resultiert. Deshalb ist eine direkte L¨ osung des obigen Optimalit¨ atssystems schwierig. Eine M¨oglichkeit ist Anwendung von Multigridmethoden, siehe z.B. Borzi [35] sowie Borzi und Kunisch [36]. Auch die direkte L¨ osung als elliptisches System ist vielversprechend, siehe die Empfehlungen zu numerischen Verfahren ab S. 137.
3.6.3 Optimale instation¨ are Temperaturquelle Die entsprechende Aufgabe (3.38)–(3.40) auf S. 124 lautet in Kurzform min J(y, u) :=
1 λ y − yΣ 2L2 (Σ) + u 2L2 (Q) 2 2
bei u ∈ Uad und der Zustandsgleichung yt − Δy ∂ν y y(0)
= βu = 0 = 0.
Mit dem in (3.36) auf S. 122 eingef¨ uhrten Operator GQ : L2 (Q) → W (0, T ) kann die L¨ osung y in der Form y = GQ (β u) dargestellt werden. Im Zielfunktional tritt die Beobachtung y|Σ auf.2 Der Beobachtungs operator EΣ : y → y|Σ ist stetig von W (0, T ) in L2 0, T ; L2 (Γ) ∼ = L (Σ). Deshalb ist der in (3.41) auf S. 125 eingef¨ uhrte Steuerungs-Beobachtungs-Operator“ S : u → y|Σ , stetig ” von L2 (Q) in L2 (Σ) und das Problem ¨ aquivalent zur reduzierten Aufgabe minu∈Uad f (u)
3.6 Notwendige Optimalit¨ atsbedingungen
131
mit dem in (3.42) auf S. 125 definierten Funktional f . Als notwendige Bedingung f¨ ur u ¯ folgt wie in (3.50) f¨ ur alle u ∈ Uad 0 ≤ Su ¯ − yΣ , Su − S u ¯ L2 (Σ) + λ u ¯, u−u ¯ L2 (Q) ,
d.h. 0≤
Σ
(¯ y − yΣ )(y − y¯) dsdt + λ
u ¯ (u − u ¯) dxdt
∀u ∈ Uad .
(3.56)
Q
¯, y|Σ = Su eingesetzt. Es ist klar, wie der adjungierte Wir haben hier wieder y¯|Σ = S u Zustand p definiert werden muss. Er wird als schwache L¨osung von −pt − Δp = 0 ∂ν p = y¯ − yΣ p(T ) = 0 eingef¨ uhrt. Existenz und Eindeutigkeit von p folgen aus Lemma 3.17. Satz 3.21 Eine Steuerung u ¯ ∈ Uad ist genau dann optimal f¨ ur das Problem der optimalen instation¨aren Temperaturquelle (3.38)–(3.40), S. 124, wenn sie mit dem oben definierten adjungierten Zustand p der folgenden Variationsungleichung gen¨ ugt: (β p + λ u ¯)(u − u ¯) dxdt ≥ 0 ∀ u ∈ Uad . Q
Beweis: Die Aussage folgt wieder aus Satz 3.18 mit aΣ = y¯ − yΣ und aΩ = 0, aQ = 0, bQ = β, bΣ = 0, bQ = 0. Die weiteren Schritte verlaufen wie im Beweis von Satz 3.20. Die eben bewiesene Variationsungleichung kann wie in Abschnitt 3.6.2 ¨aquivalent in ein punktweises Minimumprinzip und f¨ ur λ > 0 in eine Projektionsbeziehung f¨ ur u ¯u uhrt ¨berf¨ werden. Es gilt insbesondere f¨ ur fast alle (x, t) ∈ Q ! 1 u ¯(x, t) = IP[ua (x,t),ub (x,t)] − β(x, t) p(x, t) . λ
3.6.4 Differentialoperator in Divergenzform * Problemstellung und Existenz optimaler Steuerungen Die bisher behandelten parabolischen Gleichungen waren aus methodischen Gr¨ unden mit dem Laplace-Operator relativ einfach gew¨ ahlt. Die Theorie kann leicht auf allgemeinere Gleichungen ausgedehnt werden. Wir betrachten dazu den auf S. 30 eingef¨ uhrten gleichm¨ aßig elliptischen Differentialoperator in Divergenzform A y(x) = −
N i,j=1
Di aij (x) Dj y(x)
132
3 Linear-quadratische parabolische Probleme
unter den dort getroffenen Voraussetzungen und formulieren die Aufgabe λΩ λQ y(T ) − yΩ 2L2 (Ω) + y − yQ 2L2 (Q) 2 2 λv λu λΣ y − yΣ 2L2 (Σ) + v 2L2 (Q) + u 2L2 (Σ) + 2 2 2
min J(y, v, u) =
(3.57)
bei der parabolischen Gleichung yt + A y + c0 y = ∂νA y + α y = y(0) =
βQ v βΣ u y0
in Q in Σ in Ω,
(3.58)
t ∈ (0, T ), sowie den Beschr¨ ankungen an die Steuerungen va (x, t) ≤ v(x, t) ≤ vb (x, t) f.¨ u. in Q ua (x, t) ≤ u(x, t) ≤ ub (x, t) f.¨ u. in Σ.
(3.59)
Zus¨ atzlich zu den in Voraussetzung 3.14 auf S. 123 eingef¨ uhrten Gr¨oßen sind hier nichtnegative Konstanten λΩ , λQ , λΣ , λv , λu , sowie Koeffizienten βQ ∈ L∞ (Q), βΣ ∈ L∞ (Σ) gegeben. ¨ Aus Gr¨ unden der Ubersichtlichkeit ist in der parabolischen Gleichung die Abh¨angigkeit aller Funktionen von (x, t) unterdr¨ uckt worden. Der Operator A h¨angt selbst nicht von t ab. Auf die Zeitabh¨ angigkeit der Koeffizienten aij verzichten wir aus Gr¨ unden der Einfachheit. Der Existenzsatz 5.1 aus Ladyzhenskaya et al. [134] l¨asst durchaus zeitabh¨angige Koeffizienten aij (x, t) unter entsprechenden Glattheitsvoraussetzungen zu, vgl. auch Wloka [209]. Die Definition der schwachen L¨ osung f¨ ur die W¨armeleitungsgleichung u ¨bertragen wir wie folgt auf Gleichung (3.58): Definition. Eine Funktion y ∈ W21,0 (Q) heißt schwache L¨osung von (3.58), wenn die folgende Variationsgleichung f¨ ur alle w ∈ W21,1 (Q) mit w(·, T ) = 0 erf¨ ullt ist:
y(x, t) wt (x, t) dxdt =
Q
N
aij (x) Di y(x, t) Dj w(x, t) dxdt Q i,j=1 + c0 (x, t) y(x, t) − βQ (x, t) v(x, t) w(x, t) dxdt Q α(x, t) y(x, t) − βΣ (x, t) u(x, t) w(x, t) ds(x)dt + Σ y0 (x) w(x, 0) dx. − Ω
Die bisherige Definition ist ein Spezialfall dieser allgemeineren. Durch Einf¨ uhrung der Familie von Bilinearformen a[t; ·, ·] : H 1 (Ω) × H 1 (Ω) → IR, t ∈ [0, T ], a[t; y, w]
=
N
Ω i,j=1
+ Γ
aij (x) Di y(x) Dj w(x) + c(x, t) y(x) w(x) dx
α(x, t) y(x) w(x) ds(x)
3.6 Notwendige Optimalit¨ atsbedingungen
133
und H := L2 (Ω) l¨ asst sich die obige schwache Formulierung u ¨bersichtlicher aufschreiben: T T − y(t) , wt (t) H dt + a[t; y(t), w(t)] dt = βQ (t) v(t) , w(t) H dt 0 0 (3.60) T 1,1 + βΣ (t) u(t) , w(t) L2 (Σ) dt + y0 , w(0) H ∀w ∈ W2 (Q) : w(T ) = 0. 0
Hier ist wieder die Abh¨ angigkeit aller Gr¨ oßen von x unterdr¨ uckt. Nach Satz 7.9 von S. 289 besitzt das Anfangs-Randwertproblem (3.58) unter den getroffenen Voraussetzungen f¨ ur jedes Tripel (v, u, y0 ) aus L2 (Q) × L2 (Σ) × L2 (Ω) genau eine schwache L¨ osung y ∈ W21,0 (Q). Diese geh¨ ort dem Raum W (0, T ) an und erf¨ ullt mit einer von v, u, y0 unabh¨angigen Konstanten cP die Absch¨atzung
y W (0,T ) ≤ cP v L2 (Q) + u L2 (Σ) + y0 L2 (Ω) . (3.61) Die Zugeh¨ origkeit zu W (0, T ) ergibt sich wie in Satz 3.12. Die Abbildung (v, u, y0 ) → y ist deshalb linear und stetig von L2 (Q) × L2 (Σ) × L2 (Ω) nach W (0, T ). Insbesondere sind folgende Abbildungen stetig, die y auf verschiedenen Gebieten betreffen: (v, u, y0 ) → y von L2 (Q)×L2 (Σ)×L2 (Ω) in L2 (Q), (v, u, y0 ) → y|Σ von L2 (Q)×L2 (Σ)×L2 (Ω) in L2 (Σ) sowie (v, u, y0 ) → y(T ) von L2 (Q) × L2 (Σ) × L2 (Ω) in L2 (Ω). Mit diesen Informationen l¨ asst sich nun analog zu den vorhergehenden Abschnitten folgende Aussage beweisen: Folgerung. Die Aufgabe (3.57)–(3.59) besitzt unter den getroffenen Voraussetzungen optimale Steuerungen v¯ und u ¯. Diese sind eindeutig bestimmt, falls λv und λu positiv sind bzw. λQ positiv ist und βQ sowie βΣ fast u ¨berall nicht verschwinden. Bemerkung. Analog zu Abschnitt 2.3.3 kann man auch eine Aufteilung Γ = Γ0 ∪ Γ1 vornehur y vorgeben. Dies bleibt dem Leser u men und auf Γ0 homogene Randwerte f¨ ¨berlassen.
Notwendige Optimalit¨ atsbedingungen F¨ ur die Aufgabe (3.57)–(3.59) geben wir die Optimalit¨atsbedingungen ohne Beweis an, weil die Argumentation analog zu der f¨ ur die bisher diskutierten Probleme ist. Es seien die Steuerungen v¯ ∈ L2 (Q) und u ¯ ∈ L2 (Σ) mit Zustand y¯ optimal. Der zugeh¨orige adjungierte Zustand p¯ bestimmt sich aus der adjungierten Gleichung −pt + A p + c0 p = λQ (¯ y − yQ ) ∂νA p + α p = λΣ (¯ y − yΣ ) p(T ) = λΩ y¯(T ) − yΩ
in Q in Σ in Ω.
Als notwendige und hinreichende Optimalit¨ atsbedingung erh¨alt man die Variationsungleichungen βQ (x, t) p(x, t) + λv v¯(x, t) v(x, t) − v¯(x, t) dxdt ≥ 0 ∀v ∈ Vad , Q βΣ (x, t) p(x, t) + λu u ¯(x, t) u(x, t) − u ¯(x, t) dsdt ≥ 0 ∀u ∈ Uad , Σ
die wieder durch punktweise Beziehungen oder Projektionsformeln ausgedr¨ uckt werden k¨ onnen. Dabei ist Uad wie bisher definiert und Vad ist die Menge aller v aus L2 (Q), welche die Beschr¨ ankungen va (x, t) ≤ v(x, t) ≤ vb (x, t) fast u ullen. ¨ berall in Q erf¨
134
3 Linear-quadratische parabolische Probleme
3.7 Numerische L¨ osungstechniken Wir erl¨ autern hier zuerst das Gradienten-Projektionsverfahren sowie das Aufstellen eines ¨ endlichdimensionalen reduzierten Problems, weil sich diese Methoden leicht zu Ubungszwecken implementieren lassen. Gradientenverfahren sind auch heute noch oft f¨ ur komplexere Aufgaben (etwa in dreidimensionalen Ortsgebieten) die Methode der Wahl. Am ¨ Ende des Abschnitts wird ein kurzer Uberblick u ¨ ber emfehlenswerte effizientere Verfahren gegeben.
3.7.1 Gradienten-Projektionsverfahren Wir skizzieren das Gradienten-Projektionsverfahren f¨ ur den Fall der optimalen instation¨ aren Randtemperatur. Parabolische Aufgaben mit verteilter Steuerung werden v¨ollig analog behandelt, vgl. den elliptischen Fall mit verteilter Steuerung. Zu l¨osen sei die Aufgabe 1 λ min J(y, u) := y(T ) − yΩ 2L2 (Ω) + u 2L2 (Σ) 2 2 bei ua ≤ u ≤ ub und yt − Δy = 0 ∂ν y + α y = β u y(0) = y0 .
(3.62)
Wie bisher bezeichnet S : u → y(T ), L2 (Σ) → L2 (Ω), den Operator, der einer gegebenen Steuerung u bei vorgegebenem homogenem Anfangswert y0 = 0 den Endwert der L¨osung der obigen Gleichung zuordnet. Zum inhomogenen Wert y0 und der Steuerung u = 0 geh¨ ore die L¨ osung yˆ. Damit haben wir y(x, T ) = (Su)(x) + yˆ(x, T ). Das Optimalsteuerungsproblem wird auf diese Weise eine quadratische Optimierungsaufgabe im Hilbertraum, min f (u) :=
u∈Uad
λ 1 Su + yˆ(T ) − yΩ 2L2 (Ω) + u 2L2 (Σ) . 2 2
Die Ableitung von f an einer Stelle un ergibt sich durch β(x, t) pn (x, t) + λ un (x, t) v(x, t) dsdt, f (un ) v = Σ
osung der folgenden adjungierten Gleichung ist: wobei pn die L¨ −pt − Δp = 0 ∂ν p + αp = 0 p(T ) = yn (T ) − yΩ .
(3.63)
Nach Identifikation (Satz von Riesz) erhalten wir unsere u ¨ bliche Darstellung des reduzierten Gradienten, f (un ) = β pn + λ un .
3.7 Numerische L¨ osungstechniken
135
Das Verfahren l¨ auft wie folgt ab: Die Steuerungen u1 , . . . , un seien bereits berechnet. S1 (Neuer Zustand) Bestimme zu un den Zustand yn als L¨osung der Zustandsgleichung (3.62). S2 (Neue Abstiegsrichtung) Berechne den zugeh¨origen adjungierten Zustand aus Gleichung (3.63). W¨ ahle als Abstiegsrichtung den Antigradienten vn = −f (un ) = −(β pn + λ un ). S3
(Schrittweitenbestimmung) Berechne ein optimale Schrittweite sn aus f (IP[ua ,ub ] un + sn vn }) = min f IP[ua ,ub ] un + s vn . s>0
S4
un+1 := IP[ua ,ub ] un + sn vn ;
n := n + 1;
gehe zu S1.
Der auszuf¨ uhrende Projektionsschritt ist notwendig, weil un + sn vn eventuell unzul¨assig sein kann. Man sieht ansonsten die v¨ ollige Analogie zu elliptischen Aufgaben. Das Verfahren ist relativ langsam, kann aber einfach implementiert werden. Daher eignet es sich gut f¨ ur Testrechnungen. Parabolische Aufgaben sind numerisch aufw¨andiger als elliptische, denn neben der Ortsvariablen tritt die Zeitvariable auf. Deshalb sind Gradientenverfahren immer noch eine sinnvolle Alternative zu Methoden h¨oherer Konvergenzrdnung. Zur Analysis des Verfahrens verweisen wir auf [90] oder [108].
3.7.2 Aufstellen des reduzierten Problems Ist die Aufgabe (3.62) mehrfach f¨ ur verschiedene Anfangswerte y0 , Endwerte yΩ oder Regularisierungsparameter λ zu l¨ osen, dann kann sich das Aufstellen eines auf u reduzierten Problems lohnen. Das gilt auch f¨ ur den Fall, dass die Steuerung von vornherein die Form (3.64) mit relativ wenigen a priori gegebenen Funktionen ei hat. ¨ Aus Gr¨ unden der Einfachheit und Ubersichtlichkeit stellen wir uns wie im elliptischen Fall vor, dass wir zu gegebener Steuerfunktion u den Zustand y als L¨osung der Zustandsgleichung exakt bestimmen k¨ onnen. Gleiches betreffe die Berechnung aller auftretenden Integrale. Die Steuerfunktion u = u(x, t) habe analog zum elliptischen Fall mit fest gegebenen Ansatzfunktionen ei die Darstellung u(x, t) =
m
ui ei (x, t).
(3.64)
i=1
Beispiel. Es sei N = 2 und Ω = (0, 1)2 das Einheitsquadrat. Den (eindimensionalen) Rand Γ denken wir uns auf das Intervall [0, 4] der reellen Achse abgewickelt. Durchl¨ auft die Variable x den Rand Γ, so k¨ onnen wir u als Funktion der Bogenl¨ ange s und der Zeit t auffassen. Damit ist u auf dem Rechteck [0, 4] × [0, T ] definiert, das wir in ns · nt kleine Rechtecke zerlegen. Die Steuerfunktion u wird als Treppenfunktion angesetzt und ist damit jeweils konstant auf den einzelnen Rechtecken. In diesem Fall sind die Basisfunktionen ei gleich eins auf jeweils genau einem Rechteck, null außerhalb. Davon existieren m = ns · nt verschiedene. Wie bereits bemerkt wurde, kann aber der obige Ansatz auch ohne Einf¨ uhrung einer Diskretisierung a priori gegeben sein, was bei konkreten Anwendungen nicht selten ist.
136
3 Linear-quadratische parabolische Probleme
Die Funktionen yi (x, T ) := (Sei )(x), i = 1, . . . , m, sind vorauszuberechnen und ergeben sich als Endwerte der L¨ osung y von yt = ∂ν y + α y = y(0) =
Δy β ei 0.
Außerdem wird yˆ(x, T ) ben¨ otigt, die L¨ osung zum Anfangswert y0 , yˆt = Δˆ y ∂ν yˆ + α yˆ = 0 yˆ(0) = y0 . Nach Einsetzen dieser Darstellung in die Zielfunktion erhalten wir die reduzierte Zielfunktion fm , die nur vom Vektor u = (u1 , . . . , um ) abh¨angt, m m 2 2 1 λ ui yi (T ) − yΩ + yˆ(T ) + ui ei . fm ( u) = 2 2 2 2 L (Ω)
i=1
i=1
L (Σ)
Als endlichdimensionale Approximation des Optimalsteuerungsproblems l¨osen wir (Pm )
min
ua ≤ u≤ ub
fm ( u).
Die Ungleichung ua ≤ u ≤ ub ist komponentenweise zu verstehen. Außerdem wird angenommen, dass die Beschr¨ ankung ua ≤ ui ≤ ub mit Konstanten ua , ub eine sinnvolle Entsprechung zu ua ≤ u(x, t) ≤ ub ist. Das ist im Fall der im obigen Beispiel beschriebenen Treppenfunktionen ei sicher der Fall. Alternativ k¨onnen bei allgemeineren Ansatzfunktionen ei die Restriktionen ua ≤ ui ≤ ub von vornherein so gefordert sein. Nach leichter Rechnung ergibt sich fm ( u)
=
m 1 ˆ y (T ) − yΩ 2L2 (Ω) + ui yˆ(T ) − yΩ , yi (T ) L2 (Ω) 2 i=1 m m 1 λ + ui uj yi (T ) , yj (T ) L2 (Ω) + ui uj ei , ej L2 (Σ) . 2 i,j=1 2 i,j=1
y (T ) − yΩ 2L2 (Ω) - a¨quivalent zur endlichdiFolglich ist (Pm ) - bis auf die Konstante 12 ˆ mensionalen reduzierten quadratischen Optimierungsaufgabe min
1 2
u C + λD) u + a u ,
ua ≤ u ≤ ub . Um sie aufzustellen, m¨ ussen folgende Gr¨ oßen numerisch vorausberechnet werden:
a = (ai ), ai = yˆ(T ) − yΩ , yi (T ) L2 (Ω) , C = (cij ), cij = yi (T ) , yj (T ) L2 (Ω) , D = (dij ), dij = ei , ej L2 (Σ) .
(3.65)
3.7 Numerische L¨ osungstechniken
137
Im oben erl¨ auterten Beispiel der Treppenfunktionen gilt (ei , ej )L2 (Σ) = δij ei 2L2 (Σ) . Dann ist D eine Diagonalmatrix, D = diag ei 2L2 (Σ) . Die reduzierte Aufgabe kann mit einem g¨ angigen Code der quadratischen Optimierung wie z.B. quadprog in Matlab gel¨ ost werden. Eine Alternative ist die Implementierung einer Aktive-Mengen-Strategie. Die Website von NEOS (NEOS Server for Optimization) enth¨ alt eine Liste anderer verf¨ ugbarer Codes. Der hier beschriebene Zugang lohnt sich nur bei nicht zu großem m, denn zur Bestimmung aller Gr¨ oßen m¨ ussen m + 1 partielle Differentialgleichungen numerisch gel¨ost werden. Prinzipiell ist er immer anwendbar, wenn man die W¨armeleitungsgleichung numerisch beherrscht, also auch in ¨ ortlich dreidimensionalen Gebieten. Ist u von vornherein die Linearkombination (3.64) relativ weniger gegebener Ansatzfunktionen mit unbekannten (Steuerungs-)Komponenten ui , dann bietet sich diese Methode an. Zu empfehlende numerische Verfahren Folgende Verfahren wurden in zahlreichen F¨ allen mit Erfolg angewendet und k¨onnen zur numerischen L¨ osung empohlen werden: Fall ohne Restriktionen an u. Hier kann das gekoppelte System (3.55) auf S. 130 aus Zustandsgleichung und adjungierter Gleichung gel¨ost werden, sofern man dieses numerisch beherrscht. Bei eindimensionalen Ortsgebieten ist das unproblematisch. Verf¨ ugbare Programmpakete kommen auch gut mit zweidimensionalen Ortsgebieten einfacher Geometrie zurecht. Bei gr¨ oßeren Dimensionen bieten sich Multigridtechniken wie in [35] oder [36] an. Primal-duale Aktive-Mengen-Strategien. Diese geh¨oren zu den in letzter Zeit am h¨aufigsten angewendeten Methoden, siehe Ito und Kunisch [114], Bergounioux et al. [26], Kunisch und R¨ osch [129] sowie die ausf¨ uhrliche Darstellung in Ito und Kunisch [115]. Die Arbeit [129] behandelt den Fall einer allgemeinen linearen stetigen Abbildung u → y = S u und l¨ asst damit auch parabolische Gleichungen zu, w¨ahrend sich die anderen Referenzen auf elliptische Aufgaben beziehen. Wie im elliptischen Fall werden in jedem Iterationsschritt aktuell aktive Mengen f¨ ur die obere und untere Box-Restriktion an u bestimmt, in denen die Steuerung im n¨ achsten Schritt durch den entsprechenden oberen bzw. unteren Wert der Schranke fixiert wird. F¨ ur die restlichen Werte l¨ost man wieder ein Vorw¨artsR¨ uckw¨ artssystem parabolischer Gleichungen ohne Restriktionen an u. Direkte L¨osung des Optimalit¨atssystems (3.54). Sehr erfolgversprechend ist die Methode, auch im Fall von Restriktionen an u das Optimalit¨atssystem (3.54) direkt zu l¨osen. Man setzt u in der Form u = IP[ua ,ub ] {−λ−1 β p} in die Zustandsgleichung ein, verwendet dabei die Darstellung IP[ua ,ub ] (z) = max{ua , min{ub , z}} und erh¨alt schließlich das nichtlineare System f¨ ur y und p yt − Δy ∂ν y + α y y(0)
= 0 = β max{ua , min{ub , {−λ−1 β p}}} = y0 ,
−pt − Δp = 0 ∂ν p + α p = 0 p(T ) = y(T ) − yΩ .
Die hier enthaltenen max- bzw. min-Funktionen sind nur an der Stelle ua bzw. ub nicht differenzierbar, aber insgesamt Newton-differenzierbar, vgl. Ito und Kunisch [115]. Das
138
3 Linear-quadratische parabolische Probleme
macht die bisher publizierten Erfolge mit einer direkten numerischen L¨osung des obigen nichtglatten Systems verst¨ andlich. Man kann die Funktionen aber auch sehr genau durch glatte Approximationen ersetzen (das geschieht in manchen Programmsystemen automatisch). Das so entstehende (glatte) nichtlineare System zweier partieller Differentialgleichungen wird dann numerisch gel¨ ost. Neitzel et al. [166] berichten u ¨ber gute Erfahrungen bei der Anwendung dieser Technik mit vorhandenen Softwarepaketen. Vollst¨andige Diskretisierung und nachfolgende Optimierung. Diese oft auch ”discretizethen-optimize” genannte Methode beruht wie im elliptischen Fall auf einer vollst¨andigen Diskretisierung von partieller Differentialgleichung und Zielfunktional, um so eine (große) endlichdimensionale Optimierungsaufgabe zu erhalten. Das ist insbesondere f¨ ur Aufgaben mit o rtlich eindimensionaler parabolischer Gleichung leicht durchzuf¨ u hren. Dann k¨onnen ¨ verf¨ ugbare L¨ oser f¨ ur endlichdimensionale quadratische Optimierungsaufgaben eingesetzt werden.
3.8 Herleitung der verwendeten Fourierentwicklungen Der Vollst¨ andigkeit halber leiten wir noch die Fourier-Entwicklungen (3.14) her. Dazu betrachten wir die schwache L¨ osung y ∈ W21,0 (Q) ∩ W (0, T ) der parabolischen Aufgabe yt (x, t) − yxx (x, t) = f (x, t) yx (0, t) = 0 yx (1, t) + α y(1, t) y(x, 0)
in Q = (0, 1) × (0, T ) in (0, T )
= u(t)
in (0, T )
= y0 (x)
in (0, 1)
(3.66)
f¨ ur feste α > 0, T > 0 und gegebene Funktionen f ∈ L2 (Q), u ∈ L2 (0, T ), y0 ∈ L2 (0, 1). 2 2 Die normalisierten Eigenfunktionen {vn (x)}∞ n=1 des Differentialoperators A = −∂ /∂x bei homogenen Randbedingungen ∂vn (1) + αvn (1) = 0 ∂x
∂vn (0) = 0, ∂x
(3.67)
bilden ein vollst¨ andiges Orthonormalsystem in L2 (0, 1), siehe z.B. Tychonoff und Samarski [200]. Unser Ziel besteht in einer Reihenentwicklung der Form y(x, t) =
∞
vn (x)zn (t)
(3.68)
n=1
mit noch zu bestimmenden Funktionen vn und zn . Wir berechnen zun¨achst die Eigenfunktionen vn . Dazu seien {λn }∞ ullen n=1 die Eigenwerte von A, d.h. Avn = λn vn . Sie erf¨ also die homogenen Randbedingungen (3.67) sowie (3.69) vn (x) + λn vn (x) = 0 ∀ x ∈ (0, 1). √ √ Mit dem Ansatz vn (x) = c1 cos( λ x) +√c2 sin( √λ x) findet √ von √ man unter Beachtung (3.67) zun¨ achst c2 = 0 und dann α cos( λ) = λ sin( λ). Wir setzen μ := λ und erhalten zur Bestimmung von μ die Gleichung μ tan μ = α.
(3.70)
3.8 Herleitung der verwendeten Fourierentwicklungen
139
Diese Gleichung hat abz¨ ahlbar unendlich viele positive L¨osungen μn , die wir als monoton wachsende Folge {μn }∞ origen Funktionen cos(μn x) gen¨ ugen den n=1 anordnen. Die zugeh¨ Orthogonalit¨ atsrelationen
1
0
mit Nn =
1 2
+
sin(2μn ) 4μn .
cos(μn x) cos(μ x) dx =
Nn , n = 0, n=
Daher bilden die Funktionen 1 vn (x) = √ cos(μn x) Nn
ein Orthonormalsystem, das gem¨ aß der Theorie Sturm-Liouvillescher Randwertaufgaben vollst¨ andig ist, siehe [200]. Aus der Anfangsbedingung in (3.66) und dem Ansatz (3.68) folgern wir nach formaler Vertauschung von Grenzwertbildung und Summation y0 (x) = lim y(x, t) = t↓0
∞
vn (x)zn (0).
(3.71)
n=1
Andererseits folgt aus der Theorie die Fourier-Reihen im Hilbertraum ∞
y0 (x) =
y0,n vn (x)
n=1
mit Fourierkoeffizienten
y0,n =
1 0
vn (x)y0 (x) dx
(3.72)
und daher nach Koeffizientenvergleich zn (0) =
1 0
vn (x)y0 (x) dx.
Wir verwenden nun im ¨ ortlich eindimensionalen Fall die schwache Formulierung (3.25), S. 112, der parabolischen Aufgabe (3.66) und setzen v(x, t) = ϕ(t)vn (x) mit ϕ ∈ H 1 (0, T ) und ϕ(T ) = 0 als Testfunktion ein. Dann folgt f¨ ur all diese ϕ −
T 1 y(x, t)ϕ (t)vn (x) dxdt + yx (x, t)ϕ(t)vn (x) dxdt 0 0 0 0 T T y(1, t)ϕ(t)vn (1) dt − y(0, t)ϕ(t)vn (0) dt + 0 0 T 1 T 1 f (x, t)ϕ(t)vn (x) dxdt + u(t)ϕ(t)vn (1) dt + y0 (x)ϕ(0)vn (x) dx. = T
1
0
0
0
0
(3.73) Nach Einsetzen der Reihenentwicklung (3.68) in das erste Integral von (3.73) ergibt sich unter Ausnutzung der Orthogonalit¨ atsrelationen −
T 0
0
1
y(x, t)ϕ (t)vn (x) dxdt = −
0
T
zn (t)ϕ (t) dt.
(3.74)
140
3 Linear-quadratische parabolische Probleme
Das zweite Integral wird unter Beachtung von (3.67), (3.69) sowie der Definition der μn und der paarweisen Orthogonalit¨ at der vn wie folgt umgeformt: T 1 T y(1, t)ϕ(t)vn (1) − y(0, t)ϕ(t)vn (0) dt yx (x, t)ϕ(t)vn (x) dxdt = 0 0 0 T 1 y(x, t)ϕ(t)vn (x) dxdt − 0 0 (3.75) T 1 T 2 −α y(1, t)ϕ(t)vn (1) dt + y(x, t)ϕ(t)μn vn (x) dxdt = 0 0 0 T T = −α y(1, t)ϕ(t)vn (1) dt + μ2n zn (t)ϕ(t) dt 0
0
Nach Einsetzen von (3.74) und (3.75) in (3.73) erhalten wir T T zn (t)ϕ (t) dt + μ2n zn (t)ϕ(t) dt − 0 0 # 1 T " 1 f (x, t)vn (x) dx + u(t)vn (1) ϕ(t) dt + y0 (x)vn (x) dx ϕ(0) = 0
0
(3.76)
0
1
f¨ ur alle ϕ ∈ H (0, T ) mit ϕ(T ) = 0. Das ist die schwache Formulierung des Anfangswertproblems zn (t) + μ2n zn (t) = Fn (t) in (0, T ) (3.77) zn (0) = z0,n mit
Fn (t) = zn (0) =
1
0 1 0
f (x, t)vn (x) dx + u(t)vn (1) (3.78) y0 (x)vn (x) dx.
Die L¨ osung von (3.78) ist durch die Formel der Variation der Konstanten t 2 2 zn (t) = e−μn t zn (0) + e−μn (t−s) Fn (s) ds 0
gegeben, also unter Beachtung von (3.78) durch 1 t 1 2 2 y0 (x)vn (x)e−μn t dx + e−μn (t−s) f (x, t)vn (x) dx zn (t) = 0 0 0 t −μ2n (t−s) + e u(t)vn (1) ds.
(3.79)
0
Schließlich ersetzen wir in (3.79) die Integrationsvariable x durch ξ und setzen diese Darstellung f¨ ur zn in (3.68) ein. Aus Vertauschung von Summation und Integration folgt 1 ∞ 2 vn (x)vn (ξ)e−μn t y0 (ξ) dξ y(x, t) = 0 n=0 t 1 ∞
+
0
+
0 n=0 ∞ t
0 n=0
2
vn (x)vn (ξ)e−μn (t−s) f (ξ, s) dξds 2
vn (x)vn (1)e−μn (t−s) u(s) ds.
(3.80)
3.9 Parabolische Gleichungen in L2 (0, T ; V ∗ ) *
141
Das ist laut Definition der Greenschen Funktion G die zu beweisende Formel (3.14) f¨ ur ¨ den Fall α > 0. Analog leitet man G im Fall α = 0 her, Ubungsaufgabe 3.11. Bemerkungen. Wir haben w¨ahrend dieser Herleitung mehrmals Grenz¨ubergang bzw. Integration und Summation vertauscht. Deshalb bleibt der Vollst¨ andigkeit halber nachzupr¨ ufen, ob dies gerechtfertigt war. Etwas Vorsicht ist dabei geboten, denn die unter den Integralen in (3.80) stehenden unendlichen Reihen sind nicht gleichm¨ aßig konvergent. Aber f¨ ur festes t ist die ∞ P −μ2 (t−s) Funktion s → e n integrierbar auf [0, t], denn n=0
Z
∞ tX
0 n=0
2
e−μn (t−s) ds =
∞ ∞ X X 2 1 1 (1 − e−μn t ) < 0, β0 ∈ IR f¨ ur alle y, v ∈ V a[y, v] ≤ α0 y V v V (3.82) a[v, v] ≥ β v 2H 1 (Ω) − β0 v 2L2 (Ω) . Satz 3.22 Unter Voraussetzung (3.82) besitzt die Aufgabe y (t) + A y(t) = y(0) =
F (t) y0
f.¨ u. in [0, T ]
f¨ ur jedes F ∈ L2 (0, T ; V ∗ ) und jedes y0 ∈ H = L2 (Ω) genau eine L¨osung y ∈ W (0, T ). Es existiert eine Konstante cP > 0, so dass gilt y W (0,T ) ≤ cP F L2 (0,T ;V ∗ ) + y0 H . Satz und Beweis sind z.B. bei Gajewski et al. [72] oder Wloka [209] in einer allgemeineren Fassung nachzulesen, die auch zeitabh¨ angige Koeffizienten zul¨asst.
¨ 3.10 Ubungsaufgaben
143
Eine Anwendung Mit Satz 3.22 kann der adjungierte Zustand parabolischer Aufgaben als Lagrangescher Multiplikator zur parabolischen Differentialgleichung interpretiert werden: Die Differentialgleichung y + A y − F = 0 wird dazu als Nebenbedingung im Bildraum L2 (0, T ; V ∗ ) betrachtet. Die Abbildung y → y + Ay is surjektiv. Der Karush-Kuhn-Tucker-Satz 6.3 wegen (V ∗ )∗ = V einen Lagrangeschen Multiplikator z ∗ = p ∈ auf2 S. 260 liefert dann ∗ ∗ 2 L (0, T ; V ) = L (0, T ; V ). Die Anwendung dieser Technik in der optimalen Steuerung ist z.B. bei Lions [144] oder Neittaanm¨ aki und Tiba [165] dargestellt.
¨ 3.10 Ubungsaufgaben et ort dem Raum C([0, T ], L1 (0, 1)) an. Berechnen Sie ihre 3.1 Die Funktion y(x, t) = √ geh¨ x Norm. In welchen R¨ aumen Lp (0, T, Lq (0, 1)) liegt diese Funktion noch? 3.2 Beweisen Sie die Existenz einer optimalen Steuerung f¨ ur die Aufgabe (3.1)–(3.3) auf S. 95 mit inhomogenem Anfangszustand y0 . 3.3 Erweitern Sie die Definition der schwachen L¨ osung f¨ ur die Anfangs-Randwertaufgabe (3.58) von S. 132 auf das Problem mit gemischten Randbedingungen yt + A y + c0 y ∂νA y + α y y y(0)
= = = =
βQ v βΣ u 0 y0
in auf auf in
Q Σ1 Σ0 Ω,
mit Σi = Γi × (0, T ), i = 1, 2, wobei die Randst¨ ucke Γi wie in Abschnitt 2.3.3 definiert sind. 3.4 Leiten Sie mit der formalen Lagrangetechnik die notwendigen Optimalit¨ atsbedingungen erster Ordnung f¨ ur das Problem (3.57)–(3.59) von S. 132 her. 3.5 Untersuchen Sie die Aufgabe (3.1)–(3.3) auf S. 95 mit dem erweiterten Zielfunktional Z Z ˜ u, v) := J(y, u, v) + J(y, aQ (x, t) y(x, t) dxdt + aΣ (x, t) y(x, t) ds(x)dt Q Σ Z Z vQ (x, t) v(x, t) dxdt + uΣ (x, t) u(x, t) ds(x)dt, + Q
Σ
wobei J das in (3.1) definierte Zielfunktional ist und Funktionen aQ , vQ ∈ L2 (Q), aΣ , vΣ ∈ ur dieses Problem? Stellen Sie L2 (Σ) vorgegeben sind. Existieren optimale Steuerungen f¨ die notwendigen Optimalit¨ atsbedingungen erster Ordnung auf. 3.6 Behandeln Sie die Aufgabe der Anfangswertsteuerung min J(y, u) :=
λ 1 y(T ) − yΩ 2L2 (Ω) + w2L2 (Ω) 2 2
bei w ∈ L2 (Ω), |w(x)| ≤ 1 fast u ¨berall in Ω und yt − Δy ∂ν y + y y(0)
= = =
0 0 w
in in in
Q Σ Ω.
Die Voraussetzungen 3.14 von S. 123 seien erf¨ ullt. Beweisen Sie die Existenz einer optimalen Steuerung und leiten Sie die notwendigen Optimalit¨ atsbedingungen her.
144
3 Linear-quadratische parabolische Probleme
3.7 Schreiben Sie ein Programm zur numerischen L¨ osung der Anfangs-Randwertaufgabe yt (x, t) − yxx (x, t) yx (0, t) yx (, t) + y(, t) y(x, 0)
= = = =
0 0 u(t) y0 (x)
in in in in
(0, ) × (0, T ) (0, T ) (0, T ) (0, )
(3.83)
in Matlab. Verwenden Sie dazu bez¨ uglich t das implizite Euler-Verfahren und bez¨ uglich x den Differenzenquotienten (2.91) auf S. 77 mit Gitterweiten τ bzw. h f¨ ur entsprechende Zerlegungen von (0, T ) bzw. (0, ). Die Steuerung u soll entsprechend der Zerlegung von (0, T ) als Treppenfunktion eingegeben werden. Von der gegebenen Funktion y0 sind die Werte in den Gitterpunkten des Ortsgitters einzulesen. 3.8 Stellen Sie mit Hilfe des in der vorhergehenden Aufgabe geschriebenen Programms das endlichdimensionale reduzierte Problem f¨ ur die Aufgabe min J(y, u) :=
λ 1 y(T ) − yΩ 2L2 (0,1) + u2L2 (0,T ) 2 2
bei (3.83) und den Box-Restriktionen |u(t)| ≤ 1 auf. Gehen Sie nach der in Abschnitt 3.7.2 beschriebenen Methode vor. L¨ osen Sie die Aufgabe mit den von Schittkowski [183] gew¨ ahlten Werten = 1, T = 1.58, yΩ (x) = 0.5 (1 − x2 ), y0 (x) = 0, λ = 10−3 durch den Code quadprog aus Matlab. W¨ ahlen Sie als Zeitschrittweite τ = 1/100. Die Ortsschrittweite h ist sinnvoll anzupassen. 3.9 L¨ osen Sie das in der vorhergehenden Aufgabe aufgestellte reduzierte Problem auch f¨ ur ur λ = 0. L¨ osen Sie die gleiche Aufgabe mit der Funktion λ = 10−k , k = −1, 0 . . . 5, sowie f¨ yΩ (x) = 0.5 (1 − x) und halbieren Sie schrittweise die Gitterweite τ . Interpretieren Sie das Ergebnis, insbesondere im Hinblick auf Satz 3.7 auf S. 107. 3.10 Stellen Sie unter leichter Modifikation des in Aufgabe 3.7 entwickelten Programms ein solches zur L¨ osung der zum obigen Optimalsteuerungsproblem zugeh¨ origen adjungierten Gleichung auf. Berechnen Sie damit den adjungierten Zustand zu den in Aufgabe 3.8 bzw. 3.9 berechneten optimalen Endzust¨ anden y(T ) und pr¨ ufen Sie auf diese Weise die notwendigen Optimalit¨ atsbedingungen numerisch mit der Projektionsformel nach. 3.11 Leiten Sie mit der Methode aus Abschnitt 3.8 die Greensche Funktion (3.14) f¨ ur α = 0 her.
4 Steuerung semilinearer elliptischer Gleichungen 4.1 Vorbemerkungen In den vorangegangenen Abschnitten haben wir nur lineare partielle Differentialgleichungen behandelt und damit viele wichtige Anwendungen ausgeschlossen. Jetzt sind auch nichtlineare Gleichungen zugelassen, wie zum Beispiel in der Aufgabe λ 1 (y(x) − yΩ (x))2 dx + u(x)2 dx, (4.1) min J(y, u) := 2 Ω 2 Ω −Δy + y + y 3 ∂ν y
= =
ua ≤ u(x) ≤ ub
u 0
in Ω auf Γ, f.¨ u. in Ω.
(4.2) (4.3)
Die elliptische Gleichung (4.2) ist semilinear. Auch hier werden wir die uns bisher interessierenden Probleme wie Existenz und Eindeutigkeit einer L¨osung der Gleichung, Existenz einer optimalen Steuerung, notwendige Optimalit¨atsbedingungen erster Ordnung sowie numerische Prinzipien diskutieren, aber die zugeh¨orige Analysis wird schwieriger. Aus formaler Sicht kann man zum Beispiel notwendige Optimalit¨atsbedingungen mit Hilfe der Lagrange-Technik problemlos herleiten. Man formuliert sie wieder mit Hilfe einer adjungierten Gleichung, die im Sinne von Kapitel 2 die adjungierte Gleichung zur an der Stelle y¯ linearisierten Gleichung (4.2) darstellt, −Δp + p + 3¯ y2 p ∂ν p
= y¯ − yΩ = 0
in Ω auf Γ.
(4.4)
Außerdem gilt wie im linear-quadratischen Fall die Projektionsformel 1 u ¯(x) = IP[ua ,ub ] {− p(x)}. λ Wir werden jedoch gleich sehen, dass schon die Verwendung des Raumes H 1 (Ω) problematisch sein kann. F¨ ur die Analysis brauchen wir die Differenzierbarkeit von nichtlinearen Abbildungen wie y(·) → y(·)3 und hier ist die Wahl des Funktionenraums nicht trivial. Außerdem kommt ein weiterer Aspekt hinzu – die Nichtkonvexit¨at der obigen Optimalsteuerungsaufgabe. Obwohl das Zielfunktional konvex ist, bewirkt die Nichtlinearit¨at der
146
4 Steuerung semilinearer elliptischer Gleichungen
Gleichung, dass die Aufgabe zur nichtkonvexen Optimierung geh¨ort. Deshalb sind die notwendigen Bedingungen erster Ordnung nicht mehr hinreichend und die Betrachtung hinreichender Optimalit¨ atsbedingungen zweiter Ordnung wird sinnvoll. Und auch hier treten unerwartete Schwierigkeiten in der Analysis auf.
4.2 Semilineare elliptische Modellgleichung 4.2.1 Motivation des weiteren Vorgehens Zur Erl¨ auterung der weiteren Schritte betrachten wir das obige semilineare elliptische Randwertproblem (4.2) in einem beschr¨ ankten Lipschitzgebiet Ω ⊂ IR3 . Auf Grund der Monotonie der Funktion y → y 3 existiert nach Satz 4.4 zu jedem u ∈ L2 (Ω) genau eine L¨ osung y in H 1 (Ω). F¨ ur N = 3 ist nach Satz 7.1 auf S. 277 die 1 Einbettung H (Ω) → L6 (Ω) stetig und daraus folgt y 3 ∈ L2 (Ω). Der Nemytskii-Operator Φ : y(·) → y 3 (·) ist Fr´echet-differenzierbar von L6 (Ω) in L2 (Ω), siehe S. 184. Diese Eigenschaft ben¨ otigen wir zur Herleitung notwendiger Optimalit¨atsbedingungen. Ferner ist A := −Δ + I stetig von V = H 1 (Ω) nach V ∗ ; Lemma 2.35, S. 86. Also kann man das obige Randwertproblem als Gleichung in V ∗ formulieren, A y + B Φ(y) = B u, in der B der Einbettungsoperator von L2 (Ω) in V ∗ ist. Auf diese Weise ist (4.2) im Zustandsraum H 1 (Ω) gut zu behandeln. F¨ ur y 5 an Stelle von y 3 geht diese Methode 6 5 auch durch, denn Φ(y) = y ist differenzierbar von L6 (Ω) nach L 5 (Ω), siehe Abschnitt ∗ 4.3.3, und damit von V in V , wie man sich u ¨berlegt. Diese f¨ ur viele Aufgaben g¨ angige Methode hat aber ihre Grenzen. Sie funktioniert nur, wenn Φ von V in V ∗ abbildet. Dazu ben¨ otigt man Wachstumsbedingungen wie in Abschnitt 4.3, die bei y 3 oder y 5 erf¨ ullt sind, aber zum Beispiel nicht bei Φ(y) = exp(y). Aus y ∈ H 1 (Ω) muss nicht einmal exp(y) ∈ L1 (Ω) folgen. Außerdem ergeben sich in der Regel Restriktionen an die Dimension N von Ω. Wir werden jedoch sehen, dass die ¯ ist, falls u dem Raum Lr (Ω) L¨ osung y unter nat¨ urlichen Voraussetzungen stetig auf Ω mit hinreichend großem r angeh¨ ort. Dann er¨ ubrigen sich Wachstumsbedingungen. Auch Dimensionsbeschr¨ ankungen wie N ≤ 3 sind nicht n¨otig. Es gibt zwei weitere Gr¨ unde f¨ ur die Betrachtung stetiger L¨osungen y. Erstens wird die obige Methode bei parabolischen Gleichungen in W (0, T ) komplizierter, weil der Grad der Integrierbarkeit von y = y(x, t) auf Ω × (0, T ) niedriger ist als der im elliptischen Fall. Zweitens brauchen wir zur Behandlung von Zustandsbeschr¨ankungen in Kapitel 6 ohnehin die Stetigkeit des Zustands y. Insgesamt lohnt es sich deshalb, Stetigkeit oder zumindest Beschr¨ anktheit des Zustands y zu beweisen. Wir gehen wie folgt vor: Zun¨ achst wird die Gleichung unter starken Beschr¨anktheitsbedingungen im Raum H 1 (Ω) behandelt. Danach zeigen wir, dass die L¨osung sogar beschr¨ ankt bzw. stetig ist und die Beschr¨ anktheitsbedingungen abgeschw¨acht werden k¨ onnen. Dazu untersuchen wir eine allgemeinere Klasse von Aufgaben. Monotone Nichtlinearit¨ aten des Typs y 3 oder exp(y) sind f¨ ur manche Anwendungen zu speziell. Steht zum Beispiel Ω = Ω1 ∪ Ω2 f¨ ur einen aus zwei Materialien zusammengesetzten K¨orper mit
4.2 Semilineare elliptische Modellgleichung
147
verschiedenen physikalischen Konstanten κ1 , κ2 , so kann eine Nichtlinearit¨at der Form κ 1 y 3 x ∈ Ω1 d(x, y) = κ 2 y 3 x ∈ Ω2 sinnvoll sein. Dabei ist d nicht mehr stetig in x, aber beschr¨ankt und messbar. Motiviert ¨ durch diese Uberlegungen behandeln wir als Modellproblem die elliptische Randwertaufgabe A y + c0 (x) y + d(x, y) = f ∂νA y + α(x) y + b(x, y) = g
in Ω auf Γ.
(4.5)
Dabei sind Ω, Γ, c0 ≥ 0, α ≥ 0 wie in Abschnitt 2.1 definiert und mit d sowie b nichtlineare Funktionen gegeben. Der elliptische Differentialoperator A hat die Form (2.19) auf S. 30 und die Funktionen f und g werden sp¨ater die Steuerungen sein. Diese Klasse elliptischer Gleichungen ist noch nicht zu kompliziert, bringt aber schon wesentliche Schwierigkeiten nichtlinearer Gleichungen. Unter gewissen Voraussetzungen werden wir auf die Funktionen c0 bzw. α verzichten k¨ onnen.
4.2.2 L¨ osungen in H 1 (Ω) Wir beginnen mit der Frage der Existenz und Eindeutigkeit von L¨osungen der semilinearen elliptischen Gleichung (4.5) im Raum H 1 (Ω). Dazu wird die Theorie monotoner Operatoren angewendet. Die Grundidee ist einfach: Ist a : IR → IR stetig und streng monoton wachsend mit limx→±∞ a(x) = ±∞ gegeben, so hat die Gleichung a(y) = f f¨ ur jedes f ∈ IR genau eine L¨osung y ∈ IR. Diese simple Tatsache kann man auf allgemeinere Gleichungen der Form A y = f in Banachr¨aumen u ¨bertragen.
a f
Im Weiteren ist V ein reeller und separabler Hilbertraum wie zum Beispiel V = H 1 (Ω) oder V = H01 (Ω). Ein Banachraum heißt separabel, wenn er eine abz¨ahlbare und u ¨berall dichte Teilmenge enth¨alt.
y
Definition. Ein Operator A : V → V ∗ heißt monoton, wenn
f -Stelle y einer monotonen Funktion a
Ay1 − Ay2 , y1 − y2
V ∗ ,V
≥0
∀ y1 , y2 ∈ V
gilt und streng monoton, wenn hier Gleichheit nur f¨ ur y1 = y2 eintreten kann. A heißt koerziv (auch koerzitiv), wenn gilt Ay , y V ∗ ,V → ∞, falls yV → ∞ yV
148
4 Steuerung semilinearer elliptischer Gleichungen
und hemistetig, wenn die Funktion ϕ : [0, 1] → IR, t → A(y + tv) , w V ∗ ,V , f¨ ur alle festen y, v, w ∈ V auf [0, 1] stetig ist. Existiert ein β0 > 0, so dass Ay1 − Ay2 , y1 − y2 V ∗ ,V ≥ β0 y1 − y2 2V ∀ y1 , y2 ∈ V erf¨ ullt ist, dann heißt A stark monoton. Satz 4.1 (Hauptsatz u ¨ ber monotone Operatoren) Es sei V ein separabler Hilbertraum und A : V → V ∗ ein monotoner, koerziver und hemistetiger Operator. Dann besitzt die Gleichung Ay = f f¨ ur jedes f ∈ V ∗ eine L¨osung y. Die Menge aller L¨osungen ist beschr¨ankt, konvex und abgeschlossen. Ist A streng monoton, dann ist y eindeutig bestimmt. Wenn A sogar stark monoton ist, dann ist A−1 : V ∗ → V Lipschitz-stetig. Der Satz geht auf Browder und Minty zur¨ uck und ist z.B. bei Zeidler [216] bewiesen. Wir wenden ihn auf die Aufgabe (4.5) im Raum V = H 1 (Ω) an. Zun¨ achst ist zu definieren, was eine schwache L¨osung des elliptischen Problems (4.5) sein soll. Die Idee ist einfach – wir bringen in (4.5) die Nichtlinearit¨aten d(x, y) und b(x, y) auf die rechten Seiten. Dann steht ein Gleichungssysstem mit rechten Seiten f˜ = f − d(·, y) bzw. g˜ = g − b(·, y) und linearen Differentialoperatoren auf der linken da. Dazu schreiben wir die Variationsformulierung f¨ ur lineare Randwertprobleme hin. Nun tritt aber ein Problem auf, wenn b(x, y) bzw. d(x, y) unbeschr¨ankt sind wie z.B. y k oder ey : Funktionen y ∈ H 1 (Ω) brauchen nicht beschr¨ankt zu sein und deshalb ist ohne Zusatzvoraussetzungen unklar, in welchem Funktionenraum d(x, y) und b(x, y) liegen. Wir fordern am Anfang, dass d und b auf ihren Definitionsbereichen beschr¨ankt sind. Dann sind auch d(x, y) und b(x, y) beschr¨ ankt, selbst bei unbeschr¨ankter Funktion y. Voraussetzung 4.2 Es sei Ω ⊂ IRN , N ≥ 2, ein beschr¨anktes Lipschitzgebiet mit Rand Γ und A ein elliptischer Differentialoperator der Form (2.19) auf S. 30 mit beschr¨ankten und messbaren Koeffizienten aij , die der Symmetriebedingung und der Bedingung der gleichm¨aßigen Elliptizit¨at (2.20) gen¨ ugen. Die Funktionen c0 : Ω → IR und α : Γ → IR seien beschr¨ankt und messbar sowie fast ¨ uberall nichtnegativ. Mindestens eine dieser Funktionen sei nicht identisch null, so dass c0 L∞ (Ω) + αL∞ (Γ) > 0 gilt. Die Funktionen d = d(x, y) : Ω × IR → IR und b = b(x, y) : Γ × IR → IR sollen f¨ ur jedes feste y beschr¨ankt und messbar in x aus Ω bzw. Γ sein sowie stetig und monoton wachsend in y f¨ ur fast alle x ∈ Ω bzw. x ∈ Γ. Aus dieser Voraussetzung folgt insbesondere, dass d(x, 0) bzw. b(x, 0) beschr¨ankt und messbar in Ω bzw. Γ sind. Wegen der Problematik der Unbeschr¨anktheit fordern wir am Anfang zus¨ atzlich die Voraussetzung 4.3 F¨ ur fast alle x ∈ Γ bzw. x ∈ Ω gelte b(x, 0) = 0 sowie d(x, 0) = 0. Außerdem seien b und d global beschr¨ankt, d.h. es existiere eine Konstante M mit |b(x, y)| ≤ M,
|d(x, y)| ≤ M
(4.6)
f¨ ur fast alle x ∈ Γ bzw. x ∈ Ω und alle y ∈ IR. Zur Differentialgleichung geh¨ ort die Bilinearform N a[y, v] := aij (x)Di y Dj v dx + c0 y v dx + α y v ds. Ω i,j=1
Ω
Γ
(4.7)
4.2 Semilineare elliptische Modellgleichung
149
Definition. Unter den Voraussetzungen 4.2 und 4.3 heißt eine Funktion y ∈ H 1 (Ω) schwache L¨osung von (4.5), wenn die folgende Variationsformulierung erf¨ ullt ist: a[y, v] + d(x, y) v dx + b(x, y) v ds = f v dx + g v ds ∀v ∈ H 1 (Ω). (4.8) Ω
Γ
Ω
Γ
Mit dem Hauptsatz u ¨ber monotone Operatoren beweisen wir nun die folgende Existenzaussage: Satz 4.4 Unter den Voraussetzungen 4.2 und 4.3 besitzt die Gleichung (4.5) f¨ ur jedes Paar von rechten Seiten f ∈ L2 (Ω), g ∈ L2 (Γ) genau eine schwache L¨osung y ∈ H 1 (Ω). Es existiert eine von d, b, f und g unabh¨angige Konstante cM > 0 mit (4.9) yH 1 (Ω) ≤ cM f L2 (Ω) + gL2 (Γ) . Beweis. Wir wenden den Hauptsatz u ¨ ber monotone Operatoren in V = H 1 (Ω) an. (i) Definition eines monotonen Operators A : V → V ∗ Aus Abschnitt 2.13 folgt, dass die Bilinearform (4.7) gem¨aß (A1 y , v)V ∗ ,V = a[y, v] einen linearen, stetigen Operator A1 : V → V ∗ erzeugt. Das ist der lineare Anteil des nichtlinearen Operators A. Der erste nichtlineare Anteil wird formal durch (A2 y)(x) := d(x, y(x)) definiert. Das ist zu pr¨ azisieren: Jedes y aus V geh¨ort zu L2 (Ω). Auf Grund der strengen Voraussetzungen an d ist die Funktion x → d(x, y(x)) messbar (Stetigkeit von d bez¨ uglich y) und auch beschr¨ ankt (Beschr¨ anktheit von d). Daher gilt d(·, y) ∈ L∞ (Ω) f¨ ur alle y ∈ V . Das Funktional Fd , Fd (v) = d x, y(x) v(x) dx, Ω
ist deshalb linear und stetig auf V und geh¨ ort so dem Raum V ∗ an. In diesem Sinne identifiziert man d(·, y(·)) mit Fd , also einem Element von V ∗ . Das geschieht mit dem kanonischen Isomorphismus von V in V ∗ . Dementsprechend definieren wir A2 : V → V ∗ durch A2 y = Fd . Analog definiert man den dritten Anteil A3 , der zur Nichtlinearit¨at b geh¨ ort, denn Fb (v) = b x, y(x) v(x) ds(x) Γ ∗
ist ebenfalls ein Funktional aus V , das mit b(·, y(·)) identifiziert werden kann. In diesem Sinne gilt A3 y = Fb . Die Summe aller Anteile ergibt A = A1 + A2 + A3 . (ii) Monotonie von A Alle Ai sind monoton, also auch A. Das sieht man leicht ein. Die Monotonie von A1 folgt sofort aus a[y, y] ≥ 0. Betrachten wir A2 : Aus der Monotonie von d in y folgt d(x, y1 ) − d(x, y2 ) (y1 − y2 ) ≥ 0 f¨ ur alle reellen Zahlen y1 , y2 und alle x. Deshalb gilt auch A2 (y1 ) − A2 (y2 ) , y1 − y2 V ∗ ,V = d(x, y1 (x)) − d x, y2 (x)) y1 (x) − y2 (x) dx ≥ 0 Ω
150
4 Steuerung semilinearer elliptischer Gleichungen
f¨ ur alle yi ∈ H 1 (Ω). Das Integral ist durch unsere strenge Beschr¨anktheitsvoraussetzung an d definiert, denn sie garantiert die quadratische Integrierbarkeit von d(x, y1 )−d(x, y2 ). Damit ist A2 monoton. Analog zeigt man die Monotonie von A3 . (iii) Koerzivit¨at von A A1 ist koerziv, denn
(A1 v , v)V ∗ ,V = a[v, v] ≥ β0 v2V
folgt aus den Voraussetzungen an c0 und α wie im Beweis von Satz 2.6 auf S. 29. Von A2 und A3 kommen nur nichtnegative Anteile, die diese Koerzivit¨at nicht zerst¨oren. Hier wird die Voraussetzung d(x, 0) = b(x, 0) = 0 ausgenutzt: (A2 v , v)V ∗ ,V = d(x, v(x)) v(x) dx Ω
(d(x, v(x)) − d(x, 0))(v(x) − 0) dx ≥ 0
= Ω
wegen Monotonie von d. Gleiches gilt f¨ ur A3 , deshalb ist A = A1 + A2 + A3 als Summe der drei Operatoren ebenfalls koerziv. (iv) Hemistetigkeit ur A2 folgt das so: Wir setzen A1 ist als linearer Operator hemistetig. F¨ ϕ(t) := A2 (y + t v) , w V ∗ ,V = d x, y(x) + t v(x) w(x) dx. Ω
Nun sei τ ∈ IR fest ausgew¨ ahlt und {tn }∞ n=1 eine Folge reeller Zahlen aus IR, die gegen τ konvergiert. Es ist ϕ(tn ) → ϕ(τ ) zu zeigen. ∞ Wegen unserer Annahme konvergiert die Funktionenfolge d x, y(x) + tn v(x) w(x) n=1 f¨ ur fast jedes feste x ∈ Ω gegen d x, y(x) + τ v(x) w(x), denn d ist eine stetige Funktion von y. Damit ist die Funktionenfolge ¨berall punktn v(x) w(x) fast u fn (x) = d x, y(x)+t weise konvergent gegen f (x) = d x, y(x) + τ v(x) w(x). Außerdem ist sie beschr¨ankt durch eine integrierbare Funktion, denn aus (4.6) folgt d x, y(x) + tn v(x) w(x) ≤ M w(x) und wir wissen w ∈ L2 (Ω). Mit dem Satz von Lebesgue u ¨ ber die majorisierte Konvergenz, Forster [69], erhalten wir daraus ϕ(tn ) = d x, y(x) + tn v(x) w(x) dx → d x, y(x) + τ v(x) w(x) dx = ϕ(τ ) Ω
Ω
f¨ ur n → ∞. F¨ ur den Operator A3 argumentiert man analog. (v) Existenz und Eindeutigkeit der L¨osung und Absch¨atzung Existenz und Eindeutigkeit einer schwachen L¨osung y ∈ H 1 (Ω) folgen nun direkt aus dem Hauptsatz u ¨ber monotone Operatoren. Man sieht auch, dass A stark monoton ist und deshalb die im Satz behauptete Absch¨ atzung gilt. Aber so ist nicht erkennbar, dass diese nicht von d und b abh¨ angig ist. Deshalb beweisen wir die Absch¨atzung direkt.
4.2 Semilineare elliptische Modellgleichung
151
In der Variationsgleichung (4.8) f¨ ur die schwache L¨osung y w¨ahlen wir y selbst als Testfunktion und erhalten a[y, y] + (A2 y , y)V ∗ ,V + (A3 y , y)V ∗ ,V = f (x) y(x) dx + g(x) y(x) ds(x). Ω
Γ
Die A2 und A3 enthaltenden Anteile sind nichtnegativ, also folgt a[y, y] ≤ f (x) y(x) dx + g(x) y(x) ds(x). Ω
Γ
Das ist der Grund, warum die behauptete Absch¨atzung nicht von d und b abh¨angt. Die Bilinearform a[y, y] wird durch die H 1 -Norm nach unten abgesch¨atzt und die rechte Seite mit der Ungleichung von Cauchy-Schwarz. So folgt β0 y2H 1 (Ω)
≤ f L2 (Ω) yL2 (Ω) + gL2 (Γ) yL2 (Γ) ≤ c f L2 (Ω) + gL2 (Γ) yH 1 (Ω)
und schließlich die im Satz behauptete Absch¨ atzung. Bemerkungen. (i) Der Satz ist nicht direkt auf Gleichung (4.2) anwendbar, weil d(x, y) = y 3 nicht die Voraussetzung 4.3 erf¨ ullt. Diese wird aber nur dazu ben¨ otigt, dass d(x, y(x)) eine ur y(x)3 bei y ∈ H 1 (Ω) gesichert, wie bereits erw¨ ahnt wurde. Funktion aus L2 (Ω) ist. Das ist f¨ (ii) Im Beweis wurde nur ausgenutzt, dass f und g lineare und stetige Funktionale auf V erzeugen, also mit Elementen aus V ∗ identifiziert werden k¨ onnen. Dazu ist quadratische Integrierbarkeit nicht n¨ otig, siehe S. 32. Der Satz bleibt insbesondere richtig f¨ ur Vorgaben f ∈ Lr (Ω) und s N osung y sogar stetig ist (Satz 4.7). Das g ∈ L (Γ) mit r > 2 und s > N − 1, zu denen die L¨ schließt f¨ ur N = 2, 3 auch Werte r, s < 2 ein. (iii) Weitere Techniken zur Behandlung nichtlinearer elliptischer Gleichungen findet man z.B. in Barbu [19], Lions [143], Ladyzhenskaya and Ural’ceva [135], Neittaanm¨ aki et al. [164] oder Zeidler [216, 217].
4.2.3 Stetige L¨ osungen In diesem Abschnitt folgen wir Ideen von E. Casas [44]. Zun¨achst wird mit einer von Stampacchia gefundenen Methode gezeigt, dass die schwache L¨osung y ∈ H 1 (Ω) sogar beschr¨ ankt ist, wenn die Funktionen f und g besser“ sind als nur quadratisch integrier” bar. Das Hauptergebnis dieses Abschnitts ist Satz 4.8 u ¨ ber die Stetigkeit von y. Satz 4.5 Sind die Voraussetzungen 4.2 und 4.3 erf¨ ullt und r > N/2, s > N − 1 gegeben, dann existiert zu jedem Paar f ∈ Lr (Ω) und g ∈ Ls (Γ) genau eine schwache L¨osung y ∈ H 1 (Ω) des Randwertproblems (4.5). Diese geh¨ort zu L∞ (Ω) und es gibt eine von d, b, f und g unabh¨angige Konstante c∞ > 0, mit der folgende Absch¨atzung erf¨ ullt ist: yL∞ (Ω) ≤ c∞ f Lr (Ω) + gLs (Γ) . (4.10) Der Beweis des Satzes wird in Abschnitt 7.2.2 ab S. 279 gef¨ uhrt. Es gilt die Ungleichung yL∞ (Γ) ≤ yL∞ (Ω)
∀y ∈ H 1 (Ω) ∩ L∞ (Ω),
152
4 Steuerung semilinearer elliptischer Gleichungen
¨ siehe Ubungsaufgabe 4.1. Deshalb folgt aus (4.10) die gleiche Absch¨atzung f¨ ur yL∞ (Γ) . Es f¨ allt auf, dass (4.10) nicht von d und b abh¨angt. Das liegt an der Monotonie dieser Funktionen. Es ist daher naheliegend, dass die von ihnen geforderte Beschr¨anktheit gar nicht n¨ otig ist. In der Tat kann man darauf verzichten und sogar die Stetigkeit der L¨osung ¯ beweisen. Dazu ben¨ y auf Ω otigen wir noch einen weiteren Hilfssatz. Lemma 4.6 ([44]) Ist Ω ⊂ IRN ein beschr¨anktes Lipschitzgebiet und sind f ∈ Lr (Ω), g ∈ Ls (Γ) mit r > N/2, s > N − 1 gegeben, dann ist die schwache L¨osung y des Neumannproblems Ay +y = f ∂ν A y = g ¯ Mit einer von f und g unabh¨angigen Konstanten c(r, s) > 0 gilt stetig auf Ω. yC(Ω) ¯ ≤ c(r, s) f Lr (Ω) + gLs (Γ) . Beweis: Wir f¨ uhren den Beweis der Einfachheit halber unter der Zusatzvoraussetzung, ¯ geh¨oren. Zitate zum dass Ω einen C 1,1 -Rand besitzt und die Koeffizienten aij zu C 0,1 (Ω) allgemeinen Fall folgen nach diesem Beweis. Die Existenz von y ∈ H 1 (Ω) folgt aus Satz 2.6 auf S. 29 (vgl. auch die Bemerkungen auf S. 32 zu Daten mit r < 2 oder s < 2). Nach dem letzten Satz, angewendet mit c0 = 1, d = b = α = 0, ist y fast u ¨berall beschr¨ankt und erf¨ ullt die zu beweisende Absch¨ atzung, allerdings in der L∞ -Norm. Die R¨aume C ∞ (Ω) und C ∞ (Γ) sind dicht in Lr (Ω) bzw. Ls (Γ). Man w¨ahlt Funktionen fn ∈ C ∞ (Ω) bzw. gn ∈ C ∞ (Γ) mit fn → f in Lr (Ω) und gn → g in Ls (Γ), n → ∞. Die zugeh¨orige L¨osung yn hat nach den in Abschnitt 2.14.3 zusammengestellten Ergebnissen aus Grisvard [86] die Regularit¨ at yn ∈ W 2,r (Ω). Dazu wird die vorausgesetzte Glattheit der Koeffizienten ¯ f¨ aij und des Randes gebraucht. Aus der stetigen Einbettung W 2,r (Ω) ⊂ C(Ω) ur r > N/2 ¯ (Satz 7.1 auf S. 277) folgt yn ∈ C(Ω). Die Differenz y − yn l¨ost A(y − yn ) + y − yn ∂νA (y − yn )
= f − fn = g − gn .
Wenden wir wieder den letzten Satz an, dann folgt aus der Konvergenz von fn − f und gn − g gegen null auch y − yn L∞ (Ω) → 0, n → ∞. Die Folge {yn }∞ n=1 ist demnach ¯ Da insbesondere Cauchyfolge in L∞ (Ω). Andererseits wissen wir inzwischen yn ∈ C(Ω). ¯ identisch sind, ist {yn }∞ die Normen stetiger Funktionen in L∞ (Ω) und C(Ω) n=1 auch ¯ und hat daher ihren Grenzwert in C(Ω). ¯ Das kann nur y sein. Cauchyfolge in C(Ω) Die Stetigkeit von y ist damit bewiesen und die Absch¨atzung folgt aus (4.10) wegen yL∞ (Ω) = yC(Ω) ¯ . Der Beweis f¨ ur den Fall von L∞ -Koeffizienten aij und Lipschitzgebiete wurde durch Casas [44] erbracht und von Alibert und Raymond [5] auf allgemeinere Aufgaben u ¨bertragen. Neue Ergebnisse von Griepentrog [83] zur Regularit¨at von L¨osungen elliptischer Randwertaufgaben schließen die Aussage des Lemmas als Spezialfall ein. Das wird in Abschnitt 7.2.1 ab S. 278 erl¨ autert. F¨ ur gemischte (Dirichlet-Neumann-) Randbedingungen gibt es ein neues Resultat zur H¨ olderstetigkeit der L¨osung von Haller-Dintelmann et al. [95]. Im Weiteren verzichten wir auf die Beschr¨ anktheit von b und d. Ohne Voraussetzung 4.3 heißt y ∈ H 1 (Ω) ∩ L∞ (Ω) schwache L¨osung von (4.5), wenn (4.8) erf¨ ullt ist.
4.2 Semilineare elliptische Modellgleichung
153
Satz 4.7 Es sei Voraussetzung 4.2 erf¨ ullt, Ω ⊂ IRN ein beschr¨anktes Lipschitzgebiet und r > N/2, s > N − 1. Ferner sei zus¨atzlich b(x, 0) = 0 sowie d(x, 0) = 0 f¨ ur fast alle x ∈ Γ bzw. x ∈ Ω gefordert. Dann besitzt das semilineare Randwertproblem (4.5) zu jedem Paar f ∈ Lr (Ω), g ∈ Ls (Γ) in H 1 (Ω) ∩ L∞ (Ω) genau eine schwache L¨osung y. Diese ist stetig und gen¨ ugt mit einer von d, b, f und g unabh¨angigen Konstanten c∞ der Absch¨atzung yH 1 (Ω) + yC(Ω) (4.11) ¯ ≤ c∞ f Lr (Ω) + gLs (Γ) . Beweis: Wir folgen wieder Casas [44]. Zuerst wird gezeigt, dass die bisherige Beschr¨anktheitsforderung an d und b unn¨ otig ist. Man schneidet die eventuell unbeschr¨ankten Funktionen d und b ab und definiert f¨ ur beliebiges k > 0 ⎧ d(x, k), falls y > k ⎨ d(x, y), falls |y| ≤ k dk (x, y) = ⎩ d(x, −k), falls y < −k. Analog ist bk definiert. Die Funktionen bk und dk sind gleichm¨aßig beschr¨ankt und erf¨ ullen daher Voraussetzung 4.3. Nun werden f ∈ Lr (Ω) und g ∈ Ls (Γ) fest vorgegeben. Nach Satz 4.5 existiert f¨ ur das elliptische Randwertproblem A y + c0 (x) y + dk (x, y) = f ∂νA y + α(x) y + bk (x, y) = g
in Ω auf Γ
ugt der Absch¨atzung (4.10), genau eine schwache L¨ osung y ∈ H 1 (Ω) ∩ L∞ (Ω). Diese gen¨ die unabh¨ angig von dk und bk ist, also auch von k. W¨ahlen wir k > c∞ (f Lr (Ω) + gLs (Γ) ), so gilt wegen (4.10) automatisch |y(x)| ≤ k und daher dk (x, y(x)) = d(x, y(x)), also l¨ ost y die Aufgabe (4.5). Zum Nachweis der Stetigkeit von y schreiben wir das nichtlineare Randwertproblem um, das von y gel¨ost wird: Ay +y ∂νA y
= f + y − c0 y − dk (x, y) = g − α y − bk (x, y)
in Ω auf Γ.
Da y beschr¨ ankt ist, sind die rechten Seiten Funktionen aus Lr (Ω) bzw. Ls (Γ). Lemma 4.6 sichert die Stetigkeit von y. Es bleibt noch die Eindeutigkeit der L¨ osung zu beweisen. Ist y˜ eine weitere stetige schwache L¨ osung, dann sind sowohl y als auch y˜ L¨ osungen des mit k := max{yC(Ω) y C(Ω) ¯ , ˜ ¯ } definierten Problems, dessen L¨ osung aber eindeutig bestimmt ist; daher gilt y = y˜. Nun sparen wir noch die Voraussetzung d(x, 0) = b(x, 0) = 0 ein. Diese wurde im Beweis von Satz 4.4 dazu ben¨ otigt, dass der Operator A monoton ist. Satz 4.8 Der Satz 4.7 bleibt ohne die Voraussetzung b(x, 0) = d(x, 0) = 0 richtig, wenn die Absch¨atzung (4.11) mit angepasstem c∞ > 0 durch die folgende ersetzt wird: yH 1 (Ω) + yC(Ω) (4.12) ¯ ≤ c∞ f − d(·, 0)Lr (Ω) + g − b(·, 0)Ls (Γ) . Beweis: Wir schreiben die Randwertaufgabe um, A y + c0 (x) y + d(x, y) − d(x, 0) = ∂νA y + α(x) y + b(x, y) − b(x, 0) =
f (x) − d(x, 0) g(x) − b(x, 0)
in Ω auf Γ.
154
4 Steuerung semilinearer elliptischer Gleichungen
Die Funktionen y → d(x, y) − d(x, 0), y → b(x, y) − b(x, 0) verschwinden im Nullpunkt, so dass Satz 4.7 auf die rechten Seiten f − d(·, 0) und g − b(·, 0) anwendbar ist. Nach Voraussetzung 4.2 sind d(·, 0) und b(·, 0) beschr¨ankt und messbar, so dass die rechten Seiten den gleichen R¨ aumen angeh¨ oren wie f bzw. g. Absch¨atzung (4.12) ergibt sich aus (4.11).
4.2.4 Abschw¨ achung der Voraussetzungen Bis jetzt haben wir die semilineare elliptische Modellgleichung in der Form (4.5) auf S. 147 betrachtet. Die ben¨ otigte Koerzivit¨ at des elliptischen Operators wurde durch die Koeffizienten c0 bzw. α getragen. Insbesondere war die Wahl d(x, y) = 0 und b(x, y) = 0 m¨oglich. Unter welchen Bedingungen kommt man ohne die Funktionen c0 bzw. α aus, weil die im Satz von Browder und Minty vorausgesetzte Koerzivit¨at des nichtlinearen Operators allein aus d oder b resultiert? Als charakteristische Beispiele untersuchen wir die folgenden semilinearen Neumannprobleme auf die Existenz einer eindeutig bestimmten L¨osung in H 1 (Ω) ∩ L∞ (Ω) und deren stetige Abh¨ angigkeit von der rechten Seite f :
sowie
−Δy + ey ∂νA y
= f = 0
in Ω auf Γ
(4.13)
−Δy + y 3 ∂νA y
= f = 0
in Ω auf Γ.
(4.14)
Bei (4.13) ist das nicht der Fall, was leicht zu sehen ist: Die Funktion y(x) ≡ c l¨ost (4.13) mit f (x) ≡ ec und wir haben f → 0 f¨ ur c → −∞. Zu f = 0 existiert offenbar keine beschr¨ ankte L¨ osung. Das best¨ atigt man leicht durch Einsetzen der Funktion v(x) ≡ 1 als Testfunktion in die schwache Formulierung. Bei homogener Dirichlet-Randbedingung tritt dieses Problem nicht auf, denn in H01 (Ω) ist A = −Δ koerziv. Gleichung (4.14) ist jedoch in H 1 (Ω) ∩ L∞ (Ω) korrekt gestellt. Hier ist der n¨achste, von E. Casas mitgeteilte Satz anwendbar. Er bezieht sich auf die Randwertaufgabe A y + d(x, y) = 0 ∂νA y + b(x, y) = 0
in Ω auf Γ,
(4.15)
bei der A wie in (4.5) definiert ist. Hier sind die bisher gegebenen rechten Seiten f bzw. g durch d(x, y) bzw. b(x, y) ber¨ ucksichtigt. Voraussetzung 4.9 Das Gebiet Ω und der lineare Differentialoperator A sollen den in Voraussetzung 4.2 auf S. 148 formulierten Bedingungen gen¨ ugen. Die Funktionen d = d(x, y) : Ω × IR → IR und b = b(x, y) : Γ × IR → IR seien f¨ ur jedes y ∈ IR messbar in x sowie monoton wachsend und stetig in y f¨ ur fast alle x ∈ Ω bzw. x ∈ Γ. F¨ ur jedes M > 0 sollen Funktionen ψM ∈ Lr (Ω), φM ∈ Ls (Γ) mit r > N/2, s > N − 1 existieren, so dass d und b den Absch¨atzungen |d(x, y)| ≤ ψM (x) f¨ ur fast alle x ∈ Ω und alle |y| ≤ M |b(x, y)| ≤ φM (x) f¨ ur fast alle x ∈ Γ und alle |y| ≤ M
(4.16)
4.2 Semilineare elliptische Modellgleichung
155
gen¨ ugen. Mindestens eine der folgenden Bedingungen (i), (ii) treffe zu: (i) Es existieren eine Menge Ed ⊂ Ω mit positivem Maß und Konstanten Md > 0, λd > 0 so dass die folgenden Ungleichungen erf¨ ullt sind: d(x, y1 ) < d(x, y2 ) (d(x, y) − d(x, 0)) y ≥ λd |y|2
∀x ∈ Ed , ∀y1 < y2 , ∀x ∈ Ed , ∀|y| > Md .
(4.17)
(ii) Es existieren eine Menge Eb ⊂ Γ mit positivem Maß und Konstanten Mb > 0, λb > 0 so dass die folgenden Ungleichungen erf¨ ullt sind: b(x, y1 ) < b(x, y2 ) (b(x, y) − b(x, 0)) y ≥ λb |y|2
∀x ∈ Eb , ∀x ∈ Eb ,
∀y1 < y2 , ∀|y| > Mb .
(4.18)
Satz 4.10 Unter Voraussetzung 4.9 besitzt das Randwertproblem (4.15) in H 1 (Ω) ∩ ¯ L∞ (Ω) genau eine schwache L¨osung y. Diese ist stetig auf Ω. Beweis: Wir folgen der Idee von E. Casas und betrachten zun¨achst f¨ ur n = 1, 2, . . . die Randwertaufgabe A y + n−1 y + d(x, y) = 0 in Ω ∂νA y + b(x, y) = 0 auf Γ. Analog zu Satz 4.8 existiert auch unter diesen leicht ge¨anderten Voraussetzungen in H 1 (Ω) ∩ L∞ (Ω) genau eine L¨ osung yn dieser Aufgabe. Wir w¨ahlen dabei c0 (x) = n−1 . Aus Satz 7.6 auf S. 283 folgt yn L∞ (Ω) ≤ K mit einer von n unabh¨angigen Schranke K. In dieser Aussage steckt die Hauptschwierigkeit des Beweises. Wegen yn L∞ (Γ) ≤ c yn L∞ (Ω) haben wir auch die gleichm¨ aßige Beschr¨anktheit von yn L∞ (Γ) sowie der L2 -Normen der Funktionen yn und ihrer Spuren. Aus der Monotonie der Funktionen d und b und der Ungleichung (2.20) auf S. 30 folgt nach Einsetzen von yn in die schwache Formulierung f¨ ur alle n die Absch¨atzung γ0 |∇y|2 dx ≤ ψK |yn | dx + φK |yn | ds ≤ c, Ω
Ω
Γ
also ist wegen yn L∞ (Ω) ≤ K auch {yn H 1 (Ω) } beschr¨ankt. Wir k¨onnen eine Teilfolge {ynk } ausw¨ ahlen, die in H 1 (Ω) schwach und in L2 (Ω) stark gegen ein y ∈ H 1 (Ω)∩L∞ (Ω) konvergiert. Aus der Beschr¨ anktheit von yn in L∞ (Ω) bzw. L∞ (Γ) und dem Satz u ¨ber die majorisierte Konvergenz folgt die Konvergenz von d(·, yn ) bzw. b(·, yn ) gegen d(·, y) in L2 (Ω) bzw. gegen b(·, y) in L2 (Γ), so dass y L¨osung von (4.15) ist. Die Eindeutigkeit dieser L¨ osung ergibt sich aus einem Standardschluss: Sind y1 , y2 zwei beschr¨ ankte L¨ osungen, dann testen wir die Differenz der zugeh¨origen Gleichungen mit der Testfunktion v = y1 − y2 und erhalten 2 γ0 |∇v| dx + (d(x, y1 ) − d(x, y2 )) v dx + (b(x, y1 ) − b(x, y2 )) v ds ≤ 0. (4.19) Ω
Ω
Γ
Wegen Monotonie von d und b sind alle drei Terme nichtnegativ und damit gleich null. Daraus folgt zuerst |∇v(x)| = 0 f.¨ u. in Ω und deshalb fast u ¨berall y1 (x) − y2 (x) = c mit c ∈ IR, vgl. Zeidler [215], Problem 21.31a. Deshalb ist y1 − y2 ∈ H 1 (Ω) fast u ¨berall gleich der stetigen Funktion y(x) ≡ c, woraus nach dem Spursatz auch y1 (x) − y2 (x) = c fast u ¨berall auf Γ folgt.
156
4 Steuerung semilinearer elliptischer Gleichungen
F¨ ur c = 0 ist deshalb eine der beiden Funktionen y1 , y2 fast u ¨berall in Ω echt gr¨oßer als die andere, insbesondere fast u berall in E bzw. E , wo d bzw. b streng monoton ¨ d b ist. Dann w¨ are aber eines der beiden obigen Integrale positiv im Widerspruch zu 4.19. Folglich gilt c = 0, d.h. y1 = y2 . Die Stetigkeit der L¨osung erh¨alt man wieder mit Lemma 4.6. Sind d(x, y) bzw. b(x, y) zus¨ atzlich zur Monotonie in y f¨ ur fast alle x nach y differenzierbar, dann sind folgende Bedingungen hinreichend f¨ ur (4.17) bzw. (4.18): Es existieren messbare Mengen Ed ⊂ Ω bzw. Eb ⊂ Γ von positivem Maß sowie Konstanten λd > 0 bzw. λb > 0 mit dy (x, y) ≥ λd ∀x ∈ Ed , ∀y ∈ IR,
by (x, y) ≥ λb ∀x ∈ Eb , ∀y ∈ IR.
(4.20)
Gilt eine dieser Beziehungen, so ist Satz 4.8 auf das Randwertproblem (4.15) anwendbar: Wir definieren c0 (x) := χ(Ed )λd und schreiben ˜ y). d(x, y) = c0 (x)y + (d(x, y) − c0 (x)y) = c0 (x)y + d(x, Dann ist d˜ monoton wachsend bez¨ uglich y und c0 L∞ (Ω) = 0. Analog k¨onnen wir b mit α(x) := χ(Eb )λb umformen. Damit hat die Gleichung die Form (4.5). Mit jeder der beiden Bedingungen aus (4.20) sind die Voraussetzungen von Satz 4.8 erf¨ ullt.
4.3 Nemytskii-Operatoren 4.3.1 Stetigkeit von Nemytskii-Operatoren Mit Nichtlinearit¨ aten wie d(x, y) wird einer gegebenen Funktion y(·) eine neue Funktion z(x) = d(x, y(x)) zugeordnet. Operatoren dieses Typs nennt man Superpositionsoperatoren oder Nemytskii-Operatoren. Ihre Differentiation ist mit gewissen versteckten Schwierigkeiten verbunden. Beispiele. Die folgenden Zuordnungen y(·) → z(·) sind Nemytskii-Operatoren: 3 z(x) = y(x) , z(x) = sin (y(x)),
3 z(x) = a(x) y(x) , 2 z(x) = y(x) − a(x) .
Die erste Abbildung kommt im Beispiel der Supraleitung vor, die dritte dient als Paradebeispiel f¨ ur auftretende Schwierigkeiten und die vierte tritt in unseren quadratischen Integralfunktionalen auf. Die obigen Operatoren werden durch 2 d(y) = y 3 , d(x, y) = a(x) y 3 , d(y) = sin(y), d(x, y) = y − a(x) (4.21) erzeugt.
Alle im Buch vorkommenden Nichtlinearit¨ aten des obigen Typs k¨onnen von 2 Variablen abh¨ angen, von der Gebietsvariablen“ x sowie einer Funktionsvariablen“, in die eine ” ” Steuer- oder Zustandsfunktion eingesetzt wird. Die Funktionsvariable bezeichnen wir mit y, u, v oder w. Bei Aufgaben mit einer im Gebiet verteilten Steuerung wird beispielsweise die Funktion d = d(x, y), x ∈ Ω (d f¨ ur distributed) verwendet. Bei Randsteuerung tritt die f¨ ur x ∈ Γ definierte Funktion b = b(x, y) auf (b f¨ ur boundary).
4.3 Nemytskii-Operatoren
157
In parabolischen Aufgaben kommt zur Ortsvariablen x noch die Zeitvariable t hinzu, so dass (x, t) f¨ ur die Gebietsvariable steht. Zur Vereinfachung der n¨achsten Definition bezeichnen wir die von der Gebietsvariablen durchlaufene Menge mit E. Bei elliptischen Aufgaben haben wir E = Ω oder E = Γ, bei parabolischen E = Ω × (0, T ) bzw. E = Γ × (0, T ). Generell wird die Menge E als beschr¨ ankt und Lebesgue-messbar vorausgesetzt. Die numerische Analysis der Optimalsteuerung erfordert die Verwendung von Ableitungen erster und zweiter Ordnung solcher Nemytskii-Operatoren. Wir beginnen in diesem Abschnitt mit der Stetigkeit und Ableitungen erster Ordnung. Ableitungen zweiter Ordnung werden sp¨ ater im Zusammenhang mit hinreichenden Optimalit¨atsbedingungen diskutiert. Definition. Es sei E ⊂ IRm , m ∈ IN, eine beschr¨ankte sowie messbare Menge und ϕ = ϕ(x, y) : E × IR → IR eine Funktion. Die Abbildung Φ, Φ y = ϕ ·, y(·) , die einer Funktion y : E → IR die durch z(x) = ϕ x, y(x) definierte Funktion z : E → IR zuordnet, heißt Nemytskii-Operator oder Superpositionsoperator. Die Untersuchung von Nemytskii-Operatoren in Lp -R¨aumen mit 1 ≤ p < ∞ erfordert mehr oder weniger einschr¨ ankende Wachstumsbedingungen an ϕ(x, y) in Bezug auf y. Da im Weiteren alle auftretenden Steuer- und Zustandsfunktionen gleichm¨aßig beschr¨ankt sein werden, k¨ onnen wir in L∞ und deshalb mit einfacheren Bedingungen arbeiten. Diesen gen¨ ugen zum Beispiel alle auf ganz IR definierten elementaren Funktionen von y. Definition. Eine Funktion ϕ = ϕ(x, y) : E × IR → IR erf¨ ullt die Carath´eodory-Bedingung, wenn ϕ f¨ ur jedes feste y ∈ IR messbar in x ist und stetig in y f¨ ur fast alle festen x ∈ E. Sie gen¨ ugt der Beschr¨anktheitsbedingung, wenn eine Konstante K existiert, so dass |ϕ(x, 0)| ≤ K (4.22) f¨ ur fast alle x ∈ E gilt. Sie heißt lokal Lipschitz-stetig in y, wenn f¨ ur jede Konstante M > 0 eine Konstante L(M ) > 0 existiert, so dass f¨ ur fast alle x ∈ E und alle y, z ∈ [−M, M ] die Absch¨atzung |ϕ(x, y) − ϕ(x, z)| ≤ L(M ) |y − z|
(4.23)
erf¨ ullt ist. anktheitsbedingung folgt zusammen mit der lokalen Lipschitzstetigkeit Aus der Beschr¨ die Beschr¨ anktheit von ϕ f¨ ur alle y ∈ [−M, M ] und fast alle x ∈ E. Beispiele. Alle Funktionen ϕ = ϕ(y) aus C 1 (IR) erf¨ ullen diese Bedingungen. Gleiches gilt f¨ ur ϕ(x, y) := a1 (x) + a2 (x) b(y) mit ai ∈ L∞ (E) und b ∈ C 1 (IR). Die in (4.21) aufgez¨ ahlten Funktionen gen¨ ugen ebenfalls den Bedingungen, falls a ∈ L∞ (E). Lemma 4.11 Die Funktion ϕ = ϕ(x, y) sei f¨ ur jedes y ∈ IR messbar in x ∈ E, erf¨ ulle die Beschr¨anktheits-Bedingung und sei lokal Lipschitz-stetig in y. Dann ist der zugeordnete Nemytskii-Operator Φ stetig im Raum L∞ (E). Außerdem gilt f¨ ur alle r ∈ [1, ∞] Φ(y) − Φ(z)Lr (E) ≤ L(M ) y − zLr (E)
158
4 Steuerung semilinearer elliptischer Gleichungen
f¨ ur alle Funktionen y und z aus L∞ (E), die der Bedingung yL∞ (E) ≤ M , zL∞ (E) ≤ M gen¨ ugen. Beweis: Ist y ∈ L∞ (E) gegeben, so folgt |y(x)| ≤ M mit hinreichend großem M , f¨ ur fast alle x ∈ E. Die Beschr¨ anktheits- und Lipschitzbedingungen (4.22), (4.23) sichern |ϕ x, y(x) | ≤ |ϕ x, 0 | + |ϕ x, y(x) − ϕ x, 0 | ≤ K + L(M )M f¨ ur fast alle x ∈ E. Damit liegt Φ y(·) = ϕ ·, y(·) in L∞ (E), also bildet Φ den Raum L∞ (E) in sich ab. Sind y und z dem Betrag nach f.¨ u. durch M beschr¨ankt, so folgt aus der lokalen Lipschitzstetigkeit f¨ ur beliebiges 1 ≤ r < ∞ |ϕ x, y(x) − ϕ x, z(x) |r dx ≤ L(M )r |y(x) − z(x)|r dx = L(M )r y − zrLr (E) . E
E
Das ist a ur r = ∞ geht man analog ¨quivalent zur im Lemma formulierten Absch¨atzung. F¨ vor. Deshalb ist Φ auch lokal Lipschitz-stetig in L∞ (E). Ist die Funktion ϕ sogar gleichm¨aßig beschr¨ankt und Lipschitz-stetig auf ganz IR, dann ist Φ Lipschitz-stetig in jedem Raum Lr (E) und es existiert ein L > 0 mit Φ(y) − Φ(z)Lr (E) ≤ L y − zLr (E)
∀y, z ∈ Lr (E).
Das sieht man sofort am obigen Beweis. Beispiel. Φ(y) = sin y(·) Der Nemytskii-Operator Φ wird erzeugt durch ϕ(x, y) = sin(y). Wir wissen | sin(y)| ≤ 1 und | sin(y) − sin(z)| ≤ |y − z| ∀y, z ∈ IR. Die Funktion ϕ(x, y) = sin(y) ist also global beschr¨ankt und Lipschitz-stetig, jeweils mit Konstante 1. Deshalb ist Φ (global) Lipschitz-stetig und
sin y(·) − sin z(·) r ≤ y − zLr (E) ∀y, z ∈ Lr (E). L (E)
4.3.2 Differenzierbarkeit von Nemytskii-Operatoren Voraussetzungen an die Nichtlinearit¨ aten F¨ ur die Differenzierbarkeit von Nemytskii-Operatoren m¨ ussen an die definierende Funktion ϕ h¨ ohere Glattheitsvoraussetzungen gestellt werden. Um deren Formulierung etwas abzuk¨ urzen, vereinbaren wir folgende Bezeichnungsweise: Definition. Es sei E ⊂ Rm , m ∈ IN eine beschr¨ankte Menge und ϕ = ϕ(x, y) : E × IR → IR eine Funktion der Ortsvariablen x und der Funktionsvariablen y. F¨ ur fast alle x ∈ E sei sie k−mal partiell nach y differenzierbar. Wir sagen, dass die Funktion ϕ die Beschr¨anktheitsbedingung der Ordnung k erf¨ ullt, wenn eine Schranke K derart existiert, dass l Dy ϕ(x, 0) ≤ K (4.24) f¨ ur fast alle x ∈ E und alle l = 0, . . . , k gilt. Sie gen¨ ugt der lokalen Lipschitzbedingung der Ordnung k, wenn eine von M abh¨angige Lipschitzkonstante L = L(M ) existiert, so dass k D ϕ(x, y1 ) − Dk ϕ(x, y2 ) ≤ L(M ) |y1 − y2 | (4.25) y y
4.3 Nemytskii-Operatoren
159
f¨ ur alle yi ∈ IR mit |yi | ≤ M, i = 1, 2 erf¨ ullt ist. Wenn ϕ nur von der zweiten Variablen abh¨ angt, ϕ = ϕ(y), dann sind die obigen zwei Bedingungen ¨ aquivalent zur lokalen Lipschitzstetigkeit von ϕ(k) , (k) ϕ (y1 ) − ϕ(k) (y2 ) ≤ L(M ) |y1 − y2 | f¨ ur alle in (4.25) spezifizierten yi . Bemerkung. Aus Beschr¨anktheitsbedingung und lokaler Lipschitzbedingung der Ordnung k folgt die lokale Beschr¨ anktheit sowie lokale Lipschitzstetigkeit aller Ableitungen bis zur Ordnung k. Das sieht man leicht ein: Zun¨ achst ergibt sich aus Lipschitzbedingung und Beschr¨ anktheitsbedingung die lokale Beschr¨ anktheit in y, denn es gilt f¨ ur alle y mit |y| ≤ M ˛ ˛ ˛ ˛ ˛ ˛ l ˛Dy ϕ(x, y)˛ ≤ ˛Dyl ϕ(x, y) − Dyl ϕ(x, 0)˛ + ˛Dyl ϕ(x, 0)˛ ≤ L(M ) |y| + K ≤ K(M ). Daraus erh¨ alt man die lokale Lipschitzstetigkeit der Ableitung einer Ordnung niedriger. Beispielsweise folgt aus der lokalen Lipschitzstetigkeit der Ordnung 2 die lokale Lipschitzstetigkeit der Ordnung 1, denn aus dem Mittelwertsatz ergibt sich ˛ ˛ ˛ ˛ ˛Dy ϕ(x, y1 ) − Dy ϕ(x, y2 )˛ = ˛Dy2 ϕ(x, yϑ )(y1 − y2 )˛ ≤ 2 K(M ) M mit einer zwischen y1 und y2 liegenden Zwischenstelle yϑ f¨ ur |yi | ≤ M , i = 1, 2. So behandelt man St¨ uck f¨ ur St¨ uck alle Ableitungen niedrigerer Ordnung bis hin zur Funktion ϕ selbst.
Ableitungen erster Ordnung in L∞ (E) Bei Forderung der Differenzierbarkeit von Φ scheinen die Dinge klar zu liegen. Ist ϕ stetig differenzierbar nach der Funktionsvariablen, dann sollte auch der zugeordnete NemytskiiOperator Φ differenzierbar sein. Im Prinzip stimmt das, aber die Wahl des Funktionenraums ist entscheidend. Zur Vereinfachung legen wir folgende Bezeichnungsweise fest: Wir bezeichnen die partiellen Ableitungen Dy ϕ = ∂ϕ/∂y, Dy2 ϕ = ∂ 2 ϕ/∂y 2 in bekannter Weise durch ϕy , ϕyy . Es sei ϕ f¨ ur jedes feste x stetig nach y differenzierbar. Hat Φ an der Stelle y eine Fr´echetAbleitung, dann k¨onnen wir sie als Gˆateaux-Ableitung berechnen, 1 Φ (y)h (x) = lim ϕ x, y(x) + t h(x) − ϕ x, y(x) t→0 t (4.26) d = ϕ x, y(x) + t h(x) t=0 = ϕy x, y(x) h(x). dt Dieser Grenzwert existiert f¨ ur jedes feste x. Aber noch haben wir keine Information dar¨ uber, ob der Grenzwert im Sinne eines Lr -Raums existiert, in welchem Raum die Funktion ϕy x, y(x) und ihr Produkt mit h(x) liegt. Die punktweise Existenz dieser Ableitung sagt noch nichts u ¨ber Differenzierbarkeit aus. Beispiel: Sinus-Operator. Der Sinus ist unendlich oft differenzierbar und alle Ableitungen sind gleichm¨ aßig beschr¨ ankt. Wegen dieser sch¨onen Eigenschaften der Sinusfunktion testen wir die Sachlage bei ihr, und im Hilbertraum L2 (E). zwar am einfachsten Der zugeordnete Nemytskii-Operator Φ y(·) = sin y(·) ist global Lipschitz-stetig in L2 (E), wie das entsprechende Beispiel im letzten Abschnitt zeigt. Wir vermuten, dass er auch differenzierbar ist. Die Ableitung muss nach (4.26) durch Φ (y) h (x) = cos y(x) h(x) (4.27)
160
4 Steuerung semilinearer elliptischer Gleichungen
gegeben sein. Das scheint zu passen, denn der Cosinus ist durch 1 beschr¨ankt, also ist die rechte Seite von eine lineare stetige Abbildung in L2 (E), die jedem h ∈ L2 (E) (4.27) das Produkt cos y(x) h(x) aus L2 (E) zuordnet. Diese Vermutung ist leider falsch! Der Operator kann trotz der Glattheit der Sinusfunktion nicht in Lp (E) mit 1 ≤ p < ∞ differenzierbar sein. Das folgt aus einem bekannten Satz, der aussagt, dass Φ genau dann im Raum Lp (E) mit 1 ≤ p < ∞ Fr´echet-differenzierbar ist, wenn ϕ affin-linear in y ist, d.h. ϕ(x, y) = ϕ0 (x) + ϕ1 (x) y mit ϕ0 ∈ Lp (E) und ϕ1 ∈ L∞ (E), Krasnoselskii et al. [128]. Dieser unten f¨ ur den Sinus-Operator erl¨auterte Umstand erschwert die Theorie der Optimalsteuerung nichtlinearer Aufgaben außerordentlich. ¨ Die Nichtdifferenzierbarkeit des Sinus-Operators ist leicht nachzuweisen, Ubungsaufgabe 4.4, (i). Sehr einfach ist das im Raum Lp (0, 1) im Nullpunkt zu sehen, 1 ≤ p < ∞. Mit h ∈ Lp (0, 1) folgt aus der Taylorformel mit integralem Restglied, angewendet auf die Sinusfunktion, sin 0 + h(x) = sin(0) + cos(0) h(x) +
1
cos 0 + s h(x) − cos(0) h(x) ds
s=0
= 0 + h(x) + r(x).
Wir betrachten dabei h(x) bei festem x als reelle Zahl. F¨ ur den Zuwachs h w¨ahlen wir zu 0 < ε < 1 die Treppenfunktion 1 auf [0, ε] h(x) = 0 auf (ε, 1] und vollziehen den Grenz¨ ubergang ε ↓ 0. Das von h abh¨angige Restglied r(x) kann ohne Verwendung des integralen Restglieds durch Umstellen sofort abgelesen werden, r(x) = sin(h(x)) − h(x); f¨ ur x ∈ [0, ε] folgt deshalb r(x) = sin(1) − 1 = c = 0 und damit
r(x) =
c 0
auf [0, ε] auf (ε, 1].
usste der W¨ are der Sinus-Operator an der Stelle null Fr´echet-differenzierbar, dann m¨ Quotient rLp /hLp f¨ ur hLp → 0 nach null streben, aber wir erhalten
p1
ε 0
|r(x)|p dx
0
|h(x)|p dx
rLp (0,1) = ε hLp (0,1)
p1 =
1
c εp 1
= c.
εp
Die Lage ist trotzdem nicht hoffnungslos, denn wenigstens im Raum L∞ (E) ist der SinusOperator differenzierbar. Das ist eine Folgerung aus dem n¨achsten Hilfssatz. Außerdem erkennt man, dass er f¨ ur 1 ≤ p2 < p1 differenzierbar von Lp1 (0, 1) nach Lp2 (0, 1) sein 1 1 sollte, denn dann strebt der entsprechende Quotient ε p2 − p1 nach null, so dass sich oben zumindest kein Widerspruch ergibt. In der Tat l¨asst sich die Differenzierbarkeit in diesen ¨ Raumpaaren beweisen, Ubungsaufgabe 4.4, (ii).
4.3 Nemytskii-Operatoren
161
Lemma 4.12 Die Funktion ϕ sei f¨ ur jedes y ∈ IR in x ∈ E messbar und f¨ ur fast alle x ∈ E nach y differenzierbar. Sie gen¨ uge der Beschr¨anktheitsbedingung (4.24) und lokalen Lipschitzbedingung (4.25) jeweils mit Ordnung k = 1. Dann ist der von ϕ erzeugte Nemytskii-Operator Φ in L∞ (E) Fr´echet-differenzierbar und f¨ ur alle h ∈ L∞ (E) gilt Φ (y) h (x) = ϕy x, y(x) h(x) f¨ ur fast alle x ∈ E. Beweis: Wir erhalten f¨ ur beliebige y, h ∈ L∞ (E), die dem Betrag nach fast u ¨berall durch M beschr¨ ankt sind, ϕ x, y(x) + h(x) − ϕ x, y(x) = ϕy x, y(x) h(x) + r y, h (x), wobei das Restglied die Form 1 ϕy x, y(x) + s h(x) − ϕy x, y(x) ds h(x) r y, h (x) = s=0
hat. Wegen Lipschitzstetigkeit von ϕy k¨ onnen wir fast u ¨berall durch r y, h (x) ≤ L(2M )
0
1
s |h(x)| ds |h(x)| ≤
L(2M ) L(2M ) |h(x)|2 ≤ h2L∞ (E) 2 2
absch¨ atzen. Deshalb gilt r(y, h)L∞ (E) ≤ c h2L∞ (E) und r(y, h)L∞ (E) → 0, hL∞ (E)
wenn hL∞ (E) → 0.
Die geforderte Restgliedeigenschaft ist damit bewiesen. Außerdem ist der Multiplikati onsoperator h(·) → ϕy ·, y(·) h(·) linear und stetig in L∞ (E), denn ϕy x, y(x) ist wegen der Beschr¨ anktheitsbedingung an ϕy beschr¨ ankt. Die Messbarkeit von ϕy folgt u ¨ brigens aus der von ϕ, denn die Ableitung nach y ergibt sich als Grenzwert messbarer Funktionen. Alle Eigenschaften der Fr´echet-Ableitung sind damit bewiesen. Folgerung. Alle nur von y abh¨angigen Funktionen ϕ aus C 2 (IR) erzeugen in L∞ (E) differenzierbare Nemytskii-Operatoren, denn ϕ ist lokal Lipschitz-stetig. Da wir sp¨ ater den Satz u ¨ber implizite Funktionen anwenden wollen, brauchen wir den Begriff der stetigen Differenzierbarkeit einer Abbildung. Definition. Eine in einer offenen Umgebung U von u ¯ ∈ U Fr´echet-differenzierbare Abbildung F : U → V heißt stetig Fr´echet-differenzierbar an der Stelle u ¯, wenn die Abbildung u → F (u) von U in L(U, V ) stetig an der Stelle u ¯ ist, d.h. u − u ¯U → 0 ⇒ F (u) − F (¯ u)L(U,V ) → 0. Ist F an jeder Stelle u ∈ U stetig Fr´echet-differenzierbar, dann heißt F stetig Fr´echetdifferenzierbar in U. In diesem Falle h¨ angt der Operator F (u) stetig von u ab. Lemma 4.13 Unter den Voraussetzungen von Lemma 4.12 ist der Nemytskii-Operator Φ stetig Fr´echet-differenzierbar in L∞ (E).
162
4 Steuerung semilinearer elliptischer Gleichungen
Beweis: Es sei y¯ ∈ L∞ (E) fest gew¨ ahlt und y → y¯ in L∞ (E) angenommen. Zu zeigen ist Φ (y) − Φ (¯ y)L(L∞ (E)) → 0. Es gibt ein M > 0 mit max{¯ y L∞ (E) , yL∞ (E) } ≤ M . Wegen der lokalen Lipschitzstetigkeit der Ableitung von ϕ folgt dann
ϕy ·, y(·) − ϕy ·, y¯(·) v(·) ∞ Φ (y) − Φ (¯ y )L(L∞ (E)) = sup L (E) vL∞ (E) =1
≤ ϕy ·, y(·) − ϕy ·, y¯(·) L∞ (E) ≤ L(M ) y − y¯L∞ (E) . Daraus folgt Φ (y) − Φ (¯ y)L(L∞ (E)) → 0, also ist Φ (Lipschitz-) stetig differenzierbar. Beispiel. Wir betrachten in C[0, 1] f¨ ur nat¨ urliches n ≥ 2 Φ y(·) = y(·)n . Die Ableitung an einer Stelle y¯ in Richtung y ist y ) y = n y¯n−1 y. Φ (¯ y ) mit der Funktion n y¯n−1 identifizieren. F¨ ur die Operatornorm der Wir k¨ onnen Φ (¯ Differenz Φ (y1 ) − Φ (y2 ) folgt f¨ ur alle y1 und y2 aus einer beschr¨ankten Menge
Φ (y1 ) − Φ (y2 ) = max Φ (y1 ) − Φ (y2 ) y C[0,1] L(C[0,1]) yC[0,1] =1
= max n (y1n−1 − y2n−1 ) y C[0,1] yC[0,1] =1
≤ n y1n−1 − y2n−1 C[0,1] n−2 y1 − y2 (x) ≤ n(n − 1) sup y1 + θ(y2 − y1 ) (x) x∈[0,1] n−2 ≤ n(n − 1) y1 C[0,1] + y2 C[0,1] y1 − y2 C[0,1] ≤ M y1 − y2 C[0,1] mit θ = θ(x) ∈ (0, 1). Daher ist die Abbildung y → Φ (y) stetig, Φ also stetig differenzierbar.
4.3.3 Ableitungen in weiteren Lp -R¨ aumen * Der Vollst¨ andigkeit halber geben wir hier Eigenschaften von Nemytskii-Operatoren in Lp -R¨ aumen mit p < ∞ an. Sie werden zum Beispiel bei der Diskussion der Gleichung −Δy + y + y 3 = u in H 1 (Ω) genutzt. Ihre Beweise sind in den Monographien [13], [128] und in den Arbeiten [12], [78] zu finden. Mit Nemytskii-Operatoren in Sobolew- oder H¨ older-R¨ aumen befassen sich u.a. [13] und [77]. Stetigkeit. Wir gehen von einer beschr¨ ankten und messbaren Teilmenge E ⊂ IRn aus und verlangen, dass ϕ = ϕ(x, y) der Carath´eodory-Bedingung gen¨ ugt. Unter dieser Voraussetzung bildet der Nemytskii-Operator Φ(y) := ϕ(·, y(·)) genau dann f¨ ur 1 ≤ q ≤ p < ∞ von Lp (E) in Lq (E) ab, wenn mit Funktionen α ∈ Lq (E), β ∈ L∞ (E) die Wachstumsbedingung p |ϕ(x, y)| ≤ α(x) + β(x) |y| q (4.28) erf¨ ullt ist. Außerdem ist der Operator Φ f¨ ur q < ∞ automatisch stetig, wenn er u ¨ berhaupt Lp (E) in Lq (E) abbildet, [13].
4.4 Existenz optimaler Steuerungen
163
Differenzierbarkeit. Es existiere zus¨ atzlich die partielle Ableitung ϕy (x, y) f¨ ur fast alle x ∈ E und der durch ϕy (x, y) erzeugte Nemytskii-Operator bilde Lp (E) in Lr (E) ab, wobei 1 ≤ q < p < ∞ der Beziehung r=
pq . p−q
(4.29)
gen¨ ugen sollen. Dann ist Φ Fr´echet-differenzierbar von Lp (E) in Lq (E) und es gilt Φ (y) h (x) = ϕy x, y(x) h(x). Zum Nachweis der Differenzierbarkeit ist also (4.28) mit q := r und ϕ := ϕy zu fordern. Das ist plausibel, denn das Produkt ϕy h soll f¨ ur h ∈ Lp (E) zu Lq (E) geh¨oren. Wir bestimmen deshalb den zu p/q konjugierten Index s aus 1/s + q/p = 1 und sch¨atzen mit der H¨ olderschen Ungleichung (2.25) auf S. 35 wie folgt ab: 1s pq p |ϕy (x, y(x))|q |h(x)|q dx ≤ |ϕy (x, y(x))|qs dx |h(x)|q q dx E E 1s E pq = |ϕy (x, y(x))|r dx |h(x)|p dx . E
E
Nach Voraussetzung sind beide Integrale endlich. Beispiel. Ω ⊂ RN sei ein beschr¨ anktes Gebiet, k ≥ 1 eine nat¨ urliche Zahl und Φ der von ϕ(y) = y k erzeugte Nemytskii-Operator. Im Zusammenhang mit Gleichung (4.2) auf S. 145 interessiert uns, f¨ ur welche k der Operator Φ differenzierbar von L6 (Ω) nach 6/5 L (Ω) ist. Nach (4.29) muss die Ableitung ϕy den Raum L6 (Ω) in Lr (Ω) abbilden mit r=
6 65 3 = . 2 6 − 65
Wir haben |ϕy | = k |y|k−1 . Wegen der Wachstumsbedingung (4.28) fordern wir daher k − 1 ≤ p/r mit p = 6 und r = 3/2, also k−1≤
6 = 4, r
und somit k ≤ 5. Daher ist y(·)k f¨ ur k ≤ 5 differenzierbar von L6 (Ω) nach L6/5 (Ω).
4.4 Existenz optimaler Steuerungen 4.4.1 Grundvoraussetzungen des Kapitels Die Theorie f¨ ur Aufgaben mit nichtlinearen Gleichungen und Funktionalen kann durch die n¨ otigen Voraussetzungen an die Nichtlinearit¨aten leicht un¨ ubersichtlich werden. Je nach Fragestellung wie Existenz optimaler Steuerungen, notwendige Bedingungen erster Ordnung oder hinreichende Optimalit¨ atsbedingungen zweiter Ordnung sind die Forderungen unterschiedlich und m¨ ussten in jedem Abschnitt neu spezifiziert werden. Um das zu vermeiden, treffen wir hier eine Voraussetzung f¨ ur das gesamte Kapitel 4, die f¨ ur die manche S¨ atze zu stark ist. An den betreffenden Stellen wird dann erw¨ahnt, auf welche
164
4 Steuerung semilinearer elliptischer Gleichungen
Teile der Voraussetzungen man verzichten kann, siehe auch die Bemerkung am Ende des Abschnitts. In diesem Kapitel kommen immer wieder die reellwertigen Funktionen d(x, y), b(x, y), ϕ(x, y) und ψ(x, u) vor, die von der Gebietsvariablen x ∈ E und den reellen Funktions” variablen“ y bzw. u abh¨ angen. Dabei sind f¨ ur E die Spezifikationen E = Ω und E = Γ m¨ oglich. Ferner sind Schranken ua , ub , va , vb : E → IR an die Steuerungen vorgegeben. Voraussetzung 4.14 (i) Ω ⊂ IRN ist ein beschr¨anktes Lipschitzgebiet. (ii) Die Funktionen d = d(x, y), ϕ = ϕ(x, y) : Ω × IR → IR, b = b(x, y) : Γ × IR → IR sowie ψ = ψ(x, u) : E × IR → IR, E = Ω oder E = Γ, seien f¨ ur jedes reelle y bzw. u messbar in der Ortsvariablen x und f¨ ur fast alle x ∈ Ω bzw. x ∈ Γ zweimal nach y bzw. u differenzierbar. Sie sollen den Beschr¨anktheits- und lokalen Lipschitzbedingungen (4.24)–(4.25) der Ordnung k = 2 gen¨ ugen. Zum Beispiel bedeutet das f¨ ur ϕ: Es existieren eine Konstante K und eine von M abh¨angige Konstante L(M ), so dass |ϕ(x, 0)| + |ϕy (x, 0)| + |ϕyy (x, 0)| ≤ K,
|ϕyy (x, y1 ) − ϕyy (x, y2 )| ≤ L(M ) |y1 − y2 |
f¨ ur fast alle x ∈ Ω und alle y1 , y2 ∈ [−M, M ] gilt. (iii) Zus¨atzlich sei dy (x, y) ≥ 0 f¨ ur fast alle x ∈ Ω und alle y ∈ IR sowie by (x, y) ≥ 0 f¨ ur fast alle x ∈ Γ und alle y ∈ IR. Außerdem sollen Mengen Ed ⊂ Ω und Eb ⊂ Γ von positivem Maß und Konstanten λd > 0, λb > 0 existieren, so dass die Ungleichungen dy (x, y) ≥ λd ∀x ∈ Ed , ∀y ∈ IR,
by (x, y) ≥ λb ∀x ∈ Eb , ∀y ∈ IR.
erf¨ ullt sind. ur E = Ω bzw. E = Γ und (iv) Die Schranken ua , ub , va , vb : E → R seien aus L∞ (E) f¨ sollen ua (x) ≤ ub (x) bzw. va (x) ≤ vb (x) f¨ ur fast alle x ∈ E erf¨ ullen. Wie bereits erw¨ ahnt wurde, ist diese Voraussetzung insgesamt zu stark. F¨ ur die Existenz optimaler Steuerungen wird f¨ ur ϕ und ψ Teil (ii) nicht f¨ ur die Ableitungen ben¨otigt, sondern inclusive Lipschitzbedingung nur f¨ ur die Funktionen selbst (Ordnung k = 0), daf¨ ur aber Konvexit¨ at von ψ in u. F¨ ur notwendige Optimalit¨atsbedingungen erster Ordnung ist (ii) nur bis zur Ordnung k = 1 zu fordern, w¨ahrend die vollst¨andige Voraussetzung 4.14 f¨ ur Bedingungen zweiter Ordnung und das SQP-Verfahren gebraucht wird. Beispiel. Folgende Funktionen erf¨ ullen diese Voraussetzungen: ϕ(x, y) = a(x) y + β(x) (y − yΩ (x))2 mit a, β, yΩ ∈ L∞ (Ω), d(x, y) = c0 (x) y + y k mit ungeradem k ∈ IN und c0 (x) ≥ 0 in Ω, c0 L∞ (Ω) > 0, d(x, y) = c0 (x) y + exp(a(x) y) mit 0 ≤ a ∈ L∞ (Ω) und dem eben definierten c0 . Unter diesen Voraussetzungen ist der Existenzsatz 4.8 von S. 153 auf die im Weiteren auftretenden elliptischen Gleichungen anwendbar: Wir schreiben dazu d in der Form ˜ y) d(x, y) = c0 (x)y + (d(x, y) − c0 (x)y) = c0 (x)y + d(x,
(4.30)
ugt d˜ der Voraussetzung 4.2 auf S. 148. Analog verfahren mit c0 = χ(Ed )λd auf. Dann gen¨ wir mit b und definieren α := χ(Eb )λb .
4.4 Existenz optimaler Steuerungen
165
4.4.2 Verteilte Steuerung Wir untersuchen exemplarisch die Aufgabe ϕ x, y(x) dx + ψ x, u(x) dx min J(y, u) := Ω
(4.31)
Ω
bei den Nebenbedingungen −Δy + d(x, y) = ∂ν y =
u 0
in Ω auf Γ
(4.32)
f.¨ u. in Ω.
(4.33)
sowie ua (x) ≤ u(x) ≤ ub (x)
Aufgaben, bei denen die Steuerung als Quellterm in der rechten Seite der partiellen Differentialgleichung vorkommt, werden als Aufgaben mit verteilter Steuerung bezeichnet. Wir setzen hier Uad = u ∈ L∞ (Ω) : ua (x) ≤ u(x) ≤ ub (x) f.¨ u. in Ω . Definition. Eine Steuerung u ¯ ∈ Uad heißt optimal und y¯ = y(¯ u) optimaler Zustand, wenn J y(¯ u), u ¯ ≤ J y(u), u ∀ u ∈ Uad gilt. Sie heißt lokal optimal im Sinne von Lr (Ω), wenn ein ε > 0 existiert, so dass die obige Ungleichung f¨ ur alle u ∈ Uad mit u − u ¯Lr (Ω) ≤ ε erf¨ ullt ist. Bevor wir den ersten Existenzsatz f¨ ur optimale Steuerungen formulieren und beweisen, machen wir uns zwei Eigenschaften der Funktionale F (y) = ϕ x, y(x) dx, Q(u) = ψ x, u(x) dx (4.34) Ω
Ω
klar. Beide sind zusammengesetzt aus einem Nemytskii-Operator und einem Integraloperator, der linear und stetig von L1 (Ω) nach IR abbildet. F ist deshalb nach Lemma 4.11 auf S. 157 Lipschitz-stetig auf der Menge aller y ∈ L2 (Ω) mit yL∞ (Ω) ≤ M , wenn M > 0 beliebig vorgegeben ist. Gleiches gilt f¨ ur Q auf Uad , denn Uad ist in der L∞ -Norm beschr¨ ankt. Außerdem ist Q konvex auf Uad , wenn die unten stehende Konvexit¨atsvor¨ aussetzung (4.35) erf¨ ullt ist, Ubungsaufgabe 4.5. Satz 4.15 Es sei Voraussetzung 4.14 erf¨ ullt und ψ konvex in u, d.h. ψ x, λ u + (1 − λ)v ≤ λ ψ(x, u) + (1 − λ) ψ(x, v)
(4.35)
f¨ ur fast alle x aus Ω, alle reellen u, v und alle λ ∈ (0, 1). Dann besitzt die Aufgabe (4.31)– (4.33) mit verteilter Steuerung mindestens eine optimale Steuerung u ¯ mit zugeh¨origem optimalen Zustand y¯ = y(¯ u).
166
4 Steuerung semilinearer elliptischer Gleichungen
Beweis: Wir bringen zun¨ achst die Gleichung (4.32) mit Hilfe der Umformung (4.30) auf die Gestalt (4.5) auf S. 147. Darauf wenden wir Satz 4.8 auf S. 153 mit d˜ an Stelle von d an, vgl. die Bemerkungen nach (4.32). Deshalb besitzt die Zustandsgleichung (4.32) ¯ Uad ist f¨ ur jede Steuerung u ∈ Uad genau einen Zustand y = y(u) ∈ H 1 (Ω) ∩ C(Ω). eine beschr¨ ankte Menge in L∞ (Ω), damit erst recht beschr¨ankt in Lr (Ω), r > N/2. Wir k¨ onnen o.B.d.A. r ≥ 2 annehmen, denn die Wahl von r > N/2 steht uns frei. Die Absch¨ atzung (4.11) auf S. 153 liefert deshalb eine Konstante M , so dass y(u)C(Ω) ¯ ≤M f¨ ur alle Zust¨ ande y(u) gilt, die zu Steuerungen u ∈ Uad geh¨oren. Das Funktional J(y, u) = F (y) + Q(u) ist wegen Voraussetzung 4.14 nach unten beschr¨ankt. Deshalb existiert j = inf J y(u), u . u∈Uad
∞ Es sei (yn , un ) n=1 eine Minimalfolge, d.h. un ∈ Uad , yn = y(un ) und J(yn , un ) → j f¨ ur n → ∞. Wir fassen Uad jetzt als Teilmenge von Lr (Ω) auf. Dann ist Uad nichtleer, abgeschlossen, ¨ konvex und beschr¨ ankt in Lr (Ω), Ubungsaufgabe 4.6. Da Lr (Ω) ein reflexiver Banachraum ist, sind solche Mengen dieses Raumes nach Satz 2.11 schwach folgenkompakt. r Es existiert deshalb eine Teilfolge {unk }∞ k=1 , die in L (Ω) schwach gegen eine Funktion u ¯ ∈ Uad konvergiert. Damit wir am Ende nicht bei einer Dreifach-Indizierung ankommen, bezeichnen wir diese Teilfolge wieder mit {un }, nehmen also un u ¯,
n→∞
an. Wir haben damit eigentlich schon die optimale Steuerung gefunden. Das ist aber noch zu beweisen! Dazu ist die Konvergenz der Zustandsfolge {yn }∞ n=1 herzuleiten, was hier nicht so einfach ist wie im linear-quadratischen Fall. Man betrachtet zuerst die Folge zn (·) = d ·, yn (·) . Alle Zust¨ ande yn sind in L∞ (Ω) durch M beschr¨ankt, erst recht beschr¨ankt in Lr (Ω). r Folglich konvergiert eine Teilfolge {znl }∞ l=1 schwach gegen ein z in L (Ω). Auch hier ∞ nehmen wir wieder an, dass die Folge {zn }n=1 selbst schwach konvergiert. Wir haben nun −Δyn + yn = −d(x, yn ) + yn + un = Rn . −z
¯ u
Die rechte Seite Rn strebt schwach in Lr (Ω) gegen −z + u ¯. So gesehen l¨ost yn das lineare Randwertproblem −Δyn + yn = Rn ∂ν yn = 0. Nach Satz 2.6 auf S. 29 ist die Abbildung Rn → yn linear und stetig von L2 (Ω) in H 1 (Ω), wegen r ≥ 2 erst recht von Lr (Ω) in H 1 (Ω). Jede lineare stetige Abbildung ist auch schwach stetig. Die schwache Konvergenz der Folge Rn in Lr (Ω) u ¨ bertr¨agt sich also auf yn – diese Folge konvergiert schwach in H 1 (Ω) gegen ein y¯ aus H 1 (Ω), yn y¯,
n → ∞.
4.4 Existenz optimaler Steuerungen
167
Die Funktion y¯ ist der Kandidat f¨ ur den optimalen Zustand. H 1 (Ω) ist nach Satz 7.4 auf S. 277 kompakt eingebettet in L2 (Ω). In H 1 (Ω) schwach konvergente Folgen sind daher (stark) konvergent in L2 (Ω), also yn → y¯ ∈ L2 (Ω),
n → ∞.
Nach dieser etwas umfangreichen Argumentation geht es jetzt schneller. Wir wissen ¯ Damit gilt Gleiches f¨ ur die Grenzfunktion y¯, denn die Menge |yn (x)| ≤ M ∀x ∈ Ω. {y ∈ Lr (Ω) : yL∞ (Ω) ≤ M } ist konvex und abgeschlossen, daher auch schwach abgeschlossen. Wegen der Beschr¨anktheit der Folge {yn } in L∞ (Ω) gilt nach Lemma 4.11 auf S. 157 d(·, yn ) − d(·, y¯)L2 (Ω) ≤ L(M ) yn − y¯L2 (Ω) ,
(4.36)
daher d(·, yn ) → d(·, y¯) in L2 (Ω). Die Folge {un } ist auch in L2 (Ω) schwach konvergent gegen u ¯. Jetzt zeigen wir, dass y¯ die schwache L¨osung zu u ¯ ist, beide also zusammengeh¨ oren. Wir haben f¨ ur beliebiges aber festes v ∈ H 1 (Ω) ∇yn · ∇v dx + d(·, yn ) v dx = un v dx. Ω
Ω
Ω
Gehen wir zur Grenze u ¨ ber, so folgt aus yn y¯ in H 1 (Ω) die Konvergenz des ersten Integrals, aus yn → y¯ in L2 (Ω) und yn L∞ (Ω) ≤ M die Konvergenz des zweiten und aus un u ¯ in Lr (Ω) diejenige des dritten, insgesamt nach Grenz¨ ubergang ∇¯ y · ∇v dx + d(·, y¯) v dx = u ¯ v dx. Ω
Ω
Ω
¯ – Fertig? Nein. Jetzt Da v ganz H 1 (Ω) durchlaufen kann, ist y¯ die schwache L¨osung zu u muss noch die Optimalit¨ at von u ¯ bewiesen werden. Wir k¨ onnen trotz Stetigkeit des Funktionals Q nicht aus un u ¯ auf Q(un ) → Q(¯ u) schließen, denn nichtlineare Abbildungen sind nicht notwendig schwach stetig. Aber das Funktional Q ist nicht nur stetig, sondern auch konvex. Nach Satz 2.12 auf S. 37 ist Q deshalb schwach halbstetig nach unten, d.h. un u ¯
⇒
lim inf Q(un ) ≥ Q(¯ u). n→∞
Insgesamt folgt j
=
lim J(yn , un ) = lim F (yn ) + lim Q(un )
n→∞
n→∞
n→∞
y ) + Q(¯ u) = J(¯ y, u ¯). = F (¯ y ) + lim inf Q(un ) ≥ F (¯ n→∞
Kleiner als das Infimum j kann der Funktionalwert aber nicht sein. Das Paar (¯ y, u ¯) ergibt deshalb den Wert j, ist also optimal. Analog kann die Existenz optimaler Steuerungen f¨ ur die homogene Dirichlet-Randbedingung bewiesen werden.
168
4 Steuerung semilinearer elliptischer Gleichungen
Bemerkungen. Folgende zwei Schl¨usse w¨aren im Beweis falsch gewesen: (i) yn y ⇒ d(·, yn ) d(·, y), ohne die starke Konvergenz yn → y zu wissen, denn nichtlineare Abbildungen sind i.a. nicht schwach stetig. (ii) yn → y in L2 (Ω) ⇒ d(·, yn ) → d(·, y), ohne yn L∞ (Ω) ≤ M ∀ n zu haben. (iii) Von Voraussetzung (4.14) des Satzes sind die Beschr¨ anktheits- und Lipschitzbedingung von ϕ und ψ nur bis zur Ordnung k = 0 zu fordern.
Auf Grund der Nichtlinearit¨ at der Zustandsgleichung liegt ein nichtkonvexes Optimierungsproblem in u vor. Daher kann man die Eindeutigkeit der optimalen Steuerung u¯ nicht ohne Zusatzannahmen zeigen. Beliebig viele globale und lokale Minima sind theoretisch m¨ oglich. Wie paradox die Situation schon bei einfachen Aufgaben der nichtlinearen Optimierung im Banachraum sein kann, zeigt folgendes Beispiel. Wir werden es sp¨ater noch weiter diskutieren. Es hat keinen Bezug zur optimalen Steuerung, enth¨alt also keine Differentialgleichung als Nebenbedingung. Beispiele. (i) min f (u) := −
1
cos(u(x))dx, 0
0 ≤ u(x) ≤ 2π,
u ∈ L∞ (0, 1).
(4.37)
Offenbar ist −1 der Optimalwert, angenommen durch u¯(x) ≡ 0. Aber es gibt noch u ahlbar viele andere globale L¨ osungen, n¨amlich alle messbaren Funktionen u, die ¨berabz¨ nur die Werte 0 und 2π annehmen. Die Aufgabe besitzt also unendlich viele verschiedene globale Minima, die noch dazu in der L2 -Norm beliebig nahe beieinander liegen. In der L∞ -Norm haben sie voneinander den Abstand 2 π. (ii) Analog liegen die Dinge bei der Aufgabe aus Alt und Malanowski [10], 1 (u2 (x) − 1)2 dx, |u(x)| ≤ 1, u ∈ L∞ (0, 1). min 0
Randsteuerung Die Existenz mindestens einer optimalen Steuerung kann unter Voraussetzung 4.14 vollkommen analog f¨ ur die sp¨ ater auf Seite 174 definierte Aufgabe (4.50)–(4.52) mit Randsteuerung bewiesen werden.
4.5 Der Steuerungs-Zustands-Operator Bei allen im Buch behandelten Aufgaben wird der (oder den) Steuerung(en) genau ein Zustand y zugeordnet. Bei linear-quadratischen Problemen hatten wir dem Zustand y den Teil zugeordnet, der im Zielfunktional wirklich auftritt und diesen S u genannt. Von solcher Verfahrensweise gehen wir jetzt ab, weil ganz einfach die Verschiedenheit der auftretenden R¨ aume und Dualr¨ aume zu einer sehr technischen Darstellung f¨ uhren w¨ urde. Deshalb betrachten wir nur die eigentliche Abbildung u → y, die wir generell ¯ ∩ H 1 (Ω). Wie bisher mit G bezeichnen. Der Bildraum von G ist dabei stets Y = C(Ω) werden wir oft y(u) f¨ ur G(u) schreiben. Verwechslungen mit dem Funktionswert y(x) an der Stelle x d¨ urften durch den jeweiligen Kontext ausgeschlossen sein. Wir beginnen die Untersuchung mit einer im Gebiet als Quelle wirkenden Steuerung (verteilte Steuerung).
4.5 Der Steuerungs-Zustands-Operator
169
4.5.1 Verteilte Steuerung Hier geht es um die Zustandsgleichung (4.32), −Δy + d(x, y) ∂ν y
= u = 0
in Ω auf Γ.
Jeder Steuerung u ∈ U := Lr (Ω), r > N/2, wird nach Satz 4.8 auf S. 153 genau ein ¯ zugeordnet, sofern die entsprechenden Voraussetzungen Zustand y ∈ Y = H 1 (Ω) ∩ C(Ω) erf¨ ullt sind. Das wollen wir annehmen. Den zugeh¨origen Steuerungs-Zustands-Operator bezeichnen wir mit G : U → Y , G(u) = y. Satz 4.16 Unter Voraussetzung 4.14 auf S. 164 an Ω und d ist die Abbildung G Lipschitz¯ r > N/2: Es existiert eine Konstante L > 0, so stetig von Lr (Ω) nach H 1 (Ω) ∩ C(Ω), dass y1 − y2 H 1 (Ω) + y1 − y2 C(Ω) ¯ ≤ L u1 − u2 Lr (Ω) f¨ ur alle ui ∈ Lr (Ω), i = 1, 2, und die zugeh¨origen Zust¨ande yi = G(ui ) gilt. ¯ Wir schreiben die Gleichungen Beweis: Nach Satz 4.10 auf S. 155 sind die yi stetig auf Ω. f¨ ur y1 , y2 auf und ziehen sie voneinander ab, −Δ(y1 − y2 ) + d(x, y1 ) − d(x, y2 ) = u1 − u2 ∂ν (y1 − y2 ) = 0.
(4.38)
Offenbar gilt 1 d d x, y1 (x) − d x, y2 (x) = − d x, y1 (x) + s (y2 (x) − y1 (x)) ds 1 s=0 ds = dy x, y1 (x) + s y2 (x) − y1 (x) ds y1 (x) − y2 (x) . 0
Das obige Integral stellt eine wegen Monotonie von d nichtnegative Funktionc0 = c0 (x) ∞ aus L (Ω) dar,denn dy , y1 und y2 sind stetig. Auf Ed ist der Integrand dy x, y1 (x) + u. auf Ed . Offenbar s y2 (x)−y1 (x) nicht kleiner als λd > 0, also haben wir c0 (x) ≥ λd f.¨ h¨ angt c0 auch von y1 und y2 ab, was aber f¨ ur die weiteren Schl¨ usse ohne Belang ist. Wir definieren y = y1 − y2 und u = u1 − u2 . Nach Einsetzen in (4.38) sieht man, dass das so gegebene y gemeinsam mit u das Problem −Δy + c0 (x) y ∂ν y
= u = 0
l¨ ost. Wegen c0 ≥ 0 ist c0 (x) y in y monoton wachsend. Jetzt wenden wir Satz 4.7 von S. 153 mit obigem c0 , d(x, y) = 0, f = u, g = b = α = 0 an. Aus (4.11) folgt dann direkt yH 1 (Ω) + yC(Ω) ¯ ≤ L uLr (Ω) f¨ ur alle u und die zugeh¨ origen y, insbesondere f¨ ur u = u1 − u2 und y = y1 − y2 . Das ergibt die zu beweisende Absch¨ atzung.
170
4 Steuerung semilinearer elliptischer Gleichungen
Bemerkung. Im vorhergehenden und im n¨achsten Satz wird von Voraussetzung 4.14 nur die Beschr¨ anktheits- und Lipschitzbedingung der Ordnung k = 1 gebraucht.
Als N¨ achstes interessiert uns die Ableitung des Steuerungs-Zustands-Operators an einer festen Stelle u ¯. In den Anwendungen wird u¯ eine lokal optimale Steuerung sein. Satz 4.17 Unter Voraussetzung 4.14 auf S. 164 ist der Steuerungs-Zustands-Operator G ¯ Seine Ableitung f¨ ur alle r > N/2 Fr´echet-differenzierbar von Lr (Ω) nach H 1 (Ω) ∩ C(Ω). an der Stelle u ¯ ist durch u) u = y, G (¯ gegeben, wobei y die schwache L¨osung des folgenden, an der Stelle y¯ = G(¯ u) linearisierten Randwertproblems ist: −Δy + dy (x, y¯) y ∂ν y
= =
u in Ω 0 auf Γ.
(4.39)
Beweis: Es ist die Darstellung G(¯ u + u) − G(¯ u) = D u + r(¯ u, u) ¯ ein linearer stetiger Operator ist und zu zeigen, wobei D : Lr (Ω) → H 1 (Ω) ∩ C(Ω) r(¯ u, u)H 1 (Ω)∩C(Ω) ¯ →0 uLr (Ω)
f¨ ur uLr (Ω) → 0
(4.40)
gilt; dabei sei rH 1 (Ω)∩C(Ω) u) = D. ¯ = rH 1 (Ω) + rC(Ω) ¯ definiert. Dann folgt G (¯
Wir schreiben die Gleichungen f¨ ur y¯ = y(¯ u) und y˜ = y(¯ u + u) auf, −Δ¯ y + d(x, y¯) = u ¯ ∂ν y¯ = 0
−Δ˜ y + d(x, y˜) = u ¯+u ∂ν y˜ = 0.
Subtraktion ergibt =dy (x,¯ y )(˜ y −¯ y )+rd
−Δ(˜ y − y¯) + d(x, y˜) − d(x, y¯) = u ∂ν (˜ y − y¯) = 0. Der Nemytskii-Operator Φ(y) = d ·, y(·) ist nach Lemma 4.12 auf S. 161 Fr´echet-diffe¯ in L∞ (Ω). Folglich gilt renzierbar von C(Ω) Φ(˜ y ) − Φ(¯ y ) = d ·, y˜(·) − d ·, y¯(·) = dy ·, y¯(·) y˜(·) − y¯(·) + rd (4.41) mit einem Rest rd , der die Eigenschaft rd L∞ (Ω) /˜ y − y¯C(Ω) ur ˜ y − y¯C(Ω) ¯ → 0 f¨ ¯ →0 hat. Wir erhalten daraus y˜ − y¯ = y + yρ mit der L¨ osung y von (4.39) und einem Rest yρ , welcher der Gleichung −Δyρ + dy (·, y¯) yρ ∂ν yρ
= −rd = 0
(4.42)
4.6 Notwendige Optimalit¨ atsbedingungen
171
¨ gen¨ ugt, Ubungsaufgabe 4.7. Man beachte wieder dy (x, y¯) ≥ λd > 0 in Ed , so dass diese Gleichung eindeutig l¨ osbar ist. Aus der in Satz 4.16 bewiesenen Lipschitzstetigkeit folgt ˜ y − y¯C(Ω) y − y¯H 1 (Ω) ≤ L uLr (Ω) . ¯ + ˜ Außerdem gilt f¨ ur rd y − y¯C(Ω) rd L∞ (Ω) ˜ rd L∞ (Ω) rd L∞ (Ω) ¯ = ≤ L uLr (Ω) ˜ y − y¯C(Ω) uLr (Ω) ˜ y − y¯C(Ω) ¯ ¯ und deshalb rd L∞ (Ω) = o(uLr (Ω) ) wegen (4.40). Mit (4.42) haben wir auch yρ C(Ω) ¯ + yρ H 1 (Ω) = o(uLr (Ω) ). Die lineare und stetige Abbildung u → y sei mit D bezeichnet. Dann ergibt sich insgesamt u, u), G(¯ u + u) − G(¯ u) = y˜ − y¯ = D u + yρ = D u + r(¯ wobei r(¯ u, u) = yρ die geforderten Eigenschaften hat. ¯ Folgerung. G ist damit erst recht Fr´echet-differenzierbar von L∞ (Ω) in H 1 (Ω) ∩ C(Ω).
4.5.2 Randsteuerung Hier sind die Verh¨ altnisse ¨ ahnlich. Unter Voraussetzung 4.14 auf S. 164 ist G f¨ ur alle ¯ Die s > N − 1 stetig Fr´echet-differenzierbar von U = Ls (Γ) in Y = H 1 (Ω) ∩ C(Ω). Ableitung an der Stelle u¯ hat die Form G (¯ u) u = y, wobei y die schwache L¨ osung des bei y¯ = G(¯ u) linearisierten Randwertproblems ist, −Δy ∂ν y + by (x, y¯) y
= 0 = u.
4.6 Notwendige Optimalit¨ atsbedingungen 4.6.1 Verteilte Steuerung Im Weiteren sei u ¯ ∈ L∞ (Ω) eine im Sinne der L∞ −Norm lokal optimale Steuerung der Aufgabe (4.31)–(4.33) von S. 165. Wir leiten die notwendigen Bedingungen erster Ordnung her, die durch u¯ und den zugeh¨ origen Zustand y¯ zu erf¨ ullen sind. F¨ ur y haben wir die Darstellung y(u) = G(u) mit dem Steuerungs-Zustands-Operator G : L∞ (Ω) → ¯ Damit k¨ H 1 (Ω) ∩ C(Ω). onnen wir das Zielfunktional wie folgt aufschreiben: J(y, u) = J G(u), u = F G(u) + Q(u) =: f (u). Zur Definition von F und Q siehe (4.34). Unter Voraussetzung 4.14 ist f ein Fr´echetdifferenzierbares Funktional in L∞ (Ω), denn F , Q und G sind nach Lemma 4.12 auf S. 161 bzw. Satz 4.17 jeweils Fr´echet-differenzierbar.
172
4 Steuerung semilinearer elliptischer Gleichungen
Ist u ¯ lokal optimal, Uad konvex und u ∈ Uad beliebig gegeben, dann liegt die konvexe Linearkombination v := u ¯ + λ(u − u ¯) f¨ ur alle hinreichend kleinen λ > 0 in Uad und in der ε-Umgebung von u ¯, in der f (¯ u) ≤ f (v) erf¨ ullt ist. Es gilt also f¨ ur alle 0 < λ ≤ λ0 f u ¯ + λ(u − u ¯) ≥ f (¯ u). Nach Division durch λ und Grenz¨ ubergang λ ↓ 0 folgt deshalb auch hier die Variationsungleichung von Lemma 2.21 auf S. 50. Auf diese Weise haben wir folgendes Resultat bewiesen: Lemma 4.18 Ist Voraussetzung 4.14 von S. 164 erf¨ ullt, so muss jede f¨ ur (4.31) –(4.33) lokal optimale Steuerung u ¯ der folgenden Variationsungleichung gen¨ ugen: f (¯ u)(u − u ¯) ≥ 0
∀u ∈ Uad .
(4.43)
Dieses Lemma gilt ur alle im Weiteren auftretenden nichtlinearen Funktionale des Typs f¨ f (u) = J y(u), u . Die Ableitung f (¯ u) berechnet man nach der Kettenregel, f (¯ u) G (¯ u) h = F G(¯ u) h + Q (¯ u) h = F (¯ y ) y + Q (¯ u) h (4.44) = ¯(x) h(x) dx. ϕy x, y¯(x) y(x) dx + ψu x, u Ω
Ω
Dabei ist y = G (¯ u) h gem¨ aß Satz 4.17 die L¨ osung der linearisierten Aufgabe −Δy + dy (x, y¯) y ∂ν y
= h = 0.
(4.45)
¯ als L¨osung der adjungierten Wir definieren den adjungierten Zustand p ∈ H 1 (Ω) ∩ C(Ω) Gleichung in Ω −Δp + dy (x, y¯) p = ϕy x, y¯(x) (4.46) ∂ν p = 0 auf Γ. Lemma 4.19 Ist y die schwache L¨osung von (4.45) zu gegebenem h ∈ L2 (Ω) und p der als schwache L¨osung von (4.46) definierte adjungierte Zustand, dann gilt ϕy x, y¯(x) y(x) dx = p(x)h(x) dx. Ω
Ω
Beweis: Die Aussage folgt aus Lemma 2.31 auf S. 59 mit aΩ (x) = ϕy x, y¯(x) , c0 (x) = dy x, y¯(x) (man beachte dy (·, y¯(·)) = 0), βΩ = 1 sowie aΓ = α = βΓ = 0. Als Folgerung ergibt sich die Formel f¨ ur die Ableitung des reduzierten Funktionals f in Richtung h ∈ L∞ (Ω), p(x) + ψu (x, u f (¯ u) h = ¯(x)) h(x) dx. (4.47) Ω
Außerdem erhalten wir die gesuchte notwendige Optimalit¨atsbedingung:
4.6 Notwendige Optimalit¨ atsbedingungen
173
Satz 4.20 Unter Voraussetzung 4.14 gen¨ ugt jede lokal optimale Steuerung u ¯ der Aufgabe ¯ (4.31)–(4.33) mit dem durch (4.46) definierten adjungierten Zustand p ∈ H 1 (Ω) ∩ C(Ω) der Variationsungleichung p(x) + ψu x, u ¯(x)) u(x) − u ¯(x) dx ≥ 0 ∀u ∈ Uad . (4.48) Ω
Wie in Kapitel 2 k¨ onnen wir die Variationsungleichung als Minimumprinzip aufschreiben: Folgerung. Ist u ¯ lokal optimale Steuerung der Aufgabe (4.31)–(4.33), Voraussetzung 4.14 erf¨ ullt und p der zugeh¨orige adjungierte Zustand, dann wird das Minimum in
min
ua (x)≤ v ≤ub (x)
p(x) + ψu (x, u ¯(x)) v
(4.49)
f¨ ur fast alle x ∈ Ω durch v = u ¯(x) angenommen. λ 2 Spezialfall: ψ(x, u) = u mit λ > 0. 2 Diese Funktion ψ erf¨ ullt offenbar unsere Voraussetzungen. Wir haben ψu (x, u) = λ u, also wird das Minimum der Aufgabe min
ua (x)≤ v ≤ub (x)
p(x) + λ u ¯(x) v
f¨ ur fast alle x ∈ Ω durch v = u ¯(x) angenommen. Daraus folgt f¨ ur λ > 0 wie in (2.58) auf S. 56 f¨ ur fast alle x ∈ Ω die Projektionsbeziehung 1 u ¯(x) = IP[ua (x),ub (x)] − p(x) . λ ¯ und der ProjektiSind ua , ub stetig, so ist auch u ¯ stetig, denn es gilt p ∈ H 1 (Ω) ∩ C(Ω) onsoperator bildet stetige Funktionen in stetige ab. Sind ua und ub zus¨atzlich aus H 1 (Ω), ¯ so erhalten wir analog u ¯ ∈ H 1 (Ω) ∩ C(Ω). Beispiel. Wir diskutieren die Aufgabe Supraleitung“ ” min J(y, u) := bei −2 ≤ u(x) ≤ 2 sowie
λ 1 y − yΩ 2L2 (Ω) + u2L2 (Ω) 2 2
−Δy + y + y 3 ∂ν y
= u = 0.
Sie ist ein Spezialfall von (4.31)–(4.33) auf S. 165 mit ϕ(x, y) =
2 1 y − yΩ (x) , 2
ψ(x, u) =
λ 2 u , 2
d(x, y) = y + y 3 .
Setzen wir yΩ ∈ L∞ (Ω) voraus, dann sind alle geforderten Voraussetzungen (Messbarkeit, Beschr¨ anktheit, Differenzierbarkeit, Monotonie von d, Konvexit¨at von ψ bez¨ uglich u)
174
4 Steuerung semilinearer elliptischer Gleichungen
erf¨ ullt. Die Existenz mindestens einer optimalen Steuerung u¯ folgt aus Satz 4.15 auf S. 165. Die adjungierte Gleichung f¨ ur p lautet −Δp + p + 3 y¯2 p = y¯ − yΩ ∂ν p = 0. ¯ muss u Mit deren L¨ osung p ∈ H 1 (Ω) ∩ C(Ω) ¯ der Variationsungleichung (λ¯ u + p)(u − u ¯) dx ≥ 0 ∀u ∈ Uad Ω
gen¨ ugen. Im Fall λ > 0 ergibt sich daraus die u ¨ bliche Projektionsbeziehung und u¯ ∈ ¯ wenn die Schranken ua , ub zu H 1 (Ω) ∩ C(Ω) ¯ geh¨oren. F¨ H 1 (Ω) ∩ C(Ω), ur λ = 0 folgt u ¯(x) = −2 sign p(x). Testbeispiel. F¨ ur die Daten λ = 1 und yΩ = 9 erf¨ ullt u ¯(x) ≡ 2 die notwendigen ¨ Optimalit¨ atsbedingungen erster Ordnung, Ubungsaufgabe 4.8. Bemerkung. Im obigen Beispiel h¨atte die Voraussetzung yΩ ∈ Lr (Ω), r > N/2, ausgereicht. Auch dann w¨ are nach unseren Regularit¨ atss¨ atzen p und deshalb auch die optimale Steuerung u ¯ stetig, falls λ > 0. Außerdem werden die Beschr¨ anktheits- und Lipschitzbedingung von Voraussetzung 4.14 nur bis zur Ordnung k = 1 gebraucht.
4.6.2 Randsteuerung Wir untersuchen noch die Aufgabe ϕ x, y(x) dx + ψ x, u(x) ds(x) min J(y, u) := Ω
(4.50)
Γ
bei den Nebenbedingungen −Δy + y = ∂ν y + b(x, y) =
0 u
in Ω auf Γ
(4.51)
f.¨ u. auf Γ.
(4.52)
sowie ua (x) ≤ u(x) ≤ ub (x) Es sei
Uad = u ∈ L∞ (Γ) : ua (x) ≤ u(x) ≤ ub (x)
f. u ¨. auf Γ .
Der Steuerungs-Zustands-Operator G : u → y ist unter Voraussetzung 4.14 auf S. 164 eine ¯ Dies w¨are er unter unseren Voraussetzungen Abbildung von L∞ (Γ) nach H 1 (Ω) ∩ C(Ω). auch f¨ ur −Δ an Stelle von −Δ + I. Wir werden aber ein Beispiel diskutieren, wo das Fehlen von I in der adjungierten Gleichung im Fall y¯ = 0 Probleme bereiten w¨ urde. Notwendige Optimalit¨ atsbedingungen f¨ ur eine lokal optimale Steuerung u¯ k¨onnen analog zum Fall der verteilten Steuerung hergeleitet werden, nur haben jetzt G und G eine andere Bedeutung. Zun¨ achst ergibt sich die Variationsungleichung ¯(x) u(x) − u ¯(x) ds(x) ≥ 0 ∀u ∈ Uad ϕy x, y¯(x) y(x) dx + ψu x, u (4.53) Ω
Γ
4.6 Notwendige Optimalit¨ atsbedingungen
175
mit y = G (¯ u)(u − u ¯). Die Ableitung y erh¨ alt man analog zu Satz 4.17 auf S. 170 als L¨ osung des an der Stelle y¯ linearisierten Randwertproblems −Δy + y ∂ν y + by (x, y¯) y
= 0 = u−u ¯.
(4.54)
Der adjungierte Zustand p wird als L¨ osung der adjungierten Gleichung −Δp + p = ϕy x, y¯(x) ∂ν p + by (x, y¯) p = 0
in
Ω
auf Γ
(4.55)
¯ an, denn die rechte Seite ϕy ist beschr¨ankt, definiert. Er geh¨ ort dem Raum H 1 (Ω)∩C(Ω) ∞ r also aus L (Ω). Es w¨ urde auch ϕy ∈ L (Ω), Aus Lemma 2.31 auf r > N/2, ausreichen. S. 59, angewendet mit aΩ (x) = ϕy x, y¯(x) , α(x) = by x, y¯(x) , βΩ = 0 und βΓ = 1, folgt ϕy x, y¯(x) y(x) dx = p(x) u(x) − u ¯(x) ds(x) Ω
Γ
2
f¨ ur alle u ∈ L (Γ). Nach Einsetzen in die Variationsungleichung (4.53) ergibt sich: Satz 4.21 Es sei Voraussetzung 4.14 auf S. 164 erf¨ ullt. Ist u ¯ lokal optimale Steuerung des Randsteuerungsproblems (4.50)–(4.52) und der adjungierte Zustand p durch Gleichung (4.55) definiert, dann muss u ¯ der folgenden Variationsungleichung gen¨ ugen: p(x) + ψu (x, u ¯(x)) u(x) − u ¯(x) ds(x) ≥ 0 ∀u ∈ Uad . (4.56) Γ
Die Variationsungleichung kann wieder in Form eines punktweisen Minimumprinzips aufgeschrieben werden. Wegen Analogie zum Fall der verteilten Steuerung verzichten wir darauf. Wie bei verteilter Steuerung hat f (u) = J G(u), u die Ableitung f (¯ p(x) + ψu (x, u u) u = ¯(x)) u(x) ds(x). (4.57) Γ
Beispiel. Gegeben sei das Randsteuerungsproblem min J(y, u) := bei
λ 1 y − yΩ 2L2 (Ω) + u2L2 (Γ) 2 2
−Δy + y ∂ν y + y 3 |y|
= 0 = u
sowie 0 ≤ u(x) ≤ 1. Es ist ein Spezialfall des Randsteuerungsproblems (4.50)–(4.52) mit ϕ(x, y) =
2 1 y − yΩ (x) , 2
ψ(x, u) =
λ 2 u , 2
b(x, y) = y 3 |y|.
Die Randbedingung ist eigentlich vom Stefan-Boltzmann-Typ, denn f¨ ur nichtnegative y gilt y 3 |y| = y 4 . Im Gegensatz zur Funktion y 4 ist aber y 3 |y| monoton. Auch hier setzen wir
176
4 Steuerung semilinearer elliptischer Gleichungen
yΩ ∈ L∞ (Ω) voraus. Die geforderten Voraussetzungen (Messbarkeit, Differenzierbarkeit, Monotonie von b, Konvexit¨ at von Ψ in u) sind offenbar erf¨ ullt. Deshalb existiert analog zu Satz 4.15 von S. 165 mindestens eine optimale Steuerung u¯. Die Ableitung von b ist b (y) = 4 y 2 |y|, wie man leicht nachrechnet. Die adjungierte Gleichung (4.55) lautet deshalb −Δp + p = y¯ − yΩ ∂ν p + 4 y¯2 |¯ y | p = 0. Mit deren L¨ osung p erf¨ ullt u ¯ f¨ ur alle u mit 0 ≤ u(x) ≤ 1 die Variationsungleichung (λ¯ u + p)(u − u ¯) ds ≥ 0. Γ
4.7 Anwendung des formalen Lagrangeprinzips Auch bei den nichtkonvexen Problemen, die in diesem Kapitel behandelt werden, leistet das formale Lagrangeprinzip gute Dienste f¨ ur die Herleitung der Optimalit¨atsbedingungen. Auf diese Weise gelangt man leicht zum richtigen Ergebnis, das anschließend exakt bewiesen werden kann. Wir wollen das an der folgenden relativ allgemein gehaltenen Aufgabe erl¨ autern: min J(y, v, u) := ϕ x, y(x), v(x) dx + ψ x, y(x), u(x) ds(x) (4.58) Ω
Γ
bei −Δy + d(x, y, v) ∂ν y + b(x, y, u) sowie
va (x) ≤ v(x) ua (x) ≤ u(x)
= 0 = 0
in Ω auf Γ
≤ vb (x) f.¨ u. in Ω ≤ ub (x) f.¨ u. auf Γ.
(4.59)
(4.60)
Die Zielfunktion enth¨ alt auch Randwerte von y, ist also allgemeiner als bisher. Dabei verzichten wir auf die pr¨ azise Angabe der Voraussetzungen an die gegebenen Gr¨oßen, denn die Methode soll ohnehin nur formal erl¨ autert werden. Die Funktionen ϕ, ψ, d, b m¨ ussen in x messbar sein und differenzierbar nach y, u, v. Außerdem ben¨otigen wir mindestens die Monotonie von d und b in y. Weil die Steuerungen u und v nichtlinear in der Gleichung auftreten, ist ein allgemeiner Existenzbeweis f¨ ur optimale Steuerungen nicht zu erwarten. Deshalb setzen wir voraus, dass lokal optimale Steuerungen u ¯ sowie v¯ existieren, f¨ ur die wir die notwendigen Optimalit¨ atsbedingungen herleiten wollen. Die Mengen der zul¨ assigen Steuerfunktionen bezeichnen wir in Analogie zu den bisherigen Aufgaben mit Vad ⊂ L∞ (Ω) und Uad ⊂ L∞ (Γ). Die Lagrangefunktion wird formal durch − Δy + d(·, y, v) p dx − ∂ν y + b(·, y, u) p ds L(y, v, u, p) = J(y, v, u) − Ω
Γ
4.7 Anwendung des formalen Lagrangeprinzips
177
¯ nicht sauber eingef¨ uhrt. So ist sie bei Verwendung des Zustandsraums Y = H 1 (Ω)∩C(Ω) erkl¨ art, deshalb formen wir sie mit partieller Integration um und definieren L(y, v, u, p) := J(y, v, u) − ∇y · ∇p + d(·, y, v) p dx − b(·, y, u) p ds. (4.61) Ω
Γ
Dieser Definition liegt die Erwartung zugrunde, dass der Lagrangesche Multiplikator f¨ ur die Randbedingungen mit den Randwerten des Multiplikators p f¨ ur die Gleichung identisch sein wird. Deshalb steht in allen Integralen die gleiche Funktion p. Im Zweifelsfalle sollte man f¨ ur Gleichung und Randbedingung verschiedene Multiplikatoren p1 und p2 ansetzen, insbesondere bei Dirichlet-Randsteuerung. Wir erwarten die Existenz einer ¯ welche die folgenden Beziehungen erf¨ Funktion p ∈ H 1 (Ω) ∩ C(Ω), ullt: y , v¯, u ¯, p) y = 0 Dy L(¯ Dv L(¯ y , v¯, u ¯, p)(v − v¯) ≥ 0 Du L(¯ y , v¯, u ¯, p)(u − u ¯) ≥ 0
∀y ∈ H 1 (Ω) ∀v ∈ Vad ∀u ∈ Uad .
Die Auswertung dieser Bedingungen wird nur kurz erl¨autert, weil sie analog zur Arbeitsweise in Kapitel 2 erfolgt. Die erste ergibt Dy L(¯ y , v¯, u ¯, p) y = ϕy (·, y¯, v¯) y dx + ψy (·, y¯, u ¯) y ds Ω Γ ∇y · ∇p dx − dy (·, y¯, v¯) y p dx − by (·, y¯, u ¯) y p ds = 0 − Ω
Ω
Γ
f¨ ur alle y ∈ H 1 (Ω). Das ist die Variationsformulierung f¨ ur die schwache L¨osung p von −Δp + dy (·, y¯, v¯) p = ϕy (·, y¯, v¯) ∂ν p + by (·, y¯, u ¯) p = ψy (·, y¯, u ¯),
(4.62)
die wir als adjungierte Gleichung definieren. Die L¨osung p ist der adjungierte Zustand. ankt und messbar sind, by , dy nichtnegativ sind Er existiert, wenn by , dy , ϕy , ψy beschr¨ und nicht beide identisch verschwinden. Aus der zweiten und dritten Beziehung folgen die Variationsungleichungen ∀v ∈ Vad ϕv (·, y¯, v¯) − p dv (·, y¯, v¯) (v − v¯) dx ≥ 0 Ω (4.63) ψu (·, y¯, u ¯) − p bu (·, y¯, u ¯) (u − u ¯) ds ≥ 0 ∀u ∈ Uad . Γ
Die adjungierte Gleichung bildet gemeinsam mit den Variationsungleichungen, den Inklusionen u ∈ Uad , v ∈ Vad und der Zustandsgleichung das Optimalit¨atssystem zum Problem (4.58)–(4.60). Beispiel. Zur Illustration untersuchen wir die Aufgabe 2 2 min J(y, u, v) := y + yΩ y + λ1 v + vΩ v dx + λ2 u8 ds Ω
bei
Γ
−Δy + y + ey ∂ν y + y 4
= v = u4
178
4 Steuerung semilinearer elliptischer Gleichungen
sowie −1 ≤ v(x) ≤ 1,
0 ≤ u(x) ≤ 1
mit gegebenen Funktionen yΩ , vΩ aus L∞ (Ω). Die Nichtlinearit¨at y 4 vom Stefan-Boltzmann-Typ passt nicht in die allgemeine Theorie, denn y 4 ist nicht monoton. Deshalb ersetzen wir y 4 durch die monotone Funktion |y| y 3 , die f¨ ur nichtnegative y mit y 4 zusammenf¨ allt. Dann ist Satz 4.7 auf S. 153 anwendbar und liefert zu jedem Paar zul¨assiger ¯ Steuerungen u, v die Existenz genau eines Zustands y ∈ H 1 (Ω) ∩ C(Ω). Trotz Auftretens einer nichtlinearen Funktion u4 in der Randbedingung kann man hier den Beweis mindestens einer optimalen Steuerung erbringen. Man ersetzt u4 durch eine neue Steuerung u ˜. Dann steht in der Randbedingung u˜, im Funktional tritt λ2 u ˜2 auf und die Nebenbedingungen werden zu 0 ≤ u ˜ ≤ 1. Die so transformierte Aufgabe besitzt analog zum Existenzsatz 4.15 auf S. 165 optimale Steuerungen v¯ und u ˜, woraus sich f¨ ur das Ausgangsproblem die optimalen Steuerungen v¯ und u ¯=u ˜1/4 ergeben. Das Problem ordnet sich wie folgt in die allgemeine Aufgabe (4.58)–(4.60) ein: ϕ(x, y, v) = y 2 + yΩ (x) y + vΩ (x) v + λ1 v 2 , ψ(x, y, u) = λ2 u8 , d(x, y, v) = y + ey − v, b(x, y, u) = |y|y 3 − u4 . Nur dieser Einordnung wegen haben wir die Beschr¨anktheit von yΩ und vΩ vorausgesetzt. Die unten stehenden Optimalit¨ atsbedingungen bleiben offensichtlich auch f¨ ur quadratisch integrierbare Funktionen yΩ , vΩ richtig. Sie lauten f¨ ur beliebige lokal optimale Steuerungen v¯, u ¯: Adjungierte Gleichung:
−Δp + p + ey¯ p = 2 y¯ + yΩ ∂ν p + 4 y¯2 |¯ y | p = 0.
Variationsungleichungen: (2λ1 v¯ + vΩ + p)(v − v¯) dx ≥ 0 ∀v ∈ Vad Ω (8λ2 u ¯7 + 4¯ u3 p)(u − u ¯) ds ≥ 0 ∀u ∈ Uad . Γ
4.8 Pontrjaginsches Maximumprinzip * 4.8.1 Hamiltonfunktionen Alle bis jetzt hergeleiteten notwendigen Optimalit¨atsbedingungen erster Ordnung haben in Bezug auf die Steuerungen die Form einer Variationsungleichung. Sie entstanden durch Ableitung der Lagrangefunktion nach der Steuerfunktion. Das bekannte Pontrjaginsche Maximumprinzip vermeidet die Ableitung nach der Steuerung. Es wurde zuerst f¨ ur Steuerungsprobleme bei gew¨ohnlichen Differentialgleichungen bewiesen, Pontrjagin et al. [173]. Eine Erweiterung auf den Fall semilinearer partieller parabolischer Differentialgleichungen gelang von Wolfersdorf [210, 211] mit der Integralgleichungsmethode. Er wendete eine von Bittner [31] entwickelte allgemeine Technik an. Allgemeinere Resultate f¨ ur semilineare elliptische und parabolische Probleme wurden in den folgenden Jahren bewiesen, zuerst durch Bonnans und Casas [32]. Sp¨ater wurde das
4.8 Pontrjaginsches Maximumprinzip *
179
Maximumprinzip auf Zustandsrestriktionen erweitert. Wir verweisen auf Casas [42] sowie Bonnans und Casas [33] bei elliptischen Gleichungen und Casas [46], sowie Raymond und Zidani [176] f¨ ur parabolische Gleichungen. Außerdem ist das Buch [142] von Li und Yong zu diesem Thema zu nennen. Wir erl¨ autern das Maximumprinzip exemplarisch f¨ ur die Aufgabe (4.58)–(4.60), min J(y, u, v) := ϕ(x, y, v) dx + ψ(x, y, u) ds, Γ
Ω
−Δy + d(x, y, v) = 0 ∂ν y + b(x, y, u) = 0
in Ω auf Γ
sowie va (x) ≤ v(x) ≤ vb (x) f.¨ u. in Ω, ua (x) ≤ u(x) ≤ ub (x) f.¨ u. auf Γ. ¯ gew¨ ahlt. Wir gehen von der Lagrangefunktion Als Zustandsraum wird Y = H 1 (Ω)∩C(Ω) (4.61) aus. Die Integranden ihrer nicht-differentiellen Terme werden zu Hamilton-Funktionen zusammengefasst, getrennt nach Anteilen auf Ω und Γ. Definition. Die Funktionen H Ω : Ω × IR4 → IR und H Γ : Γ × IR4 → IR, H Ω (x, y, v, p0 , p) = p0 ϕ(x, y, v) − d(x, y, v) p, H Γ (x, y, u, p0 , p) = p0 ψ(x, y, u) − b(x, y, u) p,
(4.64)
werden als Hamiltonfunktionen bezeichnet. Die Hamiltonfunktionen sind Funktionen reeller Ver¨anderlicher. Ihre Argumente sind also keine Funktionen, es werden aber Funktionen in sie eingesetzt. Die notwendigen Optimalit¨ atsbedingungen f¨ ur ein Paar lokal optimaler Steuerungen (¯ u, v¯) sind durch (4.62) und (4.63) gegeben. Mit den Hamiltonfunktionen lassen sich diese notwendigen Bedingungen eleganter in folgender Weise ausdr¨ ucken: Die adjungierte Gleichung ist ¨aquivalent zu −Δp ∂ν p
= Dy H Ω (x, y¯, v¯, 1, p) = Dy H Γ (x, y¯, u ¯, 1, p)
in Ω auf Γ
(4.65)
und die Variationsungleichungen lauten in punktweiser Formulierung Dv H Ω x, y¯(x), v¯(x), 1, p(x))(v − v¯(x) ≥ 0 ∀v ∈ [va (x), vb (x)], Du H Γ x, y¯(x), u ¯(x), 1, p(x))(u − u ¯(x) ≥ 0 ∀u ∈ [va (x), vb (x)], jeweils f¨ ur fast alle x ∈ Ω bzw. x ∈ Γ. Umstellen nach der Steuerung ergibt schwache Minimumprinzipien, beispielsweise min Dv H Ω x, y¯(x), v¯(x), 1, p(x) v = Dv H Ω x, y¯(x), v¯(x), 1, p(x) v¯(x) (4.66) v∈[va (x),vb (x)]
f¨ ur fast alle x ∈ Ω. Das Minimum in (4.66) wird also fast u ¨berall durch v¯(x) angenommen.
4.8.2 Maximumprinzip Ist die Hamiltonfunktion H Ω konvex in v, dann ist die schwache Minimumbedingung (4.66) ¨ aquivalent zur Minimumbedingung min (4.67) H Ω x, y¯(x), v, 1, p(x) H Ω x, y¯(x), v¯(x), 1, p(x) = v∈[va (x),vb (x)]
180
4 Steuerung semilinearer elliptischer Gleichungen
f¨ ur fast alle x ∈ Ω. Um zu deren Maximum-Formulierung zu kommen, multiplizieren wir die Hamiltonfunktion mit −1 und f¨ uhren mit q := −p den negativen adjungierten Zustand ein. Gem¨ aß (4.65) gen¨ ugt er der adjungierten Gleichung −Δq ∂ν q
= Dy H Ω (x, y¯, v¯, −1, q) = Dy H Γ (x, y¯, u ¯, −1, q)
in Ω auf Γ.
Aus der Minimumbedingung (4.67) entsteht die Maximumbedingung H Ω x, y¯(x), v¯(x), −1, q(x) = max H Ω x, y¯(x), v, −1, q(x) v∈[va (x),vb (x)]
(4.68)
(4.69)
f¨ ur fast alle x ∈ Ω. Analoges gilt f¨ ur die Randsteuerung u. Es ist eine u urli¨ berraschende Tatsache, dass die Maximumbedingung (4.69) unter nat¨ chen Voraussetzungen auch dann noch erf¨ ullt sein muss, wenn man auf die eben zur Erl¨ auterung geforderte Konvexit¨ at verzichtet. Dann ist das Pontrjaginsche Maximumprinzip erf¨ ullt: Definition. Die Steuerungen u ¯ ∈ Uad und v¯ ∈ Vad gen¨ ugen dem Pontrjaginschen Maximumprinzip, wenn mit q0 = −1 und dem durch (4.68) definierten adjungierten Zustand q die folgenden Maximumbedingungen f¨ ur fast alle x aus Ω bzw. Γ erf¨ ullt sind: H Ω x, y¯(x), v¯(x), q0 , q(x) = max H Ω x, y¯(x), v, q0 , q(x) , v∈[va (x),vb (x)] (4.70) ¯(x), q0 , q(x) = max H Γ x, y¯(x), u, q0 , q(x) . H Γ x, y¯(x), u u∈[ua (x),ub (x)]
Globale L¨ osungen elliptischer Optimalsteuerungsprobleme m¨ ussen dem Pontrjaginschen Maximumprinzip gen¨ ugen, wenn gewisse nat¨ urliche Bedingungen an die Probleme gestellt werden. Das Maximumprinzip hat gegen¨ uber den schwachen Minimumbedingungen den Vorzug, dass es ohne partielle Ableitungen nach den Steuerungen auskommt. Damit lassen sich gegebenenfalls unter mehreren L¨ osungen von (4.66) diejenigen aussondern, die nicht das Minimum liefern. Außerdem k¨ onnen auch Funktionale zugelassen werden, die nicht differenzierbar nach der Steuerung sind. Die in diesem Kapitel untersuchten Aufgaben mit linear-quadratisch auftretenden Steuerungen erf¨ ullen die Voraussetzungen des Maximumprinzips, so dass optimale Steuerungen dem Pontrjaginschen Maximumprinzip gen¨ ugen m¨ ussen. Das Maximumprinzip war bei Steuerungsproblemen f¨ ur partielle Differentialgleichungen bisher vor allem von theoretischem Interesse. Numerische Verfahren ben¨otigen in der Regel Ableitungen nach der Steuerung, weshalb schwache Minimumbedingungen in Form von Variationsungleichungen in der Regel ausreichend sind.
4.9 Ableitungen zweiter Ordnung Ist F eine Fr´echet-differenzierbare Abbildung von einer offenen Menge U ⊂ U nach V , so ist u → F (u) eine operatorwertige Abbildung von U nach Z = L(U, V ). F¨ ur diese kann man wieder die Frage nach der Differenzierbarkeit stellen. Definition. Es sei F : U ⊃ U → V eine Fr´echet-differenzierbare Abbildung. Ist die Abbildung u → F (u) an der Stelle u ∈ U ebenfalls Fr´echet-differenzierbar, so heißt
4.9 Ableitungen zweiter Ordnung
181
F zweimal Fr´echet-differenzierbar an der Stelle u. Als zweite Ableitung bezeichnet man (F ) (u) =: F (u). Nach Definition ist F (u) ein linearer stetiger Operator von U in Z = L(U, V ), also F (u) ∈ L U, L(U, V ) , und damit von der Struktur her schon recht komplex. Zum Gl¨ uck ben¨ otigen wir nicht den Operator F selbst, sondern seine Anwendung auf gegebene Elemente. F¨ ur jede feste Richtung u1 ∈ U ist das Objekt F (u)u1 schon etwas einfacher, n¨ amlich ein linearer Operator aus L(U, V ). Diesen linearen Operator k¨onnen wir auf eine andere Richtung u2 ∈ U anwenden und erhalten ein Element F (u)u1 u2 ∈ V . Wir werden es nicht direkt mit der abstrakten Gr¨oße F (u) sondern mit F (u)u1 oder F (u)u1 u2 zu tun haben und verwenden dabei die Bezeichnungen F (u)[u1 , u2 ] := F (u) u1 u2 ,
F (u) v 2 := F (u)[v, v];
F (u)[u1 , u2 ] ist eine symmetrische und in u1 , u2 stetige Bilinearform, vgl. Cartan [41]. F¨ ur zweimal Fr´echet-differenzierbare Abbildungen F : U → V gilt mit dem Restglied r2F zweiter Ordnung der Satz von Taylor 1 F (u + h) = F (u) + F (u) h + F (u) h2 + r2F (u, h), 2 vgl. [41]. Das Restglied hat die Eigenschaft r2F (u, h)V →0 h2U
f¨ ur h → 0.
Analog zu stetiger Differenzierbarkeit heißt F zweimal stetig Fr´echet-differenzierbar, wenn die Abbildung u → F (u) stetig ist, also aus u − u ¯U → 0 die Beziehung
F (u) − F (¯ u) L(U,L(U,V )) → 0 folgt. Wie kann man solche Normen ausrechnen bzw. absch¨atzen? Zum Beispiel durch die Betrachtung der entsprechenden Bilinearform. Nach Definition gilt n¨amlich
F (u) = sup F (u) u1 L(U,V ) L(U,L(U,V )) u1 U =1
sup (F (u) u1 ) u2 V = sup u1 U =1
u2 U =1
und mit der oben eingef¨ uhrten Bezeichnungsweise
F (u) = L(U,L(U,V ))
sup u1 U =1, u2 U =1
F (u)[u1 , u2 ] . V
(4.71)
¨ Die Aquivalenz zwischen F (u) und der Bilinearform F (u)[·, ·] wird z.B. in [41], [118] oder [214] behandelt. Berechnung von F (u) An Stelle von F (u) arbeiten wir mit der zugeordneten Bilinearform und bestimmen deshalb zuerst f¨ ur beliebiges aber festes u1 ∈ U die Richtungsableitung F (u)u1 . Danach
182
4 Steuerung semilinearer elliptischer Gleichungen
setzen wir F˜ (u) = F (u)u1 . F˜ ist eine Abbildung von U in V . F¨ ur diese ergibt sich die Richtungsableitung F˜ (u)u2 , d F˜ (u)u2 = F˜ (u + t u2 ) t=0 dt
d (F (u + t u2 )u1 ) t=0 dt = F (u + t u2 )u1 u2 t=0 = F (u) u1 u2 = F (u)[u1 , u2 ]. =
Nach dieser Prozedur steht die gesuchte Bilinearform da. Beispiel. Wir f¨ uhren das (zun¨ achst formal) f¨ ur den Nemytskii-Operator Φ(y) = ϕ ·, y(·) vor, und zwar im Raum Y = L∞ (E). Die Existenz der Ableitung Φ wird stillschweigend vorausgesetzt. Sie folgt aus Satz 4.22, dessen Voraussetzungen wir schon hier fordern. Die erste Ableitung kennen wir schon, denn nach Lemma 4.12 auf S. 161 gilt Φ (y)y1 (x) = ϕy x, y(x) y1 (x). Wir setzen nun
ϕ˜ x, y := ϕy x, y y1 (x)
und definieren einen neuen Nemytskii-Operator durch ˜ Φ(y) = ϕ˜ ·, y(·) . ˜ differenzierbar. Die Funktion ϕ˜ erf¨ ullt die Voraussetzungen von Lemma 4.12, also ist Φ Die Ableitung in Richtung y2 ist ˜ (y)y2 (x) = ϕ˜y x, y(x) y2 (x) = ϕyy x, y(x) y1 (x) y2 (x), Φ also insgesamt Φ (y)[y1 , y2 ] (x) = ϕyy x, y(x) y1 (x) y2 (x).
Wir haben in der Tat eine Fr´echet-Ableitung zweiter Ordnung berechnet, wie der n¨achste Satz zeigt. Mit der eben erhaltenen Darstellung kann Ableitung Φ (y), ein recht die zweite abstraktes Objekt, mit der reellen Funktion ϕyy x, y(x) identifiziert werden. Es zeigt sich, dass die Normen beider Gr¨ oßen u ¨bereinstimmen:
Φ (y) ∞
Φ (y)[y1 , y2 ] ∞ = sup L(L (E),L(L∞ (E))) L (E) y1 L∞ (E) =y2 L∞ (E) =1
=
sup y1 L∞ (E) =y2 L∞ (E) =1
=
ϕyy (·, y) ∞ . L (E)
ϕyy (·, y) y1 y2 ∞ L (E) (4.72)
Satz 4.22 Die Funktion ϕ = ϕ(x, y) : E × IR → IR sei f¨ ur alle y ∈ IR messbar in x ∈ E und f¨ ur fast alle x ∈ E zweimal partiell nach y differenzierbar. Sie gen¨ uge der Beschr¨anktheits- und lokalen Lipschitzbedingung (4.24)–(4.25) auf S. 158 mit der Ordnung k = 2. Dann ist der von ϕ erzeugte Nemytskii-Operator Φ zweimal stetig Fr´echetdifferenzierbar in L∞ (E) und die zweite Ableitung hat folgende Form: Φ (y)[y1 , y2 ] (x) = ϕyy x, y(x) y1 (x) y2 (x).
4.9 Ableitungen zweiter Ordnung
183
Beweis: (i) Wir haben drei Dinge zu beweisen: Erstens, dass die im Satz angegebene Bildungsvorschrift f¨ ur Φ wirklich die erste Ableitung von Φ darstellt, also Φ (y + h) − Φ (y) − Φ (y) hL(L∞ (E)) → 0 f¨ ur h → 0. hL∞ (E)
(4.73)
Dazu muss zweitens gekl¨ art sein, dass Φ (y) h ein linearer Operator aus L L∞ (E) ist und die lineare Abbildung h → Φ (y) h beschr¨ankt ist. Drittens muss die Abbildung y → Φ (y) stetig sein. Wir verwenden von Anfang an die Bezeichnung Φ , auch wenn sie erst am Ende gerechtfertigt ist. Zum Beweis seien y ∈ L∞ (E) und h ∈ L∞ (E) gegeben. Es ist klar, wie der lineare Operator A = Φ (y) h zu definieren ist, als Multiplikationsoperator durch k → A k, A k (x) = ϕyy x, y(x) h(x) k(x). A geh¨ ort zu den fest vorgegebenen Funktionen y und h, wird durch die beschr¨ankte und messbare Funktion ϕyy x, y(x) h(x) erzeugt und ist offenbar ein linearer stetiger Opera¨ halber schreiben wir die Korrespondenzen tor in L∞ (E). Der besseren Ubersichtlichkeit zwischen den abstrakten Operatoren und ihren erzeugenden Funktionen auf. ∈ LL∞ (E),L(L∞(E)) , ∼ ϕyy x, y(x) Φ (y) Φ (y) h ∼ ϕyy x, y(x) h(x) ∼ A ∈ L L∞ (E) , ∈ L∞ (E). Φ (y)[h, k] ∼ ϕyy x, y(x) h(x) k(x) ∼ A k (ii) Abbildung Φ (y) : h → Φ (y) h =: A ist linear und beschr¨ankt von L∞ (E) in Die ∞ L L (E) . Die Linearit¨ at ist klar, Beschr¨ anktheit folgt mit Formel (4.72): Die Funktion ankt und messbar, deshalb ist die letzte Norm in (4.72) endlich. ϕyy (·, y(·)) ist beschr¨ Folglich ist Φ (y) f¨ ur festes y ein linearer beschr¨ankter und deshalb stetiger Operator. (iii) Nachweis von (4.73): F¨ ur den Z¨ ahler erhalten wir nach Einsetzen der konkreten Bildungsvorschriften
Φ (y + h) − Φ (y) − Φ (y) h ∞ = L(L (E))
ϕy (·, y + h) − ϕy (·, y) − ϕyy (·, y) h k ∞ = sup kL∞ (E) =1
L
(E)
= ϕy (·, y + h) − ϕy (·, y) − ϕyy (·, y) hL∞ (E) . Die Funktion ϕ(x, ˜ y) := ϕy (x, y) erzeugt einen Fr´echet-differenzierbaren Nemytskii-Operator mit einer durch ϕ˜y (x, y) = ϕyy (x, y) erzeugten Ableitung. Daher gilt ϕy (·, y + h) − ϕy (·, y) − ϕyy (·, y) hL∞ (E) → 0 f¨ ur hL∞ (E) → 0. hL∞ (E) Daraus folgt (4.73) nach Division der obigen Gleichungskette durch hL∞ (E) . (iv) Stetigkeit von y → Φ (y): Analog zu den bisherigen Schl¨ ussen erhalten wir
Φ (y1 ) − Φ (y2 ) ∞ = ϕyy (·, y1 ) − ϕyy (·, y2 ) L∞ (E) L(L (E),L(L∞ (E))) ≤ L(M ) y1 − y2 L∞ (E) , f¨ ur max{y1 L∞ (E) , y2 L∞ (E) } ≤ M . Das ist die gesuchte Stetigkeit. Wir haben sogar lokale Lipschitzstetigkeit von Φ gezeigt.
184
4 Steuerung semilinearer elliptischer Gleichungen
Ableitungen zweiter Ordnung in anderen Lp -R¨ aumen ur 1 ≤ q < p < ∞, wenn Die zweite Ableitung von Φ : Lp (E) → Lq (E) existiert f¨ y(·) → ϕyy (·, y(·)) eine Abbildung von Lp (E) nach Lr (E) darstellt mit pq , (4.74) r= p − 2q siehe [78]. In diesem Fall gilt Φ (y)[h1 , h2 ] (x) = ϕyy (x, y(x)) h1 (x) h2 (x). Die Beziehung (4.74) leuchtet ein, denn f¨ ur h1 , h2 aus Lp (E) liegt das Produkt h = h1 h2 p in L 2 (E). Aus der Sicht der Ableitung erster Ordnung mit Zuwachs h (vgl. Formel 4.29 auf S. 163) muss deshalb die Funktion ϕyy nach Lr (E) abbilden mit r=
p 2
p 2
q pq . = p − 2q −q
Beispiel. Wir betrachten den Sinus-Operator y(·) → sin(y(·)). Dieser bildet jeden Raum Lp (E) in Lq (E) ab f¨ ur 1 ≤ q ≤ p ≤ ∞. Gleiches gilt f¨ ur y(·) → cos(y(·)). F¨ ur die Differenzierbarkeit des Sinus-Operators von Lp (E) nach Lq (E) ist die Forderung 1 ≤ q < p hinreichend, denn in diesem Falle gilt r = p q/(p − q) < ∞ und es ist klar, dass der Cosinus-Operator von Lp nach Lr (E) abbildet. F¨ ur die Existenz der zweiten Ableitung braucht man analog q < p/2.
4.10 Optimalit¨ atsbedingungen zweiter Ordnung 4.10.1 Grundideen hinreichender Optimalit¨ atsbedingungen Bei den konvexen Aufgaben aus Kapitel 2 und 3 ist jede die notwendigen Optimalit¨atsbedingungen erster Ordnung erf¨ ullende Steuerung automatisch (global) optimal, denn bei Konvexit¨ at sind die notwendigen Bedingungen auch hinreichend f¨ ur Optimalit¨at. Im nichtkonvexen Fall zieht man Ableitungen h¨oherer Ordnung zu Rate, um auf lokale Optimalit¨ at zu schließen. Eine Funktion f von n reellen Ver¨ anderlichen hat an der Stelle u ¯ ∈ IRn ein lokales Minimum, wenn zus¨ atzlich zu f (¯ u) = 0 die Hesse-Matrix f (¯ u) positiv definit ist. Positive Definitheit ist a quivalent zur Existenz eines δ > 0 mit ¨ h f (¯ u) h ≥ δ |h|2
∀h ∈ IRn .
Das ist in unendlichdimensionalen R¨ aumen a ¨hnlich, aber die Theorie ist interessanter. Zur Einf¨ uhrung in die Problematik beweisen wir einen einfachen Satz, der im Funktionenraum oft nicht angewendet werden kann, weil seine Voraussetzungen in den gegebenen R¨aumen nicht erf¨ ullbar sind. Außerdem ist die darin f¨ ur alle h ∈ U geforderte Beziehung (4.75) in der Regel zu stark, man kann sie abschw¨ achen. Satz 4.23 Es sei U ein Banachraum, C ⊂ U eine konvexe Menge und f : U → IR ein Funktional, das in einer Umgebung des Punktes u ¯ ∈ C zweimal stetig Fr´echetdifferenzierbar ist. Die Steuerung u ¯ gen¨ uge der notwendigen Bedingung erster Ordnung f (¯ u)(u − u ¯) ≥ 0
∀u ∈ C
4.10 Optimalit¨ atsbedingungen zweiter Ordnung
185
und es existiere ein δ > 0, so dass u)[h, h] ≥ δ h2U f (¯
(4.75)
f¨ ur alle h ∈ U erf¨ ullt ist. Dann existieren Konstanten ε > 0 und σ > 0, so dass die quadratische Wachstumsbedingung f (u) ≥ f (¯ u) + σ u − u ¯2U f¨ ur alle u ∈ C mit u − u ¯U ≤ ε gilt. Folglich liegt an der Stelle u ¯ ein lokales Minimum von f in der Menge C vor. Beweis: Der Beweis unterscheidet sich nicht von dem im endlichdimensionalen Raum. Wir verwenden die vereinbarte Kurzschreibweise f (¯ u) h2 :=f (¯ u)[h, h]. Mit der reellen Funktion F : [0, 1] → IR, F (s) := f (¯ u+s(u−¯ u)), haben wir f (u) = F (1) und f (¯ u) = F (0). Aus der Taylorentwicklung 1 F (1) = F (0) + F (0) + F (θ), 2
θ ∈ (0, 1),
(4.76)
erh¨ alt man 1 ¯ + θ(u − u ¯) (u − u ¯ )2 u)(u − u ¯) + f u f (u) = f (¯ u) + f (¯ 2 1 ¯ + θ(u − u ¯) (u − u ¯ )2 ≥ f (¯ u) + f u 2 1 1 f u ¯ + θ(u − u ¯) − f u ¯ (u − u ¯ )2 . = f (¯ u) + f (¯ u)(u − u ¯ )2 + 2 2 Mit h = u− u ¯ folgt aus (4.75) die Ungleichung f (¯ u)(u− u ¯)2 ≥ δ u− u ¯2U . Den Betrag des letzten Ausdrucks der obigen Ungleichungskette k¨onnen wir nach oben mit δ/4 u − u ¯2U absch¨ atzen, wenn u − u ¯U gen¨ ugend klein ist, d.h. u − u ¯U ≤ ε. Das liegt an der vorausgesetzten Stetigkeit der zweiten Ableitung von f . Insgesamt erhalten wir f (u) ≥ f (¯ u) +
δ δ δ u) + u − u u − u ¯2U − u − u ¯2U ≥ f (¯ ¯2U 2 4 4
und die Aussage des Satzes ergibt sich mit σ = δ/4. Auf Optimalsteuerungsprobleme mit semilinearen partiellen Differentialgleichungen wird der Satz insbesondere dann anwendbar sein, wenn die Steuerungs-Zustands-Abbildung G zweimal stetig differenzierbar von L2 in den Zustandsraum ist und die Steuerung nur linear bzw. quadratisch im Zielfunktional sowie nur linear in der Differentialgleichung ¯ bzw. C(Q) ¯ ab, dann kann man diesen einfachen Fall vorkommt. Bildet G von L2 in C(Ω) erwarten, siehe Abschnitt 4.10.6 bzw. 5.7.4. Beispiel. Wir betrachten die Aufgabe min J(y, u) := bei
1 λ y − yΩ 2L2 (Ω) + u2L2 (Ω) 2 2
−Δy + ey y|Γ
= =
u 0
186
4 Steuerung semilinearer elliptischer Gleichungen
sowie ua (x) ≤ u(x) ≤ ub (x) f.¨ u. in Ω. Das Ortsgebiet Ω habe die Dimension N ≤ 3 und es seien Funktionen ua , ub ∈ L∞ (Ω) sowie yΩ ∈ L2 (Ω) gegeben. Wir haben 2 > N/2 = 3/2 und k¨onnen ausnutzen, dass A = −Δ in H01 (Ω) koerziv ist. Deshalb bleibt die Aussage von Satz 4.10 auf S. 155 f¨ ur diese Randwertaufgabe mit homogener Dirichletscher Randbedingung richtig (vgl. aber das Gegenbeispiel auf S. 154 mit Neumannscher Randbedingung). Die Abbildung ¯ G : u → y ist folglich zweimal stetig Fr´echet-differenzierbar von L2 (Ω) nach C(Ω). 2 Deshalb ist das reduzierte Funktional f : L (Ω) → IR, f (u) :=
1 λ G(u) − yΩ 2L2 (Ω) + u2L2 (Ω) , 2 2
ebenfalls zweimal stetig differenzierbar. Wir definieren die Lagrangefunktion L : (H01 (Ω)∩ ¯ × L2 (Ω) × H 1 (Ω) → IR wie in (4.61) auf S. 177 durch C(Ω)) 0 L(y, u, p) = J(y, u) − ∇y · ∇p + ey − u p dx. Ω
Auch L ist zweimal stetig differenzierbar. Es sei nun u ¯ eine Steuerung, die gemeinsam mit dem Zustand y¯ = G(¯ u) und dem adjungierten Zustand p die notwendigen Optimalit¨ atsbedingungen erster Ordnung f¨ ur obige Aufgabe erf¨ ullt. In Satz 4.25 beweisen wir die Darstellung f (¯ u)[h1 , h2 ] = L (¯ y, u ¯, p)[(y1 , h1 ), (y2 , h2 )],
(4.77)
wobei yi , i = 1, 2, die zu h = hi geh¨ origen L¨osungen folgender, an der Stelle y¯ linearisierten Gleichung sind: −Δy + ey¯ y = h (4.78) y|Γ = 0. Gen¨ ugt das Tripel (¯ y, u ¯, p) zus¨ atzlich mit einem δ > 0 der hinreichenden Bedingung zweiter Ordnung L (¯ y, u ¯, p)(y, h)2 ≥ δ h2 f¨ ur alle h ∈ L2 (Ω) und die zugeh¨ origen L¨ osungen y von (4.78), dann folgt aus dem letzten Satz und (4.77) die lokale Optimalit¨ at von u ¯ im Sinne von L2 (Ω). Die Bedingung (4.77) wurde f¨ ur alle h aus L2 (Ω) vorausgesetzt, eine eigentlich zu starke Forderung. Wir wissen zum Beispiel h(x) = u(x) − u ¯(x) ≥ 0 f¨ ur fast alle x mit u ¯(x) = ua (x) und analog h(x) ≤ 0 f¨ ur fast alle x mit u ¯(x) = ub (x). Solche Vorzeichenbedingungen verkleinern die Menge der zul¨ assigen Richtungen h, f¨ ur die man (4.77) fordern muss. Noch st¨ arker kann man die Menge der zu betrachtenden Richtungen h durch stark aktive Restriktionen einschr¨ anken. Die in Abschnitt 4.10.5 behandelte Aufgabe min −u2
u∈[−1,1]
zeigt das auf einfache Weise. Die Auswahl der zul¨ assigen Richtungen h beeinflusst nur die St¨arke der hinreichenden Bedingung zweiter Ordnung, nicht deren generelle Anwendbarkeit. Gravierender sind
4.10 Optimalit¨ atsbedingungen zweiter Ordnung
187
Regularit¨ atsaspekte der partiellen Differentialgleichung, denn sie setzen der einfachen L2 -Technik enge Grenzen: Im betrachteten Beispiel konnten wir ein dreidimensionales Ortsgebiet zulassen. F¨ ur eine Randsteuerung m¨ ussten wir bei sonst gleicher Konstellation schon N ≤ 2 fordern. Bei vergleichbaren parabolischen Aufgaben kommen nur verteilte Steuerungen mit N = 1 in Frage, w¨ ahrend der Fall der Randsteuerung nicht im Raum L2 behandelbar ist. Ursachen dieser Schwierigkeiten werden im n¨ achsten Abschnitt erl¨autert. Sp¨ater behan¨ deln wir eine Zwei-Norm-Technik zur Uberwindung der erw¨ahnten Probleme.
4.10.2 Die Zwei-Norm-Diskrepanz Das folgende Beispiel zeigt, dass die sorglose Verwendung von Satz 4.23 im Unendlichdimensionalen leicht zu Fehlschl¨ ussen f¨ uhrt. Hier ist keine Differentialgleichung gegeben, aber die Funktion u kommt nichtquadratisch im Zielfunktional vor. (Gegen)Beispiel. Wir betrachten die bereits diskutierte Aufgabe (4.37), 1 min f (u) := − cos u(x) dx. 0≤u(x)≤2π
0
Aus naheliegenden Gr¨ unden w¨ ahlen wir den Hilbertraum U = L2 (0, 1) f¨ ur unsere Steuerungen aus, denn das Arbeiten in Hilbertr¨ aumen ist in der Regel am einfachsten. Die Menge C ist gegeben durch C = {u ∈ U : 0 ≤ u(x) ≤ 2π, f.¨ u. in [0, 1]}. Eine globale L¨ osung der Aufgabe kennen wir, u ¯ ≡ 0. Testen wir, ob die Optimalit¨atsbedingungen f¨ ur u ¯ erf¨ ullt sind, zuerst die notwendige Bedingung erster Ordnung: 1 1 f (¯ u)(u − u ¯) = sin u ¯(x) u(x) − u ¯(x) dx = sin(0) u(x) dx = 0. 0
0
Sie ist trivial erf¨ ullt. Wir pr¨ ufen noch nach, ob u¯ auch der hinreichenden Bedingung zweiter Ordnung gen¨ ugt. Wir erhalten nach formaler Rechnung 1 1 f (¯ u) u2 = cos(0) u2 (x) dx = 1 · u2 (x) dx = 1 · u2L2 (0,1) 0
0
f¨ ur alle u ∈ L2 (0, 1). Die Bedingung ist mit δ = 1 erf¨ ullt. Nach Satz 4.23 muss deshalb eine Konstante σ > 0 existieren, so dass f (u) ≥ f (¯ u) + σ u − u ¯2L2 (0,1) f¨ ur alle u ∈ C 2 gilt, die in der L -Norm hinreichend nahe an u¯ ≡ 0 liegen. Das kann aber nicht stimmen! F¨ ur jedes noch so kleine ε > 0 ist auch die Funktion 2π 0≤x≤ε uε (x) = 0 ε 0 gr¨ oßer als f (¯ u) = −1 sein und das steht im Widerspruch zu f (uε ) = −1.
188
4 Steuerung semilinearer elliptischer Gleichungen
Wo liegt der Fehler? Er liegt in der stillschweigend verwendeten Annahme, dass unser Cosinus-Funktional f im Raum L2 (0, 1) zweimal stetig Fr´echet-differenzierbar ist. Wir ¨ erl¨ autern das unten an der Stelle u = 0. F¨ ur den allgemeinen Fall soll dies in Ubungsaufgabe 4.9 gezeigt werden. W¨ ahlt man aber f¨ ur U an Stelle von L2 (0, 1) den Banachraum L∞ (0, 1), dann ist f zweimal stetig Fr´echet-differenzierbar! Hier liegt ein typisches Beispiel f¨ ur die bekannte Zwei-Norm-Diskrepanz vor: Im Raum L2 (0, 1) erf¨ ullt f nicht die n¨otige Differenzierbarkeitsforderung, aber es liegt positive Definitheit von f (¯ u) vor, f (¯ u) u2 ≥ δ u2L2 (0,1) . Im Gegensatz dazu existiert die zweite Ableitung im Raum L∞ (0, 1) und ist dort stetig, w¨ ahrend es kein δ > 0 geben kann, so dass f (¯ u) u2 ≥ δ u2L∞ (0,1) f¨ ur alle u ∈ L∞ (0, 1) gilt. Ist hier also keine hinreichende Bedingung zweiter Ordnung erf¨ ullbar? Doch! Der von Ioffe [111] gefundene Ausweg besteht darin, mit zwei verschiedenen Normen zu arbeiten. Wir untersuchen deshalb das Restglied zweiter Ordnung der Taylor-Entwicklung von f im Raum L∞ (0, 1): Aus der bekannten Entwicklung des Cosinus an der Stelle der reellen Zahl u = u(x) erhalten wir f¨ ur festes x mit dem Restglied in Integralform f¨ ur reelle Funktionen, vgl. Heuser [102], Gleichung (168.6), 1 1 f (u + h) = − − cos u(x) + sin u(x) h(x) cos u(x) + h(x) dx = 0 0 1 + (1 − s) cos u(x) + s h(x) h2 (x) ds dx. s=0
Andererseits gilt nach Definition der Fr´echet-Ableitung 1 1 f (u + h) = − cos u(x) + sin u(x) h(x) + cos u(x) h2 (x) dx + r2f (u, h), 2 0 wobei r2f (u, h) das Restglied zweiter Ordnung von f an der Stelle u in Richtung h ist. Nach Gleichsetzen der Ausdr¨ ucke f¨ ur f (u + h) folgt 1 1 r2f (u, h) = (1 − s) cos u(x) + s h(x) − cos u(x) h2 (x) dsdx. (4.79) 0
0
Diese Darstellung ist ein Spezialfall des allgemeinen Taylorschen Satzes mit integralem Restglied; Cartan [41], Thm. 5.6.1. Die Verwendung des Restglieds in Integralform empfiehlt sich gegen¨ uber der einfacheren Lagrangeschen Form. So wird die Diskussion der Messbarkeit einer Zwischenstelle θ als Funktion von x vermieden, wie sie z.B. in der Entwicklung cos(u(x) + h(x)) = cos(u(x)) − sin(u(x) + θ(x)h(x)) h(x) auftritt. Beispiel. An dieser Stelle schieben wir den Nachweis ein, dass f im Raum L2 (0, 1) insbesondere im Nullpunkt nicht zweimal Fr´echet-differenzierbar ist. Dazu berechnen wir r2f (0, h) wie auf S. 159 f¨ ur den Zuwachs 1 auf [0, ε] h(x) = 0 auf (ε, 1]
4.10 Optimalit¨ atsbedingungen zweiter Ordnung
189
und vollziehen den Grenz¨ ubergang ε ↓ 0. Es folgt ε 1 1 − cos(1) = ε c (1 − s) cos(0 + s 1) − cos(0) 12 dsdx = ε r2f (0, h) = 2 x=0 s=0 mit c = 0 und deshalb ε −1 r2f (0, h) 2 = ε c 1 dx = c. h2L2 (0,1) 0 Dieser Ausdruck strebt f¨ ur ε ↓ 0 nicht gegen null, obwohl dabei hL2 (0,1) verschwindet. Damit ist das Cosinus-Funktional an der Stelle null in L2 (0, 1) nicht zweimal Fr´echetdifferenzierbar. f ¨ Zur Uberwindung der Zwei-Norm-Diskrepanz wird r2 (u, h) wie folgt abgesch¨atzt: |r2f (u, h)|
≤ ≤
0
1
0
1
(1 − s)s |h(x)| h2 (x) dsdx
1 hL∞ (0,1) 6
1
h2 (x) dx =
0
1 hL∞ (0,1) h2L2 (0,1) . 6
(4.80)
Folgerung. Das Restglied zweiter Ordnung des Cosinus-Funktionals erf¨ ullt |r2f (u, h)| →0 h2L2 (0,1)
f¨ ur
hL∞ (0,1) → 0.
(4.81)
Zum Nachweis ist nur (4.80) durch h2L2 (0,1) zu teilen. In dieser wichtigen Absch¨atzung treten zwei Normen auf, charakteristisch f¨ ur die Behandlung der Zwei-Norm-Diskrepanz. Jetzt kann das Cosinus-Beispiel vervollst¨ andigt werden. Wir erhalten an der Stelle unserer Referenzl¨ osung u ¯(x) ≡ 0 f (0 + h)
1 = f (0) + f (0) h + f (0) h2 + r2f (0, h) 2 1 = f (0) + 0 + h2L2 (0,1) + r2f (0, h) 2 1 r2f (0, h) 2 = f (0) + hL2 (0,1) + 2 h2L2 (0,1) 1 1 ≥ f (0) + h2L2 (0,1) − hL∞ (0,1) 2 6 1 ≥ f (0) + h2L2 (0,1) , 3
f¨ ur hL∞ (0,1) ≤ ε = 1. Damit ist in einer hinreichend kleinen L∞ -Umgebung von u ¯= 0 eine quadratische Wachstumsbedingung in der L2 -Norm erf¨ ullt. Daraus k¨onnen wir schließen, dass u ¯ im Sinne von L∞ (0, 1) eine lokal optimale L¨osung ist. Nat¨ urlich wussten wir das schon, denn u ¯ ist global optimal. Die eben erl¨ auterte Methode wird nun sinngem¨ aß auf Probleme der optimalen Steuerung u ¨bertragen.
190
4 Steuerung semilinearer elliptischer Gleichungen
4.10.3 Verteilte Steuerung Wir untersuchen jetzt Bedingungen zweiter Ordnung f¨ ur die Aufgabe (4.31)–(4.33), ϕ(x, y(x)) dx + ψ(x, u(x)) dx min J(y, u) := Ω
Ω
bei −Δy + d(x, y) = ∂ν y =
u 0
in Ω auf Γ
sowie ua (x) ≤ u(x) ≤ ub (x) f.¨ u. in Ω. Dabei nehmen wir an, dass eine Steuerung u ¯ ∈ Uad gegeben ist, die gemeinsam mit dem zugeh¨ origen Zustand y¯ = G(¯ u) und dem adjungierten Zustand p die notwendigen Optimalit¨ atsbedingungen erster Ordnung (4.46)–(4.48) auf S. 172 erf¨ ullt. Das Paar (¯ y, u ¯) braucht damit nicht optimal zu sein. Es ist unsere Referenzl¨osung, f¨ ur die wir lokale Optimalit¨ at zeigen wollen. F¨ ur die Dimension N von Ω ben¨otigen wir keine Einschr¨ankung, da wir im Steuerungsraum L∞ (Ω) arbeiten. Dabei ist zu betonen, dass wir erst dann die hinreichenden Optimalit¨atsbedingungen zweiter Ordnung nachpr¨ ufen k¨ onnen, wenn (¯ y, u ¯) konkret gegeben ist. Man h¨alt es so wie bei Extremwertaufgaben von Funktionen mehrerer Ver¨anderlicher: Nach in der Regel numerischer Bestimmung einer L¨ osung des Optimalit¨atssystems w¨are nachzupr¨ ufen, ob eine hinreichende Optimalit¨ atsbedingung erf¨ ullt ist und damit lokale Optimalit¨at vorliegt. Das numerische Verfahren wird aber in der Regel nur dann vern¨ unftig konvergieren, wenn es in der N¨ ahe einer L¨ osung gestartet wurde, welche die hinreichenden Bedingungen erf¨ ullt. Also muss man hoffen, eine solche Umgebung zu erwischen. Bemerkung. Eine hinreichende Bedingung zweiter Ordnung im Funktionenraum kann auf numerischem Wege nur sehr schwer verifiziert werden. Das Problem besteht darin, aus einer f¨ ur endlichdimensionale Approximationen nachgewiesenen positiven Definitheit auf den unendlichdimensionalen Fall schließen zu m¨ ussen. Es gibt aber eine numerische Methode von R¨ osch und Wachsmuth [179], die auf gewisse Typen von Aufgaben anwendbar ist. Ableitungen zweiter Ordnung Ableitung der Steuerungs-Zustands-Abbildung. Der Operator G bezeichnet f¨ ur das obige elliptische Randwertproblem wie bisher die Steuerungs-Zustands-Abbildung ¯ Zun¨achst kann die Existenz und u → y. Wir betrachten G von L∞ (Ω) nach H 1 (Ω)∩C(Ω). die Stetigkeit der Fr´echet-Ableitung zweiter Ordnung des Operators G gezeigt werden. Satz 4.24 Unter Voraussetzung 4.14 von S. 164 ist der Operator G : L∞ (Ω) → H 1 (Ω) ∩ ¯ zweimal stetig Fr´echet-differenzierbar. Die zweite Ableitung G (u) ist gegeben durch C(Ω) G (u)[u1 , u2 ] = z, wobei z die eindeutig bestimmte schwache L¨osung der mit y = G(u) definierten elliptischen Randwertaufgabe −Δz + dy (x, y) z ∂ν z
= −dyy (x, y) y1 y2 = 0
(4.82)
4.10 Optimalit¨ atsbedingungen zweiter Ordnung
191
ist und die Funktionen yi ∈ H 1 (Ω) durch yi = G (u) ui definiert sind. Beweis: (i) Existenz der zweiten Ableitung Wir wissen mit Satz 4.17 auf S. 170, dass die Abbildung G Fr´echet-differenzierbar ist. Um die Existenz der zweiten Ableitung zu erhalten, wenden wir den Satz u ¨ber implizite Funktionen an. Dazu wird die elliptische Randwertaufgabe f¨ ur y = G(u) in eine passende Form gebracht. Es sei R der L¨ osungsoperator der linearen elliptischen Randwertaufgabe −Δy + y ∂ν y
= =
v 0,
¯ Wir betrachten R als Operator mit Wertebereich in C(Ω). ¯ R : L∞ (Ω) → H 1 (Ω) ∩ C(Ω). Die Beziehung y = G(u) bedeutet −Δy + y ∂ν y
= u − d(x, y) + y = 0. Unter Verwendung von R heißt das y = R u − d(·, y) + y bzw. pr¨aziser y − R u − Φ(y) = 0,
(4.83)
(4.84)
¯ → L∞ (Ω) den durch d(·, y)−y erzeugten Nemytskii-Operator bezeichnet. wobei Φ : C(Ω) ¯ eine L¨ Ist umgekehrt y ∈ C(Ω) osung von (4.84), dann liegt y automatisch im Bild von R, geh¨ ort deshalb dem Raum H 1 (Ω) an und ist schwache L¨osung von (4.83). Damit sind ¯ × L∞ (Ω) → C(Ω) ¯ durch (4.83) und (4.84) ¨ aquivalent. Wir definieren nun F : C(Ω) F (y, u) = y − R u − Φ(y) . Der Operator Φ ist nach Satz 4.22 auf S. 182 zweimal stetig differenzierbar. Außerdem ist R linear und stetig. Deshalb ist auch F als zusammengesetzte Abbildung zweimal stetig Fr´echet-differenzierbar. Die Ableitung Dy F (y, u) ist surjektiv, denn die Gleichung Dy F (y, u) w = v ˜ := w − v zu w ˜ = −R Φ (y)(w ˜ + v). ist ¨ aquivalent zu w + R Φ (y) w = v und mit w ¨ Nach Definition von R ergibt sich nach etwas Rechnung die Aquivalenz zu −Δw ˜ + dy (x, y) w ˜ ∂ν w ˜
= =
−dy (x, y) v + v 0.
¯ genau eine L¨osung w Diese Randwertaufgabe besitzt aber f¨ ur jedes v ∈ C(Ω) ˜ ∈ H 1 (Ω) ∩ ¯ C(Ω). Damit sind die Voraussetzungen des Satzes u ullt und ¨ber implizite Funktionen erf¨ die Gleichung F (y, u) = 0 hat deshalb f¨ ur alle u aus einer Umgebung von u ¯ genau eine L¨ osung y = G(u). Das wussten wir bereits, denn die Existenz und Eindeutigkeit von y = G(u) hatten wir sogar f¨ ur alle u ∈ Uad bewiesen. Aber der Satz u ¨ ber implizite Funktionen sagt zus¨ atzlich aus, dass die Abbildung G so glatt ist wie die Abbildung F , siehe [41]. Somit ist G zweimal stetig Fr´echet-differenzierbar. (ii) Berechnung von G (u) Nach Einsetzen von y = G(u) erhalten wir laut Definition von F F G(u), u = G(u) − R u + R Φ G(u) = 0.
192
4 Steuerung semilinearer elliptischer Gleichungen
Differentiation in Richtung u1 ergibt mit der Kettenregel G (u) u1 − R u1 + R Φ G(u) G (u) u1 = 0 ¯ oder mit K(u) := G (u) u1 , K : L∞ (Ω) → C(Ω), K(u) − R u1 + R Φ G(u) K(u) = 0. Wir differenzieren nun in Richtung u2 und erhalten K (u) u2 + R Φ G(u) K(u), G (u) u2 + R Φ G(u) K (u) u2 = 0 nach Anwendung der Ketten- und Produktregel. Wegen K (u) u2 = G (u)[u1 , u2 ] (vgl. das auf S. 181 erl¨ auterte Schema zur Berechnung von zweiten Ableitungen) ist das ¨aquivalent zu G (u)[u1 , u2 ] + R Φ G(u) G (u) u1 , G (u) u2 + R Φ G(u) G (u)[u1 , u2 ] = 0, und das heißt mit z := G (u)[u1 , u2 ] z + R Φ (y) z + Φ (y)[y1 , y2 ] = 0. Das ist nach Definition von R gleichbedeutend mit −Δz + z ∂ν z
= −dy (x, y) z − dyy (x, y) y1 y2 = 0
und alle Behauptungen des Satzes sind bewiesen. Zweite Ableitung des Zielfunktionals. Mit Voraussetzung 4.14 auf S. 164 ist das Funktional J zweimal stetig Fr´echet-differenzierbar in Y ×L∞ (Ω). Deshalb ist die zusam mengesetzte Abbildung f : u → J G(u), u ebenfalls zweimal stetig Fr´echet-differenzierbar in L∞ (Ω). Die Ableitung kann wie im letzen Beweis berechnet werden. Wir erhalten zun¨ achst f (u) u1 = Dy J G(u), u G (u) u1 + Du J G(u), u u1 . Nach Ableitung von f˜(u) := f (u) u1 in Richtung u2 folgt mit Produkt- und Kettenregel f (u)[u1 , u2 ] = f˜ (u) u2 = Dy2 J G(u), u G (u) u1 , G (u) u2 +Du Dy J G(u), u G (u) u1 , u2 + Dy J G(u), u G (u)[u1 , u2 ] +Dy Du J G(u), u u1 , G (u)u2 + Du2 J G(u), u [u1 , u2 ] (4.85) = J (y, u) (y1 , u1 ), (y2 , u2 ) + Dy J(y, u)G (u)[u1 , u2 ]. Zur Vereinfachung dieser Ausdr¨ ucke setzen wir wieder z := G (u)[u1 , u2 ], yi := G (u)ui . Der dabei entstehende Ausdruck Dy J(y, u) z = ϕy x, y(x) z(x) dx Ω
kann durch Einf¨ uhrung des adjungierten Zustands p wie folgt umgeformt werden: Dieser ist definiert durch −Δp + dy (·, y) p = ϕy (·, y) (4.86) ∂ν p = 0.
4.10 Optimalit¨ atsbedingungen zweiter Ordnung
193
Die Funktion z l¨ ost nach Satz 4.24 das System (4.82), dessen rechte Seite als Steuerung“ ” u ˜ = −dyy (·, y) y1 y2 aufgefasst werden kann. Mit passender Wahl der Gr¨oßen, insbesondere aΩ = ϕy , βΩ = 1, v = u ˜, folgt aus Lemma 2.31 auf S. 59 pu ˜ dx = − p dyy (x, y) y1 y2 dx. (4.87) Dy J(y, u) z = Ω
Ω
Einsetzen in (4.85) liefert schließlich f (u)[u1 , u2 ] = J (y, u) (y1 , u1 ), (y2 , u2 ) −
Ω
p dyy (x, y) y1 y2 dx.
(4.88)
Durch die Lagrangefunktion kann dieser Ausdruck weiter vereinfacht werden. Definition. Die Lagrangefunktion zur Aufgabe (4.31)–(4.33) auf S. 165 ist ϕ(x, y) + ψ(x, u) − (d(x, y) − u) p dx − ∇y · ∇p dx. L(y, u, p) = Ω
Ω
Die Schreibweise f¨ ur die zweite Ableitung von L nach (y, u) vereinfachen wir durch 2 L(y, u, p)[(y1 , u1 ), (y2 , u2 )]. L (y, u, p)[(y1 , u1 ), (y2 , u2 )] := D(y,u)
Das Inkrement (yi , ui ) zeigt an, dass die Ableitung nach (y, u) gemeint ist. Aus (4.88) folgt f (u)[u1 , u2 ] = ϕyy (x, y) y1 y2 − p dyy (x, y) y1 y2 + ψuu (x, u) u1 u2 dx (4.89) Ω = L (y, u, p) (y1 , u1 ), (y2 , u2 ) . Die Lagrangefunktion stellt also wieder ein gutes Hilfsmittel zur Berechnung von Ableitungen nach u dar. Wir haben folgende Aussage bewiesen: Satz 4.25 Unter Voraussetzung 4.14 ist das reduzierte Funktional f : L∞ (Ω) → IR, f (u) = J(y, u) = J G(u), u , zweimal stetig Fr´echet-differenzierbar. Die zweite Ableitung von f kann durch f (u)[u1 , u2 ] = L (y, u, p) (y1 , u1 ), (y2 , u2 ) ausgedr¨ uckt werden. Dabei ist y der zu u geh¨orige Zustand, p der zugeordnete adjungierte Zustand und yi = G (u) ui , i = 1, 2, sind die L¨osungen der linearisierten Gleichung −Δyi + dy (x, y) yi ∂ν yi
= ui = 0.
Ein Hilfssatz. Die Zwei-Norm-Diskrepanz erfordert etwas technische Absch¨atzungen: Lemma 4.26 Unter Voraussetzungen 4.14 existiert zum Funktional f : L∞ (Ω) → IR, f (u) = J(y, u) = J G(u), u , f¨ ur alle M > 0 eine von u, h, u1 , u2 unabh¨angige Konstante L(M ), so dass |f (u + h)[u1 , u2 ] − f (u)[u1 , u2 ]| ≤ L(M ) hL∞ (Ω) u1 L2 (Ω) u2 L2 (Ω) f¨ ur alle u, h, u1 , u2 ∈ L∞ (Ω) mit max uL∞ (Ω) , hL∞ (Ω) ≤ M gilt.
(4.90)
194
4 Steuerung semilinearer elliptischer Gleichungen
Beweis: (i) Umformung mit Hilfe der Lagrangefunktion Wir definieren y = G(u), yh = G(u + h), bezeichnen die zugeh¨origen adjungierten Zust¨ ande entsprechend mit p, ph und setzen yi = G (u) ui sowie yi,h = G (u + h) ui , i = 1, 2. Die Existenz von f (u) haben wir in Satz 4.25 gekl¨art. Mit (4.89) ergibt sich f (u + h)[u1 , u2 ] − f (u)[u1 , u2 ] = = L (yh , u + h, ph ) (y1,h , u1 ), (y2,h , u2 ) − L (y, u, p) (y1 , u1 ), (y2 , u2 ) ϕyy (x, yh ) y1,h y2,h − ϕyy (x, y) y1 y2 dx − ph dyy (x, yh ) y1,h y2,h dx = Ω Ω ψuu (x, u + h) − ψuu (x, u) u1 u2 dx. p dyy (x, y) y1 y2 dx + + Ω
(4.91)
Ω
(ii) Absch¨atzung von yi,h − yi und ph − p ¯ Somit Der Operator G ist nach Satz 4.16 auf S. 169 Lipschitz-stetig von L∞ (Ω) in C(Ω). gilt yh − yC(Ω) (4.92) ¯ ≤ CL hL∞ (Ω) und deshalb auch mit einer von M abh¨ angigen Konstanten c(M ) dy (x, yh ) − dy (x, y)L∞ (Ω) ≤ c(M ) hL∞ (Ω) .
(4.93)
Im Weiteren bezeichnet c wieder eine generische Konstante. Die Ableitungen yi bzw. yi,h l¨ osen die elliptischen Gleichungen −Δyi + dy (x, y) yi −Δyi,h + dy (x, yh ) yi,h
= ui = ui
(4.94)
mit Neumannscher Randbedingung. Wegen Monotonie von d existiert ein von h unabh¨ angiges c mit yi H 1 (Ω) ≤ c ui L2 (Ω) ,
yi,h H 1 (Ω) ≤ c ui L2 (Ω) ,
ullt vgl. Satz 4.7 auf S. 153. Die Differenz yi,h − yi erf¨ −Δ (yi,h − yi ) + dy (x, y) (yi,h − yi ) = − dy (x, yh ) − dy (x, y) yi,h .
(4.95)
(4.96)
Die L2 -Norm der rechten Seite kann mit (4.93), (4.95) abgesch¨atzt werden, (dy (x, yh ) − dy (x, y)) yi,h L2 (Ω) ≤ c hL∞ (Ω) ui L2 (Ω) .
(4.97)
Mit den L¨ osungseigenschaften der linearen Gleichung (4.96) folgt unter Beachtung von dy (x, y) ≥ λd > 0 auf Ed yi − yi,h H 1 (Ω) ≤ c hL∞ (Ω) ui L2 (Ω) .
(4.98)
Die Differenz der adjungierten Zust¨ ande gen¨ ugt der Gleichung −Δ (ph − p) + dy (x, y) (ph − p) = ϕy (·, yh ) − ϕy (·, y) + dy (x, y) − dy (x, yh ) ph . ¯ ur Wegen (4.92) ist die C(Ω)-Norm von y, yh gleichm¨aßig beschr¨ankt und das trifft auch f¨ die adjungierten Zust¨ ande ph zu, denn die Beschr¨anktheit von yh u ¨bertr¨agt sich auf die
4.10 Optimalit¨ atsbedingungen zweiter Ordnung
195
rechten Seiten ϕy (·, yh ) der adjungierten Gleichung (4.86). Die rechten Seiten der letzten Gleichung k¨ onnen deshalb wie folgt abgesch¨ atzt werden: ϕy (·, yh ) − ϕy (·, y)L∞ (Ω) + dy (x, y) − dy (x, yh )L∞ (Ω) ph L∞ (Ω) ≤ ≤ c yh − yL∞ (Ω) ≤ c hL∞ (Ω) . Aus der Differenz der adjungierten Gleichungen f¨ ur p und ph erhalten wir schließlich ph − pL∞ (Ω) ≤ c hL∞ (Ω) .
(4.99)
(iii) Nachweis der Behauptung Die Ausdr¨ ucke in (4.91) k¨ onnen jetzt abgesch¨ atzt werden. Beispielsweise folgt ϕyy (·, yh ) y1,h y2,h − ϕyy (·, y) y1 y2 L1 (Ω) ≤ ≤ (ϕyy (·, yh ) − ϕyy (·, y)) y1 y2 L1 (Ω) + ϕyy (·, yh ) (y1,h y2,h − y1 y2 )L1 (Ω) ≤ ϕyy (·, yh ) − ϕyy (·, y)L∞ (Ω) y1 L2 (Ω) y2 L2 (Ω) +ϕyy (·, yh )L∞ (Ω) y1,h (y2,h − y2 )L1 (Ω) + (y1,h − y1 ) y2 L1 (Ω) ≤ c hL∞ (Ω) u1 L2 (Ω) u2 L2 (Ω) + c y1,h L2 (Ω) y2,h − y2 L2 (Ω) +c y2 L2 (Ω) y1,h − y1 L2 (Ω) ≤ c hL∞ (Ω) u1 L2 (Ω) u2 L2 (Ω) . Analog sch¨ atzt man die anderen Integrale in (4.91) ab, um (4.90) zu erhalten. Optimalit¨ atsbedingungen zweiter Ordnung Notwendige Bedingungen zweiter Ordnung. Zur Herleitung der notwendigen Bedingungen folgen wir [52]. Das Minimumprinzip (4.49) auf S. 173 liefert f¨ ur die L¨osung der Aufgabe (4.31)–(4.33) auf S. 165 die Darstellung ¯(x) > 0 ua (x), falls p(x) + ψu x, u u ¯(x) = ub (x), falls p(x) + ψu x, u ¯(x) < 0. Damit ist u ¯ auf der Menge aller x mit |p(x) + ψu x, u ¯(x) | > 0 festgelegt. Nur auf ihrem Komplement ist es sinnvoll, Bedingungen h¨ oherer Ordnung einzusetzen. Es sei A0 (¯ u) = x ∈ Ω : p(x) + ψu x, u ¯(x) > 0 . (4.100) ¯(x) nichtpositiv, falls u¯(x) = ub (x) gilt und nichtF¨ ur beliebiges u ∈ Uad ist u(x) − u negativ, wenn u ¯(x) = ua (x) erf¨ ullt ist. Diese Vorbetrachtungen motivieren die folgende Definition (Kritischer Kegel). Die Menge C0 (¯ u) besteht aus allen h ∈ L∞ (Ω) mit den Eigenschaften ⎧ ⎪ u) ⎨ = 0, falls x ∈ A0 (¯ ≥ 0, falls x ∈ / A0 (¯ u) und u ¯(x) = ua (x) h(x) ⎪ ⎩ ≤ 0, falls x ∈ / A0 (¯ u) und u ¯(x) = ub (x). Damit ist h beliebig w¨ ahlbar auf der inaktiven Menge {x ∈ Ω : ua (x) < u ¯(x) < ub (x)}.
196
4 Steuerung semilinearer elliptischer Gleichungen
Satz 4.27 Es sei u ¯ eine lokal optimale Steuerung f¨ ur die Aufgabe (4.31)–(4.33) auf S. 165 und Voraussetzung 4.14 auf S. 164 erf¨ ullt. Dann gilt f¨ ur alle h ∈ C0 (¯ u) u) h2 ≥ 0. f (¯
(4.101)
Beweis. Es sei ein beliebiges h ∈ C0 (¯ u) gegeben. F¨ ur hinreichend kleines t > 0 braucht deshalb f¨ ur n ∈ IN die Menge die Funktion u ¯ + t h nicht in Uad zu liegen. Wir definieren In = x ∈ Ω : ua (x) + 1/n ≤ u ¯(x) ≤ ub (x) − 1/n und betrachten hn := χn h mit ¯(x) ∈ {ua (x), ub (x)} und ub (x) − ua (x) ≥ 1/n 1, falls x ∈ In oder u χn (x) = 0, falls u ¯(x) ∈ ua (x), ua (x) + 1/n ∪ ub (x) − 1/n, ub (x) . ¯(x) ∈ {ua (x), ub (x) und ub (x) − ua (x) < 1/n Damit verschwindet χn (x) auch, falls u gilt. Die Funktion u = u ¯ + t hn geh¨ ort zu Uad f¨ ur alle hinreichend kleinen t > 0 und deshalb gilt 0 ≤ J(y, u) − J(¯ y, u ¯) = f (u) − f (¯ u) = f (¯ u) t hn +
1 f (¯ u) t2 h2n + r2f (¯ u, thn ) 2
mit dem Restglied zweiter Ordnung r2f von f . Wegen der Minimumbedingung (4.49) auf S. 173 verschwindet h und damit auch hn fast u ¯) ungleich null ¨ berall dort, wo p + ψu (·, u ist. Deshalb ergibt sich f (¯ u) hn = (p + ψu (·, u ¯) , hn ) = 0 und wir erhalten nach Division durch t2 1 0 ≤ f (¯ u) h2n + t−2 r2f (¯ u, thn ). (4.102) 2 u) h2n ≥ 0. F¨ ur n → ∞ konvergiert hn (x) fast Nach Grenz¨ ubergang t ↓ 0 folgt f (¯ u ¨ ber die majorisierte ¨berall gegen h(x) und wir haben hn (x)2 ≤ h(x)2 . Nach dem Satz u Konvergenz folgt daraus hn → h in L2 (Ω). Wegen Stetigkeit der quadratischen Form f (¯ u) h2 in L2 (Ω) ergibt sich die zu beweisende Aussage mit (4.102) f¨ ur n → ∞. Die Bedingung zweiter Ordnung (4.101) wurde unter Verwendung von f aufgeschrieben, also mit einer nicht explizit verf¨ ugbaren Funktion. Aus Satz 4.25 erhalten wir folgende in der Optimierungstheorie gebr¨ auchlichere Form: Lemma 4.28 Die notwendige Bedingung zweiter Ordnung (4.101) ist ¨ aquivalent zu L (¯ y, u ¯, p)(y, h)2 ≥ 0 u) und die zugeh¨orige L¨osung y = y(h) ∈ H 1 (Ω) der linearisierten f¨ ur alle h ∈ C0 (¯ Gleichung −Δy + dy (x, y¯) y = h ∂ν y = 0. Hinreichende Bedingungen zweiter Ordnung. Zur Formulierung der hinreichenden Bedingungen f¨ uhren wir zun¨ achst folgenden Kegel ein: C(¯ u) = u ∈ L∞ (Ω) : u(x) ≥ 0, falls u ¯(x) = ua (x), u(x) ≤ 0, falls u ¯(x) = ub (x) . (4.103) Eine hinreichende Bedingung zweiter Ordnung ist zum Beispiel die folgende Forderung: Es existiere ein δ > 0 mit f (¯ u) u2 ≥ δ u2L2 (Ω)
∀u ∈ C(¯ u).
(4.104)
4.10 Optimalit¨ atsbedingungen zweiter Ordnung
197
Nach (4.89) auf S. 193 ist sie a ¨quivalent zu ϕyy (x, y¯) − p dyy (x, y¯) y 2 + ψuu (x, u ¯) u2 dx ≥ δ u2L2 (Ω) Ω
f¨ ur alle u ∈ C(¯ u) und y ∈ H 1 (Ω) mit
−Δy + dy (x, y¯) y ∂ν y
= =
u 0.
⎫ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎬ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎭
(4.105)
Bemerkung. Die oben eingef¨uhrte hinreichende Bedingung ist eine zu starke Forderung. Der u), zu groß. Durch Ber¨ ucksichtigung stark aktiver RestriktioKegel C(¯ u) ist, verglichen mit C0 (¯ u) weitgehend geschlossen werden, siehe Abschnitt nen kann die L¨ ucke zwischen C(¯ u) und C0 (¯ 4.10.5. Die obige Form wird dennoch oft verwendet, insbesondere als g¨ angige Voraussetzung in der Konvergenzanalysis numerischer Verfahren. Erf¨ ullt das Paar (¯ y, u ¯) die notwendigen Bedingungen erster Ordnung und die hinreichende Bedingung zweiter Ordnung (4.105), dann ist u¯ eine lokal optimale Steuerung im Sinne von L∞ (Ω), wie der folgende Satz zeigt: Satz 4.29 Die Voraussetzung 4.14 auf S. 164 sei erf¨ ullt und die Steuerung u ¯ ∈ Uad gen¨ uge gemeinsam mit dem zugeh¨origen Zustand y¯ = G(¯ u) und dem adjungierten Zustand p der notwendigen Optimalit¨atsbedingung erster Ordnung aus Satz 4.20 auf S. 173. Erf¨ ullt das Paar (¯ y, u ¯) zus¨atzlich die hinreichende Bedingung zweiter Ordnung (4.105), dann existieren Konstanten ε > 0 und σ > 0, so dass die quadratische Wachstumsbedingung J(y, u) ≥ J(¯ y, u ¯) + σu − u ¯2L2 (Ω) f¨ ur alle u ∈ Uad mit u − u ¯L∞ (Ω) ≤ ε und die zugeh¨origen Zust¨ande y = G(u) gilt. Folglich ist u ¯ lokal optimale Steuerung im Sinne von L∞ (Ω). Beweis: Der Beweis ist fast identisch mit dem f¨ ur das Cosinus-Beispiel. Daher k¨ urzen wir die Argumentation ab. Wir erhalten J(y, u) = f (u) = f (¯ u) + f (¯ u)(u − u ¯) +
1 ¯ + θ(u − u ¯) (u − u ¯ )2 f u 2
mit θ ∈ (0, 1). Der Term erster Ordnung ist wegen der notwendigen Bedingung erster Ordnung nichtnegativ, denn f (¯ p + ψu (·, u ¯) (u − u ¯) dx ≥ 0 u)(u − u ¯) = Ω
folgt aus der Variationsungleichung von Satz 4.20, vgl. auch Formel (4.44). Die Differenz u−u ¯ geh¨ ort dem Kegel C(¯ u) an. Den Term zweiter Ordnung sch¨atzen wir nach unten ab, f u ¯ + θ(u − u ¯) (u − u ¯)2 = f (¯ ¯ + θ (u − u ¯) − f (¯ u) (u − u ¯)2 + f u u) (u − u ¯ )2 ≥ δ u − u ¯2L2 (Ω) − L u − u ¯L∞ (Ω) u − u ¯2L2 (Ω) δ ≥ u − u ¯2L2 (Ω) , 2
198
4 Steuerung semilinearer elliptischer Gleichungen
wenn u − u ¯L∞ (Ω) ≤ ε hinreichend klein ist. Dabei wurde (4.104) sowie die Absch¨atzung (4.90) auf S. 193 verwendet und ausgenutzt, dass alle u ∈ Uad durch eine gemeinsame Konstante M in L∞ (Ω) beschr¨ ankt sind. Insgesamt folgt daraus J(y, u) ≥ f (¯ u) +
δ u − u ¯2L2 (Ω) = J(¯ y, u ¯) + σ u − u ¯2L2 (Ω) 4
mit σ = δ/4, falls u − u ¯L∞ (Ω) ≤ ε gilt und ε gen¨ ugend klein ist. Analog zu Lemma 4.28 schreibt man (4.105) in folgender gebr¨auchlicheren Form auf: Lemma 4.30 Die hinreichende Bedingung zweiter Ordnung (4.105) ist ¨aquivalent zu L (¯ y, u ¯, p)(y, u)2 ≥ δ u2L2 (Ω) f¨ ur alle u ∈ C(¯ u) und alle y ∈ H 1 (Ω) mit −Δy + dy (x, y¯) y ∂ν y
= u = 0.
4.10.4 Randsteuerung Zur Erl¨ auterung der hinreichenden Optimalit¨atsbedingungen zweiter Ordnung betrachten wir exemplarisch das Randsteuerungsproblem (4.50)–(4.52), min J(y, u) := ϕ x, y(x) dx + ψ x, u(x) ds(x) Ω
Γ
bei den Nebenbedingungen −Δy = ∂ν y + b(x, y) =
0 u
in Ω auf Γ
sowie ua (x) ≤ u(x) ≤ ub (x) f.¨ u. auf Γ. Dazu verwenden wir die Lagrangefunktion ϕ(x, y) − ∇y · ∇p dx + ψ(x, u) − (b(x, y) − u) p ds. L(y, u, p) = Ω
Γ
Die hinreichende Bedingung zweiter Ordnung fordert die Existenz eines δ > 0, so dass ⎫ L (¯ y, u ¯, p)(y, u)2 ≥ δ u2L2 (Γ) ⎪ ⎪ ⎪ ⎪ ⎬ 1 f¨ ur alle u ∈ C(¯ u) und alle y ∈ H (Ω) mit (4.106) ⎪ ⎪ −Δy = 0 ⎪ ⎪ ⎭ ∂ν y + by (x, y¯) y = u erf¨ ullt ist. Der Kegel C(¯ u) wird analog zu (4.103) definiert, es ist nur Ω durch Γ zu ersetzen. Als expliziten Ausdruck f¨ ur L erhalten wir y, u ¯, p)(y, u)2 = ϕyy (x, y¯) y 2 dx − byy (x, y¯) p y 2 ds + ψuu (x, u ¯) u2 ds. L (¯ Ω
Γ
Γ
4.10 Optimalit¨ atsbedingungen zweiter Ordnung
199
Satz 4.31 Die Steuerung u ¯ ∈ Uad gen¨ uge gemeinsam mit dem zugeh¨origen Zustand y¯ = G(¯ u) und dem adjungierten Zustand p der notwendigen Optimalit¨atsbedingung erster Ordnung aus Satz 4.21 von S. 175. Erf¨ ullt das Paar (¯ y, u ¯) zus¨atzlich die hinreichende Bedingung zweiter Ordnung (4.106), dann existieren unter Voraussetzung 4.14 Konstanten ε > 0 und σ > 0, so dass die quadratische Wachstumsbedingung J(y, u) ≥ J(¯ y, u ¯) + σ u − u ¯2L2 (Γ) f¨ ur alle u ∈ Uad mit u − u ¯L∞ (Γ) ≤ ε und die zugeh¨origen Zust¨ande y = G(u) gilt. Folglich ist u ¯ eine lokal optimale Steuerung im Sinne von L∞ (Γ). Der Beweis verl¨ auft v¨ ollig analog zum Fall der verteilten Steuerung.
4.10.5 Ber¨ ucksichtigung stark aktiver Restriktionen * In den bisher bewiesenen S¨ atzen ist die L¨ ucke zwischen notwendiger bzw. hinreichender Bedingung zweiter Ordnung zu groß: Die Nichtnegativit¨at von L wird bei der notwendigen Bedingung auf dem kritischen Kegel C0 (¯ u) gefordert. Dieser ist in der Regel kleiner als der Kegel C(¯ u) in der hinreichenden Optimalit¨atsbedingung zweiter Ordnung. In C0 (¯ u) verschwinden die Steuerungen auf der stark aktiven Menge, w¨ahrend sie in C(¯ u) nur vorzeichenbeschr¨ ankt sind. Die hinreichende Bedingung zweiter Ordnung ist damit eine eigentlich zu starke Forderung. Durch Einbeziehung stark aktiver Restriktionen kann diese L¨ ucke weitgehend geschlossen werden. Dazu betrachtet man zus¨atzlich hinreichende Bedingungen erster Ordnung. Beispiel. Die konkave Funktion f : IR → IR, f (u) = −u2 , hat in der Menge Uad = [−1, 1] zwei verschiedene Minima, n¨ amlich bei u1 = −1 und u2 = 1. An beiden Stellen gilt die notwendige Bedingung erster Ordnung f (ui )(u − ui ) ≥ 0
∀u ∈ [−1, 1]
und wir haben |f (ui )| = 2 > 0, siehe nebenstehende Abbildung. Bedingungen zweiter Ordnung der bisher verwendeten Form sind hier nicht erf¨ ullbar, weil f konkav ist. Sie sind auch nicht n¨ otig, denn die ui gen¨ ugen den hinreichenden Optimalit¨atsbedingungen 1. Ordnung |f (ui )| = 0.
Hinreichende Bedingungen 1. Ordnung
Daraus folgt schon lokale Optimalit¨ at, denn wir haben an der Stelle u1 f¨ ur alle h ∈ (0, 2) f (−1 + h) = f (−1) + f (−1) h + r(h) = f (−1) + 2h − h2 > −1 = f (−1). Hier liegt nat¨ urlich sogar globale Optimalit¨ at vor.
Analoge Konstruktionen wendet man im Funktionenraum zur Abschw¨achung hinreichender Optimalit¨ atsbedingungen zweiter Ordnung an.
200
4 Steuerung semilinearer elliptischer Gleichungen
Ein vereinfachtes Beispiel im Funktionenraum Wir diskutieren die Aufgabe min f (u) =
u∈Uad
ϕ x, u(x) dx
Ω
u. in Ω , wobei ϕ Voraussetzung mit Uad = u ∈ L∞ (Ω) : ua (x) ≤ u(x) ≤ ub (x) f.¨ 4.14 auf S. 164 erf¨ ullen soll. Die Funktion u¯ ∈ Uad gen¨ uge den notwendigen Bedingungen erster Ordnung ¯(x) u(x) − u ¯(x) dx ≥ 0 ∀ u ∈ Uad . ϕu x, u Ω
Dann m¨ ussen fast u ullt sein: ¨ berall in Ω folgende Beziehungen erf¨ ≥ 0, falls u ¯(x) = ua (x) ϕu x, u ¯(x) ≤ 0, falls u ¯(x) = ub (x). Definition. F¨ ur beliebig aber fest vorgegebenes τ ≥ 0 sei Aτ (¯ u) = x ∈ Ω : |ϕu (x, u ¯(x))| > τ . Diese Menge heißt Menge der stark aktiven Restriktionen oder kurz stark aktive Menge. F¨ ur τ = 0 erhalten wir die in (4.100) definierte Menge A0 (¯ u) als Spezialfall. Die obige Definition geht auf Dontchev et al. [62] zur¨ uck. In der Beispielaufgabe fordern wir die folgende hinreichende Optimalit¨ atsbedingung zweiter Ordnung: Es sollen δ > 0, τ > 0 existieren, so dass f (¯ u) h2 ≥ δ h2L2 (Ω) f¨ ur alle h ∈ L∞ (Ω) mit folgenden zus¨ atzlichen Eigenschaften gilt: ⎧ ⎨ = 0, falls x ∈ Aτ ≥ 0, falls x ∈ / Aτ und u ¯(x) = ua (x) h(x) ⎩ ≤ 0, falls x ∈ / Aτ und u ¯(x) = ub (x). ¯(x) ≥ δ auf Ω \ Aτ sowie |ϕu x, u ¯(x) | > τ auf Aτ und Wir verlangen damit ϕuu x, u die positive Definitheit von f (¯ u) wird nur f¨ ur eine Teilmenge von C(¯ u) aus (4.103) auf S. 196 vorausgesetzt. Diese Forderung ist zusammen mit der notwendigen Bedingung erster Ordnung hinreichend f¨ ur lokale Optimalit¨at von u ¯. Das sieht man wie folgt ein: Ist u ∈ Uad hinreichend nahe an u¯ gegeben, d.h. u − u ¯L∞ (Ω) ≤ ε, dann ergibt eine Taylor-Entwicklung f (¯ u + h) − f (¯ u) = f (¯ u) h +
1 1 f (¯ f (¯ u) h2 + u + θ h) − f (¯ u) h2 2 2
mit h = u − u ¯ und θ ∈ (0, 1). Wir spalten h durch h = h1 + h2 auf, wobei h2 (x) = 0 auf Aτ und h1 (x) = 0 auf Ω \ Aτ festgesetzt wird. Die Funktion h1 nutzt die hinreichenden Bedingungen erster Ordnung aus, w¨ ahrend bei h2 die positive Definitheit von f greift.
4.10 Optimalit¨ atsbedingungen zweiter Ordnung
201
Offenbar gilt h1 (x) ≥ 0 f¨ ur alle x mit u ¯(x) = ua und h1 (x) ≤ 0 f¨ ur alle x mit u ¯(x) = ub . Mit einem Restglied r(u, h) zweiter Ordnung erhalten wir 1 f (¯ u + h) − f (¯ u) = ϕu x, u ¯(x) h(x) dx + ¯(x) h2 (x) dx + r(u, h). ϕuu x, u 2 Ω Ω ¯(x) h(x) urzungen Weil ϕu x, u ¨ berall auf Ω erf¨ ≥ 0 fast u ullt sein muss, folgt mit den Abk¨ ¯(x) , ϕuu (x) := ϕuu x, u ¯(x) unter Beachtung von h1 (x)h2 (x) = 0 ϕu (x) := ϕu x, u f (¯ u + h) − f (¯ u) ≥ 2 1 ϕu (x) h1 (x) dx + ϕuu (x) h1 (x) + h2 (x) dx + r(u, h) ≥ 2 Ω Aτ 1 1 |ϕu (x) h1 (x)| + ϕuu (x) h1 (x)2 dx + ϕuu (x) h2 (x)2 dx + r(u, h) = 2 2 Ω\Aτ A τ δ 1 τ |h1 (x)| − ϕuu L∞ (Ω) |h1 (x)|2 dx + h2 (x)2 dx + r(u, h). ≥ 2 2 Aτ Ω\Aτ F¨ ur hinreichend kleines ε > 0 gilt fast u ¨ berall ϕuu L∞ (Ω) |h1 (x)| ≤ ϕuu L∞ (Ω) ε ≤ τ und f¨ ur ε ≤ 1 außerdem |h1 (x)| ≥ h1 (x)2 . Unter Beachtung beider Ungleichungen folgt mit hinreichend kleinem ε > 0 δ τ |h1 (x)| dx + h2 (x)2 dx + r(u, h) f (¯ u + h) − f (¯ u) ≥ 2 Ω 2 Ω τ δ h1 (x)2 + h2 (x)2 dx + r(u, h) ≥ min , 2 2 Ω 1 = h2 (x) dx + r(u, h) min(τ, δ) 2 Ω ! |r(u, h)| 1 2 min(τ, δ) − , ≥ hL2 (Ω) 2 h2L2 (Ω) Wegen der wie in (4.81) auf S.189 erf¨ ullten Eigenschaft |r(u, h)| →0 h2L2 (Ω)
f¨ ur hL∞ (Ω) → 0
erhalten wir schließlich f (¯ u + h) − f (¯ u) ≥ σ h2L2 (Ω) mit σ = 41 min(τ, δ), falls ε > 0 hinreichend klein ist und ¯ u − uL∞ (Ω) ≤ ε. Das ist die lokale Optimalit¨ at von u ¯. Stark aktive Restriktionen bei elliptischen Optimalsteuerungsproblemen Es liegt auf der Hand, dass sich diese Methode auch zur Abschw¨achung hinreichender Optimalit¨ atsbedingungen bei Problemen mit partiellen Differentialgleichungen eignet. Das ist f¨ ur elliptische Aufgaben mit Restriktionen an die Steuerung in [54] ausgef¨ uhrt, bei Vorgabe zus¨ atzlicher Nebenbedingungen in Integralform in [47] und f¨ ur punktweise Beschr¨ ankungen an den Zustand in [51].
202
4 Steuerung semilinearer elliptischer Gleichungen
Wir erl¨ autern die Ber¨ ucksichtigung stark aktiver Restriktionen f¨ ur die Aufgabe der verteilten Steuerung (4.31)–(4.33), min J(y, u) := ϕ x, y(x) dx + ψ x, u(x) dx Ω
Ω
bei −Δy + d(x, y) = ∂ν y =
u 0
in Ω auf Γ
sowie ua (x) ≤ u(x) ≤ ub (x)
f.¨ u. in Ω. Wir nehmen an, dass eine Steuerung u ¯ ∈ Uad mit zugeh¨origem Zustand y¯ gegeben ist, welche die notwendigen Optimalit¨ atsbedingungen erster Ordnung erf¨ ullt, d.h. p(x) + ψu (x, u ¯(x) u(x) − u ¯(x) dx ≥ 0 ∀ u ∈ Uad . (4.107) Ω
Wir definieren f¨ ur festes τ ≥ 0 die stark aktive Menge Aτ (¯ ¯(x) > τ u) = x ∈ Ω : p(x) + ψu x, u u) = u ∈ L∞ (Ω) : u erf¨ ullt (4.108) , und den τ -kritischen Kegel Cτ (¯ ⎧ u) ⎨ = 0, falls x ∈ Aτ (¯ ≥ 0, falls x ∈ / Aτ (¯ u) und u ¯(x) = ua u(x) ⎩ ≤ 0, falls x ∈ / Aτ (¯ u) und u ¯(x) = ub . Als hinreichende Bedingung zweiter Ordnung fordern wir ⎫ ϕyy (x, y¯) − p dyy (x, y¯) y 2 + ψuu (x, u ¯) u2 dx ≥ δ u2L2 (Ω) ⎪ ⎪ ⎪ ⎪ Ω ⎪ ⎬ 1 f¨ ur alle u ∈ Cτ (¯ u) und y ∈ H (Ω) mit ⎪ ⎪ ⎪ −Δy + dy (x, y¯) y = u ⎪ ⎪ ⎭ ∂ν y = 0.
(4.108)
(4.109)
Satz 4.32 Die Voraussetzung 4.14 sei erf¨ ullt und die Steuerung u ¯ ∈ Uad gen¨ uge gemeinsam mit dem zugeh¨origen Zustand y¯ und dem adjungierten Zustand p der notwendigen Optimalit¨atsbedingung erster Ordnung aus Satz 4.20 auf S. 173. Erf¨ ullt das Paar (¯ y, u ¯) f¨ ur ein τ > 0 zus¨atzlich die hinreichende Bedingung zweiter Ordnung (4.109), dann existieren Konstanten ε > 0 und σ > 0, so dass die quadratische Wachstumsbedingung J(y, u) ≥ J(¯ y, u ¯) + σu − u ¯2L2 (Ω) f¨ ur alle u ∈ Uad mit u − u ¯L∞ (Ω) ≤ ε und die zugeh¨origen y = G(u) gilt. Folglich ist u ¯ eine lokal optimale Steuerung im Sinne von L∞ (Ω). Die Aussage ist in [54] bewiesen, kann aber auch wie Satz 5.17 auf S. 231 zu parabolischen Problemen gezeigt werden. Deshalb verzichten wir hier auf den Beweis. Die Problematik der L¨ ucke zwischen notwendigen bzw. hinreichenden Bedingungen zweiter Ordnung wird auch im Buch von Bonnans und Shapiro [34] behandelt, wo auch vielf¨ altige weitere Resultate zur Verwendung von Ableitungen zweiter Ordnung in der Optimierung zu finden sind. Außerdem verweisen wir auf Casas und Mateos [47] sowie [53] und [51] im Zusammenhang mit Zustandsbeschr¨ankungen.
4.10 Optimalit¨ atsbedingungen zweiter Ordnung
203
4.10.6 F¨ alle ohne Zwei-Norm-Diskrepanz Bei der Herleitung hinreichender Optimalit¨ atsbedingungen zweiter Ordnung haben wir bis jetzt zwei verschiedene Normen benutzt – die L∞ -Norm zur Differentiation und ur die Bedingung der positiven Definitheit von f (¯ u). Das ist nicht imdie L2 -Norm f¨ mer n¨ otig. Wenn die Steuerung in der Gleichung nur linear vorkommt, die Steuerungs¯ ist und das Zielfunktional in Bezug auf Zustands-Abbildung G stetig von L2 nach C(Ω) die Steuerung u in einem noch zu pr¨ azisierenden Sinne linear-quadratisch, dann spielt die Zwei-Norm-Diskrepanz keine Rolle. Ein entsprechendes Beispiel haben wir auf S. 185 behandelt. In folgenden F¨ allen kann man ausschließlich mit der L2 -Norm arbeiten: Verteilte Steuerung. Ist Ω ein beschr¨ anktes Lipschitzgebiet der Dimension N ≤ 3 und die Voraussetzung 4.14 erf¨ ullt, dann ist die Abbildung G : u → y f¨ ur die Aufgabe ¯ der verteilten Steuerung (4.31)–(4.33) auf S. 165 Lipschitz-stetig von L2 (Ω) nach C(Ω), vgl. Satz 4.16 auf S. 169. Deshalb bleibt Satz 4.24 u ultig, wenn man ¨ ber G auf S. 190 g¨ L∞ (Ω) durch L2 (Ω) ersetzt – im Beweis ist einfach L∞ (Ω) durch L2 (Ω) zu ersetzen und alle Schl¨ usse bleiben richtig (vgl. auch die Erl¨auterungen im n¨achsten Abschnitt f¨ ur r := 2). Folglich ist G unter Voraussetzung 4.14 zweimal stetig differenzierbar von L2 (Ω) ¯ in C(Ω). Es bleibt noch die Diskussion des Zielfunktionals. Dazu setzen wir der Einfachheit halber voraus, dass ψ die Gestalt ψ(x, u) = γ1 (x) u + γ2 (x)u2
(4.110)
mit Funktionen γ1 , γ2 ∈ L∞ (Ω) und γ2 ≥ 0 hat. Offenbar ist das Funktional γ1 (x) u(x) + γ2 (x)u(x)2 dx Ω
zweimal stetig Fr´echet-differenzierbar auf L2 (Ω). Bemerkung. Man kann nachweisen, dass eine hinreichende Bedingung zweiter Ordnung nur dann erf¨ ullt sein kann, wenn γ2 (x) ≥ δ > 0 f¨ ur fast alle x ∈ Ω gilt; siehe z.B. [198]. Unter diesen Voraussetzungen kann man in den (strengen) hinreichenden Bedingungen zweiter Ordnung den Raum L∞ (Ω) f¨ ur die Steuerung durch L2 (Ω) ersetzen: Satz 4.33 Gegeben sei die Aufgabe (4.31)–(4.33) der verteilten Steuerung, die Voraussetzung 4.14 auf S. 164 sei erf¨ ullt und die Steuerung u ¯ ∈ Uad ⊂ L2 (Ω) gen¨ uge gemeinsam mit dem zugeh¨origen Zustand y¯ = G(¯ u) und dem adjungierten Zustand p der notwendigen Optimalit¨atsbedingung erster Ordnung aus Satz 4.20 auf S. 173. Es sei N ≤ 3 und die Funktion ψ = ψ(u) habe die Form (4.110). Gen¨ ugt das Paar (¯ y, u ¯) zus¨atzlich der hinreichenden Bedingung zweiter Ordnung (4.104) auf S. 196, dann existieren Konstanten ε > 0 und σ > 0, so dass die quadratische Wachstumsbedingung J(y, u) ≥ J(¯ y, u ¯) + σu − u ¯2L2 (Ω) f¨ ur alle u ∈ Uad mit u − u ¯L2 (Ω) ≤ ε und die zugeh¨origen Zust¨ande y = G(u) gilt. Folglich ist u ¯ lokal optimale Steuerung im Sinne von L2 (Ω). ¨ Randsteuerung. Ahnlich liegen die Dinge bei der Aufgabe der Randsteuerung (4.50)– (4.52) auf S. 174, falls Ω ein beschr¨ anktes zweidimensionales Lipschitzgebiet ist. Hier ist
204
4 Steuerung semilinearer elliptischer Gleichungen
¯ Daher bleibt Satz G : u → y zweimal stetig differenzierbar von L2 (Γ) nach H 1 (Ω)∩C(Ω). 4.33 unter entsprechender Modifikation f¨ ur Ω ⊂ IR2 g¨ ultig. Man erh¨alt lokale Optimalit¨at von u ¯ im Sinne von L2 (Γ).
4.10.7 Lokale Optimalit¨ at in Lr (Ω) Die bisher bewiesenen S¨ atze zur lokalen Optimalit¨at haben bei Vorliegen der Zwei-NormDiskrepanz eine Schwachstelle. Sie sichern die lokale Optimalit¨at von u ¯ nur im Sinne des ¯ Sprungstellen, so m¨ ussen im Sinne der L∞ -Norm Raumes L∞ (Ω) bzw. L∞ (Γ). Hat u benachbarte Funktionen gleiches Sprungverhalten wie u¯ aufweisen um zur L∞ -Umgebung zu geh¨ oren, in der u ¯ den (lokal) kleinsten Zielfunktionswert liefert. Das betrifft zumindest hinreichend kleine Umgebungen. Deshalb w¨ are es von Vorteil, lokale Optimalit¨at von u ¯ in der Lr (Ω)-Norm mit r < ∞ zu zeigen. Dann spielten solche Effekte keine Rolle. Auf diese Problematik wollen wir kurz eingehen, exemplarisch f¨ ur verteilte Steuerung. ¯ Hier wissen wir, dass G f¨ ur alle r > N/2 stetig Fr´echet-differenzierbar von Lr (Ω) in C(Ω)∩ 1 H (Ω) ist. Der im Beweis von Satz 4.24 auf S. 190 eingef¨ uhrte lineare L¨osungsoperator R : u → y zum Randwertproblem −Δy + y ∂ν y
= =
u 0
¯ ∩ H 1 (Ω). Die Gleichung (4.84), ist ebenfalls stetig von Lr (Ω) nach C(Ω) y − R (u − Φ(y)) = F (y, u) = 0 ¯ ∩ H 1 (Ω)) × Lr (Ω) korrekt gestellt. mit Φ(y) = d(·, y) − y ist damit im Raumpaar (C(Ω) 1 r ¯ ¯ Es gilt F : (C(Ω) ∩ H (Ω)) × L (Ω) → C(Ω) und der Satz u ¨ ber implizite Funktionen ist anwendbar. Deshalb ist der L¨ osungsoperator G zweimal stetig differenzierbar von Lr (Ω) ¯ ∩ H 1 (Ω). nach C(Ω) Wir setzen jetzt wie im letzten Teilabschnitt ψ(x, u) = γ1 (x) u + γ2 (x) λu2 voraus. Geht man den Beweis der letzten Aussagen bis zu Satz 4.29 durch, dann wird deutlich, dass hL∞ (Ω) durch hLr (Ω) ersetzt werden kann, ohne die Richtigkeit der Absch¨atzungen zu verletzen. Analog bleibt der Beweis von Lemma 4.26 auf S. 193 richtig, wenn man dort die Norm u − u ¯L∞ (Ω) durch u − u ¯Lr (Ω) ersetzt . Daraus folgt insgesamt eine r L -Version von Satz 4.29: uge gemeinsam mit dem zugeh¨origen Zustand Satz 4.34 Die Steuerung u ¯ ∈ Uad gen¨ y¯ = G(¯ u) und dem adjungierten Zustand p der notwendigen Optimalit¨atsbedingung erster Ordnung aus Satz 4.20 auf S. 173. Die Funktion ψ habe mit γi ∈ L∞ (Ω), i = 1, 2, die Form ψ(x, u) = γ1 (x) u + γ2 (x) λ u2 und es sei r > N/2 gegeben. Sind zus¨atzlich Voraussetzung 4.14 und die (strenge) hinreichende Bedingung zweiter Ordnung (4.105) auf S. 197 erf¨ ullt, dann existieren Konstanten ε > 0 und σ > 0, so dass die quadratische Wachstumsbedingung J(y, u) ≥ J(¯ y, u ¯) + σu − u ¯2L2 (Ω) f¨ ur alle u ∈ Uad mit u − u ¯Lr (Ω) ≤ ε und die zugeh¨origen Zust¨ande y = G(u) gilt. Folglich ist u ¯ lokal optimale Steuerung im Sinne von Lr (Ω).
4.11 Numerische Verfahren
205
Bemerkung. Der Satz kann nicht ohne Weiteres auf Probleme u¨bertragen werden, bei denen die Steuerung nichtlinear in der Differentialgleichung vorkommt oder das Zielfunktional nicht die geforderte quadratische Gestalt bez¨ uglich u hat. In solchen F¨ allen m¨ ussen Zusatzvorausat wurde ohne Ber¨ ucksichtigung stark setzungen getroffen werden, siehe [54]. Die Lr -Optimalit¨ aktiver Restriktionen hergeleitet. Soll dies geschehen, dann wird die Analysis schwieriger, siehe z.B. [199] f¨ ur den Fall von Navier-Stokes-Gleichungen.
4.11 Numerische Verfahren 4.11.1 Gradienten-Projektionsverfahren Im Prinzip unterscheidet sich dieses Verfahren nicht von dem ab S. 134 f¨ ur linear-quadratische parabolische Probleme beschriebenen. Die Nichtlinearit¨at der Gleichung bereitet aber in Schritt 1 eine zus¨ atzliche Schwierigkeit, die das Verfahren wenig attraktiv macht: Ausgehend von der aktuellen Steuerung un ist zur Bestimmung des Zustands yn die semilineare Gleichung (4.51) zu l¨ osen, wozu ein Iterationsverfahren ben¨otigt wird, z.B. das Newtonverfahren. Daher ist es sinnvoller, statt des Gradienten-Projektionsverfahrens ein Verfahren vom Newton-Typ wie das SQP-Verfahren anzuwenden, das im n¨achsten Abschnitt behandelt wird. Aufw¨ andig ist auch die Wahl der Schrittweite, die selbst im Fall ohne Beschr¨ankungen nicht mehr analytisch bestimmt werden kann. Hier muss man sich zufrieden geben, wenn eine Schrittweite sn mit hinreichend großem Abstieg gefunden ist. Dies kann mit dem Halbierungsverfahren oder der Regel von Armijo geschehen, siehe Abschnitt 2.12.2.
4.11.2 Grundidee des SQP-Verfahrens Zur Motivierung des SQP-Verfahrens, dem Verfahren der Sequentiellen Quadratischen Programmierung, diskutieren wir zuerst eine Aufgabe im Raum IRn , min f (u),
u ∈ C,
(4.111)
mit f ∈ C 2 (IRn ) und einer nicht leeren, konvexen und abgeschlossenen Menge C ⊂ IRn . Zu Beginn behandeln wir den Fall ohne Nebenbedingungen, d.h. den Fall C = IRn . Dann lautet die notwendige Optimalit¨ atsbedingung erster Ordnung f¨ ur eine lokale L¨osung u ¯ von (4.111) f (¯ u) = 0. (4.112) Diese Gleichung kann man mit dem Newtonverfahren l¨osen, sofern dessen Konvergenzbedingungen erf¨ ullt sind. Ausgehend von der aktuellen Iterierten un ergibt sich u = un+1 als L¨ osung des linearen Gleichungssystems f (un ) + f (un )(u − un ) = 0.
(4.113)
F¨ ur die eindeutige L¨ osbarkeit dieses System muss die Matrix f (un ) regul¨ar sein, also positiv definit im Fall eines lokalen Minimums. Folglich ist im lokalen Minimum die hinreichende Optimalit¨ atsbedingung zweiter Ordnung die nat¨ urliche Voraussetzung f¨ ur die Konvergenz des Newtonverfahrens gegen eine lokale Minimumstelle.
206
4 Steuerung semilinearer elliptischer Gleichungen
Nun betrachten wir das Newtonverfahren aus anderer Sicht. Die Gleichung (4.113) ist die notwendige Optimalit¨ atsbedingung erster Ordnung f¨ ur die linear-quadratische Optimierungsaufgabe 1 min f (un ) (u − un ) + (u − un ) f (un )(u − un ) . (4.114) 2 Bei positiver Definitheit der Hesse-Matrix f (un ) hat dieses Problem genau eine L¨osung un+1 , denn die Zielfunktion ist dann streng konvex. Es ist gleich, ob wir die quadratische Optimierungsaufgabe (4.114) oder das lineare Gleichungssystem (4.113) l¨osen. Beide sind aquivalent. Das Newtonverfahren zur L¨ osung des nichtlinearen Systems (4.112) kann des¨ halb alternativ durch L¨ osung der Folge von quadratischen Optimierungsaufgaben (4.114) ausgef¨ uhrt werden, als SQP-Verfahren. Das ist der Schl¨ ussel zur Behandlung der Aufgabe mit Nebenbedingungen. An Stelle der Gleichung (4.112) gilt dann die Variationsungleichung f (¯ u) (u − u ¯) ≥ 0
∀u ∈ C.
(4.115)
Eine direkte Anwendung des klassischen Newtonverfahrens ist nicht m¨oglich. Aber wir k¨ onnen die Nebenbedingung u ∈ C problemlos zur Aufgabe (4.114) hinzuf¨ ugen. Wir l¨ osen 1 min f (un ) (u − un ) + (u − un ) f (un )(u − un ) (4.116) u∈C 2 und erhalten so die n¨ achste Iterierte un+1 . Bei positiver Definitheit der Hesse-Matrix f (un ) hat (4.116) genau eine L¨osung. Die L¨ osung der Folge quadratischer Optimierungsaufgaben (4.116) kann als Newtonverfahren zur L¨ osung einer verallgemeinerten Gleichung interpretiert werden und dieses Verfahren ist wie das klassische Newtonverfahren lokal quadratisch konvergent. Hinreichend f¨ ur die lokale Konvergenz gegen u ¯ sind z.B. die positive Definitheit von f (¯ u) und die 2,1 Glattheitsforderung f ∈ C . Wir verweisen auf Alt [7], Robinson [177] und Spellucci [187]. Das Newtonverfahren f¨ ur Gleichungen im Funktionenraum ist bei Deuflhard [60] sowie Kantorowitsch und Akilow [118] dargestellt. F¨ ur die Optimierung relevante Verallgemeinerungen auf Lipschitz-stetige Funktionen werden von Klatte und Kummer [124] behandelt. Direkte Anwendung auf Optimalsteuerungsprobleme Die eben beschriebene Grundidee kann man direkt auf den Fall eines Banachraums U an Stelle von IRn u ¨bertragen, z.B. auf U = L∞ (Γ), C = Uad und das Funktional f (u) = J y(u), u = ϕ x, y(x) dx + ψ x, u(x) ds(x), Ω
Γ
wobei y = y(u) die L¨ osung der elliptischen Randwertaufgabe (4.51) ist, −Δy = 0 ∂ν y + b(x, y) = u
in Ω auf Γ.
4.11 Numerische Verfahren
207
Die Ableitungen f (un ) und f (un ) werden wie in Formel (4.57) auf S. 175 bzw. wie in Satz 4.25 auf S. 193 u ¨ ber die Lagrangefunktion ermittelt. Ausgehend von un ∈ Uad ergibt sich u = un+1 als L¨ osung der quadratischen Optimalsteuerungsaufgabe 1 min f (un )(u − un ) + f (un )(u − un )2 . u∈Uad 2 Allerdings besteht bei der Durchf¨ uhrung dieses SQP“-Verfahrens ein kleiner, aber we” sentlicher Unterschied zu dem aus der Literatur der nichtlinearen Optimierung bekannten SQP-Verfahren, weshalb das Verfahren ebenfalls Newtonverfahren genannt wird: Ist die neue Iterierte un+1 berechnet, dann wird der neue Zustand yn+1 als L¨osung der semilinearen elliptischen Gleichung bestimmt, yn+1 = y(un+1 ) = G(un+1 ). Die Berechnung von yn+1 k¨ onnte wieder mit dem Newtonverfahren erfolgen. Dieser zus¨atzliche Aufwand wird umgangen, indem man an Stelle der Vorschrift yn+1 = G(un+1 ) deren Linearisierung yn+1 = yn + G (un )(un+1 − un ) verwendet und so nur eine lineare Gleichung l¨ ost. Das so aufgebaute SQP-Verfahren wird im n¨ achsten Abschnitt behandelt.
4.11.3 Das SQP-Verfahren f¨ ur elliptische Probleme Wir diskutieren das Verfahren zur Abwechslung f¨ ur die Aufgabe der verteilten Steuerung (4.31)–(4.33), min J(y, u) := ϕ x, y(x) dx + ψ x, u(x) dx Ω
Ω
bei −Δy + d(x, y) = ∂ν y =
u 0
in Ω auf Γ
sowie ua (x) ≤ u(x) ≤ ub (x) f.¨ u. in Ω. Dabei fordern wir Voraussetzung 4.14 und gehen von der Bestimmung einer lokalen Referenzl¨ osung (¯ y, u ¯) aus, welche die hinreichenden Optimalit¨atsbedingungen zweiter Ordnung (4.105) erf¨ ullt. Mit p wird wie bisher der zugeh¨orige adjungierte Zustand bezeichnet. Das Tripel (¯ y, u ¯, p) gen¨ ugt dem Optimalit¨atssystem −Δy + d(x, y) ∂ν y
= u
−Δp + dy (x, y) p = ϕy (x, y)
= 0
∂ν p
Ω
ψu (x, u) + p (v − u) dx ≥ 0
= 0
∀ v ∈ Uad .
Wie bei der Motivierung des SQP-Verfahrens betrachten wir zuerst den Fall ohne Restriktionen an u, also Uad = L∞ (Ω). Dann gilt an Stelle der Variationsungleichung die Gleichung ψu (·, u) + p = 0, also das Optimalit¨ atssystem −Δy + d(x, y) ∂ν y
= u
−Δp + dy (x, y) p = ϕy (x, y)
= 0
∂ν p
ψu (x, u) + p = 0.
= 0
208
4 Steuerung semilinearer elliptischer Gleichungen
Dieses nichtlineare Gleichungssystem f¨ ur (y, u, p) kann mit dem Newtonverfahren gel¨ost werden, siehe Deuflhard [60]. So seien schon (y1 , u1 , p1 ), . . . , (yn , un , pn ) bestimmt worden. Dann berechnen wir die neue Iterierte (yn+1 , un+1 , pn+1 ) als L¨osung des an der Stelle (yn , un , pn ) linearisierten Optimalit¨ atssytems. Dazu lohnt sich eine kleine Nebenrechnung. Linearisierung einer Abbildung F heißt F (y) ≈ F (yn ) + F (yn )(y − yn ). Bei Anwendung auf die erste Gleichung erhalten wir −Δyn − Δ(y − yn ) + d(x, yn ) + dy (x, yn )(y − yn ) − un − (u − un ) = 0, d.h. −Δy + d(x, yn ) + dy (x, yn )(y − yn ) − u = 0. Die linearen Anteile ¨ andern sich also nicht. F¨ ur das Optimalit¨atssystem ergeben sich so zur Bestimmung von (y, u, p) = (yn+1 , un+1 , pn+1 ) die Gleichungen −Δy + d(x, yn ) + dy (x, yn )(y − yn ) ∂ν y −Δp + dy (x, yn ) p + pn dyy (x, yn )(y − yn ) ∂ν p ψu (x, un ) + ψuu (x, un )(u − un ) + p
= u = 0 = ϕy (x, yn )+ +ϕyy (x, yn )(y − yn ) = 0 = 0.
(4.117)
Das ist nichts anderes als das Optimalit¨ atssystem der Aufgabe 1 min ϕy (x, yn ) (y − yn ) + ψu (x, un ) (u − un ) dx − pn dyy (x, yn )(y − yn )2 dx 2 Ω Ω 1 2 2 ϕyy (x, yn )(y − yn ) + ψuu (x, un )(u − un ) dx + 2 Ω bei u ∈ L2 (Ω) und −Δy + d(x, yn ) + dy (x, yn )(y − yn ) ∂ν y
= u = 0.
Diese Aufgabe ist ¨ aquivalent zum linear-quadratischen Problem 1 min J (yn , un )(y − yn , u − un ) + L (yn , un , pn )(y − yn , u − un )2 2 bei −Δy + d(x, yn ) + dy (x, yn )(y − yn ) ∂ν y
= u = 0.
Wir k¨ onnen also an Stelle des Systems (4.117) auch dieses Problem l¨osen. W¨ ahrend (4.117) als Gleichungssystem nicht direkt auf den Fall mit Beschr¨ankungen u ∈ Uad u ur die obige Aufgabe ohne Weiteres m¨oglich. ¨bertragen werden kann, ist das f¨ Es sind nur die Nebenbedingungen hinzuzuf¨ ugen. Mit Box-Restriktionen ist demnach im
4.11 Numerische Verfahren
209
n-ten Schritt die Aufgabe
min bei (QPn )
1 J (yn , un )(y − yn , u − un ) + L (yn , un , pn )(y − yn , u − un )2 2 −Δy + d(x, yn ) + dy (x, yn )(y − yn ) ∂ν y ua ≤ u ≤ ub .
= u = 0
zu l¨ osen. Als Ergebnis erh¨ alt man die neue Steuerung un+1 , den neuen Zustand yn+1 sowie danach den zugeh¨ origen adjungierten Zustand pn+1 , dessen Differentialgleichung ¨ in Ubungsaufgabe 4.10 zu bestimmen ist. Damit ist die Verfahrensvorschrift f¨ ur das SQP-Verfahren beschrieben. Eine Reihe von Fragen ergibt sich: Hat (QPn ) eine L¨osung (yn+1 , un+1 )? Ist diese L¨ osung eindeutig festgelegt? Konvergiert das Verfahren und, wenn ja, mit welcher Ordnung? Satz 4.35 Das Tripel (¯ y, u ¯, p) gen¨ uge den notwendigen Optimalit¨atsbedingungen f¨ ur die Aufgabe mit verteilter Steuerung (4.31)–(4.33) und der hinreichenden Optimalit¨atsbedingung zweiter Ordnung (4.105) auf S. 197. Die Voraussetzung 4.14 auf S. 164 sei erf¨ ullt. Dann existiert ein Konvergenzradius > 0, so dass das SQP-Verfahren ausgehend von einer Startn¨aherung (y0 , u0 , p0 ) mit 0, so dass f¨ ur alle n ∈ IN gilt
(yn+1 , un+1 , pn+1 ) − (¯ y, u ¯, p) C(Ω)×L ∞ (Ω)×C(Ω) ¯ ¯ ≤
2 y, u ¯, p) C(Ω)×L ≤ cN (yn , un , pn ) − (¯ ∞ (Ω)×C(Ω) ¯ ¯ . Das SQP-Verfahren ist also unter den getroffenen Voraussetzungen lokal quadratisch konvergent. Dabei wurden die sch¨ arferen hinreichenden Optimalit¨atsbedingungen (4.105) vorausgesetzt, bei denen keine stark aktiven Ungleichungsrestriktionen ber¨ ucksichtigt sind. Das ist bei Konvergenzbeweisen f¨ ur SQP-Verfahren allgemein u ¨blich. Der auf dem Newtonverfahren f¨ ur verallgemeinerte Gleichungen beruhende Beweis ist in [203] zu finden. Ein weitgehend analoger Beweis wird f¨ ur den parabolischen Fall in [197] ausgef¨ uhrt. Bei Randsteuerung sind Struktur und Theorie des SQP-Verfahrens v¨ollig analog zum Fall der verteilten Steuerung. Gleiches gilt f¨ ur homogene Dirichlet-Randbedingungen an Stelle von Neumann-Randbedingungen. Bemerkung. Die hier beschriebene Grundidee des SQP-Verfahrens erfordert bis zur Entwicklung von zuverl¨ assigen Programmen noch zus¨ atzlichen Aufwand. Zum Beispiel sind Techniken zur Globalisierung einzusetzen und die L¨ osung der quadratischen Unteraufgaben sinnvoll mit der ¨ außeren Iteration zu verbinden, wir verweisen auf die Fachliteratur. Bei den in unserem Buch angegebenen akademischen Testbeispielen funktioniert die Grundvariante jedoch ausgezeichnet.
210
4 Steuerung semilinearer elliptischer Gleichungen
¨ 4.12 Ubungsaufgaben 4.1 Beweisen Sie die Ungleichung yL∞ (Γ) ≤ yL∞ (Ω)
∀y ∈ H 1 (Ω) ∩ L∞ (Ω)
in beschr¨ ankten Lipschitzgebieten Ω. ¯ ∩ H 1 (Ω) ist dicht in H 1 (Ω). W¨ ahlen Sie eine Folge {yn } von Funktionen Hinweis: C(Ω) ¯ ∩ H 1 (Ω) mit yn → y in H 1 (Ω), n → ∞, und projizieren sie diese auf [−c, c] mit aus C(Ω) ¯ Wenden Sie den Spursatz 2.1 c = yL∞ (Ω) . Die Projektion ist stetig in H 1 (Ω) ∩ C(Ω). auf S. 23 an. 4.2 Untersuchen Sie die semilineare elliptische Aufgabe (4.5) von S. 147 auf Eindeutigkeit der ochstens L¨ osung. Zeigen Sie, dass unter Voraussetzung 4.2 auf S. 148 in H 1 (Ω) ∩ L∞ (Ω) h¨ eine L¨ osung y existieren kann. ankte und messbare Menge. F¨ ur welche R¨ aume Lq (E) ist der 4.3 Es sei E ⊂ IRN eine beschr¨ 2 Nemytskii-Operator y(·) → sin(y(·)) Fr´echet-differenzierbar von L (E) nach Lq (E)? 4.4 (i) Beweisen Sie, dass der Nemytskii-Operator y(·) → sin(y(·)) in keinem Raum Lp (0, T ) mit 1 ≤ p < ∞ Fr´echet-differenzierbar ist. Hinweis: Die erforderliche Eigenschaft des Restglieds ist schon f¨ ur Treppenfunktionen nicht erf¨ ullt. (ii) Zeigen Sie zus¨ atzlich, dass dieser Operator Fr´echet-differenzierbar von Lp1 (0, T ) nach p2 ur alle 1 ≤ p2 < p1 ≤ ∞ ist. L (0, T ) f¨ 4.5 Best¨ atigen Sie ohne R¨ uckgriff auf Lemma 4.11, dass die in (4.34) definierten Funktionale F und Q, Z Z ` ´ ` ´ ϕ x, y(x) dx, Q(u) = ψ x, u(x) dx F (y) = Ω
Ω
unter Voraussetzung 4.14 auf S. 164 Lipschitz-stetig auf ihren Definitionsgebieten sind. Weisen Sie außerdem die Konvexit¨ at von Q nach. 4.6 Es seien eine beschr¨ ankte und messbare Menge E ⊂ IRN sowie Funktionen ua , ub aus ∞ L (E) mit ua (x) ≤ ub (x) fast u ¨berall in E gegeben. Verifizieren Sie, dass die Menge ˘ ¯ u. in E Uad = u ∈ Lr (E) : ua (x) ≤ u(x) ≤ ub (x) f.¨ nichtleer, abgeschlossen, konvex und beschr¨ ankt in Lr (E) ist f¨ ur alle 1 ≤ r ≤ ∞. 4.7 Beweisen Sie die in Beziehung (4.41) verwendete Darstellung y (·) − y¯(·)) + rd Φ(˜ y ) − Φ(¯ y ) = d(·, y˜(·)) − d(·, y¯(·)) = dy (·, y¯(·)) (˜ mit einem Rest rd , der rd C(Ω) y − y¯C(Ω) ur ˜ y − y¯C(Ω) ullt. ¯ /˜ ¯ → 0 f¨ ¯ → 0 erf¨ ats4.8 Weisen Sie nach, dass u ¯(x) ≡ 2 f¨ ur λ ∈ (0, 1] und yΩ = 9 den notwendigen Optimalit¨ bedingungen der auf S. 173 definierten Aufgabe Supraleitung“ gen¨ ugt. Sind hinreichende ” Optimalit¨ atsbedingungen zweiter Ordnung erf¨ ullt? 4.9 Zeigen Sie, dass das Funktional f , Z
1
f (u) =
` ´ cos u(x) dx,
0 2
im Raum L (0, 1) nicht zweimal Fr´echet-differenzierbar ist. Verwenden Sie den Hinweis aus Aufgabe 4.4. In welchen R¨ aumen Lp (0, 1) existiert die Fr´echet-Ableitung zweiter Ordnung? 4.10 Leiten Sie die adjungierte Gleichung f¨ ur den adjungierten Zustand pn+1 zu der auf S. 209 definierten linear-quadratischen Teilaufgabe (QPn ) her.
5 Steuerung semilinearer parabolischer Gleichungen In diesem Kapitel behandeln wir analog zu Aufgaben der Optimalsteuerung semilinearer elliptischer Gleichungen den parabolischen Fall. Die Theorie der Existenz und Regularit¨at von L¨ osungen parabolischer Gleichungen unterscheidet sich in mancher Hinsicht von der f¨ ur elliptische Aufgaben. Die optimierungstheoretischen Aspekte weisen aber viele Parallelen auf. Daher braucht die Theorie der Optimalsteuerung parabolischer Gleichungen nicht in gleicher Ausf¨ uhrlichkeit wie in Kapitel 4 dargestellt zu werden. Wir diskutieren die Gleichungen relativ detailliert, k¨ urzen aber die Optimierungstheorie ab, weil die Beweise fast identisch mit denen des elliptischen Falls sind.
5.1 Die semilineare parabolische Modellgleichung Die Zustandsgleichungen in den nachfolgenden Abschnitten sind Spezialf¨alle des folgenden allgemeinen Anfangs-Randwertproblems yt + A y + d(x, t, y) = ∂νA y + b(x, t, y) = y(·, 0) =
f g y0
in Q in Σ in Ω,
(5.1)
mit analog zum elliptischen Fall definierten Funktionen d, b, Mengen Q := Ω × (0, T ) und Σ := Γ × (0, T ); A ist wieder der in (2.19) auf S. 30 definierte gleichm¨aßig elliptische ¨ Differentialoperator und ∂νA bezeichnet die zugeh¨orige Konormalenableitung. Der Ubersichtlichkeit halber unterdr¨ ucken wir wie in (5.1) meist die Angabe der Variablen x, t in der gesuchten Funktion y und in den gegebenen Daten. In diesem Abschnitt werden die wesentlichen Aussagen u ¨ber die Gleichung (5.1) skizziert. Hauptergebnisse sind das Lemma 7.12 u ¨ ber die Stetigkeit der L¨osung des linearen Anfangs-Randwertproblems sowie Satz 5.5 u ¨ ber die Existenz und Eindeutigkeit einer stetigen schwachen L¨ osung von (5.1). Diese zuerst von Casas [46] sowie Raymond und Zidani [175] bewiesenen S¨ atze bilden die Grundlage f¨ ur die zugeh¨orige Theorie der Optimalsteuerung. Wir ben¨ otigen folgende Grundvoraussetzungen: Voraussetzung 5.1 Ω ⊂ IRN , N ≥ 1, sei ein beschr¨anktes Lipschitzgebiet (f¨ ur N = 1 ein beschr¨anktes offenes Intervall). Die Funktion d = d(x, t, y) : Q × IR → IR soll f¨ ur
212
5 Steuerung semilinearer parabolischer Gleichungen
jedes feste y ∈ IR in (x, t) ∈ Q messbar sein. Analog erf¨ ulle b = b(x, t, y) : Σ × IR → IR die gleiche Voraussetzung mit Σ an Stelle von Q. Zus¨atzlich seien d und b in y monoton wachsend f¨ ur fast alle (x, t) ∈ Q bzw. (x, t) ∈ Σ. Als Standardr¨ aume zur Behandlung linearer parabolischer Gleichungen wurden bisher W21,0 (Q) bzw. W (0, T ) verwendet. F¨ ur y ∈ W (0, T ) bzw. y ∈ W21,0 (Q) k¨onnen aber ohne weitere Vorkehrungen die Funktionen d(x, t, y(x, t)) bzw. b(x, t, y(x, t)) unbeschr¨ankt sein und sind nicht notwendig integrierbar. F¨ ur den Beweis der Existenz und der Eindeutigkeit einer L¨ osung von (5.1) f¨ ugen wir deshalb zun¨achst eine weitere Voraussetzung hinzu: Voraussetzung 5.2 Die Funktion d = d(x, t, y) : Q×IR → IR sei gleichm¨aßig beschr¨ankt und global Lipschitz-stetig in y f¨ ur fast alle (x, t) ∈ Q: Es existieren K > 0 und L > 0, so dass f¨ ur fast alle (x, t) ∈ Q und alle y1 , y2 ∈ IR |d(x, t, 0)| ≤ K |d(x, t, y1 ) − d(x, t, y2 )| ≤ L |y1 − y2 |
(5.2) (5.3)
gilt. Die Funktion b = b(x, t, y) : Σ × IR → IR erf¨ ulle die gleiche Voraussetzung mit Σ an Stelle von Q. Die f¨ ur lineare Gleichungen aufgeschriebene schwache Formulierung (3.25) auf S. 112 wird wie folgt auf den nichtlinearen Fall erweitert: Definition. Es seien die Voraussetzungen 5.1 und 5.2 erf¨ ullt. Eine Funktion y ∈ W21,0 (Q) heißt dann schwache L¨osung von (5.1), wenn −
N y vt dxdt + aij Di y Dj v + d(x, t, y) v dxdt + b(x, t, y) v dsdt = Q Q i,j=1 Σ f v dxdt + g v dsdt + y0 v(·, 0) dx Q
Σ
Ω
(5.4) f¨ ur alle v ∈ W21,1 (Q) erf¨ ullt ist, die der zus¨atzlichen Forderung v(x, T ) = 0 gen¨ ugen. Die Beziehung (5.4) ist die schwache oder Variationsformulierung des Anfangs-Randwertproblems (5.1). Als parabolisches Gegenst¨ uck zu Lemma 4.4 auf S. 149 erhalten wir: Lemma 5.3 Unter den Voraussetzungen 5.1 und 5.2 besitzt das Anfangs-Randwertproblem (5.1) f¨ ur jedes Tripel von Daten f ∈ L2 (Q), g ∈ L2 (Σ), y0 ∈ L2 (Ω) genau eine schwache L¨osung y ∈ W21,0 (Q). Dieses Lemma wird in Abschnitt 7.3.1 ab S. 290 bewiesen. Die Voraussetzung 5.2 ist aber zu stark und schließt viele wichtige Anwendungen aus. Nichtlineare Funktionen wie d(y) = y n , n > 1, erf¨ ullen sie zum Beispiel nicht. Deshalb arbeitet man mit lokaler Beschr¨ anktheit und lokaler Lipschitzstetigkeit: Voraussetzung 5.4 Die Funktion d = d(x, t, y) : Q × IR → IR erf¨ ulle auf E = Q die Beschr¨anktheitsbedingung (5.2) und sei f¨ ur alle (x, t) ∈ E lokal Lipschitz-stetig in y, d.h. f¨ ur alle M > 0 existiert ein L(M ) > 0, so dass |d(x, t, y1 ) − d(x, t, y2 )| ≤ L(M ) |y1 − y2 |
(5.5)
5.2 Grundvoraussetzungen des Kapitels
213
f¨ ur alle yi ∈ IR mit |yi | ≤ M , i = 1, 2 gilt. Die Funktion b = b(x, t, y) : Σ × IR → IR gen¨ uge der gleichen Bedingung auf E = Σ. Analog zu Satz 4.5 auf S. 151 kann ohne die starke Voraussetzung 5.2 gezeigt werden, dass bei Vorgaben f und g aus passenden Lp -R¨ aumen genau eine L¨osung in der Klasse der essentiell beschr¨ ankten Funktionen aus W (0, T ) existiert. Die Beschr¨anktheit von d und b wird dazu nicht gebraucht. Man kommt also mit der schw¨acheren Voraussetzung 5.4 auf S. 212 aus und folgender Begriff der schwachen L¨osung ist daher sinnvoll: Definition. Eine Funktion y ∈ W21,0 (Q) ∩ L∞ (Q) heißt schwache L¨osung von (5.1), wenn die Variationsformulierung (5.4) f¨ ur alle v ∈ W21,1 (Q) erf¨ ullt ist, die der zus¨atzlichen Forderung v(x, T ) = 0 gen¨ ugen. Die entsprechenden Existenz- und Eindeutigkeitsresultate wurden im Zusammenhang mit optimalen Steuerungproblemen von Casas [46] bzw. Raymond und Zidani [176] bewiesen. Satz 5.5 ([46],[176]) Unter den Voraussetzungen 5.1 und 5.4 besitzt das semilineare parabolische Anfangs-Randwertproblem yt + A y + d(x, t, y) = f ∂νA y + b(x, t, y) = g y(0) = y0
in Q in Σ in Ω
¯ r > N/2 + 1, s > N + 1, genau eine zu jedem Tripel f ∈ Lr (Q), g ∈ Ls (Σ), y0 ∈ C(Ω), ¯ und mit einer von d, b, schwache L¨osung y ∈ W (0, T ) ∩ L∞ (Q). Diese ist stetig auf Q f , g und y0 unabh¨angigen Konstanten c∞ > 0 gilt die Absch¨atzung (5.6) yW (0,T ) + yC(Q) ¯ ≤ c∞ f − d(·, 0)Lr (Q) + g − b(·, 0)Ls (Σ) + y0 C(Ω) ¯ . Die Grundidee des Beweises ist die folgende: Mit Lemma 5.3 erh¨alt man analog zum elliptischen Fall genau eine L¨ osung f¨ ur die Aufgabe mit den abgeschnittenen Funktionen dk und bk . Dazu existiert eine von k unabh¨ angige Schranke f¨ ur yk L∞ (Q) , die man mit Methoden aus [134] nachweist. Die Stetigkeit der L¨osung folgt aus Lemma 7.12 auf S. 293, dem parabolischen Analogon zu Satz 4.8 auf S. 153. Zur Anwendung dieses Lemmas bringt man die beschr¨ ankten und messbaren Funktionen d(x, t, y) und b(x, t, y) auf die rechte Seite der Differentialgleichung bzw. der Randbedingung und hat dann Vorgaben aus Lr (Q) bzw. Ls (Σ). Die Absch¨ atzung f¨ ur yW (0,T ) in (5.6) folgt aus Lemma 7.10. ¯ erwartet werden. In diesem Fall Bemerkung. F¨ur y0 ∈ L∞ (Ω) kann nicht mehr y ∈ C(Q)
∞ ¯ (Q), siehe Raymond und Zidani [176]. Dies betrifft insbesondere erh¨ alt man y ∈ C((0, T ]×Ω)∩L die Regularit¨ at von adjungierten Zust¨ anden, weil in deren Endbedingung eine nur beschr¨ ankte und messbare Funktion stehen kann. Dann ist in (5.6) die Maximumnorm y0 C(Ω) ¯ durch die L∞ -Norm y0 L∞ (Ω) zu ersetzen.
5.2 Grundvoraussetzungen des Kapitels Zur besseren Lesbarkeit treffen wir auch diesem Kapitel eine insgesamt zu starke Voraussetzung, die f¨ ur alle weiteren S¨ atze ausreicht. In den einzelnen S¨atzen ist dann mehr oder weniger offensichtlich, auf welche Teile der Voraussetzung man verzichten kann.
214
5 Steuerung semilinearer parabolischer Gleichungen
Außerdem beschr¨ anken wir uns der einfacheren Schreibweise halber immer auf den Differentialoperator A = −Δ. Alle weiteren Ergebnisse bleiben f¨ ur den bisher betrachteten allgemeinen elliptischen Operator A g¨ ultig. Neben d = d(x, t, y) und b = b(x, t, y) treten folgende Gr¨oßen auf: In den Zielfunktionalen die Funktionen φ = φ(x, y), ϕ = ϕ(x, t, y, v), ψ = ψ(x, t, y, u) sowie in den Restriktionen an die Steuerungen die Schranken ua , ub , va , vb , welche s¨amtlich von (x, t) abh¨angen. Die Funktionsvariablen“ sind y, wo der Zustand y(x, t) eingesetzt wird, sowie v, u f¨ ur ” die Steuerungen v(x, t), u(x, t). Sie k¨ onnen teilweise auch fehlen, was kein Widerspruch zu den folgenden Voraussetzungen ist. Wir verwenden wieder die Mengen Q = Ω × (0, T ) und Σ = Γ × (0, T ). Voraussetzung 5.6 (i) Ω ⊂ IRN ist ein beschr¨anktes Lipschitzgebiet. (ii) Die Funktionen d = d(x, t, y) : Q × IR → IR, φ = φ(x, y) : Ω × IR → IR, ϕ = ϕ(x, t, y, v) : Q×IR2 → IR und b = b(x, t, y) : Σ×IR → IR, ψ = ψ(x, t, y, u) : Σ×IR2 → IR seien f¨ ur feste reelle Variablen y, v, u messbar in (x, t) und f¨ ur fast alle festen (x, t) aus Q bzw. Σ zweimal differenzierbar nach y, v, u. Sie gen¨ ugen den Beschr¨anktheits- und lokalen Lipschitzbedingungen (4.24)–(4.25) der Ordnung k = 2. Exemplarisch dargestellt bedeutet das f¨ ur ϕ die Existenz einer Konstanten K > 0 und einer von M > 0 abh¨angigen Konstanten L(M ) > 0, so dass mit den unten erl¨auterten Bezeichnungen ∇ϕ und ϕ f¨ ur fast alle (x, t) ∈ Q und alle yi , vi ∈ [−M, M ], i = 1, 2, Folgendes gilt: |ϕ(x, t, 0, 0)| + |∇ϕ(x, t, 0, 0)| + |ϕ (x, t, 0, 0)| ≤ |ϕ (x, t, y1 , v1 ) − ϕ (x, t, y2 , v2 )| ≤
K L(M ) |y1 − y2 | + |v1 − v2 | ...
ur fast alle (x, t) ∈ Q gefordert und by (x, t, y) ≥ 0 f¨ ur (iii) Zus¨atzlich ist dy (x, t, y) ≥ 0 f¨ ¯ fast alle (x, t) ∈ Σ. Die Funktion y0 sei aus C(Ω). (iv) Die Schranken ua , ub , va , vb : E → R sind aus L∞ (E) f¨ ur E = Q bzw. E = Σ und erf¨ ullen ua (x, t) ≤ ub (x, t) bzw. va (x, t) ≤ vb (x, t) f¨ ur fast alle (x, t) ∈ E. Bemerkungen. In (ii) stehen ∇ϕ bzw. ϕ f¨ur » ∇ϕ =
ϕy ϕv
– ,
ϕ =
»
ϕyy ϕvy
ϕyv ϕvv
– .
F¨ ur diese Gr¨ oßen stellt | · | eine beliebige Norm im IR2 bzw. IR2×2 dar. Die Voraussetzung angen wie 5.6 erf¨ ullen z.B. Funktionen d, b ∈ C 3 (IR), die nur von der Funktionsvariablen abh¨ assigen ϕ ist d(y) = y k , k ∈ IN ungerade, d(y) = exp(y). Ein typisches Beispiel eines zul¨ ϕ(x, t, y, v) = α(x, t) (y − yQ (x, t))2 + β(x, t) (v − vQ (x, t))2 mit α, β, yQ , vQ ∈ L∞ (Q), vgl. dazu auch die Bemerkungen zum elliptischen Fall nach Voraussetzung 4.14 auf S. 164.
5.3 Existenz optimaler Steuerungen Wir beginnen die Behandlung parabolischer Optimalsteuerungsprobleme mit dem Nachweis der Existenz optimaler Steuerungen. Um viele denkbare F¨alle gleichzeitig behandeln
5.3 Existenz optimaler Steuerungen
215
zu k¨ onnen, betrachten wir eine Aufgabe, die sowohl verteilte als auch Randsteuerung einschließt sowie ein Zielfunktional mit Beobachtungen auf dem Rand, im Gebiet und zum Endzeitpunkt. Wir untersuchen die Aufgabe min J(y, v, u) := ϕ x, t, y(x, t), v(x, t) dxdt φ x, y(x, T ) dx + Ω Q (5.7) + ψ x, t, y(x, t), u(x, t) dsdt Σ
bei yt − Δy + d(x, t, y) = v ∂ν y + b(x, t, y) = u y(0) = y0 sowie
va (x, t) ≤ v(x, t) ≤ vb (x, t) ua (x, t) ≤ u(x, t) ≤ ub (x, t)
in Q in Σ in Ω
(5.8)
f.¨ u. in Q f.¨ u. in Σ.
(5.9)
Soll eine der beiden Steuerungen nicht vorkommen, so kann durch die Festsetzung va = vb = 0 reine Randsteuerung bzw. durch ua = ub = 0 rein verteilte Steuerung erzwungen werden. Als Mengen zul¨ assiger Steuerungen definieren wir Vad
=
Uad
=
v ∈ L∞ (Q) : va (x, t) ≤ v(x, t) ≤ vb (x, t) u ∈ L∞ (Σ) : ua (x, t) ≤ u(x, t) ≤ ub (x, t)
f.¨ u. in Q f.¨ u. in Σ .
Im Weiteren bezeichnet y(v, u) den zu (v, u) geh¨origen Zustand y. Definition. Ein Paar von Steuerungen (¯ v, u ¯) ∈ Vad × Uad heißt optimal und y¯ = y(¯ v, u ¯) optimaler Zustand, wenn J y(¯ v, u ¯), v¯, u ¯ ≤ J y(v, u), v, u f¨ ur alle (v, u) ∈ Vad × Uad erf¨ ullt ist. Es heißt lokal optimal im Sinne von Lr (Q) × Ls (Σ), wenn ein ε > 0 existiert, so dass die obige Ungleichung f¨ ur alle (v, u) ∈ Vad × Uad mit v − v¯Lr (Q) + u − u ¯Ls (Σ) ≤ ε gilt. Im n¨ achsten Satz wird die Konvexit¨ at von ϕ und ψ in der Steuerungsvariablen ben¨otigt. Das heißt z.B. f¨ ur ϕ ϕ x, t, y, λ v1 + (1 − λ)v2 ≤ λ ϕ x, t, y, v1 + (1 − λ) ϕ x, t, y, v2 f¨ ur fast alle (x, t) ∈ Q, alle reellen y, vi , i = 1, 2, und alle λ ∈ (0, 1). Analog ist die Konvexit¨ at von ψ in der Steuerung zu verstehen. Satz 5.7 Es sei Voraussetzung 5.6 erf¨ ullt und ϕ sowie ψ seien konvex in v bzw. u. Dann besitzt die Aufgabe (5.7)–(5.9) mindestens ein Paar (¯ v, u ¯) optimaler Steuerungen mit zugeh¨origem optimalen Zustand y¯ = y(¯ v, u ¯). Beweis: Der Beweis verl¨ auft ¨ ahnlich dem von Satz 4.15 f¨ ur elliptische Aufgaben. Deshalb straffen wir die Darstellung. Nach Satz 5.5 besitzt die Zustandsgleichung (5.8) f¨ ur jedes ¯ Die Paar zul¨ assiger Steuerungen genau einen Zustand y = y(v, u) ∈ W (0, T ) ∩ C(Q).
216
5 Steuerung semilinearer parabolischer Gleichungen
Menge Vad × Uad ist beschr¨ ankt in L∞ (Q) × L∞ (Σ), damit erst recht in Lr (Q) × Ls (Σ) mit r > N/2 + 1, s > N + 1. Die Absch¨ atzung (5.6) liefert deshalb mit einem M > 0 die gleichm¨ aßige Beschr¨ anktheit y(v, u)C(Q) ¯ ≤M
∀ (v, u) ∈ Vad × Uad .
(5.10)
Das Funktional J ist wegen Voraussetzung 5.6, der Beschr¨anktheit von Uad und Vad sowie (5.10) nach unten beschr¨ ankt und hat deshalb ein endliches Infimum j. Wir k¨onnen wegen r Reflexivit¨ a t von L (Q) × Ls (Σ) eine in diesem Raum schwach konvergente Minimalfolge ∞ (vn , un ) n=1 mit schwachem Grenzwert in Vad × Uad ausw¨ahlen, vn v¯,
un u ¯,
n → ∞.
Wegen Konvexit¨ at und Abgeschlossenheit von Vad × Uad ist (¯ v, u ¯) ein Paar zul¨assiger Steuerungen. Nun ist die starke Konvergenz der Zustandsfolge in einem geeigneten Raum herzuleiten, was hier etwas aufw¨ andiger ist als im elliptischen Fall. Zun¨achst k¨ onnen wir voraussetzen, dass Teilfolgen von zn (x, t) = −d(x, t, yn (x, t)) sowie von wn (x, t) = −b(x, t, yn (x, t)) in Lr (Q) bzw. Ls (Σ) schwach gegen gewisse z und w konvergieren, denn diese Funktionenfolgen sind mit yn wegen Voraussetzung 5.6 fast u ¨ berall gleichm¨ aßig beschr¨ ankt. Wir wollen der Einfachheit halber annehmen, dass diese Teilfol∞ gen die Folgen {zn }∞ n=1 bzw. {wn }n=1 selbst sind. Nun betrachten wir die parabolische semilineare Gleichung als lineares Problem mit rechten Seiten zn + vn und wn + un , yn,t − Δyn = zn + vn ∂ν yn = wn + un yn (0) = y0 .
(5.11)
Die rechten Seiten konvergieren schwach gegen z+¯ v bzw. w+ u ¯. Auf Grund der schwachen Stetigkeit der L¨ osungsabbildung (v, u) → y(v, u) der linearen parabolischen Gleichung konvergiert die Zustandsfolge in W (0, T ) schwach gegen ein y¯ ∈ W (0, T ), yn y¯,
n → ∞.
Gleichzeitig ist bekannt, dass bei homogener Anfangsbedingung y0 := 0 die Abbildung (v, u) → y(v, u) stetig von Lr (Q) × Ls (Σ) in den Raum H¨older-stetiger Funktionen ¯ abbildet, κ ∈ (0, 1), siehe [84], [85]. Es sei yˆ ∈ C(Q) ¯ der feste L¨osungsanteil C 0,κ (Q) von yn zum inhomogenen Anfangswert y0 bei homogener rechter Seite und homogener ¯ Wegen der Randbedingung in (5.11). Die Folge {yn − yˆ} konvergiert schwach in C 0,κ (Q). 0,κ ¯ ¯ ¯ kompakten Einbettung von C (Q) in C(Q) konvergiert sie stark in C(Q) und deshalb ¯ f¨ gilt wegen yˆ ∈ C(Q) ur n → ∞ yn → y¯ ¯ Da hier gleichm¨aßige Konvergenz vorliegt, sind die weimit einem gewissen y¯ ∈ C(Q). teren Schl¨ usse etwas einfacher als im elliptischen Fall (wo wir allerdings mit einfacheren Methoden arbeiten konnten). Die lokale Lipschitzstetigkeit von d, b garantiert d(·, ·, yn ) → d(·, ·, y¯) bzw. b(·, ·, yn)∞→ b(·, ·, y¯) in L∞ (Q) bzw. L∞ (Σ), damit auch in L2 (Q) bzw. L2 (Σ). Die Folge (vn , un ) n=1 konvergiert schwach gegen (¯ v, u ¯) in L2 (Q) × L2 (Σ) . Wie im elliptischen Fall ersehen wir aus der Variationsformulierung der parabolischen Gleichung, dass y¯ die schwache L¨osung zum Paar (¯ v, u ¯) ist, y¯ also den Zustand zu (¯ v, u ¯) darstellt:
5.4 Steuerungs-Zustands-Operator
217
Nach Definition gilt f¨ ur beliebige aber feste Testfunktionen w ∈ W21,1 (Q) mit w(T ) = 0
− Q
∇yn · ∇w + d(x, t, yn ) w dxdt + b(x, t, yn ) w dsdt = yn wt dxdt + Q Σ vn w dxdt + un w dsdt + y0 w(·, 0) dx. = Σ
Q
Ω
Nach Grenz¨ ubergang n → ∞ folgt aus den genannten Konvergenzen ∇¯ y · ∇w + d(x, t, y¯) w dxdt + y¯ wt dxdt + b(x, t, y¯) w dsdt = − Σ Q Q = v¯ w dxdt + u ¯ w dsdt + y0 w(·, 0) dx. Q
Σ
Ω
Aus der Beliebigkeit von w folgt, dass y¯ schwache L¨osung ist. Schließlich wird noch die Optimalit¨ at von (¯ v, u ¯) bewiesen. Hier geht die schwache Unterhalbstetigkeit unseres Zielfunktionals ein. Diese Argumente k¨ onnen aus dem Beweis zum elliptischen Fall u ¨bernommen werden. Bemerkung. Offenbar ben¨otigt man von Voraussetzung 5.6 die Beschr¨anktheits- und Lipschitzbedingungen nur bis zur Ordnung k = 0.
5.4 Steuerungs-Zustands-Operator Wir beweisen hier Stetigkeit und Differenzierbarkeit der Steuerungs-Zustands-Abbildung und betrachten wieder Randsteuerung und verteilte Steuerung gleichzeitig durch Untersuchung der Aufgabe (5.8), yt − Δy + d(x, t, y) = v ∂ν y + b(x, t, y) = u y(0) = y0
in Q in Σ in Ω.
Auch hier wird die Abbildung (v, u) → y mit G bezeichnet, G : V × U := Lr (Q) × ¯ Wir setzen generell r > N/2 + 1, s > N + 1 voraus. Ls (Σ) → Y := W (0, T ) × C(Q). Nach Lemma 4.12 y(·) → d ·, ·, y(·) bzw. auf S. 161 sind die Nemytskii-Operatoren ¯ nach L∞ (Q) bzw. L∞ (Σ). Jedem Paar y(·) → b ·, ·, y(·) stetig differenzierbar von C(Q) von Steuerungen (v, u) ∈ V × U ordnet die Steuerungs-Zustands-Abbildung G gem¨aß Satz 5.5 genau einen Zustand y ∈ Y zu. Um ihre Differenzierbarkeit zu zeigen, beweisen wir zun¨ achst die Lipschitzstetigkeit. Satz 5.8 Unter Voraussetzung 5.6 ist die Abbildung G f¨ ur r > N/2 + 1, s > N + 1 ¯ Mit einem L > 0 gilt Lipschitz-stetig von Lr (Q) × Ls (Σ) nach W (0, T ) ∩ C(Q): y1 − y2 W (0,T ) + y1 − y2 C(Q) ¯ ≤ L v1 − v2 Lr (Q) + u1 − u2 Ls (Σ) f¨ ur alle (vi , ui ) ∈ Lr (Q) × Ls (Σ) und die zugeh¨origen Zust¨ande yi = G(vi , ui ), i = 1, 2.
218
5 Steuerung semilinearer parabolischer Gleichungen
¯ i = 1, 2. Subtraktion der partiellen DifferentialBeweis: Aus Satz 5.5 folgt yi ∈ C(Q), gleichungen f¨ ur y1 , y2 ergibt f¨ ur die Differenzen y = y1 − y2 , u = u1 − u2 , v = v1 − v2 yt − Δy + d(x, t, y1 ) − d(x, t, y2 ) ∂ν y + b(x, t, y1 ) − b(x, t, y2 ) y(0)
= v = u = 0.
(5.12)
Laut Hauptsatz der Differential- und Integralrechnung gilt f¨ ur reelle y1 , y2 d(x, t, y1 ) − d(x, t, y2 ) =
1 0
dy x, t, y2 + s (y1 − y2 ) ds (y1 − y2 ).
Nach Einsetzen von yi = yi (x, t) in diese Darstellung wird das obige Integral zu einer nichtnegativen Funktion δ = δ(x, t) aus L∞ (Q), denn dy ist nichtnegativ. Eine analoge Darstellung gilt mit einem Integralterm β = β(x, t) ≥ 0 f¨ ur b. Folglich erhalten wir f¨ ur unser gegebenes y das Anfangs-Randwertproblem yt − Δy + δ(x, t) y ∂ν y + β(x, t) y y(0)
= v = u = 0.
Die Funktionen δ und β h¨ angen zwar von y1 , y2 ab, das ist aber f¨ ur die weiteren Schl¨ usse ˜ t, y) := ohne Belang. Wegen Beschr¨ anktheit und Nichtnegativit¨at von δ und β sind d(x, δ(x, t) y und ˜b(x, t, y) := β(x, t) y monoton wachsend in y und verschwinden bei y = 0. Nach Satz 5.5 auf S. 213 existiert genau eine L¨osung y, deren Norm nicht von δ und β ˜ t, 0) = ˜b(x, t, 0) = 0 die abh¨ angt. Aus Absch¨ atzung (5.6) auf S. 213 folgt dann wegen d(x, behauptete Absch¨ atzung yW (0,T ) + yC(Q) ¯ ≤ L vLr (Q) + uLs (Σ) .
Zum Nachweis der Differenzierbarkeit betrachten wir eine feste Stelle (¯ v, u ¯). In den Anwendungen wird das ein Paar lokal optimaler Steuerungen sein. Satz 5.9 Unter Voraussetzung 5.6 auf S. 214 ist der Steuerungs-Zustands-Operator G f¨ ur r > N/2 + 1 und s > N + 1 Fr´echet-differenzierbar von Lr (Q) × Ls (Σ) in W (0, T ) ∩ ¯ Die Ableitung ergibt sich aus C(Q). G (¯ v, u ¯) (v, u) = y, wobei y die schwache L¨osung des an der Stelle y¯ linearisierten Anfangs-Randwertproblems yt − Δy + dy (x, t, y¯) y ∂ν y + by (x, t, y¯) y y(0)
= v = u = 0
ist und y¯ = G(¯ v, u ¯) der zu (¯ v, u ¯) geh¨orige Zustand.
in Q in Σ in Ω
(5.13)
5.4 Steuerungs-Zustands-Operator
219
Beweis: Wir subtrahieren die Differentialgleichung f¨ ur y¯ = G(¯ v, u ¯) von der f¨ ur y˜ = G(¯ v + v, u ¯ + u) und erhalten (˜ y − y¯)t − Δ(˜ y − y¯) + d(x, t, y˜) − d(x, t, y¯) = v ∂ν (˜ y − y¯) + b(x, t, y˜) − b(x, t, y¯) = u (˜ y − y¯)(0) = 0. Die Nemytskii-Operatoren Φ : y → d ·, ·, y(·) und Ψ : y → b ·, ·, y(·) sind nach Lemma 4.12 auf S. 161 Fr´echet-differenzierbar in L∞ (Q) bzw L∞ (Σ). Folglich gilt Φ(˜ y ) − Φ(¯ y) = dy ·, ·, y¯(·) y˜(·) − y¯(·) + rd Ψ(˜ y ) − Ψ(¯ y ) = by ·, ·, y¯(·) y˜(·) − y¯(·) + rb mit Resten rd , rb , die rd L∞ (Q) /˜ y − y¯L∞ (Q) → 0 f¨ ur ˜ y − y¯L∞ (Q) → 0 bzw. rb L∞ (Σ) /˜ y − y¯L∞ (Σ) → 0 f¨ ur ˜ y − y¯L∞ (Σ) → 0 erf¨ ullen. Wir schreiben nun y˜ − y¯ mit einem Rest yρ in der Form y˜ − y¯ = y + yρ , in der y wie in (5.13) definiert ist. Der Rest yρ gen¨ ugt dem Anfangs-Randwertproblem yρ,t − Δyρ + dy (·, ·, y¯) yρ ∂ν yρ + by (·, ·, y¯) yρ yρ (0)
= −rd = −rb = 0.
An dieser Stelle kommt die eben bewiesene Lipschitzstetigkeit ins Spiel, denn wir wissen ˜ y − y¯C(Q) ¯ ≤ L (v, u)Lr (Q)×Ls (Σ) → 0. Der Beweis kann nun analog zum Beweis von Satz 4.17 auf S. 170 vervollst¨ andigt werden. ¯ Folgerung. G ist Fr´echet-differenzierbar von L∞ (Q) × L∞ (Σ) in W (0, T ) ∩ C(Q). Bemerkung. Der letzte Beweis h¨atte auch direkt mit dem Satz u¨ber implizite Funktionen ohne Bezug auf die Lipschitzstetigkeit von G gef¨ uhrt werden k¨ onnen. Diese Technik wird im Beweis von Satz 5.15 angewendet. Die obige Argumentation ist aber etwas weniger abstrakt, ist nicht wesentlich l¨ anger und liefert die Form der Ableitung G gleich mit. Außerdem ist die Information interessant, dass G gleichm¨ aßig Lipschitz-stetig ist.
Nichtlinear auftretende Steuerungen Bei manchen Aufgabenstellungen erfordert der physikalische Hintergrund nichtlinear eingehende Steuerungen, zum Beispiel bei der W¨ armeleitgleichung mit Stefan-BoltzmannRandbedingung yt − Δy = 0 ∂ν y + β(x, t) |y| y 3 = u4 y(0) = y0 .
(5.14)
Hier setzt sich die Abbildung G aus dem Nemytskii-Operator u(·) → u(·)4 und dem L¨ osungsoperator zusammen, welcher der Funktion u ˜ := u(·)4 die L¨osung der semilinearen Anfangs-Randwertaufgabe zuordnet. Die Abbildung u(·) → u(·)4 ist nach Lemma 4.13 auf S. 161 Fr´echet-differenzierbar in L∞ (Σ), damit erst recht von L∞ (Σ) in Lr (Σ) f¨ ur
220
5 Steuerung semilinearer parabolischer Gleichungen
jedes r ≥ 1. Folglich ist die zusammengesetzte Abbildung G : u → y differenzierbar von ¯ L∞ (Σ) nach W (0, T ) ∩ C(Q). Fordert man die Differenzierbarkeit dieser Abbildung mit Definitionsbereich Lr˜(Σ) an Stelle von L∞ (Σ), dann ist r˜ > r > N/2 + 1 hinreichend groß zu w¨ahlen, so dass die Abbildung u → u4 differenzierbar von Lr˜(Σ) nach Lr (Σ) ist. Darauf wollen wir hier nicht eingehen, weil dann Wachstumsbedingungen wie in Abschnitt 4.3.3 erforderlich sind. Man erh¨ alt die Differenzierbarkeit einfacher mit Steuerungen aus L∞ (Σ). Das trifft insbesondere auf die Behandlung der Zwei-Norm-Diskrepanz im Zusammenhang mit hinreichenden Optimalit¨ atsbedingungen zweiter Ordnung zu.
Spezialf¨ alle Der K¨ urze halber haben wir bis jetzt die Eigenschaften der Abbildung G f¨ ur verteilte Steuerung und Randsteuerung gleichzeitig behandelt. Wir geben jetzt f¨ ur jeden Fall ein Beispiel an, in dem die n¨ otigen Voraussetzungen erf¨ ullt sind. Verteilte Steuerung. In der Aufgabe yt − Δy + d0 (x, t) + d1 (x, t) y 3 ∂ν y + b0 (x, t) + b1 (x, t) y y(0)
= v = 0 = 0
(5.15)
seien d0 ∈ Lr (Q), b0 ∈ Ls (Σ) und fast u ¨ berall nichtnegative Funktionen d1 ∈ L∞ (Q), ∞ b1 ∈ L (Σ) gegeben. Dann erf¨ ullen d(x, t, y) := d0 (x, t) + d1 (x, t) y 3 sowie b(x, t, y) := b0 (x, t) + b1 (x, t) y die Voraussetzungen des obigen Satzes, so dass die Abbildung ¯ ist. v → y f¨ ur r > N/2 + 1 Fr´echet-differenzierbar von Lr (Q) in W (0, T ) ∩ C(Q) Randsteuerung. Unter analogen Voraussetzungen ist G : u → y f¨ ur die Aufgabe mit Randbedingung vom Strahlungstyp yt − Δy + d0 (x, t) + d1 (x, t) y ∂ν y + b0 (x, t) + b1 (x, t) |y| y 3 y(0)
= 0 = u = 0
(5.16)
¯ falls s > N + 1. stetig Fr´echet-differenzierbar von Ls (Σ) nach W (0, T ) ∩ C(Q),
5.5 Notwendige Optimalit¨ atsbedingungen Wir behandeln wieder die Aufgabe (5.7)–(5.9) und leiten f¨ ur ein lokal optimales Paar von Steuerungen (¯ v, u ¯) die notwendigen Bedingungen erster Ordnung ab. Es ist klar, dass dann v¯ die notwendigen Bedingungen f¨ ur die Aufgabe der verteilten Steuerung mit variablem v er¨ ullen muss, bei der u = u ¯ fest gehalten wird. Analog erf¨ ullt u ¯ die notwendigen Bedingungen f¨ ur die entsprechende Aufgabe mit Randsteuerung u und fixiertem v¯. Deshalb k¨ onnen wir zun¨ achst verteilte und Randsteuerung getrennt behandeln.
5.5 Notwendige Optimalit¨ atsbedingungen
221
5.5.1 Verteilte Steuerung Wir diskutieren die Aufgabe φ x, y(x, T ) dx + ϕ x, t, y(x, t), v(x, t) dxdt min J(y, v) := Ω Q + ψ x, t, y(x, t) dsdt
(5.17)
Σ
bei den Nebenbedingungen yt − Δy + d(x, t, y) = v ∂ν y + b(x, t, y) = 0 y(0) = y0
in Q in Σ in Ω
(5.18)
sowie u. in Q. va (x, t) ≤ v(x, t) ≤ vb (x, t) f.¨
(5.19)
Der Zustand y = y(v) ist Bild des Steuerungs-Zustands-Operators G = G(v), G : ¯ Einsetzen in J ergibt die reduzierte Zielfunktion f L∞ (Q) → W (0, T ) ∩ C(Q). J(y, v) = J G(v), v = f (v). Unter Voraussetzung 5.6 auf S. 214 ist f Fr´echet-differenzierbar in L∞ (Q), denn J ist nach Lemma 4.12 auf S. 161 und G laut Satz 5.9 differenzierbar. Die Menge Vad ist konvex. Ist v¯ lokal optimal und v ∈ Vad beliebig gegeben, so gilt f¨ ur alle hinreichend kleinen λ > 0 f (¯ v ) ≤ f v¯ + λ(v − v¯) . Wie im elliptischen Fall folgt daraus nach Division durch λ und Grenz¨ ubergang λ ↓ 0: Lemma 5.10 Ist Voraussetzung 5.6 auf S. 214 erf¨ ullt, so gen¨ ugt jede f¨ ur die Aufgabe (5.17)–(5.19) lokal optimale Steuerung v¯ der Variationsungleichung f (¯ v )(v − v¯) ≥ 0
∀v ∈ Vad .
(5.20)
Die Ableitung f berechnet sich nach der Kettenregel, v )(v − v¯) = Jy (¯ y , v¯) G (¯ v )(v − v¯) + Jv (¯ y , v¯)(v − v¯) = f (¯ = φy x, y¯(x, T ) y(x, T ) dx + ϕy x, t, y¯(x, t), v¯(x, t) y(x, t) dxdt Q Ω + ψy x, t, y¯(x, t) y(x, t) dsdt + ϕv x, t, y¯(x, t), v¯(x, t) · Σ Q · v(x, t) − v¯(x, t) dxdt.
(5.21)
Dabei ist y = G (¯ v )(v − v¯) nach Satz 5.9 die L¨ osung des linearisierten Problems yt − Δy + dy (x, t, y¯) y = ∂ν y + by (x, t, y¯) y = y(0) =
v − v¯ 0 0.
(5.22)
222
5 Steuerung semilinearer parabolischer Gleichungen
Die Richtungsableitung f (¯ v )(v−¯ v ) muss wegen lokaler Optimalit¨at nichtnegativ sein. Mit einem adjungierten Zustand kann y in (5.21) eliminiert werden. Mit unseren Erfahrungen aus dem elliptischen Fall ist der adjungierte Zustand p = p(x, t) leicht zu bestimmen. Er wird definiert als L¨ osung der adjungierten Gleichung −pt − Δp + dy (x, t, y¯) p = ϕy (x, t, y¯, v¯) ∂ν p + by (x, t, y¯) p = ψy (x, t, y¯) p(x, T ) = φy x, y¯(x, T )
(5.23)
¯ Existenz und Eindeutigkeit von p ∈ und geh¨ ort zu W (0, T ) ∩ L∞ (Q) ∩ C([0, T ), C(Ω)). W (0, T ) folgen aus Lemma 3.17 auf S. 126. Die h¨ohere Regularit¨at von p ist eine Folgerung aus Lemma 7.12 auf S. 293 und der nachfolgenden Bemerkung zum L∞ -Fall: Dazu ist ¯ die Zeittransformation τ := T − t anzuwenden. Ist φy (x, y) stetig in Ω × IR, dann auch ¯ ¯ die Funktion x → φy x, y¯(x, T ) in Ω. In diesem Fall gilt p ∈ W (0, T ) ∩ C(Q). Lemma 5.11 Ist y die schwache L¨osung der linearisierten Gleichung (5.22) und p die schwache L¨osung von (5.23), dann gilt f¨ ur alle v ∈ L2 (Q) ϕy x, t, y¯(x, t), v¯(x, t) y(x, t) dxdt φy x, y¯(x, T ) y(x, T ) dx + Ω Q + ψy x, t, y¯(x, t) y(x, t) ds(x)dt = p(x, t) v(x, t) − v¯(x, t) dxdt. Σ
Q
Beweis: Die Aussage folgt aus Satz 3.18 auf S. 127 mit aΩ (x) = φy x, y¯(x, T ) , aQ (x, t) = ϕy x, t, y¯(x, t), v¯(x, t) , aΣ (x, t) = ψy x, t, y¯(x, t) . Damit ergibt sich aus Formel (5.21) die folgende Gestalt der Ableitung f (¯ v ): p + ϕv (x, t, y¯, v¯) v dxdt. v) v = f (¯
(5.24)
Q
Außerdem erhalten wir die gesuchte notwendige Optimalit¨atsbedingung: Satz 5.12 Unter Voraussetzung 5.6 auf S. 214 gen¨ ugt jede lokal optimale Steuerung v¯ der Aufgabe (5.17)–(5.19) gemeinsam mit dem adjungierten Zustand p ∈ W (0, T ) ∩ L∞ (Q) aus der adjungierten Gleichung (5.23) der Variationsungleichung p + ϕv (x, t, y¯, v¯) (v − v¯) dxdt ≥ 0 ∀v ∈ Vad . (5.25) Q
Wie bei elliptischen Problemen kann man die Variationsungleichung in Form eines Minimumprinzips aufschreiben: Folgerung. Ist v¯ lokal optimal f¨ ur (5.7)–(5.9) und p der adjungierte Zustand, dann wird unter den Voraussetzungen von Satz 5.12 das Minimum der Aufgabe min p(x, t) + ϕv (x, t, y¯(x, t), v¯(x, t) v (5.26) va (x,t)≤ v ≤vb (x,t)
f¨ ur fast alle (x, t) ∈ Q durch v = v¯(x, t) angenommen.
5.5 Notwendige Optimalit¨ atsbedingungen
223
λ 2 v mit λ > 0. 2 Hier gilt ϕv (x, t, y, v) = λ v, also wird das Minimum der Aufgabe p(x, t) + λ v¯(x, t) v min
Spezialfall: ϕ(x, t, y, v) := ϕ(x, t, y) +
va (x,t)≤ v ≤vb (x,t)
f¨ ur fast alle (x, t) ∈ Q durch v = v¯(x, t) angenommen. Daraus ergibt sich bei λ > 0 wie in Formel (2.58) auf S. 56 f¨ ur fast alle (x, t) ∈ Q die Projektionsbeziehung
1 v¯(x, t) = IP[va (x,t),vb (x,t)] − p(x, t) . λ ¯ wenn Sind die Funktionen va und vb stetig, so folgt daraus die Regularit¨at v¯ ∈ C(Q), p eine stetige Funktion ist (hinreichend daf¨ ur ist die Stetigkeit von φy (x, y)). In diesem Fall muss jede lokal optimale Steuerung v¯ eine stetige Funktion sein. Beispiel. Wir diskutieren die bereits im station¨aren Fall behandelte Aufgabe Supra” leitung“ jetzt instation¨ ar und mit etwas anderem Zielfunktional: min J(y, v) :=
1 1 λ y(·, T ) − yΩ 2L2 (Ω) + y − yΣ 2L2 (Σ) + v2L2 (Q) 2 2 2
bei yt − Δy + y 3 ∂ν y + β(x, t) y y(·, 0)
= v = 0 = y0
sowie −1 ≤ v(x, t) ≤ 1. Sie ist ein Spezialfall von (5.7)–(5.9) auf S. 215 mit 2 1 λ y − yΩ (x) , ϕ(x, t, y, v) = v 2 2 2 2 1 y − yΣ (x, t) , d(x, t, y) = y 3 , b(x, t, y) = β(x, t) y. ψ(x, t, y) = 2 ¯ sowie yΣ ∈ L∞ (Σ) voraus, dann sind alle Setzen wir 0 ≤ β ∈ L∞ (Σ), yΩ ∈ C(Ω) geforderten Voraussetzungen (Messbarkeit in (x, t), Beschr¨anktheit, Differenzierbarkeit, Monotonie von d, Konvexit¨ at von ϕ in v) erf¨ ullt. Die Existenz mindestens einer (global) optimalen Steuerung v¯ folgt aus Satz 5.7. Die adjungierte Gleichung f¨ ur p lautet φ(x, y) =
−pt − Δp + 3 y¯2 p = 0 ∂ν p + β p = y¯ − yΣ p(·, T ) = y¯(·, T ) − yΩ . ¯ muss v¯ der Variationsungleichung Mit deren L¨ osung p ∈ W (0, T ) ∩ C(Q) (λ¯ v + p)(v − v¯) dx dt ≥ 0 ∀v ∈ Vad Q
¯ gen¨ ugen. Im Fall λ > 0 ergibt sich daraus die u ¨bliche Projektionsbeziehung und v¯ ∈ C(Q). F¨ ur λ = 0 folgt v¯(x, t) = − sign p(x, t).
224
5 Steuerung semilinearer parabolischer Gleichungen
5.5.2 Randsteuerung Analog werden die notwendigen Bedingungen f¨ ur das entsprechende Randsteuerungsproblem hergeleitet: min J(y, u) := φ x, y(x, T ) dx + ϕ x, t, y(x, t) dxdt Q Ω (5.27) + ψ x, t, y(x, t), u(x, t) dsdt Σ
bei yt − Δy + d(x, t, y) = 0 ∂ν y + b(x, t, y) = u y(0) = y0
in Q in Σ in Ω
ua (x, t) ≤ u(x, t) ≤ ub (x, t)
in Σ.
(5.28)
sowie (5.29) ∞
Hier bildet der Steuerungs-Zustands-Operator G = G(u) : u → y(u) von L (Σ) nach ¯ ab, da y0 stetig auf Ω ¯ ist. Die weiteren Schritte verlaufen wie beim Fall W (0, T ) ∩ C(Q) der verteilten Steuerung. F¨ ur das reduzierte Funktional f (u) = J G(u), u berechnet sich die Ableitung gem¨ aß f (¯ p + ψu (x, t, y¯, u u) u = ¯) u dsdt, (5.30) Σ
∞
wobei p ∈ W (0, T ) ∩ L (Q) die L¨ osung der adjungierten Gleichung −pt − Δp + dy (x, t, y¯) p = ϕy (x, t, y¯) ∂ν p + by (x, t, y¯) p = ψy (x, t, y¯, u ¯) p(x, T ) = φy (x, y¯(x, T ))
(5.31)
ist. Analog zu Satz 5.12 erhalten wir: Satz 5.13 Ist Voraussetzung 5.6 auf S. 214 erf¨ ullt, so gen¨ ugt jede lokal optimale Steuerung u ¯ des Randsteuerungsproblems (5.27)–(5.29) gemeinsam mit dem adjungierten Zustand p ∈ W (0, T ) ∩ L∞ (Q) aus Gleichung (5.31) der Variationsungleichung ¯) (u − u ¯) dsdt ≥ 0 ∀u ∈ Uad . (5.32) p + ψu (x, t, y¯, u Σ
Das Minimum der Aufgabe min
ua (x,t)≤ u ≤ub (x,t)
p(x, t) + ψu (x, t, y¯(x, t), u ¯(x, t) u
wird f¨ ur fast alle (x, t) ∈ Σ durch u = u ¯(x, t) angenommen. Beispiel. Gegeben ist die Aufgabe min J(y, u) :=
1 1 λ y(·, T ) − yΩ 2L2 (Ω) + y − yQ 2L2 (Q) + u2L2 (Σ) 2 2 2
(5.33)
5.5 Notwendige Optimalit¨ atsbedingungen
225
bei yt − Δy ∂ν y + y 3 |y| y(0)
= 0 = u = y0
sowie 0 ≤ u(x, t) ≤ 1. Sie ist ein Spezialfall des obigen Problems mit φ(x, y) = ψ(x, t, y, u) =
1 1 (y − yΩ (x))2 , ϕ(x, t, y) = (y − yQ (x, t))2 2 2 λ 2 u , b(x, t, y) = y 3 |y|. 2
Die Randbedingung ist vom Stefan-Boltzmann-Typ, denn f¨ ur nichtnegative y gilt y 3 |y| = 4 4 3 ¯ y . Im Gegensatz zur Funktion y ist aber y |y| monoton. Auch hier setzen wir yΩ ∈ C(Ω) voraus. Voraussetzung 5.6 sowie die Konvexit¨ at von ψ in u sind erf¨ ullt. Deshalb existiert nach Satz 5.7 mindestens eine optimale Steuerung u ¯. Die Ableitung von b ist by (y) = 4 y 2 |y| und die adjungierte Gleichung lautet damit −pt − Δp = y¯ − yQ ∂ν p + 4 y¯2 |¯ y| p = 0 p(·, T ) = y¯(·, T ) − yΩ . ¯ erf¨ Mit deren L¨ osung p ∈ W (0, T ) ∩ C(Q) ullt u ¯ die Variationsungleichung (λ¯ u + p)(u − u ¯) dsdt ≥ 0 ∀u ∈ Uad Σ
und f¨ ur λ > 0 die Projektionsbeziehung
u ¯(x, t) = IP[0,1]
1 − p(x, t) λ
¯ f¨ ur fast alle (x, t) ∈ Σ. Mit p ist auch u ¯ stetig in Σ.
Der allgemeine Fall Durch Zusammenfassung der Ergebnisse f¨ ur die F¨alle verteilte Steuerung/Randsteuerung ergibt sich schließlich die folgende Optimalit¨ atsbedingung, in welcher der adjungierte Zustand p als L¨ osung der folgenden adjungierten Gleichung definiert ist: −pt − Δp + dy (x, t, y¯) p = ϕy (x, t, y¯, v¯) ∂ν p + by (x, t, y¯) p = ψy (x, t, y¯, u ¯) p(x, T ) = φy x, y¯(x, T )
in Q in Σ in Ω.
(5.34)
226
5 Steuerung semilinearer parabolischer Gleichungen
Satz 5.14 Unter Voraussetzung 5.6 auf S. 214 gen¨ ugt jedes Paar lokal optimaler Steuerungen (¯ v, u ¯) des Problems (5.7)–(5.9) auf S. 215 gemeinsam mit dem adjungierten Zustand p ∈ W (0, T ) ∩ L∞ (Q) aus Gleichung (5.34) den Variationsungleichungen (5.25), (5.32) bzw. den Minimumbedingungen (5.26), (5.33). Beweis: Die notwendige Bedingung f¨ ur v folgt daraus, dass v¯ die allgemeine Aufgabe (5.7)–(5.9) mit fest gehaltenem u = u ¯ l¨ osen muss. Diese ist ein Spezialfall der Aufgabe (5.17)–(5.19) mit verteilter Steuerung, wenn wir b(x, t, y) := b(x, t, y) − u ¯(x, t) setzen. In gleicher Weise muss u ¯ die allgemeine Aufgabe mit festem v¯ l¨osen. So erh¨alt man das komplette Optimalit¨ atssystem. Bemerkung. F¨ur alle notwendigen Optimalit¨atsbedingungen erster Ordnung dieses Kapitels ben¨ otigt man in Voraussetzung 5.6 die Beschr¨ anktheits- und Lipschitzbedingungen offensichtlich nur bis zur Ordnung k = 1.
5.6 Pontrjaginsches Maximumprinzip * Wir erl¨ autern das Pontrjaginsche Maximumprinzip f¨ ur die folgende Aufgabe mit nichtlinear auftretenden Steuerfunktionen: min J(y, v, u) := φ x, y(x, T ) dx + ϕ x, t, y(x, t), v(x, t) dxdt Ω Q (5.35) + ψ x, t, y(x, t), u(x, t) ds(x)dt Σ
bei yt − Δy + d(x, t, y, v) = 0 ∂ν y + b(x, t, y, u) = 0 y(0) = y0 sowie
in Q in Σ in Ω
(5.36)
va (x, t) ≤ v(x, t) ≤ vb (x, t) f.¨ u. in Q ua (x, t) ≤ u(x, t) ≤ ub (x, t) f.¨ u. in Σ.
(5.37)
Analog zum elliptischen Fall definiert man Hamiltonfunktionen: Definition. Als Hamiltonfunktionen werden die folgenden Funktionen H Q : Q × IR4 → IR, H Σ : Σ × IR4 → IR und H Ω : Ω × IR3 → IR bezeichnet: H Q (x, t, y, v, q0 , q) = H Σ (x, t, y, u, q0 , q) = H Ω (x, y, q0 , q) =
q0 ϕ(x, t, y, v) − q d(x, t, y, v) q0 ψ(x, t, y, u) − q b(x, t, y, u) q0 φ(x, y).
Ferner definieren wir als adjungierten Zustand die L¨osung q der adjungierten Gleichung −qt − Δq + dy (x, t, y¯, v¯) q = q0 ϕy (x, t, y¯, v¯) ∂ν q + by (x, t, y¯, u ¯) q = q0 ψy (x, t, y¯, u ¯) q(x, T ) = q0 φy (x, y¯(·, T )).
(5.38)
5.7 Optimalit¨ atsbedingungen zweiter Ordnung
227
Der adjungierte Zustand q stimmt mit −p aus (5.34) u ¨ berein, wenn q0 = −1 gesetzt wird. Unter Verwendung der oben eingef¨ uhrten Hamiltonfunktionen l¨asst sich das adjungierte System mit q0 := −1 wie folgt darstellen: −qt − Δq = Dy H Q (x, t, y¯, v¯, −1, q) ∂ν q = Dy H Σ (x, t, y¯, u ¯, −1, q) q(·, T ) = Dy H Ω (x, y¯(·, T ), −1, q)
in Q in Σ in Ω.
(5.39)
Definition. Die Steuerungen v¯, u ¯ erf¨ ullen das Pontrjaginsche Maximumprinzip, wenn mit q0 = −1 die Maximumbedingungen H Q x, t, y¯(x, t), v, q0 , q(x, t) = H Q x, t, y¯(x, t), v¯(x, t), q0 , q(x, t) , max va (x,t)≤v≤vb (x,t) ¯(x, t), q0 , q(x, t) H Σ x, t, y¯(x, t), u, q0 , q(x, t) = H Σ x, t, y¯(x, t), u max ua (x,t)≤u≤ub (x,t)
f¨ ur fast alle (x, t) ∈ Q bzw. fast alle (x, t) ∈ Σ erf¨ ullt sind, wobei q der in (5.39) definierte adjungierte Zustand ist. ur fast alle betreffenden (x, t) durch v¯(x, t) bzw. Die Maxima von H Q und H Σ sind also f¨ u ¯(x, t) anzunehmen. Man kann unter nat¨ urlichen Bedingungen erwarten, dass (global) optimale Steuerungen dem Maximumprinzip gen¨ ugen, siehe zum Beispiel die in der Literatur¨ ubersicht zum Maximumprinzip zu Beginn des Abschnitts 4.8.1 erw¨ahnten Arbeiten [46], [142], [176], [210, 211].
5.7 Optimalit¨ atsbedingungen zweiter Ordnung 5.7.1 Ableitungen zweiter Ordnung Wir betrachten wieder die Aufgabe (5.7)–(5.9) von S. 215. Satz 5.15 Unter Voraussetzung 5.6 ist die Steuerungs-Zustands-Abbildung G : (v, u) → y zur Gleichung (5.8) zweimal stetig Fr´echet-differenzierbar von L∞ (Q) × L∞ (Σ) in ¯ W (0, T ) × C(Q). Beweis. Analog zum elliptischen Fall wird der Satz u ¨ber implizite Funktionen angewendet. Wir leiten zun¨ achst eine Operatorgleichung f¨ ur y = G(v, u) her. Dazu schreiben wir die Gleichung f¨ ur y um, yt − Δy ∂ν y y(0)
= v − d(x, t, y) = u − b(x, t, y) = y0
in Q in Σ in Ω.
Den links stehenden linearen Anteil erfassen wir durch lineare und stetige L¨osungsope¯ GΣ : L∞ (Σ) → Y und G0 : C(Ω) ¯ → Y, ratoren GQ : L∞ (Q) → Y := W (0, T ) ∩ C(Q), die zur linearen Aufgabe yt − Δy = v in Q ∂ν y = u in Σ y(0) = w in Ω
228
5 Steuerung semilinearer parabolischer Gleichungen
geh¨ oren: Wir haben y = GQ v f¨ ur u = 0, w = 0; y = GΣ u f¨ ur v = 0, w = 0 und y = G0 w ¯ auf. Die f¨ ur u = 0, v = 0. Diese Operatoren fassen wir im Weiteren mit Bildraum C(Q) L¨ osung y der nichtlinearen Gleichung hat so die Darstellung y = GQ v − d(·, y) + GΣ u − b(·, y) + G0 y0 (5.40) bzw.
0 = y − GQ v − d(·, y) − GΣ u − b(·, y) − G0 y0 =: F (y, v, u).
Auf diese Weise umgehen wir die Diskussion von Differentialoperatoren sowie den Raum ¯ × L∞ (Q) × W (0, T ). Offenbar ist F zweimal stetig Fr´echet-differenzierbar von C(Q) ∞ ¯ L (Σ) nach C(Q), denn GQ , GΣ , G0 sind linear und stetig und die Nemytskii-Operato¯ in ren y → d(·, y) sowie y → b(·, y) sind zweimal stetig Fr´echet-differenzierbar von C(Q) ∞ ∞ L (Q) bzw. L (Σ). ¯ Ubungsaufgabe ¨ Die partielle Fr´echet-Ableitung Fy (y, v, u) ist invertierbar in C(Q), 5.1. Laut Satz u ¨ber implizite Funktionen gibt es daher in einer Umgebung einer beliebig gew¨ ahlten festen Stelle (¯ y , v¯, u ¯) lokal genau eine L¨osung y = y(v, u) der Gleichung F (y, v, u) = 0. Außerdem besagt dieser Satz, und das ist das Wesentliche, dass die Abbildung (v, u) → y zweimal stetig differenzierbar ist. Da wir mit y = G(v, u) eine L¨osung kennen, bekommen wir die zweimalige Differenzierbarkeit von G als Nebenergebnis. Satz 5.16 Unter Voraussetzung 5.6 auf S. 214 ist die zweite Ableitung von G durch
G (v, u) (v1 , u1 ), (v2 , u2 ) = z gegeben, wobei z die eindeutig bestimmte schwache L¨osung der mit y = G(v, u) definierten parabolischen Anfangs-Randwertaufgabe zt − Δz + dy (x, t, y) z = −dyy (x, t, y) y1 y2 + y1 w2 + w1 y2 + w1 w2 ∂ν z + by (x, t, y) z = −byy (x, t, y) y1 y2 + y1 w2 + w1 y2 + w1 w2 z(0) = 0 ist und die Funktionen yi , wi ∈ W (0, T ), i = 1, 2, durch folgende linearisierte AnfangsRandwertprobleme definiert sind: ∂yi /∂t − Δyi + dy (x, t, y) yi ∂ν yi + by (x, t, y) yi yi (0)
= 0 = ui = 0,
∂wi /∂t − Δwi + dy (x, t, y) wi = ∂ν wi + by (x, t, y) wi = wi (0) =
vi 0 0.
Beweis: Die Abbildung G (v, u) wird durch partielle zweite Ableitungen dargestellt,
G (v, u) (u1 , v1 ), (u2 , v2 ) = Guu [u1 , u2 ] + Guv [u1 , v2 ] + Gvu [v1 , u2 ] + Gvv [v1 , v2 ], wobei die Operatoren Guu , Guv , Gvu , Gvv durch passende Kombinationen der Richtungen ui , vi bestimmt werden k¨ onnen. Durch die Wahl v1 = v2 = 0 bestimmen wir beispielsweise Guu . Wie im letzten Beweis gehen wir dazu von der Darstellung (5.40) aus, (y =) G(v, u) = GQ v − d(·, ·, G(v, u)) + GΣ u − b(·, ·, G(v, u)) + G0 y0 . Wir differenzieren die linke und rechte Seite getrennt nach u in Richtung u1 und erhalten Gu (v, u) u1 = −GQ dy ·, ·, G(v, u) Gu (v, u) u1 + GΣ u1 − GΣ by ·, ·, G(v, u) Gu (v, u) u1 .
5.7 Optimalit¨ atsbedingungen zweiter Ordnung
229
Nach einer weitere Differentiation in Richtung u2 entsteht Guu (v, u)[u1 , u2 ]
= −GQ dyy ·, ·, G(v, u) Gu (v, u) u1 Gu (v, u) u2 +dy ·, ·, G(v, u) Guu (v, u)[u1 , u2 ] −GΣ byy ·, ·, G(v, u) Gu (v, u)u1 Gu (v, u)u2 +by ·, ·, G(v, u) Guu (v, u)[u1 , u2 ] .
In diese Beziehung setzen wir y = G(v, u), yi = Gu (v, u) ui und zuu := Guu (v, u)[u1 , u2 ] ein. Dann lautet die letzte Gleichung zuu = −GQ dyy (·, ·, y) y1 y2 + dy (·, ·, y) zuu − GΣ byy (·, ·, y) y1 y2 + by (·, ·, y) zuu . Dabei l¨ osen y1 und y2 nach Satz 5.9 die in der Behauptung definierten Anfangs-Randugt zuu den Gleichungen wertprobleme. Laut Definition von GQ , GΣ und G0 gen¨ zt − Δz + dy (x, t, y) z ∂ν z + by (x, t, y) z z(0)
= −dyy (x, t, y) y1 y2 = −byy (x, t, y) y1 y2 = 0.
ur z erhalSo haben wir den ersten Anteil zuu aus der im Satz formulierten Darstellung f¨ ten. Die anderen drei Bestandteile ergeben sich aus der gleichen Prozedur: Guv [u1 , v2 ] mit u2 = 0, v1 = 0, Gvu [v1 , u2 ] analog mit u1 = 0, v2 = 0 und Gvv [v1 , v2 ] mit u1 = u2 = 0. Durch Superposition dieser Anteile ergibt sich schließlich das in der Behauptung des Satzes angegebene z und die Form von G . Damit sind die Grundlagen geschaffen, hinreichende Optimalit¨atsbedingungen aufzustellen und deren Hinl¨anglichkeit f¨ ur lokale Optimalit¨at zu beweisen. Dies k¨onnte f¨ ur verteilte Steuerung und Randsteuerung gleichzeitig geschehen, aber dann w¨ urde die Darstellung recht un¨ ubersichtlich. Deshalb behandeln wir beide F¨alle getrennt, f¨ uhren den Beweis nur f¨ ur verteilte Steuerung und verzichten wegen v¨olliger Analogie auf den Beweis des Satzes f¨ ur Randsteuerung.
5.7.2 Verteilte Steuerung Wir betrachten wieder die Aufgabe (5.17)–(5.19) auf S. 221. Es sei v¯ ∈ Vad eine Steuerung, die den entsprechenden notwendigen Optimalit¨atsbedingungen erster Ordnung gen¨ ugt und p der zugeh¨ orige adjungierte Zustand, definiert durch Gleichung (5.23). Dann ist mit p die Variationsungleichung (5.25) erf¨ ullt, p + ϕv (x, t, y¯, v¯) (v − v¯) dxdt ≥ 0 ∀ v ∈ Vad . Q
Notwendige Optimalit¨ atsbedingungen zweiter Ordnung erh¨alt man analog zum elliptischen Fall. Wir gehen hier darauf nicht ein. Zur Formulierung der hinreichenden Bedingung zweiter Ordnung verwendet man am einfachsten die Lagrangefunktion. Sie lautet f¨ ur die Aufgabe (5.17)–(5.19) auf S. 221 L(y, v, p) = J(y, v) − yt + d(x, t, y) − v p + ∇y · ∇p dxdt − b(x, t, y)p dsdt. Q
Σ
230
5 Steuerung semilinearer parabolischer Gleichungen
Der explizite Ausdruck f¨ ur die zweite Ableitung von L ist p dyy (x, t, y¯) y 2 dxdt − p byy (x, t, y¯) y 2 dsdt y , v¯, p)(y, v)2 = J (¯ y , v¯)(y, v)2 − L (¯ Σ
Q
mit
J (¯ y , v¯)(y, v)
2
=
2
φyy (x, y¯(x, T )) y(x, T ) dx + ψyy (x, t, y¯) y Ω Σ y ϕyy (x, t, y¯, v¯) ϕyv (x, t, y¯, v¯)
+
Q
v
2
ϕvy (x, t, y¯, v¯) ϕvv (x, t, y¯, v¯)
dsdt y dxdt. v
F¨ ur elliptische Aufgaben haben wir aus methodischen Gr¨ unden mit hinreichenden Optimalit¨ atsbedingungen begonnen, die keine stark aktiven Restriktionen ber¨ ucksichtigen und daher in der Regel zu starke Forderungen sind. Erst danach sind wir auf schw¨achere Bedingungen eingegangen. Hier gehen wir diesen Umweg nicht und betrachten von vorherein stark aktive Restriktionen, die wir analog zum elliptischen Fall definieren: Definition. F¨ ur gegebenes τ ≥ 0 heißt Aτ (¯ v ) = (x, t) ∈ Q : p(x, t) + ϕv x, t, y¯(x, t), v¯(x, t) > τ Menge stark aktiver Restriktionen f¨ ur v¯. v ) ist es nicht sinnvoll, positive Definitheit der zweiten Ableitung der LagrangeIn Aτ (¯ funktion zu fordern. Das wurde bereits auf S. 199 f¨ ur eine Optimierungsaufgabe in IR erl¨ autert. Auf Aτ (¯ v ) baut der τ -kritische Kegel auf, der wie im elliptischen Fall definiert ist. Das ist die Menge der Steuerungen, f¨ ur die man die positive Definitheit von L fordert, wenn man sie gemeinsam mit der L¨ osung y der folgenden linearisierten Gleichung in L einsetzt: yt − Δy + dy (x, t, y¯) y = v in Q ∂ν y + by (x, t, y¯) y = 0 in Σ (5.41) y(0) = 0 in Ω. v ) verstehen wir die Menge aller v ∈ Definition. Unter dem τ -kritischen Kegel Cτ (¯ L∞ (Q), die folgenden Relationen gen¨ ugen: ⎧ ⎪ v) ⎨ = 0, falls (x, t) ∈ Aτ (¯ ≥ 0, falls v¯(x, t) = va und (x, t) ∈ / Aτ (¯ v) (5.42) v(x, t) ⎪ ⎩ ≤ 0, falls v¯(x, t) = v und (x, t) ∈ / A (¯ v ). b τ Je nach Vorzeichen von p + ϕv gilt auf Aτ (¯ v ) entweder v¯ = va oder v¯ = vb und daraus leiten sich die obigen Vorzeichenbedingungen ab. Es kann v dort null gesetzt werden, wo der Gradient der Zielfunktion, also die Funktion p + ϕv (x, t, y¯, v¯) mindestens den Betrag τ hat. Dabei muss τ positiv sein. Im endlichdimensionalen Fall ist diese Einschr¨ankung nicht n¨ otig. Dort sind diejenigen Komponenten der Vektoren des kritischen Kegels null, bei denen die zugeh¨ orige Komponente des Gradienten nicht verschwindet. Das ist im Funktionenraum so nicht m¨ oglich. Ein entsprechendes Gegenbeispiel hat J. Dunn [63] konstruiert. Daher formuliert man die hinreichende Optimalit¨atsbedingung zweiter Ordnung wie folgt:
5.7 Optimalit¨ atsbedingungen zweiter Ordnung
Es existieren δ > 0 und τ > 0, so dass folgende Definitheitsbedingung erf¨ ullt ist: L (¯ y , v¯, p)(y, v)2 ≥ δ v2L2 (Q) f¨ ur alle v ∈ Cτ (¯ v ) und y ∈ W (0, T ) aus (5.41).
231
(5.43)
Satz 5.17 Es sei Voraussetzung 5.6 erf¨ ullt und das Paar (¯ y , v¯) gen¨ uge den notwendigen Optimalit¨atsbedingungen erster Ordnung von Satz 5.12 sowie allen in der Aufgabe (5.17)– (5.19) geforderten Nebenbedingungen. Außerdem sollen Zahlen δ > 0, τ > 0 existieren, mit denen die Definitheitsbedingung (5.43) erf¨ ullt ist. Dann gibt es Zahlen ε > 0, σ > 0, so dass alle v ∈ Vad mit v − v¯L∞ (Q) ≤ ε und die zugeh¨orige L¨osung y(v) von (5.18) auf S. 221 der Bedingung des quadratischen Wachstums J(y, v) ≥ J(¯ y , v¯) + σ v − v¯2L2 (Q) gen¨ ugen. Folglich ist v¯ im Sinne von L∞ (Q) lokal optimal. Beweis: (i) Vorbemerkungen Wie bisher ist G : v → y die Steuerungs-Zustands-Abbildung , G : L∞ (Q) → W (0, T ) ∩ ¯ Wir wissen bereits, dass G zweimal stetig Fr´echet-differenzierbar ist und setzen C(Q). f (v) := J y(v), v = J G(v), v . Analog zu Satz 4.25 auf S. 193 gilt auch hier
f (¯ v )[v1 , v2 ] = L (¯ y , v¯, p) (y1 , v1 ), (y2 , v2 ) , (5.44) wobei p der zu (¯ y , v¯) geh¨ orige adjungierte Zustand ist und yi := G (¯ v )vi die L¨osungen der linearisierten Gleichung mit rechter Seite vi , i = 1, 2 sind. Damit l¨asst sich f (¯ v ) wie folgt gegen die L2 -Norm der Inkremente absch¨ atzen:
|f (¯ v )[v1 , v2 ]| ≤ L (¯ y , v¯, p) (y1 , v1 ), (y2 , v2 ) ≤ c y1 W (0,T ) y2 W (0,T ) + y1 W (0,T ) v2 L2 (Q) (5.45) +y2 W (0,T ) v1 L2 (Q) + v1 L2 (Q) v2 L2 (Q) ≤ c v1 L2 (Q) v2 L2 (Q) . v ) von L2 (Q) in W (0, T ) in der DarstelZuletzt wurde die Stetigkeit des Operators G (¯ lung yi = G (¯ v ) vi ausgenutzt und c ist eine generische Konstante. Die eben hergeleitete Absch¨ atzung werden wir unter (iii) mehrmals verwenden. F¨ ur die Ableitung f (¯ v ) haben wir mit g = p + ϕv (·, ·, y¯, v¯) die Darstellung f (¯ v )h = g(x, t) h(x, t) dxdt. Q
(ii) Taylor-Entwicklung Es sei v(·) ∈ Vad mit v − v¯L∞ (Q) ≤ ε beliebig gew¨ahlt. F¨ ur fast alle (x, t) ∈ Q gilt die punktweise Variationsungleichung
g(x, t) v − v¯(x, t) ≥ 0 ∀v ∈ va (x, t), vb (x, t) . Deshalb folgt mit h(x, t) = v(x, t) − v¯(x, t) 1 v ) h + f (¯ v ) h2 + r2f f (v) − f (¯ v ) = f (¯ 2 1 ≥ g(x, t) h(x, t) dxdt + f (¯ v ) h2 + r2f 2 Aτ (¯v) 1 v ) h2 + r2f . ≥ τ |h(x, t)| dxdt + f (¯ 2 Aτ (¯ v)
232
5 Steuerung semilinearer parabolischer Gleichungen
Dabei bezeichnet r2f = r2f (¯ v , h) das Restglied zweiter Ordnung der Taylor-Entwicklung von f . Jetzt zerlegen wir die Funktion h in einen Anteil h0 , der im kritischen Kegel liegt,
h0 (x, t) :=
h(x, t), falls (x, t) ∈ Aτ 0, falls (x, t) ∈ Aτ ,
v ), denn h0 erf¨ ullt auch und einen Rest h1 := h − h0 . Nach Konstruktion liegt h0 in Cτ (¯ die Vorzeichenbedingungen des kritischen Kegels. Mit diesen Funktionen gilt 1 f (v) − f (¯ v) ≥ τ |h(x, t)| dxdt + f (¯ v ) (h0 + h1 )2 + r2f . (5.46) 2 Aτ (¯ v) (iii) Absch¨atzung von f (¯ v ) (h0 + h1 )2 Wir erhalten wegen (5.43), h0 ∈ Cτ (¯ v ) und der Darstellung (5.44) 1 δ f (¯ v ) h20 ≥ h0 2L2 (Q) . 2 2 Durch Anwendung der Youngschen Ungleichung folgt aus (5.45) mit einer generischen Konstanten c > 0 f (¯ v )[h0 , h1 ] ≤ ≤ ≤
δ c h0 L2 (Q) h1 L2 (Q) ≤ h0 2L2 (Q) + c h1 2L2 (Q) 4 δ h0 2L2 (Q) + c h1 L1 (Q) h1 L∞ (Q) 4 δ h0 2L2 (Q) + c1 ε h1 L1 (Q) 4
wegen hL∞ (Q) ≤ ε. Analog gilt 1 f (¯ v ) h21 ≤ c h1 2L2 (Q) ≤ c2 ε h1 L1 (Q) . 2 Insgesamt ergibt sich nach Einsetzen aller Ungleichungen in 12 f (¯ v ) (h0 + h1 )2 1 f (¯ v ) (h0 + h1 )2 2
≥ ≥
δ δ 2 2 h0 L2 (Q) − h0 L2 (Q) + (c1 + c2 ) ε h1 L1 (Q) 2 4 δ h0 2L2 (Q) − (c1 + c2 ) ε h1 L1 (Q) . 4
ullt ist. Wegen h1 = 0 auf Ω \ Aτ folgt Wir w¨ ahlen ε so klein, dass ε (c1 + c2 ) ≤ τ /2 erf¨ h1 L1 (Q) = |h1 | dxdt Aτ (¯ v)
und nach Einsetzen der Absch¨ atzungen in (5.46) τ δ f (v) − f (¯ v) ≥ τ |h| dxdt − |h| dxdt + h0 2L2 (Q) + r2f 2 4 Aτ (¯ v) Aτ (¯v) τ δ 2 ≥ |h| dxdt + h0 L2 (Q) + r2f . 2 4 Aτ (¯ v)
5.7 Optimalit¨ atsbedingungen zweiter Ordnung
233
Es sei zus¨ atzlich ε ≤ 1, was gegebenenfalls durch weiteres Verkleinern von ε erreicht werden kann. Dann gilt |h(x, t)| ≥ h(x, t)2 . Wegen h2 dxdt h0 2L2 (Q) = Q\Aτ (¯ v)
folgt schließlich f (v) − f (¯ v) ≥
τ 2
h2 dxdt +
Aτ (¯ v)
δ h2L2 (Q\Aτ ) + r2f 4
τ δ h2L2 (Q) + r2f . ≥ min , 2 4 v , h) hat die Eigenschaft Das Restglied r2f (¯ r2f (¯ v , h) →0 h2L2 (Q)
f¨ ur hL∞ (Q) → 0.
¨ Das beweist man analog zu (4.80) auf S. 189 auch hier, Ubungsaufgabe 5.2. Deshalb folgt f¨ ur hinreichend kleines ε schließlich τ δ 1 f (v) − f (¯ v ) ≥ min h2L2 (Q) = σ h2L2 (Q) , , 2 2 4 also die behauptete quadratische Wachstumsbedingung. Bemerkungen. (i) Der Satz gilt nat¨urlich erst recht, wenn man die Definitheitsbedingung (5.43) f¨ ur die gr¨ oßere Menge aller (y, v) fordert, welche der linearisierten Gleichung (5.42) und v ). Diese strengere den Vorzeichenbedingungen in (5.42) gen¨ ugen, nicht aber v = 0 auf Aτ (¯ Form hinreichender Bedingungen zweiter Ordnung wird gern als Voraussetzung f¨ ur den Konvergenzbeweis numerischer Verfahren verwendet. Wir haben sie bereits bei elliptischen Aufgaben benutzt. (ii) Eine etwas elegantere Formulierung der hinreichenden Optimalit¨ atsbedingungen zweiter Ordnung, welche die Konstanten δ und τ vermeidet, findet man in Casas et al. [51]. Diese andere Bedingung ist jedoch ¨ aquivalent zu der hier formulierten.
5.7.3 Randsteuerung Wegen Analogie geben wir die hinreichenden Bedingungen f¨ ur die Randsteuerung ohne Beweis an und betrachten dazu Aufgabe (5.27)–(5.29) auf S. 224. Die Lagrangefunktion wird analog zum Fall der verteilten Steuerung definiert, L(y, v, p) = J(y, v) − (yt + d(x, t, y)) p + ∇y · ∇p dxdt − (b(x, t, y) − u)p dsdt. Σ
Q
Ihre zweite Ableitung ist L (¯ y, u ¯, p)(y, v)2 = J (¯ y, u ¯)(y, u)2 −
Q
mit y, u ¯)(y, u)2 J (¯
=
p dyy (x, t, y¯) y 2 dxdt −
Σ
p byy (x, t, y¯) y 2 dsdt
φyy (x, y¯(x, T )) y(x, T )2 dx + ϕyy (x, t, y¯) y 2 dxdt Ω Q y ¯) ψyu (x, t, y¯, u ¯) y ψyy (x, t, y¯, u dsdt. + u ψuy (x, t, y¯, u u ¯) ψuu (x, t, y¯, u ¯) Σ
234
5 Steuerung semilinearer parabolischer Gleichungen
Die Steuerung u ¯ ∈ Uad soll den notwendigen Optimalit¨atsbedingungen erster Ordnung f¨ ur diese Aufgabe gen¨ ugen. Dabei ist p der zugeh¨orige adjungierte Zustand, definiert durch Gleichung (5.31) auf S. 224. Mit p ist die Variationsungleichung (5.32) erf¨ ullt, p + ψu (x, t, y¯, u ¯) (u − u ¯) dsdt ≥ 0 ∀ u ∈ Uad . Σ
Zu gegebenem τ ≥ 0 heißt Aτ (¯ ¯(x, t) > τ u) = (x, t) ∈ Σ : p(x, t) + ψu x, t, y¯(x, t), u Menge stark aktiver Restriktionen f¨ ur u ¯. Die linearisierte Gleichung lautet yt − Δy + dy (x, t, y¯) y = ∂ν y + by (x, t, y¯) y = y(0) =
0 u 0
in Q in Σ in Ω
(5.47)
u) besteht aus allen u ∈ L∞ (Σ) mit und der τ -kritische Kegel Cτ (¯ ⎧ ⎪ u) ⎨ = 0, falls (x, t) ∈ Aτ (¯ ≥ 0, falls u ¯(x, t) = ua und (x, t) ∈ / Aτ (¯ u) u(x, t) ⎪ ⎩ ≤ 0, falls u ¯(x, t) = ub und (x, t) ∈ / Aτ (¯ u).
(5.48)
Als hinreichende Bedingung zweiter Ordnung fordern wir wieder y, u ¯, p)(y, u)2 ≥ δ u2L2 (Σ) L (¯ f¨ ur alle u ∈ Cτ (¯ u) und y ∈ W (0, T ) aus (5.47).
(5.49)
Satz 5.18 Das Paar (¯ y, u ¯) gen¨ uge den notwendigen Optimalit¨atsbedingungen erster Ordnung von Satz 5.13 auf S. 224 und allen in der Aufgabe der Randsteuerung formulierten Nebenbedingungen. Voraussetzung 5.6 sei erf¨ ullt und es sollen δ > 0, τ > 0 existieren, mit denen die Definitheitsbedingung (5.49) gilt. Dann gibt es Konstanten ε > 0, σ > 0, so dass f¨ ur alle u ∈ Uad mit u − u ¯L∞ (Σ) ≤ ε und die zugeh¨origen Zust¨ande y die Bedingung des quadratischen Wachstums J(y, u) ≥ J(¯ y, u ¯) + σ u − u ¯2L2 (Σ) erf¨ ullt ist. Folglich ist u ¯ lokal optimal.
5.7.4 Ein Fall ohne Zwei-Norm-Diskrepanz Auch bei parabolischen Aufgaben tritt die Zwei-Norm-Diskrepanz nicht auf, wenn bei L2 -Steuerungen die Regularit¨ at des Zustands und die Differenzierbarkeit der Nichtlinearit¨ aten zueinander passen. Das trifft beispielsweise auf Nichtlinearit¨aten zu, die in gewissem Sinne quadratisch sind, so dass das Restglied zweiter Ordnung verschwindet. Ein solches Beispiel ist die Steuerung von Navier-Stokes-Gleichungen in Abschnitt 5.10.2. Auch beim Phasenfeldmodell in Abschnitt 5.10.1 mit kubischer Nichtlinearit¨at gibt es keine Zwei-Norm-Diskrepanz.
5.8 Testaufgaben
235
Bei der Aufgabe (5.7)–(5.9) auf S. 215 mit den sehr allgemein gehaltenen Nichtlinearit¨ aten d(x, t, y) und b(x, t, y) kann die Zwei-Norm-Diskrepanz f¨ ur folgende Konstellation ausgeschlossen werden: Verteilte Steuerung mit passendem Zielfunktional und eindimensionalem Ortsgebiet Ω = (0, ). Wir nehmen als Beispiel die Aufgabe min
T
φ x, y(x, T ) dx+ 0
0
ψ1 t, y(0, t))+ψ2 t, y(, t)) dt+
T
ϕ(x, t, y, v) dxdt 0
0
bei yt (x, t) − yxx (x, t) + d(x, t, y(x, t)) −yx (0, t) + b1 (t, y(0, t)) yx (, t) + b2 (t, y(, t)) y(x, 0)
= = = =
v(x, t) 0 0 y0 (x)
in in in in
(0, ) × (0, T ) (0, T ) (0, T ) (0, )
und den Steuerungsbeschr¨ ankungen va (x, t) ≤ v(x, t) ≤ vb (x, t). Damit die Zwei-Norm-Diskrepanz nicht ins Spiel kommt, muss die Zielfunktion bez¨ uglich v linear-quadratisch sein. Deshalb fordern wir von ϕ folgende Form: ϕ(x, t, y, v) = ϕ1 (x, t, y) + ϕ2 (x, t, y) v + λ(x, t) v 2 .
(5.50)
F¨ ur d = 0 sowie b1 = b2 = 0, also f¨ ur die lineare parabolische Gleichung, werden rechte ¯ abgebildet, falls r > Seiten v der Differentialgleichung aus Lr (Q) nach W (0, T ) ∩ C(Q) N/2 + 1 gilt und y0 stetig ist. F¨ ur N = 1 und r = 2 ist das erf¨ ullt. Deshalb kann man durch leichte Modifikation des Beweises von Satz 5.15 auf S. 227 zeigen, dass die Steuerungs-Zustands-Abbildung G zweimal stetig Fr´echet-differenzierbar von L2 (Q) nach ¯ ist. (Die dort verwendeten linearen Operatoren werden definiert als W (0, T ) ∩ C(Q) ¯ → Y .) GQ : L2 (Q) → Y , GΣ : L∞ (Σ) → Y und GΩ : C(Ω) Folglich kann bei verteilter Steuerung und eindimensionalem Ortsgebiet mit Steuerungen ur Randsteuerung trifft das leider nicht zu. aus L2 (Q) gearbeitet werden. F¨ Durch sinngem¨ aße Modifikation von Voraussetzung 5.6 von S. 214 auf den hier gegebenen eindimensionalen Fall findet der Leser leicht die Glattheitsbedingungen, welchen die ugen m¨ ussen, damit das Zielfunktional zweimal stetig Fr´echetFunktionen φ, ϕi , ψi gen¨ ¯ × L2 (Q) ist, Ubungsaufgabe ¨ differenzierbar in C(Q) 5.3. Insbesondere muss λ beschr¨ankt und messbar sein und λ(x, t) ≥ δ > 0 gefordert werden, denn sonst ist eine hinreichende Optimalit¨ atsbedingung zweiter Ordnung nicht erf¨ ullbar. Es gilt dann die Aussage von Satz 5.17 mit L2 (Q) an Stelle von L∞ (Q).
5.8 Testaufgaben Wir diskutieren zwei Testaufgaben f¨ ur nichtlineare parabolische Steuerungsprobleme, bei denen hinreichende Optimalit¨ atsbedingungen f¨ ur die konstruierte L¨osung erf¨ ullt sind. Dazu gehen wir nach dem gleichen Prinzip wie bei elliptischen Aufgaben vor: Die optimalen
236
5 Steuerung semilinearer parabolischer Gleichungen
Gr¨ oßen u ¯, y¯ und der zugeh¨ orige adjungierte Zustand p werden a priori festgelegt. Danach passt man gewisse lineare Anteile am Zielfunktional und konstante Terme in der Gleichung so an, dass das Optimalit¨ atssystem nebst einer hinreichenden Optimalit¨atsbedingung zweiter Ordnung erf¨ ullt ist. Das erste Testbeispiel ist so konstruiert, dass die hinreichende Bedingung im gesamten Steuerungs-Zustands-Raum gilt. Im zweiten, komplizierteren Beispiel sind die hinreichenden Bedingungen nicht u ullt, sondern nur dort, wo die Steuerungsrestriktionen ¨berall erf¨ nicht stark aktiv sind. Außerdem ist eine integrale Zustandsrestriktion vorgegeben.
5.8.1 Testaufgabe mit Steuerungsrestriktionen Wir definieren die Aufgabe in Q = (0, ) × (0, T ), T 2 1 min J(y, u) := y(x, T ) − yΩ (x) dx − ay (t) y(, t) dt 2 0 0 T λ au (t) u(t) + u(t)2 dt + 2 0
(5.51)
bei yt (x, t) − yxx (x, t) −yx (0, t) yx (, t) + y(, t) y(x, 0)
= = = =
0 0 b(t) + u(t) − ϕ y(, t) a(x)
in in in in
(0, ) × (0, T ) (0, T ) (0, T ) (0, )
(5.52)
und 0 ≤ u(t) ≤ 1.
(5.53)
Dabei sind folgende Gr¨ oßen vorgegeben: √ π 2 2/3 = , T = 1, λ = (e − e1/3 ), ϕ(y) = y |y|3 4 2 √
2 1/3 e , yΩ (x) = (e + e−1 ) cos(x), ay (t) = e−2t , au (t) = 2
t 1 −4t e − e1/3 a(x) = cos(x), b(t) = e . − min 1, max 0, 2/3 4 e − e1/3
Das ist eine Optimalsteuerungsaufgabe f¨ ur die eindimensionale W¨armeleitgleichung mit Stefan-Boltzmann-Randbedingung. Es ist leicht nachzupr¨ ufen, dass folgende Funktionen gemeinsam die notwendigen Optimalit¨ atsbedingungen erster Ordnung erf¨ ullen:
et − e1/3 u ¯(t) = min 1, max 0, 2/3 e − e1/3 y¯(x, t) = e−t cos(x), p(x, t) = −et cos(x). Der adjungierte Zustand p ist als L¨ osung der adjungierten Gleichung −pt (x, t) − pxx (x, t) p (0, t) x px (, t) + 1 + ϕ y¯(, t) p(, t) p(x, T )
= = = =
0 0 −ay (t) y¯(x, T ) − yΩ (x)
(5.54)
5.8 Testaufgaben
237
¨ definiert. Die notwendigen Optimalit¨ atsbedingungen sind in Ubungsaufgabe 5.4 zu verifizieren. Insbesondere ist die Projektionsbeziehung f¨ ur u zu u berpr¨ u fen. Weitere Details ¨ kann man in [16] nachlesen, woraus diese Aufgabe stammt. Welche Idee liegt der Konstruktion von u ¯ zugrunde? Eine interessante optimale Steuerung sollte sowohl die untere als auch die obere Schranke annehmen und diese beiden glatt verbinden. Laut Projektionsbeziehung muss u ¯ auf inneren Teilst¨ ucken ein Vielfaches des adjungierten Zustands p sein. Exponentialfunktionen der Zeit eignen sich gut f¨ ur explizite L¨ osungen der W¨ armeleitungsgleichung, insbesondere f¨ ur p. Das f¨ uhrt nach Anpassung von Konstanten zur obigen Wahl von u¯. Diese Funktion ist auf S. 246 graphisch dargestellt. Zum Nachweis der lokalen Optimalit¨ at zeigen wir, dass eine hinreichende Optimalit¨atsbedingung zweiter Ordnung erf¨ ullt ist. Die Lagrangefunktion lautet formal L
T = J(y, u) − yt − yxx p dxdt − y(x, 0) − a(x) p(x, 0) dx 0 0 0 T T + yx (, t) + y(, t) − b(t) − u(t) p(, t) dt yx (0, t) p(0, t) dt − 0 0 T − ϕ y(, t) p(, t) dt 0
und ist ein Spezialfall der f¨ ur allgemeinere Randsteuerungsaufgaben auf S. 233 eingef¨ uhrten Funktion. Hier ist Γ die zweielementige Menge {0, 1} und deshalb gilt
Σ
p ∂ν y dsdt
T
= 0 T =
p(0, t)∂ν y(0, t) + p(, t)∂ν y(, t) dt
− p(0, t)yx (0, t) + p(, t)yx (, t) dt.
+
λ u2L2 (0,T )
0
Wir erhalten wegen ϕ (y) = 12 y 2
2
L (¯ y, u ¯, p)(y, u) =
y(T )2L2 (0,)
− 12
T
p(, t) y¯(, t)2 y(, t)2 dt.
0
Aus p(x, t) ≤ 0 folgt L (¯ y, u ¯, p)(y, u)2 ≥ λ u2L2 (0,T )
(5.55)
f¨ ur alle quadratisch integrierbaren Funktionen y, u. Aus Satz 5.18 folgt deshalb zun¨achst die lokale Optimalit¨ at von u ¯ im Sinne von L∞ (0, T ). Die hinreichenden Bedingungen zweiter Ordnung sind aber in einer sehr starken Form erf¨ ullt. Daher verwundert die folgende Aussage nicht: Satz 5.19 Das oben definierte Paar (¯ y, u ¯) ist (global) optimal f¨ ur (5.51)–(5.53). Beweis: Es sei (y, u) irgendein anderes zul¨ assiges Paar. F¨ ur das reduzierte Funktional f haben wir dann unter Beachtung der Variationsungleichung mit einem θ ∈ (0, 1) 1 u + θ(u − u ¯))(u − u ¯ )2 . f (u) ≥ f (¯ u) + f (¯ 2
238
5 Steuerung semilinearer parabolischer Gleichungen
Wie in Formel (5.44) auf S. 231 gilt u + θ(u − u ¯))(u − u ¯)2 = L (yθ , uθ , pθ )(y, u − u ¯ )2 f (¯ T ≥− pθ (, t) ϕ yθ (, t) y(, t)2 dt, 0
¯ + θ(u − u ¯) ist, yθ der zugeh¨ orige Zustand, pθ der adjungierte Zustand und wobei uθ = u y die L¨ osung der bei yθ linearisierten Gleichung zur Steuerung u − u ¯. Die Behauptung des Satzes, f (u) ≥ f (¯ u), folgt aus der Nichtnegativit¨at von ϕ und der Eigenschaft, dass alle m¨ oglichen adjungierten Zust¨ ande pθ nichtpositiv sind. Wir skizzieren die erforderlichen Details: Ist uθ eine beliebige Steuerung aus Uad , dann gilt f¨ ur den zugeh¨ origen Zustand yθ die Ungleichung ¯ yθ (x, T ) − yΩ (x) < 0 ∀x ∈ Ω. √ Zun¨ achst sieht man yΩ ≥ (e + e−1 ) cos(π/4) > 3 2/2 > 2, b(t) + uθ (t) ≤ 1.25, y0 (x) = cos(x) ≤ 1. Außerdem findet man aus Vergleichsprinzipien wie in [176], dass wegen Nichtnegativit¨ at aller vorgegebenen Daten der Zustand yθ nichtnegativ ist, daher yθ3 |yθ | = 4 yθ ≥ 0. Daraus folgt (yθ,x + yθ )(, t) = b(t) + u(t) − yθ4 (, t) ≤ 1.25. Das Maximum der L¨ osung der linearen parabolischen Randwertaufgabe mit Randbedingung yθ,x + yθ = 1.25 kann nur auf dem Rand oder am Anfang angenommen werden. Daher gilt yθ ≤ max(1, 1.25) = 1.25 und somit yθ (x, T ) − yΩ ≤ 1.25 − 2 < 0. Setzt man diese Informationen mit yθ an Stelle von y¯ in (5.54) ein, dann stehen auf der rechten Seite nichtpositive Funktionen und es gilt 1 + ϕ (yθ ) ≥ 0 in der Randbedingung. Daher muss die L¨ osung pθ der adjungierten Gleichung nichtpositiv sein.
5.8.2 Aufgabe mit integraler Zustandsrestriktion * In [163] wurde folgendes Optimalsteuerungsproblem numerisch auf hinreichende Bedingungen zweiter Ordnung untersucht: 2 1 λ T 2 min J(y, u) := α(x, t) y(x, t) − yQ (x, t) dxdt + u (t) dt 2 2 0 Q (5.56) T + ay (t) y(, t) + au (t) u(t) dt 0
bei yt (x, t) − yxx (x, t) yx (0, t) yx (, t) + y(, t)2 y(x, 0)
= = = =
eQ 0 eΣ (t) + u(t) 0
in in in in
Q (0, T ) (0, T ) (0, )
(5.57)
sowie Beschr¨ ankungen an Steuerung und Zustand 0 ≤ u(t) ≤ 1 f.¨ u. in (0, T ), y(x, t) dxdt ≤ 0. Q
(5.58) (5.59)
5.8 Testaufgaben
239
Dabei sind T > 0 und λ > 0 fixiert, Q = (0, ) × (0, T ). Die Funktionen α, yQ , eQ ∈ L∞ (Q) sowie ay , au , eΣ ∈ L∞ (0, T ) sind vorgegeben. Wie bisher bezeichnet Uad = u ∈ L∞ (0, T ) : 0 ≤ u(t) ≤ 1 f.¨ u. in (0, T ) die Menge der zul¨assigen Steuerungen. Die Nichtlinearit¨at y 2 ist nicht monoton. Wir k¨ onnten diese Schwierigkeit durch die Betrachtung der Funktion y |y| umgehen, um Existenz und Eindeutigkeit des Zustands y zu garantieren. Da wir aber eine nichtnegative L¨ osung konstruieren, ist das hier ohne Belang. Notwendige Bedingungen erster Ordnung Die Steuerung u ¯ sei lokal optimal f¨ ur die obige Aufgabe, y¯ der zugeh¨orige Zustand. Hier ist zus¨ atzlich zu den Restriktionen an die Steuerfunktion noch eine Zustandsbeschr¨ankung gegeben. Deshalb sind die bisher behandelten notwendigen Optimalit¨atsbedingungen auf diese Aufgabe nicht direkt anwendbar. Wir werden im letzten Kapitel die sogenannten Karush-Kuhn-Tucker-Bedingungen herleiten, die unter einer Regularit¨atsvoraussetzung gelten. Die Testl¨ osung wird so konstruiert, dass diese Bedingungen erf¨ ullt sind: Es exi¯ und ein stieren nach Satz 6.3 auf S. 260 ein adjungierter Zustand p ∈ W (0, T ) ∩ C(Q) nichtnegativer Lagrangescher Multiplikator μ ∈ IR so dass die adjungierte Gleichung −pt − pxx px (0, t) px (, t) + 2 y¯(, t) p(, t) p(x, T )
= = = =
α (¯ y − yQ ) + μ 0 ay (t) 0
in in in in
Q (0, T ) (0, T ) (0, )
(5.60)
sowie die Variationsungleichung
T 0
λu ¯(t) + p(, t) + au (t)
u(t) − u ¯(t) dt ≥ 0
∀u ∈ Uad
erf¨ ullt sind. Zus¨ atzlich muss die komplement¨are Schlupfbedingung y¯(x, t) dxdt = 0 μ
(5.61)
(5.62)
Q
gelten, siehe [47]. Die Aussage ergibt sich auch durch Anwendung von Satz 6.3 auf S. 260. Die Variationsungleichung (5.61) ist ¨ aquivalent zu
1 u ¯(t) = IP[0,1] − p(, t) + au (t) , (5.63) λ wobei IP[0,1] : IR → [0, 1] die punktweise Projektion auf [0, 1] bezeichnet. Auch diese Optimalit¨ atsbedingungen k¨ onnen aus dem formalen Lagrangeprinzip hergeleitet werden. Die Lagrangefunktion lautet hier L(y, u, p, μ) = J(y, u) − (yt − yxx − eQ ) p dxdt + μ y(x, t) dxdt Q Q T yx (, t) + y(, t)2 − u(t) − eΣ (t) p(, t) dt. − 0
240
5 Steuerung semilinearer parabolischer Gleichungen
Diese Definition geht davon aus, dass die homogenen Anfangs- und Randbedingungen an y im Zustandsraum verankert sind. Dann folgen die Bedingungen (5.60)–(5.61) aus Dy L(¯ y, u ¯, p, μ) y = 0 f¨ ur alle zul¨ assigen Inkremente y und Du L(¯ y, u ¯, p, μ) (u − u ¯) ≥ 0 f¨ ur alle u aus Uad . Zur Konstruktion des Testbeispiels werden die Daten wie folgt fixiert: T = 1, = π, λ = 0.004,
α0 ∈ IR, t ∈ [0, 1/4] α(x, t) = 1, t ∈ (1/4, 1], ⎧ 1 ⎪ (1 − (2 − t) cos x), t ∈ [0, 1/2] ⎨ α(x, t) yQ (x, t) = 1 ⎪ ⎩ (1 − (2 − t − α(x, t) (t − 1/2)2 )) cos x, t ∈ (1/2, 1], α(x, t)
0, t ∈ [0, 1/2] au (t) = λ + 1 − (1 + 2λ)t, ay (t) = 2(t − 1/2)2 (1 − t), t ∈ (1/2, 1],
0, t ∈ [0, 1/2] eQ (t) = (t2 + t − 3/4) cos x, t ∈ (1/2, 1],
0, t ∈ [0, 1/2] eΣ (t) = (t − 1/2)4 − (2t − 1), t ∈ (1/2, 1]. Satz 5.20 Mit den obigen Festlegungen gen¨ ugen die Gr¨oßen
0, t ∈ [0, 1/2] u ¯ = max{0, 2t − 1}, y¯ = (t − 1/2)2 cos x, t ∈ (1/2, 1] p
= (1 − t) cos x,
μ = 1
den notwendigen Optimalit¨atsbedingungen erster Ordnung f¨ ur die Aufgabe (5.56)-(5.59). Beweis: Dass Zustandsgleichung und adjungierte Gleichung erf¨ ullt sind, ist leicht nachzurechnen. Ungleichung (5.59) ist aktiv, weil das Integral von cos x u ¨ber [0, π] verschwindet. Deshalb ist die Komplementarit¨ atsbedingung (5.62) erf¨ ullt. Außerdem ist u ¯ zul¨assig. Es bleibt die Variationsungleichung (5.61) zu u ufen. Mit (5.63) finden wir ¨ berpr¨
1 < 0, t ∈ [0, 1/2) − p(π, t) + au (t) = 2t − 1 = > 0, t ∈ (1/2, 1]. λ Folglich gilt
IP[0,1]
1 − p(π, t) + au (t) = max 0, 2t − 1 = u ¯(t). λ
¨ Die Behauptung ergibt sich aus der Aquivalenz zwischen Variationsungleichung und dieser Projektionsbeziehung. Hinreichende Optimalit¨ atsbedingungen zweiter Ordnung Um stark aktiver Restriktionen zu ber¨ ucksichtigen, f¨ uhren wir zu gegebenem τ > 0 die Menge Aτ (¯ u) = t ∈ (0, T ) : |λ u ¯(t) + p(, t) + au (t)| > τ
5.8 Testaufgaben
241
ein. Wegen der Variationsungleichungen muss auf Aτ (¯ u) je nach Vorzeichen von u ¯(t) + p(, t) + au (t) eine der Gleichungen u ¯(t) = 0 oder u ¯(t) = 1 gelten. Die zweite Ableitung L ist T L (¯ − 2 p(, t) y(, t)2 + λ u2 (t) dt. y, u ¯, p, μ)(y, u)2 = α y 2 dxdt + (5.64) 0
Q
Wir nehmen weiter an, dass die Zustandsrestriktion (5.59) wie im Beispiel aktiv ist. Anderenfalls ist diese Nebenbedingung bedeutungslos und die hinreichenden Bedingungen fallen mit denen f¨ ur reine Steuerungsrestriktionen zusammen. Die hinreichende Optimalit¨ atsbedingung zweiter Ordnung lautet: Es existieren δ > 0 und τ > 0, so dass L (¯ y, u ¯, p, μ)(y, u)2 ≥ δ
T
u2 dt
(5.65)
0
ugen: f¨ ur alle y ∈ W (0, T ), u ∈ L2 (0, T ) gilt, die folgenden Beziehungen gen¨ yt − yxx yx (0, t) yx (, t) + 2 y¯(, t) y(, t) y(x, 0) u(t) = 0, u(t) ≥ 0, u(t) ≤ 0,
= = = =
0 0 u(t) 0,
falls t ∈ Aτ (¯ u) falls u ¯(t) = 0 und t ∈ / Aτ (¯ u) falls u ¯(t) = 1 und t ∈ / Aτ (¯ u), y(x, t) dxdt = 0.
(5.66)
(5.67)
Q
Wir fordern (5.65) f¨ ur alle (y, u) mit (5.66)–(5.67). Hinreichende Bedingungen im Testbeispiel Unsere Testl¨ osung (¯ y, u ¯) erf¨ ullt diese Bedingungen. Nach Konstruktion nimmt u¯ auf [0, 1/2) die untere Grenze 0 and und ist dort stark aktiv, denn f¨ ur b < 1/2 und t ∈ [0, b] gilt λu ¯(t) + p(π, t) + au (t) = p(π, t) + au (t) = −λ (2t − 1) > −λ (2b − 1). ¨ Daraus folgt [0, b] ⊂ Aτ (¯ u) f¨ ur τ = |λ(2b − 1)|. Zur Uberpr¨ ufung der hinreichenden Bedingungen zweiter Ordnung gen¨ ugt der Nachweis der Definitheitsbedingung (5.65) f¨ ur alle (y, u), welche die linearisierte Gleichung (5.66) erf¨ ullen sowie u = 0 auf [0, b], 0 < b < 1/2 beliebig aber fest. Die Wahl von α steht uns noch frei. Wir setzen
α(x, t) =
α0 , 1,
0≤t≤b b < t ≤ 1.
(5.68)
Satz 5.21 Es sei α nach (5.68) gew¨ahlt mit b ∈ [0, 1/2). Dann wird die hinreichende Bedingung zweiter Ordnung f¨ ur beliebiges α0 ∈ IR durch (¯ y, u ¯, p, μ) erf¨ ullt.
242
5 Steuerung semilinearer parabolischer Gleichungen
Beweis: Wir w¨ ahlen (y, u) so, dass u auf [0, b] verschwindet und y Gleichung (5.66) gen¨ ugt. Dann haben wir y(x, t) = 0 auf [0, b]. F¨ ur L erhalten wir deshalb π 1 1 1 L (¯ y, u ¯, p, μ)(y, u)2 = y 2 dxdt + λ u2 dt − 2 p(π, t) y(π, t)2 dt 0 0 b 0 1 1 1 ≥ λ − (1 − t) y(π, t)2 dt ≥ λ u2 dt − 2 u2 dt, 0
0
0
(5.69)
woraus die Definitheitsbedingung (5.65) folgt. Wir haben α0 nicht als positiv vorausgesetzt. F¨ ur α0 ≥ 0 w¨are L auf ganz W (0, 1) × 2 L (0, 1) gleichm¨ aßig positiv und damit die Definitheitsbedingung in einem sehr starken Sinn erf¨ ullt. Jetzt w¨ ahlen wir α0 teilweise negativ, so dass L indefinit wird. Satz 5.22 Ist α0 < 0 hinreichend klein, dann existiert ein Paar (y, u) mit folgenden Eigenschaften: u ≥ 0, y l¨ost die linearisierte Gleichung (5.66), und es gilt L (¯ y, u ¯, p, μ)(y, u)2 < 0.
(5.70)
Beweis: Wir fixieren b ∈ (0, 1/2) und setzen
1 auf [0, b] u(t) = 0 auf (b, 1]. πb Dann kann y nicht identisch verschwinden, also gilt 0 0 y 2 dxdt > 0. Es folgt π b y 2 dxdt → −∞ α0 0
(5.71)
0
ur hinreichend kleines α0 , weil zum f¨ ur α0 → −∞. Der Ausdruck (5.69) wird negativ f¨ ersten Integral der Ausdruck (5.71) hinzukommt. F¨ ur numerische Zwecke braucht man eine grobe Absch¨atzung, wie klein α0 zu w¨ahlen ist, damit L (¯ y, u ¯, p, μ)(y, u)2 negativ wird, d.h. π b 1 1 π 1 α0 y 2 dxdt + 2 (1 − t) y 2 (π, t) dt + λ u2 dt < 0. y 2 dxdt + 0
0
0
Wir fordern daher π1 |α0 | >
0
b
y 2 dxdt +
b
0
0
1
1
0
0
2(1 − t)y 2 (π, t) dt + λ πb y 2 dxdt 0 0
u2 dt
=
I1 + I2 + I3 . I0
(5.72)
Hier kann b ∈ [0, 1/2) beliebig gew¨ ahlt werden, z.B. b = 1/4. In diesem Fall werten wir die Integrale Ij aus f¨ ur
1 auf [0, 1/4] u(t) = 0 auf (1/4, 1]. Der Zustand y l¨ost mit (5.66) die homogene W¨armeleitgleichung mit homogener Anfangsbedingung, homogener Randbedingung bei x = 0 und
1 auf [0, 1/4] yx (π, t) = −2 y¯(π, t) auf (1/4, 1].
5.9 Numerische Verfahren
243
Eine numerische Auswertung der Integrale Ij , j = 0, .., 3, bringt I0 = 0.0103271, I1 = 0.0401844, I2 = 0.0708107, I3 = 0.001 und damit I1 + I2 + I3 = 10.845. I0 In diesem Beispiel sind die hinreichenden Bedingungen zweiter Ordnung erf¨ ullt, obwohl die Bilinearform L (¯ y, u ¯, p, μ) nicht im ganzen Raum der Definitheitsbedingung gen¨ ugt. Es existieren Bereiche negativer Definitheit, in denen aber die Steuerungsrestriktionen stark aktiv sind. Hier wurde das durch eine analytische Konstruktion gesichert. Es stellt sich die Frage, ob man hinreichende Bedingungen zweiter Ordnung numerisch nachpr¨ ufen kann, denn die L¨ osung ist in der Regel nicht analytisch zu ermitteln. Eine numerische L¨ osung der Aufgabe muss mit Hilfe einer Diskretisierung erfolgen, z.B. mit finiten Differenzen f¨ ur die Zeit- und finiten Elementen f¨ ur die Ortsvariable. F¨ ur die diskretisierte Aufgabe kann man die sogenannte reduzierte Hesse-Matrix bestimmen (das ist die Hesse-Matrix des Zielfunktionals in Bezug auf die diskrete Steuerung u, wenn y mit Hilfe der diskretisierten linearisierten Gleichung eliminiert wird. Sie ber¨ ucksichtigt gleichzeitig die aktiven Restriktionen, siehe Kelley [120]). Sind die Eigenwerte dieser Matrix hinreichend positiv, dann kann man erwarten, dass die hinreichenden Bedingungen erf¨ ullt sind. Allerdings liefert diese Methode keinen Beweis, dass dies wirklich so ist. Numerisch getestet wurde dieses Verfahren in [163].
5.9 Numerische Verfahren Alle in diesem Abschnitt behandelten numerische Methoden beziehen sich auf die Aufgabe (5.7)–(5.9), min J(y, v, u) := φ x, y(x, T ) dx + ϕ x, t, y(x, t), v(x, t) dxdt Ω Q + ψ x, t, y(x, t), u(x, t) dsdt, Σ
yt − Δy + d(x, t, y) = v ∂ν y + b(x, t, y) = u y(0) = y0
in Q in Σ in Ω,
va (x, t) ≤ v(x, t) ≤ vb (x, t) ua (x, t) ≤ u(x, t) ≤ ub (x, t)
in Q in Σ.
Wir schreiben die Verfahren nur formal auf. Alle gegebenen Funktionen und Daten seien so glatt, dass die im Weiteren aufgeschriebenen Terme korrekt definiert sind.
5.9.1 Gradientenverfahren Zuerst diskutieren wir das in Kapitel 2 eingef¨ uhrte Gradienten-Projektionsverfahren und definieren dazu die reduzierte Zielfunktion f (v, u) = J(y(v, u), v, u). Die Ableitung von
244
5 Steuerung semilinearer parabolischer Gleichungen
f berechnet man an einer festen Stelle (vn , un ) mit dem adjungierten Zustand pn gem¨aß ψu (x, t, yn , un ) + pn u dsdt. ϕv (x, t, yn , vn ) + pn v dxdt + f (vn , un ) (v, u) = Σ
Q
Dabei ist pn der adjungierte Zustand, die L¨ osung von −pt − Δp + dy (x, t, yn ) p = ϕy (x, t, yn , vn ) ∂ν p + by (x, t, yn ) p = ψy (x, t, yn , un ) p(x, T ) = φy x, yn (x, T ) .
(5.73)
Die Steuerungen u1 , . . . , un , v1 , . . . , vn seien bereits bestimmt. Das n¨achste Paar von Steuerungen (vn+1 , un+1 ) ergibt sich wie folgt: S1
Berechne den Zustand yn = y(vn , un ) als L¨osung von yt − Δy + d(x, t, y) = vn ∂ν y + b(x, t, y) = un y(0) = y0 .
S2
Bestimme den adjungierten Zustand pn aus der adjungierten Gleichung (5.73).
S3
Abstiegsrichtungen:
S4
Schrittweitenbestimmung: Bestimme sn aus min f IPV (vn + s hn ), IPU (un + s rn ) .
hn := −(ϕv (·, yn , vn ) + pn ), rn := −(ψu (·, yn |Σ , un ) + pn |Σ )
s>0
Hier bezeichnen IPV bzw. IPU die bereits mehrmals verwendeten punktweisen Projektionsoperatoren auf die zul¨ assigen Mengen Vad bzw. Uad , d.h. IPV = IP[va ,vb ] , IPU = IP[ua ,ub ] . S5 (Neue Steuerungen) (vn+1 , un+1 ) := IPV (un + sn hn ), IPU (vn + sn rn ) , n := n + 1; gehe zu S1. Bemerkungen. Im Gegensatz zum entsprechenden Verfahren f¨ur semilineare elliptische Gleichungen l¨ asst sich die nichtlineare Gleichung in Schritt S1 relativ leicht numerisch l¨ osen. Hier bieten sich semi-explizite Verfahren an: F¨ ur eine ¨ aquidistante Zerlegung ti = i τ mit τ = T /k, aherung von yn (x, ti ). Man bestimmt wi+1 (x) i = 0, . . . , k, bezeichne wi (x) die zu berechnende N¨ aus der linearen elliptischen Gleichung wi+1 − τ Δwi+1 ∂ν wi+1
= =
wi − τ d(x, ti+1 , wi ) + τ vn (·, ti+1 ) −b(x, ti+1 , wi ) + un (·, ti+1 )
in Ω auf Γ
f¨ ur i = 0, . . . , k − 1. Damit sind k lineare elliptische Gleichungen zu l¨ osen.
5.9.2 Das SQP-Verfahren Das SQP-Verfahren l¨ auft analog zum elliptischen Fall ab. Deshalb werden die einzelnen Schritte ohne ausf¨ uhrliche Erl¨ auterung beschrieben. Das Verfahren bezieht sich wieder auf die eben behandelte Aufgabe (5.7)–(5.9).
5.9 Numerische Verfahren
245
Die zuletzt bestimmten Iterierten seien vn , un , yn , pn . Dann ist im n¨achsten Schritt das folgende quadratische Optimalsteuerungsproblem zu l¨osen: ˜ v, u) min J(y,
bei
:= J (yn , vn , un )(y − yn , v − vn , u − un ) 1 + L (yn , vn , un , pn )(y − yn , v − vn , u − un )2 2
yt − Δy + d(x, t, yn ) + dy (x, t, yn )(y − yn ) ∂ν y + b(x, t, yn ) + by (x, t, yn )(y − yn ) y(0)
sowie
= v = u = y0
va (x, t) ≤ v(x, t) ≤ vb (x, t) in Q ua (x, t) ≤ u(x, t) ≤ ub (x, t) in Σ.
in Q in Σ in Ω,
(5.74)
(5.75)
(5.76)
Die Lagrangefunktion schreiben wir der K¨ urze halber formal auf, yt − Δy − d(x, t, y) − v p dxdt − ∂ν y + b(x, t, y) − u) p dsdt. L=J− Q
Σ
Nach Bildung der zweiten Ableitung fallen die nur formal richtigen Terme yt , −Δy und ∂ν y ohnehin weg. Die quadratische Zielfunktion J˜ ergibt sich nach etwas Rechnung als ˜ v, u) = J(y,
1 2 φy x, yn (·, T ) y(·, T ) − yn (·, T ) + φyy x, yn (·, T ) y(·, T ) − yn (·, T ) dx 2 Ω 1 y − yn ϕy y − yn ϕyy ϕyv y − yn + · + dxdt ϕ v − v v − v ϕ ϕ v − vn 2 v n n vy vv Q 1 y − yn ψy y − yn ψyy ψyu y − yn + · + dsdt ψu u − un ψuy ψuu u − un 2 u − un Σ 1 1 − pn dyy (x, t, yn )(y − yn )2 dxdt − pn byy (x, t, yn )(y − yn )2 dsdt, 2 2 Q Σ wobei die partiellen Ableitungen erster und zweiter Ordnung von ϕ und ψ ebenfalls von den Variablen (x, t, yn , vn ) bzw. (x, t, yn , un ) abh¨angen. Als L¨ osung der quadratischen Aufgabe (5.74)–(5.76) erh¨alt man (yn+1 , vn+1 , un+1 ). Diese Funktionen setzt man in die adjungierte Gleichung ein, aus der p = pn+1 bestimmt wird: Die Ableitung von J˜ nach y steht dort auf der rechten Seite, geordnet nach Integrationsgebieten. Die adjungierte Gleichung lautet deshalb −pt − Δp + dy (x, t, yn ) p = ϕy (x, t, yn , vn ) + ϕyy (x, t, yn , vn )(y − yn ) −pn dyy (x, t, yn )(y − yn ) ∂ν p + by (x, t, yn ) p = ψy (x, t, yn , un ) + ψyy (x, t, yn , un )(y − yn ) −pn byy (x, t, yn )(y − yn ) p(T ) = φy x, yn (·, T ) + φyy x, yn (·, T ) y(·, T ) − yn (·, T ) . Dieser adjungierte Zustand f¨ allt bei Anwendung des numerischen Verfahrens oft als Nebenprodukt mit an, so dass diese Gleichung nicht zus¨atzlich zu l¨osen ist. Das eben beschriebene SQP-Verfahren konvergiert lokal quadratisch im Sinne der L∞ -Normen von
246
5 Steuerung semilinearer parabolischer Gleichungen
y, v, u, p gegen eine lokale Referenzl¨ osung, sofern diese die hinreichenden Optimalit¨atsbedingungen zweiter Ordnung erf¨ ullt, siehe [197] und weitere dort zitierte Arbeiten. Beispiel. Die Testaufgabe (5.51)–(5.53) auf S. 236 wurde mit folgenden Startfunktionen gerechnet: u0 (t) ≡ y0 (x, t) ≡ p0 (x, t) ≡ 0.5. Die numerische L¨ osung der parabolischen Gleichung erfolgte durch ein implizites Differenzenverfahren bei Approximation der Randbedingung mit der Ordnung 2. Als Zeit- und Ortsschrittweite wurde 1/200 gew¨ ahlt und die Steuerfunktionen als st¨ uckweise konstant auf dem Zeitgitter angesetzt. Die Folgen der Steuerungen un (t) sowie der Randwerte yn (, t) sind in der Abbildung unten dargestellt. Bereits nach 4 Schritten war die Genauigkeit h¨oher als die numerisch f¨ ur die partiellen Differentialgleichung zu erwartende. Eine weitere Verfeinerung ergab graphisch keine Verbesserung mehr.
0.8
1 0.8
u2
0.6
u3 u4
0.6
u1
u0
y0 y2
0.4
0.4
y1
0.2
0.2 0 0
0.2
0.4
0.6
0.8
1
0
0
0.2
0.4
y3 , y4
0.6
0.8
1
Steuerungen un (t) und Randwerte yn (, t)
Literaturhinweise. Zur Konvergenzanalysis des projizierten Gradientenverfahrens verweisen wir auf [90] und [120]. Weitere g¨ angige Methoden zur L¨ osung diskretisierter Optimalsteuerungsprobleme sind detailliert in [90] dargestellt. Parabolische Aufgaben mit Box-Restriktionen an die Steuerung k¨ onnen sehr effizient mit dem projizierten Newtonverfahren gel¨ ost werden, vgl. zum Beispiel [108], [121], [122]; siehe auch [96]. ¨ Uber die Anwendung des SQP-Verfahrens berichten zahlreiche Arbeiten, insbesondere im parabolischen Fall, [80], [133], [141]. Schur-Komplement-Methoden zur effektiven Anwendung von SQP-Verfahren auf diskretisierte parabolische Probleme sind in [186], [149] dargestellt. Neben SQP-Verfahren gewinnen auch Trust-Region- und Innere-Punkte-Methoden sowie davon abgeleitete hybride Techniken zunehmend an Bedeutung f¨ ur die L¨ osung nichtlinearer parabolischer Aufgaben. Stellvertretend f¨ ur eine Vielzahl anderer Literaturstellen seien [202], [201], [207] ge¨ nannt. Weitere Literaturverweise findet man z.B. im Ubersichtsartikel [100]. Bei nichtlinearen parabolischen Aufgaben in mehrdimensionalen Ortsgebieten ist die Dimension der diskretisierten Probleme sehr hoch. Durch Modellreduktion kann man reduzierte Aufgaben wesentlich kleinerer Dimension aufstellen, die wichtige Eigenschaften des Ausgangsproblems widerspiegeln und dennoch relativ genau sind. Dazu geh¨ ort insbesondere die POD-Methode (POD f¨ ur proper orthogonal decomposition“), die insbesondere bei Str¨ omungsvorg¨ angen eine ” wichtige Hilfe ist. Diese Technik wird zum Beispiel in [3], [110], [131], [132] oder [205] angewendet.
5.10 Weitere parabolische Probleme *
247
Eine weitere, insbesondere f¨ ur lineare Gleichungen g¨ angige Methode der Modellreduktion ist balanced truncation“, siehe z.B. Antoulas [11] sowie das zugeh¨ orige Literaturverzeichnis. ”
5.10 Weitere parabolische Probleme * In diesem Abschnitt wird die Anwendbarkeit der bisher entwickelten Methoden auf allgemeinere semilineare parabolische Aufgaben skizziert. Dabei geht es nur um die prinzipielle Herangehensweise, ohne die theoretischen Details auszuarbeiten, die in Originalarbeiten nachzulesen sind und den vorgesehenen Rahmen dieses Buches sprengen w¨ urden. Die beiden Beispiele sollen auch verdeutlichen, dass letzten Endes jede Klasse nichtlinearer partieller Differentialgleichungen mit speziell auf sie zugeschnittenen Methoden behandelt werden muss.
5.10.1 Phasenfeldmodell Wir diskutieren hier ein Optimalsteuerungsproblem zum Phasenfeldmodell aus Abschnitt 1.3.2 und stellen das Optimalit¨ atssystem mit der formalen Lagrangetechnik auf. Ziel des Optimierungsprozesses soll die Approximation eines gew¨ unschten Temperaturverlaufs uQ (x, t) und Erstarrungsverlaufs ϕQ (x, t) sein: β λ α (u−uQ )2 dxdt+ (ϕ−ϕQ )2 dxdt+ f 2 dxdt (5.77) min J(u, ϕ, f ) := 2 2 2 Q Q Q bei ϕt 2 τ ϕt ∂ν u u(·, 0)
ut +
= κ Δu + f
in Q
= ξ 2 Δϕ + g(ϕ) + 2 u = 0, ∂ν ϕ = 0, = u0 , ϕ(·, 0) = ϕ0
in Q in Σ in Ω
(5.78)
und den Box-Restriktionen fa (x, t) ≤ f (x, t) ≤ fb (x, t)
f.¨ u. in Q.
(5.79)
Gegeben sind uQ , ϕQ ∈ L2 (Q), Konstanten α ≥ 0, β ≥ 0, λ ≥ 0, positive Konstanten , κ, τ, ξ, Funktionen u0 , ϕ0 ∈ L2 (Ω) und ein Polynom g = g(z) = a z + b z 2 − c z 3 mit beschr¨ ankten Koeffizientenfunktionen a(x, t), b(x, t) sowie c(x, t) ≥ c¯ > 0. Das Ortsgebiet Ω sei ein beschr¨ anktes C 2 −Gebiet mit Dimension N ∈ {2, 3}. Die Anfangsdaten u0 und ϕ0 sollen zu W 2,∞ (Ω) geh¨ oren und den Kompatibilit¨atsbedingungen ∂ν ϕ0 = ∂ν u0 = 0 auf Γ = ∂Ω gen¨ ugen. Die Steuerung ist die Temperaturquelle f ∈ L∞ (Q), Zust¨ande sind die Temperatur u und die Phasenfunktion ϕ. Die Zust¨ ande werden in R¨aumen ∂u ∂ 2 u ∂u Wp2,1 (Q) = u ∈ Lp (Q) : u, , , ∈ Lp (Q), i, j = 1, . . . , N ∂xi ∂xi ∂xj ∂t definiert, versehen mit einer entsprechenden Norm.
248
5 Steuerung semilinearer parabolischer Gleichungen
In [109] wurde gezeigt, dass das System parabolischer Gleichungen (5.78) f¨ ur q ≥ 2 zu jedem f ∈ Lq (Q), genau ein Paar von Zust¨ anden (ϕ, u) ∈ Wq2,1 (Q) × Wp2,1 (Q) mit ⎧ ⎨ p=
5q , 2 ≤ q < 5/2 und N = 3 5 − 2q ⎩ beliebig in IR , 5/2 ≤ q und N = 3 oder q ≥ 2 und N = 2 +
besitzt. Die Abbildung G : f → (u, ϕ) ist zweimal stetig Fr´echet-differenzierbar von F := L2 (Q) in Y := W21,2 (Q) × W21,2 (Q), [99]. Das liegt daran, dass der NemytskiiOperator ϕ(·, ·) → g(ϕ(·, ·)) zweimal stetig differenzierbar von W21,2 (Q) nach L2 (Q) ist. Diese Eigenschaft folgt aus der Einbettung W21,2 (Q) → L6 (Q) f¨ ur N ≤ 3 und aus der speziellen Form von g als Polynom dritten Grades in ϕ. Zur Herleitung der notwendigen Optimalit¨ atsbedingungen f¨ uhren wir die Lagrangefunktion nach dem im Abschnitt 3.1 erl¨ auterten Prinzip ein: L(u, ϕ, f, p, ψ) := J(u, ϕ, f ) − (ut + ϕt − f ) p + κ ∇u · ∇p dxdt 2 Q (τ ϕt − g(ϕ) − 2 u) ψ + ξ 2 ∇ϕ · ∇ψ dxdt. − Q
Die homogenen Neumann-Randbedingungen sind hier bereits ber¨ ucksichtigt. Wir definieren u. in Q Fad = f ∈ L2 (Q) : fa (x, t) ≤ f (x, t) ≤ fb (x, t) f.¨ als Menge der zul¨ assigen Steuerungen und erhalten mit der Lagrangetechnik folgende notwendige Optimalit¨ atsbedingungen erster Ordnung: Du L(¯ u, ϕ, ¯ f¯, p, ψ) u = 0 Dϕ L(¯ u, ϕ, ¯ f¯, p, ψ) ϕ = 0 ¯ Df L(¯ u, ϕ, ¯ f , p, ψ)(f − f¯) ≥ 0
∀u : u(0) = 0, ∀ϕ : ϕ(0) = 0, ∀f ∈ Fad .
Die homogenen Anfangsbedingungen f¨ ur die Richtungen u und ϕ gibt man vor, damit u ¯ + s u sowie ϕ ¯ + s ϕ f¨ ur s ∈ IR ebenfalls die Anfangsbedingungen erf¨ ullen. Die erste Bedingung ergibt nach partieller Integration in Bezug auf t α (¯ u − uQ ) u − p ut − κ ∇u · ∇p + 2 ψ u dxdt = 0 Q
f¨ ur alle u mit u(0) = 0. Das ist die schwache Formulierung der Gleichung −pt = κ Δp + 2 ψ + α (¯ u − uQ ) ∂ν p = 0 p(T ) = 0
in Q in Σ in Ω.
Analog folgt aus der zweiten Bedingung − pt − τ ψt = 2 ∂ν ψ = ψ(T ) =
ξ 2 Δψ + g (ϕ) ¯ ψ + β (ϕ¯ − ϕQ )
in Q
0 0
in Σ in Ω.
5.10 Weitere parabolische Probleme *
249
Die dritte Bedingung liefert die Variationsungleichung (λf¯ + p)(f − f¯) dxdt ≥ 0 ∀f ∈ Fad . Q
Davon k¨ onnen wieder punktweise Minimumprinzipien oder Projektionsbeziehungen abgeleitet werden. Weitere Details sind in Originalarbeiten nachzulesen. Literaturhinweise. Die Existenz optimaler Steuerungen und notwendige Optimalit¨atsbedingungen erster Ordnung wurden in [109] hergeleitet, die Anwendung des Gradientenverfahrens zur numerischen L¨ osung des Problems in [56] beschrieben. Hinreichende Optimalit¨ atsbedingungen zweiter Ordnung sowie die Konvergenz des SQP-Verfahrens werden in [99] behandelt. Die Zwei-Norm-Diskrepanz tritt dabei nicht auf, weil die Nichtlinearit¨ at g nur ein Polynom dritten Grades ist. Es kann also im Raum Y := W21,2 (Q) × W21,2 (Q) × L2 (Q) gearbeitet werden. Die numerische L¨ osung eines konkreten optimal gesteuerten Erstarrungsproblems ist in [97] sowie [98] dargestellt. Mit der Modellreduktion einer solchen Aufgabe befasst sich [205]. Die optimale Steuerung eines allgemeineren (thermodynamisch konsistenten) Phasenfeldmodells behandeln z.B. [188] und [140].
5.10.2 Instation¨ are Navier-Stokes-Gleichungen Problemstellung und Definitionen Die Beeinflussung von Str¨ omungen ist ein wichtiges und sehr aktives Forschungsgebiet, sowohl in der Mathematik als auch in den Ingenieurwissenschaften. Das große Interesse an solchen Aufgaben erw¨ achst aus weitreichenden Anwendungen. Zum Beispiel l¨asst sich die Umstr¨ omung von Tragfl¨ ugeln durch gesteuertes Einblasen oder Absaugen von Luft an deren Oberfl¨ ache verbessern. Mit Str¨ omungskontrolle kann man dem Abreißen der Wasserstr¨ omung um das Ruder eines Schiffes vorbeugen oder den von D¨ usentriebwerken erzeugten L¨ arm vermindern. Durch optimale Formgebung von Herzklappen lassen sich die Str¨ omungsverh¨ altnisse in k¨ unstlichen Herzen verbessern. Wir betrachten hier exemplarisch eine sehr vereinfachte Aufgabenstellung, bei der ein optimales Geschwindigkeitsfeld in einem Ortsgebiet Ω ⊂ IR2 durch in Ω wirkende steuerbare Kr¨ afte erzielt werden soll. Aufgaben dieses Typs treten zum Beispiel bei der Str¨omungskontrolle magneto-hydrodynamischer Prozesse auf. Mathematisch lautet die Aufgabe 1 u(x, t) − uQ (x, t)2 dxdt + λ f (x, t)2 dxdt min J(u, f ) := (5.80) 2 2 Q Q bei ut −
1 Δu + (u · ∇) u + ∇p = Re div u = u = u(·, 0) =
f
in Q
0 0 u0
in Q in Σ in Ω
(5.81)
und den Beschr¨ ankungen an die Steuerung f fa,i (x, t) ≤ fi (x, t) ≤ fb,i (x, t)
f.¨ u. in Q, i = 1, 2.
(5.82)
250
5 Steuerung semilinearer parabolischer Gleichungen
Wir beschr¨ anken uns dabei auf ein zweidimensionales Ortsgebiet Ω, weil nur hier Existenz und Eindeutigkeit einer L¨ osung u von (5.81) in befriedigender Weise gekl¨art sind. Gegeben sind zweidimensionale Vektorfunktionen uQ , fa , fb ∈ L2 (0, T ; L2 (Ω)2 ) mit fa (x, t) ≤ fb (x, t), ein divergenzfreies Vektorfeld u0 ∈ L2 (Ω)2 sowie Konstanten T > 0, λ ≥ 0, Re > 0. Die Kraftdichte f ∈ L2 (0, T ; L2 (Ω)2 ) ist die Steuerung, w¨ahrend der zugeh¨orige Zustand u physikalisch ein Geschwindigkeitsfeld darstellt. Die reellwertige Funktion p bezeichnet jetzt den Druck. In den Anwendungen ist die Reynoldszahl Re sehr groß, was die numerische L¨ osung von (5.81) sehr erschwert. Die Menge aller Steuerungen f ∈ L2 (0, T ; L2 (Ω)2 ), welche die obigen Restriktionen erf¨ ullen, fassen wir wie bisher zur Menge der zul¨ assigen Steuerungen Fad zusammen. Im Weiteren werden die R¨ aume V = v ∈ H 1 (Ω)2 : div v = 0 mit Skalarprodukt (u , v) =
2
∇ui · ∇vi
i=1
sowie H = v ∈ L2 (Ω)2 : div v = 0 verwendet. Die Forderung div v = 0 ist im Sinne von (v , ∇z) = 0 f¨ ur alle z ∈ H 1 (Ω)2 zu verstehen. Der Punkt · kennzeichnet wie bisher das Skalarprodukt in IR2 . Die abstrakte Formulierung der Zustandsgleichung erfolgt durch Einf¨ uhrung der Trilinearform b : V × V × V → IR,
b(u, v, w) = (u · ∇) v , w)L2 (Ω) =
2
Ω i,j=1
ui wj Di vj dx.
Es gilt b(u, v, w) = −b(u, w, v) sowie |b(u, v, w)| ≤ C uL4 (Ω)2 vH 1 (Ω)2 wL4 (Ω)2 , Temam [191]. Aus der ersten Beziehung folgt b(u, v, v) = 0. Wir verwenden den Raum W[0, T ] := {v = (v1 , v2 ) ∈ W (0, T )2 : div vi = 0, i = 1, 2}. Weiterhin bezeichnet ν wie bisher die Richtung der ¨außeren Normalen an Γ. In der Str¨ omungsmechanik steht diese aber f¨ ur die Viskosit¨at 1/Re. Da ν im Buch bereits f¨ ur die Normale vergeben ist, verwenden wir zur Bezeichnung der Viskosit¨at den Buchstaben κ, also κ := 1/Re. Analog zu der in Abschnitt 2.13.1 beschriebenen Weise erzeugt A u := −Δu eine lineare stetige Abbildung von L2 (0, T ; V ) in L2 (0, T ; V ∗ ). Außerdem ist der Operator B, definiert durch T T B(u)(t) , w(t) V ∗ ,V dt := b u(t), u(t), w(t) dt, 0
0
2
1
∗
eine Abbildung von L (0, T ; V ) in L (0, T ; V ). Definition. Eine Funktion u ∈ L2 (0, T ; V ) mit ut ∈ L1 (0, T ; V ∗ ) heißt schwache L¨osung des Anfangs-Randwertproblems (5.81), wenn sie folgenden Gleichungen im Sinne von L1 (0, T ; V ∗ ) gen¨ ugt: ut + κ A u + B(u) = f u(0) = u0 .
5.10 Weitere parabolische Probleme *
251
Satz 5.23 ([191]) Zu jedem Paar f ∈ L2 (0, T ; V ∗ ), u0 ∈ H existiert genau eine schwache L¨osung u der Gleichungen (5.81) in W(0, T ). Der Satz liefert also mehr als die geforderte Regularit¨at ut ∈ L1 (0, T ; V ∗ ). Man kann zeigen, dass die Steuerungs-Zustands-Abbildung G : f → u, G : L2 (0, T ; V ∗ ) → W(0, T ), zweimal Fr´echet-differenzierbar ist. Optimalit¨ atsbedingungen Die Herleitung von Optimalit¨ atsbedingungen erster und zweiter Ordnung kann nun prinzipiell mit den Methoden aus Kapitel 5 erfolgen. Dazu ist insbesondere die L¨osbarkeit der linearisierten Gleichung und die Regularit¨ at ihrer L¨osung zu kl¨aren und eine adjungierte Gleichung zu behandeln. Die entsprechende Theorie ist in Arbeiten zu finden, die am Ende des Abschnitts angegeben sind. An Stelle einer exakten Herleitung bedienen wir uns nochmals der formalen Lagrangetechnik, um die zu erwartenden notwendigen Bedingungen erster Ordnung herzuleiten. Diese stimmen mit den in der Literatur bewiesenen Bedingungen u ¨berein. Dazu definieren wir die Lagrangefunktion wie folgt: L(u, p, f, w, q) := J(u, f ) − ut − κ Δu + (u · ∇) u + ∇p − f · w dxdt Q + q div u dxdt. Q
Die homogene Randbedingung f¨ ur u f¨ uhren wir der K¨ urze halber implizit mit, jedoch nicht die Bedingung der Divergenzfreiheit (was auch m¨oglich w¨are). Nach dem formalen Lagrangeprinzip erwarten wir f¨ ur L an der Stelle (¯ u, p¯, f¯, w, q) die Beziehungen Du L = 0 f¨ ur alle zum Anfangszeitpunkt verschwindenden u, Dp L = 0 sowie Df L (f − f¯) ≥ 0 f¨ ur alle f aus Fad . Aus der zweiten Gleichung folgt ¯ 0 = Dp L(¯ u, p¯, f , w, q) p = − w · ∇p dxdt = − p w · ν dsdt + p div w dxdt Σ
Q
Q
f¨ ur alle hinreichend glatten p. W¨ ahlen wir p = 0 auf dem Rand, sonst aber beliebig, so folgt daraus div w = 0 in Q. Die zus¨ atzlich auf Σ folgende Beziehung w · ν = 0 wird wegen der unten erhaltenen Gleichung w|Σ = 0 erf¨ ullt sein. Aus Du L = 0 erhalten wir 0 = Du L(¯ u, p¯, f¯, w, q) u = (¯ u − uQ ) · u dxdt − w · ut dxdt Q Q (5.83) (¯ u · ∇) u + (u · ∇) u ¯ · w dxdt + q div u dxdt + κ w · Δu − Q
Q
Q
f¨ ur alle hinreichend glatten u mit u(0) = 0 und u|Σ = 0. Mit der dritten Greenschen Formel folgt wegen u|Σ = 0 w · Δu dxdt = Q
2 Q i=1
wi Δui dxdt =
2 Σ i=1
u · Δw dxdt.
wi ∂ν ui dsdt + Q
252
5 Steuerung semilinearer parabolischer Gleichungen
Außerdem gilt (¯ u · ∇) u + (u · ∇) u ¯ · w dxdt = b(¯ u, u, w) + b(u, u ¯, w) Q
= −b(¯ u, w, u) + b(u, u ¯, w) 2 = −u ¯i (Di wj ) uj + ui (Di u ¯j ) wj dxdt Q i,j=1 = − (¯ u · ∇) w · u + ((∇¯ u) w) · u dxdt Q
mit der Matrix ∇¯ u := (∇¯ u1 ∇¯ u2 ) und wegen u(0) = 0 w · ut dxdt = w(x, T ) u(x, T ) dx − u · wt dxdt. Ω
Q
Q
Nach Ber¨ ucksichtigung aller Umformungen ergibt sich aus (5.83) u ¯ − uQ + wt + κ Δ w − (∇¯ 0= u) w + (¯ u · ∇) w − ∇q · u dxdt Q 2 wi ∂ν ui dsdt − w(x, T ) u(x, T ) dx + Σ i=1
Ω
f¨ ur alle entsprechenden u. Wie bisher folgt daraus wegen der Freiheit der Wahl von u, u(T ) bzw. ∂ν in Q, Ω bzw. Σ die adjungierte Gleichung −wt − κ Δ w + (∇¯ u) w − (¯ u · ∇) w + ∇q div w w w(T )
= = = =
u ¯ − uQ 0 0 0
in in in in
Q Q Σ Ω.
Aus der Ableitung von L nach f folgt schließlich die Variationsungleichung λ f¯ + w · (f − f¯) dxdt ≥ 0 ∀f ∈ Fad . Q
Die L¨ osung (w, q) der adjungierten Gleichung ist als schwache L¨osung erkl¨art. Dabei ist w weniger regul¨ ar als bisweilen angenommen wird. Man erh¨alt den adjungierten Zustand w in W 4/3 (0, T ; V ) mit W 4/3 (0, T ; V ) = w ∈ L2 (0, T, V ) : wt ∈ L4/3 (0, T, V ∗ ) . Die Regularit¨ at w ∈ C([0, T ], H) ergibt sich nur unter Zusatzannahmen. Literaturhinweise. Theorie und Numerik der optimalen Str¨omungskontrolle stellen ein zur Zeit sehr aktives Forschungsgebiet dar. Entsprechend groß ist die Zahl von Arbeiten zu dieser Thematik. Eine der ersten grundlegenden Arbeiten zur Theorie notwendiger Optimalit¨ atsbedingungen erster Ordnung wurde f¨ ur diese Problemklasse war [1]. Neuere Arbeiten sind zum ¨ Beispiel [45], [92], [93], [104], [106], [180]. Zu nennen sind auch der Ubersichtsband [94] sowie
¨ 5.11 Ubungsaufgaben
253
die Monographie [91] zu numerischen Methoden. Den technisch schwierigeren Fall der Randsteuerung behandelt [107]. Hinreichende Optimalit¨ atsbedingungen zweiter Ordnung werden im Zusammenhang mit numerischen Methoden zum Beispiel in [104] sowie [106] verwendet und bei station¨ aren Aufgaben zum Nachweis der Lipschitzstetigkeit optimaler Steuerungen in Bezug auf St¨ orungen durch [181]. Eine Abschw¨ achung der Bedingungungen zweiter Ordnung unter Ber¨ ucksichtigung stark aktiver Steuerungsrestriktionen wird in [199] angegeben. Mit Modellreduktion durch POD-Methoden befassen sich [3], [132]. Verfahren zweiter Ordnung wie das SQP-Verfahren sind z.B. bei [104], [107] dargestellt. Neue Methoden der Gitteranpassung werden in [21] sowie ¨ im Ubersichtsartikel [22] vorgeschlagen. Zahlreiche weitere Beitr¨ age zur numerischen Analysis von Optimalsteuerungsproblemen werden in [108] dargestellt bzw. zitiert.
¨ 5.11 Ubungsaufgaben 5.1 Weisen Sie nach, dass die im Beweis von Satz 5.15 auf S. 227 definierte partielle Fr´echet¯ stetig invertierbar ist. Ableitung Fy (y, v, u) in C(Q) 5.2 Zeigen Sie f¨ ur die in Satz 5.17 auf S. 231 verwendete Funktion f (u) := J(y(u), u) die folgende Eigenschaft des Restglieds r2f zweiter Ordnung: v , h) r2f (¯ →0 h2L2 (Q)
f¨ ur hL∞ (Q) → 0.
5.3 Beweisen Sie, dass das Funktional Z Z T Z ` ´ ˘ ` ´ ` ´¯ J= φ x, y(x, T ) dx + ψ1 t, y(0, t) + ψ2 t, y( , t) dt + 0
0
0
Z
T
ϕ(x, t, y, v) dxdt 0
zweimal stetig Fr´echet-differenzierbar in C([0, ] × [0, T ]) × L2 (0, T ) ist, falls ϕ die Form ϕ(x, t, y, v) = ϕ1 (x, t, y) + ϕ2 (x, t, y) v + λ(x, t) v 2 hat, die Funktionen ψi und ϕi hinreichend glatt sind und λ beschr¨ ankt und messbar ist. 5.4 Verifizieren Sie, dass die in Testaufgabe (5.51)–(5.53) auf S. 236 definierten Funktionen u ¯, y¯, p gemeinsam die Zustandsgleichung (5.52), die adjungierte Gleichung (5.54) sowie die entsprechende Projektionsbeziehung f¨ ur u ¯ erf¨ ullen. 5.5 Untersuchen Sie den Nemytskii-Operator Φ : y → y 3 von H 1 (Ω) nach L2 (Ω) auf Existenz der ersten bzw. zweiten Fr´echet-Ableitung. Verwenden Sie dabei die Ergebnisse aus Abschnitt 4.3.3.
6 Optimierungsaufgaben im Banachraum 6.1 Karush-Kuhn-Tucker-Bedingungen 6.1.1 Konvexe Aufgaben Regel der Lagrangeschen Multiplikatoren Die in den vorangegangenen Abschnitten mehrfach erprobte formale Lagrangetechnik beruht auf einer mathematisch exakten Grundlage. Hier werden Grundz¨ uge dieser Theorie skizziert, so weit sie zum Verst¨ andnis der Behandlung von Aufgaben mit Zustandsbeschr¨ ankungen n¨ otig sind. Beweise und weitere S¨atze sind in B¨ uchern zur Optimierung in allgemeinen R¨ aumen zu finden. Die Theorie konvexer Aufgaben ist in Balakrishnan [18], Barbu und Precupanu [20], Ekeland und Temam [64] oder G¨opfert [81] dargestellt. Nichtkonvexe differenzierbare Probleme behandeln zum Beispiel Ioffe und Tichomirov [112], Jahn [116], Luenberger [147] oder Tr¨ oltzsch [196]. Zu endlichdimensionalen nichtlinearen Optimierungsproblemen gibt es eine Vielzahl von B¨ uchern, in denen die Theorie und numerische Verfahren im differenzierbaren Fall behandelt werden. Wir verweisen auf Alt [7], Gill et al. [74], Grossmann und Terno [88], Krabs [126], Kelley [120], Luenberger [148], Nocedal und Wright [169] oder Wright [212], um nur einige zu nennen. Im Weiteren seien U und Z reelle Banachr¨ aume, G : U → Z eine im Allgemeinen nichtlineare Abbildung und C ⊂ U eine nichtleere konvexe Menge. Definition. Eine konvexe Menge K ⊂ Z heißt konvexer Kegel, wenn mit jedem Element z ∈ K f¨ ur alle positiven λ ∈ IR auch λ z zu K geh¨ort , ∀λ > 0 : z ∈ K ⇒ λ z ∈ K. Durch konvexe Kegel kann man Halbordnungsrelationen ≥K wie folgt einf¨ uhren: Definition. Es sei K ⊂ Z ein konvexer Kegel. Wir schreiben z ≥K 0 genau dann, wenn z ∈ K. Analog ist z ≤K 0 durch −z ∈ K definiert. Die Elemente aus K werden als nichtnegativ“ angesehen. Die obige Definition l¨asst aber ” auch zu, dass Nichtnegativit¨ at im obigen Sinne nicht mit der nat¨ urlichen Nichtnegativit¨at u ¨bereinstimmt. Beispiel. Es sei Z = IR3 und K = {z ∈ IR3 : z1 = 0, z2 ≤ 0, z3 ≥ 0}. Offenbar ist K
6.1 Karush-Kuhn-Tucker-Bedingungen
255
ein konvexer Kegel, aber z ≥K 0 bedeutet nur f¨ ur z3 Nichtnegativit¨at.
Die n¨ achste Definition erm¨ oglicht es, auch in dualen R¨aumen den Begriff der Nichtne” gativit¨ at“ einzuf¨ uhren. Eine solche Konstruktion wird f¨ ur Lagrangesche Multiplikatoren ben¨ otigt, weil sie Elemente dualer R¨ aume sind. Definition. Es sei K ⊂ Z ein konvexer Kegel. Als den zu K dualen Kegel bezeichnet man die Menge K + = z ∗ ∈ Z ∗ : z ∗ , zZ ∗ ,Z ≥ 0 ∀z ∈ K . Beispiele. ankten Gebiet Ω ⊂ IRN und (i) Es sei Z = L2 (Ω) mit einem beschr¨ ur fast alle x ∈ Ω . K = z ∈ L2 (Ω) : z(x) ≥ 0 f¨ ¨ Hier gilt Z = Z ∗ nach dem Rieszschen Satz und K + = K, Ubungsaufgabe 6.1. (ii) Z sei ein beliebiger Banachraum und K = {0}. Dann gilt z ≥K 0 ⇔ z = 0 und man erh¨ alt K + = Z ∗ , denn f¨ ur jedes z ∗ ∈ Z ∗ gilt z ∗ , 0Z ∗ ,Z = 0 ≥ 0. (iii) Bei K = Z sind alle Elemente von Z nichtnegativ. Daraus folgt mit dem Nullfunktional 0 ∈ Z ∗ die Beziehung K + = {0}. Wir betrachten im Weiteren die Optimierungsaufgabe im Banachraum min f (u) (6.1) G(u) ≤K 0,
u ∈ C.
Die Restriktionen in (6.1) fassen wir unterschiedlich auf – als eine komplizierte“ Unglei” chung G(u) ≤K 0, die durch einen Lagrangeschen Multiplikator eliminiert werden soll, und eine einfache“ Restriktion u ∈ C, die explizit ber¨ ucksichtigt wird. Davon leitet sich ” die folgende Definition ab: Definition. Die Funktion L : U × Z ∗ → IR, L(u, z ∗ ) = f (u) + z ∗ , G(u)Z ∗ ,Z , ∗
heißt Lagrangefunktion. Ein Punkt (¯ u, z ) ∈ U × K wenn die Ungleichungskette L(¯ u, v ∗ ) ≤ L(¯ u, z ∗ ) ≤ L(u, z ∗ )
+
(6.2)
wird Sattelpunkt von L genannt,
∀u ∈ C, ∀v ∗ ∈ K +
(6.3)
¯ geh¨origer Lagrangescher Multiplikator. erf¨ ullt ist. In diesem Falle heißt z ∗ zu u In den vorangegangenen Abschnitten zur optimalen Steuerung partieller Differentialgleichungen haben wir die Lagrangefunktion mit L bezeichnet. Zur Unterscheidung verwenden wir hier den Buchstaben L. Die Existenz von Sattelpunkten ist am leichtesten f¨ ur konvexe Optimierungsaufgaben zu beweisen. Definition. Ein Operator G, der einen Banachraum U in einen durch ≥K halbgeordneten Banachraum Z abbildet, heißt konvex bez¨ uglich ≤K , wenn Folgendes gilt: G(λ u + (1 − λ) v) ≤K λ G(u) + (1 − λ) G(v)
∀ u, v ∈ U, ∀ λ ∈ (0, 1).
6 Optimierungsaufgaben im Banachraum
256
Jeder lineare Operator ist konvex. Im Weiteren bedeutet die echte Ungleichung z 0 und ein u ˜ ∈ C existieren, so dass mit y = G (¯ u)(˜ u−¯ u) und y¯ = G(¯ u) ¯ y¯(x) + y(x) ≤ −ε ∀x ∈ Ω (6.57) gilt. Das so definierte y ist L¨ osung der linearisierten Gleichung −Δy + dy (x, y¯) y ∂ν y
= u ˜−u ¯ = 0
in Ω auf Γ.
Wir setzen also voraus, dass die Regularit¨ atsbedingung (6.57) erf¨ ullt ist, die wie erw¨ahnt (6.11) von S. 259 impliziert. Der Multiplikator z ∗ zur Beschr¨ankung y ≤ 0 kann mit einem ¯ identifiziert werden. Die Lagrangefunktion L zur Aufgabe (6.56) ist μ ∈ M (Ω) L(u, μ) = f (u) + G(u) dμ = f (u) + G(u) dμΩ + G(u) dμΓ , ¯ Ω
Ω
Γ
¯ auf Ω bzw. Γ sind. Satz 6.3 ergibt wobei μΩ und μΓ die Restriktionen von μ ∈ M (Ω) folgende notwendige Optimalit¨ atsbedingung: Lemma 6.6 Ist u ¯ lokale L¨osung von (6.56), welche die Regularit¨atsbedingung (6.57) ¯ so dass folgende erf¨ ullt, dann existiert ein nichtnegatives regul¨ares Borelmaß μ ∈ M (Ω), Beziehungen erf¨ ullt sind: Du L(¯ u, μ)(u − u ¯) ≥ 0 ∀ u ∈ C y¯(x) dμ(x) = 0. ¯ Ω
(6.58)
6.2 Steuerprobleme mit Zustandsbeschr¨ ankungen
275
Nach Einsetzen der Ableitung Du L der obigen Lagrangefunktion in (6.58) folgt f (¯ G (¯ u)(u − u ¯) dμΩ + G (¯ u)(u − u ¯) dμΓ ≥ 0 u)(u − u ¯) + Ω
(6.59)
Γ
f¨ ur alle u ∈ C. Daraus folgt: Lemma 6.7 Unter den gegebenen Voraussetzungen l¨ost u ¯ das lineare Optimalsteuerungsproblem min j(y, u) := ¯(x) u(x) dx ϕy x, y¯(x) y(x) dx + ψu x, u Ω Ω y(x) dμΩ (x) + y(x) dμΓ (x), + (6.60) Ω Γ −Δy + dy (x, y¯) y ∂ν y
= u, = 0.
ua (x) ≤ u(x) ≤ ub (x),
u) und Umstellen von (6.59) Beweis: Die Aussage folgt aus der Bildungsvorschrift f¨ ur G (¯ nach u ¯. Damit l¨ ost u ¯ eine konvexe Aufgabe, die nur noch Box-Restriktionen an die Steuerung enth¨ alt. Optimalit¨atsbedingungen k¨ onnen jetzt wie im letzten Teilabschnitt abgeleitet werden. Wir definieren den adjungierten Zustand p durch −Δp + dy (x, y¯) p = ∂ν p =
ϕy (x, y¯) + μΩ μΓ
in Ω auf Γ.
(6.61)
ur alle s < N/(N − 1). Mit p ist Nach Satz 7.7 existiert genau eine L¨ osung p ∈ W 1,s (Ω) f¨ die folgende Variationsungleichung erf¨ ullt: p(x) + ψu x, u ¯(x) u(x) − u ¯(x) dx ≥ 0 ∀u(·) ∈ C. (6.62) Ω
Damit sind die notwendigen Optimalit¨ atsbedingungen in Form einer Variationsungleichung f¨ ur u ¯ hergeleitet. Alternativ kann man die Variationsungleichung (6.62) durch Lagrangesche Multiplikatoren in Gleichungsform u uhren und alle Optimalit¨atsbe¨berf¨ dingungen als Karush-Kuhn-Tucker-System aufschreiben: Lagrangesche Multiplikatoren μa , μb zu den Box-Restriktionen an u ergeben sich durch μa (x) = (p(x) + ψu x, u ¯(x) + , ¯(x) − . μb (x) = (p(x) + ψu x, u Nach dem Einbettungssatz 7.1 auf S.277 sind diese punktweise definierten Multiplikatoren Funktionen aus Lq (Ω), q < N/(N − 2). Nun formen wir die Variationsungleichung in der bereits mehrfach vorgef¨ uhrten Weise in eine Gleichung nebst komplement¨aren ¨ Schlupfbedingungen um, Ubungsaufgabe 6.4. Insgesamt ergibt sich dann: Satz 6.8 Es sei u ¯ eine lokal optimale Steuerung f¨ ur die Aufgabe (6.52)–(6.55) mit zugeh¨origem Zustand y¯ und die Regularit¨atsbedingung (6.57) sei erf¨ ullt. Dann existieren ¯ und ein adjungierter Zustand μa , μb ∈ Lq (Ω) f¨ ur alle q < N/(N − 2), μ ∈ M (Ω) p ∈ W 1,s (Ω) f¨ ur alle s < N/(N − 1), so dass u = u ¯, y = y¯, p, μa , μb , μ dem folgenden Optimalit¨atssystem gen¨ ugen:
6 Optimierungsaufgaben im Banachraum
276
−Δy + d(x, y) ∂ν y
= u = 0
−Δp + dy (x, y) p = ∂ν p =
p + ψu (x, u) + μb − μa = 0 y(x) dμ(x) = 0 μ ≥ 0, ¯ Ω μa (x) ≥ 0, ua (x) − u(x) μa (x) = 0 u(x) − ub (x) μb (x) = 0 μb (x) ≥ 0,
ϕy (x, y) + μΩ μΓ
f.¨ u. in Ω, f.¨ u. in Ω.
Literaturhinweise. Zustandsbeschr¨ankungen sind durch vielf¨altige Anwendungen sehr wichtig und finden daher großes Interesse. Wir erw¨ ahnen exemplarisch nur einige der zahlreichen Arbeiten. Notwendige Optimalit¨ atsbedingungen erster Ordnung f¨ ur elliptische Aufgaben behandeln [5], [32], [33], [42], [44], Bedingungen zweiter Ordnung [47], [52], [55], [162]. Zahlreiche elliptische Probleme mit Zustandsbeschr¨ ankungen findet man in [164]. Im parabolischen Fall verweisen wir auf [46], [150], [151], [153], [175], [176], [196] f¨ ur Optimalit¨ atsbedingungen erster Ordnung und auf [79], [174], [51] f¨ ur solche zweiter Ordnung. Die Struktur Lagrangescher Multiplikatoren f¨ ur Zustandsbeschr¨ ankungen wird in [27] diskutiert. Fehlerabsch¨ atzungen bei FEM-Approximationen und Zustandsbeschr¨ ankungen untersuchen [48], [193]; siehe auch die ausf¨ uhrlichere Darstellung dieser Thematik in [108]. Numerische Techniken zur L¨ osung elliptischer zustandsbeschr¨ ankter Aufgaben bringen [27], [28], [89], [161], [162], [158], [157]. Parabolische Aufgaben behandeln [8], [9], [141], [195]. Numerische Verfahren der Optimalsteuerung partieller Differentialgleichungen werden detailliert in [108] und [115] besprochen. Weiterf¨ uhrende Literatur zur Optimalsteuerung. Die Theorie der Optimalsteuerung linear-quadratischer elliptischer, parabolischer und hyperbolischer Aufgaben wird umfassend im Standardwerk [144] entwickelt. Verschiedene praktische Anwendungen sind in [39], [40] dargestellt. Nichtlineare Aufgaben behandeln z.B. [19], [108], [143], [165], [164], [192] sowie, bezogen auf Str¨ omungsprobleme, [91]. Die Verwendung stark stetiger Halbgruppen an Stelle von schwachen L¨ osungen f¨ ur parabolische Probleme ist bei [24], [25], [68], [138], [139] zu finden. RiccatiTechniken zur L¨ osung des sogenannten Regelproblems sowie Resultate zur Steuerbarkeit und Beobachtbarkeit behandeln [138], [139] sowie [137]. Die Verwendung von Riccati-Operatoren ist auch in [24], [25] und Lions [144] dargestellt. Steuerbarkeit und Stabilisierbarkeit nichtlinearer partieller Differentialgleichungen sind der Gegenstand von [59].
¨ 6.3 Ubungsaufgaben 6.1 Bestimmen Sie den dualen Kegel K + zum Kegel K der fast u ¨berall nichtnegativen Funkur 1 ≤ p < ∞. tionen in Lp (Ω) f¨ 6.2 Weisen Sie nach, dass die in Beziehung (6.8) auf S. 258 definierten Funktionen μ1 und μ2 Lagrangesche Multiplikatoren zur optimalen Steuerung u ¯ der Aufgabe (6.7) sind. 6.3 Leiten Sie die notwendigen Optimalit¨ atsbedingungen erster Ordnung f¨ ur die auf S. 271 definierte Optimalsteuerungsaufgabe mit Maximumnorm-Funktional her. 6.4 Leiten Sie das in Satz 6.8 auf S. 275 angegebene Optimalit¨ atssystem mit Hilfe der Variationsungleichung (6.62) auf S. 275 her. 6.5 Weisen Sie nach, dass die elliptische Aufgabe (6.25)–(6.26) auf S. 263 f¨ ur jede L¨ osung (¯ y, u ¯) die Regularit¨ atsbedingung (6.15) auf S. 260 erf¨ ullt.
7 Erg¨ anzungen zu partiellen Differentialgleichungen 7.1 Einbettungss¨ atze Das Arbeiten mit Sobolewr¨ aumen wird wesentlich durch Einbettungs- und Spurs¨atze bestimmt, die wir hier bereitstellen. Dabei halten wir uns an Adams [2]. Satz 7.1 Es sei Ω ⊂ IRN ein beschr¨anktes Gebiet mit Lipschitzrand, 1 < p < ∞ sowie m eine nichtnegative ganze Zahl. Dann sind die folgenden Einbettungen definiert und stetig: Np – F¨ ur m p < N : W m,p (Ω) → Lq (Ω), falls 1 ≤ q ≤ ; N − mp – f¨ ur m p = N : W m,p (Ω) → Lq (Ω), falls 1 ≤ q < ∞; ¯ – f¨ ur m p > N : W m,p (Ω) → C(Ω). ur alle 1 ≤ q < ∞ und f¨ ur In Gebieten Ω ⊂ IR2 gilt damit H 1 (Ω) = W 1,2 (Ω) → Lq (Ω) f¨ Ω ⊂ IR3 folgt H 1 (Ω) → L6 (Ω). Die Glattheit von Randwerten kl¨art folgender Satz: ur m p < N der SpurSatz 7.2 Es sei m ≥ 1 ganz und Γ ein C m−1,1 -Rand. Dann ist f¨ −1) p . Bei m p = N ist er f¨ ur operator τ stetig von W m,p (Ω) in Lr (Γ), falls 1 ≤ r ≤ (N N −m p alle 1 ≤ r < ∞ stetig. Diese beiden S¨ atze folgen aus [2], S¨ atze 5.4 und 5.22. Wir verweisen auch auf [67] und [209]. Zusammenfassungen von Aussagen zu Sobolewr¨aumen findet man in [71], [72]. Zur Erweiterung der obigen S¨ atze auf nichtganze m verweisen wir auf [2], S¨atze 7.57, 7.53 und Bemerkung 7.56 sowie auf die umfassende Darstellung [194]. Durch Sobolewr¨aume gebrochener Ordnung erh¨ alt man eine genauere Charakterisierung der Spurabbildung. Mit Satz 7.53 aus [2] folgt f¨ ur ganzes m ≥ 1: Satz 7.3 Ist Ω ein C m -Gebiet und 1 < p < ∞, dann ist die Spurabbildung τ stetig von W m,p (Ω) auf W m−1/p,p (Γ). Damit gilt f¨ ur die Spurabbildung τ speziell τ : H 1 (Ω) → H 1/2 (Γ); τ ist sogar surjektiv. Beim Existenzbeweis f¨ ur optimale Steuerungen wendeten wir folgendes Resultat an: Satz 7.4 (Rellich) Ist Ω ein beschr¨anktes Lipschitzgebiet, 1 ≤ p < ∞ und m ≥ 1, dann sind beschr¨ankte Mengen aus W m,p (Ω) pr¨akompakt in W m−1,p (Ω).
7 Erg¨ anzungen zu partiellen Differentialgleichungen
278
Diese Eigenschaft bezeichnet man als kompakte Einbettung. Damit sind beschr¨ankte Mengen aus H 1 (Ω) pr¨ akompakt in L2 (Ω). Die obigen S¨atze gelten teilweise unter etwas schw¨ acheren Forderungen an den Rand Γ als angegeben (regul¨are R¨ander, R¨ander mit Kegelbedingungen), siehe z.B. [2], [72] oder [86].
7.2 Elliptische Gleichungen Wir erl¨ autern hier zun¨ achst den Beweis von Lemma 4.6 f¨ ur den Fall nichtglatter Koeffizienten des Differentialoperators in Lipschitzgebieten. Dann reichen wir die in Abschnitt 4.2 verwendeten Aussagen zur essentiellen Beschr¨anktheit der L¨osung des semilinearen elliptischen Randwertproblems (4.5) nach und stellen schließlich einen Existenzsatz f¨ ur elliptische Gleichungen mit Maßen als Daten bereit.
7.2.1 Elliptische Regularit¨ at und Stetigkeit von L¨ osungen Nach Lemma 4.6 ist die schwache L¨ osung y des linearen elliptischen Randwertproblems Ay +y ∂νA y
= f = g
¯ f¨ ur gegebene Daten f ∈ Lr (Ω) sowie g ∈ Ls (Γ) mit r > N/2, s > N − 1 stetig in Ω, 1 ¯ geh¨ ort also zu H (Ω) ∩ C(Ω). Das Lemma wurde auf Seite 152 unter der vereinfachenden Zusatzannahme bewiesen, dass sowohl die Koeffizienten aij als auch der Rand Γ von Ω hinreichend glatt sind. Es bleibt aber auch f¨ ur den auf Seite 30 eingef¨ uhrten elliptischen Differentialoperator A mit Koeffizienten aij ∈ L∞ (Ω) in beschr¨ ankten Lipschitzgebieten Ω richtig. Das l¨asst sich mit folgenden, mir von Herrn J. Griepentrog u ¨ bermittelten Informationen nachvollziehen: Es sei eine fast u ¨ berall nichtnegative Funktion c0 ∈ L∞ (Ω) mit c0 L∞ (Ω) = 0 gegeben. ¯ Ferner definieren wir einen elliptischen Im Weiteren setzen wir V := H 1 (Ω) und G := Ω. ∗ Operator L ∈ L(V ; V ) durch Ly , v V ∗ ,V =
Ω
N
aij (x)Di y(x)Dj v(x) + c0 (x)y(x)v(x) dx.
i,j=1
Dann hat das lineare elliptische Neumann-Randwertproblem Lu = F f¨ ur jedes Funktional F ∈ V ∗ genau eine L¨ osung y ∈ V . In Theorem 4.12 aus [83] wird gezeigt, dass man f¨ ur ω ∈ [0, N ] zwei Raumskalen von Sobolew-Campanato-R¨ aumen W01,2,ω (G) ⊂ V und Y −1,2,ω (G) ⊂ V ∗ mit folgender Eigenschaft finden kann: Es existiert eine Konstante ω ¯ =ω ¯ (Ω) ∈ (N − 2, N ), so dass die Einschr¨ ankung von L auf W01,2,ω (G) f¨ ur jedes ω ∈ [0, ω ¯ ) ein linearer Isomorphismus von W01,2,ω (G) auf Y −1,2,ω (G) ist.
Hierbei (d.h. im Falle homogener Neumann-Daten) stimmt W01,2,ω (G) mit dem SobolewCampanato-Raum W 1,2,ω (Ω) = u ∈ V : |∇u| ∈ L2,ω (Ω)
7.2 Elliptische Gleichungen
279
von Funktionen aus V u ¨berein, deren schwache Ableitungen zum Campanato-Raum L2,ω (Ω) geh¨ oren. Besonders interessant und entscheidend ist f¨ ur uns an dem oben genannten Regularit¨ atssatz, dass der Raum W01,2,ω (G) f¨ ur ω ∈ (N − 2, N ) und κ = (N − ω)/2 stetig in den H¨ older-Raum C 0,κ (G) eingebettet ist. Wir m¨ ussen uns nur davon u ¨ berzeugen, dass f und g unter den gegebenen Voraussetzungen in Y −1,2,ω (G) liegen. Wir brauchen also ω ∈ (N − 2, N ) f¨ ur diese Eigenschaft. Nach Theorem 3.9 aus [83] geh¨ oren zum Raum Y −1,2,ω (G) f¨ ur jedes ω ∈ [0, N ) all jene Funktionale F ∈ V ∗ , die sich in der Form m F , ϕ V ∗ ,V = fi (x)Di ϕ(x) dx + f (x)ϕ(x) dx + g(x)ϕ(x) ds(x) Ω i=1
Ω
Γ
darstellen lassen, wobei f1 , . . . , fn ∈ L2,ω (Ω),
f ∈ L2N/(N +2),ωN/(N +2) (Ω),
g ∈ L2(N −1)/nN,ω(N −1)/N (Γ),
gilt und die Zuordnung (f1 , . . . , fN , f, g) → F eine lineare stetige Abbildung vermittelt. Zur Anwendung ben¨ otigen wir den Zusammenhang zwischen den Campanato-R¨aumen und den u aumen, siehe hierzu auch Bemerkung 3.10 aus [83]: ¨ blichen Lebesgue-R¨ (i) F¨ ur q ≥ 2 und ωq = N (1 − 2/q) ist Lq (Ω) in L2,ωq (Ω) stetig eingebettet. Insbesondere gilt ωq > N − 2, falls q > N . (ii) Im Fall r ≥ 2N/(N + 2) und ωr = 2 + N (1 − 2/r) erhalten wir die stetige Einbettung von Lr (Ω) in L2N/(N +2),ωr N/(N +2) (Ω). Insbesondere folgt aus r > N/2 stets ωr > N − 2. (iii) F¨ ur s ≥ 2(N − 1)/N und ωs = 1 + (N − 1)(1 − 2/s) bettet Ls (Γ) stetig in 2(N −1)/N,ωs (N −1)/N L (Γ) ein. Daher folgt aus s > N − 1 stets ωs > N − 2. Die letzten beiden Bedingungen, also r > N/2 und s > N − 1 sind die Voraussetzungen unseres Lemmas 4.6.
7.2.2 Methode von Stampacchia Wir beweisen Satz 4.5 von S. 151, also die Beschr¨anktheit der L¨osung des elliptischen Problems (4.5) auf S. 147, A y + c0 (x) y + d(x, y) = f ∂νA y + α(x) y + b(x, y) = g
in Ω auf Γ.
(7.1)
Die dazu verwendete Stampacchia-Methode benutzt folgenden Hilfssatz, siehe Kinderlehrer und Stampacchia [123], Lemma B.1.: Lemma 7.5 Es sei ϕ eine auf [k0 , ∞) definierte nichtnegative und monoton nicht wachsende Funktion mit folgender Eigenschaft: F¨ ur alle h > k ≥ k0 gelte ϕ(h) ≤
C ϕ(k)b (h − k)a
mit Konstanten C > 0, a > 0 sowie b > 1. Dann ist ϕ(k0 + δ) = 0 erf¨ ullt mit ab
δ a = C ϕ(k0 )b−1 2 b−1 .
(7.2)
7 Erg¨ anzungen zu partiellen Differentialgleichungen
280
Beweis von Satz 4.5. Wir passen einen in [189] bzw. [123] f¨ ur homogene DirichletRandbedingungen ausgef¨ uhrten Beweis auf den hier gegegeben Fall an. (i) Vorbetrachtungen Existenz und Eindeutigkeit von y ∈ H 1 (Ω) folgen aus Satz (4.4) auf S. 149. Es sind noch die Beschr¨ anktheit sowie die Absch¨ atzung (4.10) auf S. 151 nachzuweisen. Man testet dazu die L¨ osung y von (4.5) in der Variationsformulierung mit dem Anteil, der betragsm¨ aßig gr¨ oßer als k ist und zeigt, dass dieser f¨ ur hinreichend großes k verschwindet. Im Satz wurden f¨ ur f bzw. g gewisse Integrabilit¨atsordnungen vorausgesetzt, die wir hier an Stelle von r und s mit r˜ bzw. s˜ bezeichnen wollen. Wir haben also f ∈ Lr˜(Ω) und g ∈ Ls˜(Γ) mit r˜ > N/2, s˜ > N − 1. Zun¨ achst setzen wir N ≥ 3 voraus und erl¨ autern am Ende des Beweises die Anpassungen im Fall N = 2. Wir fixieren ein λ > 1 hinreichend nahe an eins, so dass r˜ > r :=
N , N − λ(N − 2)
s˜ > s :=
N −1 N − 1 − λ(N − 2)
gilt. Haben wir den Satz f¨ ur r und s bewiesen, dann bleibt er auch f¨ ur alle r˜ > r und s˜ > s richtig. F¨ ur die zu r und s konjugierten Exponenten r und s ergibt sich 1 N −2 1 =1− =λ , r r N Unten verwenden wir die Einbettungen
1 1 N −2 =1− =λ . s s N −1
v Lp (Ω) ≤ c v H 1 (Ω) mit
1 p
=
1 2
−
1 N
v Lq (Γ) ≤ c v H 1 (Ω) mit
1 q
=
1 2
−
1 2(N −1)
=
N −2 2N
=
=
(7.3)
1 2λr ,
N −2 2(N −1)
=
1 2λs
(7.4)
und haben damit z.B. v L2r (Ω) ≤ c v H 1 (Ω) wegen 2r ≤ p. Analog folgt v L2s (Γ) ≤ c v H 1 (Ω) . Weiter definieren wir f¨ ur beliebiges k > 0 die ⎧ ⎨ y(x) − k, 0, v(x) = ⎩ y(x) + k,
von y abh¨angige Funktion falls falls falls
y(x) ≥ k |y(x)| < k y(x) ≤ −k
und zeigen, dass sie f¨ ur hinreichend großes k fast u ¨berall verschwindet, also ist y dann beschr¨ ankt. Dazu werden die Mengen Ω(k) = x ∈ Ω : |y(x)| ≥ k , Γ(k) = x ∈ Γ : |τ y(x)| ≥ k , eingef¨ uhrt, wobei τ wieder die Spur von y auf Γ bezeichnet. (ii) Folgerungen aus der Monotonievoraussetzung Wir leiten aus der Monotonie die Ungleichung (7.6) her. Zun¨achst ergibt sich b(x, y) v ds ≥ 0. d(x, y) v dx ≥ 0, Ω
(7.5)
Γ
Beispielsweise erh¨ alt man auf Ω+ (k) = {x : y(x) > k} d(x, y) v dx = d(x, y) (y − k) dx = d(x, y − k + k) (y − k) dx Ω+ (k) Ω+ (k) Ω+ (k) ≥ d(x, y − k) (y − k) dx ≥ 0 Ω+ (k)
7.2 Elliptische Gleichungen
281
wegen Monotonie von d bez¨ uglich y und d(x, 0) = 0. Gleiches zeigt man f¨ ur Ω− (k) = {x : y(x) < −k} und behandelt analog das Integral u ber Γ. Aus der Variationsformulierung ¨ f¨ ur y folgt mit der in (4.7) auf S. 148 definierten Bilinearform a[y, v] a[y, v] + d(x, y) v dx + b(x, y) v ds = f v dx + g v ds Ω
Γ
und wegen (7.5)
Ω
a[y, v] ≤
Γ
f v dx +
Ω
g v ds.
(7.6)
Γ
Hier sieht man bereits, dass die Nichtlinearit¨ aten d und b keinen Einfluss auf die Absch¨atzung haben werden. (iii) Absch¨atzung von v H 1 (Ω) Wir haben a[v, v] ≤ a[y, v].
(7.7)
F¨ ur die differentiellen Anteile in der Bilinearform folgt n¨amlich N N aij (x)Di y Dj v dx = aij (x)Di v Dj v dx, Ω i,j=1
Ω i,j=1
ullt ist. Außerdem ergibt sich weil Di y = Dj v auf Ω(k) und v = 0 auf Ω \ Ω(k) erf¨ c0 y v dx = c0 y (y − k) dx + c0 y (y + k) dx Ω Ω− (k) Ω+ (k) 2 = c0 (y − k) + (y − k)k dx + c0 (y + k)2 − (y + k)k dx Ω− (k) Ω+ (k) 2 ≥ c0 v dx, Ω
wenn wir y − k > 0 bzw.
y + k < 0 auf Ω+ (k) bzw. Ω− (k) sowie v = 0 auf Ω \ Ω(k) beachten. Analog wird Γ α y v ds behandelt. Aus (7.6), (7.7) und der Koerzivit¨at von a[·, ·] folgt schließlich mit β > 0 β v 2H 1 (Ω) ≤ f v dx + g v ds. (7.8) Ω
Γ
(iv) Absch¨atzung beider Seiten in (7.8) Wir sch¨ atzen die rechte Seite mit einer generischen Konstanten c wie folgt ab: 21 12 1 r f v dx ≤ f Lr (Ω) v Lr (Ω) ≤ f Lr (Ω) |v|2r dx 1 dx Ω
1
Ω(k)
Ω(k)
1
≤
f Lr (Ω) v L2r (Ω) |Ω(k)| 2r ≤ c f Lr (Ω) v H 1 (Ω) |Ω(k)| 2r
≤
c f 2Lr (Ω) |Ω(k)| r + ε v 2H 1 (Ω) = c f 2Lr (Ω) |Ω(k)|λ p + ε v 2H 1 (Ω) .
2
1
Dabei wurde die obere Einbettung von (7.4) benutzt. Die Zahl ε w¨ahlt man so klein, dass ε v 2H 1 (Ω) durch die linke Seite von (7.8) absorbiert wird. Analog erh¨alt man f¨ ur das Randintegral 1 g v ds ≤ g Ls (Γ) v Ls (Γ) ≤ g Ls (Γ) v L2s (Γ) |Γ(k)| 2s Γ
2
≤ c g 2Ls (Γ) |Γ(k)|λ q + ε v 2H 1 (Ω) .
7 Erg¨ anzungen zu partiellen Differentialgleichungen
282
Auf der linken Seite von (7.8) spalten wir das Quadrat der H 1 (Ω)-Norm in zwei gleiche Teile auf. Aus (7.8) und den beiden Absch¨ atzungen aus (7.4) folgt dann q2 p2 |v|q ds |v|p dx + ≤ c v 2H 1 (Ω) Ω(k)
Γ(k)
und mit der Definition von v p2 (|y| − k)p dx + Ω(k)
Γ(k)
(|y| − k)q dx
q2
≤ c v 2H 1 (Ω) .
(7.9)
(v) Anwendung von Lemma 7.5 Es sei h > k vorausgesetzt. Dann gilt Ω(h) ⊂ Ω(k) sowie Γ(h) ⊂ Γ(k) und deshalb |Ω(h)| ≤ |Ω(k)| sowie |Γ(h)| ≤ |Γ(k)|. Es ergibt sich p2 p2 p2 2 (|y|−k)p dx (|y|−k)p dx (h−k)p dx ≥ ≥ = (h−k)2 |Ω(h)| p . Ω(k)
Ω(h)
Ω(h)
Analog sch¨ atzt man das Randintegral ab. Schließlich folgt aus (7.9), (7.8) 2 2 (h − k)2 |Ω(h)| p + |Γ(h)| q ≤ 2 2 ≤ c f 2Lr (Ω) + g 2Ls (Γ) |Ω(k)|λ p + |Γ(k)|λ q λ 2 2 ≤ c f 2Lr (Ω) + g 2Ls (Γ) |Ω(k)| p + |Γ(k)| q . Hier wurde die f¨ ur alle a ≥ 0, b ≥ 0 und λ ≥ 1 g¨ ultige Ungleichung aλ + bλ ≤ (a + b)λ 2 2 benutzt. Wir haben damit f¨ ur ϕ(h) = |Ω(h)| p + |Γ(h)| q die Beziehung (h − k)2 ϕ(h) ≤ c f 2Lr (Ω) + g 2Ls (Γ) ϕ(k)λ f¨ ur alle h > k ≥ 0. Nun wird Lemma 7.5 mit den Gr¨oßen a = 2, b = λ > 1, k0 = 0, C = c ( f 2Lr (Ω) + g 2Ls (Γ) ) angewendet. Wir erhalten δ 2 = c˜ ( f 2Lr (Ω) + g 2Ls (Γ) ) und damit die Behauptung, denn ϕ(δ) = 0 heißt |y(x)| ≤ δ f¨ ur fast alle x ∈ Ω sowie |τ y(x)| ≤ d f¨ ur fast alle x ∈ Γ. (vi) Modifikation im Fall N = 2 Hier seien r > N/2 = 1 und s > N − 1 = 1 die im Satz angegebenen Integrabilit¨atsordnungen von f und g. F¨ ur N = 2 sind die Einbettungen (7.4) f¨ ur alle p < ∞ und q < ∞ g¨ ultig. Wir definieren deshalb p und q mit λ > 1 durch 1 1 , = p 2λr
1 1 = q 2λs
und u usse des Falls N ≥ 3 ab Beziehung (7.4). ¨bernehmen dann alle weiteren Schl¨ Bemerkung. Die Beschr¨anktheit der Randwerte von y auf Γ wurde hier direkt mit bewiesen. anktheit von y, Aufgabe 4.1. Sie folgt aber wegen yL∞ (Γ) ≤ yL∞ (Ω) schon aus der Beschr¨
F¨ ur die Gleichung −Δy + y k = f mit Neumannscher Randbedingung, k ungerade, f¨ uhrt die eben beschriebene Methodik nicht direkt zum Erfolg. Wir diskutieren nun noch eine
7.2 Elliptische Gleichungen
283
von E. Casas gefundene Erweiterung der Methode von Stampacchia, die auf Randwertaufgaben der Form (4.15) auf S. 154, Ay + d(x, y) = 0 in Ω ∂νA y + b(x, y) = 0 auf Γ anwendbar ist. Satz 7.6 Unter den Voraussetzungen 4.9 auf S. 154 gen¨ ugt die L¨osung yn der Gleichung Ay + n−1 y + d(x, y) ∂νA y + b(x, y)
= =
0 in Ω 0 auf Γ
f¨ ur alle n > 0 mit einer von n unabh¨angigen Konstanten K > 0 der Absch¨atzung yn L∞ (Ω) ≤ K. ¨ Beweis. Wir erl¨ autern nur die n¨ otigen Anderungen des letzten Beweises. Da jetzt die Funktionen f und g nicht explizit gegeben sind, k¨onnen wir nicht zus¨atzlich d(x, 0) = 0 und b(x, 0) = 0 annehmen. Um auf den im letzten Beweis behandelten Fall zu kommen, schneiden wir d und b bei k ∈ IN bzw. −k ab und erhalten die auf Seite 153 definierten ˜ y) := Funktionen dk und bk . Dann setzen wir f (x) := −dk (x, 0), g(x) := −bk (x, 0), d(x, ˜ 0) = dk (x, y)−dk (x, 0) und definieren ˜b analog. Dann haben wir wie im letzten Beweis d(x, 0 sowie ˜b(x, 0) = 0, f ∈ Lr (Ω), g ∈ Ls (Γ). Wir nehmen an, dass in Voraussetzung 4.9 die Ungleichung (i) f¨ ur d erf¨ ullt ist. Gilt statt dessen (ii), dann arbeiten wir analog mit b. Folgende einfache Beziehungen sind grundlegend f¨ ur die Methode: In Ω \ Ed ergibt die Monotonie von d wie im letzten Beweis ⎧ ˜ y(x)) − d(x, ˜ 0))(y − k) ≥ 0, x ∈ Ω+ (k) ⎨ (d(x, ˜ 0, x ∈ Ω \ Ω(k) d(x, y(x))v(x) = ⎩ ˜ ˜ 0))(y + k) ≥ 0, x ∈ Ω− (k). (d(x, y(x)) − d(x, ˜ y(x))v(x) ≥ 0 f¨ ur alle x ∈ Ed gilt Somit haben wir d(x, ur alle x ∈ Ω \ Ed . F¨ 2 ˜ y(x))v(x) ≥ λd |y(x)|v(x) = λd v (x), |y(x)| ≥ k d(x, ˜ y(x)) · 0 = λd v 2 (x), |y(x)| < k. = d(x,
(7.10)
Die Schl¨ usse zwischen (7.5) und (7.6) des letzten Beweises k¨onnen deshalb wie folgt abge¨ andert werden: ˜ y)vdx + ˜b(x, y)vds γ0 |∇v|2 + n−1 v 2 dx + a[y, v] ≥ d(x, Ω Γ Ω 2 ˜ γ0 |∇v| dx + d(x, y)vdx ≥ Ω Ω γ0 |∇v|2 dx + λd v 2 dx. ≥ Ω
Ed
Nach der verallgemeinerten Poincar´eschen Ungleichung (2.15) auf S. 28 stellt aber der letzte Ausdruck eine zur H 1 -Norm ¨ aquivalente Norm dar. So kommen wir schließlich mit dieser Argumentation auch zur Ungleichung (7.8) des letzten Beweises und alle anderen Schl¨ usse bleiben unver¨ andert. Wir erhalten eine von n unabh¨angige Schranke δ f¨ ur die L∞ -Norm von y und setzen K := δ.
7 Erg¨ anzungen zu partiellen Differentialgleichungen
284
7.2.3 Elliptische Gleichungen mit Maßen Da bei punktweisen Zustandsbeschr¨ ankungen Maße als rechte Seiten adjungierter Gleichungen auftreten, ben¨ otigen wir entsprechende Erweiterungen der Theorie elliptischer bzw. parabolischer Gleichungen. Diese Grundlagen gehen f¨ ur elliptische Gleichungen auf Casas [42], [44] sowie Alibert und Raymond [5] zur¨ uck und im parabolischen Fall auf Casas [46] sowie Raymond und Zidani [176]. Wir zitieren hier ein solches Resultat f¨ ur das Randwertproblem A p + c0 p = ∂νA p + α p =
μΩ μΓ
in Ω auf Γ.
(7.11)
ager in Ω bzw. Γ, die Restriktionen eines reHier sind μΩ bzw. μΓ Borelmaße mit Tr¨ ¯ darstellen, d.h. μ = μΩ + μΓ ; A ist der in (2.19) auf gul¨ aren Borelmaßes μ ∈ M (Ω) S. 30 eingef¨ uhrte elliptische Differentialoperator mit Koeffizienten aij ∈ L∞ (Ω), die der Elliptizit¨ atsbedingung (2.20) und (nur der Einfachheit halber) der Symmetriebedingung aij (x) = aji (x) gen¨ ugen. Außerdem sind c0 ∈ L∞ (Ω), α ∈ L∞ (Γ) mit c0 ≥ 0, α ≥ 0 und α L∞ (Γ) + c0 L∞ (Ω) > 0 gegeben. Wir ordnen der Gleichung die Bilinearform a[p, v] =
N Ω
aij (x) Di p(x) Dj v(x) + c0 (x) p(x) v(x) dx +
i,j=1
α(x) p(x) v(x) ds(x) Γ
anktes Lipschitzgebiet. F¨ ur r > N/2, s > N − 1 wird zu; Ω ⊂ IRN ist ein beschr¨ V r,s = v ∈ H 1 (Ω) : A v ∈ Lr (Ω), ∂νA v ∈ Ls (Γ) definiert, wobei A v distributionell zu verstehen und ∂νA v wie in [44] erkl¨art ist. Definition. Eine Funktion p ∈ W 1,σ (Ω) mit σ ≥ 1 heißt schwache L¨osung von (7.11), wenn sie der folgenden Variationsgleichung gen¨ ugt: ¯ a[p, v] = v(x) dμΩ (x) + v(x) dμΓ (x) ∀v ∈ C 1 (Ω). (7.12) Ω
Γ
Satz 7.7 Unter den obigen Voraussetzungen besitzt das Randwertproblem (7.11) genau eine schwache L¨osung p mit p ∈ W 1,σ (Ω) f¨ ur alle σ ∈ [1, N/(N − 1)), die zus¨atzlich f¨ ur alle v ∈ V r,s die folgende Formel der partiellen Integration erf¨ ullt: p (A v + c0 v) dxdt + p (∂νA v + α v) ds = v dμΩ + v dμΓ ∀ v ∈ V r,s . Ω
Σ
Ω
Γ
Es existiert eine von μ unabh¨angige Konstante cσ mit p W 1,σ (Ω) ≤ cσ μ M (Ω) ¯ . Der Satz folgt aus einer allgemeineren, in Casas [44] bewiesenen Aussage. Bemerkungen. Schwache L¨osungen von (7.11) m¨ussen nicht eindeutig sein, vgl. dazu die ausf¨ uhrliche Darstellung in [5]. Die Eindeutigkeit wird erst durch die Formel der partiellen uhrt, vgl. Integration (Greensche Formel) gesichert. Eine Definition von ∂νA p wird in [44] eingef¨ auch [5]. Zur Definition der Norm μM (Ω) ¯ siehe [6].
7.3 Parabolische Gleichungen
285
7.3 Parabolische Gleichungen 7.3.1 L¨ osungen in W (0, T ) Die lineare Gleichung Hier halten wir uns im Wesentlichen an die Monographie von Ladyzhenskaya et al. [134], und f¨ uhren deshalb die folgenden, in [134] verwendeten R¨aume ein: Definition. Mit V2 (Q) wird der Raum W21,0 (Q) ∩ L∞ 0, T ; L2 (Ω) bezeichnet, versehen mit der Norm y V2 (Q) = ess sup y(t) L2 (Ω) + t∈[0,T ]
|∇x y(x, t)|2 dxdt
12 ,
Q
und mit V21,0 (Q) der Raum W21,0 (Q) ∩ C [0, T ], L2 (Ω) , versehen mit der Norm y V 1,0 (Q) = max y(t) L2 (Ω) + 2
t∈[0,T ]
2
|∇x y(x, t)| dxdt
12 .
Q
Bei Durchschnitten wie W21,0 (Q) ∩ L∞ 0, T; L2 (Ω) sind die Funktionen aus W21,0 (Q) zun¨ achst mit abstrakten Funktionen aus L2 0, T ; H 1 (Ω) zu identifizieren, sonst w¨aren reellwertige mit abstrakten Funktionen zu vergleichen. Zur besseren Lesbarkeit schreiben wir das interessierende Anfangsrandwertproblem (3.23) nochmals auf: yt + A y + c0 y = ∂νA y + α y = y(x, 0) =
f g y0 (x)
in Q = Ω × (0, T ) in Σ = Γ × (0, T ) in Ω.
(7.13)
Dabei ist der gleichm¨ aßig elliptische Differentialoperator A wie in (2.19) auf S. 30 definiert. Satz 7.8 Es seien ein beschr¨anktes Lipschitzgebiet Ω sowie Funktionen c0 ∈ L∞ (Q), α ∈ L∞ (Σ) mit α(x, t) ≥ 0, y0 ∈ L2 (Ω), f ∈ L2 (Q) und g ∈ L2 (Σ) gegeben. Der Differentialoperator A habe Koeffizienten aij ∈ L∞ (Ω) mit aij = aji und gen¨ uge der Bedingung der gleichm¨aßigen Elliptizit¨at (2.20) auf S. 30. Dann besitzt das AnfangsRandwertproblem (7.13) eine L¨osung im Raum V2 (Q). Beweis. Die Aussage folgt aus Satz 5.l, Kapitel III in [134]. In dessen Begr¨ undung sind die ¨ Anderungen erl¨ autert, die gegen¨ uber dem Beweis von Satz 4.1, Kap. III, f¨ ur homogene Dirichlet-Randbedingungen vorzunehmen sind. Wir folgen dem Beweis aus [134] und skizzieren die Anpassungen an Randbedingungen dritter Art, die zum Verst¨andnis des Beweises von Lemma 5.3 u ¨ ber unsere semilineare Gleichung n¨otig sind. Wir setzen o.B.d.A. c0 (x, t) ≥ 0 fast u ¨ berall auf Q voraus. Ist diese Eigenschaft nicht erf¨ ullt, dann substituiert man y(x, t) = eλ t y˜(x, t). In der neuen Gleichung f¨ ur y˜ steht dann an Stelle von c0 y der Term (λ + c0 ) y˜, der f¨ ur hinreichend großes λ nichtnegativ ist.
7 Erg¨ anzungen zu partiellen Differentialgleichungen
286
(i) Galerkin-Approximation Wir setzen V = H 1 (Ω), H = L2 (Ω) und w¨ ahlen eine Basis {v1 , v2 , . . .} von Elementen vi ∈ V f¨ ur den Raum V . Diese existiert, weil V ein separabler Hilbertraum ist. Dabei k¨ onnen wir nach einer Orthogonalisierung im Raum H annehmen, dass die vi orthonormal in H sind. Damit ist {vi }∞ andiges Orthonormalsystem in H. Man bestimmt i=1 ein vollst¨ f¨ ur beliebiges aber festes n ∈ IN N¨ aherungsfunktionen yn = yn (x, t) durch den Ansatz yn (x, t) =
n
uni (t) vi (x)
(7.14)
i=1
mit unbekannten Funktionen uni : [0, T ] → IR, i = 1, . . . , n. Im Weiteren bezeichnen (· , ·) bzw. · das Skalarprodukt bzw. die Norm von H sowie (· , ·)Γ das Skalarprodukt von L2 (Γ). Zur Abk¨ urzung verwenden wir die Bilinearform a[t; y, v]
=
N Ω
aij (x) Di y(x) Dj v(x) + c0 (x, t) y(x) v(x) dx
i,j=1
+
α(x, t) y(x) v(x) ds(x). Γ
Wir betrachten yn = yn (·, t) als abstrakte Funktion mit Werten in H 1 (Ω). Nach Multiplikation der parabolischen Gleichung mit vj , Integration u ¨ber Ω und nachfolgende partielle Integration erhalten wir d (7.15) yn (t) , vj + a t; yn (t), vj = f (t) , vj + g(t) , vj Γ dt f¨ ur fast alle t ∈ [0, T ]. Die Anfangsbedingung f¨ ur y ist ¨aquivalent zu y(·, 0) , v = y0 , v ∀v ∈ V . Dementsprechend fordert man f¨ ur yn die Beziehung yn (·, 0) , vj = y0 , vj ∀j = 1, . . . , n. (7.16) Einsetzen des Ansatzes (7.14) in (7.15) ergibt unter Beachtung der Orthonormalit¨at d n uj (t) + uni (t) a[t; vi , vj ] dt i=1 unj (0) n
= bj (t),
(7.17)
= (y0 , vj )
j = 1, . . . , n, mit gegebenen Funktionen bj (t) = (f (t) , vj ) + (g(t) , vj )Γ . Das ist ein System linearer gew¨ ohnlicher Differentialgleichungen auf [0, T ] f¨ ur die gesuchte Vektorfunktion un = (un1 , . . . , unn ) . Es besitzt genau eine absolutstetige L¨osung un ∈ (H 1 (0, T ))n , die das Differentialgleichungssystem fast u ullt. Multiplikation von ¨ berall auf [0, T ] erf¨ (7.15) mit uj (t) und Summation dieser Gleichungen von j = 1 bis j = n liefert f.¨ u. auf [0, T ] d yn (t) , yn (t) + a t; yn (t), yn (t) = f (t) , yn (t) + g(t) , yn (t) Γ . dt u. differenzierbar nach t. Wegen un ∈ H 1 (0, T )n ist yn : [0, T ] → L2 (Ω) f.¨
(7.18)
7.3 Parabolische Gleichungen
287
(ii) Absch¨atzungen von yn F¨ ur beliebiges aber festes τ ∈ (0, T ] gilt die Identit¨at τ d 1 τ d 1 1 ( yn (t) , yn (t)) dt = yn (t) 2 dt = yn (τ ) 2 − yn (0) 2 . dt 2 dt 2 2 0 0 Nach Integration von (7.18) folgt deshalb τ 1 yn (τ ) 2 + a[t; yn (t), yn (t)] dt 2 0 τ 1 2 f (t) , yn (t) + g(t) , yn (t) Γ dt. = yn (0) + 2 0
(7.19)
F¨ ur den Anfangswert gilt mit der Besselschen Ungleichung yn (0) 2 =
n
unj (0)2 =
j=1
n
(y0 , vj )2 ≤ y0 2 .
(7.20)
j=1
Außerdem folgt aus c0 (x, t) ≥ 0 und α(x, t) ≥ 0 2 a[t; v , v] ≥ γ0 |∇v|
∀v ∈ V
(7.21)
mit γ0 gem¨ aß (2.20) auf S. 30. Aus (7.19) und (7.20) erh¨alt man mit einer Reihe von Standardabsch¨ atzungen nach Anwendung des bekannten Bellman-Gronwallschen Lemmas max yn (t) ≤ c y0 + f L2 (Q) + g L2 (Σ) . (7.22) t∈[0,T ]
Diese Absch¨ atzung f¨ ur yn in C([0, T ], H) kann in (7.19) eingesetzt werden und ergibt unter Beachtung von (7.21) f¨ ur τ = T mit einer von n unabh¨angigen Konstanten K yn C([0,T ],H) + yn W 1,0 (Q) ≤ K 2
(7.23)
f¨ ur alle n ∈ IN. Daraus folgt insbesondere yn (t) 2H ≤ K 2 und wegen Orthonormalit¨at n
uni (t)2 ≤ K 2
∀ t ∈ [0, T ], ∀ n ∈ IN.
(7.24)
i=1
(iii) Konvergenz der Folgen {unj } und {yn } Aus (7.24) folgt |unj (t)| ≤ K, f¨ ur alle betreffenden t, j, n. Die Menge dieser unj (·) besteht daher f¨ ur jedes feste j aus gleichgradig stetigen Funktionen, was aus Integration von (7.15) folgt. Durch Anwendung des Satzes von Arz`ela-Ascoli und Auswahl einer Diagonalfolge kann man schließlich eine Teilfolge {nk }∞ k=1 finden, so dass im Sinne der gleichm¨ aßigen Konvergenz lim unj k (t) = uj (t) k→∞
f¨ ur jedes j ∈ IN gilt. Man kann dazu so vorgehen: Zuerst ergibt sich eine konvergente Teilfolge {un1 }, = 1, 2, . . .. Wir w¨ ahlen f¨ ur alle j als erstes Glied das Element unj 1 aus n und betrachten als n¨ achstes die Folge {u2 }, = 2, 3, . . .. Wegen gleichgradiger Stetigkeit n n finden wir eine konvergente Teilfolge {u2 m }. Die Folge {u1 m } konvergiert als Teilfolge
7 Erg¨ anzungen zu partiellen Differentialgleichungen
288
n
von {un1 } ebenfalls. Jetzt wird f¨ ur alle j als zweites Glied uj 1 ausgew¨ahlt, man setzt also n2 := n1 und setzt diesen Prozess fort, als n¨ achstes mit j = 3. Es ist leicht einzusehen, dass auf diese Weise eine Indexfolge {nk } derart konstruiert wird, dass alle Folgen {unj k } konvergieren. Man beachte, dass in jeder Folge {unj k } h¨ochstens die ersten j − 1 Elemente nicht zu den ausgew¨ ahlten konvergenten Teilfolgen geh¨oren. Mit den so gegebenen Funktionen uj wird y durch y(x, t) :=
∞
ui (t) vi (x)
i=1
definiert. Weiter wird unter Benutzung dieses Resultats bewiesen, dass f¨ ur jedes t ∈ [0, T ] die Folge {ynk (t)} schwach in L2 (Ω) gegen y(t) konvergiert, gleichm¨aßig in t. Absch¨atzung (7.23) und die schwache Unterhalbstetigkeit der Norm ergeben y(t) ≤ K, also y ∈ L∞ (0, T ; L2 (Ω)). F¨ ur ynk (0) bekommt man sogar starke Konvergenz gegen y0 , denn f¨ ur k → ∞ gilt nk ∞ ∞ ynk (0) − y0 = uni k (0) vi − (y0 , vi ) vi = ui (0) vi → 0 i=1
wegen
∞ i=1
i=nk +1
i=1
u2i (0) < ∞ nach (7.24). Alle obigen Schl¨ usse sind ausf¨ uhrlicher in [134] nach-
zulesen.
(iv) y ist schwache L¨osung ankt in W 1,0 (Q), daher konvergiert o.B.d.A. {ynk } Wegen (7.23) ist die Folge der yn beschr¨ 1,0 schwach in W (Q) gegen y. Wir k¨ onnen in (7.15) mit beliebigen αj ∈ C 1 [0, T ], αj (T ) = m 0 f¨ ur m ≤ n die Funktionen vm (x, t) = αj (t) vj (x) als Testfunktion einsetzen. So j=1
ergibt sich aus (7.18) d ynk (t) , vm (t) + a t; ynk (t), vm (t) = f (t) , vm (t) + g(t) , vm (t) Γ . dt Nach partieller Integration folgt −
T
T d ynk (t) , vm (t) dt + a t; ynk (t), vm (t) dt 0 dt f vm dxdt + g vm dsdt + ynk (·, 0) , vm (·, 0) . =
0
Σ
Q
F¨ ur fixiertes m wird jetzt der Grenz¨ ubergang k → ∞ vollzogen. Wegen der schwachen Konvergenz von ynk in W21,0 (Q) und ynk (0) → y0 in L2 (Ω) ergibt sich in der Grenze −
0
T
T d (y(t) , vm (t)) dt + a[t; y(t), vm (t)] dt 0 dt f vm dxdt + g vm dsdt + y0 vm (·, 0) dx. = Q
Σ
Ω
7.3 Parabolische Gleichungen
289
Die Menge aller vm des obigen Typs ist dicht in der Menge aller Funktionen aus W21,1 (Q) mit homogenen Endwerten, [134] Kap. II, Lemma 4.12. Deshalb erf¨ ullt y die Variationsformulierung f¨ ur eine schwache L¨ osung. Bemerkung. Auf die Voraussetzung der Nichtnegativit¨at von α kann verzichtet werden, siehe z.B. Raymond und Zidani [175]. Der Nachweis der Eindeutigkeit der L¨ osung ist aus formalen Gr¨ unden etwas technisch. Grundlage des Beweises ist die Energiebilanzgleichung τ 1 2 a t; y(t), y(t) dt y(τ ) L2 (Ω) + 2 0 τ (7.25) 1 2 f (t) , y(t) L2 (Ω) + g(t) , y(t) L2 (Γ) dt, = y(0) L2 (Ω) + 2 0 die man aus der Variationsformulierung f¨ ur y erh¨alt, indem man als Testfunktion y selbst einsetzt. Das ist aber nicht zul¨ assig, denn es gilt nicht notwendig y ∈ W21,1 (Q) und auch nicht y(T ) = 0. Beide Eigenschaften werden aber von Testfunktionen verlangt. In [134] ¨ wird durch Ubergang zu sogenannten Mittelungsfunktionen gezeigt, dass diese Bilanzgleichung trotzdem richtig ist, wenn die h¨ ohere Regularit¨at y ∈ V21,0 (Q) vorliegt. Deshalb existiert unter den Voraussetzungen von Satz 7.8 eine von f , g und y0 unabh¨angige Konstante cP , so dass die folgende Absch¨ atzung gilt, falls y eine L¨osung aus V21,0 (Q) ist: max y(t) L2 (Ω) + y W 1,0 (Q) ≤ cP f L2 (Q) + g L2 (Σ) + y0 L2 (Ω) . (7.26) t∈[0,T ]
2
Die Energiebilanzgleichung (7.25) hat die gleiche Form wie (7.19). Die Ungleichung (7.26) kann daraus in gleicher Weise hergeleitet werden wie die Absch¨atzungen (7.22) und (7.23) f¨ ur yn aus (7.19). Mit Hilfe ¨ ahnlicher Absch¨ atzungen wird dann bewiesen, dass es in W21,0 (Q) h¨ochstens eine L¨ osung geben kann, vgl. [134], Kap. III, Thm. 3.3. Das liegt daran, dass die Differenz zweier verschiedener L¨ osungen die Gleichung mit homogenen und damit glatten Vorgaben erf¨ ullt. So kann eine zu (7.25) ¨ ahnliche Absch¨ atzung verwendet werden, die schließlich f¨ ur die Differenz der L¨ osungen null ergibt ([134], Kap. III, Thm. 3.2). Mit Satz 7.8 wissen wir, dass es eine L¨ osung in V2 (Q) gibt und in [134], Thm. 4.2, Kap. III, wird gezeigt, dass jede schwache L¨ osung aus V2 (Q) sogar zu V21,0 (Q) geh¨ort. Wegen Eindeutigkeit in W21,0 (Q) folgt daraus, dass die eindeutig bestimmte L¨osung y in V21,0 (Q) liegt. Diese Information gestattet es, die Absch¨atzung (7.26) f¨ ur die L¨osung anzugeben. Bemerkung. Die aus [134] zitierten S¨atze sind dort f¨ur homogene Dirichlet-Randbedingungen bewiesen und auf den Fall von Randbedingungen dritter Art u ¨bertragbar.
Insgesamt ergibt sich das folgende Hauptresultat: Satz 7.9 Es seien ein beschr¨anktes Lipschitzgebiet Ω sowie Funktionen c0 ∈ L∞ (Q), α ∈ L∞ (Σ), y0 ∈ L2 (Ω), f ∈ L2 (Q) und g ∈ L2 (Σ) gegeben. Der Differentialoperator A erf¨ ulle die in Satz 7.8 formulierten Bedingungen. Dann besitzt das AnfangsRandwertproblem (7.13) im Raum W21,0 (Q) genau eine L¨osung, die dem Raum V21,0 (Q) angeh¨ort. Diese gen¨ ugt der Absch¨atzung (7.26) mit einer von f, g, y0 unabh¨angigen Konstanten cP . Bemerkung. Der Satz ergibt sich einfacher, wenn man von vornherein im Raum W (0, T ) arbeitet, Lions [144] oder Wloka [209]. Wir sind nach Ladyzhenskaya et al. [134] vorgegangen, um
7 Erg¨ anzungen zu partiellen Differentialgleichungen
290
zun¨ achst in Analogie zu schwachen L¨ osungen im elliptischen Fall den Raum W21,0 (Q) einf¨ uhren zu k¨ onnen.
Die semilineare Gleichung Im Weiteren geht es um das semilineare parabolische Anfangs-Randwertproblem yt + A y + d(x, t, y) ∂νA y + b(x, t, y) y(·, 0)
= f = g = y0
in Q in Σ in Ω.
(7.27)
Hier folgen wir teilweise dem Beweis im linearen Fall, verwenden aber auch Ideen aus Gajewski et al. [72] sowie Wloka [209]. Zu Beginn arbeiten wir mit der starken Voraussetzung gleichm¨ aßiger Beschr¨ anktheit und gleichm¨aßiger Lipschitzstetigkeit von d und b bez¨ uglich y. Wir beweisen das auf Seite 212 formulierte Lemma 5.3: Lemma 5.3 Unter den Voraussetzungen 5.1 und 5.2 auf S. 212 und den in Satz 7.8 angegebenen Voraussetzungen an A besitzt das Anfangs-Randwertproblem (7.27) f¨ ur jedes Tripel von Daten f ∈ L2 (Q), g ∈ L2 (Σ), y0 ∈ L2 (Ω) genau eine schwache L¨osung y ∈ W (0, T ). Beweis: (i) Galerkin-Approximation Wir verwenden die gleichen Bezeichnungen wie im Beweis von Satz 7.8 und gehen von n der Orthonormalbasis {v1 , v2 , . . .} sowie dem Ansatz yn (x, t) = uni (t) vi (x) aus. Die i=1
Bilinearform a bezieht sich jetzt nur auf den elliptischen Differentialoperator, N aij (x) Di y Dj v dx. a[y, v] := Ω i,j=1
Wie im Beweis von Satz 7.8 entsteht aus der parabolischen Gleichung das folgende nichtlineare System gew¨ ohnlicher Differentialgleichungen: n d n uj (t) + uni (t) a[vi , vj ] + Φj t, un (t) = bj (t), dt i=1 unj (0) = (y0 , vj ), j = 1, . . . , n. Dabei wurde bj (t) = f (t) , vj + g(t) , vj Γ und
(7.28)
n n Φj (t, u) = d ·, t, ui vi , vj + b ·, t, ui vi , vj i=1
i=1
Γ
gesetzt. Nach Voraussetzung ist die Abbildung Φ : [0, T ] × IRn → IRn gleichm¨aßig Lipschitz-stetig und gleichm¨ aßig beschr¨ ankt. Daher besitzt das obige nichtlineare System gew¨ ohnlicher Differentialgleichungen f¨ ur jedes n genau eine absolutstetige L¨osung un (·). Analog zum linearen Fall ergibt sich fast u ¨ berall auf [0, T ] d yn (t) , yn (t) + a yn (t), yn (t) + d ·, t, yn (t) , yn (t) + b ·, t, yn (t) , yn (t) Γ = dt = f (t) , yn (t) + g(t) , yn (t) Γ . (7.29)
7.3 Parabolische Gleichungen
291
(ii) Absch¨atzungen von yn Wir k¨ onnen die Beziehungen d(·, ·, 0) = b(·, ·, 0) = 0 voraussetzen (anderenfalls ziehen wir diese Werte vorher auf beiden Seiten von (7.27) ab). Aus der Monotonie von d, b folgen dann wie bei der Herleitung von (7.19) d(·, t, yn ) , yn = d(·, t, yn ) − d(·, t, 0) , yn − 0 ≥ 0 und eine analoge Beziehung f¨ ur b. Daraus ergibt sich τ 1 a t; yn (t), yn (t) dt yn (τ ) 2 + 2 0 τ 1 f (t) , yn (t) + g(t) , yn (t) Γ dt ≤ yn (0) 2 + 2 0
(7.30)
sowie die Absch¨ atzung (7.20) f¨ ur yn (0). Wir erhalten also an Stelle der Gleichung (7.19) eine analoge Ungleichung. Da wir im weiteren Beweis von Satz 7.8 ohnehin nach oben abgesch¨ atzt hatten, gelangen wir auch hier mit identischen Schl¨ ussen zur Absch¨atzung (7.23), yn C([0,T ],H) + yn W 1,0 (Q) ≤ K ∀ n ∈ IN. 2
(iii) Schwache Konvergenz von yn gegen y Auf Grund der letzten Absch¨ atzung k¨ onnen wir davon ausgehen, dass eine Teilfolge von 1,0 1,0 {yn }∞ n=1 in W2 (Q) schwach gegen ein y ∈ W2 (Q) konvergiert. O.B.d.A. sei das die Folge {yn } selbst. Wegen der vorliegenden Nichtlinearit¨at ist daraus nicht ohne Weiteres zu schließen, dass d(·, yn ) bzw. b(·, yn ) schwach gegen d(·, y) bzw. b(·, y) konvergieren. Wir wissen aber, dass beide Folgen beschr¨ ankt im Raum L2 (Q) sind. Daher konvergieren entsprechende Teilfolgen schwach gegen D ∈ L2 (Q) bzw. B ∈ L2 (Σ). Wieder nehmen wir der Einfachheit halber an, dass die gesamten Folgen schwach konvergieren, d(·, yn ) D in L2 (Q),
b(·, yn ) B in L2 (Σ).
(7.31)
Nach Grenz¨ ubergang n → ∞ zeigt sich, dass y schwache L¨osung f¨ ur ein lineares Hilfsm problem ist: Wie im linearen Fall folgt mit den Funktionen vm (·, t) = αi (t) vi (·) i=1
−
T
0
T d y(t) , vm (t) dt + a y(t), vm (t) + D(t) , vm (t) + B(t) , vm (t) Γ dt 0 dt f vm dxdt + g vm dsdt + y0 vm (·, 0) dx = Σ
Q
Ω
f¨ ur alle vm der obigen Form mit αi ∈ C 1 und αi (T ) = 0. Wegen Dichtheit der Menge so konstruierter Funktionen vm in W 1,1 (Q), [134] Kap. II, Lemma 4.12, gelangt man zu −
0
T
T d y(t) , v(t) dt + a y(t), v(t) + D(t) , v(t) + B(t) , v(t) Γ dt 0 dt f v dxdt + g v dsdt + y0 v(·, 0) dx = Q
Σ
Ω
f¨ ur alle v ∈ W 1,1 (Q) mit v(T ) = 0. Das ist die Variationsgleichung f¨ ur eine schwache L¨ osung y mit Anfangsbedingung y(0) = y0 . Wenn jetzt noch D(x, t) = d(x, t, y(x, t))
7 Erg¨ anzungen zu partiellen Differentialgleichungen
292
sowie B(x, t) = b(x, t, y(x, t)) gezeigt wird, dann ist y als schwache L¨osung nachgewiesen und der Beweis vollst¨ andig. Zun¨ achst haben wir mit Y := L2 (0, T ; V ) und Y ∗ = L2 (0, T ; V ∗ ) y + w = F (7.32) im Raum Y ∗ , wobei F ∈ Y ∗ durch F , v Y
∗ ,Y
=
f v dxdt +
g v dsdt Σ
Q
definiert ist und w ∈ Y ∗ durch T w , v Y ∗ ,Y = a y(t), v(t) + D(t) , v(t) + B(t) , v(t) Γ dt. 0
(iv) y ist schwache L¨osung der nichtlinearen Gleichung Wir gehen hier vor wie in [72], Kap. VI, Beweis von Satz 1.1. Nach Konstruktion geh¨oren alle yn dem Raum W (0, T ) an. Wie im Beweis von Satz 4.4, Beweisteil (i), definieren wir einen monotonen Operator A : W (0, T ) → L2 (0, T ; V ∗ ) durch A = A1 + A2 + A3 mit Ai : W (0, T ) → L2 (0, T ; V ∗ ), Ai : y → zi , i = 1, 2, 3, wobei z1 (t) = a[y(t) , · ], z2 (t) = d ·, t, y(t) , z3 (t) = b ·, t, y(t) . Aus (7.29) folgt T yn (t) , yn (t) V ∗ ,V dt+ 0
T
A(yn )(t) , yn (t)
0
V
∗ ,V
dt =
f yn dxdt+
Q
Σ
g yn dsdt
f¨ ur alle n ∈ IN. Formel (3.30) auf S. 119 und die Definition von F ergeben T 1 1 A(yn )(t) , yn (t) V ∗ ,V dt = F , yn Y ∗ ,Y + yn (0) 2H − yn (T ) 2H . 2 2 0 Wir wissen yn (0) → y0 und yn (T ) y(T ) in H = L2 (Ω) (die zweite Beziehung wegen yn y in W (0, T ) und der Stetigkeit des linearen Operators y → y(T ) in W (0, T )). Folglich gilt lim inf yn (T ) H ≥ y(T ) H , n→∞
somit nochmals wegen (3.30) lim A(yn ) , yn Y ∗ ,Y
n→∞
1 1 ≤ F , y Y ∗ ,Y + y(0) 2H − y(T ) 2H 2 2 = F , y Y ∗ ,Y − y , y Y ∗ ,Y = w , y Y ∗ ,Y
nach (7.32). Damit haben wir yn y, A(yn ) w und lim A(yn ) , yn ≤ w , y . Jetzt n→∞
folgt mit dem unten angegebenen Lemma 7.11 die Beziehung A(y) = w, und schließlich D = d(·, y) und B = b(·, y). Eine andere Variante zum Abschluss dieses Beweises findet man bei Lions [143]. Die vorausgesetzte gleichm¨ aßige Beschr¨ anktheit der Nichtlinearit¨aten ist eine zu starke Forderung. Daher ist dieser Satz nur bedingt anwendbar und eigentlich nur ein Hilfssatz. In Satz 5.5 wird diese Einschr¨ ankung aufgehoben. Daf¨ ur stellen wir noch folgende Absch¨ atzung bereit:
7.3 Parabolische Gleichungen
293
Lemma 7.10 Die nach Lemma 5.3, S. 293 existierende L¨osung y ∈ W (0, T ) gen¨ ugt der Absch¨atzung y W (0,T ) ≤ cP f − d(·, 0) L2 (Q) + g − b(·, 0) L2 (Σ) + y0 L2 (Ω) (7.33) mit einer von f und g unabh¨angigen Konstanten cP > 0. Beweis: Wegen y ∈ W (0, T ) darf man die nichtlineare Gleichung mit y selbst testen. Das ergibt das nichtlineare Analogon zur Bilanzgleichung (7.25), τ 1 2 y(τ ) L2 (Ω) + a y(t), y(t) + d(·, t, y(t)) , y(t) + b(·, t, y(t)) , y(t) Γ dt 2 0 τ 1 f (t) , y(t) L2 (Ω) + g(t) , y(t) L2 (Γ) dt. = y(0) 2L2 (Ω) + 2 0 Aus der Monotonie von b, d folgt (7.33) nach Abspalten von d(x, t, 0) sowie b(x, t, 0), falls diese Terme nicht null sind. Diese Terme werden den rechten Seiten zugeschlagen. Wir reichen noch das im letzten Beweis verwendete Lemma nach, vgl. [72], Kap. III, Lemma 1.3. oder auch [217]: Lemma 7.11 Es sei A ein monotoner und demistetiger Operator, der einen reflexiven Banachraum Y in seinen Dualraum Y ∗ abbildet. Dann folgt aus n → ∞, yn y in Y ,
A(yn ) w in Y ∗
und
lim A(yn ) , yn Y ∗ ,Y ≤ w , y Y ∗ ,Y
n→∞
die Beziehung A(y) = w.
7.3.2 Stetige L¨ osungen Im Folgenden ist A weiterhin der in (2.19) auf S. 30 eingef¨ uhrte gleichm¨aßig elliptische Differentialoperator mit Koeffizienten aus L∞ (Ω). Die nun folgende Stetigkeitsaussage folgt aus Satz 6.8 von Griepentrog [84] zur maximalen parabolischen Regularit¨at. Dessen Verst¨ andnis erfordert Kenntnisse u ¨ ber die in [85] definierten Sobolew-Morrey-R¨aume und deren Einbettungseigenschaften. Deshalb werden die Resultate von Griepentrog im n¨ achsten Teilabschnitt kurz erl¨ autert. Lemma 7.12 Ist Ω ⊂ IRN ein beschr¨anktes Lipschitzgebiet und sind f ∈ Lr (Q), g ∈ ¯ r > N/2 + 1, s > N + 1, gegeben, dann geh¨ort die schwache L¨osung y Ls (Σ), y0 ∈ C(Ω), der linearen parabolischen Anfangs-Randwertaufgabe mit Neumannscher Randbedingung yt + A y ∂νA y y(0)
= f = g = y0
in Q in Σ in Ω
¯ an. Es existiert eine von f , g und y0 unabh¨angige Konstante dem Raum W (0, T ) ∩ C(Q) c(r, s) > 0, so dass die folgende Ungleichung erf¨ ullt ist: y W (0,T ) + y C(Q) ¯ ≤ c(r, s) f Lr (Q) + g Ls (Σ) + y0 C(Ω) ¯ .
7 Erg¨ anzungen zu partiellen Differentialgleichungen
294
Beweis. Bei der Umsetzung der Beweisidee hat mich Herr J. Griepentrog unterst¨ utzt. (i) F¨ ur y0 = 0 folgt die Aussage des Lemmas aus Satz 6.8 in [84]. Dies wird im n¨achsten Teilabschnitt erl¨ autert. Nach dem Superpositionsprinzip ist deshalb nur noch die Ste¯ zu beweisen. Die tigkeit der L¨ osung y zu den Vorgaben f = 0, g = 0 sowie y0 ∈ C(Ω) Absch¨ atzung folgt aus der Stetigkeit der entsprechenden L¨osungsabbildungen. Wir verwenden die Notation aus [84, 85] und setzen S := (0, T ) sowie V := H 1 (Ω). Ferner definieren wir einen linearen stetigen Operator A : L2 (S; V ) → L2 (S; V ∗ ) durch
(Ay)(t) , v(t) V ∗ ,V dt =
S
S
N
Ω i,j=1
aij (x)Di y(x, t)Dj v(x, t) dxdt.
(7.34)
Dann nimmt unser lineares Anfangsrandwertproblem die Form yt + A y = 0,
y(0) = y0
(7.35)
mit homogenen Neumann-Randbedingungen an. Die Aufgabe (7.35) hat f¨ ur jeden Anfangswert y0 ∈ L2 (Ω) genau eine L¨ osung y ∈ W (0, T ). Im Weiteren werden wir W (0, T ) ¯ wie in [84, 85] mit W (S; V ) bezeichnen. Wir zeigen, dass die L¨osung y f¨ ur y0 ∈ C(Ω) ¯ C(Ω)) ¯ = C(Q) ¯ geh¨ zum Raum C(S; ort. ¯ Das Maximumprinzip f¨ Es sei y∗ das Minimum und y ∗ das Maximum von y0 in Ω. ur parabolische Gleichungen liefert aufgrund der positiven Struktur des Operators A f¨ ur die L¨ osung y von (7.35) die Schranken y∗ ≤ y(x, t) ≤ y ∗
f¨ ur fast alle (x, t) ∈ Ω × S.
(7.36)
Um dies einzusehen, kann man in der Variationsformulierung von (7.35) mit den beiden Funktionen v = (y − y ∗ )+ ∈ L2 (S; V ) sowie v = (y∗ − y)+ ∈ L2 (S; V ) testen. Das ist ein nicht trivialer, aber g¨ angiger Schluss in der Theorie parabolischer Gleichungen. Deshalb gehen wir darauf nicht weiter ein. (ii) Wir approximieren y0 durch eine Folge glatter Anfangswerte y0,k und zeigen, dass dazu stetige L¨ osungen yk geh¨ oren: ¯ Da jede Funktion aus C(Ω) zu einer Funktion aus C(IRn ) fortgesetzt werden kann, exi¯ die f¨ ¯ gleichm¨aßig stiert eine Folge von Anfangswerten y0,k ∈ C ∞ (Ω), ur k → ∞ in Ω gegen y0 konvergiert. Nach Satz 2.4 aus [85] konvergieren die L¨osungen yk ∈ W (S; V ) des Problems (7.35) zum regularisierten Anfangswert y0,k f¨ ur k → ∞ in W (S; V ) gegen die L¨ osung y des Problems (7.35) zum Anfangswert y0 . Wir zeigen nun, dass alle yk stetig ¯ × S¯ sind. auf Ω ¯ k ∈ IN, zeitlich konstante und im Ort Dazu f¨ uhren wir durch vk (t) = y0,k f¨ ur alle t ∈ S, glatte Funktionen vk ein und betrachten die entsprechenden L¨osungen wk ∈ W (S; V ) des Problems (wk )t + A wk = −A vk , wk (0) = 0. (7.37) +2 Nach Satz 5.6 aus [85] geh¨ ort A vk f¨ ur alle k ∈ IN dem Sobolew-Morrey-Raum LN (S; V ∗ ) 2 von Funktionalen an. Aufgrund der maximalen parabolischen Regularit¨at f¨ ur Probleme vom Typ (7.37), vgl. Satz 6.8 aus [84], existiert ein Exponent ω ∈ (N, N + 2), so dass die L¨ osung wk des Problems (7.37) f¨ ur jedes k ∈ IN zum Sobolew-Morrey-Raum W ω (S; V ) ¯ C(Ω)) ¯ stetig eingegeh¨ ort. Nach den S¨ atzen 3.4 und 6.8 aus [85] ist dieser Raum in C(S; ¯ C(Ω)). ¯ bettet. Somit geh¨ ort mit wk auch yk = wk + vk f¨ ur jedes k ∈ IN zum Raum C(S;
7.3 Parabolische Gleichungen
295
(iii) Nun ist die Stetigkeit von y leicht nachzuweisen. F¨ ur jedes k und ∈ IN ist die Differenz yk − y ∈ W (S; V ) die L¨ osung des Problems (7.35) zum Anfangswert y0,k − y0, . ¯ C(Ω)), ¯ Nach Schritt (ii) liegt yk − y im Raum C(S; woraus mit (7.36), angewendet auf yk − y die Absch¨ atzung (7.38) min y0,k (x) − y0, (x) ≤ yk (x, t) − y (x, t) ≤ max y0,k (x) − y0, (x) ¯ x∈Ω
¯ x∈Ω
¯ × S¯ folgt. Wegen der gleichm¨aßigen Konvergenz von f¨ ur alle k, ∈ IN und alle (x, t) ∈ Ω ¯ Mit (7.38) ist deshalb die Folge y0,k gegen y0 ist {y0,k }∞ eine Cauchyfolge in C(Ω). k=1 ¯ C(Ω)). ¯ Aufgrund der Konvergenz der zugeh¨ origen L¨ osungen yk eine Cauchyfolge in C(S; dieser Folge in W (S; V ) gegen die L¨ osung y des urspr¨ unglichen Problems (7.35) zum ¯ C(Ω)) ¯ liegen. Anfangswert y0 muss der Grenzwert y in C(S; Das Lemma ist bereits in [46] zu finden. In [176] wurde der Beweis unter strengeren Voraussetzungen an die Glattheit der Koeffizienten des Differentialoperators und des Randes Γ mit Hilfe von stark stetigen Halbgruppen ausgef¨ uhrt. Inzwischen schließen die Arbeiten [85, 84] zur maximalen parabolischen Regularit¨at diese Aussage als Spezialfall ein. Dabei kann Ω sogar ein beschr¨anktes Lipschitzgebiet im Sinne von Grisvard [86] sein. Das ist durchaus wichtig, denn zwei u ¨ber Kreuz aufeinander gelegte dreidimensionale Quader definieren ein Lipschitzgebiet im Sinne von Grisvard, aber kein Lipschitzgebiet im Sinne von Neˇcas [167], also kein regul¨ares Gebiet gem¨aß unserer Definition aus Abschnitt 2.2.2. Bemerkungen. (i) Sind die Koeffizienten von A sowie der Rand Γ hinreichend glatt, so dass die Greensche Funktion G(x, ξ, t) zur obigen linearen Anfangs-Randwertaufgabe existiert, dann l¨ asst sich Lemma 7.12 recht einfach zeigen. In diesem Falle hat y die Darstellung Z tZ Z tZ G(x, ξ, t − τ ) f (ξ, τ ) dξdτ + G(x, ξ, t − τ ) g(ξ, τ ) ds(ξ)dτ y(x, t) = 0 0 Γ ZΩ G(x, ξ, t) y0 (ξ) dξ. + Ω
Das ¨ ortlich eindimensionale Analogon haben wir mit Formel (3.13) auf S. 101 schon kennen ¯ mit x = ξ der Absch¨ gelernt. Die Funktion G gen¨ ugt f¨ ur t > 0 und x, ξ ∈ Ω atzung ` |x − ξ|2 ´ |G(x, ξ, t)| ≤ c1 t−N/2 exp − c2 τ asst sich das Lemma direkt durch Absch¨ atzung beweimit positiven Konstanten c1 , c2 . Damit l¨ sen, siehe [196], Lemma 5.6.6. ¯ in C(Q) ¯ liegt insbesondere dann vor, wenn (ii) Die Stetigkeit der Abbildung y0 → y von C(Ω) ¯ erzeugt. F¨ der elliptische Differentialoperator eine stetige Halbgruppe in C(Ω) ur den LaplaceOperator und homogene variationelle Randbedingungen wurde diese Eigenschaft in [206] bewiesen, f¨ ur den obigen Operator A in [168]. Inhomogene Dirichlet-Randdaten werden in [17] behandelt.
Maximale Regularit¨ at parabolischer Gleichungen In [85, 84] werden parabolische Gleichungen des Typs u + Au + Bu = F bei homogener Anfangsbedingung behandelt. F¨ ur uns ist deren Spezialfall u + Au = F,
u(0) = 0.
(7.39)
7 Erg¨ anzungen zu partiellen Differentialgleichungen
296
ausreichend, denn das parabolische Anfangs-Randwertproblem aus Lemma 7.12 kann bei homogenem Anfangswert y0 = 0 in der Form (7.39) aufgeschrieben werden. Dazu wird der in (7.34) auf S. 294 eingef¨ uhrte Operator A : L2 (0, T ; V ) → L2 (0, T ; V ∗ ) benutzt. Wir betrachten (7.39) im Zeitintervall S = (0, T ) und in V = H 1 (Ω). Folgende R¨ aume sind dabei von Interesse: Zun¨achst die in [85] definierten Morrey-R¨aume 2 2 ω ∗ Lω (S; L (Ω)), Lω azisieren. Ihre Be2 2 (S; L (Γ)) sowie L2 (S; V ), die wir nicht weiter pr¨ schreibung w¨ urde den beabsichtigten Rahmen dieses Abschnitts u bersteigen. Vielmehr ¨ geht es hier um ihre Einbettungseigenschaften und die S¨atze zur Regularit¨at von L¨osungen von (7.39). Weiterhin spielt der Raum 2 ω 2 ω 2 Lω 2 (S; V ) = {u ∈ L (S; V ) : u ∈ L2 (S; L (Ω)), |∇u| ∈ L2 (S; L (Ω))}
eine Rolle. Schließlich wird in dem f¨ ur uns wichtigen Fall der Dualit¨atsabbildung E : V → V ∗ der Sobolew-Morrey-Raum ω ∗ W ω (S; V ) = {u ∈ Lω 2 (S; V ) : u ∈ L2 (S; V )}
eingef¨ uhrt, vgl. Def. 6.1 in [85] mit X = Y = V . Der Leser findet eine ausf¨ uhrliche Beschreibung all dieser Sobolew-Morrey-R¨ aume und ihrer Eigenschaften in [85]. Bemerkung. In [84] wird mit G = Ω ∪ Γ ⊂ IRN die Bezeichnung H01 (G) f¨ur den Teilraum
von H 1 (Ω) mit homogenen Dirichletschen Randwerten auf dem Komplement des NeumannRandst¨ uckes Γ verwendet. In unserem Fall Γ = ∂Ω gibt es keinen Dirichlet-Rand, also gilt H01 (G) = H 1 (Ω) und H −1 (G) = H 1 (Ω)∗ = V ∗ .
Folgende Fakten werden das Verst¨ andnis der S¨atze aus [84] zur maximalen parabolischen Regularit¨ at und ihrer Anwendung auf den Beweis von Lemma 7.12 erleichtern: (i) Nach Satz 6.8 aus [84] existiert ein ω ¯ ∈ (N, N + 2], so dass die Einschr¨ankung des parabolischen Differentialoperators P : u → u + Au ur alle ω aus [0, ω ¯ ) ein linearer Isomorphismus von auf {u ∈ W ω (S; V ) : u(0) = 0} f¨ ∗ {u ∈ W ω (S; V ) : u(0) = 0} auf Lω 2 (S; V ) ist. (ii) Eine besonders wichtige Eigenschaft des Raumes W ω (S; V ) ist, dass er f¨ ur ω > N ¯ H¨ stetig in einen Raum C 0,κ (Q) older-stetiger Funktionen eingebettet ist, siehe Remark 6.1 aus [84]. Lemma 7.12 folgt nun f¨ ur y0 = 0 daraus, dass unter unseren Voraussetzungen an r und s die Abbildung (f, g) → y mit einem ω ∈ (N, ω ¯ ) stetig von Lr (Q) × Ls (Σ) in ω W (S; V ) ist. Das ergibt sich wie folgt aus [85]: ∗ (iii) Laut Theorem 5.6 aus [85] geh¨ oren zum Raum Lω ur ω ∈ [0, N ] all jene 2 (S; V ) f¨ 2 ∗ Funktionale F ∈ L (S; V ), die sich in der Form
F (t) , ϕ(t) V ∗ ,V dt = S
m S
Ω i=1
S
Ω
+
fi (x, t)Di ϕ(x, t) dxdt
f (x, t)ϕ(x, t) dxdt +
g(x, t)ϕ(x, t) ds(x)dt S
Γ
darstellen lassen, wobei 2 f1 , . . . , fN ∈ Lω 2 (S; L (Ω)),
f ∈ Lω−2 (S; L2 (Ω)), 2
g ∈ Lω−1 (S; L2 (Γ)) 2
7.3 Parabolische Gleichungen
297
gilt und die Zuordnung (f1 , . . . , fN , f, g) → F eine lineare stetige Abbildung vermittelt. Den Zusammenhang zwischen diesen Morrey-R¨ aumen und den u ¨ blichen Lebesgue-R¨aumen, in denen unsere Voraussetzungen an die Daten f und g formuliert sind, stellen wir mittels Remark 3.4 und Remark 3.7 in [85] her: 2 F¨ ur q ≥ 2 und ωq = (N + 2)(1 − 2/q) ist Lq (Q) in Lω 2 (S; L (Ω)) stetig eingebettet, und es gilt ωq > N , falls q > N + 2.
Im Falle r ≥ 2 und ωr = 2 + (N + 2)(1 − 2/r) erhalten wir die stetige Einbettung von r −2 Lr (Q) in Lω (S, L2 (Ω)). Insbesondere folgt aus r > N/2 + 1 stets ωr > N . 2 F¨ ur s ≥ 2 und ωs = 1 + (N + 1)(1 − 2/s) bettet Ls (Σ) stetig in L2ωs −1 (S, L2 (Γ)) ein. Somit folgt aus s > N + 1 stets ωs > N . Offenbar entsprechen die beiden letzten Bedingungen, also r > N/2 + 1 und s > N + 1 gerade den in Lemma 7.12 gestellten Voraussetzungen an f und g.
Index Abbildung stetige, 32 Ableitung Fr´echet, 46 Gˆ ateaux, 45 schwache, 22 Abstiegsrichtung, 74 Aktive-Mengen-Strategie, 81, 85 Banachraum, 18 Bang-BangPrinzip, 107 Steuerung, 55, 64 Bedingung erster Ordnung hinreichende, 199 Bedingung zweiter Ordnung hinreichende, 197–199, 202–204, 209, 231, 234, 237, 241 notwendige, 196 Beobachtungsoperator, 123, 130 Beschr¨ anktheitsbedingung, 157 der Ordnung k, 158 Bilinearform, 25, 132, 181 Bochner-Integral, 115 Borelmaß regul¨ ares, 268 c (generische Konstante), 29 C[a, b], 17 C([a, b], X), 114 C0∞ (Ω), 20 Carath´eodory-Bedingung, 157, 162 constraint qualification, 259 ds, 3 Di , Dx , 10 Differentialoperator elliptischer, 30 in Divergenzform, 30, 131 Differenzenverfahren, 77 Diracmaß, 270 Distribution vektorwertige, 117 ∂ν , 25 ∂νA , 30
Einbettung kompakte, 278 stetige, 277 Elliptizit¨ at gleichm¨ aßige, 30 EY , 39 Fehleranalysis, 84 Formulierung schwache, 25 Fr´echet-Ableitung eines Nemytskii-Operators, 161, 163 erster Ordnung, 218 stetige, 161 zweiter Ordnung, 181, 182, 184, 190, 193, 228 Funktion abstrakte, 113 Greensche, 101, 109, 295 messbare abstrakte, 114 Funktional, 32 konvexes, 37 lineares, 32 reduziertes, 40 schwach nach unten halbstetiges, 38 streng konvexes, 37 Γ, 2 Gebiet, 20 der Klasse C k,1 , 21 Lipschitz-, 21 Gelfandscher Dreier, 118 Gleichung adjungierte, 11, 53, 60, 98, 128, 131, 133, 172, 175, 222, 268 semilineare, 6 semilineare elliptische, 6 semilineare parabolische, 7, 8 verallgemeinerte, 206 Gradient, 10, 46 reduzierter, 12, 58, 61, 70 Gradientenverfahren bedingtes, 73 projiziertes, 76, 135, 243
Index H k (Ω), H0k (Ω), 23 H s (Γ), 90 Halbgruppe, 109 Halbierungsverfahren, 205 Halbordnungsrelation ≥K , 254 Hamiltonfunktion, 179, 226 Hauptsatz u ¨ber monotone Operatoren, 148 Hilbertraum, 19 Index konjugierter, 35 Integraloperator, 32, 49 adjungierter, 103 Karush-Kuhn-TuckerBedingungen, 15 System, 57, 275 Kegel τ -kritischer, 234 dualer, 255 konvexer, 254 kritischer, 195 Kettenregel, 47, 172 Konormale, 30 Konvergenz schwache, 35 starke, 18 Lp (a, b; X), 114 Lp (E), 19 L(U, V ), 33 L¨ osung schwache, 25, 112, 132, 149, 152, 212, 213, 250, 284 verallgemeinerte, 101 Lagrangefunktion, 13, 15, 69, 71, 96, 177, 255, 264 Lax u. Milgram Lemma von, 26 lineares Funktional, 26 Lipschitzbedingung lokale, der Ordnung k, 158 Lipschitzgebiet, 21 Lipschitzstetigkeit lokale, 157 ¯ 267 M(Ω), ¯ 284 M (Ω), Massematrix, 83 Maximumbedingung, 180 Maximumnorm, 17, 89 Minimierung, 271
299 Maximumprinzip Pontrjaginsches, 180, 227 Menge konvexe, 37 schwach folgenabgeschlossene, 37 stark aktive, 200, 202, 230, 234 Minimumprinzip, 55, 61, 129 schwaches, 55 Multiplikator Lagrangescher, 14, 15, 58, 68, 88, 255, 258, 259, 275 Multiplikatorenregel, 13, 260 ν, 3 Navier-Stokes-Gleichungen instation¨ are, 8, 249 station¨ are, 6 Nemytskii-Operator, 156, 157 Neumannproblem, 152 Newtonverfahren, 205–207 projiziertes, 85 Norm, 17 eines linearen Operators, 33 Normalenableitung, 25 Normalenvektor, 3 Oberfl¨ achenelement, 3 Oberfl¨ achenmaß Lebesguesches, 21 Ω, 2 Operator adjungierter, 48 beschr¨ ankter, 32 dualer, 48 konvexer, 255 monotoner, 147 stetiger, 32 Optimalit¨ atssystem, 12, 53, 57, 129, 269, 275 Optimierungsaufgabe quadratische, im Hilbertraum, 40 partielle Integration, 21, 119 Phasenfeldmodell, 7, 247 Poissongleichung, 24 Problem reduziertes, 9, 78, 135 Projektionsformel, 56, 62, 105, 106, 129, 131, 173, 223, 225 Punktfunktional, 89 Minimierung, 270 Q, 4
300 Randbedingung dritter Art, 27 inhomogene Dirichlet-, 31 Neumann, 65, 90, 91, 99, 100, 152 Robin, 27 Stefan-Boltzmann, 6, 7, 175, 178, 219, 225, 236 Randbeobachtung, 44, 124 Randsteuerung, 3 Raum bidualer, 34 dualer, 33 normierter, 17 reflexiver, 34 vollst¨ andiger, 18 Regularisierungsparameter, 3, 125 Regularit¨ atsbedingung, 259 von Zowe und Kurcyusz, 259 Restglied, 189 in Integralform, 188 Restriktion stark aktive, 186, 200, 230, 234 Richtungsableitung, 44 S, 40 Sattelpunkt, 255 Satz von Browder und Minty, 148 Rellich, 277 Riesz, 34 Taylor, 181 Schrittweite Armijo, 76, 205 exakte, 75 Halbierungsverfahren, 76, 205 schwach folgenabgeschlossen, 37 folgenkompakt, 37 folgenstetig, 36 konvergent, 35 Σ, 4 Skalarprodukt, 18 Slaterbedingung, 256, 258 linearisierte, 261 Sobolew-Slobodetskii-Raum, 90 Sobolewraum, 23 Spuroperator, 24 Stetigkeit, 277 Spursatz, 24 SQP-Verfahren, 206, 207, 209, 244 Steifigkeitsmatrix, 83 Steuerung Bang-Bang, 55, 64
Index lokal optimale, 165, 215 optimale, 39, 165, 215 verteilte, 4 zul¨ assige, 39 Steuerungs-Zustands-Operator, 39 Supraleitung, 6, 173, 223 τ , 23, 24, 277 Temperaturquelle, 3 Testfunktion, 25, 112, 113 Treppenfunktion, 79, 114, 135 Umschaltpunkt, 107 Ungleichung Friedrichs’sche, 26 H¨ oldersche, 35 Poincar´esche, 28 Cauchy-Schwarz, 19 verallgemeinerte Friedrichs’sche, 28 verallgemeinerte Poincar´esche, 28 V -elliptisch, 26, 86 Variationsformulierung, 25, 212 Variationsgleichung, 112, 132 Variationsungleichung, 11, 50, 51, 172, 173, 175, 221, 222, 224 im Hilbertraum, 50 punktweise, 54 W (0, T ), 118 W k,p (Ω), W0k,p (Ω), 22 W21,0 (Q), 111 W21,1 (Q), 111 Wachstumsbedingung, 162 quadratische, 185, 189, 197, 199, 202– 204, 231, 234 yt , 5 Zielfunktional, 3 Zustand adjungierter, 11, 53 optimaler, 165 Zustandsbeschr¨ ankung integrale, 238 punktweise, 89, 265, 266, 272, 274 Zustandsgleichung, 3 Zwei-Norm-Diskrepanz, 188, 203, 204, 234
Literaturverzeichnis [1] Abergel, F. und R. Temam: On some control problems in fluid mechanics. Theoret. Comput. Fluid Dynamics, 1:303–325, 1990. [2] Adams, R. A.: Sobolev Spaces. Academic Press, Boston, 1978. [3] Afanasiev, K. und M. Hinze: Adaptive control of a wake flow using proper orthogonal decomposition. In: Shape Optimization & Optimal Design, Band 216 der Reihe Lect. Notes in Pure and Appl. Math., Seiten 317–332. Marcel Dekker, 2001. [4] Ahmed, N. U. und K. L. Teo: Optimal Control of Distributed Parameter Systems. North Holland, New York, 1981. [5] Alibert, J.-J. und J.-P. Raymond: Boundary control of semilinear elliptic equations with discontinuous leading coefficients and unbounded controls. Numer. Funct. Anal. and Optimization, 3&4:235–250, 1997. [6] Alt, H. W.: Lineare Funktionalanalysis. Springer-Verlag, Berlin, 1999. [7] Alt, W.: Nichtlineare Optimierung. Vieweg, Wiesbaden, 2002. [8] Alt, W. und U. Mackenroth: On the numerical solution of state constrained coercive parabolic optimal control problems. In: Hoffmann, K.-H. und W. Krabs (Herausgeber): Optimal Control of Partial Differential Equations, Band 68 der Reihe ISNM, Seiten 44–62. Birkh¨ auser Verlag, 1984. [9] Alt, W. und U. Mackenroth: Convergence of finite element approximations to state constrained convex parabolic boundary control problems. SIAM J. Control and Optimization, 27:718–736, 1989. [10] Alt, W. und K. Malanowski: The Lagrange-Newton Method for Nonlinear Optimal Control Problems. Computational Optimization and Applications, 2:77–100, 1993. [11] Antoulas, A. C.: Approximation of Large-Scale Dynamical Systems. SIAM, Philadelphia, 2005. [12] Appell, J.: The superposition operator in function spaces – a survey. Expositiones Math., 6:209–270, 1988. [13] Appell, J. und P. P. Zabrejko: Nonlinear Superposition Operators. Cambridge University Press, 1990. [14] Arada, N., E. Casas und F. Tr¨ oltzsch: Error estimates for the numerical approximation of a semilinear elliptic control problem. Computational Optimization and Applications, 23:201–229, 2002. [15] Arada, N., H. El Fekih und J.-P. Raymond: Asymptotic analysis of some control problems. Asymptotic Analysis, 24:343–366, 2000. [16] Arada, N., J.-P. Raymond und F. Tr¨ oltzsch: On an augmented Lagrangian SQP method for a class of optimal control problems in Banach spaces. Computational Optimization and Applications, 22:369–398, 2002. [17] Arendt, C., C. Batty, M. Hieber und F. Neubrander: Vector-valued Laplace Transforms and Cauchy Problems. Birkh¨ auser, Basel, 2001.
302
Literaturverzeichnis
[18] Balakrishnan, A. V.: Optimal Control in Banach Spaces. SIAM J. Control, 3:152–180, 1965. [19] Barbu, V.: Analysis and control of nonlinear infinite dimensional systems. Academic Press, Boston, 1993. [20] Barbu, V. und Th. Precupanu: Convexity and Optimization in Banach Spaces. Editura Academiei, Sijthoff & Noordhoff, Leyden, 1978. [21] Becker, R., H. Kapp und R. Rannacher: Adaptive finite element methods for optimal control of partial differential equations: Basic concepts. SIAM J. Control and Optimization, 39:113–132, 2000. [22] Becker, R. und R. Rannacher: An optimal control approach to a posteriori error estimation in finite element methods. Acta Numerica, 10:1–102, 2001. [23] Ben Belgacem, F., H. El Fekih und J.-P. Raymond: A penalized Robin approach for solving a parabolic equation with nonsmooth Dirichlet boundary condition. Asymptotic Analysis, 34:121–136, 2003. [24] Bensoussan, A., G. Da Prato, M. C. Delfour und S. K. Mitter: Representation and Control of Infinite Dimensional Systems, Vol. I. Birkh¨ auser Verlag, Basel, 1992. [25] Bensoussan, A., G. Da Prato, M. C. Delfour und S. K. Mitter: Representation and Control of Infinite Dimensional Systems, Vol. II. Birkh¨ auser Verlag, Basel, 1993. [26] Bergounioux, M., K. Ito und K. Kunisch: Primal-dual strategy for constrained optimal control problems. SIAM J. Control and Optimization, 37:1176–1194, 1999. [27] Bergounioux, M. und K. Kunisch: On the structure of the Lagrange multiplier for stateconstrained optimal control problems. Systems and Control Letters, 48:16–176, 2002. [28] Bergounioux, M. und K. Kunisch: Primal-dual active set strategy for state-constrained optimal control problems. Computational Optimization and Applications, 22:193–224, 2002. [29] Bertsekas, D. M.: Projected Newton methods for optimization problems with simple constraints. SIAM J. Control and Optimization, 20:221–246, 1982. [30] Betts, J. T.: Practical Methods for Optimal Control Using Nonlinear Programming. SIAM, Philadelphia, 2001. [31] Bittner, L.: On optimal control of processes governed by abstract functional, integral and hyperbolic differential equations. Math. Operationsforsch. Statistik, 6:107–134, 1975. [32] Bonnans, F. und E. Casas: Une principe de Pontryagine pour le contrˆ ole des syst` emes semilin´ eaires elliptiques. J. Diff. Equations, 90:288–303, 1991. [33] Bonnans, F. und E. Casas: An extension of Pontryagin’s principle for state constrained optimal control of semilinear elliptic equations and variational inequalities. SIAM J. Control and Optimization, 33:274–298, 1995. [34] Bonnans, F. und A. Shapiro: Perturbation Analysis of Optimization Problems. SpringerVerlag, New York, 2000. [35] Borzi, A.: Multigrid methods for parabolic distributed optimal control problems. J. Comp. Appl. Math., 157:365–382, 2003. [36] Borzi, A. und K. Kunisch: A multigrid method for optimal control of time-dependent reaction diffusion processes. In: Hoffmann, K. H., R. Hoppe und V. Schulz (Herausgeber): Fast Solution of Discretized Optimization Problems, Band 138 der Reihe ISNM, Seiten 513–524. Birkh¨ auser Verlag, 2001. [37] Braess, D.: Finite Elemente: Theorie, schnelle L¨ oser und Anwendungen in der Elastizit¨ ats-
Literaturverzeichnis
303
theorie. Springer-Verlag, Berlin, 2007. [38] Brenner, S. C. und L. R. Scott: The mathematical theory of finite element methods. Springer-Verlag, New York, 1994. [39] Butkovskii, A. G.: Distributed control systems. American Elsevier, New York, 1969. [40] Butkovskii, A. G.: Methods for the Control of Distributed Parameter Systems (in Russian). Isd. Nauka, Moscow, 1975. [41] Cartan, H.: Calcul diff´erentiel. Formes diff´ erentielles. Hermann, Paris, 1967. [42] Casas, E.: Control of an elliptic problem with pointwise state constraints. SIAM J. Control and Optimization, 4:1309–1322, 1986. [43] Casas, E.: Introduccion a las ecuaciones en derivadas parciales. Universidad de Cantabria, Santander, 1992. [44] Casas, E.: Boundary control of semilinear elliptic equations with pointwise state constraints. SIAM J. Control and Optimization, 31:993–1006, 1993. [45] Casas, E.: Optimality conditions for some control problems of turbulent flow. In: Gunzburger, M. D. (Herausgeber): Flow Control, Seiten 127–147, New York, 1995. Springer-Verlag. [46] Casas, E.: Pontryagin’s principle for state-constrained boundary control problems of semilinear parabolic equations. SIAM J. Control and Optimization, 35:1297–1327, 1997. [47] Casas, E. und M. Mateos: Second order sufficient optimality conditions for semilinear elliptic control problems with finitely many state constraints. SIAM J. Control and Optimization, 40:1431–1454, 2002. [48] Casas, E. und M. Mateos: Uniform convergence of the FEM. Applications to state constrained control problems. J. of Computational and Applied Mathematics, 21:67–100, 2002. [49] Casas, E., M. Mateos und F. Tr¨ oltzsch: Error estimates for the numerical approximation of boundary semilinear elliptic control problems. Computational Optimization and Applications, 31:193–220, 2005. [50] Casas, E. und J.-P. Raymond: Error estimates for the numerical approximation of Dirichlet boundary control for semilinear elliptic equations. SIAM J. Control and Optimization, 45:1586–1611, 2006. [51] Casas, E., J. C. De los Reyes und F. Tr¨ oltzsch: Sufficient second-order optimality conditions for semilinear control problems with pointwise state constraints. SIAM J. on Optimization, 19(2):616–643, 2008. [52] Casas, E. und F. Tr¨ oltzsch: Second-order necessary optimality conditions for some stateconstrained control problems of semilinear elliptic equations. Applied Math. and Optimization, 39:211–227, 1999. [53] Casas, E. und F. Tr¨ oltzsch: Second order necessary and sufficient optimality conditions for optimization problems and applications to control theory. SIAM J. on Optimization, 13:406–431, 2002. [54] Casas, E., F. Tr¨ oltzsch und A. Unger: Second order sufficient optimality conditions for a nonlinear elliptic control problem. Z. f¨ ur Analysis und ihre Anwendungen (ZAA), 15:687– 707, 1996. [55] Casas, E., F. Tr¨ oltzsch und A. Unger: Second order sufficient optimality conditions for some state-constrained control problems of semilinear elliptic equations. SIAM J. Control and Optimization, 38(5):1369–1391, 2000. [56] Chen, Z. und K. H. Hoffmann: Numerical solutions of the optimal control problem governed by a phase field model. In: Desch, W., F. Kappel und K. Kunisch (Herausgeber): Estimation
304
Literaturverzeichnis and Control of Distributed Parameter Systems, Band 100 der Reihe ISNM, Seiten 79–97. Birkh¨ auser Verlag, 1991.
[57] Ciarlet, P.G.: The Finite Element Method for Elliptic Problems. North-Holland, Amsterdam, 1978. [58] Conway, J.B.: A course in Functional Analysis. Wiley & Sons, Warsaw/Dordrecht, 1990. [59] Coron, J.-M.: Control and Nonlinearity. American Mathematical Society, Providence, 2007. [60] Deuflhard, P.: Newton Methods for Nonlinear Problems. Affine Invariance and Adaptive Algorithms, Band 35 der Reihe Springer Series in Computational Mathematics. SpringerVerlag, Berlin, 2004. [61] Dhamo, V. und F. Tr¨ oltzsch: Some aspects of reachability for parabolic boundary control problems with control constraints. Erscheint in ESAIM COCV. [62] Dontchev, A. L., W. W. Hager, A. B. Poore und B. Yang: Optimality, stability, and convergence in nonlinear control. Applied Math. and Optimization, 31:297–326, 1995. [63] Dunn, J. C.: On second order sufficient optimality conditions for structured nonlinear programs in infinite-dimensional function spaces. In: Fiacco, A. (Herausgeber): Mathematical Programming with Data Perturbations, Seiten 83–107. Marcel Dekker, 1998. [64] Ekeland, I. und R. Temam: Analyse convexe et probl`emes variationnels. Dunod, GauthierVillars, 1974. [65] Emmrich, E.: Gew¨ ohnliche und Operator-Differentialgleichungen. Vieweg, Wiesbaden, 2004. [66] Eppler, K. und F. Tr¨ oltzsch: On switching points of optimal controls for coercive parabolic boundary control problems. Optimization, 17:93–101, 1986. [67] Evans: Partial Differential Equations, Band 19 der Reihe Graduate Studies in Mathematics. American Math. Society, Providence, Rhode Island, 1998. [68] Fattorini, H. O.: Infinite Dimensional Optimization and Control Theory. Cambridge University Press, Cambridge, 1999. [69] Forster, O.: Analysis 3. Vieweg+Teubner, Wiesbaden, 2008. [70] Friedman, A.: Partial Differential Equations of Parabolic Type. Prentice–Hall, Englewood Cliffs, 1964. [71] Fursikov, A. V.: Optimal Control of Distributed Systems. Theory and Applications. American Math. Society, Providence, Rhode Island, 1999. [72] Gajewski, H., K. Gr¨ oger und K. Zacharias: Nichtlineare Operatorgleichungen und Operatordifferentialgleichungen. Akademie–Verlag, Berlin, 1974. [73] Galdi, P., G.: An Introduction to the Navier-Stokes Equations. Springer-Verlag, New York, 1994. [74] Gill, P. E., W. Murray und M. H. Wright: Practical Optimization. Academic Press, London, 1981. [75] Glashoff, K. und E. W. Sachs: On theoretical and numerical aspects of the bang-bang principle. Numerische Mathematik, 29:93–113, 1977. [76] Glashoff, K. und N. Weck: Boundary control of parabolic differential equations in arbitrary dimensions – supremum-norm problems. SIAM J. Control and Optimization, 14:662–681, 1976. echet-differentiability of Nemytskij operators in H¨ older [77] Goebel, M.: Continuity and Fr´
Literaturverzeichnis
305
spaces. Monatshefte f. Mathematik, 113:107–119, 1992. [78] Goldberg, H., W. Kampowsky und F. Tr¨ oltzsch: On Nemytskij Operators in Lp –spaces of abstract functions. Math. Nachr., 155:127–140, 1992. [79] Goldberg, H. und F. Tr¨ oltzsch: Second order sufficient optimality conditions for a class of non–linear parabolic boundary control problems. SIAM J. Control and Optimization, 31:1007–1025, 1993. [80] Goldberg, H. und F. Tr¨ oltzsch: On a SQP–multigrid technique for nonlinear parabolic boundary control problems. In: Hager, W. W. und P.M. Pardalos (Herausgeber): Optimal Control: Theory, Algorithms and Applications, Seiten 154–177, Dordrecht, 1997. Kluwer Academic Publishers. [81] G¨ opfert, A.: Mathematische Optimierung in allgemeinen Vektorr¨ aumen. Teubner-Verlag, Leipzig, 1973. [82] G¨ oring, H., H.-G. Roos und L. Tobiska: Finite-Element-Methode. Akademie Verlag/Verlag Harri Deutsch, Berlin/Thun, 1989. [83] Griepentrog, J. A.: Linear elliptic boundary value problems with non-smooth data: Campanato spaces of functionals. Mathematische Nachrichten, 243:19–42, 2002. [84] Griepentrog, J. A.: Maximal regularity for nonsmooth parabolic problems in Sobolev– Morrey spaces. Adv. Differential Equations, 12:1031–1078, 2007. [85] Griepentrog, J. A.: Sobolev–Morrey spaces associated with evolution equations. Adv. Differential Equations, 12:781–840, 2007. [86] Grisvard, P.: Elliptic Problems in Nonsmooth Domains. Pitman, Boston, 1985. [87] Grossmann, C. und H.-G. Roos: Numerische Behandlung partieller Differentialgleichungen. Teubner-Verlag, Wiesbaden, 2005. [88] Grossmann, C. und J. Terno: Numerik der Optimierung. Teubner-Verlag, Stuttgart, 1997. [89] Grund, T. und A. R¨ osch: Optimal control of a linear elliptic equation with a supremumnorm functional. Optimization Methods and Software, 15:299–329, 2001. [90] Gruver, W. A. und E. W. Sachs: Algorithmic Methods in Optimal Control. Pitman, London, 1980. [91] Gunzburger, M. D.: Perspectives in Flow Control and Optimization. SIAM, Philadelphia, 2003. [92] Gunzburger, M. D. und S. Manservisi: The velocity tracking problem for Navier-Stokes flows with bounded distributed controls. SIAM J. Control and Optimization, 37:1913–1945, 1999. [93] Gunzburger, M. D. und S. Manservisi: Analysis and approximation of the velocity tracking problem for Navier-Stokes flows with distributed control. SIAM J. Numer. Analysis, 37:1481–1512, 2000. [94] Gunzburger Ed., M. D.: Flow Control. Spinger-Verlag, New York, 1995. [95] Haller-Dintelmann, R., C. Meyer, J. Rehberg und A. Schiela: H¨ older continuity and optimal control for nonsmooth elliptic problems. Applied Math. Optim., DOI 10.1007/s00245-0099077-x. [96] Heinkenschloss, M.: Projected sequential quadratic programming methods. SIAM J. on Optimization, 6:373–417, 1996. [97] Heinkenschloss, M.: The numerical solution of a control problem governed by a phase field model. Optimization Methods and Software, 7:211–263, 1997.
306
Literaturverzeichnis
[98] Heinkenschloss, M. und E. W. Sachs: Numerical solution of a constrained control problem for a phase field model. In: Desch, W., F. Kappel und K. Kunisch (Herausgeber): Control and Estimation of Distributed Parameter Systems, Band 118 der Reihe ISNM, Seiten 171– 188. Birkh¨ auser Verlag, 1994. [99] Heinkenschloss, M. und F. Tr¨ oltzsch: Analysis of the Lagrange-SQP-Newton method for the control of a phase field equation. Control and Cybernetics, 28(2):178–211, 1999. [100] Heinkenschloss, M. und L. N. Vicente: Analysis of inexact trust-region SQP algorithms. SIAM J. on Optimization, 12:283–302, 2001. [101] Heuser, H.: Funktionalanalysis. Teubner-Verlag, Wiesbaden, 2006. [102] Heuser, H.: Lehrbuch der Analysis, Teil 2. Vieweg+Teubner, Wiesbaden, 2008. [103] Hille, E. und R. S. Phillips: Functional Analysis and Semigroups. Amer. Math. Soc. Colloq. Publ., Providence, 1957. [104] Hinze, M.: Optimal and instantaneous control of the instationary Navier-Stokes equations. Habilitationsschrift, TU Berlin, 1999. [105] Hinze, M.: A variational discretization concept in control constrained optimization: the linear-quadratic case. J. Computational Optimization and Applications, 30:45–63, 2005. [106] Hinze, M. und K. Kunisch: Second order methods for optimal control of time-dependent fluid flow. SIAM J. Control and Optimization, 40:925–946, 2001. [107] Hinze, M. und K. Kunisch: Second order methods for boundary control of the instationary Navier-Stokes system. ZAMM, 84:171–187, 2004. [108] Hinze, M., R. Pinnau, M. Ulbrich und S. Ulbrich: Optimization with PDE Constraints, Band 23. Springer-Verlag, Berlin, 2009. [109] Hoffmann, K.-H. und L. Jiang: Optimal control problem of a phase field model for solidification. Numer. Funct. Anal., 13:11–27, 1992. [110] H¨ omberg, D. und S. Volkwein: Control of laser surface hardening by a reduced-order approach using proper orthogonal decomposition. Mathematical and Computer Modeling, 38:1003–1028, 2003. [111] Ioffe, A. D.: Necessary and sufficient conditions for a local minimum 3: Second order conditions and augmented duality. SIAM J. Control and Optimization, 17:266–288, 1979. [112] Ioffe, A. D. und V. M. Tichomirov: Theorie der Extremalaufgaben. Deutscher Verlag der Wissenschaften, Berlin, 1979. [113] Ito, K. und K. Kunisch: Augmented Lagrangian-SQP methods for nonlinear optimal control problems of tracking type. SIAM J. Control and Optimization, 34:874–891, 1996. [114] Ito, K. und K. Kunisch: Augmented Lagrangian methods for nonsmooth, convex optimization in Hilbert spaces. Nonlinear Analysis, Theory, Methods and Applications, 41:591–616, 2000. [115] Ito, K. und K. Kunisch: Lagrange Multiplier Approach to Variational Problems and Applications. SIAM, Philadelphia, 2008. [116] Jahn, J.: Introduction to the Theory of Nonlinear Optimization. Springer-Verlag, Berlin, 1994. [117] Jerison, D. S. und C. E. Kenig: The Neumann problem on Lipschitz domains. Bull. Amer. Math. Soc. (N.S.), 4:203–207, 1981. [118] Kantorowitsch, L. W. und G. P. Akilow: Funktionalanalysis in normierten R¨ aumen. Akademie-Verlag, Berlin, 1978.
Literaturverzeichnis
307
[119] Karafiat, A.: The problem of the number of switches in parabolic equations with control. Ann. Polish Math., XXXIV:289–316, 1977. [120] Kelley, C. T.: Iterative Methods for Optimization. SIAM, Philadelphia, 1999. [121] Kelley, C. T. und E. W. Sachs: Multilevel algorithms for constrained compact fixed point problems. SIAM J. Scientific Computing, 15:645–667, 1994. [122] Kelley, C. T. und E. W. Sachs: Solution of optimal control problems by a pointwise projected Newton method. SIAM J. Control and Optimization, 33:1731–1757, 1995. [123] Kinderlehrer, D. und G. Stampacchia: An Introduction to Variational Inequalities and their Applications. Academic Press, New York, 1980. [124] Klatte, D. und B. Kummer: Nonsmooth Equations in Optimization: Regularity, Calculus, Methods and Applications. Kluwer Academic Publishers, Dordrecht, 2002. ¨ [125] Knowles, G.: Uber das Bang-Bang-Prinzip bei Kontrollproblemen aus der W¨ armeleitung. Arch. Math., 29:300–309, 1977. [126] Krabs, W.: Einf¨ uhrung in die lineare und nichtlineare Optimierung f¨ ur Ingenieure. Teubner-Verlag, Stuttgart, 1983. [127] Krabs, W.: Optimal Control of Undamped Linear Vibrations. Heldermann Verlag, Lemgo, 1995. [128] Krasnoselskii, M. A., P. P. Zabreiko, E. I. Pustylnik und P. E. Sobolevskii: Integral Operators in Spaces of Summable Functions. Noordhoff, Leyden, 1976. [129] Kunisch, K. und A. R¨ osch: Primal-dual active set strategy for a general class of constrained optimal control problems. SIAM J. on Optimization, 13:321–334, 2002. [130] Kunisch, K. und B. Vexler: Constrained Dirichlet boundary control in L2 for a class of evolution equations. SIAM J. Control Optimization, 46:1726–1753, 2007. [131] Kunisch, K. und S. Volkwein: Galerkin proper orthogonal decomposition methods for parabolic problems. Numerische Mathematik, 90:117–148, 2001. [132] Kunisch, K. und S. Volkwein: Galerkin proper orthogonal decomposition methods for a general equation in fluid dynamics. SIAM J. Numerical Analysis, 40:492–515, 2002. [133] Kupfer, F.-S. und E. W. Sachs: Numerical solution of a nonlinear parabolic control problem by a reduced SQP method. Computational Optimization and Applications, 1:113–135, 1992. [134] Ladyzhenskaya, O. A., V. A. Solonnikov und N. N. Ural’ceva: Linear and Quasilinear Equations of Parabolic Type. American Math. Society, Providence, R.I., 1968. [135] Ladyzhenskaya, O. A. und N. N. Ural’ceva: Linear and Quasilinear Equations of Elliptic Type (in Russian). Izdat. “Nauka”, Moscow, 1973. [136] Lagnese, J. E., G. Leugering und E. J. P. G. Schmidt: Modeling, Analysis and Control of Dynamic Elastic Multi-Link Structures. Birkh¨ auser Verlag, Boston, 1994. [137] Lasiecka, I.: Mathematical control theory of coupled PDEs. CBMS-NSF Regional Conference Series in Applied Mathematics. SIAM, Philadelphia, 2002. [138] Lasiecka, I. und R. Triggiani: Control Theory for Partial Differential Equations: Continuous and Approximation Theories. 1: Abstract Parabolic Systems. Cambridge University Press, Cambridge, 2000. [139] Lasiecka, I. und R. Triggiani: Control Theory for Partial Differential Equations: Continuous and Approximation Theories. 2: Abstract Hyperbolic-Like Systems over a Finite Time Horizon. Cambridge University Press, Cambridge, 2000. [140] Lefter, C. und J. Sprekels: Optimal boundary control of a phase field system modeling
308
Literaturverzeichnis nonisothermal phase transitions. Adv. Math. Sci. Appl., 17:181–194, 2007.
[141] Leibfritz, F. und E. W. Sachs: Inexact SQP interior point methods and large scale optimal control problems. SIAM J. Control and Optimization, 38:272–293, 2000. [142] Li, X. und J. Yong: Optimal Control Theory for Infinite Dimensional Systems. Birkh¨ auser Verlag, Boston, 1995. [143] Lions, J. L.: Quelques m`ethodes des r`esolution des probl` emes aux limites non lin` eaires. Dunod, Gauthier–Villars, Paris, 1969. [144] Lions, J. L.: Optimal Control of Systems Governed by Partial Differential Equations. Springer-Verlag, Berlin, 1971. [145] Lions, J. L. und E. Magenes: Nonhomogeneous Boundary Value Problems and Applications, Band 1–3. Springer-Verlag, Berlin, 1972. [146] Ljusternik, L. A. und W. I. Sobolew: Elemente der Funktionalanalysis. Akademie-Verlag, Berlin, 1999. [147] Luenberger, D. G.: Optimization by Vector Space Methods. Wiley, New York, 1969. [148] Luenberger, D. G.: Linear and Nonlinear Programming. Addison Wesley, Reading, Massachusetts, 1984. [149] Maar, B. und V. Schulz: Interior point multigrid methods for topology optimization. Structural Optimization, 19:214–224, 2000. [150] Mackenroth, U.: Time–optimal parabolic boundary control problems with state constraints. Num. Funct. Anal. Opt., 3:285–300, 1981. [151] Mackenroth, U.: Convex parabolic boundary control problems with state constraints. J. Math. Anal. Appl., 87:256–277, 1982. [152] Mackenroth, U.: Some remarks on the numerical solution of bang–bang type optimal control problems. Num. Funct. Anal. Optim., 22:477–500, 1982–83. [153] Mackenroth, U.: On a parabolic distributed optimal control problem with restrictions on the gradient. Appl. Math. Optim., 10:69–95, 1983. [154] Macki, J. und A. Strauss: Introduction to Optimal Control Theory. Springer-Verlag, Berlin, 1982. [155] Malanowski, K.: Convergence of approximations vs. regularity of solutions for convex, control–constrained optimal control problems. Applied Math. Optimization, 8:69–95, 1981. [156] Maurer, H.: First and second order sufficient optimality conditions in mathematical programming and optimal control. Math. Programming Study, 14:163–177, 1981. [157] Maurer, H. und H. D. Mittelmann: Optimization techniques for solving elliptic control problems with control and state constraints. I: Boundary control. J. of Computational and Applied Mathematics, 16:29–55, 2000. [158] Maurer, H. und H. D. Mittelmann: Optimization techniques for solving elliptic control problems with control and state constraints. II: Distributed control. J. of Computational and Applied Mathematics, 18:141–160, 2001. [159] Maurer, H. und J. Zowe: First- and second-order conditions in infinite-dimensional programming problems. Math.Programming, 16:98–110, 1979. [160] Meyer, C. und A. R¨ osch: Superconvergence properties of optimal control problems. SIAM J. Control and Optimization, 43:970–985, 2004. [161] Meyer, C., A. R¨ osch und F. Tr¨ oltzsch: Optimal control of PDEs with regularized pointwise state constraints. Computational Optimization and Applications, 33:209–228, 2006.
Literaturverzeichnis
309
[162] Meyer, C. und F. Tr¨ oltzsch: On an elliptic optimal control problem with pointwise mixed control-state constraints. In: Seeger, A. (Herausgeber): Recent Advances in Optimization. Proceedings of the 12th French-German-Spanish Conference on Optimization held in Avignon, September 20-24, 2004, Lectures Notes in Economics and Mathematical Systems. Springer-Verlag, to appear 2005. [163] Mittelmann, H. D. und F. Tr¨ oltzsch: Sufficient optimality in a parabolic control problem. In: Siddiqi, A. H. und M. Kocvara (Herausgeber): Trends in Industrial and Applied Mathematics, Seiten 305–316, Dordrecht, 2002. Kluwer Academic Publishers. [164] Neitaanm¨ aki, P., J. Sprekels und D. Tiba: Optimization of Elliptic Systems. SpringerVerlag, Berlin, 2006. [165] Neitaanm¨ aki, P. und D. Tiba: Optimal Control of Nonlinear Parabolic Systems: Theory, Algorithms, and Applications. Marcel Dekker, New York, 1994. [166] Neitzel, I., U. Pr¨ ufert und T. Slawig: Strategies for time-dependent PDE control with inequality constraints using an integrated modeling and simulation environment. Numerical Algorithms, 50(3):241–269, 2009. [167] Neˇcas, J.: Les m´ethodes directes en th´eorie des equations elliptiques. Academia, Prague, 1967. [168] Nittka, Robin: Regularity of solutions of linear second order elliptic and parabolic boundary value problems on Lipschitz domains. arXiv:0906.5285v1, Juni 2009. [169] Nocedal, J. und S. J. Wright: Numerical Optimization. Springer-Verlag, New York, 1999. [170] Pazy, A.: Semigroups of Linear Operators and Applications to Partial Differential Equations. Springer-Verlag, New York, 1983. [171] Penot, J.-P.: On regularity conditions in mathematical programming. Mathematical Programming Study, 19:167–199, 1982. [172] Polak, E.: Optimization: algorithms and consistent approximations, Band 124. SpringerVerlag, New York, 1997. [173] Pontryagin, L. S., V. G. Boltyanskii, R. V. Gamkrelidze und E. F. Mishchenko: The Mathematical Theory of Optimal Processes. Wiley, New York, 1962. [174] Raymond, J.-P. und F. Tr¨ oltzsch: Second order sufficient optimality conditions for nonlinear parabolic control problems with state constraints. Discrete and Continuous Dynamical Systems, 6:431–450, 2000. [175] Raymond, J.-P. und H. Zidani: Pontryagin’s principle for state-constrained control problems governed by parabolic equations with unbounded controls. SIAM J. Control and Optimization, 36:1853–1879, 1998. [176] Raymond, J.-P. und H. Zidani: Hamiltonian Pontryagin’s Principles for control Problems governed by Semilinear Parabolic Equations. Applied Math. and Optimization, 39:143– 177, 1999. [177] Robinson, S. M.: Strongly regular generalized equations. Mathematics of Operations Research, 5:43–62, 1980. [178] R¨ osch, A.: Error estimates for parabolic optimal control problems with control constraints. Z. f¨ ur Analysis und ihre Anwendungen (ZAA), 23:353–376, 2004. [179] R¨ osch, A. und D. Wachsmuth: Numerical verification of optimality conditions. SIAM J. Control Optimization, 47(5):2557–2581, 2008. [180] Roub´ıˇcek, T.: Optimization of steady-state flow of incompressible fluids. In: Barbu, V., I. Lasiecka, D. Tiba und C. Varsan (Herausgeber): Analysis and Optimization of Differential Systems, Seiten 357–368, Boston, 2002. Kluwer Academic Publishers.
310
Literaturverzeichnis
[181] Roub´ıˇcek, T. und F. Tr¨ oltzsch: Lipschitz stability of optimal controls for the steady state Navier-Stokes equations. Control and Cybernetics, 32:683–705, 2003. [182] Sachs, E. W.: A parabolic control problem with a boundary condition of the Stefan– Boltzmann type. ZAMM, 58:443–449, 1978. [183] Schittkowski, K.: Numerical solution of a time–optimal parabolic boundary-value control problem. JOTA, 27:271–290, 1979. [184] Schmidt, E. J. P. G.: The bang–bang–principle for the time–optimal problem in boundary control of the heat equation. SIAM J. Control and Optimization, 18:101–107, 1980. [185] Schmidt, E. J. P. G.: Boundary control for the heat equation with non-linear boundary condition. J. Diff. Equations, 78:89–121, 1989. [186] Schulz, V. und G. Wittum: Multigrid optimization methods for stationary parameter identification problems in groundwater flow. In: Hackbusch, W. und G. Wittum (Herausgeber): Multigrid Methods V, Band 3 der Reihe Lect. Notes in Comput. Sci. and Engineering, Seiten 276–288. Springer-Verlag, 1998. [187] Spellucci, P.: Numerische Verfahren der nichtlinearen Optimierung. Birkh¨ auser Verlag, Basel, 1993. [188] Sprekels, J. und S. Zheng: Optimal control problems for a thermodynamically consistent model of phase-field type for phase transitions. Advances in Math. Sci. and Appl., 1:113– 125, 1992. [189] Stampacchia, G.: Le probl`eme de Dirichlet pour les ´equations elliptiques du second ordre a coefficients discontinus. Ann. Inst. Fourier, Grenoble, 15:189–258, 1965. ` [190] Tanabe, H.: Equations of evolution. Pitman, London, 1979. [191] Temam, R.: Navier-Stokes Equations. North-Holland, Amsterdam, 1979. [192] Tiba, D.: Optimal Control of Nonsmooth Distributed Parameter Systems, Band 1459 der Reihe Lecture Notes in Mathematics. Springer-Verlag, Berlin, 1990. [193] Tiba, D. und F. Tr¨ oltzsch: Error estimates for the discretization of state constrained convex control problems. Num. Funct. Anal. Optim., 17:1005–1028, 1996. [194] Triebel, H.: Interpolation Theory, Function Spaces, Differential Operators. J. A. Barth Verlag, Heidelberg-Leipzig, 1995. [195] Tr¨ oltzsch, F.: The generalized bang-bang-principle and the numerical solution of a parabolic boundary-control problem with constraints on the control and the state. ZAMM, 64:551– 557, 1984. [196] Tr¨ oltzsch, F.: Optimality conditions for parabolic control problems and applications, Band 62 der Reihe Teubner Texte zur Mathematik. Teubner-Verlag, Leipzig, 1984. [197] Tr¨ oltzsch, F.: On the Lagrange-Newton-SQP method for the optimal control of semilinear parabolic equations. SIAM J. Control and Optimization, 38:294–312, 1999. [198] Tr¨ oltzsch, F.: Lipschitz stability of solutions of linear-quadratic parabolic control problems with respect to perturbations. Dyn. Contin. Discrete Impulsive Syst., 7:289–306, 2000. [199] Tr¨ oltzsch, F. und D. Wachsmuth: Second-order sufficient optimality conditions for the optimal control of Navier-Stokes equations. ESAIM: Control, Optimisation and Calculus of Variations, 12:93–119, 2006. [200] Tychonoff, A. N. und A. A. Samarski: Differentialgleichungen der mathematischen Physik. VEB Deutscher Verlag der Wissenschaften, Berlin, 1959. [201] Ulbrich, M. und S. Ulbrich: Superlinear convergence of affine-scaling interior point Newton methods for infinite-dimensional nonlinear problems with pointwise bounds. SIAM J.
Literaturverzeichnis
311
Control and Optimization, 38:1938–1984, 2000. [202] Ulbrich, M., S. Ulbrich und M. Heinkenschloss: Global convergence of trust-region interiorpoint algorithms for infinite-dimensional nonconvex minimization subject to pointwise bounds. SIAM J. Control and Optimization, 37:731–764, 1999. [203] Unger, A.: Hinreichende Optimalit¨ atsbedingungen 2. Ordnung und Konvergenz des SQP– Verfahrens f¨ ur semilineare elliptische Randsteuerprobleme. Doktorarbeit, Technische Universit¨ at Chemnitz, 1997. [204] Vexler, B.: Finite element approximation of elliptic Dirichlet optimal control problems. Numer. Funct. Anal. Optim., 28:957–973, 2007. [205] Volkwein, S.: Optimal control of a phase-field model using proper orthogonal decomposition. ZAMM, 81:83–97, 2001. [206] Warma, M.: The Robin and Wentzell-Robin Laplacians on Lipschitz domains. Semigroup Forum, 73(1):10–30, 2006. [207] Weiser, M. und A. Schiela: Function space interior point methods for PDE constrained optimization. PAMM, 4:43–46, 2004. [208] Werner, D.: Funktionalanalysis. Springer-Verlag, Berlin, 1997. [209] Wloka, J.: Partielle Differentialgleichungen. Teubner-Verlag, Leipzig, 1982. [210] Wolfersdorf, L. v.: Optimal control for processes governed by mildly nonlinear differential equations of parabolic type I. ZAMM, 56:531–538, 1976. [211] Wolfersdorf, L. v.: Optimal control for processes governed by mildly nonlinear differential equations of parabolic type II. ZAMM, 57:11–17, 1977. [212] Wright, S. J.: Primal-Dual Interior-Point Methods. SIAM, Philadelphia, 1993. [213] Yosida, K.: Functional Analysis. Springer-Verlag, New York, 1980. [214] Zeidler, E.: Nonlinear Functional Analysis and its Application I: Fixed-point theorems. Springer-Verlag, New York, 1986. [215] Zeidler, E.: Nonlinear Functional Analysis and its Application II/A: Linear Monotone Operators. Springer-Verlag, New York, 1990. [216] Zeidler, E.: Nonlinear Functional Analysis and its Application II/B: Nonlinear Monotone Operators. Springer-Verlag, New York, 1990. [217] Zeidler, E.: Applied Functional Analysis and its Applications. Main Principles and their Applications. Springer-Verlag, New York, 1995. [218] Zowe, J. und S. Kurcyusz: Regularity and stability for the mathematical programming problem in Banach spaces. Appl. Math. Optimization, 5:49–62, 1979.