Numerische Mathematik kompakt: Grundlagenwissen für Studium und Praxis [4 ed.] 3834810185, 9783834810182

Dieses Lehrbuch behandelt in kompakter und ?bersichtlicher Form die grundlegenden Themen der Numerischen Mathematik. Es

146 24 3MB

German Pages 442 Year 2010

Report DMCA / Copyright

DOWNLOAD FILE

Polecaj historie

Numerische Mathematik kompakt: Grundlagenwissen für Studium und Praxis [4 ed.]
 3834810185, 9783834810182

Table of contents :
Cover......Page 1
Numerische Mathematik kompakt, 4. Auflage......Page 3
Vorwort zur ersten Auflage......Page 5
Inhaltsverzeichnis......Page 8
1.1 Allgemeine Vorbetrachtungen, landausche Symbole......Page 17
1.1.1 Landausche Symbole......Page 18
1.2.1 Die lagrangesche Interpolationsformel......Page 19
1.2.2 Eine erste Vorgehensweise zur Berechnung des interpolierenden Polynoms......Page 20
1.3 Neville-Schema......Page 21
1.4 Die newtonsche Interpolationsformel, dividierte Di.erenzen......Page 23
1.5 Fehlerdarstellungen zur Polynominterpolation......Page 26
1.6 Tschebysche.-Polynome......Page 29
Übungsaufgaben......Page 34
2.1 Einführende Bemerkungen......Page 37
2.2.1 Die Berechnung interpolierender linearer Splinefunktionen......Page 38
2.3 Minimaleigenschaften kubischer Splinefunktionen......Page 39
2.4.1 Vorüberlegungen......Page 41
2.4.3 Vollständige Randbedingungen......Page 44
2.4.5 Existenz und Eindeutigkeit der betrachteten interpolierenden kubischen Splines......Page 45
2.5 Fehlerabschätzungen für interpolierende kubische Splines......Page 46
Weitere Themen und Literaturhinweise......Page 51
Übungsaufgaben......Page 52
3.1 Diskrete Fouriertransformation......Page 54
3.2 Anwendungen der diskreten Fouriertransformation......Page 55
3.2.1 Fourierreihen......Page 56
3.2.2 Zusammenhang zwischen komplexen Fourierkoe.zienten und der diskreten Fouriertransformation......Page 57
3.2.3 Trigonometrische Interpolation, Teil 1......Page 58
3.2.5 Trigonometrische Interpolation, Teil 3......Page 59
3.2.6 Interpolierende reelle trigonometrische Polynome......Page 61
3.3.2 Der grundlegende Zusammenhang......Page 63
3.3.3 Bit-Umkehr......Page 65
3.3.4 Der FFT-Algorithmus in der Situation N = 2q......Page 66
3.3.5 Aufwandsbetrachtungen für den FFT-Algorithmus......Page 68
Weitere Themen und Literaturhinweise......Page 69
Übungsaufgaben......Page 70
4.1.1 Obere gesta.elte Gleichungssysteme......Page 73
4.1.2 Untere gestaffelte Gleichungssysteme......Page 74
4.2.1 Einführende Bemerkungen......Page 75
4.3 Die Faktorisierung PA = LR......Page 78
4.3.1 Permutationsmatrix......Page 79
4.3.2 Eliminationsmatrizen......Page 81
4.3.3 Die Faktorisierung PA = LR......Page 83
4.4 LR -Faktorisierung......Page 86
4.5.1 Grundbegriffe......Page 87
4.5.2 Die Berechnung einer Faktorisierung A = LL> für positiv definite Matrizen A E RNxN......Page 90
4.5.3 Eine Klasse positiv de.niter Matrizen......Page 91
4.6 Bandmatrizen......Page 92
4.7 Normen und Fehlerabschätzungen......Page 93
4.7.1 Normen......Page 94
4.7.2 Spezielle Matrixnormen......Page 97
4.7.4 Störungsresultate für Matrizen......Page 101
4.7.5 Fehlerabschätzungen für fehlerbehaftete Gleichungssysteme......Page 103
4.8.1 Elementare Eigenschaften orthogonaler Matrizen......Page 104
4.8.2 Die Faktorisierung A = QR mittels Gram-Schmidt-Orthogonalisierung......Page 105
Vorüberlegungen......Page 107
Triangulierung mittels Householder-Transformationen......Page 109
4.8.5 Anwendung 2: Lineare Ausgleichsrechnung......Page 110
Übungsaufgaben......Page 112
5.1 Vorbemerkungen......Page 118
5.2.1 Ein allgemeines Resultat......Page 119
5.2.2 Das Newton-Verfahren im eindimensionalen Fall......Page 120
5.3 Der banachsche Fixpunktsatz......Page 122
5.4 Das Newton-Verfahren im mehrdimensionalen Fall......Page 124
5.4.1 Einige Begri.e aus der Analysis......Page 125
5.4.2 Das Newton-Verfahren und seine Konvergenz......Page 126
5.4.3 Nullstellenbestimmung bei Polynomen......Page 128
Weitere Themen und LiteraturhinweiseDie......Page 132
Übungsaufgaben......Page 133
6 Numerische Integration von Funktionen......Page 136
6.1 Interpolatorische Quadraturformeln......Page 137
6.2.1 Abgeschlossene Newton-Cotes-Formeln......Page 138
6.2.2 Andere interpolatorische Quadraturformeln......Page 140
6.3 Der Fehler bei der interpolatorischen Quadratur......Page 141
6.4 Der Genauigkeitsgrad abgeschlossener Newton-CotesFormeln In für gerade Zahlen n......Page 144
6.4.1 Der Beweis von Lemma 6.15......Page 146
6.5 Summierte Quadraturformeln......Page 148
6.5.1 Summierte Rechteckregeln......Page 149
6.5.2 Summierte Trapezregel......Page 150
6.6 Asymptotik der summierten Trapezregel......Page 151
6.7.1 Grundidee......Page 152
6.7.2 Neville-Schema......Page 153
6.7.3 Verfahrensfehler bei der Extrapolation......Page 154
6.8.1 Einleitende Bemerkungen......Page 156
6.8.2 Orthogonale Polynome......Page 157
6.8.3 Optimale Wahl der Stützstellen und Gewichte......Page 160
6.8.4 Nullstellen von orthogonalen Polynomen als Eigenwerte......Page 163
6.9.1 Bernoulli-Polynome......Page 165
6.9.2 Der Beweis von Theorem 6.22......Page 167
Weitere Themen und Literaturhinweise......Page 168
Übungsaufgaben......Page 169
7.1 Ein Existenz-und Eindeutigkeitssatz......Page 170
7.2 Theorie der Einschrittverfahren......Page 172
7.2.1 Ein elementares Resultat zur Fehlerakkumulation......Page 174
7.3.1 Einschrittverfahren der Konsistenzordnung p = 1......Page 175
7.3.2 Einschrittverfahren der Konsistenzordnung p = 2......Page 176
7.4 Rundungsfehleranalyse......Page 178
7.5.1 Einführende Bemerkungen......Page 180
7.5.2 Herleitung der asymptotischen Entwicklung des globalen Verfahrensfehlers, 1. Teil......Page 181
7.5.3 Herleitung der asymptotischen Entwicklung des globalen Verfahrensfehlers, 2. Teil......Page 183
7.5.4 Asymptotische Entwicklungen des lokalen Verfahrensfehlers......Page 185
7.6 Extrapolationsmethoden für Einschrittverfahren......Page 186
7.7.1 Verfahrensvorschrift......Page 189
7.7.2 Problemstellung......Page 190
7.7.3 Vorgehensweise bei gegebener Testschrittweite h (k)......Page 191
7.7.4 Bestimmung einer neuen Testschrittweite h.(k+1)/ im Fall i.(k) >e"......Page 192
Weitere Themen und LiteraturhinweiseDie......Page 193
Übungsaufgaben......Page 194
8.1.1 Mehrschrittverfahren......Page 197
8.1.2 Konvergenz-und Konsistenzordnung......Page 198
8.1.3 Nullstabilität, Lipschitzbedingung......Page 199
8.2.1 Das Konvergenztheorem......Page 200
8.2.2 Hilfsresultat 1: Das Lemma von Gronwall......Page 203
8.2.3 Beschränktheit der Matrixfolge A, A2 ,A3,.........Page 205
8.2.4 Die Konsistenzordnung linearer Mehrschrittverfahren......Page 206
8.3 Spezielle lineare Mehrschrittverfahren – Vorbereitungen......Page 208
8.4.2 Adams-Bashfort-Verfahren......Page 211
8.4.3 Adams-Moulton-Verfahren......Page 215
8.5.1 Der Ansatz......Page 216
8.5.2 Nyström-Verfahren......Page 217
8.5.3 Milne-Simpson-Verfahren......Page 218
8.6 BDF-Verfahren......Page 220
8.6.1 Der Ansatz......Page 221
8.7 Prädiktor-Korrektor-Verfahren......Page 223
8.7.1 Linearer Prädiktor/Linearer Korrektor......Page 227
8.8.2 Existenz und Eindeutigkeit bei linearen homogenen Differenzengleichungen......Page 228
8.8.3 Die komplexwertige allgemeine Lösung der homogenen Differenzengleichung Lu = 0......Page 230
8.8.4 Die reellwertige allgemeine Lösung der homogenen Differenzengleichung Lu = 0......Page 234
8.8.5 Eine spezielle Differenzengleichung......Page 235
8.9.1 Einführende Bemerkungen......Page 238
8.9.2 Existenz und Eindeutigkeit der Lösung bei Anfangswertproblemen für Differenzialgleichungen mit oberer Lipschitzeigenschaft......Page 239
8.9.3 Das implizite Euler-Verfahren für steife Differenzialgleichungen......Page 243
8.9.4 Steife Differenzialgleichungen in den Anwendungen......Page 245
Weitere Themen und Literaturhinweise......Page 246
Übungsaufgaben......Page 247
9.1.1 Problemstellung......Page 251
9.1.2 Existenz und Eindeutigkeit der Lösung......Page 252
9.2.1 Numerische Differenziation......Page 254
9.2.2 Der Ansatz für Differenzenverfahren......Page 255
9.2.3 Das Konvergenzresultat für Differenzenverfahren......Page 256
9.2.4 Vorbereitungen für den Beweis von Teil (a) des Theorems 9.10......Page 258
9.3 Galerkin-Verfahren......Page 263
9.3.2 Eigenschaften des Differenzialoperators Lu = -un + ru......Page 264
9.3.3 Galerkin-Verfahren – ein allgemeiner Ansatz......Page 267
9.3.4 Systemmatrix......Page 271
9.3.5 Finite-Elemente-Methode......Page 272
9.3.6 Anwendungen......Page 273
9.3.7 Das Energiefunktional......Page 275
9.4 Einfachschießverfahren......Page 277
9.4.1 Numerische Realisierung des Einfachschießverfahrens mit dem Newton-Verfahren......Page 278
Weitere Themen und Literaturhinweise......Page 279
Übungsaufgaben......Page 280
10.1.1 Hintergrund zum Einsatz iterativer Verfahren bei linearen Gleichungssystemen......Page 284
10.2 Lineare Fixpunktiteration......Page 285
10.2.1 Ein Modellbeispiel......Page 287
10.3.1 Irreduzible Matrizen......Page 289
10.4 Das Gesamtschrittverfahren......Page 291
10.5.1 Der Betrag einer Matrix......Page 294
10.5.2 Konvergenzergebnisse für das Einzelschrittverfahren......Page 295
10.6 Das Relaxationsverfahren und erste Konvergenzresultate......Page 297
10.6.1 M-Matrizen......Page 300
10.7 Das Relaxationsverfahren für konsistent geordnete Matrizen......Page 301
Übungsaufgaben......Page 307
11.1 Vorbetrachtungen......Page 312
11.2 Der Ansatz des orthogonalen Residuums für positiv definite Matrizen......Page 313
11.2.1 Existenz, Eindeutigkeit und Minimaleigenschaft......Page 314
11.2.2 Der Ansatz des orthogonalen Residuums (11.2) für gegebene Akonjugierte Basen......Page 315
11.3.2 Die Berechnung A-konjugierter Suchrichtungen in K n.(A , b)......Page 317
11.3.3 Der Algorithmus zum CG-Verfahren......Page 319
11.4 Die Konvergenzgeschwindigkeit des CG-Verfahrens......Page 320
11.5 Das CG-Verfahren für die Normalgleichungen......Page 323
11.6.1 Vorbetrachtungen zum GMRES-Verfahren......Page 324
11.6.2 Arnoldi-Prozess......Page 325
11.7.1 Einführende Bemerkungen......Page 328
11.7.2 Allgemeine Vorgehensweise zur Lösung des Minimierungsproblems (11.32)......Page 329
11.7.3 Detaillierte Beschreibung der Vorgehensweise zur Lösung des Minimierungsproblems (11.32)......Page 330
11.7.4 Matlab-Programm für GMRES......Page 332
11.9 Nachtrag 1: Krylovräume......Page 334
11.10 Nachtrag 2: Interaktive Programmsysteme mit Multifunktionalität......Page 335
Weitere Themen und Literaturhinweise......Page 336
Übungsaufgaben......Page 337
12.2.1 Diagonalisierbare Matrizen......Page 339
12.2.2 Der allgemeine Fall......Page 341
12.3 Lokalisierung von Eigenwerten......Page 343
12.4 Variationsformulierung für Eigenwerte von symmetrischen Matrizen......Page 346
12.6 Nachtrag: Faktorisierungen von Matrizen......Page 348
12.6.3 Schur-Faktorisierung......Page 349
Übungsaufgaben......Page 350
13.1.1 Ähnlichkeitstransformationen......Page 353
13.1.2 Vektoriteration......Page 354
13.2.1 Householder-Ähnlichkeitstransformationen zur Gewinnung von Hessenbergmatrizen......Page 355
13.2.2 Der symmetrische Fall......Page 357
13.3.1 Der nichtsymmetrische Fall. Die Methode von Hyman......Page 358
13.3.2 Das Newton-Verfahren zur Berechnung der Eigenwerte tridiagonaler Matrizen......Page 360
13.4.1 Approximation der Eigenwerte durch Diagonaleinträge......Page 362
13.4.2 Givensrotationen zur Reduktion der Nichtdiagonaleinträge......Page 363
Das klassische Jacobi-Verfahren......Page 366
Das zyklische Jacobi-Verfahren......Page 367
13.5.1 Eindeutigkeit und Stetigkeit der QR -Faktorisierung einer Matrix......Page 368
13.5.2 De.nition des QR -Verfahrens......Page 371
13.5.3 Konvergenz des QR -Verfahrens für betragsmäßig einfache Eigenwerte......Page 372
13.5.4 Praktische Durchführung des QR -Verfahrens für Hessenbergmatrizen......Page 375
13.7.1 Definition und Eigenschaften der Vektoriteration......Page 380
13.7.2 Spezielle Vektoriterationen......Page 382
Übungsaufgaben......Page 383
14.1 Einführende Bemerkungen......Page 386
14.2 Peano-Kerne......Page 387
14.3.1 Interpolation......Page 389
Übungsaufgaben......Page 390
15.1 Einführende Bemerkungen......Page 392
15.2 Existenz eines Proximums......Page 393
15.3.1 Einige Notationen; streng konvexe Mengen......Page 395
15.3.2 Strikt normierte Räume......Page 396
15.4.1 Einige Grundlagen......Page 398
15.4.2 Proxima in linearen Unterräumen......Page 400
15.5 Gleichmäßige Approximation stetiger Funktionen durch Polynome vom Höchstgrad n 1......Page 402
15.6.2 Eine erste Anwendung des Alternantensatzes......Page 405
15.6.3 Eine zweite Anwendung des Alternantensatzes......Page 406
15.7 Haarsche Räume, Tschebysche.-Systeme......Page 407
15.7.1 Alternantensatz für haarsche Räume......Page 408
15.7.3 Untere Schranken für den Minimalabstand......Page 409
Übungsaufgaben......Page 410
16.1 Zahlendarstellungen......Page 412
16.2.1 Grundlegende Begriffe......Page 413
16.2.2 Struktur des normalisierten Gleitpunkt-Zahlensystems F......Page 414
16.2.3 Struktur des denormalisierten Gleitpunkt-Zahlensystems F......Page 416
16.3.1 Die Gleitpunktzahlen des Standards IEEE 754......Page 417
16.3.2 Weitere Gleitpunkt-Zahlensysteme in der Praxis......Page 419
16.4.1 Runden......Page 420
16.4.2 Abschneiden......Page 422
16.5 Arithmetik in Gleitpunkt-Zahlensystemen......Page 423
16.5.2 Fehlerakkumulation bei der Hintereinanderausführung von Multiplikationen und Divisionen in Gleitpunkt-Zahlensystemen......Page 424
16.5.3 Fehlerverstärkung bei der Hintereinanderausführung von Additionen in einem gegebenen Gleitpunkt-Zahlensystem F......Page 426
Weitere Themen und Literaturhinweise......Page 428
Literaturverzeichnis......Page 429
A......Page 435
E......Page 436
G......Page 437
L......Page 438
M......Page 439
P......Page 440
S......Page 441
Z......Page 442

Citation preview

Robert Plato Numerische Mathematik kompakt

Robert Plato

Numerische Mathematik kompakt Grundlagenwissen für Studium und Praxis 4., aktualisierte Auflage STUDIUM

Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über abrufbar.

Dr. Robert Plato Fachbereich Mathematik Universität Siegen Walter-Flex-Straße 3 57068 Siegen E-Mail: [email protected]

1. Auflage 2000 2., überarbeitete Auflage 2004 3., aktualisierte und verbesserte Auflage 2006 4., aktualisierte Auflage 2010 Alle Rechte vorbehalten © Vieweg +Teubner | GWV Fachverlage GmbH, Wiesbaden 2010 Lektorat: Ulrike Schmickler-Hirzebruch | Nastassja Vanselow Vieweg +Teubner ist Teil der Fachverlagsgruppe Springer Science+Business Media. www.viewegteubner.de Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlags unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Umschlaggestaltung: KünkelLopka Medienentwicklung, Heidelberg Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier. Printed in Germany ISBN 978-3-8348-1018-2

Vorwort zur vierten Auflage Für diese Neuauflage habe ich Aktualisierungen, Korrekturen und stilistische Änderungen vorgenommen, außerdem werden im Kapitel zur diskreten Fouriertransformation einige Abschnitte anders präsentiert. Der auf Seite vi näher beschriebene Onlinesupport mit den Lösungshinweisen bleibt auch für diese Neuauflage bestehen. Hinweise und Verbesserungsvorschläge zu diesem Lehrbuch erreichen mich nun unter der Email-Adresse [email protected]. Siegen, im Oktober 2009

Robert Plato

Vorwort zur zweiten Auflage Für die zweite Auflage ist das Layout etwas verändert worden, und zur Vereinheitlichung der Notation sind einige Umbenennungen erfolgt. Die Literaturhinweise wurden aktualisiert, der Index erweitert und Fehler beseitigt. Die Abschnitte über positiv definite Matrizen und das GMRES-Verfahren wurden etwas modifiziert, wobei dies auf Anregungen von Prof. Dr. Rembert Reemtsen ( TU Cottbus ) beziehungsweise G. Fuß ( TU Berlin ) zurückgeht. Außerdem sind in einigen Kapiteln die einführenden Bemerkungen erweitert worden. Unter der im Vorwort zur ersten Auflage genannten Adresse wird weiterhin ein Online-Service angeboten. Mittlerweile ist ein Übungsbuch ( [82] ) entstanden, das vollständige Lösungswege zu den meisten der in diesem Buch vorgestellten Übungsaufgaben sowie zu weiteren Aufgaben enthält. Außerdem werden dort noch ein paar spezielle Anwendungen wie etwa die digitale Audio- und Bildkompression etwas eingehender behandelt. Danken möchte ich der Christian-Albrechts-Universität zu Kiel, wo ich die Möglichkeit hatte, die erste Auflage des vorliegenden Buches vier Semester lang in Vorlesungen einzusetzen. Außerdem möchte ich dem DFG Forschungszentrum “Mathematik für Schlüsseltechnologien” ( FZT 86 ) in Berlin für Unterstützung und dem Vieweg Verlag für die erneut angenehme Zusammenarbeit danken. Berlin, im Juni 2004

Robert Plato

Vorwort zur ersten Auflage Das vorliegende Lehrbuch ist hervorgegangen aus zwei jeweils vierstündigen Vorlesungen über Numerische Mathematik, die ich seit 1997 wiederholt an der Technischen Universität Berlin gehalten habe. Diese Vorlesungen sind in erster Linie von Studierenden der Wirtschafts- und Technomathematik und zu einem kleineren Teil

vi

Vorwort

von Studierenden des Diplomstudiengangs Mathematik sowie der Physik und Informatik besucht worden. In seiner jetzigen Form richtet sich das Lehrbuch an Studierende und Absolventen der Mathematik sowie benachbarter Fächer wie Informatik, Natur- und Ingenieurwissenschaften an Universitäten und Fachhochschulen. In kompakter Form werden zahlreiche grundlegende und für die Anwendungen wichtige Themenkomplexe aus der Numerischen Mathematik behandelt: 

Interpolation, schnelle Fouriertransformation und Integration,



direkte und iterative Lösung linearer Gleichungssysteme,



iterative Verfahren für nichtlineare Gleichungssysteme,



numerische Lösung von Anfangs- und Randwertproblemen bei gewöhnlichen Differentialgleichungen,



Eigenwertaufgaben bei Matrizen,



Approximationstheorie und Rechnerarithmetik.

Auf die Behandlung der Numerik partieller Differentialgleichungen sowie der nichtlinearen Optimierung wird aufgrund des angestrebten überschaubaren Umfangs verzichtet. Das Bestreben dieses Lehrbuchs ist es, die vorliegenden Themen auf möglichst elementare und übersichtliche Weise zu behandeln. Dies gilt auch für die Herleitung der Approximationseigenschaften der vorgestellten numerischen Methoden, bei der jeweils lediglich Grundkenntnisse der Analysis und der linearen Algebra vorausgesetzt werden. Außerdem sind für viele der diskutierten Verfahren die jeweiligen Vorgehensweisen durch Bilder und Schemata veranschaulicht, was das Erlernen der auftretenden Zusammenhänge erleichtern sollte. Für zahlreiche der behandelten Verfahren werden die praktisch bedeutungsvollen Aufwandsbetrachtungen angestellt und Pseudocodes angegeben, die sich unmittelbar in Computerprogramme umsetzen lassen. Die etwa 120 vorgestellten Übungsaufgaben unterschiedlichen Schwierigkeitsgrads sind fast alle im Übungsbetrieb verwendet worden und daher praxiserprobt. Ich selbst habe die Vorläufer dieses Lehrbuchs ohne weitere Themenauswahl als Vorlage für Vorlesungen über Numerische Mathematik 1 und 2 verwendet. Dabei wurden die ersten sechs Kapitel in Teil 1 und die Kapitel 7 bis einschließlich 13 in Teil 2 der Vorlesung behandelt. Möglich wäre es aber auch, im ersten Teil die Behandlung des sechsten Kapitels über numerische Integration deutlich abzukürzen. Stattdessen könnten dann im ersten Teil beispielsweise noch die Grundlagen über Einschrittverfahren zur numerischen Lösung von Anfangswertproblemen bei gewöhnlichen Differentialgleichungen ( Kapitel 7 ) oder Relaxationsverfahren zur iterativen Lösung linearer Gleichungssysteme ( Kapitel 10 ) vorgestellt werden. Zu diesem Buch wird ein Online-Service angeboten, der unter http://www.math.tu-berlin.de/numerik/plato/viewegbuch abrufbar ist. Er umfasst Lösungshinweise zu den vorgestellten Übungsaufgaben und Matlab-Programme zu einigen der in diesem Buch präsentierten Pseudocodes. Außerdem werden über diesen Online-Service im Laufe der Zeit Abschnitte über weitere in diesem Buch nicht behandelte Themen beziehungsweise eine Liste der eventuell

vii

Vorwort

anfallenden Korrekturen angeboten. Anregungen, nützliche Hinweise und Verbesserungsvorschläge zu diesem Lehrbuch sind jederzeit willkommen und erreichen mich unter meiner Email-Adresse [email protected]. Mein Dank gilt meinen Kollegen Prof. Dr. R. D. Grigorieff und Dipl. Math. Etienne Emmrich für viele nützliche Anregungen, die in der vorliegenden Fassung weitestgehend berücksichtigt sind. Den Vorlesungsteilnehmern Dipl. Inf. Till Tantau und cand. math. Olivier Pfeiffer sowie einigen weiteren Studierenden sind zahlreiche kleine aber wichtige Verbesserungen zu verdanken. Außerdem danke ich Prof. Dr. Chuck Groetsch, Prof. Dr. Martin Hanke-Bourgeois und Prof. Dr. Hans-Jürgen Reinhardt für die Unterstützung bei der Durchführung dieses Buchprojekts und Frau Ulrike Schmickler-Hirzebruch vom Verlag Vieweg für die stets angenehme Zusammenarbeit. Berlin, im Mai 2000

Robert Plato

Inhaltsverzeichnis

Vorwort

v

Inhaltsverzeichnis

viii

1 Polynominterpolation 1.1 Allgemeine Vorbetrachtungen, landausche Symbole . . . . . . . . . . . 1.1.1 Landausche Symbole . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Existenz und Eindeutigkeit bei der Polynominterpolation . . . . . . . . 1.2.1 Die lagrangesche Interpolationsformel . . . . . . . . . . . . . . . 1.2.2 Erste Vorgehensweise zur Berechnung des interpolierenden Polynoms . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Neville-Schema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4 Die newtonsche Interpolationsformel, dividierte Differenzen . . . . . . 1.5 Fehlerdarstellungen zur Polynominterpolation . . . . . . . . . . . . . . 1.6 Tschebyscheff-Polynome . . . . . . . . . . . . . . . . . . . . . . . . . . . – Weitere Bemerkungen und Literaturhinweise . . . . . . . . . . . . . . . – Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1 1 2 3 3 4 5 7 10 13 18 18

2 Splinefunktionen 2.1 Einführende Bemerkungen . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Interpolierende lineare Splinefunktionen . . . . . . . . . . . . . . . . . 2.2.1 Die Berechnung interpolierender linearer Splinefunktionen . . . 2.3 Minimaleigenschaften kubischer Splinefunktionen . . . . . . . . . . . . 2.4 Die Berechnung interpolierender kubischer Splinefunktionen . . . . . 2.4.1 Vorüberlegungen . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.2 Natürliche Randbedingungen . . . . . . . . . . . . . . . . . . . . 2.4.3 Vollständige Randbedingungen . . . . . . . . . . . . . . . . . . . 2.4.4 Periodische Randbedingungen . . . . . . . . . . . . . . . . . . . 2.4.5 Existenz und Eindeutigkeit der betrachteten interpolierenden kubischen Splines . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5 Fehlerabschätzungen für interpolierende kubische Splines . . . . . . . – Weitere Bemerkungen und Literaturhinweise . . . . . . . . . . . . . . . – Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

21 21 22 22 23 25 25 28 28 29

3 Diskrete Fouriertransformation und Anwendungen 3.1 Diskrete Fouriertransformation . . . . . . . . . . . . . . . . . . . . 3.2 Anwendungen der diskreten Fouriertransformation . . . . . . . . 3.2.1 Fourierreihen . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.2 Zusammenhang zwischen komplexen Fourierkoeffizienten der diskreten Fouriertransformation . . . . . . . . . . . . . 3.2.3 Trigonometrische Interpolation, Teil 1 . . . . . . . . . . . .

38 38 39 40

. . . . . . . . . und . . . . . .

29 30 35 36

41 42

ix

Inhaltsverzeichnis

3.3

– –

3.2.4 Trigonometrische Interpolation, Teil 2 . . . . . . . . . 3.2.5 Trigonometrische Interpolation, Teil 3 . . . . . . . . . 3.2.6 Interpolierende reelle trigonometrische Polynome . . Schnelle Fourier-Transformation ( FFT ) . . . . . . . . . . . . 3.3.1 Einführende Bemerkungen . . . . . . . . . . . . . . . . 3.3.2 Der grundlegende Zusammenhang . . . . . . . . . . . 3.3.3 Bit-Umkehr . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.4 Der FFT-Algorithmus in der Situation N D 2q . . . . 3.3.5 Aufwandsbetrachtungen für den FFT-Algorithmus . . 3.3.6 Pseudocode für den FFT-Algorithmus in der Situation Weitere Bemerkungen und Literaturhinweise . . . . . . . . . Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . . . . . . . . . . . N D 2q . . . . . . . . . .

. . . . . . . . . . . .

43 43 45 47 47 47 49 50 52 53 53 54

4 Lösung linearer Gleichungssysteme 57 4.1 Gestaffelte lineare Gleichungssysteme . . . . . . . . . . . . . . . . . . . 57 4.1.1 Obere gestaffelte Gleichungssysteme . . . . . . . . . . . . . . . . 57 4.1.2 Untere gestaffelte Gleichungssysteme . . . . . . . . . . . . . . . 58 4.2 Der Gauß-Algorithmus . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 4.2.1 Einführende Bemerkungen . . . . . . . . . . . . . . . . . . . . . . 59 4.2.2 Gauß-Algorithmus mit Pivotsuche . . . . . . . . . . . . . . . . . 62 4.3 Die Faktorisierung PA D LR . . . . . . . . . . . . . . . . . . . . . . . . 62 4.3.1 Permutationsmatrix . . . . . . . . . . . . . . . . . . . . . . . . . . 63 4.3.2 Eliminationsmatrizen . . . . . . . . . . . . . . . . . . . . . . . . . 65 4.3.3 Die Faktorisierung PA D LR . . . . . . . . . . . . . . . . . . . . 67 4.4 LR-Faktorisierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 4.5 Cholesky-Faktorisierung positiv definiter Matrizen . . . . . . . . . . . 71 4.5.1 Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 4.5.2 Die Berechnung einer Faktorisierung A D LL> für positiv definite Matrizen A 2 R N N . . . . . . . . . . . . . . . . . . . . . . . 74 4.5.3 Eine Klasse positiv definiter Matrizen . . . . . . . . . . . . . . . 75 4.6 Bandmatrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 4.7 Normen und Fehlerabschätzungen . . . . . . . . . . . . . . . . . . . . . 77 4.7.1 Normen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 4.7.2 Spezielle Matrixnormen . . . . . . . . . . . . . . . . . . . . . . . 81 4.7.3 Die Konditionszahl einer Matrix . . . . . . . . . . . . . . . . . . . 85 4.7.4 Störungsresultate für Matrizen . . . . . . . . . . . . . . . . . . . 85 4.7.5 Fehlerabschätzungen für fehlerbehaftete Gleichungssysteme . 87 4.8 Orthogonalisierungsverfahren . . . . . . . . . . . . . . . . . . . . . . . 88 4.8.1 Elementare Eigenschaften orthogonaler Matrizen . . . . . . . . 88 4.8.2 Die Faktorisierung A D QR mittels Gram-Schmidt-Orthogonalisierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 4.8.3 Die Faktorisierung A D QS mittels Householder-Transformationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 4.8.4 Anwendung 1: Stabile Lösung schlecht konditionierter Gleichungssysteme Ax D b . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

x

Inhaltsverzeichnis

– –

4.8.5 Anwendung 2: Lineare Ausgleichsrechnung . . . . . . . . . . . . Weitere Bemerkungen und Literaturhinweise . . . . . . . . . . . . . . . Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

5 Nichtlineare Gleichungssysteme 5.1 Vorbemerkungen . . . . . . . . . . . . . . . . . . . . . . 5.2 Der eindimensionale Fall . . . . . . . . . . . . . . . . . . 5.2.1 Ein allgemeines Resultat . . . . . . . . . . . . . . 5.2.2 Das Newton-Verfahren im eindimensionalen Fall 5.3 Der banachsche Fixpunktsatz . . . . . . . . . . . . . . . 5.4 Das Newton-Verfahren im mehrdimensionalen Fall . . 5.4.1 Einige Begriffe aus der Analysis . . . . . . . . . . 5.4.2 Das Newton-Verfahren und seine Konvergenz . 5.4.3 Nullstellenbestimmung bei Polynomen . . . . . . – Weitere Bemerkungen und Literaturhinweise . . . . . . – Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . .

94 96 96

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

102 102 103 103 104 106 108 109 110 112 116 117

6 Numerische Integration von Funktionen 6.1 Interpolatorische Quadraturformeln . . . . . . . . . . . . . . . . 6.2 Spezielle interpolatorische Quadraturformeln . . . . . . . . . . 6.2.1 Abgeschlossene Newton-Cotes-Formeln . . . . . . . . . . 6.2.2 Andere interpolatorische Quadraturformeln . . . . . . . 6.3 Der Fehler bei der interpolatorischen Quadratur . . . . . . . . . 6.4 Genauigkeit abgeschlossener Newton-Cotes-Formeln . . . . . . 6.4.1 Der Beweis von Lemma 6.15 . . . . . . . . . . . . . . . . . 6.5 Summierte Quadraturformeln . . . . . . . . . . . . . . . . . . . . 6.5.1 Summierte Rechteckregeln . . . . . . . . . . . . . . . . . . 6.5.2 Summierte Trapezregel . . . . . . . . . . . . . . . . . . . . 6.5.3 Summierte Simpson-Regel . . . . . . . . . . . . . . . . . . 6.6 Asymptotik der summierten Trapezregel . . . . . . . . . . . . . 6.6.1 Die Asymptotik . . . . . . . . . . . . . . . . . . . . . . . . 6.7 Extrapolationsverfahren . . . . . . . . . . . . . . . . . . . . . . . 6.7.1 Grundidee . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.7.2 Neville-Schema . . . . . . . . . . . . . . . . . . . . . . . . 6.7.3 Verfahrensfehler bei der Extrapolation . . . . . . . . . . . 6.8 Gaußsche Quadraturformeln . . . . . . . . . . . . . . . . . . . . 6.8.1 Einleitende Bemerkungen . . . . . . . . . . . . . . . . . . 6.8.2 Orthogonale Polynome . . . . . . . . . . . . . . . . . . . . 6.8.3 Optimale Wahl der Stützstellen und Gewichte . . . . . . 6.8.4 Nullstellen von orthogonalen Polynomen als Eigenwerte 6.9 Beweis der Asymptotik für die summierte Trapezregel . . . . . 6.9.1 Bernoulli-Polynome . . . . . . . . . . . . . . . . . . . . . . 6.9.2 Der Beweis von Theorem 6.22 . . . . . . . . . . . . . . . – Weitere Bemerkungen und Literaturhinweise . . . . . . . . . . . – Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . .

120 121 122 122 124 125 128 130 132 133 134 135 135 136 136 136 137 138 140 140 141 144 147 149 149 151 152 153

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

xi

Inhaltsverzeichnis

7 Einschrittverfahren für Anfangswertprobleme 7.1 Ein Existenz- und Eindeutigkeitssatz . . . . . . . . . . . . . . . . . . . . 7.2 Theorie der Einschrittverfahren . . . . . . . . . . . . . . . . . . . . . . . 7.2.1 Ein elementares Resultat zur Fehlerakkumulation . . . . . . . . 7.3 Spezielle Einschrittverfahren . . . . . . . . . . . . . . . . . . . . . . . . 7.3.1 Einschrittverfahren der Konsistenzordnung p D 1 . . . . . . . . 7.3.2 Einschrittverfahren der Konsistenzordnung p D 2 . . . . . . . . 7.3.3 Einschrittverfahren der Konsistenzordnung p D 4 . . . . . . . . 7.4 Rundungsfehleranalyse . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.5 Asymptotische Entwicklung der Approximationen . . . . . . . . . . . . 7.5.1 Einführende Bemerkungen . . . . . . . . . . . . . . . . . . . . . . 7.5.2 Herleitung der asymptotischen Entwicklung des globalen Verfahrensfehlers, 1. Teil . . . . . . . . . . . . . . . . . . . . . . . . 7.5.3 Herleitung der asymptotischen Entwicklung des globalen Verfahrensfehlers, 2. Teil . . . . . . . . . . . . . . . . . . . . . . . . 7.5.4 Asymptotische Entwicklungen des lokalen Verfahrensfehlers . 7.6 Extrapolationsmethoden für Einschrittverfahren . . . . . . . . . . . . . 7.7 Schrittweitensteuerung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.7.1 Verfahrensvorschrift . . . . . . . . . . . . . . . . . . . . . . . . . 7.7.2 Problemstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.7.3 Vorgehensweise bei gegebener Testschrittweite h.k/ . . . . . . . 7.7.4 Bestimmung einer neuen Testschrittweite h.kC1/ im Fall ı .k/ > " 7.7.5 Pseudocode zur Schrittweitensteuerung . . . . . . . . . . . . . . – Weitere Bemerkungen und Literaturhinweise . . . . . . . . . . . . . . . – Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

154 154 156 158 159 159 160 162 162 164 164

8 Mehrschrittverfahren für Anfangswertprobleme 8.1 Grundlegende Begriffe . . . . . . . . . . . . . . . . . . . . . . . 8.1.1 Mehrschrittverfahren . . . . . . . . . . . . . . . . . . . . 8.1.2 Konvergenz- und Konsistenzordnung . . . . . . . . . . 8.1.3 Nullstabilität, Lipschitzbedingung . . . . . . . . . . . . 8.1.4 Übersicht . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.2 Der globale Verfahrensfehler bei Mehrschrittverfahren . . . . 8.2.1 Das Konvergenztheorem . . . . . . . . . . . . . . . . . . 8.2.2 Hilfsresultat 1: Das Lemma von Gronwall . . . . . . . . 8.2.3 Beschränktheit der Matrixfolge A; A2 ; A3 ; : : : . . . . . 8.2.4 Die Konsistenzordnung linearer Mehrschrittverfahren 8.3 Spezielle lineare Mehrschrittverfahren – Vorbereitungen . . . 8.4 Adams-Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . 8.4.1 Der Ansatz . . . . . . . . . . . . . . . . . . . . . . . . . . 8.4.2 Adams-Bashfort-Verfahren . . . . . . . . . . . . . . . . . 8.4.3 Adams-Moulton-Verfahren . . . . . . . . . . . . . . . . . 8.5 Nyström- und Milne-Simpson-Verfahren . . . . . . . . . . . . . 8.5.1 Der Ansatz . . . . . . . . . . . . . . . . . . . . . . . . . . 8.5.2 Nyström-Verfahren . . . . . . . . . . . . . . . . . . . . .

181 181 181 182 183 184 184 184 187 189 190 192 195 195 195 199 200 200 201

. . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . .

165 167 169 170 173 173 174 175 176 177 177 178

xii

Inhaltsverzeichnis

8.6

8.7 8.8

8.9

– –

8.5.3 Milne-Simpson-Verfahren . . . . . . . . . . . . . . . . . . . . . . 202 BDF-Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204 8.6.1 Der Ansatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205 8.6.2 Tabellarische Übersicht über spezielle Mehrschrittverfahren . . 207 Prädiktor-Korrektor-Verfahren . . . . . . . . . . . . . . . . . . . . . . . 207 8.7.1 Linearer Prädiktor/Linearer Korrektor . . . . . . . . . . . . . . . 211 Lineare homogene Differenzengleichungen . . . . . . . . . . . . . . . . 212 8.8.1 Die Testgleichung . . . . . . . . . . . . . . . . . . . . . . . . . . . 212 8.8.2 Existenz und Eindeutigkeit bei linearen homogenen Differenzengleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212 8.8.3 Die komplexwertige allgemeine Lösung der homogenen Differenzengleichung Lu D 0 . . . . . . . . . . . . . . . . . . . . . . . 214 8.8.4 Die reellwertige allgemeine Lösung der homogenen Differenzengleichung Lu D 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . 218 8.8.5 Eine spezielle Differenzengleichung . . . . . . . . . . . . . . . . 219 Steife Differenzialgleichungen . . . . . . . . . . . . . . . . . . . . . . . 222 8.9.1 Einführende Bemerkungen . . . . . . . . . . . . . . . . . . . . . . 222 8.9.2 Existenz und Eindeutigkeit der Lösung bei Anfangswertproblemen für Differenzialgleichungen mit oberer Lipschitzeigenschaft 223 8.9.3 Das implizite Euler-Verfahren für steife Differenzialgleichungen 227 8.9.4 Steife Differenzialgleichungen in den Anwendungen . . . . . . . 229 Weitere Bemerkungen und Literaturhinweise . . . . . . . . . . . . . . . 230 Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231

9 Randwertprobleme 9.1 Problemstellung, Existenz, Eindeutigkeit . . . . . . . . . . . . . . . . . 9.1.1 Problemstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.1.2 Existenz und Eindeutigkeit der Lösung . . . . . . . . . . . . . . . 9.2 Differenzenverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.2.1 Numerische Differenziation . . . . . . . . . . . . . . . . . . . . . 9.2.2 Der Ansatz für Differenzenverfahren . . . . . . . . . . . . . . . 9.2.3 Das Konvergenzresultat für Differenzenverfahren . . . . . . . . 9.2.4 Vorbereitungen für den Beweis von Teil (a) des Theorems 9.10 . 9.2.5 Nachweis der Aussage in Teil (a) von Theorem 9.10 . . . . . . . 9.3 Galerkin-Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.3.1 Einführende Bemerkungen . . . . . . . . . . . . . . . . . . . . . . 9.3.2 Eigenschaften des Differenzialoperators Lu D u 00 C ru . . . 9.3.3 Galerkin-Verfahren – ein allgemeiner Ansatz . . . . . . . . . . . 9.3.4 Systemmatrix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.3.5 Finite-Elemente-Methode . . . . . . . . . . . . . . . . . . . . . . . 9.3.6 Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.3.7 Das Energiefunktional . . . . . . . . . . . . . . . . . . . . . . . . 9.4 Einfachschießverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.4.1 Numerische Realisierung des Einfachschießverfahrens mit dem Newton-Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . .

235 235 235 236 238 238 239 240 242 247 247 248 248 251 255 256 257 259 261 262

xiii

Inhaltsverzeichnis

– –

9.4.2 Numerische Realisierung des Einfachschießverfahrens mit ner Fixpunktiteration . . . . . . . . . . . . . . . . . . . . . . . Weitere Bemerkungen und Literaturhinweise . . . . . . . . . . . . . Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

ei. . 263 . . 263 . . 264

10 Gesamtschritt-, Einzelschritt- und Relaxationsverfahren 10.1 Iterationsverfahren zur Lösung linearer Gleichungssysteme . . . . . . 10.1.1 Hintergrund zum Einsatz iterativer Verfahren bei linearen Gleichungssystemen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.2 Lineare Fixpunktiteration . . . . . . . . . . . . . . . . . . . . . . . . . . 10.2.1 Ein Modellbeispiel . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.3 Einige spezielle Klassen von Matrizen . . . . . . . . . . . . . . . . . . . 10.3.1 Irreduzible Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . 10.4 Das Gesamtschrittverfahren . . . . . . . . . . . . . . . . . . . . . . . . . 10.5 Das Einzelschrittverfahren . . . . . . . . . . . . . . . . . . . . . . . . . 10.5.1 Der Betrag einer Matrix . . . . . . . . . . . . . . . . . . . . . . . . 10.5.2 Konvergenzergebnisse für das Einzelschrittverfahren . . . . . . 10.6 Das Relaxationsverfahren und erste Konvergenzresultate . . . . . . . . 10.6.1 M-Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.7 Relaxationsverfahren für konsistent geordnete Matrizen . . . . . . . . – Weitere Bemerkungen und Literaturhinweise . . . . . . . . . . . . . . . – Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

268 268

11 CG- und GMRES-Verfahren 11.1 Vorbetrachtungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.1.1 Ausblick . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2 Der Ansatz des orthogonalen Residuums . . . . . . . . . . . . . . . . . 11.2.1 Existenz, Eindeutigkeit und Minimaleigenschaft . . . . . . . . . 11.2.2 Der Ansatz des orthogonalen Residuums (11.2) für gegebene Akonjugierte Basen . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.3 Das CG-Verfahren für positiv definite Matrizen . . . . . . . . . . . . . . 11.3.1 Einleitende Bemerkungen . . . . . . . . . . . . . . . . . . . . . . 11.3.2 Die Berechnung A-konjugierter Suchrichtungen in K n .A; b/ . . 11.3.3 Der Algorithmus zum CG-Verfahren . . . . . . . . . . . . . . . . 11.4 Die Konvergenzgeschwindigkeit des CG-Verfahrens . . . . . . . . . . . 11.5 Das CG-Verfahren für die Normalgleichungen . . . . . . . . . . . . . . 11.6 Arnoldi-Prozess . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.6.1 Vorbetrachtungen zum GMRES-Verfahren . . . . . . . . . . . . . 11.6.2 Arnoldi-Prozess . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.7 GMRES auf der Basis des Arnoldi-Prozesses . . . . . . . . . . . . . . . . 11.7.1 Einführende Bemerkungen . . . . . . . . . . . . . . . . . . . . . . 11.7.2 Allgemeine Vorgehensweise zur Lösung des betrachteten Minimierungsproblems . . . . . . . . . . . . . . . . . . . . . . . . . . 11.7.3 Detaillierte Beschreibung der Vorgehensweise zur Lösung des betrachteten Minimierungsproblems . . . . . . . . . . . . . . . . 11.7.4 Matlab-Programm für GMRES . . . . . . . . . . . . . . . . . . .

296 296 297 297 298

268 269 271 273 273 275 278 278 279 281 284 285 291 291

299 301 301 301 303 304 307 308 308 309 312 312 313 314 316

xiv

Inhaltsverzeichnis

11.8 Konvergenzgeschwindigkeit des GMRES-Verfahrens . . 11.9 Nachtrag 1: Krylovräume . . . . . . . . . . . . . . . . . 11.10Nachtrag 2: Programmsysteme mit Multifunktionalität – Weitere Bemerkungen und Literaturhinweise . . . . . . – Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

318 318 319 320 321

12 Eigenwertprobleme 12.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.2 Störungstheorie für Eigenwertprobleme . . . . . . . . . . . 12.2.1 Diagonalisierbare Matrizen . . . . . . . . . . . . . . 12.2.2 Der allgemeine Fall . . . . . . . . . . . . . . . . . . . 12.3 Lokalisierung von Eigenwerten . . . . . . . . . . . . . . . . 12.4 Variationssätze für symmetrische Eigenwertprobleme . . 12.5 Störungsresultate für Eigenwerte symmetrischer Matrizen 12.6 Nachtrag: Faktorisierungen von Matrizen . . . . . . . . . . 12.6.1 Symmetrische Matrizen . . . . . . . . . . . . . . . . 12.6.2 Diagonalisierbare Matrizen . . . . . . . . . . . . . . 12.6.3 Schur-Faktorisierung . . . . . . . . . . . . . . . . . . – Weitere Bemerkungen und Literaturhinweise . . . . . . . . – Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

323 323 323 323 325 327 330 332 332 333 333 333 334 334

13 Numerische Verfahren für Eigenwertprobleme 13.1 Einführende Bemerkungen . . . . . . . . . . . . . . . . . . . . . . . . . . 13.1.1 Ähnlichkeitstransformationen . . . . . . . . . . . . . . . . . . . . 13.1.2 Vektoriteration . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.2 Transformation auf Hessenbergform . . . . . . . . . . . . . . . . . . . 13.2.1 Householder-Ähnlichkeitstransformationen zur Gewinnung von Hessenbergmatrizen . . . . . . . . . . . . . . . . . . . . . . . . . 13.2.2 Der symmetrische Fall . . . . . . . . . . . . . . . . . . . . . . . . 13.3 Newton-Verfahren zur Berechnung von Eigenwerten . . . . . . . . . . . 13.3.1 Der nichtsymmetrische Fall. Die Methode von Hyman . . . . . . 13.3.2 Das Newton-Verfahren zur Berechnung der Eigenwerte tridiagonaler Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.4 Das Jacobi-Verfahren für symmetrische Matrizen . . . . . . . . . . . . 13.4.1 Approximation der Eigenwerte durch Diagonaleinträge . . . . . 13.4.2 Givensrotationen zur Reduktion der Nichtdiagonaleinträge . . . 13.4.3 Zwei spezielle Jacobi-Verfahren . . . . . . . . . . . . . . . . . . . 13.5 Das QR-Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.5.1 Eindeutigkeit und Stetigkeit der QR-Faktorisierung einer Matrix 13.5.2 Definition des QR-Verfahrens . . . . . . . . . . . . . . . . . . . . 13.5.3 Konvergenz des QR-Verfahrens für betragsmäßig einfache Eigenwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.5.4 Praktische Durchführung des QR-Verfahrens für Hessenbergmatrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.6 Das LR-Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.7 Die Vektoriteration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

337 337 337 338 339 339 341 342 342 344 346 346 347 350 352 352 355 356 359 364 364

xv

Inhaltsverzeichnis

– –

13.7.1 Definition und Eigenschaften der Vektoriteration 13.7.2 Spezielle Vektoriterationen . . . . . . . . . . . . . Weitere Bemerkungen und Literaturhinweise . . . . . . . Übungsaufgaben . . . . . . . . . . . . . . . . . . . . . . .

14 Restglieddarstellung nach Peano 14.1 Einführende Bemerkungen . . . . . . . . . . . 14.2 Peano-Kerne . . . . . . . . . . . . . . . . . . . 14.3 Anwendungen . . . . . . . . . . . . . . . . . . 14.3.1 Interpolation . . . . . . . . . . . . . . . 14.3.2 Numerische Integration . . . . . . . . – Weitere Bemerkungen und Literaturhinweise – Übungsaufgaben . . . . . . . . . . . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

15 Approximationstheorie 15.1 Einführende Bemerkungen . . . . . . . . . . . . . . . . 15.2 Existenz eines Proximums . . . . . . . . . . . . . . . . 15.3 Eindeutigkeit eines Proximums . . . . . . . . . . . . . 15.3.1 Einige Notationen; streng konvexe Mengen . . 15.3.2 Strikt normierte Räume . . . . . . . . . . . . . 15.4 Approximationstheorie in Räumen mit Skalarprodukt 15.4.1 Einige Grundlagen . . . . . . . . . . . . . . . . . 15.4.2 Proxima in linearen Unterräumen . . . . . . . . 15.5 …n1 -Proxima bzgl. Maximumnormen . . . . . . . . . 15.6 Anwendungen des Alternantensatzes . . . . . . . . . 15.6.1 Ein Beispiel . . . . . . . . . . . . . . . . . . . . . 15.6.2 Eine erste Anwendung des Alternantensatzes . 15.6.3 Eine zweite Anwendung des Alternantensatzes 15.7 Haarsche Räume, Tschebyscheff-Systeme . . . . . . . 15.7.1 Alternantensatz für haarsche Räume . . . . . . 15.7.2 Eindeutigkeit des Proximums . . . . . . . . . . 15.7.3 Untere Schranken für den Minimalabstand . . – Weitere Bemerkungen und Literaturhinweise . . . . . – Übungsaufgaben . . . . . . . . . . . . . . . . . . . . .

. . . . . . .

. . . . . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

364 366 367 367

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

370 370 371 373 373 374 374 374

. . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . .

376 376 377 379 379 380 382 382 384 386 389 389 389 390 391 392 393 393 394 394

16 Rechnerarithmetik 16.1 Zahlendarstellungen . . . . . . . . . . . . . . . . . . . . . . . . . . . 16.2 Allgemeine Gleitpunkt-Zahlensysteme . . . . . . . . . . . . . . . . . 16.2.1 Grundlegende Begriffe . . . . . . . . . . . . . . . . . . . . . . 16.2.2 Struktur des normalisierten Gleitpunkt-Zahlensystems F . . 16.2.3 Struktur des denormalisierten Gleitpunkt-Zahlensystems b F. 16.3 Gleitpunkt-Zahlensysteme in der Praxis . . . . . . . . . . . . . . . . 16.3.1 Die Gleitpunktzahlen des Standards IEEE 754 . . . . . . . . 16.3.2 Weitere Gleitpunkt-Zahlensysteme in der Praxis . . . . . . . 16.4 Runden, Abschneiden . . . . . . . . . . . . . . . . . . . . . . . . . . 16.4.1 Runden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

396 396 397 397 398 400 401 401 403 404 404

. . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . .

xvi

Inhaltsverzeichnis

16.4.2 Abschneiden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16.5 Arithmetik in Gleitpunkt-Zahlensystemen . . . . . . . . . . . . . . . . . 16.5.1 Arithmetische Grundoperationen in Gleitpunkt-Zahlensystemen 16.5.2 Fehlerakkumulation bei der Hintereinanderausführung von Multiplikationen und Divisionen in Gleitpunkt-Zahlensystemen . . 16.5.3 Fehlerverstärkung bei der Hintereinanderausführung von Additionen in einem gegebenen Gleitpunkt-Zahlensystem F . . . . . – Weitere Bemerkungen und Literaturhinweise . . . . . . . . . . . . . . .

406 407 408 408 410 412

Literaturverzeichnis

413

Index

419

1

Polynominterpolation

1.1 Allgemeine Vorbetrachtungen, landausche Symbole Gegenstand dieses und der beiden nachfolgenden Kapitel sind Problemstellungen der folgenden Art: Aus einer vorab festgelegten Menge von Funktionen Mn bestimme man eine Funktion, die durch gegebene Punkte .x0 ; f0 /; .x1 ; f1 /; : : : ; .xn ; fn / 2 R 2 verläuft. Hierbei ist Mn  ¹ W I ! R º eine problembezogen ausgewählte Menge von Funktionen, wobei I  R ein endliches oder unendliches Intervall mit paarweise verschiedenen Stützstellen x0 ; x1 ; : : : ; xn 2 I ist. Solche Problemstellungen werden im Folgenden kurz als ( eindimensionale ) Interpolationsprobleme bezeichnet. Bemerkung 1.1. Interpolationsprobleme treten in unterschiedlichen Anwendungsbereichen auf. Einige davon werden – ohne weitere Spezifikation der Menge Mn – im Folgenden vorgestellt: Durch die Interpolation von zeit- oder ortsabhängigen Messwerten wird die näherungsweise Ermittlung auch von Daten für solche Zeiten oder Orte ermöglicht, für die keine Messungen vorliegen.



Die Interpolation lässt sich ebenfalls sinnvoll einsetzen bei der effizienten näherungsweisen Bestimmung des Verlaufs solcher Funktionen f W I ! R, die nur aufwändig auszuwerten sind. Hier wird die genannte Funktion f vorab lediglich an den vorgegebenen Stützstellen ausgewertet. Zur näherungsweisen Bestimmung der Funktionswerte von f an weiteren Stellen werden dann ersatzweise die entsprechenden Werte der interpolierenden Funktion aus Mn herangezogen, wobei hier fj D f .xj / für j D 0; 1; : : : ; n angenommen wird. 

Eine weitere wichtige Anwendung stellt das rechnergestützte Konstruieren ( Computer-Aided Design, kurz CAD ) dar, das beispielsweise zur Konstruktion von Schiffsrümpfen oder zur Festlegung von Schienenwegen verwendet wird. Mathematisch betrachtet geht es hierbei darum, interpolierende Funktionen mit hinreichend guten Glattheitseigenschaften zu verwenden. 

Es existieren weitere Anwendungen, deren Modellierung auf andere mathematische Problemstellungen führen wie etwa die numerische Integration oder die numerische Lösung von Anfangswertproblemen für gewöhnliche Differenzialgleichungen. Wie sich herausstellen wird, lassen sich hierfür unter Zuhilfenahme der Interpolation M numerische Verfahren entwickeln.



Für jedes der vorzustellenden Interpolationsprobleme sind im Prinzip die folgenden Themenkomplexe von Interesse:

2

Kapitel 1

Polynominterpolation



Existenz und Eindeutigkeit der interpolierenden Funktion aus der vorgegebenen Klasse von Funktionen Mn . Dabei ist es aufgrund der vorliegenden .nC 1/ Interpolationsbedingungen naheliegend, für Mn lineare Funktionenräume der Dimension .n C 1/ heranzuziehen.



Stabile Berechnung der Werte der interpolierenden Funktion an einer oder mehrerer Stellen.



Aufwandsbetrachtungen für jedes der betrachteten Verfahren.



Herleitung von Abschätzungen für den bezüglich einer gegebenen hinreichend glatten Funktion f W Œ a; b  ! R und der interpolierenden Funktion auf dem Intervall Œ a; b  auftretenden größtmöglichen Fehler, wobei hier fj D f .xj / für j D 0; 1; : : : ; n angenommen wird.

1.1.1 Landausche Symbole Im Folgenden werden zunächst die landauschen Symbole O und O vorgestellt, mit denen sich bei Fehlerabschätzungen und Effizienzbetrachtungen die wichtigen Aussagen herausstellen lassen. Definition 1.2. Gegeben seien zwei Funktionen f; g W R N  D ! R, und x  2 R N sei ein Häufungspunkt der Menge D , es existiere also eine Folge x .0/ ; x .1/ ; : : :  D .n/ mit maxj D1;:::;N jxj  xj j ! 0 für n ! 1. (a) Die Notation

f .x/ D O.g.x//

für D 3 x ! x 

ist gleichbedeutend mit der Existenz einer Konstanten K  0 sowie einer Umgebung U D ¹ x 2 R N W maxj D1;:::;N jxj  xj j  ı º von x  ( mit einer Zahl ı > 0 ), so dass die folgende Abschätzung gilt,

jf .x/j  Kjg.x/j

für x 2 U \ D:

(b) Die Notation

f .x/ D

O .g.x//

für D 3 x ! x 

wird verwendet, wenn für jede Zahl " > 0 eine Umgebung U" D ¹ x 2 R N W maxj D1;:::;N jxj  xj j  ı" º ( mit einer von " abhängenden Zahl ı D ı" > 0 ) von x  existiert, so dass Folgendes gilt,

jf .x/j  "jg.x/j

für x 2 U" \ D:

Im eindimensionalen Fall N D 1 lassen sich diese Notationen auf die Situation x  D 1 übertragen, wobei nur die angegebenen Umgebungen durch Mengen der Form U D ¹ x 2 R W x  M º mit Zahlen M 2 R zu ersetzen sind. Beispiel 1.3. (1) Wenn die Funktion g in einer Umgebung von x  keine Nullstelle besitzt, ist f .x/ D O .g.x// für D 3 x ! x  gleichbedeutend mit f .x/=g.x/ ! 0 für D 3 x ! x  . Gilt zusätzlich noch g.x  / D 0 und ist g an der Stelle x  stetig, so impliziert ( jeweils für D 3 x ! x  ) die Aussage f .x/ D O . g.x/ / sinngemäß, dass f .x/ schneller gegen 0 konvergiert als g.x/ es tut.

3

Abschnitt 1.2 Existenz und Eindeutigkeit bei der Polynominterpolation

(2) Es gilt f .x/ D O.1/ für x ! x  genau dann, wenn f .x/ in einer Umgebung von x  beschränkt ist. Weiter gilt f .x/ D O .1/ für x ! x  genau dann, wenn f .x/ ! 0 M für D 3 x ! x  ( Aufgabe 1.1 ).

1.2 Existenz und Eindeutigkeit bei der Polynominterpolation Im weiteren Verlauf dieses Kapitels werden zur Interpolation von .n C 1/ beliebigen Stützpunkten .x0 ; f0 /; .x1 ; f1 /; : : : ; .xn ; fn / 2 R 2 mit paarweise verschiedenen Stützstellen x0 ; : : : ; xn speziell Funktionen aus der Menge

…n WD ¹ P W P ist Polynom vom Grad  n º herangezogen; es wird also ein Polynom P mit den folgenden Eigenschaften gesucht,

P 2 …n ; P .xj / D fj

³ für j D 0; 1; : : : ; n:

(1.1)

1.2.1 Die lagrangesche Interpolationsformel Für den Nachweis der Existenz einer Lösung des Interpolationsproblems (1.1) lassen sich die folgenden Polynome verwenden. Definition 1.4. Zu gegebenen .n C 1/ paarweise verschiedenen Stützstellen x0 ; x1 ; : : : ; xn 2 R sind die .n C 1/ lagrangeschen Basispolynome L0 ; L1 ; : : : ; Ln 2 …n folgendermaßen definiert,

Lk .x/ D

n Y x  xs xk  x s

für k D 0; 1; : : : ; n:

sD0 s¤k

Bemerkung 1.5. Das lagrangesche Basispolynom Lk genügt offensichtlich den .n C 1/ Interpolationsbedingungen ° 1 für j D k; Lk .xj / D ıkj WD 0 für j ¤ k: Daraus resultiert auch unmittelbar die lineare Unabhängigkeit der lagrangeschen Basispolynome L0 ; L1 ; : : : ; Ln , so dass diese eine Basis des .n C 1/-dimensionalen Raums …n der Polynome vom Grad  n bilden. M Das folgende Theorem behandelt die Frage der Existenz und Eindeutigkeit des interpolierenden Polynoms:

4

Kapitel 1

Polynominterpolation

Theorem 1.6. Zu beliebigen .n C 1/ Stützpunkten .x0 ; f0 /; .x1 ; f1 /; : : : ; .xn ; fn / 2 R 2 mit paarweise verschiedenen Stützstellen x0 ; x1 ; : : : ; xn existiert genau ein interpolierendes Polynom P 2 …n ( siehe Eigenschaft (1.1) ). Es besitzt die Darstellung ( lagrangesche Interpolationsformel )

P .x/ D

n X

fk Lk .x/:

(1.2)

kD0

(a) Existenz: Für die Funktion P aus (1.2) gilt P 2 …n und P .xj / D kD0 fk ıjk D fj für j D 0; 1; : : : ; n, wie man sofort nachrechnet. (b) Eindeutigkeit: Wenn auch das Polynom Q 2 …n den Interpolationsbedingungen genügt, wenn also Q.xj / D fj für j D 0; 1; : : : ; n erfüllt ist, so gilt Q  P 2 …n und Beweis.

Pn

.Q  P /.xj / D 0

für j D 0; 1; : : : ; n:

Damit ist Q  P ein Polynom vom Grad  n mit mindestens n C 1 paarweise verschiedenen Nullstellen, so dass ( siehe beispielsweise Fischer [28], Abschnitt 1.3 ) notwendigerweise Q  P  0 beziehungsweise Q  P gilt.

1.2.2 Eine erste Vorgehensweise zur Berechnung des interpolierenden Polynoms Im Folgenden sollen Algorithmen zur Berechnung der Werte des interpolierenden Polynoms an einer oder mehrerer Stellen angegeben werden, wobei zur jeweiligen Bewertung auch Aufwandsbetrachtungen angestellt werden. Definition 1.7. Jede der Grundoperationen Addition, Subtraktion, Multiplikation und Division sowie die Wurzelfunktion wird im Folgenden als arithmetische Operation bezeichnet. Der jeweils zu betreibende Aufwand eines Verfahrens lässt sich über die Anzahl der durchzuführenden arithmetischen Operationen beschreiben. Der Einfachheit halber bleibt im Folgenden unberücksichtigt, dass ein Mikroprozessor zur Ausführung einer Division beziehungsweise zur Berechnung einer Quadratwurzel jeweils etwa vier mal so viel Zeit benötigt wie zur Durchführung einer Addition, einer Subtraktion oder einer Multiplikation ( Überhuber [106], Abschnitt 5.5 ). Wie sich herausstellt, ist die folgende Zielsetzung realistisch: Angestrebtes Ziel ist die Herleitung von Verfahren, für die das zu .n C 1/ Stützpunkten gehörende interpolierende Polynom P (siehe (1.1)) nach einer Anlaufrechnung mit O.n2 / arithmetischen Operationen an jeder Stelle x 2 R in O.n/ arithmetischen Operationen ausgewertet werden kann.

(1.3)

Hierbei sind Ausdrücke der Form “O.nq /” eine Kurzform für “O.nq / für n ! 1”.

5

Abschnitt 1.3 Neville-Schema

Eine erste Variante zur Bestimmung eines interpolierenden Polynoms mit dem in (1.3) angestrebten maximalen Aufwand basiert auf der folgenden Darstellung für die lagrangeschen Basispolynome,

Lk .x/ D

n Y x  xs xk  xs

D

sD0 s¤k

k q.x/; x  xk

mit k

k D 0; 1; : : : ; n; D

n Y sD0 s¤k

1

xk  x s

;

q.x/ D

(1.4) n Y

.x  xs /:

sD0

Die Zahlen 0 ; 1 ; : : : ; n , die auch als Stützkoeffizienten bezeichnet werden, lassen sich mit einem Aufwand von insgesamt O.n2 / arithmetischen Operationen ermitteln. Sind diese Koeffizienten einmal berechnet, so lässt sich für jede Zahl x 2 R der Wert P P .x/ D q.x/. nkD0 k fk =.x  xk // in O.n/ arithmetischen Operationen bestimmen, wie man sich leicht überlegt. Diese Vorgehensweise zur Berechnung von P .x/ lässt sich also mit in (1.3) angestrebten maximalen Aufwand realisieren und hat zudem den praxisrelevanten Vorteil, dass die in der Anlaufrechnung berechneten Koeffizienten 0 ; 1 ; : : : ; n nicht von den Stützwerten f0 ; f1 ; : : : ; fn abhängen. Bei einem Wechsel der Stützwerte f0 ; f1 ; : : : ; fn unter gleichzeitiger Beibehaltung der Stützstellen x0 ; x1 ; : : : ; xn ist also eine erneute Anlaufrechnung nicht erforderlich. Bemerkung 1.8. Die Entwicklung des interpolierenden Polynoms P 2 …n als Linearkombination der lagrangeschen Basispolynome in Kombination mit der in diesem Abschnitt 1.2.2 beschriebenen Vorgehensweise zur Auswertung von P .x/ führt jedoch für nahe bei Stützstellen liegende Zahlen x zu Instabilitäten, was zurückzuführen ist auf auftretende Brüche mit betragsmäßig kleinen Nennern und Zählern. Pn k Andererseits führt der Ansatz P .x/ D kD0 ak x als Linearkombination der Monome zusammen mit den Interpolationsbedingungen auf ein lineares Gleichungssystem, dessen Lösung sich als zu aufwändig und zu empfindlich gegenüber RunM dungsfehlern erweist. In Abschnitt 1.4 wird eine Darstellung des interpolierenden Polynoms bezüglich einer anderen Basis behandelt, mit der sich das interpolierende Polynom P mit dem in (1.3) angegebenen maximalen Aufwand stabil berechnen lässt.

1.3 Neville-Schema Die Lösung für das Interpolationsproblem (1.1) kann schrittweise aus den interpolierenden Polynomen zu m D 0; 1; : : : Stützpunkten berechnet werden, wie sich im Folgenden herausstellt. Einerseits wird dieses Resultat für den Beweis der wesentlichen Aussage des nachfolgenden Abschnitts benötigt, andererseits erhält man dabei eine allgemein beliebte Vorgehensweise zur Auswertung des interpolierenden Polynoms an einigen wenigen Stellen.

6

Kapitel 1

Polynominterpolation

Definition 1.9. Seien k; m 2 N0 . Zu den .m C 1/ Stützpunkten .xk ; fk /; .xkC1 ; fkC1 /; : : : ; .xkCm ; fkCm / bezeichne Pk;kC1;:::;kCm dasjenige ( eindeutig bestimmte ) Polynom vom Grad  m mit der Eigenschaft

Pk;kC1;:::;kCm .xj / D fj

für j D k; k C 1; : : : ; k C m:

(1.5)

Für die vorgestellten Polynome Pk;kC1;:::;kCm besteht die folgende Rekursionsbeziehung:

Theorem 1.10. Seien .x0 ; f0 /; .x1 ; f1 /; : : : ; .xn ; fn / vorgegebene Stützpunkte. Für die Interpolationspolynome Pk;kC1;:::;kCm ( mit k  0 und m  0 mit k C m  n ) aus (1.5) gilt die Rekursionsformel

Pk .x/  fk ; (1.6) .xxk /PkC1;:::;kCm .x/  .xxkCm /Pk;:::;kCm1 .x/ Pk;kC1;:::;kCm .x/ D ; m  1: (1.7) xkCm  xk

Beweis. Die Identität (1.6) ist wegen Pk 2 …0 und Pk .xk / D fk offensichtlich richtig. Es bezeichne Q.x/ die rechte Seite von (1.7), und Q D Pk;kC1;:::;kCm ist dann nachzuweisen, was im Folgenden geschieht. Es gilt PkC1;:::;kCm 2 …m1 und Pk;:::;kCm1 2 …m1 und demnach Q 2 …m . Weiter gilt

Q.xk / D

0  . xk  xkCm /fk

xkCm  xk

D fk ;

Q.xkCm / D

. xkCm  xk /fkCm  0 xkCm  xk

D fkCm ;

und für j D k C 1; k C 2; : : : ; k C m  1 gilt

Q.xj / D

. xj  xk /fj  . xj  xkCm /fj xkCm  xk

D

. xk C xkCm /fj xkCm  xk

D fj :

Aufgrund der Eindeutigkeit des interpolierenden Polynoms ( Theorem 1.6 ) gilt daher notwendigerweise die Identität Q D Pk;kC1;:::;kCm . Die sich für die Werte Pk;kC1;:::;kCm .x/ aus der Rekursionsformel (1.7) ergebenden Abhängigkeiten sind in Schema 1.1 dargestellt, das als Neville-Schema bezeichnet wird. Die Einträge in Schema 1.1 lassen sich beispielsweise spaltenweise jeweils von oben nach unten berechnen. Wie bereits erwähnt wird das resultierende Verfahren zur Auswertung des interpolierenden Polynoms P .x/ D P0:::n .x/ an einzelnen Stellen x verwendet, wobei jeweils 7n2 =2 C O.n/ arithmetische Operationen anfallen, wie man leicht nachzählt.

7

Abschnitt 1.4 Die newtonsche Interpolationsformel, dividierte Differenzen

f0 D P0 .x/ f1 D P1 .x/

& ! & !

P01 .x/

& f2 D P2 .x/ P12 .x/ ! P012 .x/ :: :: :: :: : : : : fn1 D Pn1 .x/ ! Pn2;n1 .x/ !       P0:::n1 .x/ & & & fn D Pn .x/ ! Pn1;n .x/ !       P1:::n .x/ ! P0:::n .x/ Schema 1.1: Neville-Schema Beispiel 1.11. Man betrachte folgende Stützpunkte,

j xj fj

0 0 1

1 1 3

2 3 2

Für x D 2 sind die Werte des Neville-Schemas in Schema 1.2 angegeben.

f0 D P0 .2/ D 1 f1 D P1 .2/ D 3

P01 .2/ D 5

f2 D P2 .2/ D 2

P12 .2/ D 5=2

P012 .2/ D 10=3

Schema 1.2: Neville-Schema zu Beispiel 1.11 Die Einträge in Schema 1.2 ergeben sich dabei folgendermaßen:

P01 .2/ D

. 2  0 /P1 .2/  . 2  1 /P0 .2/ 10

D

2311 1

P12 .2/ D

. 2  1 /P2 .2/  . 2  3 /P1 .2/ 31

D

1  2  .1/  3 2

P012 .2/ D

. 2  0 /P12 .2/  . 2  3 /P01 .2/ 30

D

D 5; D

2  5=2  .1/  5 3

5 ; 2

D

10 : 3

M

1.4 Die newtonsche Interpolationsformel, dividierte Differenzen In diesem Abschnitt wird eine weitere Darstellung des interpolierenden Polynoms behandelt. Hierfür werden die folgenden Basispolynome benötigt.

8

Kapitel 1

Polynominterpolation

Definition 1.12. Zu gegebenen paarweise verschiedenen .n C 1/ Stützstellen x0 ; x1 ; : : : ; xn 2 R sind die speziellen .n C 1/ newtonschen Basispolynome folgendermaßen erklärt: 1;

x  x0 ;

.x  x0 /.x  x1 /; : : : : : : ; .x  x0 /.x  x1 / : : : .x  xn1 /:

Das gesuchte interpolierende Polynom P 2 …n mit P .xj / D fj für j D 0; 1; : : : ; n ( vergleiche (1.1) ) soll nun als Linearkombination der newtonschen Basispolynome dargestellt werden, also in der Form

P .x/ D a0 C a1 .x  x0 / C a2 .x  x0 /.x  x1 / C : : :

μ (1.8)

: : : C an .x  x0 /.x  x1 / : : : .x  xn1 / mit noch zu bestimmenden Koeffizienten a0 ; a1 ; : : : ; an . Sind die Koeffizienten a0 ; a1 ; : : : ; an erst einmal bestimmt, so kann für jede Zahl x D  das Polynom (1.8) mit dem Horner-Schema

P ./ D



   : : : an .  xn1 / C an1 .  xn2 / C : : : C a1 .  x0 / C a0

ausgewertet werden, wobei die ( insgesamt 3n ) arithmetischen Operationen von links nach rechts auszuführen sind. Bemerkung 1.13. Die Koeffizienten a0 ; a1 ; : : : ; an können im Prinzip aus den Gleichungen

f0 D P .x0 / D a0 ; f1 D P .x1 / D a0 C a1 .x1  x0 /; f2 D P .x2 / D a0 C a1 .x2  x0 / C a2 .x2  x0 /.x2  x1 /; :: :: :: : : : gewonnen werden, wobei allerdings n3 =3 C O.n2 / arithmetische Operationen anfallen, wie man sich leicht überlegt. Im Folgenden soll eine günstigere Vorgehensweise vorgestellt werden, die eine Berechnung dieser Koeffizienten mit den angestrebten O.n2 / arithmetischen Operationen ermöglicht. M Definition 1.14. Zu gegebenen Stützpunkten .x0 ; f0 /; .x1 ; f1 /; : : : ; .xn ; fn / 2 R 2 sind die dividierten Differenzen folgendermaßen erklärt:

f Œ xk  WD fk ; k D 0; 1; : : : ; n; f Œ xkC1 ; : : : ; xkCm   f Œ xk ; : : : ; xkCm1  f Œ xk ; : : : ; xkCm  WD ; xkCm  xk für 0  k; m  n mit k C m  n.

9

Abschnitt 1.4 Die newtonsche Interpolationsformel, dividierte Differenzen

Bemerkung 1.15. 1. Die dividierte Differenz f Œ xk ; : : : ; xkCm  hängt neben den Stützstellen xk ; xkC1 ; : : : ; xkCm auch von den Stützwerten fk ; fkC1 ; : : : ; fkCm ab. 2. Werden die Stützwerte etwa mit gj anstelle fj bezeichnet, so wird für die dividierten Differenzen naheliegenderweise die Bezeichnung g Œ xk ; : : : ; xkCm  verwendet. 3. Für die Berechnung aller dividierten Differenzen zu den Stützpunkten .x0 ; f0 /; .x1 ; f1 /; : : : ; .xn ; fn / 2 R 2 sind lediglich 3n.n C 1/=2 arithmetische Operationen erforderlich. M Die Abhängigkeiten zwischen den dividierten Differenzen sind in Schema 1.3 dargestellt.

f0 D f Πx 0  & f1 D f Πx 1 

!

f Πx 0 ; x1 

& f2 D f Πx 2  :: :

!

& f Πx 1 ; x2  :: :

!f Πx0 ; x1 ; x2  :: :: : :

fn1 D f Πxn1 !f Πxn2 ; xn1 ! &



  f Πx0 ; : : : ; xn1 

&

fn D f Πxn  ! f Πxn1 ; xn  !

& 

   f Πx1 ; : : : ; xn  !f Πx0 ; : : : ; xn 

Schema 1.3: Abhängigkeiten zwischen den dividierten Differenzen Beispielsweise gilt

f Πx0 ; x1  D f Πx0 ; x1 ; x2  D

f Πx1   f Πx0  ; x1  x0

f Πx1 ; x2  D

f Πx2   f Πx1  ; x2  x1

f Πx 1 ; x2   f Πx 0 ; x1  : x2  x 0

Das nachfolgende Theorem liefert die wesentliche Aussage dieses Abschnitts 1.4. Theorem 1.16 (Newtonsche Interpolationsformel). Für das interpolierende Polynom P 2 …n zu gegebenen .n C 1/ Stützpunkten .x0 ; f0 /; .x1 ; f1 /; : : : ; .xn ; fn / 2 R 2 gilt

P .x/ D f Πx0  C f Πx0 ; x1 .x  x0 / C : : : : : : C f Πx0 ; : : : ; xn .x  x0 /.x  x1 /    .x  xn1 /:

(1.9)

Beweis. Dieser wird per vollständiger Induktion über n geführt. Die Aussage ist sicher richtig für n D 0 und beliebige Stützpunkte .x0 ; f0 /, und es sei nun angenommen, dass sie richtig ist für n 2 N0 und beliebige Stützpunkte .x0 ; f0 /; .x1 ; f1 /; : : : ; .xn ; fn / 2 R 2 . Im Folgenden seien .n C 2/ Stützpunkte .x0 ; f0 /; .x1 ; f1 /; : : : ; .xnC1 ;

10

Kapitel 1

Polynominterpolation

fnC1 / 2 R2 gegeben, und P 2 …nC1 bezeichne das zugehörige interpolierende Polynom. Mit der Notation aus Definition 1.9 gilt dann

P  P0;:::;n

2

…nC1 ;

P .xj /  P0;:::;n .xj / D 0

für j D 0; 1; : : : ; n;

und damit gilt P .x/  P0;:::;n .x/ D a.x  x0 /    .x  xn / beziehungsweise

P .x/ D P0;:::;n .x/ C a.x  x0 /    .x  xn /

(1.10)

mit einer geeigneten Konstanten a 2 R ( Übungsaufgabe; folgt aus der Eindeutigkeit des interpolierenden Polynoms ( Theorem 1.6 ) ). Nach Induktionsvoraussetzung gilt

P0;:::;n .x/ D f Πx0  C f Πx0 ; x1 .x  x0 / C : : :

μ (1.11)

: : : C f Πx0 ; : : : ; xn .x  x0 /.x  x1 /    .x  xn1 /; so dass wegen (1.10), (1.11) noch

a D f Πx0 ; : : : ; xnC1 

(1.12)

nachzuweisen ist. Zu diesem Zweck verwendet man entsprechend Theorem 1.10 die Identität

P .x/ D

.x  x0 /P1;:::;nC1 .x/  .x  xnC1 /P0;:::;n .x/ xnC1  x0

(1.13)

und führt in (1.13) einen Koeffizientenvergleich durch. Wegen der Identität (1.10) ist klar, dass a der führende Koeffizient von P ist, es gilt also

P D Q C ax nC1 für ein gewisses Polynom Q 2 …n . Andererseits ist nach Induktionsvoraussetzung bekannt, dass das Polynom P1;:::;nC1 den führenden Koeffizienten f Œ x1 ; : : : ; xnC1  sowie P0;:::;n den führenden Koeffizienten f Œ x0 ; : : : ; xn  besitzt; wegen (1.13) besitzt P also tatsächlich den führenden Koeffizienten

a D

f Πx1 ; : : : ; xnC1   f Πx0 ; : : : ; xn  xnC1  x0

def

D f Πx0 ; : : : ; xnC1 ;

was identisch mit (1.12) ist und den Beweis komplettiert.

1.5 Fehlerdarstellungen zur Polynominterpolation Das folgende Theorem liefert für hinreichend glatte Funktionen eine Darstellung des bei der Polynominterpolation auftretenden Fehlers.

11

Abschnitt 1.5 Fehlerdarstellungen zur Polynominterpolation

Theorem 1.17. Die Funktion f W Œ a; b  ! R sei .n C 1/-mal differenzierbar und sei P 2 …n das Polynom mit P .xj / D f .xj / für j D 0; 1; : : : ; n. Für jedes x 2 Œ a; b  gilt dann die Fehlerdarstellung ! . x / f .nC1/ ./ ; . n C 1 /Š

f .x/  P .x/ D

(1.14)

mit einer Zwischenstelle  D  .x/ 2 Πa; b  und

!.x/ WD .x  x0 /    .x  xn /:

Beweis. Falls x D xj für ein j gilt, so verschwinden beide Seiten der Gleichung (1.14). Sei nun x 62 ¹ x0 ; x1 ; : : : ; xn º und sei

.x/ WD f .x/  P .x/  K !.x/; wobei die Konstante K so gewählt sei, dass

.x/ D 0 erfüllt ist. Im Folgenden soll eine spezielle Darstellung für die Konstante K hergeleitet werden. Hierzu beobachtet man, dass die Funktion in dem Intervall Œ a; b  mindestens .n C 2/ paarweise verschiedene Nullstellen

x0 ; : : : ; xn ; x besitzt. Eine wiederholte Anwendung des Theorems von Rolle zeigt: Die Funktion 0 besitzt in dem Intervall Œ a; b  mindestens .n C 1/ paarweise verschiedene Nullstellen, die Funktion 00 besitzt in Œ a; b  mindestens noch n paarweise verschiedene Nullstellen, und eine Fortführung dieses Arguments liefert die Existenz einer Nullstelle  der Funktion .nC1/ in dem Intervall Œ a; b . Nun gilt aber

P .nC1/  0;

./

! .nC1/  .n C 1/Š;

wobei man die Identität . / aufgrund des Umstands erhält, dass ! 2 …nC1 den führenden Koeffizienten eins besitzt. Insgesamt erhält man .nC1/

./ D f .nC1/ ./  K .n C 1/Š D 0

f .nC1/ .  /

beziehungsweise K D . nC1 /Š , was den Nachweis für die angegebene Fehlerdarstellung (1.14) komplettiert. Der Fehlerdarstellung (1.14) kann man unmittelbar entnehmen, dass beliebig oft differenzierbare Funktionen f W Œ a; b  ! R mit gleichmäßig beschränkten Ableitungen durch interpolierende Polynome gut approximiert werden ( siehe das nachfolgende Theorem ). Vorbereitend wird für eine Unterteilung

 D

®

./

a D x0

./

< x1

./

< : : : < xn./ D b

¯

12

Kapitel 1

Polynominterpolation

des vorgegebenen Intervalls Œ a; b  das nachfolgende Maß für die Feinheit der Unterteilung  eingeführt,

jjjj WD

max

1j n./

¹ xj./  xj./ 1 º:

Man beachte, dass das folgende Theorem auch für Intervallunterteilungen .0/ ; .1/ ; : : : mit der Eigenschaft jj.m/ jj 6! 0 für m ! 1 gültig ist. Theorem 1.18. Die Funktion f W Œ a; b  ! R sei unendlich oft differenzierbar, mit maxx 2 Œ a;b  jf .s/ .x/j  M für s D 0; 1; : : :, mit einer endlichen Konstanten M . Weiter sei .0/ ; .1/ ; : : : eine Folge von Unterteilungen des Intervalls Œ a; b  mit nm WD n..m/ / ! 1 für m ! 1. Dann konvergiert die zugehörige Folge der interpolierenden Polynome Pm 2 …nm ( welche bezüglich der Unterteilung .m/ die zugehörigen Funktionswerte von f interpolieren ) gleichmäßig gegen die Funktion f . Beweis. Mit der Notation aus Theorem 1.17 gilt maxx 2 Œ a;b  j!.x/j  .b  a/nm C1 und somit max jPm .x/  f .x/j  M

x 2 Πa;b 

. b  a /nm C1 . nm C 1 /Š

! 0

für m ! 1:

Gleichmäßige Konvergenz der Interpolationspolynome erhält man auch unter geringeren Differenzierbarkeitsannahmen an die Funktion f ( siehe Maess [69], Band 2 ). Im Allgemeinen kann man jedoch nicht erwarten, dass eine fest vorgegebene stetige Funktion auf einem kompakten Intervall umso besser durch ein interpolierendes Polynom approximiert wird, je feiner nur die Unterteilung der Stützstellen gewählt wird. Diese Aussage wird in dem folgenden Theorem 1.19 präzisiert, das hier ohne Beweis angegeben wird und insbesondere für Intervallunterteilungen .0/ ; .1/ ; : : : mit jj.m/ jj ! 0 für m ! 1 von Bedeutung ist. Theorem 1.19 (Faber). Zu jeder Folge von Unterteilungen .0/ ; .1/ ; : : : des Intervalls Œ a; b  gibt es eine stetige Funktion f W Œ a; b  ! R, so dass die Folge der Polynome Pm 2 …n..m/ / ( welche bezüglich der Unterteilung .m/ die zugehörigen Funktionswerte von f interpolieren ) für m ! 1 nicht gleichmäßig gegen die Funktion f konvergieren. Eine weitere, ohne Differenzierbarkeitsannahmen auskommende Fehlerdarstellung zur Polynominterpolation wird durch dividierte Differenzen ermöglicht: Theorem 1.20. Mit den Notationen von Theorem 1.17 mit einer beliebigen Funktion f W Œ a; b  ! R gilt im Fall x 62 ¹ x0 ; : : : ; xn º die folgende Darstellung für den Interpolationsfehler,

f .x/  P .x/ D f Πx0 ; : : : ; xn ; x  !.x/:

13

Abschnitt 1.6 Tschebyscheff-Polynome

Beweis. Mit xnC1 WD x gilt aufgrund von Theorem 1.16 die Darstellung

P0;:::;nC1 .x/ D P0;:::;n .x/ C f Œ x0 ; : : : ; xn ; x  !.x/ „ ƒ‚ … D P .x /

für x 2 R ;

und mit der Identität f .x/ D P0;:::;nC1 .x/ folgt dann die Aussage des Theorems. Als Konsequenz aus den Theoremen 1.17 und 1.20 erhält man den folgenden Mittelwertsatz für höhere Ableitungen: Korollar 1.21. Zu jeder n-mal differenzierbaren Funktion f W Œ a; b  ! R und paarweise verschiedenen Stützstellen x0 ; x1 ; : : : ; xn 2 Œ a; b  existiert eine Zwischenstelle  D  .x/ 2 Œ a; b  mit

f Πx0 ; : : : ; xn  D

f .n/ ./ ; nŠ

wobei die Stützwerte durch fj D f .xj / für j D 0; 1; : : : ; n festgelegt sind. Beweis. Für n D 0 ist die Aussage trivialerweise richtig, und für n  1 folgt sie unmittelbar aus einem Vergleich der rechten Seiten in den Theoremen 1.17 und 1.20, angewandt mit den Stützstellen x0 ; : : : ; xn1 und für x D xn .

1.6 Tschebyscheff-Polynome In diesem Abschnitt wird unter anderem der Frage nachgegangen, für welche Stützstellen x0 ; x1 ; : : : ; xn 2 Œ a; b  der Ausdruck maxx2Œ a;b  j.x  x0 / : : : .x  xn /j am kleinsten wird, es ist also eine Lösung des Minimax-Problems max j.x  x0 / : : : .x  xn /j ! min

x 2 Πa;b 

für x0 ; x1 ; : : : ; xn 2 Œ a; b 

zu bestimmen. Die Darstellung (1.14) lässt bei einer solchen “optimalen” Wahl der Stützstellen ( falls diese zudem paarweise verschieden sind ) einen minimalen Fehler bei der Polynominterpolation erwarten. Die Untersuchungen werden zunächst auf das Intervall Œ a; b  D Œ 1 ; 1  beschränkt; auf die allgemeine Situation für Œ a; b  wird am Ende dieses Abschnitts eingegangen. Es stellt sich im Folgenden heraus, dass solche optimalen Stützstellen x0 ; x1 ; : : : ; xn 2 Œ 1; 1  durch die Nullstellen des .n C 1/-ten Tschebyscheff-Polynoms der ersten Art gegeben sind. Definition 1.22. Die Tschebyscheff-Polynome der ersten Art sind folgendermaßen erklärt,

Tn .t/ D cos .n arccos t/;

t 2 Π1 ; 1 

.n D 0; 1; : : :/:

(1.15)

Theorem 1.23. Für die Funktionen T0 ; T1 ; : : : aus (1.15) gelten die folgenden Aussagen:

14

Kapitel 1

(a) Tn . cos  / D cos n

für  2 Œ 0 ;  

Polynominterpolation

.n D 0; 1; : : :/.

(b) Für t 2 Œ 1 ; 1  gilt T0 .t/ D 1; T1 .t/ D t und

TnC1 .t/ D 2 t Tn .t/  Tn1 .t/;

n D 1; 2; : : : ;

(1.16)

und Fortsetzung des Definitionsbereichs des Tschebyscheff-Polynoms Tn auf ganz R mittels dieser Rekursionsformel liefert Tn 2 …n : (1.17) (c) Der führende Koeffizient von Tn ist für n  1 gleich 2n1 . (d)

max

t 2 Π1;1 

jTn .t/j D 1:

(e) Das Tschebyscheff-Polynom Tn besitzt in dem Intervall Π1 ; 1  insgesamt .n C 1/ Extrema: .n/

Tn .sk / D .1/k

.n/

für sk

WD cos .

k n

/;

k D 0; 1; : : : ; n:

(1.18)

(f) Das Tschebyscheff-Polynom Tn besitzt n einfache Nullstellen, die allesamt in dem Intervall Π1; 1  liegen: .n/

Tn .tk / D 0

.n/

für tk

WD cos .

. 2k  1 / 2n

/;

k D 1; 2; : : : ; n:

(1.19)

Beweis. Die Aussage (a) ist offensichtlich richtig, und die Darstellungen für T0 und T1 in (b) ergeben sich sofort aus Teil (a). Für die Herleitung der Rekursionsformel (1.16) wird das folgende Additionstheorem benötigt, cos x C cos y D 2 cos .

xCy 2

/ cos . x 2 y /

für x; y 2 R :

(1.20)

Für t D cos  erhält man dann mit (1.20) sowie Teil (a) dieses Theorems die folgenden Identitäten, 2tTn .t/  Tn1 .t/ D 2 cos  cos Œ n   cos Œ .n  1/  D cos Œ .n C 1/  D TnC1 .t/: Teil (c) folgt unmittelbar aus der Rekursionsformel (b), und schließlich sind (d), (e) und (f) offensichtlich richtig. Das nachfolgende Theorem liefert die wesentliche Aussage dieses Abschnitts 1.6. Theorem 1.24. Für n 2 N0 und mit der Notation aus (1.19) gilt die folgende Optimalitätseigenschaft: min

max

y0 ;:::;yn 2 Π1;1  t 2 Π1;1 

D D

j.t  y0 / : : : .t  yn /j .nC1/

max j.t  t1

t 2 Œ1;1

1 : 2n

.nC1/

/ : : : . t  tnC1 /j

(1.21) (1.22)

15

Abschnitt 1.6 Tschebyscheff-Polynome

Beweis. Als Erstes beobachtet man, dass mit TnC1 entsprechend (1.15) die Darstellung .nC1/ Π21n TnC1 .t/ D .t  t1.nC1/ / : : : . t  tnC 1 /

(1.23)

gilt, was sich unmittelbar aus Theorem 1.23, Teil (c) und (f) ergibt. Die Identität (1.22) folgt damit aus max t 2Œ 1;1  jTnC1 .t/j D 1 ( Theorem 1.23, Teil (d) ). Bei der Identität (1.21) ist die Abschätzung “” offensichtlich, und im Folgenden soll die Abschätzung “” durch eine Widerspruchsannahme nachgewiesen werden. Angenommen, es gibt Zahlen y0 ; y1 ; : : : ; yn 2 Œ 1 ; 1 , so dass 1 2n

>

max

t 2 Π1; 1 

j!.t/j;

!.t/ WD .t  y0 / : : : .t  yn /

(1.24)

gilt. Dann besitzt das Polynom

P WD

1 T 2n nC1

!

.n C 1/ Nullstellen in Π1; 1 , denn es liegen .n C 1/ Vorzeichenwechsel vor, wie sich bei Betrachtung der .n C 2/ aufsteigend angeordneten Extrema1 von TnC1 zeigt, 1 ; 2n

.nC1/

/ D

.nC1/

/ D 

.nC1/

/ D

Π21n TnC1 .s0 Π21n TnC1 .s1 Π21n TnC1 .s2

1 ; 2n

1 ; 2n

1 2n

.nC1/

/




.nC1/

/


0;

.nC1/

/

< 0;

.nC1/

/

> 0;

)

P . s0

)

P . s1

)

P . s2

:: :

:: :

beziehungsweise allgemein .nC1/

P .sk

.nC1/

/P .sk1 / < 0

für k D 1; 2; : : : ; n C 1:

Nun sind sowohl TnC1 =2n als auch ! jeweils Polynome vom Grad D n C 1 und besitzen beide den führenden Koeffizienten 1, so dass notwendigerweise P 2 …n gilt. Jedes Polynom vom Grad n mit n C 1 paarweise verschiedenen Nullstellen muss jedoch identisch verschwinden, daher gilt P  0 beziehungsweise

Œ 21n TnC1   !; was einen Widerspruch zur Annahme (1.24) darstellt. In Bild 1.1 ist der Verlauf des optimalen Polynoms vom Grad 10 dargestellt, und zum Vergleich ist noch das Polynom 2 …10 mit äquidistanten Nullstellen und führendem Koeffizienten 1 abgebildet. Man beachte, dass sich bei dem optimalen Polynom die Abstände der einzelnen Nullstellen zueinander zu den beiden Rändern des Intervalls Œ 1; 1  hin verringern, was zu der Vermeidung von Oszillationen am Rand führt. 1

diese sind in (1.18) angegeben

16

Kapitel 1

Polynominterpolation

0.00852 0.00682 0.00511 0.00341 0.00170 -0.00000 -0.00170 -0.00341 -0.00511 -0.00682 -0.00852 -1.0

-0.8

-0.6

-0.4

-0.2

0.0

0.2

Qn

0.4

0.6

QnC1

0.8

1.0

.nC1/

Bild 1.1: Darstellung von kD0 .x  xk / und kD1 . x  tk / ( letztere gestrichelt ) für gleichabständige Nullstellen xk beziehungsweise Tschebyscheff.nC1/ Nullstellen tk ; für n D 10 Der Fall Œ a; b  D Œ 1; 1  ist damit abgehandelt, und abschließend werden allgemeine Intervalle Œ a; b   R betrachtet. Das nachfolgende Theorem2 ist eine leichte Folgerung aus Theorem 1.24 verbunden mit der folgenden affin-linearen Transformation,

t 

W Π1; 1  ! Πa; b ;

Theorem 1.25. Mit der Funktion schaft,

1 . .b 2

 a/t C a C b /:

(1.25)

aus (1.25) gilt die folgende Optimalitätseigen-

max j.x  x0 / : : : .x  xn /j

min

x0 ;:::;xn 2 Πa;b  x 2 Πa;b 

D D

2

max j.x 

x 2 Πa;b 

. b  a /nC1

2  4n

.nC1/

.t1

// : : : .x 

.nC1/

.tnC1 / /j

:

das auch noch bei anderen mathematischen Problemen zur Anwendung kommt

(1.26) (1.27)

17

Abschnitt 1.6 Tschebyscheff-Polynome

Beweis. Die Identität (1.27) ergibt sich folgendermaßen, .nC1/

max j.x 

D D

nC1

. b 2 a /

.t1

max

t 2 Π1;1  nC1 1

. b 2 a /

D

.tnC1 / /j .nC1/

max j. .t/ 

t 2Π1;1 

./

.nC1/

// : : : .x 

.t1

x2Πa;b 

2n

D

.nC1/

/ / : : : . .t/ 

. tnC1 / /j

.nC1/

.nC1/

j.t  t1

/ : : : . t  tnC1 /j

. b  a /nC1 ; 2  4n

wobei man die Identität . / aus Theorem 1.24 erhält. Die Ungleichung “” in (1.26) ist offensichtlich richtig, und zum Beweis der Ungleichung “” in (1.26) seien nun x0 ; x1 ; : : : ; xn 2 Œ a; b  beliebig. Dann gibt es eindeutig bestimmte Zahlen y0 ; y1 ; : : : ; yn 2 Œ 1; 1  mit .yj / D xj für j D 0; 1; : : : ; n, und wie im ersten Teil des Beweises erhält man max j.x  x0 / : : : .x  xn /j

x 2 Πa;b 

D D ./



max

t 2 Π1;1 

. b 2 a /

j . .t/ 

nC1

.y0 / / : : : . .t/ 

max

t 2 Π1;1 

.yn / / j

j.t  y0 / : : : .t  yn /j

. b  a /nC1 ; 2  4n

wobei sich die Ungleichung . / erneut mit Theorem 1.24 ergibt. Abschließend werden in Bild 1.2 anhand einer Beispielfunktion die interpolierenden Polynome für gleichabständige und für “optimal” gewählte Stützstellen dargestellt.

1.846

1.000

1.636

0.899

1.426

0.799

1.216

0.698

1.006

0.598

0.796

0.497

0.586

0.397

0.376

0.296

0.165

0.196

-0.045

0.095

-0.255

-0.005 -5

-4

-3

-2

-1

0

1

2

3

4

5

-5

-4

-3

-2

-1

0

1

2

3

4

Bild 1.2: ( Klassisches Beispiel von Runge ) Interpolation der Funktion f . x / D 1=. 1Cx 2 /; x 2 Œ 5; 5  ( gestrichelt ) für äquidistante Stützstellen ( links ) beziehungsweise solchen Stützstellen, die sich aus linear transformierten Tschebyscheff-Nullstellen (rechts) ergeben; es ist n D 6. Man beachte die unterschiedlichen Skalierungen in den beiden Teilabbildungen links und rechts.

5

18

Kapitel 1

Polynominterpolation

Weitere Themen und Literaturhinweise Thematisch eng verwandt ist die Hermite-Interpolation ( Aufgabe 1.3 ), die beispielsweise in Deuflhard / Hohmann [22], Mennicken / Wagenführer [71], Opfer [79], Schaback / Wendland [92], Schwarz / Klöckner [94], Freund / Hoppe [31], Weller [110] und in Werner [111] eingehend behandelt wird. Thematisch ebenfalls verwandt ist die rationale Interpolation, die beispielsweise in [71], [94], [31] und in [110] vorgestellt wird. Die Spline-Interpolation und die trigonometrische Interpolation sind Gegenstand der beiden folgenden Kapitel, und spezielle Darstellungen für die ( vektorwertige ) Polynominterpolation bezüglich äqudistanter Stützstellen sind in Abschnitt 8.3 angegeben.

Übungsaufgaben Aufgabe 1.1. Für drei gegebene Funktionen f; g; h W R N  D ! R und einen Häufungspunkt x  2 RN von D zeige man Folgendes: (a) f .x/ D O . g.x/ / für D 3 x ! x  (b) (c) (d) (e)

f .x/ D O. g.x/ / für D 3 x ! x  . f .x/ D O. g.x/ /; g.x/ D O. h.x/ / für D 3 x ! x  ) f .x/ D O. h.x/ / für D 3 x ! x  . f .x/ D O . 1 / für D 3 x ! x  ” f .x/ ! 0 für D 3 x ! x  . O. f .x/ / O . g.x/ / D O . . f g /.x/ / für D 3 x ! x  . O. O . f .x/ / / D O . O. f .x/ / / D O . f .x/ / für D 3 x ! x  . )

Aufgabe 1.2. Man zeige Folgendes: für gegebene paarweise verschiedene Stützstellen x0 ; x1 ; : : : ; xn 2 R ist die Abbildung R nC1 ! …n ; . f0 ; f1 ; : : : ; fn />  P ( wobei P das jeweilige Interpolationspolynom gemäß (1.1) bezeichnet ) linear. Aufgabe 1.3. ( Hermite-Interpolation ) Man zeige: zu paarweise verschiedenen reellen Zahlen Pr j D0 m j D n C 1

x0 ; x1 ; : : : ; xr sowie nichtnegativen ganzen Zahlen m0 ; m1 ; : : : ; mr 2 N0 mit . /

und vorgegebenen Zahlen fj 2 R für  D 0; 1; : : : ; mj  1 und j D 0; 1; : : : ; r existiert genau ein Polynom P 2 …n mit ./

P ./ .xj / D fj

für

 D 0; 1; : : : ; mj  1; j D 0; 1; : : : ; r:

Aufgabe 1.4. Zu paarweise verschiedenen reellen Zahlen x0 ; x1 ; : : : ; xn weise man für die zugehörigen lagrangeschen Basispolynome Folgendes nach: (a)

n X

Lk .x/  1;

kD0

(b)

n X kD0

´ Lk .0/ xks

D

1 0

.1/n x0 x1    xn

für s D 0; für 1  s  n; für s D n C 1:

Aufgabe 1.5. Zu den drei Stützpunkten .xj ; tan 2 .xj // für j D 0; 1; 2 mit den Stützstellen x0 D =6; x1 D =4 und x2 D =3 berechne man unter Verwendung des Schemas von Neville das zugehörige Interpolationspolynom.

19

Übungsaufgaben

Aufgabe 1.6. Zu gegebenen paarweise verschiedenen Stützstellen x0 ; x1 ; : : : ; xn 2 R und Stützwerten f0 ; f1 ; : : : ; fn 2 R weise man für die zugehörigen dividierten Differenzen Folgendes nach, n n X Y f Œ x0 ; : : : ; xn  D fj = .xj  xs /: j D0

sD0 s¤j

Aufgabe 1.7. Seien .x0 ; f0 /; .x1 ; f1 /; : : : ; .xn ; fn / 2 R 2 und .y0 ; g0 /; .y1 ; g1 /; : : : ; .yn ; gn / 2 R2 Stützpunkte mit zugehörigen dividierten Differenzen f Œ x0 ; : : : ; xn  und gŒ y0 ; : : : ; yn . Man zeige: Wenn ¹ . xj ; fj /; j D 0; 1; : : : ; n º D ¹ . yj ; gj /; j D 0; 1; : : : ; n º erfüllt ist, so gilt f Œ x0 ; : : : ; xn  D g Œ y0 ; : : : ; yn : Aufgabe 1.8. Man bestimme in der newtonschen Darstellung das Interpolationspolynom zu den folgenden Stützpunkten:

j xj fj

0

1

2

3

4

5

2

1

0

1

17

8

21

42

35

Im Folgenden bezeichnet C Œ a; b  die Menge der stetigen Funktionen f W Œ a; b  ! R, und für r D 1; 2; : : : bezeichnet C r Œ a; b  die Menge der r -fach stetig differenzierbaren Funktionen f W Œ a; b  ! R. Aufgabe 1.9. Man zeige, dass es zu jeder Funktion f 2 C Œ a; b  und paarweise verschiedenen Stützstellen x0 ; x1 ; : : : ; xn 2 Œ a; b  sowie für " > 0 ein Polynom P gibt mit max jP .x/  f .x/j

x 2 Πa;b 



P .xj / D f .xj /

";

für j D 0; 1; : : : ; n:

Aufgabe 1.10. Seien '0 ; '1 ; : : : ; 'n W C Πa; b  ! R lineare Funktionale und V  C Πa; b  ein .n C 1/-dimensionaler linearer Teilraum. (a) Man zeige, dass die verallgemeinerte Interpolationsaufgabe bestimme v 2 V

mit 'j .v/ D 'j .f /

für j D 0; 1; : : : ; n

(1.28)

genau dann für jedes f 2 C Œ a; b  eindeutig lösbar ist, wenn die Funktion f D 0 nur v D 0 als verallgemeinerte Interpolierende besitzt. (b) Sei die verallgemeinerte Interpolationsaufgabe (1.28) für jede Funktion f 2 C Œ a; b  eindeutig lösbar und Ln W C Œ a; b  ! V der zugehörige Interpolationsoperator, das heißt, Ln f D v . Man weise nach, dass Ln eine lineare Abbildung ist und für f 2 C Œ a; b  gilt

Ln f D f

f 2 V:



Aufgabe 1.11. Für paarweise verschiedene Stützstellen x0 ; x1 ; : : : ; xn 2 Œ a; b  bezeichne Ln W C Œ a; b  ! …n den “Polynominterpolations-Operator”, das heißt,

.Ln f /.xj / D f .xj /

für j D 0; 1; : : : ; n

. f 2 C Πa; b  /:

Man weise Folgendes nach:

®

sup jj Ln f jj1 W f 2 C Πa; b ; jj f jj1 D 1

wobei jj

¯

² D

max x2Πa;b 

n Y n X j D0 sD0 s¤j

³ xx j x  xs j ; s j

jj1 WD max¹ j .x/j W x 2 Œ a; b  º die Maximumnorm bezeichnet.

20

Kapitel 1

Polynominterpolation

Aufgabe 1.12. Die Tschebyscheff-Polynome der zweiten Art Un 2 …n sind definiert durch

U0 .x/ WD 1;

U1 .x/ WD 2x;

(a) Man zeige Un . cos # / D

UnC1 WD 2xUn .x/  Un1 .x/;

sin . . n C 1 /# / für sin #

n D 1; 2; : : : :

# 2 .0; /; n D 0; 1; : : : .

(b) Für n D 0; 1; : : : berechne man die beiden Werte Un .1/ und Un .1/.

(c) Man zeige Tn0 .x/ D nUn1 .x/ für x 2 Œ 1; 1 ; n D 1; 2; : : : .

Aufgabe 1.13 ( Numerische Aufgabe ). Mit einem Polynom vom Grad  n interpoliere man die Funktion f .x/ WD 1=. 25x 2 C 1 /; x 2 Π1; 1 ; 

in äquidistanten Punkten xj D 1 C 2j=n;



in den Nullstellen tj;nC1 ; j D 1; 2; : : : ; n C 1 des .n C 1/-ten Tschebyscheff-Polynoms TnC1 .

j D 0; 1; : : : ; n,

Man wähle hierbei n D 10 und erstelle jeweils einen Ausdruck des Funktionsverlaufs.

2

Splinefunktionen

2.1 Einführende Bemerkungen Bei der Polynominterpolation auf äquidistanten Gittern stellt sich mit wachsender Stützstellenzahl typischerweise ein oszillierendes Verhalten ein. Dies wird bei der in dem vorliegenden Abschnitt betrachteten Interpolation mittels Splinefunktionen vermieden. Für deren Einführung sei

 D

®

a D x 0 < x1 < : : : < x N D b

¯

(2.1)

eine fest gewählte Zerlegung des Intervalls Œ a; b , wobei man die Stützstellen x0 ; x1 ; : : : ; xN aus historischen Gründen auch als Knoten bezeichnet. Definition 2.1. Eine Splinefunktion der Ordnung ` 2 N zur Zerlegung  ist eine Funktion s 2 C `1 Œ a; b , die auf jedem Intervall Œ xj 1 ; xj  mit einem Polynom `-ten Grades übereinstimmt. Der Raum dieser Splinefunktionen wird mit S;` bezeichnet, es gilt also

S;` D

®

s 2 C `1 Πa; b  W sjΠxj 1 ;xj  D pj jΠxj 1 ;xj 

für ein pj 2 …`

¯ .j D 1; : : : ; N / :

Anstelle Splinefunktion wird oft auch die Kurzbezeichnung Spline verwendet.

Bemerkung 2.2. Es ist offensichtlich S;` mit den üblichen Verknüpfungen ein linearer Raum. Für dessen Dimension gilt dim S;` D N C `, wie durch Abzählen der M Freiheitsgrade intuitiv klar wird. In Bild 2.1 und Bild 2.2 sind Beispiele für lineare sowie quadratische Splines angegeben.

6

6 ...... .... ... ... .... .. ... ... ....... ..................... ... ... . ........... ....... . . . ... ....... ...... ......... ....... ... ................ ... ............ ................ ......

0

-

a D x0 x1 x2 x3

x4 x5 D b

0

...................... ........ ... ...... .. ..... ........... .. ...... ..... ............ ... ..... .. . .... . ... . . .. ... ... .. ... ... .. .... ... . ... . . .. ... ... . . . . .... ..... . . . . ...... . .....................

-

a D x0 x1 x2 x3

x4 x5 D b

Bild 2.1: Ein linearer Spline auf Πa; b  Bild 2.2: Ein quadratischer Spline auf Πa; b 

22

Kapitel 2

Splinefunktionen

Im Folgenden werden für interpolierende Splinefunktionen der Ordnung ` D 1 ( lineare Splines genannt ) und Splinefunktionen der Ordnung ` D 3 ( kubische Splines ) Algorithmen zur Berechnung sowie Fehlerabschätzungen hergeleitet. Splines der Ordnung ` D 2 ( quadratische Splines ) spielen in der Praxis eine geringere Rolle und werden hier nicht behandelt.

2.2 Interpolierende lineare Splinefunktionen 2.2.1 Die Berechnung interpolierender linearer Splinefunktionen Thema dieses Abschnitts ist die Berechnung linearer Splinefunktionen s 2 S;1 mit der Interpolationseigenschaft

s.xj / D fj

für j D 0; 1; : : : ; N;

(2.2)

wobei die Werte f0 ; f1 ; : : : ; fN 2 R vorgegeben sind. Für jeden Index j 2 ¹ 0; 1; : : : ; N  1 º besitzt eine solche Funktion s auf dem Intervall Œ xj ; xj C1  die lokale Darstellung

s.x/ D aj C bj .x  xj /

für x 2 Œ xj ; xj C1 ;

(2.3)

und die Interpolationsbedingungen sj .xj / D fj und sj .xj C1 / D fj C1 ergeben unmittelbar

aj D fj ;

fj C1  fj

bj D x : j C1  xj

(2.4)

Die Interpolationsbedingungen legen die Koeffizienten in dem allgemeinen Ansatz (2.3) in eindeutiger Weise fest und liefern den interpolierenden linearen Spline. Als Folgerung erhält man: Theorem 2.3. ( Existenz und Eindeutigkeit des interpolierenden linearen Splines ) Zu der Zerlegung  D ¹ a D x0 < x1 < : : : < xN D b º und Werten f0 ; f1 ; : : : ; fN 2 R gibt es genau einen linearen Spline s 2 S;1 mit der Interpolationseigenschaft (2.2). Er besitzt die lokale Darstellung (2.3)–(2.4). Mit der Notation

jjujj1 WD

max ju.x/j;

x 2 Πa;b 

u 2 C Πa; b ;

gilt für den Fehler bei der linearen Spline-Interpolation Folgendes: Theorem 2.4. Zu einer Funktion f 2 C 2 Œ a; b  sei s 2 S;1 der zugehörige interpolierende lineare Spline ( siehe (2.2) ). Dann gilt

jjs  f jj1 

1 jjf 00 jj1 h2max 8

mit hmax WD

max

¹ xj C1  xj º:

j D0;:::;N 1

23

Abschnitt 2.3 Minimaleigenschaften kubischer Splinefunktionen

Beweis. Für jeden Index j 2 ¹ 1; 2; : : : ; N º stimmt die Splinefunktion s auf dem Intervall Œ xj 1 ; xj  mit demjenigen Polynom P 2 …1 überein, für das P .xj 1/ D f .xj 1 / und P .xj / D f .xj / gilt, und Theorem 1.17 über den Fehler bei der Polynominterpolation liefert dann . x  xj 1 /. xj  x /

js.x/  f .x/j 

2

h2max



8

max

 2 Πxj 1 ;xj 

jjf 00 jj1

jf 00 ./j

für x 2 Œ xj 1 ; xj :

Daraus folgt die angegebene Fehlerabschätzung. Bemerkung 2.5. Die wesentliche Aussage in Theorem 2.4 stellt jjs f jj1 D O. h2max / dar. M

2.3 Minimaleigenschaften kubischer Splinefunktionen Im weiteren Verlauf wird die Interpolation mittels kubischer Splinefunktionen behandelt. Vor Behandlung der zugehörigen grundlegenden Themen wie Existenz, Eindeutigkeit, Berechnung und auftretender Fehler wird im vorliegenden Abschnitt zunächst eine für die Anwendungen wichtige Minimaleigenschaft interpolierender kubischer Splines vorgestellt ( siehe Korollar 2.8 unten ). Hierzu bezeichne im Folgenden

jjujj2 WD

Z

b a

ju.x/j2 dx

1=2

;

u 2 C Πa; b :

Lemma 2.6 (Holladay). Wenn eine Funktion f 2 C 2 Œ a; b  und eine kubische Splinefunktion s 2 S;3 in den Knoten übereinstimmen,

s.xj / D f .xj /

für j D 0; 1; : : : ; N;

(2.5)

so gilt

jjf 00  s 00 jj22 D jjf 00 jj22  jjs 00 jj22  2. Πf 0  s 0 s 00 /.x/ jxDa : xDb

(2.6)

Beweis. Nach Definition von jj  jj2 gilt

jjf 00  s 00 jj22 D

Z b a

jf 00 .x/  s 00 .x/j2 dx D jjf 00 jj22  2

D jjf 00 jj22  2

Z b a

Z b a

. f 00 s 00 /.x/ dx C jjs 00 jj22

. Πf 00  s 00 s 00 /.x/ dx  jjs 00 jj22 ;

(2.7)

24

Kapitel 2

Splinefunktionen

so dass man sich noch speziell mit dem mittleren Ausdruck in (2.7) zu befassen hat. Für j D 1; 2; : : : ; N liefert partielle Integration Z x j

xj 1

D

. Πf 00  s 00 s 00 /.x/ dx

.Πf 0

ˇxDxj  s 0 s 00 /.x/ ˇ

xDxj 1

Z x j xj 1

.Πf 0

 s 0 s 000 /.x/ dx xDx 0

 . Œ f  s s 000 /.x/ jxDxjj 1 C0 „ ƒ‚ … D 0

......

D



C

Z x j

xj 1



. Œ f  s s .4/ /.x/ dx; ƒ‚ … D 0

wobei der vorletzte Term aufgrund der Identität (2.5) verschwindet, und das letzte Integral verschwindet, da s .4/  0 auf den Teilintervallen .xj 1 ; xj / gilt. Das Symbol ........ wird als Unterführungszeichen verwendet, es fungiert also als Platzhalter für den darüber stehenden Ausdruck. Anschließende Summation über j D 1; 2; : : : ; N liefert aufgrund der Stetigkeit der Funktionen f 0 ; s 0 ; s 00 auf dem Intervall Œ a; b  die folgende Teleskopsumme und damit die Aussage des Lemmas, Z b a

N X

. Πf 00  s 00 s 00 /.x/ dx D

®

.Πf 0

 s 0 s 00 /.xj / 

.Πf 0

 s 0 s 00 /.xj 1 /

¯

j D1

.Πf 0

D

 s 0 s 00 /.b/ 

.Πf 0

 s 0 s 00 /.a/:

Unter gewissen zusätzlichen Bedingungen vereinfacht sich die Aussage von Lemma 2.6: Theorem 2.7. Gegeben seien eine Funktion f 2 C 2 Œ a; b  und ein kubischer Spline s 2 S;3 , die in den Knoten übereinstimmen, vergleiche (2.5). Dann gilt die Identität

jjf 00 jj22  jjs 00 jj22 D jjf 00  s 00 jj22 ;

(2.8)

sofern eine der drei folgenden Bedingungen erfüllt ist: (a)

s 00 .a/ D s 00 .b/ D 0;

(b)

s 0 .a/ D f 0 .a/;

s 0 .b/ D f 0 .b/;

(c)

f 0 .a/ D f 0 .b/;

s 0 .a/ D s 0 .b/;

s 00 .a/ D s 00 .b/. xDb

Beweis. In jedem der Fälle (a)–(c) verschwindet in (2.6) der Term . Œ f 0 s 0 s 00 /.x/ jxDa ; und die Identität (2.6) geht dann über in die Identität (2.8). Korollar 2.8. Zu gegebenen Werten f0 ; f1 ; : : : ; fN 2 R hat ein interpolierender kubischer Spline s 2 S;3 mit s 00 .a/ D s 00 .b/ D 0 unter allen hinreichend glatten interpolierenden Funktionen die geringste Krümmung, es gilt also

jjs 00 jj2  jjf 00 jj2 für jede Funktion f 2 C 2 Œ a; b  mit f .xj / D fj für j D 0; 1; : : : ; N .

25

Abschnitt 2.4 Die Berechnung interpolierender kubischer Splinefunktionen

Beweis. Die angegebene Abschätzung ergibt sich unmittelbar aus Theorem 2.7 für Splines mit der Eigenschaft (a) dort. Die in Korollar 2.8 angegebene Abschätzung gilt mit den entsprechenden Modifikationen in den zugehörigen Voraussetzungen auch für solche kubischen Splines, die den Bedingungen (b) oder (c) in Theorem 2.7 genügen. Bemerkung 2.9. (1) Man weist über die Eigenschaft (2.8) leicht nach, dass jede der Bedingungen (a), (b) oder (c) in Theorem 2.7 die Eindeutigkeit des interpolierenden kubischen Splines impliziert ( Aufgabe 2.3 ). (2) Es stellt jjf 00 jj2 lediglich eine Approximation an die mittlere Krümmung der Funktion f dar. Genauer ist die Krümmung von f in einem Punkt x gegeben durch f 00 .x/=. 1 C f 0 .x/2 /3=2 : (3) Die in Korollar 2.8 vorgestellte Minimaleigenschaft stellt den Grund dafür dar, dass in der Praxis ( beispielsweise bei der Konstruktion von Schiffsrümpfen oder der Festlegung von Schienenwegen ) für die Interpolation oftmals kubische SplinefunkM tionen verwendet werden. In Bild 2.3 ist eine kubische Splinefunktion dargestellt.

6

0

....... ....... ......... ... ... ... ... ... ... ... . ... . .. ... . . ... .. . . ... .. . ... . .. ... . . ... ... . ... ... ... . .. ... . . ... ... . . ... . . ... . . . . .... . . . . . . ...... ....... .............................................................. ........................... .... ........

-

a D x0

x1

x2

x3 D b

Bild 2.3: Ein kubischer Spline auf Πa; b  zu den Knoten a D x0 < x1 < x2 < x3 D b

2.4 Die Berechnung interpolierender kubischer Splinefunktionen 2.4.1 Vorüberlegungen In dem vorliegenden Abschnitt wird die Berechnung interpolierender kubischer Splines behandelt. Ausgehend von dem lokalen Ansatz

s.x/ D aj C bj .x  xj / C cj .x  xj /2 C dj .x  xj /3 für x 2 Œ xj ; xj C1 ;

j D 0; 1; : : : ; N  1;

μ (2.9)

26

Kapitel 2

Splinefunktionen

für eine Funktion s W Œ a; b  ! R soll in diesem Abschnitt die Frage behandelt werden, wie man die Koeffizienten aj ; bj ; cj und dj für j D 0; 1; : : : ; N  1 zu wählen hat, damit die Funktion s auf dem Intervall Œ a; b  zweimal stetig differenzierbar ist1 und darüber hinaus in den Knoten vorgegebene Werte f0 ; f1 ; : : : ; fN 2 R interpoliert,

s.xj / D fj

für j D 0; 1; : : : ; N:

(2.10)

Das nachfolgende Lemma reduziert das genannte Problem auf die Lösung eines linearen Gleichungssystems, wobei die folgende Notation verwendet wird,

hj WD xj C1  xj

für j D 0; 1; : : : ; N  1:

(2.11)

00 2 R den folgenden N  1 gekopLemma 2.10. Falls N C 1 reelle Zahlen s000 ; s100 ; : : : ; sN pelten Gleichungen

DW gj …„

‚ hj 1 sj001

C 2.hj 1 C

hj /sj00

C

hj sj00C1

D

fj C1  fj 6 hj



ƒ

fj  fj 1 6 hj 1

(2.12)

für j D 0; 1; : : : ; N  1 genügen, so liefert der lokale Ansatz (2.9) mit den Setzungen

cj

WD

bj

WD

sj00

; 2

aj WD fj ;

fj C 1  f j hj



hj 6

sj00C1  sj00

dj WD

6hj

;

(2.13)

.sj00C1 C 2sj00 /;

(2.14)

für j D 0; 1; : : : ; N  1 eine kubische Splinefunktion s 2 S;3 , die die Interpolationsbedingungen (2.10) erfüllt. Beweis. Mit den Notationen

pj .x/ D aj C bj .x  xj / C cj .x  xj /2 C dj .x  xj /3 2 …3 . j D 0; 1; : : : ; N  1 / erhält man für j D 0; 1; : : : ; N  1 die folgenden Identitäten,

pj .xj / D aj D fj ; pj00C1 .xj C1 /

D 2cj C1 D sj00C1 D sj00 C 6dj hj D pj00 .xj C1 /

.j  N  2/

beziehungsweise

pj .xj C1 / D aj C bj hj C cj h2j C dj h3j D fj 1

......

und somit tatsächlich ein kubischer Spline ist

sj00 2

h2j C

sj00C1  sj00 6

h2j

./

D

fj C1 ;

27

Abschnitt 2.4 Die Berechnung interpolierender kubischer Splinefunktionen

wobei die Identität . / eine Folgerung aus (2.14) darstellt. Die Stetigkeit der ersten Ableitung s 0 erhält man so,

pj0 1 .xj / D bj 1 C 2cj 1 hj 1 C 3dj 1 h2j 1

./

D

bj D pj0 .xj /

.j D 1; 2; : : : ; N  1/; wobei . / aus den Setzungen (2.13)–(2.14) und aus (2.12) resultiert. Bemerkung 2.11. (1) In der in Lemma 2.10 beschriebenen Situation bezeichnet man 00 2 R als Momente. Diese stimmen mit den die N C 1 reellen Zahlen s000 ; s100 ; : : : ; sN zweiten Ableitungen der Splinefunktion s in den Knoten xj überein,

sj00 D s 00 .xj /

für j D 0; 1; : : : ; N:

(2) Mit Lemma 2.10 wird klar, dass sich die Koeffizienten in der Darstellung (2.9) 00 ergeben. Diese N C 1 Momente unmittelbar aus den N C 1 Momenten s000 ; : : : ; sN genügen den N  1 Bedingungen dieses Lemmas, womit also zwei Freiheitsgrade vorliegen. Aufgrund der Bedingungen (a)–(c) in Theorem 2.7 werden noch drei Möglichkeiten diskutiert, wofür abkürzend

s00 WD s 0 .x0 /;

0 sN WD s 0 .xN /

gesetzt wird: Natürliche Randbedingungen W

00 s000 D sN D 0I

Vollständige Randbedingungen W

0 s00 D f00 ; sN D fN0 für gegebene f00 ; fN0 2 R I

Periodische Randbedingungen W

0 s00 D sN ;

00 s000 D sN :

Die Bezeichnung “natürliche Randbedingung” ist durch Korollar 2.8 gerechtfertigt. (3) Division von (2.12) durch 3.hj 1 C hj / führt auf die äquivalente Gleichung hj 1 s 00 3. hj 1 C hj / j 1

C D

2 00 s 3 j

2

C

hj s 00 3. hj 1 C hj / j C1

fj C 1  f j hj . hj 1 C hj /

 2

fj  fj 1 ; hj 1 . hj 1 C hj /

(2.15)

bei der die linke Seite eine Approximation an sj00 und die rechte Seite eine Differenzenapproximation an f 00 .xj / darstellt. Mehr hierzu finden Sie im Beweis von Lemma 2.15. M In den folgenden Unterabschnitten 2.4.2–2.4.4 sollen die Bedingungen (2.12) für die Momente zusammen mit den unterschiedlichen Randbedingungen in Matrix-VektorForm angegeben werden.

28

Kapitel 2

Splinefunktionen

2.4.2 Natürliche Randbedingungen 00 D 0 führen zusammen mit (2.12) auf das Die natürlichen Randbedingungen s000 D sN folgende Gleichungssystem:

0

1

B 2.h0 C h1 / h1 B B B B B B B B B B B @

0

h1 2.h1 C h2 / h2

:::

0

::

:

:: :

0

h2

::

:

::

:

0

:: :

::

::

:

::

:

hN 2

0

:::

:

C C0 1 0 1 C C s100 g1 CB C C B CB : C B C C B :: C D B ::: C : CB C B C C@ A @ A C C s 00 gN 1 C N 1 A

0 hN 2 2.hN 2 C hN 1 /

2.4.3 Vollständige Randbedingungen Die vollständigen Randbedingungen Š

f00

D

s00 D b0 ;

fN0

0 D sN D bN 1 C 2cN 1hN 1 C 3dN 1 h2N 1

Š

führen mit (2.13)–(2.14) auf die beiden zusätzlichen Bedingungen 2h0 s000 C h0 s100

D 6f00 C 6

f 1  f0 h0

00 00 hN 1 sN 1 C 2hN 1 sN

D 6fN0  6

fN  fN 1 hN 1

DW g0 ; DW gN :

(2.16) (2.17)

Diese Bedingungen (2.16)–(2.17) führen zusammen mit (2.12) auf das folgende Gleichungssystem:

0 h0 0 B 2h0 B B B h0 2.h0 C h1 / h1 B B :: B : h1 B 0 B B : :: :: B :: : : B B B :: :: B : : B @ 0 ::: :::

1 :::

:::

0

:

::

:

:: : :: :

:

::

:

0

::

:

:: :: ::

: 2.hN 2 C hN 1 / hN 1

0

hN 1

2hN 1

C C C C0 1 0 1 C C s000 g CB C B 0C CB : C B : C C B :: C D B :: C : CB C B C C@ A @ A C C s 00 gN C N C C A

(2.18)

29

Abschnitt 2.4 Die Berechnung interpolierender kubischer Splinefunktionen

2.4.4 Periodische Randbedingungen Die periodischen Randbedingungen Š

0 b0 D s00 D sN D bN 1 C 2cN 1 hN 1 C 3dN 1 h2N 1 ; Š

00 s000 D sN

führen mit (2.13)–(2.14) auf die zusätzliche Bedingung 00 2.hN 1 C h0 /s000 C h0 s100 C hN 1 sN 1 D 6

f 1  f0 h0

6

f N  f N 1 hN 1

DW g0 : (2.19)

Diese Bedingung (2.19) führt zusammen mit (2.12) auf das folgende Gleichungssystem:

0

1

B 2.hN 1 C h0 / B B B B B B B B B B B B B B B @

h0

:::

0

h0 2.h0 C h1 / h1 0

:: :

::

:

::

:

::

:

::

:

:: :

:

::

:

::

:

::

:

0

::

:

::

:

::

:

hN 2

0

:::

C C C C0 1 0 1 C C g0 s000 C B C CB B C CB : C C B :: C D B ::: C : C B C CB C@ A @ A C C s 00 gN 1 C N 1 C C A

0

h1

0

hN 1

::

hN 1

0

0 hN 2 2.hN 2 C hN 1 /

2.4.5 Existenz und Eindeutigkeit der betrachteten interpolierenden kubischen Splines Für den Beweis der Existenz- und Eindeutigkeitsaussage für interpolierende kubische Splines wird das nachfolgende Lemma benötigt. Es wird hier in der nötigen Allgemeinheit formuliert wird, so dass es nochmals im Beweis des wichtigen Lemmas 2.15 angewandt werden kann. Vorbereitend wird die folgende Notation eingeführt,

jjz jj1 WD

max

j D1;:::;N

jzj j;

z 2 RN :

Definition 2.12. Eine Matrix A D .ajk / 2 R N N heißt strikt diagonaldominant, falls Folgendes gilt, N X

jajk j < jajj j

für j D 1; 2; : : : ; N:

kD1 k¤j

Lemma 2.13. Jede strikt diagonaldominante Matrix A D . ajk / 2 R N N ist regulär und es gilt

jjx jj1 

max

j D1;:::;N

°

jajj j 

N X kD1 k¤j

jajk j

1 ±

jjAx jj1

für x 2 R N :

(2.20)

30

Kapitel 2

Splinefunktionen

Beweis. Für den Vektor x 2 R N sei der Index j 2 ¹ 1; 2; : : : ; N º so gewählt, dass jxj j D jjx jj1 gilt. Dann berechnet man N ˇ X ˇ jjAx jj1  j.Ax /j j D ˇ ajk xk ˇ

N X

jajj jjxj j 



kD1

 jajj jjxj j 

N X

jajk jjjx jj1 D



jajk jjxk j

kD1 k¤j

kD1 k¤j

 jajk j jjx jj1

N X

jajj j 

kD1 k¤j

beziehungsweise

jjx jj1 



jajj j 

N X

jajk j

 1

jjAx jj1 ;

kD1 k¤j

was die Ungleichung (2.20) nach sich zieht. Die Regularität der Matrix A folgt umgehend aus dieser Abschätzung (2.20). Offensichtlich ist jede der in den drei Abschnitten 2.4.2–2.4.4 betrachteten Matrizen strikt diagonaldominant. Als unmittelbare Folgerung aus dieser Beobachtung sowie den Lemmata 2.10 und 2.13 erhält man Folgendes: Korollar 2.14. Zur Zerlegung  und den Werten f0 ; f1 ; : : : ; fN 2 R gibt es jeweils genau einen interpolierenden kubischen Spline mit natürlichen beziehungsweise vollständigen ( hier sind zusätzlich Zahlen f00 ; fN0 2 R vorgegeben ) beziehungsweise periodischen Randbedingungen.

2.5 Fehlerabschätzungen für interpolierende kubische Splines Das folgende Lemma liefert eine Abschätzung für die Differenz der Momente von s und f in den Knoten xj . Dabei werden wegen der einfacheren Vorgehensweise nur kubische Splines mit natürlichen Randbedingungen betrachtet. Vergleichbare Aussagen lassen sich auch für kubische Splines mit vollständigen oder periodischen Randbedingungen nachweisen ( siehe beispielsweise Oevel [78], Mennicken / Wagenführer [71] und Freund / Hoppe [31] ). Lemma 2.15. Zu einer gegebenen Funktion f 2 C 4 Œ a; b  mit f 00 .a/ D f 00 .b/ D 0 bezeichne s 2 S;3 den interpolierenden kubischen Spline2 mit natürlichen Randbedingungen. Dann gilt max

j D1;:::;N 1

js 00 .xj /  f 00 .xj /j 

3 jjf .4/ jj1 h2max ; 4

mit hmax WD

2

max

¹ xj C1  xj º:

j D0;:::;N 1

zur Zerlegung  D ¹ a D x0 < : : : < xN D b º und den Stützwerten fj D f . xj / für j D 0; 1; : : : ; N

31

Abschnitt 2.5 Fehlerabschätzungen für interpolierende kubische Splines

Beweis. Die Darstellung (2.15) für die Momente bedeutet in Matrixschreibweise

0

1

s100 :: :

B@

0

b g1 :: :

A D @

00 sN 1

1 A;

(2.21)

b g N 1

g j die rechte Seite von (2.15) bezeichnet, und die Matrix B 2 R .N 1/.N 1/ wobei b besitzt die folgende Form, 1

0 2 3

h1 3.h0 C h1 /

B B B B B h1 2 B B 3. h1 C h2 / 3 B B B :: B : 0 B B B WD B B :: :: B : : B B B B :: B : B B B @ 0 :::

0

:::

h2

::

:

3. h1 C h2 /

:::

::

:

::

:

::

:

::

:

::

:

::

:

::

:

hN 3

2 3

3. hN 3 C hN 2 /

:::

hN 2

0

C C C C :: C C : C C C C :: C : C C; C C C 0 C C C C hN 2 C C 3. hN 3 C hN 2 / C C A 2 0

3. hN 2 C hN 1 /

3

mit der Notation hj D xj C1  xj . Im Folgenden werden die Abbildungseigenschaften der Matrix B sowie die rechte Seite des Gleichungssystems (2.21) eingehender untersucht. 1. Durch Taylorentwicklung der Funktion f 00 um den Punkt xj erhält man die folgenden Darstellungen,

f 00 .xj 1 / D f 00 .xj /  hj 1 f .3/ .xj / C f 00 .xj C1 / D f 00 .xj / C hj f .3/ .xj / C

h2j 2

h2j 1 2

f .4/ . j /;

f .4/ .b  j /;

(2.22) (2.23)

 j . Die Gleichung (2.22) wird dann mit dem mit geeigneten Zwischenstellen j und b Faktor hj 1 =. 3.hj 1 C hj // und die Gleichung (2.23) mit dem Faktor hj =. 3. hj 1 C hj // multipliziert. Die beiden Ergebnisse werden anschließend addiert und resultieren in der folgenden Approximation an die zweite Ableitung f 00 .xj /, hj 1 3. hj 1 C hj /

f 00 .xj 1 / C

2 00 f .xj / 3

C

hj 3. hj 1 C hj /

f 00 .xj C1 /

D f 00 .xj / C Rj C ıj ; Rj WD ıj WD

1 .hj 3

 hj 1 /f .3/ .xj /;

1 6. hj 1 C hj /

. h3j 1 f .4/ . j /

C h3j f .4/ .b  j / /;

j D 1; 2; : : : ; N  1;

32

Kapitel 2

Splinefunktionen

beziehungsweise in Matrixschreibweise

0

1

f 00 .x1 / :: :

B@ f

00 .x

0

A D @

N 1 /

1

f 00 .x1 / :: : f

0

A C @

00 .x N 1 /

1

R1 :: :

0

A C @

RN 1

1

ı1 :: :

A:

(2.24)

ıN 1

2. Weiter ergibt eine Taylorentwicklung der Funktion f um den Punkt xj die folgenden Darstellungen:

f .xj C1 / D f .xj / C hj f 0 .xj / C f .xj 1 / D f .xj /  hj 1 f 0 .xj / C

h2j 2

f 00 .xj / C

h2j 1 2

h3j 6

f .3/ .xj / C

h3j 1

f 00 .xj / 

6

h4j 24

f .3/ .xj / C

f .4/ . j /;

h4j 1 24

(2.25)

f .4/ .b j /; (2.26)

j 2 Œ a; b . Eine Multiplikation der Gleichung mit geeigneten Zwischenstellen j ; b (2.25) mit dem Faktor 2= hj sowie Multiplikation der Gleichung (2.26) mit dem Faktor 2= hj 1 und jeweils anschließende Auflösung nach Termen mit f .xj 1 /; f .xj / und f .xj C1 / führt auf die Gleichungen 2

2

f .xj C1/  f .xj / hj

D 2f 0 .xj / C hj f 00 .xj / C

f . xj /  f . xj 1 / hj 1

h2j 3

D 2f 0 .xj / C hj 1 f 00 .xj / 

f .3/ .xj / C h2j 1 3

h3j 12

f .4/ . j /;

f .3/ .xj / C

h3j 1 12

f .4/ .b j /;

und eine Addition dieser beiden Gleichungen sowie die anschließende Division durch hj 1 C hj resultiert in der folgenden Differenzenapproximation an die zweite Ableitung f 00 .xj /,

D b gj …„

‚ f j C1  f j 2 hj .hj 1 C hj /

ƒ

fj  fj 1 2 hj 1 .hj 1 C hj /



b ı j WD

D f 00 .xj / C Rj C b ıj ;

j D 1; : : : ; N  1;

1 12. hj 1 C hj /

C h3j 1 f .4/ .b j / /;

. h3j f .4/ . j /

beziehungsweise in Vektorschreibweise

0

f 00 .x1 / :: :

@ f

00 .x

N 1 /

1

0

A D @

b g1 :: :

1

0

A  @

b g N 1

1 b ı1 : C A  B @ :: A : b ı N 1 1

R1 :: : RN 1

0

(2.27)

Verwendung der Identität (2.27) auf der rechten Seite von (2.24) und anschließende Subtraktion des Resultats von der Gleichung (2.21) führt auf eine Fehlerdarstellung der Form

0 B@

f 00 .x1 /  s 00 .x1 / :: :

f 00 .xN 1/  s 00 .xN 1/

1

0

A D B @

ı1 ı1  b :: :

ıN 1  b ı N 1

1 C A:

33

Abschnitt 2.5 Fehlerabschätzungen für interpolierende kubische Splines

Die Matrix B ist offensichtlich strikt diagonaldominant und somit aufgrund von Lemma 2.13 regulär, und mehr noch erhält man mit der Identität 2 3



hj

hj C1



3. hj C hj C1 /

3. hj C hj C1 /

D

1 ; 3

j D 1; 2; : : : ; N  1;

die Abschätzung max

j D0;:::;N

® ¯ jf 00 .xj /  s 00 .xj /j  3 max jı1 j C jb ı1 j; : : : ; jıN 1 j C jb ı N 1 j 3 2 h jjf .4/ jj1 ; 4 max

 wobei in . / die Abschätzung

jıj j C jb ıj j 

3 3 1 hj 1 C hj 4 hj 1 C hj

jjf .4/ jj1 

1 2 h jjf .4/ jj1 ; 4 max

j D 1; 2; : : : ; N  1;

eingeht. Dies komplettiert den Beweis des Lemmas. Im folgenden Theorem werden die Approximationseigenschaften interpolierender kubischer Splines vorgestellt. Man beachte, dass die wesentliche Voraussetzung (2.28) für den Fehler der zweiten Ableitungen in den Knoten typischerweise erfüllt ist ( siehe Lemma 2.15 und die davor angestellten Bemerkungen ). Theorem 2.16. Sei f 2 C 4 Œ a; b , und sei s 2 S;3 ein interpolierender kubischer Spline3 . Weiter bezeichne hj D xj C1  xj für j D 0; 1; : : : ; N  1 und

hmax D

max

j D0;:::;N 1

hmin D

hj ;

min

j D0;:::;N 1

hj :

Falls max

j D0;:::;N

js 00 .xj /  f 00 .xj /j  C jjf .4/ jj1 h2max

erfüllt ist mit einer Konstanten C > 0, so gelten mit der Zahl c WD hhmax . C C min folgenden Abschätzungen für jedes x 2 Œ a; b :

1 4

/ die

cjjf .4/ jj1 h4max ;

(2.29)

js .x/  f .x/j  2

......

h3max ;

(2.30)

js 00 .x/  f 00 .x/j  2

......

h2max ;

(2.31)

js .3/ .x/  f .3/ .x/j  2

......

hmax

js.x/  f .x/j  0

wobei der Ausdruck 3

(2.28)

0

......

.x ¤ xj /;

(2.32)

hier jeweils für den Faktor cjjf .4/ jj1 steht.

zur Zerlegung  D ¹ a D x0 < : : : < xN D b º und den Stützwerten fj D f . xj / für j D 0; 1; : : : ; N

34

Kapitel 2

Splinefunktionen

Beweis. Man weist zunächst die Fehlerabschätzung (2.32) für die dritten Ableitungen nach. Per Definition ist s 00 auf jedem Intervall Œ xj ; xj C1  affin-linear, mithin gilt für j D 0; 1; : : : ; N  1

s .3/ .x/ 

s 00 .xj C1 /  s 00 .xj / hj

für xj < x < xj C1 :

(2.33)

Eine Taylorentwicklung von f 00 um den Punkt x 2 Πxj ; xj C1  liefert

f 00 .xj C1 / D f 00 .x/ C .xj C1  x/f .3/ .x/ C f 00 .xj / D f 00 .x/ C .xj  x/f .3/ .x/ C

. xj C1  x /2 2

. x  xj /2 2

f .4/ .˛j /;

f .4/ .ˇj /

mit gewissen Zwischenstellen ˛j ; ˇj 2 Œ xj ; xj C1 . Subtraktion der letzten beiden Gleichungen und anschließende Division durch hj liefert

f .3/ .x/ D

f 00 .xj C1 /  f 00 .xj / hj

. xj C1  x /2 .4/ f .˛j / 2hj



C

. x  xj /2 .4/ f .ˇj /; 2hj

(2.34)

und die Subtraktion “(2.33)–(2.34)” ergibt

s .3/ .x/  f .3/ .x/ D

s 00 . xj C1 /  f 00 . xj C1 / hj



s 00 . xj /  f 00 . xj / hj

C

. xj C1  x /2 f .4/ .˛j /  . x  xj /2 f .4/ .ˇj / 2hj

und somit

js .3/ .x/  f .3/ .x/j  jjf .4/ jj1 

hmax 2C hmin



.

1 min¹ h0 ; : : : ; hN 1

C

ƒ‚ D 2c

1 2

. C h2max º

C C h2max C

h2max 2

/

/ jjf .4/ jj1hmax ;



wobei eine Abschätzung der Form

.xj C1  x/2 C .x  xj /2 D .xj C1  xj /2  2.xj C1  x/.x  xj /  .xj C1  xj /2  h2max für x 2 Œ xj ; xj C1  eingeht. Die Fehlerabschätzung (2.32) für die dritten Ableitungen ist damit nachgewiesen. Die weiteren Fehlerabschätzungen ergeben sich nun durch Integration. Zur Abschätzung der zweiten Ableitungen (2.31) wählt man zu einer gegebenen Zahl x 2 Œ a; b  den nächstgelegenen Knoten xj , womit jx  xj j  hmax =2 gilt. Der Hauptsatz der Differenzial- und Integralrechnung liefert

s 00 .x/  f 00 .x/ D s 00 .xj /  f 00 .xj / C

Z x xj

s .3/ .y/  f .3/ .y/ dy

Weitere Themen und Literaturhinweise

35

und somit

js 00 .x/  f 00 .x/j  C jjf .4/ jj1 h2max C 2cjjf .4/ jj1 jx  xj jhmax  2cjjf .4/ jj1 h2max ; wobei noch die Eigenschaft hmax = hmin  1 beziehungsweise C  c verwendet wurde. Damit ist auch (2.31) für die zweiten Ableitungen nachgewiesen. Zur Abschätzung (2.30) der ersten Ableitungen beachte man, dass die Stützstellen a D x0 < x1 < : : : < xN D b Nullstellen der Funktion s  f sind und somit die Funktion s 0  f 0 in jedem Teilintervall Œ xj 1 ; xj  eine Nullstelle yj besitzt. Wählt man zu einem gegebenen Punkt x 2 Œ a; b  die nächstgelegene Nullstelle yj , so gilt jx  yj j  hmax , und der Hauptsatz der Differenzial- und Integralrechnung liefert

ˇZ js 0 .x/  f 0 .x/j D ˇ

x yj

ˇ s 00 .y/  f 00 .y/ dy ˇ  2cjjf .4/ jj1 h2max jx  yj j

 2cjjf .4/ jj1 h3max : Damit ist auch die Fehlerabschätzung (2.30) für die ersten Ableitungen nachgewiesen. Abschließend wird der Fehler s  f betrachtet. Für beliebiges x 2 Œ a; b  und den nächstgelegenen Knoten xj erhält man

ˇZ js.x/  f .x/j D ˇ

x xj

ˇ s 0 .y/  f 0 .y/ dy ˇ  2cjjf .4/ jj1 h3max jx  xj j

 cjjf .4/ jj1 h4max ; womit auch die Fehlerabschätzung (2.29) nachgewiesen ist. Bemerkung 2.17. (a) Die wesentliche Aussage in Theorem 2.16 ist jjs  f jj1 D O.h4max / für Zerlegungen  mit hmax = hmin  K , wobei K eine von der Zerlegung  unabhängige Konstante bezeichnet. Diese Bedingung an den Quotienten hmax = hmin stellt eine Uniformitätsbedingung an  dar. (b) Konvergenz jjsf jj1 ! 0 für hmax ! 0 mit hmax = hmin  K erhält man auch unter geringeren Differenzierbarkeitseigenschaften. Für gleichmäßig stetige Funktionen f W Œ a; b  ! R wird ein entsprechendes Resultat in Mennicken / Wagenführer [71], Band 2 nachgewiesen. M

Weitere Themen und Literaturhinweise Von einer gewissen Bedeutung sind in diesem Zusammenhang B-Splines der Ordnung ` 2 N0 , bei denen es sich um spezielle nichtnegative und mit einem kompakten Träger versehene4 Splinefunktionen der Ordnung ` aus den Räumen S;` handelt. Beispielsweise kann man mit ausgewählten B-Splines der Ordnung ` eine Basis für S;` erzeugen. Auf die Einführung von B-Splines wird hier im Sinne der angestrebten überschaubaren Darstellung verzichtet ( ein paar weitere Anmerkungen finden Sie noch in Abschnitt 9.3.5 ) und stattdessen auf die folgende Auswahl von Lehrbüchern 4

das heißt, diese verschwinden außerhalb eines endlichen Intervalls

36

Kapitel 2

Splinefunktionen

verwiesen: de Boor [5], Deuflhard / Hohmann [22], Kress [63], Oevel [78], Mennicken / Wagenführer [71], Schaback / Wendland [92], Schwarz / Klöckner [94], Freund / Hoppe [31], Weller [110] und Werner [111]. Außerdem ist in diesem Zusammenhang die Bézier-Interpolation zu nennen, die beispielsweise in [63], [92], [94], [110] und [111] behandelt wird.

Übungsaufgaben Aufgabe 2.1. Im Folgenden bezeichnet

 D ¹ a D x0 < x1 < : : : < xN D b º

(2.35)

wieder eine Zerlegung des Intervalls Œ a; b . Weiter seien f0 ; f1 ; : : : ; fN 2 R gegebene Stützwerte, und s sei die zugehörige interpolierende lineare Splinefunktion. Im Folgenden bezeich1 Œ a; b  den Raum derjenigen stetigen Funktionen f W Œ a; b  ! R, die stückweise stetig net C differenzierbar sind. Man zeige Folgendes: 1 Œ a; b  mit f .xj / D fj für j D 0; 1; : : : ; N gilt: (a) Für jede Funktion f 2 C

(i) jj f 0  s 0 jj22 D jj f 0 jj22  jj s 0 jj22 . (ii) Für eine beliebige ( bzgl.  ) lineare Splinefunktion

gilt jj f 0  s 0 jj2  jj f 0 

0

jj2 :

(b) Die interpolierende lineare Splinefunktion s löst das Variationsproblem

jj f 0 jj2 ! min

1 für f 2 C Œ a; b 

mit f .xj / D fj

für j D 0; 1; : : : ; N:

Aufgabe 2.2. Gegeben seien eine Zerlegung (2.35) des Intervalls Œ a; b  und Stützwerte f0 ; f1 ;

: : : ; fN 2 R. (a) Man weise nach, dass es für jede Zahl f00 2 R genau einen interpolierenden quadratischen Spline s gibt, der der Zusatzbedingung s 0 .x0 / D f00 genügt. Man gebe einen Algorithmus zur Berechnung von s an. (b) Gesucht ist nun der interpolierende quadratische Spline s mit periodischen Randbedingungen s 0 .x0 / D s 0 .xN /. Man treffe Aussagen über Existenz und Eindeutigkeit von s . Aufgabe 2.3. Man weise die Aussage im ersten Teil von Bemerkung 2.9 nach. Aufgabe 2.4. Auf dem Intervall Œ 1; 1  seien die Knoten x0 D 1; x1 D 0 und x2 D 1 gegeben. Welche Eigenschaften eines natürlichen kubischen Splines bezüglich der zugehörigen Zerlegung besitzt die folgende Funktion, und welche besitzt sie nicht?

² f .x/ D

.x C 1/ C .x C 1/3 für 1  x  0; 4 C .x  1/ C .x  1/3 für 0 < x  1:

Aufgabe 2.5. Gegeben seien die Stützpunkte

k xk fk

0

1

2

3

4

3

2

1

0

1

5 2

9

4

1

0

1

4

Man stelle das zugehörige lineare Gleichungssystem für die Momente der interpolierenden kubischen Splinefunktion mit natürlichen Randbedingungen auf.

37

Übungsaufgaben

Aufgabe 2.6. Gegeben seien eine äquidistante Zerlegung  D ¹ 0 D x0 < x1 < : : : < xN D 1 º des Intervalls Œ 0; 1 ; es gilt also xk D xk1 C h für k D 1; 2; : : : ; N , mit h D 1=N . Man betrachte auf diesem Intervall die Funktion f .x/ D sin .2x/ und die dazugehörende interpolierende kubische Splinefunktion s 2 S;3 mit natürlichen Randbedingungen. Wie groß muss die Zahl N gewählt werden, damit auf dem gesamten Intervall die Differenz zwischen s und f betragsmäßig kleiner als 1012 ausfällt? Aufgabe 2.7. Gegeben sei eine zweimal stetig differenzierbare Funktion f W Œ a; b  ! R und eine Zerlegung (2.35) des gegebenen Intervalls. Für den zugehörigen interpolierenden linearen Spline s 2 S;1 weise man mit Hilfe der taylorschen Formel die folgende Fehlerabschätzung nach: 1

js 0 .x/  f 0 .x/j  2 jj f 00 jj1 hmax

für

x 2 Πa; b ;

x 62 ¹ x0 ; x1 ; : : : ; xN º;

wobei hmax WD maxj D0;:::;N 1 ¹ xj C1  xj º den maximalen Knotenabstand bezeichnet. Aufgabe 2.8 ( Numerische Aufgabe ). Zur Interpolation beliebig verteilter Punkte .x0 ; f0 /; .x1 ; f1 /; : : : ; .xn ; fn / 2 R2 in der Ebene lassen sich kubische Splinekurven verwenden: Man bestimmt eine interpolierende kubische Splinefunktion s1 zu den Werten .t0 ; x0 /; .t1 ; x1 /; : : : ; .tn ; xn / 2 R2 und eine zweite interpolierende kubische Splinefunktion s2 zu den Werten .t0 ; f0 /; .t1 ; f1 /; : : : ; .tn ; fn / 2 R 2 . Hierbei wählt man

t0 D 0;

tj D tj 1 C

q .xj  xj 1 /2 C .fj  fj 1 /2 für j D 1; 2; : : : ; N:

Die gewünschte interpolierende kubische Splinekurve ist dann . s1 .t/; s2 .t/ / mit t 2 Œ 0; tN . Diesen Ansatz wende man auf die folgenden Punkte an:

j xj fj

0

1

2

4

5

6

7

8

1.5

0.9

0.6

0.35

3

0.2

0.1

0.5

1.0

1.5

0.75

0.9

1.0

0.8

0.45

0.2

0.1

0.2

0.25

Dabei sollen die interpolierenden kubischen Splinefunktionen s1 und s2 natürliche Randbedingungen erfüllen. Man erstelle einen Ausdruck des sich ergebenden Kurvenverlaufs.

3

Diskrete Fouriertransformation und Anwendungen

In diesem Abschnitt wird zunächst die diskrete Fouriertransformation einführend behandelt, und anschließend werden einige Anwendungen präsentiert. Schließlich wird ein Verfahren zur “schnellen” diskreten Fouriertransformation vorgestellt. Zu den Anwendungen der diskreten Fouriertransformation gehört auch die trigonometrische Interpolation, daher wird das vorliegende Thema an dieser Stelle behandelt.

3.1 Diskrete Fouriertransformation Definition 3.1. Zu einem gegebenem Datensatz von N komplexen Zahlen f0 ; f1 ; : : : ; fN 1 2 C wird der Datensatz d0 ; d1 ; : : : ; dN 1 komplexer Zahlen definiert durch

dk D

N 1 1 X

N

fj e ijk 2=N ;

k D 0; 1; : : : ; N  1

.i D

p

1 / (3.1)

j D0

als diskrete Fouriertransformierte oder auch als diskrete Fourierkoeffizienten von f0 ; f1 ; : : : ; fN 1 bezeichnet. Es wird auch die folgende Notation verwendet,

F .f0 ; : : : ; fN 1 / WD .d0 ; : : : ; dN 1 /:

(3.2)

In Matrix-Vektorschreibweise ergibt sich die diskrete Fouriertransformierte durch die Multiplikation

d0 ! pp p

D

dN 1

1

N

f0 ! pp p

V

;

(3.3)

fN 1

wobei die Matrix V 2 CN N konjugiert komplex ist zu der symmetrischen Matrix

0 1

V WD .! kj /k;j D0::N 1

1

1

B B B1 ! !2 B B D B1 ! 2 !4 B B pp pp pp Bp p p @ N  1 2.N 1/ 1! !

ppp ppp ppp pp

p

ppp

1 1

C C ! N 1 C C C N N ; ! WD e i2=N : ! 2.N 1/ C 2 C C (3.4) C pp C p A 2 ! .N 1/

Im Folgenden bezeichnet AH 2 CN M die zu einer gegebenen Matrix A 2 CM N >

konjugiert komplexe und transponierte Matrix, AH D A . Im Fall v D .v1 ; : : : ; vN /> 2 CN beispielsweise bedeutet dies v H D .v1 ; : : : ; v N /.

39

Abschnitt 3.2 Anwendungen der diskreten Fouriertransformation

Lemma 3.2. Für die Spaltenvektoren der Matrix V in (3.4),

v .k/ WD . 1; ! k ; ! 2k ; : : : ; ! .N 1/k /> 2 CN ; gilt

.v .k/ /H v .`/ D

° N

für k D `; für k ¤ `;

0

k D 0; 1; : : : ; N  1; k; ` D 0; 1; : : : ; N  1I

(3.5)

die Spaltenvektoren von V sind also paarweise orthogonal zueinander. Beweis. Im Fall k D ` erhält man wegen j! j D 1

.v .k/ /H v .k/ D

NX 1

! ks ! ks D

sD0

NX 1

1 D N;

sD0

und im Fall k ¤ ` ergibt sich

.v .k/ /H v .`/ D

NX 1

! ks ! `s D

sD0

D

NX 1

! .`k/s D

sD0

NX 1

. ! .`k/ /s

sD0

! .`k/N  1 e i.`k/2  1 D D 0; ! .`k/  1 e i.`k/2=N  1

wobei der Nenner für k; ` 2 ¹ 0; 1; : : : ; N  1 º mit k ¤ ` nicht verschwindet. Als unmittelbare Folgerung aus Lemma 3.2 erhält man das folgende Korollar. Korollar 3.3. 1. ( Diskrete Fourierrücktransformation ) Für die Matrix V 2 CN N aus (3.4) gilt

Œ

1

N

V

1

D V:

Jeder Datensatz f0 ; f1 ; : : : ; fN 1 komplexer Zahlen lässt sich also aus seiner diskreten Fouriertransformierten F .f0 ; : : : ; fN 1 / D .d0 ; : : : ; dN 1 / mittels

fj D

NX 1

dk e ijk2=N ;

j D 0; 1; : : : ; N  1;

(3.6)

kD0

zurückgewinnen. Es wird auch die folgende Notation verwendet,

F 1 .d0 ; : : : ; dN 1 / D . f0 ; : : : ; fN 1 /: PN 1 PN 1 1 2 2. Mit der Notation aus (3.1) gilt kD0 jdk j2 D N j D0 jfj j .

3.2 Anwendungen der diskreten Fouriertransformation Für die nachfolgenden Betrachtungen ist eine Erweiterung der Definition (3.2) für Indizes k 2 Z hilfreich, N 1 1 X

dk D N

j D0

fj e ijk2=N ;

k 2 Z:

(3.7)

40

Kapitel 3 Diskrete Fouriertransformation und Anwendungen

Wegen

D1

e ij.kCN /=N D e ijk2=N

‚ …„ ƒ e ijN =N D e ijk 2=N

(3.8)

liegt in (3.7) Periodizität bezüglich k vor:

k 2 Z:

dkCN D dk ;

(3.9)

Mithilfe von (3.9) kann demnach aus den Werten d0 ; d1 ; : : : ; dN 1 unmittelbar dk für

k 2 Z ermittelt werden. 3.2.1 Fourierreihen

Jede riemann-integrierbare Funktion f W Œ 0 ; L ! R mit f .0/ D f .L/ lässt sich in eine Fourierreihe entwickeln,

f .x/ D

a0 2

1 X

C



kD1

2x

ak cos . k L

/

C bk sin . k

2x

L

/



;

(3.10)

mit den reellen Fourierkoeffizienten

ak D

2

Z L

L

0

f .y/ cos . k

2y

L

/ dy;

bk D

2

Z L

L

0

f .y/ sin . k

2y

L

/ dy; (3.11)

für k D 0; 1; : : : . Dabei konvergiert die Reihe in (3.10) im quadratischen Mittel. Mit der eulerschen Formel

e ˙ik 2x=L D cos . k

2x

L

/

˙ i sin . k

2x

L

/;

i D

p 1

. k 2 Z /;

erhält man die komplexe Fourierentwicklung 1 X

f .x/ D

ck e ik2x=L

(3.12)

kD1

mit den komplexen Fourierkoeffizienten

ck D

1

Z L

L

0

f .y/e ik2y=L dy;

k 2 Z;

(3.13)

wobei Konvergenz in (3.12) im quadratischen Mittel vorliegt. Zwischen den Koeffizienten in (3.11) und (3.13) besteht der folgende Zusammenhang ( für k 2 N0 ):

ck D

ak  i b k 2

;

ak D ck C ck ;

ck D

ak C i b k 2

;

bk D i.ck  ck /:

41

Abschnitt 3.2 Anwendungen der diskreten Fouriertransformation

3.2.2 Zusammenhang zwischen komplexen Fourierkoeffizienten und der diskreten Fouriertransformation Im Folgenden wird beschrieben, inwiefern zu einer riemann-integrierbaren Funktion f W Π0; L ! R die diskreten Fourierkoeffizienten zur Approximation der komplexen Fourierkoeffizienten aus (3.13) herangezogen werden kann. Hierzu wird

fj D f .xj / mit xj D j h; j D 0; 1; : : : ; N  1

.h D

L / N

(3.14)

betrachtet. Das in (3.13) auftretende Integral wird auf Teilintervallen durch eine einfache Rechteckregel approximiert:

ck D

1

Z L

L

0

f .y/e ik2y=L dy D

N 1 1 L X fj e ijk 2=N LN

D

j D0

N 1 Z .j C1/L=N 1 X L jL=N j D0

N 1 1 X

N

j D0

f .y/e ik2y=L dy;

fj e ijk 2=N D dk ;

k 2 Z; (3.15)

mit dk aus (3.7). Solche “summierten Rechteckregeln” werden in Abschnitt 6.5.1 auf Seite 133 eingehender diskutiert. Allerdings sind bei der Diskretisierung in (3.15) lediglich für betragsmäßig kleine Werte von k gute Approximationen zu erwarten, da nur dann die auftretenden Funktionen e ik2y=L niederfrequent sind. Diese Einschränkung an k ist auch deswegen einleuchtend, da für glatte Funktionen f die Eigenschaft ck ! 0 für k ! 1 erfüllt ist, während für die Koeffizienten dk aus (3.7) gemäß (3.9) eine Periodizität bzgl. k vorliegt. Eine naheliegende Verwendung (für gerades N ) ist

dk ck ;

k D 0; 1; : : : ; N=21;

dk D dkCN ck ;

k D N=2; N=2C1; : : : ; 1

beziehungsweise in kompakter Notation

.cN=2 ; : : : ; c1 ; c0 ; : : : ; cN=21 / .dN=2 ; : : : ; dN 1 ; d0 ; : : : ; dN=21 /: Für die betrachtete Funktion f erhält man so die Näherung

f .x/

N= 21 X

dk e ik2x=L :

(3.16)

kDN=2

Beispiel 3.4. Die digitale Datenübertragung liefert ein Beispiel für die praktische Anwendbarkeit der Eigenschaft (3.15). Hier ist es etwas vereinfacht dargestellt so, dass zu den N abgetasteteten Werten (3.14) eines analogen Signals f W Œ0; L ! R die diskreten Fourierkoeffizienten d0 ; : : : ; dN 1 berechnet werden. Diese diskreten Fourierkoeffizienten werden anschließend an den gewünschten Zielort übermittelt, an dem mittels (3.16) (unter Zuhilfenahme der Periodizitätseigenschaft (3.9)) das analoge Signal f näherungsweise zurückgewonnen werden kann.

42

Kapitel 3 Diskrete Fouriertransformation und Anwendungen

In diesem Zusammenhang spielen Glättung und Datenkompression eine Rolle. Zieht man nämlich zur Approximation einer Funktion f die Darstellung (3.16) heran, so werden dabei üblicherweise hochfrequente Anteile von f vernachlässigt, was einer Glättung der Funktion f gleichkommt. Dies lässt sich auch als Datenkompression interpretieren, da nur ein Teil der Fourierkoeffizienten bei der approximativen Rekonstruktion von f verwendet wird. M

3.2.3 Trigonometrische Interpolation, Teil 1 Zur Interpolation auf einem gegebenen Intervall Π0 ; L mit L > 0 werden im Folgenden trigonometrische Polynome von der folgenden Form herangezogen,

p.x/ D

N X 1M

dk e ik2x=L ;

x 2 R;

(3.17)

kDM

mit einer Zahl M 2 N0 und Koeffizienten dM ; dM C1 ; : : : ; dN 1M . Weiter unten werden die Fälle M D 0 und M D N=2 etwas genauer betrachtet. Interpolierende trigonometrische Polynome von der Form (3.17) erhält man folgendermaßen: Theorem 3.5. Zu äquidistanten Stützstellen xj D jL=N 2 Œ 0 ; L und beliebigen Stützwerten fj 2 C für j D 0; 1; : : : ; N  1 mit N 2 N besitzt das trigonometrische Polynom p aus (3.17) die Interpolationseigenschaft

p.xj / D fj ;

j D 0; 1; : : : ; N  1;

(3.18)

falls die Koeffizienten dM ; dM C1 ; : : : ; dN 1M die Bedingung (3.7) erfüllen. Beweis. Aus der Darstellung (3.17) erhält man unmittelbar

p.xj / D

N X 1M

 dk e

ijk 2=N

D

kDM

1 X

C

N X 1M

kDM

 dk e ijk 2=N ; (3.19)

kD0

und wir betrachten im Folgenden die erste dieser beiden Teilsummen. Hierfür erhält man Folgendes, 1 X kDM

dk e ijk 2=N

./

D

1 X

NX 1

./

dkCN e ij.kCN /2=N D

dk e ijk 2=N : (3.20)

kDN M

kDM

Dabei ergibt sich . / wie in (3.8) sowie mit der Setzung (3.7), und . / erhält man unmittelbar aus einer Umindizierung. Die Darstellungen (3.19) und (3.20) zusammen ergeben

p.xj / D

NX 1

./

dk e ijk 2=N D fj ;

kD0

wobei sich die Darstellung . / aus der Definition in (3.1) ergibt.

43

Abschnitt 3.2 Anwendungen der diskreten Fouriertransformation

Ein trigonometrisches Polynom der Form (3.17), das zugleich die Interpolationseigenschaft (3.18) besitzt, bezeichnen wir als trigonometrisches Interpolationspolynom. Gemäß Theorem 3.5 gewinnt man die Koeffizienten eines solchen trigonometrischen Interpolationspolynoms mit der diskreten Fouriertransformierten (3.1) und anschließender periodischer Fortsetzung entsprechend (3.9).

3.2.4 Trigonometrische Interpolation, Teil 2 Wir betrachten nun trigonometrische Polynome p D p1 aus (3.17) für den speziellen Fall M D 0:

p1 .x/ D

NX 1

dk e ik2x=L ;

x 2 R:

(3.21)

kD0

Diese haben unter Umständen aufgrund eines oszillierenden Verhaltens schlechte Approximationseigenschaften, was anhand des folgenden Beispiels deutlich wird. In Abschnitt 3.2.5 wird allgemein beschrieben, warum dieses Verhalten nicht überraschend ist. Beispiel 3.6. Man betrachte die Funktion f W Œ 0; 1  ! R definiert durch

² f .x/ D

x;

0  x  1=2;

1  x;

1=2  x  1:

(3.22)

Für zwei verschiedene Werte von N sind in Bild 3.1 die zugehörigen trigonometrischen Interpolationspolynome der Form (3.21) dargestellt.

6 1=2

6

f .x/................................

....... .... ...... ..... ... ... .... .. ... .... ... ... ... .... .... .. ... ..... ... ..... . . .. . ... ... . . . . . . . . . . . . . . . .... ............. ... . ... ...... ...... . . ... ..... ..... . . ... ... ... ...... .. .. ... . . . . ... . . . ... .. .. ......... ....... ... . . . . . . .. . . . .... . ..... .... . . ... .. ... .... .... ... ............... .......... ... .... ... .. .. ..... ........ ........ ... . . . . . . ... ..... ... ... . .. ...... . . . . . . . . . . ... .. .. .. . . 1 ... ... .......... ..... ... ... .... ....... ... ... .. ..... ... ... ..... .. .. ........ ... ... . . . . ......... . . . . ... ... .......... ..... ..... ........ .... ... .... ........ ........ . . . . . . . ... ... .. . . . . . . . ... ... .. .. . . ... . . . ... .. ... . ... . . . ... ... ... ... ... ... ... ... ... ..... .... ..... ............ .........

1=2

Re p .x/

0

1=2

0

Im p1 .x/

1

f .x/...............................

.. . . .. ..... .. ... ....... .......... .. .. ....... . ... . . .. .. .. ... ... . ... .......... ... ... .. ... ... ... ........... ... ........ ........ .... .... .... ... ... ... .... ... .................. ... . .... .. . .. . . . . . . . .. . .. .... ....... . .. . ... .. .. .. .. .. ... ......... ..... ... .... ... ... ..... .. ... ...... ... .. ... .. ..... ... ... ..... ... ... ... ... ..... .. ... ... ........ ... ... ..... ..... ..... ....... .... .... .... ........ .... .... ... ........ .. .. .... .. .. ...... .. .. .. .. .... ..... ... .... ... .... ............. ... ....... .. . ... .. .. ....... .. .. ... ..... . . .. . . . . .. .. .. . .. ........ .. .. . . .. .. .. . . . . .. .. ... .. .. ........ .... ...... ............ .. .. .. .. .. .. .. .. .. ...... .... ..... ........ ...... .... .......... ............... ....... .... ... . . ... .... ... ........... ... . . . . .... . .. . 1 ..... ... ... ... .... ... .... ... ... ... ........................ ... ....... ... .... .... .......... . .. . . .. .. . . . . .. .. ..... . . ... .. ......... ...... ... .. ... .. ... ... ... .. .. ... ........... ... .. ... ..... ... .. .. .. .. ... ... ... ... ... .. .. .. .......... ... ... .......... . ..... .. ... .. .. .. ... ....... ........ ........ .... .............. ...... .... .... .... ... .... ......... ... ...... .... .... ...... ..... ... .... ... .. . . . . . . .. .. ... .... .. ... ..... .... .. ... .. ... .. ..... ... . ...... .. .. .. .. .. .. .. ... ... ... .. .. .. .. .. .. .. ... ... .. .. .. .. . .. . .. .. .. .. .. .. .. ... .. .. .. ... .. .. .. ... .. .. .. .. .. ..... . . . . . . . . . . . . .. .. .. .. .. .. .. .. .. .. .. .. .. . ... ..... ... .. . . . .. .. .. .. .. .. ... .. ... ...... ... ... ..... ..... ..... . ...... .. .. .. .. .

Re p .x/

0

0

1=2

1

Im p1 .x/

Bild 3.1: Darstellung der Funktion f und des Real- und Imaginärteils des trigonometrischen Interpolationspolynoms p1 der Form (3.21); links für N D 4, rechts für N D 16 M

3.2.5 Trigonometrische Interpolation, Teil 3 Zur Gewinnung interpolierender trigonometrischer Polynome mit zugleich guten Approximationseigenschaften werden im Folgenden interpolierende trigonometrische

44

Kapitel 3 Diskrete Fouriertransformation und Anwendungen

Polynome p von der Form (3.17) für den speziellen Fall M D N=2 betrachtet, wobei N 2 N als gerade angenommen wird. In diesem speziellen Fall gilt p D p2 mit

p2 .x/ D

N= 21 X

dk e ik2x=L :

(3.23)

kDN=2

Man beachte, dass ein interpolierendes trigonometrisches Polynom der Form (3.23) mit der in (3.16) betrachteten Approximation übereinstimmt. Ergeben sich die Stützwerte fj aus den Werten einer hinreichend glatten periodischen Funktion an den Stützstellen xj , so besitzt das trigonometrische Polynom p2 aus (3.23) mit der Interpolationseigenschaft (3.18) auf dem gesamten Intervall Œ 0; L gute Approximationseigenschaften, die in Theorem 3.8 unten präzisiert sind. Zunächst werden die Approximationseigenschaften anhand des folgenden Beispiels dargestellt. Beispiel 3.7. Für die Funktion f W Œ 0 ; 1  ! R aus (3.22) sind in Bild 3.2 für zwei Werte von N jeweils die interpolierenden trigonometrischen Polynome p2 aus (3.23), (3.18) dargestellt. M

6 1=2

6

........................ ...... ... ... ...... ..... ... ...... ......... ... ... ... .... .... ... .... .... .... ... ... ....... . . .... .... ... .... .... ... ......... .... ... . . ....... .......... . ....... .... . ....... . . . .. ..... . . . . ....... ........ . . ....... . ....... ......... . . ... .... .. ... . . . ... ... ... .... ... .... . . . ... .... .. .... . . .... ... . ... ..... 2 .... .... . . . .... .... ... ....... . ...... ... . . ............. ........... . . . ...... .....

1=2

f .x/

0

1=2

1

.. ............... ........ ......... ..... ...... ........ ..... ....... .... . . . ..... ... ..... ..... .... ..... . . ..... .... . ..... . . ...... .... . . . ...... ... . . ..... . . ..... ...... . . .... ... . . ...... . ... ..... . . . ...... .... . ..... . . .... ........ . . . . .... ...... ... . . ........ ... . . . . ........ ..... . ...... . . . .

f .x/

p .x/

0

p2..x/

-

0

0

1=2

-

1

Bild 3.2: Darstellung der Funktionen f und p2 aus (3.23), (3.18); links für N D 4, rechts für N D 16 Im Folgenden werden die Approximationseigenschaften des interpolierenden trigonometrischen Polynoms p2 beschrieben. Theorem 3.8. Die Funktion f W R ! C sei m-mal stetig differenzierbar und periRL odisch der Länge L, und es bezeichne jjg jj2 D . 0 jg.x/j2 dx /1=2 . Dann gilt für das trigonometrische Polynom p2 aus (3.23) mit der Interpolationseigenschaft (3.18) ( mit fj D f .xj / ) die Fehlerabschätzung

jjp2  f jj2  cm .jjf jj2 C jjf .m/ jj2 / N m mit einer gewissen Konstanten cm > 0. Beweis. Für einen elementaren Beweis unter expliziter Angabe der Konstanten cm siehe Saranen / Vainikko [91].

45

Abschnitt 3.2 Anwendungen der diskreten Fouriertransformation

Bemerkung 3.9. Es soll hier nochmals das interpolierende trigonometrische Polynom aus Abschnitt 3.2.4 betrachtet werden. Interpoliert ein solches trigonometrisches Polynom p1 von der Form (3.21) auf dem Intervall Œ 0 ; L an den äquidistanten Stützstellen xj D jL=N; j D 0; 1; : : : ; N  1, eine gegebene m-mal stetig differenzierbare und L-periodische Funktion f W R ! C, so ist die Funktion p2 .x/ WD p1 .x/e iN x=L von der Form (3.23) und interpoliert an den genannten Stützstellen die Funktion f .x/ e iN x=L. Die letztgenannte Funktion oszilliert jedoch typischerweise stark. Genauer gilt dm .f .x/e iN x=L / dx m

D e iN x=L



m X sD0

s

. ms / . iLN  /

 f .ms/ .x/ ;

wobei auf der rechten Seite dieser Gleichung der Term N m dominiert und Theorem 3.8 hier somit lediglich

jjp1  f jj2 D jjp2  f e iN x=L jj2 D O. 1 / M

erwarten lässt. Dies wird durch Beispiel 3.6 bestätigt. Mit dem nächsten Beispiel wird der Effekt der Datenglättung demonstriert.

Beispiel 3.10. Für die Funktion f W Œ 0 ; 1  ! R aus (3.22) ist in Bild 3.3 der mittels des trigonometrischen Interpolationspolynoms (3.23), (3.18) gewonnene Effekt der Datenglättung1 veranschaulicht. M

6 1=2

0

6 . .... f .x/ ...... .......... ... ......

. ...... ..... ...... ..... . ... ..... ...... ....... ...... . . ..... ..... . ... . .... ...... ...... . ...... ...... ...... ...... .....

0

...... . .. ....... ..... ...... .... ..... ...... ....... ...... ...... . .. ...... ...... ...... .... ..... ....... ...... ...... ...... ..... .

1=2

1

1=2

-

Re p.......2 .x/

.. ... ... ..... ... ... .... ... . . . ....... ... ...... ........ ... .... . . ... .. ... . . .. .... . . . ...... ... . . . ....... . . . . .... ..... . ... . ... ... . ... .. . . .... ... ....... . . . . . ...... ..... . . .... . ... ... . . ... ... . ... .. 2 .... . . . ............................. ................... ................. .................. .................. .................. .................. ..................... ....... ....... ....... ....... ....... ....... ....... .......

Im p .x/

0

0

1=2

-

1

Bild 3.3: Links die Funktion f aus (3.22) mit kleinen aber hochfrequenten Störungen, und rechts das trigonometrische Interpolationspolynom p2 für N D 16

3.2.6 Interpolierende reelle trigonometrische Polynome Zur Interpolation der Stützpunkte .xj ; fj / mit äquidistanten Stützstellen xj DjL=N 2 Œ 0; L und reellen Zahlen fj 2 R für j D 0; 1; : : : ; N  1; werden im Folgenden 1

siehe Beispiel 3.4

46

Kapitel 3 Diskrete Fouriertransformation und Anwendungen

reelle trigonometrische Polynome der Form

T .x/ D A0 C 2

N= 21 X

Ak cos

 k 2x 

kD1

L

C Bk sin

 k 2x  L

C AN=2 cos

 N x  L

(3.24)

herangezogen mit geraden Zahlen N . Hierzu werden die folgenden Koeffizienten betrachtet:

Ak D

N 1 1 X

N

fj cos

 j k 2  N

j D0

2 R;

N 1 1 X

Bk D

N

fj sin

 j k 2  N

j D0

2 R ; (3.25)

k D 0; 1; : : : ; N=2: Offenbar ist das trigonometrische Polynom T in (3.24) mit Koeffizienten Ak ; Bk wie in (3.25) reellwertig. Das folgende elementare Lemma wird beim Beweis des nachfolgenden Theorems 3.12 benötigt und gibt darüber hinaus an, wie man die Zahlen in (3.25) mithilfe der diskreten Fouriertransformierten (3.1) erhält. Lemma 3.11. Zwischen den Zahlen Ak ; Bk ; k D 0; 1; : : : ; N  1, in (3.25) einerseits und der diskreten Fouriertransformierten (3.3) bestehen die Zusammenhänge

d0 D A0 ;

dN=2 D AN=2 ;

dk D Ak  iBk ;

dk D Ak C iBk ;

k D 1; 2; : : : ; N=2  1: (3.26)

Beweis. Gemäß (3.3) gilt N 1 1 X

dk D N

j D0

N 1 1 X

fj e ijk2=N D N

j D0

  j k 2x   j k 2x    ; fj cos i sin N N k D N=2; : : : ; N=2  1;

woraus die angegebenen Identitäten unmittelbar folgen. Das folgende Theorem beschreibt die Interpolationseigenschaften des trigonometrischen Polynoms T aus (3.24)–(3.25). Theorem 3.12. Für das interpolierende trigonometrische Polynom p2 mit (3.23), (3.18) und das reelle trigonometrische Polynom T aus (3.24)–(3.25) gilt Re p2 .x/ D T .x/ sowie T .xj / D fj für j D 0; 1; : : : ; N  1. Beweis. Mit dem trigonometrischen Polynom p2 aus (3.23) gilt

p2 .x/ D d0 C

N= 21  X

dk e ik2x=L C dk e ik2x=L



C dN=2e iN x=L

kD1 ./

D A0 C

N= 21  X

.Ak  iBk /e ik2x=L C .Ak C iBk / e ik2x=L



C AN=2 e iN x=L

kD1

D A0 C 2

N= 21  X kD1

Ak cos

 k 2x  L

C Bk sin

 k 2x   L

C AN=2e iN x=L;

47

Abschnitt 3.3 Schnelle Fourier-Transformation ( FFT )

wobei in . / noch Lemma 3.11 herangezogen wurde. Aus dieser Darstellung für p2 ergeben sich unmittelbar die beiden Aussagen des Theorems.

3.3 Schnelle Fourier-Transformation (FFT) 3.3.1 Einführende Bemerkungen In diesem Abschnitt wird ein Verfahren zur “schnellen Fouriertransformation” ( Fast Fourier Transform, kurz FFT ) vorgestellt. Dieses Verfahren nutzt die spezielle Form der Transformation (3.1) aus und benötigt dabei lediglich O. N log 2 .N / / komplexe Multiplikationen, wobei log 2 den Logarithmus zur Basis 2 bezeichnet. Man beachte, dass die Berechnung der diskreten Fouriertransformierten (3.1) mittels einer MatrixVektor-Multiplikation entsprechend (3.3) insgesamt N 2 komplexe Multiplikationen erfordert.

3.3.2 Der grundlegende Zusammenhang Von grundlegender Bedeutung für den FFT-Algorithmus ist das folgende Resultat. Theorem 3.13. Aus den diskreten Fouriertransformierten der beiden ( komplexen ) Datensätze g0 ; g1 ; : : : ; gM 1 und gM ; gM C1 ; : : : ; g2M 1 der Längen M lässt sich die diskrete Fouriertransformierte des Datensatzes g0 ; gM ; g1 ; gM C1 ; : : : ; gM 1 ; g2M 1 der Länge 2M folgendermaßen bestimmen: 1 Fk .g0 ; g1 ; : : : ; gM 1 / 2 1 2

C e ik=M Fk .gM ; gM C1 ; : : : ; g2M 1 /



D Fk .g0 ; gM ; g1 ; gM C1 ; p p ; gM 1 ; g2M 1 / für k D 0; 1; : : : ; M  1;  Fk .g0 ; g1 ; : : : ; gM 1 /  e ik=M Fk .gM ; gM C1 ; : : : ; g2M 1 / D FM Ck .g0 ; gM ; g1 ; gM C1 ; : : : ; gM 1 ; g2M 1 / für k D 0; 1; : : : ; M  1:

Hierbei bezeichnen Fk beziehungsweise FM Ck die k -te beziehungsweise .M C k/-te Komponente von F . Beweis. Für k D 0; 1; : : : ; M  1 gilt

Fk .g0 ; gM ; g1 ; gM C1 ; : : : ; gM 1 ; g2M 1 / D

D

M 1 1  X gj 2M j D0

e i2jk 2=2M C

M 1 X

M 1 1  X gj 2M j D0

e ijk2=M C e ik=M

gM Cj e i.2j C1/k2=2M



j D0 M 1 X

 gM Cj e ijk 2=M :

j D0

Die zweite Gleichung in Theorem 3.13 erhält man völlig analog, wobei noch

e ij.kCM /2=2M D e ijk 2=2M e ij D .1/j e ijk2=2M berücksichtigt wird.

48

Kapitel 3 Diskrete Fouriertransformation und Anwendungen

Für den Fall N D 2q mit N 2 N kann die in Theorem 3.13 vorgestellte Eigenschaft genutzt werden, um die diskrete Fouriertransformierte eines komplexen Datensatzes f0 ; : : : ; fN 1 zu bestimmen. Dies soll zunächst anhand des nachfolgenden Beispiels erläutert werden. Beispiel 3.14. In Schema 3.1 ist für den Spezialfall N D 23 dargestellt, wie man für r D 0; 1; 2 ausgehend von der Stufe r mit den diskreten Fouriertransformierten von Datensätzen der Länge 2r zu den diskreten Fouriertransformierten von Datensätzen der Länge 2rC1 in der Stufe r C 1 gelangt. Im Folgenden wird beschrieben, wie man in

Stufe 0

f0

f4

f2

f6

f1

f5

f3

f7

k

k

k

k

k

k

k

k

F . f0 /

F . f4 /

F . f2 /

F . f6 /

& Stufe 1

.

&

F . f2 ; f6 /

F . f 0 ; f4 / &

Stufe 2

F . f5 /

&

.

F . f3 / F . f7 / &

F . f1 ; f 5 /

.

&

F . f0 ; f 2 ; f 4 ; f 6 / &

Stufe 3

.

F . f1 /

.

F . f3 ; f 7 / .

F . f1 ; f3 ; f5 ; f7 / .

F . f0 ; f1 ; f2 ; f3 ; f4 ; f5 ; f6 ; f7 /

Schema 3.1: Darstellung der schnellen Fouriertransformation im Fall N D 23 der Stufe 0 die angegebene Zuordnung f0 ; f4 ; f2 ; f6 ; f1 ; f5 ; f3 ; f7 auf die Positionen 0–7 erhält; für jede einzelne Positionsnummer n 2 ¹ 0; 1; : : : ; 7 º wird die jeweilige Binärdarstellung n D b2 22 C b1 21 C b0 20 ermittelt und in dieser anschließend die Reihenfolge der Binärziffern umgedreht. Die zugehörige Dezimalzahl b0 22 C b1 21 C b2 20 liefert dann den gesuchten Index von f . Dieses Vorgehen der Bit-Umkehr ist in Tabelle 3.1 dargestellt. Die Begründung dafür, warum dieses Vorgehen die richtige Zuordnung liefert, wird in Abschnitt 3.3.4 nachgereicht. M Position

Index von f

Dezimal , Binär 0 000 1 001 2 010 3 011 4 100 5 101 6 110 7 111

Binär revers , Dezimal 000 0 100 4 010 2 110 6 001 1 101 5 011 3 111 7

Tabelle 3.1: Darstellung der Bit-Umkehr im Fall N D 23 . Die Positionsangaben und Indizes betreffen von links aus gesehen die erste Zeile in Schema 3.1.

49

Abschnitt 3.3 Schnelle Fourier-Transformation ( FFT )

Für die Berechnung von F .f0 ; f1 ; : : : ; fN 1 / lässt sich das Ergebnis aus Theorem 3.13 sowohl rekursiv ( ohne Bit-Umkehr ) als auch iterativ umsetzen. Im Folgenden soll der iterative Weg verfolgt werden, bei dem weniger Speicherplatz erforderlich ist. Die allgemeine Vorgehensweise hierzu ist in Definition 3.19 weiter unten beschrieben. Vorbereitend wird die Bit-Umkehr eingehender behandelt.

3.3.3 Bit-Umkehr Im Folgenden wird die Bit-Umkehr in der allgemeinen Situation N D 2q betrachtet.

Pq1

Definition 3.15. Für q 2 N0 sei n D `D0 b` 2` die eindeutige Binärdarstellung einer Zahl n 2 Mq D ¹ 0; 1; : : : ; 2q  1 º mit Binärziffern ( Bits ) b` 2 ¹ 0; 1 º . Die durch q X1

q W Mq ! Mq ;

q X1

b` 2 ` 

`D0

bq1` 2`

`D0

definierte Abbildung bezeichnet man als Bit-Umkehr. Die Situation q D 0 in Definition 3.15 wird dabei lediglich aus technischen Gründen zugelassen und bedeutet M0 D ¹ 0 º und 0 .0/ D 0. Bemerkung 3.16. Es gilt offensichtlich

q

 q X1

b` 2 `



D

`D0

q X1

b` 2q1` :

`D0

M

Das folgende Theorem liefert eine Vorgehensweise, mit der sich die Bit-Umkehr effizient realisieren lässt. Die Werte q .0/; q .1/; : : : ; q .2q  1/ können damit mittels zwei geschachtelter for-Schleifen und ohne Durchführung von Multiplikationen berechnet werden. Theorem 3.17. Für die Bit-Umkehr q W Mq ! Mq gilt

q .2r C n/ D q .n/ C 2q1r ;

n D 0; 1; : : : ; 2r  1; r D 0; 1; : : : ; q  1:

Beweis. Sei r 2 ¹ 0; 1; : : : ; q  1 º. Für n 2 ¹ 0; 1; : : : ; 2r  1 º existiert eine eindeutige Binärdarstellung von der Form r X1

n D

b` 2` ;

`D0

und dann gilt n C 2r D

Pr1

`D0 b` 2

`

q .n C 2r / D

C 2r beziehungsweise r X1 `D0



b` 2q1` C 2q1r : ƒ‚

D q .n/



50

Kapitel 3 Diskrete Fouriertransformation und Anwendungen

Für das Verständnis der Funktionsweise der Bit-Umkehr in der allgemeinen Situation N D 2q ist noch das folgende Resultat von Bedeutung. Lemma 3.18. Die Bit-Umkehr q W Mq ! Mq ist bijektiv mit q1 D q . Weiter gilt für r D 0 ; 1; : : ::

r .n/ D rC1 .2n/; 2r C r .n/

n 2 Mr ; ......

D rC1 .2n C 1/;

:

Beweis. Ist elementar und wird hier nicht geführt ( Aufgabe 3.7 ).

3.3.4 Der FFT-Algorithmus in der Situation N D 2q Ausgehend von beliebigen gegebenen komplexen Zahlen g0 ; g1 ; : : : ; gN 1 2 C mit

N D 2q

mit q 2 N

führt der in Theorem 3.13 beschriebene Zusammenhang auf die in dem folgenden Algorithmus 3.19 beschriebenen Vorgehensweise. Wie sich herausstellen wird ( siehe Korollar 3.23 ), stimmt der sich dabei ermittelte Vektor dŒq;0 2 CN mit der diskreten Fouriertransformierten F .gq .0/ ; : : : ; gq .2q 1/ / überein. Damit wird dann auch unmittelbar klar, wie man die Zahlen g0 ; g1 ; : : : ; gN 1 2 C letztlich zu wählen hat, so dass der Vektor dŒq;0 2 CN tatsächlich mit der zu bestimmenden diskreten Fouriertransformierten F .f0 ; : : : ; fN 1 / eines gegebenen Datensatzes von N komplexen Zahlen f0 ; : : : ; fN 1 übereinstimmt. Algorithmus 3.19 (FFT). Ausgehend von Zahlen dŒ0;j  D gj 2 C; j D 0; : : : ; 2q  1 bestimme man für Stufen r D 1; 2; : : : ; q in der r -ten Stufe insgesamt 2qr Vektoren der Länge 2r qr r dŒr;0 ; dŒr;1 ; : : : ; dŒr;2 1 2 C2

aus den Datensätzen der jeweils vorhergehenden Stufe r  1 gemäß der folgenden Vorschrift: ŒrC1;j 

WD

ŒrC1;j 

WD

dk

d2r Ck

1  Œr;2j  dk 2 1 2

........

Œr;2j C1 

C .r/k dk 

........

;



;

r mit den Zahlen .r/ WD e i=2 ; r D 0; 1; : : : ; q  1.

k D 0; : : : ; 2r  1; j D 0; : : : ; 2qr1  1; r D 0; : : : ; q  1; M

Bemerkung 3.20. In Schema 3.2 ist die Vorgehensweise beim FFT-Algorithmus schematisch dargestellt. M Mit dem nachfolgenden Theorem werden die Einträge der im Zuge des FFT-Algorithmus auftretenden Vektoren angegeben.

51

Abschnitt 3.3 Schnelle Fourier-Transformation ( FFT )

g0 jj Stufe 0

g1 jj

g2 jj

g3 jj

::: :::

dŒ0;0 dŒ0;1 dŒ0;2 dŒ0;3

Stufe 1

&.

&.

dŒ1;0

dŒ1;1

&

: : : dŒ0;2

g2q 3 jj

q 4

:::

g2q 1 jj

q q dŒ0;2 2 dŒ0;2 1

.

&

q1 dŒ1;2 2

.

.

q1 dŒ1;2 1

&

.

q2 1

dŒ2;2

:::

& pp p

g2q 2 jj

q dŒ0;2 3

&

dŒ2;0

Stufe 2

g2q 4 jj

. ::

pp

: &

p

.

dŒq1;0dŒq1;1

Stufe q  1

&. dŒq;0

Stufe q

Schema 3.2: Schema zur Vorgehensweise beim FFT-Algorithmus Theorem 3.21. Es gilt dŒr;j  D F .gj 2r C r .0/ ; gj 2r C r .1/ ; p p ; gj 2r C r .2r 1/ /; j D 0; 1; : : : ; 2qr  1;(3.27) r D 0; 1; : : : ; q:

Beweis. Es wird vollständige Induktion über r angewandt. Die Aussage (3.27) ist sicher richtig für r D 0, und im Folgenden sei (3.27) richtig für ein 0  r  q  1. Dann berechnet man unter Berücksichtigung von 2j 2r D j 2rC1 Folgendes, ŒrC1;j 

dk

D

1 Fk .g2j 2r 2

C r .0/

; : : : ; g2 j 2 r

C .r/k Fk .g.2j C1/ 2r

C r .2r 1/

C r .0/

/

; : : : ; g.2j C1/ 2r

C r .2r 1/

/



D Fk .gs0 ; : : : ; gs2rC1 1 / mit

rC1 .2k/

‚…„ƒ s2k WD j 2rC1 C r .k/ ; s2kC1 WD

......

C 2r C r .k/; „ ƒ‚ …

k D 0; 1; : : : ; 2r  1;

rC1 .2kC1/ ŒrC1;j 

unter Berücksichtigung von Lemma 3.18. Die angegebene Darstellung für d2r Ck ergibt sich durch die gleiche Rechnung, mit .r/k ersetzt durch .r/k . Dies komplettiert den Beweis des Theorems.

52

Kapitel 3 Diskrete Fouriertransformation und Anwendungen

Bemerkung 3.22. Wenn man für eine fixierte Zahl r alle in (3.27) auftretenden Argumente gj 2r C r .k/ ( für k D 0; : : : ; 2r  1; j D 0; : : : ; 2qr  1 ) aufreiht mit j als äußerem Laufindex, so findet sich an der Position j 2r C k die Zahl gj 2r C r .k/ , deren Index man aus j 2r C k 2 Mq durch Bit-Umkehr der ersten ( zu den kleinsten Potenzen der Basis 2 gehörenden ) r Bits erhält. Für N D 8 ist die Situation in Tabelle M 3.2 dargestellt.

Stufe r

Position der Argumente 0

pp p

1

0

g000

g001

1

g000

g001

2

g000

3

g000

pp p pp p

2

g010

pp p

3

g011

g010

g011

g010

g001

g011

g100

g010

g110

pp p pp p pp p

4

g100

pp p

5

g101

g100

g101

g100 g001

pp p pp p

6

g110

pp p

7

g111

g110

g111

g110

g101

g111

g101

g011

g111

Tabelle 3.2: Stufenweise Auflistung der Argumente aus (3.27) gemäß der in Bemerkung 3.22 angegebenen Reihenfolge am Beispiel N D 23 . Die Indizes der Zahlen sind in Binärdarstellung angegeben. Unter Beachtung von q ı q D id erhält man als wesentliche Schlussfolgerung aus Theorem 3.21 das folgende Resultat: Korollar 3.23. Der FFT-Algorithmus liefert dŒq;0 D F .gq .0/ ; : : : ; gq .2q 1/ /: Die Setzung gk D fq .k/ ; k D 0; : : : ; 2q  1, führt daher auf dŒq;0 D F . f0 ; : : : ; f2q 1 /. Die Bit-Umkehr liefert also tatsächlich die anfänglich richtige Zuordnung der Zahlen

f0 ; f1 ; : : : ; fN 1 2 C auf die Positionen 0 bis N  1. 3.3.5 Aufwandsbetrachtungen für den FFT-Algorithmus Theorem 3.24. Bei der schnellen Fouriertransformation zur Bestimmung der diskreten Fouriertransformierten eines Datensatzes der Länge N D 2q fallen nicht mehr als N log2 .N /=2 C O.N / komplexe Multiplikationen an. Beweis. Wir verwenden im Folgenden die Notationen aus Algorithmus 3.25. Für r 2 ¹ 0; 1; : : : ; q  1 º fallen beim Übergang von der r -ten zur .r C 1/-ten Stufe des FFTAlgorithmus die folgenden komplexen Multiplikationen an: 



r ausgehend von .r/ erfordert die Berechnung der Zahlen .r/2 ; .r/3 ; : : : ; .r/2 1 2 C insgesamt 2r  2 . 2r / komplexe Multiplikationen; rC1

zur Bestimmung des Vektors dŒrC1;j  2 C2 aus den beiden Vektoren dŒr;2j  ; Œr; 2j C1 2r r d 2 C sind 2 komplexe Multiplikationen erforderlich, und dies jeweils

53

Weitere Themen und Literaturhinweise

für die Indizes j D 0; : : : ; 2qr1  1. Dies summiert sich zu 2r 2qr1 D 2q1 komplexen Multiplikationen auf. Beim Übergang von der r -ten zur .r C 1/-ten Stufe des FFT-Algorithmus fallen demnach weniger als 2q1 C 2r komplexe Multiplikationen an. Berücksichtigt man noch die zu Beginn des FFT-Algorithmus notwendigen q  2 .  q / komplexen Multiplikationen .r/ D .r C 1/2 ; r D q  2; q  3; : : : ; 1, so erhält man abschließend für den gesamten FFT-Algorithmus die folgende obere Schranke für die erforderliche Zahl komplexer Multiplikationen: q X1

. 2q1 C 2r / C q  q 2q1 C 2q C q D

rD0

N log 2 .N / 2

C O. N /:

3.3.6 Pseudocode für den FFT-Algorithmus in der Situation N D 2q Abschließend wird der FFT-Algorithmus in Form eines Pseudocodes angegeben. Algorithmus 3.25. Sei N D 2q . Eingabe f .k/ D fk ; Ausgabe d.k/ D dk ; for k D 0 W . N  1 / for r D 0 W . q  1 /

k D 0; : : : ; N  1 (** reeller oder komplexer Datensatz **) ......

(** diskrete Fouriertransformierte **)

d.k/ D f . q .k/ /=N

end

(** Übergang Stufe r ! Stufe r C 1 **) (** M , Datensatzlänge(r ) **)

M D 2r I  D e i=M ; for k D 0 W .M  1/ (** k , Position in den Datensätzen **) for j D 0 W 2qr1  1 (** 2qr1 , (Anzahl Datensätze)(r C 1) **) x D  k d. 2jM C M C k /; d. 2jM C M C k / D d. 2jM C k /  x ; d. 2jM C k / D d. 2jM C k / C x ; end end end M

Weitere Themen und Literaturhinweise Die diskrete Fouriertransformation geht zurück auf Cooley / Tukey [12] und wird beispielsweise in Bärwolff [2], Bollhöfer / Mehrmann [6], Deuflhard / Hohmann [22], Hanke-Bourgeois [52], Oevel [78] und in Schwarz / Klöckner [94] einführend behandelt. In [52], [78] sowie in [82] werden auch die in der Bildverarbeitung bedeutungsvolle zweidimensionale diskrete Fourier- beziehungsweise Cosinustransformation

54

Kapitel 3 Diskrete Fouriertransformation und Anwendungen

und deren Modifikationen für die Datenkompression beziehungsweise die Digitalisierung beschrieben. Diskrete Fouriertransformationen für die trigonometrische Interpolation auf nichtäquidistanten Gittern werden in Potts / Steidl /Tasche [84] behandelt.

Übungsaufgaben Aufgabe 3.1. Für gerades N seien .N C 1/ Stützstellen x0 < x1 < : : : < xN und Stützwerte f0 ; f1 ; : : : ; fN 2 C gegeben, mit xN  x0 < 2 . Man zeige Folgendes: (a) Es gibt genau ein trigonometrisches Polynom der Form N= X2 A0 T .x/ D C . Ak cos kx C Bk sin kx /;

(3.28)

2

kD1

mit komplexen Koeffizienten Ak und Bk , das die Interpolationsbedingungen T .xj / D fj für j D 0; 1; : : : ; N erfüllt. (b) Sind die Stützwerte f0 ; f1 ; : : : ; fN alle reell, so sind es auch alle Koeffizienten Ak ; Bk des zugehörigen interpolierenden trigonometrischen Polynoms der Form (3.28). Aufgabe 3.2. Sei N gerade. Man zeige: (a) Für reelle Zahlen x1 ; x2 ; : : : ; xN ist die Funktion N Y

t.x/ D

sin

x  xs 2

sD1

ein trigonometrisches Polynom von der Form (3.28) mit reellen Koeffizienten Ak ; Bk . (b) Man zeige mithilfe von Teil (a) der vorliegenden Aufgabe, dass das interpolierende trigonometrische Polynom zu den Stützstellen in Aufgabe 3.1 und zu den Stützwerten f0 ; f1 ; : : : ; fN identisch ist mit

T .x/ D

N X kD0

fk

tk .x/; tk . x k /

tk .x/ WD

mit

N Y

sin

sD0 s¤k

x  xs 2

:

Hinweis zu (a): Für U n WD span ¹1 1; sin x; cos x; : : : ; sin n x; cos n x º weise man Folgendes nach: 

für beliebige Zahlen b; c 2 R gilt w. x / WD sin



g1 2 U m ; g 2 2 U n

)

x b 2

sin

xc 2

2 U1 ;

g1 g2 2 UmCn :

Aufgabe 3.3. Es bezeichne nun D2 W CN ! C N die folgende lineare Abbildung:

D2 c WD . cj 1 C 2cj C cj C1 /j D0;::;N 1;

mit

c D .c0 ; c1 ; : : : ; cN 1 />; c1 WD cN 1 ;

cN WD c0 ;

und außerdem sei

M D diag . 0 ; 1 ; : : : ; N 1 / 2 CN N

mit k WD 4 sin2 .k=N / 2 R für k D 0; 1; : : : ; N  1:

Man zeige Folgendes:

D2

D

F 1 M F ;

.D2  I /1

D

F 1 .M  I /1 F

Hierbei bezeichnet F W C

N

!C

N

. 2 C;

¤ k für k D 0; 1; : : : ; N  1 /:

die diskrete Fouriertransformation.

55

Übungsaufgaben

Aufgabe 3.4. (a) Zu einem gegebenen Datensatz f0 ; f1 ; : : : ; fN 1 komplexer Zahlen sei der Datensatz dQ0 ; dQ1 ; : : : ; dQN 1 komplexer Zahlen definiert durch N 1 X fj e i.2j C1/k=N dQk D k

N

für k D 0; 1; : : : ; N  1

(3.29)

j D0

mit gegebenen Koeffizienten k ¤ 0 für k D 0; 1; : : : ; N  1. Man zeige

fj D

N 1 X kD0

dQk i.2j C1/k=N e k

für j D 0; 1; : : : ; N  1:

(b) Zu einem gegebenen Datensatz f0 ; f1 ; : : : ; fn1 reeller Zahlen mit n 2 N sei der transformierte Datensatz d0 ; d1 ; : : : ; dn1 reeller Zahlen definiert durch

dk D

n1  . 2j C 1 /k  k X fj cos n 2n

für k D 0; 1; : : : ; n  1

(3.30)

j D0

mit gegebenen Koeffizienten k ¤ 0 für k D 0; 1; : : : ; n  1. Man zeige: d

fj D 0 C 2 0

n X1 kD1

 . 2j C 1 /k  dk cos für j D 0; 1; : : : ; n  1: k 2n

(3.31)

Hinweis: Man verwende Teil (a) dieser Aufgabe mit den Setzungen N D 2n und fN 1j D fj für j D 0; 1; : : : ; n  1 beziehungsweise N k D k für k D 1; 2; : : : ; n und zeige für diese Situation noch dQN k D dQk für k D 1; 2; : : : ; n. Aufgabe 3.5. Für n 2 N sei f0 ; f1 ; : : : ; fn1 ein gegebener Datensatz reeller Zahlen. (a) Man zeige, dass mit den Koeffizienten dk aus (3.30) für das trigonometrische Polynom n X1

d

p./ D 0 C 2 0 Folgendes gilt:

p

 2j C 1   D fj 2n

kD1

dk cos k k

(3.32)

für j D 0; 1; : : : ; n  1: .n/

(b) Es sei P 2 …n1 das Interpolationspolynom zu den Stützpunkten .tj C1 ; fj / für j D 0; .n/

1; : : : ; n  1, wobei tj C1 D cos . .2j C 1/ = .2n/ / die Nullstellen des Tschebyscheff-Polynoms Tn der ersten Art vom Grad n bezeichnet. Man zeige, dass mit den Koeffizienten dk aus (3.30) Folgendes gilt: d

P .x/ D 0 C 2 0

n X1 kD1

dk T .x/: k k

(3.33)

Aufgabe 3.6 ( Numerische Aufgabe ). Man berechne entsprechend der Vorgehensweise in Teil (b) der Aufgabe 3.5 das Interpolationspolynom P 2 …n1 zu den beiden Funktionen

f .x/ D x 1=3 ;

x 2 Π0; 64 

bzw.

f .x/ D log .x/;

x 2 . 0; 1 

für die Werte n D 2m für m D 2; 4; : : : ; 10 und mit den Stützstellen aus Teil (b) der Aufgabe 3.5, wobei hierfür das Intervall Œ 1; 1  affin-linear auf Œ 0; 64  beziehungsweise Œ 0; 1  zu transformieren ist.

56

Kapitel 3 Diskrete Fouriertransformation und Anwendungen

Die Koeffizienten d0 ; d1 ; : : : ; dn1 ( mit den Faktoren k D 2 für k D 0; 1; : : : ; n  1 ) des Interpolationspolynoms P in der Darstellung (3.33) berechne man mit der schnellen Fouriertransformation. Man berechne außerdem den auftretenden Fehler an ( den linear zu transformierenden ) Stellen xj D 1 C j = 10 für j D 1; 2; : : : ; 20: Zur Auswertung von P .x/ D Pn1 d0 =2 C kD1 dk Tk .x/ verwende man die folgende Variante des Horner-Schemas:

bn

WD

bnC1 WD 0;

P .x /

D

.b0  b2 /=2:

bk WD 2 x bkC1  bkC2 C dk

Man weise noch die Richtigkeit der Identität (3.34) nach. Aufgabe 3.7. Man beweise Lemma 3.18.

für k D n  1; n  2; : : : ; 0; (3.34)

4

Lösung linearer Gleichungssysteme

In diesem Abschnitt werden Verfahren zur Lösung linearer Gleichungssysteme Ax D b vorgestellt, wobei A D .ajk / 2 R N N eine gegebene Matrix und b D .bj / 2 R N ein gegebener Vektor ist. Solche Gleichungssysteme treten in zahlreichen Anwendungen auf, wovon eine bereits aus Kapitel 2 über Splinefunktionen bekannt ist.

4.1 Gestaffelte lineare Gleichungssysteme Typischerweise überführt man lineare Gleichungssysteme Ax D b in eine gestaffelte Form, die dann einfach nach den Unbekannten aufzulösen ist. Solche gestaffelten linearen Gleichungssysteme werden zunächst kurz behandelt. Definition 4.1. Matrizen L; R 2 R N N der Form

0

1 p p p 0 0 ` B 11 C B pp C B `21 `22 p p p C p B C L D B p C; pp B pp C 0 p B C @ A `N 1 p p p p p p `N N

0

1 p p p r r r 1N C B 11 12 B pp C B 0 r22 p C C B R D B p ; p C pp pp B pp C p p p p B C @ A p p p 0 rN N 0

heißen untere beziehungsweise obere Dreiecksmatrizen. Es sind die Matrizen L beziehungsweise R regulär genau dann, wenn det .L/ D QN Q N j D1 `jj ¤ 0 beziehungsweise det .R/ D j D1 rjj ¤ 0 gilt.

4.1.1 Obere gestaffelte Gleichungssysteme Für die obere Dreiecksmatrix R D .rjk / 2 R N N mit rjk D 0 für j > k ist das entsprechende gestaffelte Gleichungssystem Rx D z für einen gegebenen Vektor z 2 R N von der Form

r11 x1 C r12 x2 C    C r1N xN

D

z1

r22 x2 C    C r2N xN

D

z2

ppp

ppp

pp

p

ppp

rN N xN

D zN

dessen Lösung z 2 R N für reguläres R zeilenweise von unten nach oben durch jeweiliges Auflösen nach der Unbekannten auf der Diagonalen berechnet werden kann, siehe Schema 4.1.

58

Kapitel 4

for j D N W 1 W 1

xj D

. zj



Lösung linearer Gleichungssysteme

N X

rjk xk /=rjj ;

end

kDj C1

Schema 4.1: Rekursive Auflösung eines oberen gestaffelten Gleichungssystems Rx D z Theorem 4.2. Für die Auflösung eines oberen gestaffelten Gleichungssystems sind N 2 arithmetische Operationen erforderlich. Beweis. In den Stufen j D N; N  1; : : : ; 1 der Schleife aus Schema 4.1 sind zur Berechnung der Unbekannten xj je N  j Multiplikationen und genauso viele Subtraktionen sowie eine Division durchzuführen, insgesamt erhält man die folgende Anzahl von arithmetischen Operationen,

N C 2

N X

.N  j / D N C 2

j D1

NX 1

m D N C .N  1/N D N 2 :

mD1

4.1.2 Untere gestaffelte Gleichungssysteme Für die untere Dreiecksmatrix L D .`jk / 2 R N N mit `jk D 0 für j < k ist das entsprechende gestaffelte Gleichungssystem Lx D b mit einem gegebenen Vektor b 2 R N von der folgenden Form,

`11 x1

D

b1

`21 x1 C `22 x2

D

b2

p pp

ppp

ppp

ppp

pp

p

`N 1 x1 C `N 2x2 C    C `N N xN

D bN

Dessen Lösung x 2 R N kann für eine reguläre Matrix L zeilenweise von oben nach unten durch jeweiliges Auflösen nach der Unbekannten auf der Diagonalen berechnet werden:

for j D 1 W N

xj D



bj 

jX 1

 `jk xk =`jj ;

end

kD1

Schema 4.2: Rekursive Auflösung eines regulären unteren gestaffelten Gleichungssystems Lx D b Dabei sind genauso viele arithmetische Operationen durchzuführen wie im Fall des oberen gestaffelten Gleichungssystems, nämlich N 2 ( vergleiche Theorem 4.2 ).

59

Abschnitt 4.2 Der Gauß-Algorithmus

4.2 Der Gauß-Algorithmus 4.2.1 Einführende Bemerkungen Seien wieder A D .ajk / 2 R N N eine gegebene Matrix sowie b D . bj / 2 R N ein gegebener Vektor. Im Folgenden wird der Gauß-Algorithmus beschrieben, der das Gleichungssystem Ax D b in ein äquivalentes oberes gestaffeltes Gleichungssystem Rx D z überführen soll, dessen Lösung x 2 R N dann leicht berechnet werden kann. In der ersten Stufe des Gauß-Algorithmus wird das gegebene Gleichungssystem

a11 x1 C a12 x2 C    C a1N xN

D

b1

a21 x1 C a22 x2 C    C a2N xN

D

b2

pp p

pp p

pp p

pp p

a N 1 x 1 C aN 2 x 2 C    C aN N x N

D bN

durch Zeilenoperationen in ein äquivalentes Gleichungssystem der Form

a11 x1 C a12 x2 C    C a1N xN

D

b1

.2/

.2/

D b2

pp p

pp p

pp p

a22 x2 C    C a2N xN

.2/

.2/

aN 2 x2 C    C aN N xN

9 > > > > > > > > =

.2/

(4.1)

> > > > > > > > ;

.2/

D bN

überführt. Falls a11 ¤ 0 gilt, so kann dieses erreicht werden mit Zeilenoperationen neue Zeile j WD alte Zeile j  `j 1  alte Zeile 1;

j D 2; 3; : : : ; N;

oder explizit

.aj 1  `j 1 a11 / x1 C .aj 2  `j 1 a12 / x2 C    C . ajN  `j 1 a1N / xN D bj  `j 1 b1 ƒ‚ … ƒ‚ … „ ƒ‚ … „ „ ƒ‚ … „ Š

D 0

.2/

.2/

DW aj 2

DW ajN

.2/

DW bj

mit der Setzung aj 1

`j 1 WD a ; 11

j D 2; 3; : : : ; N:

Nach diesem Eliminierungsschritt verfährt man im nächsten Schritt ganz analog mit dem System der unteren N  1 Gleichungen in (4.1). Diesen Eliminierungsprozess sukzessive durchgeführt auf die jeweils entstehenden Teilsysteme liefert zu Ax D b äquivalente Gleichungssysteme

A.s/ x D b .s/ ;

s D 1; 2; : : : ; N;

60

Kapitel 4

Lösung linearer Gleichungssysteme

wobei sich A.s/ 2 R N N und b .s/ 2 R N in der Reihenfolge

A D A.1/ ! A.2/ !

:::

! A.N / DW R

b D b .1/

:::

! b .N / DW z

! b .2/

!

ergeben mit Matrizen und Vektoren von der speziellen Form

0

A.s/

B B B B B B B D B B B B B B @

.1/

a11

.1/







.2/ a22 





a12

pp

p .s/

ass pp p

.s/

aN s

.1/

0

1

.1/

1

b1

a1N

B C C B .2/ C C B b2 C a2.2N/ C B C C B p C pp C p B C C p C B p C C 2 R N N ; b .s/ D B C 2 R N : (4.2) .s/ C .s/ C B    asN C B bs C B C C pp C B pp C B p C p C @ A A .s/ .s/    aN N bN

Hierbei wird vorausgesetzt, dass die auftretenden Diagonalelemente allesamt nicht .s/ verschwinden, ass ¤ 0 für s D 1; 2; : : : ; N; da anderweitig der Gauß-Algorithmus abbricht beziehungsweise die Matrix R singulär ist. Algorithmus 4.3. Ein Pseudocode für den Gauß-Algorithmus ist in dem folgenden Schema 4.3 angegeben. Dabei werden zur Illustration noch die Indizes .1/ ; .2/ ; : : : mitgeführt. In jeder Implementierung werden dann entsprechend die Einträge der ursprünglichen Matrix A sowie in dem Vektor b überschrieben. for s D 1 W N  1 for j

( **

A.s/ ! A.sC1/ ; b .s/ ! b .sC1/

** )

Zeile j

** )

D sC1WN

`js D

( **

.s/ .s/ ajs =ass ;

.sC1/ .sC1/ . aj;sC ; : : : ; ajN / 1

.sC1/ bj

D

D

.s/ bj



.s/ `js bs ;

.s/ .s/ .s/ .s/ . aj;sC ; : : : ; ajN /  `js . as;sC 1 ; : : : ; asN /; 1

end end Schema 4.3: Gauß-Algorithmus

M

Theorem 4.4. Für den Gauß-Algorithmus in Schema 4.3 sind 2N 3 3

.1

arithmetische Operationen erforderlich.

C O.

1

N

//

(4.3)

61

Abschnitt 4.2 Der Gauß-Algorithmus

Beweis. In der s -ten Stufe des Gauß-Algorithmus sind .N  s/2 C .N  s/ Multiplikationen und ebenso viele Additionen durchzuführen und außerdem sind .N  s/ Divisionen erforderlich, so dass insgesamt 2

NX 1

s2 C 3

sD1

NX 1

s D

sD1

. N  1 /N . 2N  1 / 3

C

3N . N  1 / 2

D

2N 3  1 3

 1  C O N

arithmetische Operationen anfallen. Das folgende Theorem liefert eine Klasse von Matrizen A 2 R N N , für die der GaußAlgorithmus durchführbar ist. Theorem 4.5. Ist die Matrix A D .ajk / 2 R N N strikt diagonaldominant, so ist der Gauß-Algorithmus zur Lösung von Ax D b durchführbar. Beweis. Es wird mit vollständiger Induktion über s D 1; 2; : : : ; N  1 nachgewiesen, dass die Matrizen

0

.s/ ass 

.s/

asN

1

B C B p ppp C B .s/ D B pp C 2 R .N sC1/.N sC1/ @ A .s/ .s/ aN    a s NN

(4.4)

strikt diagonaldominant sind. Für B .1/ D A ist dies nach Voraussetzung richtig, und wir nehmen nun an, dass für ein 1  s  N  2 die Matrix B .s/ strikt diagonaldomi.s/ nant ist. Dann gilt insbesondere ass ¤ 0, somit ist der Gauß-Eliminationsschritt auf .sC1/

B .s/ anwendbar und liefert die Matrix B .sC1/ D . ajk

/sC1j;kN 2 R .N s/.N s/

mit

.sC1/ .sC1/ . aj;sC ; : : : ; ajN / 1

D

.s/ .s/ .s/ .s/ . aj;sC ; : : : ; ajN /  `js . as;sC1 ; : : : ; asN /; 1

j D s C 1; : : : ; N;

mit den Koeffizienten .s/

.s/ `js D ajs =ass ;

j D s C 1; s C 2; : : : ; N:

Man erhält nun die strikte Diagonaldominanz der Matrix B .sC1/ : für j D s C 1; : : : ; N ergibt sich N X kDsC1 k¤j

.sC1/

jajk

j 

N X kDsC1 k¤j

.s/

jajk j C j`js j

N X

.s/

kDsC1 k¤j

jask j

.s/


0 eine Zahl ı > 0 mit

jˆ.x/  x j 

 jˆ.p/ . x / j pŠ

 C " jx  x jp

für x 2 B.x I ı/;

(5.6)

wobei im Fall p D 1 noch " > 0 so klein zu wählen ist, dass die Ungleichung jˆ0 .x /j C " < 1 erfüllt ist. Wenn man nun

 b ı WD min ¹ ı; .

x0 2 B.x Ib ı/

1 2C

/

1=.p1/

º;

C WD

jˆ.p/ . x / j pŠ

C "



wählt1 , so gilt auch xn 2 B.x I b ı/ für n D 1; 2; : : :, und (5.6) liefert dann die angegebene Konvergenzordnung  p . Unter der Zusatzbedingung ˆ.p/ .x / ¤ 0 gibt es wegen der Konvergenzaussage (5.5) für 0 < " < jˆ.p/ .x /j=pŠ eine Zahl ı > 0 mit

jˆ.x/  x j



 jˆ.p/ . x / j pŠ

  " jx  x jp

für x 2 B.x I ı/;

was die genaue Konvergenzordnung p liefert.

5.2.2 Das Newton-Verfahren im eindimensionalen Fall Zur Bestimmung einer Nullstelle x 2 R einer gegebenen Funktion f W R ! R wird im Folgenden das Newton-Verfahren

xnC1 D xn 

f . xn / f 0 . xn /

DW ˆ.xn /;

n D 0; 1; : : :

(5.7)

betrachtet. Die geometrische Bedeutung des Newton-Verfahrens ist in Bild 5.1 veranschaulicht. In dem nachfolgenden Theorem wird unter verschiedenen Voraussetzungen jeweils die Konvergenzordnung von Verfahren (5.7) angegeben2 . 1 2

vergleiche hierzu die Argumentation in Teil (b) der Bemerkung 5.4 unter Heranziehung von Theorem 5.5

105

Abschnitt 5.2 Der eindimensionale Fall

... .... .... .... ..... . . . . .... ..... ..... ..... ...... ...... . . . . ... ...... ...... ...... ...... ....... . . . . . . . ....... ......... .......... .......... ....... .. ............ . . . . . . ... . .......................................................... ....... .. ...... ....... ........ ....... ........ ....... .. . . . .. . . .. . 0 1 .. 2 ...... ........ ........ ........ ........ ........ ............ .. ......... ..................... . . . . . . . . .......... ...... ..... ...... ...... ..... ...... ...... ...... ..... ...... ...... ........ ........... . . . . . . . . . . ............ .............

f .x/

x

x

x

x

Bild 5.1: Veranschaulichung der Vorgehensweise beim Newton-Verfahren Theorem 5.6. Die Funktion f W R ! R besitze eine Nullstelle x 2 R und sei in einer Umgebung von x hinreichend oft differenzierbar. (a) Im Fall f 0 .x / ¤ 0 konvergiert das Newton-Verfahren (5.7) mindestens quadratisch. ( Falls f 00 .x / D 0 gilt, so ist es sogar konvergent von der Ordnung  p D 3. ) (b) Ist hingegen x eine m-fache Nullstelle von f mit einer Zahl m  2; gilt also

f .x/ D .x  x /m g.x/;

g.x / ¤ 0;

und ist die Funktion g zweimal differenzierbar in x , so ist die Iterationsfunktion ˆ aus (5.7) differenzierbar in x mit

ˆ0 .x / D 1 

1

m

:

(5.8)

Das Newton-Verfahren (5.7) ist in diesem Fall also ( genau ) linear konvergent. Beweis. Die Aussagen ergeben sich mit Theorem 5.5 angewandt auf die Funktion

ˆ.x/ WD x  f .x/=f 0 .x/ sowie mit den folgenden Darstellungen: im Fall (a) hat man ˆ0 D 1 

. f 0 /2  f f 00 . f 0 /2

D

f f 00 ; . f 0 /2

ˆ00 D

. f 0 /3 f 00 C f . f 0 /2 f 000  2ff 0 . f 00 /2 ; . f 0 /4

so dass also

ˆ0 .x / D 0;

ˆ.x / D x ;

ˆ00 .x / D

f 00 . x / f 0 . x /

gilt. Im Fall (b) erhält man

f 0 .x/ D m.x  x /m1 g.x/ C .x  x /m g 0 .x/ und somit

ˆ.x/ D x  ˆ0 .x/ D 1 

f .x / f 0. x /

D x 

. x  x /g . x / mg . x / C . x  x /g 0 . x /

DW

x 

Z. x / ; N .x /

Πg . x / C . x  x /g 0 . x /N . x /  Z . x /Π. m C 1 /g 0 . x / C . x  x /g 00 . x /

N . x /2

:

Dies liefert schließlich (5.8), also 0 < ˆ0 .x / < 1 und insbesondere auch ˆ0 .x / ¤ 0.

106

Kapitel 5 Nichtlineare Gleichungssysteme

5.3 Der banachsche Fixpunktsatz In Abschnitt 5.2.1 ist das allgemeine Verfahren (5.1) im eindimensionalen Fall N D 1 und für hinreichend glatte Iterationsfunktionen ˆ W R ! R sowie hinreichend gute Startwerte x0 betrachtet worden. Im folgenden Theorem nun wird lineare Konvergenz für das allgemeine Verfahren (5.1) nachgewiesen für den mehrdimensionalen Fall N  1 und ohne Differenzierbarkeitsbedingungen an ˆ, und als Startvektor werden beliebige Elemente x0 der zugrunde gelegten Menge zugelassen; überdies erhalt man die Existenz eines eindeutigen Fixpunktes. Dafür ist allerdings die globale Kontraktionseigenschaft (5.9) eine relativ schwer wiegende Forderung an die Iterationsfunktion ˆ. Theorem 5.7. Sei M  R N eine abgeschlossene Teilmenge, und die Abbildung ˆ W M ! M sei bezüglich einer Vektornorm jj  jj W R N ! R eine Kontraktion, das heißt, für eine Konstante 0 < L < 1 sei

jjˆ.x/  ˆ.y/ jj  Ljjx  y jj;

x; y 2 M;

(5.9)

erfüllt. Dann gilt Folgendes: 

ˆ besitzt genau einen Fixpunkt x 2 M;



Für jeden Startwert x0 2 M liefert die Fixpunktiteration3

xnC1 D ˆ.xn /;

n D 0; 1; : : :

(5.10)

eine gegen x konvergierende Folge, und es gilt genauer

jjxn  x jj 

L jjxn 1L

 xn1 jj 

Ln jjx1 1L

 x0 jj;

n D 1; 2; : : : : (5.11)

x  2 M Fixpunkte von ˆ, so gilt Beweis. Sind x ; b jjx  b x  jj D jjˆ.x /  ˆ.b x  / jj  Ljjx  b x  jj beziehungsweise .1  L/jjx  b x  jj  0, was x D b x  bedeutet. Im Folgenden soll die Existenz eines Fixpunktes von ˆ nachgewiesen werden, was mithilfe der Fixpunktiteration geschieht. Die dabei erzielten Zwischenergebnisse liefern dann auch unmittelbar die Abschätzungen (5.11). Sei also der Startvektor x0 2 M beliebig, und .xn /  R N bezeichne die zugehörige Folge der Fixpunktiteration (5.10). Mithilfe einer Teleskopsumme erhält man dann für n; k 2 N0 unter Verwendung von 3

vergleiche (5.1)

107

Abschnitt 5.3 Der banachsche Fixpunktsatz

jjxj C1  xj jj  Ljjxj  xj 1 jj für j D 1; 2; : : : die folgenden Abschätzungen: ˇˇ nCk ˇˇ X1 jjxnCk  xn jj D ˇˇ x`C1  x` ˇˇ  `Dn



nCk X1

 nCk X1

  k X1 `  L`n jjxnC1  xn jj D L jjxnC1  xn jj

`Dn

 

`D0

1  Lk jjxnC1 1L

L 1L

jjx`C1  x` j

`Dn

 xn jj 

jjxn  xn1 jj 

1 1L

Ln 1L

jjxnC1  xn jj

jjx1  x0 jj:

Damit gilt insbesondere

jjxnCk  xn jj 

L jjxn 1L

 xn1 jj 

Ln jjx1 1L

 x0 jj;

n; k  0;

(5.12)

und somit ist .xn /  R N Cauchyfolge mit einem Grenzwert, der zudem Fixpunkt von ˆ ist4 und daher mit x 2 M übereinstimmt. Der Grenzübergang “k ! 1” in (5.12) liefert die angegebene Abschätzung (5.11). Bemerkung 5.8. (a) Der Ausdruck .Ln =.1  L//jj x1  x0 jj in (5.11) kann für jedes n vor Beginn der Iteration bestimmt werden ( nur x1 wird hierzu benötigt ) und ermöglicht eine a priori-Fehlerabschätzung für den Approximationsfehler jjxn  x jj. (b) Der mittlere Ausdruck .L=.1  L//jjxn  xn1 jj in (5.11) hingegen kann im n-ten Iterationsschritt bestimmt werden und ermöglicht eine a posteriori-Fehlerabschätzung für den Approximationsfehler jjxn  x jj. (c) Praktisch geht man so vor: für eine vorgegebene Fehlerschranke " > 0 wird die Iteration in Schritt n D n."/ abgebrochen, falls erstmalig L 1L

jjxn  xn1 jj  "

gilt, und die a posteriori-Fehlerabschätzung garantiert dann die gewünschte Fehlerabschätzung jjxn  x jj  ". Die a priori-Fehlerabschätzung ermöglicht die Abschätzung  jj x1  x0 jj  . 1  L /" log . 1=L /

log

n."/  dae;

a D

(5.13)

für die Anzahl der nötigen Iterationsschritte, wobei dae die kleinste ganze Zahl  a bezeichnet. M 4

was aus der Bemerkung 5.2 folgt unter Beachtung der Tatsache, dass wegen der Kontraktionseigenschaft (5.9) die Abbildung ˆ insbesondere stetig ist

108

Kapitel 5 Nichtlineare Gleichungssysteme

Beispiel 5.9. Für

f .x/ WD x  e x ; f .x /

D

x 2 R;

für x 0:56714329

0

soll die Nullstelle x bestimmt werden unter Anwendung der Fixpunktiteration (5.1) mit der Iterationsfunktion

ˆ.x/ WD e x ;

x 2 R:

Auf dem Intervall M D Œ 0:5 ; 0:69  ist die Eigenschaft ˆ.M/  M ebenso erfüllt wie die Kontraktionseigenschaft (5.9) mit

L D

max x2Π0:5;0:69 

jˆ0 .x/j D

max x2Π0:5;0:69 

e x D e 1=2



0:606531:

In der folgenden Tabelle sind einige der durch das Verfahren (5.1) gewonnenen Iterierten aufgelistet, wobei als Startwert x0 D 0:55 gewählt ist und in der vorliegenden Situation das Verfahren von der speziellen Form xnC1 D e xn ; n D 0; 1; : : : ; ist.

n

xn

0 1 2 3 4 pp p

0:55000000 0:57694981 0:56160877 0:57029086 0:56536097 pp p

n

pp p 10 11 12 13 14 pp p

xn

pp p 0:56708394 0:56717695 0:56712420 0:56715412 0:56713715 pp p

n

pp p 20 21 22 23 24 pp p

xn

pp p 0:56714309 0:56714340 0:56714323 0:56714332 0:56714327 pp p

Die Situation soll für n D 12 genauer betrachtet werden. Die Fehlerabschätzung (5.11) liefert in diesem Fall 1:91  105



jx12  x j  8:13  105  1:70  104 ;

so dass die a posteriori-Abschätzung den wirklichen Fehler etwa um den Faktor 4 überschätzt, und die a priori-Abschätzung überschätzt den wirklichen Fehler etwa um den Faktor 10. Das praktische Vorgehen soll nun für die spezielle Fehlerschranke " D 0:0076 illustriert werden. Die a posteriori-Abschätzung liefert n."/ D 4 als Stoppindex, jx4  x j  ". Die Abschätzung (5.13) liefert mit n."/  16 eine Überschätzung. Schließlich ist anzumerken, dass schon in Schritt 2 der ( im Allgemeinen unbekannte ) Approximationsfehler die Schranke " unterschreitet, jx2  x j 0:0055  ". M

5.4 Das Newton-Verfahren im mehrdimensionalen Fall Für eine gegebene Funktion F W R N ! R N soll nun die Konvergenz des NewtonVerfahrens zur Lösung des Gleichungssystems F .x/ D 0 im mehrdimensionalen Fall N  1 untersucht werden.5 5

Für den eindimensionalen Fall sowie hinreichend gute Startwerte x0 ist dies bereits in Abschnitt 5.2.2 geschehen.

109

Abschnitt 5.4 Das Newton-Verfahren im mehrdimensionalen Fall

5.4.1 Einige Begriffe aus der Analysis In diesem Abschnitt werden einige Hilfsmittel aus der Analysis bereitgestellt. Im Folgenden wird mit jj  jj sowohl eine ( beliebig aber fest gewählte ) Vektornorm auf R N als auch die induzierte Matrixnorm bezeichnet. Bekanntlich heißt eine Funktion F W R N ! R N in einem Punkt x 2 R N differenzierbar, falls eine lineare Abbildung Dx F W R N ! R N existiert mit der Eigenschaft

jjF . x C h /  F . x /  .Dx F /.h/ jj ! 0 jjhjj

für RN 3 h ! 0:

Die Abbildung Dx F ist so eindeutig festgelegt und wird durch die Jacobi-Matrix repräsentiert,

0

.Dx F /.z/ D J.x/z;

B B B B B B B J.x/ WD B B B B B B B @

1 @F1 .x/ @x1

@F1 .x/ @x2



@F2 .x/ @x1

@F2 .x/ @x2



pp p

pp p

@FN @x1

.x/

@FN @x2

.x/   

@F1 .x/ @xN

C C C C C @F2 .x/ C C @xN C 2 R N N : C C pp C p C C C A @FN .x/ @xN

Die Funktion F W R N ! R N heißt auf einer Menge M  R N differenzierbar, falls sie in jedem Punkt x 2 M differenzierbar ist. Eine Menge M  R N heißt konvex, falls für je zwei Elemente x; y 2 M auch die Verbindungsstrecke von x nach y zu M gehört, das heißt,

®

x C t.y  x/ W 0  t  1

¯

 M;

x; y 2 M:

Im folgenden Lemma wird als Nachtrag zu Abschnitt 5.3 eine hinreichende Bedingung für die in Theorem 5.7 auftretende Kontraktionsbedingung (5.9) angegeben ( für ˆ D F ). Lemma 5.10. Eine gegebene Funktion F W R N ! R N sei auf einer offenen konvexen Menge M  R N differenzierbar, und für eine Konstante 0  L < 1 gelte

jjDx F jj  L;

x 2 M;

wobei Dx F mit der zugehörigen Jacobi-Matrix J.x/ identifiziert wird. Dann gilt die Abschätzung

jjF .x/  F .y/ jj  Ljjx  y jj;

x; y 2 M:

Beweis. Die Aussage R 1 des Lemmas ergibt sich unmittelbar aus dem Mittelwertsatz F .x/  F .y/ D 0 DyCt .xy/ F .x  y/ dt .

110

Kapitel 5 Nichtlineare Gleichungssysteme

Das nachfolgende Lemma über eine Variante der Taylorentwicklung für Funktionen mehrerer Veränderlicher wird beim Beweis des darauf folgenden Konvergenzresultats für das Newton-Verfahren benötigt. Lemma 5.11. Eine gegebene Funktion F W R N ! R N sei auf der offenen konvexen Menge M  R N differenzierbar, und für eine Konstante 0  L < 1 gelte

jjDx F  Dy F jj  Ljjx  y jj;

x; y 2 M:

Dann gilt die Abschätzung

j F .x/  F .y/  .Dy F /.x  y/jj 

L 2

x; y 2 M:

jjx  y jj2 ;

Beweis. Nach Voraussetzung ist für beliebige x; y 2 M die Funktion

' W Π0; 1  ! R N ;

t  F . y C t.x  y/ /

stetig differenzierbar auf dem Intervall Π0 ; 1 , und die Kettenregel liefert

' 0 .t/ D .Dy

C t . xy / F /.x

 y/;

0  t  1:

Für 0  t  1 erhält man so die Abschätzung

jj' 0 .t/  ' 0 .0/jj D jj.DyCt .xy/ F /.x  y/  .Dy F /.x  y/ jj  jjDyCt .xy/ F  Dy F jjjjx  y jj  Ltjjx  y jj2 : Wegen

 WD F .x/  F .y/  .Dy F /.x  y/ D '.1/  '.0/  ' 0 .0/ Z 1

D

0

' 0 .t/  ' 0 .0/ dt

erhält man so schließlich die Aussage des Lemmas, Z 1

jjjj 

0

jj' 0 .t/  ' 0 .0/jj dt  Ljjx  y jj2

Z 1 0

t dt D

L 2

jjx  y jj2 :

5.4.2 Das Newton-Verfahren und seine Konvergenz Im Folgenden wird das Newton-Verfahren

xnC1 D xn  .Dxn F /1 .F .xn //;

n D 0; 1; : : :;

zur Bestimmung einer Nullstelle der Funktion F betrachtet.

(5.14)

111

Abschnitt 5.4 Das Newton-Verfahren im mehrdimensionalen Fall

Bemerkung 5.12. In numerischen Implementierungen des Newton-Verfahrens geht man in den Schritten n D 0; 1; : : : jeweils so vor: Ausgehend von der bereits berechneten Iterierten xn 2 R N löst man zunächst das lineare Gleichungssystem .Dxn F /n D F .xn / und erhält anschließend xnC1 D xn C n , so dass auf die aufwändige Matrixinversion .Dxn F /1 verzichtet werden kann. M Das nachfolgende Theorem liefert unter gewissen Voraussetzungen quadratische Konvergenz sowie eine Menge von zulässigen Startvektoren x0 , die Existenz einer Nullstelle x wird vorausgesetzt. Theorem 5.13. Eine gegebene Funktion F W R N ! R N sei auf der offenen konvexen Menge M  R N differenzierbar, und x 2 M sei eine Nullstelle von F . Wenn für gewisse Zahlen r; ˇ; L > 0 Folgendes gilt,

B.xI r/  M;

jj.Dx F /1 jj  ˇ;

Dx F ist invertierbar;

jjDx F  Dy F jj  Ljjx  y jj;

x; y 2 M;

so ist für jeden Startwert

x0 2 B.x I ı/

mit ı WD min ¹ r;

1 º 2ˇL

das Newton-Verfahren (5.14) wohldefiniert, und es liegt lokale quadratische Konvergenz vor: für die Iterierten gilt

jjxnC1  x jj  ˇLjjxn  x jj2 

1 jjxn 2

 x jj;

n D 0; 1; : : : :

(5.15)

Beweis. Zunächst wird gezeigt, dass für jeden Vektor x 2 R N die folgende Implikation gilt:

jjx  x jj < ı

)

jj.Dx F /1 jj  2ˇ:

Dx F ist invertierbar;

(5.16)

Die Voraussetzung jjx  x jj < ı impliziert nämlich

WD jj.Dx F /1 jjjjDx F  Dx F jj  ˇLjjx  x jj  ˇLı 

1 ; 2

und Korollar 4.50 liefert dann die Invertierbarkeit von Dx F sowie die angegebene Abschätzung (5.16),

jj.Dx F /1 jj 

jj .Dx F /1 jj 1



ˇ 1 =2

D 2ˇ:

Die Wohldefiniertheit des Newton-Verfahrens (5.14) folgt dann aus der Abschätzung (5.16) zusammen mit der folgenden Aussage

xn 2 B.xI ı/;

n D 0; 1; : : : ;

(5.17)

die nun mit vollständiger Induktion nachgewiesen wird; nebenbei werden sich dann auch die Abschätzungen (5.15) ergeben.

112

Kapitel 5 Nichtlineare Gleichungssysteme

Nach Voraussetzung gilt x0 2 B.x I ı/, und für ein n 2 N0 sei nun bereits xn 2 B.xI ı/ gezeigt. Wegen (5.16) ist dann Dxn F invertierbar und xnC1 somit wohldefiniert, und es gilt

xnC1 D xn  .Dxn F /1 .F .xn // D xn  .Dxn F /1 .F .xn /  F .x // beziehungsweise ( unter Anwendung von Lemma 5.11 )

xnC1  x D xn  x  .Dxn F /1 .F .xn /  F .x // D .Dxn F /1 . F .x /  F .xn /  .Dxn F /.x  xn / /I jjxnC1  x jj D jj

jj

......

L

 2ˇ 2 jjxn  x jj2 D ˇLjjxn  x jj2 „ ƒ‚ …



1 jjxn 2

 x jj;

1=. 2ˇL /

woraus xnC1 2 B.x I ı/ folgt, und der vorhergehenden Zeile entnimmt man auch noch die Abschätzungen (5.15), was den Beweis von Theorem 5.13 komplettiert.

5.4.3 Nullstellenbestimmung bei Polynomen Für Polynome liefert das ( eindimensionale ) Newton-Verfahren unter günstigen Umständen die größte Nullstelle: Theorem 5.14. Gegeben sei ein reelles Polynom p.x/ 2 …r , das eine reelle Nullstelle 1 besitze, so dass 1  Re  für jede andere Nullstelle  2 C von p gilt.6 Dann sind für jeden Startwert x0 > 1 die Iterierten des Newton-Verfahrens

xnC1 D xn 

p . xn / ; p 0 . xn /

n D 0; 1; : : :;

streng monoton fallend, und

jxn  1 j ! 0

für n ! 1:

Beweis. Es bezeichne 1  2  : : :  ` die reellen Nullstellen sowie 1 ;  1 ; : : : ; m ;  m ( mit ` C 2m D r ) die komplexen Nullstellen des Polynoms p , das o. B. d. A. den führenden Koeffizienten eins besitze. Ganz allgemein erhält man mit den Wurzeln k eines Polynoms q 2 …r mit führendem Koeffizienten eins die folgenden Darstellungen für q und q 0 ,

q.x/ D

r Y kD1

6

.x  k /

q 0 .x/ D

r Y r X

.x  j / D

kD1 j D1 j ¤k

Hier bezeichnet wieder Re z den Realteil einer komplexen Zahl z 2 C.

r X kD1

1

x  k

 q.x/;

113

Abschnitt 5.4 Das Newton-Verfahren im mehrdimensionalen Fall

und somit gilt in der vorliegenden Situation ` Y

p.x/ D

.x  k /

j D1

kD1

p 0 .x/ D

m Y

 X ` kD1

1

.x  j / .x   j /;

C

x  k

m X

x  Re j

j D1

. x  j /. x   j /

2

p.x/:

(5.18)

Nun gilt für jedes  2 CnR

.x  /.x  / D x 2  2x Re  C j j2 D .x  Re /2  0;

>

x 2  2x Re  C .Re /2

x 2 R;

so dass in jedem Fall

p 0 .x/ > 0

p.x/ > 0;

für x > 1

und damit

x 

p. x / p0.x /


1

gilt. Andererseits gilt aber wegen der Darstellung (5.18) sowie wegen der Ungleichung ` X kD1

1

x  k

C

2



m X

x  Re j

j D1

. x  j /. x  j /

>

1

x  1

für x > 1

auch

x 

p. x / p 0. x /

>

1

für x > 1 :

Mittels vollständiger Induktion erschließt man, dass für einen Startwert x0 > 1 das Newton-Verfahren eine streng monoton fallende Folge x1 ; x2 ; : : : mit xk > 1 liefert, und dann liegt notwendigerweise Konvergenz vor mit einem Grenzwert, der als Fixpunkt der stetigen Iterationsabbildung ( vergleiche den Beweis von Theorem 5.6 ) auch Nullstelle von p ist und somit mit 1 übereinstimmt. Beispiel 5.15. Als Beispiel sei ein Polynom p 2 …11 betrachtet, dessen Nullstellen in der komplexen Ebene wie in Bild 5.2 verteilt seien. Hier liefert das Newton-Verfahren für einen hinreichend großen Startwert näherungsweise die Nullstelle 1 , und anschließende Anwendung des gleichen Verfahrens auf das deflationierte Polynom p1 .x/ D p.x/=.x  1 / liefert eine Näherung für die Nullstelle 2 ( wobei als Startwert x0 D 1 verwendet werden kann ). Ganz analog lässt sich eine Approximation für 3 gewinnen. Theorem 5.14 liefert jedoch keine Aussage darüber, wie die Nullstellen 4 und 5 numerisch bestimmt werden können. M

Für die praktische Umsetzung von Theorem 5.14 wird noch ein hinreichend großer Startwert benötigt. Das folgende Lemma liefert untere Schranken für mögliche Startwerte.

114

Kapitel 5 Nichtlineare Gleichungssysteme

1

6



3

2











5



3

4



-



2

1

2

3



1 Bild 5.2: Beispiel für die Verteilung der Nullstellen eines Polynoms elften Grades in der komplexen Ebene Lemma 5.16. Gegeben sei das Polynom

p.x/ D a0 C a1 x C : : : C ar1 x r1 C x r ; und  2 C sei eine beliebige Nullstelle von p.x/. (a) Es gelten die beiden Abschätzungen r ® ¯ X1 j j  max 1; jak j ;

® j j  max ja0 j; 1 C

kD0

max

1kr1

¯ jak j :

(b) Im Fall ak ¤ 0 für k D 1; : : : ; r  1 gelten die beiden Abschätzungen

j j  max

® ja0 j ja1 j

;

max

1kr1

2

jak j jakC1 j

¯ ;

j j 

r X1 kD0

jak j : jakC1 j

(c) Schließlich gilt noch

j j  q 1=r ;

falls

q WD

r X1

jak j < 1:

kD0

Beweis. Die frobeniussche Begleitmatrix zu dem Polynom p ist folgendermaßen definiert,

0

0

B B 1 ppp A WD B B pp p 0 @

a0 pp p pp p

1 C C C 2 R rr : C A

1 ar1 Für das zugehörige charakteristische Polynom gilt die Identität det . I  A/ D p. /

für 2 C;

(5.19)

115

Abschnitt 5.4 Das Newton-Verfahren im mehrdimensionalen Fall

wie im Folgenden nachgewiesen wird. Entwicklung der Determinante der Matrix I  A nach der letzten Zeile liefert

0

B 1 p p p B det . I  A/ D det B pp @ p

1

a0 pp p

ar2 1 C ar1 0 B 1 p p p B D . C ar1 / det B pp pp @ p p

C C C A 1

0

C B 1 p p p C B C C det B pp A @ p

1 ƒ‚ … D r1



1

a0 pp p pp p

1 ar2

C C C; A

und erneute Entwicklung der auftretenden Determinanten nach jeweils der letzten Zeile liefert

0

B 1 p p p B det B pp @ p

a0 pp p pp p

1 ak

1 C C C A

0

B 1 p p p B D ak det B pp @ p

1 pp

p

C C C A

0

B 1 p p p B C det B pp @ p

1 0

D a k k

B 1 p p p B C det B pp @ p

a0 pp p pp p

1 ak1

a0 pp p pp p

1 ak1

1 C C C A

1 C C C; A

für k D r  2; r  3; : : : ; 2, und schließlich gilt det



a0

1 a 1

! D a1 C a0 ;

was den Beweis der Identität (5.19) komplettiert. Aufgrund von (5.19) nun stimmt die Menge der Nullstellen des Polynoms p mit der Menge .A/ der Eigenwerte der Matrix A überein. Weiter gilt r .A/  jjA jj für jede durch eine komplexe Vektornorm induzierte Matrixnorm, vergleiche Bemerkung 4.39, und wegen r ¯ ® X1 jjA jj1 D max 1; jak j ;

® jjA jj1 D max ja0 j; 1 C

kD0

max

1kr1

¯ jak j ;

ergeben sich die Abschätzungen in (a). Für den Nachweis der Abschätzungen in (b) sei nun

D WD diag .a1 ; : : : ; ar1 ; 1 /:

116

Kapitel 5 Nichtlineare Gleichungssysteme

Die Matrix D 1 AD 2 R rr ist ähnlich zu der Matrix A, was .D 1 AD/ D .A/ beziehungsweise r .D 1 AD/ D r .A/ nach sich zieht. Weiter hat man die explizite Darstellung ( es gilt ar D 1 )

1

0 a0 =a1

0

B B B p B a1 =a2 p p B B p D 1 AD D B a2 =a3 p p B B B pp B p B @

C C C C C C C 2 R rr ; C C C C C A

a1 =a2 a2 =a3 pp p

0

ar1 =ar ar1 =ar so dass also die beiden Identitäten

jjD 1 AD jj1 D max

® ja0 j ja1 j

;

max

1kr1

2

jak j jakC1 j

¯ ;

jjD 1 AD jj1 D

r X1 kD0

jak j jakC1 j

gelten, und analog zu (a) ergeben sich die in (b) angegebenen Abschätzungen. Schließlich erhält man (c) folgendermaßen: wegen (a) ist in jedem Fall j j  1 erfüllt, und weiter gilt für jede Zahl x 2 C mit q 1=r < jx j  1 die Abschätzung

jp.x/j



jx jr 

r X1

jak jjx jk

>

q 

kD0

r X1

jak j D 0;

kD0

so dass sogar j jr  q gilt. Dies komplettiert den Beweis des Lemmas. Eine Anwendung der vier Abschätzungen in (a) und (b) aus Lemma 5.16 auf einige spezielle Polynome liefert die in der folgenden Tabelle angegebenen Resultate.

j j 

p.x/ x 2 C 1 D .x  i /.x C i / x 2  2x C 1 D .x  1/2

1

1





3

3

4

2 :5

Weitere Themen und Literaturhinweise Die numerische Lösung nichtlinearer Gleichungen wird ausführlich in Deuflhard [20] behandelt. Abschnitte über die numerische Lösung solcher Gleichungen findet man außerdem in jedem der im Literaturverzeichnis aufgeführten Lehrbücher über numerische Mathematik, beispielsweise in Deuflhard / Hohmann [22], Oevel [78], Schaback / Wendland [92] und in Werner [111]. Als eine Variante des in diesem Kapitel vorgestellten Newton-Verfahrens ist das gedämpfte Newton-Verfahren

xnC1 D xn  n .Dxn F /1 .F .xn //

für n D 0; 1; : : :

117

Übungsaufgaben

zu nennen, mit einer der Konvergenzbeschleunigung dienenden und geeignet zu wählenden variablen Schrittweite n . Eine weitere Variante des Newton-Verfahrens 1 stellen die Quasi-Newton-Verfahren xnC1 D xn  A n F .xn /; n D 0; 1; : : : dar, wobei die ( numerisch aufwändig zu berechnenden ) Jacobi-Matrizen Dxn F durch einfacher zu gewinnende Matrizen An Dxn F ersetzt werden. Einzelheiten zu den beiden genannten Varianten werden beispielsweise in [20] beziehungsweise in Freund / Hoppe [31], Geiger / Kanzow [32], Großmann / Terno [44], Kosmol [62], Mennicken / Wagenführer [71], Nash / Sofer [75], Schwetlick [95] sowie in Aufgabe 5.6 vorgestellt. Weitere Varianten wie das Sekantenverfahren beruhen auf Approximationen der Ableitungen durch Differenzenquotienten.

Übungsaufgaben Aufgabe 5.1. Gegeben sei die Gleichung

x C ln x D 0; deren eindeutige Lösung x im Intervall Œ 0:5; 0:6  liegt. Zur approximativen Lösung dieser Gleichung betrachte man die folgenden fünf Iterationsverfahren:

xnC1 WD e xn ;

xnC1 WD ln xn ; xnC1 WD

axn C e xn ; aC1

xnC1 WD

xnC1 WD .xn C e xn /=2; (5.20) an xn C e xn : an C 1

(5.21)

Welche der drei in (5.20) angegebenen Verfahren sind brauchbar? Man bestimme in (5.21) Werte a 2 R beziehungsweise a0 ; a1 ; : : : 2 R so dass sich jeweils ein Verfahren von mindestens zweiter Ordnung ergibt. Aufgabe 5.2. Die Funktion ln .x/ soll an der Stelle x D a > 0 näherungsweise berechnet werden. Dies kann beispielsweise mit dem Newton-Verfahren zur Bestimmung einer Nullstelle der Funktion

f .x/ D e x  a geschehen. Man gebe die zugehörige Iterationsvorschrift an und weise quadratische Konvergenz nach. Kann man die Konvergenzordnung p D 3 erwarten? Schließlich berechne man für a D 1 und Startwert x0 D 1 die ersten vier Iterierten x1 ; : : : ; x4 . Auf wie viele Nachkommastellen genau stimmen diese mit dem tatsächlichen Wert 0 D ln .1/ überein? Aufgabe 5.3. Zu einer kontraktiven Funktion ˆ W R N ! R N mit Kontraktionskonstante 0 < L < 1 bezeichne x 2 RN den Fixpunkt von ˆ, und der Vektor x0 2 R N sei beliebig. Die Folge . xnı /n2N0 sei gegeben durch

x0ı

WD

x0 C x0 ;

ı xnC 1

WD

ˆ.xnı / C xnC1 ;

n D 0; 1; : : :;

wobei jj xn jj  ı für n 2 N0 gelte bezüglich einer gegebenen Vektornorm jj  jj W RN ! R und einer gewissen Fehlerschranke ı . Man zeige Folgendes:

jj xnı  x jj 

ı 1L

C

Ln 1L

. . L C 2 /ı

C jj x1ı  x0ı jj /;

n D 0; 1; : : : :

118

Kapitel 5 Nichtlineare Gleichungssysteme

Aufgabe 5.4. Es sei die Abbildung ˆ W R 2 ! R 2 definiert durch

   sin x 1 x 1 C C y 4 : ˆ y D 2 1 C sin y C x (a) Man untersuche die Kontraktionseigenschaft von ˆ jeweils bezüglich jj  jj1 und jj  jj2 . (b) Man berechne den Fixpunkt . ; /> 2 R2 der Abbildung ˆ mittels der gewöhnlichen Fixpunktiteration, für den Startwert .x0 ; y0 /> D .0; 0/>. Wie oft ist bei Verwendung der a priori-Fehlerabschätzung zu iterieren, bis

jj .xn ; yn />  .; /> jj2  102 garantiert werden kann? Die entsprechende Frage stellt sich bei Anwendung der a posterioriFehlerabschätzung. Aufgabe 5.5. Gegeben sei das nichtlineare Gleichungssystem

uv C u  v  1 D 0; uv D 0:

³ (5.22)

(a) Man bestimme die exakten Lösungen des nichtlinearen Gleichungssystems (5.22). (b) Für die Startwerte

 x0 D

0 0

 und

1 1

x0 D

führe man jeweils den ersten Iterationsschritt des Newton-Verfahrens durch. Aufgabe 5.6. Für eine reguläre Matrix A 2 RN N ist die inverse Matrix X D A1 offensichtlich eine Lösung der nichtlinearen Gleichung

X 1  A D 0:

(5.23)

Das Newton-Verfahren zur Lösung der Gleichung (5.23) führt auf das Verfahren von Schulz

XnC1 WD Xn C Xn .I  AXn /;

n D 0; 1; : : : :

Man zeige: für jede Startmatrix X0 2 R N N mit jj I  AX0 jj  q < 1 ( mit einer gegebenen submultiplikativen Matrixnorm jj  jj W R N N ! R ) konvergiert die Matrixfolge X0 ; X1 ; p p p  R N N gegen die Matrix A1 mit den Abschätzungen

jj Xn  A1 jj 

jj X0 jj jj X0 jj .2n / jj I  AXn jj  q 1q 1q

für n D 0; 1; : : : :

Aufgabe 5.7 ( Numerische Aufgabe ). Man schreibe einen Code zur Lösung eines nichtlinearen Gleichungssystems mittels der folgenden Variante des Newton-Verfahrens:

xnC1 D xn  An F .xn /

für n D 0; 1; : : :;

mit

AkpCj D .Dxkp F /1

für

j D 0; 1; : : : ; p  1; k D 0; 1; : : : :

119

Übungsaufgaben

Hierbei bezeichnet Dx F die Jacobi-Matrix der Abbildung F im Punkt x . Man breche die Iteration ab, falls die Bedingung jj xn  xn1 jj2  tol erstmalig erfüllt ist oder falls n D nmax gilt. Hier sind p 2 N; nmax 2 N0 und tol > 0 frei wählbare Parameter. Man teste das Programm anhand des Beispiels

  u sin .u/ cos .v/ 0 F v WD D 0 ; 2 2 u Cv 3 mit den Parametern tol D 104 und nmax D 100 sowie mit den folgenden Startwerten beziehungsweise den folgenden Werten von p :

 (a) x0 D

1 1 ; p D 1I



 (c) x0 D

3 3 ; p D 1I

1 1 ; p D 5I

(b) x0 D

 (d) x0 D

3 3 ; p D 5:

Aufgabe 5.8. Die Funktion f 2 C 1 Œ a; b  sei streng monoton wachsend und konvex mit Nullstelle x 2 Œ a; b . Man zeige, dass für jeden Startwert x0 2 Œ x ; b  die Näherungen xn des Newton-Verfahrens gegen x konvergieren mit

xnC1  xn ;

n D 0; 1; : : : :

6

Numerische Integration von Funktionen

Zahlreiche Anwendungen wie etwa die Bestimmung von Flächen oder Normalverteilungen führen letztlich auf das Problem der Berechnung von Integralen

 .f / WD

Z b a

f .x/ dx

(6.1)

mit gewissen Funktionen f 2 C Œ a; b . Oftmals ist jedoch die Berechnung des Integrals (6.1) nicht möglich, da beispielsweise die Stammfunktion von f nicht berechnet werden kann oder die Funktionswerte von f als Resultat von Messungen nur an endlich vielen Stellen vorliegen. Beispiel 6.1. Die Preise von Kaufoptionen auf europäischen Finanzmärkten lassen sich unter gewissen vereinfachenden Annahmen ( zum Beispiel konstanten Volatilitäten ) mit der Black-Scholes-Formel explizit angeben. Für Details sei auf Günther / Jüngel [45] oder Hanke-Bourgeois [52] verwiesen. In unserem Zusammenhang ist von Interesse, dass dabei Auswertungen der Fehlerfunktion erf.x/ D

2

p



Z x 0

exp .t 2 / dt

für x  0

erforderlich sind. Deren Werte lassen sich jedoch lediglich näherungsweise bestimmen. M Man ist an einfachen Methoden zur näherungsweisen Berechnung des Integrals (6.1) interessiert, und hierzu werden im Folgenden Quadraturformeln

 n .f / D .b  a/

n X

k f .xk /;

(6.2)

kD0

herangezogen mit paarweise verschiedenen Stützstellen x0 ; x1 ; : : : ; xn 2 Œ a; b  und reellen Gewichten 0 ; 1 ; : : : ; n 2 R. Definition 6.2. Die Zahl r 2 N0 heißt Genauigkeitsgrad der Quadraturformel  n , wenn

 n .x m/ D  .x m /

für m D 0; 1; : : : ; r;

(6.3)

 n .x rC1 / ¤  .x rC1 / erfüllt ist. Der Genauigkeitsgrad einer Quadraturformel  n ist per Definition mindestens r 2 N0 , falls (6.3) gilt. Bemerkung 6.3. (a)  n W C Œ a; b  ! R ist offensichtlich eine lineare Abbildung, es gilt also

 n .˛f C ˇg/ D ˛ n .f / C ˇ n .g/

8 f; g 2 C Πa; b ;

˛; ˇ 2 R :

121

Abschnitt 6.1 Interpolatorische Quadraturformeln

(b) Wegen der Linearität der Quadraturformel  n und des Integrals  gilt:

 n besitzt den Genauigkeitsgrad r ´  n .P / D  .P / für alle Polynome P vom Grad  r; und ”  n .P / ¤  .P / für ein Polynom P vom (genauen) Grad D r C 1 ´  n .P / D  .P / für alle Polynome P vom Grad  r; und ”  n .P / ¤  n .P / für alle Polynom P vom (genauen) Grad D r C 1 M

6.1 Interpolatorische Quadraturformeln Definition 6.4. Interpolatorische Quadraturformeln  n .f / sind folgendermaßen erklärt: nach einer Festlegung von n 2 N0 sowie .n C 1/ paarweise verschiedenen Stützstellen x0 ; x1 ; : : : ; xn 2 Œ a; b  wird als Näherung für  .f / der Wert

 n .f / WD

Z b a

Qn .x/ dx

herangezogen, wobei Qn 2 …n das interpolierende Polynom zu den Stützpunkten .x0 ; f .x0 //; .x1 ; f .x1 //; : : : ; .xn ; f .xn // 2 R 2 bezeichnet. Bemerkung 6.5. Der Genauigkeitsgrad einer interpolatorischen Quadraturformel  n ist offensichtlich mindestens n. M Im Folgenden soll eine explizite Darstellung für  n .f / hergeleitet werden. Daraus resultiert dann auch die Darstellung (6.2) für die Quadraturformel  n .f / aus Definition 6.4. Theorem 6.6. Eine interpolatorische Quadraturformel  n besitzt die Gestalt

 n .f / D .b  a/

n X

k f .xk / mit k WD

Z 1 Y n 0

kD0

mD0 m¤k

t  tm tk  tm

dt;

x a

tm WD bm a : (6.4)

Beweis. Mit der lagrangeschen Interpolationsformel

Qn D

n X

f .xk /Lk

mit

n Y

Lk .x/ D

mD0 m¤k

kD0

x  xm xk  xm

Rb

Pn

erhält man  n .f / D kD0 f .xk / a Lk .x/ dx , und aus der nachfolgenden Rechnung resultiert dann die Aussage des Theorems, 1

Z b

ba a

Lk .x/ dx D

1

Z b n Y

ba a

mD0 m¤k

x  xm xk  xm

dx

./

D

Z 1 n Y 0

mD0 m¤k

t  tm tk  tm

dt D k ;

wobei man die Identität . / mit der Substitution x D .b  a/t C a erhält.

122

Kapitel 6 Numerische Integration von Funktionen

Bemerkung 6.7. (a) Der Vorteil in der Darstellung (6.4) ist in der Unabhängigkeit der Gewichte k sowohl von den Intervallgrenzen a und b als auch von der Funktion f begründet. Letztlich hängen die Gewichte nur von der relativen Verteilung der Stützstellen im Intervall Œ a; b  ab. (b) Für jede interpolatorische Quadraturformel  n .f / D .b  a/ n X

Pn

kD0

k f .xk / gilt

k D 1;

(6.5)

kD0

da ihr Genauigkeitsgrad mindestens n  0 beträgt und somit .b  a/  n .1/ D  .1/ D b  a gilt.

Pn

kD0 k

D M

6.2 Spezielle interpolatorische Quadraturformeln 6.2.1 Abgeschlossene Newton-Cotes-Formeln Die Newton-Cotes-Formeln ergeben sich durch die Wahl äquidistanter Stützstellen bei interpolatorischen Quadraturformeln. Wenn zusätzlich Intervallanfang und -ende Stützstellen sind, also x0 D a; xn D b gilt, so spricht man von abgeschlossenen Newton-Cotes-Formeln. Speziell gilt hier also ( für n  1 )

xk WD a C kh;

k D 0; 1; : : : ; n;

ba : n

h D

Lemma 6.8. Für die Gewichte 0 ; 1 ; : : : ; n der abgeschlossenen Newton-Cotes-Formeln gilt 1

k D n

Z n Y n sm 0

mD0 m¤k

km

für k D 0; 1; : : : ; n:

ds

(6.6)

Beweis. Aus der Identität (6.4) erhält man aufgrund von tk D k=n für die Gewichte die angegebene Darstellung,

k D

Z 1 Y n 0

mD0 m¤k

t  m=n .k  m/=n

dt D

1

n

Z n Y n sm 0

mD0 m¤k

km

ds;

wobei man die zweite Gleichung aus der Substitution t D s=n erhält. Die Darstellung (6.6) und die folgende Symmetrieeigenschaft der Gewichte der abgeschlossenen Newton-Cotes-Formeln ermöglichen die in den nachfolgenden Beispielen angestellten einfachen Berechnungen. Lemma 6.9. Für die Gewichte 0 ; 1 ; : : : ; n der abgeschlossenen Newton-Cotes-Formeln gilt

nk D k

für k D 0; 1; : : : ; n:

(6.7)

123

Abschnitt 6.2 Spezielle interpolatorische Quadraturformeln

Beweis. Für die lagrangeschen Basispolynome Lk gilt

Lnk .x/ D Lk .b C a  x/;

x 2 Πa; b ;

(6.8)

denn Lnk 2 …n und Q.x/ WD Lk .b C a  x/ 2 …n ; und

Q.xnj / D Lk . b C a  . a C .n  j /

ba n

//

D Lk . a C j

D Lk .xj / D ıkj D Lnk .xnj /

ba n

/

für j D 0; 1; : : : ; n;

und die Eindeutigkeit des interpolierenden Polynoms resultiert in der Identität (6.8). Daraus erhält man

nk

D

1

ba a

./

D

Z b

1

Z b

ba a

Lnk .x/ dx D

Z b

1

ba a

Lk .b C a  x/ dx

Lk .t/ dt D k ;

wobei man . / mit der Substitution x D b C a  t erhält. Beispiel 6.10. (a) Für n D 1 erhält man die Trapezregel,

 1 .f / D .b  a/

f .a/ C f .b / 2

Z b



a

f .x/ dx;

denn (6.5) und (6.7) liefern 0 C 1 D 1 und 0 D 1 , somit 0 D 1 D

1 : 2

(b) Für n D 2 erhält man die Simpson-Regel

 2 .f / D .b  a/

1 6

. f .a/

C 4f .

aCb 2

/

C f .b/ /

Z b a

f .x/ dx;

denn die Eigenschaften (6.5)–(6.7) ergeben Folgendes,

0 D

1 2

Z 2 s1 s2 0 01 02

ds D

1 ; 6

2 D 0 ;

1 D 1  0  2 D

2 : 3

Die geometrische Bedeutung der Trapez- und der Simpson-Regel ist in Bild 6.1 beziehungsweise Bild 6.2 dargestellt.

6

................... ....... .... ....... .. ...... .. ...... ... . ...... .. . ........ . .......... ... . . .......... .. . .... ... . ...... . . . . . . . .................... ..... . . . . . . . . . . . . . . . . . . . . . ................... .... ............................................................................................................ ................................................................... ................................................................... .................................. .................................................................................................... ................................................................... ................................................................... ..................................

6

f .x/

f .x/

0

-

a

b

Bild 6.1: Illustration zur Trapezregel

........ ...... . ........... . . . . ................................. . ....................... ................... . .......................................................................... . . . . . . . . . . . . . . . . . . ...... . . . . . ............................................................ . ....................................................................... ... ........................................................... ................................ ............................................................................................................ . . ................................................................................................................ ................................................................... .................................. .................................................................................................... ................................................................... ................................................................... .................................. ...................................................................

0

-

a

.a C b/=2

b

Bild 6.2: Illustration zur Simpson-Regel

124

Kapitel 6 Numerische Integration von Funktionen

(c) Der Fall n D 3 führt auf die Newtonsche 3/8-Regel

 3 .f / D .b  a/

1 8

. f .a/

C 3f .

2a C b 3

/

C 3f .

a C 2b 3

/

C f .b/ /

Z b a

f .x/ dx:

(d) In der Situation n D 4 erhält man die Milne-Regel

 4 .f / D

ba 90

Z b a

. 7f .a/ C 32f . 3a 4C b / C 12f . 2.a 4C b/ / C 32f . a C4 3b / C 7f .b/ /

f .x/ dx:

(e) Der Fall n D 8 liefert die folgende Quadraturformel,

 8 .f / D

ba 28350

. 989f .x0/

C 5888f .x1/  928f .x2/ C 10496f .x3/  4540f .x4/

C 10496f .x5/  928f .x6/ C 5888f .x7/ C 989f .x8/ /

Z b a

M

f .x/ dx:

Zu der zuletzt betrachteten Quadraturformel  8 .f / ist Folgendes anzumerken: 



Es treten negative Gewichte auf, wie überhaupt für n  8 bei den abgeschlossenen Newton-Cotes-Formeln. Dies widerspricht der Vorstellung des Integrals als Grenzwert einer Summe von Funktionswerten mit positiven Gewichten. Die Summe der Beträge der Gewichte übersteigt den Wert eins, was zu einer Verstärkung von Rundungsfehlern führt. Es gilt das folgende Theorem, das hier ohne Beweis angegeben wird. .n/

.n/

.n/

Theorem 6.11 (Satz von Kusmin). Die Gewichte 0 ; 1 ; : : : ; n nen Newton-Cotes-Formeln  n besitzen die Eigenschaft n X kD0

.n/

j k j ! 1

der abgeschlosse-

für n ! 1:

Aus den beiden genannten Gründen werden abgeschlossene Newton-Cotes-Formeln nur für kleine Werte von n angewandt.

6.2.2 Andere interpolatorische Quadraturformeln Beispiel 6.12.  Eine Rechteckregel lautet  0 .f / D .b  a/f .a/ ( hier ist n D 0 und x0 D a ), und eine weitere Rechteckregel ist  0 .f / D .b  a/f .b/ ( hier ist n D 0 und x0 D b ). Die Mittelpunktregel ist von der Form  0 .f / D .b  a/f . aCb / 2 und x0 D .a C b/=2 ).



( hier ist n D 0

Die geometrische Bedeutung der ersten Rechteck- und der Mittelpunktregel ist in Bild 6.3 beziehungsweise Bild 6.4 dargestellt. M

125

Abschnitt 6.3 Der Fehler bei der interpolatorischen Quadratur

6

6

..................... ....... .... ...... ... ...... .. ...... . ...... .. . ....... . .. ....... . . . . ... . ......... ..... . . ....................... . . . . . . .......................... . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . .. . . . . . . . .. . . . . . . . . .. . . . . . . . . . . . . . . .. . . . . . . . . .. . . . . . . . .. . . . . . . . . .. . . . . . . . . . . . . . . .. . . . . . . . . .. . . . . . . . .. . . . . . . . . .. . . . . . . . . . . . . . . .. . . . . . . . . .. . . . . . . . .. . . . . . . . . .. . . . . . . . . . . . . . . .. . . . . . . . . .. . . . . . . . .. . . . . . . . . .. . . . . . . . .

f .x/

f .x/ -

0

a

. . . . . . . . . . . . . . . . . . . . ..................... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ...... . . . . ................. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..... . . . . . . . . . ............... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .... . . . . . . . . . . . . . ............. . . . . . . . . . . . . . . . . . . . . . . . . . . . . ....... . . . . . . . . . . . . . . . . . ............. . . . . . . . . . . . . . . . . . . . . . . . ........... . . . . . . . . . . . . . . . . . . . . . ................ . . . . . . . .. . . . . . . . . . ............... . . . . . . . . . . . . . . . . . . . . . . . . . . . ....................... ............ ......... ... ............................... . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . .. . .. . .. . .. . . . . . . . . . . . . . . .. . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . .. . . . . . . . .. . . . . . . . . .. . . . . . . . . .. . . . . . . . . . .. . . . . . . . . .. . . . . . . . .. . . . . . . . . .. . . . . . . . . .. . . . . . . . . . .. . . . . . . . . .. . . . . . . . .. . . . . . . . . .. . . . . . . . . .. . . . . . . . . . .. . . . . . . . . .. . . . . . . . .. . . . . . . . . .. . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

-

0

b

a

Bild 6.3: Darstellung der Rechteckregel

.a C b/=2

b

Bild 6.4: Darstellung der Mittelpunktregel

6.3 Der Fehler bei der interpolatorischen Quadratur Im Folgenden wird eine Abschätzung für den bei der interpolatorischen Quadratur auftretenden Fehler vorgestellt. Insbesondere wird dabei deutlich, dass die interpolatorischen Quadraturformeln lediglich für kurze Intervalle Œ a; b  ( also für b  a 1 ) gute Näherungen an das zu bestimmende Integral darstellen. Vorbereitend wird noch folgende Sprechweise eingeführt: eine reellwertige Funkheißt von einem Vorzeichen auf dem Intervall Œ c; d , wenn ( sie dort definiert tion ist und ) .x/  0 für alle x 2 Œ c; d  oder .x/  0 für alle x 2 Œ c; d  gilt.

Pn

Theorem 6.13. Die interpolatorische Quadraturformel  n .f / D .ba/ kD0 k f .xk / besitze mindestens den Genauigkeitsgrad r  n, und die Funktion f W Œ a; b  ! R sei .r C 1/-mal stetig differenzierbar. Dann gilt die folgende Fehlerabschätzung,

j .f /   n .f /j  cr mit

cr

WD

min

Z 1 r Y

tnC1 ;:::;tr 2 Π0;1  0

kD0

. b  a /rC2 . r C 1 /Š

max jf .rC1/ ./j

 2 Πa;b 

(6.9)

jt  tk j dt; tk WD

xk  a ; ba

k D 0; 1; : : : ; n:

(6.10)

Wenn mit den Werten t0 ; t1 ; : : : ; tn aus (6.10) für eine bestimmte Wahl von tnC1 ; : : : ; tr 2 Q Œ 0; 1  das Produkt rkD0 .t  tk / von einem Vorzeichen in Œ 0; 1  ist, so gilt mit einer Zwischenstelle  2 Œ a; b  die folgende Fehlerdarstellung,

 .f /   n .f /

D

cr0

. b  a /rC2 .rC1/ f ./ . r C 1 /Š Z 1 r Y .t mit cr0 WD 0 kD0

(6.11)

 tk / dt:

(6.12)

Beweis. 1. Seien xnC1 ; : : : ; xr 2 Πa; b  beliebig aber so, dass x0 ; x1 ; : : : ; xr paarweise verschieden sind. Es soll in diesem ersten Teil des Beweises die unten stehende

126

Kapitel 6 Numerische Integration von Funktionen

Fehlerdarstellung (6.15) nachgewiesen werden. Sei dazu Qr 2 …r das zu den Stützpunkten .x0 ; f .x0 //; : : : ; .xr ; f .xr // gehörende interpolierende Polynom. Aufgrund der Darstellung (6.2) für  n erhält man

 n .f / D .b  a/

n X

n X

k f .xk / D .b  a/

kD0

k Qr .xk / D  n .Qr / D  .Qr /;

kD0

und somit

 .f /   n .f / D  .f /   .Qr / D

Z b a

f .x/  Qr .x/ dx:

(6.13)

Weiter gilt ( siehe Theorem 1.17 auf Seite 11 ) . !  /. x / f .rC1/ .  . x //

f .x/  Qr .x/ D

. r C 1 /Š

x 2 Πa; b ;

;

(6.14)

mit

!.x/ WD .x  x0 /    .x  xn /;

.x/ WD .x  xnC1 /    .x  xr /;

und einer geeigneten Zwischenstellenfunktion  W Œ a; b  ! Œ a; b . Man beachte, dass die rechte Seite der Gleichung (6.14) als Differenz zweier stetiger Funktionen selbst stetig und damit integrierbar ist. Weiter sei noch angemerkt, dass ! bereits durch die Quadraturformel festgelegt ist, während die Nullstellen von  noch variieren können. Aus (6.13) und (6.14) erhält man 1

 .f /   n .f / D

Z b

. r C 1 /Š a

.! /.x/ f .rC1/ .  .x/ / dx:

(6.15)

2. Es soll nun die Fehlerabschätzung (6.9) bewiesen werden, und hierzu seien xnC1 ; : : : ; xr 2 Œ a; b  beliebig. Dann wählt man Zahlen .m/ .m/ xnC 2 Œ a; b ; 1 ; : : : ; xr

m D 1; 2; : : :;

so dass Folgendes gilt, .m/

x0 ; x1 ; : : : ; xn ; xnC1 ; : : : ; xr.m/ .m/

xk

! xk

für m ! 1

Mit der Notation

m .x/ D

r Y kDnC1

paarweise verschieden;

.k D n C 1; : : : ; r/:

. x  xk.m/ /

erhält man aus der Identität (6.15) angewandt mit  D m sowie einem anschließenden Grenzübergang m ! 1 Folgendes:

j .f /   n .f /j  

1

max jf .rC1/ ./j

. r C 1 /Š  2 Œ a;b  ......

Z b a

Z

j.! m /.x/j dx b

a

j.! /.x/j dx C

j!.x/jjm.x/  .x/j dx ; „ ƒ‚ … ! 0 für m ! 1 Z b a

127

Abschnitt 6.3 Der Fehler bei der interpolatorischen Quadratur

wobei die Konvergenz des zweiten Terms aus der auf dem Intervall Œ a; b  vorliegenden gleichmäßigen Konvergenz m !  für m ! 1 resultiert. Somit erhält man 1

j .f /   n .f /j  b c r . r C 1 /Š max jf .rC1/ .x/j x 2 Œ a;b  mit ./

b cr

WD ./

D

Z b r Y

min

xnC1 ;:::;xr 2 Πa;b  a

.b  a/rC2

jx  xk j dx

kD0 Z 1 r Y

min

tnC1 ;:::;tr 2 Π0;1  0

jt  tk j dt;

kD0

wobei das Minimum in der Setzung . / aus Stetigkeitsgründen tatsächlich existiert, und . / resultiert aus der Substitution x D .b  a/t C a. Die Abschätzung (6.9) ist damit nachgewiesen. 3. Für den Nachweis von (6.11) betrachte man die Zahlen xk D .b  a/tk C a für k D n C 1; : : : ; r , so dass entsprechend der Voraussetzung die Funktion !  auf dem Intervall Œ a; b  von einem Vorzeichen ist, etwa

.! /.x/  0;

x 2 Πa; b :

Eine dem zweiten Teil dieses Beweises entsprechende Vorgehensweise liefert

 .f /   n .f / 

1 . r C 1 /Š



max f .rC1/ ./

 2 Πa;b 

C !

max jf

Z b a

.! /.x/ dx ! 0 für m ! 1 ‚ …„

.rC1/

 2 Πa;b 

./j Z b

1 max f .rC1/ ./ . r C 1 /Š  2 Œ a;b  a

Z b a

ƒ



j!.x/j jm .x/  .x/j dx

.! /.x/ dx

für m ! 1;

und analog folgt

 .f /   n .f / 

1

min f .rC1/ ./

. r C 1 /Š  2 Œ a;b 

Z b a

.! /.x/ dx:

Die Anwendung des Zwischenwertsatzes auf die stetige Funktion f .rC1/ liefert eine Zwischenstelle  2 Πa; b  mit

 .f /   n .f / D

1 . r C 1 /Š

f .rC1/ ./

Z b a

.! /.x/ dx;

(6.16)

und eine abschließende Substitution x D .b  a/t C a ergibt die Identität (6.11). Beispiel 6.14. 1. ( Rechteckregeln ) Für f 2 C 1 Œ a; b  gelten die Fehlerdarstellungen Z b a Z b a

f .x/ dx  .b  a/f .a/ D

. b  a /2

f .x/ dx  .b  a/f .b/ D 

2

f 0 .0 /;

. b  a /2 2

f 0 .1 /

(6.17) (6.18)

128

Kapitel 6 Numerische Integration von Funktionen

mit gewissen Zwischenstellen 0 ; 1 2 Œ a; b . Die Darstellung (6.17) beispielsweise erhält man aus Theorem 6.13 angewandt mit n D r D 0 und x0 D a beziehungsweise t0 D 0 unter Berücksichtigung von 0 Y

.t  tk / D t  0

c00 D

für 0  t  1;

kD0

Z 1 0

t 2 ˇˇt D1

t dt D

2 t D0

D

1 : 2

Analog leitet man die Darstellung (6.18) her. 2. ( Trapezregel ) In diesem Fall gilt für f 2 C 2 Œ a; b 

 .f /   1 .f / D 

. b  a /3

12

f 00 ./

(6.19)

mit einer Zwischenstelle  2 Œ a; b . Dies folgt aus Theorem 6.13 angewandt mit n D r D 1; x0 D a; x1 D b beziehungsweise t0 D 0; t1 D 1 unter Berücksichtigung von 1 Y

.t  tk / D t.t  1/  0

kD0

Z 1

c10 D

0

t.t  1/ dt D

für 0  t  1; t3 3



t 2 ˇˇt D1

2 t D0

1

D 6:

M

In dem vorangegangenen Beispiel wurde für n D 0 sowie für n D 1 verwendet, dass  n jeweils mindestens den Genauigkeitsgrad r D n besitzt. Analog kann man natürlich bei der Simpson-Regel ( hier ist n D 2 ) vorgehen. Dort kann man sich jedoch zu Nutze machen, dass in diesem Fall der Genauigkeitsgrad r D 3 vorliegt, was im folgenden Abschnitt für eine allgemeinere Situation nachgewiesen wird.

6.4 Der Genauigkeitsgrad abgeschlossener Newton-CotesFormeln  n für gerade Zahlen n Das folgende Lemma wird für den Beweis von Theorem 6.16 benötigt, das die wesentliche Aussage dieses Abschnitts 6.4 darstellt. Lemma 6.15. Sei n 2 N gerade, h D .b  a/=n, und xk D a C kh für k D 0; 1; : : : ; n. Für die Funktion

F .x/ WD

Z x n Y a

.y  xk / dy;

x 2 Πa; b ;

(6.20)

kD0

gilt

F .a/ D F .b/ D 0;

F .x/ > 0

für a < x < b:

Der Beweis von Lemma 6.15 wird am Ende von Abschnitt 6.4 nachgetragen.

(6.21)

129

Abschnitt 6.4 Genauigkeit abgeschlossener Newton-Cotes-Formeln

Theorem 6.16. Die abgeschlossenen Newton-Cotes-Formeln  n besitzen für gerades n  2 den Genauigkeitsgrad r D n C 1. Beweis. Er gliedert sich in zwei Teile. 1. Offensichtlich ist der Genauigkeitsgrad von  n mindestens n, siehe Bemerkung 6.5. Des Weiteren gilt  ..x  .a C b/=2 /nC1 / D 0; denn der Integrand ist eine ungerade Funktion bezüglich des Intervallmittelpunkts1 .a C b/=2. Im Folgenden wird

n



nC1 

. x  a C2 b /

D 0

(6.22)

nachgewiesen, woraus sich dann unmittelbar ergibt, dass der Genauigkeitsgrad von  n mindestens r D nC1 beträgt. Für den Nachweis von (6.22) setzt man h D .ba/=n und xk D a C kh für k D 0; 1; : : : ; n, so dass dann Folgendes gilt,

xn=2 xnk 

aCb 2

aCb

D

2

D a C

. x k 

D

aCb 2

n 2

h;

/;

k D 0; 1; : : : ;

n 2

 1:

Aufgrund der Symmetrieeigenschaft nk D k für k D 0; 1; : : : ; n ( siehe (6.7) ) erhält man daher

n



. x  a C2 b /

D .b  a/

nC1 

21   n=X nC1  a C b nC1 a C b nC1

k . xk  / C. xnk  a C b / / C n=2 . xn=2 

kD0

D .b  a/

21  n=X

2

2

2



k  0 C n=2  0

D 0;

kD0

was gerade die Aussage (6.22) darstellt. 2. Im Folgenden wird

 n .x nC2 / ¤  .x nC2 /

(6.23)

nachgewiesen, woraus sich zusammen mit dem ersten Teil des Beweises die Aussage des Theorems über den Genauigkeitsgrad von  n ergibt. Für den Nachweis von (6.23) betrachtet man für das Monom f .x/ D x nC2 und für eine beliebige Zahl xnC1 2 Œ a; b  mit xnC1 ¤ xk für k D 0; 1; : : : ; n die Fehlerformel (6.15) und integriert anschließend 1

Eine Erläuterung der Bezeichnung “ungerade bezüglich des Intervallmittelpunkts” findet sich im Beweisteil 2) von Lemma 6.15.

130

Kapitel 6 Numerische Integration von Funktionen

partiell:

D

Z b nC1 Y a

Z b  nC1 Y

1

 .x nC2 /   n .x nC2 / D

. n C 2 /Š

Z b

.x  xk / dx D

a

kD0

D

00

Z b a

  d nC2 dx nC2



kD0

a

 x nC2 .  .x/ / dx ƒ‚ …

 . nC2 /Š

F 0 .x/.x  xnC1 / dx

Z b

xDb

D F .x/.x  xnC1 /jxDa  (6.21)

a

.x  xk /

. F wie in (6.20) /

d  F .x/ dx . x  xnC1 / dx

F .x/  1 dx D 

Z b a

(6.21)

¤

F .x/ dx

0:

Dies komplettiert den Beweis des Theorems. Beispiel 6.17 (Simpson-Regel). Hier gilt für f 2 C 4 Œ a; b  die Fehlerdarstellung Z b a

f .x/ dx 

b  a 6

f .a/ C 4f .

aCb 2

/

C f .b/



D 

. b  a /5 2880

f .4/ ./

(6.24)

mit einer Zwischenstelle  2 Œ a; b , was aus Theorem 6.13 angewandt mit r D 3; n D 2; x0 D a; x1 D .a C b/=2; x2 D b beziehungsweise t0 D 0; t1 D 1=2; t2 D 1 resultiert. Für die Wahl t3 D 1=2 erhält man nämlich ( bezüglich der Notation siehe wieder Theorem 6.13 ) 3 Y

kD0

.t  tk / D t .t  12 /2 .t  1/  0 Z 1

c30 D

0

für t 2 Œ 0 ; 1 ;

t.t  12 /2 .t  1/ dt D 

1 ; 120

und mit Theorem 6.13 ergibt sich die in (6.24) angegebene Fehlerdarstellung,

 .f /   2 .f / D 

. b  a /5



1 f .4/ ./ 120

D 

. b  a /5 2880

f .4/ ./:

M

6.4.1 Der Beweis von Lemma 6.15 Die Identität F .a/ D 0 ist offensichtlich richtig, und für den Nachweis der weiteren Aussagen des Lemmas sei der Integrand in (6.20) wie folgt bezeichnet,

!.y/ D

n Y

.y  xk /;

y 2 R:

kD0

1) Es wird im Folgenden die Positivität der Funktion F auf der linken Hälfte des Intervalls Œ a; b  nachgewiesen,

F .x/ D

Z x a

!.y/ dy > 0;

a 0

für 0 < < h;

!.x1 C / < 0 :: :: :: : : :

für 0 < < h;

siehe Bild 6.5 für eine Darstellung des Verlaufs der Funktion ! . 0:01

0

.... .. .. .. .... ... .... .. .... .. . .. .. .. .. .. .. .... ... ... .. .. ... .. ... ... ............... .. ..... ...... ... .. ... ......... ............................................................................................................................................. ... ... .... .......... ... ...... ... .. .. .. .. .. . . .. .. ... .. .. .. .. .. .. .. .. .. . .. .. ... . .. ... .. .. .....

0:01

1 D x0 x1

x2

x3

x4

x5

x6

x7

x9 1 D x10

x8

Bild 6.5: Beispiel für den Verlauf der Funktion ! Allgemein gilt

!.x2j C / > 0; !.x2j C1 C / < 0

(6.26)

j D 0; 1; : : : ;

für 0 < < h;

n 2

 1:

1b) Weiter gilt

j!.y C h/j < j!.y/j

für a  y 

aCb 2

 h;

y 62 ¹ x0 ; : : : ; xn=21 º; (6.27)

denn !. y C h / !. y /

Qn

D

kD0 Q n

. y C h  xk /

. / kD0 y  xk

.y C h  a/

D

.y  b /

Qn1

kD0

Qn1

. y  xk /

. / kD0 y  xk

D

y Cha ; y b

und wegen der Annahmen in (6.27) gilt

jy C h  a j


ba 2

:

1c) Man erhält nun schließlich die in (6.25) angegebene Positivität der Funktion F : mit der Eigenschaft (6.26) erhält man unmittelbar Z x C 2j x2j

!.y/ dy > 0;

0< h

mit 0  j 

n=2  1 2

; (6.28)

132

Kapitel 6 Numerische Integration von Funktionen

und die Abschätzung (6.27) liefert Folgendes, Z x 2j C1 C x2j

!.y/ dy D

Z x 2j C x2j

>0

‚ …„ ƒ !.y/ C !.y C h/ dy C „ ƒ‚ …

0



…„

Z x 2j C1 x2j C

ƒ

!.y/ dy > 0;

D j !.yCh/ j

.0  j

0< h



n=2  2 2

/:

2) Schließlich soll nachgewiesen werden, dass die Funktion F gerade bezüglich des Intervallmittelpunkts ist,

F.

aCb 2

C / D F.

aCb 2

 /

für 0  

ba 2

:

(6.29)

Daraus resultiert dann aufgrund von F .a/ D 0 unmittelbar F .b/ D 0, und (6.25) zieht die Ungleichung F .x/ > 0 für .a C b/=2  x < b nach sich. Dies komplettiert den Nachweis der Aussagen in (6.21). 2a) Für den Beweis der Identität (6.29) wird benötigt, dass die Funktion ! unge xk D rade bezüglich des Intervallmittelpunkts .a C b/=2 D xn=2 ist: wegen aCb 2

. aCb  xnk / für k D 0; 1; : : : ; n gilt nämlich 2 !.

aCb 2

C y/ D

n Y kD0

./

D

n Y kD0

. a C2 b

. a C2 b

C y  xk / D 

n Y kD0

 y  xk / D ! .

aCb 2

. a C2 b

 y/

 y  xnk /

für 0  y 

ba 2

;

wobei man . / mit der Indextransformation k ! n  k erhält. 2b) Mit 2a) folgt schließlich die Identität (6.29):

F.

aCb 2

C / D

Z .aCb/=2 0

D F.

aCb 2

!.x/ dx C

Z .aCb/=2C .aCb/=2

!.x/ dx

 / C 0:

6.5 Summierte Quadraturformeln Rb

Zur numerischen Berechnung des Integrals  .f / D a f .x/ dx kann man beispielsweise das Intervall Œ a; b  mit Stützstellen

xk D a C kh

für k D 0; 1; : : : ; N

.h

D

ba N

/

(6.30)

versehen und die bisher betrachteten Quadraturformeln zur numerischen Berechnung der Integrale Z xk

xk1

f .x/ dx;

k D 1; 2; : : : ; N

verwenden. Die Resultate werden schließlich aufsummiert, und die so gewonnenen Formeln bezeichnet man als summierte Quadraturformeln. Im Folgenden werden einige Beispiele und die jeweils zugehörigen Fehlerdarstellungen vorgestellt.

133

Abschnitt 6.5 Summierte Quadraturformeln

6.5.1 Summierte Rechteckregeln Zwei Rechteckregeln sind in Beispiel 6.12 vorgestellt worden. Die summierten Rechteckregeln mit den äquidistanten Stützstellen aus (6.30) lauten dann entsprechend

T0 .h/ D h Tb 0 .h/ D h

NX 1 kD0 N X

Z b

f .xk /

a

f .x/ dx; ......

f .xk /

(6.31)

:

(6.32)

kD1

Die geometrische Bedeutung der summierten Rechteckregel (6.31) ist in Bild 6.6 dargestellt. Ihre approximativen Eigenschaften sind in dem nachfolgenden Theorem festgehalten. Theorem 6.18. Die Funktion f W Πa; b  ! R sei einmal stetig differenzierbar auf dem  2 Πa; b  mit Intervall Πa; b . Dann gibt es Zwischenstellen ; b Z b a

f .x/ dx  T0 .h/ D ......

ba 2

hf 0 ./;

(6.33)

ba  Tb 0 .h/ D  hf 0 .b /;

(6.34)

2

b 0 .h/ wie in (6.31) beziehungsweise (6.32). mit h D .b  a/=N , und mit T0 .h/ und T Beweis. Es wird hier nur die Fehlerdarstellung (6.33) betrachtet, den Nachweis für (6.34) führt man ganz analog. Für T0 .h/ liefert Beispiel 6.14 die Existenz einer Zwischenstelle k 2 Œ a; b  mit Z x k xk1

h2

f .x/ dx  hf .xk1 / D

2

f 0 .k /;

k D 1; 2; : : : ; N;

und Summation über k liefert Z b a

f .x/ dx  T0 .h/ D

N X h2 kD1

f 0 .k / D

2

ba 2

N 1 X

hN

f 0 .k /:

kD1

Aufgrund der Ungleichungen min f 0 .x/ 

x 2 Πa;b 

N 1 X

N

f 0 .k / 

kD1

max f 0 .x/

x 2 Πa;b 

existiert nach Anwendung des Zwischenwertsatzes auf die Funktion f 0 eine Zwischenstelle  2 Πa; b  mit

f 0 ./ D was die Fehlerdarstellung (6.33) liefert.

N 1 X

N

kD1

f 0 .k /;

134

Kapitel 6 Numerische Integration von Funktionen

6

6

.... ...... ............... ....... ... ...... .. . ... ..................................................................... . . ......................................................................................................................................................................... . . . ... .................................................................................................................................................................................................................. ........... . . . . . ...... ....................................................................................................................................................................................................................... . . . . . . . ........ ................. .......... .... ...................................................................................................................................................................................................................................................................................................... .. .. . .................................................................................................................................................................................................................................................................................................................................................................. .................................................................................................................................................................................................................................................. .. . . .................................................................................................................................................................................................................................................................................................................................................................... ................................................................................................................................................................................................................................................ .. . . ...........................................................................................................................................................................................................................................................................................

..... ...... ............... ....... ... ...... .. ... ................. . . .................................................................................................................................. . . . . . . . . . . . . . . . . . . . . . .. .............................................................................................................................................................................................................. . . . . ....... . . . . . . . . . . . ............................................................................................................................................ ............................................................................................................................................................................................................ ........................................................................................................................................................................................................................................................................................................................................................... .. . . .............................................................................................................................................................................................................................................................................................................................................................. ................................................................................................................................................................................................................................................. .. . . ................................................................................................................................................................................................................................................................................................................................................................. .............................................................................................................................................................................................................................................. .. . . .................................................................................................................................................................................................................................................................................................

f .x/

0

a D x0

x1

f .x/

b D x3

x2

0

a D x0

Bild 6.6: Summierte Rechteckregel

x1

x2

b D x3

Bild 6.7: Summierte Trapezregel

6.5.2 Summierte Trapezregel Die von der ( in Beispiel 6.10 definierten ) Trapezregel abgeleitete summierte Trapezregel mit den Stützstellen aus (6.30) lautet

T1 .h/ D

h 2

f .a/ C 2

NX 1

f .xk / C f .b/





kD1

Z b a

f .x/ dx:

(6.35)

Die geometrische Bedeutung der summierten Trapezregel (6.35) ist in Bild 6.7 veranschaulicht. Das nachfolgende Theorem liefert eine Fehlerdarstellung für diese summierte Quadraturformel. Theorem 6.19. Die Funktion f W Œ a; b  ! R sei auf dem Intervall Œ a; b  zweimal stetig differenzierbar. Dann gibt es eine Zwischenstelle  2 Œ a; b  mit Z b a

f .x/ dx  T1 .h/ D 

ba 12

h2 f 00 ./;

mit h D .b  a/=N und T1 .h/ wie in (6.35). Beweis. Der Beweis verläuft entsprechend dem Beweis von Theorem 6.18: es gibt ( siehe Beispiel 6.14 ) Zwischenstellen k 2 Œ a; b  mit Z x k xk1

f .x/ dx 

h 2

h3

Πf .xk1 / C f .xk / D  12 f 00 .k /;

k D 1; 2; : : : ; N;

und Summation über k liefert Z b a

f .x/ dx  T1 .h/ D 

N X h3 kD1

D 

ba 12

12

f 00 .k / D 

ba 12

h2

N 1 X

N

f 00 .k /

kD1

h2 f 00 ./

für eine Zwischenstelle  2 Œ a; b , wobei man die Existenz einer solchen Zwischenstelle durch Anwendung des Zwischenwertsatzes auf die Funktion f 00 erhält.

135

Abschnitt 6.6 Asymptotik der summierten Trapezregel

6.5.3 Summierte Simpson-Regel Die von der ( in Beispiel 6.10 vorgestellten ) Simpson-Regel abgeleitete summierte Simpson-Regel lautet

T2 .h/ D

h 6

N X

f .a/ C 4

f .xk1=2 / C 2

kD1

NX 1

f .xk / C f .b/





Z b a

kD1

f .x/ dx; (6.36)

mit den äquidistanten Stützstellen xk D a C kh; k  0, und mit h D .b  a/=N . Das nachfolgende Theorem liefert eine Fehlerdarstellung für die summierte SimpsonRegel. Theorem 6.20. Die Funktion f W Œ a; b  ! R sei auf dem Intervall Œ a; b  viermal stetig differenzierbar. Dann gibt es eine Zwischenstelle  2 Œ a; b  mit Z b a

f .x/ dx  T2 .h/ D 

ba 2880

h4 f .4/ ./;

mit h D .b  a/=N und T2 .h/ wie in (6.36). Beweis. Der Beweis verläuft wiederum entsprechend dem Beweis von Theorem 6.18. Für k D 1; 2; : : : ; N gibt es ( siehe Beispiel 6.17 ) Zwischenstellen k 2 Œ xk1 ; xk  mit Z x k xk1

f .x/ dx 

h 6

f .xk1 / C 4f .xk1=2 / C f .xk /



D 

h5 2880

f .4/ .k /;

und Summation über k liefert Z b a

f .x/ dx  T2 .h/ D 

N X kD1

D 

ba 2880

h5 2880

f .4/ .k / D 

ba 2880

h4

N 1 X

N

f .4/ .k /

kD1

h4 f .4/ ./

für eine Zwischenstelle  2 Œ a; b , wobei man die Existenz einer solchen Zwischenstelle durch Anwendung des Zwischenwertsatzes auf die Funktion f .4/ erhält. Bemerkung 6.21. Zwar ist die Zahl der erforderlichen Funktionsaufrufe bei der summierten Simpson-Regel doppelt so hoch wie bei den summierten Rechteckregeln oder der summierten Trapezregel. Für hinreichend glatte Funktionen f ist die Anwendung der summierten Simpson-Regel dennoch vorzuziehen, da sich beispielsweise M gegenüber der summierten Trapezregel die Genauigkeit quadriert.

6.6 Asymptotik der summierten Trapezregel In dem vorliegenden Abschnitt 6.6 wird für die summierte Trapezregel (6.35) eine asymptotische Entwicklung vorgestellt, die beim Einsatz von Extrapolationsverfahren ( siehe Abschnitt 6.7 ) Gewinn bringend eingesetzt werden kann.

136

Kapitel 6 Numerische Integration von Funktionen

6.6.1 Die Asymptotik Für die summierte Trapezregel T1 .h/ aus (6.35) wird im folgenden Theorem eine asymptotische Entwicklung angegeben, die gewisse Ähnlichkeiten mit einer Taylorentwicklung von T1 im Punkt h D 0 aufweist. ( Man beachte jedoch, dass T1 .h/ nur für diskrete positive Werte von h definiert ist. ) Theorem 6.22. Sei f 2 C 2rC2 Œ a; b ; r  0. Für die summierte Trapezregel

T1 .h/ D

h 2

f .a/ C 2

NX 1

f .xk / C f .b/





kD1

Z b a

.h

f .x/ dx

D

ba N

/

( vergleiche (6.35) ) gilt die folgende Darstellung:

T1 .h/ D 0 C 1 h2 C : : : C r h2r C RrC1 .h/; mit

0 D

Z b a

f .x/ dx;

RrC1 .h/ D O. h2rC2 /

(6.37)

für h ! 0;

(6.38)

und gewissen Koeffizienten 1 ; 2 ; : : : ; r 2 R. Beweis. Siehe Abschnitt 6.9. Es fällt auf, dass in (6.37) Terme mit ungeraden Potenzen von h nicht auftreten, was man sich zu Nutze machen kann. Mehr hierzu finden Sie in dem nachfolgenden Abschnitt 6.7 über Extrapolationsmethoden.

6.7 Extrapolationsverfahren 6.7.1 Grundidee Der vorliegende Abschnitt über Extrapolationsverfahren lässt sich inhaltlich Kapitel 1 über die Polynominterpolation zuordnen. Er wird erst hier präsentiert, da mit der vorgestellten Asymptotik der summierten Trapezregel nun eine spezielle Anwendung vorliegt. Für eine gegebene Funktion2 T .h/; h > 0; liege mit gewissen Koeffizienten 0 ; 1 ; : : : ; r 2 R das folgende asymptotische Verhalten vor,

T .h/ D 0 C 1 h C 2 h2 C : : : C r hr C O. h.rC1/ /

für h ! 0; (6.39)

mit einer Zahl > 0 und dem gesuchten Wert 0 D limh!0C T .h/. Für eine Nullfolge positiver, paarweiser verschiedener Schrittweiten h sei T .h/ bestimmbar. Wegen (6.39) gilt zunächst nur

T .h/ D 0 C O.h / 2

für h ! 0:

die typischerweise ein numerisches Verfahren repräsentiert, das zu zulässigen Diskretisierungsparametern h jeweils eine Approximation für eine gesuchte Größe 0 2 R liefert

137

Abschnitt 6.7 Extrapolationsverfahren

Mithilfe des im Folgenden vorzustellenden Extrapolationsverfahrens erhält man ohne großen Mehraufwand genauere Approximationen an die gesuchte Größe 0 ( siehe Theorem 6.26 unten ). Der Ansatz des Extrapolationsverfahrens ist folgender: zu ausgewählten positiven Stützstellen h0 ; h1 ; : : : ; hn wird das eindeutig bestimmte Polynom P0;:::;n 2 …n mit

P0;:::;n .hj / D T .hj /;

j D 0; 1; : : : ; n;

herangezogen3 und der Wert

P0;:::;n .0/ T .0/ als Approximation für T .0/ verwendet. Im Zusammenhang mit der summierten Trapezregel wird diese Vorgehensweise als Romberg-Integration bezeichnet und geht auf Romberg [87] zurück. Beispiel 6.23. Die prinzipielle Vorgehensweise bei der Extrapolation ist für n D 3 in M Bild 6.8 dargestellt.

.... .........

T .h0 /

.......................................................... ................... ............ .......... ........ . . . . . . .. ...... ..... 0 3 ..... .... 1 ....... . . ... .. ... ... .. . . ... ... .............................................. ... .......... ....... ... ....... ...... 2 ... ..... ...... . . . . . . . . ..... ... .... .... .... ..... ..... ... ....... ....... 3 ........... ...................................... ... . . . . ...... ....... ........ ................................

T .h /

P

;:::;

.h /

T .h /

T .h /

0 P0;:::;3 .0/

h3

h2

h1

..............................

h0

Bild 6.8: Darstellung der Vorgehensweise bei der Extrapolation; es ist P0;:::;3 2 …3

6.7.2 Neville-Schema Der Wert P0;:::;n .0/ T .0/ lässt sich mit dem Neville-Schema berechnen. Für positive, paarweise verschiedene Schrittweiten h0 ; h1 ; : : : sei hierzu Pk;:::;kCm 2 …m dasjenige Polynom mit

Pk;:::;kCm .hj / D T .hj /; 3

j D k; k C 1; : : : ; k C m;

Für ein Polynom P wird die Funktion h ! P . h / als Polynom in h bezeichnet.

(6.40)

138

Kapitel 6 Numerische Integration von Funktionen

und es bezeichne

Tk;:::;kCm WD Pk;:::;kCm .0/:

(6.41)

Die Werte Tk;:::;kCm lassen sich mit dem Neville-Schema (1.7) rekursiv berechnen: Theorem 6.24. Für die Werte Tk;:::;kCm aus (6.41) gilt Tk D T .hk / und

Tk;:::;kCm D TkC1;:::;kCm C

TkC1;:::;kCm  Tk;:::;kCm1

hk . hkCm /

. m  1;

 1

k  0 /:

Beweis. Mit der Darstellung (1.7) auf Seite 6 berechnet man leicht

Tk;:::;kCm D

h k TkC1;:::;kCm C h kCm Tk;:::;kCm1





hkCm

hkCm  hk

D TkC1;:::;kCm

.......

D



TkC1;:::;kCm  Tk;:::;kCm1



hkCm  hk

TkC1;:::;kCm  Tk;:::;kCm1

C



hk . hkCm /

:

1

Beispiel 6.25. Die zur summierten Trapezregel T1 .h/ ( hier gilt D 2 ) gehörenden Werte T0 ; T1 und T01 lauten für die Schrittweiten h0 D b  a und h1 D .b  a/=2 folgendermaßen,

T0 D

ba 2

. f .a/

D

b  a  f .a/ 2

b  a 6

2

C f.

aCb

f .a/ C 4f .

2

/

aCb 2

b  a  f .a/

T1 D

T1  T 0 41

T01 D T1 C D

C f .b/ /;

C

/

f .b /  2

2

C

2

b  a 6

f.

C f.

aCb 2

aCb 2

/

/

C

f .b / 2



f .b /  2

;

f .a/  2

 C f .b/ ;

so dass T01 der Simpson-Regel zur Approximation des Integrals spricht.

Rb a

f .x/ dx entM

6.7.3 Verfahrensfehler bei der Extrapolation Die betrachteten Schrittweiten h0 ; h1 ; : : : seien nun so gewählt, dass bezüglich einer h > 0 Folgendes gilt, Grundschrittweite b

hj D b h=nj

für j D 0; 1; : : : ;

mit 1 < n0  n1 < : : : :

(6.42)

Mit dem folgenden Theorem, das einen Spezialfall der in Bulirsch [9] betrachteten Situation darstellt, wird beschrieben, wie gut die Werte Tk;:::;kCm D Pk;:::;kCm .0/ den gesuchten Wert 0 D limh!0C T .h/ approximieren.

139

Abschnitt 6.7 Extrapolationsverfahren

Theorem 6.26. Sei T .h/; h > 0, eine Funktion mit der asymptotischen Entwicklung (6.39), mit gewissen Zahlen > 0 und r 2 N. Für eine Folge h0 ; h1 ; : : : von Schrittweiten mit der Eigenschaft (6.42) erfülle das Polynom Pk;:::;kCm 2 …m die Interpolationsbedingung (6.40), und Tk;:::;kCm sei wie in (6.41). Dann gilt im Fall 0  m  r  1 die asymptotische Entwicklung

Tk;:::;kCm D 0 C .1/m



mC1

nk    nkCm

b h. mC1 / C O .b h. mC2 / /

für b h ! 0:

Beweis. O. B. d. A. darf k D 0 angenommen werden. Gemäß der lagrangeschen Interpolationsformel gilt m X

P0;:::;m .h / D

T .hj /

h Y m

i h  hs

j D0

sD0 s¤j

für h 2 R ;



hj  hs

und somit m X

T0;:::;m D P0;:::;m .0/ D

cm;j T .hj /;

j D0

mit cm;j WD

(6.43) m Y

m Y



h sD0 s

hs

 hj

D

sD0 s¤j

s¤j

1 : 1  . ns =nj /

(6.44)

Nun gilt zum einen mC X1

T .hj / D

2/

k hk

C O. h.mC /; j j

(6.45)

kD0

und des Weiteren gilt nach Aufgabe 1.4 aus Kapitel 1 Folgendes, m X j D0

k

cm;j hj

8 ˆ
= > ;

für k D m C 1:

(6.46)

Die beiden Identitäten (6.45) und (6.46) eingesetzt in (6.43) ergeben dann

T0;:::;m D D

m X

cm;j

 mC X1

j D0 kD0 mC m X1  X kD0

j D0

k

k hj

k

cm;j hj



.mC2/

C O. hj

C

k

m X j D0



D 0 C .1/m mC1 h0 : : : hm C

/ .mC2/

cm;j O. hj

/

......



ƒ‚ … .mC2/

b / D O. h

h unter Beachtung der Tatsache, dass die Koeffizienten cm;j aus (6.44) nicht von b abhängen. Dies komplettiert den Beweis des Theorems.

140

Kapitel 6 Numerische Integration von Funktionen

Bemerkung 6.27. Prominente Unterteilungen sind: 



hj D hj 1 =2 für j D 1; 2; : : : mit h0 D b h

( Romberg-Folge )

b b b b b b b h h h h h h h h0 D b h; h1 D ; h2 D ; h3 D ; h4 D ; h5 D ; h6 D ; h7 D ; h8 D

b h 24

2

3

4

6

8

16

; : : :,

mit der Notation aus (6.42) allgemein nj D 2nj 2 für j  4 

12

hj 1 D b h=j für j D 1; 2; : : :

( Bulirsch-Folge )

( harmonische Folge )

M

Beispiel 6.28. Speziell soll ausgehend von der Basisunterteilung b h D .b  a/=N noch h=2j für j D 0; 1; : : : genauer betrachtet werden. Hier ist die Romberg-Folge hj D b die Bedingung (6.42) mit nj D 2j erfüllt, und unter den Bedingungen von Theorem 6.26 erhält man für n  r  1

T0;:::;n D 0 C



.1/n

nC1 2n. nC1 / =2



b h.nC1/ C O .b h.nC2/ /:

Zur Veranschaulichung soll das Resultat noch speziell für die summierte Trapezregel

T1 .h/ D

Z b a

f .x/ dx C O.h2 /

betrachtet werden, mit n D 2. Mit der in Schema 6.1 angedeuteten Vorgehensweise erhält man so mit wenig Aufwand die sehr viel genauere Approximation

T012 D

Z b a

f .x/ dx C

3 b6

64

h

C O.b h8 /:

M

T1 .h0 / D T0 & T1 .h1 / D T1 ! T01 & & T1 .h2 / D T2 ! T12 ! T012 Schema 6.1: Neville-Schema zu Beispiel 6.28

6.8 Gaußsche Quadraturformeln 6.8.1 Einleitende Bemerkungen Thema des vorliegenden Abschnitts ist die möglichst genaue numerische Berechnung gewichteter Integrale

 .f / WD

Z b a

f .x/%.x/ dx

(6.47)

141

Abschnitt 6.8 Gaußsche Quadraturformeln

wobei f W Œ a; b  ! R eine vorgegebene Funktion und % eine gegebene Gewichtsfunktion ist, siehe die folgende Definition. Hierbei werden zur Vereinfachung der Notation endliche Intervalle betrachtet, 1 < a  b < 1. Die nachfolgenden Betrachtungen lassen sich jedoch auf unendliche Intervalle übertragen. Definition 6.29. Es wird

% W Œ a; b  ! . 0; 1  Gewichtsfunktion genannt, wenn sie auf dem offenen Intervall .a; b/ stückweise stetig sowie über Œ a; b  integrabel ist. Zur numerischen Berechnung des Integrals (6.47) werden wieder interpolatorische Quadraturformeln

 n .f / D

n X

k f . k /;

(6.48)

kD1

herangezogen, wobei im Unterschied zur Formel (6.2) teils aus historischen Gründen hier jedoch 

die Stützstellen mit k bezeichnet werden,



die Summation bei k D 1 beginnt,



der Faktor b  a fehlt.

In diesem Abschnitt wird beschrieben, für welche Wahl der Stützstellen 1 ; 2 ; : : : ; n und Gewichte 1 ; 2 ; : : : ; n der Genauigkeitsgrad der zugehörigen interpolatorischen Quadraturformel einen möglichst hohen Wert annimmt. Die Begriffe interpolatorische Quadraturformel und Genauigkeitsgrad sind hierbei ganz kanonisch auf Integrale mit Gewichten zu übertragen ( wobei allerdings in den nachfolgenden Betrachtungen auch der Fall %  1 von Interesse ist ). Die resultierenden Formeln werden dann als gaußsche Quadraturformeln bezeichnet. Bei der Herleitung dieser Formeln werden orthogonale Polynome benötigt.

6.8.2 Orthogonale Polynome Definition 6.30. Zu gegebener Gewichtsfunktion % W Πa; b  ! . 0; 1  bezeichne

h p; q i D

Z b a

p.x/q.x/%.x/ dx;

jjp jj D h p; p i 1=2

für p; q 2 …:

Die Abbildung h ; ii W … … ! R definiert ein Skalarprodukt auf dem Raum aller reellen Polynome …, insbesondere ist also h ; ii linear in jedem seiner Argumente bei jeweils festem anderem Argument, und es gilt h p; p i > 0 für 0 ¤ p 2 …. Wir führen noch die folgende Notation ein. Definition 6.31. 1. Zwei Polynome p; q 2 … heißen orthogonal zueinander, wenn h p; q i D 0 gilt. 2. Das orthogonale Komplement von …n  … ist gegeben durch

…? n WD ¹ p 2 … W h p; q i D 0 8 q 2 …n º;

n D 0; 1; : : : :

142

Kapitel 6 Numerische Integration von Funktionen

Offensichtlich ist …? n ein linearer Unterraum von …. Eine spezielle Folge paarweise orthogonaler Polynome erhält man durch Gram-Schmidt-Orthogonalisierung der Monome 1; x; x 2 ; : : ::

p0 D 1;

(6.49)

pn D x n 

n X1 mD0

h x n ; pm i pm ; jj pm jj2

n D 1; 2; : : : :

(6.50)

Nach Konstruktion ist also pn ein Polynom vom genauen Grad n mit führendem Koeffizienten eins, und es gilt

pn 2 …? n1 :

(6.51)

Mit dem nachfolgenden Theorem wird eine Vorgehensweise vorgestellt, mit der sich diese Orthogonalpolynome effizient berechnen lassen. Theorem 6.32. Die Orthogonalpolynome in (6.49), (6.50) genügen der Drei-TermRekursion

p0 D 1;

p1 D x  ˇ 0 ;

pnC1 D .x  ˇn /pn  n2 pn1 ;

n D 1; 2; : : :;

mit den Koeffizienten

ˇn D

h xpn ; pn i jj pn jj2

für n D 1; 2; : : :;

n2 D

jj pn jj2 jj pn1 jj2

für n D 1; 2; : : : :

Beweis. Offenbar ist die angegebene Darstellung richtig für p0 und p1 . Für n  1 setzen wir

qnC1 WD .x  ˇn /pn  n2 pn1 und zeigen im Folgenden qnC1 D pnC1 . Dazu beobachtet man, dass qnC1 ( ebenso wie pnC1 ) ein Polynom mit genauem Grad n C 1 ist und den führenden Koeffizienten eins besitzt, und somit gilt

r WD pnC1  qnC1 2 …n :

(6.52)

Wir zeigen nun, dass qnC1 ( ebenso wie pnC1 ) im orthogonalen Komplement von …n liegt, so dass dann auch

r D pnC1  qnC1 2 …? n

(6.53)

gilt. Die Beziehungen (6.52) und (6.53) zusammen ergeben dann jjr jj2 D h r ; r i D 0 und damit wie behauptet pnC1 D qnC1 . Wie angekündigt wird nun

qnC1 2 …? n

(6.54)

143

Abschnitt 6.8 Gaußsche Quadraturformeln

nachgewiesen. Aufgrund der Identität h pn ; pn1 i D 0 und der Definition von ˇn gilt

h qnC1 ; pn i D h xpn ; pn i  ˇn jjpn jj2 D 0:

(6.55)

Weiter erhält man wieder wegen h pn ; pn1 i D 0 sowie aufgrund der Definition von n Folgendes,

h qnC1 ; pn1 i D h pn ; xpn1 i  n2 jjpn1 jj2 D h pn ; xpn1  pn i D 0; (6.56) wobei das letzte Gleichheitszeichen aus der Tatsache folgt, dass xpn1  pn ein Polynom vom Grad  n  1 darstellt. Ferner ist qnC1 auch orthogonal zu jedem Polynom vom Grad  n  2, denn es gilt

h qnC1 ; q i D h pn ; xq i  ˇn h pn ; q i  n2 h pn1 ; q i D 0 8 q 2 …n2 : „ ƒ‚ … „ ƒ‚ … „ ƒ‚ … D0

D0

(6.57)

D0

Wegen …n D span ¹ pn ; pn1 º ˚ …n2 folgt aus (6.55)–(6.57) die nachzuweisende Eigenschaft (6.54), mit der man wie bereits beschrieben pnC1 D qnC1 erhält. Das folgende Theorem liefert Aussagen über die Nullstellen der betrachteten Orthogonalpolynome. Theorem 6.33. Die Nullstellen 1 ; 2 ; : : : ; n des n-ten Orthogonalpolynoms pn in (6.50) sind einfach und liegen alle im offenen Intervall .a; b/. Sie besitzen die Darstellung4

k D

h xLk ; Lk i ; jj Lk jj2

Lk .x/ WD

n Y x  s k  s

für k D 1; 2; : : : ; n:

(6.58)

sD1 s¤k

Beweis. Es seien a < 1 < : : : < m < b . 0  m  n / diejenigen Nullstellen von pn in dem offenen Intervall .a; b/, an denen pn sein Vorzeichen wechselt, also diejenigen Nullstellen von pn in .a; b/ mit ungerader Vielfachheit. Im Folgenden wird m D n nachgewiesen. Wäre m  n  1, so hätte nämlich das Polynom

q.x/ WD

m Y

.x  k /

kD1

den Grad 0  m  n  1, so dass wegen (6.51)

h pn ; q i D 0

(6.59)

folgt. Nun ist aber das Polynom pn .x/q.x/ nach Konstruktion von einem Vorzeichen auf Πa; b , so dass

h pn ; q i D 4

Z b a

pn .x/q.x/ %.x/ dx ¤ 0

wobei L1 ; : : : ; Ln 2 …n1 die den Nullstellen 1 ; : : : ; n zugeordneten lagrangeschen Basispolynome darstellen

144

Kapitel 6 Numerische Integration von Funktionen

gilt im Widerspruch zu (6.59). Um zur Darstellung (6.58) zu gelangen, faktorisiert man pn in der Form

pn .x/ D .x  k /b q .x/; mit einem geeigneten Polynom b q 2 …n1 und erhält daraus 0 D h pn ;b q i D h xb q ;b q i  k h b q ;b q i: Hieraus folgt wegen h b q ;b qi ¤ 0

k D

h xb q;b qi jjb q jj2

D

h xLk ; Lk i ; jj Lk jj2

wobei sich die letzte Gleichung daraus ergibt, dass die Polynome b q und Lk bis auf einen konstanten Faktor übereinstimmen. Beispiel 6.34. In Tabelle 6.1 sind für verschiedene Intervalle und Gewichtsfunktionen die Bezeichnungen der zugehörigen orthogonalen Polynome aufgelistet. Intervall

Π1 ; 1 

%.x/

zugehörige orthogonale Polynome

1

Legendre-Polynome

Π1 ; 1 

p 1= 1  x 2

Π1 ; 1 

.1  x/˛ .1 C x/ˇ ; ˛ > 1; ˇ > 1

Jacobi-Polynome

.1; 1/

2 e x

Hermite-Polynome

.1; 1/

2 e x x ˛ ;

Tschebyscheff-Polynome der ersten Art Tn

˛ > 1

Laguerre-Polynome

Tabelle 6.1: Verschiedene Systeme von Orthogonalpolynomen Man beachte, dass in den beiden zuletzt genannten Beispielen anders als bisher angenommen unendliche Intervalle betrachtet werden; hierzu sei auf die Bemerkung eingangs dieses Abschnitts 6.8 verwiesen. M

6.8.3 Optimale Wahl der Stützstellen und Gewichte Das folgende Theorem beschreibt, unter welchen Bedingungen an n Stützstellen und Gewichte der Genauigkeitsgrad einer Quadraturformel 2n  1 beträgt. Theorem 6.35. Für ein n 2 N seien 1 ; : : : ; n 2 R paarweise verschiedene Zahlen, und weiter seien 1 ; : : : ; n 2 R beliebig. Dann und nur dann gilt

h p; 1 i D

n X

k p. k /

für p 2 …2n1 ;

kD1

wenn die folgenden Bedingungen (a) und (b) erfüllt sind,

(6.60)

145

Abschnitt 6.8 Gaußsche Quadraturformeln

(a) die Zahlen 1 ; : : : ; n 2 R stimmen mit den Nullstellen des n-ten orthogonalen Polynoms pn ( siehe (6.58) ) überein, (b) die Gewichte 1 ; 2 ; : : : ; n haben die Gestalt

k D h Lk ; 1 i

für k D 1; 2; : : : ; n;

wobei L1 ; L2 ; : : : ; Ln 2 …n1 die den Zahlen 1 ; 2 ; : : : ; n zugeordneten lagrangeschen Basispolynome darstellen5 . Unter diesen Bedingungen gilt auch k D h Lk ; Lk i > 0 für k D 1; 2; : : : ; n: Beweis. “ )” Es gelte (6.60), und zum Beweis von (a) setzen wir

q.x/ WD .x  1 /    .x  n / und weisen im Folgenden die Identität q D pn nach. Hierzu wendet man die Identität (6.60) auf das Polynom p.x/ WD x m q.x/ mit m 2 ¹ 0; 1; : : : ; n  1 º an und erhält

h q; x m i D h x m q; 1 i D

n X

k m k q. k / D 0 „ƒ‚… kD1

für m D 0; 1; : : : ; n  1;

D0

was insgesamt

q 2 …? n1 und damit q  pn 2 …? n1 nach sich zieht. Außerdem ist q ein Polynom mit genauem Grad n und führendem Koeffizienten eins, so dass sich die Eigenschaft q pn 2 …n1 ergibt, was schließlich ( wie im Beweis des vorigen Theorems 6.32 ) q D pn liefert. Teil (b) ergibt sich wegen Lj . k / D ıjk unmittelbar aus der Identität (6.60) angewandt mit p D Lj . “( ” Es gelte nun (a), (b), und p 2 …2n1 sei beliebig. Dann lässt sich das Polynom p in der Form6

p D qpn C r schreiben mit gewissen Polynomen q; r 2 …n1 . Wegen pn . k / D 0 gilt dann

p. k / D r. k /;

k D 1; 2; : : : ; n;

und mit der lagrangeschen Interpolationsformel erhält man

r.x/ D

n X

r. k /Lk .x/ D

kD1

n X

p. k /Lk .x/:

kD1

Dies führt dann auf die angegebene Identität (6.60):

h p; 1 i D h q; pn i C h r ; 1 i D „ ƒ‚ … D 0

n X kD1

p. k /hh Lk ; 1 i D

n X

k p. k /:

kD1

Die angegebene Darstellung k D h Lk ; Lk i > 0 für die Gewichte ergibt sich aus der Darstellung (6.60) angewandt auf das Polynom p D L2k . 5 6

vergleiche (6.58) nach Polynomdivision mit Rest

146

Kapitel 6 Numerische Integration von Funktionen

Bemerkung 6.36. Man beachte, dass hier ( im Unterschied zu den abgeschlossenen Newton-Cotes-Formeln ) die Gewichte in jedem Fall positiv ausfallen7 . M Definition 6.37. Die Quadraturformel

 n .f / WD

n X

k f . k /

für f 2 C Œ a; b ;

(6.61)

kD1

mit den Stützstellen 1 ; : : : ; n 2 R und Gewichten 1 ; : : : ; n wie in (a) und (b) aus Theorem 6.35 bezeichnet man als gaußsche Quadraturformel. Als eine unmittelbare Konsequenz aus Theorem 6.35 erhält man: Korollar 6.38. Die gaußsche Quadraturformel (6.61) ist interpolatorisch und besitzt mindestens den Genauigkeitsgrad r D 2n  1. Beweis. Zu einer gegebenen Funktion f 2 C Œ a; b  sei Qn1 2 …n1 das interpolierende Polynom zu den Stützpunkten . 1 ; f . 1 / /; . 2 ; f . 2 / /; : : : ; . n ; f . n / /. Aus der Eigenschaft (6.60) erhält man die erste Aussage, n X

k f . k / D

kD1

n X

k Qn1 . k / D h Qn1 ; 1 i ;

kD1

und die angegebene untere Schranke für den Genauigkeitsgrad folgt ebenfalls unmittelbar aus (6.60). Mit dem folgenden Resultat wird die Fehleraussage aus Theorem 6.13 ( siehe Seite 125 ) auf die vorliegende Situation der gewichteten Integrale übertragen. Theorem 6.39. Für den Fehler bei der Gaußquadratur (6.61) gilt unter der Voraussetzung f 2 C 2n Œ a; b  die Darstellung

 .f /   n .f / D D



Z b  1 p 2 .x/ %.x/ dx f .2n/ ./ . 2 n /Š a n

Z n . b  a /2nC1  1  Y .t . 2n /Š 0 kD1

(6.62)

   tk /2 %. .b  a/t C a / dt f .2n/ ./ (6.63)

k a für k D 1; 2; : : : ; n, und mit einer geeigneten Zwischenstelle  2 Œ a; b . mit tk WD ba

Beweis. Der Genauigkeitsgrad bei der Gaußquadratur (6.61) beträgt nach Korollar 6.38 mindestens r D 2n  1. Wählt man zu den Stützstellen 1 ; 2 ; : : : ; n nun die weiteren Stützstellen nC1 D 1 ; : : : ; 2n D n , so ist 2n Y

kD1

.x  k / D

n Y

.x  k /2 D pn2 .x/

kD1

von einem Vorzeichen, und man erhält dann die Resultate (6.62)–(6.63) mit der gleichen Vorgehensweise wie in den Teilen 1 und 3 des Beweises von Theorem 6.13. 7

vergleiche hierzu die Anmerkungen vor Theorem 6.11

147

Abschnitt 6.8 Gaußsche Quadraturformeln

Bemerkung 6.40. 1. Als unmittelbare Konsequenz aus Theorem 6.39 ergibt sich, dass der Genauigkeitsgrad der gaußschen Quadraturformeln genau r D 2n  1 beträgt. Dies ist optimal; für die Situation % D 1 siehe hierzu Aufgabe 6.2. 2. Man kann auch summierte gaußsche Quadraturformeln betrachten und anwenden; die Resultate aus Abschnitt 6.5 lassen sich ganz kanonisch übertragen. M

6.8.4 Nullstellen von orthogonalen Polynomen als Eigenwerte Für größere Werte von n steht man noch vor dem Problem, die Nullstellen des n-ten orthogonalen Polynoms pn sowie die Gewichte 1 ; : : : ; n zu bestimmen. Dazu gehen wir im Folgenden davon aus, dass die Koeffizienten ˇj und j in der Rekursion

p0 D 1;

p1 D x  ˇ 0 ;

(6.64)

2

pj C1 D .x  ˇj /pj  j pj 1 ;

j D 1; 2; : : :;

(6.65)

explizit bekannt sind und betrachten dann die symmetrische Matrix

0

ˇ0

 1

0

B B B  1 ˇ1  2 B B :: J D B 0 :  2 B B :: : : :: :: B : @ 0

:::

0

::: :: : :: : :: :

0

1

C C C C C nn : 0 C 2 R C C  n1 C A ˇn1 :: :

 n1

(6.66)

Theorem 6.41. Die Nullstellen 1 ; 2 ; : : : ; n des n-ten Orthogonalpolynoms pn stimmen mit den Eigenwerten der Matrix J überein, und die Gewichte ergeben sich daraus folgendermaßen:

k D h 1 ; 1 i =

 n X1 j D0

j2 pj2 . k /



für k D 1; 2; : : : ; n;

(6.67)

mit den Zahlen

°

j WD

1

.1/j =. 1 2    j /

für j D 0; für j D 1; 2; : : : ; n  1:

Beweis. Es wird zunächst Folgendes nachgewiesen, Jv .k/ D k v .k/

für k D 1; 2; : : : ; n;

(6.68)

mit dem Vektor

v .k/ D

. 0 p0 . k /; „ ƒ‚ … D 1

>

1 p1 . k /; : : : ; n1 pn1 . k / /

2 Rn:

148

Kapitel 6 Numerische Integration von Funktionen

Es ist

. Jv .k/ /1 D ˇ0  1  1 1 p1 . k / D ˇ0 C p1 . k / D ˇ0 C k  ˇ0 .k/

D k D k v1 ; und weiter erhält man aus den Rekursionsformeln (6.65) mit x D k Folgendes ( wobei in der nachfolgenden Situation j D n  1 noch n WD n WD 0 gesetzt wird und pn . k / D 0 zu beachten ist ):

. Jv .k/ /j C1 D  j j 1 pj 1 . k / C ˇj j pj . k /  j C1 j C1 pj C1 . k /  .1/j  2 j pj 1 . k / C ˇj pj . k / C pj C1 . k / D 1    j „ ƒ‚ … D j

.k/

D j k pj . k / D k vj C1

für j D 1; 2; : : : ; n  1;

und (6.68) ist damit bewiesen. Im Folgenden soll noch die Darstellung (6.67) nachgewiesen werden. Die Identität (6.68) bedeutet noch, dass v .k/ Eigenvektor zum Eigenwert k der Matrix J ist. Gemäß Theorem 6.33 sind diese Eigenwerte paarweise verschieden, und aus der Symmetrie der Matrix J erhält man dann >

v .k/ v .`/ D 0

für k ¤ `:

(6.69)

Aufgrund der paarweisen Orthogonalität der Polynome p0 ; p1 ; : : : sowie wegen Theorem 6.35 gilt

ıj 0 h 1 ; 1 i D h pj ; 1 i D

n X

` pj . ` /

für j D 0; 1; : : : ; n  1;

(6.70)

`D1

und Multiplikation von (6.70) mit j2 pj . k / sowie anschließende Summation über j liefert

h 1; 1 i D D

n n X1 X j D0 `D1 n X

` j2 pj . k / pj . ` / D

n X `D1

`

n X1 j D0

j2 pj . k / pj . ` /

` .v .k/ />v .`/ D k .v .k/ />v .k/ ;

`D1

wobei in der letzten Gleichheit noch die Orthogonalitätsbeziehung (6.69) eingeht. Dies liefert die Aussage (6.67). Bemerkung 6.42. Die gesuchten Eigenwerte der Matrix J aus (6.66) können für größere Werte von n nur numerisch berechnet werden. Entsprechende Methoden werden in Kapitel 13 vorgestellt. M

149

Abschnitt 6.9 Beweis der Asymptotik für die summierte Trapezregel

6.9 Nachtrag: Beweis der Asymptotik für die summierte Trapezregel 6.9.1 Bernoulli-Polynome Definition 6.43. Die Bernoulli-Polynome Bk sind rekursiv erklärt: B0 .x/  1; und für k D 1; 2; : : : gilt

Bk .x/ D Ak C k

Z x 0

x 2 Π0; 1 ;

Bk1 .t/ dt;

mit Ak WD k

Z 1Z x 0

0

(6.71)

 Bk1 .t/ dt dx:

(6.72)

Beispielsweise gilt

B1 .x/ D x  B3 .x/ D x 3 

1 ; 2 3 2 x 2

B2 .x/ D x 2  x C 1 x; 2

C

1 ; 6

(6.73)

B4 .x/ D x 4  2x 3 C x 2 

1 : 30

Theorem 6.44. Für die Bernoulli-Polynome Bk aus (6.71)–(6.72) gelten die folgenden Aussagen: (a) ( äquivalente Formulierung ) Es gilt Bk 2 …k für k D 0; 1; : : :, und

Bk0 .x/ D kBk1 .x/;

Z 1 0

Bk .x/ dx D 0

für k D 1; 2; : : : :

(6.74)

(b) Es gilt B1 .0/ D 1=2; B1 .1/ D 1=2, und

Ak D Bk .0/ D Bk .1/

für k D 2; 3; : : : :

(c) Die Funktion B2k ist gerade bezüglich x D 1=2, und B2kC1 ist ungerade bezüglich x D 1=2, es gilt also 1

1

B2k . 2 C x / D B2k . 2  x / 1 2

1 2

B2kC1 . C x / D B2kC1 .  x /

für 0  x  ......

1 ; 2

I

(d) B2kC1 .0/ D B2kC1 .1/ D 0 für k D 1; 2; : : : . Beweis. “(a)” gilt offensichtlich. “(b)”: Die Aussage für B1 resultiert unmittelbar aus (6.73). Für k  2 folgt Ak D Bk .0/ aus der Definition (6.71), und wegen der Mittelwerteigenschaft in (6.74) erhält man Z 1

Bk .1/ D Ak C k

0

Bk1 .x/ dx D Ak C k  0 D Ak :

150

Kapitel 6 Numerische Integration von Funktionen

“(c)” wird mit vollständiger Induktion nachgewiesen. B0  1 ist eine gerade Funktion bezüglich x D 1=2, und wir nehmen nun an, dass B2k eine bezüglich x D 1=2 gerade Funktion ist. Dann gilt

B2kC1 .x/ D A2kC1 C .2k C 1/

Z x 0

B2k .t/ dt

Z 1=2

D A2kC1 C .2k C 1/ 0 ƒ‚ „ DW b A2kC1

Z x

B2k .t/ dt C.2k C 1/ B .t/ dt ; 0  x  1: 1=2 2k … ƒ‚ … „ DW Q.x/

Nun ist Q ungerade bezüglich x D 1=2, denn 1

Q. 2 C x / D D

Z 1=2Cx 1=2

Z 1=2x 1=2

B2k .t/ dt D

Z x 0

Z x

1

B2k . 2 C t / dt D

0

1

B2k . 2  t / dt

1 2

B2k .t/.1/ dt D Q.  x /: R1 Q.x/ dx D 0, und wegen 0 B2kC1 .x/ dx D 0, D 0 und somit B2kC1 D .2kC1/Q eine bezüglich x D 1=2

Damit gilt aber notwendigerweise

R1 0

A2kC1 vergleiche (6.74), ist b ungerade Funktion. Sofort ergibt sich nun, dass B2kC2 bezüglich x D 1=2 eine gerade Funktion ist: 1 2

B2kC2 . C x / D A2kC2 C .2k C 2/ D A2kC2 C .2k C 2/ 1

D B2kC2 . 2  x /

Z 1=2x 0

Z 1=2Cx 0

B2kC1 .t/ dt

B2kC1 .t/ dt C .2k C 2/

für 0  x 

Z 1=2Cx 1=2x



1 : 2

B2kC1 .t/ dt ƒ‚ … D 0

“(d)” Die erste Identität in (d) ist schon in (b) festgehalten, und die dritte Gleichheit ergibt sich aus der Tatsache, dass B2kC1 bezüglich x D 1=2 eine ungerade Funktion ist: 1 2

B2kC1 .1/ D B2kC1 . C

1 2

/

1 2

D B2kC1 . 

1 2

/

D B2kC1 .0/ D B2kC1 .1/:

Definition 6.45. Die Werte B2k .0/; k D 0; 1; : : :; heißen bernoullische Zahlen. Die ersten bernoullischen Zahlen sind

B 0 .0 / D 1 ;

B2 .0/ D

1 ; 6

B4 .0/ D 

1 ; 30

B6 .0/ D

1 ; 42

B8 .0/ D

Die bernoullischen Zahlen spielen beim Beweis von Theorem 6.22 eine Rolle.

1 : 30

151

Abschnitt 6.9 Beweis der Asymptotik für die summierte Trapezregel

6.9.2

Der Beweis von Theorem 6.22

Im Folgenden wird der Beweis von Theorem 6.22 geführt, und hierzu setzt man die Bernoulli-Polynome Bk von dem Intervall Œ 0; 1  ausgehend 1-periodisch fort,

Sk .x/ WD Bk .x  m/

für m  x < m C 1;

m D 0; 1; : : : :

Es ist S0 eine Sägezahnfunktion, die Funktion S1 ist stückweise stetig differenzierbar, und für k  2 ist Sk stetig differenzierbar, und es gilt

Sk0 .x/ D kSk1 .x/

m 2 N0

für m < x < m C 1;

. k D 1; 2; : : : /:

Im weiteren Verlauf wird nachgewiesen, dass die Darstellung (6.37) richtig ist mit 0 wie in (6.38) und für

k WD RrC1 .h/ WD

B2k . 0 / . 2 k /Š

. f .2k1/ .b/  f .2k1/ .a/ /;

1

Z b

. 2r C 2 /Š

a



S2rC2 .0/  S2rC2 .

k D 1; 2; : : : ; r;

xa h

/



(6.75)

 f .2rC2/ .x/ dx h2rC2 : (6.76)

Aus (6.76) folgt dann 2. b  a / max jB2rC2 .y/j max jf .2rC2/ .x/jh2rC2 . 2r C 2 /Š y 2 Œ 0;1  x 2 Œ a;b 

jRrC1 .h/j 

und damit die zweite Darstellung in (6.38). Zum Beweis der Darstellung (6.37) mit den Koeffizienten aus (6.38), (6.75) und (6.76) wird zur Vereinfachung zunächst die Intervall-Transformation Œ a; b  ! Œ 0; N  vorgenommen: sei

g.t/ WD f .a C th/;

0  t  N:

Die Identität (6.37) mit den Koeffizienten aus (6.38), (6.75) und (6.76) ist dann äquivalent zu der euler-maclaurinschen Summenformel g. 0 / 2

C g.1/ C : : : C g.N  1/ C r X B2k . 0 / . 2k /Š

D

. g.2k1/ .N / 

g.t/ dt

9 > > =

g.2k1/ .0/ / C CrC1

> > ;

g. N / 2



Z N 0

kD1

(6.77)

mit dem Fehlerterm

CrC1 WD

1

Z N

. 2 r C 2 /Š

0

. S2rC2 .0/  S2rC2 .t/ /g.2rC2/ .t/ dt;

(6.78)

denn

 g. 0 / g. N /  T1 .h/ D h C g.1/ C : : : C g.N  1/ C ; Z b a

f .x/ dx D h

2 Z N 0

2

g.t/ dt;

f .j / .a C th/hj D g .j / .t/;

0  t  N:

152

Kapitel 6 Numerische Integration von Funktionen

Es soll nun die Identität (6.77)–(6.78) nachgewiesen werden: Z 1

1 .g.1/ 2

C g.0// 

g.t/ dt

0

ˇt D1 D B1 .t/g.t/ˇ  Z 1

D

0

Z 1

t D0

B0 .t/g.t/ dt

0

Z 1

B1 .t/g 0 .t/ dt D

0

S1 .t/g 0 .t/ dt;

und analog gilt 1 .g.j 2

C 1/ C g.j // 

Z j C1 j

g.t/ dt D

Z j C1 j

S1 .t/g 0 .t/ dt;

j D 0; 1; : : : ; N  1;

so dass man g. 0 /

C g.1/ C : : : C g.N  1/ C

2

g. N /



2

Z N 0

g.t/ dt D

Z N 0

S1 .t/g 0 .t/ dt

erhält. Das letzte Integral wird weiter partiell integriert, Z N 0

S1 .t/g 0 .t/ dt

D

ˇt DN 1 S2 .t/g 0 .t/ˇ 2Š t D0

D

B2 .0/ 0 .g .N / 2Š



Z N 1 2Š 0

 g 0 .0/ / 

S2 .t/g 00 .t/ dt

Z N 1 2Š 0

S2 .t/g 00 .t/ dt;

und partielle Integration des letzten Integrals liefert wiederum



Z N 1 2Š 0

S2 .t/g 00 .t/ dt

Z N 1 3Š 0

ˇt DN 1 D  S3 .t/g 00 .t/ˇ C 3Š

D 

t D0

B3 .0/ .g 00 .N / 3Š

 g 00 .0/ / C

„ƒ‚…

D

S3 .t/g 000 .t/ dt Z N 1 3Š 0

S3 .t/g 000 .t/ dt

D0 Z N 1 S3 .t/g 000 .t/ dt: 3Š 0

Wiederholte partielle Integration liefert schließlich die Identität (6.77) mit der folgenden Konstanten,

CrC1 D D D

1 . 2rC2 /Š

S2rC2 .0/Πg .2rC1/ .N /  g.2rC1/ .0/  

1 . 2r C 2 /Š

1

S2rC2 .0/ Z N

. 2r C 2 /Š 0

Z N 0

g .2rC2/ .t/ dt 

1

Z N

. 2rC2 /Š 0 Z N

1 . 2r C 2 /Š 0

S2rC2 .t/g .2rC2/ .t/ dt

S2rC2 .t/g.2rC2/ .t/ dt

. S2rC2 .0/  S2rC2 .t/ /g.2rC2/ .t/ dt;

was mit der Setzung (6.78) übereinstimmt.

Weitere Themen und Literaturhinweise Eine Auswahl existierender Lehrbücher mit Abschnitten über numerische Integration bildet Freund / Hoppe [31], Hämmerlin / Hoffmann [48], Kress [63], Krommer / Überhuber [64], Oevel [78] und Werner [111]. Insbesondere in [64] werden viele weitere Themen wie die numerische Berechnung uneigentlicher und mehrdimensionaler Integrale beziehungsweise die symbolische Integration behandelt. Orthogonale Polynome werden ausführlich in Hanke-Bourgeois [52] behandelt.

153

Übungsaufgaben

Übungsaufgaben Aufgabe 6.1. Gegeben sei eine Unterteilung  W a  x0 < x1 < : : : < xn  b des Intervalls Œ a; b . Man zeige, dass es eindeutig bestimmte Zahlen a0 ; a1 ; : : : ; an 2 R gibt mit n X

Z b

ak P .xk / D

a

kD0

P .x/ dx

für alle P 2 …n :

Aufgabe 6.2. Zu einer beliebigen Pn Unterteilung a  x0 < : : : < xn  b des Intervalls Πa; b  bezeichne  n .f / D . b  a / kD0 k f .xk / eine Quadraturformel. Man zeige, dass ihr Ge-

nauigkeitsgrad  2n C 1 ist, es gibt also ein Polynom P 2 …2nC2 mit  n .P / ¤

Rb a

P .x/ dx .

Aufgabe 6.3. Man bestimme die Koeffizienten a0 ; a1 ; a2 2 R durch Taylorabgleich so, dass / C a2 f .b/ zur näherungsweisen Berechnung die Quadraturformel Qf D a0 f .a/ C a1 f . aCb 2 des Integrals

Rb a

f .x/ dx einen möglichst hohen Genauigkeitsgrad besitzt.

Aufgabe 6.4. Zu einer periodischen stetigen Funktion f W R ! R und den Stützstellen xj D 2j=. N C 1 / mit j D 0; 1; : : : ; N für gerades N 2 N bezeichne Tf das interpolierende PN=2 trigonometrische Polynom von der Form . Tf /.x/ D A20 C . Ak cos kx C Bk sin kx /. kD1 Weiter bezeichne Qf WD

R 2

. Tf /.x/ dx . Man zeige, dass sich Qf schreiben lässt als Qf D 0 a f .x / mit ( von f unabhängigen ) positiven Gewichten ak > 0 für k D 0; 1; : : : ; N . k kD0 k

PN

Aufgabe 6.5. Man weise mithilfe der euler-maclaurinschen Summenformel für N 2 N die folgende Identität nach, N X

k3 D

 N.N C 1/ 2 2

:

kD1

Aufgabe 6.6. Das Funktionensystem . Un /n2N0 der Tschebyscheff-Polynome der zweiten Art bildet bezüglich des Skalarprodukts h u; v i D stem.

R1

1

u.x/ v.x/

p

1  x 2 dx ein Orthogonalsy-

Aufgabe 6.7 ( Numerische Aufgabe ). Man berechne die vier bestimmten Integrale Z 0:5 0

1 16x 2 C 1

Z

dx;

2 0

Z =2

e x dx; 2

0

2

. cos x2 /

sin 3x dx;

Z =2 p 0

j cos 2x j dx;

numerisch durch Extrapolation der Trapezsummen T1 . hj / unter Anwendung der RombergSchrittweite h0 D b  a und hj D hj 1 =2 für j D 1; 2; : : : . Genauer: mit den Bezeichnungen aus (6.40)–(6.41) mit T D T1 und D 2 berechne man für k D 0; 1; : : : die Werte

Tkm;:::;k

für m D 0; 1; : : : ; min¹ k; m º:

(6.79)

Man breche mit k DW k ab, falls

m C 1  k  12;

jTkm ;:::;k  Tkm C1;:::;k j  "

oder aber

k D 13 8

erfüllt ist ( mit m D 4 und " D 10 ). Man gebe für jedes der vier zu berechnenden Integrale die Werte (6.79) für k D 0; 1; : : : ; k in einem Tableau aus, jeweils auf acht Nachkommastellen genau.

7

Explizite Einschrittverfahren für Anfangswertprobleme bei gewöhnlichen Differenzialgleichungen

Viele Anwendungen wie beispielsweise die Berechnung der Flugbahn eines Raumfahrzeugs beim Wiedereintritt in die Erdatmosphäre oder Räuber-Beute-Modelle führen auf Anfangswertprobleme für Systeme von gewöhnlichen Differenzialgleichungen. Ebenso resultieren gewisse Diskretisierungen von Anfangswertproblemen für partielle Differenzialgleichungen in Anfangswertproblemen für Systeme von gewöhnlichen Differenzialgleichungen. Ein konkretes Beispiel hierzu wird in Abschnitt 8.9.4 auf Seite 229 vorstellt. Solche Anfangswertprobleme für Systeme von gewöhnlichen Differenzialgleichungen sind Gegenstand des vorliegenden und des nächsten Kapitels. Definition 7.1. Ein Anfangswertproblem für ein System von N gewöhnlichen Differenzialgleichungen 1. Ordnung ist von der Form

y 0 D f .t; y/;

t 2 Πa; b ;

(7.1)

y.a/ D y0 ;

(7.2)

mit einem gegebenen endlichen Intervall Πa; b , einem Vektor y0 2 R N und einer Funktion

f W Πa; b   R N ! R N ;

(7.3)

und gesucht ist eine differenzierbare Funktion y W Œ a; b  ! R N mit den Eigenschaften (7.1)–(7.2). Die Notation in (7.1) ist eine übliche Kurzform für y 0 .t/ D f .t; y.t//; t 2 Œ a; b . Differenzierbarkeit bedeutet hier komponentenweise Differenzierbarkeit, und es ist 0 .t//> 2 R N . y 0 .t/ D .y10 .t/; : : : ; yN

7.1 Ein Existenz- und Eindeutigkeitssatz Die Existenz und Eindeutigkeit der Lösung ist auch bei Anfangswertproblemen für Systeme von gewöhnlichen Differenzialgleichungen eine grundlegende Fragestellung. Diese ist Gegenstand des nächsten Theorems, wobei die folgende Lipschitzbedingung für Funktionen f von der Form (7.3) eine wesentliche Rolle spielt,

jjf .t; u/  f .t; v/jj  Ljju  v jj;

t 2 Πa; b ;

u; v 2 R N ;

(7.4)

mit einer Konstanten L > 0, wobei hier und im Folgenden jj  jj W R N ! R eine beliebige Vektornorm bezeichnet.

155

Abschnitt 7.1 Ein Existenz- und Eindeutigkeitssatz

Neben der angesprochenen Existenz- und Eindeutigkeitsaussage für Anfangswertprobleme von der Form (7.1)–(7.2) liefert das folgende Theorem ein ebenso wichtiges Resultat zur stetigen Abhängigkeit von den Anfangswerten. Theorem 7.2. Es sei f W Œ a; b   R N ! R N eine stetige Funktion, die die Lipschitzbedingung (7.4) erfülle. Dann gelten die beiden folgenden Aussagen: (a) ( Picard/Lindelöf ) Das Anfangswertproblem (7.1)–(7.2) besitzt genau eine stetig differenzierbare Lösung y W Œ a; b  ! R N . (b) Für differenzierbare Funktionen y; b y W Œ a; b  ! R N mit

y 0 D f .t; y/; b y0

D f .t;b y /;

t 2 Πa; b I

y.a/ D y0

.......

b y .a/ D b y0

gilt die Abschätzung

jjy.t/  b y .t/jj  eL.t a/ jjy0  b y 0 jj;

t 2 Πa; b :

(7.5)

Einen Beweis hierzu finden Sie beispielsweise in Heuser [54], Abschnitt 12. Auch unter anderen Voraussetzungen an die Funktion f sind Existenz- und Eindeutigkeitsaussagen für das Anfangswertproblem (7.1)–(7.2) möglich. Zur Vereinfachung der Notation wird Folgendes angenommen:

In diesem und dem folgenden Kapitel 8 wird ohne weitere Spezifikation an die Funktion f angenommen, dass jedes der betrachteten Anfangswertprobleme von der Form (7.1)–(7.2) jeweils eine eindeutig bestimmte Lösung y W Œ a; b  ! R N besitzt. An einigen Stellen erweist sich das folgende Resultat über die Glattheit der Lösung des Anfangswertproblems (7.1)–(7.2) als nützlich, das man mit der Kettenregel erhält. Theorem 7.3. Für eine p -mal stetig partiell differenzierbare Funktion mit p  1 ist die Lösung des Anfangswertproblems (7.1)–(7.2) mindestens .p C 1/-mal stetig partiell differenzierbar. Bemerkung 7.4. In der Situation von Theorem 7.3 lassen sich die höheren Ableitungen der Lösung angeben. Beispielsweise berechnet man im eindimensionalen Fall N D 1 sowie für p D 1 sofort Folgendes:

y 00 .t/ D

@f @t

.t; y.t// C

@f @y

.t; y.t//y 0 .t/ D

 @f @t

C

@f @y

 f . t; y.t/ /:

(7.6) M

156

Kapitel 7 Einschrittverfahren für Anfangswertprobleme

In den meisten Fällen lässt sich die Lösung des Anfangswertproblems (7.1)–(7.2) nicht exakt berechnen, so dass man auf numerische Verfahren zurückgreift. Solche Verfahren werden in diesem und dem darauf folgenden Kapitel vorgestellt, wobei es die Zielsetzung der meisten dieser Verfahren ist, zu der Lösung y W Œ a; b  ! R N des Anfangswertproblems (7.1)–(7.2) schrittweise für ` D 0; 1; : : : Approximationen

u` y.t` /;

` D 0; 1; : : : ; n;

zu gewinnen auf einem noch nicht näher spezifizierten Gitter

 D ¹ a D t0 < t1 < : : : < tn  b º; h` WD t`C1  t`

für ` D 0; 1; : : : ; n  1:

(7.7)

7.2 Theorie der Einschrittverfahren Im Folgenden werden Einschrittverfahren einführend behandelt. Definition 7.5. Ein ( explizites ) Einschrittverfahren zur approximativen Bestimmung einer Lösung des Anfangswertproblems (7.1)–(7.2) ist von der Gestalt

u`C1 D u` C h` '.t` ; u` I h` /;

` D 0; 1; : : : ; n  1I

u0 WD y0

(7.8)

mit einer Verfahrensfunktion ' W Œ a; b   R N  R C ! R N und einem noch nicht näher spezifizierten Gitter beziehungsweise Schrittweiten der Form (7.7). Bemerkung 7.6. (1) Die Approximation u` hängt von u`1 nicht jedoch ( unmittelbar ) von u`2 ; u`3 ; : : : ab, was die Bezeichnung “Einschrittverfahren” rechtfertigt. Im anschließenden Kapitel 8 werden dann Mehrschrittverfahren behandelt. (2) Ein Einschrittverfahren ist durch seine Verfahrensfunktion ' festgelegt, die Schrittweiten hingegen sind noch frei wählbar. Zur Vereinfachung der Notation wird dennoch im Folgenden bei Einschrittverfahren auf die Verfahrensvorschrift (7.8) verwiesen, obwohl Eigenschaften von ' behandelt werden. (3) Ebenfalls zwecks einer vereinfachten Notation wird als Definitionsbereich einer Verfahrensfunktion ' immer Œ a; b   R N  R C angegeben, obwohl bei den meisten noch vorzustellenden speziellen Einschrittverfahren der Ausdruck '.t; uI h/ lediglich für Schrittweiten h  b  t wohldefiniert ist. (4) Eine wichtige Rolle spielen in der Praxis auch implizite Einschrittverfahren, die durch die Definition (7.8) nicht unmittelbar erfasst sind. Solche impliziten Einschrittverfahren werden gemeinsam mit den Mehrschrittverfahren in Kapitel 8 behandelt. M

Die wichtigste Kennzahl eines Einschrittverfahrens ist seine Konvergenzordnung:

157

Abschnitt 7.2 Theorie der Einschrittverfahren

Definition 7.7. Ein Einschrittverfahren (7.8) zur Lösung des Anfangswertproblems y 0 D f .t; y/; y.a/ D y0 besitzt die Konvergenzordnung p  1, falls sich der globale Verfahrensfehler abschätzen lässt in der Form max jju`  y.t` /jj  C hp max ;

hmax WD

`D0;:::;n

max `D0;:::;n1

¹ t`C1  t` º;

mit einer von dem gewählten Gitter  unabhängigen Konstanten C  0. Für die Bestimmung der Konvergenzordnung eines Einschrittverfahrens spielt der folgende Begriff eine maßgebliche Rolle. Definition 7.8. Für ein Einschrittverfahren (7.8) zur Lösung des Anfangswertproblems y 0 D f .t; y/; y.a/ D y0 bezeichnet

.t; h/ WD y.t/ C h'.t; y.t/ I h/  y.t C h/ ƒ‚ … „

für t 2 Œ a; b ;

0  h  b  t;

Verfahrensvorschrift den lokalen Verfahrensfehler im Punkt .t C h; y.t C h/ / bezüglich der Schrittweite h. Andere sinnvolle Definitionen des lokalen Verfahrensfehlers sind ebenfalls möglich ( siehe Aufgabe 7.3 ). Definition 7.9. Ein Einschrittverfahren (7.8) zur Lösung des Anfangswertproblems y 0 D f .t; y/; y.a/ D y0 besitzt die Konsistenzordnung p  1, falls für den lokalen Verfahrensfehler die Ungleichung

jj .t; h/jj  C hpC1

für t 2 Œ a; b ;

0  h  b  t;

(7.9)

erfüllt ist mit einer ( von t und h unabhängigen ) Konstanten C  0. Die Konsistenzordnung bezeichnet man oft nur kurz als Ordnung eines Einschrittverfahrens. Es wird nun die wesentliche Abschätzung für den bei Einschrittverfahren auftretenden globalen Verfahrensfehler vorgestellt, wofür die folgende Lipschitzbedingung an die Verfahrensfunktion benötigt wird,

j '.t; uI h/  '.t; v I h/jj  L' jju  v jj für t 2 Œ a; b ;

0 < h  b  t;

u; v 2 R N :

μ (7.10)

Bei allen in diesem Kapitel vorzustellenden speziellen Einschrittverfahren ist eine solche Lipschitzbedingung (7.10) erfüllt, falls die Funktion f der Lipschitzbedingung (7.4) genügt. Theorem 7.10. Ein Einschrittverfahren (7.8) zur Lösung des Anfangswertproblems

y 0 D f .t; y/; y.a/ D y0 besitze die Konsistenzordnung p  1 und erfülle die Lipschitzbedingung (7.10). Dann liegt die Konvergenzordnung p vor. Genauer gilt max jju`  y.t` /jj  Khp max ;

`D0;:::;n

hmax WD

max `D0;:::;n1

¹ t`C1  t` º;

(7.11)

mit der Konstanten K D LC .e L' .ba/  1/, wobei C aus der Abschätzung (7.9) her' rührt.

158

Kapitel 7 Einschrittverfahren für Anfangswertprobleme

Beweis. Mit den Setzungen

e` D u`  y` ; ` D .t` ; h` /;

y` WD y.t` /;

` D 0; 1; : : : ; n; ` D 0; 1; : : : ; n  1;

gilt für ` D 0; 1; : : : ; n  1

y`C1 D y` C h` '.t` ; y` I h` /  ` ; u`C1 D u` C h` '.t` ; u` I h` /; und daher

e`C1 D e` C h` . '.t` ; u` I h` /  '.t` ; y` I h` / / C ` beziehungsweise

jje`C1 jj  jje` jj C h` j '.t` ; u` I h` /  '.t` ; y` I h` /jj C jj ` jj  . 1 C h` L' /jje` jj C h` C hp max ; und das nachfolgende Lemma 7.12 liefert wegen e0 D 0 unmittelbar die Aussage des Theorems. Bemerkung 7.11. Lipschitzbedingung (7.10) und Konsistenzordnung p zusammen M gewährleisten also die Konvergenzordnung p des Einschrittverfahrens (7.8).

7.2.1 Ein elementares Resultat zur Fehlerakkumulation Lemma 7.12. Für Zahlen L > 0; a`  0; h` > 0 und b  0 sei

a`C1  . 1 C h` L/a` C h` b;

` D 0; 1; : : : ; n  1;

erfüllt. Dann gelten die Abschätzungen

a` 

e Lx`  1 b L

C e Lx` a0

mit x` WD

` X1

hj

. ` D 0; 1; : : : ; n /:

j D0

Beweis. Der Fall ` D 0 ist klar, und den Induktionsschritt ` ! ` C 1 führt man wie folgt:

a`C1

 e h` L ‚ …„ ƒ  Lx`  e 1  . 1 C h` L/ b C e Lx` a0 C h` b L

 D

e

  1  h` L C h` b C e L.x` Ch` / a0 L

L.x` Ch` /

e Lx`C1  1 b C e Lx`C1 a0 : L

159

Abschnitt 7.3 Spezielle Einschrittverfahren

7.3 Spezielle Einschrittverfahren 7.3.1 Einschrittverfahren der Konsistenzordnung p D 1 Beispiel 7.13. Das Euler-Verfahren ist von der Form

u`C1 D u` C h` f .t` ; u` /;

` D 0; 1; : : : ; n  1I

u0 WD y0 :

(7.12)

Andere übliche Bezeichnungen für das Verfahren (7.12) sind eulersches Polygonzugverfahren oder vorwärtsgerichtete Euler-Formel. In Bild 7.1 ist die Vorgehensweise des Euler-Verfahrens veranschaulicht. Dabei stellen die Funktionen y; b y beziehungsweise y Lösungen der Differenzialgleichung y 0 D f .t; y / dar mit den Anfangswerten y.t0 / D y0 ; b y .t1 / D u1 beziehungsweise y.t2 / D u2 . Die gestrichelten Linien stellen Tangenten dar und illustrieren die Bestimmung der jeweils nächsten Approximation.

y .... ......... ...

.......... .......... ....... ...... ..... . . .... . . ..... .... .... .... ..... ... .... . .... . . . . . .. ... ........................... ... .............. ... .. .. .. ... .. .. . . . .. ... .. .. .. ... .. ... .. ... .. . . . . . .. ... .. ... ... .. ...... ... ........ ... ........... ... . . . . . . ... ..... .... ..... .... ...... .... ..... ........ ...... ............ . . . . . . . ...... ....... ........ ....... ..

y.t/

u2

u1 u0 D y0

y.t/

b y .t/

...........................................

t0 D a

t1

t

t2

Bild 7.1: Vorgehensweise beim Euler-Verfahren

M

Theorem 7.14. Für eine stetig partiell differenzierbare Funktion f W Œ a; b   R N ! R N besitzt das Euler-Verfahren die Konsistenzordnung p D 1. Beweis. Eine Taylorentwicklung der Lösung des Anfangswertproblems y 0 D f .t; y/; y.a/ D y0 liefert

y.t C h/ D y.t/ C y 0 .t/h C . yj00 . j / /jND1

h2 2

mit geeigneten Zwischenstellen j 2 Œ a; b , und daraus erhält man für den lokalen Verfahrensfehler

.t; h/ D y.t/ C h f .t; y.t//  y.t C h/ D . yj00 . j / /jND1 „ ƒ‚ … D y 0 .t/

h2 2

160

Kapitel 7 Einschrittverfahren für Anfangswertprobleme

beziehungsweise

jj .t; h/ jj1  C h2 ;

1 max jjy 00 . / jj1 ; 2 2 Πa;b 

D

mit C

wobei die zweimalige stetige Differenzierbarkeit der Lösung y aus Theorem 7.3 folgt.

7.3.2 Einschrittverfahren der Konsistenzordnung p D 2 Zur Herleitung von Einschrittverfahren (7.8) der Konsistenzordnung p D 2 wird für die Verfahrensfunktion der Ansatz

'.t; uI h/ D a1 f .t; u/ C a2 f .t C b1 h; u C b2 hf .t; u//; t 2 Πa; b ;

0  h  b  t;

μ

u 2 RN ;

(7.13)

betrachtet mit noch festzulegenden Konstanten aj ; bj 2 R. Theorem 7.15. Ein Einschrittverfahren (7.8) mit einer Verfahrensfunktion der Form (7.13) ist konsistent von der Ordnung p D 2, falls die Funktion f W Œ a; b   R N ! R N zweimal stetig partiell differenzierbar ist und für die Koeffizienten Folgendes gilt:

a1 C a2 D 1;

1 ; 2

a2 b 1 D

a2 b 2 D

1 : 2

(7.14)

Beweis. Der Beweis wird für den eindimensionalen Fall N D 1 geführt. Taylorentwicklungen sowohl von '.t; y.t/ I / im Punkt h D 0 als auch von der Lösung y in t zusammen mit Theorem 7.3 ergeben

'.t; y.t/I h/

D

D1=2 D1=2 D 1 ‚…„ƒ  ‚ …„ ƒ  ‚…„ƒ @f @f   .a1 C a2 / f C h a2 b1 @t C a2 b2 f @y . t; y.t/ / C O.h2 /;

y.t C h/

D

y.t/ C y 0 .t/h C y 00 .t/

.7:6/

D

h2 2

C O.h3 /

  @f @f  h2  y.t/ C hf C @t C f @y 2 . t; y.t/ / C O.h3 /; ƒ‚ … „ D h'.t; y . t / I h/ C O.h3 /

woraus für den lokalen Verfahrensfehler unmittelbar

.t; h/ D y.t/ C h'.t; y.t/ I h/  y.t C h/ D O.h3 / folgt. Bemerkung 7.16. Der eine Freiheitsgrad in (7.14) kann nicht zur Gewinnung eines Verfahrens der Konsistenzordnung p D 3 verwendet werden. M Es werden nun zwei Beispiele für Einschrittverfahren von der Form (7.13) vorgestellt.

161

Abschnitt 7.3 Spezielle Einschrittverfahren

Beispiel 7.17. Die Verfahrensfunktion für das modifizierte Euler-Verfahren lautet

'.t; uI h/ D f .t C

h 2

;u C

h 2

f .t; u//;

t 2 Πa; b ;

0  h  b  t;

u 2 RN ; wobei ' aus dem Ansatz (7.13) hervorgeht für a1 D 0; a2 D 1 und b1 D b2 D 1=2, und das zugehörige Einschrittverfahren (7.8) besitzt nach Theorem 7.15 für eine hinreichend glatte Funktion f daher die Konsistenzordnung p D 2. Das Verfahren selbst lässt sich folgendermaßen formulieren,

u`C1=2 D u` C

h` 2

t`C1=2 WD t` C

f .t` ; u` /;

u`C1 D u` C h` f .t`C1=2 ; u`C1=2 /;

h` 2

;

` D 0; 1; : : : ; n  1:

Die Wirkungsweise des modifizierten Euler-Verfahrens ist in Bild 7.2 veranschauy ; y beziehungsweise e y Lösungen der Diffelicht. Dabei stellen die Funktionen y; b renzialgleichung y 0 D f .t; y / dar mit den Anfangswerten y.t0 / D y0 ; b y .t1=2 / D y .t3=2 / D u3=2 . Die Näherung u1 erhält man von u0 u1=2 ; y.t1 / D u1 beziehungsweise e ausgehend auf einer Geraden der Steigung b y 0 .t1=2 /.

y .... ........ .. .

y.t/

................................. ........ ......... ....... ...... ....... ...... ...... ..... . . . ...... .... . ...... 3= 2 . 1 . .... ... . . . . . . . . . . . . .... ........................... . . . ........... . .......... . ... . . . . . ........ .... ............ ... . .. . . . . . . . . . . . . . ....... ..... . .... ....... ........ ... ..... ....... ........ .. ..... ........ ......... ... ..... ....... . ........... . . ... . . . ....... ............. .. ....... ................... ..... ... ........ .... ..... . ... . ....... . . . ... ....... . .. . . . . . ....... .. ........ ........ . . . ....... ... ......... . .. ... . ........ 2 ..... ....... .... ..... .... ........... . . .... . . . ........... .... . . . . . . . ... .... . . . ..... ..... ............ . . ............. . . 1= 2 .............

u

u

e y.t /

y.t /

b y.t /

u

u

...........................................

t0 D a

t1=2

t1

t3=2

t

t2 M

Bild 7.2: Vorgehensweise beim modifizierten Euler-Verfahren

Beispiel 7.18. Die Verfahrensfunktion für das Verfahren von Heun lautet

'.t; uI h/ D

1 f .t; u/ 2

 C f .t C h; u C hf .t; u// ;

t 2 Πa; b ;

0  h  b  t;

u 2 RN ;

wobei ' aus der allgemeinen Form (7.13) hervorgeht für a1 D a2 D 1=2 und b1 D b2 D 1. Das zugehörige Einschrittverfahren (7.8) besitzt also für eine hinreichend glatte Funktion f ebenfalls die Konsistenzordnung p D 2. Der Algorithmus selbst

162

Kapitel 7 Einschrittverfahren für Anfangswertprobleme

lässt sich folgendermaßen formulieren,

v`C1 D u` C h` f .t` ; u` /;

u`C1 D

w`C1 D u` C h` f .t`C1 ; v`C1 /;

1 .v 2 `C1

C w`C1 /;

` D 0; 1; : : : ; n  1: M

7.3.3 Einschrittverfahren der Konsistenzordnung p D 4 Beispiel 7.19. Die Verfahrensfunktion für das klassische Runge-Kutta-Verfahren lautet

'.t; uI h/ D

1 Œk 6 1

C 2k2 C 2k3 C k4 ;

t 2 Πa; b ;

0  h  b  t;

u 2 RN ;

mit

k1 WD f .t; u/; k3 WD f . t C

k2 WD f . t C h 2

;u C

h 2

k2 /;

h 2

;u C

h 2

k1 /;

k4 WD f . t C h; u C hk3 /:

Durch Taylorentwicklung lässt sich nachweisen, dass das klassische Runge-KuttaVerfahren für eine hinreichend oft differenzierbare Funktion f die KonsistenzordM nung p D 4 besitzt. Bei jedem der vorgestellten speziellen expliziten Einschrittverfahren ist für die Anwendbarkeit des Konvergenzresultats aus Theorem 7.10 jeweils noch die Lipschitzeigenschaft (7.10) nachzuprüfen. Hier stellt man leicht fest, dass diese Lipschitzbedingung (7.10) jeweils genau dann erfüllt ist, wenn die Funktion f der Lipschitzbedingung (7.4) genügt.

7.4 Rundungsfehleranalyse In diesem Abschnitt 7.4 werden die Auswirkungen von fehlerbehafteten Anfangswerten und Rundungsfehlern bei Einschrittverfahren (7.8) untersucht. Hierzu sei im Folgenden angenommen, dass eine fehlerbehaftete Verfahrensvorschrift von der folgenden Form

μ v`C1 D v` C h` '.t` ; v` I h` / C ` ; ` D 0; : : : ; n  1I v0 WD y0 C e0 ; jj` jj  ı;

......

jje0 jj  ";

(7.15)

vorliegt mit gewissen Vektoren e0 ; ` 2 R N , und jj  jj bezeichnet eine nicht weiter spezifizierte Vektornorm. Theorem 7.20. Zur Lösung des Anfangswertproblems y 0 D f .t; y/; y.a/ D y0 sei durch (7.8) ein Einschrittverfahren mit der Konsistenzordnung p  1 gegeben, das die

163

Abschnitt 7.4 Rundungsfehleranalyse

Lipschitzbedingung (7.10) erfülle. Dann gelten für die durch die fehlerbehaftete Verfahrensvorschrift von der Form (7.15) gewonnenen Approximationen die folgenden Abschätzungen, max jjv`  y.t` /jj

`D0;:::;n

  K hp max C

ı hmin

mit hmax D mit der Konstanten K WD

max¹C;1º

L'



C e L' .ba/ " max

`D0;:::;n1

(7.16)

hmin D

h` ;

min `D0;:::;n1

h` ;

Œ e L' .ba/  1 , für C aus (7.9).

Beweis. Die Vorgehensweise im Beweis von Theorem 7.10 ist nur geringfügig zu modifizieren: mit den Setzungen

e` D v`  y` ; ` D .t` ; h` /;

y` WD y.t` /;

` D 0; 1; : : : ; n; ` D 0; 1; : : : ; n  1;

gilt für ` D 0; 1; : : : ; n  1

y`C1 D y` C h` '.t` ; y` I h` /  ` ; v`C1 D v` C h` '.t` ; v` I h` / C ` ; und daher

e`C1 D e` C h` Π'.t` ; v` I h` /  '.t` ; y` I h` /  C ` C ` beziehungsweise

jje`C1 jj  jje` jj C h` jj'.t` ; v` I h` /  '.t` ; y` I h` /jj C jj ` jj C jj` jj  . 1 C h` L' /jje` jj C h` . C hp max C

ı hmin

/;

und Korollar 7.12 liefert zusammen mit der Abschätzung jje0 jj  " unmittelbar die Aussage des Theorems. Bemerkung 7.21. Die rechte Seite in der Abschätzung (7.16) setzt sich aus drei Terp men zusammen: der erste Term Khmax resultiert aus dem globalen Verfahrensfehler des Einschrittverfahrens, und der zweite Term ı= hmin korrespondiert zu den akkumulierten Rundungsfehlern. Der Term e L' .ba/ " schließlich rührt von einem fehlerbehafteten Anfangswert her. M Als unmittelbare Folgerung aus Theorem 7.20 erhält man im Fall eines exakt gegebenen Anfangswerts ( " D 0 ) und konstanter Schrittweite: Korollar 7.22. Es liege die Situation aus Theorem 7.20 vor mit v0 D y0 und h` D h max¹C;1º für ` D 0; 1; : : : ; n  1. Dann gilt mit der Konstanten K WD Œ e L' b  1  die L' Fehlerabschätzung max jjv`  y.t` /jj  K . hp C

`D0;:::;n

ı h

/:

(7.17)

164

Kapitel 7 Einschrittverfahren für Anfangswertprobleme

Mit der Wahl h D hopt D .ı=p /1=.pC1/ erhält man max jjv`  y.t` /jj 

`D0;:::;n

2K

p p=.pC1/

ı p=.pC1/ :

Die Situation in Abschätzung (7.17) ist in Bild 7.3 veranschaulicht. .... ......... . .... ... ....... ... ...... ... ........ ... . . . .... .. .... ....... ...... ...... ... .. ...... ....... ...... .......... . ...... . . ...... ... .. .... ... ....... ... ... ...... ... .... ...... .... ... ...... ... ...... . . ...... . ... . ....... ..... .... ....... .... ... ... ... ..... .... ... .... ..... .... ... .... ..... ........ . ... ... . . . .... .... .... ... .... ...... ..... ..... ..... ..... .... ..... ..... ..... ... ...... ...... ..... .... ..... ...... .......... .... ...... . . . . . . . ..... ...... ..... ......... ..... ....... ....... . ..... ....... ....... .......... ...... . . ........ ...... ............... ........ ............ .......... ...... ......... . . . . . . ............. . ...... . . . . . . . . . . ............................................. ....... ...... . . . . . ....... . . ....... ........ ......... ......... ............ ........... . ....................... .................................................................................................................. ..................................................... ............................... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ....................................... ....... ...................... ................................ .............................. ............................................

Gesamtfehler

Verfahrensfehler Khp 0

Rundungsfehler Kı= h

hopt

0

Schrittweite h

Bild 7.3: Einfluss des Rundungsfehlers in Abhängigkeit von der Schrittweite h (vergleiche Korollar 7.22)

7.5 Asymptotische Entwicklung der Approximationen 7.5.1 Einführende Bemerkungen Zur Lösung des Anfangswertproblems y 0 D f .t; y/; y.a/ D y0 werden in dem vorliegenden Abschnitt 7.5.1 Einschrittverfahren (7.8) bezüglich unterschiedlicher Gitter betrachtet, die der Einfachheit halber jeweils gleichabständige Knoten besitzen sollen,

h > 0;

t` D a C `h

für ` D 0; 1; : : : ; n;

mit 0 < n 

ba : (7.18) h

Im Folgenden ist es von Vorteil, die Schrittweitenabhängigkeit der Approximationen des Einschrittverfahrens (7.8) explizit anzugeben. Dies geschieht durch die folgende Notation,

uh .t`C1 / WD uh .t` / C h'.t` ; uh .t` /I h/;

` D 0; : : : ; n  1I

uh .0/ WD y0 ; (7.19)

mit t` D t` .h/ entsprechend (7.18). Es ist dann

uh .t/ definiert für alle

a < t  b;

h 2 H t WD

® t a m

¯ W m D 1; 2; : : : : (7.20)

165

Abschnitt 7.5 Asymptotische Entwicklung der Approximationen

Die Funktion uh wird als Gitterfunktion bezeichnet. Besitzt das zugrunde liegende Einschrittverfahren die Konsistenzordnung p  1 und genügt die Verfahrensfunktion der Stabilitätsbedingung (7.10), so gilt nach Theorem 7.10 an jeder Stelle a < t  b

uh .t/ D y.t/ C O.hp /

für H t 3 h ! 0:

(7.21)

In Abhängigkeit von der vorliegenden Konsistenzordnung und den Differenzierbarkeitseigenschaften der beteiligten Funktionen lässt sich die Darstellung (7.21) in Form einer asymptotischen Entwicklung präzisieren: Theorem 7.23. Bezüglich des Anfangswertproblems y 0 D f .t; y/; y.a/ D y0 besitze eine gegebene Verfahrensfunktion ' W Œ a; b   R N  R C ! R N die Konsistenzordnung p  1 und genüge der Stabilitätsbedingung (7.10). Weiter seien die Funktionen f und ' jeweils .p C r/-mal stetig partiell differenzierbar. Für gewisse Koeffizientenfunktionen cpCj 2 C rC1j . Œ a; b ; R N / mit cpCj .a/ D 0 für j D 0; 1; : : : ; r  1 gilt dann die folgende asymptotische Entwicklung:

uh .t/ D y.t/ C cp .t/hp C cpC1 .t/hpC1 C : : : C cpCr1 .t/hpCr1 C O.hpCr /; t 2 Πa; b ;

h 2 Ht;

μ (7.22)

wobei die angegebenen Konvergenzraten gleichmäßig in t auftreten. Hierbei bezeichnet C s .D; R N / die Menge der s -mal stetig partiell differenzierbaren Funktionen W D ! R N , wobei D  R M gelte für ein M  1. Auf der Basis solcher asymptotischer Entwicklungen lassen sich Verfahren höherer Ordnung gewinnen1 . Die Existenz einer solchen Asymptotik ist erstmals in Gragg [38] nachgewiesen worden. In den folgenden Abschnitten 7.5.2 und 7.5.3 wird eine später entwickelte, auf Hairer / Lubich [49] und Deuflhard / Bornemann [21] basierende Methode zur Herleitung für die genannte asymptotische Entwicklung (7.22) vorgestellt.

7.5.2 Herleitung der asymptotischen Entwicklung des globalen Verfahrensfehlers, 1. Teil Eine asymptotische Entwicklung (7.22) erhält man mittels nur zu diesem Anlass konstruierter spezieller Einschrittverfahren höherer Ordnung. Grundlage dafür bildet die folgende Rekursionsvorschrift, bei der die Verfahrensfunktion  W Œ a; b   R N  R C ! R N aus einer Verfahrensfunktion hervorgeht mittels 

.t; uI h/ WD

.t; u  hq cq .t/I h/ C Πcq .t C h/  cq .t/ hq1 ;

(7.23)

mit einer Zahl q  1 und einer im Moment nicht näher spezifizierten Funktion cq W Œ a; b  ! R N . Lemma 7.24. Bezüglich des Anfangswertproblems y 0 D f .t; y/; y.a/ D y0 besteht zwischen den zu den Verfahrensfunktionen und  gehörenden Gitterfunktionen  vh und vh der folgende Zusammenhang,

vh .t/ D vh .t/ C cq .t/hq ; 1

siehe Abschnitt 7.6 über Extrapolationsmethoden

t 2 Πa; b ;

h 2 Ht:

166

Kapitel 7 Einschrittverfahren für Anfangswertprobleme

Beweis. Offensichtlich gilt vh .0/ D vh .0/ D y0 , und dann erhält man induktiv für t D h; 2h; : : : ; die Aussage des Lemmas

vh .t C h/ D vh .t/ C h



.t; vh .t/I h/

D vh .t/ C hq cq .t/ C h .t; vh .t/ I h/ C Œ cq .t C h/  cq .t/ hq D vh .t/ C h .t; vh .t/I h/ C cq .t C h/hq : „ ƒ‚ … D vh .t C h/ Bemerkung 7.25. Lemma 7.24 lässt sich sukzessive auf die folgenden Verfahrensfunktionen anwenden ( das Schema ist zeilenweise zu lesen )

pp p

D ';

q D p;

' Π1  WD

D 'Π1 ;

q D p C 1;

' Π2  WD

pp p

D ' Πr1  ;

pp p

pp p

q D p C r  1;

pp p

' Πr  WD



9 > > > > > =



> > > > > ;



pp p

(7.24)

Mit der Notation u0;h D uh sowie us;h für die zu ' Œ s  gehörende Gitterfunktion . s D 1; 2 : : : / gilt nach Lemma 7.24

usC1;h .t/ D us;h .t/ C cpCs .t/hpCs ;

s D 0; 1; : : : ; r  1;

beziehungsweise

ur;h .t/ D uh .t/ C cp .t/hp C cpC1.t/hpC1 C : : : C cpCr1 .t/hpCr1 : (7.25) Für die komplette Herleitung der asymptotischen Entwicklung (7.22) sind nun “lediglich” noch konkrete Funktionen cp ; : : : ; cpCr1 zu ermitteln, so dass

ur;h .t/  y.t/ D O.hpCr /

für H t 3 h ! 0

(7.26)

gilt beziehungsweise die zugehörige Verfahrensfunktion ' Œ r  aus dem Schema (7.24) die Konsistenzordnung p C r besitzt. M Die angestellten Bemerkungen legen es nahe, eine Funktion cq zu wählen, so dass mittels der Rekursionsvorschrift (7.23) aus einer Verfahrensfunktion mit der Konsistenzordnung q eine Verfahrensfunktion  erzeugt wird, die die Konsistenzordnung q C 1 besitzt. Die Einzelheiten dazu werden im Folgenden vorgestellt, wobei als Erstes eine Darstellung für den zu der zugrunde liegenden Verfahrensvorschrift ' gehörenden lokalen Verfahrensfehler geliefert wird: Lemma 7.26. Unter den in Theorem 7.23 genannten Bedingungen gilt für den zugrunde liegenden lokalen Verfahrensfehler die Entwicklung

y.t C h/  y.t/  h'.t; y.t/I h/ D dpC1 .t/ hpC1 C O.hpC2 /

für h ! 0;

mit einer Funktion dpC1 2 C r .Œ a; b ; R N /, wobei die angegebenen Konvergenzraten gleichmäßig in t auftreten.

167

Abschnitt 7.5 Asymptotische Entwicklung der Approximationen

Beweis. Die Behauptung folgt unmittelbar aus einer Taylorentwicklung der Funktion g.h/ D y.t C h/  y.t/  h'.t; y.t/ I h/ in h D 0,

y.t C h/  y.t/  h'.t; y.t/ I h/ D

pC X1

d` .t/h` C O.hpC2/

`D0

D dpC1 .t/hpC1 C O.hpC2 /; da wegen der vorliegenden Konsistenzordnung q notwendigerweise d0 .t/ D : : : D

dp .t/ D 0 gilt. Für die Funktion dpC1 gilt die Darstellung dpC1 .t/ D 1 @p '

pŠ @hp .t; y.t/I

y .pC1/ . t / . pC1 /Š



0/.

7.5.3 Herleitung der asymptotischen Entwicklung des globalen Verfahrensfehlers, 2. Teil In Vorbereitung auf das nächste Lemma sei W Œ a; b   R N  R C ! R N eine beliebige Verfahrensfunktion, die bezüglich des Anfangswertproblems y 0 D f .t; y/; y.a/ D y0 die Konsistenzordnung q  1 besitzt mit der folgenden Darstellung für den lokalen Verfahrensfehler,

y.t C h/  y.t/  h .t; y.t/I h/ D dqC1 .t/ hqC1 C O.hqC2 / für h ! 0; (7.27) mit einer Funktion dqC1 W Œ a; b  ! R N , wobei die angegebenen Konvergenzraten gleichmäßig in t auftreten. Des Weiteren wird die Konsistenzbedingung

.t; uI 0/ D f .t; u/

für .t; u/ 2 Œ a; b   R N

(7.28)

vorausgesetzt. In allen praxisrelevanten Fällen liegt die vorausgesetzte Konsistenzordnung in der verallgemeinerten Form der Aufgabe 7.3 auf Seite 178 vor, so dass dann (7.28) automatisch erfüllt ist. In den weiteren Überlegungen spielt das folgende Anfangswertproblem für ein inhomogenes lineares System gewöhnlicher Differenzialgleichungen eine technische Rolle,

cq0 .t/ D Dy f .t; y.t// cq .t/ C dqC1 .t/;

t 2 Πa; b ;

cq .a/ D 0: (7.29)

N

Hierbei bezeichnet Dy f .t; u/ D . @y i .t; u//i;j D1 2 R N N die Funktionalmatrix der j Abbildung y ! f .t; y/ an der Stelle u 2 R N . Entsprechend wird diese Notation im Folgenden für Verfahrensfunktionen verwendet. Mit dieser Wahl der Funktion cq erhält man unter hinreichend guten Differenzierbarkeitseigenschaften der beteiligten Funktionen durch die Rekursionsvorschrift (7.23) eine Verfahrensfunktion  mit der Konsistenzordnung q C 1. @f

Lemma 7.27. Eine Verfahrensfunktion 2 C 3 .Œ a; b   R N  R C ; R N / besitze die Konsistenzordnung q  1 mit einem lokalen Verfahrensfehler von der Form (7.27), und die Konsistenzbedingung (7.28) sei erfüllt. Weiter sei dqC1 2 C s .Œ a; b ; R N / für

168

Kapitel 7 Einschrittverfahren für Anfangswertprobleme 2

2

@ ein s  1 erfüllt, und die Abbildungen t  @h .t; y.t/ I 0/ und t  @y@ @y .t; y.t/ I 0/ @yj i j seien für alle Indizes i; j mindestens .s  1/-mal stetig partiell differenzierbar auf Œ a; b . Unter diesen Voraussetzungen besitzt die Verfahrensfunktion  aus (7.23) mit cq 2 C sC1 .Œ a; b ; R N / aus (7.29) die Konsistenzordnung2 q C 1. Im Fall s  2 besitzt der zugehörige lokale Verfahrensfehler  die Darstellung

 .t; h/ D dqC2 .t/hqC2 C O. hqC3 /

für h ! 0

gleichmäßig in t , mit einer Funktion3 dqC2 2 C s1 . Œ a; b ; R N /. Beweis. Der lokale Verfahrensfehler bezüglich

 .t; h/ WD y.t C h/  y.t/  h D

......

D

......







besitzt die folgende Form,

.t; y.t/ I h/

 h .t; y.t/  hq cq .t/ I h/  Œ cq .t C h/  cq .t/ hq  h .t; y.t/ I h/ ƒ‚ …

D .t;h/



 hR.t; h/; mit R.t; h/ WD

......



. t; y.t/  hq cq .t/ I h/ 

 . t; y.t/ I h/ :

Es soll zunächst der Fall q  2 behandelt werden. Taylorentwicklungen liefern D O. hqC2 /

R.t; h/ D Dy .t; y.t/ I h/hq cq .t/ C cq .t C h/  cq .t/ D

hcq0 .t/

C

1 00 c .t/h2 2 q

C O.h / 3

‚ …„ ƒ O.h2q / ;

(7.30)

für h ! 0;

und zur Bearbeitung der Identität (7.30) verwendet man eine weitere Taylorentwicklung,

Dy .t; y.t/I h/ D Dy .t; y.t/I 0 / C ƒ‚ … „ D Dy f .t; y.t// mit der Matrix

@Dy @h

@Dy @h

.t; y.t/ I 0/h C O.h2 / für h ! 0;

@2

N

.t; y.t/I 0/ D . @h @yi .t; y.t/ I h//i;j D1 2 R N N , wobei j

Komponente der vektorwertigen Funktion

i

die i -te

bezeichnet. Insgesamt erhält man

D 0 ‚ …„ ƒ    0 .t; h/ D dqC1 .t/ C Dy f .t; y.t//cq .t/  cq .t/ hqC1 C

 @Dy „

2 3

@h

.t; y.t/I 0/cq .t/  ƒ‚ DW dqC2 .t/

1 00 c .t/ 2 q





hqC2 C O. hqC3 / für h ! 0;

bezüglich des gleichen Anfangswertproblems y 0 D f .t; y/; y. a / D y0 Die spezielle Form von dqC2 ist im Beweis angegeben.

169

Abschnitt 7.5 Asymptotische Entwicklung der Approximationen

wobei die angegebenen Konvergenzraten gleichmäßig in t auftreten. Im Fall q D 1 verwendet man anstelle (7.30) die folgende Taylorentwicklung zweiter Ordnung,

R.t; h/ D Dy .t; y.t/I h/hc1 .t/ C .c1 .t/> Dy2 „ DDy2

i . t; y.t/ I

ƒ‚

N

h/ c1 .t//i D1 h2 C O. h3 / …

i . t;y.t / I 0 /CO. h /

N

@2

für h ! 0, mit der Hessematrix Dy2 i . t; y.t/I h/ D . @y @yi .t; y.t/ I h//k;lD1 , wobei k l bezeichnet. Man erhält so die Darstellung i die i -te Komponente von



.t; h/ D

‚ 

DW d3 .t/ …„

>

c1 .t/ Dy

2

i .t; y.t/I

0 /c1 .t/

N

iD1

C

@Dy @h

.t; y.t/ I 0/c1 .t/  C O. h4 /

ƒ 

1 00 c .t/ 2 1

h3

für h ! 0;

wobei die angegebenen Konvergenzraten gleichmäßig in t auftreten. Es sind nun alle Hilfsmittel zur Komplettierung des Beweises des Theorems über die asymptotische Entwicklung des globalen Verfahrensfehlers zusammengestellt: Beweis von Theorem 7.23. Die Aussage des Theorems folgt unmittelbar aus den in Bemerkung 7.25 angestellten Vorüberlegungen, wobei noch für jede Anwendung von Lemma 7.27 dessen Voraussetzungen nachzuprüfen sind, was im Folgenden geschieht. Es ist so, dass mit der Verfahrensfunktion ' auch jede der in (7.24) betrachteten Funktionen ' Œ s  der Stabilitätsbedingung (7.10) genügt. Weiter gelten die Identitäten

f .t; u/ D '.t; uI 0/ D ' Π1  .t; uI 0/ D : : : D ' Πr1  .t; uI 0/ sowie @2 ' Πr1  .t; uI 0/ @h @yj

@2 ' Π1 

D ::: D .t; uI 0/ @h @yj 8 2 @ ' ˆ ; falls p  2; ˆ < @h @yj .t; uI 0/ N D X @2 ' ˆ ....... ˆ ......  .t; uI 0/; p D 1; : @yi @yj i D1

so dass Lemma 7.27 tatsächlich jeweils anwendbar ist. Theorem 7.23 ist damit vollständig bewiesen.

7.5.4 Asymptotische Entwicklungen des lokalen Verfahrensfehlers Es werden nun die vorgestellten asymptotische Entwicklungen des globalen Verfahrensfehlers zur Gewinnung von Verfahren höherer Ordnung eingesetzt. Zuvor wird noch eine asymptotische Entwicklung für den lokalen Verfahrensfehler angegeben, die sich bei der Konstruktion von Schrittweitensteuerungen verwenden lässt:

170

Kapitel 7 Einschrittverfahren für Anfangswertprobleme

Theorem 7.28. Unter den Bedingungen von Theorem 7.23 gilt für jede fixierte Zahl ` 2 N die folgende Entwicklung für den lokalen Verfahrensfehler4 :

D u` ‚ …„ ƒ uh .a C `h/ D y.a C `h/ C bpC1 hpC1 C bpC2 hpC2 C : : : C bpCr1 hpCr1 C O.hpCr / (7.31) für h > 0, mit gewissen von der Zahl ` abhängenden vektoriellen Koeffizienten bpC1 ; : : : ; bpCr1 2 R N . Beweis. Aus Theorem 7.23 erhält man unter Verwendung der Taylorentwicklungen

cpCj .a C `h/ D

rj X1

.k/

cpCj .a/

kD1

. `h /k kŠ

C O.hrj /

für j D 0; 1; : : : ; r  1

unmittelbar die Aussage des Theorems,

uh .a C `h/ D y.a C `h/ C

r X1

cpCj .a C `h/hpCj C O.hpCr /

j D0

D y.a C `h/ C

r s X1  X sD1

kD1



.k/

cpCsk .a/ ƒ‚ DW bpCs

`k pCs h C O.hpCr /: kŠ …

7.6 Extrapolationsmethoden für Einschrittverfahren Im Folgenden wird ein Einschrittverfahren (7.19)5 mit der Konsistenzordnung p  1 und einer asymptotischen Entwicklung von der Form6 uh .t/ D y.t/ C cp .t/hp C cpC1 .t/hpC1 C: : :CcpCr1 .t/hpCr1 CO.hpCr / herangezogen. Bei fixiertem t 2 Œ a; b  werden Extrapolationsverfahren für h ! 0 betrachtet mit dem Ziel der Gewinnung von Verfahren höherer Ordnung. Zur Approximation von y.t/ betrachte man für eine feste Stelle t 2 Œ a; b  zu Schrittweiten hŒ0 > hŒ1 > : : : aus H t ( siehe (7.20) ) und einer Zahl 0  m  r das vektorwertige Polynom P0;:::;m von der Form

P0;:::;m .h/ D d0 C dp hp C dpC1 hpC1 C : : : C dpCm1 hpCm1 ; h 2 R ; (7.32) mit vektoriellen Koeffizienten d0 ; dp ; dpC1 ; : : : ; dpCm1 2 R N , wobei diese m C 1 Koeffizienten so zu bestimmen sind, dass die m C 1 Interpolationsbedingungen

P0;:::;m .hŒk / D uhŒk .t/ 4

für k D 0; 1; : : : ; m;

(7.33)

Anders als bei der asymptotischen Entwicklung des globalen Verfahrensfehlers hängt die betrachte Stelle hier von h ab. 5 zur approximativen Bestimmung der Lösung des Anfangswertproblems y 0 D f .t; y/; y. a / D y0 6 siehe (7.22)

Abschnitt 7.6 Extrapolationsmethoden für Einschrittverfahren

171

erfüllt sind. Die betrachteten Schrittweiten seien dabei so gewählt, dass bezüglich einer Grundschrittweite h 2 H t Folgendes gilt,

hŒk D h=nk

für k D 0; 1; : : : ;

mit 1  n0  n1  : : : :

(7.34)

Als Näherung für y.t/ wird P0;:::;m .0/ herangezogen. Durch diese Extrapolation nach h ! 0 erhält man ein Verfahren der Ordnung p C m, es gilt P0;:::;m .0/ D y.t/ C O.hpCm /. Die genauen Approximationseigenschaften sind in dem folgenden Theorem angegeben.

Theorem 7.29. Gegeben sei ein Einschrittverfahren (7.19)5 mit einer asymptotischen Entwicklung von der Form (7.22). In der Situation (7.34) gilt für das (existierende und eindeutig bestimmte) Polynom P0;:::;m von der Form (7.32) mit der Interpolationseigenschaft (7.33) die folgende Fehlerdarstellung

P0;:::;m .0/ D y.t/ C

pCr X1

Bs cs .t/ hs C O.hpCr /;

(7.35)

sDpCm

mit von t und h unabhängigen Matrizen BpCm ; : : : ; BpCr1 2 R N N . Beweis. Der Beweis wird zunächst für den eindimensionalen Fall ( N D 1 ) geführt. Die Menge der Polynome von der Form (7.32) stimmt ( für N D 1 ) überein mit ¹ P 2 …pCm1 W P ./ .0/ D 0 für  D 1; 2; : : : ; p  1 º, und die angegebene Existenz und Eindeutigkeit folgt dann aus der des hermiteschen Interpolationsproblems, vergleiche Aufgabe 1.3 auf Seite 18. Im Folgenden wird die angegebene Fehlerdarstellung für P0;:::;m .0/  y.t/ D d0  y.t/ hergeleitet. Hierzu schreibt man die Interpolationsbedingungen (7.33) in Form eines linearen Gleichungssystems

0

10

1

0 1 p p p 1=n B 1 1=n0 1=n0 CB C 0 uhŒ0 .t/ B CB C B C B CB C B C hp dp B 1 1=np 1=npC1 p p p 1=npCm1 C B C B C B CB C B uhŒ1 .t/ C 1 1 1 B C B hpC1 d C D B C ; (7.36) pC1 Bp CB C B C pp pp pp pp Bp CB C B C p pp p p p Bp CB C B C p B CB C @ A @ A@ A p pC1 p p p pCm1 uhŒm .t/ 1 1=nm 1=nm 1=nm hpCm1 dpCm1 „ ƒ‚ … .mC1/.mC1/ DW Am 2 R p

pC1

pCm1

d0

wobei die auftretende Matrix wegen der Eindeutigkeit des Polynoms P0;:::;m regulär ist. Auf der anderen Seite führt eine Auswertung der asymptotischen Entwicklung

172

Kapitel 7 Einschrittverfahren für Anfangswertprobleme

(7.22) an den Stellen hŒ0 ; hŒ1 ; : : : ; hŒm in Matrix-Vektor-Darstellung auf Folgendes,

D Am …„

‚ 0 p

pC1

B 1 1=n0 1=n0

B B B 1 1=np 1=npC1 B 1 1 B Bp pp pp Bp p p Bp B @ p pC1 1 1=nm 1=nm

ƒ 10

1

1 0 CB C uhŒ0 .t/ C CB C B C CB C B cp .t/hp pCm 1 C C B C B p p p 1=n CB C B uhŒ1 .t/ C 1 C  rh .t/; (7.37) CB c C B pC 1 pC1 .t/h C CB CDB pp pp C CB C B p p p C CB C B p p CB C @ A A@ A 1 uhŒm .t/ p p p 1=npCm cpCm1.t/hpCmC1 m p p p 1=npCm1

y.t/

0

0 mit rh .t/ WD

pCr X1 sDpCm

1=ns0

1

B 1=ns1 C B p C cs .t/ hs C O.hpCr /; @ pp A 1=nsm

mit der gleichen Matrix wie in (7.36). Subtrahiert man nun das System (7.37) von dem Gleichungssystem (7.36), so führt dies auf

0

10 p

pC1

p p p 1=npCm1

1 d0  y.t/

B 1 1=n0 1=n0 CB C 0 B CB C p B CB C . dp  cp .t/ /h B 1 1=np 1=npC1 p p p 1=npCm1 C B C B C B C 1 1 1 B CB C D rh .t/: (7.38) pC 1 .dpC1  cpC1 .t/ /h Bp C B C pp pp pp Bp CB C pp p p p Bp CB C p B CB C @ A@ A p pC1 p p p pCm1 pCmC 1 1 1=nm 1=nm 1=nm .dpCm1  cpCm1 .t/ /h ƒ‚ … „ D Am 1 Multipliziert man noch A m auf beiden Seiten, so führt eine Betrachtung der ersten Gleichung des entstehenden Systems für den eindimensionalen Fall N D 1 auf die Behauptung ( unter Beachtung der Unabhängigkeit der Matrix Am von h und t ). Im allgemeinen Fall N  1 sind in der Matrix Am und in den in rh auftretenden Vektoren q q die skalaren Einträge 1=nj 2 R jeweils durch die Matrizen . 1=nj /I 2 R N N zu ersetzen, ansonsten bleibt die Argumentation die Gleiche.

Bemerkung 7.30. (a) Im Fall einer Konsistenzordnung p D 1 und der eindimensionalen Situation N D 1 ist die Aussage von Theorem 7.29 eine unmittelbare Konsequenz aus Theorem 6.26 in Kapitel 6 über numerische Integration. (b) Die in dem genannten Kapitel 6 angegebenen speziellen Unterteilungsfolgen lasM sen sich auch als Schrittweiten hŒ0 > hŒ1 > : : : verwenden. Beispiel 7.31. Mit den genannten Bezeichnungen wird nun der Spezialfall der Konsistenzordnung p D 1 und die Schrittweiten hŒ0 D h; hŒ1 D h=2; hŒ2 D h=4

173

Abschnitt 7.7 Schrittweitensteuerung

betrachtet mit der typischerweise kleinen Grundschrittweite h > 0. Man erhält dann die Fehlerdarstellung

P012 .0/ D y.t/ C O.h3 /; mit einem kubisch in h fallenden Fehler. Der erforderliche Aufwand zur Berechnung von P012 .0/ entsprechend dem Neville-Schema (1.7) auf Seite 6 dagegen beträgt n C 2n C 4n D 7n D O.1= h/ Schritte des vorliegenden Einschrittverfahrens, so dass der dafür erforderliche Aufwand lediglich linear in n D O.1= h/ wächst. M Beispiel 7.32. In der speziellen Situation uh .t/ D y.t/ C cp .t/hp C cpC1 .t/hpC1 C O.hpC2 / für h ! 0 und hŒ0 D h; hŒ1 D h=n1 berechnet sich der Wert P01 .0/ zu

P01 .0/ D uh=n1 .t/ C

uh=n1 .t/  uh .t/ np 1  1

;

was man wahlweise mit dem Neville-Schema (1.7) oder über das Gleichungssystem (7.36) im Beweis von Theorem 7.29 erhält. Das Gleichungssystem (7.38) aus dem angesprochenen Beweis liefert die Fehlerdarstellung

P01 .0/ D y.t/  ˇcpC1 .t/ hpC1 C O.hpC2 / p

mit dem Koeffizienten ˇ WD .1  1=n1 /=.n1  1/, Details werden hier nicht ausgeführt ( Aufgabe 7.10 auf Seite 180 ). Für die nachfolgenden Betrachtungen über Schrittweitensteuerungen wird hier noch der Spezialfall t D a C `h mit fixiertem ` 2 N genauer untersucht. Eine Taylorentwicklung der Funktion cpC1 im Punkt t D a liefert wegen der Identität cpC1 .a/ D 0 die Abschätzung cpC1.a C `h/ D O.h/ und somit

P01 .0/ D y.a C `h/ C O.hpC2 /

M

für h ! 0:

7.7 Schrittweitensteuerung 7.7.1 Verfahrensvorschrift Zur Lösung des Anfangswertproblems y 0 D f .t; y/; y.a/ D y0 wird für eine gegebene Verfahrensfunktion ' W Œ a; b   R N  R C ! R N mit der Konsistenzordnung p  1 die folgende Vorschrift herangezogen,

w D u` C u`C1 D w C

h` 2

h` 2

'.t` ; u` I

'.t` C

h` 2

h` 2

μ

/;

;wI

h` 2

/;

t`C1 WD t` C h` ;

` D 0; 1; : : : :

(7.39)

Im Folgenden wird eine adaptive Wahl der Schrittweiten h` vorgestellt mit dem Ziel einer effizienten Fehlerkontrolle. Einführende Erläuterungen hierzu findet man im folgenden Abschnitt 7.7.2, und in den nachfolgenden Abschnitten 7.7.3 und 7.7.4 wird die genaue Vorgehensweise zur Wahl der Schrittweiten h` beschrieben.

174

Kapitel 7 Einschrittverfahren für Anfangswertprobleme

Bemerkung 7.33. Der Schritt .t` ; u` / ! .t`C1 ; u`C1 / in der Verfahrensvorschrift (7.39) entspricht zwei Schritten .t` ; u` / ! .t`C1=2 ; u`C1=2 / ! .t`C1 ; u`C1 / des Einschrittverfahrens (7.8) mit halber Schrittweite h` =2. Diese Approximation u`C1

y.t`C1 / 2 R N wird für eine Fehlerschätzung benötigt, daher kann man auch gleich die Verfahrensvorschrift (7.39) anstelle des ursprünglichen Einschrittverfahrens (7.8) M verwenden.

7.7.2 Problemstellung Im Folgenden soll ausgehend von einer gegebenen Stelle t` 2 Œ a; b  und einer gegebenen Approximation u` y.t` / 2 R N eine Schrittweite h` > 0 bestimmt werden, für die

jju`C1  z.t` C h` / jj "

(7.40)

erfüllt ist, wobei u`C1 2 R N aus einem Schritt des gegenwärtig betrachteten Verfahrens (7.39) hervorgeht und " > 0 eine vorgegebene Fehlerschranke darstellt, und z W Œ t` ; b  ! R N bezeichnet die Lösung des Anfangswertproblems

z 0 D f .t; z/;

t 2 Πt` ; b I

z.t` / D u` :

(7.41)

Weiter bezeichnet jj  jj in (7.40) eine nicht näher spezifizierte Vektornorm. Bemerkung 7.34. (a) Die Forderung (7.40) zeigt, dass die noch zu beschreibende Schrittweitensteuerung auf einer Vorgabe des lokalen Verfahrensfehlers beruht. Damit erhofft man sich ein vernünftiges Verhalten des globalen Verfahrensfehlers. (b) Die Forderung (7.40) stellt man aus den folgenden Gründen: 



der lokale Verfahrensfehler jju`C1  z.t` C h` / jj soll die vorgegebene Schranke " nicht übersteigen. Dies wird durch die Wahl einer hinreichend kleinen Schrittweite h` erreicht. Aus Effizienzgründen und zur Vermeidung der Akkumulation von Rundungsfehlern wird man die Schrittweite h` jedoch nicht so klein wählen wollen, dass jju`C1  z.t` C h` /jj " gilt.

(c) Zu beachten ist zudem, dass die Lösung des Anfangswertproblems (7.41) nicht M bekannt ist und erst noch numerisch zu bestimmen ist. Zur Vereinfachung der Notation führen wir die folgende Bezeichnung für einen von dem Punkt .t` ; u` / ausgehenden Schritt der Verfahrensvorschrift (7.39) mit Länge h ein,

u2h=2 WD w C

h 2

'.t` C h2 ; w I

h 2

/ mit w D u` C

h 2

'. t` ; u` I

h 2

/: (7.42)

Zur Bestimmung einer Schrittweite h` , für die die Forderung (7.40) ungefähr erfüllt ist, wird ausgehend von einer nicht zu kleinen Startschrittweite h.0/ für k D 0; 1 : : :, so vorgegangen: 

Zunächst berechnet man u2h.k/ =2 .

175

Abschnitt 7.7 Schrittweitensteuerung



Anschließend ermittelt man eine Schätzung für den Fehler j u2h.k/ =2  z.t` C

h.k/ /jj und bricht den Iterationsprozess mit k" WD k ab, falls diese Schätzung kleiner gleich " ausfällt.



Andernfalls, falls diese Schätzung größer als " ist, wird eine neue Testschrittweite h.kC1/ < h.k/ bestimmt.

Abschließend verfährt man mit h` D h.k" / und t`C1 D t` C h.k" / fort. Einzelheiten zu der genannten Fehlerschätzung und der Bestimmung einer neuen Testschrittweite werden in den nachfolgenden Abschnitten 7.7.3–7.7.4 beschrieben.

7.7.3 Vorgehensweise bei gegebener Testschrittweite h.k/ Für eine Testschrittweite h.k/ > 0; k 2 N0 , bestimmt man entsprechend einem Schritt der Verfahrensvorschrift (7.42) den Vektor u2h.k/ =2 2 R N . Anschließend wird zur Überprüfung der Eigenschaft jju2h.k/ =2  z.t` C h.k/ /jj " der Wert z.t` C h.k/ / durch zh.k/ 2 R N geschätzt, wobei

zh WD u2h=2 

vh  u2h=2 2p  1

mit vh WD u` C h'.t` ; u` I h/;

h > 0: (7.43)

Dabei erhält man die Approximation (7.43) mittels lokaler Extrapolation entsprechend Beispiel 7.32 mit n1 D 2. Der Fehler j u2h.k/ =2  z.t` C h.k/ /jj berechnet sich dann näherungsweise zu

ı .k/ WD jju2h.k/ =2  zh.k/ jj D

jjvh.k/  u2h.k/ =2 jj 2p  1

:

(7.44)

Ist dann die Abschätzung ı .k/  " erfüllt, so gibt man sich ( vergleiche (7.40) mit t`C1 D t` C h.k/ ) mit der Schrittweite h` D h.k/ zufrieden und verfährt wie in Abschnitt 7.7.2 beschrieben fort ( mit ` um eins erhöht ). Die vorliegende Situation ist in Bild 7.4 veranschaulicht. ..... ......... ... ..

z.t/

"j " #j

........... ...................... .................. ............... ............. . . . . . . . . . . . ............ ........... .......... .k1/ ......... ......... ........ . . . . . . ... ........ .k/ ....... . . . . . . ...... ...... ....... ...... ...... ..... . . . . ... ...... .k/ 2 ...... 2 ..... .k1/ ..... 2 ..... . . . . ..... . . . .... . . . ..

zh

zh u

h

=

u

h

=2

u`

t`

t`C1 D t` C h.k/

t` C h.k1/

Bild 7.4: Illustration zur Schrittweitensteuerung

..........................

176

Kapitel 7 Einschrittverfahren für Anfangswertprobleme

7.7.4 Bestimmung einer neuen Testschrittweite h.kC1/ im Fall ı .k/ > " Gilt mit der Notation aus (7.44) jedoch ı .k/ > ", so wiederholt man die in Abschnitt 7.7.3 vorgestellte Vorgehensweise mit k um eins erhöht, mit einer neuen Testschrittweite h.kC1/ < h.k/ . Bei der Festlegung einer solchen neuen Testschrittweite h.kC1/ bedient man sich einer näherungsweisen Darstellung des Fehlers u2h=2  z.t` C h/: Lemma 7.35. Mit den Notationen (7.41)–(7.44) gilt unter den Bedingungen von Theorem 7.23 über die Asymptotik des globalen Verfahrensfehlers ( dort für r D 2 ) Folgendes,

jju2h=2  z.t` C h/jj D

 h pC1 .k/ ı C O . . h.k/ /pC2 /; h.k/

0 < h  h.k/ : (7.45)

Gilt also h.k/ "1=.pC2/ , so gewinnt man aus der Darstellung (7.45) unter Vernachlässigung des Restglieds die neue Testschrittweite

h.kC1/ WD

 " 1=.pC1/ .k/ h ı .k/

(7.46)

und wiederholt damit die Vorgehensweise in Abschnitt 7.7.3, mit k um eins erhöht. Beweis von Lemma 7.35. Gemäß Theorem 7.28 existiert ein von h unabhängiger Vektor bpC1 2 R N mit

u2h=2  z.t` C h/ D bpC1 hpC1 C O.hpC2 /;

h > 0;

(7.47)

und im Folgenden wird eine Approximation für bpC1 geliefert. Mithilfe von Beispiel 7.32 erhält man mit zh aus (7.43) Folgendes,

zh  z.t` C h/ D O.hpC2 /; und dies eingesetzt in (7.47) führt auf

u2h=2  zh D bpC1hpC1 C O.hpC2 /:

(7.48)

Wegen der Identität ı .k/ D j u2h.k/ =2  zh.k/ j bedeutet die Darstellung (7.48) insbesondere jjbpC1 jj.h.k/ /pC1 D ı .k/ C O..h.k/ /pC2 / beziehungsweise

jjbpC1 jj D

ı .k/ C O.h.k/ /: .h.k/ /pC1

Die Darstellung (7.49) eingesetzt in (7.47) liefert die Aussage des Lemmas,

 h pC1 .k/ ı C O. h.k/ /hpC1 C O.hpC2 / h.k/ ........ C O. .h.k/ /pC2 /; 0 < h  h.k/ : D

jju2h=2  z.t` C h/jj D

(7.49)

177

Weitere Themen und Literaturhinweise

Bemerkung 7.36. (1) Für den Startschritt empfiehlt sich eine Wahl h.0/ D "q mit einer Konstanten 1 < q < 1=.p C 2/. (2) Zur der in diesem Abschnitt 7.7 vorgestellten Schrittweitenstrategie existieren Alternativen. Ebenfalls sinnvoll ist zum Beispiel ein Abbruchkriterium der Form c1 "  ı .k" /  c2 ". Ist diese Bedingung etwa für ein k noch nicht erfüllt, so setzt man h.kC1/ entsprechend (7.46), wobei hier eine Schrittweitenvergrößerung h.kC1/ > h.k/ eintreten kann. (3) Nicht behandelt wird hier die Frage, ob das in diesem Abschnitt 7.7 beschriebene Abbruchkriterium nach einer endlichen Wahl von Versuchsschrittweiten abbricht oder nicht ( beziehungsweise ob k" < 1 gilt ). M

7.7.5 Pseudocode zur Schrittweitensteuerung Die in Abschnitt 7.7 beschriebene Vorgehensweise wird abschließend in Form eines Pseudocodes zusammengefasst, wobei wieder ' W Œ a; b   R N  R C ! R N eine Verfahrensfunktion der Konsistenzordnung p  1 zur Lösung des Anfangswertproblems (7.1)–(7.2) ist.

t0 D a;

Algorithmus 7.37. Seien

repeat

u0 D y0 ;

h.0/ > 0;

` D 0;

" > 0.

k D 0;

repeat if k D 0

then h D h.0/

w D u` C

h 2

h

'.t` ; u` I 2 /;

v D u` C h'.t` ; u` I h/;

else h D

. ı" /

u`C1 D w C ı D

1=.pC1/

h 2

jjv  u`C1 jj ; 2p  1

h

end;

h

'.t` C 2 ; w I h2 /; k D k C 1;

until ı  ";

t`C1 D t` C h;

` D ` C 1;

until t`  b ; M

Weitere Themen und Literaturhinweise Die Theorie der Anfangswertprobleme für gewöhnliche Differenzialgleichungssysteme wird beispielsweise in Heuser [54] und in Dallmann / Elster [15] einführend behandelt, und eine Auswahl existierender Literatur über Einschrittverfahren zur numerischen Lösung solcher Probleme bildet Deuflhard / Bornemann [21], Grigorieff [41], Hairer / Nørsett /Wanner [50], Kress [63], Reinhardt [85], Strehmel / Weiner [101], Stoer / Bulirsch [99] und Weller [110]. Insbesondere in [21], [50] und [101] findet man

178

Kapitel 7 Einschrittverfahren für Anfangswertprobleme

auch weitergehende Ausführungen über die hier nur beiläufig behandelten RungeKutta-Verfahren. In März [68] und in [101] findet man Einführungen über die hier nicht behandelten Algebro-Differenzialgleichungssysteme, bei denen es sich um spezielle implizite Differenzialgleichungssysteme von der Form f .t; y.t/; y 0 .t// D 0 handelt.

Übungsaufgaben Aufgabe 7.1. Man forme das Anfangswertproblem

y100

D t 2  y10  y22 ;

y200

D t C y20 C y13 ;

y1 .0/

D 0;

y10 .0/ D 1

y2 .0/ D 1;

y20 .0/ D 0

in ein Anfangswertproblem für ein System erster Ordnung um. Aufgabe 7.2. (a) Für das Anfangswertproblem

y 0 D . 1 C jy j /1

auf Π0; b ;

y.0/ D y0 ;

(7.50)

weise man Existenz und Eindeutigkeit der Lösung nach. (b) Seien y und v Lösungen der Differenzialgleichung in (7.50) mit den Anfangswerten y.0/ D y0 beziehungsweise v. 0 / D v0 . Man weise Folgendes nach,

jy.t/  v.t/j  e j t j jy0  v0 j

für t 2 Œ 0; b :

Aufgabe 7.3. Für ein Einschrittverfahren (7.8) zur Lösung des Anfangswertproblems y 0 D f .t; y/; y.a/ D y0 lässt sich der lokale Verfahrensfehler allgemeiner auch für beliebige Punkte .t; y/ 2 Œ a; b   R N definieren,

.t; h/ WD y C h'.t; y I h/  z.t C h/;

0  h  b  t;

wobei z W Œ t ; b  ! R N die Lösung des Anfangswertproblems z 0 D f .s; z/; s 2 Œ t ; b  mit Anfangswert z.t/ D y bezeichnet. Entsprechend lässt sich der Begriff Konsistenzordnung p  1 aus Definition 7.9 für beliebige Punkte . t; y / 2 Œ a; b   R N verallgemeinern. Man zeige: Für jedes Einschrittverfahren (7.8) zur Lösung des Anfangswertproblems y 0 D f .t; y/; y.a/ D y0 mit einer verallgemeinerten Konsistenzordnung p  1 gilt die Konsistenzbedingung

'.t; y I 0/ D f .t; y/

für .t; y/ 2 Œ a; b   R N :

Aufgabe 7.4. Man betrachte das Anfangswertproblem

y0 y.a/

D g.t/;

t 2 Πa; b ;

(7.51)

D 0;

(7.52)

mit einer gegebenen hinreichend glatten Funktion g W Œ a; b  ! R. Wendet man das EulerVerfahren mit konstanter Schrittweite h D .b  a/=N auf das Anfangswertproblem (7.51)–

Rb

(7.52) an, so erhält man eine Näherungsformel für das Integral a g.t/ dt . Gleiches gilt für das Verfahren von Heun. Man gebe beide Nährungsformeln für das Integral sowie jeweils obere Schranken für den von der Zahl h abhängenden Integrationsfehler an.

179

Übungsaufgaben Aufgabe 7.5. Gegeben sei das Anfangswertproblem

y0 D t  t 3;

y.0/ D 0:

Zur Schrittweite h sollen mit dem Euler-Verfahren Näherungswerte u` für y.t` /; t` D ` h, berechnet werden. Man gebe y.t` / und u` explizit an und zeige, dass an jeder Stelle t der Fehler eh .t/ D uh .t/  y.t/ für h D t=n ! 0 gegen Null konvergiert. Aufgabe 7.6 ( Numerische Aufgabe ). Man löse die van der Pol’sche Differenzialgleichung

y 00  .1  y 2 /y 0 C y D 0;

y.0/ D 2;

y 0 .0/ D 0

für D 0 und D 12 numerisch jeweils mit dem Euler-Verfahren, dem modifizierten EulerVerfahren sowie dem klassischen Runge-Kutta-Verfahren. Dabei verwende man jeweils einmal die konstante Schrittweite h D 0:025 und einmal die konstante Schrittweite h D 0:0025 und gebe tabellarisch die Näherungswerte an den Gitterpunkten t D 0:5; 1:0; 1:5; : : : ; 15; an. Aufgabe 7.7 (Taylor-Verfahren). Für eine p -fach differenzierbare Funktion f W Œ a; b   R ! R mit p 2 N sei f .0/ WD f und

f Œj  WD

@f Œj 1 @f Œj 1  C f @t @y

für j D 1; 2; : : : ; p:

Zur Lösung des Anfangswertproblems y 0 D f .t; y/; y.a/ D y0 ist dann über die Verfahrensfunktion

'.t; y I h/ WD

p X hj 1 .j 1/ f .t; y/ jŠ

(7.53)

j D1

ein Einschrittverfahren u`C1 D u` C h'.t` ; u` I h/ der Ordnung p definiert. Nun zur Aufgabenstellung. Gegeben sei das Anfangswertproblem

y0 D 1  y

auf Π0; 1 ;

y. 0 / D 0:

(7.54)

(a) Man bestimme für jede Zahl p 2 N die zugehörige Verfahrensfunktion ' . (b) Man löse das Anfangswertproblem (7.54) für p D 2 und h D 1=n näherungsweise mit dem zur Verfahrensfunktion (7.53) gehörenden Einschrittverfahren und schätze den Fehler bei b D 1 ab. Aufgabe 7.8. Man zeige, dass das durch die Verfahrensfunktion 1

'.t; y I h/ D 6 . k1 C 4k2 C k3 /; k1 D f .t; y/;

k2 D f .t C

h 2

;y C

h 2

k1 /;

k3 D f .t C h; y C h.k1 C 2k2 //;

gegebene Einschrittverfahren ( einfache Kutta-Regel ) die Konvergenzordnung p D 3 besitzt. Aufgabe 7.9. Zur Lösung des Anfangswertproblems y 0 D f .t; y/; y.a/ D y0 sei für jedes p > 0 ein Einschrittverfahren p -ter Ordnung gegeben, welches für jeden Schritt die Rechenzeit pT0 benötigt und in t D b den Wert der gesuchten Funktion approximiert mit einem Fehler Khp . Die Konstanten K und T0 sollen vom jeweiligen Verfahren unabhängig sein. Man bestimme für p und einen vorgeschriebenen Fehler "  K in t D b die größtmögliche Schrittweite h D h. p; " / und die zugehörige Gesamtrechenzeit T D T . p; " /. Wie verhält sich T in Abhängigkeit von p und welches ist die optimale Konsistenzordnung popt D popt . " /? Wie verhält sich popt in Abhängigkeit von "? Der Einfachheit halber sei angenommen, dass die Zahlen p und N ( wobei der Zusammenhang h D .b  a/=N besteht ) reell gewählt werden dürfen.

180

Kapitel 7 Einschrittverfahren für Anfangswertprobleme

Aufgabe 7.10. Man weise die in Beispiel 7.32 getroffenen Aussagen nach. Aufgabe 7.11 ( Numerische Aufgabe ). Man löse numerisch die Differenzialgleichung

y 0 D 200 t y 2 ;

t  3;

y.3/ D

1 ; 901

mit dem Standard-Runge-Kutta-Verfahren der Ordnung p D 4 unter Verwendung der in Abschnitt 7.7 beschriebenen Schrittweitensteuerung. Zur Berechnung jeder neuen Schrittweite h` starte man mit h.0/ D h`1 ( beziehungsweise im Fall k D 0 mit h.0/ WD 0:02 ) und korrigiere gemäß Abschnitt 7.7 solange, bis ( siehe Bemerkung 7.36 ) "=3  ı .k/  3" oder k D 20 erfüllt ist, wobei " D 107 gilt. Für ` D 1; 2; : : : ; 50 gebe man jeweils die Näherungswerte in t` sowie y.t` /; h`1 und die Anzahl der Versuche k zur Bestimmung der Schrittweite h` an.

8

Mehrschrittverfahren für Anfangswertprobleme bei gewöhnlichen Differenzialgleichungen

Mit den in diesem Kapitel behandelten Mehrschrittverfahren zur näherungsweisen Bestimmung einer Lösung des Anfangswertproblems (7.1)–(7.2) ( in Kurzschreibweise y 0 D f .t; y/; y.a/ D y0 ) erhält man auf einfache Weise Verfahren höherer Konvergenzordnung.

8.1 Grundlegende Begriffe 8.1.1 Mehrschrittverfahren Definition 8.1. Ein m-Schrittverfahren zur näherungsweisen Bestimmung einer Lösung des Anfangswertproblems y 0 D f .t; y/; y.a/ D y0 besitzt auf einem äquidistantem Gitter die Form m X

˛j u`Cj D h'.t` ; u` ; : : : ; u`Cm I h/;

` D 0; 1; : : : ; n  m;

(8.1)

j D0

mit 

Koeffizienten ˛j 2 R mit ˛m ¤ 0 und einer Funktion

' W Πa; b   . R N /mC1  R C ! R N ; 

Gitterpunkten beziehungsweise Schrittweiten

t` D a C `h 

(8.2)

für ` D 0; 1; : : : ; n;

mit h D

ba ; n

(8.3)

nicht näher spezifizierten Startwerten u0 ; : : : ; um1 2 R N .

Ein m-Schrittverfahren bezeichnet man allgemeiner auch als Mehrschrittverfahren. Bemerkung 8.2. (a) Üblicherweise setzt man u0 WD y0 , und die weiteren Startwerte u1 ; u2 ; : : : ; um1 2 R N sind in einer Anlaufrechnung zu ermitteln. (b) Nach der Anlaufrechnung wird für jedes ` 2 ¹ 0; 1; : : : ; n  m º so verfahren, dass aus den dann bereits bestimmten Näherungen u` ; : : : ; u`Cm1 2 R N gemäß der Verfahrensvorschrift (8.1) die Näherung u`Cm 2 R N berechnet wird mit der Zielsetzung

u`Cm y.t`Cm /: Hier bezeichnet y W Œ a; b  ! R N die Lösung des Anfangswertproblems y 0 D f .t; y/; y.a/ D y0 .

182

Kapitel 8 Mehrschrittverfahren für Anfangswertprobleme

(c) Wie schon bei den Einschrittverfahren wird zwecks einer vereinfachten Notation der Definitionsbereich einer Funktion ' immer wie in (8.2) angegeben, obwohl bei den meisten noch vorzustellenden speziellen m-Schrittverfahren der Ausdruck '.t; v0 ; : : : ; vm1 I h/ lediglich für Schrittweiten h  .b  t/=m wohldefiniert ist. (d) Hängt in der Verfahrensvorschrift (8.1) die rechte Seite tatsächlich von der Unbekannten u`Cm ab, so spricht man von einem impliziten m-Schrittverfahren. Ist andererseits die Funktion ' unabhängig von u`Cm , so liegt ein explizites m-Schrittverfahren vor. (e) Auf variablen Gittern, die hier nicht weiter behandelt werden, sind m-Schrittverfahren von der Form m X j D0

˛j u`Cj D h`Cm ' . t` ; : : : ; t`Cm ; u` ; : : : ; u`Cm I h`Cm /;

` D 0; 1; : : : ; n  m:

(f) Ist in der Verfahrensvorschrift (8.1) die Funktion ' von der speziellen Form

'.t; v0 ; : : : ; vm I h/ D

m X

ˇj f .t C j h; vj /;

j D0

so wird (8.1) als lineares m-Schrittverfahren bezeichnet.

M

Beispiel 8.3. Ein spezielles lineares 2-Schrittverfahren ist die Mittelpunktregel,

u`C2 D u` C 2hf .t`C1 ; u`C1 /;

` D 0; 1; : : : ; n  2:

Ausführlich werden spezielle Mehrschrittverfahren in Abschnitt 8.3 behandelt.

(8.4) M

8.1.2 Konvergenz- und Konsistenzordnung Die Approximationseigenschaften eines Mehrschrittverfahrens werden durch seine Konvergenzordnung beschrieben. Definition 8.4. Ein Mehrschrittverfahren von der Form (8.1) zur Lösung des Anfangswertproblems y 0 D f .t; y/; y.a/ D y0 besitzt die Konvergenzordnung p  1, falls sich zu jeder Konstanten c  0 und beliebigen Startwerten u0 ; : : : ; um1 2 R N mit jjuk  y.tk /jj  chp für k D 0; 1; : : : ; m  1 der globale Verfahrensfehler in der Form max `Dm;:::;n

jju`  y.t` /jj  Khp

abschätzen lässt mit einer von der Schrittweite h unabhängigen Konstanten K  0. Hier und im Folgenden bezeichnet jj  jj W R N ! R eine nicht näher spezifizierte Vektornorm. In Analogie zu den Einschrittverfahren spielen bei der Bestimmung der Konvergenzordnung eines Mehrschrittverfahrens die folgenden Begriffe eine wichtige Rolle.

183

Abschnitt 8.1 Grundlegende Begriffe

Definition 8.5. Für ein Mehrschrittverfahren (8.1) zur Lösung des Anfangswertproblems y 0 D f .t; y/; y.a/ D y0 bezeichnet

.t; h/ WD

m  X

9  > ˛j y.t C j h/  h'.t; y.t/; y.t C h/; : : : ; y.t C mh/ I h/; =

j D0

0 < h 

bt ; m

> ;

(8.5)

den lokalen Verfahrensfehler im Punkt .t; y.t// ( bezüglich der Schrittweite h ).

Definition 8.6. Ein Mehrschrittverfahren (8.1) zur Lösung des Anfangswertproblems y 0 D f .t; y/; y.a/ D y0 besitzt die Konsistenzordnung p  1, falls für eine Konstante C und eine hinreichend kleine Zahl H > 0 der lokale Verfahrensfehler die folgende Abschätzung erfüllt,

jj .t; h/jj  C hpC1 ;

a  t  b;

0  h  H:

Die Konsistenzordnung wird oft nur kurz als Ordnung eines Mehrschrittverfahrens bezeichnet.

8.1.3 Nullstabilität, Lipschitzbedingung Bei der Behandlung der Konvergenzordnung eines Mehrschrittverfahrens wird auch die folgende Lipschitzbedingung an die Funktion ' W Œ a; b  . R N /mC1 R C ! R N aus der Verfahrensvorschrift (8.1) eine Rolle spielen,

j '.t; v0 ; : : : ; vm I h/  '.t; w0 ; : : : ; wm I h/jj  L'

m X

jjvj  wj jj . vj ; wj 2 R N /: (8.6)

j D0

Bemerkung 8.7. (a) Falls f W Œ a; b   R N ! R N eine stetige Funktion ist, die die Lipschitzbedingung (7.4) erfüllt, so ist für lineare Mehrschrittverfahren die Lipschitzbedingung (8.6) erfüllt mit der Lipschitzkonstanten L' D L maxj D0;:::;m jˇj j. (b) Falls die Lipschitzbedingung (8.6) erfüllt ist, so ist für hinreichend kleine Schrittweiten h die Existenz und Eindeutigkeit der Approximationen des m-Schrittverfahrens (8.1) gewährleistet, da man die Bestimmungsgleichung für u`Cm als Fixpunktgleichung schreiben kann, die für 0 < h < 1=.˛m L' / einer Kontraktionsbedingung M genügt. Schließlich ist bei den Konvergenzbetrachtungen für Mehrschrittverfahren die folgende Eigenschaft von Bedeutung. Definition 8.8. Ein m-Schrittverfahren (8.1) zur Lösung von y 0 D f .t; y/; y.a/ D y0 heißt nullstabil, falls für das erzeugende Polynom

./ WD ˛m  m C ˛m1  m1 C : : : C ˛0 2 …m

(8.7)

184

Kapitel 8 Mehrschrittverfahren für Anfangswertprobleme

die folgende dahlquistsche Wurzelbedingung erfüllt ist,

./ D 0;

./ D 0

)

j j  1I

j j D 1

)

 ist einfache Nullstelle von :

8.1.4 Übersicht Die nächsten Abschnitte des vorliegenden Kapitels behandeln die folgenden wichtigen Themen: 

Kriterien zur Bestimmung der Konvergenzordnung von allgemeinen Mehrschrittverfahren,



Kriterien zur Bestimmung der Konsistenzordnung sowie Überprüfung der Nullstabilität allgemeiner Mehrschrittverfahren,



Behandlung spezieller Mehrschrittverfahren.

8.2 Der globale Verfahrensfehler bei Mehrschrittverfahren 8.2.1 Das Konvergenztheorem Es wird nun das wesentliche Konvergenzresultat für Mehrschrittverfahren vorgestellt. Theorem 8.9. Ein m-Schrittverfahren (8.1) für das Anfangswertproblem y 0 D f .t; y/; y.a/ D y0 sei nullstabil und die Funktion ' genüge der Lipschitzbedingung (8.6). Dann existieren Konstanten K  0 und H > 0, so dass für 0 < h D .b  a/=n  H die folgende Abschätzung gilt,

h max jju`  y.t` /jj  K

`D0;:::;n

max kD0;:::;m1

jjuk  y.tk / jj C



max

at bmh

 i jj .t; h/ jj =h : (8.8)

Beweis. Zur Vereinfachung der Notation nehmen wir im Folgenden ˛m D 1 an und betrachten den skalaren Fall N D 1. Mit den Setzungen

e` D u`  y` ; ` D .t` ; h/;

y` WD y.t` /;

` D 0; 1; : : : ; n; ` D 0; 1; : : : ; n  m;

gelten für ` D 0; : : : ; n  m die folgenden Darstellungen m X j D0 m X j D0

˛j y`Cj

D h'.t; y` ; : : : ; y`Cm I h/ C ` ;

˛j u`Cj

D h'.t` ; u` ; : : : ; u`Cm I h/;

185

Abschnitt 8.2 Der globale Verfahrensfehler bei Mehrschrittverfahren

und daher m X

˛j e`Cj

j D0

D hŒ '.t` ; u` ; : : : ; u`Cm I h/  '. t; y` ; : : : ; y`Cm I h/   ` : (8.9) ƒ‚ … „ DW ı`

Dieses lässt sich folgendermaßen schreiben,

0

1

10

0

e`C1

0

1 e`

1

0

1 0

B B B C CB C C B B : C B C CB C pp pp B B :: C B e`C2 C C B e`C1 C p p B B B C CB C C B : C D B CB C C B C :: B B B : C CB C C 0 1 CB : B B 0 C B : C C @ @ @ A A@ A A p p p p p p e`Cm e`Cm1 ˛0 ˛m1 ı`  ` ƒ‚ … „ ƒ‚ … „ ƒ‚ … „ „ ƒ‚ … DW E`C1 DW A DW E` DW F`

(8.10)

mit der Matrix A 2 R mm und den Vektoren E` ; F` 2 R m . Aus der Darstellung (8.10) erhält man mittels vollständiger Induktion die Beziehung

E` D A` E0 C

` X1

A`1 F ;

` D 0; 1; : : : ; n  m C 1:

(8.11)

D0

Zur Abschätzung der rechten Seite von (8.11) beobachtet man, dass die Wurzeln des erzeugenden Polynoms  mit den Eigenwerten der Matrix A übereinstimmen1 , und aufgrund der Nullstabilität erhält man aus dem nachzutragenden Lemma 8.15 die Beschränktheit der Potenzen der Matrix A, das heißt,

jjAk jj1  C;

k D 0; 1; : : : ;

(8.12)

mit einer Konstanten C > 0. Aus (8.11)–(8.12) resultiert die Abschätzung `   X1 jjE` jj1  C jjE0 jj1 C jjF jj1 ;

` D 0; 1; : : : ; n  m C 1:

(8.13)

D0

Wegen (8.9) und (8.10) gilt

jjF jj1 D jı   j  j  j C hL'

m X

jeCj j

j D0



max

j D0;:::;nm

j j j C hL' mjjE jj1 C hL' jjEC1 jj1 ;

und Summation ergibt ` X1 D0

jjF jj1  nŒ

max

j D0;:::;nm

j j j C hc1

` X1

jjE jj1 C hL' jjE` jj1

D0

mit c1 WD L' .m C 1/: 1

Details hierzu findet man im Beweis von Lemma 5.16 im Kapitel über nichtlineare Gleichungssysteme.

186

Kapitel 8 Mehrschrittverfahren für Anfangswertprobleme

Dies eingesetzt in (8.13) führt für 0 < h  H mit einer Konstanten H < 1=.CL' / auf folgende Abschätzung,

jjE` jj1 

 C jjE0 jj1 1  CL' H

C nŒ

max

j D0;:::;nm

 j j j C

` X1 C c1 h jjE jj1 ; 1  CL' H D0

` D 1; 2; : : : ; n  m C 1: Das ebenfalls noch nachzutragende diskrete Lemma von Gronwall 8.14 liefert dann die Behauptung, wenn man noch

jjE0 jj1 D

max `D0;:::;m1

ju`  y.t` /j;

ju`  y.t` /j  jjE` jj1 ;

berücksichtigt. Bemerkung 8.10. Dem Beweis von Theorem 8.9 entnimmt man noch, dass im Falle expliziter Verfahren H D 1 als obere Schranke für die Schrittweiten gewählt werden kann und die wesentliche Fehlerabschätzung (8.8) für jede Schrittweite h D .b  a/=n formal richtig ist. Es ist jedoch zu beachten, dass bei den noch zu behandelnden steifen Differenzialgleichungen ( siehe Kapitel 8.9 ) der Fehler bei expliziten Verfahren erst für kleine Schrittweiten h > 0 klein ausfällt, was wegen der dort typischerweise großen Lipschitzkonstanten nicht im Widerspruch zur Fehlerabschätzung (8.8) steht. Hier ist der Einsatz impliziter Verfahren sinnvoller. Einzelheiten dazu werden M in Abschnitt 8.9 vorgestellt. Als unmittelbare Folgerung aus Theorem 8.9 erhält man das folgende Korollar. Korollar 8.11. Ein nullstabiles m-Schrittverfahren (8.1) mit der Konsistenzordnung p  1 und einer der Lipschitzbedingung (8.6) genügenden Funktion ' besitzt die Konvergenzordnung p . Es folgt ein Resultat über fehlerbehaftete Mehrschrittverfahren. Korollar 8.12 (Rundungs- und Verfahrensfehleranalyse). Ein m-Schrittverfahren (8.1) zur Lösung des Anfangswertproblems y 0 D f .t; y/; y.a/ D y0 besitze die Konsistenzordnung p  1 und sei nullstabil, und die Funktion ' genüge der Lipschitzbedingung (8.6). Für die Startwerte sei max `D0;:::;m1

jjv`  y.t` / jj  chp C ı1

erfüllt mit einer von h unabhängigen Konstanten c  0. Für die Lösung der Gleichungen m X j D0

˛j v`Cj D h'.t` ; v` ; : : : ; v`Cm I h/ C ` ; jj` jj  ı2 ;

` D 0; 1; : : : ; n  m; ......

;

187

Abschnitt 8.2 Der globale Verfahrensfehler bei Mehrschrittverfahren

gilt dann die Fehlerabschätzung max jjv`  y.t` /jj  K . hp C ı1 C

`D0;:::;n

ı2 h

/ 1=.pC1/

mit einer von h unabhängigen Konstanten K  0. Mit der Wahl h D ı2 man p=.pC1/

max jjv`  y.t` /jj  K . 2ı2

erhält

C ı1 / :

`D0;:::;n

Beweis. Verläuft wie der Beweis von Theorem 8.9. Man hat dort nur ` D .t` ; h` /C` zu setzen.

8.2.2 Hilfsresultat 1: Das Lemma von Gronwall Als erster Nachtrag zum Beweis von Theorem 8.9 wird in diesem Abschnitt das diskrete Lemma von Gronwall vorgestellt. Vorbereitend hierzu wird die folgende kontinuierliche Fassung betrachtet. Lemma 8.13 (Gronwall). Für die riemann-integrierbare Funktion ˆ W Œ 0 ; T  ! R sowie für Konstanten ˛; ˇ 2 R mit ˇ > 0 sei

ˆ.t/  ˛ C ˇ

Z t 0

t 2 Π0; T ;

ˆ.s/ ds;

erfüllt. Dann gilt

ˆ.t/  ˛e ˇ t ;

t 2 Π0; T :

(8.14)

Beweis. Mit der Notation

M WD

sup ˆ.t/

0t T

wird im Folgenden per Induktion über n D 0; 1; : : : die folgende Abschätzung bewiesen,

ˆ.t/  ˛

n X . ˇt /` `Š

`D0

. ˇt /nC1

C M.

n C 1 /Š

;

t 2 Π0; T :

(8.15)

Der Grenzübergang n ! 1 in (8.15) liefert dann die Abschätzung (8.14). Die Abschätzung (8.15) ist richtig für n D 0,

ˆ.t/  ˛ C ˇ

Z t 0

ˆ.s/ ds  ˛ C ˇ

Z t 0

M ds D ˛ C Mˇt;

t 2 Π0; T :

188

Kapitel 8 Mehrschrittverfahren für Anfangswertprobleme

Wir nehmen nun an, dass für ein n 2 N die Abschätzung (8.15) richtig ist mit n  1 anstelle n. Dann gilt

ˆ.t/  ˛ C ˇ 

˛ C ˛

D

˛

Z t 0

 n X1 ˇ ` ˆ.s/ ds  ˛ C ˇ ˛ `Š `D0

Z t 0

s ` ds C M

Z t

ˇn nŠ

0

s n ds



n X1

n X ˇ `C1 t `C1 .ˇt/` ˇ nC1 t nC1 .ˇt/nC1 C M D ˛ C ˛ C M `Š ` C 1 nŠ n C 1 `Š .n C 1/Š `D0 `D1

n X

.ˇt/nC1 .ˇt/` C M ; `Š .n C 1/Š `D0

t 2 Π0; T ;

was den Beweis des Gronwall-Lemmas komplettiert. Eine unmittelbare Konsequenz aus dem Lemma von Gronwall ist das Resultat (7.5) über die stetige Abhängigkeit von den Anfangswerten bei einem Anfangswertproblem y 0 D f .t; y/; y.a/ D y0 . Hier soll das Lemma von Gronwall zum Beweis der folgenden diskreten Variante verwendet werden. Lemma 8.14 (Diskrete Variante des Lemmas von Gronwall). Es seien positive Zahlen h0 ; : : : ; hr1 > 0 sowie Konstanten ˛  0 und ˇ  0 gegeben. Für Zahlen v0 ; : : : ; vr 2 R seien die folgenden Ungleichungen erfüllt,

jv0 j  ˛;

jv` j  ˛ C ˇ

` X1

hj jvj j

für ` D 1; 2; : : : ; r:

j D0

Dann gilt die folgende Abschätzung,

 `  X1 jv` j  ˛ exp ˇ hj ;

` D 0; 1; : : : ; r:

j D0

Beweis. Es soll Lemma 8.13 angewandt werden, und hierzu betrachtet man mit der Notation x0 WD 0 und x`C1 WD x` C h` für ` D 0; 1; : : : ; r  1 die Treppenfunktion

ˆ WD

r X1 `D0

jv` jŒ x` ; x`C1 / C jvr j¹ xr º W Œ 0; T  ! R

.T WD xr /;

wobei M die charakteristische Funktion bezüglich einer gegebenen Menge M bezeichnet, es gilt also M  1 auf M und  0 außerhalb von M . Für beliebige ` 2 ¹ 0; 1; : : : ; r  1 º und t 2 Œ x` ; x`C1 /, sowie auch für ` D r und t D xr gilt dann

ˆ.t/ D jv` j  ˛ C ˇ D ˛ C ˇ

Z x ` 0

` X1

hj jvj j D ˛ C ˇ

j D0

ˆ.s/ ds  ˛ C ˇ

` X1 Z xj C1 j D0

Z t 0

ˆ.s/ ds:

xj

ˆ.s/ ds

189

Abschnitt 8.2 Der globale Verfahrensfehler bei Mehrschrittverfahren

Das Lemma von Gronwall liefert nun

 `  X1 jv` j D ˆ.x` /  ˛e ˇ x` D ˛ exp ˇ hj

für ` D 0; 1; : : : ; r:

j D0

Dies komplettiert den Nachweis der Aussage der diskreten Variante des Lemmas von Gronwall.

8.2.3 Beschränktheit der Matrixfolge A; A 2 ; A 3 ; : : : Das nachfolgende Lemma liefert den zweiten und letzten Nachtrag zum Beweis von Theorem 8.9. Zuvor führen wir noch die folgende Notation ein: einem Eigenwert 2 C einer Matrix A 2 R N N entsprechen nur lineare Elementarteiler, falls die geometrische Vielfachheit von mit der algebraischen Vielfachheit übereinstimmt. Äquivalent dazu ist, dass alle zu gehörenden Jordanblöcke trivial sind. Lemma 8.15. Für eine gegebene Matrix A 2 R N N ist die Folge der Matrizen A; A2 ; A3 ; : : : beschränkt genau dann, (i) wenn der Spektralradius von A kleiner gleich eins ausfällt, r .A/  1; (ii) und wenn jedem Eigenwert 2 C von A mit j j D 1 nur lineare Elementarteiler entsprechen. Beweis. Für den Nachweis der Äquivalenz wird eine zu A ähnliche Matrix J 2 CN N in jordanscher Normalform herangezogen,

0 B J D @

J1

1 pp

C A;

p

Jr

0 B B J` D B @

1

` 1 pp

pp

p

pp

p p

C C C 2 CN` N` ; 1A

` D 1; 2; : : : ; r;

`

Pr

wobei N`  1 und `D1 N` D N gilt. Im Fall N` D 1 bedeutet diese Notation J` D . ` / 2 C11 . Seien nun zuerst die Bedingungen (i) und (ii) erfüllt, es gilt also

j ` j  1I

im Fall j ` j D 1

sei N` D 1

. ` D 1; 2; : : : ; r /: (8.16)

Man wählt nun " > 0 so klein, dass für jedes ` 2 ¹ 1; 2; : : : ; r º im Fall N`  2 die Ungleichung j ` j C "  1 erfüllt ist, was aufgrund von (8.16) möglich ist. Dann betrachtet man

b J D D 1 JD;

D D diag . 1; "; "2 ; : : : ; "N 1 / 2 R N N ;

und erhält unter Beachtung von b J D ."kj Jjk / Folgendes,

0 B b J D @

b J1

1 pp

p

b Jr

0

B C b B A; J` D B @

1

` " pp

p

pp pp

C C C 2 CN` N` ; ` D 1; 2; : : : ; r; (8.17) p "A ` p

190

Kapitel 8 Mehrschrittverfahren für Anfangswertprobleme

J ` D . ` / 2 C11 im Fall N` D 1. Aufgrund der Konstruktion gilt beziehungsweise b jj b J jj1 D

max jj b J ` jj1  1

`D1;:::;r

und daher

jj b J  jj1  1;

 D 1; 2; : : : :

Die Ähnlichkeit der Matrizen A und J impliziert A D T 1 J T mit einer regulären Matrix T 2 CN N , und damit gilt

J  T1 ; A D T11 b

 D 0; 1; : : : ;

mit T1 WD D 1 T:

Daher ist also auch die Matrixfolge A1 ; A2 ; : : : beschränkt. Wir nehmen nun umgekehrt an, dass eine der beiden Bedingungen (i), (ii) nicht erfüllt ist. Wenn die Bedingung (i) nicht erfüllt ist, so gilt für ein 1  `  r die Ungleichung j ` j > 1, und dann betrachte man im Fall N`  2 etwa die Vektorfolge

0 B B B @

` 1 pp

p

1 0 1 pp pp

p p

C C C 1A

0

1

`

B0C B0 B C B B pp C D B pp @ pA @ p

`

0

1 C C C; A

 D 0; 1; : : :;

0

und für N` D 1 gilt J` D . ` / 2 C11 . Falls (ii) nicht erfüllt ist, so gilt für ein 1  `  r sowohl j ` j D 1 als auch N`  2, und hier betrachte man beispielsweise

0 B B B @

`

1

`

0 1 1 1 0 0 1  ` B  C C B pp B ` C C B 1C p B C C B C 0 D B 0 C; C pp C B pp C p 1A B @ ppp A @ p A ` 0 0

 D 0; 1; : : : :

In jedem Fall ist wegen

0 B J D @

J1

1 pp

C A;

p

 D 0; 1; : : :;

Jr dann die Matrix J und damit auch die zu J ähnliche Matrix A nicht potenzbeschränkt. Die Aussage des Lemmas ist damit vollständig nachgewiesen.

8.2.4 Die Konsistenzordnung linearer Mehrschrittverfahren Zum Abschluss der allgemeinen Betrachtungen über Mehrschrittverfahren wird in dem folgenden Lemma ein einfaches Kriterium zur Bestimmung der Konsistenzordnung eines linearen Mehrschrittverfahrens vorgestellt.

191

Abschnitt 8.2 Der globale Verfahrensfehler bei Mehrschrittverfahren

Lemma 8.16. Sind für das lineare m-Schrittverfahren m X

˛j u`Cj D h

j D0

m X

` D 0; 1; : : : ; n  m;

ˇj f .t`Cj ; u`Cj /;

j D0

mit einer p -mal stetig partiell differenzierbaren Funktion f W Œ a; b   R N ! R N ( für eine Zahl p  1 ) die Gleichungen m X

¹ j  ˛j  j 1 ˇj º D 0;

 D 0; 1; : : : ; p;

(8.18)

j D0

erfüllt, so ist das m-Schrittverfahren konsistent von der Ordnung p . Für eine .p C 1/mal stetig partiell differenzierbare Funktion f gilt mehr noch die Darstellung

.t; h/ D CpC1

O.hpC2 /

y .pC1/ .t/hpC1

C  j pC1 ˛j

m X

mit CpC1 WD

j D0

. p C 1 /Š

für h ! 0;



j p ˇj pŠ



:

9 > > = > > ;

(8.19)

Beweis. Die Lösung des Anfangswertproblems y 0 D f .t; y/; y.a/ D y0 ist nach Theorem 7.3 .p C 1/-mal stetig partiell differenzierbar. Taylorentwicklung der Funktionen y und y 0 in dem Punkt t 2 Œ a; b  mh ergibt p X y ./ .t/   j h Š

y.t C j h/ D

C O.hpC1 /;

D0

y 0 .t C j h/ D

p X1 D0

y .C1/ .t/   j h Š

C O.hp / D

p X D0



y ./ .t/ 1 1 j h Š

C O.hp /:

Für den lokalen Verfahrensfehler folgt daraus

.t; h/ D

m X

˛j y.t C j h/  h

j D0

D

m X

m X

ˇj f .t C j h; y.t C j h//

j D0

Œ ˛j y.t C j h/  hˇj y 0 .t C j h/

j D0

D

p X D0

Œ

m X

y ./ .t/

j  ˛j  j 1 ˇj  Š h C O.hpC1 /; 0 < h  j D0 „ ƒ‚ … D 0

bt : (8.20) m

Die Darstellung (8.19) folgt durch die gleiche Entwicklung wie in (8.20), mit p ersetzt durch p C 1.

192

Kapitel 8 Mehrschrittverfahren für Anfangswertprobleme

Bemerkung 8.17. (a) Die ersten beiden Gleichungen des Systems (8.18) bedeuten ausgeschrieben m X

˛j

D 0

für  D 0 ;

j D0

m X

j˛j

j D1

„ ƒ‚ … D .1/

„ ƒ‚ … D  0 .1/

D

m X

ˇj

für  D 1;

j D0

wobei ./ D ˛m  m C: : :C˛0 das zugehörige erzeugende Polynom bezeichnet. Insbesondere implizieren Nullstabilität und Konsistenzordnung p  1 notwendigerweise  0 .1/ ¤ 0. (b) Die Approximationen u0 ; : : : ; unm des Mehrschrittverfahrens (8.1) bleiben unverändert, wenn die Verfahrensvorschrift (8.1) mit einer beliebigen Konstanten ¤ 0 multipliziert wird; in diesem Sinne sind also sowohl der lokale Verfahrensfehler .t; h/ als auch die Konstante CpC1 in (8.19) nicht eindeutig festgelegt. Als ( die von p abhängige ) Fehlerkonstante bezeichnet man die normierte Größe CpC1 = 0 .1/. (c) Die Konsistenzordnung der noch zu betrachtenden speziellen linearen Mehrschrittverfahren lässt sich auch anders als mit Lemma 8.16 bestimmen, wie sich noch M herausstellen wird.

8.3 Spezielle lineare Mehrschrittverfahren – Vorbereitungen Die meisten der vorzustellenden Mehrschrittverfahren beruhen auf der Anwendung interpolatorischer Quadraturformeln auf äquidistanten Gittern. Vorbereitend werden in diesem Abschnitt Darstellungen für Interpolationspolynome auf äquidistanten Gittern geliefert.

Definition 8.18. Für einen gegebenen Datensatz g0 ; g1 ; : : : ; gr 2 R N sind die Rückwärtsdifferenzen r k g 2 R N für 0  k    r rekursiv erklärt durch

r 0 g D g  ; k

r g D r

k1

 D 0; 1; : : : ; r; g  r

k1

g1 ;

 D k; k C 1; : : : ; r

. k D 1; 2; : : : ; r /:

Die bei den Rückwärtsdifferenzen auftretenden Zusammenhänge sind in Schema 8.1 dargestellt.

193

Abschnitt 8.3 Spezielle lineare Mehrschrittverfahren – Vorbereitungen

r 0 g0 D g 0 & r 0 g1 D g 1

!

r 1 g1

& 0

r g2 D g 2 :: :

!

& 1

r g2 :: :

! r 2 g2 :: :

r 0 gr1 D gr1 ! r 1 gr1 ! & r 0 gr D g r

!



::

:

   r r1 gr1

& r 1 gr

&

!





r r1 gr

! r r gr

Schema 8.1: Abhängigkeiten der Rückwärtsdifferenzen Lemma 8.19. Für die Rückwärtsdifferenzen r k g 2 R N eines gegebenen Datensatzes g0 ; g1 ; : : : ; gr 2 R N gilt

r k g D

k X j D0

.1/j . jk /gj ;

0  k    r:

(8.21)

Beweis. Es bezeichne S den Rückwärtsshift,

Sg WD g1 ;

 D 1; 2; : : : ; r:

Wenn man dann die Operatoren .I  S/k und S j in naheliegender Weise rekursiv erklärt, so erhält man mit dem binomischen Satz

r k g D .I  S/k g D

k X j D0

.1/j . jk /S j g D

k X j D0

.1/j . jk /gj :

Die folgenden Darstellungen für das Interpolationspolynom und den zugehörigen Interpolationsfehler bei äquidistanten Stützstellen dienen als Vorbereitung auf die Behandlung spezieller Mehrschrittverfahren. Lemma 8.20. Gegeben seien insgesamt r C1 äquidistante Stützstellen x` D x0 C` h für ` D 0; 1; : : : ; r; mit Zahlen x0 2 R und h > 0. Dann besitzt das zu gegebenen Vektoren g0 ; g1 ; : : : ; gr 2 R N gehörende eindeutig bestimmte ( vektorwertige ) interpolierende Polynom P 2 …N r die Darstellung

P .xr C sh/ D

r X kD0

s

.1/k . k /r k gr ;

s 2 R:

(8.22)

194

Kapitel 8 Mehrschrittverfahren für Anfangswertprobleme

Hierbei gelten die folgenden Identitäten,

. s k /

D

.s/.s  1/    .s  k C 1/ .1/k D kŠ s.s C 1/    .s C k  1/; kŠ

(8.23)

und es bezeichnet

…N r WD

®

P .t/ D

r X

ak t k ;

¯

mit ak 2 R N :

kD0

Beweis von Lemma 8.20. Für die newtonsche Darstellung des Polynoms P erhält man unter Verwendung von (8.23) und den Resultaten aus Abschnitt 1.4 Folgendes,

P .xr C sh/ D a0 C a1 .xr C sh  xr / C : : : C ar .xr C sh  xr /    .xr C sh  x1 / D

r X kD0

D

r X kD0

ak

k Y1

r X

j D0

kD0

.xr C sh  xrj / D

ak hk

k Y1

.s C j / D

j D0

r X

ak

k Y1

. xr C sh  .xr  j h/ /

j D0

s

ak hk .1/k kŠ. k

/

(8.24)

kD0

mit den dividierten Differenzen

ak D gΠxr ; : : : ; xrk  2 R N ;

k D 0; 1; : : : ; r:

(8.25)

Die Aussage des Lemmas erhält man nun aus (8.24)–(8.25) zusammen mit der folgenden Darstellung für die dividierten Differenzen,

g Πx` ; : : : ; x`k  D

r k g` ; kŠhk

0  k  `  r;

die man mittels vollständiger Induktion über k D 0; 1; : : : ; r erhält:

g Œ x`  D g` D r 0 g` ; ` D 0; 1; : : : ; rI gŒ x` ; : : : ; x`kC1   g Œ x`1 ; : : : ; x`k  g Œ x` ; : : : ; x`k  D kh k1 g  r k1 g r r k g` ` `1 ; ` D k; k C 1; : : : ; r: D D ..k  1 /Šhk1 /kh kŠhk

Lemma 8.21. Zu einer gegebenen Funktion g 2 C rC1 . Œ c; d ; R N / und zu den äquidistanten Stützstellen x` D x0 C ` h 2 Œ c; d  für ` D 0; 1; : : : ; r bezeichne P 2 …N r das zugehörige ( vektorwertige ) interpolierende Polynom. Der Interpolationsfehler in xr C sh 2 Œ c; d  besitzt die Darstellung

g.xr C sh/  P .xr C sh/

rC1 D .1/rC1 . r s ; C 1 / F .s/ h .rC1/

F .s/ D .gj

9 =

.j .s// /j D1;:::;N 2 R N ; ;

mit geeigneten Zwischenstellen j .s/ 2 Œ c; d  für j D 1; 2; : : : ; N .

(8.26)

195

Abschnitt 8.4 Adams-Verfahren

Beweis. Aus Abschnitt 1.5 ist die folgende Fehlerdarstellung bekannt, .rC1/

gj .xr C sh/  Pj .xr C sh/ D

!. xr C sh / gj

. j .s/ /

. r C 1 /Š

;

mit !.x/ D .x  x0 /    .x  xr /, und Pj bezeichnet die j -te Komponente des vektorwertigen Polynoms P . Die Aussage des Lemmas folgt dann mit der Darstellung (8.23),

!.xr C sh/ D

r Y

.xr C sh  .xr  j h/ / D hrC1

j D0

r Y

.s C j /

j D0

D hrC1 .1/rC1 . r s C 1 / .r C 1/Š :

8.4 Adams-Verfahren 8.4.1 Der Ansatz Zur Herleitung der ersten Klasse von Mehrschrittverfahren beobachtet man, dass die Lösung y W Œ a; b  ! R N des Anfangswertproblems y 0 D f .t; y/; y.a/ D y0 auch der folgenden Integralrelation genügt,

y.t`Cm /  y.t`Cm1 / D

Z t `Cm t`Cm1

` D 0; 1; : : : ; n  m; (8.27)

f .t; y.t// dt;

was man durch Integration der Differenzialgleichung y 0 D f .t; y.t// von t`Cm1 bis t`Cm erhält. Adams-Verfahren gewinnt man nun durch Ersetzen des Integranden durch geeignete Polynome P ,

u`Cm  u`Cm1 D

Z t `Cm t`Cm1

P .t/ dt;

` D 0; 1; : : : ; n  m:

(8.28)

Je nach der speziellen Wahl von P erhält man explizite beziehungsweise implizite Verfahren. Im Folgenden werden Einzelheiten hierzu vorgestellt.

8.4.2 Adams-Bashfort-Verfahren Definition 8.22. Für m  1 erhält man das m-schrittige Adams-Bashfort-Verfahren durch den Ansatz (8.28) mit

P 2 …N m1 ;

P.tj / D fj ; fj WD f .tj ; uj /;

j D `; ` C 1; : : : ; ` C m  1; ......

Die vorliegende Situation ist in Bild 8.1 veranschaulicht.

:

μ (8.29)

196

Kapitel 8 Mehrschrittverfahren für Anfangswertprobleme ... .......

f`Cm .... .....

........ ......... ..........

f`Cm1.................................................................................................................

P.t/

....................... ... .................... ... ............................. ... ............................... . 1 . .......... . ............................... 2..... .................................................. ....... ........... ... ...... ....... .............................. ..... .... ...... .................... ... .... . . . ......... 1 ......... . . . ..... .................... ...... ......... ... .............................. ...................... .... .................... ..... .................... ..... . . . . . ......... . .... .............................. .......................... ........ ................................ .................... ........ ................................ .................... .......... .............................. .................... ..........

f`C

f`Cm

f`

f`

t`1 t`

t`C1

:::

.... ........

t

t`Cm1 t`Cm

Bild 8.1: Vorgehensweise des m-schrittigen Adams-Bashfort-Verfahrens im eindimensionalen Fall Das folgende Theorem liefert eine explizite Darstellung für das Adams-BashfortVerfahren: Theorem 8.23. Das m-schrittige Adams-Bashfort-Verfahren hat die Gestalt

u`Cm  u`Cm1 D h

m X1

k r k f`Cm1 ;

` D 0; 1; : : : ; n  m;

(8.30)

kD0

mit den von m unabhängigen Koeffizienten

k WD .1/k

Z 1 0

. s k / ds;

k D 0; 1; : : :;

(8.31)

die sich rekursiv berechnen durch 1

kC1

0 C

1

k

1 C

1

k1

2 C : : : C

1 2 k1

C k D 1 für k D 0; 1; : : : : (8.32)

Beweis. Die Darstellung (8.30)–(8.31) folgt umgehend aus Lemma 8.20 mit xj D t`Cj für j D 0; 1; : : : ; m  1, Z t `Cm

P.t/ dt D h

t`Cm1

Z 1 0

Z 1

m X1

s

.–1/k .k 0 ƒ‚ kD0 „ k

P.t`Cm1 C sh/ ds D h

/ ds r k f`Cm1 : (8.33) …

Bei dem Nachweis der Rekursionsformel (8.32) für die Koeffizienten k bedient man sich der erzeugenden Funktion

G.t/ WD

1 X

k t k D

kD0 Z 1

D D

0



1 X

.t/k

kD0

.1  t/s ds D  t

.1  t/ln .1  t/

;

Z 1 0

. s k / ds

1 ln . 1  t

./

D

ˇsD1 . 1  t/s ˇ /

Z 1 X 1 0

k . s k /.t/



ds

kD0

sD0

1 < t < 1:

(8.34)

197

Abschnitt 8.4 Adams-Verfahren

Hier folgt . / durch Vertauschen von Reihenentwicklung und Integration, was P1 s  aufk grund der bei festem 1 < t < 1 gleichmäßigen von kD0 k .t/   sKonvergenz 2 bezüglich s 2 Œ 0 ; 1  ( in unserer Situation gilt j k j  1 ) zulässig ist. Die Darstellung (8.34) für G.t/ liefert

G.t/

ln .1  t/ t

D

1 ; 1t

jt j < 1;

beziehungsweise in Potenzreihenschreibweise

. 0

C 1 t C 2 t 2 C : : : / . 1 C

t

C

2

t2 3

C ::: / D

.1

C t C t 2 C : : : /; (8.35)

und ein Vergleich der Koeffizienten von t 0 ; t 1 ; t 2 ; : : : auf den beiden Seiten der Gleichung (8.35) ergibt die Aussage (8.32). Bemerkung 8.24. (a) Das m-schrittige Adams-Bashfort-Verfahren (8.30) lässt sich in eindeutiger Weise in der Form

u`Cm  u`Cm1 D h

m X1 j D0

` D 0; 1; : : : ; n  m;

ˇm;j f`Cj ;

(8.36)

schreiben mit den von der Zahl m abhängigen Koeffizienten ˇm;0 ; ˇm;1 ; : : : ; ˇm;m1 2 R, denn (8.21) ergibt unmittelbar m X1

k r k f`Cm1 D

m k X1 X kD0 j D0

kD0

D

m X1 

.1/j . jk / k f`Cm1j

.1/j

j D0



m X1

. jk / k

 f`Cm1j :

kDj

ƒ‚ … DW ˇm;m1j

(b) Aus der Rekursionsformel (8.32) berechnen sich die ersten vier Koeffizienten 0 ; : : : ; 3 2 R zu

0 D 1 ;

1 D

1 ; 2

2 D

5 ; 12

3 D

3 : 8

Für m D 1; : : : ; 4 lauten die m-schrittigen Adams-Bashfort-Verfahren in der klassischen Darstellung eines linearen Mehrschrittverfahrens folgendermaßen,

m D 1 W u`C1 D u` C hf` ; m D 2 W u`C2 D u`C1 C m D 3 W u`C3 D u`C2 C m D 4 W u`C4 D u`C3 C

h 2

` D 0; : : : ; n  1I . 3f`C1  f` /;

h 12

h 24

. 23f`C2  16f`C1 C 5f` /;

. 55f`C3  59f`C2 C 37f`C1  9f` /;

......

n  2I

......

n  3I

......

n  4:

Insbesondere erhält man im Fall m D 1 das klassische Euler-Verfahren. 2

siehe (8.23)

M

198

Kapitel 8 Mehrschrittverfahren für Anfangswertprobleme

Das folgende Theorem stellt die wesentlichen Eigenschaften der Adams-BashfortVerfahren heraus: Theorem 8.25. Das m-schrittige Adams-Bashfort-Verfahren ist nullstabil. Im Fall f 2 C m . Œ a; b   R N ; R N / besitzt es die Konsistenzordnung p D m, und die Fehlerkonstante lautet m . Beweis. Das zugehörige erzeugende Polynom ist

./ D  m1 .  1/; so dass die dahlquistsche Wurzelbedingung offensichtlich erfüllt ist. Für den Nachweis der Konsistenzordnung betrachtet man den lokalen Verfahrensfehler,

.t; h/

./

D

y.t C mh/  y.t C .m  1/h/  h

./

D

./

D

 h

......

Z t Cmh t C.m1/h

m X1 j D0 m X1

ˇm;j y 0 .t C j h/ k r k y 0 . t C .m  1/h/

kD0

y 0 .s/  P.s/ ds;

mit

P.t C j h/ D y 0 .t C j h/;

P 2 …N m1 ;

für j D 0; 1; : : : ; m  1;

wobei r k y 0 .t C .m  1/h/ die Rückwärtsdifferenzen bezüglich der Folge y 0 .t/; y 0 .t C h/; : : : ; y 0 .t C .m  1/h/ bezeichnen. Die Identitäten . / und . / resultieren dabei unmittelbar aus der Verfahrensdarstellung (8.36) sowie der daran anschließenden Begründung, und die Identität ./ folgt mit Lemma 8.20 ( siehe auch (8.33) im Beweis von Theorem 8.23 ). Mit der Darstellung (8.26) für den Interpolationsfehler erhält man dann Z 1

.t; h/ D h

0

y 0 .t C .m  1 C s/h/  P. t C .m  1 C s/h/ ds

D hmC1 .1/m

Z 1 0

. s m / F .s/ ds

mit F .s/ D

D O.hmC1 /

. yj.mC1/ .j .s/ / /j D1;::;N ;

für h ! 0;

j .s/ 2 Πt ; t C mh:

Im Fall f 2 C mC1 . Πa; b   R N ; R N / verwendet man

yj.mC1/ .j .s// D yj.mC1/ .t/ C O.h/

für h ! 0

und folgert mit der Definition (8.31) für m die folgende Darstellung für den lokalen Verfahrensfehler,

.t; h/ D m y .mC1/ .t/hmC1 C O.hmC2 / Wegen  0 .1/ D 1 ist m die Fehlerkonstante.

für h ! 0:

199

Abschnitt 8.4 Adams-Verfahren

8.4.3 Adams-Moulton-Verfahren Definition 8.26. Für m  1 erhält man das m-schrittige Adams-Moulton-Verfahren durch den Ansatz (8.28) mit

P 2 …N m;

P.tj / D fj ;

μ

j D `; ` C 1; : : : ; ` C m;

fj WD f .tj ; uj /;

......

(8.37)

:

.... ......

f ........... `Cm ......... P.t/ ........ . ....... f`Cm1................................................................................................................

. .. .................... ... .............................. ... . . . . . . . . . . .. ........................................ . . . .......... ................................ 2...... .................................................. ....... ........... ... ...... ....... .............................. .... ..... ...... .................... .... .... . . . ......... 1 ......... . . ...... .. .............................. ................................... .... .......... ..... .............................. .................... ...... . . . . . . .......... ...... .............................. .......................... .......... .............................. .................... .......... .............................. .................... .......... .............................. .................... ..........

f`C1

f`Cm

f` f`

t`1 t`

t`C1

:::

........ ....

t

t`Cm1 t`Cm

Bild 8.2: Vorgehensweise des m-schrittigen Adams-Moulton-Verfahrens im eindimensionalen Fall Die folgenden Resultate über das Adams-Moulton-Verfahren lassen sich genauso wie die Resultate über die Adams-Bashfort-Verfahren erzielen. Daher wird hier auf die jeweiligen Nachweise verzichtet. Theorem 8.27. Das m-schrittige Adams-Moulton-Verfahren hat die Gestalt m X

u`Cm  u`Cm1 D h

k r k f`Cm ;

` D 0; 1; : : : ; n  m;

kD0

mit den von m unabhängigen Koeffizienten

k WD .1/k

Z 0 1

. s k / ds;

für k D 0; 1; : : :;

die sich rekursiv berechnen durch 0 D 1 und 1

kC1

0 C

1 

k

1 C

1

k1

2 C : : : C

1  2 k1

C k D 0 für k D 1; 2; : : : : (8.38)

Bemerkung 8.28. (a) Das m-schrittige Adams-Moulton-Verfahren lässt sich in eindeutiger Weise in der Form

u`Cm  u`Cm1 D h

m X j D0

 ˇm;j f`Cj ;

` D 0; 1; : : : ; n  m;

200

Kapitel 8 Mehrschrittverfahren für Anfangswertprobleme

schreiben mit den von der Zahl m abhängigen Koeffizienten  ˇm;mj D .1/j

m X

. jk / k;

j D 0; 1; : : : ; m:

kDj

(b) Aus der Rekursionsformel (8.38) berechnen sich die ersten vier Koeffizienten 0 ; : : : ; 3 zu 1 2

0 D 1;

1 D  ;

2 D 

1 ; 12

3 D 

1 : 24

Für m D 1; 2; 3 lauten die m-schrittigen Adams-Moulton-Verfahren in der klassischen Darstellung eines linearen Mehrschrittverfahrens folgendermaßen,

m D 1 W u`C1 D u` C

h 2

.f`C1 C f` /; h

m D 2 W u`C2 D u`C1 C

12

m D 3 W u`C3 D u`C2 C

24

h

` D 0; : : : ; n  1I

. 5f`C2 C 8f`C1  f` /;

......

n  2I

. 9f`C3 C 19f`C2  5f`C1 C f` /;

......

n  3:

Das für m D 1 gewonnene Verfahren wird als Trapezregel bezeichnet.

M

Das folgende Resultat stellt die wesentlichen Eigenschaften der Adams-MoultonVerfahren heraus: Theorem 8.29. Das m-schrittige Adams-Moulton-Verfahren ist nullstabil. Im Fall f 2 C mC1 . Œ a; b   R N ; R N / besitzt es die Konsistenzordnung p D m C 1, und die Fehler konstante lautet mC 1. Bemerkung 8.30. Ein m-schrittiges Adams-Moulton-Verfahren besitzt demnach eine höhere Konvergenzordnung als ein m-schrittiges Adams-Bashfort-Verfahren. Der dafür zu zahlende Preis besteht in der numerischen Lösung eines nichtlinearen Gleichungssystems für die Näherung u`Cm 2 R N . Approximationen hierfür lassen sich mittels gewisser Fixpunktiterationen gewinnen, die in Abschnitt 8.7 vorgestellt werden. M

8.5 Nyström- und Milne-Simpson-Verfahren 8.5.1 Der Ansatz Zur Herleitung einer zweiten Klasse von Mehrschrittverfahren integriert man die Differenzialgleichung y 0 D f .t; y.t// von t`Cm2 bis t`Cm ,

y.t`Cm /  y.t`Cm2 / D

Z t `Cm t`Cm2

f .t; y.t// dt;

` D 0; 1; : : : ; n  m; (8.39)

201

Abschnitt 8.5 Nyström- und Milne-Simpson-Verfahren

und spezielle Verfahren gewinnt man nun durch Ersetzen des Integranden durch geeignete Polynome P ,

u`Cm  u`Cm2 D

Z t `Cm t`Cm2

P.t/ dt;

` D 0; 1; : : : ; n  m:

(8.40)

Je nach der speziellen Wahl von P erhält man explizite beziehungsweise implizite Verfahren. Einzelheiten hierzu werden im Verlauf des vorliegenden Abschnitts 8.5 vorgestellt.

8.5.2 Nyström-Verfahren Definition 8.31. Für m  2 erhält man das m-schrittige Nyström-Verfahren durch den Ansatz (8.40) mit

P 2 …N m1 ;

P.tj / D fj ;

j D `; ` C 1; : : : ; ` C m  1;

fj WD f .tj ; uj /;

:

......

..... .....

f`Cm f`Cm1

................................ ...................... ........... ................................... . ................. . . . . . . ........ .......................................... ...... ................................................................ ........................... . . . ............ . . . . . . . . . . . . . ...................................... ...... ........... `Cm.2....................................................................................... ....... . . . . . . . . . . . . . . . . . . . ..... ....... . . . . . . . . . . . . . . . . . .... ... . . ................................... 1 ............ ...... .... ........................................ ............................ .................................................................... ... ..... .................................................... ..... ........................................ . . . . . ......... ....... ....................................................................... ........................... ........................................ ...... .......................................................................... ........................................ ...... .......................................................................... ........................................ ......... ....................................................................... ....................

f`C1

f`

f

f`

t`1 t`

t`C1

::: t`Cm2

P.t/

........ .....

t

t`Cm

Bild 8.3: Vorgehensweise des m-schrittigen Nyström-Verfahrens im eindimensionalen Fall Die folgenden Resultate für die Nyström-Verfahren lassen sich genauso wie die Resultate über die Adams-Bashfort-Verfahren herleiten. Auf die jeweiligen Nachweise wird daher wiederum verzichtet. Theorem 8.32. Das m-schrittige Nyström-Verfahren hat die Gestalt

u`Cm  u`Cm2 D h

m X1

~k r k f`Cm1 ;

` D 0; 1; : : : ; n  m;

kD0

mit den von m unabhängigen Koeffizienten

~k WD .1/k

Z 1 1

. s k / ds;

k D 0; 1; : : :;

202

Kapitel 8 Mehrschrittverfahren für Anfangswertprobleme

die sich rekursiv berechnen durch ~0 D 2 und 1

kC1

~0 C

1

k

~1 C

1

k1

~2 C : : : C

1 ~ 2 k1

C ~k D 1 für k D 1; 2; : : : : (8.41)

Bemerkung 8.33. (a) Das m-schrittige Nyström-Verfahren lässt sich in eindeutiger Weise in der Form

u`Cm  u`Cm2 D h

m X1

ˇm;j f`Cj ;

j D0

` D 0; 1; : : : ; n  m;

schreiben mit den von der Zahl m abhängigen Koeffizienten

ˇm;m1j D .1/j

m X1

. jk /~k ;

j D 0; 1; : : : ; m  1:

kDj

(b) Aus (8.41) berechnen sich die ersten fünf Koeffizienten ~0 ; : : : ; ~4 zu

~0 D 2;

~1 D 0 ;

~2 D

1 ; 3

~3 D

1 ; 3

~4 D

29 : 30

Für m D 2; 3; 4 lauten die m-schrittigen Nyström-Verfahren in der klassischen Darstellung eines linearen Mehrschrittverfahrens folgendermaßen,

m D 2 W u`C2 D u` C 2hf`C1 ; m D 3 W u`C3 D u`C1 C m D 4 W u`C4 D u`C2 C

h 3

h 3

` D 0; : : : ; n  2I

. 7f`C2  2f`C1 C f` /;

......

n  2I

. 8f`C3  5f`C2 C 4f`C1  f` /;

......

n  4:

Für m D 2 erhält man also die Mittelpunktregel.

M

Das folgende Resultat stellt die wesentlichen Eigenschaften der Nyström-Verfahren heraus: Theorem 8.34. Das m-schrittige Nyström-Verfahren ist nullstabil. Für f 2 C m . Œ a; b   R N ; R N / besitzt es die Konsistenzordnung p D m. Die Fehlerkonstante lautet ~m =2.

8.5.3 Milne-Simpson-Verfahren Definition 8.35. Für m  2 erhält man das m-schrittige Milne-Simpson-Verfahren durch den Ansatz (8.40) mit

P 2 …N m;

P.tj / D fj ; fj WD f .tj ; uj /;

j D `; ` C 1; : : : ; ` C m; ...... :

203

Abschnitt 8.5 Nyström- und Milne-Simpson-Verfahren ..... .....

f`Cm1

f`Cm

............................... ..................................... ..................................... ....... .............................................. ...... ...................................................................... .............................. . . . .. . . ..................................... ........................................ ........... ....... `Cm2 ............................................................................. ....... . . . . . . . . . . . . .................... . ...... ........................................... ... 1 ............ ...... .... ........................................ ........................... ............................................................................ .. ...... ............................................ ...... . ................ . . . . . ........................................ ........ ............................................................... .............................. ........................................ ................. ............................................................... ........................................ ......... ....................................................................... ........................................ ......... ....................................................................... ....................

f`C1

f`

f

f`

t`1 t`

t`C1

::: t`Cm2

P.t/

..... ........

t

t`Cm

Bild 8.4: Vorgehensweise des m-schrittigen Milne-Simpson-Verfahrens im eindimensionalen Fall Die folgenden Resultate für die Milne-Simpson-Verfahren ergeben sich genauso wie die Resultate über die Adams-Bashfort-Verfahren. Auf die einzelnen Beweisführungen wird daher auch hier verzichtet. Theorem 8.36. Für m  2 hat das m-schrittige Milne-Simpson-Verfahren die Gestalt m X

u`Cm  u`Cm2 D h

~kr k f`Cm ;

` D 0; 1; : : : ; n  m;

kD0

mit den von der Zahl m unabhängigen Koeffizienten

~k WD .1/k

Z 0 2

. s k / ds;

k D 0; 1; : : :;

die sich rekursiv berechnen durch ~0 D 2; ~1 D 2 und 1

kC1

~0 C

1 

k

~1 C

1

k1

~2 C : : : C

1  ~ 2 k1

C ~k D 0 für k D 2; 3; : : : : (8.42)

Bemerkung 8.37. (a) Das m-schrittige Milne-Simpson-Verfahren (8.42) lässt sich in eindeutiger Weise in der Form

u`Cm  u`Cm2 D h

m X j D0

 ˇm;j f`Cj ;

` D 0; 1; : : : ; n  m;

schreiben mit den von der Zahl m abhängigen Koeffizienten m X

 ˇm;mj D .1/j

. jk /~j;

j D 0; 1; : : : ; m  1:

kDj

(b) Aus (8.41) berechnen sich die ersten fünf Koeffizienten ~0 ; : : : ; ~4 zu

~0 D 2;

~1 D 2;

~2 D

1 ; 3

~3 D 0;

~4 D 

1 : 90

204

Kapitel 8 Mehrschrittverfahren für Anfangswertprobleme

Für m D 2 beziehungsweise m D 4 lauten die m-schrittigen Milne-Simpson-Verfahren in der klassischen Darstellung eines linearen Mehrschrittverfahrens folgendermaßen,

m D 2 W u`C2 D u` C

h 3

m D 4 W u`C4 D u`C2 C

.f`C2 C 4f`C1 C f` /; h 90

0  `  n  2I

. 29f`C4 C 124f`C3 C 24f`C2 C 4f`C1  f` /; 0  `  n  4:

Für m D 2 erhält man das Verfahren von Milne, das der Simpson-Regel zur numeriM schen Integration entspricht.

Theorem 8.38. Für m  2 ist das m-schrittige Milne-Simpson-Verfahren nullstabil. Wir unterscheiden nun die Fälle m D 2 und m  4:3 (a) Für eine hinreichend glatte Funktion f besitzt das ( zweischrittige ) Verfahren von Milne die Konsistenzordnung p D 4, und die Fehlerkonstante lautet 1=180. (b) Für m  4 und eine hinreichend glatte Funktion f besitzt das m-schrittige Milne– Simpson-Verfahren die Konsistenzordnung p D m C 1, und die Fehlerkonstante lautet  ~mC 1 =2. Bemerkung 8.39. Ganz allgemein erhält man für jede Zahl q  3 weitere Klassen von Mehrschrittverfahren durch Integration der Differenzialgleichung y 0 D f .t; y/ von t`Cmq bis t`Cm ,

y.t`Cm /  y.t`Cmq / D

Z t `Cm t`Cmq

f .t; y.t// dt;

` D 0; 1; : : : ; n  m;

sowie durch anschließendes Ersetzen des Integranden durch geeignete Polynome P ,

u`Cm  u`Cmq D

Z t `Cm t`Cmq

P.t/ dt;

` D 0; 1; : : : ; n  m:

(8.43)

Bei allen auf solchen Ansätzen ( mit q  1 ) beruhenden Ein- und Mehrschrittverfahren wird für jeden Index ` die Vorgehensweise in (8.43) als Integrationsschritt M bezeichnet.

8.6 BDF-Verfahren Im Folgenden werden die ( impliziten ) rückwärtigen Differenziationsformeln behandelt, die kurz als BDF-Verfahren ( backward differentiation formulas ) bezeichnet werden. 3

Für m D 3 erhält man das gleiche Verfahren wie für m D 2.

205

Abschnitt 8.6 BDF-Verfahren

8.6.1 Der Ansatz Definition 8.40. Für m  1 ist die Vorgehensweise bei dem m-schrittigen BDF-Verfahren für ` D 0; : : : ; n  m folgendermaßen: ausgehend von den schon berechneten Approximationen uj y.tj / für j D `; : : : ; ` C m  1, bestimmt man die Näherung u`Cm y.t`Cm / dahingehend, dass für das Interpolationspolynom

P 2 …N m;

P.tj / D uj ;

j D `; ` C 1; : : : ; ` C m;

(8.44)

Folgendes erfüllt ist, Š

P 0 .t`Cm / D f`Cm ;

mit f`Cm WD f .t`Cm ; u`Cm /:

(8.45)

Der Vektor u`Cm 2 R N wird also durch die zusätzliche Bedingung (8.45) festgelegt. Die vorliegende Situation ist in Bild 8.5 veranschaulicht. . .... .. ...

.. ... ... ... . 1 . . 2........ .......................................... ........ ...... .... ...... ..... .... .... ..... . . . . . 1 . . ..... .. .. ....... ...... .... ............................. .... ..... ...... ...... . . . . . . . .......................

u`C

u`

P.t/

u`Cm

u`

1 t`1 t`

u`Cm

.. .. ........................ ..... ........ .. ................. .......

u`Cm1................

t`C1

:::

f`Cm .... ........

t`Cm1 t`Cm

t

Bild 8.5: Vorgehensweise des m-schrittigen BDF-Verfahrens im eindimensionalen Fall

Theorem 8.41. Das m-schrittige BDF-Verfahren hat die Gestalt m X 1 k r u`Cm k

D hf`Cm ;

` D 0; 1; : : : ; n  m:

(8.46)

kD1

Beweis. Für das Polynom P aus (8.44) erhält man nach Lemma 8.20 auf Seite 193 die folgende Darstellung,

P.t`Cm C sh/ D

m X

s

.1/k . k /r k u`Cm ;

s 2 R;

(8.47)

kD0

mit noch freiem u`Cm 2 R N . Zur Anpassung an die Bedingung (8.45) wird (8.47) differenziert,

P 0 .t`Cm / D

1 d

h ds

ˇ P.t`Cm C sh/ ˇ

sD0

D

m 1 X

h

kD0

.1/k

d s ds k

. /jsD0 r k u`Cm ;

206

Kapitel 8 Mehrschrittverfahren für Anfangswertprobleme

und wegen

4 . s 0 / D 1 sowie

d s ds k

. /jsD0

d .s/.s  1/    .s  k C 1/ .1/.2/    .k C 1/ jsD0 D  ds kŠ kŠ k 1  2    .k  1/ .1/ D D .1/k kŠ k

D

für k  1 erhält man die Äquivalenz der Aussagen (8.44)–(8.45) beziehungsweise (8.46). Bemerkung 8.42. (a) Das m-schrittige BDF-Verfahren (8.46) lässt sich in eindeutiger Weise in der Form m X

˛m;j u`Cj D hf`Cm ;

` D 0; 1; : : : ; n  m;

j D0

schreiben mit den von der Zahl m abhängigen Koeffizienten ˛m;0 ; : : : ; ˛m;m 2 R, denn die Darstellung (8.21) liefert m X 1 k r u`Cm k

kD1

D

m k X 1 X .1/j jk k

kD1

j D0

. /u`Cmj

D

m X j D0



.1/j „

m X

kDmax¹j;1º

1 k k j

ƒ‚ DW ˛m;mj

. /



u`Cmj :



(b) Für m D 1; : : : ; 5 lauten die m-schrittigen BDF-Verfahren in der klassischen Darstellung eines linearen Mehrschrittverfahrens folgendermaßen ( jeweils für `  n  m ):

mD1W

u`C1  u` D hf`C1 I 1 . 3u`C2 2

mD2W 1 . 11u`C3 6

mD3W 1 12

mD4W mD5W

1 60

. 25u`C4

 4u`C1 C u` / D hf`C2 I

 18u`C2 C 9u`C1  2u` / D hf`C3 I

 48u`C3 C 36u`C2  16u`C1 C 3u` / D hf`C4 I

. 137u`C5  300u`C4 C 300u`C3  200u`C2 C 75u`C1  12u` / D hf`C5 :

Insbesondere erhält man im Fall m D 1 das implizite Euler-Verfahren.

M

Man kann Folgendes nachweisen ( siehe etwa Abschnitt III.3 in Hairer / Nørsett /Wanner [50] ): Theorem 8.43. Das m-schrittige BDF-Verfahren ist genau für 1  m  6 nullstabil. Für hinreichend glatte Funktionen f besitzt es die Konsistenzordnung p D m, und die Fehlerkonstante lautet 1=.m C 1/.

207

Abschnitt 8.7 Prädiktor-Korrektor-Verfahren

Mehrschrittverfahren

Ordnung

Fehlerkonstante

m-schrittige Adams-Bashfort-Verfahren, m  1

m

m

mC1

 mC 1

m

~ m =2

mC1

 ~mC 1 =2

m

1=.m C 1/

......

Adams-Moulton-Verfahren, m  1

......

Nyström-Verfahren, m  2

......

Milne-Simpson-Verfahren, m  4

........

BDF-Verfahren, 1  m  6

Tabelle 8.1: Übersicht der Konsistenzordnungen und Fehlerkonstanten für spezielle nullstabile m-Schrittverfahren

8.6.2 Tabellarische Übersicht über spezielle Mehrschrittverfahren

8.7 Prädiktor-Korrektor-Verfahren Implizite m-Schrittverfahren von der Form (8.1) mit ˛m D 1 implementiert man in der Form eines Prädiktor-Korrektor-Schemas. Bei im Folgenden fixiertem ` geht man dabei folgendermaßen vor: 

mittels einer Fixpunktiteration ( dem Korrektor, engl. corrector ) bestimmt man Œ1

ŒM 1

u`Cm ; : : : ; u`Cm 

ŒM 

2 R N und schließlich u`Cm WD u`Cm 2 R N ;

Œ0 

den Startwert u`Cm 2 R N verschafft man sich durch ein zunächst nicht näher spezifiziertes explizites m-Schrittverfahren ( den sogenannten Prädiktor, engl. predictor ),

Die folgende Definition präzisiert dieses Vorgehen.

Definition 8.44. Gegeben seien  

ein implizites m-Schrittverfahren von der Form (8.1) mit ˛m D 1 ( der Korrektor ); ein explizites m-Schrittverfahren ( der Prädiktor ) mit Koeffizienten ˛0 ; ˛1 ; : : : ;  ˛m 1 sowie der Funktion

' W Πa; b  . R N /m Π0; H  ! R N :

Bei dem zugehörigen Prädiktor-Korrektor-Verfahren geht man für ` D 0; : : : ; n  m so Œ0 ŒM 1 ŒM  vor: für fixiertes ` bestimmt man u`Cm ; : : : ; u`Cm ; u`Cm DW u`Cm 2 R N entspre4

siehe (8.23)

208

Kapitel 8 Mehrschrittverfahren für Anfangswertprobleme

chend den folgenden Bestimmungsgleichungen, m X1

Œ0

u`Cm C

j D0

uΠC `Cm

m X1 j D0

˛j u`Cj D h' . t` ; u` ; : : : ; u`Cm1 I h /;

(8.48-a)

Œ1 ˛j u`Cj D h' . t` ; u` ; : : : ; u`Cm1 ; u`Cm I h /;  D 1; 2; : : : ; M; (8.48-b)  u`Cm D uŒM : `Cm .0/

Hier setzt man u0 D y0 , und die übrigen Startwerte u` D u` y.t` /; ` D 1; : : : ; m1; hat man in einer ( an dieser Stelle nicht näher spezifizierten ) Anlaufrechnung zu bestimmen. Das folgende Lemma macht deutlich, dass sich das vorgestellte Prädiktor-KorrektorVerfahren als nichtlineares explizites m-Schrittverfahren von der Form (8.1) darstellen lässt. Lemma 8.45. Gegeben sei ein Prädiktor-Korrektor-Verfahren entsprechend Definition 8.44. Für die gewonnenen Approximationen u` y.t` / 2 R N eines PrädiktorKorrektor-Verfahrens gilt die Darstellung

u`Cm C

m X1 j D0

˛j u`Cj D h ŒM 

wobei die Funktion ist, Œ

ŒM 

.t` ; u` ; : : : ; u`Cm1 I h/; ` D 0; 1; : : : ; n  m; (8.49)

W Πa; b  . R N /m Π0; H  ! R N wie folgt rekursiv definiert

Œ1 .t; v0 ; : : : ; vm1 I h/ D '.t; v0 ; : : : ; vm1 ; vm I h/;

 D 1; : : : ; M;

(8.50)

mit Œ0 vm Œ1

vm

D D h

h' . t; v0 ; : : : ; vm1 I h /  Œ1 .

......

/ 

m X1 j D0 m X1 j D0

˛j vj ;

9 > > > =

˛j vj ;

> >  D 2; : : : ; M: > ;

(8.51)

Beweis. Für den Nachweis der Darstellung (8.49) setzt man in (8.50)–(8.51)

v0 WD u` ;

v1 WD u`C1 ; : : : ; vm1 WD u`Cm1 ;

und durch Vergleich von (8.48) und (8.51) erkennt man mittels vollständiger Induktion leicht Œ vm D uŒ ; `Cm

 D 0; 1; : : : ; M;

209

Abschnitt 8.7 Prädiktor-Korrektor-Verfahren ŒM 

wobei vm Œ

u`Cm C

entsprechend (8.51) definiert sei. Dies bedeutet nichts anderes als m X1

˛j u`Cj D h

Œ

.t` ; u` ; : : : ; u`Cm1 I h/;

 D 1; 2; : : : ; M: (8.52)

j D0

Für  D M erhält man aus (8.52) schließlich die Darstellung (8.49). Gegenstand des folgenden Theorems sind die Konsistenzordnung und Nullstabilität von Prädiktor-Korrektor-Verfahren.

Theorem 8.46. Gegeben sei ein Prädiktor-Korrektor-Verfahren von der Form in Definition 8.44, welches die folgenden Eigenschaften besitze: 

der Prädiktor besitze die Konsistenzordnung p  1, und die Funktion ' genüge einer Lipschitzbedingung der Form (8.6);



der Korrektor sei nullstabil und besitze die Konsistenzordnung p  p C M , und die Funktion ' genüge einer Lipschitzbedingung der Form (8.6).

Dann ist das Prädiktor-Korrektor-Verfahren nullstabil und besitzt die Konsistenzordnung p CM , und die zugehörige Funktion ŒM  genügt der Lipschitzbedingung (8.6).

Beweis. Die zu den Funktionen ' beziehungsweise ' gehörenden Lipschitzkonstanten seien mit L beziehungsweise L bezeichnet. (a) Die Nullstabilität folgt unmittelbar aus der Darstellung (8.49). (b) Wir zeigen im Folgenden für  D 1; 2; : : : ; M induktiv, dass die Funktion Œ aus (8.50) einer Lipschitzbedingung der Form (8.6) genügt mit einer gewissen LipschitzŒ Œ konstanten LŒ . Tatsächlich erhält man für wm entsprechend vm aus (8.50), (8.51) Folgendes ( für 0 < h  H ),

jj

Œ1

.t; v0 ; : : : ; vm1 I h/    m X1

 L

j D0

Œ1

.t; w0 ; : : : ; wm1 I h/jj

  Œ0  Œ0 jjvj  wj jj C j vm  wm jj

h m  X1 jjvj  wj jj . 1 C  L j D0

max

j D0; p p ;m1

j˛j j /

C hjj ' .t; v0 ; p p ; vm1 I h/  ' . t; w0 ; p p ; wm1 I h/jj   L 1 C „

   m X1 j˛j j C HL jjvj  wj jj ; j D0;:::;m1 ƒ‚ … j D0 max

Œ1

DW L

i

210

Kapitel 8 Mehrschrittverfahren für Anfangswertprobleme

und genauso erhält man für  D 2; 3; : : : ; M :

j

Œ

.t; v0 ; : : : ; vm1 I h/   m X1

 L

 jjvj  wj jj . 1 C

j D0 Œ1

C hjj   L 1 C „

Œ

.t; w0 ; : : : ; wm1 I h/jj max

j D0; p p ;m1

j˛j j /

.t; v0 ; p p ; vm1 I h/ 

Œ1

. t; w0 ; p p ; wm1 I h/jj



   m X1 j˛j j C HLŒ1 jjvj  wj jj : j D0;:::;m1 ƒ‚ … j D0 max

DW L

Œ

(c) Für den Nachweis der angegebenen Konsistenzordnung definiert man

 .t; h/ D y.t C mh/ C Π.t; h/ D y.t C mh/ C

9 > ˛j y.t C j h/  h' .t; y.t/; : : : ; y.t C .m  1/h//;> > > > > j D0 = m X1

m X1

˛j y.t C j h/  h

Œ

.

(8.53) /;> >

......

j D0

 D 1; 2; : : : ; M;

> > > > ;

womit  der lokale Verfahrensfehler des Prädiktors ist, und ŒM  .t; h/ stellt den lokalen Verfahrensfehler des Prädiktor-Korrektor-Verfahrens dar. Im Folgenden wird mittels vollständiger Induktion Folgendes gezeigt,

jj Π.t; h/jj D O.hp CC1 /

für h ! 0

. D 1; 2; : : : ; M /;

(8.54)

und für  D M erhält man die angegebene Konsistenzordnung für das PrädiktorKorrektor-Verfahren. Für den Nachweis von (8.54) zieht man für  D 1; 2; : : : ; M die Definition (8.50) von Œ heran, Œ

. t; y.t/; y.t C h/; : : : ; y.t C .m  1/h/ I h / ΠD ' . t; y.t/; y.t C h/; : : : ; y.t C .m  1/h/; vm I h /;

mit Œ0 

vm

D .8:53/

D

Œ1

vm

1

D

.8:53/

D

h' . t; y.t/; : : : ; y.t C .m  1/h/ / 

m X1 j D0

˛j y.t C j h/

y.t C mh/   .t; h/; h

Œ1

. t; y.t/; : : : ; y.t C .m  1/h/ /



m X1 j D0

y.t C mh/  Œ1 .t; h/:

˛j y.t C j h/

(8.55)

211

Abschnitt 8.7 Prädiktor-Korrektor-Verfahren

Dies eingesetzt in (8.55) ergibt unter Verwendung der Notation Œ0 D  Œ

.t; y.t/; : : : ; y.t C .m  1/h/ I h/ D '.t; y.t/; : : : ; y.t C .m  1/h/; y.t C mh/  Œ1 .t; h/ I h/ D '.; y.t C mh/I h/ C Œ '.; y.t C mh/  Œ1 .t; h/ I h/  '. ; y.t C mh/ I h/ 

wobei  für “t; y.t/; : : : ; y.t C .m  1/h/” steht. Bezeichnet noch .t; h/ den lokalen Verfahrensfehler des Korrektors, so erhält man aus der letzten Darstellung zusammen mit (8.53) die folgenden Abschätzungen,

jj Œ1 .t; h/jj  jj .t; h/ jj C hLjj  .t; h/jj; jj Œ .t; h/jj 

......

C hLjj Œ1 .t; h/ jj;

 D 2; 3; : : : ; M;

beziehungsweise mit vollständiger Induktion

jj Π.t; h/jj D O.hpC1 / C hO.hp C / D O. hp CC1 /

für h ! 0

. D 1; 2; : : : ; M /; was mit der Aussage (8.54) übereinstimmt. Bemerkung 8.47. In der typischen Situation p  1 D p D m ist nach Theorem 8.46 M ein Korrektorschritt ausreichend, man wählt also M D 1.

8.7.1 Linearer Prädiktor/Linearer Korrektor Typischerweise sind sowohl Prädiktor als auch Korrektor lineare Mehrschrittverfahren, es gilt also

' .t; v0 ; : : : ; vm1 I h/ D

m X1 j D0

'.t; v0 ; : : : ; vm I h/ D

m X

ˇj f .t C j h; vj /;

ˇj f .t C j h; vj /:

j D0

In dieser speziellen Situation wird das Prädiktor-Korrektor-Verfahren in Form eines Pseudocodes dargestellt. Algorithmus 8.48. Für ein gegebenes lineares implizites m-Schrittverfahren von der Form (8.1) mit ˛m D 1 ( der Korrektor ) sowie ein explizites lineares m-Schrittverfahren mit Koeffizienten ˛j ; ˇj ; j D 0; : : : ; m 1 ( der Prädiktor ) nimmt das zugehörige Prädiktor-Korrektor-Verfahren die folgende Gestalt an:

212

Kapitel 8 Mehrschrittverfahren für Anfangswertprobleme

for ` D 0; 1; : : : ; n  m m X1

Œ0 

P u`Cm C

j D0

˛j u`Cj D h

m X1 j D0

ˇj f`Cj I

for  D 1; : : : ; M W Œ1

Œ1

D

f .t`Cm ; u`Cm / m 1  m  X X1 Œ Œ1 u`Cm C ˛j u`Cj D h ˇj f`Cj C hˇm f`Cm

f`Cm

j D0

E C

j D0

ŒM 

u`Cm D u`Cm ŒM 

E f`Cm D f .t`Cm ; u`Cm / Wie üblich ist hier u0 WD y0 , und die weiteren Startwerte u1 ; : : : ; u` 2 R N sind in einer nicht näher spezifizierten Anlaufrechnung zu berechnen, und schließlich setzt man f` WD f .t` ; u` / für ` D 0; : : : ; m  1. Das resultierende Verfahren bezeichnet man als P.EC/M E-Verfahren, wobei E für “evaluate” steht. M Bemerkung 8.49. Zur Einsparung einer Funktionsauswertung kann man in AlgorithŒM  ŒM 1 mus 8.48 die Setzung f`Cm D f .t`Cm ; u`Cm / zu f`Cm WD f`Cm modifizieren. Das

resultierende Gesamtverfahren bezeichnet man als P.EC/M -Verfahren, welches hier nicht weiter diskutiert werden soll und auch nicht als Mehrschrittverfahren von der M Form (8.1) darstellbar ist.

8.8 Lineare homogene Differenzengleichungen 8.8.1 Die Testgleichung In diesem Abschnitt soll das Verhalten spezieller Mehrschrittverfahren zu Illustrationszwecken anhand der Testgleichung

y 0 .t/ D y.t/;

t 0

. 2 R /;

untersucht werden. Ein allgemeines lineares m-Schrittverfahren nimmt hier die Form m X j D0

j u`Cj D 0;

` D 0; 1; : : :;

(8.56)

an mit j D ˛j  h ˇj für j D 0; 1; : : : ; m. Im Folgenden wird beschrieben, wie man die Lösungen .u` /`2N0 der Differenzengleichung (8.56) erhält.

8.8.2 Existenz und Eindeutigkeit bei linearen homogenen Differenzengleichungen Definition 8.50. Im Folgenden bezeichne

s. K / D ¹ u D .u` /`2N0 j u` 2 K º

(8.57)

213

Abschnitt 8.8 Lineare homogene Differenzengleichungen

den Raum der Folgen, mit K D C oder K D R. Eine Abbildung L W s. K / ! s. K / von der Form

.Lu/` D

m X j D0

` D 0; 1; : : :

j u`Cj ;

(8.58)

mit gegebenen Koeffizienten 0 ; 1 ; : : : ; m 2 R ; m ¤ 0, bezeichnet man als linearen Differenzenoperator m-ter Ordnung. Die Gleichung Lu D 0 nennt man zugehörige homogene Differenzengleichung. Schließlich bezeichnet

N .L/ D ¹ u D .u` /`2N0 2 s. K /

j

Lu D 0 º

(8.59)

den Nullraum von L. Bemerkung 8.51. Mit den natürlichen Verknüpfungen bildet s. K / einen linearen Vektorraum über K, und eine Abbildung L W s. K / ! s. K / von der Form (8.58) M ist linear. .0/

Theorem 8.52. Zu gegebenem Differenzenoperator (8.58) und Startwerten u0 ; : : : ; .0/

um1 2 K gibt es genau eine Folge u 2 s. K / mit .0/

Lu D 0;

u` D u`

für ` D 0; 1; : : : ; m  1:

(8.60)

Beweis. Für eine Folge u 2 s. K / bedeutet Lu D 0 Folgendes,

u`Cm D 

 m X1 j D0

 j u`Cj = m ;

` D 0; 1; : : :;

(8.61)

woraus unmittelbar Existenz und Eindeutigkeit einer Folge . u` /`2N0 2 s. K / mit der Eigenschaft (8.60) resultieren. Theorem 8.53. Für jeden linearen Differenzenoperator L der Ordnung m gilt die Identität dim N .L/ D m. Beweis. Für  D 1; 2; : : : ; m sei die Folge uŒ 2 s. K / folgendermaßen definiert,

LuΠD 0;

Œ

u`

² D

1;

für ` D   1;

0;

für ` 2 ¹ 0; : : : ; m  1 ºn¹   1 º:

Diese m Folgen bilden eine Basis von N .L/, wie im Folgenden nachgewiesen wird. (i) Die Folgen uŒ1 ; : : : ; uŒm sind linear unabhängig, denn für gegebene Koeffizienten c1 ; : : : ; cm 2 K gilt: m X D1

c uŒ D 0 Ý 0 D

m X D1

c uŒ

 `

D

m X D1

Œ

c  u`

D c`C1 ; ` D 0; : : : ; m  1:

214

Kapitel 8 Mehrschrittverfahren für Anfangswertprobleme

(ii) Andererseits gilt

N .L/  span ¹ uŒ1 ; : : : ; uŒm º; denn für eine beliebige Folge u 2 N .L/ gelten mit c WD u1 für  D 1; : : : ; m die Identitäten m X D1

c uŒ

 `

D

m X D1

beziehungsweise u D

Œ

c  u`

Pm

D c`C1 D u` ;

D1 c u

Œ

` D 0; 1; : : : ; m  1;

aufgrund von Theorem 8.52.

8.8.3 Die komplexwertige allgemeine Lösung der homogenen Differenzengleichung Lu D 0 Zur Bestimmung einer Basis des m-dimensionalen Raums der komplexwertigen Lösungsfolgen der Gleichung Lu D 0 mit gegebenem Differenzenoperator L der Form (8.58) macht man zunächst den Ansatz u D .  ` /`2N0 mit  2 C und erhält

.Lu/` D

m X

j  `Cj

j D0

./

D

`

m X

j  j ;

` D 0; 1; : : :;

j D0

so dass die Gleichung Lu D 0 erfüllt ist, falls  2 C eine Nullstelle des charakteristischen Polynoms

./ D m m C m1  m1 C : : : C 0

(8.62)

ist. Diese Aussage ( und insbesondere die Identität . / ) ist auch wahr für  D 0, wobei der genannte Ansatz hier u D . 1; 0; 0; : : : / 2 s. C / bedeutet. Im Falle einer s -fachen Nullstelle  2 C mit s  2 ist dieser Ansatz jedoch nicht hinreichend allgemein. Es stellt sich Folgendes heraus: 

gilt  ¤ 0, so ist für jedes 0    s  1 auch u D . `  ` /`2N0 Lösung der Gleichung Lu D 0. mal



‚ …„ ƒ Gilt andererseits  D 0, so ist für jedes 0    s 1 auch u D .0; : : : ; 0; 1; 0; 0; : : :/ 2 s. C / Lösung der Gleichung Lu D 0.

Das allgemeine Resultat hierzu ist in dem folgenden Theorem festgehalten. Theorem 8.54. Zu gegebenem Differenzenoperator L der Form (8.58) seien 1 ; : : : ; r 2 C die paarweise verschiedenen Nullstellen des charakteristischen Polynoms (8.62) mit den jeweiligen Vielfachheiten m1 ; : : : ; mr 2 N. Für beliebige Polynome Pk 2 …mk 1 ; k D 1; 2; : : : ; r ( mit komplexen Koeffizienten ) sowie gegebenenfalls Zahlen aj 2 C; j D 0; 1; : : : ; mk 1 , ist je nach der Situation (i)

k ¤ 0 für k D 1; : : : ; rI

(ii) k D 0 für ein 1  k  rI

215

Abschnitt 8.8 Lineare homogene Differenzengleichungen

durch (i) u` D

r X kD1

(ii) u` D

r X

kD1 k¤k

9 > ` D 0; 1; : : : ; . k ¤ 0 für alle k / > > > > =

Pk .`/k` ; mk 1 ......

X

C

j D0

aj ıj ` ;

> . k D 0 für ein k /> > > > ;

......

(8.63)

eine Folge u 2 s. C / mit Lu D 0 definiert. Umgekehrt lässt sich jede Lösung u 2 s. C / der Gleichung Lu D 0 in der Form (8.63) darstellen. Beweis. Im Folgenden verwenden wir die Notation  Y1

! .x/ WD x.x  1/    .x   C 1/ D

.x  s/;

x 2 R;

sD0

so dass ! ein Polynom vom genauen Grad  mit den Nullstellen 0; 1; : : : ;   1 ist. Weiter sei noch festgehalten, dass für k D 1; 2; : : : ; r die Eigenschaft ./ .k / D 0 für  D 0; 1; : : : ; mk  1 gleichbedeutend mit m X j D

j ! .j /kj  D 0;

 D 0; 1; : : : ; mk  1;

(8.64)

ist. Dies gilt mit der Konvention 00 D 1 auch für den Fall k D 0 und bedeutet hier nichts anderes als 0 D 1 D : : : D mk 1 D 0. Im Folgenden soll das spezielle System

.uΠk;   /kD1;:::;r

D0;:::;mk 1

 s. C /

definiert durch

uΠk;   D .! .`/k` /`2N0

für

k 2 ¹ 1; : : : ; r º;  2 ¹ 0; : : : ; mk  1 º

(8.65)

betrachtet werden, wobei diese spezielle Wahl von uŒ k;   einen kurzen Beweis der linearen Unabhängigkeit ermöglicht. Die Elemente uŒ k;   2 s. C / lassen sich folgendermaßen darstellen: 

Für k ¤ 0 gilt die Identität

uΠk;   D

k .! .`/k` /`0 ; „ƒ‚…

(8.66)

const.

Πk;  



D 0 für ` D 0; 1; : : : ;   1. und aufgrund der speziellen Form von ! gilt u` Mit der Konvention 0 1 D 0 bedeutet die Darstellung (8.65) im Falle k D 0 Folgendes, uŒ k ;   D Š.ı` /`0 ;

 D 0; 1; : : : ; mk  1:

(8.67)

216

Kapitel 8 Mehrschrittverfahren für Anfangswertprobleme

Die Tatsache dim N .L/ D m ist aufgrund von Theorem 8.53 bereits bekannt, und Pr des Weiteren gilt kD1 mk D m. Im Folgenden wird nachgewiesen, dass das System (8.65) eine Basis von N .L/ bildet. Mit den Darstellungen (8.66)–(8.67) für dieses System erhält man die Darstellungen (8.63), wenn man noch berücksichtigt, dass sich Pn jedes Polynom P 2 …n in eindeutiger Weise in der Form P .x/ D sD0 as !s .x/ darstellen lässt. Für den Nachweis der Basiseigenschaften des Systems (8.65) wird als Erstes für fixierte k 2 ¹ 1; : : : ; r º und  2 ¹ 0; : : : ; mk  1 º die Identität LuŒ k;   D 0 nachgewiesen. Hierzu beobachtet man, dass für festes ` die Funktion C ! C; j  ! .` C j / ein Polynom  -ten Grades in j darstellt, so dass es Koeffizienten a;`;s 2 C für s D 0; 1; : : : ;  gibt mit  X

! .` C j / D

j D 0; 1; : : : :

a;`;s !s .j /;

sD0

Damit gilt m X

.LuΠk;   /` D

j D0

D

m X

Πj

j D0



 X sD0

Πk;  

j u`Cj

m X

D

j D0

`Cj 

j ! .` C j /k

m   X  `Cj  X j    D 0: a;`;s !s .j / k  D k` Πa;`;s j !s .j /k j D0

sD0



ƒ‚ .8:64/

D

… 0

Es ist nun noch die lineare Unabhängigkeit der Familie (8.65) nachzuweisen. Hierzu  C Koeffizienten mit seien .ck /kD1;:::;r D0;:::;mk 1

X

ck uΠk;   D 0:

kD1;:::;r D0;:::;mk 1

Dies bedeutet 0 D

X kD1;:::;r D0;:::;mk 1

ck uŒ`k;   D

X

ck ! .`/k` ;

` D 0; 1; : : : ; m  1;

kD1;:::;r D0;:::;mk 1

beziehungsweise in Matrixschreibweise

Bc D

r X

Bk c k D 0

kD1

mit Matrizen und Vektoren

0 B B B B D B B B1 B @

1

:::

Br

C C C C 2 Cmm ; C C A

0

1

B c1 C B C B C B C B C c D B ppp C 2 Cm ; B C B C B C @ A cr

217

Abschnitt 8.8 Lineare homogene Differenzengleichungen

wobei Bk 2 Cmmk und ck 2 Cmk wie folgt erklärt sind,

1

0

Bk

0 ppp 0 !0 .0/ C B C B C B pp pp 1 C B !0 .1/k !1 .1/ p p C B C B C B pp pp C B 0 p p C B C; D B C B C B mk 1 ppp ppp !mk 1 .mk  1/ C B !0 .mk  1/k C B C B p p C B p p C B p p C B A @ mmk m 1 !0 .m  1/k p p p p p p !mk 1 .m  1/k ƒ‚ … „ .! .`/k` /`D0;:::;m1

0 B ck D @

ck 0 pp p

1 C A:

ck;mk 1

D0;:::;mk 1

Die lineare Unabhängigkeit der Familie (8.65) ergibt sich nun aus der Regularität der Matrix B 2 Cmm , die im Folgenden nachgewiesen wird. Hierzu beobachtet man, dass für ein Polynom

p./ D

m X1

dj  j ;

j D0

mit den paarweise verschiedenen Nullstellen 1 ; 2 ; : : : ; r 2 C und den jeweiligen Vielfachheiten m1 ; : : : ; mr 2 N nur5 p  0 beziehungsweise d0 D : : : D dm1 D 0 Pr gelten kann, denn wegen kD1 mk D m besitzt das Polynom p 2 …m1 mindestens m Nullstellen ( entsprechend ihren Vielfachheiten gezählt ). Wegen

p ./ .k / D

m X1

d` ! .`/k` ;

 D 0 ; 1 ; : : : ; mk  1 ;

k D 1; 2; : : : ; r;

`D

ist dies gleichbedeutend damit, dass das Gleichungssystem Ad D 0 nur die triviale Lösung besitzen kann, wobei

0 B A1 B B pp A D B p B @ Ar 5

siehe beispielsweise Fischer [28], Abschnitt 1.3

1 C C C C 2 Cmm ; C A

218

Kapitel 8 Mehrschrittverfahren für Anfangswertprobleme

und die Matrix Ak 2 Cmk m ist folgendermaßen erklärt,

0

Ak

B B B B D B B B B @

!0 .0/ !0 .1/k1 p p p !0 .mk  1/kmk 1 p p p 0

!1 .1/

ppp

pp

p

pp

0

ppp

0



p

!0 .m  1/km1

pp p

pp p

ppp

ppp

1 C C C C C : C C C A

!mk 1 .mk  1/ p p p !mk 1 .mk  1/kmmk ƒ‚ … ` .! .`/k /D0;:::;mk 1 `D0;:::;m1

Dies zieht die Regularität der Matrix A nach sich. Wegen der Eigenschaft B D A> folgt daraus die behauptete Regularität der Matrix B . Eine erste Konsequenz aus Theorem 8.54 ist die folgende Aussage: Korollar 8.55. Sei L ein Differenzenoperator der Form (8.58). Genau dann hat jede Lösung u 2 s. C / der Gleichung Lu D 0 die Eigenschaft sup`D0;1;::: ju` j < 1, wenn für die paarweise verschiedenen Nullstellen 1 ; : : : ; r 2 C des charakteristischen Polynoms (8.62) Folgendes gilt,

´ jk j < 1 oder

μ

jk j D 1; k einfache Nullstelle

. k D 1; 2; : : : ; r /:

8.8.4 Die reellwertige allgemeine Lösung der homogenen Differenzengleichung Lu D 0 In erster Linie ist man an den reellen Lösungen der Differenzengleichung Lu D 0 interessiert. Hierzu bedient man sich für 2 C der Polarkoordinatendarstellung D e i' 2 C;  > 0; ' 2 Œ 0; 2 /; und erhält unmittelbar die Darstellung

` D ` e i`' D ` . cos .`'/ C i sin .`'/ /;

` D 0; 1; : : : :

Berücksichtigt man noch, dass aufgrund der reellen Koeffizienten von ./ D m  m C m1 m1 C : : : C 0 mit jeder Nullstelle  2 C von auch ./ D 0 gilt, erhält man als zweite Konsequenz aus Theorem 8.54 die allgemeine Form der reellen Lösungsfolgen der Gleichung Lu D 0: Theorem 8.56. Zu gegebenem Differenzenoperator L von der Form (8.58) seien 1 ; : : : ; r1 2 R sowie 1 ; 1 ; : : :, r2 ; r2 2 CnR die paarweise verschiedenen Nullstellen des charakteristischen Polynoms (8.62), mit den jeweiligen Vielfachheiten m1 ; : : : ; mr1 und n1 ; : : : ; nr2 2 N, sowie den Polarkoordinatendarstellungen k D k e i'k 2 C, mit k > 0; 'k 2 .0; 2/: Für beliebige Polynome

P k 2 …m k  1

für k D 1; : : : ; r1 ;

b k 2 … n 1 Qk ; Q k

für k D 1; : : : ; r2 ;

219

Abschnitt 8.8 Lineare homogene Differenzengleichungen

sowie gegebenenfalls Zahlen a0 ; : : : ; amk 1 2 R ist je nach der Situation (i)

k ¤ 0

für k D 1; : : : ; r1 I

k D 0 für ein 1  k  r1 I

(ii)

durch

(i) u D

r1 X

Pk .`/k`

C

kD1

(ii) u D

r1  X

r2 X

k`



bk .`/ sin Π`'k  Qk .`/ cos .`'k / C Q



 `

kD1

m k 1

C

......

C

......

X

j D0

kD1 k¤k

aj ıj `

 `

eine Folge u 2 s. R / mit Lu D 0 definiert. Umgekehrt lässt sich jede Lösung u 2 s. R / der Gleichung Lu D 0 in der Form (i) beziehungsweise (ii) darstellen.

8.8.5 Eine spezielle Differenzengleichung Zur näherungsweisen Lösung des Anfangswertproblems y 0 D f .t; y/; y.a/ D y0 wird im Folgenden zu Testzwecken das Zweischrittverfahren

u`C2  4u`C1 C 3u` D 2hf .t` ; u` /;

` D 0; 1; : : : ; n  2;

(8.68)

untersucht. Theorem 8.57. (a) Das Verfahren (8.68) besitzt unter den üblichen Glattheitsvoraussetzungen an die Funktion f die Konsistenzordnung p D 2. Es ist jedoch nicht nullstabil. (b) Die Anwendung des Verfahrens (8.68) auf die Testgleichung

y 0 .t/ D y.t/;

t 2 Π0; b ;

y.0/ D 1;

(8.69)

mit der Schrittweite h D b=n > 0 sowie den Startwerten u0 D 1 und u1 D e h liefert Folgendes,

u` D

. „ƒ‚… e t`

C

h3 6

e t`=3 3` /. 1 C O.h//

für h ! 0;

` D 0; 1; : : : ; n; (8.70)

y.t` / wobei (8.70) gleichmäßig in ` gilt, es hängt also O. h/ nicht von ` ab. Wegen der fehlenden Nullstabilität ist also keine Konvergenz des Verfahrens (8.68) zu erwarten, und anhand der Testgleichung lässt sich das genaue Divergenzverhalten beobachten: an jeder festen Stelle t D `h verhält sich u` für ` D t= h ! 1 wie t 3 e t =3 3` =.6`3 /. Für die feste Schrittweite h D 0:01 sind die durch das Verfahren (8.68) gelieferten Resultate in Tabelle 8.2 vorgestellt.

220

Kapitel 8 Mehrschrittverfahren für Anfangswertprobleme

e t` C

h3

e t` =3 3`

`

t`

y.t` /

u`

2 3

0:02 0:03

9:802  101 9:704  101

9:802  101 9:704  101

9:802  101 9:704  101

7 8

0:07 0:08

9:324  101 9:231  101

9:328  101 9:242  101

9:328  101 9:242  101

13 14

0:13 0:14

8:781  101 8:694  101

1:148  100 1:682  100

1:156  100 1:705  100

20 21

0:20 0:21

8:187  101 8:106  101

6:050  102 1:819  103

6:22  102 1:871  103

30 31

0:30 0:31

7:408  101 7:334  101

3:688  107 1:110  108

3:792  107 1:142  108

100

1:00

3:679  101

1:164  1041

1:199  1041

:: : :: : :: : :: : :: :

:: :

:: :

:: :

:: :

:: :

:: :

:: :

:: :

:: :

:: :

:: :

6

:: :

:: :

:: :

:: :

:: :

:: :

:: :

:: :

:: :

Tabelle 8.2: Illustration des Differenzenverfahrens (8.68), mit der Schrittweite h D 0:01 angewandt auf die Testgleichung (8.69) für b D 1 Beweis von Theorem 8.57. (a) Die angegebene Konsistenzordnung ergibt sich unmittelbar aus Lemma 8.16. Das zu dem Verfahren (8.68) p gehörende erzeugende Polynom ist ./ D  2  4 C 3 mit den Wurzeln 1=2 D 2 ˙ 4  3 D 2 ˙ 1 beziehungsweise 1 D 3; 2 D 1, so dass also keine Nullstabilität vorliegt. (b) Anwendung des Verfahrens (8.68) auf die Testgleichung y 0 D y führt auf die Differenzengleichung

u`C2  4u`C1 C .3  2h/u` D 0;

` D 0; 1; : : : ; n  2:

(8.71)

Das zugehörige charakteristische Polynom lautet

./ D  2  4 C 3  2h; mit den Nullstellen

1=2 D 2 ˙

p

 2 C;

4  .3  2h/ D 2 ˙

p

1 C 2h:

Die allgemeine Lösung von (8.71) ist demnach

u` D c1 1` C c2 2` ;

` D 0; 1; : : : :

(8.72)

Anpassung dieser allgemeinen Lösung an die exakten Anfangsbedingungen u0 D 1; u1 D e h ergibt u0 D c1 C c2 D 1; u1 D c1 1 C c2 2 D e h beziehungsweise

c1 D

2  e h ; 2  1

c2 D

e h  1 : 2  1

(8.73)

221

Abschnitt 8.8 Lineare homogene Differenzengleichungen

Zur Beschreibung des Verhaltens von u` aus (8.72) mit Koeffizienten wie in (8.73) verwendet man

p

1Cx D 1 C

1 x 2



1 2 x 8

C

C O. x 4 /

1 3 x 16

für x ! 0

und erhält für die Nullstellen die folgenden Taylorentwicklungen,

1 D 2 C .1 C h C O.h2 // D 3 C h C O. h2 /

für h ! 0

(8.74)

beziehungsweise 1 2 h C 12 h3 C O.h4 / / 2 1 2 h  12 h3 C O. h4 / 2 3 4

2 D 2  . 1 C h  D 1h C D e

h



1 h 3

C O.h /

für h ! 0:

9 > = (8.75)

> ;

Für die Koeffizienten c1 ; c2 aus (8.73) erhält man mit den Darstellungen (8.74)–(8.75) und wegen 2  1 D 2 C O.h/ Folgendes,

c1 D

 13 h3 C O.h4 / D 2 C O.h/

C O. h4 /

für h ! 0;

c2 D

2  1 C O.h3 / D 1 C O. h3 / 2  1

für h ! 0:

1 3 h 6

Die Lösungsfolge u 2 s. R / der Differenzengleichung (8.71) mit u0 D 1; u1 D e h nimmt somit folgende Gestalt an,

u` D

1 3 h .1 6

C O.h//. 3 C h C O.h2 //` C . 1 C O. h3 / /. e h C O. h3 / /` (8.76)

für h ! 0. Zur Behandlung des zweiten Summanden der rechten Seite in (8.76) berechnet man noch

Πe h C O.h3 /` D e t` Π1 C O.h3 /e h `

./

D

e t` Π1 C O.h2 / 

für h ! 0;

wobei sich . / unter Berücksichtigung von log.1 C x/ D O.x/ und e x D 1 C O.x/ für x ! 0 aus

` log. 1 C O.h3 /e h / D `O.h3 /e h D O.h2 /

für h ! 0

(8.77)

ergibt. Den ersten Summanden der rechten Seite in (8.76) behandelt man ganz ähnlich, `

Π3 C h C O.h2 / D

D 3` Π1 C

1 h 3

3` e t` =3 Π1 C O.h2 /e h=3 

`

`

C O.h2 / ` D 3` Πe h=3 C O.h2 /  ./

D

3` e t` =3 Π1 C O.h/ 

für h ! 0;

wobei man . / genauso wie (8.77) erhält. Daraus resultiert die Darstellung (8.70),

u` D e t` . 1 C O.h2 // C D

.

1 3 h 6

e t`=3 3` . 1 C O.h/ /

e t` C 16 h3 e t` =3 3` /. 1 C O.h// „ƒ‚… D y.t` /

Dies komplettiert den Beweis.

für h ! 0;

` D 0; 1; : : : ; n:

222

Kapitel 8 Mehrschrittverfahren für Anfangswertprobleme

8.9 Steife Differenzialgleichungen 8.9.1 Einführende Bemerkungen In vielen Anwendungen wie etwa der chemischen Reaktionskinetik treten Anfangswertprobleme für spezielle Differenzialgleichungen y 0 D f .t; y/; t 2 Œ a; b  auf, bei W Œ a; b  ! R N existiert, dem sich jede Lösung denen ein Gleichgewichtszustand N y W Œ a; b  ! R der Differenzialgleichung unabhängig von der Lage des Anfangswerts schnell annähert, das heißt, außerhalb eines kleinen Intervalls Œ a; a C " gilt y . Solche Differenzialgleichungen werden als “steif” bezeichnet und erfordern eine besondere numerische Behandlung, wie sich herausstellen wird. Im Folgenden wird zunächst der Begriff “steife Differenzialgleichung” etwas präzisiert. Definition 8.58. Ein Anfangswertproblem y 0 D f .t; y/; y.a/ D y0 genügt einer oberen Lipschitzbedingung bezüglich eines gegebenen Skalarprodukts h ; ii W R N R N ! R, wenn es eine stetige Funktion M W Œ a; b  ! R gibt mit

h f .t; u/  f .t; v/; u  v i  M.t/jju  v jj2 ;

u; v 2 R N :

(8.78)

Gilt M.t/  0 für jede Zahl t 2 Œ a; b , so bezeichnet man das gegebene Anfangswertproblem als dissipativ. Hier und im Folgenden bezeichnet jj  jj W R N ! R die durch das Skalarprodukt induzierte Norm. Im weiteren Verlauf sollen Anfangswertprobleme y 0 D f .t; y/; y.a/ D y0 betrachtet werden, die (a) zum einen dissipativ sind oder zumindest einer oberen Lipschitzbedingung genügen mit M.t/ von moderater positiver Größe, beispielsweise M.t/  1; (b) zum anderen die folgende Eigenschaft besitzen,

m.t/ WD

inf

2 RN

u; v u¤v

h f .t; u/  f .t; v/; u  v i jju  v jj2

0

für t 2 Œ a; b :

(8.79)

Eine Anfangswertproblem y 0 D f .t; y/; y.a/ D y0 mit den in (a) und (b) beschriebenen Eigenschaften bezeichnet man als steif. Bemerkung 8.59. Bei steifen Differenzialgleichungen kann aufgrund der Abschätzung

jhh f .t; u/  f .t; v/; u  v i j jjf .t; u/  f .t; v/ jj  jju  v jj2 jju  v jj die Funktion f W Œ a; b   R N ! R N die Lipschitzbedingung (7.4) höchstens noch mit einer groß ausfallenden Lipschitzkonstanten L  jm.t/j erfüllen, so dass die Konvergenzsätze 7.10 und 8.9 für Einschritt- beziehungsweise Mehrschrittverfahren wegen der auftretenden großen Konstanten erst für kleine Schrittweiten h > 0 sinnvolle Resultate liefern. M

223

Abschnitt 8.9 Steife Differenzialgleichungen

In dem folgenden Beispiel wird anhand einer einfachen steifen Differenzialgleichung das Verhalten sowohl des expliziten als auch des impliziten Euler-Verfahrens getestet. Wie sich zeigt, liefert das explizite Euler-Verfahren erst für sehr kleine Integrationsschritte vernünftige Ergebnisse, was aufgrund der vorigen Bemerkung 8.59 auch nicht sonderlich überraschend ist. Beispiel 8.60. Das Anfangswertproblem

y 0 D y  .1 C /e t ;

t 2 Π0; 1 ;

y.0/ D y0 ;

(8.80)

besitzt die Lösung

y.t/ D e t C .y0  1/e t ;

t 2 Π0; 1 :

Für 2 R ; 0 gilt demnach y.t/ e t bereits für kleine Werte 0 < t 1. Tatsächlich ist das Anfangswertproblem (8.80) für 2 R mit 0 steif, mit M.t/  m.t/  j j. Im Folgenden werden für die beiden Werte D 10 ( das Anfangswertproblem (8.80) ist in dieser Situation nicht steif ) und D 1000 ( dann ist das Anfangswertproblem (8.80) steif ) jeweils sowohl für das explizite als auch das implizite Eulerverfahren numerische Ergebnisse präsentiert. In allen vier Fällen werden gleichabständige Gitter unterschiedlicher Feinheit verwendet, und zwar solche mit den Knotenabständen

h D 2k

für k D 2j;

j D 2; 3; : : : ; 6:

Die Resultate sind in Tabelle 8.3 wiedergegeben. Der Anfangswert ist jeweils y0 D 1, und die Lösung des Anfangswertproblems (8.80) ist dann unabhängig von und lautet y.t/ D e t für t 2 Œ 0 ; 1 . Man beachte, dass im Falle des expliziten Eulerverfahrens der Fehler an der Stelle t D 1 für kleiner gewählte Schrittweiten zunächst über alle Schranken hinauswächst. Für die Schrittweiten h D 210 und h D 212 werden vernünftige Ergebnisse erzielt. M Wie sich in Beispiel 8.60 gezeigt hat, liefert das implizite Euler-Verfahren hier trotz der in Bemerkung 8.59 angestellten Beobachtungen für alle kleinen Schrittweiten h > 0 vernünftige Ergebnisse. Dieses Verhalten ist kein Zufall, wie sich in Abschnitt 8.9.3 herausstellen wird.

8.9.2 Existenz und Eindeutigkeit der Lösung bei Anfangswertproblemen für Differenzialgleichungen mit oberer Lipschitzeigenschaft Für Anfangswertprobleme bei gewöhnlichen Differenzialgleichungen mit oberer Lipschitzeigenschaft sollen zunächst die Fragen “Existenz und Eindeutigkeit einer Lösung” sowie die “stetige Abhängigkeit von den Anfangswerten” diskutiert werden. Zwar kann unter diesen Voraussetzungen nicht auf Theorem 7.2 von Picard/Lindelöf auf Seite 155 zurückgegriffen werden, eine stetige Abhängigkeit von den Anfangswerten (und damit insbesondere die Eindeutigkeit der Lösung) liegt dennoch vor:

224

Kapitel 8 Mehrschrittverfahren für Anfangswertprobleme

D 10 uh .1/  y.1/

h

D 1000 uh .1/  y.1/

uh .1/  y.1/

h

expl. Eulerverf. impl. Eulerverf.

uh .1/  y.1/

expl. Eulerverf. impl. Eulerverf.

0:0625 1:247  103

1:308  103

0:0625

1:283  1024

1:175  105

0:0156 3:174  104

3:212  104

0:0156

2:865  1069

2:892  106

0:039

7:971  105

7:994  105

0:039

8:014  10112

7:202  107

0:010

1:995  105

1:996  105

0:010

1:797  107

1:799  107

0:002

4:989  106

4:990  106

0:002

4:495  108

4:496  108

Tabelle 8.3: Numerische Ergebnisse für das explizite/implizite Eulerverfahren. Dabei bezeichnet uh .1/ jeweils die gewonnenen Approximationen für y.1/. Theorem 8.61. Die Funktion f W Œ a; b   R N ! R N genüge der oberen Lipschitzbedingung (8.78) bezüglich eines gegebenen Skalarprodukts h ; ii und einer gegebenen Funktion M . Dann gilt für differenzierbare Funktionen y; b y W Œ a; b  ! R N mit

y 0 D f .t; y/;

t 2 Πa; b ;

y.a/ D y0 ;

......

b y .a/ D b y 0;

0

y /; b y D f .t;b die Abschätzung

jjy.t/  b y .t/jj  exp.

Z t a

M.s/ ds / jjy0  b y 0 jj;

t 2 Πa; b :

(8.81)

Beweis. Die Funktion

ˆ.t/ D jj.y  b y /.t/ jj2 ;

t 2 Πa; b ;

ist differenzierbar auf dem Intervall Πa; b , und es gilt

μ

./

y /0 .t/; .y  b y .t//; . y  b y /.t/ i 2h .y  b y /.t/ii D 2h f .t; y.t//  f .t;b



2M.t/ jj.y  b y /.t/ jj2 D 2M.t/ˆ.t/;

ˆ0 .t/ D

(8.82)

t 2 Πa; b ;

wobei die letzte Abschätzung aus der oberen Lipschitzbedingung (8.78) resultiert. Die Identität . / folgt unmittelbar aus dem nachfolgenden Lemma 8.62. Die Abschätzung (8.82) zusammen mit der weiter unten nachzutragenden Variante des GronwallLemmas liefert die Behauptung (8.81). Es sind noch zwei Hilfsresultate nachzutragen.

225

Abschnitt 8.9 Steife Differenzialgleichungen

Lemma 8.62. Es seien h ; ii W R N R N ! R ein Skalarprodukt mit induzierter Norm jj  jj W R N ! R und u W Πa; b  ! R N eine differenzierbare Funktion. Dann ist die Funktion

ˆ.t/ D jju.t/jj2 ;

t 2 Πa; b ;

differenzierbar auf dem Intervall Πa; b , mit

ˆ0 .t/ D 2h u0 .t/; u.t/ i ;

t 2 Πa; b :

Beweis. Die Aussage ergibt sich zum Beispiel folgendermaßen,

ˆ.t C h/  ˆ.t/ h

jju.t C h/ jj2  jju.t/jj2 h h u.t C h/  u.t/; u.t/ii h u.t C h/; u.t C h/  u.t/ i C D h h 0 ! 2h u .t/; u.t/ i für h ! 0: D

Das folgende Resultat stellt eine Variante des Gronwall-Lemmas dar: Lemma 8.63. Für die differenzierbare Funktion ˆ W Œ a; b  ! R sei

ˆ0 .t/  c.t/ˆ.t/;

t 2 Πa; b ;

erfüllt mit der stetigen Funktion c W Œ a; b  ! R. Dann gilt

ˆ.t/  exp

Z

t a

 c.s/ ds ˆ.a/;

t 2 Πa; b :

(8.83)

Beweis. Mit der Notation

 Zt  ˇ.t/ WD exp  c.s/ ds ; a

t 2 Πa; b ;

erhält man auf dem Intervall Œ a; b  Folgendes,

.ˆˇ/0 D ˆ0 ˇ C ˆˇ 0 D ˆ0 ˇ  cˆˇ D ˇ. ˆ0  cˆ/  0; so dass die Funktion ˆˇ auf dem Intervall Œ a; b  monoton fallend ist und damit insbesondere ˆ.t/ˇ.t/  ˆ.a/ gilt für t 2 Œ a; b , was gerade die Aussage (8.83) darstellt. In gewissen Situationen gewährleistet auch die obere Lipschitzeigenschaft (8.78) die Existenz der Lösungen der zugehörigen Anfangswertprobleme, so zum Beispiel bei Anfangswertproblemen für autonome Differenzialgleichungen

y 0 D f .y/;

t 2 Πa; b ;

y.a/ D y0 ;

(8.84)

was in dem folgenden Theorem ohne Beweis festgehalten wird ( siehe Strehmel / Weiner [101] ).

226

Kapitel 8 Mehrschrittverfahren für Anfangswertprobleme

Theorem 8.64. Genügt die ( von t unabhängige ) Funktion f W R N ! R N einer oberen Lipschitzbedingung (8.78), gilt also

h f .u/  f .v/; u  v i  M jju  v jj2 ;

u; v 2 R N ;

(8.85)

mit einer Konstanten M 2 R, so besitzt das Anfangswertproblem (8.84) genau eine Lösung. Beispiel 8.65. Das autonome Anfangswertproblem

y 0 D y 3 ;

t 2 Πa; b ;

y.a/ D y0 2 R ;

ist dissipativ ( bezüglich des Skalarprodukts h u; v i D uv für u; v 2 R ) und besitzt nach Theorem 8.64 eine eindeutige Lösung. Man beachte, dass Theorem 7.2 hier nicht anwendbar ist, denn die Funktion f .y/ D y 3 für y 2 R genügt keiner globalen Lipschitzbedingung von der Form (7.4). M Zum Abschluss dieses einführenden Abschnitts werden untere und obere Lipschitzschranken für stetig partiell differenzierbare Funktionen angegeben. Lemma 8.66. Die Funktion f W Œ a; b  R N ! R N sei stetig partiell differenzierbar. (a) Mit der Notation aus (8.79) gilt

m.t/ D

inf

0¤w2R N

h Dy f .t; u/w; w i jjw jj2

für t 2 Œ a; b ;

u; w 2 R N :

(8.86)

(b) Die Funktion f genügt bezüglich einer gegebenen Funktion M W Œ a; b  ! R der oberen Lipschitzbedingung (8.78) genau dann, wenn Folgendes gilt,

h Dy f .t; u/w; w i  M.t/jjw jj2

für t 2 Œ a; b ;

u; w 2 R N :

Beweis. Der Mittelwertsatz für vektorwertige Funktionen bedeutet

f .t; u/  f .t; v/ D

Z

1 0

 Dy f .t; v C s.u  v// ds .u  v/

beziehungsweise

h f .t; u/  f .t; v/; u  v i D

˝˝

Z 1

Œ

0

˛˛ Dy f .t; v C s.u  v// ds  .u  v/; u  v : (8.87)

Auf der anderen Seite gilt 1

Dy f .t; u/w D lim h . f .t; u C hw/  f .t; u/ /; h!0

u; w 2 R N ;

t 2 Πa; b : (8.88)

Aus den Darstellungen (8.87) und (8.88) erhält man unmittelbar die Aussagen (a) und (b) des Lemmas.

227

Abschnitt 8.9 Steife Differenzialgleichungen

8.9.3 Das implizite Euler-Verfahren für steife Differenzialgleichungen In diesem Abschnitt wird für das in Beispiel 8.60 auftretende günstige Verhalten des impliziten Euler-Verfahrens bei der Lösung steifer Anfangswertprobleme eine mathematische Erklärung geliefert. Das folgende Lemma dient dabei als Vorbereitung. Lemma 8.67. Die Funktion f W Œ a; b  R N ! R N genüge der oberen Lipschitzbedingung (8.78) mit M.t/  M . Je nach der Situation (i) M  0 beziehungsweise (ii) M > 0 gilt dann für beliebige u; v 2 R N sowie t 2 Œ a; b  die folgende Abschätzung, (i) M  0 W jju  v jj  (ii) M > 0 W

jju  v  h.f .t; u/  f .t; v/ /jj 8 h > 0;

 .1 C ~h/

......

8 0 < h  H;

......

μ (8.89)

mit der Zahl 0 < H < 1=M und der Konstanten ~ WD M=.1  HM / in der Situation (ii). Beweis. Nach Voraussetzung gilt

hhh f .t; u/  f .t; v/; u  v i  hM jju  v jj2 beziehungsweise

. 1  hM /jju  v jj2  h u  v; u  v i  hhh f .t; u/  f .t; v/; u  v i D h u  v  h. f .t; u/  f .t; v/ /; u  v i  j u  v  h. f .t; u/  f .t; v/ / j jju  v jj: Die Behauptung im Fall M  0 folgt daraus unmittelbar, und im Fall M > 0 ergibt sie sich nach der weiteren Rechnung D~

‚ …„ ƒ M 1 M D 1 C h  1 C h: 1  hM 1  hM 1  HM

Für gleichabständige Knoten t` D a C `h; ` D 0; 1; : : : ; n, mit h D .b  a/=n ist das implizite Euler-Verfahren zur Lösung von y 0 D f .t; y/; y.a/ D y0 von der Form ( vergleiche Bemerkung 8.42 )

u`C1 D u` C hf .t`C1 ; u`C1 /;

` D 0; 1; : : : ; n  1;

u0 WD y0 ;

(8.90)

und besitzt für eine hinreichend glatte Funktion f die Konsistenzordnung p D 1, das heißt, für den lokalen Verfahrensfehler ( vergleiche (8.5) auf Seite 183 )

.t; h/ D y.t C h/  y.t/  hf .t C h; y.t C h//; gilt die Abschätzung

jj .t; h/ jj  C h2 ;

0  h  b  t;

0 < h  b  t;

228

Kapitel 8 Mehrschrittverfahren für Anfangswertprobleme

mit einer von h und t unabhängigen Konstanten C  0. Das folgende Theorem liefert die wesentliche Konvergenzaussage für das implizite Euler-Verfahren zur Lösung steifer Differenzialgleichungen. Man beachte, dass die Konstante K hier im Falle M  0 moderat ausfällt. Theorem 8.68. Erfüllt die Funktion f W Œ a; b  R N ! R N die obere Lipschitzbedingung (8.78) mit M.t/  M , so gilt für den globalen Verfahrensfehler des impliziten Euler-Verfahrens (8.90) die folgende Abschätzung, max jju`  y.t` /jj

`D0;:::;n

 Kh;

´

mit K WD

(8.91)

C. b  a /; falls M  0  C  M.ba/=.1HM / ....... e 1 ; M >0 M

μ

mit der Einschränkung 0 < h  H < 1=M im Fall M > 0. Beweis. Mit den Setzungen

e` D u `  y ` ;

y` WD y.t` /;

` D .t` ; h/;

` D 0; 1; : : : ; n; ` D 0; 1; : : : ; n  1;

gilt für ` D 0; 1; : : : ; n  1

y`C1 D y` C hf .t`C1 ; y`C1 / C ` ; u`C1 D u` C hf .t`C1 ; u`C1 /; und daher

e`C1  hΠf .t`C1 ; u`C1 /  f .t`C1 ; y`C1 /  D e`  ` :

(8.92)

Im Fall M  0 erhält man aus (8.89) und (8.92)

jje`C1 jj  j e`C1  h. f .t`C1 ; u`C1 /  f .t`C1 ; y`C1 / / j D jje`  ` jj  jje` jj C jj ` jj  jje` jj C C h2 : Wegen e0 D 0 erhält man mittels vollständiger Induktion die angegebene Abschätzung (8.91) für den Fall M  0. Für M > 0 geht man vergleichbar vor: wiederum aus (8.89) und (8.92) erhält man mit ~ WD M=.1  MH / die folgenden Abschätzungen,

jje`C1 jj  . 1 C ~h/jj e`C1  h. f .t`C1 ; u`C1 /  f .t`C1 ; y`C1 / / j  . 1 C ~h/. jje` jj C jj ` jj /  .1 C ~h/jje` jj C

1 1MH

jj ` jj;

und mit Lemma 7.12 erhält man die Abschätzung (8.91) auch für den Fall M > 0. Dies komplettiert den Beweis des Theorems.

229

Abschnitt 8.9 Steife Differenzialgleichungen

8.9.4 Steife Differenzialgleichungen in den Anwendungen Die Linienmethode bei der Wärmeleitungsgleichung Ein Anfangsrandwertproblem für die räumlich eindimensionale Wärmeleitungsgleichung ist gegeben durch @u @t

D

@2 u ; @x 2

0 < x < L;

u.0; t/ D u.L; t/ D 0; u.x; 0/ D f .x/;

0 < t < T;

t 2 Π0; T ; x 2 Π0; L;

wobei f W Œ 0 ; L ! R eine gegebene Funktion ist. Die Funktion u W Œ 0 ; L  Œ 0 ; T  ! R soll numerisch bestimmt werden. Für äquidistante Gitterpunkte

xj D jx;

j D 1; 2; : : : ; N  1

.x D L=N /; 2

und eine hinreichend glatte Funktionen u ergibt eine Approximation von @@xu2 .xj ; t/; 1  j  N  1, durch zentrale Differenzenquotienten 2. Ordnung Folgendes ( Details werden später vorgestellt, siehe Lemma 9.6 ): @2 u .xj ; t/ @x 2

D

u.xj C1 ; t/  2u.xj ; t/ C u.xj 1 ; t/ C O..x/2/: .x/2

Vernachlässigung des Terms O..x/2/ führt auf das folgende gekoppelte System von N  1 gewöhnlichen Differenzialgleichungen für yj .t/ u.xj ; t/, 1

yj0 .t/ D

.x/

2

. yj C1 .t/

 2yj .t/ C yj 1 .t/ /;

yj .0/ D f .xj /;

0 < t < T;

μ (8.93)

j D 1; 2; : : : ; N  1;

( mit y0 .t/ WD yN .t/ WD 0 ) beziehungsweise in kompakter Form

y 0 .t/ D Ay.t/;

y.0/ D w0 ;

0 < t < T;

mit

y.t/ D

A D

>

. y1 .t/; : : : ; yN 1.t/ / 0

B 2 1 B pp p 1 B B 1 B 2 pp .x/ B p B @

pp

p

pp

p

1

;

1

w0 D

>

. f .x1/; : : : ; f .xN 1/ /

;

C C C C C 2 R .N 1/.N 1/ : 1 C C A 2

Die vorgestellte Vorgehensweise, die Wärmeleitungsgleichung durch ein System gewöhnlicher Differenzialgleichungen bezüglich der Zeit t mittels Diskretisierung in Ortsrichtung x zu approximieren, wird als Linienmethode bezeichnet.

230

Kapitel 8 Mehrschrittverfahren für Anfangswertprobleme

Die Eigenwerte k der symmetrischen Matrix A lassen sich explizit berechnen ( eine Herleitung wird in Lemma 9.12 nachgereicht ),

k D

4

.x/2

sin 2 .

k 2N

/

>

0

für k D 1; 2; : : : ; N  1;

so dass das System (8.93) bezüglich des Skalarprodukts h u; v i D pativ ist. Wegen

N 1



PN 1 j D1

uj vj dissi-

4

.x/2

ist es für kleine Ortsschrittweiten x sehr steif.

Weitere Themen und Literaturhinweise Die auf Seite 177 genannten Lehrbücher zum Thema Einschrittverfahren enthalten allesamt auch Einführungen über Mehrschrittverfahren zur numerischen Lösung nichtsteifer Anfangswertprobleme. Im Folgenden werden einige weitere Themenkreise ansatzweise vorgestellt. (a) Asymptotische Entwicklungen des globalen Verfahrensfehlers existieren auch für Mehrschrittverfahren. Wie sich herausstellt, liegen für spezielle Mehrschrittverfahren wie etwa die implizite Trapezregel oder das explizite Zweischrittverfahren von Gragg [38] asymptotische Entwicklungen in h2 vor, bei denen man wie schon bei der summierten Trapezregel angepasste Extrapolationsverfahren verwendet, etwa das Gragg-Bulirsch-Stoer-Verfahren aus Bulirsch / Stoer [10]. Es besteht auch die Möglichkeit einer simultanen Anwendung von Extrapolationsverfahren und Schrittweitensteuerungsstrategien. Einzelheiten hierzu findet man beispielsweise in Deuflhard [18], [19] und in Hairer / Nørsett /Wanner [50]. (b) Für stetig partiell differenzierbare Funktionen f lässt sich eine obere Lipschitzbedingung auch noch sinnvoll definieren, falls die zugrunde liegende Vektornorm jj  jj W R N ! R C nicht durch ein Skalarprodukt induziert ist. Hierzu bedient man sich der logarithmischen Norm Œ  W R N N ! R, die folgendermaßen definiert ist,

ΠA  WD

jjI C hA jj  1 ; h h!0C lim

A 2 R N N ;

(8.94)

wobei jj  jj W R N N ! R C die durch die zugrunde liegende Vektornorm induzierte Matrixnorm bezeichnet. Die logarithmische Norm ist unabhängig voneinander von Dahlquist [14] und Lozinski [67] eingeführt worden. Deren allgemeine Eigenschaften sowie konkrete Darstellungen für einige durch geläufige Vektornormen induzierte logarithmische Normen werden in den Aufgaben 8.11–8.16 vorgestellt. Mithilfe logarithmischer Normen lassen sich zum Beispiel Aussagen über die stetige Abhängigkeit von den Anfangswerten treffen. Gilt etwa bezüglich einer gegebenen Funktion M W Œ a; b  ! R eine verallgemeinerte obere Lipschitzbedingung von der Form

ΠDy f .t; u/   M.t/

für t 2 Œ a; b ;

u 2 RN ;

231

Übungsaufgaben

so behält die Fehlerabschätzung (8.81) über die stetige Abhängigkeit von den Anfangswerten ihre Gültigkeit ( Dekker / Verwer [16] ). (c) Neben dem impliziten Euler-Verfahren eignen sich viele andere implizite Einund Mehrschrittverfahren zur numerischen Lösung steifer Anfangswertprobleme. Ausführliche Behandlungen dieses Themas findet man beispielsweise in Deuflhard / Bornemann [21], Hairer / Wanner [51] oder Strehmel / Weiner [101].

Übungsaufgaben Aufgabe 8.1. Man zeige, dass ein lineares m-Schrittverfahren genau dann für alle Anfangswertprobleme mit hinreichend glatten Funktionen f W Œ a; b   R N ! R N die Konsistenzordnung p besitzt, wenn mit der Notation

L Πy.t/; h  WD

m X

Œ ˛j y.t C j h/  hˇj y 0 .t C j h/ 

j D0

die Beziehungen L Œ t 0 ; h  D L Œ t 1 ; h  D : : : D L Œ t p ; h  D 0 erfüllt sind. Aufgabe 8.2. Man bestimme mithilfe des Gleichungssystems (8.18) die ( genaue ) Konsistenzordnung des Zweischrittverfahrens

u`C2  u` D

h 3

. f .t`C2 ; u`C2 /

C 4f .t`C1 ; u`C1 / C f .t` ; u` / /:

Für das Mehrschrittverfahren

u`C3 C .u`C2  u`C1 /  u` D h

3C 2

. f .t`C2 ; u`C2 /

C f .t`C1 ; u`C1 / /

bestimme man die von 2 R abhängige Konsistenzordnung p . Für welche Werte von 2 R ist das Verfahren nullstabil? Aufgabe 8.3. Man zeige, dass für jede Zahl m 2 N ( bis auf Normierung ) genau ein mschrittiges lineares Verfahren m X

˛j u`Cj D h

j D0

m X

ˇj f .t`Cj ; u`Cj /

j D0

mit der Konsistenzordnung 2m existiert, aber keines mit der Konsistenzordnung 2m C 1. Hinweis: Für p D 2m und p D 2m C 1 betrachte man jeweils das Konsistenz-Gleichungssystem (8.18) für die Unbekannten ˛j ; j D 0; 1; : : : ; m, und ˇj ; j D 0; 1; : : : ; m, und argumentiere wie zum Ende des Beweises von Theorem 8.54. Aufgabe 8.4. (a) Für die homogene Differenzengleichung

u`C3  4u`C2 C 5u`C1  2u` D 0;

` D 0; 1; : : :

gebe man die allgemeine Lösung an. (b) Man löse folgende Differenzengleichungen:

u`C2  2u`C1  3u`

D 0;

u`C1  u`

`

u0 D 0;

D 2 ;

u`C1  u`

D `;

u0 D 0;

u`C2  2tu`C1 C u`

D 0;

u0 D 1;

u1 D 1;

u0 D 0; u1 D t 2 .1; 1/:

232

Kapitel 8 Mehrschrittverfahren für Anfangswertprobleme

Aufgabe 8.5. (a) Man zeige, dass jede Lösung y.t/ der skalaren Differenzialgleichung 2. Ordnung

y 00 D f .t; y/;

t 2 Πa; b ;

(8.95)

der folgenden Identität genügt ( für t; t ˙ h 2 Œ a; b  ):

y . t C h /  2y . t / C y . t  h / Z

D

h2

1 0

.1  s/. f .t C sh; y . t C sh // C f .t  sh; y . t  sh // / ds:

(8.96)

(b) Zur numerischen Lösung einer Anfangswertaufgabe für (8.95) setze man in (8.96) t D t`Cm1 und ersetze die Funktion f .s; y.s// durch dasjenige Polynom P 2 …m1 , welches die Stützpunkte . t`Cj ; f`Cj /; j D 0; : : : ; m  1 interpoliert, wobei die übliche Notation f`Cj D f . t`Cj ; u`Cj / verwendet wird. Daraus leite man die expliziten linearen Störmer-Verfahren

u`Cm  2u`Cm1 C u`Cm2 D h2

m X1

k r k f`Cm1 ;

` D 0; 1; : : : ; n  m

kD0

mit den Koeffizienten Z

k D .1/k

1 0

s

.1  s/.. k

/

C

. ks // ds

her. Für m D 2 und m D 3 gebe man die Verfahren an. Aufgabe 8.6. Man beweise: Für ein nullstabiles lineares Mehrschrittverfahren der Konsistenzordnung p gilt 1 .h / D e h C O.hpC1 / für h ! 0; wobei 1 .h / die Nullstelle des Polynoms

Q.; h / D ./  h ./ mit 1 .h / ! 1 .0/ D 1 für h ! 0 bezeichnet. Hier ist  das erzeugende Polynom, und

./ WD ˇm  m C : : : C ˇ0 2 …m . Aufgabe 8.7. Für die Fälle m D 1; 2; 3 rechne man die auf Seite 206 angegebenen expliziten Darstellungen der BDF-Formeln nach und und überprüfe jeweils die Nullstabilität. Aufgabe 8.8. Das zweischrittige Verfahren

u`C2 C 4u`C1  5u` D h. 4f .t`C1 ; u`C1 / C 2f .t` ; u` / /

(8.97)

besitzt unter den üblichen Glattheitsvoraussetzungen die Konsistenzordnung p D 3. Ist es nullstabil? Man wende es mit der Schrittweite h > 0 und Startwerten u0 D 1 und u1 D e h auf die Testgleichung y 0 D y; y.0/ D 1 an und zeige, dass mit t ¤ 0 und h D h` D t=` für ` ! 1 Folgendes gilt: `

u` D . 1 C O.h4 / /. e t =` C O.h4 / /

1 h 4 .1 216



C O.h//. 5  3h C O.h2 / /` ;

und dabei der erste Summand für ` ! 1 gegen e t konvergiert und der zweite Summand sich für große ` verhält wie t 4 .5/` 3t =5



216

`4

e

:

Aufgabe 8.9 ( Numerische Aufgabe ). Man löse numerisch das Anfangswertproblem

y 0 D y; mit dem

y.0/ D 1;

233

Übungsaufgaben

 

h zweischrittigen Verfahren (8.97), einmal mit den Startwerten p u0 D 1; u1 D e und dann 2 auch mit den Startwerten u0 D 1; u1 D 1 WD 2  3h C 9 C 6h C 4h ; und für D 0 und D 9 mit dem dreischrittigen Verfahren

u`C3 C .u`C2  u`C1 /  u` D h

3C 2

. f .t`C2 ; u`C2 /

C f .t`C1 ; u`C1 / /

( vergl. Aufgabe 8.2 ) mit den Startwerten u0 D 1; u1 D e h und u2 D e 2h . Die Schrittweite sei jeweils h D 0:01. Geben Sie tabellarisch zu den Gitterpunkten t D t` D `h; ` D 2; 3; : : : ; 100 die exakte Lösung y.t/, die Näherung uh .t/, den Fehler uh .t/  y.t/ und 4

t im Falle des ersten Verfahrens  216

.5/` 3t =5 e `4

an.

Aufgabe 8.10 ( Numerische Aufgabe ). Man löse das Anfangswertproblem

y 0 .t/

D y.t/;

y.0/

D 1;

t 2 Π0; 15 ;

für D 1 und D 1 jeweils mit den beiden folgenden Prädiktor-Korrektor-Verfahren: 1. Das Verfahren von Milne besitzt Prädiktor und Korrektor 4

.0/ u`C 4

D u` C 3 h. 2f`C3  f`C2 C 2f`C1 /

.C1/

D u`C2 C 3 h. f`C4 C 4f`C3 C f`C2 /;

u`C4

1

./

 D 0; 1; : : : :

2. Das Verfahren von Hamming besitzt den gleichen Prädiktor wie das Verfahren von Milne, und der Korrektor ist hier 9

1/ u.C  8 u`C3 C `C4

1 u 8 `C1

3

./ D 8 h. f`C C 2f`C3  f`C2 /: 4

./

./

Hierbei bedeutet f` D f .t` ; u` / und f`C4 D f .t`C4 ; u`C1 /. Für die Anlaufrechnung verwende man das klassische Runge-Kutta-Verfahren und für die Korrektoriteration das Abbruchkriterium .C1/

ju`C4

 u./ `C4 j

ju./ j `C4

 105 :

Man verwende jeweils die Schrittweite h D 0:1 und gebe tabellarisch zu den Gitterpunkten t D 0:1; 0:2; 0:3; : : : ; 1:0; 2:0; 3:0; : : : ; 15; die exakte Lösung y.t/, die Näherung uh .t/, den Fehler uh .t/  y.t/ und die Anzahl der durchgeführten Iterationsschritte an. Aufgabe 8.11. Für die Matrix

A D

10 12 12 20

! 2 R22

berechne man die logarithmischen Normen 1 Œ A ; 1 Œ A  und 2 Œ A . Aufgabe 8.12. Diskretisierung der Wärmeleitungsgleichung mit Neumann-Randbedingungen @u @t

D

@2 u C f .x; t/; @x 2

@u . 0; t / @x

D

@u . 1; t / D 0; @x

u. x; 0 /

D

g. x /;

0  x  1;

a  t  b; ........

0  x  1;

;

234

Kapitel 8 Mehrschrittverfahren für Anfangswertprobleme

führt mithilfe zentraler Differenzenquotienten erster und zweiter Ordnung ( bei äquidistanter Ortsschrittweite x D 1=N ) auf ein Anfangswertproblem für ein System von N C 1 gewöhnlichen Differenzialgleichungen

y 0 .t/ D Ay.t/ C z.t/;

y.a/ D z0

mit einer geeigneten Matrix A 2 R .N C1/.N C1/ . Man gebe eine Matrixnorm an, so dass für die zugehörige logarithmische Norm Œ A   0 gilt. Aufgabe 8.13. Man weise

ΠA  D

ln jj e hA jj

lim

h

h!C0

für A 2 R N N

nach. Hinweis: Zunächst zeige man

ΠA  D

jj e hA jj  1 : h!C0 h lim

Aufgabe 8.14. Man weise nach, dass für Matrizen A; B 2 R N N und nichtnegative Zahlen c 2 R ; c  0 Folgendes gilt,

ΠcA  D cΠA ;

ΠA C B   ΠA  C ΠB :

Aufgabe 8.15. Man zeige: (a) Ist die Norm jj  jj W KN ! R durch ein Skalarprodukt h ;  i W KN KN ! R induziert, so gilt für die zugehörige logarithmische Norm die Darstellung

ΠA  D

max

x2K N W j x j D1

für A 2 KN N ;

Re h Ax; x i

wobei man im reellen Fall K D R den Ausdruck Re h Ax; x i durch h Ax; x i ersetzen kann. ( Die Definition (8.94) für logarithmische Normen lässt sich auch für komplexe Matrizen beziehungsweise für Normen auf komplexen Räumen verwenden. ) (b) Für eine durch eine Vektornorm jj  jj W C N ! R induzierte logarithmische Norm Œ   W CN N ! R gilt die Ungleichung

ΠA   max Re 2.A/

für A 2 CN N :

Gilt hier im Allgemeinen Gleichheit? Aufgabe 8.16. Sei 1 Œ   W R N N ! R die zur Maximumnorm jj  jj1 W R N ! R gehörende logarithmische Norm. Man weise für 0 ¤ A 2 R N N die folgende Äquivalenz nach:

1 ΠA   0



jj I C A jj1  1

8 0 <   jj A jj1 :

9

Randwertprobleme bei gewöhnlichen Differenzialgleichungen

9.1 Problemstellung, Existenz, Eindeutigkeit 9.1.1 Problemstellung Viele praxisrelevante Fragestellungen führen auf Randwertprobleme für gewöhnliche Differenzialgleichungen. Beispiel 9.1. Die zeitlich stationäre Temperaturverteilung in einem dünnen Metallstab wird beschrieben durch das folgende Randwertproblem:

c

@2 u @x 2

D f .x/;

u.a/ D ˛;

a < x < b; u.b/ D ˇ;

wobei f W Œ a; b  ! R eine gegebene Funktion ist, die anliegende, zeitlich unabhängige Wärmequellen darstellt. Die Funktion u W Œ a; b  ! R beschreibt die zeitlich unabhängige Temperaturverteilung in dem Stab und ist gesucht. Die Temperaturen ( hier mit ˛ beziehungsweise ˇ bezeichnet ) an den beiden Rändern sind vorgegeben, M und c > 0 stellt eine Materialkonstante dar. Randwertprobleme für gewöhnliche Differenzialgleichungen sind Gegenstand des vorliegenden Kapitels. Definition 9.2. Ein Randwertproblem für eine gewöhnliche Differenzialgleichung zweiter Ordnung mit separierten Randbedingungen ist von der Form

u00 D f .x; u; u0 /; u.a/ D ˛;

x 2 Πa; b ;

u.b/ D ˇ;

(9.1) (9.2)

auf einem endlichen Intervall Œ a; b  und mit gegebenen Zahlen ˛; ˇ 2 R sowie einer Funktion f W Œ a; b   R 2 ! R, und gesucht ist eine zweimal stetig differenzierbare Funktion u W Œ a; b  ! R mit den Eigenschaften (9.1)–(9.2). Die Notation in (9.1) ist eine übliche Kurzform für u00 .x/ D f .x; u.x/; u0 .x//; x 2 Œ a; b . Oft werden solche Randwertprobleme auch in abgeschwächter Form betrachtet, bei der eine stetige Lösung u W Œ a; b  ! R der Differenzialgleichung u00 D f .x; u; u0 / lediglich auf dem offenen Intervall .a; b/ gesucht wird ( und die zweimalige stetige Differenzierbarkeit von u lediglich dort gefordert wird ). Zur Vereinfachung der Situation werden Randwertprobleme im weiteren Verlauf in der spezielleren Fassung (9.1)–(9.2) betrachtet.

236

Kapitel 9 Randwertprobleme

Bemerkung 9.3. In den Anwendungen treten auch Randwertprobleme für gewöhnliche Differenzialgleichungen höherer Ordnung und für Systeme von gewöhnlichen Differenzialgleichungen auf: Ein Randwertproblem für eine gewöhnliche Differenzialgleichung n-ter Ordnung mit linearen Randbedingungen ist von der Form



u.n/ D f .x; u; u0 ; : : : ; u.n1/ /; n X1

. cjk u.k/ .a/

x 2 Πa; b ;

C djk u.k/ .b/ / D ˛j ;

j D 0; 1; : : : ; n  1

(9.3) (9.4)

kD0

mit einer gegebenen Funktion f W Œ a; b   R n ! R und gegebenen reellen Koeffizienten cjk ; djk und ˛j 2 R sowie einer zu bestimmenden n-mal stetig differenzierbaren Funktion u W Œ a; b  ! R. Ein Randwertproblem für ein System von n gewöhnlichen Differenzialgleichungen erster Ordnung mit linearen Randbedingungen ist von der Form



U 0 D F .x; U /;

x 2 Πa; b ;

AU.a/ C BU.b/ D U0

(9.5) (9.6)

mit einer gegebenen Funktion F W Œ a; b   R n ! R n und Matrizen A; B 2 R nn und einem Vektor U0 2 R n , und mit einer zu bestimmenden differenzierbaren vektorwertigen Funktion U W Œ a; b  ! R n . Jedes Randwertproblem von der Form (9.3)–(9.4) lässt sich mit den Setzungen U1 D u; U2 D u0 ; : : : ; Un D u.n1/ in ein Randwertproblem für ein System von n gewöhnlichen Differenzialgleichungen erster Ordnung von der Form (9.5)–(9.6) überführen. M

Die folgenden Betrachtungen beschränken sich auf die in (9.1)–(9.2) betrachteten Randwertprobleme für gewöhnliche Differenzialgleichungen zweiter Ordnung.

9.1.2 Existenz und Eindeutigkeit der Lösung Wie schon bei Anfangswertproblemen für gewöhnliche Differenzialgleichungen ist auch bei Randwertproblemen zunächst die Frage der Existenz und Eindeutigkeit der Lösung zu behandeln. Beispiel 9.4. Die homogene lineare gewöhnliche Differenzialgleichung zweiter Ordnung

u00 .x/ C u.x/ D 0;

a < x < b;

besitzt die allgemeine Lösung u.x/ D c1 sin x C c2 cos x für x 2 Œ a; b , mit Koeffizienten c1 ; c2 2 R, wobei aus der Theorie der gewöhnlichen Differenzialgleichungen bekannt ist, dass hierfür keine weiteren Lösungen existieren. Im Folgenden sollen verschiedene Randbedingungen ( auf unterschiedlichen Grundintervallen ) betrachtet werden.

237

Abschnitt 9.1 Problemstellung, Existenz, Eindeutigkeit

(a) Das Randwertproblem

u00 C u D 0

auf Π0; =2 ;

u.0/ D 0;

u.=2/ D 1;

besitzt die eindeutige Lösung u.x/ D sin x; x 2 Œ 0; =2 . (b) Bei dem Randwertproblem

u00 C u D 0

auf Π0 ;  ;

u.0/ D 0;

u./ D 0;

stellt jede Funktion von der Gestalt u.x/ D c1 sin x; x 2 Œ 0;  , mit c1 2 R eine Lösung dar. (c) Schließlich existiert für das Randwertproblem

u00 C u D 0

auf Π0 ;  ;

u.0/ D 0;

u./ D 1; M

keine Lösung.

Durch das vorangegangene Beispiel 9.4 wird deutlich, dass es bei Randwertproblemen für gewöhnliche Differenzialgleichungen keine so allgemein gültige Existenz– und Eindeutigkeitsaussage wie bei Anfangswertproblemen gibt. Unter gewissen Zusatzbedingungen lassen sich jedoch Existenz und Eindeutigkeit nachweisen. Ein entsprechendes Resultat für die in (9.5)–(9.6) beschriebene allgemeine Situation bei Systemen von gewöhnlichen Differenzialgleichungen erster Ordnung findet man beispielsweise in Stoer / Bulirsch [99]. Es wird nun noch ein Spezialfall des Randwertproblems (9.1)–(9.2) bei gewöhnlichen Differenzialgleichungen zweiter Ordnung betrachtet. Es handelt sich hierbei um das folgende sturm-liouvillesche Randwertproblem mit homogenen Randbedingungen,

u00 .x/ C r.x/u.x/ D '.x/; u.a/ D u.b/ D 0;

a  x  b;

(9.7) (9.8)

wobei r; ' W Œ a; b  ! R vorgegebene stetige Funktionen sind. Hier gilt die folgende Aussage: Theorem 9.5. Das Randwertproblem (9.7)–(9.8) besitzt für stetige Funktionen r; ' W Œ a; b  ! R eine eindeutig bestimmte Lösung u 2 C 2 Œ a; b , falls r nicht-negativ ist, r.x/  0 für x 2 Œ a; b . Beweis. Siehe Kress [63], Theorem 11.4. Zur numerischen Lösung von solchen Randwertproblemen (9.7)–(9.8) und allgemeiner von Randwertproblemen von der Form (9.1) – (9.2) werden im Folgenden Differenzenverfahren, Variationsmethoden ( Galerkin-Verfahren ) und Einfachschießverfahren vorgestellt.

238

Kapitel 9 Randwertprobleme

9.2 Differenzenverfahren 9.2.1 Numerische Differenziation In dem folgenden Lemma wird der später benötigte zentrale Differenzenquotient zweiter Ordnung ( zur Approximation der zweiten Ableitung einer Funktion von einer Veränderlichen ) definiert und seine Approximationseigenschaften behandelt. Bei dieser Gelegenheit werden gleich noch die gängigen Differenzenquotienten zur Approximation der ersten Ableitung vorgestellt. Lemma 9.6. (a) Für u 2 C 2 Œ a; b  gelten mit geeigneten Zahlen 1 ; 2 2 Œ 0 ; 1  die Beziehungen u . x C h /  u. x / h

D u0 .x/ C u00 .x C 1 h/ 2 . vorwärts gerichteter Differenzenquotient /

u. x /  u. x  h / h

D u0 .x/  u00 .x  2 h/

h

h 2

. rückwärts

/:

......

(b) Für u 2 C 3 Œ a; b  gilt mit einer geeigneten Zahl  2 Œ 1; 1  Folgendes, u. x C h /u. x  h / 2h

D u0 .x/ C u.3/ .x C h/

h2 6

( zentraler Differenzenquotient 1. Ordnung ):

(c) Für u 2 C 4 Œ a; b  gilt mit einer geeigneten Zahl  2 Œ 1 ; 1  Folgendes, u . x C h /  2 u . x / C u. x  h / h2

D u00 .x/  u.4/ .x C h/

h2 12

( zentraler Differenzenquotient 2. Ordnung ):

Die rechts vorgestellten Bezeichnungen beziehen sich auf die linke Seite der jeweiligen Gleichung. Beweis. Die Aussagen erhält man mittels geeigneter Taylorentwicklungen der Funktion u in x . (a) Hier verwendet man

u.x ˙ h/ D u.x/ ˙ u0 .x/h C u00 .x ˙ 1=2 h/

h2 2

:

(b) Eine weitere Taylorentwicklung der Funktion u in x liefert mit geeigneten Zahlen 1 ; 2 2 Π0 ; 1 

u.x ˙ h/ D u.x/ ˙ u0 .x/h C u00 .x/

h2

˙ u.3/ .x ˙ 1=2 h/

2

h3 6

;

und eine Subtraktion führt auf die angegebene Darstellung, u. x C h /  u. x  h / 2h

D ./

D

0 C u0 .x/h C 0 C

. u.3/ .x C 1 h/

u0 .x/h C u.3/ .x C h/

h2 6

;

C u.3/ .x  2 h/ /

h2 12

239

Abschnitt 9.2 Differenzenverfahren

mit einer Zahl  2 Œ 1 ; 1 , wobei man die Identität . / mithilfe des Mittelwertsatzes erhält. (c) Ganz entsprechend erhält man mit geeigneten Zahlen 1 ; 2 2 Œ 0 ; 1  auch

u.x ˙ h/ D u.x/ ˙ u0 .x/h C u00 .x/

h2

˙ u.3/ .x/

2

h3 6

C u.4/ .x ˙ 1=2 h/

h4 24

;

und daraus erhält man für eine Zahl  2 Œ 1; 1  die folgende Identität, u . x C h /  2 u . x / C u. x  h / h2

D 0 C u00 .x/ C 0 C

. u.4/ .x ˙ 1 h/

D u00 .x/ C u.4/ .x C h/

h2 12

h2

C u.4/ .x ˙ 2 h/ / 24

:

9.2.2 Der Ansatz für Differenzenverfahren Im Folgenden wird der Ansatz für Differenzenverfahren vorgestellt, wobei dies anhand des speziellen Randwertproblems u00 C ru D '; u.a/ D u.b/ D 0 mit der nichtnegativen Funktion r  0 geschieht1 . Das zugrunde liegende Intervall Œ a; b  wird mit Gitterpunkten versehen, die hier äquidistant gewählt seien,

xj D a C j h;

j D 0; 1; : : : ; N

mit h D

ba : N

(9.9)

Eine Betrachtung des genannten Randwertproblems u00 C ru D '; u.a/ D u.b/ D 0 an diesen Gitterpunkten bei einer gleichzeitigen Approximation der Werte u00 .x1 /; : : : ; u00 .xN 1 / durch jeweils entsprechende zentrale Differenzenquotienten 2. Ordnung führt auf das folgende gekoppelte System von N  1 linearen Gleichungen, vj C1 C 2vj  vj 1 2

h

C r.xj /vj D '.xj /;

j D 1; 2; : : : ; N  1; . v0 D vN D 0 /

für die Approximationen vj u.xj /; j D 1; : : : ; N  1. Setzt man noch

rj D r.xj /; 1

vergleiche (9.7)– (9.8)

'j D '.xj /;

j D 1; 2; : : : ; N  1;

μ (9.10)

240

Kapitel 9 Randwertprobleme

so erhält man für das Gleichungssystem (9.10) die folgende Matrix-Vektor-Darstellung

0

10

1

0

1

2

B 2 C r1 h 1 C B v1 C B '1 C B CB C B C B CB C B C B 1 2 C r h2 p p p CB v C B ' C B C B C B C 2 2 2 1 B CB C D B C 2 R N 1 : (9.11) 2 B C B C B C h B p p CB p C B p C pp pp p p 1 B CB p C B p C B CB C B C @ A@ A A @ 2 1 2 C rN 1 h vN 1 'N 1 „ ƒ‚ … DW A 2 R .N 1/.N 1/ Daraus erhält man unmittelbar die folgende Fehlerdarstellung: Theorem 9.7. Für das Differenzenschema (9.10) zur Lösung des Randwertproblems (9.7)–(9.8) mit r  0 gilt mit der Notation uj WD u.xj / und der Matrix A aus (9.11) die Fehlerdarstellung

0 1

h2

1

v1  u1

B A@

pp p

0

h B C A D  12 @ 2

vN 1  uN 1

u.4/ .x1 C 1 h/ pp p

1 C A:

(9.12)

u.4/ . xN 1 C N 1 h/

Beweis. Die Aussage folgt unmittelbar aus der zu (9.10) äquivalenten Darstellung (9.11) und der aus Teil (c) in Lemma 9.6 resultierenden Identität

0 1

h2

B A@

u1 pp p

1

0

C B A D @

uN 1

'1 pp p

1

0

h2 B C A C 12 @

'N 1

u.4/ .x1 C 1 h/ pp p

1 C A:

u.4/ . xN 1 C N 1 h/

Für den Nachweis der eindeutigen Lösbarkeit des Gleichungssystems (9.10) und die gleichzeitige Herleitung eine Normabschätzung des Fehlers in (9.12) wird im Folgenden  

die Regularität der Matrix A 2 R .N 1/.N 1/ nachgewiesen sowie

eine Abschätzung der Form h2 jjA1 jj1  C geliefert mit einer von der Zahl N unabhängigen Konstanten C > 0.

Hierzu sind ein paar Vorbereitungen erforderlich.

9.2.3 Das Konvergenzresultat für Differenzenverfahren Definition 9.8. Für zwei Matrizen S D .sjk /; T D .tjk / 2 R N N schreibt man

S  T

W”

sjk  tjk

für j; k D 1; 2; : : : ; N;

241

Abschnitt 9.2 Differenzenverfahren

beziehungsweise äquivalent dazu T  S . Eine Matrix S 2 R N N heißt nichtnegativ, wenn S  0 gilt. Im Folgenden werden die unmittelbar erforderlichen Resultate über nichtnegative Matrizen geliefert. Weitere Eigenschaften solcher Matrizen werden in Abschnitt 9.2.4 vorgestellt. Lemma 9.9. Für gegebene Matrizen S; T 2 R N N gelten die folgenden Implikationen, 0  S  T

)

T  0

)

jjS jj1  jjT jj1 I ˇˇ  1 ˇˇ ˇˇ p ˇˇ jjT jj1 D ˇˇˇˇ T pp ˇˇˇˇ 1

(9.13)

:

(9.14)

1

Beweis. Mit den Notationen S D .sjk /; T D .tjk / 2 R N N erhält man die Aussage (9.13) folgendermaßen,

jjS jj1 D

D

max

j D1;:::;N

max

j D1;:::;N

N X

jsjk j D

max

j D1;:::;N

kD1 N X

N X

sjk 

kD1

max

j D1;:::;N

N X

tjk

kD1

jtjk j D jjT jj1 :

kD1

Aus den letzten beiden Identitäten resultiert dann auch die Aussage (9.14). Das folgende Theorem liefert die wesentlichen Hilfsmittel für den Beweis der nachfolgenden Fehlerabschätzung bei Differenzenverfahren zur Lösung von Randwertproblemen. Der Beweis von Teil (a) dieses Theorems wird in Abschnitt 9.2.4 nachgereicht. Theorem 9.10. (a) Die Matrix A 2 R .N 1/.N 1/ aus (9.11) ist regulär, und im Ordnungssinn gilt ( vergleiche Definition 9.8 )

0

1 0  A 1  A  0 ;

A0

2 1 B 1 p p p B WD B pp @ p

1 C C C 2 R .N 1/.N 1/ ist regulärI (9.15) pp p 1 A 1 2

pp

p

(b) es gilt 1 jjA1 jj1  jjA 0 jj1 

.b  a/2 8

h2 :

(9.16)

Beweis. Der Beweis von Teil (a) wird nachgetragen, hier wird nur der Nachweis für Teil (b) geführt. Das spezielle Randwertproblem

z 00 .x/ D 1;

a < x < b;

z.a/ D z.b/ D 0;

242

Kapitel 9 Randwertprobleme

besitzt die Lösung

z.x/ D

1 .x 2

 a/.b  x/;

a  x  b;

so dass insbesondere z 2 C 4 Œ a; b  und z .4/  0 gilt. Aus der Fehlerdarstellung für den zentralen Differenzenquotienten 2. Ordnung erhält man deshalb 1

A0

1 ppp 1

! D

z1 !

1

h2

ppp

;

(9.17)

zN 1

mit der Notation zj D z.xj /. Die zweite Abschätzung in (9.16) folgt nun unmittelbar aus (9.14) sowie Teil (a) dieses Theorems, und die erste Abschätzung in (9.16) erhält man sofort aus (9.13) sowie wiederum aus Teil (a) dieses Theorems. Die vorherige Aussage ermöglicht die Herleitung der folgenden Fehlerabschätzung für Differenzenverfahren zur Lösung von Randwertproblemen. Theorem 9.11. Gegeben sei das Randwertproblem (9.7)–(9.8) mit r  0, für dessen Lösung u 2 C 4 Œ a; b  erfüllt sei. Dann gilt max

j D0;:::;N

mit der Konstanten M WD

jvj  u.xj /j  M h2 ;

. b  a /2 jju.4/ jj1 96

und den Notationen aus (9.9) und (9.10).

Beweis. Die Aussage folgt unmittelbar aus den Theoremen 9.7 und 9.10.

9.2.4 Vorbereitungen für den Beweis von Teil (a) des Theorems 9.10 Die Regularität der Matrix A0 aus (9.15) ist eine unmittelbare Konsequenz aus der Tatsache, dass die Eigenwerte von Tridiagonalmatrizen mit konstanten Einträgen entlang der Haupt- und der Nebendiagonalen direkt angegeben werden können: Lemma 9.12. Eine Tridiagonalmatrix

0

a b

1

:: B : C Bc a C A D B : C 2 R .N 1/.N 1/ @ :: ::: bA c a mit Zahlen a; b; c 2 R ; b  c > 0, besitzt die folgenden Eigenwerte,

p  k  k D a C 2sgn.c/ bc cos ; N

k D 1; 2; : : : ; N  1:

Die zugehörigen Eigenvektoren sind im Beweis angegeben.

243

Abschnitt 9.2 Differenzenverfahren

Beweis. Zur Vereinfachung der Notation wird im Folgenden der Fall a D 0 betrachtet. ( Die Aussage in der allgemeinen Situation erhält man danach durch Betrachten der Matrix A  aI . ) Mit den Setzungen

D WD

 ; N

M WD

. bc /

1=2

;

Œk 1 N 1 x Œk WD .x`Œk /N mit x` WD M `=2 sin . k`D / `D1 2 R

erhält man unter Verwendung der Darstellung Œk

x`

D

M`

. e ik`D

2i

 e ik`D /;

` D 1; 2; : : : ; N  1;

(9.18)

für j D 1; 2; : : : ; N  1 Folgendes, 1h

.Ax Œk /j D

2i

cM j 1 e i.j 1/kD C bM j C1 e i.j C1/kD 

D

Mj h 2i

. cM 1e ikD

. cM j 1 e i.j 1/kD

C bM j C1 e i.j C1/kD /

i

i C bMe ikD /e ijkD  . cM 1e ikD C bMe ikD /e ijkD ;

wobei diese Vorgehensweise auch in den Fällen j D 1 und j D N  1 zulässig ist, da die rechte Seite der Gleichung in (9.18) für ` D 0 und ` D N verschwindet. Wegen p  1 cM D bM D sgn.c/ bc berechnet man daraus mit der Abkürzung D sgn.c/ Folgendes,

.Ax Œk /j D D

Mj  2i

.

p p p p  bce ikD C bce ikD /e ijkD  . bce ikD C bce ikD /e ijkD

 Mj  p

bc . e ikD C e ikD / . e ijkD  e ijkD / D 2i

. 2

p

Œk

bc cos .kD/ /xj :

Für Matrizen A, deren Eigenwerte allesamt im offenen Einheitskreis liegen, lässt sich die Inverse der Matrix I  A als neumannsche Reihe darstellen. Genauer gilt Folgendes: Theorem 9.13. Für eine Matrix A 2 R N N sind die folgenden Aussagen äquivalent: (a) .A/  ¹ 2 C W j j < 1 º; (b) Es existiert eine Vektornorm jj  jj W R N ! R, so dass für die zugehörige Matrixnorm gilt jjA jj < 1; (c) Die Reihe (d) Es gilt

A

P1

D0 A



ist konvergent;

! 0 für  ! 1.

244

Kapitel 9 Randwertprobleme

Wenn eine der ( und damit alle ) Bedingungen erfüllt ist, so gilt 1 X

.I  A/1 D

A :

(9.19)

D0

Beweis. .a/ ) .b/: Für jede Zahl " > 0 existiert2 eine verallgemeinerte JordanJ T mit einer regulären Matrix T 2 CN N sowie Faktorisierung der Form A D T 1 b

0 B b J D B @

0

1

b J1 pp

p

b Jr

C C; A

B B b Jk D B @

1

k " pp

p

pp pp

C C C 2 CNk Nk ; p " A k p

k D 1; 2; : : : ; r;

Pr

11 b mit Nk  1; . Hier kD1 Nk D N . Im Fall Nk D 1 bedeutet dies J k D Œ k  2 C sei nun " > 0 hinreichend klein gewählt, so dass für jeden Index k 2 ¹ 1; 2; : : : ; r º die Ungleichung j k j C " < 1 erfüllt ist, was wegen Voraussetzung (a) möglich ist. Aufgrund der Konstruktion gilt

jj b J jj1 D

max jj b J k jj1 < 1:

kD1;:::;r

Man setzt dann

jjx jjT WD jjT x jj1 ;

x 2 RN ;

und weist leicht nach, dass jj  jjT eine Norm auf R N darstellt. Für die zugehörige Matrixnorm ist dann tatsächlich jjA jjT < 1 erfüllt, denn für jeden Vektor x 2 R N gilt

jjAx jjT D jjTAx jj1 D jj b J T x jj1  jj b J jj1 jjT x jj1 D jj b J jj1 jjx jjT : .b/ ) .c/: Die Behauptung folgt unmittelbar aus der absoluten Konvergenz, 1 X

jjA jj 

D0

1 X

jjA jj < 1:

D0

.c/ ) .d /: In jedem mit einer Norm versehenen Vektorraum folgt aus der KonP1 vergenz einer Reihe j D0 xj die Konvergenz seiner Summanden gegen null, xj ! 0 .j ! 1/. .d / ) .a/: Wenn 2 C ein Eigenwert von A mit j j  1 ist, so erhält man mit einem zugehörigen Eigenvektor x 2 CN und für jede Vektornorm jj  jj W CN ! R jjA x jj D jj  x jj D j j jjx jj



jjx jj

beziehungsweise jjA jj  1 für  D 1; 2; : : : im Widerspruch zur Annahme (d). Schließlich gilt unter den Bedingungen (a)–(d)

.I  A/

n X1 D0

A D

n X

.A  AC1 / D I  An ! I

D0

woraus man die Darstellung (9.19) erhält. 2

siehe den Beweis von Lemma 8.15

für n ! 1;

245

Abschnitt 9.2 Differenzenverfahren

Weitere Eigenschaften nichtnegativer Matrizen Es folgen einige Aussagen über nichtnegative Matrizen. Lemma 9.14. Für nichtnegative Matrizen S; T 2 R N N sind sowohl S C T 2 R N N als auch S T 2 R N N nichtnegative Matrizen. Weiter gilt für Matrizen S1 ; S2 2 R N N und T1 ; T2 2 R N N mit 0  S1  S2 und 0  T1  T2 auch 0  S1 T1  S2 T2 . Konvergente Folgen nichtnegativer Matrizen besitzen nichtnegative Grenzwerte. Beweis. Ist elementar und wird hier nicht geführt. Theorem 9.15. Für Matrizen S; T 2 R N N und 2 R gilt die folgende Implikation,

²

0  S  T;

²

³ )

> r .T /

> r .S/; 0  . I  S /1  . I  T /1 :

³ (9.20)

P1

 Beweis. Zunächst wird der Spezialfall D 1 > r .T / betrachtet. Es ist D0 S konvergent, denn unter Anwendung von Lemma 9.9, Lemma 9.14 und Theorem 9.13 erhält man

j

n1 X Dn0

Sj1  j

n1 X Dn0

T  jj1 ! 0

für n0  n1 ;

n0 ; n1 ! 1:

Wiederum nach Theorem 9.13 folgt daraus 1 > r .S/ sowie die Darstellbarkeit der P1  Inversen der Matrix I  S als neumannsche Reihe, .I  S/1 D D0 S . Daraus resultiert schließlich der zweite Teil der Aussage (9.20) für den Spezialfall D 1,

.I  S/1 D

1 X D0

S 

1 X

T  D .I  T /1 :

D0

Die Aussage für die allgemeine Situation > 0 erhält man durch Betrachtung von 1 S und 1 T : es gilt 1 S  1 T sowie 1 > r . 1 T /, mit der schon bewiesenen Aussage (9.20) für den Spezialfall D 1 erhält man die Regularität der Matrix I  1 S sowie .I  1 S/1  .I  1T /1 und daraus wiederum unmittelbar die Aussage (9.20) in ihrer ganzen Allgemeinheit. Als unmittelbare Konsequenz erhält man das folgende Resultat. Theorem 9.16. Für Matrizen A; B 2 R N N mit 0  A  B gilt r .A/  r .B/. Beweis. Diese Aussage erhält man unmittelbar durch Anwendung von Theorem 9.15 für D r .A/ C " mit " > 0; " ! 0. Das folgende Resultat für nichtnegative Matrizen wird im nachfolgenden Kapitel 10 benötigt.

246

Kapitel 9 Randwertprobleme

Theorem 9.17. Für jede Matrix B 2 R N N mit B  0 und jede Zahl > 0 gilt die folgende Äquivalenz,

² ”

> r .B/

I  B ist regulär;

³

. I  B/1  0:

(9.21)

Beweis. Die Implikation “ )” folgt unmittelbar aus Theorem 9.15 angewandt mit S D 0. Für den Nachweis der Implikation “( ” wird zunächst der Spezialfall D 1 betrachtet. Ist die Matrix I  B regulär und gilt .I  B/1  0, so folgt 0

n X1



B D

D0

D .I 

n X1

B  .I  B/.I  B/1 D

D0

. B   B C1 /.I  B/1

D0 1

n

B / .I  B/  .I  B/ „ƒ‚… „ ƒ‚ … 0

n X1

1

;

0

beziehungsweise insbesondere 0 

n X1

B   .I  B/1 ;

n D 1; 2; : : : :

D0

Pn1

P1

Pn

   Wegen D0 B  D0 B für n D 1; 2; : : : ist also D0 B notwendigerweise 3 konvergent und damit gilt die Ungleichung r .B/ < 1. Die allgemeine Situation > 0 für die Implikation “( ” in der Aussage (9.21) lässt sich auf den Fall D 1 zurückführen,

> r .B/ ” 1 > r . 1 B/; I  B regulär; . I  B/1  0 ” I  1 B regulär; .I  1 B/1  0: Dies komplettiert den Beweis des Theorems. Als Konsequenz aus Theorem 9.17 erhält man das folgende klassische Resultat. Theorem 9.18 (Satz von Perron). Für jede Matrix A 2 R N N mit A  0 ist die Zahl D r .A/ ein Eigenwert von A. Beweis. Wäre die Matrix I  A regulär, so ergäbe sich 0

./



./

.. C "/I  A /1 ! . I  A/1

für 0 < " ! 0;

wobei die Ungleichung . / aus Theorem 9.17 resultiert, und . / folgt mit Korollar 4.50 über die Stetigkeit der Matrixinversion. Daraus erhält man . I  A/1  0 im Widerspruch zur Aussage von Theorem 9.17. 3

vergleiche Theorem 9.13

247

Abschnitt 9.3 Galerkin-Verfahren

9.2.5 Nachweis der Aussage in Teil (a) von Theorem 9.10 Für den Nachweis der Aussage (9.15) betrachtet man die folgenden Matrizen D; D0 ;

S und S0 2 R .N 1/.N 1/ ,

D D 2I C h2 diag .r1 ; : : : ; rN 1 /; 0

S

1 B 0 B 2 C r1 h2 B B B 1 pp B p B 2 2 C r h B 2 B D B B pp B p B B B B @

pp

p

0

1

D0 D 2I; 1

C C C C C C C C C; C 1 C C 2 C rN 2 h2 C C C C A

2 C rN 1 h2

0 S0

0

B B1 B D B2 B @

1

1 2

pp

p

pp

p

pp

p

pp

p

1 2

C C C C 1C 2A 0

0

und erhält damit die Darstellungen

A D D.I  S/;

A0 D D0 .I  S0 /:

Mit Lemma 9.12 erhält man

.S0 / D

®

cos .

k N

/

W k D 1; : : : ; N  1

¯

 ¹ x W 1 < x < 1 º;

und offensichtlich gilt 0  S  S0 , so dass nach Theorem 9.15 die Matrizen I  S0 und I  S regulär sind und mehr noch 0  .I  S/1  .I  S0 /1 gilt. Weiterhin sind die Matrizen D und D0 offensichtlich regulär mit D 1  D01 . Insgesamt erhält man also die Regularität der Matrix A sowie 1 0  A1 D .I  S/1 D 1  .I  S0 /1 D01 D A 0 ;

was den Beweis von Teil (a) des Theorems 9.10 komplettiert. Bemerkung 9.19. Der vorgestellte Beweis lässt sich noch kompakter führen mithilfe der im anschließenden Kapitel behandelten Theorie der M-Matrizen ( siehe insbesonM dere Aufgabe 10.7 ).

9.3 Galerkin-Verfahren In dem vorliegenden Abschnitt werden Galerkin-Verfahren behandelt, die bei speziellen Problemstellungen und bei Verwendung geeigneter Ansatzräume bessere Approximationseigenschaften als Differenzenverfahren besitzen.

248

Kapitel 9 Randwertprobleme

9.3.1 Einführende Bemerkungen Im Folgenden wird der Ansatz für Galerkin-Verfahren zur approximativen Lösung von Randwertproblemen vorgestellt. Exemplarisch soll dies zunächst anhand des speziellen sturm-liouvilleschen Randwertproblems u 00 C ru D '; u.a/ D u.b/ D 0, mit der nichtnegativen Funktion r W Œ a; b  ! R C geschehen4 . Hierzu wird dieses Randwertproblem als Operatorgleichung Lu D ' geschrieben mit

L W C Πa; b   DL ! C Πa; b ;

μ

u  u00 C ru;

DL D ¹ u 2 C 2 Œ a; b  W u.a/ D u.b/ D 0 º;

(9.22)

und im weiteren Verlauf bezeichne noch

h u; v i 2 WD

Z b a

u; v 2 C Πa; b ;

u.x/ v.x/ dx;

(9.23)

das L2 -Skalarprodukt, und S  DL sei ein linearer Unterraum mit dim S < 1. Als Raum S kann hier beispielsweise der Raum der kubischen Splines mit natürlichen Randbedingungen verwendet werden. In der vorliegenden speziellen Situation ist die Galerkin-Approximation b s 2 S folgendermaßen erklärt5 :

b s 2 S;

h Lb s;

i 2 D h ';

i2

für alle

2 S:

(9.24)

Interessiert ist man an der Verwendung von solchen Räumen S , für die einerseits s  u bezüglich der L2 -Norm jj  jj2 oder anderer gängiger Normen mögder Fehler b lichst klein ausfällt, und andererseits soll die zugehörige Galerkin-Approximation mit möglichst wenig Aufwand bestimmt werden können. Im weiteren Verlauf werden die folgenden Themen abgehandelt: 

Galerkin-Verfahren werden in einer allgemeinen Form und für eine große Klasse von Problemstellungen definiert sowie ihre Konvergenzeigenschaften behandelt ( übernächster Abschnitt 9.3.3 ).



Die Bedeutung der in Abschnitt 9.3.3 erzielten Konvergenzresultate sollen anhand des sturm-liouvilleschen Differenzialoperators Lu D u 00 Cru aus (9.22) erläutert werden. Die dafür benötigten Eigenschaften von L werden in dem nachfolgenden Abschnitt 9.3.2 hergeleitet.

9.3.2 Eigenschaften des Differenzialoperators Lu D u00 C ru Im Folgenden werden einige Eigenschaften des Differenzialoperators Lu D u00 C ru aus (9.22) vorgestellt. Als Erstes geht es darum, das anhand des Modellbeispiels aus (9.22) betrachtete Galerkin-Verfahren dahingehend sinnvoll zu verallgemeinern, dass eine Verwendung des Raums S der linearen Splinefunktionen infrage kommt, der aufgrund der fehlenden Differenzierbarkeitseigenschaften nicht in dem Definitionsbereich DL des sturm-liouvilleschen Differenzialoperators enthalten ist. Dabei ist 4 5

vergleiche (9.7)– (9.8) Die konkrete Art der Berechnung wird in Abschnitt 9.3.4 behandelt.

249

Abschnitt 9.3 Galerkin-Verfahren

die folgende symmetrische Bilinearform hilfreich,

ŒŒ u; v  WD

Z b a

.u0 v 0 C ruv /.x/ dx;

u; v 2 C1 Πa; b ;

μ (9.25)

C1 Œ a; b  D ¹ u W Œ a; b  ! R W u ist stückweise stetig differenzierbar º: Hierbei heißt eine Funktion u W Œ a; b  ! R stückweise stetig differenzierbar, falls sie auf dem Intervall Œ a; b  stetig ist und eine Zerlegung  D ¹ a D x0 < x1 < : : : < xN D b º existiert, so dass auf jedem der offenen Teilintervalle .x0 ; x1 /; .x1 ; x2 /; : : : ; .xN 1 ; xN / die Ableitung der Funktion u existiert und dort eine stetige Funktion darstellt. Das Symbol  in C1 Œ a; b  bezieht sich nicht auf eine vorab festgelegte Zerlegung. Die Bedeutung des in (9.25) auftretenden Integrals mit stückweise stetig differenzierbaren Funktionen u; v wird klar mit der folgenden Setzung, Z b a

u0 .x/v 0 .x/ dx D

M Z zk X kD1

zk1

u0 .x/ v 0 .x/ dx;

(9.26)

wobei die Zahlen a D z0 < z1 < : : : < zM D b so gewählt sind, dass die Funktion u0 v 0 auf jedem der offenen Teilintervalle .z0 ; z1 /; .z1 ; z2 /; : : : ; .zM 1 ; zM / definiert und stetig ist. Wegen der fehlenden Setzung der Funktion u0 v 0 an den Stellen z0 ; : : : ; zM sind die die Integrale auf der rechten Seite von (9.26) als uneigentliche Integrale zu verstehen. Entsprechend ist für stückweise stetig differenzierbare Funktionen u W Rb Œ a; b  ! R der Wert jju0 jj2 D . a u0 .x/2 dx /1=2 zu verstehen. Mit dem folgenden Lemma wird der Zusammenhang zwischen der angegebenen Bilinearform und dem sturm-liouvilleschen Differenzialoperator L beschrieben: Lemma 9.20. Es gilt

ŒŒ u; v  D h Lu; v i 2

für u 2 DL ;

v 2 D;

(9.27)

mit D D ¹ u 2 C Œ a; b  W u.a/ D u.b/ D 0 º: 1

Beweis. Auch für stückweise stetig differenzierbare Funktionen sind die Regeln der partiellen Integration anwendbar, und so erhält man

h Lu; v i 2 D

Z b a

.u00 C ru/.x/ v.x/dx

D .u0 v /.x/ja C b

D 0 C

Z b a

Z b a

. u0 v 0 C ruv /.x/ dx

.u0 v 0 C ruv /.x/ dx D ŒŒ u; v :

Bemerkung 9.21. Man beachte, dass der Ausdruck ŒŒ u; v  auch für Funktionen u 2 DnDL definiert ist. Aufgrund der Identität (9.27) stellt die Bilinearform ŒŒ ;  somit

250

Kapitel 9 Randwertprobleme

bezüglich des ersten Eingangs eine Fortsetzung der Bilinearform h L; ii2 dar. Diese Eigenschaft ermöglicht die Erweiterung des in (9.24) anhand des sturm-liouvilleschen Differenzialoperators Lu D u00 C ru eingeführten Galerkin-Verfahrens auch auf solche Ansatzräume S  D , die nicht in DL enthalten sind ( vergleiche Definition M 9.28 unten ). Als unmittelbare Konsequenz aus Theorem 9.20 und der Symmetrie der Bilinearform ŒŒ ;  erhält man die Symmetrie des sturm-liouvilleschen Differenzialoperators L. Korollar 9.22. Der sturm-liouvillesche Differenzialoperator L in (9.22) ist symmetrisch, es gilt also

h Lu; v i 2 D h u; Lv i 2

für u; v 2 DL :

Beweis. Die Behauptung folgt unmittelbar aus Lemma 9.20,

h Lu; v i 2 D ŒŒ u; v  D ŒŒ v; u D h Lv; uii2 D h u; Lv i 2 :

In dem nächsten Theorem werden die ( später benötigte ) positive Definitheit der Abbildung u  ŒŒ u; u nachgewiesen und gängige obere und untere Schranken für ŒŒ u; u hergeleitet. ( Diese Schranken ermöglichen die Herleitung konkreter Fehlerabschätzungen für die Galerkin-Approximation. ) Das folgende Lemma liefert hierfür die technischen Hilfsmittel. 1=2

Lemma 9.23. Mit der Notation jjujj2 D h u; uii2

jjujj2  .b  a/jju0 jj2

gilt die friedrichsche Ungleichung

für u 2 C1 Œ a; b  mit u.a/ D 0:

(9.28)

Beweis. Aufgrund der Eigenschaft u.a/ D 0 gilt

u.x/ D

Z x a

u 0 .t/ dt

für x 2 Œ a; b ;

(9.29)

da der Haupsatz der Differenzial- und Integralrechnung auch für stückweise stetig differenzierbare Funktionen gültig ist. Ausgehend von (9.29) liefert eine Anwendung der cauchy-schwarzschen Ungleichung die folgende Abschätzung,

u.x/2 

Z x a

12 dt 

Z x a

u0 .t/2 dt D .x  a/

Z x a

‚ u0 .t/2 dt  .b  a/

D jju0 jj22 …„ ƒ

Z b a

u0 .t/2 dt

für x 2 Œ a; b ; und die angegebene Ungleichung (9.28) resultiert nun unmittelbar aus der trivialen

Rb

Abschätzung jjv jj2 D . a v.s/2 ds /1=2  .b  a/1=2 jjv jj1 für v 2 C Œ a; b . Mithilfe des vorhergehenden Lemmas lassen sich obere und untere Schranken für ŒŒ u; u herleiten, die die Grundlage für nachfolgende konkrete Fehlerabschätzungen darstellen.

251

Abschnitt 9.3 Galerkin-Verfahren

Theorem 9.24. Es gelten die Ungleichungen

jju0 jj22  ŒŒ u; u  1 jju0 jj22

für u 2 C1 Œ a; b  mit u.a/ D 0;

(9.30)

mit der Konstanten 1 D 1 C jjr jj1 .b  a/2 . Beweis. Die angegebenen Ungleichungen erhält man folgendermaßen,

ŒŒ u; u D ......

Z b a

./

..u0 /2 C ru2 /.s/ ds

D



Z b a

u0 .s/2 ds D jju0 jj22 ;

 jju0 jj22 C jjr jj1 jjujj22

.......

./



1 jju0 jj22 ;

wobei die Abschätzungen . / und . / aus der Nichtnegativität r  0 beziehungsweise der friedrichschen Ungleichung resultieren. Die später benötigten Eigenschaften des speziellen Differenzialoperators Lu D u00 C ru stehen nun allesamt zur Verfügung.

9.3.3 Galerkin-Verfahren – ein allgemeiner Ansatz Galerkin-Verfahren lassen sich in den unterschiedlichsten Situationen einsetzen und werden hier daher in genügender Allgemeinheit betrachtet. Zunächst werden die entsprechenden Annahmen zusammengetragen. Voraussetzungen 9.25. (a) In einem reellen Vektorraum V wird die lineare Gleichung

Lu D '

mit L W V  DL ! V linear ;

'2V

betrachtet, wobei DL ein linearer Unterraum von V ist. Diese Gleichung Lu D ' besitze eine Lösung u 2 DL. Weiter sei h ; ii W V V ! R eine Bilinearform auf V . (b) Es bezeichne ŒŒ ;  W D D ! R eine zweite Bilinearform auf einem linearen Unterraum D  V , wobei D eine Obermenge des Definitionsbereichs DL der Abbildung L darstellt, DL  D . Diese zweite Bilinearform ŒŒ ;  sei positiv definit,

ŒŒ u; u > 0

für 0 ¤ u 2 D;

und zwischen den beiden genannten Bilinearformen bestehe der folgende Zusammenhang,

ŒŒ u; v  D h Lu; v i

für u 2 DL ;

v 2 D:

(9.31)

Beispiel 9.26. Der im vorangegangenen Abschnitt 9.3.2 betrachtete Differenzialoperator Lu D u00 C ru erfüllt mit den in dem dortigen Zusammenhang betrachteten Bilinearformen die in Voraussetzung 9.25 genannten Bedingungen ( mit den Notationen V D C Œ a; b  und h ; ii D h ;  i 2 ). M

252

Kapitel 9 Randwertprobleme

Bemerkung 9.27. (a) Unter den in Voraussetzung 9.25 genannten Bedingungen ist der Operator L notwendigerweise injektiv. Falls nämlich Lu D 0 erfüllt ist für eine Funktion u 2 DL , so gilt 0 D h Lu; uii D ŒŒ u; u

Ý

u D 0:

(b) Die Abbildung D 3 u  ŒŒ u; u1=2 bezeichnet man als Energienorm. Tatsächlich erfüllt sie die Normeigenschaften, was offensichtlich ist im Fall einer symmetrischen Bilinearform ŒŒ ; , die dann ein Skalarprodukt darstellt. Man kann aber auch für den nichtsymmetrischen Fall die Normeigenschaften der Energienorm nachweisen ( Aufgabe 9.10 ). (c) Die Eigenschaft (9.31) dient in den nachfolgenden Betrachtungen lediglich dazu, Galerkin-Verfahren in einer relativ allgemeinen Form zu erklären. Es existiert jedoch ein weiterer Anwendungsbereich, der hier kurz angesprochen werden soll. Aufgrund der Eigenschaft (9.31) stellt die Lösung u 2 DL der Operatorgleichung Lu D ' auch eine Lösung der Variationsgleichung finde u 2 D

mit ŒŒ u; v  D h '; v i

für alle v 2 D

(9.32)

dar. Diese Variationsgleichung (9.32) erlangt in denjenigen Anwendungen eine eigenständige Bedeutung, bei denen die Gleichung Lu D ' entgegen der Voraussetzung 9.25 nicht in D lösbar ist, die Variationsgleichung (9.32) jedoch eine Lösung u 2 D besitzt. Solche Lösungen bezeichnet man dann als verallgemeinerte oder schwache Lösung von Lu D ' . Die nachfolgenden Resultate gelten auch für schwache Lösungen. M Definition 9.28. Es seien die in Voraussetzung 9.25 genannten Bedingungen erfüllt. Zur approximativen Lösung der Gleichung Lu D ' ist für einen gegebenen linearen s 2 S wie folgt Unterraum S  D mit dim S < 1 die Galerkin-Approximation b erklärt,

b s 2 S;

ŒŒb s;

 D h ';

i

für alle

2 S:

(9.33)

Dieses Verfahren wird als Galerkin-Verfahren beziehungsweise im Falle der Symmetrie der Bilinearform ŒŒ ;  auch als Ritz-Verfahren bezeichnet. Bemerkung 9.29. (a) Wenn S  DL gilt, so kann man (9.33) in der folgenden klassischen und der ( aus dem in (9.24) angegebenen Beispiel ) bereits bekannten Form schreiben,

b s 2 S;

h Lb s;

i D h ';

i

für alle

2 S:

(b) Die Galerkin-Approximation ist eindeutig bestimmt. Sind nämlich b s; s 2 S zwei Galerkin-Approximationen, so gilt insbesondere b s  s 2 S und dann ŒŒb s  s;b s  s  D 0, s D s gilt. so dass aufgrund von Teil (b) der Annahme 9.25 notwendigerweise b

253

Abschnitt 9.3 Galerkin-Verfahren

(c) Wenn u 2 DL die Lösung der Gleichung Lu D ' bezeichnet, so gilt für jedes Element b s 2 S:

b s ist Galerkin-Approximation ” Œb s  u ;

 D 0

für alle

2 S : (9.34)

Dies folgt unmittelbar aus den Darstellungen (9.32) und (9.33). (d) Allgemeiner als in (9.33) kann man für lineare Räume S1  D und S2  V mit s 2 S1 von der folgenden Form betrachten, dim S1 D dim S2 < 1 Approximationen b

b s 2 S1 ;

ŒŒb s;

 D h ';

i

für

2 S2 :

(9.35)

In diesem Zusammenhang wird S1 als Ansatzraum und S2 als Testraum bezeichnet. Bei Galerkin-Verfahren stimmen demnach Ansatz- und Testraum überein. M Die folgende Minimaleigenschaft der Galerkin-Approximation bildet die Grundlage für die Herleitung konkreter Fehlerabschätzungen bei Galerkin-Verfahren. Man beachte, dass hier die Symmetrie der Bilinearform ŒŒ ;  benötigt wird. Theorem 9.30. Es seien die in Voraussetzung 9.25 genannten Bedingungen erfüllt, und zusätzlich sei die Bilinearform ŒŒ ;  W D D ! R symmetrisch. Dann minimiert s 2 S in dem Raum S  D den Fehler bezüglich der die Galerkin-Approximation b Energienorm, es gilt also

Œb s  u ; b s  u  D min Œ s  u ; s  u : s2S

(9.36)

Beweis. Die Aussage erhält man durch folgende Rechnung, bei der s 2 S beliebig gewählt ist,

Œb s  u ; b s  u  D

D 0 nach .9:34/

‚ …„ ƒ Œ s  u ; b s  s; b s  u  s  u  C Œ b

D Πs  u ; s  u 

C Πs  u ; b ss

D

......



......

 Œb s  s; b s  s  C Œb s  u ; b ss „ „ ƒ‚ … ƒ‚ …  0 D 0 :

Die in Theorem 9.30 vorgestellte Minimaleigenschaft der Galerkin-Approximation bezüglich der Energienorm ist ein erster Schritt zur Herleitung konkreter Fehlerabschätzungen für das Galerkin-Verfahren. Ausgangspunkt weiterer Fehlerabschätzungen ist das folgende triviale Resultat, das man in den Anwendungen typischerweise mit speziellen Normen jjj  jjj W D ! R C einsetzt.

254

Kapitel 9 Randwertprobleme

Theorem 9.31. Es seien die in Voraussetzung 9.25 genannten Bedingungen erfüllt mit einer symmetrischen Bilinearform ŒŒ ; , und bezüglich einer nichtnegativen Abbildung jjj  jjj W D ! R C gelte

c1 jjjujjj2  ŒŒ u; u  c2 jjjujjj2

für alle u 2 D

(9.37)

mit gewissen Konstanten c2  c1 > 0. Dann gilt

r jjjb s  u jjj  c min jjjs  u jjj s2S

mit c D

c2 : c1

(9.38)

Beweis. Die Aussage folgt unmittelbar aus der Eigenschaft (9.36). In der Situation (9.38) nennt man das Galerkin-Verfahren quasioptimal bezüglich jjjjjj, da die Galerkin-Approximation bis auf einen konstanten Faktor aus dem Raum S die optimale Approximation an u darstellt. Auch für nichtsymmetrische Bilinearformen ŒŒ ;  erhält man unter vergleichbaren Bedingungen die Quasioptimalität der Galerkin-Approximation. Theorem 9.32 (Lemma von Céa). Es seien die in Voraussetzung 9.25 genannten Bedingungen erfüllt und bezüglich einer Abbildung jjj  jjj W D ! R C gelte

c1 jjjujjj2  ŒŒ u; u für u 2 D;

ŒŒ u; v   c2 jjjujjjjjjvjjj für u; v 2 D

(9.39)

s  u jjj  c mins2S jjjs  u jjj mit mit gewissen Konstanten c2  c1 > 0. Dann gilt jjjb c D c2 =c1 , das Galerkin-Verfahren ist also quasioptimal bezüglich jjj  jjj. Beweis. Die Aussage erhält man durch folgende Rechnung, bei der s 2 S beliebig gewählt ist,

c1 jjjb s  u jjj2

./



Œb s  u ; b s  u 

D

s  u ; b s s Œb s  u ; s  u  C Œb ƒ‚ … „ D 0 c2 jjjb s  u jjjjjjs  u jjj;

./



wobei man die Abschätzungen . / und . / jeweils unmittelbar aus den Bedingungen in (9.39) erhält. Eine Division durch jjjb s  u jjj liefert nun ( im Fall jjjb s  u jjj ¤ 0, andernfalls ist die Aussage sowieso trivial ) die Quasioptimalität. Bemerkung 9.33. Typischerweise ist in Theorem 9.32 die Abbildung jjj  jjj eine Norm, und die erste der beiden Bedingungen in (9.39) wird dann als Koerzivität der Bilinearform ŒŒ ;  bezüglich jjj  jjj bezeichnet. Die zweite Bedingung in (9.39) stellt eine Beschränktheitsbedingung an die Bilinearform ŒŒ ;  dar. M

255

Abschnitt 9.3 Galerkin-Verfahren

9.3.4 Systemmatrix Zur konkreten Berechnung der Galerkin-Approximation benötigt man noch eine Basis für den Raum S : Lemma 9.34. Es seien die in Voraussetzung 9.25 genannten Bedingungen erfüllt und PN das System s1 ; : : : ; sN 2 S bilde eine Basis von S . Es ist das Element s D kD1 ck sk 2 S mit den Koeffizienten c1 ; : : : ; cN 2 R genau dann Galerkin-Approximation, wenn die Koeffizienten c1 ; : : : ; cN 2 R dem folgenden linearen Gleichungssystem genügen,

0 B B B B B @

ŒŒ s1 ; s1  p p p ŒŒ sN ; s1 

10

1 c1

1

0 h '; s1 i

CB C C B CB C C B p p C B C C B pp pp C B pp C D B C: p CB C C B A@ A A @ ŒŒ s1 ; sN  p p p ŒŒ sN ; sN  cN h '; sN i pp p

pp p

(9.40)

Beweis. Nach Definition (9.33) ist mit der gegebenen Basis von S ein Element s 2 S genau dann Galerkin-Approximation, wenn s 2 S und ŒŒ s; sj  D h '; sj i für j D 1; 2;

: : : ; N gilt. Mit dem Ansatz s D N X

PN

kD1 ck sk

2 S ist dies gleichbedeutend mit

ŒŒ sk ; sj  ck D h '; sj i ;

j D 1; 2; : : : ; N:

kD1

Die Matrixversion hierzu ist identisch mit (9.40).

Bemerkung 9.35. (a) Die in (9.40) auftretende Matrix wird als Systemmatrix oder auch als Steifigkeitsmatrix bezeichnet und ist regulär aufgrund der Eindeutigkeit der Galerkin-Approximation ( siehe Teil (b) von Bemerkung 9.29 ). Daraus erhält man auch unmittelbar die Existenz der Galerkin-Approximation. (b) Das Gleichungssystem (9.40) stellt lediglich eine “Halbdiskretsierung” der gegebenen Operatorgleichung Lu D ' dar, denn sowohl die Einträge in der Systemmatrix als auch die Komponenten des Vektors auf der rechten Seite des Gleichungssystems sind in der Regel nicht exakt bekannt und müssen numerisch berechnet werden. Im Fall der beiden speziellen Bilinearformen aus Voraussetzung 9.25 kann dies beispielsweise mittels Quadraturformeln geschehen. Allgemein bezeichnet man solche Verfahren, bei denen die Einträge in der Systemmatrix beziehungsweise der rechten Seite des Gleichungssystems (9.40) durch exakt auswertbare Näherungsformeln approximiert werden, als volldiskrete GalerkinVerfahren. M

256

Kapitel 9 Randwertprobleme

9.3.5 Finite-Elemente-Methode In der Praxis ist der zugrunde liegende Raum V typischerweise ein Funktionenraum und man verwendet als Basis des zum Galerkin-Verfahren gehörenden Raums S oft Funktionen s1 ; : : : ; sN 2 S mit einem jeweils kleinen Träger, es gilt also sk D 0 außerhalb einer vom jeweiligen Index k abhängenden Menge und sk  sj D 0 für einen Großteil der Indizes. In diesem Fall wird das zugehöriges Galerkin-Verfahren auch als Finite-Elemente-Methode bezeichnet.

Beispiel 9.36. Zu der Zerlegung  D ¹ a D x0 < x1 < : : : < xN D b º eines Intervalls Œ a; b  sei S der Raum der linearen Splines, S D S;1 . Eine Basis dieses .N C 1/dimensionalen Vektorraums erhält man durch Hutfunktionen ( lineare B-Splines ), die folgendermaßen erklärt sind,

8 1 .x  xj 1 /; falls x 2 Œ xj 1 ; xj ; ˆ ˆ < hj 1 1 sj .x/ D .x  x/; falls x 2 Œ xj ; xj C1 ; hj j C1 ˆ ˆ : 0 sonst

9 > > = > > ;

j D 0; 1; : : : ; N;

(9.41)

wobei hj D xj C1  xj ; j D 0; 1; : : : ; N  1 die Knotenabstände bezeichnet. In (9.41) sind in den Fällen “j D 0” beziehungsweise “j D N ” die Situationen “x 2 Œ x1 ; x0 ” beziehungsweise “x 2 Œ xN ; xN C1 ” ohne Relevanz. Die vorliegende Situation ist in Bild 9.1 veranschaulicht.

1

0

...... ....... .... .. ...

s0.

s1

s2

s3

s4

s5

.. .. .. .... ..... .................. ....... .... ...... ........ ....... ....... .... ....... .... .... ... ... ... ... ...... ........ .... ....... ... .... ... ... ... .... ..... ....... ....... .... .... .... .... ... .... ... .. ....... ... ....... . . . . .... ....... . . . ... .. . . . . . . . . . . . . . ....... ....... .... ... ..... ........ ...... .......... ... .. ..... ..... ....... ....... .............. ...... ... ... .... ...... ....... ....... .... ....... .... ... ... ... ... ... ....... ........ .... .... .... .... ....... ... ..... ..... .... . ....... . . . .... . . . . . . . . . . . . . .... ... ... ....... .... .. .. ... ... ... ....... .... .............. ... .... .... ... ... ... ... ....... ......... ..... .... ... ................................. ....

a D x0

x1

x2

x3

x4

x

x5 D b

Bild 9.1: Darstellung der Hutfunktionen an einem Beispiel Für das Referenzbeispiel (9.22) mit den homogenen Randbedingungen verwendet man sinnvollerweise Räume S mit in den Randpunkten a und b verschwindenden Funktionen, beispielsweise also den Raum der linearen Splines S;1 mit Nullrandbedingungen, S D ¹ s 2 S;1 W s.a/ D s.b/ D 0 º. Eine Basis dieses .N  1/dimensionalen Vektorraums bilden die Hutfunktionen s1 ; : : : ; sN 1 . M Beispiel 9.37. Mit der Notation xj D a C j h 2 R für j D 3; 2; : : : ; N C 3 mit h D .b  a/=N sei S der Raum der kubischen Splines zur äquidistanten Zerlegung  D ¹ a D x0 < x1 < : : : < xN D b º des Intervalls Œ a; b . Eine Basis dieses .N C 3/-dimensionalen Vektorraums S D S;3 erhält man beispielswei-

b D se, indem man hilfsweise auf dem Intervall Πx3 ; xN C3  und zur Zerlegung 

257

Abschnitt 9.3 Galerkin-Verfahren

¹ x3 < x2 < : : : < xN C3 º die eindeutig bestimmten kubischen Splinefunktionen s1 ; s0 ; : : : ; sN ; sN C1 2 Sb mit natürlichen Randbedingungen und den Funktions;3 werten sj .xj / D 2=3; sj .xj ˙1 / D 1=6 und sj .x` / D 0 in den restlichen Knoten heranzieht. Bei diesen Funktionen handelt es sich um spezielle kubische B-Splines, deren explizite Form beispielsweise in Oevel [78] angegeben ist. Durch Einschränkung der Definitionsbereiche dieser B-Splines auf das Intervall Œ a; b  erhält man eine Familie von Funktionen, die eine Basis von S D S;3 darstellt. Die vorliegende Situation ist in Bild 9.2 veranschaulicht.

2=3

.... ........ ..

1=6 0

x 1

s0

s

s1

s2

s3

s4

s5

.......... . ..... ...................... ....................... .......... ....................... ..... ........ ............ ...... .... .... ...... .... ..... ...... ..... ... .... ... .... ... ... ... .... ... .... .... ... ... ..... ... ..... ... ..... ... ..... ... ...... . . . . . . . . . . . ... .. ... .. ... ... ... ... ...... .... ..... ..... .... ..... ..... ... .... ... ... ... .... ... ... ... ... ... ..... ... ..... ... ..... ... ..... ... ..... ... ... ... ... ... ... ... ... .. ... . . . . . . . . . . ... ... ... ... . . . . ... .. ... ... ... ... ... ... ... ... ... ... ... ... .. .. .. ... ... ... ... ... ... ... ... ... ... ... ... ... ..... . . . . . . ... ... . . . . . . . ... .. ... ... ... ... ... .. . ... ...... ...... . . . . . . . . ..... ....... . ..... ........ .. .... . .... . . . .... . . . . . . . . ..... ... ....... .... ... ........ ... ........ . . .... ........ . . . . . . . . . . . . . . . . . . . . . . . . . . . . ...... ...... ...... ...... 1 ............ ............ .... .... .... ..... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .... ... .... .... .... .... ... ... ... ... ............................................................................................................................................................................................................................................................................

x0 D a

s6

x1

x2

x3

x4

x5 D b

..................

x

x6

Bild 9.2: Darstellung von kubischen B-Splines anhand eines Beispiels (N D 5) Ist bei Verwendung der Finite-Elemente-Methode der zugrunde liegende Operator L ein Differenzialoperator, so besitzt die zugehörige Systemmatrix bei richtiger Anordnung der Basiselemente typischerweise eine Bandstruktur, so dass sich das entsprechende Gleichungssystem (9.40) mit verhältnismäßig geringem Aufwand lösen lässt. Die Situation wird im nachfolgenden Abschnitt verdeutlicht.

9.3.6 Anwendungen Im Folgenden wird nun wieder das spezielle sturm-liouvillesche Randwertproblem aus Abschnitt 9.3.1 betrachtet: Es bezeichne L W C Œ a; b   DL ! C Œ a; b  den speziellen Differenzialoperator aus (9.22). Weiter bezeichnet h ; ii2 das L2 -Skalarprodukt ( siehe (9.23) ), und ŒŒ ;  W C1 Œ a; b  C1 Œ a; b  ! R sei die Bilinearform (9.25). Die Gleichung Lu D ' besitze eine Lösung u 2 DL .

(9.42)

Ausgehend von der in (9.42) beschriebenen Situation werden nun die Approximationseigenschaften des Galerkin-Verfahrens bezüglich spezieller Ansatzräume S vorgestellt. Vorbereitend wird die folgende allgemeine Abschätzung festgehalten, die eine unmittelbare Konsequenz aus den bereits gewonnenen Resultaten ist. Korollar 9.38. Ausgehend von der in (9.42) beschriebenen Situation sei zu einem vorgegebenen Ansatzraum S  D D ¹ u 2 C1 Œ a; b  W u.a/ D u.b/ D 0 º die zugehörige

258

Kapitel 9 Randwertprobleme

Galerkin-Approximation mit b s 2 S bezeichnet. Hier gilt die folgende Fehlerabschätzung,

jjb s 0  u0 jj2   min jjs 0  u0 jj2 s2S

(9.43)

mit  D . 1 C jjr jj1 .b  a /2 /1=2 . Beweis. Die Aussage folgt unmittelbar aus den Theoremen 9.24, 9.30 und 9.31. Im Folgenden werden für S lineare beziehungsweise kubische Splineräume mit Nullrandbedingungen herangezogen. Für die Abschätzung der rechten Seite von (9.43) lassen sich in dieser Situation die bereits bekannten Schranken für den jeweils bei der Interpolation auftretenden Fehler verwenden.

Korollar 9.39. Zu einer gegebenen Zerlegung  D ¹ a D x0 < x1 < : : : < xN D b º bezeichne S den Raum der linearen Splinefunktion mit Nullrandbedingungen,

S D ¹ s 2 S;1 W s.a/ D s.b/ D 0 º:

(9.44)

s 2S Mit den Notationen aus (9.42) gilt für die zugehörige Galerkin-Approximation b die folgende Abschätzung, jjb s 0  u0 jj2  chmax jju00 jj1 mit einer Konstanten c  0, wobei u 2 C 2 Œ a; b  angenommen wird. Beweis. Dieses Resultat erhält man als unmittelbare Konsequenz aus Korollar 9.38 unter Berücksichtigung von Aufgabe 2.7.

Bemerkung 9.40. In der Situation von Korollar 9.39 ist man auch an Abschätzungen s  u interessiert, die aber mit den in diesem Abschnitt hergeleiteten für den Fehler b Techniken nicht mit der optimalen Ordnung hergeleitet werden können. Mit einer etwas genaueren Wahl der zugrunde liegenden Räume und mit einer verfeinerten Technik ( die als Dualitäts- oder Aubin-Nitsche-Trick bezeichnet wird ) lässt sich aber für das Galerkin-Verfahren mit dem Ansatzraum aus (9.44) zur Lösung des sturmliouvilleschen Randwertproblems mit homogenen Randbedingungen (9.7)–(9.8) die s  u jj2 D O.h2max / nachweisen. M Abschätzung jjb In der vorliegenden Situation (9.42), (9.44) mit den Hutfunktionen s1 ; : : : ; sN 1 ( siehe Beispiel 9.36 ) als Basis von S soll noch die zugehörige Systemmatrix betrachtet werden. Wegen sk sj D 0 für jk  j j  2 gilt auch

ŒŒ sk ; sj  D 0

für jk  j j  2;

259

Abschnitt 9.3 Galerkin-Verfahren

so dass die zugehörige Systemmatrix eine Tridiagonalmatrix darstellt, deren Einträge folgendes Aussehen besitzen:

ŒŒ sj ; sj 1  D ŒŒ sj 1 ; sj  D  ŒŒ sj ; sj  D

1



hj 1 1

hj 1

C C

1

Z x j

2

hj 1 xj 1 1

.x  xj 1 /.xj  x/ r.x/ dx; j D 2; 3; : : : ; N  1;

Z x j

1

h2j 1 xj 1 1

h2j

Z x j C1 xj

.x  xj 1 /2 r.x/ dx C h j

.xj C1  x/2 r.x/ dx;

j D 1; 2; : : : ; N  1;

mit hj D xj C1  xj für j D 0; 1; : : : ; N  1. Beispiel 9.41. Für die spezielle Situation (9.22)–(9.25) werde zu der Zerlegung  D ¹ a D x0 < x1 < : : : < xN D b º der Raum S der kubischen Splines mit Nullrandbedingungen betrachtet,

S D ¹ s 2 S;3 W s.a/ D s.b/ D 0 º: Mit der Notation hj D xj C1 xj für j D 0; 1; : : : ; N 1 sei die Uniformitätsbedingung max

j D0;:::;N 1

hj  K

min

j D0;:::;N 1

hj

erfüllt mit einer Konstanten K  0 von moderater Größe. Dann gilt für die zugehös 2 S die folgende Abschätzung, rige Galerkin-Approximation b

jjb s 0  u0 jj2  ch3max jju jj1 .4/

. hmax WD

max

j D0;:::;N 1

hj /;

mit der Konstanten c D . 1 C jjr jj1 .b  a //1=2 2K , wobei u 2 C 4 Œ a; b  und u00 .a/ D u00 .b/ D 0 vorausgesetzt wird. Dieses Resultat ist eine unmittelbare Konsequenz aus Korollar 9.38 und Theorem 2.16, wobei man in (9.43) den die Funktion u interpolierenden kubischen Spline s mit natürlichen Randbedingungen betrachtet. M Bemerkung 9.42. Auch in der Situation von Beispiel 9.41 ist man an Abschätzungen für den Fehler b s  u interessiert. Unter leicht modifizierten Bedingungen lässt sich s auch hier mit dem bereits angesprochenen Aubin-Nitsche-Trick die Abschätzung jjb M u jj2 D O.h4max / nachweisen.

9.3.7 Das Energiefunktional Als Ergänzung zu der in der Voraussetzung 9.25 beschriebenen allgemeinen Situation wird im Folgenden das Energiefunktional vorgestellt, mit dem sich einerseits die Lösung der Gleichung Lu D ' und andererseits die zugehörige Galerkin-Approximation charakterisieren lassen.

260

Kapitel 9 Randwertprobleme

Definition 9.43. In der Situation von Voraussetzung 9.25 ist das zugehörige Energiefunktional J W D ! R folgendermaßen erklärt,

J.u/ D

1 ŒŒ u; u 2

 h u; ' i

für u 2 D:

Das folgende Theorem zeigt, dass sich der Wert des Energiefunktionals nur um eine Konstante von dem Fehler in der Energienorm unterscheidet. Theorem 9.44. Es seien die in Voraussetzung 9.25 genannten Bedingungen erfüllt mit einer symmetrischen Bilinearform ŒŒ ; . Dann gilt

J.u/ D

1 2

. ŒŒ u  u ; u  u   ŒŒ u ; u  /

für u 2 D;

wobei wieder u 2 DL die Lösung der Gleichung Lu D ' bezeichnet. Beweis. Man erhält die Aussage des Theorems durch folgende Rechnung, 2J.u/

D ŒŒ u; u  2h u; ' i D ŒŒ u; u  2h u; Lu i D ŒŒ u; u  2ŒŒ u; u  D

. ŒŒ u; u

 2ŒŒ u; u  C ŒŒ u ; u  /  ŒŒ u ; u  u 2 D:

D Œ u  u ; u  u   ŒŒ u ; u ;

Als unmittelbare Konsequenz der Theoreme 9.30 und 9.44 erhält man die folgende Minimaleigenschaft. Korollar 9.45. In der Situation von Theorem 9.44 gilt

J.u / D

1

min J.u/ D  ŒŒ u ; u ; 2

u2D

J.b s/ D min J.s/; s2S

wobei b s 2 S die Galerkin-Approximation zu einem gegebenem Ansatzraum S bezeichnet. Bemerkung 9.46. Die Ergebnisse in Theorem 9.44 und Korollar 9.45 behalten ihre Gültigkeit für den Fall, dass die Gleichung Lu D ' entgegen der Annahme 9.25 nicht in DL lösbar ist, jedoch eine verallgemeinerte Lösung u 2 D existiert. Demnach ist ein Element u 2 D genau dann verallgemeinerte Lösung der Gleichung Lu D ' , wenn es das Energiefunktional minimiert. M

261

Abschnitt 9.4 Einfachschießverfahren

9.4 Einfachschießverfahren Eine weitere Möglichkeit zur Lösung von Randwertproblemen bei gewöhnlichen Differenzialgleichungen bietet das im Folgenden vorgestellte Einfachschießverfahren, das anhand des allgemeinen Randwertproblems u00 D f .x; u; u0 /; u.a/ D ˛; u.b/ D ˇ betrachtet wird6 . Im Folgenden wird ohne weitere Spezifikation an die Funktion f beziehungsweise an die Randbedingungen angenommen, dass für das vorliegende Randwertproblem eine eindeutig bestimmte Lösung u W Œ a; b  ! R existiert. Ausgangspunkt des Einfachschießverfahrens ist die Betrachtung korrespondierender Anfangswertprobleme für die vorliegende gewöhnliche Differenzialgleichung 2. Ordnung,

u00 D f .x; u; u0 /; u.a/ D ˛;

x 2 Πa; b ;

(9.45)

0

u .a/ D s;

(9.46)

deren Lösung für jede Zahl s 2 R existiere und mit

u.; s/ W Πa; b  ! R

(9.47)

bezeichnet wird. Dabei ist s D s 2 R so zu bestimmen, dass u.b ; s / D ˇ gilt und damit die Funktion u.; s / W Œ a; b  ! R die Lösung des vorgegebenen Randwertproblems u00 D f .x; u; u0 /; u.a/ D ˛; u.b/ D ˇ darstellt, also u.; s / D u./ auf dem Intervall Œ a; b  erfüllt ist. Diese Bestimmung von s erfolgt typischerweise iterativ, was die Bezeichnung Einfachschießverfahren begründet und in Bild 9.3 illustriert ist.

u .... ........ .. .

˛ ˇ

u. ; 1/

................ .......... ..... ..... .... .... .... ... ...................................................................... ... . . . ........... ... .................... .......... . ... . ........ .............. .............................. ... . . . . . ....... ..... ............... .. . . . . . . . . ....... .... .. ........... . .. . . . . . . . . . .. ... ...... .. ... ...... ..... .. ... ..... .. ..... ... .. ..... ... . ..... ... . . ..... .. ..... .. .... .. . .. .. ........ . .. .. ....... .. .. .. ..

u. ; 0:5/

u. ; s / D u./ ..........................................

a

x

b

Bild 9.3: Veranschaulichung der Situation beim Einfachschießverfahren Die nach dem vorliegenden Ansatz entstandene Problemstellung ist äquivalent zu einer Bestimmung der ( eindeutig bestimmten ) Nullstelle s 2 R der nichtlinearen Funktion

F .s/ WD u.b ; s/  ˇ;

s 2 R:

(9.48)

Zur näherungsweisen Lösung dieses Nullstellenproblems lassen sich die in Kapitel 5 vorgestellten Iterationsverfahren einsetzen, von denen im Folgenden zwei Verfahren genauer betrachtet werden. 6

vergleiche (9.1) – (9.2) auf Seite 235

262

Kapitel 9 Randwertprobleme

9.4.1 Numerische Realisierung des Einfachschießverfahrens mit dem Newton-Verfahren Eine Möglichkeit zur numerischen Realisierung des Einfachschießverfahrens besteht in der Anwendung des Newton-Verfahrens, F . sn / ; F 0 . sn /

snC1 D sn 

n D 0; 1; : : : :

(9.49)

Dabei sind in jedem Schritt des Newton-Verfahrens (9.49) zum einen eine Auswertung der Funktion F und damit das Lösen eines Anfangswertproblems der Form (9.45)–(9.46) erforderlich, was wiederum numerisch mit einem der in den Kapiteln 7 und 8 vorgestellten Ein- beziehungsweise Mehrschrittverfahren geschieht. Des Weiteren fällt in jedem Schritt des Newton-Verfahrens (9.49) eine Auswertung der Ableitung

F 0 .s/ D

@u .b ; @s

s/;

s 2 R;

an. An jeder Stelle s erhält man eine solche Ableitung F 0 .s/ als die Lösung eines Anfangswertproblems für eine ( von s abhängende ) gewöhnliche Differenzialgleichung 2. Ordnung: Lemma 9.47. Bei hinreichend guten Differenzierbarkeitseigenschaften der beteiligten Funktionen stellt für jeden Wert s 2 R die Funktion

v WD

@u .; s/ @s

W Πa; b  ! R

die Lösung eines Anfangswertproblems für eine spezielle lineare gewöhnliche Differenzialgleichung 2. Ordnung dar,

v 00 .x/ D g1 .x; s/v.x/ C g2 .x; s/ v 0 .x/; v.a/ D 0;

x 2 Πa; b ; v 0 .a/ D 1:

(9.50)

Die spezielle Form der Funktionen g1 .; s/; g2 .; s/ W Œ a; b  ! R ist im Beweis angegeben. Beweis. Die Aussage erhält man unter Anwendung der Kettenregel,

v 00 .x/ D D

@3 u d @u f . x; u.x ; s/; .x ; s/ / .x ; s/ D @x ds @s @x 2 @f @u



. x; u.x ; s/; @u .x ; s/ / v.x/ C @x ƒ‚ DW g1 .x; s/



@f @u 0



. x; u.x ; s/; @u .x ; s/ / v 0 .x/; @x ƒ‚ DW g2 .x; s/

x 2 Πa; b ;



beziehungsweise

u.a ; /  ˛

Ý

v.a/ D 0;

@u .a ; @x

s/ D s

Ý

v 0 .a/ D 1:

263

Weitere Themen und Literaturhinweise

Zu beachten ist noch, dass die im Anschluss von (9.49) beschriebene Anwendung spezieller Ein- oder Mehrschrittverfahren zur numerischen Berechnung von F .s/ gleichzeitig Approximationen für die Funktionen u.; s/ und @u .; s/ auf einem Git@x ter a D x0 < x1 < : : : < xm D b liefert. Damit sind auch die Werte der Funktionen g1 .; s / und g2 .; s / an den genannten Gitterpunkten näherungsweise bekannt, was die approximative Lösung des Anfangswertproblems (9.50) mittels spezieller Einoder Mehrschrittverfahren bezüglich des gleichen Gitters ermöglicht.

9.4.2 Numerische Realisierung des Einfachschießverfahrens mit einer Fixpunktiteration Eine weitere Möglichkeit zur numerische Realisierung des Einfachschießverfahrens besteht in der Anwendung einer Fixpunktiteration,

snC1 D sn  F .sn /;

n D 0; 1; : : : ;

(9.51)

mit einem Startwert s0 2 R und einem Parameter > 0. In Aufgabe 9.13 sind Bedingungen angegeben, die eine Kontraktionseigenschaft und damit Konvergenz der Fixpunktiteration (9.51) gewährleisten.

Weitere Themen und Literaturhinweise Die Theorie der Randwertprobleme für gewöhnliche Differenzialgleichungssysteme wird beispielsweise in Heuser [54] und in Dallmann / Elster [15] einführend behandelt. Dort findet man auch zahlreiche Beispiele für spezielle Randwertprobleme. Eine Auswahl existierender Lehrbücher mit Abschnitten über die numerische Lösung von Randwertproblemen bildet Emmrich [24], Golub / Ortega [37], Kress [63], Schwarz / Klöckner [94], Stoer / Bulirsch [99] und Weller [110]. Ausführliche Erläuterungen über die Finite-Elemente-Methode in mehreren Raumdimensionen zur Lösung von Randwertproblemen für partielle Differenzialgleichungen findet man beispielsweise in Bärwolff [2], Braess [7], Goering / Roos /Tobiska [33], Großmann / Roos [43], Hanke-Bourgeois [52], Knabner / Angermann [61], Jung / Langer [59], Suttmeier [103] und in Schwetlick / Kretzschmar [96]. Den Aubin-Nitsche-Trick zur Herleitung von Fehlerabschätzungen für das Galerkin-Verfahren findet man in [7] oder Finckenstein [26], Band 2. Die Theorie der nichtnegativen Matrizen wird beispielsweise in Berman / Plemmons [4] und in Horn / Johnson [58] behandelt. Einfachschießverfahren lassen sich problemlos auf allgemeinere Randwertprobleme ( etwa mit nichtlinearen Randbedingungen ) übertragen. Gelegentlich stellen sich bei Einfachschießverfahren jedoch Instabilitäten gegenüber Datenstörungen ein ( dieser Effekt wird in Aufgabe 9.14 anhand eines Randwertproblems für eine einfache lineare Differenzialgleichung 2. Ordnung demonstriert ), weswegen in der Praxis auch Mehrfachschießverfahren eingesetzt werden, die hier jedoch nicht weiter behandelt werden. Eine Einführung hierzu findet man etwa [99], wo auch ein Vergleich der einzelnen zur Lösung von Randwertproblemen bei gewöhnlichen Differenzialgleichungen verwendeten Verfahren angestellt wird.

264

Kapitel 9 Randwertprobleme

Übungsaufgaben Aufgabe 9.1. Im Folgenden wird das Randwertproblem

u00 . x / u. a /

C p . x /u0 . x / C r . x /u. x / D ' . x /; D ˛;

x 2 Πa; b ;

u. b / D ˇ;

betrachtet mit Zahlen ˛; ˇ 2 R und Funktionen p; r; ' 2 C Œ a; b  mit r . x /  0 für x 2 Œ a; b . Approximation der Ableitungen u0 und u00 durch zentrale Differenzenquotienten erster beziehungsweise zweiter Ordnung auf einem äquidistanten Gitter xj D a C j . b  a /=N für j D 1; 2; : : : ; N  1 führt mit einer gewissen Matrix A 2 R.N 1/.N 1/ und einem gewissen Vektor b 2 R N 1 auf ein lineares Gleichungssystem Av D b für v D . v1 ; v2 ; : : : ; vN 1 /> 2 RN 1 , mit den Näherungen vj u. xj /. Man gebe A und b an und zeige, dass das Gleichungssystem für hinreichend kleine Werte von h eindeutig lösbar ist. Aufgabe 9.2. Für eine Matrix A 2 R N N sei eine reguläre Zerlegung gegeben, also eine Zerlegung der Form

A D B  P;

B; P 2 R N N ;

B regulär;

B 1  0;

P  0:

Dann gilt die folgende Äquivalenz:

A regulär;

A1  0



I  B 1 P regulär;

. I  B 1 P /1  0:

Ist eine dieser beiden Bedingungen erfüllt, so gilt r . B 1 P / < 1. Aufgabe 9.3. Eine Matrix A 2 R N N sei regulär mit einer nichtnegativen Inversen, A1  0. Man zeige: für jede reguläre Zerlegung A D B  P der Matrix A gilt

r .A1 P / : 1 C r .A1 P /

r .B 1 P / D

Aufgabe 9.4. Gegeben sei eine reguläre Matrix A 2 RN N mit A1  0 und zwei regulären Zerlegungen A D B1  P1 D B2  P2 , wobei P1  P2 gelte. Man weise die Ungleichungen r .B11 P1 /  r .B21 P2 / < 1 nach. Aufgabe 9.5. Für eine Funktion ' 2 C Œ 0; 1  betrachte man das Randwertproblem

u00 D ' . x /;

u.0/ D u.1/ D 0:

(9.52)

(a) Man zeige, dass sich die Lösung von (9.52) in der Form Z

u. x / D

1 0

x 2 Π0; 1 ;

G. x;  / './ d ;

schreiben lässt mit der greenschen Funktion

² G.x; / D

.x  1/; x.   1 /;

falls   x; sonst.

(b) Die Funktionen u beziehungsweise u C u seien Lösungen des Randwertproblems (9.52) beziehungsweise der fehlerbehafteten Version

. u C u /00 D ' C '

auf Π0; 1 ;

. u C u /.0/ D . u C u /.1/ D 0;

mit ' 2 C Œ 0; 1 ; j' . x / j  " für x 2 Œ 0; 1 . Man zeige ju. x / j  "x. 1x /=2 für x 2 Œ 0; 1 .

265

Übungsaufgaben

(c) Das Differenzenverfahren mit zentralen Differenzenquotienten zweiter Ordnung liefert als Lösung eines lineares Gleichungssystems A0 v D b Näherungswerte vj für u. xj / mit xj D j=N; j D 1; 2; : : : ; N  1: Für die fehlerbehaftete Variante

A0 .v C v/ D b C b

mit b 2 R N 1 ;

jj b jj1  "

weise man Folgendes nach,

jvj j 

" 2

xj . 1  xj /

für j D 1; 2; : : : ; N  1:

Aufgabe 9.6. Die lineare Abbildung  W R N C1 ! R N 1 sei definiert durch

. v /j WD bj vj 1  aj vj C cj vj C1 ;

j D 1; 2; : : : ; N  1;

mit Koeffizienten bj > 0; cj > 0 und aj  bj C cj für j D 1; 2; : : : ; N  1. (a) Man beweise das folgende diskrete Maximumprinzip: Wenn für den Vektor v D . v0 ; : : : ;

vN /> 2 R N C1 mit v  0 die folgende Bedingung erfüllt ist, vj D max vj j D0;:::;N

für ein 1  j  N  1;

so gilt v0 D v1 D : : : D vN . (b) Man beweise die inverse Monotonie der Abbildung : Wenn für Zahlen uj und vj 2 R . j D 0; : : : ; N / die Bedingungen

u 

v;

u0  v0 ;

uN  vN ;

erfüllt sind, so gilt u  v: Aufgabe 9.7. Gegeben sei eine Zerlegung  D ¹ a D x0 < x1 < : : : < xN D b º des Intervalls Œ a; b , und hmax D maxj D0;:::;N 1 ¹ xj C1  xj º bezeichne den maximalen Knotenabstand. Man 1 Œ a; b  mit f .x0 / D f .x1 / D : : : D f .xN / D 0 gilt die zeige: für jede Funktion f 2 C 0 Abschätzung jj f jj2  hmax jj f jj2 : Aufgabe 9.8. Gegeben sei der Differenzialoperator

L W C Œ a; b   DL ! C Œ a; b ; u  . pu0 /0 C ru; ® ¯ DL D u 2 C 2 Œ a; b  W u.a/ D ˛u.b/ C u0 .b/ D 0 ; mit p 2 C 1 Œ a; b ; r 2 C Œ a; b ; p.x/  p0 > 0; r.x/  0 für x 2 Œ a; b  und mit ˛  0. Die 1 Œ a; b  sei durch Bilinearform ŒŒ ;   auf C Z b

ŒŒ u; v  D

a

Œ pu0 v 0 C ruv  dx C ˛. puv /.b/;

u; v 2 C1 Πa; b ;

definiert, und h ;  i2 sei das L2 -Skalarprodukt auf C Œ a; b . Man zeige Folgendes: (a) Die Bilinearform ŒŒ ;   stellt eine Fortsetzung der Abbildung h L;  i2 dar, und bezüglich des Skalarprodukts h ;  i2 ist die Abbildung L symmetrisch. 1 Œ a; b  mit u.a/ D 0, mit geeigneten (b) Man zeige c1 jj u jj21  ŒŒ u; u   c2 jj u0 jj21 für u 2 C Konstanten c1 und c2 .

266

Kapitel 9 Randwertprobleme

Aufgabe 9.9. Gegeben sei der folgende Differenzialoperator vierter Ordnung,

L W C Œ a; b   DL ! C Œ a; b ; u  . pu00 /00 C ru; ® ¯ DL D u 2 C 4 Œ a; b  W u.a/ D u0 .a/ D u00 .b/ D u000 .b/ D 0 ; mit p 2 C 2 Œ a; b ; r 2 C Œ a; b ; p.x/  p0 > 0; r.x/  0 für x 2 Œ a; b , und h ;  i2 sei das L2 -Skalarprodukt auf C Œ a; b . (a) Man zeige, dass die Abbildung L symmetrisch und positiv definit bezüglich h ;  i2 ist. 2 (b) Auf dem Raum C Œ a; b  D ¹ u 2 C 1 Œ a; b  ! R W u0 stückweise stetig differenzierbar º bestimme man eine Bilinearform ŒŒ ;  , die eine Fortsetzung der Abbildung h L;  i2 darstellt und für die Abschätzungen von der Form c1 jj u jj21  ŒŒ u; u   c2 jj u00 jj21 gelten für u 2 C2 Œ a; b  mit u.a/ D u0 .a/ D 0.

Aufgabe 9.10. Man zeige: Für eine positiv definite Bilinearform ŒŒ ;   W D D ! R auf einem reellen Vektorraum D gilt die verallgemeinerte cauchy-schwarzsche Ungleichung,

jŒŒ u; v  C ŒŒ v; u j  2ŒŒ u; u 1=2 ŒŒ v; v 1=2

für u; v 2 D:

Daraus leite man die Dreiecksungleichung für die zugehörige Norm D 3 u  ŒŒ u; u 1=2 her. Aufgabe 9.11 (Fehlerquadratmethode). Es seien V und W reelle Vektorräume, die Abbildung L W V ! W sei injektiv und linear, und h ;  i sei ein Skalarprodukt auf W mit der zugehörigen Norm jj  jj. Außerdem seien u 2 V und ' 2 W . Man weise die Äquivalenz der folgenden drei Aussagen nach: (i) u löst die Minimierungsaufgabe jj Lu  ' jj ! min für u 2 V: (ii) Es gilt h Lu ; Lv i D h '; Lv i für jedes v 2 V . (iii) Es gilt Lu ' 2 R.L/? , dem orthogonalen Komplement des Bildraums von L bezüglich h ;  i. Ist weiter PN der Vektorraum V endlich-dimensional mit Basis v1 ; : : : ; vN und gilt die Identität kD1 ck vk mit gewissen Koeffizienten c1 ; : : : ; cN , so ist jede der Eigenschaften (i), (ii) und (iii) äquivalent zu der Eigenschaft Ac D b mit den Notationen

u D

A D . h Lvj ; Lvk i /N j;kD1 ;

b D . h '; Lvj i /N j D1 ;

c D . c1 ; : : : ; cN />:

Aufgabe 9.12. Gegeben sei das Randwertproblem

Lu D u00 C xu D x 3 C x 2 C 2;

x 2 Π0; 1 ;

u.0/ D u.1/ D 0:

Wie lautet das ritzsche Gleichungssystem, wenn als Ansatzfunktionen trigonometrische Pop lynome von der Form vk .x/ D 2 sin kx; k D 1; 2; : : : ; N verwendet werden? Aufgabe 9.13. Man betrachte das Randwertproblem u00 D f .x; u; u0 /; u.a/ D ˛; u.b/ D ˇ mit einer stetig partiell differenzierbaren Funktion f W Œ a; b   R2 ! R, die die folgenden Bedingungen erfülle, 0
0 beliebig ist. Ist in diesem Fall das Einfachschießverfahren eine geeignete Methode zur Lösung des vorliegenden Randwertproblems? Aufgabe 9.15 ( Numerische Aufgabe ). Man löse numerisch das Randwertproblem

u00 . x / C 6x.1  x/u0 . x / C u. x /2 D x 4 C 10x 3  17x 2 C 6x  2;

x 2 Π0; 1 ;

u.0/ D u.1/ D 0; mit dem Einfachschießverfahren. Zur Nullstellensuche verwende man das Newton-Verfahren einmal mit Startwert s .0/ D 1 und einmal mit s .0/ D 20. Die jeweiligen Anfangswertprobleme löse man numerisch mit dem expliziten Eulerverfahren mit Schrittweite h D 1=30. Man gebe die Näherungen vj zu den Gitterpunkten xj D j h; j D 0; 1; : : : ; 30, tabellarisch an.

10

Gesamtschritt-, Einzelschritt- und Relaxationsverfahren zur Lösung linearer Gleichungssysteme

10.1 Iterationsverfahren zur Lösung linearer Gleichungssysteme Zur Lösung linearer Gleichungssysteme

Ax D b

. A 2 RN N

regulär;

b 2 RN /

(10.1)

mit der eindeutigen Lösung x D A1 b 2 R N werden in den beiden folgenden Kapiteln 10 und 11 einige spezielle Iterationsverfahren vorgestellt. Dabei hat man sich unter einem Iterationsverfahren ganz allgemein ein Verfahren vorzustellen, bei dem – ausgehend von einem beliebigen Startvektor x .0/ 2 R N – sukzessive Vektoren x .1/ ; x .2/ ; : : : 2 R N berechnet werden gemäß der zum jeweiligen Verfahren gehörenden Iterationsvorschrift.

10.1.1 Hintergrund zum Einsatz iterativer Verfahren bei linearen Gleichungssystemen Iterative Verfahren werden unter anderem zur schnellen approximativen Lösung linearer Gleichungssysteme (10.1) eingesetzt. Im Vergleich dazu benötigen die in Kapitel 4 vorgestellten direkten Verfahren zur Lösung eines Gleichungssystems von der Form (10.1) im Allgemeinen1 cN 3 C O.N 2 / arithmetische Operationen mit einer gewissen Konstanten c > 0. Demgegenüber setzt sich bei jedem der vorzustellenden Iterationsverfahren ein einzelner Iterationsschritt typischerweise wie folgt zusammen: 

es treten ein oder zwei Matrix-Vektor-Multiplikationen auf, die mit jeweils N 2 Multiplikationen zu Buche schlagen,



zudem sind mehrere kleine Operationen notwendig wie etwa die Berechnung von Skalarprodukten oder Summen von Vektoren, bei denen insgesamt O.N / arithmetische Operationen anfallen.

Insgesamt erfordert die Durchführung eines Iterationsschrittes also O.N 2 / arithmetische Operationen. Liefert nun das Iterationsverfahren nach einer vertretbaren Anzahl von n N Iterationsschritten hinreichend gute Approximationen x .n/ x , so beträgt der Gesamtaufwand insgesamt also deutlich weniger als die oben genannten cN 3 C O.N 2/ arithmetischen Operationen. 1

also bei voll besetzter Matrix A ohne spezielle Struktur

Abschnitt 10.2

269

Lineare Fixpunktiteration

Weitere zu beachtende Aspekte im Zusammenhang mit dem Einsatz iterativer Verfahren sind in der nachfolgenden Bemerkung aufgeführt. Bemerkung 10.1. (a) Bereits bei der numerischen Lösung nichtlinearer Gleichungssysteme in Kapitel 5 sind einige Iterationsverfahren vorgestellt worden, dort vor dem Hintergrund fehlender direkter Methoden. Natürlich lassen sich einige der dort vorgestellten Resultate – so zum Beispiel der banachsche Fixpunktsatz ( Theorem 5.7 ) – zur approximativen Lösung linearer Gleichungssysteme verwenden. In den beiden folgenden Kapiteln 10–11 wird sich jedoch Folgendes herausstellen: 



Für gewisse Fixpunktiterationen lassen sich auch bei fehlender Kontraktionseigenschaft noch Konvergenzresultate nachweisen, und dies größtenteils bei beliebiger Wahl des Startwerts x .0/ 2 R N . Für Gleichungssysteme Ax D b mit speziellen Eigenschaften – etwa Monotonie oder Symmetrie von A – lassen sich besonders effiziente Methoden einsetzen.

(b) In den Anwendungen treten häufig Fragestellungen auf, deren Modellierung und anschließende Diskretisierung auf große lineare Gleichungssysteme Ax D b mit schwach besetzten ( ein Großteil der N 2 Einträge ist also identisch null ) Matrizen A 2 R N N führen. Ein Modellbeispiel hierzu ist in Abschnitt 10.2.1 angegeben. Die bereits getroffenen Aussagen über direkte und iterative Löser lassen sich mit entsprechenden Modifikationen bezüglich des Aufwands übertragen. M

10.2 Lineare Fixpunktiteration Eine Klasse von Iterationsverfahren zur approximativen Bestimmung der Lösung x der Gleichung (10.1) gewinnt man durch Umformulierung von Ax D b in eine Fixpunktgleichung der Form

x D H x C z;

(10.2)

mit einer geeigneten zunächst nicht näher spezifizierten Iterationsmatrix H 2 R N N sowie einem geeigneten Vektor z 2 R N . Es sei nur angenommen, dass die Lösung x 2 R N der Gleichung (10.1) zugleich einziger Fixpunkt von (10.2) ist. Die zur Fixpunktgleichung (10.2) gehörende lineare Fixpunktiteration lautet dann

x .nC1/ D H x .n/ C z;

n D 0; 1; : : :;

(10.3)

wobei x .0/ 2 R N ein frei wählbarer Startvektor ist. Im Folgenden werden für lineare Fixpunktiterationen der Form (10.3) Resultate für ( globale ) Konvergenz im Sinne der folgenden Definition geliefert. Definition 10.2. Das Verfahren (10.3) zur Bestimmung von x 2 R N heißt konvergent, wenn für jeden Startwert x .0/ 2 R N Folgendes gilt,

jjx .n/  x jj ! 0

für n ! 1:

(10.4)

Hier bezeichnet jj  jj W R N ! R eine nicht näher spezifizierte Vektornorm. Ein nicht konvergentes Verfahren (10.3) nennt man divergent.

270

Kapitel 10 Gesamtschritt-, Einzelschritt- und Relaxationsverfahren

Theorem 10.3. Das stationäre Iterationsverfahren (10.3) ist konvergent genau dann, wenn die Ungleichung r .H / < 1 erfüllt ist. Beweis. Nach Voraussetzung gilt x D H x C z , und somit gelten die Fehlerdarstellungen x .nC1/  x D H .x .n/  x / beziehungsweise

x .n/  x D H n .x .0/  x /;

n D 0; 1; : : : :

(10.5)

Konvergenz ist demnach gleichbedeutend mit H n ! 0 für n ! 1. Dies wiederum ist nach Theorem 9.13 äquivalent zur Eigenschaft r .H / < 1. Bemerkung 10.4. Ebenfalls nach Theorem 9.13 ist das stationäre Iterationsverfahren (10.3) konvergent genau dann, wenn eine Vektornorm jj  jj W R N ! R existiert, so dass für die zugehörige Matrixnorm die Ungleichung jjH jj < 1 erfüllt ist. Für spezielle Matrizen A und spezielle Verfahren (10.3) ist es jedoch häufig so, dass dieses Kriterium für gängige und leicht zu berechnende Normen nicht erfüllt ist, obwohl die ( oft auch nachweisbare ) Ungleichung r .H / < 1 erfüllt ist und somit KonverM genz vorliegt. Die Konvergenz der linearen Fixpunktiteration (10.3) ist umso besser, je kleiner der Spektralradius r .H / ausfällt: Theorem 10.5. Zu einer beliebigen Matrix H 2 R N N und jeder Zahl " > 0 existiert eine Vektornorm jj  jj W R N ! R, mit der für das stationäre Iterationsverfahren (10.3) die folgende Abschätzung gilt,

j x .n/  x jj  .r .H / C "/n j x .0/  x jj;

n D 0; 1; : : : :

Beweis. Die Aussage ist eine unmittelbare Konsequenz aus der Darstellung (10.5) und dem folgenden Lemma. Lemma 10.6. Zu jeder Matrix H 2 R N N und jeder Zahl " > 0 existiert eine Vektornorm jj  jj W R N ! R, so dass für die zugehörige Matrixnorm die folgende Ungleichung gilt:

jjH jj  r .H / C ": Beweis. Mit der Notation a WD 1=.r .H / C "/ erhält man r .aH / D a r .H / < 1, und Theorem 9.13 liefert dann die Existenz einer Vektornorm jj  jj W R N ! R, so dass für die zugehörige Matrixnorm die Ungleichung jjaH jj < 1 erfüllt ist. Daraus erhält man unmittelbar die Aussage des Lemmas. Als unmittelbare Konsequenz aus Lemma 10.6 erhält man Folgendes: Korollar 10.7. Für jede Matrix H 2 R N N gilt

® ¯ r .H / D inf jjH jj W die Matrixnorm ist durch eine reelle Vektornorm induziert :(10.6) In Aufgabe 10.1 wird ein Kriterium dafür angegeben, wann in (10.6) das Minimum angenommen wird.

Abschnitt 10.2

271

Lineare Fixpunktiteration

10.2.1 Ein Modellbeispiel Problemstellung Im Folgenden wird ein Beispiel vorgestellt, bei dem die noch vorzustellenden iterativen Verfahren sinnvoll angewendet werden können2 . Es handelt sich hierbei um ein dirichletsches Randwertproblem für die Poisson-Gleichung,



@2 u @x 2



@2 u @y 2

auf  WD .0 ; 1/2 ;

(10.7)

auf  WD Rand von Π0 ; 1 2 ;

(10.8)

D f

u D 0

wobei f W Œ 0; 1 2 ! R eine gegebene stetige Funktion ist, und die Funktion u W Œ 0; 1 2 ! R ist zu bestimmen. Im Folgenden wird vorausgesetzt, dass das Randwertproblem (10.7)–(10.8) eine eindeutig bestimmte stetige und im Inneren von Œ 0; 1 2 zweimal stetig differenzierbare Lösung u W Œ 0; 1 2 ! R besitzt.3 Der Ansatz für Differenzenverfahren Zur numerischen Lösung des Randwertproblems (10.7)–(10.8) mittels Differenzenverfahren wird das zugrunde liegende Intervall Œ 0 ; 1 2 mit Gitterpunkten versehen, die hier äquidistant gewählt seien,

xj D j h;

yk D kh;

j; k D 0; 1; : : : ; M

.h D

1

M

/:

(10.9)

Die inneren Gitterpunkte sind in Bild 10.1 dargestellt. 1

.M  1/h .M  2/h :: : :: :

2h

h 0

.................................................................................................................................................................................... .... .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ..

0 h 2h

::: :::

.M  1/h

Bild 10.1: Darstellung des gegebenen Gitters Bezüglich dieses Gitters (10.9) wird das Randwertproblem (10.7)–(10.8) in zweierlei Hinsicht diskretisiert: die Poisson-Gleichung (10.7) wird lediglich an den inneren 2 3

vergleiche Bemerkung 10.1 Unter zusätzlichen Voraussetzungen an f ist diese Annahme erfüllt ( Hackbusch [46], Kapitel 3 ).

272

Kapitel 10 Gesamtschritt-, Einzelschritt- und Relaxationsverfahren

Gitterpunkten .xj ; yk /; 1  j; k  M  1, betrachtet, und die partiellen Ableitungen werden dort jeweils durch zentrale Differenzenquotienten 2. Ordnung approximiert,

u.xj 1 ; yk / C 2u.xj ; yk /  u.xj C1 ; yk / C O.h2 /; h2 u.xj ; yk1 / C 2u.xj ; yk /  u.xj ; ykC1 / @2 u  2 .xj ; yk / D C O.h2 /; @y h2 j; k D 1; 2; : : : ; M  1; 

@2 u .xj ; yk / @x 2

D

9 > > > > = > > > > ;

(10.10)

wobei hier u 2 C 4 .Œ 0 ; 1 2 / angenommen wird. Vernachlässigung des Restglieds in (10.10) führt auf das folgende gekoppelte System von N D .M  1/2 linearen Gleichungen,

Uj 1;k  Uj;k1 C 4Uj;k  Uj;kC1  Uj C1;k D fj;k ; j; k D 1; : : : ; M  1; (10.11) h2 für die Approximationen

Uj;k



j; k D 1; 2; : : : ; M  1;

u.xj ; yk /;

wobei in (10.11) noch

Uj;0 D U0;k D 0;

j; k D 1; 2; : : : ; M  1;

fj;k D f .xj ; yk /;

......

gesetzt ist. Zu jedem Gitterpunkt .xj ; yk / korrespondiert in natürlicher Weise sowohl die Unbekannte Uj;k als auch eine Gleichung aus (10.11). Ordnet man in Bild 10.1 diese Gitterpunkte beziehungsweise die entsprechenden Unbekannten und Gleichungen zeilenweise (von links nach rechts) und dann aufwärts an, so erhält man die folgende Matrixdarstellung für die Gleichungen (10.11), 0 0 10 1 1 f1;1 U1;1 4 1 1 p p B B CB C C p p pp pp pp B B 1 p p p p CB C C p B B CB C C p p p p p B pp B CB C C pp p p p p 1 pp B B CB C C B B CB C C B fM 1;1 C B C B UM 1;1 C  1 4  1 B B CB C C pp B B CB C C p 4 1 B f1;2 C B 1 C B U1;2 C B B C C C B pp p p pp ppp ppp B B CB C C p p 1 p p p p B B CB C C pp pp B B CB C C pp pp pp pp B B CB C C p p p 1 p p p B B C C C B pp B f CB U C C  1  1 4 p 1 B B M 1 ; 2 C B C B M 1;2 C D B B C C C B p p pp pp pp pp B CB C C h2 B p p 1 B B CB C C pp pp B pp pp pp B CB C C p p p p p B B CB C C B B C C C B p p pp pp pp pp pp B B CB C C p p p B B CB C C p p B B C C C B p p pp pp pp pp B B C C 1 C B B B CB C C B B C C C B 1 4 1 B f1;M 1 C B C B U1;M 1 C B B CB C C p p p p p pp pp pp B B CB C C 1 p p p p B B CB C C p p B B CB C C pp pp pp p p p p p 1 A @ p p @ A A @



ƒ‚ DWA

1

1 4



UM 1;M 1

fM 1;M 1

Abschnitt 10.3

273

Einige spezielle Klassen von Matrizen

Die zugrunde liegende Matrix A 2 R N N mit N D .M  1/2 ist schwach besetzt und dient im Folgenden als ein Referenzbeispiel für die vorzustellenden speziellen Klassen von Matrizen. Bemerkung 10.8. In dem Differenzenschema (10.11) treten auf der linken Seite der Gleichung für jeden Index .j; k/ die Näherungen zum Gitterpunkt .xj ; yk / und seinen vier Nachbarn auf, weshalb man hier von einer Fünfpunkteformel oder auch von einem Fünfpunktestern spricht. Die zur Gewinnung der Matrixdarstellung angegebene Reihung der Gitterpunkte wird als lexikografische Anordnung bezeichnet. M

10.3 Einige spezielle Klassen von Matrizen und ihre Eigenschaften In Vorbereitung auf die nachfolgenden Abschnitte 10.4 und 10.5 über das Gesamtund das Einzelschrittverfahren sollen zunächst einige spezielle Klassen von Matrizen betrachtet werden.

10.3.1 Irreduzible Matrizen Auch im Folgenden liegt das Hauptaugenmerk auf reellen Matrizen. Aus technischen Gründen wie etwa anstehenden Spektralbetrachtungen werden nun jedoch auch komplexe Matrizen und Normen zugelassen. Definition 10.9. Eine Matrix B D .bjk / 2 CN N heißt reduzibel, falls Mengen J; K  ¹ 1; 2; : : : ; N º mit folgenden Eigenschaften existieren:

J ¤ ¿; bjk D 0

K ¤ ¿; 8 j 2 J;

J \ K D ¿;

J [ K D ¹ 1; 2; : : : ; N º; (10.12)

k 2 K:

Andernfalls heißt die Matrix irreduzibel. Beispiel 10.10. Die Matrix

0

1 2 0

1

B C @ 1 1 0 A 3 0 1 ist reduzibel: man betrachte J D ¹ 1; 2 º und K D ¹ 3 º.

M

Die Bezeichnung “reduzibel” begründet sich in der folgenden Eigenschaft: Bemerkung 10.11. Die Lösung eines gegebenen nichtsingulären Gleichungssystems Ax D b mit einer reduziblen Matrix A D .ajk / 2 CN N lässt sich in zwei kleinere Teilaufgaben zerlegen ( die Notation sei entsprechend Definition 10.9 gewählt ):

274

Kapitel 10 Gesamtschritt-, Einzelschritt- und Relaxationsverfahren

(i) man bestimmt zunächst die Unbekannten xj ; j 2 J , des linearen Gleichungssystems N X

ajk xk D

kD1

X

ajk xk

Š

D

bj ;

j 2 J:

k2J

(ii) Anschließend bestimmt man die Unbekannten xj ; j 2 K , des linearen Gleichungssystems X k2K

ajk xk

Š

D

bj 

X

ajk xk ;

j 2 K:

k2J

M

Beispiel 10.12. Eine Tridiagonalmatrix ist irreduzibel genau dann, wenn jeder ihrer M Nebendiagonaleinträge von null verschieden ist. Beweis. Die Tridiagonalmatrix sei mit B D .bjk / 2 CN N bezeichnet. “ )”: Für einen beliebigen Index j 2 ¹ 1; : : : ; N  1 º sind die Mengen J D ¹ 1; : : : ; j º und K D ¹ j C 1; : : : ; N º nichtleer und disjunkt mit J [K D ¹ 1; : : : ; N º. Da für beliebige Indizes j 2 J und k 2 K mit jj  k j  2 ohnehin bjk D 0 gilt, ist aufgrund der Irreduzibilität der Matrix B notwendigerweise bj ;j C1 ¤ 0. Die Eigenschaft bj C1;j ¤ 0 erschließt man nach Vertauschen von J und K genauso. “( ”: Für beliebige Mengen J; K  ¹ 1; 2; : : : ; N º von der Form (10.12) existieren notwendigerweise Indizes j 2 J; k 2 K , die benachbart sind, es gilt also k D j C 1 oder k D j  1. Für solche Indizes gilt aufgrund der Annahme bjk ¤ 0, und infolgedessen ist die Matrix B irreduzibel. Beispiel 10.13. Die zu dem vorgestellten Modellbeispiel aus Abschnitt 10.2.1 gehörende Matrix ist irreduzibel diagonaldominant ( Aufgabe 10.5 ). M Die folgenden elementaren Eigenschaften werden ebenfalls noch benötigt. Lemma 10.14. Die Matrix B 2 CN N sei irreduzibel. (a) Für jede Diagonalmatrix D 2 CN N ist mit B auch die Matrix B C D irreduzibel. (b) Für Zahlen cjk 2 R mit cjk ¤ 0 für j ¤ k ist mit B D .bjk / auch die Matrix .cjk bjk / 2 CN N irreduzibel. Beweis. Ist eine Matrix irreduzibel, so ändert sich diese Eigenschaft aufgrund der Definition offenkundig nicht, wenn man die Diagonaleinträge beliebig abändert. Entsprechendes gilt, wenn die nichtverschwindenden Nichtdiagonaleinträge beliebig zu nichtverschwindenden Einträgen abgeändert werden.

Abschnitt 10.4

275

Das Gesamtschrittverfahren

Definition 10.15. Eine Matrix B D .bjk / 2 CN N heißt irreduzibel diagonaldominant, falls B irreduzibel ist und weiter Folgendes gilt, N X

jbjk j  jbjj j;

j D 1; 2; : : : ; N;

9 > > > =

für mindestens ein j 2 ¹ 1; 2; : : : ; N º:

> > > ;

kD1 k¤j .......


> =

Ý x .nC1/ D D 1 b  D 1 .L C R/x .n/ ;

......

:

> > > ;

(10.16)

Die zugehörige Iterationsmatrix hat die Gestalt

0 0

HGes

a12 =a11

ppp

1 a1N =a11

B B B B pp pp B a21 =a22 p p p p p B B D D 1 .L C R/ D  B B pp B pp pp p p p aN 1;N =aN 1;N 1 B B B @ aN 1 =aN N p p p aN;N 1 =aN N 0

C C C C C C C C: C C C C C A

Erste hinreichende Kriterien für die Konvergenz des Gesamtschrittverfahrens liefert das folgende Theorem.

Abschnitt 10.4

277

Das Gesamtschrittverfahren

Theorem 10.18. Das Gesamtschrittverfahren ist durchführbar und konvergent, falls eine der beiden folgenden Bedingungen erfüllt ist, N X

jajk j < jajj j;

j D 1; 2; : : : ; N



kD1 k¤j



A ist strikt diagonaldominant



jjHGes jj1 < 1

 I

oder N X

jajk j < jakk j;

k D 1; 2; : : : ; N

.”

A> ist strikt diagonaldominant /:

j D1 j ¤k

Beweis. Jede der genannten Bedingungen impliziert unmittelbar ajj ¤ 0 für j D 1; 2; : : : ; N und damit die Durchführbarkeit des Gesamtschrittverfahrens. Die erste Bedingung bedeutet jjHGes jj1 < 1, was r .HGes / < 1 und somit die Konvergenz des Gesamtschrittverfahrens nach sich zieht. Die zweite Bedingung bedeutet jj.L C R/D 1 jj1 < 1, wegen der Ähnlichkeit der Matrizen HGes und .LCR/D 1 folgt daraus

.HGes / D ..L C R/D 1 / beziehungsweise

r .HGes / D r ..L C R/D 1 /  jj.L C R/D 1 jj1 < 1; was den Beweis des Theorems komplettiert. In wichtigen Anwendungen treten Matrizen auf4 , für die keine der beiden jeweils relativ starken Voraussetzungen von Theorem 10.18 erfüllt ist, wohl aber die schwächere Voraussetzung des folgenden Theorems, die ebenfalls die Konvergenz des Gesamtschrittverfahrens impliziert. Theorem 10.19. Für irreduzibel diagonaldominante Matrizen A 2 R N N ist das Gesamtschrittverfahren durchführbar und konvergent. Beweis. Würde ein Diagonaleintrag der Matrix A verschwinden, so wären aufgrund der vorausgesetzten Diagonaldominanz von A alle Einträge in der gleichen Zeile der Matrix A identisch null im Widerspruch zur vorausgesetzten Irreduzibilität von A. Für die Konvergenz des Verfahrens ist die Ungleichung r .HGes / < 1 beziehungsweise für jede Zahl 2 C mit j j  1 die Regularität der Matrix HGes  I nachzuweisen, wofür nach Theorem 10.16 die irreduzible Diagonaldominanz der Matrix HGes  I hinreichend ist. Letzteres wird in den folgenden Beweisteilen (i) und (ii) nachgewiesen. (i) Mit Lemma 10.14 erschließt man, dass mit der Matrix A auch die Matrizen L C R; HGes D D 1 .L C R/ und HGes  I irreduzibel sind. (ii) Des Weiteren erfüllt die Matrix .bjk / WD HGes  I auch die Bedingungen (10.13), N X kD1 k¤j

4

j ajk j j ajj j

„ƒ‚…

./



1  j j D jbjj j;

j D 1; 2; : : : ; N;

j bjk j

zum Beispiel die Matrix A aus (9.11), die man nach Anwendung des Differenzenschemas auf das spezielle in Abschnitt 9.2 betrachtete Randwertproblem 2. Ordnung erhält

278

Kapitel 10 Gesamtschritt-, Einzelschritt- und Relaxationsverfahren

und für zumindest einen Index j liegt in . / Ungleichheit vor aufgrund der Voraussetzung an die Matrix A. Damit ist die Matrix HGes  I in der Tat irreduzibel diagonaldominant, was den Beweis des Theorems komplettiert.

10.5 Das Einzelschrittverfahren Betrachtet man für das Gesamtschrittverfahren die komponentenweise Darstellung .nC1/ .n/ in (10.16), so ist es naheliegend, zur Berechnung von xj anstelle von x1 ; : : : ; .n/

.nC1/

xj 1 die bereits berechneten und vermeintlich besseren Approximationen x1

;

1/ : : : ; xj.nC 1

zu verwenden. Die zugehörige Fixpunktiteration ist in der folgenden Definition festgehalten. Definition 10.20. Für eine Matrix A D .ajk / 2 R N N mit ajj ¤ 0 für j D 1; : : : ; N ist das Einzelschrittverfahren, auch Gauß-Seidel-Verfahren genannt, zur Lösung der Gleichung Ax D b von der folgenden Form, .nC1/

xj

D

1 

ajj

bj 

jX 1 kD1

.nC1/

ajk xk



N X

.n/ 

ajk xk

; j D 1; 2; : : : ; N; n D 0; 1; : : : ;

kDj C1

bzw.

.D C L/x .nC1/ D b  Rx .n/ ;

.......

:

Die zugehörige Iterationsmatrix hat die Gestalt

HEin D .D C L/1 R:

10.5.1 Der Betrag einer Matrix Für die Herleitung von Konvergenzergebnissen für das Einzelschrittverfahren werden einige weitere ordnungstheoretische Resultate für Matrizen benötigt, die im Folgenden vorgestellt werden. Definition 10.21. Der Betrag einer Matrix A D .ajk / 2 R N N ist durch jAj WD .jajk j/ 2 R N N definiert. Lemma 10.22. Für Matrizen A; B 2 R N N gelten die folgenden Aussagen:

jAj



0;

jjA jj1

D

jj jAj jj1 D jj jAje jj1 ;

)

jjA jj1  jjB jj1 :

jAj  jB j

jA C B j  jAj C jB j;

jAB j  jAj jB j;

mit e D .1; : : : ; 1/> 2 R N ;

Abschnitt 10.5

279

Das Einzelschrittverfahren

Beweis. Es soll exemplarisch nur der Nachweis für die dritte Abschätzung in der ersten Zeile der Aussage geführt werden. Hierzu setzt man A D .ajk /; B D .bjk /; jAB j D .cjk /; jAjjB j D .djk / 2 R N N und erhält N N ˇX ˇ X cjk D ˇ aj ` b`k ˇ  jaj ` jjb`k j D djk : `D1

`D1

Die Beweise der anderen Aussagen sind ähnlich einfach und werden wie bereits angekündigt hier nicht geführt. Insbesondere ist die Abbildung j  j W R N N ! R N N stetig. Die folgende Eigenschaft stellt eine Variante von Lemma 9.9 dar und wird im Beweis des nächsten Theorems benötigt. Lemma 10.23. Für Matrizen S; T 2 R N N und 2 R gilt die Implikation

jS j  T;

1 > r .T /

) I  S regulär ;

P1

Beweis. Es sind die Reihen D0 S  und dung von Lemma 10.22 erhält man n1 ˇˇ X ˇˇ ˇˇ S  ˇˇ Dn0

1

D

n1 ˇˇ ˇ X ˇ ˇˇ ˇˇ ˇ S  ˇ ˇˇ Dn0



n1 ˇˇ X ˇˇ ˇˇ T  ˇˇ Dn0

1

1

j.I  S/1 j  .I  T /1 : (10.17)

P1

D0 jS j



konvergent, denn unter Anwen-

n1 ˇˇ X ˇˇ  ˇˇ jS j ˇˇ Dn0

! 0

1

für n0  n1 ;

n0 ; n1 ! 1:

Daher ist die Matrix I  S regulär und es gilt die Identität .I  S/1 D dass man schließlich die Aussage (10.17) erhält, 1 X

j.I  S/1 j 

D0

jS j 

1 X

P1

D0 S

,

so

T  D .I  T /1 :

D0

Entsprechend der ( partiellen ) Ordnung für Matrizen wird noch eine Ordnung für Vektoren eingeführt. Für zwei Vektoren x D .xj /; y D .yj / 2 R N schreibt man

x  y

W”

xj  yj

für j D 1; 2; : : : ; N:

Synonym für x  y wird die Notation y  x verwendet. Ein Vektor x 2 R N heißt nichtnegativ, falls x  0 gilt.

10.5.2 Konvergenzergebnisse für das Einzelschrittverfahren Ein erstes hinreichendes Kriterium für die Konvergenz des Einzelschrittverfahrens liefert das folgende Theorem.

280

Kapitel 10 Gesamtschritt-, Einzelschritt- und Relaxationsverfahren

Theorem 10.24. Für jede strikt diagonaldominante Matrix A 2 R N N gilt

jjHEin jj1  jjHGes jj1 < 1:

Beweis. Die strikte Diagonaldominanz der Matrix A ist offensichtlich äquivalent zu jjHGes jj1 < 1 ( siehe Theorem 10.18 ). Im Folgenden wird die zweite Ungleichung in 0  jHEin je  jjHGes jj1 e

(10.18)

mit e D .1; : : : ; 1/> nachgewiesen ( die erste Ungleichung in (10.18) ist offensichtlich richtig ), woraus dann jjHEin jj1 D jjjHEin je jj1  jjHGes jj1 und somit die Aussage des Theorems folgt. Für den Nachweis der zweiten Ungleichung von (10.18) beobachtet man

HGes D D 1 .L C R/

jHGes j D jD 1 Lj C jD 1 R j;

Ý

HEin D .I C D 1 L/1 D 1 R; und Lemma 10.23 angewandt mit S D D 1 L und T D jD 1 Lj liefert ( in der Abschätzung .// 1 j HGes jj D

./

jHEin j  j.I C D 1 L/1 jjD 1 R j  . I  jD 1 Lj/1 D .I  jD 1 Lj/1 . jHGes j  I C . I  jD 1 Lj/ /

‚ …„ ƒ jD 1 R j

Lj

D I C .I  jD 1 Lj/1 .jHGes j  I / und daher

jj HGes jj1 e

jHEin je  e C .I  jD

1

Lj/

1

‚ …„ ƒ . jHGes je  e /

D e C .jjHGes jj1  1 / . I  jD 1 Lj/1 e „ ƒ‚ …„ ƒ‚ … ./  0 I  e C .jjHGes jj1  1 /e D jjHGes jj1 e; was (10.18) bedeutet und den Beweis komplettiert. Die Ungleichung . / folgt dabei mit Lemma 10.23 angewandt mit S D 0 und T D jD 1 Lj. Bemerkung 10.25. Für strikt diagonaldominante Matrizen A 2 R N N kann man nach Theorem 10.24 bei der Anwendung des Einzelschrittverfahrens eine schnellere Konvergenz als bei der Anwendung des Gesamtschrittverfahrens erwarten. M Ein weiteres hinreichendes Kriterium für die Konvergenz des Einzelschrittverfahrens liefert das folgende Theorem5 . Theorem 10.26. Für irreduzibel diagonaldominante Matrizen A 2 R N N ist das Einzelschrittverfahren durchführbar und konvergent. 5

siehe die Anmerkungen vor Theorem 10.19

Abschnitt 10.6

281

Das Relaxationsverfahren und erste Konvergenzresultate

Beweis. Das Nichtverschwinden der Diagonaleinträge von A ( was die Durchführbarkeit des Einzelschrittverfahrens gewährleistet ) ist bereits in Theorem 10.19 gezeigt worden. Für die Konvergenz des Einzelschrittverfahrens ist die Ungleichung r .HEin / < 1 beziehungsweise für jede Zahl 2 C mit j j  1 die Regularität der Matrix HEin  I nachzuweisen. Hierzu sei in Erinnerung gerufen, dass HEin D .D C L/1 R gilt, und die Regularität der Matrix HEin  I ist damit äquivalent zur Regularität von D C L C R. Für die letztgenannte Eigenschaft ist nach Theorem 10.16 die irreduzible Diagonaldominanz der Matrix D C L C R hinreichend, die im Folgenden nachgewiesen wird. (i) Mit Lemma 10.14 erschließt man, dass mit A auch die Matrix D C L C R irreduzibel ist. (ii) Weiter erfüllt die Matrix .bjk / WD D C L C R auch die Bedingungen (10.13), jX 1

j ajk j C

N X

jajk j  j j

kDj C1

kD1

N X

jajk j

./



j jjajj j;

j D 1; 2; : : : ; N;

kD1 k¤j

und in . / gilt nach Voraussetzung an die Matrix A für ein Index j die Ungleichheit. Damit ist die Matrix D C L C R in der Tat irreduzibel diagonaldominant, was den Beweis komplettiert.

10.6 Das Relaxationsverfahren und erste Konvergenzresultate Im Folgenden wird das Relaxationsverfahren vorgestellt. Hier ist im .n C 1/-ten Iterationsschritt die Vorgehensweise so, dass – ausgehend von dem Vektor x .n/ – für x j.nC1/ gemäß der Vordie Indizes j D 1; : : : ; N jeweils zunächst hilfsweise die Zahl b schrift des Einzelschrittverfahrens ermittelt wird aus den bereits berechneten Wer.nC1/ .nC1/ .n/ .n/ .nC1/ ten x1 ; : : : ; xj 1 ; xj C1 ; : : : ; xN , und anschließend berechnet sich xj als .nC1/

xj eine durch einen Parameter ! 2 R festgelegte Linearkombination von b .n/ xj .

und

Im Einzelnen sieht die Iterationsvorschrift folgendermaßen aus,

1/ b x .nC j

xj.nC1/

D D

1 

ajj

bj 

1/ !b x .nC j

jX 1 kD1

ajk xk.nC1/

C .1 

!/xj.n/



N X kDj C1

 ajk xk.n/

9 > > = > > ;

;

j D 1; 2; : : : ; N . n D 0; 1; : : : /:

Die zugehörige Fixpunktiteration ist in der folgenden Definition angegeben. Definition 10.27. Für eine Matrix A D .ajk / 2 R N N mit nichtverschwindenden Diagonaleinträgen, ajj ¤ 0 für j D 1; 2; : : : ; N , ist das Relaxationsverfahren zur

282

Kapitel 10 Gesamtschritt-, Einzelschritt- und Relaxationsverfahren

Lösung der Gleichung Ax D b von der folgenden Form, .nC1/

ajj xj

jX 1  .nC1/ D ! bj  ajk xk  kD1

N X kDj C1

.n/ 

ajk xk

für j D 1; 2; : : : ; N

.n/

C .1  !/ajj xj ; . n D 0; 1; : : : /;

beziehungsweise in Matrix-Vektor-Schreibweise

.D C !L/x .nC1/ D !b C ..1  !/D  !R /x .n/

. n D 0; 1; : : : /:

Die zugehörige Iterationsmatrix hat die Gestalt

H .!/ D .D C !L/1 ..1  !/D  !R /:

(10.19)

Für ! D 1 stimmt das Relaxationsverfahren mit dem Einzelschrittverfahren überein, H .1/ D HEin . Für ! < 1 spricht man von Unter-, im Falle ! > 1 von Überrelaxation. In dem vorliegenden Abschnitt werden für zwei Klassen von Matrizen allgemeine Konvergenzresultate zum Relaxationsverfahren hergeleitet. Eine optimale Wahl des Relaxationsparameters ! wird dabei nicht weiter diskutiert. Die erzielten Resultate sind aber bereits für den Fall ! D 1 ( Einzelschrittverfahren ) von Interesse. Bemerkung 10.28. Eine besondere Bedeutung erlangt das Relaxationsverfahren für die spezielle Klasse der konsistent geordneten Matrizen A, die im nächsten Abschnitt 10.7 behandelt werden. Für solche Matrizen A lässt sich der Spektralradius der Iterationsmatrix H .!/ als Funktion des Relaxationsparameters ! genau ermitteln beziehungsweise die Wahl von ! optimieren. M Für allgemeine Matrizen A 2 R N N mit nichtverschwindenden Diagonalelementen gilt das folgende Resultat, mit dem sich die Wahl vernünftiger Relaxationsparameter schnell einschränken lässt. Theorem 10.29 (Kahan). Für die Iterationsmatrix des Relaxationsverfahrens gilt

r .H .!//  j!  1 j;

! 2 R:

Beweis. Mit der Bezeichnung 1 ; : : : ; N 2 C für die entsprechend ihrer Vielfachheit gezählten Eigenwerte von H .!/ gilt aufgrund der Darstellung (10.19) Folgendes, N Y

j D det H .!/ D det .I  !D 1 L/1 det . .1  !/I  !D 1 R / D .1  !/N ; „ ƒ‚ … j D1 D 1 so dass notwendigerweise j j j  j 1  ! j für mindestens einen Index 1  j  N gilt.

Abschnitt 10.6

283

Das Relaxationsverfahren und erste Konvergenzresultate

Korollar 10.30. Das Relaxationsverfahren ist höchstens für 0 < ! < 2 konvergent. Beweis. Für ! 62 .0 ; 2/ gilt nach Theorem 10.29 die Ungleichung r .H .!//  1, so dass nach Theorem 10.3 keine Konvergenz vorliegen kann. Ein erstes hinreichendes Kriterium für die Konvergenz des Relaxationsverfahrens liefert das folgende Theorem. Theorem 10.31 (Ostrowski, Reich). Für eine symmetrische, positiv definite Matrix A 2 R N N ist das zugehörige Relaxationsverfahren für jeden Wert 0 < ! < 2 durchführbar und konvergent,

r .H .!// < 1

für 0 < ! < 2:

Beweis. Aufgrund der Definitheit der Matrix A gilt ajj D e> j Aej > 0 für alle j , was insbesondere die Durchführbarkeit des Relaxationsverfahrens nach sich zieht. Für den Nachweis der Konvergenz berechnet man zunächst

H .!/ D I  !.D C !L/1 A D I  D I  2. 2A1 . !1 D C L //

1

. !1 D

C L/

1

A

D I  2.Q C I /1 D . Q  I /.Q C I /1 ;

1 mit Q WD 2A1 . ! D C L /  I:

Im Folgenden wird

.Q/  ¹ 2 C W Re > 0 º

(10.20)

nachgewiesen. Wegen

.H .!// D

® 1 ¯ W 2 .Q/ C1

und 2 2 ˇ  1 ˇ2 ˇ ˇ D . Re  1 / C . Im / C1 . Re C 1 /2 C . Im /2


0

erhält man dann die Aussage des Theorems. Für den Nachweis von (10.20) betrachtet man 2 C und 0 ¤ x 2 CN mit Qx D x und erhält zunächst

Ax D 2. !1 D C L /x  Ax: Skalare Multiplikation mit dem Vektor x liefert

> 0 ‚…„ƒ . Re / x HAx D 2Re x H . !1 D C L /x  x H Ax D x

H

.!D 2

C L C L /x  x .D C L C R /x D „ƒ‚… H

DR

und daraus folgt Re > 0.

H

> 0; da ajj >0 8 j



…„

. !  1/ x 2

ƒ

H

Dx ;

284

Kapitel 10 Gesamtschritt-, Einzelschritt- und Relaxationsverfahren

10.6.1 M-Matrizen Im Folgenden wird eine weitere Klasse von Matrizen vorgestellt, bei denen das Relaxationsverfahren einsetzbar ist. Definition 10.32. Eine Matrix A D .ajk / 2 R N N heißt M-Matrix, falls Folgendes gilt: (a) Die Matrix A ist regulär und besitzt eine Inverse mit ausschließlich nichtnegativen Einträgen, A1  0. (b) Alle Einträge der Matrix A außer denen auf der Diagonalen sind nichtpositiv, ajk  0 für alle Indizes j; k mit j ¤ k . M-Matrizen lassen sich folgendermaßen charakterisieren: Theorem 10.33. Für eine Matrix A D .ajk / 2 R N N gilt die folgende Äquivalenz,

A ist M-Matrix

8 ˆ für j D 1; : : : ; N; ˆ < ajj > 0 ajk  0 für alle j; k mit j ¤ k; ˆ ˆ : r .D 1 .L C R// < 1;



9 > > = > > ;

(10.21)

mit der Zerlegung A D D C L C R in Diagonal-, unteren und oberen Anteil entsprechend (10.15). Die Inverse jeder M-Matrix A besitzt die nichtnegative neumannsche Reihenentwicklung

A1 D

1 X



.  D 1 .L C R / /

D0 „

ƒ‚

0

D 1 „ƒ‚… …



0:

(10.22)

0

Beweis. “( ” Mit der Identität I  D 1 A D D 1 .L C R/ und den Voraussetzungen

D regulär;

D 1  0;

.L C R/  0;

r .D 1 .L C R// < 1;

erhält man unter Anwendung von Theorem 9.13 die Regularität der Matrix A sowie die nichtnegative neumannsche Reihenentwicklung (10.22) für die Inverse A1 , womit die Richtung “( ” nachgewiesen ist. Für den Nachweis der anderen Implikation “ )” sei nun A eine M-Matrix. Wenn akk  0 für ein k 2 ¹ 1; : : : ; N º gilt, so erhält man für den Vektor a .k/ D .ajk /j 2 R N die Ungleichung a.k/  0 und daraus den Widerspruch k -ter Einheitsvektor ek D A1 a.k/  0. Für den Nachweis der Ungleichung r .B/ < 1 mit B WD D 1 .L C R/ stellt man Folgendes fest,

B  0;

I  B D D 1 A regulär;

.I  B/1 D A1 D  0;

und Theorem 9.17 liefert die behauptete Ungleichung r .B/ < 1. Beispiel 10.34. Die Matrix zu dem in Abschnitt 10.2.1 vorgestellten Modellbeispiel ist eine M-Matrix, denn als irreduzibel diagonaldominante Matrix gilt für sie nach Theorem 10.19 die Ungleichung r .D 1 .L C R// < 1. M

Abschnitt 10.7

285

Relaxationsverfahren für konsistent geordnete Matrizen

Theorem 10.35. Für eine M-Matrix A 2 R N N ist das Relaxationsverfahren durchführbar und für jeden Parameter 0 < !  1 konvergent,

r .H .!// < 1

für 0 < !  1:

Beweis. Die Durchführbarkeit ist aufgrund des Nichtverschwindens der Diagonaleinträge der Matrix A ( siehe Theorem 10.33 ) gewährleistet. Im Folgenden wird

H .!/  0;

. I  H .!/ /1  0;

I  H .!/ regulär;

(10.23)

nachgewiesen. Die Aussage des Theorems erhält man dann unmittelbar mit Theorem 9.17. Nach Voraussetzung gilt ( mit der Zerlegung D C L C R D A aus (10.15) )

D regulär;

D 1  0 ;

D  0;

R  0;

L  0:

Damit ist insbesondere die Matrix D C !L regulär, und die Eigenschaft H .!/  0 resultiert dann aus .D C !L/1  0, was man wie folgt einsieht,

!D 1 L  0; ./

Ý

. !D 1 L/ D ¹ 0 º;

 .!D 1 L/ /

.I

1

D . I C !D 1 L/1  0;

wobei man die Schlussfolgerung . / mit Theorem 9.17 erhält. Die beiden anderen Aussagen in (10.23) ergeben sich folgendermaßen, regulär

I  H .!/ D .D C !L/1 . D C !L  .1  !/D C !R / .I  H .!//1 D D

1

!A 1

!I

1

.D C !L/ D

C

1

!A

1

1

.  .1  !/L

„ƒ‚… „ 0

1

!A

ƒ‚

0

‚ …„ ƒ D !.D C !L/1 A;

. A  .1  !/L  R /  R/ …



0:

Dies komplettiert den Beweis von Theorem 10.35. Bemerkung 10.36. Beim Relaxationsverfahren für M-Matrizen gelten spezieller die Abschätzungen r .H .!2 //  r .H .!1 // < 1 für 0 < !1  !2  1 ( Aufgabe 10.10 ), so dass innerhalb des Parameterintervalls 0 < !  1 die Wahl ! D 1 optimal ist. M

10.7 Das Relaxationsverfahren für konsistent geordnete Matrizen Es soll nun noch eine Klasse von Matrizen behandelt werden, bei denen sich der Spektralradius der zugehörigen Iterationsmatrix H .!/ als Funktion des Relaxationsparameters ! genau ermitteln beziehungsweise die Wahl von ! optimieren lässt.

286

Kapitel 10 Gesamtschritt-, Einzelschritt- und Relaxationsverfahren

Definition 10.37. Eine Matrix A D .ajk / 2 R N N mit ajj ¤ 0 für alle j heißt konsistent geordnet, falls die Eigenwerte der Matrix

J.˛/ WD ˛D 1 L C ˛ 1 D 1 R

2

CN N ;

0 ¤ ˛ 2 C;

(10.24)

unabhängig von ˛ sind, wenn also die Identität .J.˛// D .J.1// gilt für 0 ¤ ˛ 2 C. Hierbei bezeichnet A D D C L C R die Zerlegung in Diagonal-, unteren und oberen Anteil entsprechend (10.15).

Beispiel 10.38. Eine Block-Tridiagonalmatrix

0

1

B D1 C1 B B B1 p p p B A D B pp B p B @

pp

p

pp

p

CM 1

C C C C C 2 R N N C C A

BM 1 DM PM

mit regulären Diagonalmatrizen Dk 2 R Nk Nk ; k D 1; 2; : : : ; M ( mit kD1 Nk D N ) ist konsistent geordnet. ( Die Nebendiagonalmatrizen seien hierbei von entsprechender Dimension, es gilt also Bk 2 R NkC1 Nk und Ck 2 R Nk NkC1 für k D 1; 2; : : : ; M  1. ) M Beweis. Hier gilt

0

0

1 0

B B B 1 p B D 2 B1 p p 1 B D L D B pp B p B @

pp

p

1 B DM M 1 0

C C C C C; C C C A

B B B B 1 D R D B B B B @

1

0 D11 C1

pp

p

pp pp

p 1 C p DM 1 M 1

0

und somit

0

1 ˛ 1 D 1 C

0 B B B B 1 B ˛D2 B1 B J.˛/ D B B B B B @

1

1

pp

p

pp

p

pp

p

pp

p

C C C C C C C 2 R N N : C C 1 C ˛ 1 DM 1 M 1 C C A

1 ˛DM BM 1

0

C C C C C; C C C A

Abschnitt 10.7

Relaxationsverfahren für konsistent geordnete Matrizen

287

Mit einer geeigneten Transformationsmatrix S˛ von Diagonalgestalt erhält man schließlich die Ähnlichkeit der Matrizen J.1/ und J.˛/:

0

1 0 I ˛ N 1 B C B C 1 B C ˛ I N2 B C S˛ WD B C pp B C p B C @ A ˛ M 1 INM

1

0

B 0 ˛ 0 D11 C1 B B B B B pp pp p p B ˛D21 B1 B Ý S˛ J.1/ D B B B pp pp 1 B p p ˛ M 2 DM 1 CM 1 B B B @ 1 B ˛ M 1 DM 0 M 1

C C C C C C C C C C C C C C C A

beziehungsweise S˛ J.1/S˛1 D J.˛/. Beispiel 10.39. Die Matrix aus dem Modellbeispiel in Abschnitt 10.2.1 ist konsistent geordnet ( Aufgabe 10.14 ). M Das folgende Theorem 10.41 stellt eine Beziehung her zwischen den Eigenwerten von HGes D D 1 .L C R/ und denen von H .!/. Zuvor wird die folgende Eigenschaft konsistent geordneter Matrizen festgehalten: Lemma 10.40. Bei konsistent geordneten Matrizen A 2 R N N liegt die Menge der Eigenwerte .HGes /  C der zum Gesamtschrittverfahren gehörenden Iterationsmatrix HGes symmetrisch zum Ursprung, es gilt also .HGes / D .HGes /. Beweis. Mit der Notation (10.24) gilt J.1/ D HGes und J.1/ D HGes , woraus die Aussage unmittelbar folgt. Theorem 10.41. Die Matrix A 2 R N N sei konsistent geordnet, und sei 0 ¤ ! 2 R. p Weiter sei 0 ¤ 2 C eine beliebige Zahl und 2 C eine der beiden Wurzeln von . Dann gilt die folgende Äquivalenz:

2 .H .!//



C!1 p 2 . HGes /: !

(10.25)

288

Kapitel 10 Gesamtschritt-, Einzelschritt- und Relaxationsverfahren

Beweis. Sei 0 ¤ 2 C und

p 2 C eine der beiden Wurzeln von . Es gilt dann

I  H .!/ D .D C !L/1 . .D C !L/  .1  !/D C !R / D .D C !L/1 . . C !  1/D C !. L C R/ /   D .I C !D 1 L/1 . C !  1/I C ! 1=2 . 1=2 D 1 L C 1=2 D 1 R /  C! 1 1=2 1 1=2 1 I C . D L C D R / D ! 1=2 .I C !D 1 L/1 ! 1=2 „ ƒ‚ … regulär

beziehungsweise

2 .H .!// ” C!1 2 .  1=2 D 1 L  1=2 D 1 R / D .  D 1 L  D 1 R /; ƒ‚ … ƒ‚ … „ „ ! 1=2 1=2 D J.  1 / D H Ges D J. / was mit der im Theorem angegebenen Äquivalenz übereinstimmt. Korollar 10.42 (Der Fall ! D 1). Für jede konsistent geordnete Matrix A 2 R N N gilt

r .HEin / D r .HGes /2 :

Für eine konsistent geordnete Matrix A 2 R N N sind demnach Gesamt- und Einzelschrittverfahren entweder beide konvergent oder divergent, und im Fall der Konvergenz ist das Einzelschrittverfahren doppelt so schnell wie das Gesamtschrittverfahren. Mit dem folgenden Theorem wird das Verhalten von r .H .!// in Abhängigkeit von ! beschrieben. Eine entsprechende Veranschaulichung liefert Bild 10.2 auf Seite 290. Theorem 10.43. Die Matrix A 2 R N N sei konsistent geordnet, und die Eigenwerte der Matrix HGes D D 1 .L C R/ seien allesamt reell und betragsmäßig kleiner als eins, es sei also .D 1 .L C R//  .1 ; 1/ erfüllt. Dann gilt

´ r .H .!// D

1 4



q !%Ges C

2 ! 2 %2Ges  4.!  1/ ;

0 < !  ! ;

!  1;

!  !  2;

mit %Ges WD r .D 1 .L C R// und ! WD

q 1C

2

1  %2Ges

Beweis. Sei 0 < !  2 mit ! ¤ 1 fest gewählt.6 6

Die Situation ! D 1 ist bereits mit Korollar 10.42 abgeklärt.

:

Abschnitt 10.7

289

Relaxationsverfahren für konsistent geordnete Matrizen

(a) In einem ersten Schritt werden ( vergleiche Theorem 10.41 ) für jede Zahl  2 R die Lösungen 2 C der Gleichung

p  ! C !  1 D 0;

(10.26)

bestimmt. In der Tat besitzt die Gleichung (10.26) zwei Lösungen 1=2 D 1=2 ./ 2 C, für die entsprechend der Annahme ! ¤ 1 notwendigerweise 1=2 ¤ 0 gilt. Explizite Darstellungen sind

1=2 WD p

1=2 WD

1 ! 4

9 > =

p 2 ! 2 2  4.!  1/ ;  ........ ;

˙

1 2

(10.27)

> ;

und daraus erhält man

8 < j 1=2 j D

:

1 ! 4

˙

p

2 ! 2 2  4.!  1/ ; !  1;

2 

4.!  1/

!2

2


das dazugehörige lineare Gleichungssystem näherungsweise mit dem Gesamtschrittverfahren gelöst werden. Als Startvektor verwende man jeweils x .0/ D .1; 1; 1/>. Man gebe jeweils eine allgemeine Darstellung der n-ten Iterierten x .n/ 2 R 3 an und diskutiere die Ergebnisse im Hinblick auf Konvergenz. Aufgabe 10.3. Gegeben seien die Matrizen

0

0

B B0 A D B B1 @ 1

1

1

0

1

0

1

0C

0

0

C C; C 1A

0

1

0

0

0

1

B B1 0 B B D B B0 0 B @0 0 2

2

1

0

0

1

0

0

1C

0

1

2

0

C C 0C C: C 0A

0

0

1

Man zeige, dass A irreduzibel beziehungsweise B reduzibel ist. Aufgabe 10.4. Zu gegebener Matrix A D . ajk / 2 R N N und beliebigen Indizes j; k 2 ¹ 1; : : : ; N º mit j ¤ k heißt eine Familie von Indizes j0 ; j1 ; : : : ; jM 2 ¹ 1; 2; : : : ; N º mit j0 D j; jM D k eine j und k verbindende Kette, falls ajr1 ;jr ¤ 0 gilt für r D 1; 2; : : : ; M.

292

Kapitel 10 Gesamtschritt-, Einzelschritt- und Relaxationsverfahren

Man zeige Folgendes: Eine Matrix A 2 RN N ist irreduzibel genau dann, wenn für alle Indizes j; k 2 ¹ 1; : : : ; N º mit j ¤ k eine j und k verbindende Kette existiert. Aufgabe 10.5. Man zeige, dass die zu dem vorgestellten Modellbeispiel aus Abschnitt 10.2.1 gehörende Matrix irreduzibel diagonaldominant ist. Aufgabe 10.6. Sei A D . ajk / 2 R N N eine irreduzibel diagonaldominante Matrix mit ajj > 0 für j D 1; 2; : : : ; N . Man zeige: (a) Für alle Eigenwerte 2 C von A gilt Re > 0: (b) Ist die Matrix A symmetrisch, so ist sie auch positiv definit. Aufgabe 10.7. Für zwei Matrizen A; b A 2 RN N betrachte man Zerlegungen A D D C L C R b Cb beziehungsweise b ADD LCb R jeweils in Diagonal- sowie unteren und oberen Anteil. Man b sowie L C R  b LCb R0 zeige: wenn A eine M-Matrix ist und die Ungleichungen 0  D  D A eine M-Matrix und es gilt 0  b A1  A1 . erfüllt sind, so ist auch b Aufgabe 10.8. Für eine Matrix A D . ajk / 2 R N N beweise man die Äquivalenz der folgenden vier Aussagen: (i) A ist M-Matrix; (ii) A C sI ist M-Matrix für alle s  0;

(iii) es gibt eine Matrix B 2 R N N mit B  0 und eine Zahl s > r .B/, so dass die Identität A D sI  B gilt; (iv) die Nichtdiagonaleinträge ajk ; j ¤ k; der Matrix A sind nichtpositiv, und alle Eigenwerte von A besitzen einen positiven Realteil, .A/  ¹ 2 C W Re > 0 º: Aufgabe 10.9. Gegeben sei das lineare Randwertproblem

u00 .x/ C

1 u0 .x/ 1Cx

D '.x/;

u.0/ D 0;

0 < x < 1;

u.1/ D 0:

(10.33)

Diskretisierung von (10.33) mit zentralen Differenzenquotienten zweiter beziehungsweise erster Ordnung bei konstanter Gitterweite h D 1=N führt auf ein lineares Gleichungssystem Av D b . Man zeige Folgendes: (a) Für h < 2 ist A 2 R.N 1/.N 1/ eine M-Matrix. (b) Für die Hilfsfunktion

. x / D 

.1 C x/2 2

ln .1 C x/ C

2 x. x 3

C 2 /ln2

und mit den Notationen vj D .xj /; xj D j h für j D 1; 2; : : : ; N  1 und e D . 1; : : : ; 1 /> 2 R N 1 gilt die Abschätzung

jj Av  e jj1 

1 2 h 4

( und damit .Av/j  1  h2 =4 für j D 1; 2; : : : ; N  1 ).

(c) Für eine von h unabhängige Konstante M gilt jj A1 jj1  M . (d) Für die Lösung u von (10.33) und die Lösung v des Gleichungssystems Av D b gilt 1 mit der Notation z D . u.xj / /N j D1 und einer von h unabhängigen Konstanten K die Abschätzung jj v  z jj1  Kh2 :

Aufgabe 10.10. Für eine gegebene M-Matrix A 2 RN N weise man die folgenden Abschätzungen nach:

r .H .!2 //  r .H .!1 // < 1

für 0 < !1  !2  1:

293

Übungsaufgaben Aufgabe 10.11. Im Folgenden wird das Randwertproblem

u00 . x / C p . x /u0 . x / C r . x /u. x / D ' . x /;

x 2 Πa; b ;

u. a / D u. b / D 0;

betrachtet mit Funktionen p; r; ' 2 C Œ a; b  mit r.x/  0 für x 2 Œ a; b . Eine Diskretisierung der Ableitungen mittels zentraler Differenzenquotienten bei konstanter Schrittweite h D .b  a/=N führt mit den Notationen xj D a C j h; pj D p.xj / und rj D r.xj /; 'j D '.xj / für j D 1; 2; : : : ; N  1 sowie

0

1 2

. 1  h2 p1 /

B B B B . 1 C h p2 / 2 . 1  h2 p2 / 2 B B 1 B pp pp A D B p p . 1 C h2 p3 / h2 B B B pp B p 2 . 1  h2 pN 2 / B @ . 1 C h2 pN 1 / 2

C C C C C C C C C C C C C A

1 und D D diag . r1 ; r2 ; : : : ; rN 1 /; c D . 'j /N j D1 , auf das Gleichungssystem . A C D /v D c:

(a) Man zeige, dass A C D eine M-Matrix ist, falls Folgendes erfüllt ist,

h max jp.x/j  2; x 2 Πa;b 

inf ¹ Re W 2 .A/ º C

inf

x 2 Πa;b 

r.x/ > 0:

(b) Im Fall p.x/  0 und h  .b  a/=2 ist A C D eine M-Matrix, wenn Folgendes erfüllt ist, inf

x 2 Πa;b 

  2 h2   4 r.x/ >  C 12 : ba ba

Aufgabe 10.12. Ist die Matrix

0

A D

2 1 p p 1 B 1 p p p p

h2

@

1

C 2 R .N 1/.N 1/ pp pp p p 1 A 1 2

mit h D 1=N positiv definit beziehungsweise eine M-Matrix beziehungsweise konsistent geordnet? Man bestimme als Funktion von h die Eigenwerte von I D 1 A und den zugehörigen Spektralradius r .I  D 1 A/, den optimalen Parameter ! für das Relaxationsverfahren sowie den Spektralradius r .H .! // der entsprechenden Iterationsmatrix H .! /. Aufgabe 10.13. Man zeige, dass reguläre Dreiecksmatrizen konsistent geordnet sind. Aufgabe 10.14. Gegeben sei eine Block-Tridiagonalmatrix von der speziellen Form

1

0 B B b1 D B p B B a1 D p p A D B B pp B 0 p B @

C C C p C C 2 R N N C pp p bM 1 D C C A B aM 1 D pp

294

Kapitel 10 Gesamtschritt-, Einzelschritt- und Relaxationsverfahren

mit der Diagonalmatrix D D diag . b11 ; : : : ; bKK / wobei 0 ¤ bjj die Diagonaleinträge von B 2 R KK bezeichne. Mit der Zerlegung B D D C L C R entsprechend (10.15) und mit

J.˛/ D ˛D 1 L C ˛1 D 1 R;

0¤˛2C

gelte J.˛/ D S˛ J.1/S˛1 für 0 ¤ ˛ 2 C mit einer geeigneten Transformationsmatrix S˛ 2 R N N . Man zeige, dass die Matrix A konsistent geordnet ist. Aufgabe 10.15. Es sei

0 A B 11 B p p ADB B p @ AM 1

p p p A1M pp ppp p p p p AMM

1 C C C C A

eine quadratische Matrix mit quadratischen Diagonalblöcken Ajj ; j D 1; 2; : : : ; M , und die Block-Diagonalmatrix D D diag . A11 ; : : : ; ANN / sei nichtsingulär. Weiter bezeichne

0

1

B A B 21 L D B pp pp @ p p p p AM 1 p AM;M 1 und

C C C; A

0

A12 p p p A1M p pp B p pp B R D B @ AM 1;M

H .!/ D .D C !L/1 . .1  !/D  !R /

1 C C C; A

.! ¤ 0/:

In den folgenden Teilaufgaben (a) und (b) seien für eine Zahl p > 1 die Eigenwerte von

J.˛/ D ˛D 1 L C ˛.p1/ D 1 R;

0 ¤ ˛ 2 C;

(10.34)

unabhängig von ˛ , es gelte also .J.˛// D .J.1// für ˛ ¤ 0: Man weise Folgendes nach: (a) Ist  2 . D 1 . L C R / / erfüllt und die Zahl 2 C eine Lösung der Gleichung

. C !  1 /p D p1 ! p p ;

(10.35)

so gilt 2 .H .!//. Ist umgekehrt 0 ¤ 2 .H .!// und erfüllt  die Gleichung (10.35), dann ist  2 . D 1 . L C R / /. (b) Für  ¤ 0 gilt

 2 . D 1 . L C R / /



p 2 .H .1//;

und r .D 1 .L C R//p D r .H .1//. (c) Sei nun A von der speziellen Gestalt

0

A11 0    0 A 1M B pp pp B 0 B A21 p p B pp B p p p pp A D B 0 pp pp p B B pp p p pp B p pp pp p 0 @ 0    0 AM;M 1 AMM

1 C C C C C C: C C C A

Man zeige, dass mit p D M  2 die Eigenwerte der Matrix J.˛/ aus (10.34) unabhängig von ˛ sind.

295

Übungsaufgaben Aufgabe 10.16 ( Numerische Aufgabe ). Zur numerischen Lösung des Randwertproblems

u00 .x/ C u.x/ D e x ;

x 2 Π0; =2 ;

u.0/ D u.=2/ D 0;

betrachte man auf einem äquidistanten Gitter der Weite h D schema

vj C1  .2  h2 /vj C vj 1 D h2 e zj ;



2N

das zugehörige Differenzen-

j D 1; 2; : : : ; N  1;

(10.36)

mit zj D j h. Für N D 30 beziehungsweise N D 200 bestimme man eine approximative Lösung von (10.36) mithilfe des Relaxationsverfahrens mit den folgenden Relaxationsparametern, ! D 0:1; 0:2; 0:3; : : : ; 2:0; 2:1, wobei die Iteration jeweils abgebrochen werden soll, wenn mehr als 1000 Iterationen ( für N D 200 mehr als 2000 Iterationen ) benötigt werden oder falls jj x .n/  x .n1/ jj1  105 ausfällt. Als Startwert wähle man jeweils x .0/ D 0. Für jede Wahl von ! gebe man die Anzahl .n/ der benötigten Iterationsschritte n, jj x .n/  x .n1/ jj1 und den Fehler maxj D1;:::;N 1 jxj  u. zj /j tabellarisch an.

11

Verfahren der konjugierten Gradienten und GMRES-Verfahren

11.1 Vorbetrachtungen Ziel der nachfolgenden Betrachtungen ist erneut die approximative Lösung eines regulären linearen Gleichungssystems

Ax D b

.A 2 R N N regulär;

b 2 RN /

( mit der eindeutigen Lösung x D A1 b 2 R N ), und hierzu seien

¹ 0 º  D 1  D2  : : :  R N

(11.1)

zunächst nicht weiter spezifizierte ( endlich oder unendlich viele ) lineare Unterräume. Im Folgenden werden zwei Ansätze zur Bestimmung von ( unterschiedlichen ) Vektorfolgen xn 2 Dn ; n D 1; 2; : : : ; vorgestellt.1 Definition 11.1. (a) Für gegebene Ansatzräume (11.1) hat der Ansatz des orthogonalen Residuums zur Bestimmung von Vektoren x1 ; x2 ; : : : 2 R N die folgende Form,

x n 2 Dn ; Axn  b 2 Dn?

³ n D 1; 2; : : : :

(11.2)

(b) Der Ansatz des minimalen Residuums zur Bestimmung von Vektoren x1 ; x2 ; : : : 2 R N hat für gegebene Ansatzräume (11.1) die folgende Form,

x n 2 Dn ; jjAxn  b jj2 D min jjAx  b jj2

μ n D 1; 2; : : : :

(11.3)

x2Dn

Hierbei bezeichnet wie üblich

M ? WD

®

¯ y 2 R N W y >x D 0 für jedes x 2 M ;

M  R N beliebig;

das orthogonale Komplement einer Menge M , und jj  jj2 bezeichnet wieder die euklidische Vektornorm. Schließlich bezeichnet im Folgenden zu jedem x 2 R N der Vektor Ax  b das zugehörige Residuum2 , was die Bezeichnungen für die beiden in Definition 11.1 vorgestellten Ansätze erklärt. 1

Im Unterschied zum vorigen Kapitel 10 wird nun wieder die etwas knappere Tiefstellung für den Laufindex n gewählt. Dies ist hier ohne weiteres möglich, da die einzelnen Einträge in den vektorwertigen Iterierten im Folgenden keine spezielle Rolle spielen. 2 In der Literatur findet man die Bezeichnung “Residuum” oft auch für den Vektor b  Ax anstelle Ax  b .

Abschnitt 11.2

297

Der Ansatz des orthogonalen Residuums

Bemerkung 11.2. Natürliche Fragestellungen im Zusammenhang mit den beiden vorgestellten Ansätzen sind jeweils Existenz und Eindeutigkeit der Vektoren xn . Zudem gilt es, Algorithmen zur Bestimmung dieser Vektoren anzugeben sowie Abschätzungen für den Fehler jjxn  x jj herzuleiten bezüglich gängiger Normen. Schließlich sind spezielle Ansatzräume für D1 ; D2 ; : : : auszuwählen. M Bei der Wahl spezieller Ansatzräume in (11.1) werden die im Folgenden definierten Krylovräume eine hervorgehobene Rolle spielen: Definition 11.3. Zu gegebener Matrix A 2 R N N und einem Vektor b 2 R N ist die Folge der Krylovräume wie folgt erklärt,

K n .A; b/ D span ¹ b; Ab; : : : ; An1 b º  R N ;

n D 0; 1; : : : :

Offensichtlich sind die Krylovräume aufsteigend, es gilt ¹ 0 º D K 0 .A; b/  K 1 .A; b/  : : : . Weitere Eigenschaften von eher technischer Natur werden zu einem späteren Zeitpunkt vorgestellt3 .

11.1.1 Ausblick In dem vorliegenden Kapitel werden nun die beiden in Definition 11.1 angegebenen Ansätze mit den speziellen Räumen Dn D K n .A; b/ behandelt.4 (a) Der Ansatz des orthogonalen Residuums mit den Räumen Dn D K n .A; b/ wird für symmetrische, positiv definite Matrizen A 2 R N N betrachtet. Dies führt auf das klassische Verfahren der konjugierten Gradienten. Einzelheiten hierzu werden in den Abschnitten 11.2–11.4 vorgestellt. Für allgemeine ( also indefinite oder nichtsymmetrische ) reguläre Matrizen A 2 R N N kann man zu den Normalgleichungen A>Ax D A>b übergehen und hierfür das angesprochene Verfahren der konjugierten Gradienten betrachten. Einige Details zu diesem Ansatz finden sich in Abschnitt 11.5. (b) Schließlich wird für die Räume Dn D K n .A; b/ der Ansatz des minimalen Residuums betrachtet. Dies führt auf das ( in Abschnitt 11.6 behandelte ) GMRES-Verfahren, welches universell einsetzbar ist, weitere Voraussetzungen an die Matrix A wie etwa Symmetrie entfallen hier.

11.2 Der Ansatz des orthogonalen Residuums für positiv definite Matrizen In dem vorliegenden Abschnitt 11.2 wird der Ansatz des orthogonalen Residuums für allgemeine Ansatzräume der Form (11.1) betrachtet unter der zusätzlichen Annahme, dass A 2 R N N eine symmetrische, positiv definite Matrix ist. 3 4

siehe Lemma 11.31 auf Seite 319 Diese Verfahren werden allgemein als Krylovraummethoden bezeichnet.

298

Kapitel 11

CG- und GMRES-Verfahren

11.2.1 Existenz, Eindeutigkeit und Minimaleigenschaft Im Folgenden wird für eine gegebene symmetrische, positiv definite Matrix A 2 R N N die Existenz und Eindeutigkeit der zum Ansatz des orthogonalen Residuums (11.2) gehörenden Vektoren xn diskutiert. Hierzu werden die folgenden Notationen eingeführt:

h x; y i 2 D x>y; h x ; y iA D x>Ay;

x; y 2 R N ; ;

......

jjx jjA D .x>Ax/1=2 ;

x 2 RN :

Bemerkung 11.4. (1) Die neue Notation h ;  i 2 für das klassische skalare Produkt wird wegen der gelegentlich einfacheren Lesbarkeit eingeführt. (2) Wie man leicht nachrechnet, bildet im Falle einer symmetrischen, positiv definiten Matrix A 2 R N N die Abbildung h  ;  iA ein Skalarprodukt auf R N , und jj  jjA stellt offensichtlich die zugehörige Norm dar; diese bezeichnet man als A-Norm. (3) Aufgrund der Natur des Ansatzes des orthogonalen Residuums erhält man Fehlerabschätzungen zunächst nur bezüglich der A-Norm. Fehlerabschätzungen bezüglich der natürlicheren euklidischen Norm jj  jj2 werden dann noch über die Äquivalenz M von Normen hergeleitet. Das folgende Resultat liefert für den Ansatz des orthogonalen Residuums neben Existenz und Eindeutigkeit auch eine Minimaleigenschaft, mit der zu einem späteren Zeitpunkt5 noch konkrete Fehlerabschätzungen hergeleitet werden. Theorem 11.5. Zu gegebener symmetrischer, positiv definiter Matrix A 2 R N N sind für n D 1; 2; : : : die Vektoren xn aus dem Ansatz des orthogonalen Residuums (11.2) – mit allgemeinen Ansatzräumen Dn entsprechend (11.1) – eindeutig bestimmt, und es gilt

jjxn  x jjA D min jjx  x jjA ;

n D 1; 2; : : : :

x2Dn

(11.4)

Beweis. Bei fest gewähltem Index n betrachtet man für den Nachweis der Eindeutigkeit zwei Vektoren xn ; b x n mit der Eigenschaft (11.2). Hier gilt

h A.xn  b x n / ; xn  b xn i2 D 0 „ ƒ‚ … „ ƒ‚ … 2 Dn?

Ý

xn D b x n:

2 Dn

Für den Nachweis der Existenz setzt man mit einer beliebigen Basis d0 ; d1 ; : : : ; dm1 von Dn ( mit m WD dim Dn ) wie folgt an,

xn D

m X1 kD0

5

siehe Abschnitt 11.4

˛k dk

(11.5)

Abschnitt 11.2

299

Der Ansatz des orthogonalen Residuums

und erhält damit

xn genügt .11:2/



Axn  b 2 Dn?

” h Axn  b; dj i 2 D 0 ”

m X1

(11.6) für j D 0; 1; : : : ; m  1; ......

h Adk ; dj i 2 ˛k D h b; dj i 2

; (11.7)

kD0

was ein lineares System von m Gleichungen für die m Koeffizienten ˛0 ; : : : ; ˛m1 darstellt. Infolgedessen und aufgrund der Eindeutigkeit der Lösung – diese wurde im ersten Teil dieses Beweises bereits nachgewiesen – ist dieses Gleichungssystem also lösbar. Schließlich ist noch die Minimaleigenschaft (11.4) nachzuweisen. Hierzu berechnet man für einen beliebigen Vektor x 2 Dn Folgendes, 2 2 jjx  x jjA D jjxn  x C x  xn jjA 2

D jjxn  x jjA

D0

‚ …„ ƒ 2 C 2 h A.xn  x /; x  xn i 2 C jjx  xn jjA „ ƒ‚ … „ ƒ‚ …

2

 jjxn  x jjA :

2 Dn?

2 Dn

Dies komplettiert den Beweis des Theorems.

11.2.2 Der Ansatz des orthogonalen Residuums (11.2) für gegebene A konjugierte Basen Mit dem Beweis von Theorem 11.5 ist bereits eine Möglichkeit zur Durchführung des Ansatzes des orthogonalen Residuums vorgestellt worden; ausgehend von einer Basis d0 ; : : : ; dm1 für Dn hat man nur das durch den Ansatz (11.5) entstehende Gleichungssystem (11.7) zu lösen. Im Folgenden soll ein Spezialfall behandelt werden, bei dem dieses Gleichungssystem (11.7) von Diagonalgestalt ist. Definition 11.6. Es sei A 2 R N N eine symmetrische, positiv definite Matrix. Gegebene Vektoren d0 ; d1 ; : : : ; dn 1 2 R N n¹ 0 º mit n  N heißen A-konjugiert, falls Folgendes gilt,

h Adk ; dj i 2 D 0

für k ¤ j:

Bemerkung 11.7. A-Konjugiertheit ist also gleichbedeutend mit paarweiser OrthoM gonalität bezüglich des Skalarprodukts h  ;  iA . Unter Fortführung des Ansatzes (11.5)–(11.7) lässt sich im Falle symmetrischer positiv definiter Matrizen A 2 R N N der Ansatz des orthogonalen Residuums (11.2) besonders einfach verwirklichen, falls eine A-konjugierte Basis von Dn gegeben ist. Genauer gilt Folgendes:

300

Kapitel 11

CG- und GMRES-Verfahren

Theorem 11.8. Für eine gegebene symmetrische, positiv definite Matrix A 2 R N N und A-konjugierte Vektoren d0 ; d1 ; : : : ; dn 1 2 R N n¹ 0 º mit n  N gelte

Dn D span ¹ d0 ; d1 ; : : : ; dn1 º;

n D 0; 1; : : : ; n :

Dann erhält man für den Ansatz des orthogonalen Residuums (11.2) die folgenden Darstellungen für n D 1; 2; : : : ; n :

xn D

n X1

˛k dk ;

mit ˛k

D 

kD0

h rk ; dk i 2 ; h Adk ; dk i 2

rk WD Axk  b;

(11.8)

k  1;

r0 WD b: (11.9)

Beweis. Aus der Vorgehensweise des Ansatzes (11.5)–(11.7) ( mit m D n ) im Beweis von Theorem 11.5 erhält man im Fall der nun vorliegenden A-Konjugiertheit zunächst Folgendes,

xn D

n X1

˛k dk ;

mit ˛k

kD0

WD

h b; dk i 2 h Adk ; dk i 2

.n D 1; 2; : : : ; n /; (11.10)

und die Zahl ˛k in (11.10) stimmt mit der aus (11.8) überein, was für k D 0 klar ist und für k  1 so folgt: n X1

h b  Axn ; dn i 2 D h b; dn i 2  ˛k h Adk ; dn i 2 D h b; dn i 2 ; n D 0; 1; : : : ; n : „ ƒ‚ … „ ƒ‚ … kD0 D rn D 0 Dies komplettiert den Beweis. Bemerkung 11.9. (a) Der Darstellung (11.8) entnimmt man, dass die Zahl ˛k unabhängig von n ist und somit Folgendes gilt,

xnC1 D xn C ˛n dn ; rnC1 D rn C ˛n Adn . n D 0; : : : ; n  1I x0 WD 0 /; (11.11) womit sich die Durchführung des Verfahrens (11.8) weiter vereinfacht. Man beachte, dass die Berechnung des Matrix-Vektor-Produkts Adn für die Bestimmung von ˛n sowieso erforderlich ist, und mittels (11.11) erhält man dann das Residuum rnC1 auf einfache Weise, also ohne Berechnung eines weiteren Matrix-Vektor-Produkts. ( Die meisten Abbruchkriterien basieren auf den Werten des Residuums, weshalb dieses von Bedeutung ist. ) (b) Aufgrund der ersten Identität in (11.11) bezeichnet man den Vektor dn als Suchrichtung, und die Zahl ˛n wird als Schrittweite bezeichnet. Diese Bezeichnungsweise verwendet man im Übrigen auch bei anderen Verfahren der Form (11.11). (c) Ebenfalls mit der ersten Identität in (11.11) wird klar, das im Prinzip eine simultane Berechnung der Suchrichtungen und Approximationen in der Reihenfolge d0 ; x1 ; d1 ; x2 ; : : : möglich ist. In der Praxis wird im Fall Dn D K n .A; b/ auch so vorgegangen. Einzelheiten werden im nachfolgenden Abschnitt 11.3 behandelt.

Abschnitt 11.3

301

Das CG-Verfahren für positiv definite Matrizen

(d) Für vorgegebene Suchrichtungen in der Vorschrift (11.11) sind die Schrittweiten aus (11.8) optimal in dem folgenden Sinne,

jjxnC1  x jjA D min jjxn C tdn  x jjA : t 2R

M

Der Nachweis dafür ist elementar und wird hier nicht geführt.

11.3 Das CG-Verfahren für positiv definite Matrizen 11.3.1 Einleitende Bemerkungen Für den Ansatz des orthogonalen Residuums sollen im Folgenden nun speziell Krylovräume als Ansatzräume herangezogen werden. Definition 11.10. Zu gegebener symmetrischer, positiv definiter Matrix A 2 R N N ist das Verfahren der konjugierten Gradienten gegeben durch Ansatz (11.2) mit der speziellen Wahl

Dn D K n .A; b/;

n D 0; 1; : : : :

(11.12)

Dieses Verfahren bezeichnet man auch kurz als CG-Verfahren, wobei die Notation “CG” von der englischen Bezeichnung “method of conjugate gradients” herrührt. Der Grund für die Bezeichnungsweise “konjugierte Gradienten” wird später geliefert6 . Für die praktische Durchführung des CG-Verfahrens liefert Theorem 11.8 einen ersten Ansatz. Die noch ausstehende Konstruktion A-konjugierter Suchrichtungen in dem Raum K n .A; b/ ist das Thema des folgenden Abschnitts 11.3.2.

11.3.2 Die Berechnung A -konjugierter Suchrichtungen in K n .A; b/ Das folgende Lemma behandelt die Berechnung A-konjugierter Suchrichtungen in K n .A; b/ für n D 0; 1; : : : : Ausgehend von den Notationen aus Theorem 11.8 wird für jetzt fixierten Index n dabei so vorgegangen, dass – ausgehend von einer bereits konstruierten A-konjugierten Basis d0 ; : : : ; dn1 für K n .A; b/ – eine A-konjugierte Basis für K nC1 .A; b/ gewonnen wird durch eine Gram-Schmidt-Orthogonalisierung der Vektoren d0 ; : : : ; dn1 ; rn 2 R N bezüglich des Skalarprodukts h  ;  iA . Wie sich im Beweis von Lemma 11.11 herausstellt, genügt hierfür eine Gram-Schmidt-Orthogonalisierung der beiden Vektoren dn1 ; rn 2 R N . Lemma 11.11. Zu gegebener symmetrischer, positiv definiter Matrix A 2 R N N und mit den Notationen aus Theorem 11.8 seien die Suchrichtungen speziell wie folgt gewählt: d0 WD b sowie

dn WD rn C ˇn1 dn1 ; 6

siehe Bemerkung 11.15

ˇn1 WD

h Arn ; dn1 i2 ; h Adn1 ; dn1 i2

n D 1; 2; : : : ; n  1; (11.13)

302

Kapitel 11

CG- und GMRES-Verfahren

wobei n den ersten Index mit rn D 0 bezeichnet. Mit dieser Wahl sind die Vektoren d0 ; d1 ; : : : ; dn 1 2 R N A-konjugiert und es gilt span ¹ d0 ; : : : ; dn1 º D span ¹ b; r1 ; r2 ; : : : ; rn1 º D K n .A; b/;

μ (11.14)

n D 1 ; 2 ; : : : ; n :

Beweis. Mittels vollständiger Induktion über n D 1; 2; : : : ; n werden sowohl die AKonjugiertheit der Vektoren d0 ; d1 ; : : : ; dn1 2 R N als auch die beiden Identitäten in (11.14) nachgewiesen. Wegen span ¹ d0 º D span ¹ b º D K 1 .A; b/ ist der Induktionsanfang klar, und im Folgenden sei angenommen, dass die Vorschrift (11.13) ein System d0 D b; d1 ; d2 ; : : : ; dn1 von A-konjugierten Vektoren mit der Eigenschaft (11.14) liefert mit einem fixierten Index 1  n  n  1. Gemäß (11.2) gilt rn 2 K n .A; b/? , und im Fall rn ¤ 0 sind demnach die Vektoren d0 ; : : : ; dn1 ; rn linear unabhängig. Eine Gram-Schmidt-Orthogonalisierung dieser Vektoren bezüglich des Skalarprodukts h  ;  iA liefert den Vektor

dn WD rn C

n X1 kD0

h Arn ; dk i2 d h Adk ; dk i2 k

./

D

rn C ˇn1 dn1 ;

(11.15)

wobei man die Identität . / aus den Eigenschaften A. K n1 .A; b/ /  K n .A; b/ sowie rn 2 K n .A; b/? erschließt:

h Arn ; dk i 2 D h rn ; Adk i 2 D 0;

k D 0; 1; : : : ; n  2:

Nach Konstruktion sind die Vektoren d0 ; : : : ; dn1 ; dn A-konjugiert und es gilt span ¹ d0 ; : : : ; dn1 ; dn º D span ¹ b; r1 ; r2 ; : : : ; rn º. Aufgrund der zweiten Identität in (11.11) gilt zudem span ¹ b; r1 ; r2 ; : : : ; rn º  K nC1 .A; b/, so dass aus Dimensionsgründen auch hier notwendigerweise Gleichheit vorliegt. Dies komplettiert den Beweis des Lemmas. Bemerkung 11.12. Mit dem durch Lemma 11.11 beschriebenen Abbruch wird gleichzeitig die Lösung des Gleichungssystems Ax D b geliefert, es gilt also xn D x . Dabei gilt notwendigerweise

n  N; denn aufgrund der linearen Unabhängigkeit der beiden Vektorsysteme in (11.14) erM hält man dim K n .A; b/ D n für n D 0; 1; : : : ; n . Als unmittelbare Konsequenz aus dem Beweis von Lemma 11.11 erhält man für die Schrittweiten noch die folgende Darstellung, wie man sie üblicherweise auch in numerischen Implementierungen verwendet:

Abschnitt 11.3

303

Das CG-Verfahren für positiv definite Matrizen

Lemma 11.13. In der Situation von Lemma 11.11 gelten die Darstellungen

˛n D ˇn1 D

jjrn jj22 ; h Adn ; dn i 2 jjrn jj22 ; jjrn1 jj22

n D 0; 1; : : : ; n  1; n D 1; 2; : : : ; n  1

(11.16)

.r0 WD b/:

(11.17)

Beweis. Mit rn 2 K n .A; b/? sowie der Setzung (11.13) für die Suchrichtung dn erhält man hh rn ; dn i 2 D jjrn jj22 , und zusammen mit (11.8) liefert dies (11.16). Diese Darstellung (11.16) für ˛n zusammen mit der Identität7 rn D rn1 C ˛n1 Adn1 liefert schließlich Folgendes,

jjrn jj22 D h rn ; rn1 i 2 C ˛n1 h rn ; Adn1 i 2 D ˇn1 jjrn1 jj22 ; „ ƒ‚ … D 0 und daher gilt auch die angegebene Darstellung (11.17) für ˇn1 . Dies komplettiert den Beweis des Lemmas.

11.3.3 Der Algorithmus zum CG-Verfahren Trägt man die Resultate aus Theorem 11.8, Darstellung (11.11), Lemma 11.11 sowie Lemma 11.13 zusammen, so ergibt sich der folgende Algorithmus für das Verfahren der konjugierten Gradienten. Algorithmus 11.14. Schritt 0: Setze r0 D b . Für n D 0; 1; : : : W (a) Wenn rn D 0, so Abbruch, n D n . (b) Wenn andererseits rn ¤ 0, so verfahre man in Schritt n C 1 wie folgt,

´ dn D

rn C ˇn1 dn1 ;

ˇn1 D

r0 ;

xnC1 D xn C ˛n dn ; rnC1 D rn C ˛n Adn :

˛n D

jj rn jj22 jj rn1 jj22

;

jj rn jj22 h Adn ; dn i2

wenn n  1 wenn n D 0

; M

Bemerkung 11.15. Die in Definition 11.10 eingeführte Bezeichnung “Verfahren der konjugierten Gradienten” hat ihre Ursache in den beiden folgenden Eigenschaften: 

7

Für jeden Index n ist das Residuum rn identisch mit dem Gradienten des Energiefunktionals J.x/ D 12 h Ax; x i 2 hh x; b i 2 an der Stelle xn , es gilt also rn D rJ.xn /; siehe hierzu Aufgabe 11.2.

vergleiche (11.11)

304 

Kapitel 11

CG- und GMRES-Verfahren

Es gilt

h rn ; rk i 2 D 0

für n ¤ k: M

Dies folgt unmittelbar aus den Eigenschaften (11.2) sowie (11.14).

11.4 Die Konvergenzgeschwindigkeit des CG-Verfahrens Mit Bemerkung 11.12 wird klar, dass das CG-Verfahren als direktes Verfahren interpretiert werden kann, das nach endlich vielen Schritten die exakte Lösung von Ax D b liefert, xn D x . Aufgrund der eingangs von Abschnitt 10 angestellten Bemerkungen sind jedoch auch die Approximationseigenschaften der Iterierten x1 ; x2 ; : : : von Interesse. Aus diesem Grund werden in dem vorliegenden Abschnitt ausgehend von der Optimalitätseigenschaft (11.4) konkrete Fehlerabschätzungen für das Verfahren der konjugierten Gradienten hergeleitet. Hierbei ist das folgende Lemma nützlich. Lemma 11.16. Zu einer gegebenen symmetrischen, positiv definiten Matrix A 2 R N N sei . k ; vk /kD1;:::;N ein vollständiges System von ( positiven ) Eigenwerten k > 0 und zugehörigen orthonormalen Eigenvektoren vk 2 R N , es liegt also folgende Situation vor:

vj>vk D ıjk ;

Avk D k vk ; Mit der Entwicklung x D Darstellungen:

p.A/x D

N X

PN

kD1 ck vk

j; k D 1; 2; : : : ; N:

2 R N gelten für jedes Polynom p die folgenden

ck p. k /vk ;

kD1

jjp.A/x jj2 D

N X

ck2 p. k /2

1=2

jjp.A/x jjA D

;

N X

kD1

ck2 k p. k /2

1=2

:

kD1

Insbesondere gilt also

m1=2 jjx jj2  jjx jjA  M 1=2 jjx jj2 ;

x 2 RN

0 @

m WD

min kD1;:::;N

M WD

max kD1;:::;N

k ; k

1 A

: (11.18)

Beweis. Mit der angegebenen Entwicklung für x 2 R N bezüglich der vorgegebenen Basis erhält man unmittelbar Folgendes,

A x D

N X kD1

ck k vk ;

 D 0; 1; : : :;

Abschnitt 11.4

305

Die Konvergenzgeschwindigkeit des CG-Verfahrens

und daraus folgt die erste Identität des Lemmas. Weiter berechnet man N ˝˝ X

jjp.A/x jj2 D

N X

cj p. j /vj ;

j D1

ck p. k / vk

˛˛1=2 2

kD1

N  X

D

cj ck p. j /p. k / h vj ; vk i 2 „ ƒ‚ … j;kD1 D ıjk

1=2

D

N X

ck2 p. k /2

1=2

;

kD1

und analog erhält man

jjp.A/x jjA D

N N  X ˛˛1=2 ˝˝  X A cj p. j /vj ; ck p. k / vk 2 j D1

D

˝˝

N X

kD1

cj j p. j /vj ;

j D1

D

N X

ck p. k / vk

˛˛1=2 2

kD1

N  X j;kD1

cj ck j p. j /p. k / h vj ; vk i 2 „ ƒ‚ …

1=2

D

N X

ck2 k p. k /2

1=2

:

kD1

D ıjk

Den ersten Schritt auf dem Weg zur Herleitung spezieller Abschätzungen für jjxn  x jjA liefert das folgende Theorem. Theorem 11.17. Zu einer gegebenen symmetrischen, positiv definiten Matrix A 2 R N N gelten für das CG-Verfahren die folgenden Fehlerabschätzungen:

jjxn  x jjA 



inf

sup

p2…n ; p.0/D1 2.A/

 jp. /j jjx jjA

für n D 0; 1; : : : ; n :

Beweis. Für jedes Polynom p 2 …n mit p.0/ D 1 ist q.t/ WD . 1  p.t/ /=t ein Polynom vom Grad höchstens n  1, und somit gilt mit der Setzung x WD q.A/b Folgendes,

x 2 K n .A; b/;

x  x D p.A/x: PN Mit Lemma 11.16 und der Entwicklung x D kD1 ck vk 2 R N erhält man

jjxn  x jjA

D jjp.A/x jjA ‚ …„ ƒ N 1=2 X jjx  x jjA D  ck2 k p. k /2 kD1



Dies komplettiert den Beweis.

sup 2.A/

jp. /j

N X kD1



ck2 k

1=2

ƒ‚ … D jjx jjA

:

306

Kapitel 11

CG- und GMRES-Verfahren

Zur Herleitung spezieller Abschätzungen des Fehlers xn  x mittels Theorem 11.17 werden im Folgenden Tschebyscheff-Polynome der ersten Art herangezogen8 , die auf dem Intervall Œ 1 ; 1  die Darstellung Tn .t/ D cos . n arccos t / besitzen. Das folgende Lemma wird für die Herleitung der genannten speziellen Fehlerabschätzungen benötigt: Lemma 11.18. Für die Tschebyscheff-Polynome der ersten Art T0 ; T1 ; : : : gilt

Tn .t/ D Tn .

C1  1

/



1 .t 2 1 2

C

p

p p  t 2  1 /n C .t  t 2  1 /n n

. p C 11 /

für  2 R ;

für t 2 R ;

jt j  1;

 > 1:

(11.19)

Beweis. Auf dem Intervall Π1 ; 1  besitzt Tn die folgende Darstellung, t DW cos

D

Tn .t/

cos n D

1 . cos  2

1 in Œe 2

C e in 

 C i sin  /n C . cos   i sin  /n p p n 1 D 2 .t C i 1  t 2 /n C . t  i 1  t 2 / mit t 2 Œ 1 ; 1 : (11.20) „ ƒ‚ … DW p.t/

D

Die nachfolgende Darstellung zeigt, dass die in (11.20) definierte Funktion p.t/ ein Polynom ( vom Höchstgrad n ) darstellt,

D 0 für j=2 62 N0

p.t/ D

n 1 X 2 j D0

n j

. /t

p

nj j

t 2 /j

. 1 „ ƒ‚

i



‚ …„ ƒ j . 1 C .1/ / ;

t 2 R:

2 …j für j=2 2 N0

Zusammenfassend lässt sich feststellen, dass Tn und p zwei Polynome darstellen, die auf dem Intervall Œ 1 ; 1  übereinstimmen, daher gilt notwendigerweise auch

Tn .t/ D p.t/

für t 2 R :

Die im Lemma angegebene Darstellung von Tn .t/ für jt j  1 folgt dann unmittelbar p p aus der Identität i 1  t 2 D t 2  1. Für den Nachweis der Ungleichung (11.19) berechnet man für   1

C1 ˙ 1

r

  C 1 2 1

1 D D

8

vergleiche Definition 1.22

p p C1˙2  . C 1/2  .  1/2 D  1 1 p p .  ˙ 1 /2  ˙ 1 D p ; 1   1  C1˙

Abschnitt 11.5

307

Das CG-Verfahren für die Normalgleichungen

und daraus resultiert die Behauptung,  C1 Tn 1

.

/

D

1 2

p h  p C 1 n    1 n i C p p 1 C1

p



1   C 1 n : p 2 1

Es werden nun die Resultate für die Konvergenzgeschwindigkeit des Verfahrens der konjugierten Gradienten vorgestellt. Theorem 11.19. Zu einer gegebenen symmetrischen, positiv definiten Matrix A 2 R N N gelten für das CG-Verfahren die folgenden Fehlerabschätzungen:

jjxn  x jjA  2 n jjx jjA ;

n D 0; 1; : : : ;

p

jjxn  x jj2  2 A n jjx jj2 ;

......

p

1 mit den Notationen A WD cond2 .A/ und WD p AC1 . A

Beweis. Für den Nachweis der ersten Abschätzung wird im Normalfall A > 1 Theorem 11.17 angewandt mit dem folgenden Polynom,

p. / WD

Tn Π. M C m  2 /=.M  m /  ; Tn Π. M C m /=. M  m / 

2 R;

wobei die Zahlen m und M wie schon in (11.18) den kleinsten beziehungsweise größten Eigenwert der Matrix A bezeichnen. Offensichtlich gilt p 2 …n und p.0/ D 1, wegen .A/  Œ m; M  und max mM

M Cm

1

jp. /j D jTn . /j M m

 C1

1

D jTn . A /j  1 A

.11:19/



2 n

erhält man die erste Abschätzung des Theorems für die Situation A > 1. ( Der degenerierte Fall A D 1 ist gleichbedeutend mit A D I für ein > 0 und führt auf x1 D x . ) Die zweite Abschätzung des Theorems ist eine unmittelbare Konsequenz aus der ersten Abschätzung und der Normäquivalenz (11.18).

11.5 Das CG-Verfahren für die Normalgleichungen Ist das reguläre lineare Gleichungssystem Ax D b symmetrisch indefinit oder aber nichtsymmetrisch, so kann man zu den Normalgleichungen

A>Ax D A>b übergehen und hierauf das klassische CG-Verfahren anwenden. Diesen Ansatz bezeichnet man als CGNR-Verfahren.

308

Kapitel 11

CG- und GMRES-Verfahren

Bemerkung 11.20. (a) Als unmittelbare Konsequenz aus Theorem 11.5 ergibt sich für die Iterierten des CGNR-Verfahrens die Minimaleigenschaft

jjAxn  b jj2 D

min

x2K n .A>A;A>b/

jjAx  b jj2 :

(11.21)

Diese Eigenschaft (11.21) begründet den Buchstaben “R” in der Notation CGNR, da in dieser Variante das Residuum minimiert wird, und der Buchstabe “N” steht für “Normalgleichungen”. Aufgrund der Eigenschaft (11.21) ist auch unmittelbar klar, dass das CGNR-Verfahren für die spezielle Wahl Dn D K n .A>A; A>b/; n D 0; 1; : : :, mit dem Ansatz des minimalen Residuums (11.3) übereinstimmt. (b) Einen Algorithmus zur Bestimmung der Iterierten des CGNR-Verfahrens erhält man durch Übertragung des Algorithmus 11.14 angewandt auf die Normalgleichungen A>Ax D A>b . Dabei sind in jedem Iterationsschritt zwei Matrix-Vektor-Multiplikationen erforderlich ( zur Berechnung von Adn und A>Adn ). Man beachte, dass die numerisch kostspielige Berechnung der Matrix A>A dafür nicht erforderlich ist. (c) Als Konsequenz aus Theorem 11.19 erhält man für das CGNR-Verfahren die folgenden Fehlerabschätzungen:

jjAxn  b jj2  2 n jjb jj2 ;

n D 0; 1; : : : ;

jjxn  x jj2  2A n jjx jj;

......

1 mit den Notationen A WD cond2 .A/ und WD

AC . Man beachte, dass die in A 1 p Theorem 11.19 auftretenden Größen A hier durch A ersetzt werden mussten, was sich bei schlecht konditionierten Problemen ( A 1 ) als ungünstig erweist. M

11.6 Arnoldi-Prozess 11.6.1 Vorbetrachtungen zum GMRES-Verfahren Eine weitere Möglichkeit zur Lösung eines regulären linearen Gleichungssystems Ax D b mit symmetrisch indefiniter oder aber nichtsymmetrischer Matrix A 2 R N N liefert das GMRES-Verfahren: Definition 11.21. Das GMRES-Verfahren ist definiert durch den Ansatz des minimalen Residuums (11.3) mit der speziellen Wahl Dn D K n .A; b/, es gilt also

xn 2

K n .A; b/;

jjAxn  b jj2 D

min x2K n .A;b/

jjAx  b jj2 ;

n D 1; 2; : : : : (11.22)

Die Abkürzung “GMRES” hat ihren Ursprung in der englischen Bezeichnung “generalized minimal residual method”. Ursprünglich wurde dieses Verfahren für symmetrische Matrizen A betrachtet und dabei mit MINRES bezeichnet. Für n D 1; 2; : : : ist die grundsätzliche Vorgehensweise zur Realisierung des GMRES-Verfahrens folgendermaßen:

Abschnitt 11.6

309

Arnoldi-Prozess

(a) Mittels des gleich zu beschreibenden Arnoldi-Prozesses wird bezüglich des euklidischen Skalarprodukts eine Orthogonalbasis von K n .A; b/ erzeugt. (b) Mittels dieser Orthogonalbasis lässt sich das Minimierungsproblem (11.22) als ein einfacheres Minimierungsproblem formulieren, das schnell gelöst werden kann. Details hierzu werden in Abschnitt 11.7 vorgestellt. Der vorliegende Abschnitt 11.6 befasst sich mit dem in (a) angesprochenen ArnoldiProzess.

11.6.2 Arnoldi-Prozess Die Vorgehensweise beim Arnoldi-Prozess ist schnell beschrieben: ausgehend von einem gegebenen normierten Vektor q1 2 R N wird bezüglich des klassischen Skalarprodukts h ;  i 2 eine Folge paarweise orthonormaler Vektoren q1 ; q2 ; : : : generiert durch Gram-Schmidt-Orthogonalisierung der Vektoren q1 ; Aq1 ; Aq2 ; : : :9 . Der folgende Algorithmus beschreibt die genaue Vorgehensweise. Algorithmus 11.22 (Arnoldi-Prozess). Ausgehend von einem gegebenem Vektor 0 ¤ b 2 R N setzt man q1 D b=jjb jj2 2 R N und geht folgendermaßen vor für n D 1; 2; : : :: (a) ( Orthogonalisierung ) Man setzt

hj n WD .Aqn />qj 2 R ; b q nC1 WD Aqn 

n X

j D 1; 2; : : : ; n;

hj n qj 2 R N :

(11.23) (11.24)

j D1

q nC1 D 0 bricht der Prozess ab; der Abbruchindex wird (b) ( Normierung ) Im Fall b mit n D n bezeichnet. Wenn andererseits b q nC1 ¤ 0 gilt, so setzt man hnC1;n WD jjb q nC1 jj2 2 R ;

qnC1 WD

1

jjb q nC1 jj2

b q nC1 2 R N :

(11.25) M

Bemerkung 11.23. (a) Der Arnoldi-Prozess hat eine eigenständige Bedeutung und kann beispielsweise auch zur numerischen Behandlung von Eigenwertproblemen eingesetzt werden; mehr Details hierzu später10 . (b) Den Setzungen (11.23)–(11.24) entnimmt man, dass der Arnoldi-Prozess genau dann abbricht, wenn erstmalig Aqn 2 span ¹ q1 ; : : : ; qn º gilt. M Das folgende Lemma stellt die wichtigsten Eigenschaften im Zusammenhang mit dem Arnoldi-Prozess zusammen. 9

Die zu orthogonalisierenden Vektoren werden also erst im Verlauf des Prozesses generiert und sind nicht von vornherein gegeben. 10 siehe Bemerkung 11.27

310

Kapitel 11

CG- und GMRES-Verfahren

Lemma 11.24. Die durch den Arnoldi-Prozess erzeugten Vektoren q1 ; q2 ; : : : ; qn 2 R N sind paarweise orthonormal, und es gilt span ¹ q1 ; q2 ; : : : ; qn º D span ¹ q1 ; : : : ; qn1 ; Aqn1 º D K n .A; b/

(11.26)

für n D 1; 2; : : : ; n . Ist die Matrix A regulär, so gilt für die eindeutige Lösung x 2 R N des Gleichungssystems Ax D b Folgendes,

x 2 K n .A; b/:

(11.27)

Beweis. Die paarweise Orthogonalität erhält man mittels vollständiger Induktion über n ( unter Verwendung von (11.23) ): > qnC 1 qj D

1

hnC1;n

Π.Aqn />qj  hj n  D 0;

j D 1; 2; : : : ; n; n D 1; 2; : : : ; n  1:

Schließlich gewährleistet die Setzung (11.25) die Eigenschaft jjqnC1 jj2 D 1. Die beiden Identitäten in (11.26) sollen nun mit vollständiger Induktion über n nachgewiesen werden. Wegen q1 D b=jjb jj2 ist die Behauptung richtig für n D 1, und es wird nun der Induktionsschritt 1  n  1 ! n  n geführt. Aufgrund von n  n sind die Vektoren q1 ; : : : ; qn1 ; Aqn1 2 R N linear unabhängig, so dass nach Konstruktion die erste Identität in (11.26) richtig ist. Die zweite Identität in (11.26) erhält man so: die Relation “” folgt aus Aqn1 2 A.K n1 .A; b/ /  K n .A; b/; die Identität “D” ergibt sich dann aus Dimensionsgründen:

n D dim span ¹ q1 ; : : : ; qn1 ; Aqn1 º  dim K n .A; b/  n: Die Aussage in (11.27) erhält man so: nach Definition von n in Algorithmus 11.22 gilt Aqn 2 span ¹ q1 ; : : : ; qn º D K n .A; b/, und per Konstruktion gilt

Aqj 2 K j C1 .A; b/  K n .A; b/;

j D 1 ; 2 ; : : : ; n  1 ;

so dass insgesamt A. K n .A; b//  K n .A; b/ gilt beziehungsweise aus Dimensionsgründen die Abbildung A W K n .A; b/ ! K n .A; b/ bijektiv ist, und wegen b 2 K n .A; b/ gilt dann – wie in (11.27) angegeben – notwendigerweise auch x 2 K n .A; b/. Dies komplettiert den Beweis. Bemerkung 11.25. (a) Mit der Aussage (11.26) wird klar, dass dim K n .A; b/ D n für n D 1; 2; : : : ; n gilt. Einige weitere Eigenschaften von Krylovräumen werden zu einem späteren Zeitpunkt vorgestellt11 . Der Arnoldi-Prozess bricht also notwendigerweise nach höchstens N Schritten ab, n  N . (b) In Schritt n des Arnoldi-Prozesses sind 2N.N  1/ arithmetische Operationen zur Berechnung von Aqn erforderlich. Zudem fallen noch .3 C 2n/N arithmetische Operationen zur Bestimmung von hj n 2 R ; j D 1; : : : ; n C 1 und qnC1 2 R N an. Im Fall n D N ergeben sich insgesamt 3N 3 C O. N 2 / arithmetische Operationen. 11

siehe Lemma 11.31

Abschnitt 11.6

311

Arnoldi-Prozess

(c) Ist die Matrix A symmetrisch, A D A>, so gilt für j  n  2 die Identität hj n D qn>Aqj D 0 aufgrund der Eigenschaften Aqj 2 K j C1 .A; b/  K n1 .A; b/ und qn 2 K n .A; b/? . Die Gram-Schmidt-Orthogonalisierung (11.23)–(11.24) geht hier also über in eine Drei-Term-Rekursion ( das heißt, für die Berechnung von qnC1 werden nur qn und qn1 benötigt ):

b q nC1 WD Aqn  hnn qn  hn1;n qn1 ;

n D 1; 2; : : : ; n :

Diesen Spezialfall für den Arnoldi-Prozess bezeichnet man als Lanczos-Prozess.

M

Matrixversion des Arnoldi-Prozesses Für die weiteren Anwendungen ist die folgende Matrixversion des Arnoldi-Prozesses von Bedeutung. Theorem 11.26. Für eine gegebene Matrix A 2 R N N und einen Vektor 0 ¤ b 2 R N gelten mit den Notationen aus dem Arnoldi-Prozess die folgenden Identitäten:

1

0

1

0

C B B C B B C B B C B B A B q1 : : : qn C D B q1 C B B C B B A @ @

C C C C : : : qnC1 C C C A

„ ƒ‚ … DW Qn 2 R N n

0

h11 p p p

B B h21 p p p B B pp p @

h1n p pp

hnn

1 C C C; C A

n D 1; : : : ; n  1; (11.28)

hnC1;n „ ƒ‚ … DW Hn 2 R .nC1/n

beziehungsweise im letzten Schritt

0

1

0

1

B B C B B C B B C B B C A B q1 : : : qn C D B q1 C B B B B C @ @ A

C C C C : : : qn C C C A

0

B B h21 p p p B B pp p @ „

ƒ‚ … „ DW Qn 2 R N n

h11 p p p

ppp pp

p

h1n pp p pp p

1 C C C: C A

(11.29)

hn ;n 1 hn n ƒ‚ … DW Hn 2 R n n

Beweis. Es genügt der Nachweis von (11.29), da die Matrixprodukte in (11.28) für

n D 1; : : : ; n  1 jeweils gerade die ersten n Spalten der beiden Matrixprodukte von (11.29) darstellen. Ein Vergleich der n Spalten der Matrixprodukte in (11.29) führt PnC1 auf Aqn D j D1 hj n qj beziehungsweise hnC1;n qnC1 D Aqn  Pn

n X

hj n qj ;

n D 1 ; 2 ; : : : ; n  1 ;

j D1

sowie auf Aqn D j D1 hj n qj . Dies entspricht exakt den Setzungen (11.23)–(11.25) des Arnoldi-Prozesses.

312

Kapitel 11

CG- und GMRES-Verfahren

Bemerkung 11.27. (a) In Kurzform bedeuten die Darstellungen (11.28)–(11.29) Folgendes,

AQn D QnC1 Hn

.n D 1; 2; : : : ; n  1 /;

AQn D Qn Hn : (11.30)

(b) Bricht der Arnoldi-Prozess nicht vorzeitig ab, gilt also n D N , so erhält man eine Faktorisierung der Form

0

Q> N AQN

B h11 p p p B B h21 p p p B D B pp B p B @

ppp pp

p

hN;N 1

1 h1N C C ppp C C 2 R N N ; pp C C p C A hN N

1 N N Q> ; N D QN 2 R

so dass die Matrix A durch orthogonale Ähnlichkeitstransformationen auf obere Hessenbergform gebracht worden ist, das heißt, die resultierende Matrix unterscheidet sich von einer oberen Dreiecksmatrix lediglich durch die nichtverschwindenden Einträge auf der unteren Nebendiagonalen; eine solche Matrix bezeichnet man als Hessenbergmatrix. Eine Hessenbergform ist bei der numerischen Behandlung von Eigenwertproblemen von Vorteil, siehe Kapitel 13; dort werden auch andere orthogonale Ähnlichkeitstransformationen ( Householder-Transformationen, Givens-Rotationen ) zur Gewinnung einer Hessenbergform vorgestellt. M

11.7 Realisierung von GMRES auf der Basis des Arnoldi-Prozesses 11.7.1 Einführende Bemerkungen Im Folgenden wird eine Methode zur Umsetzung des GMRES-Verfahrens vorgestellt, die die durch den Arnoldi-Prozess generierten Orthogonalbasen der Krylovräume K 1 .A; b/; K 2 .A; b/; : : : verwendet. Theorem 11.28. Mit den Notationen aus dem Arnoldi-Prozess gelten für die Vektoren

x1 ; x2 ; : : : 2 R N aus dem GMRES-Verfahren genau dann die Darstellungen xn D Qn zn ;

n D 1; 2; : : : ; n ;

(11.31)

wenn für n D 1; 2; : : : ; n der Vektor zn 2 R n das folgende Minimierungsproblem löst,

0 jjb jj 1 2

jjHn z  cn jj2 ! min

n

für z 2 R ;

mit cn

0 WD @ ppp A 2 R min¹nC1;n º : (11.32) 0

Abschnitt 11.7

313

GMRES auf der Basis des Arnoldi-Prozesses

Beweis. Für jeden Index n  n  1 und jeden Vektor z 2 R n gilt

jjAQn z  b jj2 D j QnC1 Hn z  QnC1 cn j 2 D jjHn z  cn jj2 ;

(11.33)

wobei die Norm jj  jj2 in (11.33) die ersten beiden Male auf R N und und im dritten Fall auf R nC1 operiert; die letzte Identität in (11.33) resultiert aus der Isometrieeigenschaft jjQn y jj2 D jjy jj2 . Für den Index n D n verhält sich die Situation nicht viel anders; man hat nur in dem mittleren Ausdruck von (11.33) die beiden auftretenden Indizes n C 1 jeweils durch n zu ersetzen.

11.7.2 Allgemeine Vorgehensweise zur Lösung des Minimierungsproblems (11.32) Im vorigen Abschnitt 11.7.1 ist auf der Basis des Arnoldi-Prozesses das Problem der Bestimmung der Approximationen x1 ; x2 ; : : : 2 R N des GMRES-Verfahrens reduziert worden auf die Lösung des linearen Ausgleichsproblems (11.32). Im Folgenden wird dargestellt, wie man die dabei auftretende Matrix Hn mit oberer Hessenbergstruktur schnell in eine orthogonale Matrix und eine verallgemeinerte obere Dreiecksmatrix von der folgenden Form faktorisiert: 

Für n D 1; 2; : : : ; n  1 bestimmt man sukzessive Faktorisierungen der Form

0 B Hn D Tn B @

1 Rn

0

C C ; Tn 2 R .nC1/.nC1/ ; A

0>

B Rn D @

ppp pp

1

pC p pp A 2 R nn; 0 2 R n :



Tn1 D Tn>;

(11.34)

Nach der Bestimmung solcher Faktorisierungen kann das jeweilige Ausgleichsproblem (11.32) unmittelbar gelöst werden durch die Auflösung des folgenden gestaffelten Gleichungssystems:12

0 1 Rn z D y 2 R n ;

mit

0

jjb jj2

1

By C B C B C WD T > B 0p C 2 R nC1 n @ pp A @ A 

. n D 1; 2; : : : ; n  1 /:

0

 Für den Index n D n  verhält sich die Situation nur geringfügig anders. Hier bestimmt man eine Faktorisierung der Form

0 Hn D Tn Rn ;

Tn 2 R nn ; Tn1 D Tn> ;

12

B R n D @

ppp pp

p

pp p

1 C A 2 R n n ; (11.35)



Eine einführende Behandlung dieser Vorgehensweise finden Sie in Abschnitt 4.8.5.

314

Kapitel 11

CG- und GMRES-Verfahren

und die Lösung des linearen Ausgleichsproblems (11.32) ( die in dieser Situation gleichzeitig die Lösung von Ax D b darstellt ) kann dann leicht über das folgende gestaffelte Gleichungssystem bestimmt werden,

0

jjb jj2

1

B 0 C n C Rn z D Tn> B @ ppp A 2 R : 0 Im folgenden Abschnitt 11.7.3 wird beschrieben, wie man auf effiziente Art Faktorisierungen der Form (11.34)–(11.35) gewinnt.

11.7.3 Detaillierte Beschreibung der Vorgehensweise zur Lösung des Minimierungsproblems (11.32) Im Folgenden wird beschrieben, wie man für fixierten Index n  n ausgehend von einer Faktorisierung der Form

0

1

B Hn1 D Tn1 B @

Rn1

C C 2 R n.n1/ ; A

0 2 R n1 ;

0> verfährt, um im Fall n  n  1 eine Faktorisierung der Form (11.34) und im Fall n D n eine Faktorisierung von der Gestalt (11.35) zu erhalten. Wie bisher auch soll zunächst die Situation n  n  1 behandelt werden. Da die Hessenbergmatrix Hn eine einfache Erweiterung von Hn1 darstellt, ist die folgende orthogonale Transformation von Hn naheliegend, 

0 B B B B B @

1 0 > Tn 1

>

0

C B

B 0C C B

0 B B Rn1 B D B B B 0> @ 0>

hnn 0>

„ r1n pp p

rn1;n  

hnC1;n

ƒ‚ D Hn 1 C C C C; C C A

mit

0

C B C B T> H C B n1 n1 C D B C B A @

pp p

Hn1

C B C B A @

1

1

h1n

0>



0

> Tn 1

r1n pp p

1

1 h1n ! C pp C p C hnn C C A

hnC1;n

0

h1n

1

B C B C B C > B pp C B C WD Tn 1@ p A: @ rn1;n A hnn 

(11.36)

Die untere der beiden mit “” bezeichneten Zahlen stimmt mit hnC1;n überein, was im Folgenden aber keine Rolle mehr spielt. Man beachte, dass bei dieser Transformation

Abschnitt 11.7

315

GMRES auf der Basis des Arnoldi-Prozesses

> x ) zur Betatsächlich nur eine Matrix-Vektor-Multiplikation ( von der Gestalt Tn 1 rechnung des letzten Spaltenvektors anfällt, da die Dreiecksmatrix Rn1 als bekannt angenommen ist. Nun ist noch der Vektor .; /> 2 R 2 orthogonal in ein Vielfaches des ersten Einheitsvektors zu transformieren, ohne dabei den Rest der in (11.36) auftretenden Matrix zu verändern. Hierzu wird der Vektor w Œn 2 R 2 ; jjw Œn jj2 D 1, gemäß Lemma 4.62 auf Seite 92 so bestimmt, dass für die Householdermatrix W Œ n  D I2  2w Œn .w Œn /> 2 R 22 Folgendes gilt,

0 W Œn

  

 D

rnn



0

1

B In1 B bzw. äquivalent B B @

W Œn

0

r1n

1

0

r1n

1

B pp C B p C B p C C B pp C C B C CB C B rn1;n C D B rn1;n C ; C C B CB C B C AB @ rnn A @  A 0



wobei wieder Is 2 R ss die Einheitsmatrix bezeichnet. So hat man bereits die gewünschte Faktorisierung gewonnen,

0 B B B B B B @

10 In1 0>

0

W



Œn

CB CB CB CB CB C@ A

1

0

C

B B B D B B @

0C C

> Tn 1

C Hn C A

0>





1 C C C C 2 R .nC1/n : C A

0

1

ƒ‚ DW Tn>

ppp  p pp p pp



Nun soll noch die Situation n D n behandelt werden, die sich geringfügig von dem Fall n  n  1 unterscheidet. Hier führt man die folgende Transformation aus,



0 B Tn> 1 B @ Hn 1 „

h1n pp p

1

0

B R C n  1 C D B B A @

hn n ƒ‚ … D Hn

0>

mit

r1n pp p

1 C C C A

DW Rn ; rn 1;n rn n 0 0 1 h1n r1n B p B pp C > B @ p A WD Tn 1 @ pp rn n hn n

1 C C; A

 

bei der lediglich eine Matrix-Vektor-Multiplikation von der Art Tn> 1 x anfällt. Die gewünschte Faktorisierung liegt nun schon vor; eine anschließende Elimination ist hier nicht erforderlich, so dass die Wahl Tn D Tn 1 zum Ziel führt.

316

Kapitel 11

CG- und GMRES-Verfahren

Bemerkung 11.29. (a) Eine unmittelbare Folgerung Vorgehensweise sind die folgenden Darstellungen,

0 B Rn D B @

p

C C 2 R nn ; A

pp p

vorgestellten

n D 1; 2; : : : ; n ; 0

rnn Tn> D SnŒ n  Sn1    S1 ; Œn

der

1

r11 p p p r1n pp

aus

Œn

Œn

mit Sj

B B WD B @

1

I j 1

C C C 2 R .nC1/.nC1/ ; A

W Œj  Inj

j D 1; 2; : : : ; n;

n D 1 ; 2 ; : : : ; n  1 ;

beziehungsweise Tn D Tn 1 . Naheliegenderweise verwendet man diese Faktorisierungen von Tn> für die numerischen Berechnungen, die Berechnung eines Matrix> x wird also über n zweidimensionale MatrixVektor-Produkts von der Form Tn 1 Vektor-Multiplikationen realisiert. (b) Man beachte, dass bei der Lösung des Minimierungsproblems (11.32) in jedem Schritt n lediglich O.N / arithmetische Operationen erforderlich sind, so dass die numerische Hauptlast auf dem Arnoldi-Prozess ruht. Insgesamt lässt sich festhalten, dass für jeden Schritt des GMRES-Verfahrens lediglich eine Matrix-Vektor-Multiplikation sowie Operationen niedrigen Aufwands benötigt werden, es fallen also 2N 2 C O.N / arithmetische Operationen pro Iterationsschritt an. Dies ist ein Gewinn gegenüber dem CGNR-Verfahren, bei dem zwei Matrix-Vektor-Multiplikationen pro Iterationsschritt erforderlich sind. Auf der anderen Seite ist anzumerken, dass GMRES sich nicht wie das CGNR-Verfahren als einfache Zweitermrekursion realisieren lässt und der Speicherplatzbedarf wegen der benötigten Matrizen Rn und orthogonalen Vektoren qn ; n D 1; 2; : : : höher ausfällt. Schließlich gestaltet sich die Gewinnung von Fehlerabschätzungen für das GMRES-Verfahren schwieriger, wie sich im nachfolgenden Abschnitt herausstellen wird. M

11.7.4 Matlab-Programm für GMRES Im Folgenden wird ein Matlab-Programm ( das auch unter Octave lauffähig ist ) für das GMRES-Verfahren auf der Basis des Arnoldi-Prozesses angegeben. Die Matrix A 2 R N N sowie der Vektor b 2 R N sind dabei als gegeben angenommen. Der Algorithmus bricht in dieser Variante mit dem Schritt n D n ab, er fungiert hier also als direkter Löser. Auf der Webseite zu diesem Buch finden Sie weitergehende Erläuterungen zu diesem Programm. % ................... gmres.m ...................... x = zeros(N,1); d = zeros(2,1); w = zeros(2,N);

res = zeros(N,1); Q = zeros(N,N); y = zeros(N,1);

u = zeros(2,1); R = zeros(N,N); y(1) = norm(b);

Abschnitt 11.7

GMRES auf der Basis des Arnoldi-Prozesses

317

h = zeros(N,1);

goahead = 1; n = 1; %(*** Ende der Initialisierungen ***) Q(:,1) = b/norm(b); myeps = 0.000001; %(*** Start der Iteration; n D Iterationsschritt ***) while (goahead == 1) v = A*Q(:,n); z = v; for j= 1:n h(j) = Q(:,j)’*v; z = z - h(j)*Q(:,j); end qhat = z; normqhat = norm(qhat); if ( (normqhat = 2) R(1:n-1,n) = h(1:n-1); end %(*** Berechnung der neuen orthog. Transformation ***) if (goahead == 0) R(n,n) = h(n); else u = h(n:n+1); if (abs(u(1)) = ‚ …„ ƒ K 0 .A; b/¤ K 1 .A; b/ ¤ p p ¤ K n 1 .A; b/ ¤ K n .A; b/ D K n C1 .A; b/ D p p ; (11.38) > ; x 62 K n .A; b/ für n D 0; 1; : : : ; n  1; x 2 K n .A; b/;

Abschnitt 11.10

Nachtrag 2: Programmsysteme mit Multifunktionalität

319

wobei sich die in (11.38) angegebenen Eigenschaften unmittelbar aus dem nachfolgenden Lemma ergeben. Lemma 11.31. Für eine reguläre Matrix A 2 R N N sowie einen Vektor b 2 R N sind für jede Zahl n  1 die folgenden Aussagen äquivalent: (a) Die Vektoren b; Ab; : : : ; An b sind linear abhängig; (b) K n .A; b/ D K nC1 .A; b/; (c) A.K n .A; b//  K n .A; b/; (d) es existiert ein linearer Unterraum M  R N mit dim M  n, für den b 2 M gilt und der bezüglich der Matrix A invariant ist, A.M/  M ; (e) für x D A1 b gilt x 2 K n .A; b/. Beweis. Die Äquivalenzen ergeben sich folgendermaßen: .a/ ) .b/ W Nach Voraussetzung existieren eine Zahl 0  m  n und Konstanten 0 ; 1 ; : : : ; m1 2 R mit

Am b D

m X1

 A b:

D0

Daraus resultiert dann

An b D

n X1

.nm/ A b 2 K n .A; b/:

Dnm

.b/ ) .c/: Dies folgt sofort aus A.K n .A; b//  K nC1 .A; b/ D K n .A; b/. .c/ ) .d / W Man wähle M D K n .A; b/. .d / ) .a/ W Nach Voraussetzung gilt A b 2 M für  D 0; 1; : : :, und daher gilt dim span ¹ b; Ab; : : : ; An b º  n beziehungsweise (a). .c/ ) .e/ W Aus Dimensionsgründen ist die Abbildung A W K n .A; b/ ! K n .A; b/ eine Bijektion, und wegen b 2 K n .A; b/ besitzt somit die Gleichung Ax D b in dem Krylovraum K n .A; b/ eine Lösung, die wegen der Injektivität von A notwendigerweise mit x übereinstimmt. .e/ ) .a/ W Nach Annahme gilt x 2 span ¹ b; Ab; : : : ; An1 b º beziehungsweise b D Ax 2 span ¹ b 2 ; b 3 ; : : : ; An b º, woraus die behauptete lineare Abhängigkeit folgt.

11.10 Nachtrag 2: Interaktive Programmsysteme mit Multifunktionalität Bei dem auf Seite 316 angesprochenen Programmsystem Matlab handelt es sich um ein interaktives Programmsystem mit Multifunktionalität. Die interaktive Arbeitsweise von Programmsystemen im Allgemeinen erlaubt dabei jeweils eine komfortable und rasche Bearbeitung unterschiedlicher und schnell wechselnder Problemstellungen. Unter Multifunktionalität ist dabei vorrangig Numerik-, Computeralgebra- und Grafik-Funktionalität zu verstehen. Hierbei bedeutet Numerik-Funktionalität die Bereitstellung von fertigen Routinen beispielsweise zur Lösung linearer und nichtlinearer Gleichungssysteme, zur Durchführung der schnellen Fouriertransformation

320

Kapitel 11

CG- und GMRES-Verfahren

oder zur numerischen Lösung von Anfangswertproblemen bei gewöhnlichen Differenzialgleichungen. Unter dem Begriff Computeralgebra-Funktionalität versteht man die Fähigkeit eines Programmsystems, die aus der Analysis oder Algebra bekannten Vorgehensweisen vorzunehmen. Dazu gehört beispielsweise die Berechnung der Ableitung oder der Stammfunktion von Funktionen einer Veränderlichen ebenso wie die exakte Berechnung von Eigenwerten von Matrizen oder die exakte Bestimmung von Nullstellen von Polynomen. In allen Fällen sind Variablen als Koeffizienten zugelassen. Solche Berechnungen mittels Computeralgebra-Systemen bezeichnet man allgemein als symbolisches Rechnen. Naturgemäß können Programmsysteme mit Computeralgebra-Funktionalität auch nur solche Probleme lösen, für die überhaupt analytisch Lösungen angegeben werden können. Die Nullstellen von Polynomen vom Grad  5 etwa können im Allgemeinen auch mit solchen Programmsystemen nicht bestimmt werden. Grafik-Funktionalität ermöglicht beispielsweise die Darstellung von Funktionen f W R 2  D ! R als Niveauflächen in dreidimensionalen Abbildungen. Bei Matlab handelt es sich um das derzeit wohl bekannteste interaktive Programmsystem mit ausgeprägter Numerik- und Grafik-Funktionalität. Es bietet interaktiv Routinen zu allen in dem vorliegenden Buch vorgestellten und weiteren Problemstellungen an. Zusätzlich existieren Module beispielsweise für das symbolische Rechnen, wobei dieses auf dem Computeralgebra-System Maple basiert. Eingesetzt wird Matlab in Lehre und Forschung an Hochschulen und in Unternehmen beispielswiese aus der chemischen Industrie, der Automobil- oder der Stahlindustrie. Weitere interaktive Programmsysteme mit Multifunktionalität sind Octave und Scilab ( vorwiegend Numerik- und Grafik-Funktionalität ) sowie Maple, MuPad und Mathematica ( vorrangig Computeralgebra- und Grafik-Funktionalität; NumerikFunktionalität ist ebenfalls vorhanden ). Andere Computeralgebra-Systeme sind Kant V4 ( Computational Algebraic Number Theory, [13]; ein Programmsystem mit Computeralgebra-Funktionalität für den Bereich Zahlentheorie ), Macsyma sowie Reduce. Internet-Adressen zu den einzelnen Programmsystemen finden Sie im Online-Service zu diesem Buch.

Weitere Themen und Literaturhinweise Das Verfahren der konjugierten Gradienten geht zurück auf Hestenes / Stiefel [53] und wird zum Beispiel in den Lehrbüchern Fischer [27], Hackbusch [47], Kelley [60], Meister [70], Schwarz / Klöckner [94] und Stoer / Bulirsch [99] behandelt. Varianten des Verfahren vom Typ der konjugierten Gradienten werden beispielsweise in [70] sowie in Ashby / Manteuffel /Saylor [1], Freund / Golub /Nachtigal [30], HankeBourgeois [52], Nachtigal / S. Reddy /L. Reddy [74], Saad / Schultz [90], Sonneveld [97], Stoer [98] und in Vuik / van der Vorst [108] diskutiert. Resultate zur Konvergenzgeschwindigkeit des GMRES-Verfahrens findet man beispielsweise in [52] sowie in Greenbaum / Pták /Strako˘ s [40], Liesen [65], Moret [73], Nevanlinna [77], Plato / Vainikko [83] und in van der Vorst / Vuik [107]. Eine Einführung zu Matlab findet man beispielsweise in Gramlich / Werner [39], und Anwendungen von Matlab in der Finanzmathematik werden in Günther / Jüngel [45] vorgestellt.

321

Übungsaufgaben

Übungsaufgaben Aufgabe 11.1. Zu gegebener symmetrischer, positiv definiter Matrix A 2 R N N und einem Vektor b 2 R N habe die Zahl n die Bedeutung aus (11.38). Man zeige: x D A1 b ist Linearkombination von n Eigenvektoren der Matrix A. Aufgabe 11.2. Zu gegebener symmetrischer, positiv definiter Matrix A 2 R N N und einem Vektor b 2 R N zeige man: für jeden Index n ist das Residuum rn D Axn  b identisch mit dem Gradienten des Energiefunktionals J.x/ D 12 h Ax; x i2  h x; b i2 an der Stelle xn , es gilt also rn D rJ.xn /. Aufgabe 11.3. Zu gegebener symmetrischer, positiv definiter Matrix A 2 R N N zeige man: (a) Man weise für das CG-Verfahren für n D 1; 2; : : : ; n die folgenden Darstellungen nach:

xn

D

qn .A/b mit qn 2 …n1 geeignet;

pn .A/b mit pn .t/ D 1  tqn .t/: Pn1 k > (b) Der zur Entwicklung qn .t/ D kD0 ck t gehörende Koeffizientenvektor .c0 ; : : : ; cn1 / 2 R n ist Lösung des linearen Gleichungssystems 0 10 1 0 1 > > 2 > n > ppp c b Ab b A b b A b b b 0 B CB C B C B CB C B C B > CB C B > 2 C > 3 > nC 1 p p p B b Ab C C B c1 C Bb A b b A b b A b B CB C B C CB C: B C D B B B C C B pp C pp p p p p p p p p B B C C B p C p p p p B CB p C C B A@ A @ @ A b>An b b>AnC1 b p p p b>A2n1 b cn1 b>An1 b rn

D

Aufgabe 11.4. Zu gegebener symmetrischer, positiv definiter Matrix A 2 RN N weise man für das CG-Verfahren die folgenden Beziehungen nach ( für n D 0; 1; : : : ; n , mit der Zahl n aus (11.38) ):

rn>dn jj dn jj22 jj xnC1 jj2

D

jj rn jj22 ;

D

jj rn jj42



dn

n X

1

kD0

jj rk jj22

;

jj xn jj2 . n  n  1 /;

D jj rn jj22

dn>dk

D

jj rn jj2



jj rn jj22 jj rk jj22

n X

rk ; jj rk jj22

kD0

jj dk jj22

für k  n;

jj dn jj2 :

Aufgabe 11.5. Es bezeichne

0

0 B1 0 B

A D @

pp

1

p

pp

p

1 0

1 C C 2 R N N ; A

0 1 1 B0C B C

b D @ pp A 2 R N ; p 0

x

0 1 0 p B pp C N C D B @0A 2 R ; 1

so dass x die eindeutige Lösung des linearen Gleichungssystems Ax D b darstellt; die Matrix A wird als zirkulant bezeichnet. Man zeige: (a) Das GMRES-Verfahren liefert die Vektoren x1 D x2 D : : : D xN 1 D 0 und xN D x , das heißt, das GMRES-Verfahren liefert in den Schritten n D 1; 2; : : : ; N  1 keine Approximationen an die Lösung x , auch eine schrittweise Verbesserung tritt nicht auf.

322

Kapitel 11

CG- und GMRES-Verfahren

(b) Dagegen liefert das CGNR-Verfahren nach nur einem Iterationsschritt die exakte Lösung, x1 D x .

12

Eigenwertprobleme

12.1 Einleitung Die mathematische Formulierung des Schwingungsverhalten von mechanischen oder elektrischen Systemen sowie die anschließende Diskretisierung des Modells führt auf das Problem der Bestimmung der Eigenwerte von Matrizen ( kurz als Eigenwertproblem bezeichnet ), was in der Regel numerisch geschieht. Für solche Eigenwertprobleme werden in dem vorliegenden Kapitel Störungs-, Einschließungs- und Variationssätze vorgestellt, und in dem darauf folgenden Kapitel 13 werden numerische Verfahren zur Lösung von Eigenwertproblemen behandelt.

12.2 Störungstheorie für Eigenwertprobleme In diesem Abschnitt wird diskutiert, inwieweit sich Änderungen der Einträge einer Matrix A 2 R N N auf die Menge ihrer Eigenwerte auswirken. Etwas genauer werden zu gegebener Matrix A 2 R N N Abschätzungen dafür angegeben, wie groß der Abstand der Eigenwerte der gestörten Matrix A C A 2 R N N zum jeweils nächstgelegenen Eigenwert von A höchstens sein kann. Umgekehrte Abschätzungen – wie groß also der Abstand der Eigenwerte von A zum jeweils nächstgelegenen Eigenwert von A C A höchstens sein kann – sind von geringerem praktischem Interesse und werden hier auch nicht behandelt. Das folgende Theorem liefert ein entsprechendes Resultat für diagonalisierbare Matrizen. Die allgemeine Situation wird in Theorem 12.5 betrachtet.

12.2.1 Diagonalisierbare Matrizen Theorem 12.1 (Bauer/Fike). Die Matrix A 2 R N N sei diagonalisierbar,

T 1 AT

D diag . 1 ; : : : ; N / 2 CN N ;

(12.1)

mit der regulären Matrix T 2 CN N und den Eigenwerten 1 ; : : : ; N 2 C von A. Dann gelten für die Eigenwerte der Matrix A C A 2 R N N mit A 2 R N N beliebig die folgenden Abschätzungen,

8  2 .A C A/ W

min j  k j  condp .T /jjA jjp :

(12.2)

kD1::N

Hier ist 1  p  1, und jj  jjp bezeichnet die durch die gleichnamige Vektornorm induzierte Matrixnorm. Beweis. Sei  2 C ein Eigenwert der Matrix A C A. Falls  gleichzeitig ein Eigenwert der Matrix A ist, so folgt die Aussage unmittelbar, im Folgenden sei also  62 .A/

324

Kapitel 12

Eigenwertprobleme

angenommen. Wegen

A D TDT 1 ;

D WD diag . 1 ; : : : ; N /;

gilt

.A  I /1 D T .D  I /1 T 1 ; und somit

jj.A  I /1 jjp

 condp .T /jj.D  I /1 jjp

./

D condp .T / . min j  k j /

condp .T / max j  k j1

D

kD1::N

1

kD1::N

beziehungsweise min j  k j 

kD1::N

condp .T /

jj . A  I /1 jjp

;

(12.3)

b D diag . d1 ; : : : ; dN / 2 CN N gültige Identiwobei in . / die für Diagonalmatrizen D b tät jj D jjp D maxkD1::N jdk j eingeht. Zur weiteren Abschätzung von (12.3) betrachtet man einen Eigenvektor x 2 CN von A C A zum Eigenwert  und erhält .A C A/x D x

bzw.

Ax  x D Ax

bzw. x D .A  I /1 Ax

und somit 1  jj.A  I /1 A jjp  jj.A  I /1 jjp jjA jjp ;

(12.4)

und dies in (12.3) verwendet liefert die Aussage des Theorems. Das Eigenwertproblem ist für symmetrische Matrizen also stabil in dem Sinne, dass für p D 2 die Konstante cond2 .T / in (12.2) minimal ausfällt: Korollar 12.2. Für eine symmetrische Matrix A 2 R N N und jede Matrix A 2 R N N gilt min j  j  jjA jj2

2 . A /

für  2 .A C A/:

Beweis. In der vorliegenden Situation darf in (12.1) die Matrix T 2 R N N orthogonal gewählt werden, T 1 D T > ( vergleiche auch Abschnitt 12.6.2 ). Dann gilt insbesondere jjT jj2 D jjT 1 jj2 D 1, so dass die Behauptung unmittelbar aus Theorem 12.1 folgt. Bemerkung 12.3. Die Transformationsmatrix T in (12.1) besteht aus N linear unabhängigen Eigenvektoren von A. Die Konditionszahl von T wird dann größer ausfallen, wenn etwa zwei von diesen Eigenvektoren fast parallel sind. M

Abschnitt 12.2

325

Störungstheorie für Eigenwertprobleme

Beispiel 12.4. Die diagonalisierbare Matrix

a 1

A D

! ;

a

T D @

1

1

p p 

0

1 A;

T 1 D

(12.5)

p , und als Transformationsmatrix und deren

besitzt die Eigenwerte 1=2 D a ˙ Inverse ergibt sich zum Beispiel

0

0 < 1;

1 2

@

1

p

1=

p 1 1 =

1 A;

1

cond1 .T / D 1 C p ;

so dass in diesem Beispiel die Abschätzung (12.2) für 0 < 1 eine große Schranke liefert. In einem solchen Fall ist die Anwendung des folgenden Theorems 12.5 vorzuziehen. In diesem Zusammenhang sei auch auf Beispiel 12.7 verwiesen, wo gerade M der Grenzfall D 0 aus (12.5) behandelt wird.

12.2.2 Der allgemeine Fall Mit der Schur-Faktorisierung1 einer gegebenen Matrix A lässt sich in der allgemeinsten Situation für A die Empfindlichkeit der Menge der Eigenwerte von A gegenüber Störungen in den Einträgen dieser Matrix messen. Theorem 12.5. Für die Eigenwerte von A C A 2 R N N mit beliebigen Matrizen A; A 2 R N N gelten die folgenden Abschätzungen,

® 1=N ¯ ; c WD max¹ ;  1=N º; 8 2 .A C A/ W min j  j  c max jjA jj2 ; jjA jj2 2.A/

 WD

NX 1

jjR jjs2 :

sD0

der nichtdiagonale Anteil aus einer Schur-Faktorisierung Q1 AQ D D C R 2 CN N mit einer Diagonalmatrix D 2 CN N . Die Matrixnorm jj  jj2 ist induziert durch die euklidische Vektornorm.

Hier ist R 2

CN N

Beweis. Sei  2 C ein Eigenwert der Matrix A C A. Falls  auch Eigenwert der Matrix A ist, folgt die angegebene Abschätzung unmittelbar. Im Folgenden sei also  62 .A/. Aus der auch für nichtdiagonalisierbare Matrizen gültigen Abschätzung (12.4) erhält man mit A D Q.D C R/Q1 1  jj.D  I C R/1 jj2 jjA jj2 :

(12.6)

Weiter gilt

.D  I C R/1

D

.I C .D  I /1 R /1 .D  I /1

./

NX 1

D

> ..D  I /1 R /s .D  I /1 ; > ;

sD0 1

9 > > =

Eine Definition wird in Abschnitt 12.6 ab Seite 332 nachgetragen.

(12.7)

326

Kapitel 12

Eigenwertprobleme

wobei in . / eingeht, dass .D  I /1 R eine strikte obere Dreiecksmatrix darstellt ( also verschwindende Diagonaleinträge besitzt ) und somit . .D  I /1 R /N D 0 gilt, wobei man Letzteres leicht nachrechnet. Weiter ist noch zu beachten, dass für Pp1 Matrizen B 2 CN N mit B p D 0 für ein p 2 N0 Folgendes gilt, .I B/1 D sD0 B s , was man ebenfalls leicht nachrechnet. Für die abzuschätzende Größe

" WD

1

min j  j D

jj.D  I /1 jj2

2.A/

erhält man somit aus (12.6)–(12.7) 1 

1  1 NX jj R jj2 s

"

"

sD0

NX 1

jjA jj2 

² jjR jj2

falls "  1

1=";

s

1="N ;

sD0

„ ƒ‚ … D 

sonst

³ jjA jj2 ;

woraus sich unmittelbar die Aussage des Theorems ergibt. Bemerkung 12.6. In der typischen Situation jjA jj2 1 geht die Abschätzung in Theorem 12.5 über in 1=N

min j  j  c jjA jj2

für  2 .A C A/:

2.A/

(12.8)

Für diagonalisierbare Matrizen A ist diese Abschätzung (12.8) bezüglich des Terms 1=N A aufgrund von jjA jj2 jjA jj2 für große N schwächer als die Abschätzung (12.2). M Beispiel 12.7. Für die Matrix

 A D

1 0





D

   0 1 0 C 0 0 0 „ ƒ‚ … „ ƒ‚ … DW D DW R

mit einer beliebigen Zahl 2 C gilt mit der Notation aus Theorem 12.5 die Identität jjR jj2 D 1 und somit  D 2. Für

 A C A D

 1 ; ı

0 < ı 1;

ist dann jjA jj2 D ı erfüllt, so dass Theorem 12.5 die Abschätzung

8  2 .A C A/ W

p

min j  j  2 ı

2.A/

liefert. Tatsächlich gilt

.A/ D ¹ º;

.A C A/ D ¹ ˙

p

ı º;

max .

. .......

min j  j D

2.AC A/ 2.A/

p ı:

Abschnitt 12.3

327

Lokalisierung von Eigenwerten

Sowohl Theorem 12.1 als auch Theorem 12.5 liefern Abschätzungen für die Empfindlichkeit der Menge .A/ gegenüber Störungen in den Einträgen der Matrix A. Aussagen über die Änderung der entsprechend ihrer algebraischen Vielfachheit gezählten Eigenwerte werden jedoch erst durch das folgende Theorem möglich, das hier ohne Beweis angegeben wird. Theorem 12.8. Für eine Matrix A 2 R N N mit den Eigenwerten 1 ; : : : ; N 2 C existiert zu jedem " > 0 ein ı > 0 mit der folgenden Eigenschaft: Zu jeder Matrix A 2 R N N mit jjA jj  ı gibt es eine Nummerierung 1 ; : : : ; N 2 C der Eigenwerte von A C A mit max kD1;:::;N

jk  k j  ":

(12.9)

Hierbei bezeichnet jj  jj W R N N ! R C eine Matrixnorm. Beweis. Siehe Mennicken / Wagenführer [71] oder Werner [111].

12.3 Lokalisierung von Eigenwerten Im Folgenden wird ein wichtiges Einschließungsresultat für Eigenwerte vorgestellt. Theorem 12.9. (a) Für eine Matrix A D .ajk / 2 R N N gilt

.A/ 

N [

Gj ;

j D1

mit den Gerschgorin-Kreisen

Gj WD

®

z 2 C W jz  ajj j 

N X

¯ jajk j ;

j D 1; 2; : : : ; N:

kD1 k¤j

(b) Wenn genauer die Vereinigung von q Gerschgorin-Kreisen

K .1/ WD Gj1 [ : : : [ Gjq

. j` ¤ jm für ` ¤ m /

disjunkt von der Menge der Vereinigung K .2/ der restlichen N  q Gerschgorin-Kreise ist, so enthält K .1/ genau q Eigenwerte von A und K .2/ enthält genau N q Eigenwerte von A ( jeweils entsprechend ihrer algebraischen Vielfachheit gezählt ). Beweis. (a) Für 2 C ist die Bedingung 62

j  ajj j >

N X kD1 k¤j

jajk j;

SN

j D1

Gj gleichbedeutend mit

j D 1; 2; : : : ; N;

328

Kapitel 12

Eigenwertprobleme

was wiederum gerade die strikte Diagonaldominanz der Matrix A  I 2 CN N impliziert. Daher ist A  I 2 CN N nichtsingulär2 , die Zahl also kein Eigenwert von A. Damit ist Teil (a) nachgewiesen. Für den Nachweis der Aussage in (b) zerlegt man die Matrix A D .ajk / in die Summe eines diagonalen und eines nichtdiagonalen Anteils, A D D C M mit

D D diag .a11 ; : : : ; aN N / 2 R N N ;

M D A  D;

und betrachtet in R N N die Strecke von D nach A,

1 p p p p p p a ta ta 12 1N C B 11 C B C B B ta ppp ta2N C C B 21 a22 ta23 C B C B p p p p p C 2 R N N ; B pp pp pp pp A.t/ D D C tM D B pp C C B C B C B pp pp pp p p taN 1;N C B p C B A @ p p p taN;N 1 aN N taN 1 p p p 0

0  t  1;

so dass A.0/ D D und A.1/ D A gilt. In den folgenden Punkten (i)–(iii) werden nun einige Vorbereitungen getroffen für den anschließend in Punkt (iv) beschriebenen entscheidenden Beweisschritt. (i) Als Erstes soll

.A.t//  K .1/ [ K .2/

für 0  t  1

(12.10)

nachgewiesen werden. Hierzu bezeichne G1 .t/; : : : ; GN .t/ die zu A.t/ gehörenden Gerschgorin-Kreise,

Gj .t/ D

®

z 2 C W jz  ajj j  t

Offensichtlich gilt

Gj .t/  Gj ;

N X

¯ jajk j ;

j D 1; 2; : : : ; N:

kD1 k¤j

j D 1; 2; : : : ; N

für 0  t  1;

und mit Teil (a) dieses Theorems erhält man (12.10). (ii) Von den insgesamt N Eigenwerten von D D A.0/ befinden sich die q Eigenwerte aj1 j1 ; : : : ; ajq jq in der Menge K .1/ und die restlichen N  q Eigenwerte liegen in K .2/ , was unmittelbar aus der Eigenschaft ajj 2 Gj für j D 1; 2; : : : ; N folgt. (iii) Weiter beobachtet man vorbereitend noch

" WD dist .K .1/ ; K .2/ / > 0; (12.11) was aus der Disjunktheitsvoraussetzung K .1/ \K .2/ D ¿ und der Abgeschlossenheit der Mengen K .1/ und K .2/ folgt. 2

siehe Lemma 2.13 auf Seite 29

Abschnitt 12.3

329

Lokalisierung von Eigenwerten

(iv) Die Eigenschaften (12.10)–(12.11) und die Schlussfolgerung in (ii) zusammen mit der stetigen Abhängigkeit der Eigenwerte gegenüber Matrixstörungen ergeben nun Teil (b) des Theorems, wie im Folgenden noch detailliert nachgewiesen wird. Hierzu bezeichne

® ¯ t0 WD sup t 2 Œ 0; 1  W genau q Eigenwerte von A.t/ liegen in K .1/ :

(12.12)

Die Menge in (12.12) enthält t D 0 und ist somit nichtleer. Wenn 1 .t0 /; : : : ; N .t0 / 2 C die der algebraischen Vielfachheit nach gezählten Eigenwerte von A.t0 / bezeichnen, so existiert nach Theorem 12.8 zu " aus (12.11) eine Zahl ı > 0 und eine Nummerierung 1 .t/; : : : ; N .t/ 2 C der Eigenwerte von A.t/ mit max kD1;:::;N

j k .t/  k .t0 /j < "

für t 2 Œ 0 ; 1 ;

jt  t0 j < ı:

(12.13)

Aus der Eigenschaft (12.13) folgt zweierlei: zum einen wird das Maximum in (12.12) angenommen, denn gemäß der Definition von t0 gibt es ein t 2 Œ 0; 1  mit t0  ı < t  t0 , so dass die Menge K .1/ genau q Eigenwerte von A.t/ enthält, und genau N  q Eigenwerte von A.t/ sind in K .2/ enthalten. ( Die Situation ist in Bild 12.1 veranschaulicht. ) Wegen (12.13), (12.10) und (12.11) enthält die Menge K .1/ mithin auch genau q Eigenwerte von A.t0 /. Zum anderen ist noch t0 D 1 nachzuweisen; wegen A.1/ D A ergibt sich daraus die Aussage des Theorems. Wäre t0 < 1, so enthielte für jedes t 2 Œ 0; 1  mit t0 < t  t0 C ı die Menge K .1/ genau q Eigenwerte von A.t/ ( wieder aufgrund der Eigenschaften (12.13), (12.10) und (12.11) ). Dies stellt einen Widerspruch zur Definition (12.12) dar und komplettiert den Beweis der Aussage des Theorems. . ..... ....... .. ... .. ... .. ........................................................................... ................. ............ .......... ............ .......... ........ ....... ........ . . . . . . ...... ...... ...... . . . . ..... ..... . . ... . ... ... .  . ... 5 0 .. ... . . ... .. .   . .. . 1 0 5 .. .... ... .. ... ... ... ...  2 0 . . ...  1 ... ... ... .... ..... ..... ...... ..... ...... ......  2 . . ....... . . . . ... ........ ........ ......... ......... ............ ................ ............ ...............................................................................

.t /

.t /

Im z

.t/

.t/

.t /

.t/

........................... ....... ...... ...... .... .... .... .... ... ... ... . . ... .. . . ... .. ... . . ... .. . . ... ... ... . . . ... . . ... .... ... ... ... ...  ... 4 0 .. .... .. ..  4 .. .. ... ... ... .. .... .. ... ... .. ... .... .. ... ... ...  3 ... . ... . . . ...  3 0 ... ... ... ... ... .. .. ... . . . .. ... ... ... ... ... ... ... .. . . ... .. ... ... ... ... ... ... ... ... ... . . ... .. ... ... .... ..... ..... ....... ..... ...............................

.t/

 " !

.t/

.t /

.t /

..........................

Re z Bild 12.1: Veranschaulichung zweier Situationen im Beweis von Theorem 12.9 am Beispiel N D 5. Dargestellt ist die Verteilung der Eigenwerte von A.t0 / und A.t/ für t mit jt  t0 j  ı . Die Ellipsen sollen die Mengen K1 beziehungsweise K2 umfassen.

330

Kapitel 12

Beispiel 12.10. Für die Matrix

Eigenwertprobleme

1

0

1=2

5

B B B 1=2 B A D B B 1=2 B @ 1=2

0 1=2

C C 0 0 C C C 2 R 44 C 1 1=2 C A

3 0 0

0

6

ist die Lage der Gerschgorin-Kreise in Bild 12.2 dargestellt. Aus Theorem 12.9 folgert man dann, dass es reelle Eigenwerte 0  3  2 und 2:5  2  3:5 gibt ( komplexe Eigenwerte reeller Matrizen treten automatisch als konjugiert komplexe Paare auf ). Die beiden anderen Eigenwerte liegen entweder im Intervall Π4 ; 6:5  oder sind durch ein komplex konjugiertes Paar in G3 [ G4 gegeben.

G1 1 0

.............................. ...... ........ ..... .... .... ... ... ... . . ... . ... .... .. ... ... .... . ... ... ... .. . ... .. . . ... .. . ... . . .... .... ...... ...... ....... ................................

1

1

G2 ................. ....... .... ... ... ... ... .... . ... ... ... ... . .... ........ ........... ........

3

G3

C

G

............................... ........ 4 ...... ..... .... .... ... ... .......... . . ............ ........... . ... . . . ... ... .. .. ... .. ... .. .... ..... . ... ... ... ... ... .. .. ... . . . . .... .. ... .. . . . . . . . . . . . ................. ... . ... .. .... .... ...... ..... ....... .................................

5

7

M

Bild 12.2: Gerschgorin-Kreise für Beispiel 12.10

12.4 Variationsformulierung für Eigenwerte von symmetrischen Matrizen Im Folgenden spielen orthogonale Komplemente von Mengen L  R N eine Rolle,

® ¯ L? WD y 2 R N W y>x D 0 für jedes x 2 L :

Es ist L?  R N ein linearer Unterraum. Falls L  R N ein linearer Unterraum ist, so gilt L ˚ L? D R N . Theorem 12.11 (Courant/Fischer). Für eine symmetrische Matrix A 2 R N N mit Eigenwerten 1  2  : : :  N gilt Folgendes,

kC1 D

N k D

min

max

x>Ax D x>x

max

min

x>Ax D x>x

L R N linear 0¤x2L? dim L  k

L R N linear 0¤x2L? dim L  k

jeweils für k D 0; 1; : : : ; N  1.

min

max

x>Ax ; (12.14) x>x

max

min

x>Ax ; (12.15) x>x

y1 ;:::;yk 2R N 0 ¤ x 2 R N x>y` D0; `D1;:::;k

y1 ;:::;yk 2R N 0 ¤ x 2 R N x>y` D0; `D1;:::;k

Abschnitt 12.4

331

Variationssätze für symmetrische Eigenwertprobleme

Beweis. Es wird nur der Nachweis für (12.14) geführt, die Aussage (12.15) ergibt sich ganz entsprechend. Die zweite Identität in (12.14) ist unmittelbar einsichtig, und im Folgenden soll die erste Identität in (12.14) nachgewiesen werden. Dazu sei u1 ; : : : ; uN 2 R N ein vollständiges System von Eigenvektoren ( zu den Eigenwerten 1 ; : : : ; N ), die aufgrund der Symmetrie der Matrix A zudem noch als paarweise orthonormal angenommen werden dürfen3 . Zum Beweis der Ungleichung “” in (12.14) sei L  R N ein beliebiger linearer Unterraum mit dim L  k . Dann gilt dim L?  N  k , und wegen dim span ¹ u1 ; : : : ; ukC1º D k C 1 existiert ein Vektor

x 2 span ¹ u1 ; : : : ; ukC1 º \ L? ;

x>x D 1:

(12.16)

Für den Vektor x aus (12.16) gilt insbesondere die Darstellung kC X1

x D

kC X1

˛ ` u` ;

`D1

j˛` j2 D 1;

`D1

mit gewissen Koeffizienten ˛1 ; : : : ; ˛kC1 2 R. Weiter gilt Ax D

x>Ax D

kC X1

` j˛` j2



kC1

`D1

kC X1

PkC1 `D1

` ˛` u` sowie

j˛` j2 D kC1 ;

`D1

was wegen x 2 L? gerade die angegebene Abschätzung “” in (12.14) liefert. Für den Beweis der Abschätzung “” in (12.14) sei speziell L WD span ¹ u1 ; : : : ; uk º gewählt. Für jeden Vektor x 2 L? mit x >x D 1 gibt es eine Darstellung N X

x D

˛ ` u` ;

`DkC1

N X

j˛` j2 D 1;

`DkC1

mit gewissen Koeffizienten ˛kC1 ; : : : ; ˛N 2 R. Daraus erhält man die Identität Ax D PN `DkC1 ` ˛` u` , und weiter N X

x>Ax D

N X

` j˛` j2  kC1

`DkC1

j˛` j2 D kC1 ;

`DkC1

was gerade die Abschätzung “” in (12.14) liefert. Als unmittelbare Folgerung aus Theorem 12.11 erhält man: Korollar 12.12 (Satz von Rayleigh/Ritz). Unter den Bedingungen von Theorem 12.11 gilt

1 D

3

max

0¤x2R N

x>Ax ; x>x

siehe auch (12.18) im Nachtrag zu diesem Kapitel

N D

min

0¤x2R N

x>Ax : x>x

332

Kapitel 12

Eigenwertprobleme

Bemerkung 12.13. Den Ausdruck

R.x/ D

x>Ax ; x>x

0 ¤ x 2 RN ;

bezeichnet man als Rayleigh-Quotienten.

12.5 Störungsresultate für Eigenwerte symmetrischer Matrizen Ein Störungsresultat für die Eigenwerte symmetrischer Matrizen ist bereits in Korollar 12.2 vorgestellt werden. Für den Spezialfall symmetrischer Störungen liefert das folgende Theorem eine Verschärfung des genannten Resultats. Theorem 12.14. Seien A; A 2 R N N symmetrische Matrizen, und für B 2 ¹ A; A; A C A º bezeichne 1 .B/  2 .B/  : : :  N .B/ die monoton fallend angeordneten Eigenwerte der Matrix B . Dann gilt

k .A/ C N .A/  k .A C A/  k .A/ C 1 .A/;

k D 1; 2; : : : ; N;

und damit insbesondere

j k .A C A/  k .A/j  jjA jj2 ;

k D 1; 2; : : : ; N:

(12.17)

Beweis. Theorem 12.11 und Korollar 12.12 ergeben für k D 0; 1; : : : ; N  1

kC1 .A C A/ D

min

N R N linear dim N k

 N k .A C A / D 

max

0¤x2N ?

N R N linear dim N k

......

x>x

C

® x >Ax ¯

......

max

® x >Ax

x>x min

0¤x2N ?

® x >Ax x>x x>x

C 1 .A/ D kC1 .A/ C 1 .A/;

C

® x >Ax ¯

x>Ax ¯ x>x

x>Ax ¯ x>x

C N .A/ D N k .A/ C N .A/:

Die Abschätzung (12.17) folgt nun unmittelbar aus der Identität r .A/ D jjA jj2 , siehe (4.35) auf Seite 83.

12.6 Nachtrag: Faktorisierungen von Matrizen Im Folgenden werden einige aus der linearen Algebra bekannte Matrix-Faktorisierungen in Erinnerung gerufen. Detaillierte Erläuterungen hierzu findet man zum Beispiel in Fischer [28] oder im Fall der Schur-Faktorisierung in Bunse / Bunse-Gerstner [11] oder Opfer [79].

Abschnitt 12.6

333

Nachtrag: Faktorisierungen von Matrizen

12.6.1 Symmetrische Matrizen Eine Matrix A 2 R N N heißt symmetrisch, falls A D A> gilt. Es existiert dann eine Orthonormalbasis u1 ; : : : ; uN 2 R N bestehend aus Eigenvektoren von A. Bezeichnet man die zugehörigen Eigenwerte mit 1 ; : : : ; N 2 R, so liegt folgende Situation vor:

μ

Auk D k uk ; u> u D ık` ; k `

(12.18)

k; ` D 1; 2; : : : ; N:

Theorem 12.15. Die Matrix A 2 R N N sei symmetrisch mit Zerlegung (12.18). Dann gilt

0

A D UDU >

1

U D @ u1 : : : uN A 2 R N N :

mit D WD diag . 1 ; : : : ; N / 2 R N N ;

Beweis. Jeder Vektor x 2 R N besitzt die Darstellung

x D

N X

˛` u`

`D1

mit gewissen Koeffizienten ˛1 ; : : : ; ˛N 2 R, und dann gilt

UDU >x D

N X

N X

˛` UDU >u` D

`D1

`D1

˛` U D e` D „ƒ‚… ` e`

N X

˛` ` u` D Ax:

`D1

12.6.2 Diagonalisierbare Matrizen Die Matrix A 2 R N N heißt diagonalisierbar, falls eine Faktorisierung der Form

T 1 AT D diag . 1 ; : : : ; N / 2 CN N ;

(12.19)

existiert mit einer regulären Matrix T 2 CN N . Die Zahlen 1 ; : : : ; N 2 C stellen dann die Eigenwerte der Matrix A dar, und der k -te Spaltenvektor uk 2 R N von T D .u1 j : : : juN / 2 CN N ist ein Eigenvektor der Matrix A zum Eigenwert k .

12.6.3 Schur-Faktorisierung Jede Matrix A 2 R N N ist ähnlich zu einer Dreiecksmatrix, wobei die Transformationsmatrix Q 2 CN N unitär gewählt werden kann, das heißt, Q1 D QH . Die entsprechende Faktorisierung

Q1 AQ D R

. Q 2 CN N

unitär;

wird als Schur-Faktorisierung bezeichnet.

R 2 CN N untere Dreiecksmatrix / (12.20)

334

Kapitel 12

Eigenwertprobleme

Weitere Themen und Literaturhinweise Eine Auswahl existierender Lehrbücher mit Abschnitten über Variationsformulierungen sowie Störungsresultate für die Eigenwerte symmetrischer und nichtsymmetrischer Matrizen bildet Deuflhard / Hohmann [22], Golub / Van Loan [35], Hämmerlin / Hoffmann [48], Hanke-Bourgeois [52], Horn / Johnson [58], Kress [63], Mennicken / Wagenführer [71], Oevel [78], Parlett [81], Schaback / Wendland [92], Stoer / Bulirsch [99] und Werner [111]. Variationsformulierungen und Störungsresultate für Singulärwertzerlegungen findet man in [58], [35] und in Baumeister [3].

Übungsaufgaben Aufgabe 12.1. (a) Gegeben seien die ( komplexen ) Tridiagonalmatrizen

0

a1

B Bc B 2 A D B B @

b2 a2 :: :

0

::

:

::

:

cN

0

0

1

a1

B B B c2 B D B B B @

C C C C; C bN A aN

b2 a2 :: :

0

0

::

:

::

:

cN

bN

1 C C C C: C C A

aN

Man zeige: Die komplexe Zahl ist ein Eigenwert der Matrix A genau dann, wenn  ein Eigenwert der Matrix B ist. (b) Für die reelle symmetrische Tridiagonalmatrix

0

a1

B Bb B 2 A D B B @

b2 a2 :: :

0

::

:

::

:

bN

0

1

C C C C 2 R N N C bN A aN

sei

ak D aN C1k

für k D 1; 2; : : : ; N;

bk D bN C2k

für k D 2; 3; : : : ; N;

erfüllt. Man weise Folgendes nach: eine Zahl 2 C ist Eigenwert der Matrix A genau dann, wenn  ein Eigenwert von A ist. (c) Man zeige, dass die Eigenwerte der Tridiagonalmatrix

0

0

B Bb B 2 A D B B @ 0

b2

0

0

::

:

::

::

:

:

bN

1

C C C C 2 C N N C bN A 0

symmetrisch zur Zahl 0 liegen und Folgendes gilt,

° det .A/ D

.1/N=2 jb2 b4 : : : bN j2 ; 0

falls N gerade; sonst.

335

Übungsaufgaben Aufgabe 12.2. Es sei A 2 R N N eine Matrix von der Form

A D . I  2vv> / D . I  2vv> / mit

D D diag . 1 ; : : : ; N / 2 RN N ; v 2 RN ; v>v D 1:

Man zeige: (a) Die Matrix A ist symmetrisch, und für k D 1; 2; : : : ; N ist die Zahl k ein Eigenwert von T A mit der k -ten Spalte aus der Matrix p I  2vv als zugehörigem Eigenvektor. > (b) Ist speziell v D . 1; 1; : : : ; 1 / = N , so erhält man mit der Notation A D . ajk / Folgendes,

ajk D

1

N

. N k ıjk  2 j  2 k C 2r /;

N 2 X

mit r D

N

s :

sD1

Aufgabe 12.3. Für eine symmetrische Matrix A 2 R N N und einen Vektor x D .xk / 2 R N mit xk ¤ 0 für k D 1; 2; : : : ; N bezeichne

dk WD

.Ax/k xk

für k D 1; 2; : : : ; N:

Man zeige: für jede Zahl  2 R enthält das Intervall Œ %; C%  mit % WD max1kN jdk  j mindestens einen Eigenwert der Matrix A. Aufgabe 12.4. Zu gegebener Jordanmatrix

0 B B A WD B B @



1



0

::

:

::

:

1

C C C 2 CN N C 1A

0

und einer Störungsmatrix B 2 C N N bezeichne k ./; k D 1; 2; : : : ; N , die Eigenwerte der fehlerbehafteten Matrix A C B , mit  2 C. Man weise mit dem Satz von Gerschgorin ( der auch für komplexe Matrizen richtig ist ) Folgendes nach: (a)

max j k ./  j  . jj B jj1 C 1 /j j1=N

1kN

für j j  1:

(b) Die Abschätzung in (a) ist in Bezug auf den Exponenten 1=N von j j nicht zu verbessern.

SN

Aufgabe 12.5. Sei A D . ajk / 2 R N N eine irreduzible Matrix, und G D j D1 Gj bezeichne die Vereinigung der Gerschgorin-Kreise. Man zeige: für jeden Eigenwert der Matrix A mit 2 @G gilt auch 2 @Gj für j D 1; 2; : : : ; N; und alle Komponenten eines zu gehörenden Eigenvektors sind betragsmäßig gleich groß. Aufgabe 12.6. Man zeige Folgendes: Für eine symmetrische Matrix A 2 R N N enthält jedes Intervall der Form Œ   jj Ax  x jj2 ;  C jj Ax  x jj2  mit einer Zahl  2 R und einem Vektor x 2 R N mit jj x jj2 D 1 mindestens einen Eigenwert der Matrix A. Aufgabe 12.7. Für eine symmetrische Matrix A 2 R N N mit den Eigenwerten 1  2  : : :  N weise man Folgendes nach:

k

D

N kC1

D

max

min

x>Ax ; x>x

min

max

x>Ax ; x>x

M R N linear 0¤x2M dim M Dk

M R N linear 0¤x2M dim M Dk

k D 1; 2; : : : ; N;

......

:

336

Kapitel 12

Eigenwertprobleme

Aufgabe 12.8. Seien A; A 2 R N N symmetrische Matrizen, und für B 2 ¹ A; A; ACA º bezeichne 1 .B/  2 .B/  : : :  N .B/ die angeordneten Eigenwerte der Matrix B . (a) Durch Angabe einer geeigneten Matrix A zeige man, dass die Abschätzungen4

k .A/ C N .A/  k .A C A/  k .A/ C 1 .A/

für k D 1; 2; : : : ; N;

nicht zu verbessern sind. (b) Falls die Matrix A positiv definit ist, so gilt

k .A/  k .A C A/

für k D 1; 2; : : : ; N:

Aufgabe 12.9. Es besitze eine symmetrische Matrix A 2 RN N mit monoton fallend angeordneten Eigenwerten 1  2  : : :  N eine rechte untere Dreiecksform,

0

p p p 0 a1N 1 p pp C p p B pp pp pp p C B A D B ; p p pp C @ 0 A pp aN 1 aN 2 p p p aNN 0

mit ajk D akj

für alle j; k:

Man zeige: es gilt k  0 für alle Indizes k  bN=2c, und außerdem gilt k  0 für alle Indizes k  dN=2e C 1. Hierbei bezeichnet bxc die größte ganze Zahl  x , und dxe ist die kleinste ganze Zahl  x .

4

siehe Theorem 12.14

13

Numerische Verfahren für Eigenwertprobleme

13.1 Einführende Bemerkungen Im Folgenden werden verschiedene numerische Verfahren zur approximativen Bestimmung von Eigenwerten quadratischer Matrizen vorgestellt. Dabei basiert eine Klasse von Algorithmen auf der Anwendung von Ähnlichkeitstransformationen, eine zweite auf Vektoriterationen.

13.1.1 Ähnlichkeitstransformationen In dem vorliegenden Abschnitt werden Verfahren vorgestellt, von denen jedes auf der Hintereinanderausführung von Ähnlichkeitstransformationen beruht,

μ

A D A.1/ ! A.2/ ! A.3/ ! : : : 1 A.m/ S ; A.mC1/ D Sm m

mit Sm 2 R N N regulär

m D 1; 2; : : : ;

(13.1)

mit der Zielsetzung, für hinreichend große Werte von m auf effiziente Weise gute Approximationen für die Eigenwerte von A.m/ zu gewinnen.1 Im weiteren Verlauf werden die folgenden speziellen Verfahren von der Form (13.1) behandelt. 

Mittels N  2 Householder-Ähnlichkeitstransformationen ( siehe Abschnitt 13.2 ) lässt sich eine obere Hessenbergmatrix A.N 1/ erzeugen, wobei obere beziehungsweise untere Hessenbergmatrizen allgemein folgende Gestalt besitzen,

0



B B B B B0 B B p B pp @ 0

ppp

ppp

ppp



 



pp

p

pp

p

pp

p

pp

p

pp p pp p

ppp

0





1

0

C C C C C C C C A

B B B B B B B B @

bzw.





pp p

pp

pp p pp p 

p

ppp

1

0 ppp pp pp p p pp pp p p pp p

0 pp C p C C

ppp ppp



C

N N : 0C C 2 R 

C C A

Eine Matrix B D .bjk / ist demnach genau dann eine obere Hessenbergmatrix, falls bjk D 0 gilt für j  k C 2. Entsprechend ist B D .bjk / genau dann eine untere Hessenbergmatrix, falls bjk D 0 für j  k  2 gilt. Die Hessenbergstruktur ist insofern von Vorteil, als sich hier mit dem NewtonVerfahren beziehungsweise auch mit dem QR-Verfahren effizient die Nullstellen des zugehörigen charakteristischen Polynoms bestimmen lassen ( siehe Abschnitt 13.3 beziehungsweise Abschnitt 13.5 ). 1

Diese Eigenwerte stimmen aufgrund der durchgeführten Ähnlichkeitstransformationen mit denen der Matrix A D A.1/ überein.

338

Kapitel 13 Numerische Verfahren für Eigenwertprobleme



Mit Givensrotationen ( siehe Abschnitt 13.4 für Einzelheiten ) lassen sich Matrizen A.m/ erzeugen, deren Nichtdiagonaleinträge für wachsendes m in einem zu spezifizierenden Sinn betragsmäßig immer kleiner werden, so dass dann die Diagonaleinträge von A.m/ gute Approximationen an die Eigenwerte von A darstellen.



QR-Verfahren ( siehe Abschnitt 13.5 ) liefern Matrizen A.m/ , deren Einträge im unteren Dreieck für hinreichend große Werte von m betragsmäßig klein ausfallen, und dann approximieren die Diagonaleinträge von A.m/ die Eigenwerte der Matrix A, wie sich herausstellen wird.

Mit der folgenden Bemerkung wird deutlich, warum man aus Stabilitätsgründen in (13.1) sinnvollerweise orthogonale Matrizen Sm wählt. Bemerkung 13.1. Im Folgenden sei die Matrix A 2 R N N als diagonalisierbar angenommen, T 1 AT D D mit der regulären Matrix T 2 R N N und der Diagonalmatrix D 2 R N N . Bekanntermaßen2 bildet dann bezüglich einer gegebenen Vektornorm jj  jjp die Zahl condp .T / eine Fehlerkonstante für den Fehler in den Eigenwerten von A gegenüber kleinen Störungen in der Matrix A, max

min j  j  condp .T /jjA jjp :

2 . ACA / 2.A/

Dementsprechend bildet also nach dem .m  1/-ten Schritt des Verfahrens (13.1) aufgrund von 1 .m/ b b T Tm D D m A

1 bm WD S1:::m mit T T;

S1:::m WD Sm    S1 ;

bm / eine Fehlerkonstante für den Fehler der Eigenwerte die Konditionszahl condp .T .m/ 2 . A / D .A/ gegenüber kleinen Störungen in der Matrix A.m/ . Wegen der bm /  condp .S1:::m / condp .T / ist demnach bezüglich der Norm Ungleichung condp .T jj  jj D jj  jj2 die Verwendung orthogonaler Transformationen empfehlenswert: Sk1 D Sk>

8k

)

bm / D cond2 .T /: cond2 .T

M

Für die einzelnen Verfahren gibt es noch weitere Gründe, die Transformationsmatrizen Sm orthogonal zu wählen. Details hierzu werden später vorgestellt.

13.1.2 Vektoriteration Bei der zweiten Klasse numerischer Verfahren zur Bestimmung der Eigenwerte von Matrizen handelt es sich um Vektoriterationen, die allgemein von der folgenden Form sind,

z .mC1/ D C z .m/ ;

m D 1; 2; : : :

.z .0/ 2 R N ;

C 2 R N N geeignet /;

mit der Zielsetzung, aus den Vektoren z .m/ 2 R N Informationen über einzelne Eigenwerte oder auch nur den Spektralradius r .A/ einer gegebenen Matrix A 2 R N N zu gewinnen. Details hierzu werden in Abschnitt 13.7 vorgestellt. 2

siehe Theorem 12.1

Abschnitt 13.2

339

Transformation auf Hessenbergform

13.2 Transformation auf Hessenbergform 1 A.m/ S ; m D 1; 2; : : : ; Es sollen zunächst Transformationen der Form A.mC1/ D Sm m N  2, vorgestellt werden, mit denen sukzessive Matrizen von der Form

0

A.m/

B B B B B B D B B B B B B @

 

0 pp p pp p pp p 0



ppp pp p pp p pp p

ppp

ppp pp

ppp ppp

ppp

p



pp p pp p







ppp



0 pp p





ppp



0



ƒ‚ m

pp p

pp p



…„

ppp

pp p



19 0 > > > C> B C= B .m/ C m B A1 C> B C> B > C> B C; D B C B C9 B C> B C= B C N m B a.m/ A> @ 0 ;

1

.m/

A2

.m/

A3

C C C C C C C (13.2) C C C C C A

ƒ‚ … N m .m/

2 R mm und den im Allgemeinen 2 R m.N m/ und A.m/ 2 R .N m/.N m/, sowie mit 3 N m .N  1/ 2R . Die Matrix A schließlich besitzt Hessen-

erzeugt werden mit der Hessenbergmatrix A1 .m/

vollbesetzten Matrizen A2 einem gewissen Vektor a .m/ berggestalt. 1 A.m/ S mit einer Das Vorgehen ist hier, in dem Schritt A.m/ ! A.mC1/ D Sm m .m/ Householdertransformation ( Abschnitt 13.2.1 ) den Vektor a aus (13.2) in ein Vielfaches des Einheitsvektors .1; 0; : : : ; 0/> 2 R N m zu transformieren und dabei das aus Nulleinträgen bestehende Trapez in der Matrix A.m/ zu erhalten. Die Transformationsmatrizen S1 ; : : : ; SN 1 sind hier orthogonal, was aus Stabilitätsgründen von Vorteil ist3 . Ein weiterer Vorteil besteht darin, dass für symmetrische Matrizen A 2 R N N die Matrix A.N 1/ 2 R N N ebenfalls symmetrisch und somit notwendigerweise ( als Hessenbergmatrix ) tridiagonal ist, das heißt, A.N 1/ ist dünn besetzt, was beispielsweise für die Anwendung des Newton-Verfahrens zur Bestimmung der Nullstellen des charakteristischen Polynoms der Matrix A.N 1/ von praktischem Vorteil ist.

13.2.1 Householder-Ähnlichkeitstransformationen zur Gewinnung von Hessenbergmatrizen Eine Möglichkeit zur Transformation auf Hessenbergform über ein Schema der Form 1 A.m/ S ; m D 1; 2; : : : ; N  2, besteht in der Anwendung von HouseA.mC1/ D Sm m holder-Transformationen,

0 Sm

1

B Im B D B B @ 0

3

0

Hm

siehe hierzu Bemerkung 13.1

C C C; C A

9 > > > > > .N m/.N m/ ; = Hm D IN m  2wmwm 2 R (13.3) > >w > wm 2 R N m ; wm > m D 1; > ;

340

Kapitel 13 Numerische Verfahren für Eigenwertprobleme

wobei Is 2 R ss mit s  1 die Einheitsmatrix bezeichnet und der Vektor wm 2 R N m so gewählt wird, dass4

Hm a D m em

(13.4)

gilt mit einem Koeffizienten m 2 R. Nach Lemma 4.60 auf Seite 91 ist die Matrix Sm orthogonal und symmetrisch, und mit (13.2)–(13.4) erhält man hier Matrizen A.m/ der Gestalt (13.2) beziehungsweise

0

A.mC1/ D Sm A.m/ Sm

1

B B B B B B B D B B B B B B @

.m/

.m/

Hm A3 Hm

m em

0

C C C C C C C C: C C C C C A

.m/

A 2 Hm

A1

(13.5)

Von Interesse ist der bei dieser Vorgehensweise anfallende Gesamtaufwand zur Berechnung der Matrix A.N 1/ : Theorem 13.2. Die Transformation auf obere Hessenberggestalt mittels HouseholderÄhnlichkeitstransformationen von der Form (13.5) lässt sich mit 10N 3 3

.1

C O.

1

N

//

arithmetischen Operationen realisieren. Beweis. Zu einem gegebenen Vektor wm 2 R N m lässt sich jede Matrix-Vektor> /x D x  2.w> x/w mit x 2 R N m Multiplikation von der Form Hm x D .I  2wm wm m m in 2.N  m/ Additionen und ebenso vielen Multiplikationen realisieren, insgesamt also in 4.N  m/ arithmetischen Operationen. Der gleiche Aufwand ist für jede Multiplikation x >Hm D .Hm x/> erforderlich. Dem Schema (13.5) entnimmt man, dass bei dem Schritt A.m/ ! A.mC1/ insgesamt 2.N  m/ C m D N  m C N solcher MatrixVektor-Multiplikationen erforderlich sind und dafür demnach 4.N m/2 C 4.N m/N arithmetische Operationen anfallen. Bei Durchführung des gesamten Schemas von A D A.1/ bis hin zur Berechnung von A.N 1/ summiert sich dies zu 4

NX 2 mD1

. .N  m/2

C N.N  m / / D 4

NX 1 mD2

„ ƒ‚ … . N 1 /N . 2N 1 / 6

NX 1

m2 C 4N

m D

mD2

10N 3 3

. 1 C O . N1 //

„ ƒ‚ …  1. N 21 /N  1

arithmetischen Operationen. Die Berechnung der Vektoren w1 ; : : : ; wN 2 erfordert nochmals die dagegen nicht weiter ins Gewicht fallenden O.N 2 / Additionen und ebenso viele Multiplikationen sowie O.N / Divisionen und genauso viele Quadratwurzeln. 4

Die genaue Form des Vektors wm 2 R N m ist in Lemma 4.62 auf Seite 92 angegeben.

Abschnitt 13.2

341

Transformation auf Hessenbergform

13.2.2 Der symmetrische Fall Falls die Matrix A 2 R N N symmetrisch ist, so erhält man aufgrund der Orthogonalität der Transformationsmatrizen für A.m/ die Form

2

A

.m/

6 6 6 6 6 6 6 D 6 6 6 6 6 6 6 4

ppp

p







ppp

0 pp p





pp p

pp p

ppp

0









pp

p

pp pp

0 pp p pp p pp p 0



p

0 ppp ppp pp pp p p pp  0 p



ppp

ƒ‚ m

ppp

ppp

39

1

0

> 0 > > > > pp 7 7 p 7=

B B B 7 m B 7 B > 0 7> B > 7> B > ; 7 D B  7 B 79 B B  7> 7> B = B pp 7 7 p 5 N m B @ > > ;

.m/

A1

0

a.m/ a.m/

0

>

.m/

A3

C C C C C C C C C C C C C C A



…„

ƒ‚ … (13.6) N m .m/ mit der Tridiagonalmatrix A1 2 R mm und der im Allgemeinen vollbesetzten Ma.m/ trix A3 2 R .N m/.N m/ , sowie mit einem gewissen Vektor a .m/ 2 R N m . Die Matrix A.N 1/ schließlich besitzt Tridiagonalgestalt. Die entsprechende HouseholderÄhnlichkeitstransformation liefert eine Matrix A.mC1/ mit der folgenden Struktur, 1 0

A.mC1/ D Sm A.m/ Sm

B B B B B B B B D B B B B B B B @

.m/

A1

0

m e> m

0

m em

.m/

Hm A3 Hm

C C C C C C C C C: C C C C C C A

(13.7)

Für zugrunde liegende symmetrische Matrizen A ist der bei dieser Vorgehensweise anfallende Gesamtaufwand zur Berechnung von A.N 1/ etwas geringer als für nichtsymmetrische Matrizen aus R N N : Theorem 13.3. Bei symmetrischen Matrizen A 2 R N N lässt sich durch HouseholderÄhnlichkeitstransformationen eine Tridiagonalmatrix gewinnen mit einem Aufwand von 8N 3 3

.1

1

C O . N //

arithmetischen Operationen. Beweis. Es sind die gleichen Überlegungen wie beim Beweis von Theorem 13.2 anzustellen, so dass hier nur die wenigen Modifikationen herausgestellt werden. So entnimmt man dem Schema (13.7), dass bei dem Schritt A.m/ ! A.mC1/ insgesamt

342

Kapitel 13 Numerische Verfahren für Eigenwertprobleme

2.N  m/ Matrix-Vektor-Multiplikationen mit Householdermatrizen 2 R .N m/.N m/ erforderlich sind und dafür demnach 8.N  m/2 arithmetische Operationen anfallen. Bei Durchführung des gesamten Schemas von A D A.1/ bis hin zur Berechnung von A.N 1/ summiert sich dies zu 8

NX 2

NX 1

mD1

mD2

.N  m/2 D 8

 . N  1 /N . 2 N  1 /  m2 D 8  1 D 6

8N 3 3

.1

1

C O . N //

arithmetischen Operationen. Die Berechnung der Vektoren w1 ; : : : ; wN 2 erfordert nochmals die vergleichsweise nicht weiter ins Gewicht fallenden O.N 2 / arithmetischen Operationen.

13.3 Newton-Verfahren zur Berechnung der Eigenwerte von Hessenbergmatrizen Im vorangegangenen Abschnitt 13.2 sind Methoden vorgestellt worden, mit denen man zu einer gegebenen Matrix A 2 R N N eine obere Hessenbergmatrix B 2 R N N gewinnt, deren Eigenwerte mit denen von A übereinstimmen, .B/ D .A/. In dem vorliegenden Abschnitt wird geschildert, wie sich die Eigenwerte von Hessenbergmatrizen effizient näherungsweise bestimmen lassen. Hierzu bedient man sich des Newton-Verfahrens mC1 D m  p.m /=p 0 .m /; m D 0; 1; : : :; zur iterativen Bestimmung der Nullstellen des zugehörigen charakteristischen Polynoms5 p./ D det .B  I /, dessen Nullstellen mit den Eigenwerten der Matrix B 2 R N N übereinstimmen. Bei vollbesetzten Matrizen ist diese Vorgehensweise mit cN 3 C O.N 2 / arithmetischen Operationen pro Iterationsschritt ( mit einer gewissen Konstanten c > 0 ) recht aufwändig. Bei Hessenbergmatrizen B jedoch lässt sich für jedes  der Aufwand zur Berechnung der Werte p./ und p 0 ./ auf jeweils O.N 2/ arithmetische Operationen reduzieren, wie sich im Folgenden herausstellen wird.

13.3.1 Der nichtsymmetrische Fall. Die Methode von Hyman Das charakteristische Polynom p./ einer Hessenbergmatrix und die zugehörige Ableitung p 0 ./ lassen sich jeweils über die Auflösung spezieller gestaffelter linearer Gleichungssysteme berechnen, wie sich im Folgenden herausstellen wird. Theorem 13.4. Sei B D .bjk / 2 R N N eine obere Hessenbergmatrix mit bj;j C1 ¤ 0 für j D 1; 2; : : : ; N  1 und charakteristischem Polynom p./ D det .B  I /;  2 R. Im Folgenden sei  2 R fest gewählt und kein Eigenwert von B , und es bezeichne x D x./ D .xk .// 2 R N den eindeutig bestimmten Vektor mit

.B  I /x D e1 ; 5

Entsprechende Konvergenzresultate finden Sie in Abschnitt 5.4.3.

(13.8)

Abschnitt 13.3

343

Newton-Verfahren zur Berechnung von Eigenwerten

mit e1 D .1; 0; : : : ; 0/> 2 R N . Dann gelten die folgenden Darstellungen,

p./ D

.1/N 1b21 b32    bN;N 1 ; xN ./

1 ıd 1 p./ . /: (13.9) D 0 p ./ xN ./ d xN ./

Beweis. Anwendung der cramerschen Regel auf die Gleichung (13.8) liefert die erste Aussage in (13.9),

0

xN

D

B B B B B det B B B B B @

1 b11  

b12



b1;N 1

pp

p

pp p pp p

pp

p

bN 1;N 1  

0 pp p pp p

bN;N 1

0

b22  

b21

b32

0

./

D

B b21 B B B B .1/N 1 det B B B B B @ „

1

C C C C Cı C p./ C C C C A 1

b22   p p p

C C C pp pp C b32 p p Cı C p./; C C pp p bN 1;N 1   C C A bN;N 1 ƒ‚ … D b21 b32    bN;N 1 b2;N 1

wobei man die Identität . / durch Entwicklung der auftretenden Determinante nach der letzten Spalte erhält. Dies ergibt die erste Identität in (13.9), und eine anschließende Differenziation liefert die zweite Aussage in (13.9). Bemerkung 13.5. In Theorem 13.4 stellt die Bedingung an das Nichtverschwinden der unteren Nebendiagonaleinträge keine ernsthafte Restriktion dar: im Fall bj;j C1 D 0 für ein j 2 ¹ 1; 2; : : : ; N  1 º lässt sich das Problem auf die Bestimmung der EigenM werte zweier Teilmatrizen von oberer Hessenbergstruktur reduzieren. Die für (13.9) erforderliche N -te Komponente der Lösung des Gleichungssystems (13.8) und deren Ableitung erhält man jeweils über die Lösung gestaffelter linearer Gleichungssysteme: Theorem 13.6. Mit den Bezeichnungen aus Theorem 13.4 erhält man die beiden Werd . x 1./ / aus den folgenden ( durch Umformung und Differenziatite 1=xN ./ und d N

344

Kapitel 13 Numerische Verfahren für Eigenwertprobleme

on von (13.8) entstandenen ) gestaffelten linearen Gleichungssystemen

.b11  /v1 C

C



C

b1;N 1 vN 1

C

b1 N

b21 v1 C . b22   /v2 C



C

b2;N 1 vN 1

C

b2 N

b12 v2

pp

pp

p

ppp

p

ppp

9 > > > D xN ./> > > > > > > D 0 > > > > = 1

> > > > > > 0 > > > > > > > > 0 ;

bN 1;N 2 vN 2  .bN 1;N 1   /vN 1 C bN 1;N D bN;N 1 vN 1

CbN N   D

(13.10) beziehungsweise

.b11  /z1 C

C



C

b1;N 1 zN 1

b21 z1 C .b22   /z2 C



C

b2;N 1 zN 1

b12 z2

pp

p

pp

p

pp p

9 > d 1 >  v1 D d . x ./ /> > > N > > > > > >  v2 D 0 > > > = pp p

bN 1;N 2 zN 2  .bN 1;N 1  /zN 1  vN 1 D

0

 1 D

0

bN;N 1 zN 1

> > > > > > > > > > > > > > ;

(13.11) die man rekursiv nach den Unbekannten vN 1 ; vN 2 ; : : : ; v1 ; 1=xN ./ beziehungsd . x 1./ / auflöst. weise zN 1 ; zN 2 ; : : : ; z1 ; d N

Beweis. Die Aussage (13.10) erhält man ( für vk D xk ./=xN ./ ), indem die einzelnen Zeilen des Gleichungssystems (13.8) durch xN ./ dividiert werden. Differenziadv tion der Gleichungen in (13.10) nach  liefert für zk D . dk /./ unmittelbar (13.11).

13.3.2 Das Newton-Verfahren zur Berechnung der Eigenwerte tridiagonaler Matrizen Ist die in Abschnitt 13.3.1 behandelte Matrix B 2 R N N symmetrisch, so ist sie notwendigerweise tridiagonal. In diesem Fall lassen sich die Werte p./ D det .B  I / und p 0 ./ auf einfache Weise rekursiv berechnen:

Abschnitt 13.3

345

Newton-Verfahren zur Berechnung von Eigenwerten

Lemma 13.7. Zu gegebenen Zahlen a1 ; : : : ; aN 2 R und b2 ; : : : ; bN 2 R gelten für die charakteristischen Polynome

0

pn ./ D det .Jn  I /;

Jn

1

a1 b 2

B Bb B 2 D B B @

pp

p

pp

p

pp

p

pp

p

bn

C C C C; bn C A an

n D 1; 2; : : : ; N;

die folgenden Rekursionsformeln

μ

p1 ./ D a1  ;

(13.12)

pn ./ D .an  /pn1 ./  bn2 pn2 ./;

n D 2; 3; : : : ; N;

mit der Notation p0 ./ WD 1. Für die Ableitungen gelten die Rekursionsformeln

p10 ./ D 1; 0 2 0 pn0 ./ D pn1 ./ C .an  /pn 1 ./  bn pn2 ./;

n D 2; 3; : : : ; N:

Beweis. Die angegebene Darstellung für p1 ergibt sich unmittelbar, und weiter gilt

p2 ./ D det

a1  

b2

b2

a2  

!

D .a1  / .a2  /  b22 ; „ ƒ‚ … D p1 .  /

was die angegebene Darstellung für p2 ist. Für n  3 erhält man

0

1

B a1   b2 C B C B C pp pp B b2 C p p B C B C B C pp pn ./ D det B C a   b p n2 n1 B C B C B C B bn1 an1   bn C B C @ A bn an   0 B a1   b2 B B pp pp B b2 p p B B ./ B pp D .an  /pn1 ./  bn det B p an3   bn2 B B B B bn2 an2   bn1 B @ 0 bn „ ƒ‚ ./

D bn pn2 ./

1 C C C C C C C C; C C C C C A …

346

Kapitel 13 Numerische Verfahren für Eigenwertprobleme

wobei sich die Identitäten . / beziehungsweise . / durch Determinantenentwicklung nach der letzten Spalte beziehungsweise der letzten Zeile ergeben. Dies komplettiert den Beweis der Identität (13.12). Die angegebenen Rekursionsformeln für die Ableitungen der Polynome pn erhält man unmittelbar durch Differenziation der Terme in (13.12).

13.4 Jacobi-Verfahren zur Nichtdiagonaleinträge-Reduktion bei symmetrischen Matrizen In dem folgenden Abschnitt 13.4.1 wird spezifiziert, inwieweit bei quadratischen Matrizen B die Diagonaleinträge Approximationen an die Eigenwerte von B darstellen ( für den Fall, dass die Nichtdiagonaleinträge von B betragsmäßig klein ausfallen ). Anschließend werden in Abschnitt 13.4.2 zu einer gegebenen symmetrischen Matrix 1 A.m/ S ; m D 1; 2; : : : A 2 R N N spezielle Verfahren von der Form A.mC1/ D Sm m behandelt, mit denen man sukzessive solche zu A ähnlichen Matrizen B mit betragsmäßig kleinen Nichtdiagonaleinträgen erzeugt.

13.4.1 Approximation der Eigenwerte durch Diagonaleinträge Vor der Einführung des Jacobi-Verfahrens und den zugehörigen Konvergenzbetrachtungen sind ein paar Ergänzungen zu den in Kapitel 12 vorgestellten allgemeinen Störungsresultaten für Eigenwerte erforderlich. Definition 13.8. Für eine symmetrische Matrix B D .bjk / 2 R N N ist die Zahl S .B/ 2 R C folgendermaßen erklärt, N X

S .B/ WD

2 bjk :

(13.13)

j; kD1 j ¤k

Offensichtlich gilt

S .B/ D jjB jj2F 

N X

2 bkk D jjB  D jj2F ;

mit D WD diag .b11 ; : : : ; bN N /; (13.14)

kD1

wobei jj  jjF die Frobeniusnorm bezeichnet. Der Wert S .B/ wird im Folgenden als Maß dafür verwendet, wie weit die Matrix B von einer Diagonalgestalt entfernt ist. Bei Matrizen mit ( gegenüber der Diagonalen ) betragsmäßig kleinen Nichtdiagonaleinträgen stellen die Diagonaleinträge Approximationen für die Eigenwerte dar. Genauer gilt Folgendes: Theorem 13.9. Seien 1  2  : : :  N die Eigenwerte der symmetrischen Matrix B D .bjk / 2 R N N , und seien bj1 j1  bj2 j2  : : :  bjN jN die der Größe nach angeordneten Diagonaleinträge von B . Dann gilt

jbjr jr  r j 

p S .B/;

r D 1; 2; : : : ; N:

Abschnitt 13.4

347

Das Jacobi-Verfahren für symmetrische Matrizen

Beweis. Mit der Notation D WD diag .b11 ; : : : ; bN N / erhält man max

rD1;:::;N

jbjr jr  r j

./



./

jjB  D jj2



jjB  D jjF D

p S .B/;

wobei die Ungleichung . / aus Theorem 12.14 angewandt mit A D B; A D D  B folgt. Die Abschätzung . / resultiert aus der allgemeinen Ungleichung jj  jj2  jj  jjF ( siehe Theorem 4.45 ), und die letzte Identität ist eine unmittelbare Konsequenz aus den Definitionen für jj  jjF und S ./, vergleiche die Darstellung (13.14).

13.4.2 Givensrotationen zur Reduktion der Nichtdiagonaleinträge Im Folgenden wird das Verfahren von Jacobi zur approximativen Bestimmung der Eigenwerte symmetrischer Matrizen A 2 R N N über die Reduktion der Nichtdiagonaleinträge vorgestellt, S .A/ > S .A.2/ / > : : : . Dieses Verfahren ist von der Form 1 A.m/ S ; m D 1; 2; : : : mit A.1/ D A, wobei die einzelnen ÄhnlichkeitA.mC1/ D Sm m stransformationen von der allgemeinen Form

0

1p B pp

1 b WD pq B B pq ;

pq

B B B B B D B B B B B @

1 1

s

c 1p

C C C C C C C C C C C A

pp

s

1

c 1p pp

" p

p 2 R N N (13.15) q

1

" q

sind mit einer symmetrischen Matrix B 2 R N N und mit speziell zu wählenden Indizes p ¤ q und reellen Zahlen

c 2 C s 2 D 1:

c; s 2 R ;

(13.16)

Im Folgenden soll zunächst ein allgemeiner Zusammenhang zwischen den Zahlen

b und S .B/ hergestellt werden. Hierzu beobachtet man, dass wegen der besonS .B/ deren Struktur der Matrix pq Folgendes gilt, 1

0 0

0

B B B B b 0 B D B C B B B B @

0

C C C C 0 C C C C A

0

0

0

" p

0

" q

p 2 R N N ; q

348

Kapitel 13 Numerische Verfahren für Eigenwertprobleme

b D .b b jk / die Einträge mit den Indizes .p; p/; .q; q/ und .p; q/ wobei in der Matrix B von besonderer Bedeutung sind: b bpp D c 2 bpp C 2csbpq C s 2 bqq ;

(13.17)

b b qq

(13.18)

D s 2 bpp  2csbpq C c 2 bqq ;

b b qp D cs.bqq  bpp / C .c  s /bpq ; bpq D b 2

b b jk

D bjk ;

2

j; k 62 ¹ p; q º;

(13.19) (13.20)

wobei B D .bjk /. Weiter gilt noch

b bpj D cbjp C sbjq ; b jp D b

b b jq D b b qj D sbjp C cbjq

für j 62 ¹ p; q º:

b Im folgenden Theorem 13.11 wird ein Zusammenhang zwischen den Zahlen S .B/ und S .B/ hergestellt, für dessen Beweis das folgende Resultat über die Invarianz der Frobeniusnorm gegenüber orthogonalen Transformationen benötigt wird. Lemma 13.10. Für jede Matrix B 2 R N N und jede orthogonale Matrix Q 2 R N N gilt die Identität jjQ1 BQ jjF D jjB jjF : Beweis. Zunächst sei an die aus der linearen Algebra bekannte Spur einer Matrix A D P .ajk / 2 R N N erinnert, spur .A/ D N kD1 akk . Die Aussage folgt nun unmittelbar aus den beiden folgenden Identitäten,

jjA jj2F D spur .A>A/;

spur .S T / D spur .T S/

für alle A; S; T 2 R N N ;

deren elementaren Nachweise hier nicht geliefert werden.

b und Das folgende Theorem stellt einen Zusammenhang zwischen den Zahlen S .B/ S .B/ her. Theorem 13.11. Für eine symmetrische Matrix B D .bjk / 2 R N N gilt mit den Bezeichnungen aus (13.15) Folgendes, 2 2 b D S .B/  2. bpq S .B/ b bpq /:

Beweis. Eine Anwendung von Lemma 13.10 und den Identitäten (13.14) und (13.20) liefert

b D jj B b jj2F  S .B/

N X

b b 2kk

kD1

D



jjB jj2F  „

N X kD1

ƒ‚ S .B /

2 bkk





2 2 2 C bpp C bqq b bpp b b 2qq :

(13.21)

Abschnitt 13.4

349

Das Jacobi-Verfahren für symmetrische Matrizen

Zur Verarbeitung der letzten vier Summanden in (13.21) verwendet man die Identitäten (13.17)–(13.19) in der folgenden Matrixschreibweise,

! b bpq bpp b D b bpq b b qq „ ƒ‚ … b DW b

c

s

!

s c

bpp bpq

!

c s

bpq bqq s „ ƒ‚ … DW b

! :

c

Die entstehenden Matrizen b und b b 2 R 22 sind also orthogonal ähnlich zueinander, und daher erhält man unter Anwendung von Lemma 13.10 2 2 2 2 2 b C b b 2qq C 2b D bpp C bqq C 2bpq ; bpp bpq „ ƒ‚ … „ ƒ‚ … D jjb jj2F D jjb b jj2F

(13.22)

und die Identitäten (13.21)–(13.22) ergeben dann die Aussage des Theorems. Mit Lemma 13.11 wird offensichtlich, dass ( bei festem Index .p; q/ ) im Fall b bpq D 0 b die Zahl S .B/ die größtmögliche Verringerung gegenüber S .B/ zu verzeichnen hat.

bpq D 0 erfüllt ist, Korollar 13.12. Wählt man in (13.15) die Zahlen c und s so, dass b dann gilt 2 b D S .B/  2bpq S .B/ :

Das folgende Theorem stellt eine Wahl der Zahlen c und s vor, mit der man b bpq D 0 erhält. Theorem 13.13. In (13.15) erhält man den Eintrag b bpq D 0 durch folgende Wahl der Zahlen c und s ( o. B. d. A. sei bpq ¤ 0 )

r

c D

1CC 2

r

; s D sgn.bpq /

1C 2

mit C D

bpp  bqq

. . bpp  bqq /2

2 / C 4bpq

1=2

: (13.23)

Beweis. Mit (13.19) folgt

b bpq

r

D ./

D

sgn.bpq /

1  C2 .bqq 4

 bpp / C C bpq

sgn.bpq /jbpq j.bqq  bpp /

. .bpp  bqq /2

1=2

2 / C 4bpq

C

bpp  bqq

. . bpp  bqq /2

1=2

2 / C 4bpq

wobei die Identität . / sich so ergibt:

r

1  C2 4

 .bpp  bqq /2 C 4b 2  .bpp  bqq /2 1=2 pq

D

1 2

D

jbpq j : 2 /1=2 ..bpp  bqq /2 C 4bpq

2 .bpp  bqq /2 C 4bpq

bpq D 0;

350

Kapitel 13 Numerische Verfahren für Eigenwertprobleme

Bemerkung 13.14. 1. Offensichtlich gilt in (13.23) jC j < 1, so dass dort die Zahl s wohldefiniert ist. Ebenso offensichtlich gilt dann c 2 C s 2 D 1, womit die Matrix pq in (13.15) orthogonal ist. 2. Bei einer Wahl von c und s entsprechend (13.23) tritt üblicherweise für gewisse b jk ¤ 0 gilt, Indizes .j; k/ 62 ¹ .p; q/; .q; p/ º üblicherweise auch der Fall ein, dass b M obwohl eventuell bjk D 0 erfüllt ist. Im Folgenden soll noch die spezielle Wahl des Indexes .p; q/ diskutiert werden. Korollar 13.12 legt nahe, .p; q/ so zu wählen, dass jbpq j maximal wird. In diesem Fall erhält man die folgende Abschätzung: Theorem 13.15. Für Indizes .p; q/ mit p ¤ q sei

jbpq j



jbjk j

für j; k D 1; 2; : : : ; N;

j ¤ k;

(13.24)

erfüllt. Mit den Bezeichnungen aus (13.15) und Einträgen c und s entsprechend Theorem 13.13 gilt dann die Abschätzung

b  .1  "N /S .B/; S .B/

mit "N WD

2

N .N  1/

:

Beweis. Wegen (13.24) gilt die Abschätzung

S .B/ D

N X

2 2 bjk  N.N  1/bpq ;

j; kD1 j ¤k

da die Anzahl der Nichtdiagonaleinträge N.N  1/ beträgt. Die Aussage folgt nun mit Korollar 13.12.

13.4.3 Zwei spezielle Jacobi-Verfahren Im Folgenden werden für das zu Beginn von Abschnitt 13.4 bereits vorgestellte Jacobi-Verfahren zwei unterschiedliche Möglichkeiten der Wahl der Indizes .p1 ; q1 /; .p2 ; q2 /; : : : behandelt. Das klassische Jacobi-Verfahren Algorithmus 13.16 (Klassisches Jacobi-Verfahren). Für eine gegebene symmetrische Matrix A 2 R N N setze man A.1/ WD A. for m D 1; 2; : : :: .m/

.m/

bestimme Indizes p; q mit japq j  jajk j für j; k D 1; : : : ; N; j ¤ k ; 1 A.m/  ; A.mC1/ WD pq pq ( * für pq aus (13.15) mit c und s wie in (13.23) * ) end M

Abschnitt 13.4

351

Das Jacobi-Verfahren für symmetrische Matrizen

Bemerkung 13.17. 1. Nach Theorem 13.15 konvergiert für die Matrizen A.m/ des klassischen Jacobi-Verfahrens die Messgröße S .A.m/ / ! 0 linear. Genauer gilt

S .A.m//  .1  "N /m S .A/ für m D 1; 2; : : :



"N D

2

N .N  1/

;

 A D A.1/ :

Ist eine absolute Genauigkeit > 0 vorgegeben, mit der die Eigenwerte der vorgegebenen Matrix A bestimmt werden sollen, so ist gemäß Theorem 13.9 nach

m



2

p

S .A/= /  log.1  "N /

log.



N 2 log.

p

S .A/= /

p

Schritten die gewünschte Genauigkeit erreicht, S .A.m/ /  . Für das Erreichen einer vorgegebenen Genauigkeit sind somit cN 2 Iterationsschritte durchzuführen. 2. In jedem Schritt des klassischen Jacobi-Verfahrens fallen etwa 4N Multiplikationen und 2N Additionen sowie O.1/ Divisionen und Quadratwurzelberechnungen an, insgesamt also 6N. 1 C O.1=N // arithmetische Operationen. Hinzu kommt in jedem Schritt der weitaus höher ins Gewicht fallende Aufwand zur Bestimmung des betragsmäßig größten Elements, wofür N.N  1/=2 Vergleichsoperationen erforderlich M sind.

Das zyklische Jacobi-Verfahren Mit Bemerkung 13.17 wird klar, dass beim klassischen Jacobi-Verfahren cN 4 CO.N 3 / Operationen für das Erreichen einer vorgegebenen Genauigkeit durchzuführen sind ( mit einer Konstanten c > 0 ), was die Anwendung dieses Verfahrens nur für kleine Matrizen zulässt. Daher ist die folgende Variante des Jacobi-Verfahrens in Betracht zu ziehen, die auf die Bestimmung des jeweils betragsmäßig größten Eintrags verzichtet:

Algorithmus 13.18 (Zyklisches Jacobi-Verfahren). Für eine gegebene symmetrische Matrix A 2 R N N setze man A.1/ WD A. for m D 0; 1; : : ::

B WD A.m/ ;

for p D 1 W N  1 1 B ; end B WD pq pq aus (13.15) mit c und s wie in (13.23) *)

for q D p C 1 W N (* für pq end

A.mC1/ WD B ; end

352

Kapitel 13 Numerische Verfahren für Eigenwertprobleme

Bemerkung 13.19. 1. Das zyklische Jacobi-Verfahren ist von der allgemeinen Form 1 A.m/ S ; m D 1; 2; : : : mit A.mC1/ D Sm m

Sm D D

. 12 13    1N /. 23 24    2N /    . N 2;N 1 N 2;N / N 1;N NY 1  pD1

N Y

 pq ;

qDpC1

wobei die Einträge c D c.p; q; j / und s D s.p; q; j / von pq entsprechend Theorem 13.13 gewählt sind. 2. In einem Schritt A.m/ ! A.mC1/ des zyklischen Jacobi-Verfahrens werden N.N  1/=2 Jacobi-Transformationen (13.15) mit insgesamt 3N 3 . 1 C O.1=N / / arithmetischen Operationen durchgeführt. Typischerweise ist nach m D O.1/ Schritten die Zahl S .A.m/ / hinreichend klein ( man beachte hierzu das nachfolgende Theorem 13.20 ), so dass man mit einem Gesamtaufwand von O.N 3/ arithmetischen OperaM tionen auskommt. Das zyklische Jacobi-Verfahren konvergiert im Falle einfacher Eigenwerte quadratisch im Sinne des folgenden Theorems. Eine Beweisidee dazu und Hinweise auf die entsprechende Originalliteratur findet man in Parlett [81]. Theorem 13.20. Falls alle Eigenwerte der symmetrischen Matrix A 2 R N N einfach auftreten, so gilt für die Matrizen A.m/ des zyklischen Jacobi-Verfahrens

S .A.mC1/ / 

S .A.m/ /2 ı

für m D 1; 2; : : :;

mit ı WD

min

;  2 .A/; ¤

j  j:

13.5 Das QR -Verfahren 13.5.1 Eindeutigkeit und Stetigkeit der QR -Faktorisierung einer Matrix Für das in den folgenden Abschnitten 13.5.2–13.5.3 behandelte QR-Verfahren zur approximativen Bestimmung der Eigenwerte einer Matrix werden die folgenden Aussagen über Eindeutigkeit und Stetigkeit der QR-Faktorisierung einer Matrix benötigt. Lemma 13.21 (Eindeutigkeit der QR -Faktorisierung). Für Orthogonalmatrizen Q1 ; Q2 2 R N N und reguläre obere Dreiecksmatrizen R1 ; R2 2 R N N sei

Q1 R1 D Q2 R2 erfüllt. Dann existiert eine Vorzeichenmatrix S D diag . 1 ; : : : ; N / 2 R N N mit

k 2 ¹ 1; 1 º, so dass Folgendes gilt,

Q2 D Q1 S;

R2 D SR1 :

Abschnitt 13.5

353

Das QR-Verfahren

Beweis. Nach Voraussetzung gilt

Q11 Q2 D R1 R21 DW S: Es sind Produkte und Inverse von orthogonalen Matrizen wieder orthogonal, und entsprechendes gilt für obere Dreiecksmatrizen. Folglich ist S sowohl obere Dreiecksmatrix als auch orthogonal,

0 ................................. 1 S 1 D S >;

B S D @

.............................................. ......................................... ..................................... ................................ ............................ ....................... ................... .............. .......... ..... .

C N N : A 2 R

(13.25)

Damit kann S nur eine Diagonalmatrix sein, S D diag . 1 ; : : : ; N / 2 R N N , und wieder wegen S 1 D S > erhält man k D 1= k für k D 1; 2; : : : ; N , woraus die Aussage des Lemmas folgt. .m/

Definition 13.22. Für Matrizen Am D .ajk / und A D .ajk / 2 R N N schreibt man

Am ! A für m ! 1

W”

.m/

ajk ! ajk für m ! 1 . j; k D 1; 2; : : : ; N /:

Bekanntermaßen gilt Am ! A für m ! 1 genau dann, wenn jjAm  A jj ! 0 für m ! 1 für irgendeine Matrixnorm jj  jj W R N N ! R erfüllt ist. Für die Konvergenzbetrachtungen des noch vorzustellenden QR-Verfahrens wird das folgende Resultat über die lokale Lipschitzstetigkeit der QR-Faktorisierung benötigt. Im Folgenden ist O.m / eine Kurzschreibweise für O.jjm jj2 /. Lemma 13.23 (Stetigkeit der QR-Faktorisierung). Für Orthogonalmatrizen Qm ; Q 2 R N N und obere Dreiecksmatrizen Rm ; R 2 R N N sei

DW m ‚ …„ ƒ Qm Rm  Q R ! 0

für m ! 1

(13.26)

erfüllt, und die Matrix Q R 2 R N N sei regulär. Dann existieren Vorzeichenmatrizen .m/

Sm D diag . 1

; : : : ; N / 2 R N N .m/

.m/

mit k

2 ¹ 1; 1 º;

(13.27)

mit

Qm Sm D Q C O.m /;

Sm Rm D R C O.m /

für m ! 1: (13.28)

Beweis. Es ist die Matrix R regulär, da Q und QR reguläre Matrizen sind, und somit können wir

bm WD Rm R1 R

354

Kapitel 13 Numerische Verfahren für Eigenwertprobleme

betrachten. Als Erstes beobachtet man

b> R b R m m D I C O.m /

für m ! 1;

(13.29)

was sich wie folgt ergibt,

b> b R m Rm

1 .R1 />R> D . R>/1 . Qm Rm />. Qm Rm /R1 m Rm R

D ./

D

.R> /1 . .QR /> C O.m / /. QR C O.m / / R1

D

.R> /1 R>R R1 C O.m / „ ƒ‚ … D I

für m ! 1;

wobei in . / noch zu beachten ist, dass jjB jj2 D jjB > jj2 gilt für beliebige Matrizen B 2 R N N . Im Folgenden wird mithilfe von (13.29) nachgewiesen, dass für gewisse Vorzeichenmatrizen Sm 2 R N N von der Form (13.27) Folgendes gilt,

bm D I C O.m / Sm R

für m ! 1:

(13.30)

Aus (13.30) folgert man dann nämlich die Darstellung (13.28),

Sm Rm Qm Sm

D

bm R D R C O.m /; Sm R

./

D

.Qm Rm /.Sm Rm /1

D

Q C O.m /

./

D

. QR C O.m / /. R1 C O.m/ /

für m ! 1:

2 Hierbei ist in ./ zu beachten, dass nach Voraussetzung Sm D I gilt, und für hinreichend große m ist die Matrix Rm regulär, was sich beispielsweise aus (13.26), der 1 jj D 1 ergibt. Die Identität ./ ist eine Regularität von QR und der Eigenschaft jjQm 2 Folgerung aus Korollar 4.50. Im Folgenden wird nun die Konvergenzaussage (13.30) nachgewiesen. Inverse und Produkte von oberen Dreiecksmatrizen bilden wieder obere Dreiecksmatrizen, somit bm eine obere Dreiecksmatrix. Man erhält dann folgende Zerlegung, ist insbesondere R

0 B B b Rm D B B @

b r .m/ 11

ppp .m/ p p p b r 22 pp p 



pp p

 .m/

b rNN

1

0



0 pp p pp p

C B C B .m/ .m/ C DW diag .b r 11 ; : : : ;b rNN / C B C B „ ƒ‚ … A @ DW Dm 0 „

pp

p

ppp

ppp pp p pp p



ppp

0

ƒ‚ DW Um

1

pp C p C



C: C A …

(13.31) Mit den Bezeichnungen aus (13.31) wird nun 2 Dm D I C O.m/;

Um D O.m /

für m ! 1

(13.32)

Abschnitt 13.5

355

Das QR-Verfahren .m/

nachgewiesen, woraus dann mit den Vorzeichenmatrizen Sm D diag . sgn.b r 11 /; : : : ; .m/ sgn.b r N N // unmittelbar (13.30) folgt. Zum Nachweis von (13.32) beobachtet man als Erstes 1 bm D . R b> R C Bm m/

1 b> b b> mit Bm WD . R m / . Rm Rm  I /:

Mit (13.29) folgt

Bm D O.m /; b 1 ; wobei noch zu beachten ist, dass (13.29) die Beschränktheit der Matrixfolge R 0

1 b b> b 1 jj1=2 ! 1 für m ! 1. b1 ; : : : nach sich zieht, jj R R m jj2 D jj. R m R m / 1 2 b> Zum Zweiten ist offensichtlich R m eine untere Dreiecksmatrix, und Inverse von 1 eine b> unteren Dreiecksmatrizen sind wieder untere Dreiecksmatrizen, so dass . R m/

untere Dreiecksmatrix ist. Daher stimmt notwendigerweise das strikte obere Dreieck von Bm mit dem strikten oberen Dreieck von Um überein. Insgesamt erhält man damit folgende Darstellung,

0 B Bm D B @

......... ................ ........................ ................................ ........................................ ................................................ ........................................................ ................................................................ ........................................................................

1 C C C Um D O.m /: A

Es ist nun klar, dass sich daraus die zweite Identität in (13.32) ergibt, und abschließend wird die erste Identität in (13.32) nachgewiesen, 2 > > b b> Dm D Dm Dm D . R m  Um /. R m  Um /

D

>b > b> b b> R m R m  Rm Um  Um Rm C Um Um D I C O.m / für m ! 1: „ ƒ‚ … „ ƒ‚ … „ ƒ‚ … „ ƒ‚ …

DI CO.m /

DO.m /

DO.m /

O.m /

Damit ist (13.32) und somit auch (13.30) nachgewiesen, und man erhält die Stetigkeitsaussage (13.28).

13.5.2 Definition des QR -Verfahrens Der folgende Algorithmus beschreibt in Form eines Pseudocodes das QR-Verfahren zur approximativen Bestimmung der Eigenwerte einer Matrix A. Algorithmus 13.24 (QR-Verfahren). Sei A 2 R N N eine beliebige reguläre Matrix.

A.1/ WD A; for m D 1; 2; : : :: bestimme Faktorisierung A.m/ D Qm Rm mit Qm 2 R N N orthogonal und Rm 2 R N N von oberer Dreiecksgestalt;

A.mC1/ WD Rm Qm 2 R N N ; end

M

356

Kapitel 13 Numerische Verfahren für Eigenwertprobleme

Wie sich gleich herausstellen wird, approximieren die Diagonaleinträge von A.m/ unter geeigneten Bedingungen für m ! 1 die Eigenwerte der Matrix A. Hierbei werden die folgenden Darstellungen für die Iterationsmatrizen A.m/ und die Potenzen Am benötigt. Lemma 13.25. Mit den Bezeichnungen aus Algorithmus 13.24 sowie der Notation

Q1:::m WD Q1 Q2    Qm ;

Rm:::1 WD Rm Rm1    R1 ;

(13.33)

gilt 1 A.m/ Q ; A.mC1/ D Qm m .......

D

1 Q1:::m AQ1:::m ;

Am D Q1:::m Rm:::1 ;

m D 1; 2; : : : ; ......

;

......

:

Beweis. Die erste Identität ist unmittelbar einsichtig, und daraus resultiert dann die zweite Identität, 1 .m/ 1 1 A.mC1/ D Qm A Qm D Qm Qm1 A.m1/ Qm1 Qm 1 D : : : D Qm    Q11 AQ1    Qm :

Die dritte Identität erhält man mittels vollständiger Induktion unter Verwendung des folgenden Arguments,

Q1:::m Rm:::1

D ./

D

Q1:::m1 Qm Rm Rm1:::1 D Q1:::m1 A.m/ Rm1:::1 AQ1:::m1 Rm1:::1

für m  1;

wobei in . / die gerade bewiesene zweite Identität eingeht. Damit ist Lemma 13.25 vollständig bewiesen. Wie sich im Verlauf des Beweises für den folgenden zentralen Konvergenzsatz herausstellen wird, hat die QR-Faktorisierung Am D Q1:::m Rm:::1 für die m-te Potenz der Matrix A insofern eine besondere Bedeutung, als dass sich die Matrix Rm:::1 bis auf die Vorzeichenwahl als ein Produkt von drei Matrizen darstellen lässt, bei der die m Diagonalmatrix diag . m 1 ; : : : ; N ) den dominanten Faktor darstellt. Weiter zeigt sich

1 m 1 schließlich, dass die Matrix A.m/ D Q1:::m 1 A Rm1:::1 dann eine Normierung von m A darstellt, bei der sich auf der Diagonalen die Werte 1 ; : : : ; N herauskristallisieren.

13.5.3 Konvergenz des QR -Verfahrens für betragsmäßig einfache Eigenwerte Unter gewissen Bedingungen konvergieren für m ! 1 die Diagonaleinträge von A.m/ gegen die betragsmäßig fallend sortierten Eigenwerte von A, wobei die Konvergenzgeschwindigkeit von der betragsmäßig betrachteten Trennung der Eigenwerte abhängt:

357

Das QR-Verfahren

Abschnitt 13.5

Theorem 13.26. Die Matrix A 2 R N N sei regulär und diagonalisierbar mit betragsmäßig einfachen Eigenwerten 1 ; : : : ; N 2 R, die o. B. d. A. betragsmäßig fallend angeordnet seien,

j 1 j > j 2 j > : : : > j N j > 0; (13.34)   und die Inverse der Matrix T D v1 j : : :j vN 2 R N N mit Eigenvektoren vk 2 R N zu k besitze ohne Zeilenvertauschung eine LR-Faktorisierung.6 Dann gilt für das in Algorithmus 13.24 beschriebene QR -Verfahren A.m/ D Sm USm C O.q m /

für m ! 1;

ˇ kC1 ˇ ˇ ˇ; k kD1::N 1

mit q WD

max

mit geeigneten Matrizen von der Form

0 .m/

Sm D diag . 1

.m/

B B B U D B B @ 2 ¹ 1 ; 1 º /;

1

pp

; : : : ; N / 2 R N N ;

. k.m/



p

ppp pp p pp p



pp p 

1 C C C C 2 R N N : C A (13.35)

N .m/

Insbesondere approximieren also die Diagonaleinträge von A.m/ D . ajk / die betragsmäßig fallend sortierten Eigenwerte von A, .m/

max jakk  k j D O.q m /

kD1::N

für m ! 1:

Beweis. Für die Eigenvektormatrix T 2 R N N aus der Voraussetzung des Theorems betrachte man eine QR-Faktorisierung,

0 .................................... 1 b T D QR;

Q2R

N N

orthogonal;

b D B R @

........................................... ......................................... ..................................... ................................ ............................ ....................... ................... .............. .......... ..... .

C N N : A 2 R

(13.36)

Es wird nun Folgendes nachgewiesen,

b R b1 /Sm C O.q m / A.m/ D Sm . RD

für m ! 1

(13.37-a)

mit Matrizen Sm 2 R N N von der Form (13.27) und der Diagonalmatrix

D WD diag . 1 ; : : : ; N / 2 R N N :

(13.37-b)

b R b1 . Für den Die Aussage des Theorems erhält man danach mit der Matrix U WD RD Nachweis von (13.37) benötigt man die vorausgesetzte Faktorisierung der Form 0 T 1 D LR;

1

B  B L D B pp @ p 

6

1 pp pp

p p

pp

ppp



C C C 2 R N N ; A

p 1

0 ................................. 1 B R D @

.............................................. ......................................... ..................................... ................................ ............................ ....................... ................... .............. .......... ..... .

C N N ; A 2 R (13.38)

Eine detaillierte Formulierung finden Sie in (13.38) im Beweis. Eine Erläuterung dazu liefert die anschließende Bemerkung 13.27.

358

Kapitel 13 Numerische Verfahren für Eigenwertprobleme

und beobachtet als Erstes, dass

Lm WD D m LD m D I C O.q m /

für m ! 1

(13.39)

gilt, denn mit der Notation L D .Ljk / gilt Lm D . . j = k /m Ljk /, und dann folgt (13.39) aus der Ungleichung j j = k j  q für j  k C 1. Im Weiteren wird eine

b m 2 R N N benötigt, QR-Faktorisierung von RL b m DW Q bm ; b mR RL

bm 2 R Q

N N

orthogonal;

0 ................................. 1 bm R

B D @

.............................................. ......................................... ..................................... ................................ ............................ ....................... ................... .............. .......... ..... .

C N N : A 2 R

b mR bm D R b CO. q m / D I R b CO. q m / für m ! Man erhält aus (13.39) die Konvergenz Q 1, und Lemma 13.23 über die Stetigkeit der QR-Faktorisierung liefert dann mit einer b m beziehungsweise den entsprechenden Vorzeichenwahl in den Spalten der Matrix Q bm Folgendes, Zeilen der Matrix R b m D I C O.q m /; Q

bm D R b C O.q m / R

für m ! 1:

(13.40)

Diese Konvergenzaussage ist der erste Schritt beim Nachweis von (13.37). Im zweiten Schritt ergeben sich für die Potenzen Am ; m  1, die beiden folgenden QR-Faktorisierungen, ./

b m LR Am D TD m T 1 D QRD

.13:39/

D

Am D Q1:::m Rm:::1 ;

bm D m R ; (13.41) b m D m R D QQ bm R Q RL „ƒ‚… „ƒ‚… „ ƒ‚ … Dreieck orthog. b Qmb Rm (13.42)

wobei in der ersten Identität von (13.41) die Faktorisierung A D TDT 1 eingeht, und die Identität . / resultiert aus (13.36) und (13.38). Die Identität (13.42) erhält man aus Lemma 13.25. Die Eindeutigkeit der QR-Faktorisierung ( vergleiche Lemma 13.21 ) liefert dann

b m SmC1 ; Q1:::m D QQ bm D m R; Rm:::1 D SmC1 R

mit

.mC1/

SmC1 D diag . 1

.

.mC1/

; : : : ; N

.mC1/

k

/ 2 R N N ;

2 ¹ 1; 1 º geeignet /:

Daraus erhält man

D I

Qm D

1 Q1:::m 1 Q1:::m

‚ …„ ƒ

D

1 1 b b Sm Q m1 Q Q Qm SmC1 ;

1 m 1 1 b b Rm D Rm:::1 Rm . D 1 /m1 R 1:::1 D SmC1 Rm D RR m1 Sm ; „ ƒ‚ … D D

und daraus wiederum 1 2 b 1 b b b A.m/ D Qm Rm D Sm Q m1 Qm SmC1 RmC1 D Rm Sm ; „ƒ‚… „ƒ‚… „ƒ‚… „ƒ‚… „ƒ‚… !I !I DI !b R !b R 1

Abschnitt 13.5

359

Das QR-Verfahren

wobei die angegebenen Konvergenzeigenschaften mit der Rate O.q m / gelten, wie man der Darstellung (13.40) entnimmt. Daraus erhält man schließlich die Identität bD R b1 C O.q m / für m ! 1. Dies komplettiert den Beweis (13.37), Sm A.m/ Sm D R des Theorems. Bemerkung 13.27. (a) Die Bedingung der Existenz einer LR-Faktorisierung für die Inverse der in Theorem 13.26 beschriebenen Eigenvektormatrix T ist äquivalent zu der Eigenschaft span ¹ e1 ; : : : ; en º \ span ¹ vnC1 ; : : : ; vN º D ¹ 0 º

für n D 1; 2; : : : ; N  1;

siehe Aufgabe 13.2. Hier bezeichnet ek 2 R N den k -ten Einheitsvektor. Wegen der fehlenden Kenntnis der Eigenvektoren v1 ; : : : ; vN ist diese Bedingung praktisch nicht nachprüfbar. (b) Im Falle komplexer Eigenwerte, .A/ 6 R, ist die Bedingung (13.34) des Satzes nicht erfüllt und auch die Aussage des zugehörigen Theorems verliert ihre Gültigkeit. Einzelheiten über die erforderlichen Modifikationen finden Sie beispielsweise in Oevel [78] und in Stoer / Bulirsch [99]. (c) Bei vollbesetzten Matrizen erfordert jeder Schritt des QR-Verfahrens wegen der notwendigen Berechnung einer QR-Faktorisierung cN 3 C O.N 2/ arithmetische Operationen. Daher ist es zweckmäßiger, zunächst eine Ähnlichkeitstransformation auf Hessenberggestalt gemäß Abschnitt 13.2 durchzuführen und die entstehende Matrix mit dem QR-Verfahren zu bearbeiten. Weitere Einzelheiten hierzu werden im folgenden Abschnitt 13.5.4 vorgestellt. (d) Eine alternative Präsentation des QR-Verfahrens findet man in Kress [63] ( siehe auch Watkins [109] ). M

13.5.4 Praktische Durchführung des QR -Verfahrens für Hessenbergmatrizen Ausgehend von dem letzten Aspekt der Bemerkung 13.27 wird im Folgenden für den Spezialfall einer Hessenbergmatrix A 2 R N N eine effiziente Vorgehensweise zur Berechnung der Iterierten7 A.2/ ; A.3/ ; : : : des QR-Verfahrens beschrieben. Prinzipielles Vorgehen bei der Durchführung des Schritts A.m/ ! A.mC1/ Zur Durchführung des Schritts A.m/ ! A.mC1/ hat man nach Definition zunächst .m/ eine QR-Faktorisierung A.m/ D Qm Rm für die Hessenbergmatrix A.m/ D . ajk / zu bestimmen, was sukzessive in der folgenden Form geschieht,

A.m/

D A.m;1/ ! A.m;2/ ! : : : ! A.m;N / DW Rm;

> A.m;k/ ; A.m;kC1/ D Smk 7

k D 1; 2; : : : ; N  1;

die allesamt von Hessenbergform sind, siehe Übungsaufgabe 13.3

μ (13.43)

360

Kapitel 13 Numerische Verfahren für Eigenwertprobleme

mit dem Ziel der schrittweisen Elimination der unteren Nebendiagonaleinträge,

0

A

.m;k/

B B B B B B B B B B B D B B B B B B B B B B @

.m;k/ p p p a11

pp

0 pp p pp p

pp

ppp

ppp

ppp

ppp

.m;k/

1

a1N

C C C C C .m;k/ C ak1;N C C .m;k/ C akN C Zeile k C (13.44) C C .m/ Zeile kC1 akC1;N C C C .m/ akC2;N C C C pp C p C A .m/ aN N pp p

p .m;k/

p ak1;k1

pp p pp p pp p

ppp

ppp

ppp

ppp

.m;k/

ppp

ppp

ppp

ppp

ppp

0

akk

0

akC1;k akC1;kC1

.m/

.m/ .m/

pp

ppp

ppp

.m/

akC2;kC1 akC2;kC2

0

0

ppp

ppp

p

pp

ppp

0

p

"

pp

p

.m/

aN;N 1

Spalte k wobei die verwendete Notation für die Einträge der Matrix A.m;k/ dadurch gerechtfertigt ist, dass die Matrizen A.m;k/ und A.m/ in den Zeilen k C 1; k C 2; : : : ; N übereinstimmen. Das angesprochene Ziel wird erreicht, wenn man im Zuge der Transformation (13.43) spezielle Givensrotationen Smk 2 R N N von der Form

0 B B B B B D B B B B B @

Smk

1

1 pp

C C C C C C C C C C A

p 1

c s s c 1

pp

p

 Zeile k  Zeile k C 1

1

"

Spalte k verwendet mit den folgenden Setzungen für die Zahlen c; s 2 R,

ca C sb D p sa C cb D 0

1

a2

C

b2

c D p bzw.

s D p

a a2 C b 2 b

a2 C b 2

.m;k/

mit

a WD akk

;

.m/

b WD akC1;k ;

wobei noch b ¤ 0 angenommen wird. Gilt andernfalls b D 0, so ist keine Transformation erforderlich und man kann c D 1; s D 0 setzen. In jedem Fall gilt c 2 C s 2 D 1 und Smk ist somit eine Orthogonalmatrix. Mit diesen Notationen ändert sich bei einer Transformation von der Form A.m;k/ pp pp pp > ! Smk A.m;k/ lediglich die in (13.44) gekennzeichnete Teilmatrix  p p p p p p  2

361

Das QR-Verfahren

Abschnitt 13.5

R 2.N kC1/ zu

c s s c

!  

ppp ppp  ppp ppp 

D

 ppp ppp  0  ppp 

2 R 2.N kC1/ :

Nach der Gewinnung einer QR-Faktorisierung A.m/ D Qm Rm für die Hessenbergmatrix A.m/ besteht der zweite Teil bei der Durchführung des Schritts A.m/ ! A.mC1/ des QR-Verfahrens in der Berechnung des Matrixprodukts A.mC1/ D Rm Qm mit Qm WD Sm1 Sm2    Sm;N 1 . Die Durchführung des Schritts A .m/ ! A .mC1/ in der Praxis Zur Speicherplatzersparnis führt man in der Praxis die beiden genannten Teile des Schritts A.m/ ! A.mC1/ simultan in der folgenden Form durch,

A.m/ D B .m;1/ ! B .m;2/ ! : : : ! B .m;N / DW A.mC1/ ; > B .m;k/ S B .m;kC1/ D Smk mk ;

μ (13.45)

k D 1; 2; : : : ; N  1;

wobei im Detail so vorgegangen wird: Algorithmus 13.28 (QR-Verfahren für Hessenbergmatrizen). Man berechnet

B .m;k/

.k;1/

> ! Smk B .m;k/

.k;2/

!

> Smk B .m;k/ Smk DW B .m;kC1/ ; k D 1; : : : ; N  1;

(13.46) > wobei nach dem Schritt .k; 1/ in der Matrix Smk B .m;k/ die Einträge mit den Indizes .m;kC1/

k C 1; k C 1 beziehungsweise k C 2; k C 1 mit den Werten akC1;kC1 beziehungsweise .m/

akC2;kC1 übereinstimmen und diese für die Berechnung der Givensrotation Sm;kC1

M

zwischenzuspeichern sind.

Die in dem Algorithmus 13.28 gewählte Reihenfolge bei der Durchführung der Matrizenmultiplikationen führt aufgrund der Assoziativität des Matrixprodukts dennoch tatsächlich auf die Matrix > > > .m/ B .m;N / D Sm;N Sm1 Sm2    Sm;N 1 D A.mC1/ : 1 Sm;N 2    Sm1 A .m;kC1/

Mit dem folgenden Lemma wird klar, dass sich die Werte akC1;kC1 beziehungsweise .m/ akC2;kC1 nach dem Schritt .k; 1/ tatsächlich an den genannten Positionen stehen. ( Bei dem darauf folgenden Schritt .k; 2/ aus (13.46) werden diese überschrieben. ) > B .m;k/ Lemma 13.29. Die in (13.46) nach dem Schritt .k; 1/ entstehende Matrix Smk ist von Hessenbergform. Deren Einträge stimmen in den Spalten k C 1; k C 2; : : : ; N

362

Kapitel 13 Numerische Verfahren für Eigenwertprobleme

mit denen der Matrix A.m;kC1/ aus (13.43) überein,

0

> Smk B .m;k/

D

.m;kC1/ p p p  a .m;kC1/ ppp ppp a1N 1;kC1 p p pp B pp B  p p p pp p B pp pp B0 p p p  p p B B pp p p .m;kC1/ .m;kC1/ Bp p  akC1;kC1 akC1;N B Bp pp .m/ .m/ .m/ B pp akC2;N p akC2;kC1 akC2;kC2 B p B pp pp pp pp p p p pp @p .m/ .m/ ppp 0 ppp ppp 0 aN;N 1 aN N 

1 C C C C C C C: C C C C C A

> S> > A.m/ D A.m;kC1/ und somit auch Beweis. Es gilt offensichtlich Smk    Sm 1 m;k1 > Smk B .m;k/ D A.m;kC1/ Sm;1    Sm;k1 . Im Folgenden wird mittels vollständiger Induktion über ` D 1; 2; : : : ; k die Darstellung

A.m;kC1/ Sm1    Sm;`1 0



B B B B0 Bp B pp Bp Bp Bp B pp Bp Bp p D B B pp B pp B B pp Bp B B pp Bp B B pp Bp @

ppp pp p pp p pp p





pp p pp p

p pp

 

pp



p



pp p pp p pp p

0  pp p 0 pp p



pp p pp p pp p ppp



pp p pp p

p p p  a.m;kC1/ 1;kC1 pp pp p p pp pp p p pp pp p p pp ppp p pp pp p p p pp pp p p p p pp pp p  p pp .m;kC1/ p 0 a pp

kC1;kC1 .m/

ppp

.m/

p akC2;kC1 akC2;kC2 pp pp p p

0 ppp ppp ppp ppp ppp ppp ppp

"

ppp

ppp

pp

p

.m/ aN;N 1

0

.m;kC1/

a1;N

1

C C C C C C C C C C C C C C C C .m;kC1/ C C akC 1;N C C .m/ akC2;N C C C pp C p A .m/ aN N pp p pp p pp p ppp pp p pp p pp p

Zeile Zeile

` `C1 (13.47)

Zeile

kC1

"

Spalte k C 1

Spalte `

nachgewiesen, so dass die Einträge in den Spalten k C 1; k C 2; : : : ; N mit denen der Matrix A.m;kC1/ übereinstimmen. Die Aussage des Lemmas folgt dann aus (13.47) mit ` D k . Die Identität (13.47) ist offensichtlich richtig für ` D 1. Ausgehend von der Darstellung (13.47) mit einem `  k  1 bedeutet die Multiplikation . A.m;kC1/ Sm;1    Sm;`1 /Sm;` eine Transformation der in (13.47) gekennzeichneten Teilmatrix,  

ppp ppp p  pp

0

 

!

ppp ppp p  pp

0



c s s c

 

 D

ppp pp p

ppp pp p

 

2 R .`C1/2 ;

Abschnitt 13.5

363

Das QR-Verfahren

so dass auch der Induktionsschritt abgeschlossen ist. Bemerkung 13.30. Mit dem Beweis wird auch deutlich, dass für k D 1; 2; : : : ; N  1 > B .m;k/ von nach dem ersten Teilschritt .k; 1/ aus (13.46) die entstehende Matrix Smk

Hessenberggestalt ist. Für die Matrizen B .m;2/ ; : : : ; B .m;N 1/ gelten die folgenden Darstellungen,

0

B .m;k/

ppp ppp ppp ppp ppp ppp  B ppp B pp B pp p p B0 B pp pp pp pp Bp p p p Bp pp pp pp p D B p 0 p p p Bp pp pp pp B pp p p  p B B pp p p ppp Bp 0 pp pp B pp p p p p p p p p p ppp @p 0 ppp ppp ppp ppp ppp 0   

ppp pp p pp p pp p

1 C C C C C C C C C C C C C C A

 Zeile k

. k D 2; 3; : : : ; N  1 /;

 Zeile k C 1

" " Spalte k Spalte k C 1 so dass die Matrizen B .m;2/ ; : : : ; B .m;N 1/ jeweils an der Position .k C 1; k  1/ von einer Hessenberggestalt abweichen. Beim Übergang B .m;k/ ! B .m;kC1/ wird zunächst  p p p p p p  2 R 2.N kC2/ gekennzeichnete Block durch die Transformation der durch  pp pp pp  

p ppp p p p ppp p p

 c s s c

!

 

p p ppp p p p ppp p

2 R 2.N kC2/

(13.48)

> B .m;k/ wird anschließend überschrieben, und in der daraus entstehenden Matrix Smk

mit der gekennzeichneten Teilmatrix 2 R .kC2/2 die Transformation p p

pp ppp

pp ppp

 

p p

!

pp ppp

pp  c s ppp s c

(13.49)

 

M

durchgeführt.

Mit der vorangegangenen Bemerkung lässt sich leicht der bei der Durchführung des Schritts A.m/ ! A.mC1/ anfallende Gesamtaufwand ermitteln. Theorem 13.31. Für Hessenbergmatrizen A lässt sich das Schema (13.45) zur Durchführung des Schritts A.m/ ! A.mC1/ des QR-Verfahrens mit 6N 2 . 1 C O . arithmetischen Operationen realisieren.

1

N

//

364

Kapitel 13 Numerische Verfahren für Eigenwertprobleme

Beweis. Eine Transformation der Form (13.48) erfordert .N  k C 2/  2  2 D 4.N  k C 2/ Multiplikationen und 2.N  k C 2/ Additionen, insgesamt fallen dabei also 6.N  k C 2/ arithmetische Operationen an. Entsprechend erfordert eine Transformation der Form (13.49) 6.k C 2/ arithmetische Operationen, und der Schritt k aus (13.46) – bestehend aus den beiden Transformationen (13.48)–(13.49) – benötigt also 6.N C 2/ arithmetische Operationen. Für die N  1 Schritte aus (13.46) sind demnach 6N 2 . 1 C O.1=N // arithmetische Operationen durchzuführen. Die Berechnung der Givensrotationen erfordert nochmals die dagegen nicht weiter ins Gewicht fallende Berechnung von N Quadratwurzeln und 2N Quotienten.

13.6 Das LR -Verfahren Alternativ zum QR-Verfahren kann man auch folgendermaßen vorgehen: Algorithmus 13.32 (LR-Verfahren). Sei A 2 R N N eine reguläre Matrix.

A.1/ WD A; for m D 1; 2; : : :: bestimme Faktorisierung A.m/ D Lm Rm mit Lm bzw. Rm 2 R N N von unterer bzw. oberer Dreiecksgestalt;

A.mC1/ WD Rm Lm 2 R N N ; end M

Für das LR-Verfahren lassen sich dem QR-Verfahren vergleichbare Resultate erzielen. Einzelheiten finden Sie beispielsweise in Stoer / Bulirsch [99].

13.7 Die Vektoriteration 13.7.1 Definition und Eigenschaften der Vektoriteration Definition 13.33. Für eine gegebene Matrix B 2 R N N lautet die Vektoriteration folgendermaßen:

z .mC1/ D Bz .m/ ;

m D 0; 1; : : :

. z .0/ 2 R N /:

(13.50)

Die Vektoriteration ermöglicht unter günstigen Umständen die Bestimmung des betragsmäßig größten Eigenwerts der Matrix B . Das nachfolgende Theorem liefert hierzu ein Konvergenzresultat für diagonalisierbare Matrizen B 2 R N N mit Eigenwerten 1 ; 2 ; : : : ; N 2 C. Hierzu sei noch folgende Sprechweise eingeführt: für einen Index 1  k  N besitzt ein gegebener Vektor x 2 CN einen Anteil in N .B  k I /,

Abschnitt 13.7

365

Die Vektoriteration

falls in der eindeutigen Zerlegung8 x D xk nicht verschwindet, xk ¤ 0.

PN

kD1 xk

mit xk 2 N .B  k I / der Vektor

Theorem 13.34. Für die diagonalisierbare Matrix B 2 R N N mit Eigenwerten 1 ; : : : ; N 2 C gelte 1 D 2 D : : : D r ; j r j > j rC1 j  : : :  j N j mit r  N  1.9 Falls der Startvektor z .0/ 2 R N einen Anteil in N .B  1 I / besitzt, gilt für die Vektoriteration (13.50)

jjz .mC1/ jj D j 1 j C O.q m / jjz .m/ jj

ˇ

ˇ

rC1 ˇ mit q WD ˇ < 1;

für m ! 1;

1

mit einer beliebigen Vektornorm jj  jj W CN ! R. Beweis. Es gibt eine Darstellung der Form z .0/ D x1 C k I /, und dann gilt allgemein

z .m/ D m 1 x1 C

 m m k x k D 1 x1 C

N X kDrC1

N X kDrC1

PN

kDrC1

. k1 /

m

xk mit xk 2 N .B 

 xk ;

m D 0; 1; : : : : (13.51)

Daraus erhält man nacheinander m .m/

1 z

D x1 C

N X kDrC1

j 1 jm jjz .m/ jj D jjx1 jj C O.q m / j 1 j1

jj z .mC1/ jj jj z .m/ jj

D

m

. k1 /

O . q mC1 /

jj x1 jj C jj x1 jj C O . q m /

xk D x1 C O.q m /

für m ! 1;

für m ! 1; ./

D

1 C O.q m /

für m ! 1; (13.52)

wobei die Identität . / wegen x1 ¤ 0 gilt. Die Identität (13.52) liefert dann unmittelbar die Aussage des Theorems. Bemerkung 13.35. In Theorem 13.34 stellt die Bedingung “z .0/ 2 R N besitzt einen Anteil in N .B  1 I /” keine wesentliche Einschränkung dar. Selbst falls z .0/ doch keinen Anteil in N .B  1 I / besitzt, so wird sich im Verlauf der Iteration aufgrund von Rundungsfehlern die in dem Beweis von Theorem 13.34 benötigte Eigenschaft M einstellen, dass die Vektoren z .m/ Anteile in N .B  1 I / besitzen. Das folgende Theorem liefert eine Folge reeller Zahlen, die im Falle symmetrischer Matrizen gegen den betragsmäßig größten Eigenwert konvergiert (und nicht gegen den Betrag davon). Theorem 13.36. Die Matrix B 2 R N N sei symmetrisch, und für ihre Eigenwerte 1 ; : : : ; N 2 R sei 1 D 2 D : : : D r ; j r j > j rC1 j  : : :  j N j mit r  8 9

bekanntlich gilt in der vorliegenden Situation R N D ˚N N .B  k I ) kD1 Im Fall r D N liegt die triviale Situation B D 1 I vor.

366

Kapitel 13 Numerische Verfahren für Eigenwertprobleme

N  1 erfüllt10 . Falls der Startvektor z .0/ 2 R N einen Anteil in N .B  1 I / besitzt, so konvergiert die zur Vektoriteration gehörende Folge der Rayleigh-Quotienten

rm D

.z .m/ />z .mC1/ ; jjz .m/ jj22

m D 1; 2; : : :

gegen den Eigenwert 1 ,

rm D 1 C O.q 2m /

ˇ

ˇ

rC1 ˇ mit q WD ˇ < 1:

für m ! 1;

1

Beweis. Wie im Beweis von Theorem 13.34 erhält man ( vergleiche (13.51) ) N X

 z .m/ D m 1 x1 C

kDrC1

. k1 /

m

 xk ;

m D 0; 1; : : :;

wobei hier o. B. d. A. angenommen werden darf, dass die Eigenvektoren x1 ; xrC1 ; xrC2 ; : : : ; xN 2 R N paarweise orthogonal sind. Daraus erhält man N X

 .z .m/ />z .mC1/ D 12mC1 jjx1 jj22 C

kDrC1

 jjz .m/ jj22 D 21m jjx1 jj22 C

N X kDrC1

2mC1

. k1 / 2m

. k1 /

 jjxk jj22 ;

 jjxk jj22 ;

und Quotientenbildung ergibt

rm D 1

jjx1 jj22 C

PN

jjx1 jj22 C

kDrC1

PN

 k 2mC1

kDrC1

D 1 C O.q 2m /

1

. k / 1

2m

jjxk jj22 ;

jjxk jj22

D 1

jjx1 jj22 C O. q 2mC1 / jjx1 jj22 C O. q 2m /

für m ! 1;

was die Aussage des Theorems liefert.

13.7.2 Spezielle Vektoriterationen Im Folgenden werden zwei spezielle Vektoriterationen vorgestellt. Definition 13.37. Für eine gegebene Matrix A 2 R N N ist die von Mises-Iteration folgendermaßen definiert,

z .mC1/ D Az .m/ ;

10

der Fall r D N ist trivial, B D 1 I

m D 0; 1; : : :

. z .0/ 2 R N /:

367

Weitere Themen und Literaturhinweise

Die von Mises-Iteration erhält man mit der speziellen Wahl B D A aus der Vektoriteration (13.50), und die Eigenschaften der von Mises-Iteration entnimmt man daher unmittelbar Abschnitt 13.7.1. Definition 13.38. Für eine gegebene Matrix A 2 R N N und eine Zahl  2 R n .A/ ist die inverse Iteration von Wielandt folgendermaßen erklärt,

.A  I /z .mC1/ D z .m/ ;

m D 0; 1; : : :

. z .0/ 2 R N /:

Bemerkung 13.39. Die inverse Iteration von Wielandt erhält man mit der speziellen Wahl B D .A  I /1 aus der Vektoriteration (13.50). Abschnitt 13.7.1 liefert daher für eine symmetrische Matrix A 2 R N N mit Eigenwerten 1 ; : : : ; N 2 R unmittelbar das Folgende: Ist k ein Index, für den für k D 1; 2; : : : ; N entweder

k D k oder j k  j < j k  j

erfüllt ist, so gilt für die dazugehörende Folge der Rayleigh-Quotienten rm ! . k  /1 beziehungsweise 1 rm C  ! k

für m ! 1:

M

Weitere Themen und Literaturhinweise Die in diesem Kapitel vorgestellten und andere Algorithmen zur numerischen Bestimmung der Eigenwerte von Matrizen finden Sie beispielsweise in den in Kapitel 12 genannten Lehrbüchern und in Bunse / Bunse-Gerstner [11] und Trefethen / Bau [104]. Verfahren zur numerischen Berechnung der Singulärwertzerlegung einer Matrix werden in [11], Deuflhard / Hohmann [22], Golub / Van Loan [35], Stoer / Bulirsch [99] und in Werner [111] vorgestellt.

Übungsaufgaben Aufgabe 13.1. Man weise nach, dass eine obere Hessenbergmatrix durch eine Ähnlichkeitstransformation mit einer Diagonalmatrix so umgeformt werden kann, dass die unteren Nebendiagonaleinträge nur die Werte 0 oder 1 annehmen. Aufgabe 13.2. Man zeige unter Verwendung von Aufgabe 4.8 auf Seite 98 Folgendes: für eine gegebene reguläre Matrix T D . v1 j : : : jvN / 2 R N N besitzt die Inverse T 1 genau dann eine LR-Faktorisierung, wenn Folgendes gilt, span ¹ e1 ; : : : ; en º \ span ¹ vnC1 ; : : : ; vN º D ¹ 0 º wobei ek 2 R N den k -ten Einheitsvektor bezeichnet.

für n D 1; 2; : : : ; N  1;

368

Kapitel 13 Numerische Verfahren für Eigenwertprobleme

Aufgabe 13.3. Das QR-Verfahren erhält eine Hessenberg- oder Tridiagonalform: ist die reguläre Matrix A von Hessenberg- beziehungsweise Tridiagonalform, so besitzen auch die zu dem QR-Verfahren gehörenden Matrizen A.2/ ; A.3/ ; : : : eine Hessenberg- beziehungsweise Tridiagonalform. Aufgabe 13.4. Es sei A 2 RN N eine symmetrische Matrix mit Eigenwerten 1 D 2 D : : : D r ; j r j > j rC1 j  : : :  j N j. Mit der Vektorfolge z .mC1/ D Az .m/ ; m D 0; 1; : : :, werde die Folge der Rayleigh-Quotienten

rm D

. z .m/ />z .mC1/ ; jj z .m/ jj22

m D 0; 1; : : :;

gebildet mit einem Startvektor z .0/ , der einen Anteil im Eigenraum der Matrix A zum Eigenwert 1 besitze. Man weise Folgendes nach: für einen Eigenvektor x zum Eigenwert 1 gilt sgn.rm /m

ˇm  ˇ z .m/ D x C O ˇ rC1 ˇ 1 jj z .m/ jj2

für m ! 1:

Aufgabe 13.5. Es sei A 2 R N N eine diagonalisierbare Matrix mit Eigenwerten 1 ; 2 ; : : : ; N ; für die 2 D  1 < 0 und j 2 j > j 3 j  : : :  j N j gelte. Für die Vektoriteration z .mC1/ D Az .m/ ; m D 0; 1; : : : weise man Folgendes nach ( jj  jj bezeichne irgendeine Vektornorm ): (a) Falls z .0/ einen Anteil im Eigenraum der Matrix A zum Eigenwert 1 besitzt, so gilt für einen Eigenvektor x1 zum Eigenwert 1 Folgendes:

ˇ ˇ2m  1 z .2m/ C z .2mC1/ D x1 C O ˇ 3 ˇ 1 jj 1 z .2m/ C z .2mC1/ jj

für m ! 1:

(b) Falls z .0/ einen Anteil im Eigenraum der Matrix A zum Eigenwert 2 besitzt, so gilt für einen Eigenvektor x2 zum Eigenwert 2 Folgendes:

ˇ ˇ2m  1 z .2m/  z .2mC1/ D x2 C O ˇ 3 ˇ . 2 m/ . 2 mC 1 / 1 jj 1 z z jj

für m ! 1:

Aufgabe 13.6. Es sei 1 eine einfache dominante Nullstelle des Polynoms n X

p.x/ D

ak x k mit an D 1:

kD0

Zu vorgegebenen hinreichend allgemeinen Startwerten x1n ; x2n ; : : : ; x0 2 R n¹ 0 º betrachte man die Folge n X1 xmCn D  ak xmCk ; m D 1; 2; : : : : kD0

Durch Anwendung der Vektoriteration auf die Transponierte der frobeniusschen Begleitmatrix zu p.x/ weise man Folgendes nach,

ˇ ˇm  xmC1 D 1 C O ˇ 2 ˇ xm 1

für m ! 1;

wobei 2 2 C eine nach 1 betragsmäßig größte Nullstelle des Polynoms p sei.

369

Übungsaufgaben Aufgabe 13.7 ( Numerische Aufgabe ). Für die Matrix A D .ajk / 2 R N N mit

ajk D

° N  j C 1; N  k C 1;

falls k  j; sonst,

bestimme man für N D 50 und N D 100 mit dem LR-Algorithmus numerisch jeweils sowohl den betragsmäßig kleinsten als auch den betragsmäßig größten Eigenwert. Sei Am D .m/ /; m D 0; 1; : : :; die hierbei erzeugte Matrixfolge. Man breche das Verfahren ab, falls . ajk m D 100 oder .m1/ .m/ jakk  akk j "m WD max  0:05 .m1/ kD1;:::;N jakk j erfüllt ist. Man gebe außer den gewonnenen Approximationen für die gesuchten Eigenwerte auch die Werte "1 ; "2 ; : : : an.

14

Restglieddarstellung nach Peano

14.1 Einführende Bemerkungen Für ganz unterschiedliche Verfahren ( zur Lösung auch ganz unterschiedlicher Problemstellungen wie etwa Interpolation sowie numerische Integration und Differenziation ) existiert ein eleganter und einheitlicher Zugang zur Herleitung von Fehlerdarstellungen. Dieser Zugang, der zudem Verallgemeinerungen schon bekannter Fehlerdarstellungen für Funktionen f mit geringeren Differenzierbarkeitseigenschaften ermöglicht, soll in dem vorliegenden Kapitel 14 in Grundzügen vorgestellt werden. Im Folgenden wird das lineare Funktional R W C 1 Œ a; b  ! R definiert durch n X

Rf D

˛k f .xk / C ˇ

Z b

kD0

a

f 2 C 1 Πa; b ;

f .x/ dx;

(14.1)

betrachtet. Dabei sind x0 ; x1 ; : : : ; xn 2 Œ a; b  paarweise verschiedene Stützstellen, und ˛k und ˇ 2 R sind gegebene Koeffizienten. Weiter bezeichnet C 1 Œ a; b  den Raum der stückweise stetigen Funktionen auf Œ a; b . Es sei angenommen, dass das Funktional R für ein r  0 auf dem Raum der Polynome vom Höchstgrad r verschwindet,

Rp D 0

8 p 2 …r :

Beispiel 14.1. Zu gegebenen Stützstellen x0 ; x1 ; : : : ; xn 2 Œ a; b  hat das Restglied bei der Polynominterpolation für einen ausgewählten Punkt x 2 Œ a; b  die folgende Gestalt,

Rf D

n X

f 2 C 1 Πa; b ;

f .xk /Lk .x/  f .x/;

kD0

mit den lagrangeschen Basispolynomen Lk .x/ D

Qn

xxj j D0;j ¤k xk xj

(14.2)

. Bekanntermaßen

gilt hier R j…n D 0, und für hinreichend glatte Funktionen f gilt die folgende Fehlerdarstellung1 :

Rf D

! . x / f .nC1/ .  / ; . n C 1 /Š

f 2 C nC1 Πa; b ; M

mit !.x/ WD .x  x0 /    .x  xn /.

Beispiel 14.2. Für eine gegebene interpolatorische Quadraturformel und für hinreichend glatte Funktionen f hat das Restglied die folgende Gestalt,

Rf D .b  a/

n X kD0

1

siehe (1.14)

k f .xk / 

Z b a

f .x/ dx;

f 2 C 1 Πa; b :

Abschnitt 14.2

371

Peano-Kerne

Per Definition ist für Quadraturformeln ein Genauigkeitsgrad von mindestens r gleichbedeutend mit der Eigenschaft R j…r D 0, und für Funktionen f 2 C mC1 Œ a; b  mit n  m  r sind bereits Fehlerabschätzungen bekannt2 . Auch hier stellt sich die M Frage nach Fehlerdarstellungen für weniger glatte Funktionen f .

14.2 Peano-Kerne Im weiteren Verlauf werden die folgenden Notationen verwendet: (a)

.x  t/m C WD

° .x  t/m ; 0;

x  t; x < t;

für m  1;

.x  t/0C WD

(b) für eine Funktion W Œ a; b  Œ c; d  ! R mit der Eigenschaft für jedes t 2 Œ c; d  bezeichnet

R x . .x; t// D R . .; t//;

° 1; 0;

x  t; x < tI

.; t/ 2 C 1 Πa; b 

t 2 Πc; d :

Das Argument von R x ist also jeweils als Funktion von x aufzufassen. Definition 14.3. Gegeben sei ein Funktional R W C 1 Œ a; b  ! R der Gestalt (14.1), welches auf dem Raum …r verschwindet. Dann bezeichnet man die Funktionen

Km .t/ WD

1



R x ..x  t/m C /;

t 2 Πa; b 

. m D 0; 1; : : : ; r /

als Peano-Kerne. Das folgende Theorem liefert die zentrale Aussage des vorliegenden Abschnitts. Der zugehörige Beweis beruht auf einer Approximation der Funktion f durch Polynome vom Grad  r , die mittels Taylorentwicklungen gewonnen werden. Theorem 14.4. Gegeben sei ein Funktional R W C 1 Œ a; b  ! R der Gestalt (14.1), welches auf dem Raum …r verschwindet. Für jedes 0  m  r gilt

Rf

D

Z b a

f .mC1/ .t/Km .t/ dt;

f 2 C mC1 Πa; b :

Falls weiterhin R.x rC1 / ¤ 0 erfüllt ist und der Peano-Kern Kr sein Vorzeichen nicht wechselt, so gilt die Darstellung

Rf

D ~f .rC1/ ./;

mit einer geeigneten Zwischenstelle  R . x rC1 / : . rC1 /Š

2

siehe Theorem 6.13

f 2 C rC1 Πa; b ;

(14.3)

D  .f / 2 Πa; b  und der Konstanten ~ D

372

Kapitel 14

Restglieddarstellung nach Peano

Beweis. Eine Taylorentwicklung der Funktion f in dem linken Randpunkt a mit Integraldarstellung des Restglieds liefert

DW pm .x/ 2 …m …„



f .x/ D f .a/ C f 0 .a/.x  a/ C : : : C 1

mit rm .x/ WD

Z x

mŠ a

ƒ f .m/ .a/ .x mŠ

f .mC1/ .t/.x  t/m dt D

1

Z b

mŠ a

 a/m C rm .x/;

x 2 Πa; b ;

f .mC1/ .t/.x  t/m C dt; x 2 Πa; b :

Somit erschließt man D0

Rf

‚…„ƒ  Z b .mC1/  1 R.pm C rm / D Rpm C Rrm D mŠ R x f .t/.x  t/m dt C a

D ./

1

D

Z b

mŠ a

f .mC1/ .t/R x ..x  t/m C / dt D

Z b a

f .mC1/ .t/Km .t/ dt; f 2 C mC1 Πa; b ;

wobei sich die Identität . / wie folgt berechnet,

Rx



Z

b

a

D D

f .mC1/ .t/.x  t/m C dt n X

˛k

Z b

kD0 Z b a

a



f .mC1/ .t/.xk  t/m C dt C ˇ

f .mC1/ .t/

n X kD0



˛k .xk  t/m C C ˇ

Z bZ b a Z b a

ƒ‚ R x ..x  t/m C/

a

.x

f .mC1/ .t/.x  t/m C dt dx   t /m C dx dt: …

Damit ist der erste Teil der Aussage des Theorems bewiesen. Wechselt nun der PeanoKern Kr sein Vorzeichen nicht, so liefert eine Anwendung des Mittelwertsatzes der Integralrechnung

Rf D

.



Z b a

Kr .t/ dt / f .rC1/ ./; ƒ‚ … DW ~

f 2 C rC1 Πa; b ;

(14.4)

mit einer geeigneten Zwischenstelle  D  .f / 2 Œ a; b . Eine Anwendung der Identität (14.4) auf das Monom x rC1 liefert schließlich die behauptete Darstellung für die Konstante ~ ,

R.x rC1 / D ~.r C 1/Š; womit auch die Darstellung (14.3) bewiesen ist.

Abschnitt 14.3

373

Anwendungen

Bemerkung 14.5. Auch für allgemeine Fehlerfunktionale der Form

Rf D

n0 X

˛0k f .x0k / C

kD0

n1 X

˛1k f 0 .x1k / C : : : C

kD0

ns X

˛sk f .s/ .xsk / C ˇ

kD0

Z b a

f .x/ dx (14.5)

für f 2 C mC1 Œ a; b  gelten für m D s; sC1; : : : ; r die Darstellungen aus Theorem 14.4 mit dem Peano-Kern aus Definition 14.3 ( noch allgemeiner dürften auch Terme mit gewichteten Integralen von Ableitungen der Funktion f auftreten ). Man hat sich nur zu überlegen, dass die Identität . / im Beweis von Theorem 14.4 auch in dieser allgemeinen Situation ihre M Gültigkeit behält.

14.3 Anwendungen 14.3.1 Interpolation Theorem 14.6. Zu gegebenen Stützstellen x0 ; x1 ; : : : ; xn 2 Œ a; b  besitzt bei der Polynominterpolation das Restglied für eine ausgewählte Stelle x 2 Œ a; b  die folgende Darstellung3

Rf D

n 1 X



Lk .x/

kD0

Z x k x

f .mC1/ .t/.xk  t/m dt;

f 2 C mC1 Πa; b  n Y x  xj

mit den lagrangeschen Basispolynomen Lk .x/ D

j D0 j ¤k

xk  xj

.0  m  n/;

.

Beweis. Nach Definition gilt für den Peano-Kern Km die folgende Darstellung, n  X

1

Km .t/ D



 m .xk  t/m C Lk .x/  .x  t/C ;

kD0

und daher

Rf

D

n  1 X

mŠ kD0

Lk .x/

Z x k a



D

 f .mC1/ .t/.xk  t/m dt  D 0 …„

a

f .mC1/ .t/.x  t / dt ƒ

Z x n   X 1 .mC1/ m m dt f .t/ L .x/.x  t/  .x  t / k k mŠ a kD0 Z x n  k 1 X  f .mC1/ .t/.xk  t/m dt ; C Lk .x/ mŠ x kD0

was in der behaupteten Darstellung resultiert. 3

Z x

vergleiche (14.2)

374

Kapitel 14

Restglieddarstellung nach Peano

14.3.2 Numerische Integration Beispiel 14.7 (Numerische Integration, Simpson-Regel). Das Restglied der SimpsonRegel zur numerischen Integration auf dem Intervall Π1; 1  hat die folgende Gestalt,

Rf D

1 f .1/ 3

C

4 f .0/ 3

C

1 f .1/ 3

Z 1



1

f 2 C 1 Π1; 1 ;

f .x/ dx;

und bekanntermaßen4 ist r D 3 der Genauigkeitsgrad der Simpson-Regel. Daher gilt für t  0 ( und m D 3 )

K3 .t/ D D D D

1 R x ..x 6

1 6 1 6

h h

 t/3C /

1 .1  3 1 3

0 

4 .0 3

t/3C C 4 3

0 C

 t/3C C

1 .1  3

 1 .1  t/3  4 .1  t/4 D 3

t/3C 

Z 1

t/3 

1 1 6

1 .1  3

t

1 .1 72

Z 1

.x  t/3C dx

i

1

.x  t/3 dx

i

 t/3 .1 C 3t/  0 für t 2 Œ 0; 1 :

Weiter gilt nach Aufgabe 14.2 die folgende Identität,

K3 .t/ D K3 .t/;

t 2 Π0; 1 ;

so dass der Peano-Kern K3 auf dem Intervall Œ 1 ; 1  von einem Vorzeichen ist, K3 .t/  0 für t 2 Œ 1; 1 . Also ist (14.3) anwendbar, und wegen R . x4 / 4Š

D

1 24

. 13

C

4 3

0 C

1 3

Z 1



1

x 4 dx / D

1 90

erhält man so die schon bekannte Fehlerdarstellung 1 f .1/ 3

C

4 f .0/ 3

C

1 f .1/ 3

Z 1



für f 2 C 4 Œ 1 ; 1 ;

1

f .t/ dt D

1 f .4/ ./ 90

 D  .f / 2 Π1; 1 :

M

Weitere Themen und Literaturhinweise Weitergehende Betrachtungen zur peanoschen Restglieddarstellung werden zum Beispiel in Hämmerlin / Hoffmann [48] und in Schaback / Wendland [92] angestellt.

Übungsaufgaben Aufgabe 14.1. Man zeige, dass für allgemeine Fehlerfunktionale der Form (14.5) die Darstellung aus Theorem 14.4 mit dem Peano-Kern aus Definition 14.3 für Werte m D s; s C 1; : : : ; r ihre Gültigkeit behält. 4

siehe Theorem 6.16

375

Übungsaufgaben

Aufgabe 14.2. Gegeben sei ein Funktional R W C 1 Œ a; b  ! R der Gestalt (14.1), welches auf dem Raum …r verschwindet, und m sei eine ungerade Zahl mit 1  m  r . Man zeige: falls

Rf D Rb f

für f 2 C mC1 Œ a; b 

mit b f

. a C2 b C x /

WD f .

aCb 2

 x /;

x 2 Œ

ba ba 2

;

2



erfüllt ist, so ist der Peano-Kern Km symmetrisch bezüglich des Intervallmittelpunkts, das heißt,

Km .

aCb 2

C x / D Km .

aCb 2

 x /;

x 2 Π0;

ba 2

Aufgabe 14.3. Im Folgenden betrachte man die Quadraturformel Qf WD

R1

:

R1 1

P .x/ dx zur nä-

herungsweisen Berechnung des Integrals 1 f .x/ dx , wobei für f 2 C 1 Œ 1; 1  das Polynom P 2 …5 die Lösung der folgenden hermiteschen Interpolationsaufgabe bezeichnet,

P 0 .xj / D f 0 .xj /

P .xj / D f .xj /;

für j D 0; 1; 2;

mit x0 D 1; x1 D 0 und x2 D 1. (a) Man zeige

Qf

D

7 f .1/ 15

C

1 0 f .1/ 15

C

16 f .0/ 15

C

7 1 f .1/  f 0 .1/: 15 15

(b) Zeige: die Quadraturformel Q besitzt den Genauigkeitsgrad 5. (c) Man berechne für n D 5 den Peano-Kern K5 zu der Quadraturformel Q und zeige, dass dieser sein Vorzeichen nicht wechselt. (d) Man bestimme unter Verwendung von (c) eine Fehlerdarstellung für die betrachtete Quadraturformel.

15

Approximationstheorie

15.1 Einführende Bemerkungen Eine wichtige Fragestellung der numerischen Mathematik ist es, bezüglich einer festgelegten Norm für eine gegebene Funktion eine Bestapproximation aus einer Menge von Funktionen zu bestimmen sowie den auftretenden Fehler abzuschätzen. Vergleichbare Fragestellungen treten auch für Vektoren anstelle von Funktionen auf. Beispiel 15.1. Die Frage der optimalen Wahl der Stützstellen bei der Polynominterpolation führt auf das Minimaxproblem1 max j.x  x0 / : : : .x  xn /j ! min

x2Πa;b 

für x0 ; x1 ; : : : ; xn 2 Œ a; b :

(15.1)

Die Gesamtheit aller Funktionen von der Form .x  x0 / : : : .x  xn / stimmt überein mit dem Raum der Polynome vom Grad n C 1 mit führendem Koeffizienten eins, so dass das Minimierungsproblem (15.1) äquivalent zu dem folgenden Approximationsproblem ist:

jjx nC1  p jj1 D

max jx nC1  p.x/j ! min

x 2 Πa;b 

für p 2 …n :

M

Beispiel 15.2. Lineare Ausgleichsprobleme besitzen die Form2

jjAx  b jj2 ! min

für x 2 R N ;

mit gegebener Matrix A 2 R M N und gegebenem Vektor b 2 R M . Diese können ebenfalls als Approximationsprobleme aufgefasst werden, bei dem aus der Menge ¹ Ax W x 2 R N º eine Bestapproximation an den Vektor b ( und anschließend ein M Urbild unter A ) zu bestimmen ist. In dem vorliegenden Abschnitt wird in Grundzügen eine allgemeine Theorie über Bestapproximationen – im Folgenden kurz als Proxima bezeichnet – vorgestellt. Definition 15.3. Für eine Teilmenge ¿ ¤ M  V eines normierten Raums . V ; jj  jj/ und ein gegebenes Element v 2 V heißt u ein M -Proximum an v , falls

u 2 M;

jju  v jj D

inf jju  v jj :

u2M



ƒ‚ … DW Ev . M /

Die Zahl Ev .M/ bezeichnet man als Minimalabstand des Elements v von der Teilmenge M . 1

Dieses Problem ist erstmalig in Abschnitt 1.6 behandelt worden unter gleichzeitiger Angabe einer Lösung. 2 siehe hierzu Abschnitt 4.8.5 für eine erstmalige Behandlung, wo zugleich Lösungsvorschläge zu finden sind

Abschnitt 15.2

377

Existenz eines Proximums

Bemerkung 15.4. (a) Natürliche Fragestellungen in diesem Zusammenhang sind Existenz und Eindeutigkeit eines Proximums u sowie die Angabe von Verfahren zur Bestimmung von u und eventuell noch die Herleitung von Abschätzungen für den Minimalabstand. (b) Das in Definition 15.3 beschriebene Problem ist ein Optimierungsproblem von der Form für u 2 M  V ;

f .u/ ! min

(15.2)

mit dem speziellen Zielfunktional f .u/ D jjuv jj. Allgemeine Probleme von der Form (15.2) sind Gegenstand der nichtlinearen Optimierung, die ein weites Feld darstellt und hier nicht weiter verfolgt wird. Literaturhinweise zu diesem Thema finden Sie M auf Seite 394.

15.2 Existenz eines Proximums In dem vorliegenden Abschnitt soll – im Anschluss an die Vorstellung zweier Beispiele – in einem allgemeinen Kontext die Frage der Existenz eines Proximums behandelt werden. Beispiel 15.5. Man betrachte die folgende spezielle Situation:

1

v

............... .. ............ . . ........... .. .. ........ . . . .............. .. .. . ...... .. .. ..... . . . . . . ..... .. .. .. .. .... . . . . . . . ....... . . . . . .. . . . . . . . . .... .... ... ... .... .... . . . . . . . ........ .. . . . . . . ..... .... . .... .. . .... . . . . . . . . . . ...... .... . . . . ..... . . . . . . . .. . . . . .... . . . . .... ... . . . . . . . . ... ... . .. . . . . . . . . . .... .. . . . . . . . . .. ... . .... . . . . . . . ..... ... . . . . . . . . .. ... . . . . . . . ... .... . ..... . . . . . . ....... . ...... ........ . . . ............. ............ . . ............ .................

 u

0

1

1

0

V

D R2 ;

jjv jj D jjv jj2 D . v12 C v22 /1=2 ; M D ¹ x 2 R 2 W jjx jj2  1 º:

1

p

p

Für den Vektor v D .2; 1/> ist u D . 2= 5; 1= 5 /> ein M -Proximum ( das hier zudem eindeutig bestimmt ist ) an den Vektor v . M Beispiel 15.6. Man betrachte nun die folgende Situation:

V

D C Π0; 1 ;

jjv jj D jjv jj1 D

max jv.t/j;

t 2 Π0; 1 

M D ¹ e ˇ t W ˇ > 0 º; und sei v  12 . Es ist jje ˇ t  v jj1 D e ˇ  und kein M -Proximum an v existiert.

1 2

>

1 2

für ˇ > 0, so dass Ev .M/ D

1 2

gilt M

378

Kapitel 15 Approximationstheorie

Die folgende Definition und das nachfolgende Lemma dienen der Herleitung einer ersten Existenzaussage für Proxima. Definition 15.7. Für eine Teilmenge ¿ ¤ M  V eines normierten Raums . V ; jj  jj/ und ein gegebenes Element v 2 V heißt .uk /k2N eine M -Minimalfolge an v , wenn

.uk /k2N  M;

jjuk  v jj ! Ev .M/

für k ! 1:

(15.3)

Lemma 15.8. Für eine Teilmenge ¿ ¤ M  V eines normierten Raums . V ; jj  jj/ und ein gegebenes Element v 2 V sei .uk /k2N eine M -Minimalfolge an v , die in M einen Häufungspunkt u besitze,

u 2 M;

jjuk  u jj ! 0

für N1 3 k ! 1

. N1  N geeignet /: (15.4)

Dann ist u ein M -Proximum an v . Beweis. Es gilt !0 für N1 3k!1

jju  v jj 

‚ …„ ƒ jju  uk jj

!Ev . M / für k!1

C

‚ …„ ƒ jjuk  v jj

und infolgedessen notwendigerweise jju  v jj  Ev .M/. Als unmittelbare Konsequenz aus dem vorangegangenen Lemma erhält man das folgende Resultat. Theorem 15.9. Ist ¿ ¤ M  V eine kompakte Teilmenge des normierten Raums . V ; jj  jj/, so existiert zu jedem Vektor v 2 V ein M -Proximum an v . Korollar 15.10. Ist U  V ein endlich-dimensionaler linearer Unterraum des normierten Raums .V ; jj  jj/, so existiert zu jedem Vektor v 2 V ein U-Proximum an v . Beweis. Die Menge

M WD ¹ u 2 U W jju  v jj  Ev .U/ C 1 º  U ist offensichtlich nichtleer und kompakt, nach Theorem 15.9 existiert also ein M Proximum u an v . Wegen

jju  v jj D

inf jju  v jj  sup jju  v jj  Ev .U/ C 1 

u2M

u2M

inf u2UnM

jju  v jj

gilt dann notwendigerweise jju  v jj D infu2U jju  v jj D Ev .U/. Zusammenfassend kann man festhalten, dass sowohl in kompakten Teilmengen von normierten Räumen als auch in endlich-dimensionalen linearen Unterräumen von normierten Räumen die Existenz eines Proximums gewährleistet ist.

Abschnitt 15.3

379

Eindeutigkeit eines Proximums

15.3 Eindeutigkeit eines Proximums In den beiden folgenden Unterabschnitten 15.3.1 und 15.3.2 werden in einem allgemeinen Rahmen jeweils ein hinreichendes Kriterium für die Eindeutigkeit eines Proximums hergeleitet.

15.3.1 Einige Notationen; streng konvexe Mengen Definition 15.11. Sei .V ; jj  jj/ ein normierter Raum. (a) Für x 2 V und r > 0 ist die abgeschlossene Kugel um x mit Radius r gegeben durch

B.xI r/ D ¹ y 2 V W jjy  x jj  r º: (b) Für eine Teilmenge M  V bezeichnet

M ı D ¹ x 2 M W es existiert ein " > 0 mit B.xI "/  M º den offenen Kern von M. Es heißt M offen, falls M ı D M gilt. Schließlich heißt M abgeschlossen, falls V nM eine in V offene Menge ist. Beispiel 15.12. In einem normierten Raum .V ; jj  jj/ ist B.xI r/ eine abgeschlossene M Teilmenge und es gilt B.xI r/ı D ¹ y 2 V W jjy  x jj < r º. Definition 15.13. Eine Teilmenge M  V des normierten Raums . V ; jj  jj/ heißt konvex, falls für je zwei Elemente x; y 2 M auch die Verbindungsstrecke von x nach y zu M gehört, das heißt,

¹ x C .y  x/ W

0   1 º  M;

x; y 2 M:

Es heißt M streng konvex, falls zu je zwei verschiedenen Punkten deren Verbindungsstrecke ohne die Endpunkte selbst zum offenen Kern von M gehört, das heißt,

¹ x C .y  x/ W

0 < < 1 º  Mı ;

x; y 2 M;

x ¤ y:

Offensichtlich ist eine streng konvexe Menge auch konvex. Lemma 15.14. Ist ¿ ¤ M  V eine konvexe Teilmenge des normierten Raums . V ; jj  jj/, so ist für jedes v 2 V die Menge der M–Proxima an v konvex. Beweis. Für zwei M –Proxima u1 und u2 an v sowie jede Zahl 2 Œ 0 ; 1  gilt

jj.1  /u1 C u2  v jj  .1  /jju1  v jj C jju2  v jj  .1  /Ev .M/ C Ev .M/ D Ev .M/:

Die streng konvexen Mengen liefern die erste Klasse von Mengen, in denen Proxima eindeutig sind:

380

Kapitel 15 Approximationstheorie

Proposition 15.15. Ist ¿ ¤ M  V eine streng konvexe Teilmenge des normierten Raums .V ; jj  jj/, so existiert zu jedem Element v 2 V höchstens ein M -Proximum an v.  Beweis. Seien u 1 und u2 M -Proxima an v 2 V nM ( im Fall v 2 M ist die Situation  klar ), und nach Lemma 15.14 ist dann auch 12 .u 1 C u2 / ein M -Proximum. Wenn nun 1 ı     u1 ¤ u2 gilt, so ist 2 .u1 C u2 / 2 M , und dann liegt für eine hinreichend klein gewählte Zahl 0 < < 1 die folgende Situation vor,

u

u WD .1  / jju  v jj



u1 C u2

C v

2

u 1

C u 2

2



u Cu 

M;



D

.1  /jj

D

.1  /Ev .M/ < Ev .M/;

2

v

.............................. 2 .......... . ......... . . ...... . .... ..... ............. . . .... ..... . ... ...... .... .... . . . ... . . . .. . . ... ............ . .  . . . . . .1 . 2. ... ..... . .... .. . . 2 . ........... .. . .. .. . . . . . . ... . ... .... . . . . .. ... . . . .... . . . . 1 ... . . ... . . . . ... . .... .... . . . . . . ... ... . . . . ... . ... . . . ..... . . . ... ..... . ......... . . ...... ....... ........... . ........... . ..........................

 vjj

u

M

und daraus resultiert ein Widerspruch.

15.3.2 Strikt normierte Räume Definition 15.16. Der normierte Raum .V ; jj  jj/ heißt strikt normiert, falls die abgeschlossene Einheitskugel B.0I 1/ streng konvex ist. Strikte Normiertheit bedeutet also Folgendes:

jjx jj D jjy jj D 1;

x¤y

)

jj.1  /x C y jj < 1 für 0 < < 1 .x; y 2 V /: (15.5)

Ein normierter Raum .V ; jj  jj/ ist demnach genau dann strikt normiert, wenn die Einheitssphäre ¹ x 2 V W jjx jj D 1 º keine Strecken enthält. Vier spezielle Situationen sind in den folgenden Bildern 15.1–15.4 dargestellt.

¹ x 2 R 2 W jjx jj1  1 º . ........ .... . ..... .... . . ..... ..... . . . . . . . ...... ...... . . . . . . . . . ....... . . .... . . . . . . . .... ..... . . . . . . . . ..... .... . . . . . . . . . ..... ....... . .. . .. . .. . .. . .. . .. . .. . .. . .. . .. . ........ .... . . . . . . . . . .... .... . . . . . . . . .... ..... . . . . . . . ..... ...... . . . . . . . . . . . ..... ..... . . . . .... ...... . . . . . ...... ..... . ..... ... ...... .....

1

1

1 2

1

Bild 15.1: . R ; jj  jj1 /, nicht strikt normiert

¹ x 2 R 2 W jjx jj2  1 º 1

1

................ ......... . . ......... ....... . . . . . . . . . ...... ..... . . . . . . ....... .... . . . . . . . . . .... ..... .. . .. . .. . .. . .. . .. . .. . .. . .. . .. ....... . .. . . . . . . . . . . . .. ... . . . . . . . . . . ... ... . . . . . . . . . . . ... .... .. . .. . .. . .. . .. . .. . .. . .. . .. . .. . .. . .. .... ... . . . . . . . . . . . .. .. . . . . . . . . . . . .... ... . . . . . . . . . . . .. ..... . . . . . . . . . . . . . . . . . . . ..... ... . . . . . . . . . .... ..... . . . . . . . .... ...... . . . . . . . . . . . . . ....... ....... . . . . ....... .............................

1 2

1

Bild 15.2: . R ; jj  jj2 /, strikt normiert

Abschnitt 15.3

381

Eindeutigkeit eines Proximums

¹ x 2 R 2 W jjx jj3  1 º 1

1

¹ x 2 R 2 W jjx jj1  1 º

.......................................... ........ . . . . . . ......... .... . . . . . . . . . ..... ..... . . . . . . . . . . . . . . . . . . . ..... ..... . . . . . . . . . . . . . . . . . . . . . .... .. . . . . . . . . . . .. .. . . . . . . . . . . . .. .. . . . . . . . . . . . . .. ... . . . . . . . . . . . ... .... .. . .. . .. . .. . .. . .. . .. . .. . .. . .. . .. . .. .... ... . . . . . . . . . . . .... .. . . . . . . . . . . . . . . . . . . . . . . . .. ... . . . . . . . . . . . . .. ... . . . . . . . . . . . ... ..... . . . . . . . . . . . . . . . . . . . . . ..... ... . . . . . . . . . . .... ...... . . . . . . . . . . . . . . . ...... .......... . . . .......... .............................

1

....................................................................................... .... . . . . . . . . . . . . . . . . . . . . . . . .... .... . . . . . . . . . . . . . . . . . . . . . . . .... .... . . . . . . . . . . . . . . . . . . . . . . . .... .... . . . . . . . . . . . . . . . . . . . . . . . .... .... . . . . . . . . . . . . . . . . . . . . . . . .... .... . . . . . . . . . . . . . . . . . . . . . . . .... .... . . . . . . . . . . . . . . . . . . . . . . . .... .... . . . . . . . . . . . . . . . . . . . . . . . .... .... . . . . . . . . . . . . . . . . . . . . . . . .... .... . . . . . . . . . . . . . . . . . . . . . . . .... .... . . . . . . . . . . . . . . . . ... ..... . . . . . . . . . . . . . . . . . . . . . . . ..... ................................................................................

1

1

1

1

1

Bild 15.3: . R 2 ; jj  jj3 /, strikt normiert Bild 15.4: . R 2 ; jj  jj1 /, nicht strikt normiert Bemerkung 15.17. Im Grunde genügt es, in (15.5) die Betrachtungen auf den Fall

D 1=2 zu beschränken, was etwa für beliebige 0 <  1=2 aus der Darstellung .1  /x C y D 12 .x C x C 2 .y  x// resultiert. M Nur in strikt normierten Räumen stellt zu je zwei linear unabhängigen Elementen die Dreiecksungleichung eine echte Ungleichung dar, wie sich mit dem folgenden Theorem herausstellt: Theorem 15.18. Ein normierter Raum .V ; jj  jj/ ist genau dann strikt normiert, wenn für beliebige Elemente 0 ¤ x 2 V und 0 ¤ y 2 V Folgendes gilt,

jjx jj C jjy jj D jjx C y jj

)

9 ˛ 2 K mit y D ˛x:

(15.6)

Beweis. “ )” Sei V strikt normiert, und für beliebige Elemente 0 ¤ x 2 V und 0 ¤ y 2 V gelte jjx jj C jjy jj D jjx C y jj. O. B. d. A. sei noch jjx jj  jjy jj, und dann berechnet man

ˇˇ x ˇˇ x ˇˇ y y ˇˇˇˇ y ˇˇˇˇ y ˇˇˇˇ ˇˇ C C   ˇˇ  ˇˇ jj x jj

jj y jj

jj x jj

D

jj x jj

jj x jj C jj y jj jj x jj

 jjy jj



jj x jj 1

jj x jj

jj y jj



1



jj y jj

D 2;

und die strikte Normiertheit impliziert

x y D ; jjx jj jjy jj

Ý

y D ˛x mit ˛ D

jj y jj : jj x jj

“( ” Umgekehrt sei nun die Eigenschaft (15.6) erfüllt, und für beliebige Vektoren x; y 2 V mit jjx jj D jjy jj D 1 sowie x ¤ y und 2 .0; 1/ ist

jj x C .1  /y jj < 1

(15.7)

nachzuweisen. Im Fall jjx jj < 1 oder jjy jj < 1 folgt (15.7) unmittelbar mit der Dreiecksungleichung, und im Folgenden gelte also jjx jj D jjy jj D 1. Falls nun im Wider./

spruch zur Ungleichung (15.7) die Identität jj x C .1  /y jj D 1 erfüllt ist, so gilt also

jj x jj C jj.1  /y jj D jj x C .1  /y jj D 1;

382

Kapitel 15 Approximationstheorie

und aufgrund von (15.6) existiert ein ˛ 2 K mit x D ˛.1  /y , beziehungsweise für ein ˇ 2 K:

x D ˇy

Im Folgenden wird ˇ D 1 nachgewiesen, was einen Widerspruch zu x ¤ y liefert. Wegen jjx jj D jjy jj D 1 gilt jˇ j D 1, und weiter berechnet man noch 0

./

D

j ˇ C .1  /j2  1 D j ˇ j2 C 2 .1  /Re ˇ C j 1  j2  1

D

2 .1  /.Re ˇ  1/

und daher Re ˇ D 1, was zusammen mit jˇ j D 1 den behaupteten Widerspruch ˇ D 1 liefert. Das folgende Theorem liefert eine weitere Klasse von Mengen, in denen Proxima eindeutig sind. Theorem 15.19. Ist U  V ein linearer Unterraum eines strikt normierten Raums .V ; jj  jj/, so existiert zu jedem Element v 2 V höchstens ein U-Proximum an v .  Beweis. Sind u 1 und u2 zwei verschiedene U -Proxima an v 2 V , so gilt aufgrund der strikten Normiertheit

jj

u1 C u2 2

„ ƒ‚ …

 vjj < Ev .U/;

2U

und daraus resultiert ein Widerspruch. Zusammenfassend kann man festhalten, dass sowohl in streng konvexen Teilmengen als auch in strikt normiert linearen Unterräumen die Eindeutigkeit eines Proximums gewährleistet ist.

15.4 Approximationstheorie in Räumen mit Skalarprodukt 15.4.1 Einige Grundlagen Relativ günstige Verhältnisse in Bezug auf Eindeutigkeit, Existenz und Berechnung von Proxima liegen für solche Normen vor, die durch ein Skalarprodukt induziert werden. Einige grundlegende Resultate hierzu werden im Folgenden vorgestellt, wobei als Erstes die Eigenschaften eines Skalarprodukts in Erinnerung gerufen werden. Der Einfachheit halber werden wieder reelle Vektorräume zugrunde gelegt. Definition 15.20. Ein Skalarprodukt auf einem Vektorraum V ist eine Abbildung h ; ii W V V ! R mit folgenden Eigenschaften: 



für jeden Vektor x 2 V sind die Abbildungen h x; ii und h ; x i W V ! R linear ( Bilinearität ); es gilt h x; x i > 0 für jeden Vektor 0 ¤ x 2 V

( Definitheit );

Abschnitt 15.4



383

Approximationstheorie in Räumen mit Skalarprodukt

für beliebige Vektoren x; y 2 V gilt h x; y i D h y; x i

( Symmetrie ).

Ein Skalarprodukt bezeichnet man auch als inneres Produkt. Theorem 15.21. Ein Skalarprodukt auf einem reellem Vektorraum V induziert eine Norm mittels jjx jj D h x; x i 1=2 für x 2 V . Beweis. Positive Definitheit und Homogenität der Norm sind jeweils unmittelbare Folgerungen aus der Definitheit und der Bilinearität des Skalarprodukts. Die Dreiecksungleichung für die Norm resultiert aus der cauchy-schwarzschen Ungleichung

jhh x; y i j  jjx jjjjy jj;

x; y 2 V ;

(15.8)

wobei in (15.8) Gleichheit genau dann vorliegt, wenn x und y linear abhängig sind. Einen Beweis für (15.8) finden Sie etwa in Fischer [28]. Beispiel 15.22. (a) Das klassische euklidische Skalarprodukt auf R N ist gegeben durch h x; y i 2 D x>y für x; y 2 R N . (b) Für eine symmetrische, positiv definite Matrix A 2 R N N ist durch h x ; y iA D x>Ay für x; y 2 R N ein Skalarprodukt auf R N definiert, welches im Zusammenhang mit dem Verfahren der konjugierten Gradienten3 von Bedeutung ist. (c) Zu gegebener Gewichtsfunktion % W Œ a; b  ! . 0; 1  stellt Z b

h p; q i WD

a

p; q 2 …;

p.x/q.x/%.x/ dx;

ein Skalarprodukt auf dem Raum aller reellen Polynome … dar.4

M

Wichtige und elementare Identitäten in diesem Zusammenhang sind

jjx C y jj2 D jjx jj2 C 2 h x; y i C jjy jj2 ; 2

2

jjx C y jj C jjx  y jj

2

2

D 2.jjx jj C jjy jj /;

x; y 2 V ; (15.9) ......

; (15.10)

wobei (15.10) als Parallelogrammgleichung bezeichnet wird. Als eine Folgerung aus dieser Identität erhält man die – für die Eindeutigkeit des Proximums in linearen Unterräumen relevante – strikte Normiertheit: Theorem 15.23. Ein Vektorraum mit einer durch ein Skalarprodukt induzierten Norm ist strikt normiert. Beweis. Die Aussage folgt unmittelbar aus der Parallelogrammgleichung (15.10) sowie aus der Eigenschaft (15.5) und Bemerkung 15.17. 3 4

siehe Abschnitt 11 Solche Skalarprodukte treten im Abschnitt 6.8 über die Gaußquadratur auf.

384

Kapitel 15 Approximationstheorie

15.4.2 Proxima in linearen Unterräumen Im Folgenden spielen orthogonale Komplemente von Mengen M  V eine Rolle,

M? WD ¹ y 2 V W h x; y i D 0 für jedes x 2 M º: Mit dem folgenden Theorem wird eine Charakterisierung für Proxima aus linearen Unterräumen vorgestellt. Theorem 15.24. Sei U  V ein linearer Unterraum U  V eines Vektorraums V mit innerem Produkt h ; ii. Es ist ein Element u 2 U genau dann ein U-Proximum an einen gegebenes v 2 V , wenn u  v 2 U? gilt. Beweis. “( ” Im Fall u  v 2 U ? berechnet man für ein beliebiges Element u 2 U mithilfe der Identität (15.9) Folgendes,

jju  v jj2 D jju  v C u  u jj2 2 U?

2 U

‚ …„ ƒ ‚ …„ ƒ 2 D jju  v jj2 C 2 h u  v; u  u i C jju  u jj  jju  v jj2 ; „ „ ƒ‚ … ƒ‚ … D 0  0 so dass u ein U-Proximum an den Vektor v darstellt. “ )” Im Fall u  v 62 U? existiert nach Definition ein Element 2 U mit  h u  v; i ¤ 0, o. B. d. A. sei h u  v; i < 0 erfüllt5 . In dieser Situation erhält man für hinreichend kleine Zahlen 0 < t 1 Folgendes,

jju C t

 v jj2 D jju  v jj2 C 2 thh u  v; i C t 2 jj jj2 < jju  v jj2 ; „ ƒ‚ … < 0 für 0 < t 1

so dass u kein U-Proximum an den Vektor v darstellt. Dies komplettiert den Beweis des Theorems. Für die Situation V D R 3 ist die Aussage von Theorem 15.24 in Bild 15.5 veranschaulicht.

v

.... ........ .... ... ................................................................................................................................................................................................. .. ............. . . . . . . . . . . . . . . . . . . . ............. ............ . . . . . . . . . . . . . . . . . . . ............ ... ............. . . . . . . . . . . . . . . . . . . . ............ ............. . . . . . . . . . . . . . . . . . . ........................ . . . . ... . . . . . . . . ...... ...... ... ............. . . . . . . . . . . . . . . . . . . . .............. ............ . . . . . . . . . . . . . . . . . . . ............. ... ............. . . . . . . . . . . . . . . . . . . . .............. .. ................... . . . . . . . . . . . . . . . . . . . ................. .................. . . . . . . . . . . . . . . . . . . ........................ . . . . . . . . . . . ........... . .. . . . . . . . . . . . . . . . . . .......... ............. . . ............. . . . . . . . . . . . . . . . .......................... ............ ............. . . . . ... .. . . . . . . . . . . . . . ............. ............ . . . . . . .. ........ . . . . . . . . . . . . ............ ............. . . . . . . . .... . . . . . . . . . ........................... . . . . . . . . . . . . ......... . . . . . . . . . . . . . . . . . . . .......... .............. . . . . . . . . . . . . . . . . . . . ............. ........................................................................................................................................................................................................

U

r  u

Bild 15.5: Darstellung der Aussage von Theorem 15.24 für V D R 3 und einen Unterraum U mit dim U D 2 Mit dem folgenden Theorem wird für endlich-dimensionale lineare Unterräume mit gegebener Basis eine Methode zur Bestimmung des Proximums geliefert. 5

andernfalls geht man von

zu 

über

Abschnitt 15.4

Approximationstheorie in Räumen mit Skalarprodukt

385

Theorem 15.25. In einem Vektorraum V mit innerem Produkt h ; ii sei U  V ein endlich-dimensionaler linearer Unterraum mit gegebener Basis u1 ; : : : ; um , und es sei P  u 2 U . Mit dem Ansatz u D m kD1 ˛k uk ist u genau dann ein U-Proximum an ein gegebenes Element v 2 V , wenn die Koeffizienten ˛1 ; : : : ; ˛m dem folgenden linearen Gleichungssystem genügen, m X

h uk ; uj i ˛k D h v; uj i 2 ;

j D 1; 2; : : : ; m:

(15.11)

kD1

Beweis. Man hat nur zu berücksichtigen, dass für einen beliebigen Vektor w 2 V die folgende Äquivalenz richtig ist6 :

w 2 U?



h w; uj i D 0

für j D 1; 2; : : : ; m:

Bemerkung 15.26. (a) Die im Zusammenhang mit Theorem 15.25 auftretende Matrix

0 B B B B @



1

h u1 ; u1 i

ppp

h um ; u1 i

pp p

pp

p pp

p

C C C 2 R mm C A

h u1 ; um i p p p h um ; um i ƒ‚ … DW G

wird als gramsche Matrix bezeichnet. Sie ist offensichtlich symmetrisch und wegen der Eindeutigkeit des Proximums auch regulär; schließlich liegt aufgrund der leicht Pm nachzuweisenden Identität ˛>G˛ D jj kD1 ˛k uk jj2 für ˛ D .˛1 ; : : : ; ˛m /> 2 R m auch positive Definitheit vor. Das zugehörige Gleichungssystem (15.11) nennt man Normalgleichungen ( für Proxima ). (b) Wenn mit den Bezeichnungen aus Theorem 15.25 die Vektoren u1 ; : : : ; um eine orthonormale Basis des Unterraums U bilden, so vereinfacht sich die Berechnung des Proximums zu

u D

m X

h v; uk i uk :

kD1

Diese Eigenschaft macht man sich beispielsweise beim Verfahren der konjugierten Gradienten zu Nutze. M Abschließend wird als weitere Anwendung von Theorem 15.24 eine Charakterisierung für Lösungen linearer Ausgleichsprobleme geliefert: Korollar 15.27. Zu gegebener Matrix A 2 R M N sowie gegebenem Vektor b 2 R M ist der Vektor x 2 R N genau dann eine Lösung des linearen Ausgleichsproblems jjAx  b jj2 ! min für x 2 R N , wenn x zugleich eine Lösung der Normalgleichungen A>Ax D A>b darstellt. 6

siehe Übungsaufgabe 15.2

386

Kapitel 15 Approximationstheorie

Beweis. Die Aussage folgt unmittelbar aus Theorem 15.24 unter Beachtung der Identität R.A/? D N .A>/, wobei R.A/ den Bildraum der Matrix A und N .A>/ den Nullraum der transponierten Matrix A> bezeichnet.

15.5 Gleichmäßige Approximation stetiger Funktionen durch Polynome vom Höchstgrad n  1 Eine wichtige Rolle auf dem Raum R N sowie auf Funktionenräumen kommt der gleichmäßigen Approximation zu, die mathematisch mittels Maximumnormen beschrieben wird. Solche Normen sind jedoch nicht durch Skalarprodukte induziert und somit die Resultate aus Abschnitt 15.4 nicht anwendbar. Auch strikte Normiertheit liegt in Vektorräumen mit Maximumnormen nicht vor, so dass Theorem 15.19 über die Eindeutigkeit von Proxima in linearen Unterräumen ebenfalls nicht anwendbar ist. Dennoch sind in solchen Räumen für spezielle lineare Unterräume Eindeutigkeitsaussagen möglich beziehungsweise existieren Lösungsverfahren. Im Folgenden sollen speziell die Unterräume …n1 des Raums C Œ a; b  betrachtet werden, wobei dieser mit einer gewichteten Maximumnorm von der Gestalt

jj

jj1;w WD

sup j .t/jw.t/;

t 2Πa;b 

2 C Πa; b ;

(15.12)

für t 2 Œ a; b :

(15.13)

versehen ist mit einer Gewichtsfunktion

w W Πa; b  ! R stetig;

w.t/ > 0

Das folgende Theorem liefert in der vorliegenden Situation eine Charakterisierung für …n1 -Proxima an stetige Funktionen. Theorem 15.28 (Alternantensatz). Mit den Bezeichnungen (15.12) und (15.13) seien eine Funktion f 2 C Œ a; b  sowie ein Polynom p  2 …n1 mit p  ¤ f gegeben. Dann sind die folgenden Aussagen (a) und (b) äquivalent: (a) p  ist ein …n1 -Proximum an f , es gilt also

jjf  p  jj1;w D

min jjf  p jj1;w :

p2…n1

(b) Es existiert eine Alternante s0 ; s1 ; : : : ; sn 2 Œ a; b  für f und p  , das heißt,

s0 < s1 < : : : < sn ; .f .sk /  p  .sk //w.sk / D .f .sk1 /  p  .sk1 / /w.sk1 / für k D 1; 2; : : : ; n; und diese Alternante besitzt die Eigenschaft

jf .sk /  p  .sk /jw.sk / D jjf  p  jj1;w

für k D 0; 1; : : : ; n:

Abschnitt 15.5

387

…n1 -Proxima bzgl. Maximumnormen

Beweis. “.b/ ) .a/”: Angenommen, es gibt ein Polynom p 2 …n1 mit der Eigenschaft sup jf .t/  p.t/jw.t/
0 impliziert .sk / > 0, und entsprechend impliziert f .sk /  p  .sk / < 0 die Ungleichung .sk / < 0. Daher wechselt die Funktion mindestens n-mal ihr Vorzeichen auf dem Intervall Œ a; b , und damit hat p  p  mindestens n paarweise verschiedene Nullstellen, woraus p D p  folgt, was einen Widerspruch zur Ungleichung (15.14) darstellt. “.a/ ) .b/”: Angenommen, es existiert keine Alternante für f und p  . In diesem Fall kann das Intervall Œ a; b  in 1  n  n abgeschlossene Teilintervalle

Ik D Πtk1 ; tk ;

1  k  n

. mit a D t0 < t1 < : : : < tn D b /

zerlegt werden, so dass Folgendes gilt:  

.f .tk /  p  .tk //w.tk / D 0 für k D 1; 2; : : : ; n  1; für jeden Index k 2 ¹ 1; 2; : : : ; n º existiert ein sk 2 Ik mit jf .sk /  p  .sk /jw.sk / D jjf  p  jj1;w ¤ 0; 8x 2 Ik W .f .x/  p .x//w.x/ ¤ .f .sk /  p  .sk / /w.sk / für k D 1; 2; : : : ; n I



für jeden Index k 2 ¹ 1; 2; : : : ; n  1 º gilt

.f .sk /  p  .sk //w.sk / D .f .skC1 /  p  .skC1 / /w.skC1 /:

388

Kapitel 15 Approximationstheorie

jj f  p  jj1;w jj f  p  jj1;w  "

...... .... ... ..................... ....... .......... ......... .... .... ...... ... .... .. ... ... ..... .... ... .. .. ... ... .... ... .. .. .... ... ... ... ... . . . . . . . .... ... .. .. . ... . . . . ... ... . .... . . .. . . . ... . . . ... ... .. . .. . . ... . . . . . ... . ... ... .. ... . . . . . . . . ... . ... ... . .. . . . . . . . ... . . . ... .. ... . .... . . . ... . . . . . . . . . . .. . . ... ........ ... .. ... .. . . . . ... . ... . .. ... .... . ... ... . . ..... ... . ... .. ... . ... . ... .. . . ... ... ... .. .. ... ... . . . . . ... .. . ... ... ... ... . . ... . . .. . ... ... .. . . .... . . . . . . . . ... . ...... 1 1 ...... 2 2 3 ... ... ... ... ... . ... .. .. ... . ... ... .. ... . . ... .. ... .. . . . ... ... .. .. ... ... .. ... ... .. ... ... .. .. ... ... ..... ... ... . . ...... . .. ... .. .. ... ........... .........

a

s

t

s

t

s

b

. f .x/  p  .x/ /w.x/

jj f  p  jj1;w C " jj f  p  jj1;w Bild 15.7: .a/ ) .b/: Beweisveranschaulichung für den Spezialfall n D 3

O. B. d. A. darf noch angenommen werden, dass

f .sk /  p  .sk / > 0

für k ungerade;

< 0

........

für k gerade:

Dann existiert notwendigerweise eine Zahl " > 0 mit inf .f .t/  p  .t//w.t/

 jjf  p  jj1;w C "

sup



t 2Ik t 2Ik

......

jjf  p  jj1;w  "

für k ungerade; für k gerade;

und dann gibt es ein Polynom p 2 …n 1 mit den folgenden Eigenschaften:

p < 0 auf Ik , falls k ungerade, p > 0 auf Ik , falls k gerade, jjp jj1;w  "=2, wobei die letztgenannte Eigenschaft durch Multiplikation mit einer kleinen positiven Konstanten folgt. Eine Illustration der vorliegenden Situation findet sich in Bild 15.7. Für das Polynom

p WD p   p 2 …n1 gilt dann f  p D f  p  C p und daher

.f  p/.t/ < .f  p  /.t/; inf .f .t/  p.t//w.t/

t 2Ik

 jjf 

p  jj

1;w

.f  p/.t/ > .f  p  /.t/; sup .f .t/  p.t//w.t/

t 2Ik

t 2 .tk1 ; tk / C "=2 t 2 .tk1 ; tk /

 jjf  p  jj1;w  "=2

für k ungerade; ......

für k gerade; ......

und infolgedessen ergibt sich der Widerspruch jjf  p jj1;w < jjf  p  jj1;w . Dies komplettiert den Beweis. Bemerkung 15.29. Die Voraussetzungen des Alternantensatzes lassen sich abschwächen. So genügt es, von der Funktion w anstelle Positivität lediglich Nichtnegativität zu fordern, das heißt, w.t/  0 für t 2 Œ a; b  7 , und außerdem kann die 7

Dann stellt jj  jj1;w im Allgemeinen keine Norm mehr dar, was aber hier keine Rolle spielt.

Abschnitt 15.6

389

Anwendungen des Alternantensatzes

Bedingung “p  ¤ f ” zu “jjf  p  jj1;w > 0” abgeschwächt werden. Weiter können – anstelle stetiger f – solche Funktionen f W Œ a; b  ! R D R [ ¹ 1; 1 º zugelassen werden, für die das Produkt f w eine auf dem Intervall Œ a; b  stetige Funktion ergibt. Der Beweis lässt sich ohne Weiteres auf diese allgemeinere Situation übertragen, für die ebenfalls Anwendungen existieren ( siehe Nemirovski˘ı/ Polyak [76] ). M Beispiele hierzu werden in den Aufgaben 15.3 und 15.4 vorgestellt.

15.6 Anwendungen des Alternantensatzes 15.6.1 Ein Beispiel Beispiel 15.30. Zu einer gegebenen konvexen Funktion f 2 C 2 Œ a; b  ist das …1 Proximum gesucht. Aus dem Mittelwertsatz der Differenzialrechnung erhält man eine Zwischenstelle  2 .a; b/ mit der Eigenschaft

f 0 ./ D

f .b /  f .a / ; ba

und das …1 -Proximum p  ist dann gegeben durch

p  .t/ WD D

1  f .b /  f .a / .t 2 ba

f .b /  f .a/ ba

f .b /  f .a / .t ba

 / C f ./ C

. t  a C2  /

C

f .a/ C f . / 2

;

 a/ C f .a/



t 2 R;

denn die Punkte s0 D a; s1 D  und s2 D b bilden eine Alternante,

.p   f /.a/ D .p   f /./ D .p   f /.b/ D jjp   f jj1 : Die vorliegende Situation ist in Bild 15.8 dargestellt.

.. .... .... .... .. .. .... .... .......... .. .. .... .... .............. .... .... .. . . . . . . . . . . . . . .... .. . .... .... ... .. .. .... .... ... .... .... .. ... . .... .... . ... .. .... ... . . . . . . . . . . . .............. ......... .. .... .... . ................ ... .. .... .... .... .................. ... .... .... .. ................. ....................... . .... .... . . . . . . . . . . . . . . . . . . . . .. ............... ...... ....... .... ................ .... .... ................... ... ................ ... .... .. .... .... ................ .... ..... .... .... .. ................ .. ... ..... ......................... . . . . . . .... . . . . ..... . . . . . . ... .. .... ............ ..... . . . . . . . . . . . . . .... .... .. . . . . . . . . . ...... .. . .. .... .... ................ ..... ...... .. .... .... .. ..... ........................... .. .... .... ...... ......... ............... ........... .... .... .. ...... . . . . . . . ........ .................................... . . . . . . . . . . .. ......... ..... ........ .... .... .. .......... ................ ......... .......... .... .... ............. ................ .... .......................... .... ...................... ................ .................................................... .... . . . . . . . . .. .... .... .... .. .. .... .... .... .... .. .. .... .... .... .... .. . . . . . . . . .... .... .. .... .... .... .... ..

f

M

%

p

%

%

% D jjp   f jj1 D Ef .…1 /

a



b

Bild 15.8: Veranschaulichung der in Beispiel 15.30 vorliegenden Situation

15.6.2 Eine erste Anwendung des Alternantensatzes Theorem 15.31. Für n  1 ist das Polynom

p  .t/ D t n 

1 T .t/; 2n1 n

t 2 R;

390

Kapitel 15 Approximationstheorie

bezüglich der Maximumnorm ein …n1 -Proximum an die Funktion f .t/ D t n ; t 2 Œ 1; 1 , mit

jjp   t n jj1 D

1

min jjp  t n jj1 D

2n1

p 2 …n1

:

Hierbei bezeichnet Tn 2 …n das n-te Tschebyscheff-Polynom der ersten Art, es gilt also Tn .t/ D cos .n arccos t/; t 2 Œ 1; 1 . Beweis. Der führende Koeffizient von Tn ist 2n1 ( siehe Theorem 1.23 auf Seite 14 ), 1 und somit gilt p  2 …n1 . Weiter gilt offensichtlich jjp   t n jj1 D 2n 1 , und das System sk D cos .

.nk/ n

skn  p  .sk / D

/;

k D 0; 1; : : : ; n, bildet aufgrund von 1

2n1

Tn .sk / D

.1/nk

für k D 0; 1; : : : ; n;

2n1

eine Alternante, so dass aus Theorem 15.28 die Aussage des Theorems folgt. Als unmittelbare Konsequenz ergibt sich das folgende Resultat ( vergleiche Theorem 1.24 ): .n/

Korollar 15.32. Für die Zahlen tk D cos . die folgende Optimalitätseigenschaft: min

.2k1/ 2n

./

max j.t  y1 / : : : .t  yn /j

D

y1 ;:::;yn 2 Π1;1  t 2Π1;1 

./

D

.n/

/;

k D 1; 2; : : : ; n ( mit n 2 N ) gilt

max

t 2 Π1; 1 

1 2n1

.n/ j.t  t1 / : : : .t  tn.n/ /j

:

.n/

Beweis. Bei den Werten t1 ; : : : ; tn handelt es sich um die Nullstellen des Tschebyscheff-Polynoms Tn , und der führende Koeffizient von Tn lautet 2n1 ; daraus resultiert die Identität . /. Die Ungleichung “” in . / ist offensichtlich richtig, und “” schließlich erhält man wie folgt: 1 2n1

./

D

min jj p  t n jj1 

p2…n1

„ ƒ‚ … 2 …n

min

max

y1 ;:::;yn 2 Π1;1  t 2 Π1;1 

j .t  y1 / : : : .t  yn / j; „ ƒ‚ … 2 …n

wobei die Identität ./ eine Konsequenz aus Theorem 15.31 ist.

15.6.3 Eine zweite Anwendung des Alternantensatzes Als eine weitere Anwendung des Alternantensatzes erhält man das folgende Resultat. Es liefert nachträglich die Optimalität der im Beweis von Theorem 11.19 über die Konvergenzraten beim Verfahren der konjugierten Gradienten verwendeten Polynome ( bezogen auf das Intervall Œ m; M  ).

Abschnitt 15.7

391

Haarsche Räume, Tschebyscheff-Systeme

Theorem 15.33. Ausgehend von Zahlen 0 < m  M gilt für das Polynom

p  . / WD cTn

 M C m  2  ;

c WD Tn

M m

 M C m 1

. 2 R /;

M m

Folgendes:

p  2 …n ; max mM

p .0/ D 1;

jp  . /j D

min

(15.15) max

p2…n mM p.0/D1

jp. /j D Tn

 M C m 1 M m

:

(15.16)

Beweis. Die Eigenschaft (15.15) ist offensichtlich richtig, und für den Nachweis von (15.16) betrachtet man die folgenden Darstellungen,

jp  . /j D

max mM

min

max

p2…n mM p.0/D1

1

max mM

jp. /j D

j  q  . /j D c mit q  . / WD min

max

q2…n1 mM

j

1



1  p  . /



2 …n1 ;

 q. /j;

und erhält die Aussage des Theorems mittels Theorem 15.28 angewandt mit q  anstelle p  sowie

Πa; b  D Πm; M ;

w. / D ;

1

f . / D ;

unter Berücksichtigung der Tatsache, dass

k WD 

M m 2

sk C

M Cm 2

mit sk WD cos

 k  n

;

k D 0; 1; : : : ; n;

eine Alternante darstellt, 1

k .  q  . k / / D p . k / D Tn .sk / D c.1/k für k D 0; 1; : : : ; n: k

Bemerkung 15.34. Zur Bestimmung eines solchen …n1 -Proximums lässt sich – auf der Grundlage des Alternantensatzes – ein Algorithmus angeben, das Austauschverfahren von Remez. Einzelheiten hierzu finden Sie beispielsweise in Hämmerlin / HoffM mann [48] und in Schaback / Wendland [92].

15.7 Haarsche Räume, Tschebyscheff-Systeme Die Aussage des Alternantensatzes behält ihre Gültigkeit, wenn man anstelle des Raums …n1 der Polynome vom Grad  n  1 haarsche Räume mit der Dimension n betrachtet. Die entsprechende Theorie wird im Folgenden vorgestellt. Von grundlegender Bedeutung sind dabei die folgenden Begriffe.

392

Kapitel 15 Approximationstheorie

Definition 15.35. (a) Ein endlich-dimensionaler linearer Raum U  C Œ a; b  heißt haarscher Raum, falls jede Funktion 0 6 u 2 U höchstens n  1 paarweise verschiedene Nullstellen besitzt, wobei n WD dim U. (b) Ein linear unabhängiges Funktionensystem u1 ; : : : ; un 2 C Œ a; b  heißt Tschebyscheff-System, falls U D span ¹ u1 ; : : : ; un º  C Œ a; b  einen haarschen Raum bildet. Beispiel 15.36. (a) Die Monome 1; x; x 2 ; : : : ; x n1 2 C Œ a; b  bilden offensichtlich ein Tschebyscheff-System. (b) Die Exponentialmonome 1; e x ; e 2x ; : : : ; e .n1/x 2 C Œ a; b  bilden ein Tschebyscheff-System. Beweis. Hier betrachtet man

U WD span ¹ 1; e x ; e 2x ; : : : ; e .n1/x º D ¹ p ı e x W p 2 …n1 º  C Œ a; b : Falls dann u D p ıe x 2 U mindestens n paarweise verschiedene Nullstellen a  x1 < : : : < xn  b hat, so besitzt das Polynom p 2 …n1 die n paarweise verschiedenen Nullstellen e x1 < : : : < e xn , und somit gilt notwendigerweise p  0 beziehungsweise u  0. (c) Für 0  a < b < 2 bilden die trigonometrischen Monome 1; sin x; cos x; : : : ; sin mx; cos mx 2 C Œ a; b  ein Tschebyscheff-System. Beweis. Hierzu betrachtet man

U WD span ¹ 1; sin x; cos x; : : : ; sin mx; cos mx º m ¯ ® X . ˛k sin kx C ˇk cos kx / W ˛k ; ˇk 2 R D kD0

D

m ® X

k e ikx W k 2 C;

Re k D Re k ;

Im k D Im k

¯

kDm



¹ e imx q ı e ix W q 2 …2m º  C Œ a; b :

Falls dann u D e imx .q ı e ix / 2 U mindestens .2m C 1/ paarweise verschiedene Nullstellen 0  x0 < : : : < x2m < 2 besitzt, so hat ( aufgrund der Injektivität der Funktion e ix auf dem Intervall Œ 0; 2 / ) das Polynom q 2 …2m mindestens .2m C 1/ paarweise verschiedene Nullstellen und somit gilt notwendigerweise q  0 beziehungsweise u  0. M

15.7.1 Alternantensatz für haarsche Räume Der Alternantensatz lässt sich auf haarsche Räume übertragen: Theorem 15.37. Für einen haarschen Raum U  C Œ a; b  der Dimension dim U D n behält der Alternantensatz seine Gültigkeit, wenn dort “…n1 ” durch “U” ersetzt wird.8 8

Etwas genauer ist dort noch das Wort “Polynom” zu streichen, und sinnvollerweise wird man die Notation “p  ” durch “u ” ersetzen.

Abschnitt 15.7

393

Haarsche Räume, Tschebyscheff-Systeme

Beweis. Der Beweis verläuft ähnlich dem des Alternantensatzes für Polynome, unter Verwendung des nachfolgenden Resultats über die eindeutige Lösbarkeit des Interpolationsproblems in haarschen Räumen. Theorem 15.38. Zu einem haarschen Raum U  C Œ a; b  der Dimension dim U D n und n Stützpunkten .x1 ; f1 /; : : : ; .xn ; fn /; mit paarweise verschiedenen Stützstellen x1 ; x2 ; : : : ; xn 2 Œ a; b  gibt es genau ein Element u 2 U mit der Interpolationseigenschaft

u.xj / D fj

für j D 1; 2; : : : ; n:

Beweis. Wird hier nicht geführt ( Aufgabe 15.6 ).

15.7.2 Eindeutigkeit des Proximums Für haarsche Räume U  C Œ a; b  ist die Existenz von U-Proxima an Funktionen f 2 C Œ a; b  aufgrund von Korollar 15.10 gewährleistet. Im Folgenden werden nun Eindeutigkeitsbetrachtungen geführt, der Einfachheit halber nur für die spezielle Gewichtsfunktion w  1. Theorem 15.39. Bezüglich der Maximumnorm jj  jj1 auf dem Intervall Œ a; b  ist in einem haarschen Raum U  C Œ a; b  zu jedem f 2 C Œ a; b  das U-Proximum an die Funktion f eindeutig bestimmt. Beweis. Für zwei U-Proxima u1 ; u2 2 U an die Funktion f ist auch9 die Funktion 1 .u1 C u2 / ein U-Proximum an f , für die dann eine Alternante a  s0 < s1 < : : : < 2 sn  b; n WD dim U, existiert, das heißt, 1 2

.u1  f /.sk / C „ ƒ‚ … j j  Ef .U/

1 2

.u2  f /.sk / D „ ƒ‚ …

. 12 .u1 C u2 /  f /.sk /

j j  Ef .U/

D .1/k Ef .U/;

k D 0; 1; : : : ; n;

2 ¹ 1; 1 º;

und daher

.u1  f /.sk / D .u2  f /.sk / bzw. .u1  u2 /.sk / D 0 für k D 0; 1; : : : ; n; „ ƒ‚ … 2 U so dass notwendigerweise u1  u2 gilt. Bemerkung 15.40. Man beachte, dass der Vektorraum C Œ a; b  zusammen mit der Maximumnorm jj  jj1 nicht strikt normiert ist, so dass Theorem 15.39 nicht unmittelbar aus Theorem 15.19 resultiert. M

15.7.3 Untere Schranken für den Minimalabstand Ist für eine Approximation u 2 U an eine Funktion f eine Alternante gegeben, an dessen Punkten jedoch der Abstand von u zur Funktion f nicht maximal und der Alternantensatz daher nicht anwendbar ist, so gewinnt man doch zumindest eine untere Schranke für den Minimalabstand Ef .U/: 9

siehe Lemma 15.14

394

Kapitel 15 Approximationstheorie

Theorem 15.41 (de la Valleé-Poussin). Seien U  C Œ a; b  ein haarscher Raum sowie f 2 C Œ a; b  und u 2 U. Wenn a  s0 < s1 < : : : < sn  b mit n WD dim U eine Alternante bezüglich der Funktionen f und u darstellt, das heißt,

.u  f /.sk / D ı .1/k

für k D 0; 1; : : : ; n;

erfüllt ist mit geeigneten Zahlen 2 ¹ 1; 1 º und 0 < ı  jju  f jj1 , so gilt die folgende Abschätzung,

ı  Ef .U/: Beweis. Im Fall Ef .U/ < ı würde man für das U-Proximum u an f die Identität

u  u D u  f  . u  f / „ ƒ‚ … erhalten, mit der Konsequenz

jj jj1 D Ef .U/

sgn.u  u /.sk / D sgn.u  f /.sk / D .1/k

„ ƒ‚ … 2 U

für k D 0; 1; : : : ; n;

so dass die Funktion u  u dann n Nullstellen besitzen würde und infolgedessen sich der Widerspruch u  u ergäbe. Bemerkung 15.42. In Ergänzung zu Theorem 15.41 kann man für den MinimalabM stand noch die triviale obere Schranke Ef .U/  jju  f jj1 angeben.

Weitere Themen und Literaturhinweise Ausführliche Behandlungen des Themas Approximationstheorie finden Sie beispielsweise in Hämmerlin / Hoffmann [48], Opfer [79] und in Schaback / Wendland [92]. Die in Abschnitt 15.3.2 vorgestellte Theorie der strikt normierten Räume lässt sich erweitern um die Theorie der gleichmäßig konvexen, vollständig normierten Räume V , in denen für konvexe abgeschlossene Teilmengen ¿ ¤ M  V die Existenz von M Proxima gewährleistet ist. Einzelheiten hierzu werden beispielsweise in Hirzebruch / Scharlau [56] vorgestellt. Dort werden auch ( für mit einem Skalarprodukt versehene Räume ) Orthonormalsysteme behandelt, die zur Bestimmung von Proxima in Unterräumen verwendet werden. Einführungen zu dem in Bemerkung 15.4 angesprochenen Thema “nichtlineare Optimierung” finden Sie beispielsweise in Dennis / Schnabel [17], Grossmann / Terno [44], Geiger / Kanzow [32], Nash / Sofer [75], Schaback / Wendland [92], Schwarz / Klöckner [94], Schwetlick [95], Tröltzsch [105] oder Werner [111].

Übungsaufgaben Aufgabe 15.1. Man weise nach, dass der Vektorraum C Œ a; b  zusammen mit der Maximumnorm jj  jj1 nicht strikt normiert ist.

395

Übungsaufgaben

Aufgabe 15.2. Man weise die Äquivalenz (15.11) nach. Aufgabe 15.3. Man weise für die Folge von Funktionen

pn .t/ D

p .1/n T2nC1 . t/ ; p 2n C 1 t

t >0

. n D 0; 1; : : : /

Folgendes nach: ./

pn 2 … n ; p max jpn .t/j t

D

1 2n C 1

p max jpn .t/j t

D

min

0t 1 0t 1

pn .0/ D 1; für n D 0; 1; : : :;

p

max jp.t/j t ;

p2…n 0t 1 p.0/D1

wobei . / so zu verstehen ist, dass zu der Funktion pn eine Fortsetzung nach 0 und darüber hinaus auf die negative Halbachse existiert, welche ein Polynom von Höchstgrad n darstellt. Aufgabe 15.4. Man überlege sich, dass für die Folge von Funktionen

pn .t/ D

1  TnC1 .1  2t/ 2.n C 1/2 t

0¤t 2R

;

. n D 0; 1; : : : /

Folgendes gilt:

pn 2 … n ;

pn .0/ D 1;

max jpn .t/j t

D

max jpn .t/j t

¤

0t 1 0t 1

1 . n C 1 /2

min

für n D 0; 1; : : :;

max jp.t/j t:

p2…n 0t 1 p.0/D1

Aufgabe 15.5. Es ist p  0 bezüglich der Maximumnorm ein …n1 -Proximum an die Funktion f .t/ D sin 3t; t 2 Œ 0; 2  genau dann, wenn n  1  2 gilt. Aufgabe 15.6. Man beweise Theorem 15.38.

16

Rechnerarithmetik

In dem vorliegenden Kapitel werden zunächst einige Grundlagen über die in Hardund Software verwendeten reellen Zahlensysteme vorgestellt. Anschließend wird die Approximation reeller Zahlen durch Elemente solcher Zahlensysteme behandelt. Ein weiteres Thema bilden die arithmetischen Grundoperationen in diesen Zahlensystemen. Bemerkung 16.1. Solche Umwandlungs- und Arithmetikfehler verursachen bei jedem numerischen Verfahren Fehler sowohl in den Eingangsdaten als auch bei der Durchführung des jeweiligen Verfahrens. Für verschiedene Situationen sind die Auswirkungen solcher Fehler in einem allgemeinen Kontext bereits diskutiert worden: 





der Einfluss fehlerbehafteter Matrizen und rechter Seiten auf die Lösung eines zugrunde liegenden linearen Gleichungssystems ( Abschnitt 4.7.5 ), und bei Einschrittverfahren zur Lösung von Anfangswertproblemen für gewöhnliche Differenzialgleichungen die Auswirkungen der in jedem Integrationsschritt auftretenden eventuellen Fehler auf die Güte der Approximation an die Lösung der Differenzialgleichung ( Abschnitt 7.4 ), und der Einfluss fehlerbehafteter Matrizen auf die Lösung von EigenwertprobleM men ( Abschnitt 12.2 ).

16.1 Zahlendarstellungen Von grundlegender Bedeutung für die Realisierung von Zahlendarstellungen auf Rechnern ist die folgende aus der Analysis bekannte Darstellung. Theorem 16.2. Zu gegebener Basis b  2 lässt sich jede Zahl 0 ¤ x 2 R in der Form

x D

1 X

kDeC1

akCe bk D

1 X kD1

 ak bk be ;

a1 ; a2 ; : : : 2 ¹ 0; 1; : : : ; b  1 º; (16.1) e 2 Z;

2 ¹ C;  º

darstellen mit einer nichtverschwindenden führenden Ziffer, a1 ¤ 0. Zwecks Eindeutigkeit der Ziffern sei angenommen, dass es eine unendliche Teilmenge N1  N gibt mit ak ¤ b  1 für k 2 N1 . Beweis. Siehe etwa Forster [29]. Bemerkung 16.3. (a) Die zweite Darstellung für x in (16.1) bezeichnet man als Gleitpunktdarstellung. (b) Durch die abschließende Bedingung in Theorem 16.2 ist die Eindeutigkeit der Ziffern in den Darstellungen (16.1) gewährleistet. So wird zum Beispiel für die Zahl 0:9999 : : : D 1:0 die letztere Darstellung gewählt.

Abschnitt 16.2

397

Allgemeine Gleitpunkt-Zahlensysteme

(c) Praxisrelevante Zahlensysteme und ihre Ziffern sind in Tabelle 16.1 dargestellt. M

Zahlensystem

Basis b

mögliche Ziffern

Dezimalsystem

10

Binärsystem

2

0, 1

Oktalsystem

8

0, 1, 2, 3, 4, 5, 6, 7

Hexadezimalsystem

16

0, 1, 2, 3, 4, 5, 6, 7, 8, 9

0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E, F

Tabelle 16.1: Praxisrelevante Zahlensysteme und ihre Ziffern

16.2 Allgemeine Gleitpunkt-Zahlensysteme 16.2.1 Grundlegende Begriffe In jedem Prozessor beziehungsweise bei jeder Programmiersprache werden jeweils nur einige Systeme reeller Zahlen verarbeitet. Solche Systeme werden im Folgenden vorgestellt. Definition 16.4. Zu gegebener Basis b  2 und Mantissenlänge t 2 N sowie für Exponentenschranken emin < 0 < emax ist die Menge F D F. b; t; emin ; emax /  R wie folgt erklärt,

8 9 ˆ > <  X = t k e ak b b W a1 ; : : : ; at 2 ¹ 0; 1; : : : ; b  1 º; a1 ¤ 0 F WD

[ ¹ 0 º: (16.2) ˆ > : kD1 ; e 2 Z; emin  e  emax ; 2 ¹ C;  º

Die Menge b F ist definiert als diejenige Obermenge von F, bei der in der Liste von Parametern in (16.2) zusätzlich noch die Kombination “e D emin ; a1 D 0” zugelassen ist. Die Elemente von b F ( und damit insbesondere auch die Elemente von F  b F ) werden im Folgenden kurz als Gleitpunktzahlen bezeichnet. Zu jeder solchen Gleitpunktzahl

x D a be 2 F

mit a D

t X

ak bk

(16.3)

kD1

bezeichnet das Vorzeichen, es ist a die Mantisse mit den Ziffern a1 ; : : : ; at , und e ist der Exponent. Gleitpunktzahlen mit der Darstellung (16.3) bezeichnet man im Fall a1  1 als normalisiert, andernfalls als denormalisiert. Bemerkung 16.5. Die Menge F  R stellt folglich ein System normalisierter Gleitpunktzahlen dar. Diese Normalisierung garantiert die Eindeutigkeit in der Darstellung (16.3). Im Spezialfall des kleinsten zugelassenen Exponenten e D emin bleibt

398

Kapitel 16

Rechnerarithmetik

diese Eindeutigkeit ( mit Ausnahme der Zahl 0 ) jedoch erhalten, wenn auf die Normalisierung verzichtet wird, so dass bis auf die Zahl 0 auch alle Gleitpunktzahlen aus b F eindeutig in der Form (16.3) darstellbar sind. M Im weiteren Verlauf werden zunächst grundlegende Eigenschaften der Mengen F und

b F festgehalten ( Abschnitte 16.2.2 und 16.2.3 ) und anschließend einige spezielle Systeme von Gleitpunktzahlen vorgestellt ( Abschnitt 16.3 ).

16.2.2 Struktur des normalisierten Gleitpunkt-Zahlensystems F Im Folgenden werden für die Gleitpunktzahlen aus dem System F  R zunächst Schranken angegeben und anschließend deren Verteilung auf der reellen Achse beschrieben. Wegen der Symmetrie von F um den Nullpunkt genügt es dabei, deren positive Elemente zu betrachten. Theorem 16.6. In dem System F D F. b; t; emin ; emax / normalisierter Gleitpunktzahlen stellen xmin WD bemin 1 ; xmax WD bemax .1  bt /; das kleinste positive beziehungsweise das größte Element dar, es gilt also xmin ; xmax 2 F und

xmin D min ¹ x 2 F W x > 0 º;

xmax D max ¹ x 2 F º:

Beweis. Für die Mantisse a einer beliebigen Gleitpunktzahl aus F gilt notwendigerweise b1  a 

t X

./

bk .b  1/ D 1  bt ;

kD1

wobei die erste Ungleichung aus der Normalisierungseigenschaft a1  1 und die zweite Ungleichung aus der Eigenschaft ak  b  1 resultiert. Die Summe schließlich stellt eine Teleskopsumme dar, woraus die Identität . / folgt und der Beweis komplettiert ist. Bemerkung 16.7. Der durch das normalisierte Gleitpunkt-Zahlensystem F überdeckte Bereich sieht demnach wie folgt aus, F  Œ xmax ; xmin  [ ¹ 0 º [ Œ xmin ; xmax ; was in Bild 16.1 veranschaulicht ist.

Πxmax

 Πxmin0 xmin

 xmax

Bild 16.1: Darstellung des durch das normalisierte Gleitpunkt-Zahlensystem F überdeckten Bereiches M Detaillierte Aussagen über die Verteilung der Gleitpunktzahlen aus den System F liefern das folgende Theorem und die anschließende Bemerkung.

Abschnitt 16.2

399

Allgemeine Gleitpunkt-Zahlensysteme

Theorem 16.8. In jedem der Intervalle Œ be1 ; be ; emin  e  emax , befinden sich gleich viele Gleitpunktzahlen aus dem System F, bei einer jeweils äquidistanten Verteilung mit den konstanten Abständen bet : F \ Œ be  1 ; b e  D

®

¯ . b1 C j bt /be W j D 0; 1; : : : ; M ] ; „ ƒ‚ … e 1 e t b C jb

M ] WD bt  bt1 :

Beweis. Im Folgenden werden die im Beweis von Theorem 16.6 zum Thema Mantissen angestellten Überlegungen fortgeführt. Die Mantissengesamtzahl beträgt bt1 .b  1/ D bt  bt1 , und diese sind äquidistant über das gesamte abgeschlossene Intervall Œ b1 ; 1  bt  verteilt mit jeweiligem Abstand bt , eine aufsteigende Anordnung der Mantissen sieht also wie folgt aus:

a D b1 C j bt ;

j D 0; 1; : : : ; M ]  1:

Hieraus resultiert die Aussage des Theorems. Bemerkung 16.9. Durch Theorem 16.8 wird die ungleichmäßige Verteilung der Gleitpunktzahlen auf der Zahlengeraden verdeutlicht. So tritt in dem System der normalisierten Gleitpunktzahlen F zwischen der größten negativen Zahl xmin und der kleinsten positiven Zahl xmin eine ( relativ betrachtet ) große Lücke auf, und ferner werden die Abstände zwischen den Gleitpunktzahlen mit wachsender absoluter Größe zunehmend größer. Die beschriebene Situation für F ist in Bild 16.2 veranschaulicht. xmin

... ...

... ...

... . . . . . . . ... . . . . . . . ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. .. .. .. .. .. .. ... .. .. .. .. .. .. .. ...

bemin C1

... ... ...

bemin bemin 1 0

xmin

... . . . . . . . .. . . . . . . . .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... . .. . . . . . . .. . . . . . . . . .. . . . . . . .. . . . . . . . ...

e bemin 1 b min

... ...

bemin C1

... ...

... ...

... ...

... ...

... ...

... ...

... ... ...

... ...

... ...

bemin C2

Bild 16.2: Verteilung der betragsmäßig kleinen normalisierten Gleitpunktzahlen des Systems F M Eine wichtige Kenngröße des Gleitpunkt-Zahlensystems F ist der maximale relative Abstand der Zahlen aus dem Bereich ¹ x 2 R W xmin  jx j  xmax º zum jeweils nächstgelegenen Element aus F. Hier gilt Folgendes: Theorem 16.10. min z2F

jz  x j  12 btC1 jx j „ ƒ‚ … DW eps

für x 2 R

mit xmin  jx j  xmax :

(16.4)

Beweis. Aus Symmetriegründen genügt es, die Betrachtungen auf positive Zahlen x zu beschränken, und im Folgenden werden die Betrachtungen auf eines der infrage kommenden Intervalle Œ be1 ; be  konzentriert. Nach Theorem 16.8 sind die Gleitpunktzahlen aus dem System F über das gesamte Intervall Œ be1 ; be  äquidistant verteilt mit den konstanten Abständen bet , und somit beträgt für eine beliebige reelle

400

Kapitel 16

Rechnerarithmetik

Zahl x aus diesem Intervall der Abstand zum nächstgelegenen Element aus F höchstens 12 bet . Die Eigenschaft be1  x liefert schließlich die Aussage des Theorems.

Bemerkung 16.11. Aus der Abschätzung (16.4) wird unmittelbar einsichtig, dass bei festgelegter Basis b die Genauigkeit des Gleitpunkt-Zahlensystems F ausschließlich von der Anzahl der Ziffern der Mantisse abhängt, während die Wahl der Exponentenschranken emin und emax die Größe des von dem Gleitpunkt-Zahlensystem F überdeckten Bereichs beeinflussen. M Für die eindeutig bestimmte Zahl n 2 N mit 0:5  10n  eps < 5  10n spricht man im Zusammenhang mit dem System F von einer n-stelligen Dezimalstellenarithmetik.

16.2.3 Struktur des denormalisierten Gleitpunkt-Zahlensystems b F Im Folgenden werden für das Obersystem b F  F die gegenüber dem System der normalisierten Gleitpunkt-Zahlensystems F zusätzlichen Eigenschaften beschrieben. Theorem 16.12. Auf dem Bereich . 1; xmin  [ Œ xmin ; 1 / stimmen die GleitpunktF überein, und auf dem abgeschlossenen Intervall Œ bemin ; bemin  Zahlensysteme F und b F äquidistant verteilt D Œ bxmin ; bxmin  sind die Gleitpunktzahlen aus dem System b mit konstanten Abständen bemin t :

b F \ Œ bemin ; bemin  D ¹ j bemin t W j D bt ; : : : ; bt º:

(16.5)

Insbesondere stellt

b x min WD bemin t das kleinste positive Element in b F dar. F Beweis. Für die Mantisse a einer beliebigen denormalisierten Gleitpunktzahl aus b gilt a1 D 0, und die Eigenschaft ak  b  1 liefert

a 

t X

bk .b  1/ D b1  bt ;

kD2

beziehungsweise b FnF  ¹ x 2 R W 0 < jx j < xmin º, was identisch mit der ersten Aussage des Theorems ist. Im denormalisierten Fall sind die Mantissen über das gesamte abgeschlossene Intervall Œ 0 ; 1  bt  äquidistant verteilt mit Mantissenabstand bt , eine aufsteigende Anordnung sieht hier wie folgt aus:

a D j bt ;

j D 0; 1; : : : ; bt  1:

Daraus erhält man die Aussage (16.5). Die beschriebene Situation für b F ist in Bild 16.3 veranschaulicht.

Abschnitt 16.3

... ...

... ...

bemin t bemin t

... .. ... . . . . . . . ... . . . . . . . ... .. .. .. .. ................ .. ......... .. .. .. .. .. ... .. .. .. .. .. .. .. ... .. .. .. .. . .. . ... ... ... ... ... ... ... ... ... ... ... ... .... .... .... .... .... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .... ... ... ... ... ... ... ... ... ... ... ... ... .... ... .... ... ... .. .. .. .. .. .. .. ... .. .. . . . . . .. . . . . . . . ... . . . . . . . .. . . . . . . . ... . . . . . . . ... .

bemin C1

401

Gleitpunkt-Zahlensysteme in der Praxis

bemin bemin 1 0

e bemin 1 b min

... ...

... ...

... ...

... ...

... ...

... ...

... ...

bemin C1

... ... ...

... ...

... ...

bemin C2

Bild 16.3: Verteilung der betragsmäßig kleinen Gleitpunktzahlen aus dem System b F Bemerkung 16.13. Die in dem System der normalisierten Gleitpunktzahlen F ( relativ gesehen ) auftretenden großen Lücken zwischen der größten negativen Zahl xmin und der Zahl 0 sowie zwischen 0 und der kleinsten positiven Zahl xmin sind in dem Gleitpunkt-Zahlensystem b F aufgefüllt worden mit äquidistant verteilten denormalisierten Gleitpunktzahlen. Man beachte jedoch, dass auf der anderen Seite die relativen Abstände der Gleitpunktzahlen aus b F zur Zahl 0 hin anwachsen bis hin zu min

z2b F; z ¤b x min

jz  b x min j D 1: b x min

M

16.3 Gleitpunkt-Zahlensysteme in der Praxis 16.3.1

Die Gleitpunktzahlen des Standards IEEE 754

Zwei weitverbreitete Gleitpunkt-Zahlensysteme sind 

b F . 2; 24; 125; 128 /

( einfaches Grundformat ),



b F . 2; 53; 1021; 1024 /

( doppeltes Grundformat ),

die beide Bestandteil des IEEE1 -Standards 754 aus dem Jahr 1985 sind, in dem zugleich die Art der Repräsentation festgelegt ist. Einzelheiten hierzu werden im Folgenden erläutert, wobei mit dem gängigeren doppelten Grundformat begonnen wird. Neben den genannten Grundformaten existieren noch erweiterte Gleitpunkt-Zahlensysteme – im Folgenden kurz als Weitformate bezeichnet – die ebenfalls in einer einfachen und einer doppelten Version existieren und im Anschluss an die einfachen und doppelten Grundformate vorgestellt werden. Beispiel 16.14 (IEEE, doppeltes Grundformat). Die Gleitpunktzahlen aus dem System

b F . 2; 53; 1021; 1024 / lassen sich in 64-Bit-Worten realisieren, wobei jeweils ein Bit zur Darstellung des Vorzeichens verwendet wird und 52 Bits die Mantisse sowie 11 Bits den Exponenten ausmachen, 64 Bit-Wort



…„

a2 „

a3

::: ::: ƒ‚

52 Bits für Mantisse a 1

a53

ƒ e1

…„

e2

::: ƒ‚

e11



11 Bits für Exponenten e

IEEE ist eine Abkürzung für “Institute of Electrical and Electronics Engineers”.

402

Kapitel 16

Rechnerarithmetik

Man beachte, dass bei normalisierten Gleitpunktzahlen für die führende Ziffer der Mantisse notwendigerweise a1 D 1 gilt, so dass hier auf eine explizite Darstellung verzichtet werden kann. Mit den 11 Exponentenbits lassen sich wegen 211 D 2048 die 2046 Exponenten von emin D 1021 bis emax D 1024 kodieren. Dies geschieht in Bias-Notation ( verschobene Notation ), bei der der Exponent e durch die Dualzahldarstellung der Zahl e  emin C 1 2 ¹ 1; : : : ; emax  emin C 1 º D ¹ 1; : : : ; 2046 º repräsentiert wird. Von den beiden verbleibenden Bitkombinationen aus dem Exponentenbereich wird die Nullbitfolge 00    0 zur Umschaltung der Mantisse auf denormalisierte Gleitpunktzahlen ( e D emin ; a1 D 0 ) verwendet. Das verbleibende freie Bitmuster 11    1 verwendet man zur Umschaltung der Mantissenbits für die Darstellung symbolischer Ausdrücke wie C1; 1 oder NaN-Ausdrücken, wobei NaN eine Abkürzung für “Not a Number” ist und bestimmte arithmetische Gleitpunktoperationen wie “0=0”, “0  1” oder “1  1” symbolisiert. ( Natürlich bleiben bei der Umschaltung zur Darstellung solcher symbolischen Ausdrücke die meisten Bitmuster der Mantisse unbelegt. ) Die kleinste positive normalisierte sowie die größte Gleitpunktzahl sind hier

xmin D 21022 2:23  10308 ;

xmax 21024 1:80  10308 ;

während b x min D 21074 4:94  10324 die kleinste positive denormalisierte Gleitpunktzahl ist. Der relative Abstand einer beliebigen Zahl aus dem Bereich ¹ x 2 R W F. 2; 53; 1021; 1024 / beträgt xmin  jx j  xmax º zum nächstgelegenen Element aus b höchstens

M

eps D 253 1:11  1016 :

Beispiel 16.15 (IEEE, einfaches Grundformat). Die Gleitpunktzahlen aus dem System

b F . 2; 24; 125; 128 / werden in 32-Bit-Worten kodiert, wovon jeweils 23 Bits für die Mantisse und 8 Bits für den Exponenten sowie ein Vorzeichenbit vergeben werden. 32 Bit-Wort



…„

a2 „

a3

::: ƒ‚

a24 e1 …„

23 Bits für Mantisse a

ƒ ::: ƒ‚

e8



8 Bits für Exponent e

Aufgrund der Identität 28 D 256 lassen sich mit den 8 Exponentenbits die 254 Exponenten von emin D 125 bis emax D 128 in Bias-Notation kodieren, und die beiden verbleibenden Bitkombinationen aus dem Exponentenbereich werden wie bei dem doppelten Grundformat verwendet. Die kleinste positive normalisierte sowie die größte Gleitpunktzahl sehen hier wie folgt aus,

xmin D 2126 1:10  1038 ;

xmax 2128 3:40  1038 ;

und b x min D 2149 1:40 1045 ist die kleinste positive denormalisierte Gleitpunktzahl. Der relative Abstand einer beliebigen Zahl aus dem Bereich ¹ x 2 R W xmin  jx j  xmax º zum nächstgelegenen Element aus b F. 2; 24; 125; 128 / beträgt höchstens eps D 224 0:60  107 . M

Abschnitt 16.3

Gleitpunkt-Zahlensysteme in der Praxis

403

Beispiel 16.16 (IEEE, einfaches und doppeltes Weitformat). Neben dem genannten einfachen und doppelten Grundformat legt der IEEE-Standard 754 Gleitpunkt-Zahlensysteme im Weitformat fest – wiederum in einer einfachen und einer doppelten Fassung. Hierbei sind im Unterschied zu den Grundformaten lediglich Unterschranken für die verwendete Bitanzahl und die Mantissenlänge sowie Ober- und Unterschranken für den Exponenten vorgeschrieben. Ein typisches erweitertes Gleitpunkt-Zahlensystem aus der Klasse der doppelten Formate ist

b F. 2; 64; 16381; 16384 /; deren Elemente über 80-Bit-Worte dargestellt werden mit einem Vorzeichenbit, 64 Bits für die Mantisse sowie 15 Bits für den Exponenten. Die kleinste positive normalisierte sowie die größte Gleitpunktzahl lauten hier

xmin D 216382 104932 ;

xmax 216384 104932 ;

und der maximale relative Abstand einer beliebigen reellen Zahl aus dem Bereich ¹ x 2 R W xmin  jx j  xmax º zum nächstgelegenen Element aus b F. 2; 64; 16381; 16384 / liegt bei eps D 264 5:42  1020 . M Die einfachen und doppelten Grundformate des IEEE-Standards 754 waren beziehungsweise sind in vielen gängigen Hardware- und Softwareprodukten implementiert, so zum Beispiel in den Prozessoren von Intel ( 486DX, Pentium ), DEC ( Alpha ), IBM ( RS/6000 ), Motorola ( 680x0 ) und Sun ( SPARCstation ) oder den Programmiersprachen C++ und Java und den Programmpaketen Matlab und Scilab.

16.3.2 Weitere Gleitpunkt-Zahlensysteme in der Praxis Im Folgenden werden weitere in der Praxis verwendete Gleitpunkt-Zahlensysteme vorgestellt. Beispiel 16.17 (Taschenrechner). Bei wissenschaftlichen Taschenrechnern werden zumeist dezimale Gleitpunkt-Zahlensysteme verwendet. Weitverbreitet ist das System F. 10; 10; 98; 100 /, wobei intern mit einer längeren Mantisse ( in einigen Fällen M mit 12 Ziffern ) gearbeitet wird. Beispiel 16.18 (Cray). Zwei gängige Gleitpunkt-Zahlensysteme auf Cray-Rechnern M sind die Systeme F. 2; 48; 16384; 8191 / und F. 2; 96; 16384; 8191 /. Beispiel 16.19 (IBM System/390). Auf Großrechnern von IBM existieren drei hexadezimale Gleitpunkt-Zahlensysteme: F. 16; 6; 64; 63 / ( einfaches Format ) sowie F. 16; 14; 64; 63 / ( doppeltes Format ) und F. 16; 28; 64; 63 / ( erweitertes Format ). Man beachte, dass bei allen drei Systemen lediglich die Mantissenlänge und somit die Genauigkeit variiert, der überdeckte Zahlenbereich hingegen bleibt unverändert. M Die charakteristischen Größen der vorgestellten sowie einiger anderer praxisrelevanter Systeme von Gleitpunktzahlen sind in Tabelle 16.2 zusammengestellt.

404

Kapitel 16

Rechner o. Norm

Format

Basis ] Ziff.

b

Rechnerarithmetik

Exponentlimit denorm

b x min

xmin

emin

einfach

2 24

125

......

doppelt

2 53 1021 1024 ja

210308 210308 510324 11016

......

erweit.doppelt

2 64 16381 16384 ja

1104932 1104932 4104951 51020

IEEE

emax

xmax

t

128 ja

3 10 

38

IBM 390

einfach

16

6

64

63 nein 71075

......

doppelt

16 14

64

63 nein

10 10

98

Taschenrechner (Bsp.)

1

1038



51079 ......

......

100 nein 11099

11099

1

eps

1045

6 108







5107



11016



11010

Tabelle 16.2: Übersicht praxisrelevanter Gleitpunkt-Zahlensysteme

16.4 Runden, Abschneiden Ein erster Schritt bei der Durchführung von Algorithmen besteht in der Approximation reeller Zahlen durch Elemente aus dem Gleitpunkt-Zahlensystem F. In den folgenden Abschnitten 16.4.1 und 16.4.2 werden hierzu zwei Möglichkeiten vorgestellt.

16.4.1 Runden Die erste Variante zur Approximation reeller Zahlen aus dem Überdeckungsbereich eines gegebenen Gleitpunkt-Zahlensystems F liefert die folgende Definition: Definition 16.20. Zu einem gegebenen Gleitpunkt-Zahlensystem F D F. b; t; emin ; emax / mit b gerade ist die Funktion rd W ¹ x 2 R W xmin  jx j  xmax º ! R folgendermaßen erklärt,

8 t X ˆ ˆ ak bk /be ; < . rd.x/ D

ˆ ˆ : 

kD1 ......

C b

 t

falls atC1  be ; falls atC1 

b 2

b 2

9 >  1> = > > ;

für x D .

1 X

ak bk /be

kD1

(16.6)

mit einer normalisierten Darstellung für x entsprechend Theorem 16.2. Man bezeichnet rd.x/ als den auf t Stellen gerundeten Wert von x . Beispiel 16.21. Bezüglich der Basis b D 10 und der Mantissenlänge t D 3 gilt die Identität rd.0:9996/ D 1:0 D 0:1  101 . Dies verdeutlicht noch, dass sich beim Runden alle Ziffern ändern können. M Der Rundungsprozess liefert das nächstliegende Element aus dem System F: Theorem 16.22. Zu einem gegebenen Gleitpunkt-Zahlensystem F D F. b; t; emin ; emax / gilt für jede Zahl x 2 R mit xmin  jx j  xmax die Eigenschaft rd.x/ 2 F, mit der Minimaleigenschaft j rd.x/  x j D minz2F jz  x j.

Abschnitt 16.4

405

Runden, Abschneiden

P1

Beweis. Ausgehend von der Notation x D . kD1 ak bk /be erhält man durch elementare Abschätzungen die folgenden unteren und oberen Schranken für den AusP1 druck kD1 ak bk :

t X

1 X

ak bk 

kD1

‚ ak bk 

kD1

t X

ak bk C

kD1

1 X

D b t …„

ƒ

.b  1/bk „ ƒ‚ … kDtC1 bkC1  bk

und daraus folgt t  X

t    X ak bk be  jx j  ak bk C bt be :

kD1



ƒ‚

kD1



 b 1



ƒ‚  1



Daher liegen die Schranken in dem Intervall Œ be1 ; be , so dass die beiden für rd.x/

Pt

Pt

infrage kommenden Werte . kD1 ak bk /be und . kD1 ak bk C bt /be nach Theorem 16.8 die Nachbarn von x aus dem Gleitpunkt-Zahlensystem F darstellen. Daraus resultiert insbesondere rd.x/ 2 F, und im Folgenden wird die Ungleichung

j rd.x/  x j  btCe =2

(16.7)

nachgewiesen, wobei die obere Schranke in der Abschätzung (16.7) die Hälfte des Abstands der beiden Nachbarn zueinander darstellt, so dass (16.7) die behauptete Optimalität nach sich zieht. Zum Beweis von (16.7) unterscheidet man zwei Situationen. Im Fall “atC1  b=2  1” berechnet man

j rd.x/  x j D

 X 1

ak bk be

D



atC1 b.tC1/ C

kDtC1

h 

1 X

 ak bk be

kDtC2

. b2  1 /b.tC1/

C

1 X

bkC1  bk

‚ …„ ƒ i .b  1/bk be

kDtC2

D



......

 C b.tC1/ be D

1 tCe b ; 2

und in der Situation “atC1  b=2” erhält man

 j rd.x/  x j D

bt 



1 tCe b : 2

 0  bt =2 ‚ …„ ƒ ‚ …„ ƒ  1 1 X X ak bk be D bt  atC1 b.tC1/  ak bk be

kDtC1

kDtC2

Aus diesen Abschätzungen schließlich erhält man die Ungleichung (16.7). Die Situation beim Runden ist in Bild 16.4 veranschaulicht.

406

Kapitel 16

Rechnerarithmetik

... .................................................................................................. ................................................................................................. . ... ........................................................................................... .............................................................................................. ... ... ... ... .. .. ... . .. .. . .. ... ... .. . ...

ı

ı

x0

x1

x2

Bild 16.4: Es stellen x0 ; x1 und x2 benachbarte Zahlen aus dem System F dar. Die Pfeile kennzeichnen jeweils Bereiche, aus denen nach x0 ; x1 beziehungsweise nach x2 gerundet wird. Als leichte Folgerung aus Theorem 16.22 erhält man das folgende Resultat. Korollar 16.23. In einem gegebenen Gleitpunkt-Zahlensystem F D F. b; t; emin ; emax / gilt für jede Zahl x 2 R mit xmin  jx j  xmax die folgende Abschätzung für den relativen Rundungsfehler,

j rd.x/  x j  jx j

D btC1 =2 ‚…„ƒ

für x 2 R

eps

mit xmin  jx j  xmax :

(16.8)

Eine alternative Fehlerdarstellung ist rd.x/ D x C x

für ein x 2 R

mit

jx j jx j

 eps:

(16.9)

Beweis. Die Abschätzung (16.8) folgt aus dem Beweis von Theorem 16.22 oder direkt aus Theorem 16.10. Die Darstellung (16.9) ergibt sich mit der Setzung x WD rd.x/  x unmittelbar aus der Abschätzung (16.8). Bemerkung 16.24. Auch auf dem Intervall .xmin ; xmin / stellt (16.6) eine sinnvolle ( und dem IEEE-Standard 754 entsprechende ) Definition für die Funktion rd dar, wenn P1 man in (16.6) die normalisierte Darstellung für x ersetzt durch x D . kD1 ak bk / bemin mit a1 D 0. Tatsächlich gilt rd.x/ 2 b F und j rd.x/  x j D minz2b jz  x j für F x 2 .xmin ; xmin /, jedoch verliert die Aussage von Korollar 16.23 über den relativen Rundungsfehler für solche Werte von x ihre Gültigkeit, was unmittelbar aus Bemerkung 16.13 folgt. Der Fall jx j > xmax führt im IEEE-Standard 754 zu einem Overflow, M genauer zu rd.x/ D 1 beziehungsweise rd.x/ D 1.

16.4.2 Abschneiden Ein einfache Alternative zum Runden stellt das Abschneiden (english: truncate) dar: Definition 16.25. Zu einem gegebenen Gleitpunkt-Zahlensystem F D F. b; t; emin ; emax / ist die Funktion tc W ¹ x 2 R W xmin  jx j  xmax º ! R folgendermaßen erklärt, tc.x/ D

 X t kD1

ak bk be

für x D

 X 1 kD1

ak bk be :

Abschnitt 16.5

407

Arithmetik in Gleitpunkt-Zahlensystemen

Es wird tc.x/ als die auf t Stellen abgeschnittene Zahl x bezeichnet. Die Situation beim Abschneiden ist in Bild 16.5 veranschaulicht. .................................................................................................................................................................................. ................................................................................................................................................................................ ... ... .. .. ... ... ... .. .. .

ı

ı

x0

x1

x2

Bild 16.5: Es stellen x0 ; x1 und x2 benachbarte Zahlen aus dem System F dar. Die Pfeile kennzeichnen jeweils Bereiche, aus denen nach x0 beziehungsweise nach x1 abgeschnitten wird.

Beispiel 16.26. Für die Basis b D 10 und die Mantissenlänge t D 3 gilt die Identität tc.0:9996/ D 0:999  100 . M Theorem 16.27. Zu einem gegebenen Gleitpunkt-Zahlensystem F D F. b; t; emin ; emax / gelten für jede Zahl x 2 R mit xmin  jx j  xmax die Eigenschaft tc.x/ 2 F und die folgende Fehlerabschätzung,

j tc.x/  x j  2eps jx j „ƒ‚…

für x 2 R

mit xmin  jx j  xmax :

(16.10)

btC1

Eine alternative Fehlerdarstellung ist tc.x/ D x C x

für ein x 2 R

mit

jx j jx j

 2eps:

(16.11)

Beweis. Für eine beliebige Zahl x 2 R mit xmin  jx j  xmax weist man die Eigenschaft tc.x/ 2 F entsprechend der Vorgehensweise im Beweis von Theorem 16.22 P1 nach, und mit der Darstellung x D . kD1 ak bk /be erhält man die Abschätzung (16.10) leicht durch

j tc.x/  x j D

1  X kDtC1

1  X  ak bk be 

bkC1  bk

‚ …„ ƒ  .b  1/bk be D btCe

kDtC1

sowie der Eigenschaft jx j  bb1 . Die Darstellung (16.11) resultiert mit der Setzung x WD tc.x/  x unmittelbar aus der Abschätzung (16.10). Bemerkung 16.28. Die Aussagen aus Bemerkung 16.24 lassen sich für die Abschneidefunktion tc übertragen. M

16.5 Arithmetik in Gleitpunkt-Zahlensystemen In den folgenden Abschnitten werden arithmetische Grundoperationen in Gleitpunkt-Zahlensystemen vorgestellt und Abschätzungen für den bei der Hintereinanderausführung solcher Operationen entstehenden Gesamtfehler hergeleitet.

408

Kapitel 16

Rechnerarithmetik

16.5.1 Arithmetische Grundoperationen in Gleitpunkt-Zahlensystemen In einem gegebenen Gleitpunkt-Zahlensystem F D F. b; t; emin ; emax / sehen naheliegende Realisierungen von Grundoperationen ı 2 ¹ C; ; ; =º zum Beispiel so aus,

x ı y D rd.x ı y/ für x; y 2 F mit xmin  jx ı y j  xmax ; (16.12) oder x ı y D tc.x ı y/

......

(16.13)

wobei im Fall der Division y ¤ 0 angenommen ist. Bemerkung 16.29. (a) Man beachte, dass für Operationen von der Gestalt (16.12) oder (16.13) sowohl Assoziativ- als auch Distributivgesetze keine Gültigkeit besitzen. (b) Praktisch lassen sich (16.12) beziehungsweise (16.13) so realisieren, dass man zu gegebenen Zahlen x; y 2 F anstelle des exakten Wertes x ı y eine Approximation z x ı y 2 R mit rd.z/ D rd.x ı y/ beziehungsweise tc.z/ D tc.x ı y/ bestimmt. M Für die folgenden Betrachtungen wird lediglich die Annahme getroffen, dass der bei arithmetischen Grundoperationen in Gleitpunkt-Zahlensystemen auftretende relative Fehler dieselbe Größenordnung wie der relative Rundungsfehler besitzt, eine weitere Spezifikation ist nicht erforderlich. Definition 16.30. Zu einem gegebenen Gleitpunkt-Zahlensystem F D F. b; t; emin ; emax / bezeichnen im Folgenden C ;  ;  ; = Operationen mit den Eigenschaften

x ı y 2 F ; 

x ı y D x ı y C für ein 2 R ;

x; y 2 F mit xmin  jx ı y j  xmax ;

j j jx ı y j

 K eps

(16.14)



ı 2 ¹ C; ; ; =º ;

wobei im Fall der Division y ¤ 0 angenommen ist, und K  0 ist eine Konstante. In den Fällen (16.12) beziehungsweise (16.13) gilt (16.14) mit K D 1 beziehungsweise K D 2. In den beiden nächsten Abschnitten werden Abschätzungen für den akkumulierten Fehler bei der Hintereinanderausführung von Grundoperationen in Gleitpunkt-Zahlensystemen hergeleitet.

16.5.2 Fehlerakkumulation bei der Hintereinanderausführung von Multiplikationen und Divisionen in Gleitpunkt-Zahlensystemen Das folgende Lemma wird benötigt beim Beweis des darauf folgenden Theorems über die Fehlerausbreitung bei der Hintereinanderausführung von Multiplikationen und Divisionen in Gleitpunkt-Zahlensystemen. Lemma 16.31. Für Zahlen 1 ; : : : ; n 2 R mit j k j  " für k D 1; 2; : : : ; n, und für Exponenten 1 ; 2 ; : : : ; n 2 ¹ 1; 1 º gilt in der Situation n " < 1 Folgendes, n Y kD1

.1 C k /k D 1 C ˇn

n"

mit jˇn j  : 1  n"

(16.15)

Abschnitt 16.5

409

Arithmetik in Gleitpunkt-Zahlensystemen

Beweis. Es wird ein Induktionsbeweis über n geführt, und hierzu seien vorbereitend die folgenden elementaren Abschätzungen angegeben,

j.1 C k /k j 

1C" ; 1  "

j. 1 C k /k  1 j 

" 1  "

für k D 1; 2; : : : ; n: (16.16)

Die zweite Abschätzung in (16.16) liefert den Induktionsanfang n D 1 für (16.15), und im Folgenden wird der Induktionsschritt “n ! n C 1” geführt. Hierzu schreibt man nC Y1

.1 C k /k  1 D .1 C nC1 /nC1

kD1

n  Y

 .1 C k /k  1 C .1 C nC1 /nC1  1

kD1

und schätzt dann mit (16.15) und der Induktionsannahme folgendermaßen ab,

ˇ nC ˇ Y1 1 C " n" " ˇ .1 C k /k  1 ˇ  C 1  " 1  n" 1  " kD1 1 . n C 1 /" n" C n"2 C "  n "2 D 1   1  n" 1   1  n" . n C 1 /" . n C 1 /"  D ; 1  . n C 1 /" C n"2 1  . n C 1 /"

D

1

so dass die Darstellung für den Fall n C 1 bewiesen und der Induktionsschritt damit abgeschlossen ist. Theorem 16.32. Zu einem gegebenen Gleitpunkt-Zahlensystem F D F. b; t; emin ; emax / seien Zahlen x1 ; x2 ; : : : ; xn 2 R und x1 ; x2 ; : : : ; xn 2 R gegeben mit jxk j jxk j

xk C xk 2 F;

 K eps

für k D 1; 2; : : : ; n;

(16.17)

mit .n  1/K eps < 1=4. Weiter sei für Grundoperationen ı1 ; : : : ; ın1 2 ¹ ; =º die Eigenschaft (16.14) sowie xmin  jx1 ı1 : : : ıj xj j  xmax für j D 2; : : : ; n  1 erfüllt, wobei jeweils noch ein gewisser Abstand zu den Intervallrändern xmin und xmax gegeben sei2 . Dann gilt die Fehlerdarstellung

.x1 C x1 / ı1 .x2 C x2 / ı2 : : : ın1 . xn C xn / D x1 ı1 x2 ı2 : : : ın1 xn C ; mit

j j jx1 ı1 : : : ın1 xn j



. 2n  1 /K eps : 1  . 2n  1 /K eps

Beweis. Ausgehend von der Fehlerdarstellung

xk C xk D xk .1 C k / mit j k j  K eps; 2

Diese Bedingung wird in (16.19) im Beweis präzisiert.

für k D 1; 2; : : : ; n;

410

Kapitel 16

Rechnerarithmetik

berechnet man unter Anwendung von (16.14)

.x1 C x1 / ı1 .x2 C x2 / D .x1 .1 C 1 / / ı1 . x2 .1 C 2 / / D .x1 ı1 x2 / . .1 C 1 / ı1 .1 C 2 / / .1 C ˛1 / mit j˛1 j  K eps; und mit einer entsprechenden Vorgehensweise erhält man sukzessive die Darstellungen

9 > > > > =

.x1 C x1 / ı1 .x2 C x2 / ı2    ıj 1 .xj C xj / D .x1 ı1 x2 ı2 : : : ıj 1 xj /.1 C ˇ2j 1 / mit 1 C ˇ2j 1 D .1 C 1 / ı1 .1 C 2 / ı2    ıj 1 .1 C j /

jY 1

(16.18)

> > > .1 C ˛k /;> ;

kD1

für j D 2; 3; : : : ; n, mit j˛k j  K eps für alle k . Die Anwendbarkeit der Eigenschaft (16.14) wird zum Beispiel durch die Bedingung 1  . 2n  2 /K eps xmin 1  . 4n  4 /K eps

 jx1 ı1 : : : ıj 1 xj j 

. 1  .2n  2/K eps /xmax ;

(16.19)

gewährleistet, denn sie zusammen mit Lemma 16.31 impliziert, dass die Resultate der Multiplikationen und Divisionen in dem Gleitpunkt-Zahlensystem allesamt in dem relevanten Bereich ¹ x 2 R W xmin  jx j  xmax º enthalten sind. Aus der Darstellung (16.18) folgt unter nochmaliger Anwendung von Lemma 16.31 die Aussage des Theorems. Bemerkung 16.33. (a) Theorem 16.32 impliziert die Gutartigkeit von Multiplikationen und Divisionen in Gleitpunkt-Zahlensystemen, relative Eingangsfehler werden nicht übermäßig verstärkt. (b) Falls in der Situation von Theorem 16.32 etwa die Ungleichung .2n  1/K eps < 0:1  1 erfüllt ist, so gilt

j j .2n  1/K eps   . 1:12K eps /.2n  1/: 0 :9 jx1 ı1 : : : ın1 xn j Mit jeder zusätzlichen maschinenarithmetischen Multiplikation oder Division kann M sich also eine 12-prozentige Fehlerverstärkung einstellen.

16.5.3 Fehlerverstärkung bei der Hintereinanderausführung von Additionen in einem gegebenen Gleitpunkt-Zahlensystem F Das folgende Theorem befasst sich mit der möglichen Fehlerverstärkung bei der Hintereinanderausführung von Additionen und Subtraktionen in einem gegebenen Gleitpunkt-Zahlensystem F D F. b; t; emin ; emax /. Dabei werden beliebige Vorzeichen zugelassen, so dass man sich auf die Betrachtung von Additionen beschränken kann. Erläuterungen zur Abschätzung (16.20) finden Sie in der darauf folgenden Bemerkung 16.35.

Abschnitt 16.5

411

Arithmetik in Gleitpunkt-Zahlensystemen

Theorem 16.34. Zu einem gegebenen Gleitpunkt-Zahlensystem F D F. b; t; emin ; emax / seien x1 ; x2 ; : : : ; xn 2 R und x1 ; x2 ; : : : ; xn 2 R Zahlen mit der Eigenschaft (16.17), und es bezeichne

Sk WD

k X 

.xj C xj /;

Sk WD

j D1

k X

xj

für k D 1; 2; : : : ; n;

j D1

P

wobei für eine Hintereinanderausführung von Additionen in F von links nach rechts steht. Dann gilt die folgende Fehlerabschätzung,

j Sk  Sk j 

.1 C eps/kj . 2jxj j C jSj j / eps für k D 1; 2; : : : ; n; (16.20)

 X k j D1



ƒ‚ DW Mk



falls noch ( mit der Notation M0 D 0 ) die Partialsummen innerhalb gewisser Schranken liegen:

xmin C .Mk1 C jxk j/eps  jSk j  xmax  . Mk1 C jxk j/eps; k D 1; 2; : : : ; n: (16.21)

Beweis. Es wird die Abschätzung (16.20) per Induktion über k bewiesen. Die Aussage in (16.20) ist sicher richtig für k D 1, und im Folgenden sei angenommen, dass sie für ein k  1 richtig ist. Mit der Notation

Sj WD Sj  Sj

für j  1;

S0 D 0;

berechnet man mit einer gewissen Zahl k 2 R ; j k j  eps, Folgendes,

Sk

D D ./

  Sk  Sk D Sk 1 C .xk C xk /  Sk

.Sk1 C Sk1 / C .xk C xk /  Sk

D

.Sk C Sk1 C xk /.1 C k /  Sk

D

.1 C k /Sk1 C k Sk C .1 C k /xk

und daher

jSk j  .1 C eps/jSk1 j C eps. jSk j C 2jxk j/:

(16.22)

Die Identität . / folgt hierbei aus der Eigenschaft (16.14), wobei die Resultate der Additionen in dem Gleitpunkt-Zahlensystem aufgrund der Annahme (16.21) allesamt in dem relevanten Bereich ¹ x 2 R W xmin  jx j  xmax º enthalten sind. Die Aussage dieses Theorems ist nun eine unmittelbare Konsequenz aus der Abschätzung (16.22) und der Induktionsannahme.

412

Kapitel 16

Rechnerarithmetik

Bemerkung 16.35. (a) Der Faktor .1 C eps/kj in der Abschätzung (16.20) ist umso größer, je kleiner k ist. Daher wird man vernünftigerweise beim Aufsummieren mit den betragsmäßig kleinen Zahlen beginnen. Dies gewährleistet zudem, dass die Partialsummen Sk betragsmäßig nicht unnötig anwachsen. (b) Theorem 16.34 liefert lediglich eine Abschätzung für den absoluten Fehler. Der relative Fehler j Sn  Sn j=jSn j jedoch kann groß ausfallen, falls jSn j klein gegenüber P n1 M j D1 .jxj j C jSj j/ C jxn j ist.

Weitere Themen und Literaturhinweise Eine ausführliche Behandlung von Gleitpunkt-Zahlensystemen und der Grundarithmetiken finden Sie etwa in Überhuber [106] ( Band 1 ), Goldberg [34] oder in Higham [55]. Insbesondere in [106] werden viele weitere interessante Themen wie beispielsweise spezielle Summationsalgorithmen für Gleitpunktzahlen, numerische Softwarepakete, die Anzahl der benötigten Taktzyklen zur Durchführung der vier Grundoperationen C; ; ; =, die asymptotische Komplexität von Algorithmen und die konkrete Implementierung von arithmetischen Operationen behandelt. Dass letztere nicht immer einwandfrei verläuft, zeigt sich am Beispiel der fehlerhaften Pentium-Chips im Jahr 1994 ( Moler [72] ).

Literaturverzeichnis [1] Ashby, S. F., T. A. Manteuffel und P. Saylor: A taxomony for conjugate gradient methods. SIAM J. Numer. Anal., 27(6):1542–1568, 1990. [2] Bärwolff, G.: Numerik für Ingenieure, Physiker und Informatiker. Elsevier, München, 2007. [3] Baumeister, J.: Stable Solution of Inverse Problems. Vieweg, Braunschweig/Wiesbaden, 1987. [4] Berman, A. und R. Plemmons: Nonnegative Matrices in the Mathematical Sciences. SIAM, Philadelphia, 1. Auflage, Reprint, 1994. [5] Boor, C. de: A Practical Guide to Splines. Springer, Heidelberg, Berlin, 1978. [6] Bollhöfer, M. und V. Mehrmann: Numerische Mathematik. Eine projektorientierte Einführung für Ingenieure, Mathematiker und Naturwissenschaftler. Vieweg, Wiesbaden, 2004. [7] Braess, D.: Finite Elemente. Springer, Berlin, Heidelberg, New York, 3. Auflage, 2003. [8] Brenan, K. E., S. L. Campbell und L. R. Petzold: Numerical Solution of Initial-Value Problems in Differential-Algebraic Equations. SIAM, Philadelphia, 1. Auflage, Reprint, 1996. [9] Bulirsch, R.: Bemerkungen zur Romberg-Integration. Numer. Math., 6:6–16, 1964. [10] Bulirsch, R. und J. Stoer: Numerical treatment of ordinary differential equations by extrapolation methods. Numer. Math., 8:1–13, 1966. [11] Bunse, W. und A. Bunse-Gerstner: Numerische Mathematik. Teubner, Stuttgart, 1985. [12] Cooley, J. W. und J. W. Tukey: An algorithm for the machine calculation of complex Fourier series. Math. of Computations, 19:297–301, 1965. [13] Daberkow, M., C. Fieker, J. Klüners, M. Pohst, K. Roegner, M. Schörnig und K. Wildanger: KANT V4. J. Symbolic Computation, 24:267–283, 1997. [14] Dahlquist, G.: Stability and error bounds in the numerical integration of ordinary differential equations. Transactions of the Royal Institute of Technology, Stockholm, 130, 1959. [15] Dallmann, H. und K.-H. Elster: Einführung in die höhere Mathematik III. Gustav Fischer Verlag, Jena, 2. Auflage, 1992. [16] Dekker, K. und J. G. Verwer: Stability of Runge-Kutta methods for stiff nonlinear differential equations. North-Holland, Amsterdam, 1984. [17] Dennis, J. E. und R. B. Schnabel: Numerical Methods for Unconstrained Optimization and Nonlinear Equations. SIAM, Philadelphia, 1. Auflage, Reprint, 1996. [18] Deuflhard, P.: Order and step-size control in extrapolation methods. Numer. Math., 41:399–422, 1983. [19] Deuflhard, P.: Recent progess in extrapolation methods for ordinary differential equations. SIAM Review, 27:505–535, 1985.

414

Literaturverzeichnis

[20] Deuflhard, P.: Newton Methods for Nonlinear Problems. Springer, Heidelberg, Berlin, 2004. [21] Deuflhard, P. und F. Bornemann: Numerische Mathematik 2. de Gruyter, Berlin, 3. Auflage, 2008. [22] Deuflhard, P. und A. Hohmann: Numerische Mathematik 1. de Gruyter, Berlin, 4. Auflage, 2008. [23] Elman, H.: Iterative methods for linear systems. In: J. Gilbert und andere (Herausgeber): Advances in Numerical Analysis, Vol. III., Proceedings of the fifth summer school in numerical analysis, Lancaster University, UK, 1992, pp. 69–118, Oxford, 1994. Clarendon Press. [24] Emmrich, E.: Gewöhnliche und Operator-Differentialgleichungen. Vieweg, Wiesbaden, 2004. [25] Engl, H. W., M. Hanke und A. Neubauer: Regularization of Inverse Problems. Kluwer, Dordrecht, 2. Auflage, 2000. [26] Finckenstein, K. Graf Finck von: Einführung in die Numerische Mathematik, Band 1 und 2. Carl Hanser Verlag, München, 1977/1978. [27] Fischer, B.: Polynomial Based Iteration Methods for Symmetric Linear Systems. WileyTeubner, Chichester, Stuttgart, 1996. [28] Fischer, G.: Lineare Algebra. Vieweg, Wiesbaden, 15. Auflage, 2005. [29] Forster, O.: Analysis 1. Vieweg/Teubner, Wiesbaden, 9. Auflage, 2008. [30] Freund, R. W., G. H. Golub und N. M. Nachtigal: Iterative solution of linear systems. In: Acta Numerica, pp. 1–44, Cambridge, 1991. Cambridge Univ. Press. [31] Freund, R. W. und R. H. W. Hoppe: Stoer/Bulirsch: Numerische Mathematik 1. Springer, Berlin, 10. Auflage, 2007. [32] Geiger, C. und C. Kanzow: Numerische Verfahren zur Lösung unrestringierter Optimierungsaufgaben. Springer, Heidelberg, Berlin, 2002. [33] Goering, H., H. G. Roos und L. Tobiska: Finite-Element-Methode. Akademie-Verlag, Berlin, 3. Auflage, 1993. [34] Goldberg, D.: What every computer scientist should know about floating-point arithmetic. ACM Computer Surveys, 23:5–48, 1991. [35] Golub, G. und C. F. Van Loan: Matrix Computations. The Johns Hopkins University Press, Baltimore, London, 2. Auflage, 1993. [36] Golub, G. und J. M. Ortega: Wissenschaftliches Rechnen und Differentialgleichungen. Eine Einführung in die Numerische Mathematik. Heldermann Verlag, Berlin, 1995. [37] Golub, G. und J. M. Ortega: Scientific Computing. Teubner, Stuttgart, 1996. [38] Gragg, W. B.: On extrapolation algorithms for ordinary initial value problems. SIAM J. Numer. Anal., 2:384–403, 1965. [39] Gramlich, G. und W. Werner: Numerische Mathematik mit Matlab. dpunkt.verlag, Heidelberg, 2000. [40] Greenbaum, A., V. Pták und Z. Strako˘ s: Any nonincreasing convergence curve is possible for GMRES. SIAM J. Matrix Anal. Appl., 17(3):465–465, 1996.

415

Literaturverzeichnis

[41] Grigorieff, R. D.: Numerik gewöhnlicher Differentialgleichungen, Band 1 und 2. Teubner, Stuttgart, 1972/77. [42] Groetsch, C. W.: Inverse Problems in the Mathematical Sciences. Vieweg, Braunschweig /Wiesbaden, 1993. [43] Großmann, Ch. und H.-G. Roos: Numerische Behandlung partieller Differentialgleichungen. Teubner, Stuttgart, 3. Auflage, 2005. [44] Großmann, Ch. und J. Terno: Numerik der Optimierung. Teubner, Stuttgart, 2. Auflage, 1997. [45] Günther, M. und A. Jüngel: Finanzderivate mit MATLAB. Vieweg, Wiesbaden, 2003. [46] Hackbusch, W.: Theorie und Numerik elliptischer Differentialgleichungen. Teubner, Stuttgart, 1986. [47] Hackbusch, W.: Iterative Lösung großer schwach besetzter Gleichungssysteme. Teubner, Stuttgart, 1991. [48] Hämmerlin, G. und K.-H. Hoffmann: Numerische Mathematik. Springer, Berlin, 4. Auflage, 1994. [49] Hairer, E. und C. Lubich: Asymptotic expansion of the global error of fixed-stepsize methods. Numer. Math., 45:345–360, 1984. [50] Hairer, E., S. P. Nørsett und G. Wanner: Solving Ordinary Differential Equations I, Nonstiff Problems. Springer, Berlin, 2. Auflage, 1993. [51] Hairer, E. und G. Wanner: Solving Ordinary Differential Equations II, Stiff Problems. Springer, Berlin, 2. Auflage, 1996. [52] Hanke-Bourgeois, M.: Grundlagen der Numerischen Mathematik. Teubner, Stuttgart, 2. Auflage, 2006. [53] Hestenes, M.R. und E. Stiefel: Method of conjugate gradients for solving linear systems. J. Res. Nat. Bur. Standards, Sec. B 49:409–432, 1952. [54] Heuser, H.: Gewöhnliche Differentialgleichungen. Teubner, Stuttgart, 4. Auflage, 2004. [55] Higham, N.: Accuracy and Stability of Numerical Algorithms. 2. Auflage, 2002.

SIAM, Philadelphia,

[56] Hirzebruch, F. und W. Scharlau: Einführung in die Funktionalanalysis. B. I. Wissenschaftsverlag, Mannheim/Wien/Zürich, 1971. [57] Hofmann, B.: Mathematik Inverser Probleme. Teubner, Stuttgart, Leipzig, 1999. [58] Horn, R. A. und C. R. Johnson: Matrix Analysis. Cambridge University Press, Cambridge, 1. Auflage, Reprint, 1994. [59] Jung, M. und U. Langer: Methode der finiten Elemente für Ingenieure. Teubner, Stuttgart, 2001. [60] Kelley, C. T.: Iterative Methods for Linear and Nonlinear Equations. SIAM, Philadelphia, 1995. [61] Knabner, P. und L. Angermann: Numerik partieller Differentialgleichungen. Springer, Berlin, Heidelberg, 2000. [62] Kosmol, P.: Methoden zur numerischen Behandlung nichtlinearer Gleichungen und Optimierungsaufgaben. Teubner, Stuttgart, 1989.

416

Literaturverzeichnis

[63] Kress, R.: Numerical Analysis. Springer, Berlin, Heidelberg, New York, 1998. [64] Krommer, A. und C. Überhuber: Computational Integration. SIAM, Philadelphia, 1998. [65] Liesen, J.: Computable convergence bounds for GMRES. 21(3):882–903, 2000.

SIAM J. Matrix Analysis,

[66] Louis, A. K.: Inverse und schlecht gestellte Probleme. Teubner, Stuttgart, 1989. [67] Lozinski˘i, S. M.: Error estimate for numerical integration of ordinary differential equations. Izv. Vysš. Uˇ cebn. Zaved. Matematika, 6(6):52–90, 1958. [68] März, R.: Numerical methods for differential algebraic equations. In: Iserles, A. (Herausgeber): Acta Numerica Vol. 1, pp. 141–198, Cambridge, 1992. Cambridge Univ. Press. [69] Maess, G.: Vorlesungen über numerische Mathematik, Band 1 und 2. Birkhäuser, Basel, 1985/88. [70] Meister, A.: Numerik linearer Gleichungssysteme. Vieweg, Wiesbaden, 2. Auflage, 2005. [71] Mennicken, R. und E. Wagenführer: Numerische Mathematik, Band 1 und 2. Vieweg, Braunschweig/Wiesbaden, 1977. [72] Moler, C.: A Tale of Two Numbers. SIAM News, 28(1):p. 1 and p. 16, 1995. [73] Moret, I.: A note on the superlinear convergence of GMRES. SIAM J. Numer. Analysis, 34(2):513–516, 1997. [74] Nachtigal, N. M., S. C. Reddy und L. N. Reddy: How fast are nonsymm