LEHRBUCH - Mathematik II - Analysis und Numerik [1. Auflage] 9783947940202

Das Lehrbuch Das Buch behandelt wesentliche Themen aus den mathematischen Teilgebieten der Analysis, garniert mit numeri

1,519 134 134MB

German Pages 285 Year 2020

Report DMCA / Copyright

DOWNLOAD FILE

Polecaj historie

LEHRBUCH - Mathematik II - Analysis und Numerik [1. Auflage]
 9783947940202

Table of contents :
Inhaltsverzeichnis
5.2.2 Mit Grenzwerten rechnen
69
5.2.3 Schranke, Monotonie, Inf & Sup
72
5.2.4 Ein Konvergenzkriterium für reelle Folgen 76
5.2.5 Teilfolgen und Häufungspunkte
78
5.2.6 Cauchyfolgen
89
1 Analysis und Numerik
11
5.3 Reihen
91
1.1 Analysis
11
5.3.1 Einige wichtige Reihen
94
1.2 Numerik
14
5.4 Grenzverhalten von Reihen
98
5.4.1 Notwendige Konvergenzbedingung 99
2 Reelle Zahlen
17
5.4.2 Absolute Konvergenz
99
2.1 Die reellen Zahlen beschreiben
19
5.4.3 Das Majorantenkriterium
100
2.1.1 Die reellen Zahlen konstruktiv beschreiben 19
5.4.4 Das Leibnitz-Kriterium
102
2.1.2 Die reellen Zahlen axiomatisch beschr. . . 20
5.4.5 Wurzelkriterium
103
2.2 Die Mächtigkeit der reellen Zahlen
25
5.4.6 Quotientenkriterium
104
2.2.1 Abzählbarkeit
25
6 Funktionen und Folgen
107
3 Komplexe Zahlen
29
6.1 Eine Konvergenz für reelle Funktionen
108
3.1 Die komplexen Zahlen
31
6.1.1 Konvergenz & verknüpfte Funktionen .
114
3.1.1 Die imaginäre Einheit
31
6.2 Konvergenz mehrdimensionaler Funktionen . .
115
3.1.2 Rechnen mit komplexen Zahlen
32
6.3 Funktionenfolgen
119
3.2 Nullstellen von Polynomgleichungen
36
3.3 Die komplexe Zahlenebene
38
7 Stetigkeit
122
7.1 Stetigkeit
122
3.3.1 Betrag und Argument komplexer Zahlen 38
3.3.2 Konjugiert komplexe Zahlen
39
7.1.1 Varianten der Stetigkeit
124
7.2 Analyse reeller stetiger Funktionen
128
3.4 Polardarstellung komplexer Zahlen
41
7.2.1 Der Zwischenwertsatz
128
4 Zahlendarstellung
46
7.2.2 Der Satz von Heine
130
4.1 Zahldarstellung im positionellen Zahlsystem
46
7.2.3 Der Satz vom Minimum und Maximum 131
4.1.1 Natürliche Zahlen zu einer Basis
47
7.3 Stetig fortsetzbare Funktionen
133
4.2 Maschinenzahlen
50
7.3.1 Gebrochen-rationale Funktionen
135
4.2.1 Darstellung von ganzen Zahlen
51
7.4 Stetigkeit mehrdimensionaler reeller Funktionen 140
4.2.2 Gleitkommazahlen
52
7.4.1 Stetigkeit mehrdimensionaler Funktionen 140
4.2.3 Binäre Gleitkommazahlen mit „hidden Bit" 53
8 Die Ableitung
141
5 Folgen und Reihen
55
8.1 Die eindimensionale Ableitung
142
5.1 Folgen
56
8.1.1 Alternative Beschreibung der Ableitung . 145
5.1.1 Graphische Darstellung von Folgen . . 59
8.1.2 Höhere Ableitungen
146
5.2 Grenzverhalten von Folgen
62
8.2 Rechenregeln für Ableitungen
147
5.2.1 Grenzwert, Konvergenz & Divergenz . . . 62
8.2.1 Die Summenregel
147
9
• INHALTSVERZEICHNIS
8.2.2 Die Produktregel
148
11 Polynominterpolation
220
8.2.3
Die
Kettenregel
150
11.1 Polynome - Definition und Eigenschaften . . . . 221
8.2.4 Die Quotientenregel
151
11.1.1 Homer-Schema
223
8.2.5 Die Ableitung der Umkehrfunktion . . . 153
11.2 Polynominterpolation
224
8.3
Der Mittelwertsatz (der Differentialrechnung) 154
11.2.1 Existenz und Eindeutigkeit der Polyno-
8.4
Die mehrdimensionale Ableitung
156
minterpolation
226
8.4.1 Die partielle Ableitung
159
11.2.2 Interpolationsfehler
228
8.4.2 Höhere partielle Ableitungen
167
11.3 Verfahren zur Berechnung des Interpolationspo-
8.5
Extremstellen für eindimensionale Funktionen 169
lynoms von kleinem Grad
232
8.5.1 Wachstum von Funktionen
169
11.3.1 Lagrange-Interpolation
232
8.5.2 Extrema einer Funktion
171
11.3.2 Aitken-Neville-Interpolation
237
8.6
Extremstellen für mehrdimensionale Funktionen 177
11.3.3 Newton-Interpolation
241
8.6.1 Extrema im Mehrdimensionalen
177
11.4 Spline Interpolation
244
8.7
Taylorentwicklung
181
11.4.1 Kurzschreibweise für Splines
246
8.7.1 Das Taylorpolynom
181
11.4.2 Kubische Splines
248
8.7.2 Beispiele der Taylorentwicklung
183
12 Nummerische
Integration
252
9 Nullstellen nummerisch finden
186
12.1 Numerische Integration - Einleitung
253
9.1 Iterationsverfahren - Einführung
187
12.2 Die Newton-Cotes-Formeln
255
9.2 Der Banachsche Fixpunktsatz
190
12.2.1 Äquidistanten Stützstellen
259
9.3 Iterationsverfahren zur Nullstellenbestimmung
193
12.3 Newton-Cotes-Formeln von kleinem Grad . .
261
9.3.1 Das Newton-Verfahren
193
12.3.1 Die Trapezregel
262
9.3.2 Das Sekanten-Verfahren
194
12.3.2 Die Simpsonregel
263
10 Das Integral
197
12.3.3 Die e-Regel
264
12.4 Quadraturfehler
266
10.1 Das bestimmte Integral
200
10.1.1 200
12.4.1 Exakte Quadraturformeln
266
Der orientierte Flächeninhalt
12.4.2 Quadraturfehler für beliebige Funktionen 267
10.1.2 Das Integral von Treppenfunktionen . . 201
12.4.3 Die summierten Newton-Cotes-Formeln . 267
10.1.3 Das Integral allgemeiner Funktionen . . 203
10.1.4 Rechenregeln für das Integral
210
13 Fehlerabschätzung
269
10.2 Der Mittelwertsatz (der Integralrechnung) . 213
13.1 Runden von Inputzahlen
270
10.3 Der Hauptsatz der Different.- & Integralrechnung214
13.2 Fortpflanzung des Rundungsfehlers
274
10.3.1 Integrale berechnen
216
10.3.2 Zwei Integrationshilfen
217
Symbolverzeichnis
283

Citation preview

Samuel Hetterich

Mathematik II Analysis und Numerik

1. Auflage

Lehrbuch

LEHRBUCH Mathematik II Analysis und Numerik Samuel Hetterich

Analogverlag

Bibliographische Informationen Der Deutschen Bibliothek Die Deutsche Bibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliographie; detailliertere bibliographische Daten sind im Internet über http://dnb.ddb.de abrufbar.

ISBN 978-3-947940-20-2 1. Auflage ©2020 Analogverlag Samuel Hetterich, Idsteiner Straße 149, D-60326 Frankfurt Umschlaggestaltung: Analogverlag Samuel Hetterich, Idsteiner Straße 149, D-60326 Frankfurt Druck: WIRmachenDRUCK GmbH, Mühlbachstr. 7, D-71522 Backnang

WIrmachenDruck.de Sie sparen, wir drucken:

Das Werk, einschließlich seiner Teile, ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages und des Autors unzulässig. Dies gilt insbesondere für die elektronische oder sonstige Vervielfältigung, Übersetzung, Verbreitung und öffentliche Zugänglichmachung Printed in Germany

Meiner geliebten Frau Janice und unseren Söhnen.

VORWORT Das Studium der Grundlagen der Mathematik stellt viele Studierende unterschiedlicher Studienrichtungen vor große Herausforderungen. Mit diesem Buch möchte ich all jenen ein Hilfsmittel an die Hand geben, diese erste Klippe zu umschiffen. Ich lese im vierten Jahr epochal die Grundlagenvorlesungen "Mathematik für die Informatik I" und "Mathematik für die Informatik II" über die Themenfelder der linearen Algebra, Analysis, diskreten Mathematik und Numerik an der Goethe-Universität Frankfurt am Main. Das vorliegende Lehrbuch entstand in der Dynamik eines kritischen Prozesses zwischen der von mir gehaltenen Vorlesung und dem Austausch mit meinen

Studierenden der vergangenen Jahre. Viele Beispiele und Abbildungen entwickelte ich, um meine Vorlesung gezielt anschaulicher und lebendiger zu gestalten. Auch Ich bin dankbar für jede Anmerkung, jeden Verbesserungsvorschlag und ehrliche Kritik der Vergangenheit, aber auch der Zukunft. Das Skript zu der gleichnamigen Vorlesung vorangegangener Semester, gehalten von Herrn Dr. Hartwig Bosse, diente mir als Quelle der Inspiration, Abschnitte durfte ich übernehmen, dafür danke ich herzlich. Dank gilt auch meiner Familie und meinen Freunden, die mich bei der Entstehung dieses Buches auf vielfältige Weise unterstützt haben.

EIN WORT ZUM INHALT DES LEHRBUCHS

Bei der Auswahl der Themen haben mich zwei Grundsätze geleitet. Methodisch sollen Leser befähigt werden, mathematische Inhalte lesen und formulieren zu können. Dabei sollen Sie ein solides Fundament und ein grundlegendes Verständnis der formalen und abstrakten mathematischen Herangehensweise entwickeln. Inhaltlich sollen Leser über grundlegende Themen der Analysis und Numerik informiert werden. Es ist sicherlich nicht möglich, alle diejenigen Themenfelder der Analysis und der Numerik in vollem Umfang zu behandeln, mit denen Studierende unterschiedlichster Studienrichtungen im Laufe ihrer weiteren Studien konfrontieren werden. Deshalb muss eine Auswahl geschehen. Ich habe den Fokus bewusst auf die saubere Vermittlung und ansprechende Anschauung der Grundlagen gelegt.

6

Schlussendlich mündete dieser Ansatz in das vorliegende Lehrbuch. Zunächst wird ein grundlegendes Verständnis von Zahlen und Zahlendarstellungen auf Rechnern vermittelt. Dabei stehen die reellen und komplexen Zahlen im Fokus. Folgen und Reihen werden als grundlegendes Werkzeug der Analysis und Numerik im Anschluss ausführlich studiert und dann mit dem Themenfeld von Funktionen verknüpft. Dies soll die Grundlagen des Studiums der Stetigkeit, der Ableitung und des Integrals legen. Im Kontext der Ableitung werden Extremstellen studiert. Das Finden von Nullstellen ist dabei essentielle Methode. Wir fügen einen numerischen Exkurs zur Nullstellenbestimmung eindimensionaler reeller Funktionen ein. Für das Integral studieren wir numerische Berechnungsverfahren, nachdem wir auch dafür mit der Polynominterpolation Grundalgen legen. Wir schließen mit einer kurzen Diskussion des Themenkomplexes der Fehlerabschätzung in der Numerik.

EIN WORT ZUM STUDIUM MIT DEM LEHRBUCH

Dieses Lehrbuch möchte genau dieses sein: Ein Lehrer für jeden grundlegend am Thema interessierten Leser. Es hat zum Ziel, die abstrakten mathematischen Theorien nicht bloß sauber (und deshalb nur für Experten), sondern vor allem für Jedermann lesbar darzustellen. Es will das Wissen an die Studierenden bringen, möchte lehren. Damit dies gelingt, sind einige Hinweis notwendig. „Eine Sprache erlernt man, indem man sie spricht" und „Wiederholung ist die Mutter allen Lernens", diese beiden zweifellos wahren Aussagen gelten auch für das Erlernen mathematischer Inhalte. Nur wer sich mit den abstrakten Definitionen und Aussagen auseinandersetzt und sie dadurch „verdaut", Zeit investiert und übt, wird sie wirklich erfassen. Diesen Aufwand können Ihnen keine noch so guten (und praxisorientierten) Bücher, keine noch so „freshen" Erklärvideos und online Tutorials, aber auch keine Vorlesung abnehmen - diesen Aufwand werden Sie selbst betreiben müssen. Doch es gibt Bedingungen, die diesen Prozess begünstigen - bei der Konzeption dieses Lehrbuchs habe ich dies berücksichtigt. Wenn Sie sich die folgenden Aspekte durchlesen, sollte Ihnen auch klar werden, warum ich immer noch an das „analoge Lehrbuch" glaube, dass man anfassen, beschreiben, blättern und zerlesen kann. Schlüssige, klare Darstellung „aus einem Guss". Möchte man neue mathematische Inhalte erfassen, dann stellt einen die Abstraktion vor große Herausforderungen. Es gibt nichts dem Lernerfolg gleich hinderliches, wie sekundäre Aspekte, die den klaren Blick auf das Wesentliche verwehren. Solche Aspekte können die ungenaue und wechselnde Notation (Benennung) der auftreten-

den mathematischen Objekte, die unterschiedlichen ersten Sicht- und Herangehensweisen, oder ungenügende oder falsche Motivation der Inhalte, sowie schlecht gewählte Beispiele sein. Das vorliegende Buch ist „aus einem Guss geschrieben". Die gleiche Symbolik zieht sich durch das ganze Buch. Verwirrung durch variierende Notation sollte so vermieden sein. Das Lehrbuch setzt die Inhalte meines Buchs "Mathematik für die Informatik r voraus. Es sind mathematische Grundlagen der Themenfelder Abbildungen, Mengenlehre, Logik und Beweise, aber auch der Linearen Algebra. In diesem Lehrbuch wird außerdem das mathematische Wissen aus der Schule vorausgesetzt. Sollten Sie dabei eigene Defizite feststellen, empfehle ich einen Online-Mathematik-Brückenkurs, der den Übergang von der Schule an die Universität unterstützten möchte. Abitur-relevantes mathematisches Grundlagenwissen kann dort wiederholt und aufgefrischt werden. Sie finden Ihn unter www . ombplus . de. Einen zweiten interessanten Blickpunkt liefert die Lerntheorie. Lernen heißt Verknüpfen. Dazu muss Wissen aufbereitet, sortiert und an existierendes Wissen angedockt werden. In einer Zeit ständiger Verfügbarkeit allen Wissens (man kann schnell googeln oder auf Wikipedia nachlesen) sind wir es nicht mehr gewohnt (oder vielleicht schon nicht mehr dazu in der Lage), Wissen dauerhaft für uns selbst zu erschließen. Das ist fatal. Das Lehrbuch möchte Ihnen helfen, die behandelten Inhalte wirklich zu lernen. Dabei fördert es durch seine aufeinander aufbauende Struktur das Verknüpfen von Wissen.

7

Intuitive Beispiele. Um abstrakte Definitionen oder Objekte, aber auch mathematische Aussagen zu erfassen, helfen intuitive Beispiele. In dem vorliegenden Lehrbuch findet sich eine Vielzahl ausführlich kommentierter Beispiele. Dabei wird besonders auf eine ausführliche Darstellung der Rechenwege Wert gelegt. Das hilft den Durchblick zu erlangen und Abstraktes mit Leben gefüllt besser zu erinnern. Unterstützende Illustrationen. Was in Worten umständlich beschrieben wird, kann oft leichter in einer Grafik erfasst werden. Deshalb verfügt das Lehrbuch über zahlreiche als Illustration und Beweisskizze unterstützende Abbildungen. Hilfreiche Erläuterungen. Das Lehrbuch ist durchsetzt mit einer großen Zahl an Erläuterungen. Sie ergänzen den Lesefluss und helfen Neues zu erfassen, es abzugrenzen und einzuordnen. Wieder gilt der Grundsatz: "Lernen heißt Verknüpfen". In den Erläuterungen möchte ich mit dem Lesenden und seinem schon gelernten Wissen in den Dialog treten. Platz für Entfaltung. Das Lehrbuch bietet einen breiten Schreibrand. Dieser breite Streifen an der Buchaußenseite fasst nicht nur gedruckte Erläuterungen und Abbildungen, sondern bietet Raum für Ihre Notizen. Markieren und kommentieren Sie die Inhalte, notieren Sie Ihre Fragen oder gefundene Antworten, ergänzen Sie Zwischenschritte und halten Sie Eselsbrücken fest.

Der Raum gehört Ihnen, nutzen Sie ihn. Ein gutes Gefühl. Mit Emotionen verknüpftes Wissen bleibt. Das Lehrbuch ist beispielsweise bewusst in Farbe gedruckt. Sie sollen gerne Zeit mit ihm verbringen. Das Lehrbuch darf Ihnen ein treuer Begleiter sein. Bücher sind Freunde. Sie werden viel zusammen durchmachen, das schweißt zusammen. Mein Lehrbuch der linearen Algebra aus dem ersten Semester findet immer noch seinen Ehrenplatz in meinem Bücherregal. Die von Notizen übersäten Seiten sehe ich immer noch vor mir, wenn ich meine Augen schließe und mich erinnere. Diese Erfahrung wünsche ich Ihnen mit Ihrem persönlichen Exemplar des Lehrbuchs. Zwei gut gemeinte Ratschläge sollen diese „Gebrauchsanweisung" abrunden: Bleiben Sie am Ball und lassen Sie sich nicht frustrieren. Das Studium der Mathematik bedarf Ausdauer und Frustrationstoleranz. Geben Sie sich die Zeit, die Sie brauchen - beißen Sie sich rein. Es ist sicherlich naiv zu glauben, Sie könnten das Buch an einem Wochenende verschlingen. Das Erlernen der Mathematik braucht „Verdauungszeit". Vertrauen Sie mir jedoch, dass Sie in drei Jahren, wenn sie die Inhalte verdaut und Komplexeres in Ihrem Studium erlernt haben werden, das Lehrbuch ungläubig aufschlagen. Ungläubig, weil Ihnen die Inhalte lange nicht mehr so schwer und abstrakt erscheinen, wie sie das in den nächsten Wochen und Monaten noch tun werden.

LETZTE ERSTE WORTE

Bei Anregungen, Kritik, Verbesserungsvorschlägen oder falls Sie Fehler finden, melden Sie sich gerne per Mail unter [email protected]. So ist nun alles gesagt und es kann losgehen. Ich 8

wünsche Ihnen viel Erfolg bei Ihren Studien. Frankfurt, im Frühjahr 2020 Samuel Hetterich

INHALTSVERZEICHNIS •

Inhaltsverzeichnis 1 Analysis und Numerik

1.1 Analysis 1.2 Numerik 2 Reelle Zahlen

11

11 14 17

19 2.1 Die reellen Zahlen beschreiben 2.1.1 Die reellen Zahlen konstruktiv beschreiben 19 2.1.2 Die reellen Zahlen axiomatisch beschr. . . 20 25 2.2 Die Mächtigkeit der reellen Zahlen 25 2.2.1 Abzählbarkeit

5.2.2 Mit Grenzwerten rechnen 69 5.2.3 Schranke, Monotonie, Inf & Sup 72 5.2.4 Ein Konvergenzkriterium für reelle Folgen 76 5.2.5 Teilfolgen und Häufungspunkte 78 89 5.2.6 Cauchyfolgen 5.3 Reihen 91 5.3.1 Einige wichtige Reihen 94 5.4 Grenzverhalten von Reihen 98 5.4.1 Notwendige Konvergenzbedingung 99 5.4.2 Absolute Konvergenz 99 5.4.3 Das Majorantenkriterium 100 102 5.4.4 Das Leibnitz-Kriterium 103 5.4.5 Wurzelkriterium 5.4.6 Quotientenkriterium 104 6 Funktionen und Folgen

3 Komplexe Zahlen

29

31 3.1 Die komplexen Zahlen 31 3.1.1 Die imaginäre Einheit 32 3.1.2 Rechnen mit komplexen Zahlen 36 3.2 Nullstellen von Polynomgleichungen 38 3.3 Die komplexe Zahlenebene 3.3.1 Betrag und Argument komplexer Zahlen 38 39 3.3.2 Konjugiert komplexe Zahlen 41 3.4 Polardarstellung komplexer Zahlen 4 Zahlendarstellung

46

46 4.1 Zahldarstellung im positionellen Zahlsystem 4.1.1 Natürliche Zahlen zu einer Basis 47 50 4.2 Maschinenzahlen 51 4.2.1 Darstellung von ganzen Zahlen 52 4.2.2 Gleitkommazahlen 4.2.3 Binäre Gleitkommazahlen mit „hidden Bit" 53

6.1 Eine Konvergenz für reelle Funktionen 6.1.1 Konvergenz & verknüpfte Funktionen . 6.2 Konvergenz mehrdimensionaler Funktionen . . 6.3 Funktionenfolgen 7 Stetigkeit

55

56 5.1 Folgen 5.1.1 Graphische Darstellung von Folgen . . 59 62 5.2 Grenzverhalten von Folgen 5.2.1 Grenzwert, Konvergenz & Divergenz . . . 62

108 114 115 119 122

122 7.1 Stetigkeit 124 7.1.1 Varianten der Stetigkeit 128 7.2 Analyse reeller stetiger Funktionen 7.2.1 Der Zwischenwertsatz 128 130 7.2.2 Der Satz von Heine 7.2.3 Der Satz vom Minimum und Maximum 131 7.3 Stetig fortsetzbare Funktionen 133 7.3.1 Gebrochen-rationale Funktionen 135 7.4 Stetigkeit mehrdimensionaler reeller Funktionen 140 7.4.1 Stetigkeit mehrdimensionaler Funktionen 140 8 Die Ableitung

5 Folgen und Reihen

107

141

8.1 Die eindimensionale Ableitung 142 8.1.1 Alternative Beschreibung der Ableitung . 145 8.1.2 Höhere Ableitungen 146 8.2 Rechenregeln für Ableitungen 147 8.2.1 Die Summenregel 147

9

• INHALTSVERZEICHNIS

8.3 8.4

8.5

8.6 8.7

8.2.2 Die Produktregel 148 Die Kettenregel 8.2.3 150 8.2.4 Die Quotientenregel 151 8.2.5 Die Ableitung der Umkehrfunktion . . . 153 Der Mittelwertsatz (der Differentialrechnung) 154 Die mehrdimensionale Ableitung 156 8.4.1 Die partielle Ableitung 159 8.4.2 Höhere partielle Ableitungen 167 Extremstellen für eindimensionale Funktionen 169 8.5.1 Wachstum von Funktionen 169 8.5.2 Extrema einer Funktion 171 Extremstellen für mehrdimensionale Funktionen 177 8.6.1 Extrema im Mehrdimensionalen 177 Taylorentwicklung 181 8.7.1 Das Taylorpolynom 181 8.7.2 Beispiele der Taylorentwicklung 183

9 Nullstellen nummerisch finden

9.1 Iterationsverfahren - Einführung 9.2 Der Banachsche Fixpunktsatz 9.3 Iterationsverfahren zur Nullstellenbestimmung 9.3.1 Das Newton-Verfahren 9.3.2 Das Sekanten-Verfahren 10 Das Integral

186

187 190 193 193 194 197

10.1 Das bestimmte Integral 200 10.1.1 Der orientierte Flächeninhalt 200 10.1.2 Das Integral von Treppenfunktionen . . 201 10.1.3 Das Integral allgemeiner Funktionen . . 203 10.1.4 Rechenregeln für das Integral 210 10.2 Der Mittelwertsatz (der Integralrechnung) . 213 10.3 Der Hauptsatz der Different.- & Integralrechnung214 10.3.1 Integrale berechnen 216 10.3.2 Zwei Integrationshilfen 217

10

11 Polynominterpolation

220

11.1 Polynome - Definition und Eigenschaften . . . . 221 11.1.1 Homer-Schema 223 11.2 Polynominterpolation 224 11.2.1 Existenz und Eindeutigkeit der Polynominterpolation 226 11.2.2 Interpolationsfehler 228 11.3 Verfahren zur Berechnung des Interpolationspolynoms von kleinem Grad 232 11.3.1 Lagrange-Interpolation 232 11.3.2 Aitken-Neville-Interpolation 237 11.3.3 Newton-Interpolation 241 11.4 Spline Interpolation 244 11.4.1 Kurzschreibweise für Splines 246 11.4.2 Kubische Splines 248 12 Nummerische Integration

252

12.1 Numerische Integration - Einleitung 253 12.2 Die Newton-Cotes-Formeln 255 12.2.1 Äquidistanten Stützstellen 259 12.3 Newton-Cotes-Formeln von kleinem Grad . . 261 12.3.1 Die Trapezregel 262 12.3.2 Die Simpsonregel 263 12.3.3 Die e-Regel 264 12.4 Quadraturfehler 266 12.4.1 Exakte Quadraturformeln 266 12.4.2 Quadraturfehler für beliebige Funktionen 267 12.4.3 Die summierten Newton-Cotes-Formeln . 267 13 Fehlerabschätzung

13.1 Runden von Inputzahlen 13.2 Fortpflanzung des Rundungsfehlers Symbolverzeichnis

269

270 274 283

Kapitel 1

Analysis und Numerik In diesem Kapitel möchten wir die Themenfelder der Analysis und der Numerik kennenlernen und in den größeren Kontext der Mathematik stellen. Dabei werden wir grundlegende Fragestellungen und Methoden diskutieren und einen Überblick über die in diesem Buch behandelten Themen geben.

In diesem Buch möchten wir die Grundlagen der mathematischen Teilgebiete der Analysis und der Numerik studieren. Diese beiden Themenfelder passen sehr gut zusammen. Wie wir gleich besprechen werden, ist die Analysis in der modernen Mathematik tatsächlich ein sehr weites Feld. In einem engeren Sinne verordnet man unter der Analysis das Studium von allgemeinen Funktionen. In der reellen Analysis, auf welche wir uns in diesem Buch im Wesentlichen konzentrieren, studiert man reelle Funktionen. Die Analysis legt die theoretischen Grundlagen im Verständnis dieser Funktionen. Dabei formuliert sie die richtigen Fragen und beantwortet sie in einem formalen

strengen mathematischen Sinne. Möchte man diese Einsichten nutzen, um konkrete Funktionen automatisiert mit einem Rechner zu berechnen, steht man vor praktischen Problemen. Angefangen mit der Frage, wie Rechner Zahlen speichern, bis hin zu der Aufgabe die Verarbeitung logischer Anweisungen auf Rechnern zu realisieren, sind dabei große Herausforderungen zu überwinden. In der Numerik untersucht man genau dieses Problemfeld. Man kann also klar formulieren, dass die Analysis die theoretischen Grundlagen legt und die Numerik die praktische Seite in den Blick nimmt.

1.1 Analysis Das Wort Analysis ist ein Gräzismus, also ein aus dem Altgriechischen in die deutsche Sprache entlehntes Wort. Die direkte Übersetzung lautet „Auflösung'. Ähnliches gilt für das verwandte Wort „Analyse". Unter einer Analyse versteht man eine systematische Untersuchung, bei der das zu un-

tersuchende Objekt in seine Bestandteile zerlegt, also „aufgelöst" wird. Diese Bestandteile werden dann nach Kriterien klassifiziert und entsprechend ihrer Eigenheiten geordnet beschrieben. Dabei fasst man insbesondere auch die Beziehungen und Wechselwirkungen dieser ins Auge. Die offensicht-



ANALYSIS

liche Idee: Man möchte das große Ganze durch das Verständnis seiner Einzelteile begreifen. Historisches

Ein Teilgebiet der Mathematik trägt den Namen Analysis und die Umschreibung einer Analyse trifft die dort betriebene Mathematik sehr gut. Die grundlegende Arbeit der Analysis wurde von Gottfried Wilhelm Leibniz (1646-1716) und Isaac Newton (1643-1727) unabhängig voneinander geleistet. Sie entwickelten die sogenannte Infinitesimalrechnung. Diese liefert eine Methode, eine Kurve auf beliebig kleinen oder, dem Lateinischen entlehnt, infinitesimalen Abschnitten widerspruchsfrei zu beschreiben. Klassisch wurde die Mathematik in die Teilgebiete der Geometrie und Algebra unterteilt. Die Probleme, welche Leibniz und Newton zu der Entwicklung dieser Methode trieben, waren aus diesen Teilgebieten motiviert. Wie lässt sich der Flächeninhalt einer durch eine gekrümmte Begrenzungslinie eingefassten Fläche definieren oder berechnen? Die Antwort lautete: Analysis - zerlege die Fläche in viele kleine Teile, für welche der Flächeninhalt zu beschreiben ist und setze diese wieder zu der großen Fläche zusammen. Man kann beispielsweise den Flächeninhalt eines Kreises bestimmen, indem man den Kreis durch eine Pizza annähert, deren Pizzastücke nicht Kreisausschnitten sondern Dreiecken entsprechen. Den Flächeninhalt der Dreiecke kann man leicht bestimmen. Der Flächeninhalt des Kreises entspricht fast der Summe dieser Flächeninhalte. Man unterschätzt ihn, denn jedes Pizzastück approximiert einen Kreisausschnitt und unterschlägt einen kleinen Teil zwischen Dreiecksbegrenzung und Kreislinie. Wählt man diese Dreiecke möglichst schmal - also infinitesimal klein - so nähert sich der durch

12

die Approximation ermittelte Flächeninhalt hoffentlich dem Flächeninhalt der Kreisfläche. In der Formalisierung des Konzepts, das mit "möglichst schmal" umschrieben wird, steckt die abstrakte Leistung von Leibniz und Newton. Spätestens seit Leonhard Euler (1707-1783), dem wir noch heute einen großen Teil der Terminologie und Notation in der Mathematik verdanken, wird die Analysis als ein eigenständiges Teilgebiet der Mathematik verstanden. Er führte beispielsweise den Begriff der mathematischen Funktion in die Analysis ein. Die Problemstellungen der Analysis werden seitdem in der Regel durch eine Funktion beschrieben, welche auf verschiedene Eigenschaften hin untersucht wird. Das können die auch aus der Schule bekannten Eigenschaften der Stetigkeit, der Differenzierbarkeit und der Integrierbarkeit sein. Grundsätzlich ist entscheidend, ob die Funktion über den reellen Zahlen, den komplexen Zahlen oder sonst einer Menge definiert ist. Das wird deutlicher, wenn man sich die soeben aufgezählten Eigenschaften näher anschaut. Historisch studierte man Funktionen über den reellen Zahlen. Grundlegende Fragestellungen

Erhält man eine beliebige Funktion f : R -+ R von den reellen Zahlen in die reellen Zahlen, so kann man Glück haben und die Funktion ist linear. Das meint, dass für alle x, y E 118 gilt, dass f(x + y) = f (x) + f(y) f (x • y) = x • f (Y).

Der Funktionsgraph einer solchen Funktion ist eine Gerade, die durch den Ursprung läuft. Eine solche Funktion ist immer von der Form f (x) = c • x für ein c E R. Man versteht sie sehr gut. Kennt

ANALYSIS

man den Funktionswert an einer Stelle, kann man ihn für jede andere Stelle nennen. Außerdem kann man den Flächeninhalt zwischen Funktionsgraph und x-Achse über einem Intervall sehr leicht berechnen. Weiß man beispielsweise, dass für eine lineare Funktion f (5) = 10 ist, kann man darauf schließen, dass für alle x E IR gilt f (x) = 2 • x. Es ist der Funktionsgraph bekannt, der Wert in jeder noch so großen Umgebung um 5 - beides lässt sich allein über den Funktionswert an der Stelle 5 ermitteln. Nun gibt es neben linearen unheimlich viele weitere reelle Funktionen. Lassen sich diese ebenso wie lineare verstehen? Kann man aus der Kenntnis des Funktionswerts an einer Stelle etwas über den Funktionswert an anderen, vielleicht benachbarten Stellen sagen? Bei der Differenzierbarkeit nähert man Funktionen durch lineare Funktionen lokal an. Man stellt fest, dass der Funktionsgraph an einem Punkt, wenn man „ganz nahe heranzoomt", aussieht, wie eine lineare Funktion. Wenn dies der Fall ist, nennt man die Funktion differenzierbar. Lokal betrachtet liegt also „fast" eine von den leicht zu studierenden linearen Funktionen vor. Der Name erschließt sich aus der Methode zum Auffinden einer solchen Approximation. Man sucht zunächst Sekanten, welche den Funktionsgraphen an mehr als einer Stelle in der zu untersuchenden Umgebung schneiden - die Steigung einer solchen Sekante lässt sich als ein Quotient aus den Differenzen der Funktionswerte und der Stützstellen berechnen. Details finden sich in Kapitel 8. Ist eine Funktion an einem Punkt nicht differenzierbar, kann man zumindest danach fragen, ob er in einem gewissen Sinne kontinuierlich ist. Grob gesprochen, darf der Funktionsgraph zwar abknicken, aber nicht wild hin und herspringen. Springt

der Graph nicht, wird er als stetig bezeichnet. Stetigkeit ist ein weiteres grundlegendes Konzept der Analysis und wird in Kapitel 7 studiert. Neben der Differenzierbarkeit und der Stetigkeit ist die Fragestellung der Integralrechnung schon angeklungen. Der Flächeninhalt einer von einer gekrümmten Linie eingefassten Fläche soll bestimmt werden. In Kapitel 10 nehmen wir dieses in den Blick. Methodik

Grundlegend für die gesamte Analysis sind die beiden Körper R, der Körper der reellen Zahlen, und C, der Körper der komplexen Zahlen, mitsamt deren vielfältigen Eigenschaften. Bevor man Analysis betreibt, ist eine umfangreiche Beschäftigung mit diesen Zahlbereichen obligatorisch. Das bedeutendste Werkzeug der Analysis ist das Konzept der mathematischen Folge. In dieser Einleitung haben wir schon verschiedentlich von einem „ganz nahe an einen Funktionsgraphen Heranzoomen" gesprochen. Formal sauber geschieht dies mit einer Folge von Abständen, die immer kleiner zu dem im Fokus liegenden Punkt gewählt werden. Da man beliebig nahe an eine reelle Zahl herantreten kann, setzt sich eine solche Folge unendlich lange fort. Das Studium eines solchen abstrakten Objekts wird in Kapitel 5 betrieben. Der Grenzwertbegriff sei als ein bedeutender an dieser Stelle noch herauszustreichen. In Kapitel 6 wenden wir diese Methoden auf Funktionen an. Im Kontext der Differentialrechnung und möchte man mehrdimensionale Funktionen studieren, ist ein grundlegendes Verständnis der linearen Algebra unabdingbar. In der linearen Algebra werden lineare Funktionen ausführlich erklärt und beschrieben. Die Analysis kommt nicht ohne die dort entwickelten Methoden aus.

13



NUMERIK

1.2 Numerik

In der numerischen Mathematik, oder kurz Numerik, werden die Probleme praktischer Lösungen von mathematischen Berechnungen auf einem automatisierten Rechner betrachtet. Grundsätzlich fallen in der Mathematik häufig Problemstellungen an, deren Lösung darin besteht, mittels algorithmischer Berechnung eine mathematische Größe zu bestimmen. Das können ... ■ ... die Lösung linearer Gleichungssysteme, ■ ... die Berechnung von (bestimmten) Integralen, ■ ... die Lösung von Differentialgleichungen und ■ ... die Ermittlung der Nullstelle(n) einer stetigen Funktion sein. Die Numerik konstruiert und analysiert Algorithmen und passt diese gegebenenfalls gezielt an, um solche Problemstellungen eben nicht nur theoretisch, sondern ganz praktisch mit Hilfe eines Rechners zu lösen. Die obige Aufzählung von Problemen ist bei weitem nicht erschöpfend und für jedes dieser Probleme gibt es eine große Zahl von zunächst einmal theoretischen unterschiedlichen Lösungsverfahren. Dabei unterscheidet man zwischen ■ direkten Verfahren, die bei unendlicher Rechengenauigkeit die exakte Lösung des Problems liefern und Beispiel: Gauß-Verfahren

■ approximativen Verfahren, die nur eine Näherung (Approximation) des Problems berechen. Beispiel: Quadraturformeln

14

In der Praxis reicht in der Regel eine endliche Genauigkeit der Lösung eines mathematischen Problems. Deshalb werden häufig, obwohl es für entsprechende Probleme direkte Verfahren gibt, approximative Verfahren bevorzugt. Diese liefern dann eine Lösung mit gewünschter Genauigkeit in angemessener Geschwindigkeit. Beim Berechnen von Größen mit einem Rechner, beispielsweise einem Computer, nehmen Laien oft naiv an, dass der Computer sicherlich korrekt rechnen wird. Doch diese Annahme stellt sich als fatal heraus. Die Natur des Computers und die der zu berechnenden Aufgaben sind nämlich in der Regel nicht kompatibel, was zu Problemen führt. Das Problem liegt grundsätzlich darin, dass ein Rechner nur endlich viel Speicher zur Verfügung hat. Das bedeutet, dass er sich nicht jede Zahl korrekt "merken" kann. Die Kreiszahl 7r als irrationale Zahl hat als Dezimalzahl unendlich viele Nachkommastellen, die nicht periodisch werden. Das ist im Übrigen auch der Fall, wenn man 7r im Binärsystem für einen Rechner verständlich darstellen möchte. Ein Rechner, der den Flächeninhalt eines Kreises mit Radius 1 berechnen soll, ist aufgeschmissen. Er kennt 7r nicht. Bestenfalls kann er mit einer Approximation von 7r rechnen und erhält nur eine Approximation an den Flächeninhalt. Die erste Fehlerquelle besteht also darin, dass ein Rechner die Eingaben einer Rechnung nicht korrekt abspeichern kann, sondern sie rundet. Man nennt einen Fehler, der seinen Ursprung in dieser Problematik hat, eine Störung der Eingabedaten. Eine zweite Fehlerquelle besteht darin, dass ein Algorithmus nicht korrekt auf einem Rechner dar-

NUMERIK •

gestellt werden kann. Das könnte unter anderem daran liegen, dass eine Berechnung durchgeführt werden muss, die nicht exakt oder ausreichend schnell zu realisieren ist. Es könnte beispielsweise sein, dass eine Eingabe x mit der eulerschen Zahl e potenziert werden muss. Eine Rechnung, die nicht exakt auf einem Rechner mit nur endlich viel Speicherkapazität durchzuführen ist. Statt mit dem korrekten Algorithmus wird also ein für Rechner praktikabler Ersatz verwendet. In diesem Fall wird mittels Taylorapproximation ein Polynom ermittelt und auch verwendet, welches die Funktionswerte der Exponentialfunktion approximiert. Mit diesen zwei Fehlerquellen kann es passieren, dass das Ergebnis einer numerischen Rechnung auf einem Rechner mit der tatsächlichen Lösung nicht mehr viel zu tun hat. Man ist also daran interessiert, ob eine numerische Berechnung mit fehlerhaften Eingabedaten und mittels einem für einen Rechner angepassten Algorithmus noch annehmbare Lösungen liefert. Formal kann man einen numerischen Algorithmus als eine Funktion f auffassen, welche die möglichen Eingabedaten x auf ihre Lösungen abbildet. Bezeichnet man mit die gestörten, fehlerhaften Eingabedaten und mit den für einen Rechner angepassten Algorithmus kann man vier Größen bestimmen. Diese sind häufig nur theoretischer Natur und nicht exakt zu bestimmen. Abschätzungen geben aber eine gute Orientierung. Die erste Größe If

- f (41

ist der Abstand, der Lösungen des "korrekten" Algorithmus für die korrekte Eingabe x und die gestörte Eingabe x. Dieser Abstand wird auch als Kondition bezeichnet und ist eine Eigenschaft des

Algorithmus. In Worten: Wie stark reagiert der Algorithmus auf gestörte Eingabedaten.

»korrekten"

Die zweite Größe f(x) - f(x) ist der Abstand, der Lösungen des »numerischen" Algorithmus für die korrekte Eingabe x und die gestörte Eingabe i. Dieser Abstand wird auch als Stabilität bezeichnet und ist eine Eigenschaft des numerischen Algorithmus. In Worten: Wie stark reagiert der »numerischen" Algorithmus auf gestörte Eingabedaten. Die dritte Größe (x) - f(x) ist der Abstand, der Lösungen des »numerischen Algorithmus" und des »korrekten Algorithmus" für die korrekte Eingabe x. Dieser Abstand wird auch als Konsistenz bezeichnet. In Worten: Wie stark weicht der numerische Algorithmus bei korrekten Eingabedaten von der korrekten Lösung ab. Die vierte Größe

ist der Abstand, der Lösungen des »numerischen" Algorithmus für gestörte Eingabedaten und der Lösung des »korrekten" Algorithmus für die korrekte Eingabe x. Dieser Abstand wird auch als Konvergenz bezeichnet und ist die eigentlich gefragte Größe. In Worten: Wie stark weicht der »numerischen" Algorithmus bei gestörten Eingabedaten von der "korrekten" Lösung ab. Schon angeklungen ist der Aspekt der Laufzeitanalyse. Nur weil ein numerischer Algorith-

15



NUMERIK

mus theoretisch Lösungen mit akzeptabler Fehlerabschätzung liefert, heißt das noch lange nicht, dass er dies auch effizient tut. Das meint, dass die Laufzeit, welche üblicherweise mit der Anzahl der Berechnungen auf einem Rechner angegeben wird, akzeptabel ist. Diese Laufzeitanalyse muss grundsätzlich für jeden numerischen Algorithmus und, wenn man ganz genau ist, für jede mögliche Eingabe durchgeführt werden. Das ist nicht praktikabel. Das Gebiet der Komplexitätstheorie beschäftigt sich ausführlich mit solchen Fragestellungen. In dieser grundlegenden Darstellung der Numerik beschränken wir uns auf einige wesentliche Aspekte. Die Numerik wird die Analysis garnieren, so schließt sich dem Kapitel 8 über die Ableitung Kapitel 9 zur numerischen Bestimmung von Nullstellen an. Nullstellen zu finden ist im Kontext von Extremwertanalyse eine entscheidende Methode. Auch das Berechnen von Integralen kann

16

und muss in vielen Anwendungen in Ermangelung exakter Verfahren numerisch, approximativ betrieben werden. So schließt sich dem Kapitel 10 über Integrale das Kapitel 12 über numerische Integration an. Ganz zu Beginn, im Kontext der in den Kapiteln 2 und 3 studierten Zahlenbereiche der reellen und komplexen Zahlen, legen wir die Grundlagen der Darstellung von Zahlen auf Rechnern. Am Schluss des Buchs befindet sich das Kapitel 13 welches die Aufgabe der Fehlerabschätzung in den Blick nimmt. Häufig werden komplizierte Funktionen der Analysis durch eine leichtere Funktion ersetzt, welche dieser „ähnelt". Dabei wird üblicherweise eine Interpolationsfunktion verwendet, welche an sogenannten Stützstellen exakt mit der zu interpolierenden Funktion übereinstimmt und die werte dazwischen interpoliert. Polynome bieten sich als solche interpolierenden Funktionen aus vielen praktischen Gründen an, wir studieren sie in Kapitel 11.

Kapitel 2

Reelle Zahlen In diesem Kapitel wollen wir einen Einblick in die mathematische Definition von Zahlenbereiche geben. Dabei stehen die reellen Zahlen im Fokus. Möchte man allgemeine Funktionen über den reellen Zahlen studieren, ist ein grundlegendes Verständnis der reellen Zahlen und ihrer besonderen Eigenschaften unabdingbar. Zahlenbereiche können axiomatisch oder konstruktiv eingeführt werden. Zunächst erörtern wir an den natürlichen Zahlen die axiomatische Definition von Zahlenbereichen und wenden dies auf die reellen Zahlen an und nennen ihre wichtigen Eigenschaften. Abschließend nehmen wir die Mächtigkeit der reellen Zahlen in den Blick.

Es gibt verschieden Zahlenbereiche in der Mathematik. Die gängigsten sind die natürlichen, die ganzen, die rationalen und die reellen Zahlen. Tatsächlich lassen sich diese mathematisch unterschiedlich beschreiben. In der Mathematik gibt es zwei Wege Zahlenbereiche zu definieren. Man kann sie konstruktiv und axiomatisch beschreiben. Bei der Konstruktion wird eine Menge von Elementen beschrieben, welche die Eigenschaften des gewünschten Zahlbereiches haben. Sind die natürlichen Zahlen gegeben, kann man die ganzen Zahlen als eine Zahlenbereichserweiterung dieser definieren. Dabei wird eine Äquivalenzrelation auf dem kartesischen Produkt der natürlichen Zahlen mit sich selbst, also auf N x N, definiert. Dann sind zwei Tupel (a ,b), (c, d) E N x N äquivalent, wenn gilt a+ d = c+ b. Die Addition und Multiplikation sind dabei definiert als (a, b) (c, d) = (a + c, b d) (a, b) • (c,

und

= (ac bd, ad + bc).

Die ganzen Zahlen entsprechen der Menge der Äquivalenzklassen dieser Äquivalenzrelation. Über solche Zahlenbereichserweiterungen lassen sich die ganzen aus den natürlichen, die rationalen aus den ganzen und die reellen aus den rationalen Zahlen konstruieren. Die natürlichen Zahlen fallen bei dieser Beschreibung vom Himmel. Die natürlichen Zahlen werden axiomatisch eingeführt. Es wird also eine Menge von Axiomen formuliert, welche die natürlichen Zahlen eindeutig beschreiben. Dieses Vorgehen ist in der Mathematik typisch. Axiome sind dabei nicht zu beweisende Grundannahmen. Jede mathematische Aussage muss über logische Schlüsse auf solche Axiome zurückzuführen sein. Die natürlichen Zahlen werden über die sogenannten Peano-Axiome definiert. Der italienische Mathematiker Guiseppe Peano formulierte 1889 fünf Axiome, welche die natürlichen Zahlen bis heute bestimmen. Sie werden ihm zur Ehre als die Peano-Axiome be-

zeichnet.

deutig beschreiben. Um dieses Vorgehen etwas zu üben, möchten wir die axiomatische Einführung der natürlichen Zahlen über die Peano-Axiome kurz betrachten.

Tatsächlich kann man so jeden der genannten Zahlenbereiche auch axiomatisch beschreiben - also definierende Eigenschaften festlegen, die ihn ein-

ZU DEFINITION 2.1

gl

Die formalen Formulierungen der Peano-Axiome sind etwas schwer zu lesen hier eine „Übersetzung" in gesprochene Sprache. Es ist Pl. [Es gibt eine natürliche Zahl, welche mit 0 bezeichnet wird.] P2. [Für jede natürliche Zahl n gibt es eine natürliche Zahl n', welche als Nachfolger bezeichnet wird.] P3. [Die 0 ist kein Nachfolger einer natürlichen Zahl.] P4. [Natürliche Zahlen mit gleichem Nachfolger sind gleich.] P5. [Enthält eine Menge N die 0 und mit jeder natürlichen Zahl n auch deren Nachfolger n', sind die natürlichen Zahlen eine Teilmenge von N.]

DEFINITION 2.1 Wir nennen eine Menge N die Menge der natürlichen Zahlen, wenn sie die folgenden Eigenschaften (als Peano-Axiome bezeichnet) besitzt.

P 1. P2. P3. P4. P5.

0EN Vn(n E N n' E N) Vn(n E N n' 0) Vn, m(m, n E N (m' = n m = n)) VN(0 E N A Vn(n E N (n E X E N))

N C N)

r BEMERKUNG 2.2 Dass jede natürliche Zahl einen Nachfolger besitzt, sorgt dafür, dass die natürlichen Zahlen „der Größe nach" sortiert werden können. Beginnend mit der 0 folgt der Nachfolger der 0 welchen wir mit 1 bezeichnen, folgt der Nachfolger der 1, welchen wir mit 2 bezeichnen, folgt der Nachfolger der 2, welchen wir mit 2 bezeichnen, .... L

J

✓ BEMERKUNG 2.3 Das

1

L

J

Axiom P5 wird auch als Induktionsaxiom bezeichnet und ist Grundlage des Beweisprinzips der vollständigen Induktion.

BEMERKUNG 2.4 Ob

L

die natürlichen Zahlen bei 0 oder erst bei 1 anfangen ist letztlich Frage der Vereinbarung. In der Zahlentheorie, einem Teilgebiet der Mathematik, ist es üblich die 0 nicht zu den natürlichen Zahlen zu zählen. In der Informatik und anderen Bereichen der Mathematik zählt die 0 üblicherweise zu den natürlichen Zahlen. Daran halten wir uns in diesem Buch. J

Rechnen mit natürlichen Zahlen Wir betrachten die beiden Rechenoperationen Ad-

dition und Multiplikation natürlicher Zahlen. Die Addition zweier natürlicher Zahlen ist folgendermaßen definiert. ■ Für alle natürlichen Zahlen n E N gilt n

0 = n.

• Für alle natürlichen Zahlen n, m E N gilt n+

= (n + m)'.

Die erste Eigenschaft klingt gewohnt, man ist vielleicht darüber verwundert, dass diese Trivialität überhaupt der Rede wert ist. Die zweite Eigenschaft in Worten lautet: Die Summe einer natürlichen Zahl n und dem Nachfolger

18

DIE REELLEN ZAHLEN BESCHREIBEN •

m' einer natürlichen Zahl m entspricht dem Nachfolger der Summe der natürlichen Zahl n und der natürlichen Zahl m. Hilft das in der Praxis weiter? Wieder ist eine Summe zweier natürlicher Zahlen zu „berechnen". Allerdings nimmt m nun selbst die Rolle des Nachfolgers ein, so dass man statt der Summe von n und dem Nachfolger von m den Nachfolger der Summe von n und m bestimmt, was dem Nachfolger der Summe von n und dem Vorgänger von m entspricht. Man „reduziert" quasi den zweiten Summanden und merkt sich dabei, wie oft man das getan hat, bis man bei der 0 angelangt ist. Dann hilft die erste Regel und die gesuchte Summe ist dann der so und so vielte Nachfolger von n. Mit konkreten Zahlen für n = 5 und m = 2 ist dann m' = 3 und wir erhalten ni-m'=5+3= (5+2)'= ((5±1)')'

mit Hilfe der Addition definiert. ■ Für alle natürlichen Zahlen n EN gilt n•0 =n. ■ Für alle natürlichen Zahlen n, m E N gilt n • m' = (n • m) n. Die erste Eigenschaft klingt wiederum gewohnt. Die zweite Eigenschaft in Worten lautet: Das Produkt einer natürlichen Zahl n und dem Nachfolger m' einer natürlichen Zahl m entspricht dem Produkt der natürlichen Zahl n und der natürlichen Zahl m plus die natürliche Zahl n. Hilft das in der Praxis weiter? Wieder ist das Produkt zweier natürlicher Zahlen zu „berechnen". Wiederum nimmt m nun selbst die Rolle des Nachfolgers ein. Mit konkreten Zahlen für n = 5 und m = 2 ist dann m' = 3 und wir erhalten

= (( (5 + 0)')')' = ( (5)' )'r = B. n•m' =5.3=5.2+5=5.1+5+5 DieMultiplikation zweier natürlicher Zahlen wird

=5.0+5+5+5=15.

2.1 Die reellen Zahlen beschreiben Wie schon in der Einleitung dieses Kapitels ausgeführt, lassen sich Zahlenbereiche konstruktiv, als eine Zahlenbereichserweiterung aus einem

schon definierten Zahlenbereich oder axiomatisch, mit ihren definierenden Eigenschaften einführen.

2.1.1 Die reellen Zahlen konstruktiv beschreiben Die reellen Zahlen sind eine Zahlenbereichserweiterung der rationalen Zahlen. Eine erste Konstruktion dieser Art führte Karl Weierstraß (18151897) durch, welcher die reellen Zahlen mittels

beschränkten Reihen positiver Glieder definierte eine Konstruktion, deren hier gegebene Bezeichnung nach Lektüre des Kapitels 5 hoffentlich nicht mehr ganz so kryptisch klingt.

19

1 DIE REELLEN ZAHLEN BESCHREIBEN

Mittlerweile sind andere Konstruktionen gebräuchlicher. Man kann die Dedekindschen Schnitte rationaler Zahlen betrachten. Die reellen Zahlen entsprechen dort den kleinsten oberen Schranken von nach oben beschränkten Teilmengen der rationalen Zahlen. Ein anderer Ansatz betrachtet die Äquivalenzklassen von Cauchy-Folgen. Zwei Cauchy-Folgen sind dabei äquivalent, wenn ih-

re Differenz eine Nullfolge ist. Zuletzt sei noch die Konstruktion als Äquivalenzklassen von Intervallschachtelungen rationaler Intervalle erwähnt. Auch von diesen Konstruktionen kann sich ein Laie zunächst nur schwer eine Vorstellung machen nach dem Studium der grundlegenden Methoden der Analysis fällt dies sicherlich leichter.

2.1.2 Die reellen Zahlen axiomatische beschreiben Die reellen Zahlen haben einige wichtige Eigenschaften, welche sie zusammengenommen eindeutig definieren. Das heißt, dass kein anderer Zahlenbereich all diese Eigenschaften vereint. Dies gilt nicht für die einzelnen Eigenschaften, welche die reellen Zahlen durchaus mit anderen Zahlbe-

ZU DEFINITION

2.5

ä

In der Definition eines Körpers sind die mathematischen Begriffe „Verknüpfung" und „abelsche Gruppe " enthalten. Für ein tieferes Studium dieser Begriffe sei auf eine Darstellung algebraischer Strukturen verwiesen. Kurz gesagt ist eine Verknüpfung auf einer Menge eine Abbildung, welche zwei Elementen aus der Menge ein anderes Element der Menge zuordnet. Man könnte es auch als Rechenoperation bezeichnen. Eine abelsche Gruppe ist eine Menge, auf welche eine Verknüpfung definiert ist, wobei diese Verknüpfung umkehrbar ist (es inverse Elemente gibt), sie die Rechenregeln der Assozitivität und der Kommutativität erfüllt und so etwas wie ein neutrales Element besitzt.

20

reichen gemeinsam haben kann. Die reellen Zahlen als algebraische Struktur Die reellen Zahlen sind ein Körper. Ein Körper ist eine algebraische Struktur, die einer Menge mit zwei Verknüpfungen entspricht, welche gewisse „Rechenregeln" erfüllen.

DEFINITION 2.5 Ein Körper (K,±,.) ist ein Tripel aus • einer Menge K, • einer Verknüpfung + : • einer Verknüpfung • :

x x

K' und -+ K' wobei K c K' ist,

so dass die folgenden Axiome gelten. Kl. (K, +) ist eine abelsche Gruppe (e = 0) K2. (K \ {0}, •) ist eine abelsche Gruppe K3. a•(b+c)=a•b+a•c K4. (a+b)•c=a•c+b•c

Va, b, c E K Va, b, c E K

Es lässt sich leicht überprüfen, dass die reellen Zahlen einen Körper bilden. Dazu sind die Körperaxiome nachzurechnen. Das ist umfangreich, aber im Detail nicht weiter dramatisch. Man

(Addition) (Multiplikation) (Distributivgesetz I) (Distributivgesetz II)

verliert dabei schnell den Überblick, welche Rechenregeln man verwenden darf und welche man zeigen muss.

DIE REELLEN ZAHLEN BESCHREIBEN III

II LEMMA 2.6 Die reellen Zahlen bilden mit der gewöhnlichen Addition und Multiplikation einen Körper. Beweis. Die Körperaxiome Kl. bis K4 sind nachzurechnen. Details werden dem Leser überlassen.

Die reellen Zahlen sind geordnet

Dass die reellen Zahlen mit der gewöhnlichen Addition und Multiplikation einen Körper bilden, beschreibt sie allerdings nicht allumfassend. Auch die rationalen Zahlen bilden mit der gewöhnlichen Addition und Multiplikation einen Körper. Die reellen Zahlen kann man, wie man das von den allermeisten gebräuchlichen Zahlenbereichen kennt, geordnet aufschreiben. Die komplexen Zah-

len (welche wir in Kapitel 3 einführen) und andere in der Mathematik verbreitete Körper haben diese Eigenschaft nicht - sie ist deshalb erwähnenswert. Die Begriffe der Halbordnung und der Totalordnung formalisieren die Idee einer "sortierten" Menge. Die reellen Zahlen sind total geordnet, wie Lemma 2.9 festhält.

DEFINITION 2.7 Es sei A eine beliebige Menge. Wir bezeichnen eine Relation auf A als Halbordnung auf A und A als halb geordnet, wenn die folgenden Axiome gelten.

H1. a a H2. Ist a b und b a, dann ist a = b H3. Ist a b und b c, dann ist a c

EA Va, b E A Va, b,c E A

(Reflexivität) (Antisymmetrie) (Transitivität)

Wir bezeichnen eine Halbordnung auf A als Totalordnung auf A und A als total geordnet, wenn außerdem das folgende Axiom gilt. T01. Es ist entweder a

b oder b ti a Va, b, c e A

(Totalität)

BEISPIEL 2.8 Betrachte ein beliebige Menge .A, deren Elemente selbst Mengen sind. Dann ist die Teilmengenrelation c eine Halbordnung auf A. Denn es gelten

H1. H2. H3.

Für jede Menge A E A gilt A c A. Gilt für zwei Mengen A, B E A, dass A c B und B c A, dann gilt A = B. Gilt für drei Mengen A, B, C E A, dass A c B und B c C, dann gilt auch A c C.

Die Teilmengenrelation ist je nach Beschaffenheit von .A keine Totalordnung. Es gibt möglicherweise Mengen A, B E A mit A B und B IZ A. Zum Beispiel könnten beide Mengen nicht leer aber disjunkt, also A n B = 0 sein.

e

ZU DEFINITION 2.7 Eine Halbordnung auf einer Menge A ist eine Relation auf dieser Menge. Sie setzt also prinzipiell zwei Elemente der Menge A in Relation zueinander. Dabei ist nicht vorausgesetzt, dass sie das für jedes beliebige Pärchen von Elementen aus A tut. Den Ausdruck a b für zwei Elemente a, b E A kann man als „erst kommt a und dann kommst b oder a ist gleich b" oder „man sortiere b vor a oder a ist gleich b" interpretieren. Die drei Eigenschaften spiegeln unsere Vorstellung einer solchen Ordnung. So ist die Eigenschaft H01 offensichtlich und trägt der Möglichkeit Rechnung, dass a gleich b gewählt sein kann. Die Eigenschaften H02 und H03 sind spannender. So spiegelt H02 die Tatsache, dass ein in Relation stehen von a und b sowie b und a nur dann möglich ist, wenn a gleich b ist. Es kann nicht a vor b und b vor a sortiert werden, wenn diese sich unterscheiden. Die Eigenschaft H03 macht deutlich, dass aus einer Sortierung der Elemente a und b, sowie b und c auch eine für a und c folgt. Eine Totalordnung schließt den Fall aus, dass es zwei Elemente der Menge gibt, die nicht in Relation zueinander stehen, für welche man also nicht ihre Sortierung entscheiden kann. Als ein gutes Beispiel für eine Ordnung kann man sich grundsätzlich die „ldeiner-gleich-Relation" vorstellen.

Es ist zum Beispiel A = {{0,1,2}, {0,1}, {1,2}, {O}} eine über die Teilmengenrelation halb geordnete Menge. Da weder {1,2} c {0} noch {0} c {1,2} gilt, ist A nicht total geordnet. Entfernt man die Menge {1,2} aus A, erhält man eine total geordnete Menge A\ {{1,2}} = {10,1,21, {0,1}, {0}1, weil 101 c {0,1},{0} c {0,1,2} und {0,1} c {0,1,2}. 21



DIE REELLEN ZAHLEN BESCHREIBEN

L EMMA 2.9 Die reellen Zahlen sind über die „kleiner-gleich-Relation" total geordnet. Beweis. Man rechnet die Eigenschaften H01 bis H03 und TO1 nach. Details werden dem Leser überlassen. ■

Das Konzept der Ordnungen angewendet auf die algebraische Struktur eines Körpers führt zu angeordneten Körpern. Die reellen Zahlen sind nach Lemma 2.11 ein angeordneter Körper. Nicht je-

ZU DEFINITION

2.10 ei

Ein angeordneter Körper ist eine Menge mit einer Totalordnung, welche verträglich mit den Verknüpfungen des Körper ist. Die Axiome werden auch als Anordnungsaxiome bezeichnet.

der Körper ist angeordnet. Die komplexen Zahlen beispielsweise bilden einen Körper, der nicht angeordnet ist.

DEFINITION 2.10 Ein Körper 1K heißt geordnet (oder auch angeordnet), wenn auf ihm eine Totalordnung < definiert ist und die folgenden Axiome gelten. A1.

Ist a < b, dann ist a±c4 eine surjektive Funktion der natürlichen Zahlen in die Menge M. BEISPIEL 2.23

L n

1 1

BEISPIEL 2.24 Die Menge M = N der natürlichen Zahlen ist abzählbar unendlich. Wir finden mit A(n) = n für alle n E N eine offensichtlich surjektive und injektive Funktion der Menge der natürlichen Zahlen auf sich selbst. L

1 BEISPIEL 2.25 Die Menge M = Z der ganzen Zahlen ist abzählbar unendlich. Wir finden mit A(0) = 0 und A(1) = 1, A(2) = —1, A(3) = 2, A(4) = —2, ... eine Funktion von N nach Z, die offensichtlich surjektiv und injektiv ist.

L

1 1

2.26 Endliche Mengen sind stets höchstens abzählbar. Spannend wird die Frage, wenn man unendliche Mengen in den Blick nimmt. BEMERKUNG

Die Menge der rationalen Zahlen ist nach Proposition 2.27 abzählbar unendlich - sprich, obwohl die rationalen Zahlen „gefühlt mehr" Zahlen als die natürlichen Zahlen beinhalten, gibt es eine bijektive Funktion zwischen diesen Zahlbereichen. In ZU PROPOSITION

2.27

A

Das in Proposition 2.27 verwendete Argument wird auch als das erst Cantorsche Diagonalargument bezeichnet. Dabei ist der Zusatz „diagonal" offensichtlich zu verstehen. Der Zusatz „Cantor', verweist auf den Mathematiker Georg Ferdinand Ludwig Philipp Cantor (1845-1918), welcher diesen Beweis erdachte.

26

ihrer Mächtigkeit sind sie gleich. Satz 2.28 zeigt, dass diese für die reellen Zahlen nicht der Fall ist. Man könnte also umgangssprachlich sagen, dass die reellen Zahlen in ihrer Unendlichkeit die natürlichen Zahlen überragen.

PROPOSITION 2.27 Die Menge der rationalen Zahlen ist abzählbar unendlich. Beweis. Man schreibt zunächst die rationalen Zahlen in eine unendlich große Tabelle. Der Eintrag in Zeile i und Spalte j in der Tabelle lautet dabei ist i E N>1 und j E Z. Nun löscht man alle Einträge, deren Bruch nicht vollständig gekürzt ist und erhält die in Abbildung 2.1 angedeutete Tabelle.

DIE MÄCHTIGKEIT DER REELLEN ZAHLEN •

7 6

5

4

3

2

10

6 5 4 3 2 10 1 1 1 1 1 1 5 1

1 2

1 2

373

4

3

/

5

5

6

4

5

6

7

i

1 2 3 4 5 6 1 1 1 1 1 1 1

ri

3

3

1 2 3 3

3

/

5

/ 4

1 2 3 3

7

6 5 4 3 2 1 0 1 2 3 4 5

67

1

1

7

2

8

3 4 5 6 7

8

ABBILDUNG 2.1

Es lassen sich die rationalen Zahlen in einer unendlich großen Tabelle aufschreiben. Dabei stimmen je zwei Brüche der selben Zeile in ihrem Nenner und in der selben Spalte in ihrem Zähler überein. Sie sind ungekürzt aufgeschrieben und in einem Eliminationsschritt werden dann nicht vollständig gekürzte Brüche gelöscht. Man zählt dann die vollständig gekürzten Brüche, also alle rationalen Zahlen, indem man die Tabelle wie rechts angedeutet abläuft. Dabei erhält man eine bijektive Funktion der natürlichen Zahlen in die Menge der rationalen Zahlen.

Nun läuft man diese Tabellen diagonal ab, wie in dem Schema rechts in Abbildung 2.1 angedeutet. Man beginnt in Zeile 1 und Spalte 0. Dabei findet man die Bilder der natürlichen Zahlen, indem man durchgestrichene Brüche ignoriert. Es ist also A(0) = 0— 1' 2 A(6) = — 1'

1 A(1) = 1 — A(2) = -1' 1 3 A(7) = — ' A(8) = — 1 3'

2 A(3) = -1' 1 A(9) = 3'

A(4) = -1, 2

1 A(5) = — 2

Man hat nun eine surjektive (weil jeder Bruch in der Tabelle aufgeführt ist) und injektive (weil alle nicht vollständig gekürzten Brüche gelöscht wurden) Funktion beschrieben. Also sind die rationalen ■ Zahlen abzählbar unendlich.

III

SATZ

2.28 Die Menge der reellen Zahlen ist überabzählbar.

Beweis. Wir zeigen, dass das Intervall [0,1) der nicht-negativen reellen Zahlen kleiner 1 nicht abzählbar ist. Dann ist die Menge aller reellen Zahlen sicherlich auch nicht abzählbar.

27

DIE MÄCHTIGKEIT DER REELLEN ZAHLEN

Angenommen, es gibt eine surjektive Funktion A : N —> [0,1). Dann betrachte mit A(i) = 0, AioAii Ai2 ... x

X0

die Dezimaldarstellung der reellen Zahl A(i) e [0,1).

4 4 • • • Aoo A11 A22 A33 0

mit Aij E {0,1, ... ,9} für j e N,

XI X2 X3

1

2

Wir konstruieren nun eine reelle Zahl mit der Dezimaldarstellung

3 . .

0 A00 A01 A02 A03 • • •

X

=

0, xix2x3

... mit xi = { 1 falls Aii =- 0 0 sonst.

1 A10 A11 Al2 A13 • • • 2 A20 A21 A22 A23 • • • 3 A30 A31 A32 A33 • • •

ABBILDUNG 2.2

in

Gegeben eine Liste aller reller Zahlen im halboffenen Einheitsintervall [0,1). Die im Beweis zu Satz 2.28 konstruierte reelle Zahl x im halboffenen Einheitsintervall unterscheidet sich zu allen reellen Zahlen in der Liste. Das steht im Widerspruch dazu, dass die Liste alle reelle Zahlen in dem Intervall auflistet.

28

Die Zahl x liegt in dem Intervall [0,1] und unterscheidet sich in ihrer Dezimaldarstellung an der Stelle i von der Dezimaldarstellung von A(i) für alle i E N. Es gilt also x /=A(j) für alle i E N. Ein Widerspruch zur Surjektivität von A. Es gibt also keine surjektive Funktion der natürlichen Zahlen in das reelle Intervall [0,1) - es ist demnach nicht abzählbar. ■ r BEMERKUNG 2.29

Das Argument im Beweis von Satz 2.28 wird als zweites Diagonalargument von Cantor

bezeichnet. Man nimmt an, es gibt eine Liste der reellen Zahlen im Intervall [0,1). Dann konstruiert man eine Zahl x, die sich von allen diesen Zahlen unterscheidet, indem man die Zahlen der Liste zunächst in einer großen Tabelle in ihrer Dezimaldarstellung aufführt. Dann sorgt man dafür, dass sich x von der Zahl in Zeile i genau an Stelle i unterscheidet - dieser Eintrag liegt auf der Diagonalen der in Abbildung 2.2 gegebenen Tabelle. Damit unterscheidet sich x von jeder Zahl in der Liste und ist damit eine reelle Zahl im halboffenen Einheitsintervall, die nicht aufgezählt wird. Die Liste korrespondiert nicht zu einer surjektiven Funktion - ein Widerspruch.

Kapitel 3

Komplexe Zahlen Die komplexen Zahlen sind eine Zahlenbereichserweiterung. Die reellen Zahlen werden durch Nullstellen von Polynomen der Form x2 = —1 ergänzt. Dazu wird die imaginäre Einheit i eingeführt, für welche gilt i2 = —1. Eine komplexe Zahl besteht aus einem Realteil und einem Imaginärteil. Die komplexen Zahlen können nicht auf einem Zahlenstrahl aber in einer Ebene, der sogenannten Gauß'schen Zahlenebene verzeichnet werden. Mittels Polarkoordinaten erhält man eine alternative Beschreibung der komplexen Zahlen.

Wir wir schon in Kapitel 2 betrachtet haben, gibt es unterschiedliche Zahlbereiche. Allseits bekannt sind die natürlichen, ganzen, rationalen, irrationalen und damit auch reellen Zahlen. Sie sind ineinander enthalten, es ist N c Z c Q c (die irrationalen Zahlen haben da natürlich eine Sonderstellung). Man kann sie axiomatisch beschreiben oder Schritt für Schritt als Zahlenbereichserweiterungen konstruieren. Historisch betrachtet stellt man fest, dass sie auch erst nach und nach „entdeckt" wurden. Die Ansprüche an Zahlen des praktischen Lebens sind nach und nach gestiegen. Man kann sich das veranschaulichen, in dem man für jeden dieser Zahlbereiche Typen von Gleichungen charakterisiert, deren Lösungen in ihm enthalten sind.

entsprechen der Anzahl zählbarer Gegenstände. Mit ihnen kann man problemlos addieren. Hat man 3 Exemplare und 4 Exemplare des selben Gegenstands in der Hand, besitzt man insgesamt 7 Exemplare. Man kann in den natürlichen Zahlen also problemlos Gleichungen der Form 3 + x = 7 lösen. Es gibt die natürliche Zahl x = 4, welche jene Gleichung löst. Man muss an dieser Stelle erwähnen, dass die 0 eine durchaus fortschrittliche Erfindung war. Sie ermöglichte das Nutzen von Stellenwertsystemen - siehe Kapitel 4. Ganze Zahlen

Möchte man eine Gleichung der Form 5 + x = 2 lösen, kommt man mit den natürlichen Zahlen an seine Grenzen. Die ganzen Zahlen Z = {0,1, —1,2, —2,3 — 3,4, —4, ...}

Natürliche Zahlen

Die natürlichen Zahlen N = {0,1,2,3,4, ...}

schließen diese Lücke. Es gibt die ganze Zahl x = —3, welche jene Gleichung löst. Negative Zahlen haben ihre Entsprechung beispielsweise bei der Notation von Schulden oder gerichteten

Größen, wie der Temperatur auf der Skala, die sich an einem kalibrierten Nullpunkt orientieren. Rationale Zahlen

Möchte man eine Gleichung der Form 5 • x = 7 lösen, kommt man mit den ganzen Zahlen an seine Grenzen. Die rationalen Zahlen Q= { 12 :p,qEZ} schließen diese Lücke. Es gibt die rationale Zahl x = s, welche jene Gleichung löst. Brüche und damit die rationalen Zahlen stehen für "Anteile eines geteilten Ganzen" - berühmte Anwendungen sind das Teilen von Pizzas und Kuchen. Reelle Zahlen

Möchte man eine Gleichung der Form x2 = 2 lösen, kommt man mit den rationalen Zahlen an seine Grenzen. Die reellen Zahlen R=

E Z, di E {0, ... ,9}}

mit den enthaltenden irrationalen Zahlen (Dezimalzahldarstellung bricht nicht ab und wird nicht periodisch) schließen diese Lücke. Es gibt die reelle Zahl x = welche jene Gleichung löst. Die reelle Zahl N/2 entspricht übrigens der Länge der Diagonalen in einem 1-mal-1 großen Quadrat, wie der Satz des Pythagoras erhellt. Auch das Verhältnis der Seiten eines Blatt Papiers im Din A4-Format ist 1 zu Na Komplexe Zahlen

Tatsächlich haben wir nun alle Zahlenbereiche kennen gelernt, deren Zahlen auf dem Zahlenstrahl zu finden sind. Beginnend mit den

30

natürlichen Zahlen, ergänzt um ihre negativen Zahlen (die ganzen Zahlen), um Brüche (die rationalen Zahlen) und Zahlen mit nicht periodischer Dezimaldarstellung (die reellen Zahlen) hat man wirklich die letzte Lücke auf dem Zahlenstrahl geschlossen. Man könnte also davon ausgehen, dass es keine weiteren Zahlen gibt. Möchte man jedoch die Gleichung der Form x2 = —1 lösen, findet sich unter all diesen Zahlen keine, die das tut. Wir werden nun den altbewährten Weg gehen und den Zahlenbereich erweitern - "neue Zahlen erfinden". Dabei werden wir feststellen, dass diese "neu erfundenen Zahlen" tatsächlich nicht mehr auf einem Zahlenstrahl zu verzeichnen sind - eine Ebene muss erhalten der Zahlenstrahl wird um eine räumliche Komponente ergänzt. Das kann man mit einem zweidimensionalen Koordinatensystem vergleichen, bei welchem die x-Achse (ein Zahlenstrahl) um die y-Achse (ebenfalls ein Zahlenstrahl) ergänzt wird. Wir werden außerdem feststellen, dass diese "neuen" Zahlen eine weniger offensichtliche anschauliche Darstellung in der Umwelt besitzen. Man kann sich diese Zahlen zwar veranschaulichen, also auf ein Blatt Papier zeichnen, findet sie jedoch in der Natur nur "hinter den Kulissen", in der Beschreibung bestimmter physikalischer Phänomene beispielsweise. Dieser Umstand führt zu der leicht obskur anmutenden Bezeichnung dieser „neuen" Zahlen als „imaginäre" Zahlen. Tatsächlich heißt der neue Zahlenbereich komplexe Zahlen - eine komplexe Zahl besteht aus einem reellen Anteil (einer reellen Zahl) und einem imaginären Anteil (eine solche imaginäre Zahl).

DIE KOMPLEXEN ZAHLEN

3.1 Die komplexen Zahlen Die Klasse der reellen Zahlen ist sehr groß, trotzdem lernt man in der Schule, dass a • x2 ti•x+c = 0 nur dann lösbar ist, falls ihre Diskriminante A = b2 — 4ac nicht negativ ist, da aus einer negativen Zahl keine Wurzel gezogen werden kann. Beispielsweise hat die Gleichung x2 = —1 kei-

ne reelle Lösung, was etwas unbefriedigend ist. Lässt sich nicht vielleicht doch irgendwie eine Zahl VII definieren? Die Antwort lautet: „Dein!". Tatsächlich gibt es keine reelle Zahl x e l mit x2 = —1 - hier wird also nichts vorenthalten trotzdem konstruieren wir nun eine Lösung, indem wir uns eine entsprechende Zahl definieren.

3.1.1 Die imaginäre Einheit Wie angekündigt definieren wir uns nun eine Zahl, bolen einen Buchstaben ein, der dieser Lösung welche die Gleichung x2 = —1 löst. Dabei führt entspricht. man in Ermangelung von alternativen ZahlensymD E Fl N T1 0 N 3.1 Wir nennen eine Zahl die imaginäre Einheit, welche die Gleichung x2 = —1 löst und bezeichnen sie mit i. Man rechnet mit der imaginären Einheit i, als wäre sie eine Variable. Es ist also beispielsweise i

i = 2i,

i • i = i2

—1 • i =

oder auch

1 • i = i.

bi ZU DEFINITION 3.1

Die Zahl i ist in sofern imaginär, als dass sie keine reelle Zahl ist und keine direkt greifbare Entsprechung in der „echten" Welt besitzt. Sie wird als Einheit bezeichnet, weil man die komplexen Zahlen „mit ihr baut" und sie dort eine ähnliche Rolle spielt, wie die 1 in den reellen Zahlen.

r BEMERKUNG 3.2 Aus der Regel i2 = —1 und den erlaubten Rechenregeln lässt sich folgern, dass sich Potenzen von i wieder als ±1 oder +i schreiben lassen. i °

=

1

= i2 i3 i4 i5

i • i i2 i •i 3 i4

L

Mit der imaginären Einheit erhalten wir nun eine neue, zusätzliche Zahl, mit welcher wir die Lösungen für x2 = —1 angeben können, es sind

= i • (-1)

=

i • (-i)

=

-1 1

i •1 J

nämlich i und —i. Außerdem kann man mittels imaginärer Einheit die komplexen Zahlen definieren.

31



DIE KOMPLEXEN ZAHLEN

ZU DEFINITION

3.3 gl

Eine komplexe Zahl ist also aus einer reellen Zahl und einem reellen Vielfachen der imaginären Einheit über eine Addition zusammengebaut. Sie hat also einen reellen und einen imaginären Anteil. Auch wenn uns eine komplexe Zahl wie ein Term erscheint, handelt es sich dabei um eine Zahl. Man denke an rationale Zahlen in der Bruchschreibweise Auch sie sind aus zwei Zahlen "zusammengebaut". Eine komplexe Zahl hat also einen Realteil und einen Imaginärteil, wie ein Bruch einen Zähler und einen Nenner besitzt. Dabei wird übrigens häufig der folgende typische Fehler begangen: Der Imaginärteil der komplexen Zahl z=a+b•i ist die reelle Zahl b und nicht i • b. Ist Im(z) = 0, so schreibt man für die komplexe Zahl z=a+O•i auch einfach z = a, lässt den Imaginärteil und die imaginäre Einheit also einfach weg. Aus dem Kontext muss dann klar werden, dass z nicht die reelle Zahl a sondern die komplexe Zahl a + 0 • i ist. Ist Re(z) = 0, so schreibt man für die komplexe Zahl z = 0 + b i auch einfach z = b • i, lässt den Realteil also einfach weg.

DEFINITION 3.3 Eine komplexe Zahl z hat die Form z = a die imaginäre Einheit.

b• i, dabei sind a, b E IR und i ist

Man bezeichnet mit Re(z) = a den Realteil von z und mit Im(z) = b den Imaginärteil von z. Die Menge aller komplexen Zahlen bezeichnet man mit C = fa+b•i : a,b E 1181.

BEISPIEL 3.4 Es ist 14 + 14 • i eine komplexe Zahl. Auch ist 7r — 4• i eine komplexe Zahl. Auch 13 ist genauso wie —,÷ 34 i eine komplexe Zahl oder besser, kann als solche aufgefasst werden. Dabei ist 13 eine verkürzte Schreibweise für die komplexe Zahl 13 + 0 • i bzw. 0 + 13 13 434 i).

3.1.2 Rechnen mit komplexen Zahlen

Das Rechnen mit komplexen Zahlen folgt im Wesentlichen den Rechenregeln für reelle Zahlen, d.h. auch hier gilt beispielsweise die Regel "Punkt- vor Strichrechnung". Für das Multiplizieren von komplexen Zahlen benötigt man zum einen ein gutes Verständnis der binomischen Formeln und zum

anderen die einfache Einsicht aus Bemerkung 3.2, dass sich Potenzen von i wieder als +1 oder ±i schreiben lassen. Addition und Multiplikation komplexer Zahlen

Wir definieren die Summe und das Produkt zweier komplexer Zahlen.

DEFINITION 3.5 Es seien x = a + b • i und y = c d • i komplexe Zahlen. Dann entspricht die Summe bzw. das Produkt von x und y den komplexen Zahlen

x+y=(a+b•i)+(c+d•i)=(a+c)+(b+d)•i x • y = (a + b • i) • (c + d • i) =- (a • c — b • d) + (a • d + b • c) • i. r

Hat einer der Faktoren des Produkts zweier komplexer Zahlen x = a±b•i und y 0 • i = c den Imaginärteil Im(y) = 0, gilt vereinfachend

BEMERKUNG 3.6

c

x • y = (a L

32

b • i) • c = (a • c)

(b • c) • i.

DIE KOMPLEXEN ZAHLEN

BEISPIEL



3.7 Es ist für die beiden komplexen Zahlen x = 2 + 3 • i und y = 4 + 5 • i die Summe bzw. das

Produkt

WI ZU DEFINITION 3.5

x+y=(2+3•i)+(4+5•4=(2+4)+(3+5)•i= 6+8.i x • y = (2 + 3 • i) • (4 + 5 • i) = (2 • 4 — 3 • 5) + (2 • 5 + 3 • 4) • i = —7 + 22 • i Es ist für die beiden komplexen Zahlen x = 4 + • i und y = — + 3 • i die Summe / 3 1 3 1 4 1 x+y= (4+- •i)+(-- +3 •i) = (4+--))+ (—+3)•i= 3- +3- •i 6 7 7 6 7 6 und das Produkt x• y = L

6

• i) •

3 + 3 • i) = (4 • (— — 6 • 3) + 7 7)

7 )) • i=-23 + 1113 • i. 3 + 6 • (14 14

J

Subtraktion von komplexen Zahlen

Möchte man die Addition zweier Zahlen "rückgängig machen", subtrahiert man eine der beiden Zahlen. Algebraisch ausgedrückt, addiert man das additive Inverse einer der beiden Zahlen. So ist 5 + 3 = 8 und das additive Inverse von 5 ist —5 und das additive Inverse von 3 ist — 3. Man erhält 8 + (-3) = 5 und 8 + (-5) = 3, hat also

die Addition "rückgängig gemacht". Doch ist dies in den komplexen Zahlen immer möglich? Gibt es für zwei komplexe Zahlen z, w E C stets eine komplexe Zahl —w E C, so dass z + w (— w) = z? Unter der Annahme, dass 0 + 0 • i das neutrale Element der Addition der komplexen Zahlen ist, gilt w + (—w) = 0 + 0 • i?

Vielleicht scheint einem die Definition der Addition und Multiplikation von komplexen Zahlen zunächst etwas willkürlich. Doch bei näherem Hinsehen entpuppt sich diese Regel als verkapptes Rechnen mit Polynomen. Dabei fasst man die komplexen Zahlen als Polynome in der Variablen i auf und berechnet die Summe bzw. das Produkt der beiden Polynome. Derweilen berücksichtigt man, wie nach der Definition der imaginären Einheit und ausführlicher in Bemerkung 3.2 beobachtet, dass i2 = —1 ist. Fasst man also die komplexen Zahlen als Terme mit der Unbekannten i auf und wendet man die Regeln der Termumformung an, erhält man x

y

(a b i)

(c d • i)

=a-l-c+b•i±d•i = (a c)

(b d) • i

b • i) • (c

d • i)

und x • y = (a

=a•c-l-a•d•i+b•i•c+b•i•d•i

LEMMA 3.8 Das neutrale Element der Addition komplexer Zahlen ist 0 + 0 • i = 0.

=a•c-I-(a•d+b•c) •i+b•d• i2 =a•c-I-(a •di-b•c)•i—b•d

Beweis. Sei z E C beliebig gewählt mit z = a b • i. Dann gilt

= (a • c — b • d)

(a • d

b • c) • i.

z+(0+0•i)=(a+b•i)±(0+0•i)=(a+0)+(b+0)•i=a+b•i=z. •

Nun können wir additive Inverse berechnen - das ment der Addition identifiziert hat - was wir in geht natürlich nur, wenn man ein neutrales Ele- Lemma 3.8 getan haben.

LEMMA

3.9 Es sei z E C. Dann ist —z = — a

( — b) • i das additive Inverse zu z.

33

In DIE KOMPLEXEN ZAHLEN

Beweis. Man rechnet nach, dass

z (-z) =(ad-b•i)+(-a-F(-0•0=(a-F(-0+(b+(-1)))•i=0+0•i=0 gilt, was zu beweisen war. BEISPIEL

1111

3.10 Das additive Inverse der komplexen Zahl z = 3 + 4 • i ist —z = —3 + (-4) • i. Tatsächlich gilt z + (—z) = (3 + 4 • i) + (-3 + (-4) • i) = (3 + (-3)) + (4 + (-4)) • i = 0 + 0 • i = 0

L

Division von komplexen Zahlen

Möchte man die Multiplikation zweier Zahlen „rückgängig machen", teilt man durch eine der beiden Zahlen. Algebraisch ausgedrückt, multipliziert man mit dem multiplikativen Inversen einer der Zahlen. Doch ist dies in den komplexen Zahlen

immer möglich? Gibt es für zwei komplexe Zahlen z, w E C stets eine komplexe Zahl w -1 E C, so dass z • w • w -1 = z? Unter der Annahme, dass 1 + 0 • i das neutrale Element der Multiplikation komplexer Zahlen ist, gilt w • w -1 = 1 + 0 • i?

LEMMA 3.11 Das neutrale Element der Mult iplikation komplexer Zahlen ist die komplexe Zahl

1 + 0 • i = 1. Beweis. Sei z E C beliebig gewählt mit z = a + b • i. Dann gilt z • (1 + 0 • i) = (a + b • i) • (1 + 0 • i) = (a • 1 - b • 0) + (a • 0 + b • 1) • i = (a + b • i) = z.

Nun können wir multiplikative Inverse berechnen. M LEMMA 3.12 Es sei x E C \ {0 + 0 • mit x = a + b • i. Dann ist x 1 =

a a2+b2

-I-

multiplikative Inverse zu z. Beweis. Man rechnet nach, dass x•x

-1

= (a + b • i) • ( a

-b + a2 + b2 a2 b2 -b

a2 + b2 ) (a a2 + b2b gilt, was zu beweisen war.

34

—b a i +b • a2 + b2 ) a2 + b2

1

a2+b2

das

DIE KOMPLEXEN ZAHLEN •

BEISPIEL

3.13 Das multiplikative Inverse der komplexen Zahl z = 3 + 4 • i ist 3

z

+

—4

— 32 + 42 32 + 42

i= 3 + ( 4 25 25 •

Tatsächlich gilt z • z-1 = (3 + 4 • i) •

( 25 +

=

"

—4

--g}) +

.

(

25)

+4• 3 25

•i

( 916 + ) +0•i=1+0•i=1 25

ZU DEFINITION 3.14

L

Grundsätzlich ist die Division eine verkürzte

Schreibweise und meint "Multiplikation mit dem multiplikativ Inversen". Wir zeigen nun auf, dass die Division in "Bruchschreibweise" auch für komDEFINITION

plexe Zahlen Sinn ergibt. Dabei rechnet man erneut so, als wären komplexe Zahlen Polynome in der Veränderlichen i.

3.14 Seien w, z E C. Wir schreiben w • z-1 = Z . Außerdem gelten für Brüche mit

komplexen Zahlen die gewohnten Rechenregeln für Terme mit Veränderlichen.

Der Ausdruck=' ist tatsächlich eine Schreibweise und meint w • z-1. Setzt man allerdings konkrete komplexe Zahlen in den Bruch ein und wendet dann die Rechenregeln für Terme mit Veränderlichen an, lässt sich diese Schreibweise leicht rechtfertigen. Es ist für die komplexen Zahlenw=c+d-iundz=a+b•i nämlich d • i) • (a — i) c d•i (c a b• i (a b • i) • (a — b • 0 d • i) • (a — b • i) a2 — 62 • i2 (c d • i) • (a — b - i) a2 b2 (a — - i) = (c +d i) a2 62 (c

BEISPIEL 3.15 Betrachte

w z

2+5•i 3 + 4 •i

die komplexen Zahlen z = 3 + 4 • i und w = 2 + 5 • i. Dann ist

(2 + 5 • i) • (3 — 4 • i) (3 + 4 •i)•(3 — 4 •i)

(2 + 5 • i) • (3 — 4 • i) 32 _ 42 . i2

26 + 7 • i 32 + 42

26 7 25 + 25 • 2.

Wie in der Erläuterung zu Definition 3.14 angemerkt, hilft die dritte binomische Formel enorm, einen Bruch zweier komplexer Zahlen wieder in eine komplexe Zahl umzuwandeln. L

—1

= w • z .

J

ZUSAMMENFASSUNG

Komplexe Zahlen sind eine Zahlenbereichserweiterung. Man ergänzt die reellen Zahlen mit Hilfe der imaginären Einheit i (siehe Definition 3.1) um Lösungen für quadratische Gleichungen beschreiben zu können. Es löst i die Gleichung x2 = —1, also ist il = —1 - keine reelle Zahl ist quadriert negativ. Eine komplexe Zahl, wie wir sie in Definition 3.3 eingeführt haben, ist die Summe einer reellen Zahl und dem Produkt einer reellen Zahl und der imaginären Einheit, wie beispielsweise 6 + 3 • i. Die Menge der komplexen Zahlen wird mit C bezeichnet. Mit komplexen Zahlen kann man rechnen. Im Wesentli-

chen fasst man eine komplexe Zahl a b • i als ein Term in der Unbekannten i auf und berücksichtigt beim Rechnen die Regeln der Termumformung. Damit kann man komplexe Zahlen auch in der Bruchschreibweise notieren. Es gelten für zwei komplexe Zahlen x = a+b•i und y = c+d•i die Rechenregeln

Damit lässt sich nun auch leicht erklären, wie man aus einem Bruch mit komplexen Zahlen wieder eine komplexe Zahl gewinnen kann. Dazu muss man die komplexe Einheit aus dem Nenner eliminieren. Das lässt sich leicht bewerkstelligen, wenn man mit der komplexen Zahl erweitert, welche dem Nenner entspricht, wobei der Imaginärteil mit einem Minus versehen wird. In Anwendung der dritten binomischen Formel taucht dann ein i2 im Nenner auf, was per Definition —1 ist.

x + y = (a b • i) + (c + d • i) = (a + c) + (b + d) • i x • y =(a+b • i) • (c + d • i) = (a • c — b • d) + (a • d + b • c) • i.

35

NULLSTELLEN VON POLYNOMGLEICHUNGEN

x — y (a + b • i) — (c d • i) = (a — c) (b — d) • i

Y

c —d = e2 d2 e2 d2 x a+b•i ac—bd bc — ad e2 d2 + e2 d2 y c+d•i

3.2 Nullstellen von Polynomgleichungen

ZU SATZ

3.16

Mit der imaginären Einheit i können wir nun Lösungen für alle quadratischen Gleichungen angeben und nicht nur eine Lösung für x2 = —1, wie man vielleicht zunächst vermutet. Darüber

hinaus finden wir mit Hilfe der komplexen Zahlen Lösungen für alle Polynomgleichungen - sprich Nullstellen von Polynomen.

SATZ 3.16 Es sei x 2 ±px -Eqmit p, q E RI und

(5)2 — q < 0. Dann hat die Gleichung x2 + px q = 0

IA

Dieser Satz verallgemeinert die p-q-Formel insofern, als dass die Lösungsmenge über den komplexen Zahlen ausgegeben wird, falls die Gleichung keine Lösung in den reellen Zahlen besitzt (das gewährleistet die Bedingung (i) 2 — q < 0). Jedes Polynom hat dann höchstens zwei und mindestens eine Lösung in den komplexen Zahlen.

die komplexen Lösungen xi =

P • z•

(12

2

und

x2

P —— 2



(2 ) 2



q

Beweis. Man setzt die Zahlen xi und x2 in die Gleichung x2 + px q = 0 ein und verifiziert so die Aussage. •

BEISPIEL

3.17 Gesucht sind die Lösungen von x2 + 2x + 10 = 0. Mit der p-q-Formel erhält man x112 = —1 ± •V1 — 10 = —1 + V(-1) • 9 = —1 ± 3 •

In den reellen Zahlen gibt es hier keine Lösung, in den komplexen Zahlen lauten die Lösungen x 1/2 = — 1 ± 3.i.

BEMERKUNG 3.18 Die komplexen Zahlen liefern sogar nicht nur Lösungen für quadratische Gleichungen. Der Fundamentalsatz der Algebra besagt fast, dass jedes (nicht konstante) Polynom

p(x) = an • xn an_i • xn-1 + + al • x1 + ao vom Grad n genau n + 1 Nullstellen in den komplexen Zahlen besitzt. Also fast, weil er genauer sagt, dass jedes Polynom in das Produkt von n 1 vielen Linearfaktoren zerfällt. Es ist nämlich p(x) = an • xn +an_i.x--1 +

+ al • xl + ao = (x — xo) • (x — xi) • (x — xn),

wobei die ..... ..e n E C Nullstellen des Polynoms sind. Fast, weil der gleiche Linearfaktor mehrfach in diesem Produkt vorkommen kann.

36

NULLSTELLEN VON POLYNOMGLEICHUNGEN •

Ein typischer Fehler im Umgang mit der imaginären Einheit Jetzt, nachdem wir gelernt haben, wie man mit komplexen Zahlen rechnet, können wir ein warnendes Wort zum Umgang mit der imaginären Einheit vertragen. Es ist nicht richtig, auch wenn es verführerisch scheint, zu schreiben, dass i = ist. Auch wenn es, wie in Beispiel 3.17 so aussieht, als hätte man „-‘/." . durch i ersetzt, ist die schlicht falsch. Warum ist das Aussage i = so? Die Wurzelfunktion Nfi liefert für eine reelle Zahl x E R mit x > 0 das nicht-negative y, für dass y2 x gilt. Wegen der Einschränkung „nicht-negativ" funktioniert die Wurzelfunktion nicht für —1 • Die Lösungen für y2 = 16 sind zum Beispiel 4 und —4, die Wurzelfunktion liefert aber nur die postive Lösung fliA = 4. • Die Lösungen für y2 = —1 sind i und —i, aber hier ist (und bleibt!) unklar, wer „die positive" Lösung ist. Sowohl i als auch —i sind weder positiv noch negativ - es ist ja weder i noch —i eine reelle Zahl. Es ist eine neu eingeführte Zahl, für die wir noch nicht (das wird auch so bleiben) festgelegt ha-

ben, ob sie positiv oder negativ ist - man kann sie schlicht nicht mir der 0 vergleichen. Die Aussage 0 > i wird weder mit „wahr" noch mit „falsch" beantwortet. Ein anderes, etwas schwierigeres Argument für eine echte i #-‘/_ ist das Folgende. Wäre Zahl, so dürfte man aus —1 die Wurzel ziehen. Für die entstehende Zahl ,‘/_ müsste dann die übliche Wurzelrechenregel -Va • b = Vä • N/T) gelten. Dann ist jedoch

1=

(-1) = 1/(-1)\/.(-1) =

= -1

eine höchst widersprüchliche Aussage. Die komplexen Zahlen bilden einen Körper Man kann leicht nachrechnen, dass die komplexen Zahlen mit ihrer Addition und Multiplikation einen Körper bilden. Im Kontrast zu den reellen Zahlen sind sie jedoch kein angeordneter Körper. Diese Einsicht wird klarer, wenn man die komplexe Zahlenebene anschaut. Die reellen Zahlen lassen sich geordnet auf einem Zahlenstrahl verzeichnen. Für die komplexen Zahlen ist dies nicht mehr möglich, eine ganze Ebene ist nötig. Dabei geht die Eigenschaft einer Anordnung verloren.

ZUSAMMENFASSUNG

Nach Satz 3.16 liefern komplexe Zahlen Lösungen für jede quadratische Gleichung, welche in den reellen Zahlen keine Lösung besitzt. Nach Bemerkung 3.18 gilt das für beliebige Polynomgleichungen über den reellen Zahlen. Der Fundamentalsatz der Alge-

bra besagt, dass jedes Polynom in Linearfaktoren über den komplexen Zahlen zerfällt. Ein typischer Fehler im Umgang mit der imaginären Einheit besteht darin anzunehmen, dass i = ist.

37



DIE KOMPLEXE ZAHLENEBENE

Im

3.3 Die komplexe Zahlenebene 5-4i 2.i

2Re

—1

1 2 3 4 6 6 7

—2 ABBILDUNG 3.1 Die „komplexe Zahlenebene" oder auch „Gauß'sche Zahlenebene" ist eine Möglichkeit, die komplexen Zahlen aufzuzeichnen. Sie entspricht dem zweidimensionalen Vektorraum R2 oder eben diesen kartesischen Koordinaten, wobei die Achsen mit Re und Im bezeichnet werden. Eine komplexe Zahl a i • b findet man dann an Stelle des Punkts (a, b) oder eben des Vektors (a). So ist jede komplexe Zahl in der Ebene zu finden und jeder Punkt der Ebene wird mit genau einer komplexen Zahl identifiziert. Im

Die natürlichen, die ganzen, die rationalen und auch die reellen Zahlen lassen sich auf einem Zahlenstrahl (besser einer Zahlengerade) verzeichnen. Das ist für die komplexen Zahlen nicht mehr möglich. Um die komplexen Zahlen aufzuführen, benötigt man eine ganze Ebene. Die Menge der komplexen Zahlen C lässt sich nämlich als ein zweidimensionaler reeller Vektorraum auffassen. Jeder komplexen Zahl z = a+b•i wird dabei der Vektor, dessen Komponenten dem Real- und Imaginärteil der Zahl entspricht, zugeordnet. Es gilt also z=a+b•ii—>

(Re(z) Im(z))

(ct

1))

Den dabei entstehenden „besonderen" R2 nennt man die "komplexe Zahlenebene" oder auch die „Gauß'sche Zahlenebene". Dort bezeichnet man die x1-Achse mit Re und die x2-Achse mit Im. Beide Koordinaten-Achsen (auch die Im-Achse!) werden mit reellen Zahlen beschriftet. Die Zahl z = 0 + 2- i liegt beispielsweise als Vektor 2 auf der Im-Achse bei Achsenabschnitt „2" (d.h. bei Im (0 + 2 • i) = 2). Der „Wert" der komplexen Zahl z ist aber weiterhin 2i und damit komplex. Die Zahl w = 5 + 4 • i hat die Koordinaten (5,4).

(1

Siehe Abbildung 3.1. Geometrische Interpretation der Addition komplexer Zahlen Addiert man zwei reelle Zahlen, so lässt sich dies als „Aneinanderhängen" der Strecken vom Ursprung zu den Zahlen auf dem Zahlenstrahl interpretieren. Addiert man zwei Vektoren des R2 so kann man dies als „Aneinanderhängen" der repräsentierenden Pfeile im Koordinatensystem interpretieren. Tatsächlich entspricht die Vektoraddition der Addition komplexer Zahlen in dem Sinne, dass der die Summe repräsentierende Pfeil sich als „aneinandergehängte" Pfeile der Summanden entpuppt. Es gilt für zwei Vektoren (eb) , (de) des R2 nämlich (b) + (d) = (ab ++

Für die zugehörigen komplexen Zahlen gilt ebenfalls (a±b•i)+(c+d•i)=(a+c)+(b+d)•i. Anschaulich lässt sich dies in Abbildung 3.2 für die komplexen Zahlen 3+1 • i und 4+ 3 - i beobachten.

—2 ABBILDUNG 3.2

Addiert man zwei Vektoren des R2 so kann man dies als „Aneinanderhängen" der repräsentierenden Pfeile im Koordinatensystem interpretieren. Tatsächlich entspricht die Vektoraddition der Addition komplexer Zahlen in dem Sinne, dass der die Summe repräsentierende Pfeil sich als „aneinandergehängte" Pfeile der Summanden entpuppt.

38

3.3.1 Betrag und Argument komplexer Zahlen

Jede komplexe Zahl z E C hat als Vektorpfeil im R2 eine Länge und schließt einen Winkel zur ReAchse ein. Die Länge verallgemeinert den Betrag reeller Zahlen - dort einfach der „Abstand" zur Null, hier nun der Abstand zum 0-Vektor mit der euklidischen Norm - alias dem Satz des Pythago-

ras - ausgemessen. Der Winkel verallgemeinert das Vorzeichen einer reellen Zahl - dort die Richtung, in die man von der Null ausgehend die Zahl findet, hier nun die Richtung, die man vom Ursprung aus einschlagen muss, um dem Vektor zu folgen.

DIE KOMPLEXE ZAHLENEBENE •

ZU DEFINITION

DEFINITION

3.19

3.19 Der Betrag einer komplexen Zahl z = a + b • i ist die Länge des zugehörigen

Vektors = .Va2 b2.

1z1 =

Das Argument arg(z) E [0,27r) einer komplexen Zahl z E C ist der Winkel, der zwischen der Re-Achse und der Strecke von 0 nach z eingeschlossen wird. r

3.20 Man beachte, dass nach der Definition 3.19 für arg(z) stets 0 < arg(z) < 27r gilt. so sind zwei Winkel äquivalent, wenn sie sich nur um ein Vielfaches von 27r unterscheiden.

BEMERKUNG

Gibt man jedoch Winkel an,

Das Bogenmaß ordnet dem vollen Kreis den Wert 27r zu, weil der Kreisumfang des Einheitskreises (der Kreis mit Radius r = 1) 2irr = 27r beträgt. L

_J

Der Betrag einer komplexen Zahl verallgemeinert den Betrag der reellen Zahl. Es ist der Abstand zur 0. Für die komplexen Zahlen ist die 0 der Ursprung der Zahlenebene. Der Betrag einer komplexen Zahl entspricht der euklidischen Norm des zugehörigen Vektors und damit seiner Länge - also dem Abstand des Punktes in der komplexen Zahlenebene und dem Ursprung. Das Argument einer komplexen Zahl verallgemeinert das Vorzeichen einer reellen Zahl. Der Betrag gibt den Abstand zur 0 das Vorzeichen die Richtung (positiv oder negativ) an. Gleiches gibt das Argument einer komplexen Zahl. Die Richtung, in der man die komplexe Zahl vom Ursprung betrachtet findet.

-

BEISPIEL

3.21 Für die Zahl z = —2 + 2 • i ist I z i = V22 + 22 _ 2

und

3 arg(z) = 4 — 7r.

Für die Zahl w = 2 — 2 • i ist = V22 + 22 = 2 • Vi

und

arg(z) = 27r —

ir

4

7 = — 7r. 4

Siehe Abbildung 3.3 und 3.4.

IM ABBILDUNG 3.3

3.3.2 Konjugiert komplexe Zahlen Das Argument einer komplexen Zahl verallgemeinert das Vorzeichen reeller Zahlen. So wie es für jede positive reelle Zahl eine negative - oder inverse - reelle Zahl gibt, gibt es für auch für eine komplexe Zahl eine bezüglich des Arguments "inverse" komplexe Zahl. Addiert man eine positive

reelle Zahl zu ihrer negativen Zahl erhält man 0. Diese Idee übertragen wir nun auf die komplexen Zahlen. Wir definieren für jede komplexe Zahl ihre konjugierte komplexe Zahl, so dass die Summe der beiden Imaginärteil 0 hat.

DEFINITION 3.22 Für eine komplexe Zahl z = a+b•i bezeichnet man mit 7 = a — b • i die zu z konjugiert komplexe Zahl.

Die Zahl z = —2 + 2 • i aus Beispiel 3.21 in der komplexen Zahlenebene verzeichnet. Das Argument entspricht dem Winkel, den z repräsentierender Vektor und Re-Achse einschließen, der Betrag der Länge des Vektors.

lel ZU DEFINITION 3.22 Die konjugierte Zahl einer komplexen Zahl z entspricht der komplexen Zahl z, die man erhält, wenn man den zu z gehörenden Vektor an der reellen Achse spiegelt. Mit dem Wissen über die geometrische Interpretation der Addition komplexer Zahlen ist es nun wenig erstaunlich, dass die Summe dieser beiden komplexen Zahlen auf der reellen Achse liegt, also Imaginärteil gleich 0 hat.

39



DIE KOMPLEXE ZAHLENEBENE

BEISPIEL

3.23 Die komplexe Zahl z = 2 + 2 • i hat die konjugierte komplexe Zahl 7 = 2 — 2 • i. Ihre Summe

ist z+7=2+2.i+2+(-2)•i=4+0•i, siehe Abbildung 3.5.

Es haben z und 7 die selbe Länge, aber „entgegen- findet diese Winkel, wenn man einmal im und gesetzte Winkel". Dabei sind zwei Winkel entge- einmal entgegen dem Uhrzeigersinn einen Winkel gengesetzt, wenn ihre Summe 27r entspricht. Man entsprechender Größer überstreicht.

Re

LEMMA

ABBILDUNG 3.4

Die Zahl w = 2 — 2 i aus Beispiel 3.21 in der komplexen Zahlenebene verzeichnet. Das Argument entspricht dem Winkel, den w repräsentierender Vektor und Re-Achse einschließen, der Betrag der Länge des Vektors.

3.24 Es sei z

E

C. Dann gilt lz I = 1z1 und arg z = 27r — arg(z).

Beweis. Das Bilden einer konjugiert komplexen Zahl kommt dem Spiegeln an der reellen Achse gleich dabei werden Längen erhalten und das Argument ändert sich wie beschrieben. Details werden dem Leser überlassen. ■

Konjugieren und Rechnen mit komplexen Zahlen das Konjugieren also vor oder nach dem Addieren ist vertauschbar. Bei Summen und Produkten kann bzw. Multiplizieren geschehen.

Im

111 LEMMA 3.25 Es seien z, w E C. Dann gilt •

Re

und

(Z W) = 7Z- +

(z • w) = 7 • t.T.

z+z

Beweis. Man rechnet die Behauptungen schlicht nach, die Details werden dem Leser überlassen.

-

ABBILDUNG 3.5

II Mit Hilfe der zu z konjugierten komplexen Zahl den Betrag von z berechnen.

Die konjugiert komplexe Zahl der komplexen Zahl z = 2 + 2 i ist = 2 — 2 i. Man erhält die konjugiert komplexe Zahl durch Spiegeln an der Real-Achse. Die konjugiert komplexe Zahl, einer komplexen Zahl, deren Imaginärteil gleich 0 ist, ist die Zahl selbst.

40

kann man den Realteil, den Imaginärteil und auch

LEMMA 3.26

Für z E C gelten

Re(z) =z z 2

Im(z)

z 7 = 2•i

und

izi==v/z• z.



POLARDARSTELLUNG KOMPLEXER ZAHLEN •

Beweis. Sei z = a

b • i. Man rechnet nach

(a + b • i) + (a — b • i) = 2a _ z +7 a = Re(z) 2 2 2 z—7 (a + b • i) — (a — b • i) = 2bi = b = Im(z) 2i 2i 2i [z77 = N/ (a + b • i) • (a — b • i) = \, /a2 — (b . i)2 _ . Va2 + b2 = Izi.

ZUSAMMENFASSUNG

Komplexe Zahlen können in einem zweidimensionalen Koordinatensystem, der sogenannten „Gauß'schen Zahlenebene" verzeichnet werden. Jeder komplexen Zahl wird dadurch ein Vektor des R2 zugeordnet. Vektoraddition und Addition in den komplexen Zahlen sind verträglich - sprich: Die Addition der komplexen Zahlen erhält durch die Vektoraddition eine geometrische Anschauung. Nach Definition 3.19 wird jeder komplexen Zahl ein Betrag und ein Argument zugeordnet. Der Betrag ist

der Abstand zum Ursprung in der komplexen Zahlenebene, das Argument der Winkel, den die Strecke vom Ursprung zur komplexen Zahl in der komplexen Zahleneben mit der Re-Achse einschließt. Zu jeder komplexen Zahl lässt sich ihre komplex konjugierte Zahl bilden. Nach Definition 3.22 ist die komplex konjugierte Zahl einer komplexen Zahl z = einfach die Zahl 2 = a — b • i, also die komplexe Zahl mit negativem Imaginärteil.

3.4 Polardarstellung komplexer Zahlen Ig ZU DEFINITION 3.27

Fasst man die komplexen Zahlen als die Punkte im JR2 - also der komplexen Ebene - auf, so ist es wenig erstaunlich, dass man neben den kartesischen Koordinaten auch alternative Koordinaten nutzen kann, die komplexen Zahlen zu beschreiben. Anstatt den Real- und den Imaginärteil einer komplexen Zahl z zu nennen, kann man auch

ihren Betrag r, also den Abstand vom Ursprung, und ihr Argument, also den Winkel a, den die Strecke vom Ursprung zu z mit der reellen Achse einschließt, angeben. Beschreibt man einen Punkt in der Ebene mit diesen Größen, spricht man von Polarkoordinaten.

DEFINITION 3.27 Sei z E C \ {0}. Die Polarkoordinaten von z sind alle Paare (I arg(z) 27r) e JR2 mit k E Z.

k•

Polarkoordinaten beschreiben die Punkte der Ebene bezüglich des Ursprungs und der Re-Achse. Ein Punkt ist eindeutig beschrieben, wenn sein Abstand zum Ursprung und der Winkel zur Re-Achse bekannt ist. Wir erhalten so eine alternative Beschreibung der komplexen Zahlen. An dieser Stelle sei nochmal darauf hingewiesen, dass das Argument einer komplexen Zahl ein Winkel zwischen 0 und 27r ist - Winkel kleiner 0 und größer 2ir werden als ein mehrfaches Drehen betrachtet. Ist man nur an der resultierenden Richtung interessiert, zeigen 0, und 27r + oi in die gleiche Richtung.

41

U POLARDARSTELLUNG KOMPLEXER ZAHLEN

Für z = 0 sind die Polarkoordinaten von der Form (0, a), dabei ist der Winkel (t beliebig.

Für die komplexe Zahl z = 2 — 2i gilt 1z1 = 2 • 4 und arg(z) = 27r — 51 . Es bilden dann beispielsweise die Paare (2 • 2ir — und (2 • 4, 2ir — ) aber auch (2 • '4, 187 — i) und (2 • 12-, —10007 — ) Polarkoordinaten von z. Siehe Abbildung 3.6. BEISPIEL 3.28

Re

Möchte man die Polarkoordinaten und die kartesi- nen wir Polarkoordinaten in kartesische Koordinaschen Koordinaten ineinander umrechnen, helfen ten um und gleich im Anschluss umgekehrt. die trigonometrischen Funktionen. Zunächst rech-

II LEMMA 3.29 Sei z

E C in Polarkoordinaten z = (r, a) beschrieben. Dann gilt

z = r • cos(a) r • sin(a) • i.

ABBILDUNG 3.6

El

Die komplexe Zahl z = 2 — 2i aus Beispiel 3.28 lässt sich in Polarkoordinaten beschreiben. Ihr Betrag lautet I z I = 2 • und damit sind (2 • V2-, 2ir — und (2 • -4, 27r — ä ) aber auch (2 • '4, 187r — U und (2 • -sa —10007r — zulässige Polarkoordinaten dieser komplexen Zahl. im

Beweis. Wir skizzieren die Situation für a E [0, Dann bilden der z repräsentierende Vektor und die Projektionen auf die reelle bzw. imaginäre Einheit (also die xi - und die x2-Koordinate in kartesischen Koordinaten) ein rechtwinkliges Dreieck mit Winkel a am Ursprung, siehe Abbildung 3.7. Es ist die Hypotenuse genau 1z1 lang, außerdem sind die Ankathete Re(z) und die Gegenkathete Im(z) lang. Nach der Definition des Sinus und des Cosinus gilt cos(a) =

Re(z) 1z1

und

sin(a) = Gegenkathete Hypotenuse

Im(z) 1z1

Stellt man diese Gleichungen um und berücksichtigt, dass r = IzI ist, folgt die Behauptung.

III

Im(z)

Ankathete Hypotenuse



LEMMA 3.30 Sei z E C in kartesischen Koordinaten z = a + b • i. Dann ist z in Polarkoordinaten

(r, a), wobei r = 1,z1 =

b2

und

a=

arccos

, falls b > 0

— arccos (0 , falls b < 0. Re ►

Re z)

ABBILDUNG 3.7

Anhand eines rechtwinkligen Dreiecks und den trigonometrischen Formeln lässt sich die Umrechnung von kartesischen und Polarkoordaten komplexer Zahlen schnell herleiten. Lemma 3.29 und 3.30 formulieren diese.

42

Beweis. Erneut verwendet man die trigonometrischen Funktionen, um die Aussage zu verifizieren siehe Abbildung 3.7 für eine Skizze. Details werden dem Leser überlassen. ■

POLARDARSTELLUNG KOMPLEXER ZAHLEN •

Geometrische Interpretation der Multiplikation mit Hilfe der Polarkoordinaten Für zwei komplexe Zahlen ist die Multiplikation in Polarkoordinaten erheblich einfacher als in kartesischen Koordinaten. Kurz gesagt, gilt der Merkspruch: „Längen werden multipliziert und Winkel

werden addiert'. Um diesen Merkspruch nachzuvollziehen, benötigt man die eulersche Darstellung komplexer Zahlen. ZU DEFINITION 3.31

DEFINITION

3.31 Für a E 111 definieren wir et' = cos(a) + i • sin(a), wobei e die eulersche Zahl

ist. BEMERKUNG 3.32 Dass die in Definition 3.31 eingeführte Verallgemeinerung der Exponentialfunktion zur Basis e auf imaginäre Zahlen Sinn ergibt, folgt aus der folgenden Betrachtung der Taylorentwicklungen der Funktionen em, sin(x) und cos(x) in den reellen Zahlen. Die Taylorentwicklung betrachten wir erst in Kapitel 8, greifen an dieser Stelle vor.

Die Taylorentwicklungen lauten x2

x3

x4

x2 cos(x) = - — 2!

x5

x3

x4

x5

Man könnte sagen, dass man die eulersche Funktion, also die Exponentialfunktion zur Basis e auf komplexe Zahlen verallgemeinert. Das trifft im Lichte von Bemerkung 3.32 sicherlich zu. Insbesondere gelten übrigens ei"` = — 1und ei = i. Die Zahl ei" entspricht der komplexen Zahl auf dem Einheitskreis, deren Polarkoordinaten Länge 1 und Winkel a ausweisen. Alle so definierten Zahlen liegen also auf dem Einheitskreis.

+ — ± , sin(x) = — — + — + 4! 5! 2! +3J + — 4! + — 5! + • • • 3! ex = 1 + x + — Setzt man die Zahl i • a in die Taylorentwicklung von ex ein, erhält man a2

ex =l+i•a+i2 •

7! a2

=l+i•a—l•— 2! a2 a4 = (1 — + 1 • 4!

+i3 •

a3

7! + i4 • 24 4!

i5 •

a5

5! a4 a5 +1•—+i•—+... 4! 5! a3 a5 ...) + (i • a — i • — + i • — + ...) = cos(a) + i • sin(a). 3! 5! a3

L

BEISPIEL

3.33 Es ist beispielsweise

ei.' = cos(7) + i • sin(7) = — 1 + i • 0 = — 1

und

cos (I) + i • sin ( 71) = 0 + i • 1 =

2

2

Allgemein ist die komplexe Zahl ea auf der komplexen Zahlenebene als die Hypotenuse eines rechtwinkligen Dreiecks mit den Seiten cos(a) und sin(a) zu finden: sie hat den Betrag 1. Die Länge der Hypotenuse ist also 1, damit liegt die komplexe Zahl auf dem Einheitskreis in der komplexen Ebene. Siehe Abbildung 3.8.

Wir formulieren nun die Multiplikation und Divisi- ten. Dies ist im Kontrast zu der Multiplikation und on komplexer Zahlen mit Hilfe von Polarkoordina- Division komplexer Zahlen angenehm einfach.

ABBILDUNG

3.8

Die komplexe Zahl ei '', welche per Definition 3.31 der komplexen Zahl cos(a) + i • sin(a) entspricht, befindet sich auf dem Einheitskreis in der komplexen Ebene. Man findet sie, indem man ein rechtwinkliges Dreieck mit den Katheten cos(a) und sin(a) und der Hypotenuse 1 verzeichnet.

43



POLARDARSTELLUNG KOMPLEXER ZAHLEN

LEMMA 3.34 Es

seien z, w

z • w = (r • R,

E

C mit z = (r, a) und w = (R, 0). Dann gilt ß) und falls w 0 auch '1 = , — ß) . w R

Bevor wir Lemma 3.34 beweisen, betrachten wir nen lässt. Die Aussage lässt sich vor allem geomeein Beispiel, welches die Aussage plausibel erschei- trisch gut nachvollziehen. E

BEISPIEL

3.35 Betrachte die komplexen Zahlen

z = 1 + 2 • sin (7r ) • i 3 Dann kann man leicht berechnen, dass gilt

und

w 0 + 3 • i.

z • w = —6 • sin (3) + 3 • i. Es gelten übrigens (1r 1 sin (L ) = und 3 2 c" = Somit lassen sich unter anderem mit dem Satz des Pythagoras und dem trigonometrischen Pythagoras (sin2 (x) + cos2 (x) = 1) die Beträge und Argumente der beteiligten komplexen Zahlen berechnen als lz I = \/12 + 4 • sin2 arg(z) = 1 3

(7

3

) =2

Iwi = 3, arg(w) =

lz•wl= .V35 • sin2 CLD +32 =6 3 5ir arg(z • w) = — 6.

ABBILDUNG 3.9

Multipliziert man zwei komplexe Zahlen in Polarkoordinaten, werden ihre Beträge multipliziert und die Winkel addiert.

44

POLARDARSTELLUNG KOMPLEXER ZAHLEN •

Den Beweis für Lemma 3.34 werden wir mit der nifestiert. Bemerkung 3.32 erhellt ihren Hintereulerschen Darstellung komplexer Zahlen führen. grund. Diese finden wir in dem folgenden Korollar ma-

KOROLLAR

3.36 Für eine komplexe Zahl z E C mit Polarkoordinaten (r, cx) gilt z = r • e".

Jetzt können wir Lemma 3 34 beweisen. Beweis. [Beweis von Lemma 3.34.] Es gelten z = r • ei'a und w = R • e" . Daraus folgt Z • w= r • ei'a •

R•

ß = r • R • ei' (.1+ ß)

Die letzte Zahl hat offensichtlich den Betrag r • R und den Winkel a + ß. Es hat das Produkt z • w also die Polarkoordinaten (r • R, a 0.). Für den Quotienten gilt w = R • e" = R • e" e—ia = • e z r • e" Die letzte Zahl hat offensichtlich den Betrag 12 , und den Winkel /3 — a. Demnach hat der Quotient ,e ■ die Polarkoordinaten (e ß — a).

ZUSAMMENFASSUNG

In der komplexen Ebene kann man neben den kartesischen Koordinaten auch alternative Koordinaten nutzen um die komplexen Zahlen zu beschreiben. Polarkoordinaten geben nach Definition 3.27 statt dem Real- und dem Imaginärteil einer komplexen Zahl z ihren Betrag r, also den Abstand vom Ursprung, und einen Winkel a, den die Strecke vom Ursprung zu z mit der reellen Achse einschließt, an. Nach Lemma 3.29 lässt sich eine komplexe Zahl z E C in Polarkoordinaten z = (r, a) in kartesischen Koordinaten schreiben als z = r • cos(a) r • sin(a) • i. Nach Lemma 3.30 lässt sich eine komplexe Zahl z E C

mit z = a + b • i in Polarkoordinaten (r, a) schreiben, wobei gilt r = zI =_ N/a2 b2 a=

und

arccos (e) , falls b > 0 — arccos ( , falls b < 0.

Nach Definition 3.31 und Korollar 3.36 lässt sich jede komplexe Zahl schreiben als r • ei.a für r, a E IR. Mit Hilfe dieser, als eulersche Darstellung bezeichnete Beschreibung der komplexen Zahlen, lässt sich mit Lemma 3.34 die Multiplikation und Division komplexer Zahlen leicht durchführen. Leicht zu merken ist dieser Leitspruch zur Multiplikation "Längen werden multipliziert und Winkel werden addiert".

45

Kapitel 4

Zahlendarstellung Um Numerik betreiben zu können, ist ein grundlegendes Verständnis von Rechnern - das sind Maschinen zum automatisierten Rechnen - und insbesondere von ihrer Verarbeitung von Zahlen wichtig. Wir erinnern kurz an die gebräuchliche Darstellung von natürlichen, ganzen und rationalen Zahlen in positionellen Zahlsystemen (Dezimalsystem, Binärsystem, Hexadezimalsystem). Danach weiten wir in aller Kürze den Blick und betrachten die Darstellung von allgemeinen reellen Zahlen in Gleitkomma-Formaten.

Wert Symbol 1 5 V 10 X 50 100 500 1000 M

In der Mathematik gibt es die verschiedensten Algorithmen zur Lösung konkreter Fragestellungen. Beispielhaft sind der euklidische Algorithmus (Zahlentheorie), das Gram-Schmidtsche Orthogonalisierungsverfahren (Lineare Algebra), das RSASchema (Kryptographie) und Hammingcodes (Codierungstheorie) zu nennen. Die algorithmische Formulierung dieser zielt mitunter darauf, einen Computer zur Berechnung einzusetzen. Ein Computer ist, wie es der Name schon sagt, eine Maschine, die rechnet - und das schneller und berechenbarer als ein Mensch dies tut. Um dieses Werkzeug zu verwenden, muss man sich allerdings zunächst

klar werden, wie ein Computer die im Algorithmus auftretenden Zahlen verarbeitet. Sprich, ist es dem Computer überhaupt möglich Zahlen exakt zu speichern und fehlerfrei zur Berechnung der gewünschten Lösung zu verarbeiten? Wir möchten uns deshalb nun allgemein anschauen, wie Zahlen schriftlich fixiert und dann von einem Computer gespeichert und verarbeitet werden. Dazu stellen wir in diesem Kapitel zunächst die generelle Darstellung von Zahlen in positionellen Zahlsystemen vor und besprechen im Schnelldurchlauf einfache Zahlenformate, wie Computer sie zum Speichern von Zahlen verwenden.

4.1 Zahldarstellung im positionellen Zahlsystem

ABBILDUNG 4.1 al

Die additive Zahlschrift der Römer ist auch uns noch geläufig.

Im Laufe der Geschichte gab es die unterschiedlichsten Ansätze Zahlen darzustellen. Zahldarstellungen sind systematische und praktische Lösungen des Problems, sehr große Zahlen mit wenigen Symbolen darzustellen. Grundsätzlich

lassen sich zwei Typen von Zahldarstellungen unterscheiden. Additive Zahlschriften Für eine Auswahl von Zahlen gibt es repräsentierende Symbole. Zahlen, für die keine ei-

ZAHLDARSTELLUNG IM POSITIONELLEN ZAHLSYSTEM •

genen Symbole existieren, werden als eine Summe der Zahlen gebildet, für welche Symbole existieren. In der Darstellung werden die entsprechenden Symbole einfach aneinander gereiht. Ist beispielsweise o das Symbol für die 10 und gibt es kein Symbol für die 20, dann lässt sich die 20 darstellen als oo. Eine Erleichterung in der Zahldarstellung erreicht man nur für kleine Zahlen, bis zu deren Wert Zahlen existieren, welche durch eine Ziffer repräsentiert werden. Die Darstellung einer Zahl ist in additiven Zahlschriften nicht eindeutig. Gibt es neben dem Symbol für die 10 auch noch ein Symbol für die 5, möglicherweise *, dann ist die 20 auch darzustellen als * * = * * = * o *. Die römische Zahldarstellung ist eine additive Zahlschrift. Wie man anhand der Tabelle in Abbildung 4.1 prüfen kann, ist beispielsweise die Zahl 2013 in römischer Zahldarstellung MMXIII= 1000 + 1000 + 10 + 1 + 1 + 1 = 2013. Möchte man allerdings die Zahl 109, also eine Milliarden in diesem System darstellen, müsste man 106, also eine Millionen mal die Ziffer M aneinander reihen. Die antike hebräische Zahldarstellung ist ebenfalls additiv und verwendet die 23 Buchstaben des Hebräschen Alphabets B = 1, 3 = 2,... ,

Positionelle Zahlschritten

Es gibt für die ersten Zahlen (einschließlich der Null) Symbole. In der Darstellung einer Zahl tragen dann nicht bloß die Symbole Information, sondern auch die Position an welcher ein Symbol auftaucht. Das Zahlsystem der Maya ist eine positionelle Zahlschrift auf der Basis 20. Wie in der Tabelle in Abbildung 4.2 ersichtlich, gibt es für die Zahlen 0 bis 19 Symbole. Zahlen werden als Summe von Potenzen der 20 dargestellt, welche jeweils mit einer Zahl von 0 bis 19 multipliziert werden. Dabei wird die Zahl von rechts gelesen, wobei die Ziffer ganz rechts der Faktor vor 20° ist, die zweite Ziffer von rechts der Faktor vor 201 ist, die dritte Ziffer der Faktor vor 202 ist, usw. Die k-te Stelle von rechts ist also der Faktor vor 20k. Ein Beispiel erhellt das Vorgehen. Es ist (

= 3 • 202 + 5 • 20 + 6 = 1200 + 100 + 6 = 1306.

Auch die arabischen Zahlen sind ein positionelles Zahlsystem mit der Basis 10. Sie sind den Symbolen der Zahlen, die wir heute verwenden schon recht ähnlich. Zwischen diesen zwei wesentlichen Typen gibt es auch Mischformen, z.B. die chinesische/japanische Zahldarstellung ohne an dieser Stelle ins Detail zu gehen.

Wert Symbol e2) 0 1 2 ••

3 4 5 6 7 8 9

•••

••

•••

••••

10 ••••

19 ABBILDUNG 4.2

Die Mayas verwendeten eine positionelle Zahlschrift, die Symbole sind in dieser Tabelle dargestellt.

4.1.1 Natürliche Zahlen zu einer Basis

Die allgemeine Darstellung einer natürlichen Zahl in einem positionellen Zahlsystem erfolgt stets zu einer festen Basis b E N>l, im Zehnersystem (De-

zimalsystem) ist b = 10. Dieses System ist uns geläufig und sollte als leitendes Beispiel im Hinterkopf sein.

47

ZAHLDARSTELLUNG IM POSITIONELLEN ZAHLSYSTEM

ZU DEFINITION 4.1 WI

Wir sind vermutlich mit dem Dezimalsystem zur Basis 10 am meisten vertraut. Das Binärsystem (zur Basis 2) und das Hexadezimalsystem (zur Basis 16) spielen beispielsweise in der Informatik eine wichtige Rolle.

LJEFINMON 4.1 Für b E N>i sind Zb = {0,1,2, Basis b. Eine Ziffernfolge (zk _1 • • • z1 zo)b mit k Ziffern zo,

b - 1} die Ziffern für das Zahlsystem zur zk-i E 2 wird interpretiert als

k-1 • (zk _1 • • • Z1 zo)b = E zi • b2 = Zk-1 • bk-1 -1• • • + Z2 • b2 i=0

Zi • b + zo • b°

r

BEMERKUNG 4.2 Die Ziffern in 21 entsprechen selbst Ziffern eines Zahlsystems, wir haben uns für das zur Basis 10 entschieden. Auch die Summe, die in Definition 4.1 zur Interpretation einer Ziffernfolge angeführt wird, ist mit Zahlen des 10er-Systems durchzuführen. Wir halten deshalb fest, dass ganze Zahlen (wie bis hierhin praktiziert) stets im Dezimalsystem notiert werden, falls dies nicht anders angegeben ist.

Es beinhalten die Menge der Ziffern 2b = {0,1,2, ... , b — 1} eines Zahlsystems zu einer Basis b Ziffern, die größer als 10 sein können, wenn b größer als 10 ist. Die Ziffern selbst sind jedoch Zahlen im 10-er System und daher mit mehr als einer Ziffer im Dezimalsystem zu notieren. Beispielsweise sind die Ziffern des Hexadezimalsystems 216 = {0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15}. Dies kann zu Problemen führen. Wie ist in diesem Fall die Ziffernfolge (123)16 zu interpretieren? Als (1 2 3)16 bestehend aus drei Ziffern oder als (12 3)16 bestehend aus zwei Ziffern? Um diesen Verwirrungen vorzubeugen, werden statt der Ziffern 10,11, .. . ,15 in der Praxis häufig die Buchstaben A,...,F verwendet. BEISPIEL 4.3 Die Zahl (212)7 im Zahlsystem zur Basis 7 hat im Dezimalsystem die Darstellung (100)10. Denn es ist

(212)7 = 2 • 72 + 1 • 71 + 2 • 7° -= 2 • 49 + 1 • 7 + 2 • 1 = 1 • 102 + 0 • 101 + 0 • 10° = (100)10. Die Zahl (ABC)16 im Hexadezimalsystem hat im Dezimalsystem die Darstellung (2784)10. Es ist nämlich (ABC)16 = 10 • 162 + 11 • 161 + 12 • 16° = 10 • 256 + 11 • 16 + 12 • 1 = 2 • 103 + 7 • 102 + 8 • 101 + 4 • 100 = (2784)10 • L 1 BEMERKUNG 4.4 Wir

schätzen am Dezimalsystem, dass die Multiplikation mit 10 und das Teilen durch 10 einfach ist. Allgemein gilt für alle Zahlsysteme zur Basis b, dass die Multiplikation mit b dem Anhängen einer 0 und das Teilen durch b dem Löschen der letzten Stelle entspricht (wenn diese eine 0 ist - sonst erhält man einen Rest bzw. einen Bruch). Es ist

48

(zk _1

zo)b • (10)b = (zk _1

(zk _1

zi zo)b : (10)b = (zk _1

z1 zo 0)b zi)b + (zo)b : (10)b.

ZAHLDARSTELLUNG IM POSITIONELLEN ZAHLSYSTEM

BEISPIEL 4.5 Für

n = 13 = (13)10 ist n = (13)10 = (1101)2 = 1 • 23 + 1 • 22 + 0 • 21+ 1 • 2° = 13

und für m = 2 = (2)10 ist m = (2)to = (10)2 = 1 • 21 + 0 • 2° = 2. Entsprechend gilt n • m -= (1101)2 • (10)2 = (1 • 23 + 1 • 22 + 0 • 21 + 1 • 2°) • 2 = 1 • 24 + 1 • 23 + 0 • 22 + 1 • 21 + 0 • 2° = (11010)2 n : m (1101)2 : (10)2 = (1 • 23 + 1 • 22 + 0 • 21 + 1 • 2°) : 2 = 1 • 22 + 1 • 21 + 0 • 2° + 1 : 2 = (110)2 + (1)2 : (10)2. L

J

1 Stellen darstellbare Binärzahl ist übrigens (1... 1)2 = 2k-F1 — 1. BEMERKUNG 4.6 Die größte mit k Allgemein gilt, dass die größte mit k 1 Stellen darstellbare Zahl in einem Zahlsystem zur Basis b die Zahl bk+ — 1 ist. Das folgt aus den beiden „einfachen" Rechnungen k

(b — 1) • 61 — (b 1) •

(b — 1 . . . b — 1) b = i=0

b k +1 — 1

bk-1-1

b— 1

(b — 1 . . . b — 1)b = E(b — 1) • bi > E zi • = (zk . • • zo), für alle zo, , zk E .4. Die erste Rechnung ist eine Anwendung von Lemma 5.94, welche die Partialsumme einer geometrischen Reihe berechnet. Die zweite Rechnung macht deutlich, dass jede Zahl im Zahlsystem zur Basis b mit k 1 Stellen kleiner oder gleich (b — 1, . . . , b — 1)b ist. L

b-adische Brüche

Ähnlich, wie man Dezimalbrüche bildet, lassen sich in Zahlsystemen zu unterschiedlichen Basen b-adische Brüche in „Komma-Schreibweise" bilden. Dabei erweitert man das Prinzip der IdentifikatiDEFINITION

on von Stellen mit Potenzen von b nach rechts, also hinter das Komma. Die Exponenten werden dann negativ und gebrochene Anteile können dargestellt werden.

4.7 Sei ein Zahlsystem zu einer Basis b gegeben. Eine Ziffernfolge (Zk—i ... Z1 ZO Z-1 Z-2 • • • Z—m)b

49



MASCHINENZAHLEN

mit k Ziffern vor dem Komma und m Nachkommastellen wird interpretiert als k-1 . bi .

(Zk_1 ... Z1 ZO, Z-1 Z-2 • • • Z—m)b =

=-m rBEISPIEL 4.8

Die Zahl (34,12)5 im Zahlsystem zur Basis 5 hat im Dezimalsystem die Darstellung (19,28)10.

Denn es ist (34,12)5 = 3 • 51 + 4 • 5° + 1 • 5-1 + 2 • 5-2 = 3 • 5 + 4 • 1 + 1 • —5 + 2 • 1 = 1 • 101 + 9 • 10° + 2 • 10-1 A- 8 • 10-2 = (19,28)5.

BEMERKUNG 4.9 In

einem b-adischen Bruch gilt, dass Multiplikation mit b das Komma um eine Stelle nach rechts und Division durch b das Komma um eine Stelle nach links verschiebt.

4.2 Maschinenzahlen Im letzten Abschnitt haben wir die Darstellung von Zahlen zu einer Basis b vorgestellt, nun studieren wir die grundlegenden Möglichkeiten, badische Zahlen in einem Rechner darzustellen. Da in Rechnern in der Regel Binärwörter gespeichert werden, legen wir nun für die folgenden Abschnitte fest, dass b = 2 gilt. Dabei vergessen wir nicht, dass vorgestellte Zahlenformate auch für andere Basen definiert werden können. Beim Speichern von Zahlen in Rechnern treten zwangsläufig Probleme auf, weil ein Rechner zum Speichern von Zahlen nur endlich viele Stellen verwendet. Es können also nicht alle (Nachkomma)Stellen einer Binärzahl mit beispielsweise unendlich vielen Stellen dargestellt werden. Der Grund für diese Problematik ist offensichtlich. In jedem Rechner auf diesem Planeten kann es nur endlich viel Speicherplatz geben, weil der Planet gegenwärtig nur endlich viele Atome zur Datenspeicherung zur Verfügung stellt. Entsprechend kann 50

ein Rechner auch nur endlich viele Ziffern einer Binärzahl aufbewahren. Die Zahlen, die ein Rechner darstellen kann, nennt man Maschinenzahlen oder darstellbare Zahlen. Dabei gibt es unterschiedliche Zahlenformate, die zu unterschiedlichen Mengen von Maschinenzahlen führen. Ein Zahlenformat ist eine Vorschrift, welche die Speicherung von Zahlen regelt. Es konkretisiert beispielsweise die Bitlänge, also den für eine Zahl zur Verfügung gestellten Speicherplatz. Zahlen, die für ein bestimmtes Zahlenformat mit festgelegter Bitlänge keine Maschinenzahlen sind, werden beim Speicherungsvorgang dann zwangsläufig auf Maschinenzahlen gerundet. Bei diesem Vorgang möchte man natürlich im Blick behalten, wie groß der entstehende Rundungsfehler ist. Um dies zu untersuchen, benötigt man Wissen über die kleinste und die größte Maschinenzahl xmin und xmax, sowie den Abstand zweier Maschinenzahlen.

MASCHINENZAHLEN II

4.2.1 Darstellung von ganzen Zahlen Für die Darstellung von ganzen Zahlen, also natürlichen Zahlen, die mit einem Vorzeichen versehen sind, bieten sich zwei verschiedene Methoden an. Entweder man speichert das Vorzeichen in einer eigenen Position (meist der führenden), oder man interpretiert die führende Position nicht als bk son-

4.10 Ein Binärwort (s, zk_2 ,

DEFINITION

dem als —bk . Bei Binärzahlen nennt man diese Zahldarstellung das Zweier-Komplement-Format. Es bietet den entscheidenden Vorteil, dass das Addieren der resultierenden Zahlen angenehm einfach ist. Der Grund liegt in der binären Struktur von Computern und den dort zu implementierenden Rechenoperationen. Hier jedoch gehen wir nicht weiter ins Detail. , zo)si E F2 der Länge k im signed Integer Format

wird interpretiert als z,_2,

, zosi = (-1). •

z, • J=0

1 BEISPIEL 4.11 Es steht das Binärwort (1,1,0,0,1)si im signed Integer Format für die Zahl

(1,1,0,0,1)si = (-1)1 • (1 • 23 + 0 • 22 + 0 • 21 + 1 • 2°) = —9.

ZU DEFINITION

4.10

Die englische Bezeichnung passt gut. Ins Deutsche übersetzt trüge das Format die Bezeichnung "mit einem Vorzeichen versehene natürliche Zahl". Das erste Bit, im Binärwort mit s benannt, bestimmt das Vorzeichen der zugeordneten ganzen Zahl. Ist es 1, so wird eine negative ganze Zahl zugeordnet, ist es 0, so wird eine positive ganze Zahl zugeordnet. Der Betrag der zugeordneten Zahl entspricht der Zahl, deren Binärdarstellung den k — 1 auf das Vorzeichenbit folgenden Bits entspricht. Dabei wird die 0 sowohl durch (0,0, ... ,0) als auch durch (1,0, ... ,0) dargestellt.

Es steht das Binärwort (0,1,0,0,1)si im signed Integer Format für die Zahl (0,1,0,0,1)si = (-1)° • (1 • 2 + 0 • 22 + 0 • 21 + 1 • 2°) = 9.

Im Zweierkomplement steht das führende Bit an nicht wie in einer normalen Binärzahl für das VerPosition k — 1 für das Verwenden von —2" und wenden von -1-2k-1. DEFINITION

4.12 Ein Binärwort (zk _1, zk _2 ,

, zo)zK E n der Länge k im Zweierkomplement-

ZU DEFINITION 4.12

Im Zweierkomplement-Format wird der Zahlenbereich der Zahlen 2k —1 bis 2k um 2" nach links verschoben.

Format wird interpretiert als k-2 (Zk_i, Zk-2, • • • ZO)ZK = — zk-1 • 2k-1 +

Ezj • 2j. i=0

1 BEISPIEL

4.13 Es ist steht das Binärwort (1,1,0,0,1)zK im Zweierkomplement-Format für die ganze Zahl (1,1,0,0,1)zi< = —1 • 24 + (1 • 2 + o • 22 + 0 • 21 + 1 • 2°) = —16 + 9 = —7.

51

MASCHINENZAHLEN

Es ist steht das Binärwort (0,1,0,0,1)zK im Zweierkomplement-Format für die ganze Zahl (0,1,0,0,1)zK = —0 • 24 + (1 • 23 + 0 • 22 + 0 • 21 + 1 • 2°) = 0 + 9 = 9.

KOROLLAR 4.14 Die Binärwörter der Länge k im Zweierkomplement-Format können die ganzen Zahlen von — 2k-1bis 2k-1 - 1 darstellen.

4.2.2 Gleitkommazahlen

Häufig werden sehr große, meist gerundete Zahlen in „Millionen" oder „Milliarden" angegeben. So liest man beispielsweise von „ungefähr 80 Millionen Bundesbürgern" in Deutschland. Die 80 ist nur im Zusammenspiel mit dem Wort „Millionen" hier richtig zu verstehen. Es präzisiert, dass die eigentliche Zahl um weitere sechs Nullen (wie eine Millionen) ergänzt werden bzw. gleichbedeutend die Zahl mit einer Millionen multipliziert werden muss. Man könnte auch sagen, dass 80 • 106 die korrekte Zahl ist. Diese Darstellung ist auch von Taschenrechnern bekannt und macht sich zu Nutze, dass Multiplikation mit einer ZehnerpoZU DEFINITION 4.15 Streng genommen, ist eine Zahl im Gleitkomma-Format ein Tupel mit drei Einträgen, wobei die Einträge, zumindest Mantisse und Exponent, wiederum Thpel sind. In der Praxis vereinigt man Vorzeichenbit, Exponent und Mantisse zu einem Tupel der Länge 1 E M. Korrekt wäre es also beispielsweise zu schreiben (1, (1,1), (2,3,1,0,1))GK. Man notiert aber (1,1,1,2,3,1,0,1)GK und kann mit Kenntnis von E und M dieses Tupel korrekt interpretieren.

tenz, das Komma einer Dezimalzahl verschiebt. Das lässt sich natürlich auf Brüche zu beliebigen Basen verallgemeinern, wenn mit Potenzen der Basis multipliziert oder dividiert wird. Ein solches Format wird demnach auch als Gleitkomma-Format bezeichnet. Gleitkommazahlen eines solchen Formats stellen b-adische Brüche dar, indem sie angeben ■ wie das Vorzeichen der Zahl lautet, ■ an welcher Position die führende Ziffer des b-adischen Bruchs steht, ■ wie die Ziffern der Zahl lauten.

DEFINITION 4.15 Ein Gleitkomma-Format für b-adische Zahlen zu einer Basis b E N>1 mit den Ziffern 2b = {04,2, ... b - 1} ist für die Mantissenlänge M E N>1 und die Exponentenlänge E E N>1 ein Tupel (s, e, m)GK bestehend aus

■ einem Vorzeichenbit s e {0,1}, ■ einem Exponent e E zig ■ und einer Mantisse m E Ein Tupel repräsentiert die b-adische Zahl mit dem Vorzeichen (-1) und dem Betrag in • be . 1

Es sei E = 2 und M = 5 für b = 4. Dann ist die 4-adische Zahl im Gleitkomma-Format mit diesen Parametern BEISPIEL 4.16

(1,1,1,2,3,1,0,1)GK = (-1)1 • (2310100000)4, weil (1,1)4 = 41 + 1 • e = 5 ist. 52

MASCHINENZAHLEN •

L

Negative Exponenten mittels Bias speichern

Um Zahlen mit Betrag kleiner 1 speichern zu - ähnlich wie im Zweierkomplement-Format - auf können, müsste man negative Exponenten spei- eine Verschiebung des Zahlenbereichs der Expochern, also ein weiteres Vorzeichenbit einfügen. nenten, so dass dort negative Zahlen ebenfalls Dies kann man sich jedoch sparen, einigt man sich durch positive repräsentiert werden. D EFINITION 4.1 7 Ein Gleitkomma-Format mit Bias ist ein Gleitkomma-Format mit zusätzlich festgelegtem Bias B E N. Eine Tupel repräsentiert die Binärzahl mit dem Vorzeichen (-1)8 und dem Betrag m • be-B . rBEISPIEL 4.18 Es sei E = 2 und M = 5 für Gleikommaformat mit diesen Parametern

b = 4 mit dem Bias B = 7. Dann ist die 4-adische Zahl im

(1,1,1,2,3,1,0,1)GK = (-1)1• (231,01)4, weil (1,1)4 = 41+ 1 • 4° = 5 ist und damit e —

B = —2.

4.2.3 Binäre Gleitkommazahlen mit „hidden Bit"

Bis auf die Zahl 0 fangen alle Binärbrüche mit Man nennt ein binäres Gleitkomma-Format mit einer führenden 1 an. Diese 1 kann man beim einem solchen „hidden Bit" normalisiert. Der ofSpeichern auslassen, um ein Bit Speicherplatz zu fensichtliche Nachteil der Normalisierung besteht sparen. Man nennt dieses Bit ein „hidden Bit", also darin, dass die 0 nicht gespeichert werden kann. ein verstecktes Bit, weil es beim Speichern in der Stets ergänzt man die Mantisse um eine führende Mantisse nicht aufgeführt wird, man es beim Inter- 1 - das ist für die 0 nicht korrekt möglich. pretieren der Zahl jedoch berücksichtigen muss. DEFINITION 4.19 Eine normalisierte binäre Gleitkommazahl mit Mantissenlänge M E N>1, Exponentenlänge E E N>1 und Bias B E N>1 ist ein Binärwort (s, e, m) E IF2+E±m , welches dem Binärbruch mit dem Vorzeichen (-1)8 und dem Wert (1, m) • 2e-13 entspricht.

BEISPIEL 4.20 Es sei E = 2 und M = 5 für b = 4 mit dem Bias Gleitkomma-Format mit hidden Bit mit diesen Parametern

B = 5. Dann ist die 2-adische Zahl im

(1,14,0,1,1,0,1)GK = (-1)1 • (0,0101101)2,

53

MASCHINENZAHLEN

weil (1,1)2 = 21 + 1 • 2° = 3 ist und damit e — B = —2.

zu LEMMA 4.21 gi Der Abstand der beiden Zahlen entspricht genau dem Wert der letzten Mantissenstelle von x.

11 LEMMA 4.21 Es sei ein normalisiertes Gleitkomma-Format mit Mantissenlänge M E N>1, Exponentenlänge E E N>1 und Bias B E N>1 gegeben. Seien außerdem x und y mit x< y zwei aufeinanderfolgende Gleitkommazahlen in diesem Format. Dann gilt y - x = 2-m•• 26'—B , wobei es der Exponent von x ist. 7

BEMERKUNG 4.22 Es sei ein normalisiertes Gleitkomma-Format mit Mantissenlänge

M E N>1, Exponentenlänge E E N>1 und Bias B E N>i gegeben. Dann gelten die folgenden Aussagen, die wir nicht weiter begründen. Sie nachzuvollziehen ist eine gute Übungsaufgabe. 1. Die Zahl 0 ist nicht darstellbar. 2. Die kleinste positive darstellbare Zahl ist xi mi ni (0 ... 0) = 2— B. 3. Der größtmögliche Exponent ist emax = (1 ... 1)2 — B = 2E —1— B. 4. Die größte darstellbare Zahl ist xin. = (2 — 2— m) • 2emax . 5. Die kleinste darstellbare Zahl ist xmin = — (2 — 2— m) • 2emax.

54

Kapitel 5

Folgen und Reihen Folgen sind ein mächtiges Werkzeug der Analysis. Eine Folge ist ein unendlich langes Tupel über einer gegebenen Menge. Die Einträge sind mit den natürlichen Zahlen indiziert und heißen Folgenglieder. Man kann eine Folge auf ihr Grenzverhalten hin untersuchen. Das meint, Tendenzen für die Folgenglieder ermitteln, deren Index gegen unendlich strebt. Der Grenzwert einer Folge ist das erste Konzept in diesem Zusammenhang. Ähnlich kann man Schranken an Folgen definieren und damit eine Folge auf Monotonie hin untersuchen. Für das Studium von reellen Folgen ist Kenntnis der reellen Zahlen unabdingbar. Das Konzept des Supremums und des lnfimums präzisiert das Konzept der Beschränkung einer Menge. Neben Teilfolgen und Häufungspunkten fasst man ebenfalls Cauchyfolgen ins Auge. Reihen sind Folgen, die über ihr Bildungsgesetz definiert sind. Das Studium des Grenzverhaltens von Reihen ist kompliziert. Man findet eine Reihe von Konvergenzkriterien für Reihen.

Wachstumsvorgänge in der Natur lassen sich häufig mit der sogenannten Fibonaccifolge beschreiben. Die Fibonaccifolge ist eine unendlich lange Folge von Zahlen, deren Werte sich über ein Bildungsgesetz ergeben. Die ersten beiden Zahlen sind 1 und 1, jede weitere Zahl ergibt sich aus der Summe ihrer beiden Vorgänger. Also ist die dritte Zahl 1 + 1 = 2 und die vierte Zahl 1 + 2 = 3 und somit lautet die Folge 1,1, 2, 3, 5,8,13, 21, 34,55, 89, 144, 251, .... Ihren Namen erhielt die Folge zu Ehren des italienischen Mathematikers Leonardo da Pisa, genannt Fibonacci („figlio di Bonacci", Sohn des Bonacci). In seinem im 13. Jahrhundert verfassten Buch Liber abbaci, was mit "Buch der Rechenkunst" zu übersetzen ist, führt er diese Folge als Lösung der Frage eines Kaninchenzüchters an. Dieser stellte sich die Frage, wie viele Kaninchenpaare inner-

halb von zwölf Monaten aus einem einzigen Paar hervorgehen. Dabei setzte er voraus, dass jedes Paar erst ab dem zweiten Lebensmonat ein weiteres Paar pro Monat wirft. Man kann leicht darauf kommen, dass dieser „Versuchsaufbau" zu der genannten Folge führt. Mathematische Folgen sind unendlich lange Zahlenfolgen Diese Idee einer unendlich langen Zahlenfolge entspricht genau dem mathematischen Konzept einer Folge. Solche Konstrukte sind für sich interessant, lassen sich auf vielfältige Fragestellungen hin untersuchen und spielen insbesondere in der Analysis eine wichtige Rolle. Folgen und die Untersuchung von Funktionen Lineare Funktionen lassen sich leicht über eine Steigung (und möglicherweise einen yAchsenabschnitt) vollständig beschreiben. Möchte

U FOLGEN

man allgemein Funktionen untersuchen, ist es unumgänglich sich auf eine Stelle zu konzentrieren und die Funktion in einer kleinen Umgebung um diesen Punkt anzuschauen. Dabei hat man die Hoffnung, dass die Funktion bzw. ihr Funktionsgraph, wenn man „ganz nahe heranzoomt" entweder aussieht wie eine lineare Funktion (Differenzierbarkeit) oder wenigstens eine Linie und nicht eine Wolke von unzusammenhängenden Punkten bildet (Stetigkeit). Das „ganz nahe heranzoomen" stellt allerdings ein Problem dar, liegen doch in

jedem noch so kleinen Intervall um eine reelle Zahl unendlich viele weitere reelle Zahlen. Man könnte also mit Abstand 2 zu einer Stelle x beginnen, dann auf Abstand 1 springen, dann auf Abstand 1, dann auf Abstands und so weiter, so dass man nach n Sprüngen Abstand n zu x hat. Man wird nie bei x ankommen, doch beliebig nahe herantreten. Dieser Prozess kann unendlich lange fortgesetzt werden. Die Abstände bilden eine Folge von Zahlen, die unendlich weit fortgesetzt wird.

ZU DEFINITION 5.1 A

Im Prinzip ist eine Folge nichts anderes als ein unendliches Tupel. Entsprechend werden Elemente der Menge M den natürlichen Zahlen zugeordnet, also geordnet aufgeschrieben. Dabei müssen die Folgenglieder nicht unterschiedliche Elemente der Menge M sein. Die Bezeichnung (a„),,EN spiegelt die Interpretation einer Folge als unendliches Time' wieder. Ein Tupel ist eine geordnete Menge, wie beispielsweise dieses 5-er Tupel (1,2,3,2,2) mit fünf Einträgen. Man kann jeder Position in dem Tupel eine natürliche Zahl von 1 bis 5 zuordnen. Eine Folge tut genau dies, nur für unendlich viele Positionen. Der Index soll dies verdeutlichen. Wie genau man Folgen angibt, es sind ja immerhin unendlich viele Zuordnung zu treffen, wird in Bemerkung 5.2 besprochen.

5.1 Folgen

Wir beginnen direkt mit der Definition einer Folge Bild einer unendlichen, nicht abbrechenden Zahund formalisieren das in der Einleitung entfaltete lenreihe.

DEFINITION 5.1 Es sei M eine beliebige Menge. Dann bezeichnen wir eine Funktion a : N —> M als Folge in M und schreiben (an ),,,, mit den Folgengliedern an = a(n) für alle n e N.

Ist M = IR, dann nennt man (an).EN eine reelle Folge. Die Tatsache, dass eine Folge eine Funktion der zugeben. Es gibt, wie die Bemerkung 5.2 festhält, unendlichen Menge der natürlichen Zahlen in eine drei gängige Verfahren eine Folge zu beschreiben. Menge M ist, führt zu der Schwierigkeit, sie anr

ZU BEMERKUNG 5.2 ei

Bei der aufzählenden Definition einer Folge, wird in der Regel ein Bildungsgesetz durch die Angabe der ersten Folgenglieder "mitgeliefert", ohne es explizit zu nennen.

BEMERKUNG 5.2 Eine Folge über einer Menge M kann auf verschiedene Weisen angegeben werden. Je nachdem, ob M entsprechende "Rechenoperationen" erlaubt, kann eine Folge auf drei verschiedene Weisen angegeben werden. Folgen können...

• ... aufzählend definiert werden. Dann schreibt man beispielsweise

(an)neN =

( 1 1, 1 , 1, 1 , ...) l' 2 4 8 16

• ... definierend angegeben werden. Dann definiert man beispielsweise, dass für eine Folge (an)neN gilt 1 an = — für alle n E N. 21

56

FOLGEN

• ... rekursiv durch einen Startwert und eine Rekursionsgleichung definiert werden. Dann definiert man beispielsweise, dass für eine Folge (an ),EN gilt 1 ao = —

und

an+1 = — • an für alle n 2

L

BEMERKUNG 5.3 Manchmal ist es für eine einfache Darstellung sinnvoll, den Index der Folge leicht anzupassen. Möchte man beispielsweise die Folge (1 1 1 1 definierend angeben, ist es schöner „a„ = :1 für alle n E N>1" im Gegensatz zu „an = für alle n E N" zu schreiben, was formal richtig wäre - da die natürlichen Zahlen für uns bei 0 beginnen. In diesem Fall nennt man die Folge dann (an)nEN >l • Allgemein darf man also m viele führende natürliche Zahlen abschneiden und nennt die Folge dann (an)nEN?rn •

L

BEISPIEL 5.4 Die Folge (an )„EN der natürlichen Zahlen lässt sich tatsächlich auf die drei in Bemerkung 5.2 erwähnten unterschiedlichen Weisen angeben. • Auzählend ist (an) nEN = (0,1,2,3,4, • • •)• • Definierend ist an = n für alle n E N. • Rekursiv durch (einen) Startwert(e) und eine Rekursionsgleichung ist zum Beispiel ao = 0

und

an+1 = an + 1 für alle n E N

oder aber auch ao = 0, ai = 1

und

an+2 = an + 2 für alle n E N.

BEISPIEL 5.5 Es ist (pn)nEN die Folge der aufsteigend sortierten Primzahlen mit den ersten 24 Folgengliedern (die Primzahlen kleiner als 100)

po = 2, p5 = 13, Plo = 31, P15 = 59, P20 = 79,

= 5,

pl = 3,

P2

Ps = 17, P11 = 37, P16 = 61, P21 = 83,

= 19, P12 = 41, P17 = 67, P22 = 89,

7, P8 = 23 P13 = 47, P18 = 71, P23 = 97,

P3 =

P4 = 11, po = 29, P14 = 53, P19 = 73,

Dass es sich dabei um eine Folge handelt, es also tatsächlich unendlich viele Primzahlen gibt, besagt der ca. 2300 Jahre alte Satz von Euklid.

Man kann Folgen vergleichen und sehr einfa- Folgenglieder den gleichen Wert annehmen. Eine che Folgen charakterisieren. Dabei sind zwei besondere Rolle spielt die Folge, deren FolgenglieFolgen gleich, wenn sie in jedem Folgenglied der konstant gleich 0 sind. übereinstimmen und Folgen konstant, wenn alle

57



FOLGEN

DEFINITION 5.6 Eine Folge (an)nEN über einer Menge M wird als konstante Folge bezeichnet, wenn es ein m E M gibt, so dass an = m für alle n E N. ZU DEFINITION 5.6 el

Die hier angeführten Definitionen sind nicht nur auf den ersten Blick leicht eingängig sie sind tatsächlich nicht kompliziert. Da man häufig Folgen auf Gleichheit hin untersuchen möchte und Nullfolgen als Werkzeug in Beweisen und konstante Folgen als Quelle für Beispiele verwendet, ergibt es dennoch Sinn, sich auf die entsprechenden Bezeichnungen zu einigen.

Die konstante reelle Folge (an)nEN mit an = 0 für alle n E N wird als Nullfolge bezeichnet. Zwei Folgen (an )nEN und (bn)neN heißen gleich, wenn an = bn für alle n E N. Man kann aus reellen Folgen durch Addition, Sub- glieder mit identischem Index miteinander vertraktion, Multiplikation und Division neue Folgen rechnet. basteln. Dabei werden die entsprechenden Folgen-

DEFINITION 5.7 Gegeben seien die reellen Folgen (an)nEN und (bn)neN. Dann sind die Folgen mit Sn

= an + bn,

Gln = an — bn

und

pn = an • bn

für alle n E N die Summenfolge (sn)„EN, Differenzenfolge (dn)„EN und Produktfolge (p„ )„,EN von (an )neN und (bn)nen. Gilt zusätzlich bn 0 für alle n e N, so ist die Folge mit qn =

an bn

die Quotientenfolge (q.)nEN von (an)nE N und (bn )nEN . Für reelle Folgen gibt es einen offensichtlichen Zusammenhang zwischen der Differenzenfolge und der Frage, ob sie gleich sind. Zwei Folgen sind

natürlich genau dann gleich, wenn ihre Differenzenfolge eine Nullfolge ist.

LEMMA 5.8 Zwei reelle Folgen (an).EN und (bn)nEN sind genau dann gleich, wenn die Differenzenfolge von (an )nEN und (b,,)TiEN eine Nullfolge ist.

II

Beweis. Es sind zwei Richtungen der Äquivalenz zu zeigen. „

>" Es seien (an )neN und (bn)neN gleich. Dann gilt mit an = bn auch an — bn = 0 für alle n E N. Also ist die Differenzenfolge von (an )nEN und (bri).EN eine Nullfolge.

„" Es sei die Differenzenfolge von (an) nEN und (bn)nEN eine Nullfolge. Dann ist mit an — bn = 0 auch an = bn für alle n E N. Also sind (an)neN und (bn)nEN gleich.

58

FOLGEN

1

5.1.1 Graphische Darstellung von Folgen

Folgen kann man, wie auch bei Funktionen durch Graphen üblich, graphisch darstellen. Das ist wenig überraschend, ist eine Folge ja eine Funktion von den natürlichen Zahlen in eine Menge M. Anschaulich wird es, wenn die Menge M geordnet auf einem Zahlenstrahl aufgezeichnet werden kann, wie beispielsweise die reellen Zahlen. Bei der graphischen Darstellung von Folgen gibt es im Wesentlichen zwei Modelle, die einander sehr ähnlich sind. ■ Die Folge wird in ein Koordinatensystem ge-

zeichnet (dabei kann nur ein endlicher Teil der Folge verzeichnet werden). ■ Die Folge wird auf einem M-Zahlenstrahl eingezeichnet (dabei kann möglicherweise die ganze Folge verzeichnet werden). Folgen in Koordinatensystemen verzeichnen

Wir betrachten allgemein eine Folge (an ),,EN über einer Menge M. Dann erhalten wir die in Abbildung 5.1 illustrierte Darstellung in einem Koordinatensystem.

M "10 .11 ag

"9 .4

.6 .2 .1 .0 0 1 2 3 4 5 6 7 8 9 10

11 N ABBILDUNG 5.1

Mal

Die Darstellung einer Folge in einem Koordinatensystem. Die Folgenglieder sind aus einer Menge M gewählt, welche auf der y-Achse aufgetragen sind. Auf der x-Achse sind die natürlichen Zahlen alias der Folgenindex verzeichnet. Offensichtlich kann so immer nur ein kleiner Teil der Folge verzeichnet werden.

Folgen auf einem Zahlenstrahl verzeichnen

Die zweite Darstellung entspricht der Verteilung der Folgenglieder auf einem Strahl. Man erhält sie, indem man sich die y-Achse des Koordinatensystems mit den aufgetragenen Folgengliedern

aufzeichnet - mathematisch formuliert - die Folgenglieder auf die y-Achse projiziert, siehe Abbildung 5.2.

59





FOLGEN

.0 .1 .2 .6 .5 .7 .4

.3 .12

M

.11 .9 "10 .8

ABBILDUNG 5.2 Die Darstellung einer Folge auf einem Zahlenstrahl. Das setzt natürlich voraus, dass M geordnet aufgeschrieben werden kann. Man erhält diese Darstellung aus der Projektion der Darstellung im Koordinatensystem auf die y-Achse. Dabei sind in der Skizze natürlich nur endlich viel Folgenglieder verzeichnet.

Wir betrachten, um eine konkretes Beispiel für die zu sehen, die Folge aus Beispiel 5.5, die Folge der Darstellung in einem Koordinatensystem und das Primzahlen. Verzeichnen einer Folge auf einem Zahlenstrahl N 100 • 90 • 80 • 70 • 60 • 50 • 40 30 • 20 • 10 •

89/.

83 e« 67 5961.•

71

7 3 9

3

29 31

3

• 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

, .••• ,•• ••, • 0

ABBILDUNG

10

20

•,• 30

• ,• 40

• , • 50

•,• 60

• ,• • 70

•, • 80

•, 90

• 100

N

5.3

Die Darstellung der Folge (p.,-,)„EN der Primzahlen aus Beispiel 5.5 in einem Koordinatensystem (oben). Die Darstellung der Folge (p„),„ E ri der Primzahlen aus Beispiel 5.5 auf einem Zahlenstrahl (unten). Die Menge ist nach dem Satz von Euklid unendlich groß. Es wird nur ein kleiner Teil der Folge auf dem Zahlenstrahl dargestellt.

BEISPIEL 5.9 Die Folge der Primzahlen aus Beispiel 5.5 hat die in Abbildung 5.3 (oben) gezeigte Darstellung in einem Koordinatensystem.

Die Folge hat auch die in Abbildung 5.3 (unten) dargestellte Verteilung der Folgenglieder auf einem Zahlenstrahl der natürlichen Zahlen. Es ist darauf hinzuweisen, dass sowohl im Koordinatensystem, als auch auf dem Zahlenstrahl nur die ersten 24 Folgenglieder der Folge aufgeführt sind. Die unendlich vielen weiteren Folgenglieder, deren Wert größer als 97 ist, sind in dem unendlich großen Koordinatensystem und auf dem unendlich langen Zahlenstrahl der natürlichen Zahlen ebenfalls einzuzeichnen.

60

FOLGEN •

Wir betrachten nun ein Beispiel, welches die im Kontrast zu der Darstellung in einem KoordiStärke der Darstellung auf einem Zahlenstrahl natensystem verdeutlicht.

BEISPIEL 5.10 Die Folge (an )„EN>i mit an = nfür allen E N>1 hat die in Abbildung 5.4 (oben) gezeigte Darstellung in einem Koordinatensystem. Offensichtlich sind nicht alle Folgenglieder in dem gewählten Ausschnitt des Koordinatensystems zu verzeichnen. Das würde sich auch nicht ändern, wenn man den Ausschnitt beliebig groß wählt - stets würde man unendlich viele Folgenglieder nicht verzeichnen können.

Zudem erhalten wir die Verteilung der Folgenglieder auf einem Zahlenstrahl der rationalen Zahlen, wie in Abbildung 5.4 (unten) gezeigt. Man sieht, dass sich die Folgenglieder der Folge nahe um die 0 „tümmeln" - genauer zwischen der 1 und der 0. Tatsächlich befinden sich dort unendlich viele Folgenglieder. Denn für jedes n e N ist zwischen 0 und 1 - je größer der Index n dabei ist, um so kleiner ist das entsprechende Folgenglied

1

Q

4

-2

3

4

5

6



7 8 9 10 11 12 N>i

0

ABBILDUNG

5.4

Die Darstellung der Folge (a„),E N aus Beispiel 5.10 in einem Koordinatensystem (oben). Die Darstellung der Folge (a, )„, E N aus Beispiel 5.10 auf einem Zahlenstrahl (unten). Tatsächlich sind, wenn auch nicht scharf voneinander abzugrenzen, alle Folgenglieder der Folge auf dem Zahlenstrahl verzeichnet. In einem Koordinatensystem wäre dies nicht möglich.

ZUSAMMENFASSUNG

Eine Folge (an )nEN ist nach Definition 5.1 eine Funktion, die jeder - wirklich jeder - natürlichen Zahl einen Wert einer Menge M zuordnet. Man sagt dann, dass sie eine Folge über der Menge M ist. Die ein-

zelnen Bilder a(n) für n E N werden mit an und als Folgenglieder der Folge (an )„EN bezeichnet. Eine Folge, bzw. diese Funktion, kann auch erst bei einer natürlichen Zahl m größer 0 beginnen. Man

61



GRENZVERHALTEN VON FOLGEN

schreibt dann (an)nEN>„, und diese Funktion „beginnt" erst bei m E N. Folgen können nach Bemerkung 5.2 aufzählend, definierend oder rekursiv angegeben werden. Nach Definition 5.6 heißt eine Folge konstant, wenn alle Folgenglieder übereinstimmen. Sie heißt Nullfolge, wenn sie konstant 0 ist und zwei Folgen heißen gleich, wenn alle ihre Folgenglieder gleich sind. Nach Lemma 5.8 sind zwei reelle Folgen (a n )nEN und (bn) n eN genau dann gleich, wenn die Differenzenfolge von (an ),,EN und (bn ),EN eine Nullfolge ist. Nach Definition 5.7 sind die Folgen mit sn = an + bn, dn = an — bn und pn = an • bn für alle n E N die ZU DEFINITION

5.11

Summenfolge (sn)nEN, Differenzenfolge (c/n)nEN und Produktfolge (pn)nEN von zwei reellen Folgen (an)nEN und (bn)n EN. Gilt zusätzlich bn 0 0 für alle n E N, so ist die Folge mit qn = a die Quotientenfolge (q7,)„EN von (an) neN und (3n)neN• Folgen kann man graphisch darstellen. Bei der graphischen Darstellung von Folgen gibt es im Wesentlichen zwei Modelle, die einander sehr ähnlich sind. Die Folge wird entweder in ein Koordinatensystem gezeichnet (dabei kann nur ein endlicher Teil der Folge verzeichnet werden) oder sie wird auf einem M-Zahlenstrahl eingezeichnet (dabei kann möglicherweise die ganze Folge verzeichnet werden).

A

Die Eigenschaft GW lautet in Worten: Zu jedem reellen positiven Abstand e gibt es ein Index N, E N, ab dem für alle größeren Indizes n > N, gilt, dass der Abstand von a„ zu x kleiner ist als e. Anders formuliert: Egal wie klein man sich die maximale Abweichung e wählt, es gibt immer einen Index N,, so dass alle Folgenglieder mit Index größer oder gleich N höchstens e von x abweichen. Es gibt unter diesen Folgengliedern mit Index größer oder gleich N, keines mehr, dass nicht nahe (höchstens e weit entfernt) an x liegt. Dabei kann es sein, dass eine Folge für beispielsweise e = 1 erst ab einem unglaublich großem Index, wie zum Beispiel N. = 101010 (Eine Zahl mit 10' - also 10 Milliarden Nullen), sich nicht mehr weiter als e = 1 von einem Wert x entfernt. Aber wieder gilt: Die ersten 101010 Folgenglieder sind im Vergleich zu den unendlichen vielen noch folgenden Folgenglieder marginal.

5.2 Grenzverhalten von Folgen Wir untersuchen nun, wie sich eine Folge entwickelt. Dabei berücksichtigen wir nicht bloß eine endliche Anzahl, sagen wir die ersten N Folgenglieder. Denn diese N Folgenglieder machen selbst für jede noch so große natürliche Zahl N einen verschwindend kleinen Anteil der Folge aus - es folgen noch unendlich viele Folgenglieder auf das N-te Folgenglied. Man möchte also untersuchen, ob es eine Tendenz gibt, die sich nicht nach einer endlichen Zahl von Folgengliedern plötzlich

ändert, sondern für Folgenglieder mit beliebig großem Index wahr bleibt. Es könnte zum Beispiel sein, dass die Folge ab Folgenglied N konstant ist - dann ist die Tendenz „alle Folgenglieder haben den selben Wert" eine Aussage, die für Folgenglieder mit beliebig großem Index wahr ist. Die allgemeineren Ansätze sind die Konzepte des Grenzwertes, der oberen und unteren Schranke und des Häufungspunkts, welche Aspekte dieses Verhaltens formalisieren.

5.2.1 Grenzwerte von Folgen, Konvergenz und Divergenz Wir beginnen mit der Definition des Grenzwertes einer Folge. Dabei werden wir uns den Abstand von Folgengliedern zu einem festen Wert aus

der Menge M anschauen. Deshalb beschränken wir uns auf Folgen über Mengen, für welche eine Norm definiert ist - also Vektorräume.

DEFINITION 5.11 Es sei V ein Vektorraum und II • 11 : V •-+ R eine Norm auf V und (an )nEN eine Folge über V. Ein x E V heißt Grenzwert (oder Limes) der Folge (an)„EN bezüglich der Norm II • 11,

62

GRENZVERHALTEN VON FOLGEN •

wenn die folgende Bedingung erfüllt ist. GW. Für alle e e R mit e > 0 gibt es eine natürliche Zahle N, E N, so dass für alle natürlichen Zahlen n E N mit n > N, gilt Man - x11 < e. In diesem Fall schreibt man x = lim an und sagt, dass (an)nEN gegen x konvergiert oder falls der n—>oo

exakte Wert des Grenzwertes nicht von Relevanz/oder nicht bekannt ist, dass (an )neN konvergiert. rBEMERKUNG

5.12 Die Eigenschaft GW eines Elements x und einer Folge (an)nEN lässt sich formal schreiben

als Ve E

e > 03/V, EIN Har, — x11 < eVn E n > Ne .

r BEMERKUNG 5.13 Das Kriterium GW lässt sich auf ein gegebenes Element x E V anwenden. Damit ist nicht auszuschließen, dass eine Folge konvergiert, wenn man für ein x E V nachweist, dass GW nicht gilt - es könnte schlicht ein anderes Element x' E V geben, dass ein Grenzwert ist. Möchte man also nachweisen, dass eine Folge nicht konvergiert, muss man argumentieren, dass kein Element aus V die Eigenschaft GW erfüllt.

r BEMERKUNG 5.14 Für manche Folgen kann man eine Grenzwert finden, der gar nicht in der Menge V liegt. Man findet ihn dann in einem Vektorraum V', der V enthält. Dann sagt man, dass die Folge nicht in V, wohl aber in V' konvergiert.

Zum Beispiel kann man die irrationale Zahl, welche die Gleichung

1 1+x

=x

bzw. 0 = X2 + X

—1

löst, als den Grenzwert einer Folge rationaler Zahlen beschreiben. Diese Lösung ist als der sogenannte „Goldene Schnitt" bekannt und lautet x = 12. Sie kann mit Hilfe der Fibonacci-Folge approximiert werden, die wir schon in der Einleitung diese Kapitels erwähnt haben. Die Fibonacci-Folge ist rekursiv definiert mit

fo = 1, fl = 1

und f.+1 =

fn-

für alle n E N>i•

Die Folgenglieder werden auch als die Fibonacci-Zahlen bezeichnet. Die Folge mit = fn fn+1

für alle n N,

der Quotienten aufeinander folgender Fibonacci-Zahlen, konvergiert gegen x. Dabei sind alle Folgenglieder der Folge (an)nEN rationale Zahlen, der Grenzwert hingegen nicht.

r BEMERKUNG 5.15 Ist im Kontext nichts anderes verfügt, verwenden wir für reelle Vektorräume in GW die euklidische Norm. Ist aus dem Kontext klar, welche Norm man zum Messen des Abstands zum Grenzwert

63



GRENZVERHALTEN VON FOLGEN

verwendet, dann spricht man auch einfach nur von „dem Grenzwert" und lässt den Zusatz „zur Norm 11 • 11" einfach weg. Für reelle Folgen, also Folgen über den reellen Zahlen, verwendete man als Norm in der Regel den Absolutbetrag. Er entspricht im Übrigen der euklidischen Norm, fasst man die reellen Zahlen als den eindimensionalen reellen Vektorraum auf. L

J

BEMERKUNG 5.16 Ist

eine Folge über ein Bildungsgesetz definiert, so passt man die Schreibweise x = lim an n—> oo

für den Grenzwert leicht an und notiert statt an das Bildungsgesetz für an. Für die Folge (an )„EN mit an = für alle n E N>1 schreibt man zum Beispiel 1 ihn — = 0 n—>o9 n

Diese Folge konvergiert tatsächlich gegen 0, wie in Beispiel 5.22 gezeigt. L

Möchte man überprüfen, ob ein Wert ein Grenzwert einer Folge ist, kann man das folgende Sche-

gegeben, welche es ermöglichen, die in Definition 5.11 gegebene Bedingung GW zu überprüfen.

ma 5.17 anwenden. Dabei sind zwei Schritte anSCHEMA F 5.17 Ein

Wert x als Grenzwert einer Folge (an)rieri prüfen.

Schritt 1. Wähle e E I% beliebig mit E > 0. (Dabei darf man e auch nach oben beschränken, wenn das für den Beweis leichter ist. Gilt die Bedingung aus GW für ein e, dann auch für e' mit EJ > E.) Schritt 2. Finde für das in Schritt 1 gewählte E einen Index NE, so dass Man — x11 < e für alle n E N mit n > Ne gilt.

BEISPIEL 5.18 Die konstante reelle Folge (an )„EN mit an = 1 für allen E N hat den Grenzwert x = 1. Wir wenden Schema F 5.17 an.

Schritt 1. Wähle e E IR beliebig mit e > 0. Schritt 2. Wir finden für das in Schritt 1 gewählte e einen Index mit NE = 0, so dass lan — x1 = 11 — 11 = 0 5, e für alle n E N mit n > 0 = NE gilt. Tatsächlich kann man also für jedes gewählte e das gleiche NE wählen. Die Zahl x = 3 ist hingegen kein Grenzwert dieser Folge. Wir wenden Schema F 5.17 an. Siehe Abbildung 5.5. Schritt 1. Wähle e = 1.

64

GRENZVERHALTEN VON FOLGEN •

Schritt 2. Wir finden kein N, E N, so dass lan — x1 = 11 — 31 = 2 < für alle n E N mit n > N, gilt. Tatsächlich gibt es nicht einen Index n E N, so dass lan — xl = 11 — 31 = 2 < e gilt. 1

E

T

5.19 Die reelle Folge (an )nEN mit an = (-1)" für alle n E N ist eine alternierende Folge, denn es gilt an = 1 für alle geraden n und an = —1 für alle ungeraden n. Die Zahlen 1 und —1 wechseln sich also ständig ab, die Folge springt zwischen ihnen hin und her. Diese Folge hat keinen Grenzwert. Siehe Abbildung 5.6. Angenommen, es ist x ein Grenzwert der Folge (an)nEN, dann gibt es nach GW einen Index NE für jedes E R mit e > 0, so dass 'an — xl < e für alle n > NE. BEISPIEL

3+

Demnach muss auch für e = 1 ein solcher Index N1 existieren. Dann ist aber 'an — xl

1

und

lan+1 —

für alle n > N 1 . Das bedeutet aber, dass lan — an+i 1 < 1 ist - ein Widerspruch. Denn zwei aufeinanderfolgende Folgenglieder haben Abstand 2 (eines ist 1, das andere —1). In Worten: Es gibt keine Zahl x, so dass ab einem fixierten Folgenindex alle nachfolgenden Folgenglieder nahe an x liegen, weil die Folgenglieder untereinander stets so großen Abstand haben. Vielleicht ahnt man das folgende Lemma 5.20

schon, denn eine Folge kann nicht zwei unterschiedliche Grenzwerte besitzen. Die Definition würde das erlauben, denn grundsätzlich darf man jedes Element aus V daraufhin untersuchen, ob es

IS

N

x1
0 nur endlich viele Folgenglie-

der Abstand größer oder gleich e zum Grenzwert haben können.

Die zwischen 1 und —1 alternierende Folge aus Beispiel 5.19 hat keinen Grenzwert. Egal welchen Wert man wählt, der Abstand zweier aufeinander folgender Folgenglieder ist immer 2. Damit ist es unmöglich, dass die Folgenglieder ab einem bestimmten Grenzwert beliebig nahe an dem selben Wert liegen.

V L EMMA 5.21 Es sei (an)nEN eine Folge über einem Vektorraum V und II • II : V -+ IR eine Norm auf V. Es ist x genau dann ein Grenzwert der Folge (an )„EN, wenn für alle e > 0 nur für endlich viele

65

GRENZVERHALTEN VON FOLGEN

Folgenglieder gilt Ilan — xll> e.

Beweis. Der Beweis dieser Aussage ist eine Übungsaufgabe. Graphische Darstellung von Grenzwerten Bevor wir uns weitere Folgen und ihre Grenzwerte anschauen, möchten wir zunächst zwei Möglichkeiten kennenlernen, Grenzwerte von Folgen graphisch darzustellen. Dem Vorbild für Folgen folgend, gibt es zwei Ansätze, sich das Konzept des Grenzwertes einer Folge graphisch anschaulich zu verdeutlichen. Je nachdem welche graphische Darstellung einer Folge man wählt, stellt sich die Bedingung GW entweder

als „E-Schlauch" (im Koordinatensystem) oder als "Punktwolke" (auf dem Zahlenstrahl) um den Grenzwert dar. Möchte man prüfen, ob x ein Grenzwert ist und wählt den Parameter e, so ist die Bedingung GW dann erfüllt, wenn in einem Koordinatensystem der Graph der Folge einen Schlauch um x der "Dicke" 2E nicht mehr verlässt, siehe Abbildung 5.7.

M

e

N, 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

N

ABBILDUNG 5.7

Die Illustration der Bedingung GW in einem Koordinatensystem. Ist x ein Grenzwert, so gibt es für jedes e > 0 - egal wie klein dieses auch gewählt sein mag - einen kritischen Index N„ ab welchem die Folge den „e"-Schlauch nicht mehr verlässt. Sprich: Alle Folgenglieder mit Index mindesten NE liegen in dem „e"-Schlauch um x.

Die Idee des Grenzwertes wird dadurch illustriert, dass egal wie klein man den „E"-Schlauch wählt, der Graph der Folge ab einem bestimmten Index

66

diesen nicht mehr verlässt. Ähnliches gilt für die sogenannte "Punktwolke" auf dem Zahlenstrahl. Möchte man prüfen, ob x

GRENZVERHALTEN VON FOLGEN

ein Grenzwert ist und wählt man den Parameter Folgenglieder um x ballen und nur endlich vieE, so ist die Bedingung GW dann erfüllt, wenn le Folgenglieder außerhalb des um x zentrierte auf einem Zahlenstrahl sich die unendliche vielen Intervall der Länge 26 liegen, siehe Abbildung 5.8.

e

x

x

e

/14. ABBILDUNG 5.8

Die Illustration der Bedingung GW auf einem Zahlenstrahl. Ist x der Grenzwert einer Folge, so gibt es für jedes E > 0 - egal wie klein dieses auch gewählt sein mag - einen kritischen Index N„ ab welchem die Folge sich dann um x „tummelt. Das soll meinen, dass sich alle Folgenglieder mit Index mindestens N E in der Umgebung mit Radius e um x befinden.

Die Illustration des Grenzwertes besteht nun darin, lich viele Folgenglieder, eine Wolke mit Abstand dass egal wie klein man E wählt, alle, bis auf end- höchstens e um x bilden. Q



ABBILDUNG 5.9

Das Konvergenzkriterium GW des Grenzwertes der Folge aus Beispiel 5.22 für e = 0 3 ist im Koordinatensystem (oben) und auf dem Zahlenstrahl (unten) illustriert.

BEISPIEL 5.22 Die Folge (a.)„EN>1mit an = für alle n E N>i hat den Grenzwert x = 0. Um das zu zeigen, wenden wir Schema F 5.17 an.

Schritt 1. Wähle E E IR beliebig mit e > 0.

67

GRENZVERHALTEN VON FOLGEN

Schritt 2. Zu gegebenem e > 0 definiert man N, = r E 1, man rundet mit der oberen Gaußklammer auf die natürliche Zahl auf, die größer oder gleich dem Bruch Eist. Für alle n > IV, gilt dann zunächst natürlich Ian—

xl=Ian—of=an= 1 ?I

woraus folgt, dass , I an — zI

1

— n

1

1 =

1 =E

. gilt. Um den Schritt 2 für eine konkrete Zahl nachzuvollziehen, wählen wir E = 0,3. Dann ist =[1 3 = [ 101 = 4. io Es gilt also: Für alle n E N mit n > 4 ist der Abstand Ian — 01 kleiner als 0,3. Diese Situation ist in Abbildung 5.9 veranschaulicht.

In der Darstellung im Koordinatensystem wird deutlich, dass ab dem vierten Folgenglied die Folge in den „E"-Schlauch „hineintaucht" und diesen auch nicht mehr verlässt. Auf dem Zahlenstrahl wird deutlich, dass in der Umgebung der 0, bzw. in dem Intervall [-0,3; 0,3] unendlich viele Folgenglieder liegen und außerhalb nur

endlich viele. L

Divergenz von Folgen

ZU DEFINITION 5.24

gi

Die Eigenschaft DBO einer Folge (a„)„ EN heißt in Worten: Zu jeder (noch so großen) reellen Zahl S gibt es ein Index N E N, ab dem für alle n > N gilt: a„ ist größer S. Es gibt also keine Zahl S, wie groß sie auch sein mag, die nicht „dauerhaft" von der Folge überschritten wird. „Dauerhaft" meint, dass es einen „Zeitpunkt" alias ein Folgenglied gibt, ab welchem die Folge stets größer S ist. Analog gilt dies auch für die Eigenschaft DBU, in Worten heißt sie: Zu jeder (noch so kleinen) reellen Zahl S gibt es ein Index N E N, ab dem für allen > N gilt: a„ ist kleiner S.

Das Gegenteil von Konvergenz ist Divergenz. Re- erdenklichen Wert und unter-/überschreiten dieelle Folgen, zumindest solche, die nicht konver- sen ab einem bestimmten Index nicht mehr. Man gieren, lassen sich in zwei Klassen unterteilen. sagt, dass diese Folgen bestimmt divergieren. Dabei wachsen/fallen die einen über/unter jeden DEFINITION 5.23 Eine Folge (an )nEN, die nicht konvergiert, heißt divergent.

Für reellwertige Folgen gibt es die beiden folgen- Folge die Folgenglieder immer größer bzw. kleiner den Verfeinerungen. Sie entscheiden, ob für eine werden, sie also gegen +oo oder —oo strebt. DEFINITION 5.24 Sei (an )nEN eine reelle Folge. Ist die folgende Bedingung erfüllt, dann sagt man, dass (an)nEN bestimmt gegen +oo divergiert. DBO. Für alle S E 118 gibt es ein NS E N, so dass für alle n E N mit n > NS gilt an > S.

In diesem Fall schreibt man lim an = +oo. n co

Ist analog die folgende Bedingung erfüllt, dann sagt man, dass (an)n E N bestimmt gegen — x diver-

68

GRENZVERHALTEN VON FOLGEN •

giert. DBU. Für alle S E R gibt es ein Ns E N, so dass für alle n E N mit n > Ns gilt an < S.

In diesem Fall schreibt man lim an = —oo. n

00

1

BEM ERKUNG 5.25 Wir bemerken, wie man die Eigenschaften der bestimmten Divergenz formal notiert. Die Eigenschaft DBO einer Folge (an)nEN lässt sich formal schreiben als V S EIRON E N : ari > SVn E N,n > N. Analog gilt dies auch für die Eigenschaft DBO, die sich formal als V S E TUN E : < SVn E N, n > N schreiben lässt. SCHEMA

F 5.26 Eine Folge (an)„EN auf bestimmte Divergenz prüfen.

Schritt 1. Wähle S E I18 beliebig. (Dabei darf man S auch nach unten bzw. oben beschränken, wenn das für den Beweis leichter ist. Gilt die Bedingung DBU bzw. DBO für ein S, dann auch für S' mit S' < S bzw. S' > S.) Schritt 2. Finde für das in Schritt 1 gewählte S einen Index Ns, so dass Ian — xl > S

bzw.

I an —XI Ns gilt.

E

BEISPIEL 5.27 Betrachte die Folge (an)nEN mit an = n für alle n E N. Diese Folge divergiert bestimmt gegen +oo. Es ist also nachzuweisen, dass die Bedingung DBU erfüllt ist. Wir wenden Schema F 5.26 an.

Schritt 1. Wähle S E R beliebig. Schritt 2. Es gilt für Ns = [Si > S, so dass an = n > Ns für alle n > Ns, was zu zeigen war.

5.2.2 Mit Grenzwerten rechnen Das folgende Lemma 5.28 formuliert implizit ein Rechenverfahren zum Berechnen von Grenzwerten von zusammengesetzten Folgen. Im Prinzip darf man das Bilden des Grenzwertes an allen bekannten Rechenzeichen auseinanderbrechen.

Um formal korrekt zu bleiben, ist es wichtig, dass in der entsprechenden Berechnung zuerst in einer Nebenrechnung die Grenzwerte der zusammenzusetzenden Folgen berechnet werden und diese erst danach zu einem Ganzen zusammengesetzt werden.

69



GRENZVERHALTEN VON FOLGEN

El

LEMMA 5.28

Es seien (an )„EN und (bn )„EN zwei konvergente reelle Folgen mit Grenzwerten lim an = a und

lim bn = b.

n 00

n —› oo

Dann gelten für die zusammengesetzten Folgen lim (an + bn ) = a + b,

n—>oo

Gilt zusätzlich b

lim (an — bn ) = a — b und lim (an • bn ) = a b. n—* 00

n —› oo

0 und bn 0 für alle n E N, so folgt ,. n an = a nr — b„ b

n--> oo



Beweis. Der Beweis dieser Aussagen ist eine Übungsaufgabe.

Dieses Lemma 5.28 ist vor allem dann hilf-

reich, wenn reelle Folgen über ein Bildungsgesetz definiert sind. Dann lässt sich die Folge möglicherweise in die Summe, Differenz, das Produkt oder den Quotienten zweier Folgen zerlegen.

BEISPIEL

Das ist für Polynome und Brüche mit Polynomen im Zähler und Nenner sicherlich der Fall. Folgen sind dann gebrochen-rationale Funktionen, deren Definitionsbereich auf die natürlichen Zahlen beschränkt ist.

1 5.29 Aus Beispiel 5.22 wissen wir bereits, dass nue —n

Entsprechend folgern wir für die Folgen mit an = 22- und bn = lim an = lim 27 -2 = 0, weil lim

n—>oo

lim

n—>oo

n—>oo

= lim

n—>oo

1

n2

0 gilt. für alle n E N>1, dass sie den Grenzwert

1 1 = lim — • — = 0 •0 = 0 n-->00 n n

1 1 1 = 0, weil lim — = lim — • = 0•0 = 0 n—>oo n3 n—>oo n n2

besitzen. Induktiv finden wir lim =0 n—>oo n'

L

für alle k E N> 1 .

SCHEMA F 5.30 Für gebrochen-rationale Funktionen (Brüche aus Polynomen), deren Definitionsbereich den natürlichen Zahlen entspricht, gibt es ein einfaches Verfahren zum Berechnen des Grenzwertes.

Schritt 1. Finde die größte im Nenner auftretende Potenz nk und kürze den Bruch mit dieser. Schritt 2. Berechne den Grenzwert unter Verwendung von lim = 0 und lim nk = oo sowie lim s = s für n—> co n n—> co s R.

70

GRENZVERHALTEN VON FOLGEN II

BEISPIEL

5.31 Es sei die Folge (an),,EN>, mit an =

8 n2 + 3 n3 für allen E N>1 gegeben. 3 • n + 2 • n4

Schritt 1. Es ist n4 die größte im Nenner auftretende Potenz. Wir kürzen +3. + 3 . 2.7) . n4 8• (8 . 8 •n2 + 3 • n3 an = 3 •n + 2 • n4 — (3 • 3- + 2 • 1) • n4 3 • ,71:5 +2.1 Schritt 2. Es ist also 8 • e2- + 3 • lim an =

n—>co

3 • -2-7 +2.1

0+0 =11 0+2

1 = 0 sowie Hm Jj - = 0, wie in Beispiel 5.31 Es gilt nämlich lim 2 = 2 und lim 1= 0, lim —2n—>oo n

gesehen.

n—> oo n

n—Ico n

n—>ce 1

L

BEISPIEL

5.32 Es sei die Folge (an,)nE%i mit an =

8 • n2 + 3 n4 für allen E N>1 gegeben. 3•n+2•n4

Schritt 1. Es ist n4 die größte im Nenner auftretende Potenz. Wir kürzen 8. 1_ 3) n 4 (8 . 8 n2 + 3 n4 an

=

3 • n + 2 • n4 = (3 • 775 1 + 2 • 1) • n4

+3 n

3 • 23- +2.1

Schritt 2. Es ist also lim an =

n—>o°

8• 2-+3 0+3 3 =— 2 0+2 3•jj +2• 1

Es gilt nämlich lim 3 = 3, nlim 2 = 2 und

= 0, sowie ni.+In

= 0, wie in Beispiel 5.31

gesehen. L

Ig ZU BEISPIEL 5.33 BEISPIEL

8 • n2 + 3 • n5 5.33 Es sei die Folge (an)neN ?A. mit an = 3 n 2 n4 für alle n E 1‘1>i gegeben.

Es ist an =

8 • n2 + 3 • n5 3 • n + 2 • n4

(8 . ni + 3 . n) . n4 (3 • 7,3- + 2 • 1) • n4

8. 7 1,2_ . +3. n =

3 • ,71:1- +2.1

8.0 +3. n >

3 = • n. 5 3•1+2•1

Ist der Grad des Zählers größer als der Grad des Nenners, so kann das Konvergenzverhalten durch Abschätzen bestimmt werden.

Die Folge wird also beliebig groß und erfüllt die Eigenschaft DBO - ist also bestimmt divergent gegen +00.

BEMERKUNG 5.34 Rechnen mit oo ist im Übrigen nicht möglich! Das Symbol oo steht nicht für eine Zahl, entsprechend versagen bei oo die üblichen Rechengesetze. Insbesondere der Wert von „e" ist nicht bestimmt.

71

GRENZVERHALTEN VON FOLGEN

Man könnte sonst die folgenden (nicht gestatteten Rechenspiele) durchführen. lim

n—foo

42 • n2 42 = lim n—*00 n n3

=

I

lim

n-+oo

42 • n3 42 • n lim = 00 I n2 = 1

nL i moo 42n:2 =

lim 42 • 1= 42

n—).co 1

Ist „22" nun 0, oo, 42 oder ganz was anderes?

L "

_J

ZUSAMMENFASSUNG

Nach Definition 5.11 ist für eine Folge (a n )nEN über einem Vektorraum mit Norm II :V.-41KeinxE V, ein Grenzwert (oder Limes) der Folge bezüglich dieser Norm, wenn die Bedingung GW erfüllt ist. Diese Bedingung besagt, dass es für alle a E R mit a > 0 eine natürliche Zahl Ne E N gibt, so dass für alle natürlichen Zahlen n E N mit n > Ar gilt 11 an — x11 < a. In diesem Fall schreibt man x = lim an und sagt, dass gegen x konn--).00 vergiert oder falls der exakte Wert des Grenzwertes nicht von Relevanz/oder nicht bekannt ist, dass (an ),,EN konvergiert. Mit Hilfe von Schema F 5.17 lässt sich in zwei Schritten überprüfen, ob ein gegebener Wert Grenzwert einer Folge ist. Nach Lemma 5.20 hat eine Folge höchstens einen Grenzwert. Existiert einer, ist er also eindeutig. Nach Lemma 5.21 gibt es für jedes a > 0 nur endlich viele Folgenglieder mit Abstand größer a zum Grenzwert. Man kann Konvergenz graphisch darstellen. In einem Koordinatensystem gibt es für jeden „e"-Schlauch einen Index, so dass die Folge ab diesem Index kom-

plett in diesem Schlauch liegt. Auf einem Zahlenstrahl „tummeln" sich alle Folgenglieder um den Grenzwert man spricht dann von einer Punktwolke. Nach Definition 5.23 heißt eine nicht konvergente Folge divergent. Reelle Folgen können nach Definition 5.24 bestimmt divergieren, wenn die Eigenschaften DBO oder DBU erfüllt sind. Die Folgen also anschaulich jeden beliebig großen/kleinen Wert dauerhaft über-/unterschreiten. Nach Lemma 5.28 kann man für zusammengesetzt konvergente Folgen, also Summen-, Differenzen-, Produkt- und Quotientenfolgen die Grenzwerte eben auch als Summe, Differenz, Produkt und Quotient der Grenzwerte berechnen. Für Folgen, deren Folgenglieder Quotienten aus Polynomen sind - auch gebrochen-rationale Funktionen genannt - kann man nach Schema F 5.30 Konvergenzaussagen treffen, wenn man den Grad der Zählerund Nennerpolynome vergleicht. Bemerkung 5.34 warnt davor, mit dem Symbol oo wie mit einer Zahl zu rechnen.

5.2.3 Schranken, Monotonie, Infimum und Supremum

Ein Folge, die nicht konvergiert, kann sich dennoch in einem sehr kleinen Intervall von M befinden. Das meint, die Menge der möglicherweise unendlich vielen verschiedenen Folgenglieder liegt relativ dicht beieinander, sie ist zumindest nach oben und nach unten beschränkt. Diese Idee wol72

len wir nun für reelle Mengen formalisieren und dann auf Folgen anwenden. Besitzt eine allgemeine Menge M eine Ordnung, dann lässt sich dieses Konzept auch auf diese Menge verallgemeinern.

GRENZVERHALTEN VON FOLGEN U

Schranken an reellen Mengen Wir formalisieren also zunächst, wann eine Teil- unten beschränkt ist. Die Definition ist wenig menge der reellen Zahlen nach oben und nach überraschend und leicht eingängig. DEFINITION

5.35 Sei A c R eine Teilmenge der reellen Zahlen.

ZU DEFINITION 5.35

Wir nennen eine Zahl x E R eine obere Schranke für A, falls für alle a E A gilt a < x. Analog heißt y

E TR

eine untere Schranke für A, falls für alle a E A gilt a > y.

Die Menge A heißt nach oben/unten beschränkt, falls sie eine obere/untere Schranke hat. Falls beides zutrifft, nennt man A einfach beschränkt.

BEISPIEL 5.36 Es

sei die Menge A = {1,2,3} C R gegeben.

Die Menge A hat in x = 3 eine obere Schranke. Es gilt offensichtlich mit 1 < 3,

2 3 ebenfalls eine obere Schranke an A.

A

Die Menge A hat in x = —1 eine untere Schranke. Es gilt offensichtlich mit 2 > —1

1 > —1,

und

3 > —1, ABBILDUNG 5.10

dass tatsächlich jedes Element aus A größer gleich —1 ist. Außerdem ist dann jede reelle Zahl x E 118 mit x < —1 ebenfalls eine untere Schranke an A.

BEISPIEL 5.37 Es sei

die Menge A =

>2

Der Begriff der oberen Schranke ist recht intuitiv zu verstehen. Jede Zahl x E IR, die größer ist als alle Elemente in A ist eine obere Schranke an A. Das heißt insbesondere, wenn es eine obere Schranke x an A gibt, dann auch unendlich viele. Denn jede Zahl x1 E lE mit xi > x ist dann auch eine obere Schranke an A. Es macht dann also wirklich keinen Sinn von „der (einen)" oberen Schranke an A zu sprechen, vielmehr gibt es eine ganze Reihe, sogar unendlich viele oberen Schranken an A, oder eben keine einzige. Analog gilt das natürlich auch für untere Schranken. Siehe Abbildung 5.10.

= {x E llt : x > 2} c R gegeben.

Die Menge A hat keine obere Schranke. Angenommen, es gibt eine obere Schranke x E IR an A. Dann gibt es zwei Fälle. Fall 1 (x E A): Dann ist x eine reelle Zahl, die größer gleich 2 ist. Dann ist aber auch x' = x + 1 eine reelle Zahl größer gleich 2 und damit x' E A. Da x eine obere Schranke an A ist, muss dann aber auch gelten x' < x, was gleichbedeutend ist mit x' = x +1 < x, ein Widerspruch. Fall 2 (r (it A): Dann ist x eine reelle Zahl, die kleiner 2 ist. Da x eine obere Schranke an A ist und 2 in A ist, muss dann aber auch gelten 2 < x, ein Widerspruch.

Im gestrichelten Bereich finden sich untere und im gepunkteten Bereich obere Schranken an A, wobei A fett markiert ist. Die Skizze illustriert zumindest für die reellen Zahlen, dass es mehr als eine untere und eine obere Schranke an eine Teilmenge der reellen Zahlen gibt, wenn es überhaupt eine solche gibt.

Die Menge A hat in x = 2 eine untere Schranke. Es gilt offensichtlich für jedes Element a in A, dass a > 2 gilt. L

Die Definition von oberen und unteren Schranken trifft die Intuition einer Schranke nur bedingt. Wir haben festgestellt, dass eine nach oben bzw. nach

J

unten beschränkte reelle Menge mehr als nur eine jeweilige Schranke besitzt. Wäre es nicht naheliegender nach der kleinsten oberen Schranke und

73



GRENZVERHALTEN VON FOLGEN

nach der größten unteren Schranke zu fragen und zeichnen? Die Begriffe Supremum und Infimum diese eben als eine solche, eine Schranke, zu be- tun genau dies.

ZU

DEFINITION 5.38 Sei A eine Teilmenge einer geordneten Menge M.

DEFINITION 5.38 el

Das Supremum ist ganz einfach die kleinste obere Schranke, das Infimum die größte untere Schranke.

Wir nennen x E M das Supremum von A, falls x eine obere Schranke von A ist und für jede obere Schranke z von A gilt z > x. Man schreibt dann sup(A) = x. Ist A nicht nach oben beschränkt, dann sagen wir sup(A) = +oo. Entsprechend heißt y E M das Infimum von A, falls y eine untere Schranke von A ist und für jede untere Schranke z von A gilt z < y. Man schreibt dann inf(A) = y. Ist A nicht nach unten beschränkt, dann sagen wir sup(A) = —oc.

BEISPIEL 5.39 Betrachte wieder die Menge A = {1,2,3} c IR aus Beispiel 5.36. Dann gilt, dass sup(A) = 3 ist, denn 3 ist die kleinste obere Schranke an A. Jede Zahl die kleiner als 3 ist, ist keine obere Schranke an A, weil 3 selbst in A enthalten ist. Formal sauber nehmen wir an, dass es eine obere Schranke s E R gibt, die kleiner ist als 3 - also s < 3. Das ist aber ein direkter Widerspruch, denn 3 ist in A und s eine obere Schranke an A, also muss gelten s > 3.

Analog gilt inf(A) = 1. L

zu SATZ 5.40 gl Diese Aussage ist insbesondere richtig, da A eine Teilmenge der reellen Zahlen ist. In anderen Zahlbereichen gilt diese Aussage nicht allgemein - siehe Beispiel 5.41.

Die folgende Tatsache werden wir nicht beweisen, reellen Zahlen voraussetzen würde, als unserer weil dies eine genauere Beschäftigung mit den Darstellung angemessen.

SATZ 5.40 Jede nach oben beschränkte Menge A c R hat ein Supremum und jede nach unten

beschränkte Menge hat ein Infimum. 7

BEISPIEL 5.41 Sei A die Menge aller x E IR mit x2 ZU BEISPIEL

5.41

Das Beispiel zeigt insbesondere, dass Satz 5.40 in den rationalen Zahlen Q nicht zutrifft, denn das gefundene Infimum bzw. Supremum +/ ist irrational.


0, so dass 1 = u e. Dann ist aber 1 < u — e.

74

GRENZVERHALTEN VON FOLGEN •

Nach der Definition sind in dem offenen Intervall (1,2) alle reelle Zahlen x E R mit 1 < x < 2 enthalten. Also ist auch u — E A. Es ist offensichtlich u — e u - ein Widerspruch, denn u ist eine untere Schranke an A. Schranken an reellen Folgen

Wir wenden uns nun wieder reellen Folgen zu Dabei wird es schlicht auf die (möglicherweise unund übertragen das Konzept der Beschränkung endliche) Menge der Folgenglieder angewendet. von Mengen von reellen Zahlen auf reelle Folgen. DEFINITION 5.43 Wir nennen eine Folge (an )nEN nach oben bzw. nach unten beschränkt, falls die Menge {an : n E N} diese Eigenschaft hat. -1

5.43

wiederholen werden dabei nur einmal

BEISPIEL 5.44 Die Folge (an )nE N mit an = für alle n E N>1 ist nach unten und nach oben beschränkt. Es ist 1 1 {an : n E NI = { — : n E N>1 L

ZU DEFINITION

Die Menge {an : n E N} fasst die Folgenglieder der Folge in einer Menge zusammen. Folgenglieder die sich aufgelistet. Also ist zum Beispiel für die konstante Folge (an )nEN mit an = 1 für

allen E N diese Menge einfach : n E N} = {1}, also einelementig und offensichtlich nach oben und unten

und 1 ist eine obere und 0 eine untere Schranke an diese Menge.

beschränkt.

BEISPIEL 5.45 Die Folge (an )nEN mit an = n für alle n E N ist nach unten aber nicht nach oben beschränkt. Es ist lan : n

= In : n

E N} = N

und 0 ist eine untere Schranke an diese Menge. Die Menge der natürlichen Zahlen ist allerdings nicht nach oben beschränkt. 1

5.46 Die alternierende Folge (an )nEN mit an = n • (-1)" für alle n E N ist weder nach unten noch nach oben beschränkt. Es ist BEISPIEL

{an : n E N} = {n : n E N mit n ist gerade} U {—n : n E N mit n ist ungerade}, und weil die Mengen der geraden und der ungeraden natürlichen Zahlen nicht nach oben beschränkt sind, gibt es weder eine obere noch eine untere Schranke. L

_J

Monotonie von Folgen

Wir haben nun Begriffe kennen gelernt, die be- Wachstum einer stetigen Tendenz folgen, oder ob schreiben, ob eine Folge beliebig große oder klei- der Wert aufeinanderfolgender Folgenglieder mal ne Werte annimmt oder ob sie das nicht tut. Wir größer und mal kleiner wird. möchten nun untersuchen, ob Folgen in Ihrem

75



GRENZVERHALTEN VON FOLGEN

DEFINITION 5.47 Es sei (an)nEN )n EN eine Folge über einer geordneten Menge M.

ZU DEFINITION 5.47

Eine Folge ist monoton wachsend, wenn für jedes Folgenglied gilt, dass das nachfolgende Folgenglied keinen kleineren Wert besitzt. Sie ist streng monoton wachsend, wenn der Wert des Nachfolgers echt größer ist. Analog gilt das für monoton fallende und streng monoton fallende Folgen.

monoton wachsend, falls für alle n E N gilt an < an+1. streng monoton wachsend, falls für alle n E N gilt an < Wir nennen (an)nEN monoton fallend, falls für alle n E N gilt an > an+i • Wir nennen (an)flEN streng monoton fallend, falls für alle n E N gilt an, > Wir nennen (an)nEN Wir nennen (an )nEN

BEISPIEL 5.48

Die Folge (an ),EN = (1,2,3,4, ...) ist streng monoton wachsend, denn es gilt an = n < n 1 = an±i

für alle n E N. Die Folge ist im Übrigen auch monoton wachsend (ohne den Zusatz „streng"), denn die schwächere Forderung an < an+1 ist auch erfüllt. L

J

BEISPIEL 5.49 Die Folge (an)nEN = (1, 4- 1, )4, • • .) mit an = 2n für alle n E N ist streng monoton fallend, denn es gilt 1 1 1 1 = an+1 an — 2n > 2 2n = 2n+1

für alle n E N. Die Folge ist im Übrigen auch monoton fallend (ohne den Zusatz „streng"), denn die schwächere Forderung an > an±i ist auch erfüllt. L

5.2.4 Ein Konvergenzkriterium für reelle Folgen Wir möchten die Konzepte des Grenzwertes,

ZU PROPOSITION 5.50 gl

Wie in der Einleitung schon angesprochen, gibt die Proposition ein Kriterium an die Hand, eine reelle Folge auf Konvergenz zu prüfen. Ist eine Folge monoton wachsend oder fallend und entsprechend nach oben oder unten beschränkt, konvergiert sie. Außerdem wird der Grenzwert charakterisiert. Er entspricht dem Supremum oder Infimum aller Folgenglieder. Das Finden dieses Supremums oder Inflmums ist in der Regel eine Herausforderung.

76

Das Kriterium charakterisiert den Grenzwert zwar

der Beschränkung und Monotonie nun zusam-

als ein Supremum oder ein Infimum, gibt jedoch

menführen. Wir erhalten ein Konvergenzkriteri-

kein Berechnungsschema an, ist also für viele Fol-

um, welches eine qualitative Aussage über das

gen nur von theoretischer Bedeutung. Es lässt sich

„Konvergenzverhalten" einer Folge liefert. Wir er-

mit dem Kriterium die Existenz eines Grenzwertes

fahren dabei, ob eine Folge konvergiert oder nicht.

beweisen, dieser aber nicht konstruktiv finden.

PROPOSITION 5.50 Sei (an)nE N eine reelle Folge. Ist die Folge (an )nEN monoton wachsend und nach oben beschränkt, so konvergiert sie gegen sup{an :

n e N}.

GRENZVERHALTEN VON FOLGEN IN

Ist die Folge (an)ri E N monoton fallend und nach unten beschränkt, so konvergiert sie gegen inflo, n NI. Beweis. Wir zeigen nur die erste Behauptung. Die zweite Aussage folgt aus dieser, wenn man zur Folge (—an)n E N übergeht. Sei also s = sup{an : n E N}, welches nach Satz 5.40 existiert, und sei e > 0. Wir möchten zeigen, dass s der Grenzwert der Folge (an)nE N ist. Wir suchen also einen Folgenglied, so dass alle nachfolgenden Folgenglieder höchstens Abstand e zu s haben. Weil s das Supremum an die Menge aller Folgenglieder ist, gibt es ein Folgenglied mit einem Index, nennen wir ihn Ne, so dass aNs > s — E gilt. Gäbe es diesen nicht, wäre .5 — 6 eine obere Schranke an { an : n E N} und s nicht das Supremum (alias die kleinste obere Schranke) für {an : n E N}. Da die Folge (an)nE N monoton wachsend ist, gilt für alle n > NE folglich .5 > an > aNs > s — E. Demnach gilt für alle n > /V,, dass Ian — sI < e und NE tatsächlich der zu e gesuchte Index ist. Es ist s • also der Grenzwert der Folge (an)nEN.

BEISPIEL 5.51 Die Folge (an )nEN = , 2 , 3, 1, • • .) mit an = 1 für alle n E N konvergiert. Wende dazu Proposition 5.50 an. = 1, damit ist die Folge nach oben Offensichtlich gilt für jedes Folgenglied an = n+, < beschränkt. Weiterhin ist die Folge monoton wachsend. Denn es ist für alle 71. E N n(n + 2) (n + 1)(n + 1) n+1 n and-i — = + 2 n + 1 = (n + 2)(n + 1) (n + 1)(n + 2) 1 (n2 + 2n + 1) — (n2 + 2n) (n + 1)(n + 2) > 0. (n + 1)(n + 2)

Nach Proposition 5.50 konvergiert die nach oben beschränkt und monoton wachsende Folge (an),EN demnach. BEISPIEL 5.52 Sei 0 < q < 1. Die Folge (an)nEN mit an = qn für alle n E N konvergiert ebenfalls nach Proposition 5.50. Man kann leicht prüfen, dass diese Folge monoton fallend und nach unten durch 0 beschränkt ist.

77



GRENZVERHALTEN VON FOLGEN

ZUSAMMENFASSUNG

Nach Definition 5.35 nennen wir für eine Teilmenge A der reellen Zahlen eine reelle Zahl x E eine obere Schranke von A, falls für alle a E A gilt a < x. Analog heißt y E Ig eine untere Schranke für A, falls für alle a E A gilt a > y. Die Menge A heißt nach oben/unten beschränkt, falls sie eine obere/untere Schranke hat. Falls beides zutrifft, nennt man A einfach beschränkt. Ist A eine Teilmenge einer geordneten Menge M, dann nennen wir nach Definition 5.38 x E M das Supremum von A, falls x eine obere Schranke von A ist und für jede obere Schranke z von A gilt z > x. Man schreibt dann sup(A) = x. Ist A nicht nach oben beschränkt, dann sagen wir sup(A) =- -Foo. Entsprechend heißt y E M das Infimum von A, falls y eine untere Schranke von A ist und für jede untere Schranke z von A gilt z < y. Man schreibt dann inf (A) = y. Ist A nicht nach unten beschränkt, dann sagen wir sup(A) = —oe. Satz 5.40 hält fest, dass jede nach oben beschränkte Menge A c EI ein Supremum und jede nach unten beschränkte Menge ein Infimum hat. Definition 5.43 überträgt das Konzept der Beschränkung auf reelle Folgen. Eine Folge (an)neN heißt nach oben/unten beschränkt, falls die Menge

der Folgenglieder {an : n E N} diese Eigenschaft hat. Nehmen die Werte der Folgenglieder einer Folge mit steigendem Index stetig zu oder ab oder zumindest nicht ab oder zu, spricht man von monotonem Wachstum der Folge. Definition 5.47 vereinbart für eine Folge (an )nEN über einer geordneten Menge M die folgenden Bezeichnungen. Wir nennen (a n)nEN monoton wachsend, falls für alle n E N gilt a n < an+ • Wir nennen (an )nEN streng monoton wachsend, falls für alle n E N gilt an, < an+1. Wir nennen (an)nEN monoton fallend, falls für alle n E N gilt an > an+ . Wir nennen (an)„EN streng monoton fallend, falls für alle n E N gilt an > an+ • Führt man das Konzept des Grenzwertes, der Beschränkung und der Monotonie zusammen erhält man einN für reelle Folgen. Sei (an )nEN eine reelle Folge. Dann gelten nach Proposition 5.50 die beiden folgenden Aussagen. Ist die Folge (an )nEN monoton wachsend und nach oben beschränkt, so konvergiert sie gegen sup{an : n E N}. Ist die Folge (an)nEN monoton fallend und nach unten beschränkt, so konvergiert sie gegen inf {an : n E N}.

5.2.5 Teilfolgen und Häufungspunkte Wir möchten nun aufzeigen, wie man aus Folgen Teilfolgen gewinnen kann. Eine Teilfolge wählt für eine gegebene Folge eine unendliche Teilmenge von Folgengliedern aus und bildet aus diesen wiederum eine Folge, indem die Reihenfolge der Folgenglieder beibehalten wird. Anschaulich gesprochen werden manche der Folgenglieder der

78

ursprünglichen Folge nicht berücksichtigt oder aus der Folge gestrichen, um eine Teilfolge zu bilden. Teilfolgen können konvergieren, auch wenn die Folge nicht konvergiert, andersherum ist dies nicht möglich. Eine Folge kann Teilfolgen mit unterschiedlichen Grenzwerten besitzen, doch nun zunächst zur formalen Definition.

GRENZVERHALTEN VON FOLGEN IM

5.53 Sei (an)riEN eine Folge und (m.)nEN eine streng monoton wachsende Folge WB mit m, E N für alle n E N. Dann ist (am )n-- eine Folge, die wir Teilfolge von (an ),,EN nennen. DEFINITION

BEISPIEL 5.54 Betrachte die Folgen (an )neN = , ...) mit an = 2nfür allen E N und (mn)nEN = (1,3,5,7, ...), die Folge der ungeraden natürlichen Zahlen. Dann ist (am.,,)nEN = ( 11 L,...) eine Teilfolge

L

von (on)n€N• J

ZU DEFINITION

5.53

Eine Teilfolge einer Folge (an,),,EN wählt sich unendlich viele Folgenglieder aus und baut aus diesen in gleichbleibender Reihenfolge eine neue Folge. Anders ausgedrückt, werden alle Folgenglieder aus der Folge (an )„E N gestrichen, deren Index nicht in der Menge {m, : n E N} liegt.

Konvergiert eine Folge, dann auch jede ihrer Teil- gegen den gleichen Grenzwert, den der konverfolgen. Dabei konvergieren diese Teilfolgen alle genten Folge.

El

5.55 Es sei (an)nEN eine konvergente Folge. Dann konvergiert jede Teilfolge von (an)nEN gegen den Grenzwert von (cOnEN. LEMMA

Beweis.



Der Beweis ist eine Übungsaufgabe.

Es ist sicherlich richtig, dass nicht jede Folge konvergiert, wir haben schon Beispiele dazu gesehen. Doch zumindest besitzt jede beschränkt reelle Fol-

ge eine konvergente Teilfolge. Um das einzusehen, stellen wir zunächst fest, dass jede Folge eine monotone Teilfolge besitzt.

LEMMA 5.56 Jede reelle Folge (an )nEN hat entweder eine monoton wachsende oder eine monoton fallende Teilfolge.

Sei eine reelle Folge (an)neN gegeben. Sei 13 die Menge aller Zahlen n E N, so dass an > a, für alle j > n, also

Beweis.

B=

{n E N : an > aj Vj E Ni, j > n}.

In Worten sammelt die Menge 13 alle Indizes derjenigen Folgenglieder, deren Wert echt größer als der von allen nachfolgenden Folgengliedern ist. Wir betrachten zwei Fälle. Fall 1 (Die Menge 13 ist unendlich.): Sei (mn)nEN streng monoton wachsend, so dass {ran : n E N} c B.

Dann ist die Folge (am„ )neu (streng) monoton fallend.

79



GRENZVERHALTEN VON FOLGEN

Fall 2 (Die Menge 13 ist endlich): Dann hat B eine obere Schranke no E N. Wir konstruieren die Folge induktiv, beginnend mit mi = no + 1. Wenn rrin bereits definiert ist, definieren wir (mn Cn+1 = lk N : ak > am„, k > Diese Menge ist nicht leer, weil (am,„ )„EN monoton wachsend.

m„ e B. Sei also mn+i das Minimum aus C,,+1. Dann ist

In beiden Fällen erhält man eine monoton wachsende Teilfolge, was zu zeigen war.

ZU SATZ 5.57

lel

Der Satz von Bolzano-Weierstraß ist nicht konstruktiv. Außerdem spricht er von einer konvergenten Teilfolge. Das bedeutet, dass eine beschränkt reelle Folge mindestens eine konvergente Teilfolge besitzt, es können viele sein, mit unterschiedlichen Grenzwerten. Solche Grenzwerte von Teilfolgen werden aus offensichtlichen Gründen auch als Häufungspunkte bezeichnet, wie wir im nächsten Abschnitt sehen werden. Es befinden sich nämlich unendlich viele Folgenglieder in ihrer Nähe.

ZU DEFINITION 5.58

Ein Häufungspunkt einer Teilmenge des R" ist nach der Definition zunächst ein Punkt, sodass es zu jedem beliebigen Abstand mindestens einen Punkt der Teilmenge gibt. Der Aspekt der Häufung ist zunächst nicht ersichtlich. Tatsächlich folgt daraus direkt, dass in jeder Umgebung um einen Häufungspunkt unendlich viele Elemente der Teilmenge liegen. Siehe dazu Lemma 5.62.

80

Wir können nun ernten, was wir mühevoll erarbeitet haben. Der folgende Satz 5.57 ist berühmt und fundamental. Er ist nach den beiden Mathematikern Bernard Bolzano (1781-1848) und Karl

SATZ



Weierstraß (1815-1897) zu Ehren benannt. Beide leisteten grundlegend wichtige Arbeit in der Entwicklung der Analysis.

5.57 (BOLZANO-WEIERSTRASS) Jede beschränkte reelle Folge besitzt eine konvergente

Teilfolge. Beweis. Folgt direkt aus Proposition 5.50 und Lemma 5.56.

Häufungspunkte von Teilmengen reeller Vektorräume Ein Häufungspunkt einer Menge zeichnet sich dadurch aus, dass sich in jeder noch so kleinen Umgebung um ihn unendlich viele Punkte der Menge befinden. Die Punkte der Menge häufen sich dort. Da wir von einem Abstand reden, wählen wir die

Menge als einen Vektorraum, für diese Darstellung wählen wir einen reellen Vektorraum. Die folgende Definition formalisiert diese Idee, wenn vielleicht auch auf den ersten Blick nicht ersichtlich.

DEFINITION 5.58 Sei X c ItIn. Dann nennen wir u E 1W' einen Häufungspunkt von X, wenn es — für alle b > 0 ein x E X {u} gibt mit < S.

Wir nennen die Menge U6 (u,X) = {x E X :

— ull < 451

aller Elemente aus X mit Abstand höchstens S zu u die 5-Umgebung von u in X.

GRENZVERHALTEN VON FOLGEN •

BEMERKUNG 5.59 Weil wir hier reelle Vektorräume im Blick haben, ist die in der Definition verwendete Norm in der Regel die euklidische Norm, welche für n = 1 - also in den reellen Zahlen - einfach dem Absolutbetrag entspricht.

r BEMERKUNG 5.60 Ein Häufungspunkt einer Menge muss nicht zwangsläufig in der Menge selbst liegen. Zu jedem noch so kleinen Abstand muss es allerdings einen Punkt aus der Menge geben, der höchstens diesen Abstand zu dem Häufungspunkt hat. Siehe Beispiel 5.61.

BEISPIEL

5.61 Die Menge X=

:n E N}

besitzt nur den Häufungspunkt u = ( der nicht in X enthalten ist. Wähle dazu 5 > 0 beliebig. Mit °1) ' N6 = [11 findet man eine natürliche Zahl, so dass x6 = ( N81. 1 I kleineren Abstand als 8 zu u hat. Es ist nämlich Na

11x6 - ull =

-

1—1

_1 _ 1< b. N631

In jeder noch so kleinen Umgebung um einen ist übrigens auch nicht möglich, einen Punkt zu Häufungspunkt einer Menge liegen unendlich vie- finden, der am dichtesten an dem Häufungspunkt le Elemente der Menge wie Lemma 5.62 zeigt. Es liegt.

5.62 Seien X c IlBn, u ein Häufungspunkt von X und S > 0. Dann hat die Menge Kardinalität co.

E LEMMA U8(U, X)

le

ZU LEMMA 5.62

Tatsächlich befinden sich für jedes 5 > 0 in der 5-Umgebung von u in X unendlich viele Elemente aus X, wenn u ein Häufungspunkt von X ist.

Beweis. Wir konstruieren eine Folge (a.),,EN über X \ {u} mit Grenzwert u und der Eigenschaft, dass ay, am für alle n, m E N mit n m. Die Aussage folgt dann aus der Definition des Grenzwertes. Angenommen, es gibt so eine Folge. Dann gibt es, weil u der Grenzwert dieser Folge ist, für ein 6 > 0 stets ein N6 E N, so dass lan — x II < 6 für alle n E N mit n > N6 . Da die Folgenglieder alle verschieden sind, gibt es unendlich viele Folgenglieder, deren Abstand zu u kleiner 5 ist. Da (a.).EN eine Folge über X \ {u} ist, folgt die Behauptung. Bleibt zu zeigen, dass es eine solche Folge gibt. Dazu wählen wir So = 1. Dann gibt es, weil u ein Häufungspunkt von X ist, ein xo E X \ ful mit Ilxo — ulk < 6. Wir setzen ao = xo. Nun definieren wir rekursiv die weiteren Folgenglieder. Dazu wählen wir n E N>° und setzen 6„ =

81

GRENZVERHALTEN VON FOLGEN



Es ist nun Ilar„ — ull > (5„

f-ür alle m E {0,1,

, n — 1}.

Da u jedoch ein Häufungspunkt ist, gibt es ein xn E X \ {u} mit 11x,,, — Es gilt somit a„, # am für alle m E {0,1,



, n — 1} und damit ar,

Eine Teilmenge eines reellen Vektorraums vereinigt mit ihren Häufungspunkten wird als der Abschluss dieser Menge bezeichnet. Häufungspunkte müssen zwar nicht zwangsläufig zu der Menge selbst gehören, die Menge selbst „deutet allerdings darauf hin". Es gibt ja in jeder noch so kleinen Umgebung um ihre Häufungspunkte un-

ZU DEFINITION

DEFINITION

5.63 g

Der Abschluss einer Teilmenge eines reellen Vektorraums vereinigt die Teilmenge mit allen ihren Häufungspunkten, die selbst in oder außerhalb der Menge liegen können. Ist die Menge nicht nach oben bzw. unten beschränkt, ist sup(X) = +00 bzw. inf (X) = —oo ebenfalls als „Zahl" im Abschluss von X enthalten.

< (5, Setze dann a„ = xn.

a.,„ für alle n, m E N mit n # rn.

endlich viele Elemente der Menge. Wir definieren nur für Teilmengen der reellen Zahlen den Abschluss formal sauber, weil der Abschluss neben den Häufungspunkten auch noch Infimum und Supremum der Menge umfasst, die wir nur für solche Mengen definiert haben.

5.63 Sei X c R. Dann bezeichnet X

=X U

{x E : x ist Häufungspunkt von X} U {sup(X), inf(X)}

den Abschluss von X. r BEMERKUNG 5.64 Eine Menge steht in folgender einfachen Beziehung zu ihrem Abschluss. Es ist nicht unwichtig, sich den Blick dafür zu schärfen, dass jede Menge in ihrem eigenen Abschluss enthalten ist. Für X c litn also gilt X c X.

Bezüglich des Abschlusses von offenen, halboffenen und abgeschlossenen Intervallen halten wir das folgende Lemma 5.65 fest. Der Abschluss

entspricht jeweils dem abgeschlossenen Intervall mit den gleichen Intervallgrenzen. Hier erschließt sich auch die Bezeichnung.

11 LEMMA 5.65 Seien a, b E R mit a < b. Dann ist

(a, b) = (a, b] = [a, b) = [a, b] = [a, b]. Beweis. Der Beweis ist eine Übungsaufgabe. Man kann sich an den Argumenten aus Beispiel 5.66 orientieren. ■

82

GRENZVERHALTEN VON FOLGEN II

1

5.66 Betrachte die Menge X = [0,1]. Es ist nach Lemma 5.65 X = X. Dies möchten wir nun für dieses Intervall nachvollziehen. BEISPIEL

Es ist eine Mengengleichheit zu zeigen - wir zeigen also zwei Inklusionen. „c" Nach der Definition des Abschlusses gilt

X c X.

„D" Wir zeigen nun, dass es kein uER\ X gibt, das ein Häufungspunkt von X ist. Sei also u e [0,1]. Dann gibt es zwei Fälle: Fall 1 (u > 1): Dann ist u = 1 + e für ein e > 0. Wähle 5 = 2. Angenommen, es gibt ein x E [0,1] mit lx — ul < 5 = ä. Dann ist aber sowohl x < 1 als auch x < u und damit

Ix — ul > 11 — (1 +

=e

ein Widerspruch - also gibt es für 5 = e kein x E [0,1], so dass Ix — uI < 5. Also ist u kein Häufungspunkt von X. Fall 2 (u < 0): Dann ist u = 0 — E für ein E > 0. Angenommen, es gibt ein x E [0,1] mit lx — uI < S = 2. Dann ist aber sowohl x > 0 als auch —u > 0 und damit

Ix — ui 10 — (0 — ein Widerspruch - also gibt es für (5 = Häufungspunkt von X.

5

=E

kein x E [0,1], so dass ix — uI < 5. Also ist u kein

Also gilt [0,1] = [0,1]. L E

B EISPIEL 5.67 Es gilt = R u {— oo, +oo}. Dazu muss man sich nur daran erinnern, dass es beliebig kleine rationale Zahlen gibt. Wählt man u ER \ Q und b > 0, dann gibt es eine rationale Zahl ±, die echt kleiner ist als 5. Ein Vielfaches x von x liegt sicherlich in dem Intervall von u — .5 bis u + 5 und ist selbst eine rationale Zahl, nämlich die gesuchte. L

1

Neben Häufungspunkten können Mengen Vollständigkeit halber führen wir diese Konzepte auch innere sowie Randpunkte besitzen. Der an dieser Stelle kurz ein.

DEFINITION 5.68 Es sei X C IV. Dann ist x E X eine innerer Punkt von X, wenn es ein e > 0 gibt, so dass für alle z E IV mit Ilx — ziI < E auch z E X gilt. Die Menge aller inneren Punkte von X, nennen wir das Innere von X, welches mit X° bezeichnet wird. Ein Punkt in X \ {X°} wird als Randpunkt, die Menge X \ {X°} wird als Rand von X bezeichnet.

ie Ein innerer Punkt x einer Menge X c zeichnet sich dadurch aus, dass es in einer (möglicherweise sehr kleinen) Umgebung um diesen nur Punkte aus der Menge X gibt. Punkte, die nicht innere Punkte sind, werden als Randpunkte bezeichnet. Ist n = 1 und X ein abgeschlossenes Intervall X = [a, 6], dann sind a und b Randpunkte und die Punkte im offenen Intervall (a, b) sind die inneren Punkte.

Häufungspunkte von Folgen über reellen Vektorräumen

83



GRENZVERHALTEN VON FOLGEN

Wir möchten die Konzepte des Häufungspunktes von Teilmengen reeller Vektorräume zu solchen von Folgen über reellen Vektorräumen abgrenzen.

ZU DEFINITION

5.69 gl

Ist u ein Häufungspunkt einer Folge, dann gibt es für jeden noch so kleinen Abstand e > 0 unendlich viele Folgenglieder, die kleineren Abstand als e zu u haben. An dieser Stelle unterscheiden sich die Definitionen des Häufungspunktes von Folgen über und Teilmengen von reellen Vektorräumen. Bei den Folgen ist der Häufungspunkt selbst als Wert nicht ausgeschlossen - die Folgenglieder müssen sich in ihrem Wert nicht unterscheiden. Die alternierende Folge, die stets zwischen 1 und —1 hin und her springt hat zwei Häufungspunkte: 1 und —1. Die Folgenglieder nehmen aber nur die Werte 1 und —1 an und die Menge der Folgenglieder hat keinen Häufungspunkt. Es häufen sich also die Folgenglieder, nicht ihre Werte.

IR

DEFINITION 5.69 Sei eine Folge (an),,EN über R'2 gegeben. Wir nennen u E IV einen Häufungspunkt von (an )„EN, wenn es eine konvergente Teilfolge von (an)neg gibt, deren Grenzwert u ist. 1 BEISPIEL

5.70 Wir

betrachten eine zwischen zwei Punkten altemierende Folge und untersuchen sie auf ihre

Häufungspunkte hin. Die reelle Folge (an) neN mit an = (-1)n für alle n E N hat zwei Häufungspunkte, siehe Abbildung 5.11. Die Zahlen 1 und —1 wechseln sich ständig ab, die Folge springt zwischen ihnen hin und her. Also definieren sowohl (m)nEN = (0,2,4,6, ...) als auch (r—ri,)neg = (1,3,5,7, ...) je eine Teilfolge, mit Grenzwert. Es ist lim

L

=1

und

lim ar-r, = —1.

n—>oo

Im Kontrast hat die Menge {an : n E N} = {1, — 1} keinen Häufungspunkt.

Es gibt einen wichtigen Zusammenhang zwi- Häufungspunkten von Mengen, wie die folgende schen Häufungspunkten von Folgen und Proposition 5.71 deutlich werden lässt.

EI PROPOSITION 5.71 Es sei X (a N

c IR und u E R. Es ist genau dann u E X, wenn es eine Folge EN über X gibt mit limn_›. an = u.

Beweis. Es sind zwei Richtungen der Äquivalenz zu zeigen. Es sei x

ABBILDUNG 5.11

Die alternierende Folge aus Beispiel 5.70 besitzt zwei Häufungspunkte, die Menge ihrer Folgenglieder jedoch keinen.

84

Das ist wichtig, weil es sonst leicht zu Verwechslungen an dieser Stelle kommt.

E

X. Dann gibt es zwei Fälle.

Fall 1 (u E X): Dann hat die konstante Folge (a„)„EN über X mit an = u für alle n E N den Grenzwert u. Fall 2 (u e X): Dann ist u ein Häufungspunkt von X, der nicht in X liegt. Dann lässt sich, ähnlich wie im Beweis von Lemma 5.62 beschrieben, rekursiv eine Folge über X konstruieren. Dazu nimmt man die Folge (an)>nEN>, mit an = n zu Hilfe. Nach der Definition des Häufungspunktes, gibt es für alle n E N>1 ein xn E X \ {u} mit II xn — ull < Man definiert dann eine Folge (an)nEN mit an = xn für alle n E Ni>1. Es ist nach der Konstruktion (an)nen eine Folge über X \ {u}. Außerdem gilt dann für alle n E N>1, dass lia,n — ull < 21 für alle m e NI>Ti. Für jedes e > 0 gibt es demnach mit NE = ni einen Index, so dass Ilan — < N < e für alle n E N>1 mit n > Ne. Also konvergiert (an)nen gegen u.

GRENZVERHALTEN VON FOLGEN



„< ": Es gibt erneut zwei Fälle. Fall 1 (u E X): Dann ist u e X nach der Definition des Abschlusses. Fall 2 (u e X): Angenommen, es gibt ein Folge (a,,,)„EN über X mit Grenzwert u. Dann gibt < 5 für alle n > N8, insbesondere für es für jedes 5 > 0 ein n6 E N, so dass Ilan — n = N6. Damit gibt es für jedes 5 mit aN, ein Element in X = X \ {u}, für welches < S. Damit ist u ein Häufungspunkt von X und nach der Definition des gilt Ilan — Abschlusses ist u E X.

Besitzt eine Folge mehr als einen Häufungspunkt, dann kann sie sicherlich nicht konvergieren. Jeder Häufungspunkt ist ein „Kandidat" für den GrenzLEMMA

wert, doch jeder weitere Häufungspunkt macht dem einen Strich durch die Rechnung.

5.72 Eine reelle Folge konvergiert genau dann, wenn sie genau einen Häufungspunkt

besitzt. Beweis. Der Beweis ist eine Übungsaufgabe. Limes inferior und Limes superior

IM ZU DEFINITION 5.73

Konvergiert eine Folge nicht, ist jedoch nach un- schränkt ist. Die Folge (an),,EN mit ao = —1000 ten und/oder nach oben beschränkt, dann gibt und an = (-1)n für alle n E N>1 ist beispielses sicherlich Häufungspunkte. Um den kleinsten weise nach unten durch —1000 beschränkt - für bzw. den größten solchen Häufungspunkt zu cha- große n ist aber —1 eine viel aussagekräftigere rakterisieren, gibt es die Begriffe Limes superi- untere Schranke. Der Limes inferior dieser Folge or und Limes inferior. Sie identifizieren, ob eine wäre —1. Folge „dauerhaft" nach unten bzw. nach oben beDEFINITION

5.73 Sei eine reelle Folge (an)nea gegeben. Wir bezeichnen mit lim inf an = sup{ inf{ak : k E N, k > n—> 00

: n E NI

den Limes inferior und mit limsup an = inf {sup{a k : k E N, k > n} : n E N} n—>co

Um den Limes inferior einer Folge zu bestimmen, bastelt man sich praktisch eine bestimmte Menge. In die Menge fügt man für jedes n E N das Infimum der Menge fak : k > n} der nachfolgenden Folgenglieder ein. Anders ausgedrückt, man schneidet für jedes n E N die ersten n— 1 Folgenglieder weg und bildet das Infimum über die übrigen Folgenglieder. Hat man diese unendlich vielen Infima in der Menge versammelt, bildet man das Supremum. Die Idee dahinter: Die ersten endlich vielen Folgenglieder können eine Folge nach unten beschränken, aber eine tatsächliche untere Schranke soll den Grenzübergang ins Unendliche überdauern. Es ist die größte untere Schranke, egal wie viele Folgenglieder man zu Beginn abschneidet. Siehe Abbildung 5.12. Das gleiche gilt analog für den Limes superior.

85

GRENZVERHALTEN VON FOLGEN

den Limes superior von (ari)iEN.

lli



11 1

2 3 4

6 i

8 3 10 11 12 13 11 15 16 17 18 19 20 21 22 23 21

N

ABBILDUNG 5.12 Der Limes inferior einer Folge ist das größte Infnnum aller Teilfolgen, bei denen endlich viele der ersten Folgenglieder gestrichen wurden.

BEISPIEL

5.74 Für die Folge (an) nEN mit an = (-1)n für allen lim inf an = —1 n—>=

und

E

N gilt

lim sup an = 1. n 00

Es ist ganz offensichtlich inf{ak : k > n} = {-1} für alle n E N und deshalb auch sup{inf{ak : k E N, k > n} : n E N} = sup{-1} = —1 und analog sup{ak : k E N, k > n} = {1} für allen

E

N und deshalb auch

sup{inf{ak : k E N, k > n} : n E NI = inf{1} = 1.

BEISPIEL

5.75 Für die Folge (an)ng mit an = für allen E N>1 gilt lim inf an = 0 n—>co

und

lim sup an = 0. -->

Es ist ganz offensichtlich inf{ak :k E N, k > n} = {0} für allen E N>1 und deshalb auch sup{inf{ak : k E P1, k > n} : n E N} = sup{0} = 0. Etwas komplizierter, aber dennoch leicht einzusehen ist sup{ak : k > n} = {,+,} für alle n monoton fallend ist) und deshalb auch

(an )neN

1 sup{inf{ak : k E N, k n} : n E NI} = inf — : n E NI>1 = 0.

86

E

N>1 (weil

GRENZVERHALTEN VON FOLGEN

Der Limes inferior und der Limes superior noch, sie sind auch ihr kleinster und größter sind stets ein Häufungspunkt einer Folge. Mehr Häufungspunkt. III LEMMA 5.76 Sei (an )neN eine reelle Folge. Es seien

lim inf = u und lim sup = o mit u, o E n—>co

n—>oo

Dann ist u der kleinste und o der größte Häufungspunkt von (an )nEN. Beweis. Wir zeigen, dass hm Aussage folgt analog.

= u der kleinste Häufungspunkt von (an )nEN ist. Die andere

Wir definieren eine Folge (un )nEN mit un = inf{ak : k E N, k > n}. Die Folge (un)nEN ist monoton wachsend und nach oben beschränkt, konvergiert also gegen sup{un : n E N} = sup{inf{ak : k E N, k > n} : n E N} = lim inf an = ui. n—>co Die Folge (un)nEN ist jedoch keine Teilfolge von (an)neN, also bleibt uns mit Hilfe von (un )nEN eine konvergente Teilfolge mit Grenzwert lim infn,. an zu konstruieren. Sein E N. Da un = inf{ak : k E N, k > n} ist, gibt es ein k > n mit un < ak < un + #7 ,„ Setze mit = k. Es gilt dann mit = k > n. Also ist (onn)nE N eine nach oben unbeschränkte Folge über N. Außerdem definieren wir nun eine Folge (än)nerl mit än = am, für alle n E N. Es gilt l un

, — ani

1 —• n

(5.1)

Wir zeigen nun, dass (än)nEN gegen u konvergiert. Wähle dazu ein e > 0 beliebig. Da (un)nEN gegen u konvergiert, gibt es für 2 ein n E N, so dass z > Außerdem gibt es ein NI , so dass Iun — < N

(5.2)

Aus (5.1) und (5.2) folgt zusammen mit der Dreiecksungleichung 1 1 2 +— =— < — ui = I a n — un + un — ul < Wtn — un I + lun — ul < — n n n für alle n

E

N mit n > N e. Also konvergiert (än)nEN gegen u.

Da (m.).EN eine nach oben unbeschränkte Folge über N ist, hat sie eine streng monoton wachsende Teilfolge, mit welcher wir eine Teilfolge von (än)neN und damit auch eine von (an )nEN gewinnen. Diese konvergiert dann mit (rin)nEN auch gegen ui. Also ist u ein Häufungspunkt von (a.),,EN• Zu zeigen, dass es sich dabei um den kleinsten Häufungspunkt handelt, überlassen wir dem Leser. ■

87



GRENZVERHALTEN VON FOLGEN

Die Folge (an)„EN aus Beispiel 5.75 konvergiert Limes inferior und der Limes superior überein gegen 0. Tatsächlich stimmen in diesem Fall der das ist kein Zufall. LEMMA 5.77 Es sei (ari)„EN eine reelle Folge. Es konvergiert (an ), EN genau dann gegen ihren Limes inferior, wenn ihr Limes inferior gleich ihrem Limes superior ist.

Beweis. Es sind zwei Richtungen der Äquivalenz zu zeigen. „-": Es konvergiere (an )nEN gegen lim inf„,. an = u. Angenommen, es ist lim sup„,,,0 an = mit u ui. Dann gibt es ein e > 0 mit ui — u = e. Da (a.).EN gegen u konvergiert, gibt es ein E N, so dass la n — ul < 2 für alle n > N mit n > N. Dann ist aber auch an < u + e für alle n > Also gilt auch sup{ak : k

< u+ 2.

Demnach ist u' = limsup an -= inf{sup{ak : k E N, k > n} : n E n-->oo

< sup{ak : k E N, k > Ni} < u+

Dann ist jedoch ui — u < z - ein Widerspruch. Also ist u = u' und lim sup7, lim infn,,, 0 und wähle NE, so dass laNs — an s < e für allen > NE. Weil lim amn = Z,

n—> co

existiert ein k e N, so dass mk > NE und I amk — zi < e. Für alle n > mk gilt folglich lan — zi < I am„ —z1+ I am, —an l 0 eine natürliche Zahle N EN geben, so dass für alle natürlichen Zahlen n, m E N mit n, m > N gilt liar, — a,n 11 < E. Proposition 5.82 erklärt die Ähnlichkeit zur definierenden Eigenschaft des Grenzwertes. Es ist eine reelle Folge genau dann konvergent, wenn sie eine Cauchyfolge ist.

5.3 Reihen Wir wenden uns nun speziellen und sehr wichtigen Folgen zu, den Reihen, welche über ihr Bildungsgesetz charakterisiert werden. Dabei betrachtet man reelle Folgen, wobei ein Folgenglied

stets der Summe der vorangegangenen Folgenglieder plus einen nun hinzugefügten Summanden entspricht - unendliche Summen, wenn man so möchte.

91

REIHEN

ZU DEFINITION

DEFINITION 5.83 Sei (an)riEN eine reelle Folge. Wir definieren eine weitere Folge mit den Folgen-

5.83 WI

Vereinfacht ausgedrückt, ist eine Reihe also eine „Summe unendlich vieler Summanden". Wenn aber unendlich viele Werte addiert werden, kann der Wert dieser Summe auch unendlich groß werden und dadurch gar nicht existieren. Bei manchen solcher unendlichen Summen ist ihr Wert, oder sogar die Existenz eines Wertes, unklar. Betrachte zum Beispiel

gliedern An =

für alle n E N, welche wir Reihe und deren Glieder wir Partialsummen nennen. Wenn die Folge (An ),,EN gegen eine Zahl S E R konvergiert, schreiben wir 00

Eak = n—>ce lim An = S

1— 1 + 1 — 1 + 1 +...=? 1+ z + s + ä + s +...=?

Bei solchen „unendlichen Summen" müssen wir also tatsächlich Grenzwerte betrachten, wie wir sie bereits von Folgen kennen.

ak, k=-0

k=0

und nennen S den Grenzwert der Reihe. Man sagt dann auch, dass die Reihe konvergiert. Nicht konvergente Reihen heißen divergent. Man verwendet auch die Schreibweise Ec° k=0 ak, um die Reihe zu bezeichnen. r BEMERKUNG 5.84 Ähnlich wie bei Folgen darf der Startpunkt der Summe (also der Index, bei dem die Summe startet) frei gewählt werden. Die Reihe muss nicht zwangsläufig bei k = 0 beginnen, sondern kann bei jeder ganzen Zahl m E Z beginnen. Dann muss bei Indizes größer 0 entsprechend die Indexmenge der Folge angepasst werden: Analog zu obiger Definition definiert man dann E "k_,,, ak . r BEMERKUNG 5.85 Aus jeder reellen Folge kann man eine Reihe basteln - man kann sogar jede Folge als Reihe schreiben. Dazu addiert man die Differenz von zwei aufeinander folgenden Folgengliedern. Sei (an )nEN für alle n E N>i ist. Jede Reihe ist eine Folge, dann ist an = bn, wobei bo = ao und b„ = an — somit eine Folge und jede Folge lässt sich als Reihe schreiben.

r BEMERKUNG 5.86 Ändert man in einer Reihe (nur) endlich viele Summanden, so ändert sich das Konvergenz-verhalten (Konvergenz oder Divergenz) nicht, jedoch möglicherweise der Grenzwert. Natürlich kann sich hierdurch der Wert der Reihe ändern (falls die Reihe konvergiert, d.h. falls sie „überhaupt einen Wert hat"). Gleiches gilt für das Weglassen oder Hinzufügen von endlich vielen Summanden.

BEISPIEL 5.87 Ein erstes naives Beispiel ist die Reihe, welche über die Nullfolge (an)reepi, also an = 0 für alle n E N, gebildet wird. Dann sind die Partialsummen Ay, =

E ak = E 0 = 0 k=0

k=0

für alle n E N gleich Null. Die Folge der Partialsummen ist also selbst eine Nullfolge. Offensichtlich konvergiert diese Reihe gegen 0.

92

REIHEN II

BEISPIEL

5.88 Betrachte die Folge (an)nelea mit an = 2 . Dann sind die Partialsummen =

1

n 1 1 1 1 1 1 1 2 =2— E ak = E = + — 2 + — 4 + —8 + 178- + + T, k=0

,

k=0

wie man leicht über eine vollständige Induktion beweist, oder sich an der Skizze der Abbildung 5.13 klarmacht. Dann ist der Grenzwert dieser Reihe

c

= lim= lim 2 — — = 2. E— n—>co n—>co 2k 2n

k=0 E

BEISPIEL

5.89 Wir betrachten zunächst die Reihe Ecc 2

(k-1)•k

und behaupten, dass

CO 11 k= 2

1

1

1 =1

(k — 1) • k = 2 6 12 20

1 32

gilt. Diese Reihe ist also konvergent. Das sieht man folgendermaßen ein. Zunächst macht man sich klar, dass gilt 1

k (k — 1) • k

k—k+1 (k — 1) • k

(k — 1) • k

k—1 (k — 1) • k

1 k—1

ABBILDUNG

1 k.

Also kann man die Partialsummen berechnen. Es ist für n E N>2 1

An = k=2

(k — 1) • k

n k—k+1 2—• (k — 1) • k k=2

1

1

1

1

1

1

2

2

3

3

k=2

=

1

1

k=3

1

1

1

-- +...+ 4 n

k=4

1

1

1

1 —

1

75

k=n

1

+ ... + n — 1 + + 1 1 2 2 II 3 3 , 4 =0 =0 =0

5.13

Skizze zur Größe der Partialsummen der Reihe aus Beispiel 5.88. Die Summanden der Reihe summieren sich zu 2, allerdings erst im Grenzübergang. Für jede Partialsumme, An, fehlt noch genau ein Kreisausschnitt mit des gesamten Kreises zu zwei Kreisen.

1 1 = 1 ——. n n

Wir berechnen also den Grenzwert der Reihe als oo

1

k=2 (k — 1)k

=

n—>co

(E k=2

1

(k — 1)k

=

n—>oo

=

1

n—>oo

(1 — — ) = 1. n

L

BEISPIEL

5.90 Die Reihe über der Folge (an)nEN mit an = n für alle n E N ist divergent. Es ist also 00

E k= 0 + 1 + 2 + 3 + 4 + 5 + = oo, k=0

denn die Folge der Partialsummen 0,1,3,6,10,15, ... ist divergent. Genauer gilt nach dem kleinen Gauß, dass die Summe der ersten n (von 0 verschiedenen) natürlichen Zahlen E k = n (ri + 2 k=o

93

II REIHEN

ist. Somit erhalten wir 00

n • (n+1) E k =n—Yoo lim An = liM = 00. n—Yoo 2

k=0 L

BEISPIEL 5.91 Die Reihe über die alternierende Folge (an).EN mit an = (-1)n für allen E N ist divergent. Es hat also CC

E(-1.)" = 1 — 1 + 1 — 1 k=0

keinen Grenzwert, denn die Folge der Partialsummen 1,0,1,0,1, ... hat zwei Häufungspunkte (nämlich 1 und 0). Hier lässt sich der Grenzwert der Reihe nicht bestimmen. L

J

5.3.1 Einige wichtige Reihen

Die folgenden Reihen sind in der Mathematik und in vielen ihrer Anwendungen wichtig. Sie werden über Folgen gebildet, deren Bildungsgesetze jeweils ein statistisches Lagemaß zu Grunde liegt. Dabei wird der Nachfolger zweier Folgenglieder als deren geometrisches, arithmetisches und harmonisches Mittel berechnet. ZU DEFINITION

5.92 iä

Die geometrischen Reihen

Die geometrische Reihe lässt sich leicht auf Konvergenz hin untersuchen. Damit ist sie eine geeignetes Werkzeug um andere Reihen auf Konvergenz hin zu untersuchen, indem man sie mit der geometrischen Reihe vergleicht, also nach unten oder oben abschätzt.

5.92 Eine reelle Folge (an)„EN mit an = qn für ein q e IR und alle n e N bezeichnen wir als geometrische Folge. DEFINITION

Die Bezeichnung "geometrische Folge" folgt der Bezeichnung des geometrischen Mittels. Jedes Folgenglied einer geometrischen Folge entspricht dem geometrischen Mittel seines Vorgängers und seines Nachfolgers. Das geometrische Mittel zweier Zahlen x und y liefert die Seitenlänge eines Quadrates, welches den gleichen Flächeninhalt wie das Rechteck mit den Seitenlängen x und y hat. Tatsächlich gilt a„ •

94

= 9' • 9'1-2 = q2'+2 = (q11-12 = a 2 1 .

00

Die Reihe über einer geometrischen Folge, also eine Reihe der Form

E

qk ,

wird als geometrische

k=0

Reihe zum Parameter q bezeichnet.

BEISPIEL

L

5.93 Es ist die Reihe aus Beispiel 5.88 eine geometrische Reihe. Sie ist von der Form

mit dem Parameter q = 2 .

E öc>

k=-0

k

— 2

REIHEN •

eine geometrische Reihe konvergiert, als auch eine Formel für die Partialsummen und bei Konvergenz den Wert explizit angeben.

Die geometrische Reihe aus Beispiel 5.93 konvergiert, wie wir in Beispiel 5.88 gesehen haben. Man kann sowohl entscheiden, für welche Parameter

LEMMA

5.94 Sei q

E

R. Die Partialsummen der geometrischen Reihe zum Parameter q lauten

2_,

k

k=0

=

1 — qn-1-1

für alle n E N.

1_q

00

Für —1 < q < 1 konvergiert die geometrische Reihe und es gilt

E qk = 1 —1 q • k=0

00

Für 1 < q gilt

E qk = 00. k=0

Für q < —1 ist die geometrische Reihe divergent. Beweis. Für die Partialsumme An = Enk=0k gilt

1 • E qk

= 1 +q

+ q2

+ • • • +

qn

k=0

q E qk =



q

q

2

qn

qn+1.

k=0

Man berechnet damit (1 _ q) E qk = 1. E qk k=0

q E qk

= 1_

qn-I-1.

k=0

k=0

Teilen durch 1 — q auf beiden Seiten führt zu

Eq

k

k=0

Für —1 < q < 1 gilt limn_>. qn+1

_ qn-I-1

1—q

= 0 und es folgt

00 1- qm+1 = 1- 0 E qk = n-+co lim 1— q 1—q k—o

1 1—q

.

Für 1 < q divergiert die Reihe offensichtlich bestimmt gegen oo. Für q < —1 werden die Beträge der Partialsummen beliebig groß. Sie alternieren jedoch und divergieren 1111 deshalb nicht bestimmt.

95

111 REIHEN

Die arithmetischen Reihen Arithmetische Folgen wachsen additiv konstant. Das meint, dass die Differenz zweier aufeinanderfolgender Folgenglieder immer gleich einem ZU DEFINITION

festen Wert ist. Der Wert, der addiert werden muss, um von einem Folgenglied zum nachfolgenden zu gelangen, ist stets gleich.

5.95 MI

Die Bezeichnung „arithmetische Folge" folgt der Bezeichnung des arithmetischen Mittels. Jedes Folgenglied einer arithmetischen Folge entspricht dem arithmetischen Mittel seines Vorgängers und seines Nachfolgers. Das arithmetische Mittel zweier Zahlen x und y entspricht ihrem Durchschnitt 2 • (x + y). Tatsächlich gilt

DEFINITION 5.95 Eine reelle Folge (an)n EN mit a n = ao n • d für ein ao E 118 und d E IR und alle rt E N>L, bezeichnen wir als arithmetische Folge. Eine über einer arithmetischen Folge gebildete Reihe wird als arithmetische Reihe bezeichnet. 7

BEISPIEL 5.96 Die Reihe

1•

(a,,, + a,•,+2) 1 = — (no + n • d + no +(n+ 2) • d) 2• = ao (rt + 1) • d =

Zwei Folgenglieder einer arithmetischen Reihe unterscheiden sich im Übrigen genau um d.

E 2 + k • 3 ist eine arithmetische Reihe. k=0

Die arithmetische Reihe aus Beispiel 5.96 diver- für die Partialsummen einer arithmetischen Reihe giert bestimmt gegen oo. Man kann eine Formel angeben.

II LEMMA

5.97 Die Partialsummen der arithmetischen Reihe sind für eine arithmetische Folge

(an)nEfi n

ak =(n+ 1 ) • a0 k=- 0

d

n(n + 1) 2

Beweis. Man rechnet schlicht nach Eak=Eao-Fk•d=Eao+Ek•d=(n-1-1)•ao+a•Ek=(n+1)•ao+d k=0

k=0

k=0

k=0

k=0

n•(n+1) 2

wobei die letzte Gleichung die als der „kleine Gauß" bekannte Summenformel 1+2+3+...+n = n.( 2+1) verwendet, welche eine Formel für die Summe der natürlichen Zahlen von 1 bis n ist. ■ Die harmonische Reihe Die harmonische Reihe taucht vermehrt in der Kombinatorik und in vielen technischen Anwendungen auf. Sie summiert die Kehrwerte der natürlichen Zahlen. Eine nette Anschauung liefert

96

der Bau eines „schiefen" Turms mit Bauklötzen. Dabei wird angenommen, dass die Bauklötze alle gleich lang, breit, hoch und schwer sind. Legt man die Bauklötze flach auf den Tisch und fängt an sie

REIHEN •

zu stapeln, indem man die Bauklötze nicht mittig aufeinander türmt, sondern die oberen Bauklötze stets über die Kante des unteren Bauklötzchens schiebt, darf man den obersten Stein bis zur Hälfte über die Kante schieben. Schiebt man ihn weiter, fällt der Turm. Nimmt man nun diesen Turm und hebt ihn auf ein weiteres Klötzchen, darf der untere Stein des (Zweier-)Turms nur höchstens ein

Drittel über den neuen unteren Stein hinausragen, damit er stehen bleibt. Das Prinzip setzt sich so fort: die unteren Steine dürfen nur ein Viertel, ein Fünftel, ein Sechstel, und so weiter hinausragen. Insgesamt hat der Turm mit n Steinen so eine Breite von i + 2 + s + + Siehe Abbildung 14. ABBILDUNG 5.14

5.98 Die reelle Folge (an ),,,EN mit ar, = ,+ für alle n E N>1, wird als harmonische Folge bezeichnet. DEFINITION

Die harmonische Reihe wird über die harmonische Folge gebildet.

II LEMMA 5.99 Die harmonische Reihe divergiert bestimmt gegen oo.

Beweis. Wir zeigen, dass die harmonische Reihe konvergiert, indem wir ihre Partialsummen nach unten abschätzen. Es ist für n E N 2". x--.1 1 1 1 1 1 1 1

2 -•17 k=1

= i +± ä +7 4 +++. 7 -Erä ±•••F

=

1 1 1 1 1 1 1 1 + — + — +— +— +— +— +— +•••+ 1 2 3 4 5 6 7 8

1 2n-1 + 1

1 +•••+— 2.

>*+.•.+2r

1 1 1 1 1 1 1 1 1 1 ? i ± 2 ±74 +7 4 + g ± g + g ± g ±•••±271 +•••+ F _1 —2 1

1

= i + i2 +

1

_1 —2 1

n

2 +•••+ 2 =1+ 2* n Stück

Für beliebige Partialsummen der harmonischen Reihe gilt dann

n

2 llos2 (n)i

k=1

k=1

E > E > + k

2 Liog2(n)i 2

Das heißt, die Folge der Partialsummen ist durch eine Folge nach unten beschränkt, die bestimmt gegen oo divergiert. Also divergiert die harmonische Reihe ebenfalls bestimmt gegen oo. ■

Die Illustration der harmonischen Reihe anhand von Türmen mit Bauklötzen der Höhe zwei und sechs. Diese Türme sind so gestapelt, dass sie "gerade nicht umstürzen". Würde man einen der aufgestapelten Steine weiter nach rechts schieben, würde der Turm einfallen. Man beachte, dass sich der Türm aus zwei Bauklötzen an der Spitze des Turms mit sechs Bauklötzen wiederfindet. Die Breite dieser Türme entspricht dem Wert der harmonischen Reihe, hier für n = 2 und n = 6 illustriert. Ein erstaunliches Ergebnis der Konvergenzuntersuchung dieser Reihe ergib: Diese Türme können beliebig breit werden - ohne umzustürzen (wenn beliebig viele Bauklötze zur Verfügung stehen).

lb ZU DEFINITION 5.98 Die Bezeichnung "harmonische Folge" folgt der Bezeichnung des harmonischen Mittels. Jedes Folgenglied einer harmonischen Folge entspricht dem harmonischen Mittel seines Vorgängers und seines Nachfolgers. Das harmonische Mittel zweier Zahlen x und y entspricht e- . Es berechnet die durchschnittliche Geschwindigkeit, wenn man zunächst eine gewisse Zeit mit Geschwindigkeit x und dann die gleiche Zeit mit Geschwindigkeit y fährt. Tatsächlich gilt 2 • a„ • a„+2 = 2 • n • „.+.2 _ an + an+2 ,42

n2Z22)

1

n+ 1

=

97



GRENZVERHALTEN VON REIHEN

ZUSAMMENFASSUNG

Eine Reihe ist eine Folge, deren Folgenglieder endlichen Summen entsprechen. Genauer ist nach Definition 5.83 für eine reelle Folge (an),,EN eine weitere Folge mit den Folgengliedern An = E ak, k=0

für alle n E N definiert, welche man als Reihe und deren Glieder man als Partialsummen bezeichnet. Wenn die Folge (An)nEN gegen eine Zahl S E R konvergiert, schreibt man 00

E ak = n->W lim An = S k=0

und nennt S den Grenzwert der Reihe. Man sagt dann auch, dass die Reihe konvergiert. Nicht konvergente Reihen heißen divergent. Man verwendet auch die Schreibweise EZto ak, um die Reihe zu bezeichnen. Als wichtige Familien von Reihen seien die geometrischen, die arithmetischen und die harmonischen Reihen genannt. Nach Definition 5.92 ist eine geometrische Reihe stets von der Form Ek=0,.. qk für ein q E R. Lemma 5.94 benennt die Partialsummen der

geometrischen Reihe zum Parameter q mit qn+1

E qk k=0

_q



Für —1 < q < 1 konvergiert die geometrische Rei1 he und es gilt E qk = . Für 1 < q gilt 1 — q k=o

E qk = 00. Für q < —1 ist die geometrische Reihe k=o divergent. Nach Definition 5.95 heißt eine reelle Folge (an )„EN mit an = ao n • d für ein ao E R und d E R und alle n E N>1, arithmetische Folge. Eine über einer arithmetischen Folge gebildete Reihe wird als arithmetische Reihe bezeichnet. Nach Lemma 5.97 sind die Partialsummen der arithmetischen Reihe für eine arithmetische Folge (a7,)„EN

E ak = (n 1)ao k=0

d

n(n 1) 2

Nach Definition 5.98 ist eine reelle Folge (an )„EN mit an = 7 für alle n E N>1 eine harmonische Folge. Die harmonische Reihe wird über die harmonische Folge gebildet. Nach Lemma 5.99 divergiert die harmonische Reihe bestimmt gegen co.

5.4 Grenzverhalten von Reihen

Wir werden nun einige Kriterien, sogenannte Konvergenzkriterien, kennen lernen, um die Konvergenz von Reihen nachzuweisen. Sie lassen sich in der Regel auf Reihen anwenden, die bestimmte Voraussetzungen erfüllen. Das universelle Werkzeug zum Nachweis der Konvergenz von Reihen gibt es nicht. Man erhält viel mehr eine Menge

98

von „Spezialwerkzeugen", die allerdings auch nur für spezielle Fälle anzuwenden sind. Möchte man Reihen auf Konvergenz hin untersuchen, besteht der erste Schritt darin herauszufinden, welches Konvergenzkriterium sich bei der vorliegenden Reihe anwenden lässt.

GRENZVERHALTEN VON REIHEN

5.4.1 Notwendige Konvergenzbedingung

Konvergiert eine Reihe, dann lässt sich mit Sicher- Folge der Summanden eine Nullfolge ist. Ist dies heit sagen, dass die Folge der Summanden eine nicht der Fall, kann mit Sicherheit ausgeschlossen Nullfolge ist. Es ist also für die Konvergenz ei- werden, dass die Reihe konvergiert. ner Reihe eine notwendige Bedingung, dass die

El

LEMMA

5.100 Konvergiert die Reihe Er_o ak, dann ist (an)nEN eine Nullfolge.

Beweis. Angenommen, es gibt eine konvergente Reihe Er—o ak, so dass die Folge der Summanden (an)n E N keine Nullfolge ist. Dann gibt es ein 8 > 0 für welches es kein Na E N gibt, so dass Ian — 01 < für alle n > Nb. Es gibt also unendlich viele Folgenglieder, mit lan — 01 = lan1 > 6. Es sei (arninEN die Teilfolge von (an )nEN dieser Folgenglieder, mit lani„ — 01 > 8 für alle n E N. Da die Reihe Ek"_0 ak konvergiert, ist die Folge der Partialsummen eine Cauchyfolge. Also gibt es für jedes s > 0 ein Are E N, so dass IAn -Am l
N.

(5.3)

Wähle nun E. = ö und ein n' E N, so dass mn, > N. Dann gilt Amn, =

und

'Aran, —

= arn n, I

(5

mit mn,, mn, — 1 > Nb - ein Widerspruch zu (5.3). Also gibt es keine konvergente Reihe Ek 0 ak, deren Folge von Summanden (an)nEN keine Nullfolge ist. ■ r

1

BEMERKUNG

5.101 Die Umkehrung von Lemma 5.100 gilt nicht allgemein. Betrachte dazu die harmonische

Reihe. Sie konvergiert nicht, obwohl die Folge der Summanden eine Nullfolge darstellt.

5.4.2 Absolute Konvergenz

Bei der absoluten Konvergenz summiert man statt giert. Man steht dann allerdings immer noch vor den Summanden, den Absolutbetrag der Sum- dem Problem absolute Konvergenz nachzuweisen, manden. Man schlussfolgert dann, dass eine ab- wenn man Konvergenz nachweisen möchte. solut konvergente Reihe ebenfalls stets konver-

99



GRENZVERHALTEN VON REIHEN

ZU DEFINITION 5.102 Ed

Diese Eigenschaft als „absolut konvergent" zu bezeichnen ergibt Sinn, denn die Reihe 1 Iak 1 summiert die Absolutbeträge der Folgenglieder auf, vergisst also etwaige Vorzeichen.

DEFINITION 5.102 Eine Reihe Er ak heißt absolut konvergent, wenn die Reihe Er-1 I akl konvergiert. Konvergiert eine Reihe absolut, dann sicherlich auch ohne die Beträge. II

PROPOSITION 5.103 (ABSOLUTE KONVERGENZ) Eine absolut konvergente Reihe konvergiert.

Beweis. Sei An = Elen=0 ak und Bn = Ekn=0 lak I. Für n,m E N mit n < m gilt

E

k=-n+1

ak

< E

lak I -= IBm — Brd.

(5.4)

k=n+1

Diese Ungleichung folgt aus der Dreiecksungleichung des Absolutbetrags. Es gilt nämlich I + c2 I < I ci + 1c21 und allgemein In° c < Eis=0 Ie.,' für s E N und reelle Zahlen c1, , cs E R. Wenn die Reihe Ekn=0 lak I konvergiert, konvergiert die Folge der Partialsummen (Bn)neN und ist nach Proposition 5.82 eine Cauchyfolge. Wenn aber die Folge (Bn)neN eine Cauchyfolge ist, trifft dies mit ■ (5.4) auch auf (iln )„EN zu, und die Reihe Enk=O ak konvergiertebenfalls. r

5.104 Die Umkehrung von Proposition 5.103 ist übrigens nicht wahr. Die alternierende Reihe ° ( — 1 ) k • nist konvergent - die harmonische Reihe Er_i njedoch nicht.

BEMERKUNG

111 KOROLLAR 5.105 Die Reihe Ek"0 ak konvergiert, wenn es eine reelle Zahl 0 < q < 1 gibt, so dass lakl < q"-1 für alle k e N. Beweis. Folgt aus Proposition 5.103 und Lemma 5.94, denn Er," o la„ I konvergiert, weil En°°_ i lan g < _ En" qn-1 und En"_

5.4.3 Das Majorantenkriterium Ist eine Folge (an)nEN nicht negativ, jedes Folgen- die Reihe über (b„),,EN, dann auch die Reihe über glied durch ein Folgenglied einer anderen Folge (an)nEN• (bn)„EN nach oben beschränkt und konvergiert

100

GRENZVERHALTEN VON REIHEN

Es sei Er 0 bk = b eine konvergente Reihe mit Grenzwert b E IR. Gilt für eine Folge (an)neN die Abschätzung 0 < an < bn für alle n E N, so ist die Reihe über der Folge (an ),,EN konvergent und es gilt LEMMA 5.106 (MAJORANTENKRITERIUM)

0

< E an E bn

b.

k =0

k=0

Beweis. Es seien (an)nEN und (bn)nEN zwei Folgen mit 0 < an < bn. Außerdem sei die Reihe 0 bn. Dann ist die Folge der Partialsummen über (bn )nEN konvergent mit dem Grenzwert b = An = EL, ak sowohl monoton wachsend als auch nach oben beschränkt. Monotonie. Die Summanden entsprechen den Folgengliedern der Folge (a. )n E N, welche nach Voraussetzung größer gleich 0 sind. Es ist offensichtlich n+1

E an = an+1 + > an > An •

An+1 =

k=0 >0 k=0

Beschränktheit. Es gilt an < bn und bn > 0 für alle n E N. Es ist also oo

E bn = b.

An =Ean bn k=0

k=0

k=D

k=n+1

Die Folge (An)nEN ist also monoton wachsend und nach oben beschränkt und konvergiert damit nach • Proposition 5.50.

BEISPIEL 5.107

Die Reihe

E _ ist konvergent, denn die konvergente Reihe 1 =

k=i k2 Beispiel 5.89 lässt sich als Majorante nutzen.

Um dies zu erreichen, müssen wir die Reihe 1 =

oo

(k — 1) • k

aus

E (k — 1) . k um einen ersten Summanden ergänzen, weil

k=2

der Bruch (k-11)4 für k = 1 nicht definiert ist. Wir setzen bn=

1

1 (n-1)•n

falls n = 1 sonst.

Für die Folgen (an )„EDT>2 mit an = 1-2- für alle n E N>1 und (bn)nEN>2 gilt dann 0 < an < bn für alle E N>1, denn es ist ai = 1 < 1 = b1 und

72

an =

1

n•n


2. Es gilt also nach Beispiel 5.89 00

00

00

0 < E ak E bk =1+ E k=1

k=1

k=2

1 (k —1) • k

= 2.

5.4.4 Das Leibnitz-Kriterium

Für Reihen über monotonen Nullfolgen trifft das dend, weil man sich anschaulich gesprochen, Leibnitz-Kriterium eine Aussage bezüglich ihrer die Summe der Differenzen aufeinanderfolgender Konvergenz. Die Monotonie ist dabei entschei- Summanden der Reihe anschaut.

PROPOSMON 5.108 (LEIBNITZ-KRITERIUM) Sei (ari)„EN eine monoton fallende oder wachsende reelle Nullfolge. Dann konvergiert die alternierende Reihe Er1 (-1)k • ak gegen 0.

Beweis. Sei (an),EN o.B.d.A. eine monoton fallende reelle Nullfolge. Damit ist a„, > 0 für alle n E N.

Wir betrachten zwei Teilfolgen von An. Die eine involviert die geraden Indizes, die andere die ungeraden Indizes. Es sei (b,,,)„EN mit bn = A2n für alle n E N die Folge der Partialsummen mit geradem Index und (en )neN mit an = A2n+1 für alle n E N die Folge der Partialsummen mit ungeradem Index. Es gilt bn+1 =

bn

(-1)2n+1 • a2.+1 + (-1)2n+2 • a2n +2 = bn — a2n+1 a2n+2 < bn,

für alle n E N. Dabei folgt die letzte Ungleichung aus der Monotonie von (an )nE N - es ist a2n+1 >— a2n+2 und damit —a2ri+1 + 122,2+2 > 0. Außerdem ist für alle n E N bn

= azn +

Ea2j — azi+1 > a2n > 0. .i=0

Also ist (bn )„EN eine monoton fallende durch 0 nach unten beschränkte Folge. Nach dem Satz von Bolzano-Weierstraß konvergiert (bn).EN demnach. Analog gilt Cn+1 =

102

erb

1)2 )2n+3 -1 (-1)2n+2 • C2n+3 ((_ • a2n+2 =

Cn

a2n+2 a2n-I-3 > bn,

GRENZVERHALTEN VON REIHEN •

für alle n E N. Dabei folgt die letzte Ungleichung aus der Monotonie von (4nerq• Es ist a2n+2 > a2n+3 und damit a20+2 a2n+3 < 0. Außerdem ist für alle n E N Cn = a2n

E

a2i+2 < a2n < 0.

—a2j+1

j =0

Also ist (cn).E N eine monoton wachsende durch 0 nach oben beschränkte Folge. Nach dem Satz von Bolzano-Weierstraß konvergiert (cn )„EN demnach. Also konvergiert auch die Reihe mit 00

E(-1)k • ak = lim

lim en .

n—Too

k=1

n—Tco

r BEMERKUNG 5.109 Über den Grenzwert der Reihe trifft das Leibnitz-Kriterium keine Aussage. Man kann jedoch zeigen, dass für die Folgen (bn)nEN und (c„).„EN aus dem Beweis zu Proposition 5.108 gilt

hm bn = hm

n—Too

Dazu stellt man fest, dass en

n—Too

en .

= bn + a2.+1 ist und erhält

hm cn = hm (bn + a2n+1) = lim bn lim a2n+1 = hm bn + 0 = lim bn.

n--Too

n-> 00

n—Too

n—Too

L

n—Too

n—Yoo

_J

5.4.5 Wurzelkriterium

In manchen Anwendungen ist das Wurzelkriteri- genglied der k-ten Wurzel des Betrags des k-ten um hilfreich. Dabei bastelt man aus dem Sum- Summanden entspricht. Ist der Limes superior diemanden der Reihe eine Folge, wobei das k-te Fol- ser Folge kleiner 1, konvergiert die Reihe.

SATZ 5.1 1 0

Sei Er0 ak eine Reihe. Ist lim up

absolut. Gilt lim sup

k

Iak >

/

< 1, dann konvergiert die Reihe Er_0 ak

1, dann divergiert die Reihe.

k—>co

103

GRENZVERHALTEN VON REIHEN

Beweis. Es sei s = lim sup -1 Vlak I
0, so dass s + E < 1. Da s der Limes superior der Folge mit den Folgengliedern 1 < s + E für alle k > Ne. VV, ist, gibt es ein N, E N, so dass . Ne und demnach jakl < (s + E)k für alle k > N. Also gilt N,-1

oo

N,-1

co

Elaki = E iakl+ Elakl k=0

k=0


1 bzw. I ak I > 1 für unendlich viele k E N, kann die ■

Reihe nicht nach oben beschränkt sein und divergiert demnach.

5.4.6 Quotientenkriterium Das Quotientenkriterium fußt auf dem schon be- Reihe und verwendet eine solche in Anwendung kannten Konvergenzverhalten der geometrischen des Majorantenkriteriums.

MI SATZ 5.111 Sei Ecc

eine Reihe, wobei ak 0 für alle k E N. Ist lim supk dann konvergiert die Reihe Er 0 ak absolut. k=0 ak

ak ak+1


0, so dass s + e < 1. Da s der Limes superior der Folge mit den Folgengliedern ak+1 ist, gibt es ein N, E N, so dass ak+1 < S E für alle k > Ne. ak ak Also gilt Iak+11 =

104

ah+1 ak

lak+11- ( s + 6)

GRENZVERHALTEN VON REIHEN

für alle k > N, und demnach laN,±t 1 < Iarr 1 • ( s e)t für t E N. Also gilt N,-1

co

0o

N,-1

N,-1

oo

00

iaki + laN,i • E (8 +6)k-N.. = E 14+ laAj- I • Eiaki = i laki+ Elakl < I

k=0

k=0

k=N,

k=N,

k=0

k=0

e)k.

(s k=0

Es ist EkN'0-1 lak 1 (weil nur endlich viele Summanden) nach oben beschränkt und die Reihe zr 0(s + E)k eine geometrische Reihe mit Parameter s — e < 1, welche konvergiert. Also ist die Folge der Partialsummen der Reihe Er o lak 1 nach oben beschränkt und monoton wachsend. Nach dem Satz von Bolzano Weierstraß konvergiert sie demnach. ■

e

BEISPIEL 5.112 Die Reihe Er 0 konvergiert. Nach dem Quotientenkriterium ist zu prüfen, ob der Limes superior der Folge mit den Folgengliedern aakr echt kleiner 1 ist.

Es gilt ak+1 I ak I

=I

2k+1•k!

= 2

I (k+1)!.2k

k

für alle k E N. Damit konvergiert die Folge 11111 k—>oo

ak+i ak

= liM = 0 k—>00 k

und es ist der Limes superior dieser Folge gleich ihrem Grenzwert. Also konvergiert nach dem Quotientenkriterium die Reihe Er_o L

e



J

ZUSAMMENFASSUNG

Nach Lemma 5.100 ist für eine konvergente Reihe Eicyclo ak die Folge der Summanden (a„)neN eine Nullfolge. Dass also die Folge der Summanden eine Nullfolge ist, wird auch als notwendige Konvergenzbedingung bezeichnet. Bemerkung 5.101 warnt, dass die Umkehrung von Lemma 5.100 nicht allgemein gilt - die harmonische Reihe ist ein Gegenbeispiel.

0 < q < 1 gibt, so dass lak l < qn-1 für alle k E N. Lemma 5.106 formuliert das Majorantenkriterium. Es sei EZI, bk = b eine konvergente Reihe mit Grenzwert b E IR. Gilt für eine Folge (an )„EN die Abschätzung 0 < an < bn für alle n E N, so ist die Reihe über die Folge (an )nEN konvergent und es gilt CO

Eine Reihe Ecktiak heißt nach Definition 5.102 absolut konvergent, wenn die Reihe E,c,°_, lak i konvergiert. Proposition 5.103 macht klar, dass eine absolut konvergente Reihe konvergiert. Bemerkung 5.104 warnt, dass die Umkehrung von Proposition 5.103 nicht allgemein gilt - die harmonische Reihe ist wiederum ein Gegenbeispiel. Nach Korollar 5.105 konvergiert die Reihe Eckx1.0 ak, wenn es eine reelle Zahl

0 JR. Man sagt, dass f (x) für x —> u gegen y konvergiert, falls die folgende Bedingung erfüllt ist. FK. Für alle e E IR mit e > 0 gibt es ein 8, > 0, so dass für alle x E X mit lx —ui < SE gilt f (x)

< e.

In diesem Fall schreibt man auch kurz lim f (x) = y.

ABBILDUNG 6.1 Konvergiert eine Funktion f (x) für x —> u gegen y, lässt sich für jede Umgebung mit Abstand e > 0 um y eine Umgebung mit Abstand SE > 0 um u finden, so dass der Schnitt von „Ss-Schlauch" um u und Funktionsgraph vollständig im „e-Schlauch" um y liegt. In dem linken Diagramm ist dies nicht der Fall, da ist das 8, noch zu groß gewählt. Es ist jedoch, wie in dem rechten Diagramm skizziert, ein ös zu finden, welches die gewünschte Situation herbeiführt. r BEMERKUNG 6.2 Die Schreibweise ähnelt der Notation im Kontext von Grenzwerten von Folgen. Und tatsächlich gibt es eine offensichtliche Analogie. Der Definitionsbereich korrespondiert zu der Indexmenge N von Folgen. Der Bildbereich bzw. die Bilder entsprechen den Folgengliedern. Das y ist der potenzielle Grenzwert. Das 5, entspricht dem N,, also dem Index ab dem Folgenglieder nicht weiter als e vom Grenzwert abweichen - so auch hier: Es ist die Umgebung im Definitionsbereich für welche die zugehörigen Funktionswerte nicht weiter als e von y abweichen. Die Analogie wird in den folgenden Entsprechungen deutlich.

Der Definitionsbereich R hat seine Entsprechung im Indexbereich der Folgen N. Der Grenzwert einer Folge ist das y aus Definition 6.1. Die Funktionswerte f (x) entsprechen den Folgenglieder an . Die e-Umgebung

108

EINE KONVERGENZ FÜR REELLE FUNKTIONEN

um den Grenzwert der Folge entspricht der e-Umgebung um den Grenzwert der Funktionenkonvergenz. Der oo im Kontext von Folgen entspricht der Tendenz x —> u. Man könnte also auch Grenzübergang für n tollkühn behaupten, dass u der Unendlichkeit entspricht. Die obige Definition wird auch als das e-b-Kriterium bezeichnet. Man könnte auch die Aussage von Proposition 6.7 als Definition von Konvergenz verwenden. Dort wird gezeigt, dass man die Konvergenz einer Funktion auch mit „Testfolgen" prüfen kann, die auf der x-Achse gegen u konvergieren. Die Funktion konvergiert genau dann für x —> y gegen y, wenn die Folge der Funktionswerte der Folgenglieder für alle solche Folgen gegen y konvergiert. L

_J

f(4

ABBILDUNG

6.2

Konvergiert eine Funktion f (x) für x -+ u nicht gegen ein y E IR, lässt sich nicht für jede Umgebung mit Abstand e > 0 um y eine Umgebung mit Abstand SE > 0 um u finden, so dass der Schnitt von „& -Schlauch" um u und Funktionsgraph vollständig im „e"-Schlauch um y liegt. In den beiden Diagrammen ist die Situation mal für zwei Werte y' und y" skizziert. Das linke Diagramm macht deutlich, dass man bei einem positiv gewähltem SE niemals die gewünschte Situation vorfindet, dass der Schnitt von „ös -Schlauch" um u und Funktionsgraph vollständig im „e"-Schlauch um y' bzw. y" liegt. Das rechte Diagramm soll deutlich machen, dass diese erst für bs = 0 der Fall wäre, was nicht zulässig ist. Der offensichtliche Grund für das Scheitern liegt natürlich in dem Sprung, den der Graph der Funktion vollzieht.

f(.)

r BEMERKUNG

6.3 Die Eigenschaft FK lässt sich formal schreiben als > 0 : (x) — y < EVX E X, IX — UI
035, E Uk,

L

In Worten heißt die Bedingung FK: Zu jedem reellen positiven Abstand e gibt es einen Abstand Se , so dass für alle Elemente des Definitionsbereichs mit Abstand kleiner bE zu u der Abstand von f (x) zu y kleiner ist als e.

_J

BEISPIEL 6.4 Betrachte die Funktion f : [0,1] —› R mit x 1—> • x. Dann ist X = X = [0,1]. Wähle u und y = 4 .

Die Funktion f (x) konvergiert für x

2 gegen 1. Es sei e > 0 beliebig. Wähle nun Se = e. Es sei x e [0,1] mit



= x—

1 2

< SE e

ABBILDUNG 6.3

Die auf dem Einheitsintervall definierte reelle Abbildung f mit f (x) = z • x aus Beispiel 6.4 konvergiert für x —> 2 gegen . Egal wie klein man e > 0 wählt, 5, = E ist eine gute Wahl um die Konvergenzbedingung FK zu erfüllen.

109

EINE KONVERGENZ FÜR REELLE FUNKTIONEN

beliebig gewählt. Dann gibt es ein xo mit lx01 < e, so dass x = ä+ xo. Deshalb berechnen wir

1 1 If(x) - YI = —2 « x — —4

f(.)

1

(1

\



1

x°)

1 2 • xo

< E.

Also konvergiert f (x) für x —> 2 gegen 1. Betrachte Abbildung 6.3. L

J

6.5 Betrachte die Funktion f : R \ {4} -+ JR mit x 1—> Funktion konvergiert nicht für x 4. BEISPIEL

Die Funktion f : JR \ {4} —> JR mit f (x)

A. Dann ist X = \ {4} = R. Die

1

A konvergiert für x —> 4 nicht.

Es sei e = 1. Dann gilt für alle x E (3, 4)

f (x) < f (4 — —1 ) = — = —1 E

E

f (x) > f (4 + 1 ) =

ABBILDUNG 6.4

E

=1

für alle x E (4, 5)

Es gibt nun für jedes 8 > 0 zwei reelle Zahlen x_ und x+, so dass x —1 < x_ < 4 < x+ < x +1 und x —5 < x_ < 4 < x+ < x + B. Aus der ersten Ungleichung folgt

as•

f(x_) < f(3) und f (x+) > 1.

Die auf ganz IR ohne 4 definierte reelle Abbildung f mit f (x) = A aus Beispiel 6.5 konvergiert für x —› 4 nicht. Wählt man e = 1, ist es unmöglich ein .31 > 0 zu finden, um die Konvergenzbedingung FK zu erfüllen.

Demnach gibt es kein y E R, so dass sowohl f (x _) E (f (y)— 1, f (y) +1) als auch f (x+) E (f (y)-1, f (y)+1), weil das offene Intervall (f (y) — 1, f (y) + 1) kleiner 2 und der Abstand von f (x_) und f (x+) größer 2 ist. Also konvergiert f (x) für x

4 nicht. Siehe Abbildung 6.4. _J 1

BEISPIEL 6.6 Betrachte die Funktion f : R —> R mit

f(.)

x 1—>

—1 falls x < 0 1 sonst. {

Dann ist X \ {±oo} = IIF \ {±oo} = R. Die Funktion konvergiert für alle u E R \ {0} für x —> u gegen f (u) und nicht für x -4 0. Fall 1 (u E \ {0}): Dann ist lu — 01 < 6 für ein 8 > 0. Folglich ist f (u) = f (x) für alle x E JR mit Ix — ul < 5. Wir können also für alle e > 0 dieses 6 verwenden und es ist I f (x) — f(u)1 = 0 0, so dass 1f (x) — yl < äfür alle Ix — 01 < B. Angenommen, es gibt ein y E JR, so dass es für E = ein 5 > 0 gibt, mit 1f (x) — y1 < 2für alle Ix — 01 < 5. Dann gibt es in jeder noch so kleinen Umgebung um die 0 positive und negative Zahlen. Die Zahlen x_ = — ä und x+ = ä tuns - dann ist nämlich f (x_) = —1 und f (x+) = 1 und somit

6.5

Die auf ganz 1k definierte reelle Abbildung f aus Beispiel 6.5, welche —1 für alle negativen und alle anderen Zahlen 1 ist, konvergiert für x —> u, falls u < 0 gegen —1 und falls u > 0 ist gegen 1. Wählt man e > 0 beliebig, tut es ein SE > 0, welches kleiner als der Betrag von u ist, um die Konvergenzbedingung FK zu erfüllen.

für alle x E R mit Ix — ul < 8.

2 = If(x+)

L

f(x-)1= If(x+) -

- ein Widerspruch. Siehe Abbildung 6.6.

— f(x—)1

5 If(x+)- yl + If(x-)- YI < 2 + 2 = 1

EINE KONVERGENZ FÜR REELLE FUNKTIONEN •

Die in Bemerkung 6.2 hervorgehobene Ähnlichkeit der Konvergenz von reellen Funktionen und reeller Folgen wird in der folgenden Proposition 6.7

noch deutlicher. Man kann mit Hilfe von Folgen, die gegen u konvergieren, prüfen, ob eine Funktion für x —› u gegen eine reelle Zahl y konvergiert.

PROPOSITION 6.7 Seien y E R, X c R, u E X \ {±oo} und f : X —› R. Es konvergiert f (x) genau dann für x —> u gegen y, wenn für alle Folgen (an)neN über X mit lim an = u gilt n—>oo

lim f (an) = y. n—>oo IZ

Beweis. Es sind zwei Richtungen der Äquivalenz zu zeigen. >" I>

Es konvergiere f (x) für x —› u gegen ein y E IR. Außerdem sei (an )neN eine Folge über X mit Grenzwert u. Es ist zu zeigen, dass die Folge (bn)nEN mit b„ = f (an) für alle n E N gegen y konvergiert. Sei e > 0 beliebig gewählt. Dann gibt es ein 6 > 0, so dass 1f (x) — y1 < e für alle x E X mit — < 6. Da (an)„EN gegen u konvergiert, gibt es ein Ns E N, so dass lan — uI < 6 für alle n > Na. Also ist Ibn — YI = Igan) — y1 < e für alle n > Ns. Also konvergiert (bn)nen gegen y, was zu zeigen war.


0.

6.14 Sei f : JR --> JR mit x 1-->

{1 fürxElEt \12 0 für x E Q.

113

U EINE KONVERGENZ FOR

REELLE FUNKTIONEN

Diese Funktion konvergiert an keiner Stelle. Wähle dazu ein u E IR beliebig, aber fest. Für eine Folge (12.).EN rationaler Zahlen, die von links gegen u konvergiert, ist die Folge der Funktionswerte ( f (an )),,EN konstant 0. Ihr Grenzwert ist also 0. Für eine Folge (bn )„EN irrationaler Zahlen, die von rechts gegen u konvergiert, ist die Folge der Funktionswerte (f (bn )),,EN konstant 1. Ihr Grenzwert ist also 1. Demnach konvergiert f (x) nicht für x gegen u.

6.1.1 Die Konvergenz ist mit der Verknüpfung von Funktionen verträglich Hat man zwei Funktionen in der Hand, für wel- Funktionen auch diese Eigenschaft haben. Die beiche die eingeführte Konvergenz von Funktionen den folgenden Propositionen geben eine positive vorliegt, stellt sich die Frage, ob die verknüpften Antwort auf diese Frage.

PROPOSMON 6.15 Sei

X C IR. Seien f, g : X und lim g(x) = z, dann auch x->u lim f (x) + g(x) = y + z

und

Funktionen und u E IR. Gilt lim f (x) = y x-u

lim f (x) • g(x) = y • z. x-).0

Beweis. Zu E > 0 sei 8 > 0 so, dass I f (x) - y1 < e und Ig(x) - z1 < E, für alle x E X mit - ul < 8. Dann gilt für solche x 1(f + 9) (x) - (y + z)1 < If (x) - y I

I9(x) - < 2e.

Daraus folgt die erste Behauptung. Um die zweite Behauptung zu zeigen, bemerken wir, dass 1(f • g)(x) - y • z1 = 1(1 (x) - y) • g(x) y • (g(x) - 9(u))1

19(x)1 11(x) - YI +

19(x) - zl• (6.1)

Wir wählen also 8 > 0 klein genug, so dass für alle x mit Ix - uI < S gilt 19(x)15-1z1 + 1 ,

if(x) - Yl
R Funktionen. Sind

KONVERGENZ MEHRDIMENSIONALER FUNKTIONEN •

u E X, v E Y, z E IR so, dass hm f (x) = v und firn h(y) = z, dann gilt lim h o f (x) = z. y—>v

x—>u

Beweis. Zu jedem E > 0 existiert ein (5 > 0, so dass für alle y E Y mit lv — yi < 5 gilt Ih(y) — zI < E. Ferner gibt es ein -y > 0, so dass für alle x e X mit Ix — uI < 7 gilt f (x) — vl < 5. Für diese x gilt also Ih(f(x)) — zi < E. •

6.2 Konvergenz mehrdimensionaler reeller Funktionen ZU DEFINITION 6.17

Das Konzept der Konvergenz reeller Funktionen kann auf mehrdimensionale reelle Funktionen übertragen werden. Solche mehrdimensionalen Funktionen bilden aus einem Rn in einen IR' ab. Dabei definiert man die Bilder einträgeweise. In jedem Eintrag des Bildvektors hat man dabei eine

Abbildung vom R' in die reellen Zahlen. Auf solche Funktionen konzentrieren wir uns nun. Wir verallgemeinern Definition 6.1 der Konvergenz von Funktionen auf mehrdimensionale Funktionen.

.f(-

1L

.1 ABBILDUNG 6.8

Der Konvergenzbegriff einer Funktion im mehrdimensionalen ähnelt dem im eindimensionalen Fall. Eine Funktion f (x) konvergiert für x —> u gegen y E ig, wenn man für jeden Abstand e einen Abstand be finden kann, so dass die Funktionswerte für alle x-Werte mit Abstand kleiner SE zu u kleineren Abstand als e zu y haben. Anders formuliert: Man muss für die „e-Platte" um y einen „&-Schlauch" um u finden, so dass der Schnitt von Schlauch und Funktionsgraph vollständig in der Platte liegt.

DEFINITION 6.17

gegeben.

Seien y E Et, X c 118n, u E X, eine Norm 11 • II : lir —> IR und f : X —>

Die Definition 6.17 ist in ihrer Interpretation des eindimensionalen Falls, nämlich Definition 6.1, sehr ähnlich. Siehe deshalb die Erläuterung zu Definition 6.1. In der Abbildung 6.8 ist zu sehen, dass die intuitiven „e- und 5-Schläuche" nun vielleicht wirkliche Schläuche bzw. „Platten" sind. Die Interpretation lässt sich deshalb leicht übertragen. Man wählt zunächst einen Abstand e > 0 in der Hoffnung ein 6E > 0 zu finden, so dass alle Funktionswerte von Urbildern die höchstens Abstand bE zu u haben auch höchstens Abstand e zu y haben. Da die Urbilder im R' „leben", benötigen wir dort den Abstandsbegriff mehrdimensionaler reeller Vektorräume. Wir wählen dazu die euklidische Norm. Die Menge aller Punkte, die im IV Abstand höchstens bE zu u haben, liegen in einer Kugel (die Verallgemeinerung des Kreises) um u. Die Bilder sind eindimensional, dort haben wir im Prinzip einen eindimensionalen Kreis, ein Intervall. Ein Unterschied zwischen Definition 6.1 und 6.17 besteht darin, dass u im eindimensionalen Fall aus dem Abschluss von X gewählt werden darf. Im mehrdimensionalen Fall müssten man zunächst definieren, was der Abschluss einer Menge von n-dimensionalen Spaltenvektoren ist. Im Kontext von Folgen haben wir das nur für reelle Zahlen definiert. Tatsächlich ist eine Verallgemeinerung leicht möglich. Aus Gründen der besseren Lesbarkeit haben wir in der Darstellung des Themas darauf verzichtet und müssen uns deshalb hier einschränken. Grundsätzlich ist eine Variante mit dem Abschluss im Mehrdimensionalen aber denkbar.

115

KONVERGENZ MEHRDIMENSIONALER FUNKTIONEN

Man sagt, dass f (x) für x

u gegen y konvergiert, falls die folgende Bedingung erfüllt ist.

FK. Für alle e E 1R mit E > 0 gibt es ein (5e > 0, so dass für alle x E X mit

< (5 gilt

if (x)

< e.

In diesem Fall schreibt man auch kurz lim f (x) = y. x-3u

BEISPIEL

6.18 Betrachte die Funktion f : [0,1] 2 —> R mit xl-÷ x2. Wähle 1

und Die Funktion f (x) konvergiert für x

Y

=

u gegen 1.

Es sei e > 0 beliebig. Wähle nun (5, = e. Es sei x E [0,1]2 mit =

Ilx — u112 = 2

< SE = E

(:2

2

beliebig gewählt. Es gilt dann 1

1.f(x) — Y12 = X2 —

2

< 5€ = E. 2

2

Also konvergiert f (x) für x —r u gegen 1. Siehe Abbildung 6.9. L

J

f (€

1/

ABBILDUNG 6.9

Betrachte die Funktion f (X) aus Beispiel 6.18. Dabei wird ein zweidimensionaler Vektor des 1R2 auf seine erste Komponente abgebildet. Die Funktion konvergiert für u E R2 mit ui = u2 = ä für x —+ u gegen Wählt man einen Abstand e > 0, so liegt der „E-Schlauch" um u geschnitten mit dem Funktionsgraphen in der „e-Platte" um 1.

BEISPIEL 6.19 Betrachte

die Funktion f : 1112

Ill mit x 1 —> 11x111. Wähle und

Die Funktion f (x) konvergiert für x —> u gegen 1.

116

y = 1.

KONVERGENZ MEHRDIMENSIONALER FUNKTIONEN •

Es sei E

>

0 beliebig. Wähle nun 6, = 2e. Es sei x E [0,112 mit

11x —

=

(:)

1 u

auch lim f (x)+g(x) = y z und lim f (x) • g(x) = x—>u x—>u y • z. Seien X,YCRsowief:X—>Yund h: Y —> Ek Funktionen. Sind u E X, v E Y, z ER so, dass lim f (x) = v und li m h(y) z, dann gilt yiv

lim h o f (x) = z. x—>u

Das Konzept der Konvergenz reeller Funktionen kann auf mehrdimensionale reelle Funktionen übertragen werden. Seien y E R, X C Rn, u E X und f : X —> R gegeben. Nach Definition 6.17 sagt man, dass f (x) für x —> u gegen y konvergiert, falls die Bedingung FK. erfüllt ist. Sie besagt, dass es für alle e E R mit E > 0 ein 6, > 0 gibt, so dass für alle < 8 gilt f (x) — yl < e. In diesem x E X mit 11x — Fall schreibt man auch kurz lim f (x) = y. Für den mehrdimensionalen Fall formuliert Proposition 6.20 ein Kriterium für die Konvergenz über die Konvergenz von Folgen.

FUNKTIONENFOLGEN

6.3 Funktionenfolgen Betrachtet man Folgen, deren Elemente aus einer Klasse von Funktionen gewählt sind, lassen sich diese ebenfalls auf Konvergenz hin untersuchen, wenn die Klasse von Funktionen einen Vektorraum bildet. Die Menge der reellen Funktionen auf dem selben Definitionsbereich bildet beispielsweise eine solche Klasse. Die Null in diesem Vektorraum ist die Funktion, die alle Elemente des Definitionsbereichs auf 0 abbildet. Die Vektorraumstruktur ist notwendig, um eine Norm als Werkzeug für den

Tn

L

Konvergenzbegriff zu erhalten. Diese abstrakte Herangehensweise wollen wir nun etwas umschiffen und für bestimmte Normen den zugehörigen Konvergenzbegriff untersuchen, ohne die Norm als solches in den Fokus zu nehmen. Im Folgenden werden die punktweise und gleichmäßige Konvergenz von Funktionenfolgen betrachten. Zunächst beginnen wir mit der Definition von Funktionenfolgen.

DEFINITION 6.21 Es sei für jedes n E N eine Funktion gegeben fn : D -+ mit D E IR' für ein E N. Dann nennen wir (fn )n EN eine reelle Funktionenfolge über dem Definitionsbereich D.

B EISPIEL 6.22 Betrachte für alle n E N die Funktionen fn, : [0,1] —› R mit x Funktionenfolge (fn )nEN über dem Definitionsbereich [0,1].

IM

ZU DEFINITION

6.21

Eine Funktionenfolge ist eine Folge von Funktionen, die alle auf dem selben Definitionsbereich definiert sind.

xn. Sie bilden einen 1

Punktweise Konvergenz von Funktionenfolgen

Bei der punktweisen Konvergenz betrachtet man tionswerten und prüft diese auf Konvergenz. Man im Prinzip für jedes x eine eigene Folge von Funk- untersucht also eine Folge von Funktionswerten. DEFINITION 6.23 Sei eine Funktionenfolge (,,ri f ) nEN über einem Definitionsbereich D gegeben. Dann konvergiert die Folge (fn )nEN punktweise gegen eine Funktion f : D --> IR, wenn für alle x E D gilt lim fn,(x) = f (x).

n.—>oo

Die Funktion f wird dann als Grenzfunktion bezeichnet.

tu ZU DEFINITION 6.23 Es liegt genau dann punktweise Konvergenz vor, wenn für jedes x aus dem Definitionsbereich D die Folge der Funktionswerte der Funktionen f„ an der Stelle x gegen den Funktionswert der Funktion an der Stelle x konvergiert. Die Grenzfunktion ist das dem Grenzwert analoge Objekt.

6.24 Betrachte die Funktionenfolge aus Beispiel 6.22. Es ist also für alle n E N eine Funktion fn : -+ IR mit x H xn gegeben, die zusammen eine Funktionenfolge (fn )nEN über dem Definitionsbereich [0,1] bilden. Diese konvergiert punktweise gegen die Funktion f : [0,1] -+ mit BEISPIEL

[0,1]

X 1—>

0 falls x E [0,1) {1 falls x = 1.

119



FUNKTIONENFOLGEN

Um das zu belegen, muss für jedes x E [0,1] gezeigt werden, dass die Folge der Fnktionswerte der Funktionen .fn an der Stelle x, also die Folge (f n (x))ne N gegen f (x) konvergiert. Sei also x E [0,1) beliebig gewählt. Sei e > 0 beliebig gewählt. Dann gilt lim xn = 0 = f(x), n—>co weil Ixt < 1 - Lemma geometrische Reihe. Für x = 1 ist HM in = lim 1 = 1 = f(1). n—>co n-->oo Also konvergiert die Funktionenfolge (f,,,,)„EN punktweise gegen die Funktion f. L

Gleichmäßige Konvergenz von Funktionenfolgen

Punktweise Konvergenz ist in vielen Fällen nicht ausreichend; es wir ein stärkeres Konzept der Konvergenz benötigt. Bei der gleichmäßigen Konver-

genz muss die Folge von Funktionswerten für jedes x im Definitionsbereich gleich schnell gegen den Wert der Grenzfunktion konvergieren.

ZU DEFINITION 6.25

6.25 Sei eine Funktionenfolge (fri) iEN über einem Definitionsbereich D gegeben. Dann konvergiert die Folge (f n ) nE Ngleichmäßig gegen eine Funktion f : D —› 118, wenn gilt DEFINITION

Es liegt genau dann gleichmäßige Konvergenz vor, wenn die Folge von Funktionswerte für jedes

lim sup I fn (x) — f (x)I = 0. n —'c° xED

BEISPIEL 6.26 Betrachte die Funktionenfolge aus Beispiel 6.22 und 6.24. Es ist also für alle n E N eine Funktion fn : [0,1] —>i mit x H xn gegeben, die zusammen eine Funktionenfolge [0,1] übRermditem Definitionsbereich [0,1] bilden. Diese konvergiert nicht gleichmäßig gegen die Funktion (fn)n X

I—)

0 falls x E [0,1) 1 { falls x = 1.

Dazu ist zu zeigen, dass für eine > 0 kein NE E N gibt, so dass sup fn (x) — f (x)1 < e

xED

für alle n > NE .

(6.2)

Wähle e = 4. Angenommen, es gibt ein N1 E N, so dass (6.2) erfüllt ist. Wähle n > NE. Nun gilt allerdings für die Zahl xn = (i) n E [0,1), so dass = (() 4



4

und damit gilt sup Ifn(x) — .f(xll fn(xn) =

xED

120

3 1 = —4 > 2

FUNKTIONENFOLGEN •

ein Widerspruch zu der Annahme, dass mit n > N, (6.2) erfüllt ist. Folglich konvergiert die Funktionenfolge (fn )nEN nicht gleichmäßig gegen die Funktion f. L

_J

ZUSAMMENFASSUNG

über einem Defi- net. Sei eine Funktionenfolge..,n,nea ff 1 nitionsbereich D gegeben. Die Folge (fn )nEN kon- Die Folge (fn)nEN konvergiert nach Definition 6.25 vergiert nach Definition 6.23 punktweise gegen eine gleichmäßig gegen eine Funktion f : D —r R, wenn Funktion f : D —r IR, wenn für alle x E D gilt gilt lim fn(x) = f (x). Die Funktion f wird dann als Grenzfunktion bezeich-

lim

Ifn.(x)



f(x)I

= 0.

xED

121

Kapitel 7

Stetigkeit Stetigkeit ist ein grundlegendes Konzept der Analysis. Es baut auf der Konvergenz für Funktionen auf. Nachdem Stetigkeit für eindimensionale reelle Funktionen eingeführt und diskutiert wird, werden die Varianten der gleichmäßigen und Lipschitz- sowie stückweiser Stetigkeit diskutiert. Der Zwischenwertsatz, der Satz von Heine und der Satz vom Minimum und Maximum sind strukturell wichtig für die Analysis reeller Funktionen. Besitzen Funktionen Definitionslücken, können sie dort stetig fortsetzbar sein oder Pol- bzw. Sprungstellen besitzen. Das Konstrukt der Stetigkeit lässt sich wie die Konvergenz für Funktionen auch auf mehrdimensionale Funktionen anwenden.

ZU DEFINITION

7.1

Die Definition der Stetigkeit fußt auf der Konvergenz von reellen Funktionen. Stetigkeit ist eine Eigenschaft für einzelne Stellen des Definitionsbereichs einer Funktion. Konvergiert die Funktion an dieser Stelle, sollte dieser Grenzwert mit dem Funktionswert an dieser Stelle übereinstimmen. Bei dem Konzept der Stetigkeit handelt es sich also zunächst einmal um eine "lokale" Eigenschaft. Die Frage, ob eine Funktion stetig ist, muss näher spezifiziert werden. Allgemein meint man damit, dass die Funktion auf ihrem ganzen Definitionsbereich stetig ist, also in jedem einzelnen Punkt. Eine Funktion kann auf einer Teilmenge ihres Definitionsbereiches stetig aber für manche Punkte in ihrem Definitionsbereich eben nicht stetig sein.

Reelle Funktionen, deren Funktionsgraph nicht wild hin und her springt (im eindimensionalen) oder Stufen aufweist (im mehrdimensionalen), sind von besonderem Interesse. Wir möchten nun Funktionen, die man anschaulich gesprochen

„zeichnen kann, ohne den Stift abzusetzen” ins Auge fassen. Dabei bauen wir auf dem in Kapitel 6 entwickelten Konvergenzbegriff für Funktionen auf. Tatsächlich lässt sich das Konzept auf mehrdimensionale Funktionen verallgemeinern.

7.1 Stetigkeit Eine Funktion ist in einem Punkt ihres Definitionsbereichs stetig, wenn sie dort nicht bloß konver-

giert, sondern dieser Grenzwert mit dem Funktionswert an dieser Stelle übereinstimmt.

DEFINITION 7.1 Sei X c IR, f : X -+ IR und u e X. Wir nennen f stetig im Punkt u, falls

lim f (x) = f (u).

x—)›u

Ist ferner 8 c X, so heißt f stetig auf S, falls f stetig in jedem Punkt u E 8 ist. Ist zusätzlich S = X nennen wir f stetig. 7

STETIGKEIT



f (=)

BEISPIEL 7.2 Sei f : 11 --> 1k mit x N c für ein c E IR eine konstante Funktion. Diese Funktion ist für alle

u E JR stetig. Wähle dazu u E JR fest. Für jedes e > 0 kann man 5 = 1 wählen und es ist I f (x) — f (u)1 = 1c — cl = 0 < E

für alle x E R

und somit auch für alle x E 1k mit Ix — ul < 5 = 1. Siehe Abbildung 7.1. L

UB ABBILDUNG 7.1 BEISPIEL 7.3 Sei f : R —> lt mit x H x die Identitätsfunktion. Auch diese Funktion ist stetig für alle u E R.

Eine konstante Abbildung ist, wie in Beispiel De bewiesen, stetig in jedem Punkt des 7.2 Definitionsbereichs. Für jedes e > 0 findet man in 5, = 1 einen Radius der Umgebung um u, so dass die Funktionswerte in dieser Umgebung höchstens Abstand E zu dem Funktionswert von u haben - genau genommen sind sie sogar identisch und haben somit Abstand 0. Die Funktion ist also stetig in u.

Wähle dazu u E IR fest. Für jedes e > 0 findet man mit 8 = e ein 5, welches die notwendige Bedingung erfüllt. Denn es ist f(x)

für alle x E JR mit Ix — uI < b = e.

f(u)1 = Ix — //I < e

Siehe Abbildung 7.2. L

BEISPIEL 7.4 Sei f : R —> R mit x 1—>

{ —1 für x < 0 1 für x > 0.

Diese Funktion ist stetig für alle u E JR \ {0}. Für u = 0 ist f nicht stetig. L 1

BEISPIEL 7.5 Sei D : R —> R mit x

fürxEJR\Q 0 für x E Q.

1

die Dirichletfunktion. Sie ist in keinem x E IR stetig. Um das einzusehen überlegt man sich, dass in jedem Intervall um eine reelle Zahl u rationale Zahlen enthalten sind. L

In ABBILDUNG 7.2

Hat man zwei Funktionen an der Hand, die an genschaft haben. Da dies für die Konvergenz von der selben Stelle stetig sind, stellt sich die Fra- Funktionen der Fall ist, können wir dieses Resultat ge, ob die verknüpften Funktionen auch diese Ei- direkt auf die Stetigkeit übertragen.

PROPOSMON 7.6 Sei X c R. Seien f, g X —> R Funktionen und u E R. Sind f und g in u stetig, dann auch f g und f • g.

Beweis. Die Aussagen folgen direkt aus Proposition 6.15.

Eine Identitätsabbildung ist, wie in Beispiel 7.3 bewiesen, stetig in jedem Punkt des Definitionsbereichs. Für jedes e > 0 findest man in SE = e einen Radius der Umgebung um u, so dass die Funktionswerte in dieser Umgebung höchstens Abstande e zu dem Funktionswert von u haben. Die Funktion ist also stetig in u.



123



STETIGKEIT

PROPOSMON 7.7 Seien X, Y c IR sowie f : X --> Y und h : Y —› R Funktionen. Sind u E X und v e Y so, dass f (u) = v. Ist f stetig in u und h stetig in v, dann ist h o f ebenfalls stetig in u. Beweis. Die Aussage folgt direkt aus Proposition 6.16.



r BEMERKUNG 7.8 Mit den Proposition 7.6 und 7.7 sowie den Beispielen 7.2 und 7.3 haben wir nun schon eine breite Menge von stetigen Funktionen kennen gelernt. Es sind sicherlich Polynomfunktionen stetig auf ganz R.

Anschauung Die Illustration, dass eine Funktion genau dann stetig ist, wenn man ihren Funktionsgraphen ohne abzusetzen mit dem Stift zeichnen kann, trifft ganz gut. Die Konvergenz einer Funktion an einer Stelle u ist ja dann gegeben, wenn die Funktionswerte der Stellen in einer Umgebung um u sehr nahe beieinander liegen. Das bedeutet, dass, wie schon in Kapitel 6 (Definition 6.1 und die zugehörige Erläuterung und die veranschaulichen-

den Beispiele sind da zu nennen) besprochen, der Funktionsgraph links von u und rechts von u auf den selben Punkt zulaufen - sie einen Weg beschreiben, der auf den selben Punkt an Stelle u führt. Bei der Stetigkeit kommt nun noch hinzu, dass die Funktion dort diesen „angepeilten Wert auch tatsächlich annimmt", der Funktionswert an der Stelle u dem erwarteten entspricht.

7.1.1 Varianten der Stetigkeit ZU DEFINITION

7.14

Der Unterschied zur Stetigkeit bzw. zur Konvergenz von Funktionen besteht darin, dass nicht für jedes u E X und e eine eigenes 6 gewählt werden darf. Das scheint zunächst nicht relevant zu sein, wählt man einfach das kleinste 6, das man für ein festes e und unterschiedliche u E X benötigt. Doch dieser Ansatz geht dann schief, wenn man beliebig kleine 6s benötigt, wenn also das Infimum der Menge {6e für u : u E X} gleich 0 ist.

124

Es gibt verschärfte Formen der Stetigkeit, welche in bestimmten Anwendungen relevant sind oder stärkere mathematische Aussagen über Funktionen mit diesen Eigenschaften zulassen.

DEFINITION

Gleichmäßige Stetigkeit

Bei der gleichmäßigen Stetigkeit ist nicht jede Stelle des Definitionsbereichs einzeln im Blick, sondern der gesamte Definitionsbereich als ganzes.

7.9 Seien X c Et und f : X —>

Man sagt, dass f (x) gleichmäßig stetig ist, falls die folgende Bedingung erfüllt ist. FGS. Für alle E e R mit e > 0, gibt es ein 6, e IR mit 8, > 0, so dass für alle x, u E X mit Ix — ul < 6, gilt I f (x) — f (u)I < e.

STETIGKEIT •

BEISPIEL 7.10 Die schon in Beispiel 7.3 auf Stetigkeit hin untersuchte Funktion f : R R mit x H x ist auch gleichmäßig stetig.

Wähle dazu u E R beliebig. Für jedes E erfüllt. Denn es ist

>

f( )

0 findet man mit 5, = e ein Zahl, welche die notwendige Bedingung

I f (x) — f (u)I = — ul x2

ist nicht gleichmäßig stetig.

Angenommen, f ist gleichmäßig stetig. Dann gibt es für E x —u lu • 81 = 4

2

= 2, 8

ein Widerspruch. Siehe Abbildung 7.3. L

Aus gleichmäßiger Stetigkeit folgt Stetigkeit. Das tig ist. Die Umkehrung ist nicht allgemein richtig. bedeutet, dass eine gleichmäßig stetige Funktion Es gibt stetige Funktionen, die nicht gleichmäßig an jeder Stelle ihres Definitionsbereichs auch ste- stetig sind.

EI ABBILDUNG 7.3

Die Funktion aus Beispiel 7.11 ist nicht gleichmäßig stetig, wenn auch stetig auf ganz IR. Schon für e = 1 ist es nicht möglich ein Si > 0 zu finden, welches an allen Stellen u E R die Stetigkeitsbedingung erfüllt. Wählt man nur u groß genug - zum Beispiel gleich- findet man, dass (51 zu groß gewählt wurde,es Stellen in der Umgebung um u gibt, deren Funktionswert weiter als e = 1 von f (u) abweicht.

IN LEMMA 7.12 Eine gleichmäßig stetige Funktion ist stetig. IR gleichmäßig stetig. Sei u E X beliebig gewählt. Dann ist f Beweis. Seien X c IR und f : X < öe ps gilt stetig in u, denn für jedes E > 0 gibt es ja ein Seps, so dass für alle x E X mit Ix — ■ u gegen f (u) und somit stetig in u. f (x) — f (u)I < e. Also konvergiert f (x) für x

Die Umkehrung von Lemma 7.13 ist nicht richtig. Eine stetige Funktion ist nicht zwangsläufig auch gleichmäßig stetig. In Beispiel 7.11 haben wir gesehen, dass die stetige Funktion f : IR —> R mit x H x2 nicht gleichmäßig stetig ist. BEMERKUNG 7.13

125

STETIGKEIT

Lipschitz-Stetigkeit Möchte man ein Funktion nicht nur innerhalb ei- die Möglichkeit dazu. Sie gibt eine obere Schranner kleinen Umgebung auf Stetigkeit hin untersu- ke an das Wachstum einer Funktion über größere chen, bietet das Konzept der Lipschitz-Stetigkeit Zeiträume.

ZU DEFINITION 7.14

d

Ist eine Funktion Lipschitz-stetig, dann ist ihr (positiver oder negativer) Wachstum auch über größere Strecken beschränkt. Stetigkeit ist doch eine sehr lokale Eigenschaft, möchte man größere Zusammenhänge sehen, ist die Lipschitz-Stetigkeit das Mittel der Wahl

DEFINITION 7.14 Seien X c R und f : X

R.

Man sagt, dass f (x) Lipschitz-stetig ist, falls die folgende Bedingung erfüllt ist. FLS. Es gibt ein L > 0, genannt Lipschitz-Konstante, so dass für alle x, u E X gilt 11(x) — f (u)I < L • Ix — ul. 1 BEMERKUNG

7.15 Die Lipschitz-Stetigkeit trägt ihren Namen zu Ehre des deutschen Mathematikers und

Hochschullehrers Rudolf Otto Sigismund Lipschitz (1832-1904). BEISPIEL 7.16 Die Funktion f : R zulässige Lipschitz-Konstante.

JR mit x H 3x ist Lipschitz-stetig. Zum Beispiel ist L = 4 eine

Wähle x, u E JR beliebig. Dann gilt (x)

f (u)I =13x 3u1= 3 • Ix — /LI < 4 • Ix —

was zu zeigen war. BEISPIEL 7.17 Die Funktion f : JR —> JR mit x 1-4 x 2 ist nicht Lipschitz-stetig.

Angenommen, f ist Lipschitz-stetig. Dann gibt es eine Lipschitz-Konstante L > 0, so dass für alle x, u E R gilt (x)

f (u)1< L • Ix

u1

Sei nun x > 0 und u = x + L. Dann gilt Ix — =L und If(x) — f(u)1=

— (x L)2 I -= 1x2 — x2 — 2xL — L2 1= L • 12x + ?_ L • L = L • Ix — ul,

- ein Widerspruch.

Eine Lipschitz-stetige Funktion ist auch, wie Stetigkeit ist also eine stärkere Eigenschaft als Lemma 7.18 zeigt, gleichmäßig stetig. Lipschitz- gleichmäßige Stetigkeit und Stetigkeit. E LEMMA 7.18 Eine Lipschitz-stetige Funktion ist gleichmäßig stetig.

Beweis. Seien X C JR und f : X —> JR Lipschitz-stetig. Es ist zu zeigen, dass dann für alle e > 0 ein SE > 0 existiert, so dass für alle x, u E R mit I x — /LI < S E gilt 11(x) — f (u)I < E.

126

STETIGKEIT 11

Wähle e > 0 beliebig aber fest. Setze öE = i . Dann gilt für alle x, u e IR mit Ix — ui < 6, = L , dass I f (x) — f (u)1 < L • Ix



ul < L •

= L• 7 E =e,

was zu zeigen war.

L

BEMERKUNG 7.19 Umkehrung von Lemma 7.18 gilt nicht allgemein. Sei dazu f : [0,1] —> R mit x gegeben. Diese Funktion ist gleichmäßig stetig, aber nicht Lipschitz-stetig. Details werden an dieser Stelle dem Leser überlassen.

111 KOROLLAR 7.20 Eine Lipschitz-stetige Funktion ist stetig.

Beweis. Nach Lemma 7.13 ist jede gleichmäßig stetige Funktion stetig. Nach Lemma 7.18 ist jede

Lipschitz-stetige Funktion gleichmäßig stetig.



Stückweise Stetigkeit

Die Variante der stückweisen Stetigkeit, die wir nun kennen lernen, ist schwächer als Stetigkeit. Man lässt für eine Funktion beliebig aber endlich

viele unstetige Stellen zu und nennt sie dann aus offensichtlichen Erwägungen "stückweise" stetig zwischen den unstetigen Stellen ist sie stetig.

DEFINITION 7.21 Wir nennen eine Funktion f : [a, b] —> IR stückweise stetig, wenn es eine Zahl c > 0 und weitere Zahlen a = ao < ai < • • • < ak = b gibt, so dass f auf jedem Intervall (az _i, ori,) stetig ist für i = 1, . . . , k und I f (x)1 < c für alle x E [a, b].

ZU DEFINITION 7.21 Stückweise stetige Funktionen spielen im Kontext von Integralen, die wir in Kapitel 10 studieren werden, eine wichtige Rolle. Eine stückweise stetige Funktion kann beliebig viele, aber endlich viele, Sprungstellen besitzen.

ZUSAMMENFASSUNG

Nach Definition 7.1 ist für X C JR eine Funktion f : X —> R stetig in u E X, falls limx—u f (x) = f (u)• Ist ferner S c X, so heißt f stetig auf S, falls f stetig in jedem Punkt u E S ist. Ist zusätzlich S = X nennen wir f stetig. Nach Proposition 7.6 und 7.7 sind Summen und Produkte sowie Ketten von stetigen Funktionen stetig. Definition 7.14 stellt eine erste Variante der Stetigkeit vor. Seien X c R und f : X —> R. Man sagt, dass f (x) gleichmäßig stetig ist, falls die Bedingung FGS. ersfüllt ist. Sie besagt, dass es für alle E E JR mit e > 0

ein 8, E R mit i5E > 0 gibt, so dass für alle x, u E X mit Ix < VE gilt f (x) — f (u)1 < e. Nach Lemma 7.13 ist jede gleichmäßig stetige Funktion stetig, nach Bemerkung 7.13 gilt die Umkehrung nicht allgemein. Definition 7.14 gibt eine zweite Variante der Stetigkeit. Seien X c JR und f : X —> R. Man sagt, dass f (x) Lipschitz-stetig ist, falls die Bedingung FLS. erfüllt ist. Sie besagt, dass es ein L > 0, genannt Lipschitz-Konstante, gibt, so dass für alle x, u E X gilt f (x) — f (u)I < L • lx — 74. Eine Lipschitz-stetige Funktion ist nach Lemma 7.18 gleichmäßig stetig,

127

U ANALYSE REELLER STETIGER FUNKTIONEN

nach Bemerkung 7.19 gilt die Umkehrung nicht allgemein. Nach Korollar 7.20 folgt aus Lipschitz-Stetigket Stetigkeit. Definition 7.21 gibt eine dritte Variante der Stetig-

keit. Eine Funktion f : [a, b] —> IR heißt stückweise stetig, wenn es eine Zahl c > 0 und weitere Zahlen a = ao < ai < • • • < ak = b gibt, so dass f auf jedem Intervall (ai_i, ai) stetig ist für i = 1, k und f (x)1 < c für alle x E [a,b].

7.2 Analyse reeller stetiger Funktionen

ABBILDUNG 7.4

Proposition 7.22 besagt, dass eine stetige Funktion, die auf einem Intervall [a, b] definiert ist und für die f (a) < 0 und f (b) > 0 ist, eine Nullstelle besitzt c E (a, 6).

Ist eine reelle Funktion f : [a, b] -+ IR stetig, so können wir mit Gewissheit sagen, dass jeder Wert zwischen den Funktionswerten f (a) und f (b) auch tatsächlich angenommen wird. Außerdem ist ihr Bild ein abgeschlossenes Intervall und es gibt Stellen, deren Funktionswert maximal bzw. mini-

7.2.1 Der Zwischenwertsatz

f(s)

ABBILDUNG

7.5 El

Die Menge Z sammelt alle x in dem Intervall [a, 6], deren Funktionswert f (x) negativ ist.

mal unter allen Funktionswerten ist. Diese Aussagen liefern der Zwischenwertsatz, der Satz von Heine und der Satz vom Minimum und Maximum (oder Extremwertsatz). Die Aussagen klingen alle zunächst offensichtlich, müssen aber mit Hilfe der Definition der Stetigkeit bewiesen werden.

Die folgende Proposition ist eine Vorarbeit zum Zwischenwertsatz und klingt zunächst mal offensichtlich, aber ihn zu beweisen braucht dennoch mehr Aufwand als erwartet. Es ist notwendig, die Aussage des Satzes wirklich zu durchdringen. In Worten sagt er, dass eine Funktion, welche auf

einem Intervall stetig ist und der Funktionswert der unteren Intervallgrenze negativ und der rechten Intervallgrenze positiv ist, in diesem Intervall den Wert 0 (mindestens einmal) annimmt, siehe Abbildung 7.4.

7.22 Seien a < b reelle Zahlen und sei f : [a, b] —› IR stetig auf dem gesamten Intervall [a, b]. Wenn f (a) < 0 aber f (b) > 0, dann existiert eine Zahl c E (a, b) mit f (c) = 0.

111 PROPOSITION

Beweis. Wir definieren mit Z= ABBILDUNG 7.6

Der Funktionswert des Supremums c der Menge Z ist sicherlich nicht negativ - sonst könnte man ein x konstruieren, dass in Z liegt und größer als c ist - ein Widerspruch zur Supremumseigenschaft von c.

128

[a, b] : f (x) < 01,

die Menge aller x-Werte, deren Funktionswerte echt negativ sind (siehe Abbildung 7.5). Diese Menge hat die folgenden drei Eigenschaften. • Z ist beschränkt (das Intervall [a, b] ist beschränkt)

ANALYSE REELLER STETIGER FUNKTIONEN •

• Z ist nicht leer (a ist sicher in Z) • Der Wert b ist nicht in Z enthalten.

Sei c = sup Z. Die Funktion f ist stetig in c. Wir wollen zeigen, dass f (c) = 0 ist. Dazu zeigen wir zwei Ungleichungen. „ IR eine stetig Funktion. Man nennt x E [a, b] einen Fixpunkt von f, wenn f (x) = x ist. Die Funktion f besitzt mindestens einen Fixpunkt.

Um das einzusehen, bildet man eine Hilfsfunktion g : [a, b] —> R mit x 1—> f (x) — x. Nun beobachtet man, dass jede Nullstelle von g ein Fixpunkt von f ist und umgekehrt. Nach Proposition 7.6 ist g als Summe der beiden stetigen Funktionen fi (x) = f (x) und f2 (x) = — x auf dem Intervall [a, b] stetig. Nach dem Zwischenwertsatz gibt es also eine Zahl c E [a, b] mit g(c) = 0 und damit f (c) = c einem Fixpunkt von f. L

7.2.2 Der Satz von Heine

Der Satz von Heine besagt, dass das Bild einer senen Intervall auch ein abgeschlossenes Intervall stetigen reellen Funktion über einem abgeschlos- ist.

SATZ 7.26 (SATz VON HEINE)

Sei f : [a, b] —> R eine stetige Funktion. Dann ist f ([a, b])

f (x) : x E [a, b]l beschränkt. Beweis. Wir zeigen, dass f ([ct, b]) nach oben beschränkt ist, die Beschränktheit nach unten folgt analog.

Wir nehmen an, dass f ([a, b]) nicht nach oben beschränkt ist. Dann gibt es eine Folge (Xn)nEN mit xn E [a, b] und f (xn) > n für alle n E N.

Diese Folge (xn)rien ist beschränkt (es ist ja xn E [a, b] für alle n E N). Demnach gibt es nach Satz 5.57 eine konvergente Teilfolge (x,,,„)nEN , welche gegen einen Wert x* E [a, b] konvergiert. Sei N* E N so gewählt, dass f (x*) < N* — 10 ist. Da f stetig ist, gibt es für E = 1 ein 5€ > 0, so dass für alle x E b] mit Ix — x*1 < 6, gilt f (x) — f (x*)I < 1. Allerdings gibt es ein ./V A r 8 gilt, dass Ixn — x* < (SE. Sei nun n* = max{N*, NbE }. Dann gilt für xn. , dass I xri. — x* < äe und damit auch f (xn.) — f (x*)I 5 1.

Es ist jedoch f (xn.) > 11*

130

> N*

und f (x*) < N* — 10 - ein Widerspruch.

ANALYSE REELLER STETIGER FUNKTIONEN •

Also ist f



b]) nach oben beschränkt.

Das Beispiel 7.27 veranschaulicht die Aussage des 7.29 zeigen. Ist die Funktion nicht stetig, gilt die Satzes von Heine. Die Umkehrung des Satzes von Aussage des Satzes von Heine ebenfalls nicht, wie Heine ist nicht korrekt, wie die Beispiele 7.28 und Beispiel 7.30 zeigt.

BEISPIEL 7.27 Die stetige Funktion f : [2,3] —› x2 bildet das abgeschlossene Intervall [2,3] auf das abgeschlossene Intervall [4,9] ab.

BEISPIEL 7.28 Die stetige Funktion f : (0,1) —› 5 bildet das offene Intervall (0,1) auf das Intervall [5,5] ab. Das Bild ist also abgeschlossen, obwohl der Definitionsbereich einem offenen Intervall entspricht. L r

▪ BEISPIEL 7.29 Die Funktion f : (-1,2] —› x2 bildet das halb-offene Intervall (-1,2] auf das Intervall [0,4] ab. Das Bild ist also abgeschlossen, obwohl der Definitionsbereich einem halb-offenen Intervall entspricht. Siehe Abbildung 7.10 ▪

i2A

ABBILDUNG 7.10

Das halboffene Intervall (-1,2] wird in Beispiel 7.29 durch die stetige Funktion mit x H X2 auf ein abgeschlossens Intervall abgebildet. f(.)

BEISPIEL 7.30 Betrachte die in u = 2nicht-stetige Funktion f : [0,1] —› IR mit xi—r

{1 falls x x

1

sonst.

Das Bild der Funktion ist das halb-offene Intervall ,1], wie in Abbildung 7.11 zu sehen.

7.2.3 Der Satz vom Minimum und Maximum ABBILDUNG 7.11

Der Satz vom Minimum und Maximum gilt für tion: Es gibt tatsächlich je einen x-Wert, dessen eine stetige reelle Funktion auf einem abgeschlos- Funktionswert dem Supremum bzw. Infimum über senen Intervall. Die Aussage betrifft den größten alle Funktionswerte entspricht. bzw. kleinsten Funktionswert einer solchen Funk-

Das abgeschlossene Intervall [0,1] wird in Beispiel 7.30 durch eine nicht-stetige Funktion auf ein halboffenes Intervall abgebildet.

SATZ 7.31 (SATZ VOM MINIMUM UND MAXIMUM) Seien a, b E IR mit a < b und sei f : [a, b] —> JR stetig. Es gibt Zahlen xr„,,, E [a, b] und x. E [a, b] so dass

f (xmin) = inf{ f (x) : x E [a, b])- und

f (x.) = sup{ f (x) : x E [a, b]}.

131

ANALYSE REELLER STETIGER FUNKTIONEN

Beweis. Wir wissen durch den Satz von Heine, dass das Bild der Funktion f beschränkt ist. Außerdem ist das abgeschlossene Intervall [a, b] abgeschlossen, beinhaltet also alle Häufungspunkte, bzw. den Grenzwert jeder Folge über [a, b]. Wir zeigen die Existens von x. E [a, b], die Existenz von xmin E [a, b] folgt analog. Sei dazu s = sup{ f (x) : x E [a, b]l . Zunächst konstruiert man eine Folge (an).EN mit ao = N' (die Stelle genau in der Mitte des Intervalls [a, b]). Da s das Supremum an alle Bilder von f ist und f stetig auf [a, b] ist (und damit auch auf dem Intervall zwischen s und ao), gibt es nach dem Zwischenwertsatz ein c zwischen s und ao, so dass f (c) = f (8)+2 f (") ist. Es liegt der Funktionswert an der Stelle c genau zwischen f (ao) und f (s). Setze nun al = c. So definiert man allgemein iterativ mit gleicher Begründung: Es ist a. = c E [a, b], wobei für c gilt f (c) = f (s)+ 2(')für alle n E N> • Die Folge (an)nEN konvergiert in [a, b] mit für n oo gegen ein x* E [a, b]. Außerdem ist die Folge mit bn = f (an) für alle n E N monoton wachsend und nach oben durch s beschränkt. Es gilt sogar s = sup{bn : n E N} (Angenommen, es gibt ein s', mit s' < s, welches eine obere Schranke an die Folge (bn)nEN ist. Nach der Konstruktion der Folge ist jedoch der Abstand von bn zu s genau 2' • (s — bo), also beliebig klein. Dann gibt es sicherlich ein Folgenglied, so dass der Abstand zu s kleiner ist als s — - ein Widerspruch.) Demnach konvergiert (bn)nEN gegen s. Da f stetig ist, konvergiert für jede Folge, die gegen x* konvergiert die Folge der Funktionswerte gegen f (x*). Also ist f (x*) = s, was zu zeigen war. •

(bn )n EN

7

Der Name „Satz vom Minimum und Maximum" rührt daher, dass eine stetige reelle Funktion stets ein globales Maximum bzw. Minimum besitzt. In Definition 8.63 definieren wir diese Begriffe formal - anschaulich sind es die Stellen, an denen die Funktion maximal bzw. minimal wird. Der Satz wird demnach auch als „Extremwertsatz" bezeichnet. Er trifft allerdings nur eine Aussage über die Existenz dieser Extremwerte. Um solche zu konstruieren benötigt man die Werkzeuge der Differentialrechnung. Tatsächlich gibt es nicht stetige reelle Funktionen, die kein globales Maximum bzw. Minimum besitzen, siehe Beispiel 7.34. BEMERKUNG 7.32

L

BEISPIEL

7.33 Betrachtet man die Funktion f : [2,3] 4 = inf{ f (x) : x E [a, b]}

und

J

x2, so stellt man fest, dass 9 = sup{ f (x) : x E [a, b]l

Und tatsächlich gibt es mit xmin = 2 und xnm. = 3 zwei Stellen in [a, b], deren Funktionswerte f (xrnin) = f (2) = 4 und f (x.) = f (3) = 9 dem Infimum und Supremum der Funktionswerte entsprechen. L

Die Voraussetzung, dass der Definitionsbereich Maximum. Man kann jeweils Beispiele finden, in einem abgeschlossenen Intervall entspricht und denen die Voraussetzungen nicht erfüllt sind und dass die Funktion f stetig ist, sind beide grund- die Aussage dann ebenfalls negiert wird. legend wichtig für den Satz vom Minimum und

132

STETIG FORTSETZBARE FUNKTIONEN •

BEISPIEL 7.34 Betrachtet man die Funktion f : (0,1) -4 x, so stellt man fest, dass das Infimum bzw. das Supremum der Funktionswerte (also 0 und 1) nicht angenommen wird. L

BEISPIEL

7.35 Betrachte die schon in Beispiel 7.30 diskutierte Funktion f : [0,1] —> IR mit 1 falls x < x sonst.

Diese Funktion ist in u = 2 nicht-stetig. Und tatsächlich ist das Infimum über alle Funktionswert 2 - ein Wert, der keinem Funktionswert einer Zahl des Definitionsbereichs auch tatsächlich entspricht, siehe Abbildung 7.11. L

ZUSAMMENFASSUNG

Proposition 7.22 ist eine Vorbereitung für den Zwischenwertsatz. Sie besagt, dass für reelle Zahlen a < b und eine stetige Funktion f : [a, b] —› IR eine Zahl c E (a, b) existiert mit f (c) = 0, wenn f (a) < 0 aber f (b) > 0. Nach dem Zwischwertsatz (Satz 7.24) nimmt eine stetige Funktion auf einem abgeschlossenen Intervall [a, b] alle Funktionswerte zwischen f (a) und f (b) garantiert an. Es gibt also ein c E [a, b] mit f (c) = y für alle y zwischen f (a) und f (b). Der Satz von Heine (Satz 7.26) besagt, dass das Bild einer stetigen reellen Funktion über einem abgeschlos-

senen Intervall auch ein abgeschlossenes Intervall ist. Formal sei f : [a, b] —› IR eine stetige Funktion. Dann ist f ([a, b]) = { f (x) : x E [a, 6] } beschränkt. Der Satz vom Minimum und Maximum (Satz 7.31) gilt für eine stetige reelle Funktion auf einem abgeschlossenen Intervall. Die Aussage betrifft den größten bzw. kleinsten Funktionswert einer solchen Funktion: Es gibt tatsächlich je einen x-Wert, dessen Funktionswert dem Supremum bzw. Infimum über alle Funktionswerte entspricht. Formal seien a, b e JR mit a < b und sei f : [a, b] JR stetig. Es gibt Zahlen xinin E [a, b] und xmax E [a, b] so dass f (xinin) = inf{f(x) : x E [a, b]} und f (x.) = suplf (x) : x E [a, b]}.

7.3 Stetig fortsetzbare Funktionen Häufungspunkte des Definitionsbereichs, welche nicht in ihm enthalten sind, werden Definitionslücken genannt. Es ist in manchen Fällen aber möglich einen Funktionswert für diese zu ergänzen, wenn die Funktionswerte der Punkte um diesen Häufungspunkt "nur einen Schluss

für den Funktionswert zulassen". Anders ausgedrückt, wenn die Funktion für x gegen den Häufungspunkt konvergiert, das Hinzufügen der Definitionslücke zum Definitionsbereich und das Zuordnen des richtigen Funktionswertes dafür sorgen, dass die Funktion an dieser Stelle stetig ist.

133

Funktion mindestens auf einer Seite in der Nähideerigii9ASAAkiefelkiebNEN sehr kleine Werte an. Der zu erwartende Funktionswert wäre also ±oo - das möchten wir vermeiden. Bei einer Sprungstelle konvergiert die Funktion wenigstens von links und von rechts für x --> u gegen einen Wert, wenn auch nicht den selben, die Funktion macht dort einen Sprung. Trifft keiner dieser beiden Sonderfälle zu, so lässt sich das Verhalten der Funktion um die Definitionslücke nicht besser interpretieren, es bleibt eine nicht stetig hebbare Defiältiönslücke.

7.36 Sei f : X -+ IR eine reelle Funktion und u E \ X ein Häufungspunkt von X. Dann nennen wir u eine Definitionslücke von f . DEFINITION

Konvergiert f für x u von links gegen den gleichen Wert wie von rechts, dann nennen wir u eine stetig hebbare Definitionslücke. Divergiert die Folge (f (4),,EN für alle Folgen (an )nepi, die entweder von links und/oder von rechts gegen u konvergieren, bestimmt gegen ±co, nennen wir u eine Polstelle. Konvergiert f für x -+ u von links gegen einen anderen Wert wie von rechts, dann nennen wir u eine Sprungstelle.

BEISPIEL

7.37 Die Funktion,

f : [0,1] --+ JR mit

x ti

1 falls x


besitzt in u = äeine Definitionslücke. Diese ist tatsächlich eine Sprungstelle und damit nicht stetig hebbar, denn f konvergiert für x ---> u von links gegen 1 und von rechts gegen siehe Abbildung 7.12.

ABBILDUNG 7.12 Die Definitionslücke der Funktion aus Beispiel 7.37 bei 2ist nicht stetig hebbar, sie ist eine Sprungstelle.

7 BEISPIEL 7.38 Die Funktion f : [0,1] \ {1} —> JR mit (x _ 3) ( ito x2 + 2) x 1—>

L

(x — 3)(x + 3)

besitzt in ui = 3 und in U2 = 10 je eine Definitionslücke. Die Definitionslücke in ui ist stetig hebbar, die in u2 eine Polstelle, siehe Abbildung 7.13.

Ergänzt man den Definitionsbereich einer Funkti- le. Der Funktionswert lässt sich eindeutig festleon um eine stetig hebbare Definitionslücke, erhält gen. man die stetig fortgesetzte Funktion an dieser StelZU DEFINITION 7.39 gl

7.39 Sei f : X --> JR eine reelle Funktion und u eine stetig hebbare Definitionslücke von f. Dann konvergiert f für x —› u gegen ein y E IR. Man nennt die Funktion 7 X U {u} —› IR mit DEFINITION

Die stetige Fortsetzung f einer Funktion f ist der Funktion f identisch bis auf die Definitionslücke u, die dem Definitionsbereich von f zugefügt wurde. Das Bild ist ohne Überraschung der Wert, den man erwartet, der Grenzwert, denn f konvergiert für x u gegen einen Wert y E lt - er ist das Bild von u unter 7.

134

(x) =

f (x),

für alle x E X

Y,

für x = u

die stetige Fortsetzung von f an der Definitionslücke u.

STETIG FORTSETZBARE FUNKTIONEN II

BEISPIEL 7.40

Die Funktion f : R \ {-3,3} X

1—›

JR mit (x — 3)(h X2 + 2) (X - 3)(x + 3)

aus Beispiel 7.38 besitzt in ui = 3 eine stetig hebbare Definitionslücke. Die stetige Fortsetzung von f an dieser Definitionslücke ist die Funktion 7 JR \ {-3} -+ JR mit X

-Lx2 + 2 1-› io (x + 3)

7.3.1 Polstellen und stetige Fortsetzungen gebrochen-rationaler Funktionen

Die in den Beispielen 7.38 und 7.40 betrachte- tionslücken über die Nullstellen des Zähler- und te Funktion ist eine gebrochen-rationale Funkti- des Nennerpolynoms näher untersuchen. on. Für solche Funktionen lassen sich die Defini-

D EFIN ITION 7.41 Eine Funktion f : R \ {xi, x2, . xI

>

}

der Form

a„xn . . . aox° bm x7 n . . . box°

nennen wir eine gebrochen-rationale Funktion mit dem Zählerpolynom a(x) = an xn . . . aox° und dem Nennerpolynom b(x) = bm xm box° , wobei xi, • • • , xk die Nullstellen des Nennerpolynoms sind.

L

BEMERKUNG 7.42 Für ein Polynom p(x) = pr,xn ... pox° ist die Vielfachheit einer Nullstelle xo von p die größte natürliche Zahl v, so dass man p(x) = (x — xo)v • q(x) für ein weiteres Polynom q(x) schreiben kann.

BEISPIEL 7.43

Die Funktion f :

\ { 3,2} mit — f (x)

3x3 + 12x + 12 3x4 — 13x3 + 6x2 + 36x — 40

IM ABBILDUNG 7.13

Die Definitionslücke bei 3 ist, die bei —3 nicht stetig hebbar. ZU DEFINITION

7.41

Gebrochen-rationale Funktionen besitzen genau an den Nullstellen des Nennerpolynoms Definitionslücken. Dabei können diese stetig hebbar oder auch Polstellen sein.

ist eine gebrochen-rationale Funktion mit Zählerpolynom a(x) = 3x3 + 12x + 12 und Nennerpolynom b(x) = 3x4 — 13x3 + 6x2 + 36x — 40. Tatsächlich hat das Nennerpolynom die Nullstellen

-

und 2.

135

111 STETIG FORTSETZBARE FUNKTIONEN

L

1

Das folgende Lemma gibt ein Kriterium, anhand hebbar oder Polstellen sind und ob Vorzeichendessen man entscheiden kann, ob die Definiti- wechsel bei den Polstellen vorliegen. onslücken gebrochen-rationaler Funktionen stetig

11

LEMMA 7.44 Für eine Definitionslücke u einer gebrochen-rationalen Funktion f : X —> R lässt sich folgendes feststellen. Sei v. die Vielfachheit von u bezüglich des Zählerpolynoms und vb die Vielfachheit von u bezüglich des Nennerpolynoms von f.

■ Ist v. > vb und v. — vb gerade, so ist u mit 0 stetig fortsetzbar, wobei die Nullstelle der Fortsetzung kein Vorzeichenwechsel vollführt. ■ Ist v. > vb und v. — vb ungerade, so ist u mit 0 stetig fortsetzbar, wobei die Nullstelle der Fortsetzung einen Vorzeichenwechsel vollführt. ■ Ist va = vb, so ist u mit stetig fortsetzbar. ■ Ist va < vb und va — vb ist gerade, so ist u eine Polstelle ohne Vorzeichenwechsel. ■ Ist va < vb und va — vb ist ungerade, so ist u eine Polstelle mit Vorzeichenwechsel. Beweis. Man kann den Funktionsterm von f (x) umformen zu an xn + . . . + aox° _ (x — u)" • qa (x) bm xm + + bo x° (x — u)vb • qb (x) ' mit zwei Polynomen qa (x), qb(x) E Ek[x], wobei u weder für qa (x) noch qb(x) eine Nullstelle ist. Da weder qa (x) noch qb(x) eine Nullstelle in u hat, gibt es ein Intervall um X„ c IR um u, in welcher sowohl qa (x) als auch qb(x) nicht 0 sind, sie also auch dort keine Nullstelle besitzen. Es gilt also

lq.(x)1 > 0 und lqb(x)1 > 0

für alle xEX—u

und das Vorzeichen wechselt weder für qa (x) noch für qb(x) in Xu. Wir unterscheiden einige Fälle bezüglich der Vielfachheiten. Fall 1 (v. > vb): Es lässt sich der Funktionsterm von f (x) schreiben als an xn + . . . + ao x° bmxm + . . . + box°

136

_

(x — u)" • qa (x) (x — u)vb • qb(x)

(x — u)" — vb • qa(x) qb(x)

STETIG FORTSETZBARE FUNKTIONEN •

Offensichtlich ist die Funktion fi : X U {u} -- IR mit X 1—>

( x - u)" -vb • qa (x) qb(x)

stetig in u. Also ist f dort hebbar. Offensichtlich hat der Zählerterm der Fortsetzung dort eine Nullstelle. Es gibt nun zwei weitere Fälle zu unterscheiden. Fall 1.1 (va - vb ist gerade): Sowohl das Polynom qa (x) als auch das Polynom qb (x) hat in einer Umgebung um u ein festes Vorzeichen. Der Faktor (x - u)"-vb ist stets positiv, weil der Exponent va - vb gerade ist. Also liegt eine Nullstell ohne Vorzeichenwechsel vor. Fall 1.2 (va - vb ist ungerade): Sowohl das Polynom qa (x) als auch das Polynom qb(x) hat in einer Umgebung um u ein festes Vorzeichen. Der Faktor (x - u)"-vb wechselt sein Vorzeichen bei u, weil der Exponent va - vb ungerade ist. Also liegt eine Nullstell mit Vorzeichenwechsel vor. Fall 2 (va = vb): Es lässt sich der Funktionsterm von f (x) schreiben als au xn + . . . + aox° _ (x - u)" • qa (x) bm xrn + . . . + bo x° - (x - u)vb • qb (x)

qa (x) qb(x) •

Offensichtlich ist die Funktion f2 : X U {u} -+ IR mit x) qb(x)

qa ((x) k->a

stetig in u. Also ist f dort stetig fortsetzbar mit -IM = q R gegeben, so dass die Funktion ju : X \ {u} mit X 1->

R

f (x) - Lu(x) x-u

für x -› u gegen 0 konvergiert. Das heißt, es gibt einen Parameter m E R, so dass Lu (x) = f (u) m • (x - u) ist. Es ist f (x) - Lu (x) _ f (x) - f (u) - m • (x - u) x-u x -U Also konvergiert auch f ( x).-uf ( u) für x

BEMERKUNG

f (x) - f (u) X

- U

m.

u und zwar gegen m.

8.9 Man könnte die Aussage aus Proposition 8.8 auch der Art auffassen, dass der Fehler

r(x) = f (x) — Lu (x) schneller gegen 0 geht als x gegen u, wenn man genau das tut - nämlich x gegen u

gehen lässt.

8.1.2 Höhere Ableitungen

Die Ableitung einer Funktion f : X R, die auf ihrem ganzen Definitionsbereich differenzierbar ist, ist wiederum eine Funktion f' : X -› R auf dem selben Definitionsbereich. Diese Funktion ist nicht notwendigerweise differenzierbar in jedem Punkt (und in der Tat womöglich nicht ein-

146

mal stetig). Aber wenn sie es ist, kann man sie differenzieren und erhält eine weitere Funktion f" : X -› R. Sie wird als die zweite Ableitung von f bezeichnet und ist faktisch die Ableitung der Ableitung von f. Das Spiel kann man für manche Funktionen beliebig oft wiederholen.

RECHENREGELN FÜR ABLEITUNGEN •

DEFINITION 8.10 Es sei f : X -+ R eine auf ganz X differenzierbare Funktion. Ist die Ableitung f' von f auf ganz X differenzierbar, so nennen wir die Ableitung von f' die zweite Ableitung von f, bezeichnet mit f [2].

Induktiv nennen wir die zweite Ableitung der n-ten Ableitung von f, die (n + 1)-te Ableitung von f, bezeichnet mit f in+11 . Besitzt f eine stetige n-te Ableitung, so nennen wir f n-mal stetig differenzierbar.

äl ZU DEFINITION 8.10 Man bezeichnet die Ableitungen der Ableitung einer Funktion als ihre ‚höheren" Ableitungen. Anschaulich gesprochen gibt die zweite Ableitung darüber Auskunft, wie sich die Steigung ändert - also die Steigung der Steigung. Die zweite Ableitung wird auch manchmal mit f" bezeichnet, die dritte mit f'".

BEISPIEL 8.11 In Beispiel 8.5 haben wir gesehen, dass die Ableitung der Funktion f : IR —> IR mit x 1—> x die Funktion f' : R -+ JR mit x N I ist.

In Beispiel 8.4 haben wir gesehen, dass für alle c E JR die Ableitung der Funktion f : R —> R mit x H c die Funktion f' : JR —> IR mit x 1—> 0 ist. Demnach gilt für die Funktion f : JR —> JR mit x 1—> x, dass die höheren Ableitungen für alle x E JR lauten f"(x) = 0 (x) =1 und damit f[n] (x)

=

0 für alle x E

und n E N>2. Die Funktion ist also beliebig oft stetig differenzierbar.

L

J

8.2 Rechenregeln für Ableitungen Ähnlich wie im Fall von stetigen Funktionen, kann Schule im Kontext von Kurvendiskussionen beman aus gegebenen differenzierbaren Funktionen kannt. neue basteln. Diese Regeln sind häufig aus der

8.2.1 Die Summenregel Ableitungen bilden und Funktionen summieren lässt sich vertauschen. Das meint, dass die Ableitung der Summe zweier differenzierbarer Funktionen der Summe ihrer Ableitungen entspricht. Ob

PROPOSITION

man zunächst die Ableitungen bildet und diese addiert, führt zu der selben Funktion, die man erhält, wenn man erst die Funktionen addiert und dann die Ableitung bildet.

8.12 Angenommen, die Funktionen fi , f2 : X --> ff8 sind im Punkt u E X

147



RECHENREGELN FÜR ABLEITUNGEN

differenzierbar, dann ist die Funktion fi + f2 : X -+ IR, x 1—> f l (x) f2 (x) differenzierbar in u mit (fi+ f2)'(u) = fi(u)+f(u)Beweis. Es gilt nach Proposition 6.15 lim (fl + f2)(x)-(f ->

X - U

f2)(u) = hm f (x)+ f2(x)- fi(u)- f2(u) -111, x -U (u) + f2(x)

= lim (s) x ->u = lim I .= lim

.,u

f2(u)

X - U

fi(x)- fi (u) -

fi(x) — fi(u)

-

f2(x)- f2(u) -u

+ hm f 2

(x) — f2(u)

-

= fi (u)+.f(u), ■

wie behauptet.

BEISPIEL

8.13 Sei f : JR --> IR mit x 1—> x + 2. Dann ist f für alle u E IR differenzierbar.

Es ist f = fi + f2 mit fi(x) = x und f2 (x) = 1. Nach Beispiel 8.4 ist fi(x) = 1

und

f(x) = 0

für alle x E R. Wähle nun u E JR fest. Dann ist nach Proposition 8.12 (u) = f;(u) f(u) = 1 + 0 = 1. L

Also gilt allgemein f' (x) =1 für alle x E R.

J

8.2.2 Die Produktregel

Die Ableitung des Produkts zweier differenzier- tors gewichteten Ableitungen. Diese Regel wird barer Funktionen entspricht der Summe der mit aus offensichtlichen Gründen als Produktregel bedem jeweiligen Funktionswerts des anderen Fak- zeichnet.

PROPOSITION

148

8.14 Angenommen, die Funktionen fi f2 : X -i IR sind im Punkt u E X

RECHENREGELN FÜR ABLEITUNGEN III

differenzierbar, dann ist die Funktion fi • b : X -* R, x k—>

(x) • f 2(x)

differenzierbar in u mit

{ + fi(u) • .f . (u). (h • f2)' (u) = fi(u) • 2(u) Beweis. Es gilt

• f2)(u) =

hin (fl f2)(x) -U

lim

x->u

= xIlm

fi(x) • f2(x) - (u) • f 2(u) x-u fi(x) • f2(x) - h (u) • f2(x) + fi(u) • f2(x) - h (u) • f2(u) x

->u

= um (f 2(x) f (x) f (u) u x-u

-U

(u)

(u) - f2(x) x-

Nach Proposition 8.6 ist hm f 2(x) = f2 (u). Mit Proposition 6.15 ist also x-*u

• f 1.(x) - h (u) + (u) • lim Ui • f2)(x) - ( f • f2)(u) = h• m f 2 (x) hm

x--+u --

X

-U

x->u

= .11(u)

x ->u,

x -U

- (u)

f2(x) u x-

(u) + fi(u) • f2(u), ■

wie behauptet.

BEISPIEL

8.15 Sei f : —> IR mit x 1—> x 2. Dann ist f für alle u E differenzierbar.

Es ist f = fi • f2 mit fi(x) = x und f2(x) = x. Nach Beispiel 8.4 ist für alle x E R fi(x) = 1

und

f2(x) = 1.

Wähle nun u E JR beliebig aber fest. Dann ist nach Proposition 8.14 f'(u) = fi(u) • f2(u) + (u) • .f(u) =1•u+1•u=u+u= 2u. L

Da u beliebig aus gewählt ist, finden wir die Ableitung f'(x) = 2x für alle x E R..

BEISPIEL

8.16 Sei f : JR —› R mit x '—> 53. Dann ist f für alle u E JR differenzierbar.

Es ist f = f i • f2 mit fi(x) = X2 und f2 (x) = x. Nach den Beispielen 8.4 und 8.15 ist für alle x E (x)

= 2x

und

f(x) = 1.

Wähle nun u E R beliebig aber fest. Dann ist nach Proposition 8.14 f (u) = fi (u) • f2(u) + fi (u) • f'(u) = 2u • u u2 • 1 = 3u2. Da u beliebig aus R gewählt ist, finden wir die Ableitung f'(x) = 3x für alle x E R.

BEMERKUNG

8.17 Allgemein lässt sich, wie in Beispiel 8.16 angedeutet, induktiv herleiten, dass f : ]R —> R

149

RECHENREGELN FÜR ABLEITUNGEN

mit x H xn für alle u E R differenzierbar ist. Es gilt f'(x) = ne-1. Zusammen mit der Summenregel können nun die Ableitungen von Polynomfunktionen leicht berechnet werden. Für die Funktion f : R 118 mit f (x) = anxn + an-ix -1 für ao, ••• , art

E

aix + ao

R und n E N ist f'(x) = nanxn-1 (n - 1)an _ixn-2 + • • • + al •

Mit Hilfe der Produktregel kann die folgende Ableitungsregel leicht bewiesen werden.

1111 x

Sei fi : X -> JR eine beliebige differenzierbare Funktion und 12 : X -> JR mit c. Dann ist f = fl • f2 = c • h für alle u E X differenzierbar und es gilt f (x) = c • fi(x).

LEMMA 8.18

Beweis. Es gilt .f. (x)= 0 und somit ist (x) = .6(x) • 12(x) + h(x).f(x)= cwie behauptet.



8.2.3 Die Kettenregel

Die Ableitung der Verkettung zweier differenzier- Funktionswertes der inneren Funktion und der barer Funktionen entspricht dem Produkt der Ab- Ableitung der inneren Funktion. leitung der äußeren Funktion an der Stelle des

II PROPOSITION 8.19 Angenommen, die Funktion fi :

X -+ Y ist im Punkt u E X und die Funktion 12 : Y im Punkt v = fl (u) differenzierbar. Dann ist die Funktion 12 o fl : X -÷ JR, x 12(8(x)) differnzierbar in u mit (12 o fi)'(u)= .f(fi(u)) • fi(u).

Beweis. Wir führen die Kurzschreibweise t = fi (x) - fl (u) ein. Es gilt lim

.-,,,,

f2 0 fi (x) - f2 0 fl(u) = ii. f2(v + t) - f2(v) x-).. x-u x- u

lim

( tMv)

x-42., X - U

f2(v) x -u

(8.1)

150

RECHENREGELN FÜR ABLEITUNGEN •

Wir berechnen lim tf2(v) = hm f2(v)(fi(x)- fi(u)) = f2 (v) • lim f l (x) -f l(u) = f(v) fi(u). ->u x - u x->u X - U x->u X U

(8.2)

Ferner gilt, sofern t 0, t lim f2(v + t) - f2(v) - Wv) = hm x —u .—>u x —

(v t) — f2(v) f(v))

Nach Definition der Ableitung ,A(v) bzw. fl(u) gelten 0 = lim f2 (x) f2 (v) x->v

lim f2(v s) f2(V) S10

X -v

f(v)

fi u) = lim fi(x) b(u) = lim X -41,

X

U

x>u X

U

Also gilt + t) - f2(v) - t.A(v) lim f2(v = 0. x —u

Schließlich folgt die Behauptung, wenn man (8.2) und (8.3) in (8.1) einsetzt.

(8.3)

■ 1

BEISPIEL 8.20

Sei f : —> JE mit xl—> (x3 — 1)2. Dann ist f für alle u E IR differenzierbar.

Es ist f = f2 o fi mit fi (x) = X3 - 1und f2(x) = x2. Es ist für alle x E R (x)

= 3x2

und

f(x)= 2x.

Wähle nun u E beliebig aber fest. Dann ist nach Proposition 8.19 (u) = J. (fi(u)) • fl(u)= 2(u3 — 1) • 3u2 = 6(U3 - 1)212

Da u beliebig aus R gewählt ist, finden wir die Ableitung f / (x) = 6(x3 — 1)x2 für alle x E IR.

8.2.4 Die Quotientenregel

Ist eine Funktion gleich dem Quotienten zweier differenzierbarer Funktionen, lässt sich die Ableitung mit Hilfe der Ableitungen dieser beiden

Funktionen beschreiben. Um das einzusehen, berechnet man zunächst die Ableitung der Funktion f(x) = •

151

RECHENREGELN FOR ABLEITUNGEN

LEMMA

8.21 Die Funktion f :

\ {0} mit x

ist differenzierbar. Es gilt

f (x) = - .

Beweis. Wir zeigen zunächst, dass die Funktion f stetig in u E 111 \ {O} ist. Denn es ist f (x) - f (u) =

1 1 u x x u xu,

(8.4)

Wenn lu - xi hinreichend klein ist, gilt I > ä • 14 Dann zeigt (8.4), dass If (x)— f(u)1


3. Aus Proposition 8.19 folgt 11 (3- ) (u) = (h o f 2)' (u) = f2(u) • h' (f 2(u)) = Mu)

f(u)

f 2 (u)2 )

f 2 (u)2

(8.8) ■

Aus (8.7) und (8.8) folgt schließlich die Behauptung. BEISPIEL 8.23 Sei f : R \ {0, —3} —> R mit xi—> (:7 2 _12x2 . Dann ist f für alle u E R \ {0, —3} differenzierbar. Es ist f = t mit f1 (x) (x — 1)2 und f2(x) = x2 + 3x. Es ist für alle x E R f;.(x) =- 2(x — 1)

und

f(x) = 2x + 3.

Wähle nun u E R \ {0, —3} beliebig aber fest. Dann ist nach Proposition 8.19 f(u) =

fl(u) • f 2 (u) — (u) • .f. (u) f2(u)2

2(u — 1) (u2 + 3u) — (u — 1)2(2u + 3) (u2 3u)2

Da u beliebig aus JR gewählt ist, finden wir die Ableitung f'(x) = 6(x3 — 1)x2 für alle x E R.

8.2.5 Die Ableitung der Umkehrfunktion

Der Beweis des folgenden Satzes benötigt einige sprengen. Er ist allerdings sehr nützlich, weshalb Überlegungen, die den Rahmen dieser Darstellung wir ihn zumindest formulieren.

SATZ 8.24 Sei f : (a, b) (c, d) eine stetige und bijektive Funktion, die im Punkt u E (a, b) differenzierbar ist. Dann ist die Umkehrfunktion f : (c, d) —> (a, b) im Punkt v = f (u) differenzierbar mit Ableitung f -1(u )

1u)

fl

BEISPIEL 8.25 Sei f : (1,2) —> (1,4) mit x 1—> x2 . Die Funktion f ist für alle u E (1,2) differenzierbar und bijektiv. Es ist die Umkehrfunktion f —1 : (1,4) —> (1,2) mit xl—> Da f'(x) = 2xist, gilt nach Satz 8.24, dass (f —1)' (x) = zx für alle x E (1,4).

153



DER MITTELWERTSATZ (DER DIFFERENTIALRECHNUNG)

8.3 Der Mittelwertsatz (der Differentialrechnung)

Was sagt die Ableitung zusätzlich zu dem Aspekt bale Verhalten einer Funktion aus? Wir beginnen der lokalen linearen Approximation über das glo- mit der folgenden Beobachtung. ft.) SATZ 8.26 (DER SATZ VON ROLLE) Sei f : [a, b] —› R eine differenzierbare Funktion mit f (a) = f (b) = 0. Dann gibt es ein c E (a, b) mit f (c) = 0.

Beweis. Wir unterscheiden zwei Fälle. ABBILDUNG 8.4

Der Satz von Rolle besagt, dass zwischen zwei Nullstellen einer differenzierbaren Funktion die Ableitung an mindestens einer Stelle 0 ist.

Fall 1 (Es gibt ein d E (a, b) mit f (d) > 0.): Nach Lemma 7.26 ist f ([a, b]) = {f (x) : x E [a, b])-

nach oben beschränkt. Es existiert also das Supremum s = sup f ([a, b]) und demnach wird das Supremum von einem c e (a, b) angenommen. Nach der Definition des Supremums gibt es zu jedem n E N eine Zahl yr, E [a, b], so dass — f (y7i )1 < Diese Folge (yri)nEN ist beschränkt und hat nach Satz 5.57 eine konvergente Teilfolge, die gegen eine Zahl c E [a, b] konvergiert. Es gilt also f (c) = s. Weil s > 0 ist, ist sicherlich c a und c b also c E (a, b). Wir zeigen nun, dass f' (c) = 0 gilt. Dazu nehmen wir an, dass gilt f' (c) # 0 . Dazu unterscheiden wir zwei Fälle. Fall 1.1 (f'(c) > 0): Dann gibt es eine kleines 5 > 0, so dass mit e = f (c) / 2 gilt f (c + 6) — f(c) > je, 5 —

> 0.

Daraus folgt aber, dass f (c + 5) > f (c) = s ist - ein Widerspruch zu der Tatsache, dass s = sup f ([a, b]). Also folgt f' (c) < 0. Fall 1.2 (f' (c) < 0): Dann gibt es entsprechend ein kleines 5 > 0, so dass mit E = — (c)/2 gilt f (c — 5) — f (c) >



— f' (c)

r

> 0.

Daraus folgt aber, dass f (c — 5) > f (c) = s ist, was wiederum ein Widerspruch zu der Tatsache ist, dass s = sup f ([a, b]). Also folgt f'(c) > 0. Es bleibt also nur die Möglichkeit, dass f ( c) = 0 ist. Fall 2 (Für alle d E (a, b) ist f (d) < 0.): In diesem Fall wenden wir das Argument aus Fall 1 auf die Funktion — f an und erhalten ein c mit — (c) = 0, also auch f' (c) = 0. Ist f (x) = 0 für alle x E (a, b), dann folgt unmittelbar, dass f (x) = 0 für alle x E (a, b).

154

DER MITTELWERTSATZ (DER DIFFERENTIALRECHNUNG) •

Der Mittelwertsatz der Differentialrechnung ist ei- heißt, der Satz von Rolle folgt aus dem Mittelwert- h=1 = ZU SATZ 8.27 ne allgemeinere Form des Satzes von Rolle. Das satz.

SATZ 8.27 (MITTELWERTSATZ DER DIFFERENTIALRECHNUNG)

Sei f : [a, b] -+ R differenzierbar.

Es gibt ein c E [a, b], so dass (c)

f (b) — f (a) b— a

Beweis. Die Funktion h : [a, —>

x

.f (x) — f (a)

f (bb) — f (a)

—a

(x — a)

erfüllt die Voraussetzungen des Satzes von Rolle. Es ist h(a) = f (a) — f (a) f(b2(a) (a a) = 0. Es ist h(b) = f (b) — f (a) f (b)b laf (a) (b a) = 0. Die Funktion h ist auf [a, b] nach Proposition 8.12 differenzierbar, weil f (x) und (x — a) differenzierbar sind.

Der Mittelwertsatz lässt sich folgendermaßen umschreiben: Für zwei Punkte auf dem Graphen einer differenzierbaren Funktion über einem Intervall [a, b] gibt es immer (mindestens) eine Stelle c E [a, b], an welcher die Ableitung mit dem Differenzenquotienten von a und b übereinstimmt. Siehe Abbildung 8.5. Die Differenzierbarkeit ist eine notwendige Voraussetzung für den Mittelwertsatz der Differentialrechnung. Eine Funktion, die zwar stetig ist, aber eine nicht differenzierbare Stelle besitzt, muss den Punkt mit der gesuchten Steigung nicht zwangsläufig besitzen. Siehe Abbildung 6. f( , )

Folglich existiert ein c e [a, b] mit 0=

(c) = (c)

f (b) — f (a)

b—a ■

Umstellen dieser Gleichung liefert die Behauptung.

BEMERKUNG 8.28 Ähnlich wie beim Zwischenwertsatz im Kontext der Stetigkeit, liefern der Satz von Rolle

L

und der Mittelwertsatz der Differentialrechnung nur je eine Aussage über die Existenz (mindestens) einer Stelle mit Ableitung 0 bzw. gleich dem Differenzenquotienten. Im Allgemeinen ist diese nicht eindeutig. Außerdem ist die Aussage jeweils nicht konstruktiv zu verstehen. Weder der Satz von Rolle, noch der Mittelwertsatz der Differentialrechnung gibt eine Vorschrift, wie man den Punkt mit der gewünschten Eigenschaft findet.

ABBILDUNG 8.5

_J

ZUSAMMENFASSUNG

Die Ableitung einer Funktion f ordnet nach Definition 8.1 einem Häufungspunkt u des Definitionsbereich den Grenzwert einer Hilfsfunktion zu. Diese Hilfsfunktion gu, für eine feste Stelle u, bildet jedes x E X\{u} auf den Differenzenquotienten von x und u über f

ab. Nach Proposition 8.6 folgt aus Differenzierbarkeit Stetigkeit. Proposition 8.8 gibt eine alternative Beschreibung der Ableitung als Approximation einer affin linearen Abbildung. Es kann für manche Funktionen die Ableitung der Ableitung angegeben werden.

Der Mittelwertsatz der Differentialrechnung garantiert für eine differenzierbare Funktion, dass es für zwei Punkte auf dem Graphen einer Funktion über einem Intervall [a, b) immer (mindestens) eine Stelle c E [a, b] gibt, an welcher die Ableitung mit dem Differenzenquotienten von a und b übereinstimmt.

155



DIE MEHRDIMENSIONALE ABLEITUNG

Man nennt sie nach Definition 8.10 eine höhere Ableitung. Proposition 8.12, 8.14, 8.19 und 8.22 formulieren die Summen-, Produkt-, Ketten- und Quotientenregel für Ableitungen, der Satz 8.24 ermöglicht das Ableiten der Umkehrfunktion Der Satz von Rolle (Satz 8.26) besagt, dass zwischen

zwei Nullstellen einer differenzierbaren Funktion die Ableitung an mindestens einer Stelle 0 ist. Der Mittelwertsatz der Differentialrechnung (Satz 8.27) garantiert für eine differenzierbare Funktion, dass es für zwei Punkte auf dem Graphen einer Funktion über einem Intervall [a, b] immer (mindestens) eine Stelle c E [a, b] gibt, an welcher die Ableitung mit dem Differenzenquotienten von a und b übereinstimmt.

b

ABBILDUNG 8.6

8.4 Die mehrdimensionale Ableitung

Die Differenzierbarkeit ist eine notwendige Voraussetzung für den Mittelwertsatz der Differentialrechnung. Eine Funktion, die zwar stetig ist, aber eine nicht differenzierbare Stelle besitzt, muss den Punkt mit der gesuchten Steigung nicht zwangsläufig besitzen, wie in der obigen Skizze ersichtlich. Die Funktion besitzt in d eine Stelle, an der f nicht differenzierbar ist. Sonst ist die Ableitung entweder 0 (links von d) oder 2 (rechts von d) und nicht 1, wie der Differenzenquotient von a und b.

f(,)

Bisher haben wir uns mit Funktionen f : X —› R von einer Teilmenge X c IR in die reellen Zahlen befasst. Häufig treten aber auch Funktionen f:X IR"' von einer Teilmenge X c IR' in den IR"' auf. Lässt sich auch für solche Funktionen eine Ableitung einführen? Lassen sich auch solche Funktionen lokal durch eine lineare Funktion approximieren? Die Antwort lautet ja! Dazu benötigt man Grundkenntnisse der linearen Algebra - insbesondere mehrdimensionaler linearer Funktionen. Lineare Approximation für höhere Dimensionen

1511

Wir beschränken uns zunächst auf Funktionen f : X —> R mit X c I[8". Der R' ist ein ndimensionaler Vektorraum. Betrachtet man eine Funktion vom R" in den R"2 lässt sich diese in einem kartesischen Koordinatensystem verzeichnen. Anschaulich wird das nur für die Paare n = 1 und m = 1 bzw. m = 2, sowie n = 2 und m = 1.

Eine Funktion, welche aus dem R2 in die reellen Zahlen abbildet. Die Urbilder sind in der xi-x2 -Ebene verzeichnet, die Bilder auf der x3 -Achse. Das Bild ist ein gekrümmter R2, wenn man so möchte.

Für n = 1 und m = 1 liegt eine einfache reelle Funktion vor, wie wir sie schon sehr ausführlich studiert haben. Um eine solche eindimensionale Funktion (ihr Funktionsgraph ist eindimensional

yl ABBILDUNG 8.7

156

- etwas schwammig formuliert) in einem Koordinatensystem darzustellen, benötigt man dort zwei Dimensionen. Auf der x1-Achse werden die Urbilder und auf der x2-Achse die Bilder verzeichnet. Eine lineare Funktion ist in diesem Fall eine Gerade. In der Sprache der linearen Algebra ein Untervektorraum - streng genommen nur dann, wenn sie durch den Ursprung verläuft. Sonst entspricht sie einem „verschobenen" Untervektorraum - man spricht dann von einem affinen linearen Raum. Für n = 2, also einer zweidimensionalen Funktion f : X —> R mit X c R2, benötigt man in der Darstellung schon ein dreidimensionales Koordinatensystem. Auf der xi-x2-Ebene werden die Urbilder und auf der x3-Achse die Bilder verzeichnet. Ein Beispiel ist die Funktion f : R2 -# E8 mit 2 1 f (x) = 4 — — • xi — — • x. 2 2 Dabei ist x E R2 eine zweidimensionaler Spaltenvektor mit den Komponenten xl und x2. Ein Ausschnitt dieser Funktion ist in Abbildung 8.7 skizziert. Der Graph dieser Funktion sind die Punk-

DIE MEHRDIMENSIONALE ABLEITUNG

Fall zweidimensional sind. Das Bild einer solchen Funktion ist eindimensional, lebt aber im R3.

to des R3 mit

Ein Beispiel ist die Funktion f : JR wobei x E 1R2 beliebig gewählt werden darf.

f(x) =

Eine lineare Funktion in diesem Fall (n = 2 und m = 1) zeichnet sich dadurch aus, dass ihr Bild in dem Koordinatensystem eine Ebene darstellt. Eine Ebene ist die zweidimensionale Verallgemeinerung einer Gerade. In der Sprache der linearen Algebra ist eine Ebene ein zweidimensionaler Unterraum des R3 - streng genommen nur dann, wenn sie den Ursprung enthält. Sonst entspricht sie einem „verschobenen" Untervektorraum - man spricht dann von einem affinen linearen Raum. Ein Hauptresultat der linearen Algebra ist die Beobachtung, dass lineare Funktionen durch Matrizen beschrieben werden. Mit diesen Einsichten lassen sich die Fragestellungen rund um die Ableitung auf diesen zweidimensionalen Fall übertragen. Gibt es eine Ebene, welche den Funktionsgraphen lokal gut approximiert? Der Fall n = 1 und rn = 2 ist dem letzten Fall recht ähnlich. Zur Darstellung wird ebenfalls ein dreidimensionales Koordinatensystem benötigt. Auf der xi-Achse werden die Urbilder und in der x2x3-Ebene die Bilder verzeichnet, die in diesem

R2 mit

.

Dabei wird eine reelle Zahl xi E R auf einen zweidimensionalen Spaltenvektor mit den Komponenten (xi ) = xi und f2 (x ) = xl abgebildet. Ein Ausschnitt dieser Funktion ist in Abbildung 8.8 skizziert. Auch hier lässt sich eine lokale Approximation mittels einer affin linearen Funktion durchführen. In diesem Fall ist es eine Gerade, welche einem verschobenen eindimensionalen Unterraum des R3 entspricht. Allgemein kann man eine Funktion f : Rn Rm in einem Koordinatensystem der Dimension 72+ 7/1 darstellen. Übersteigt n m den Wert 3, ist dies nicht mehr geometrisch anschaulich zu zeichnen. Dennoch lässt sich eine Matrix suchen, die einen n-dimensionalen Unterraum im Rn±m beschreibt, dessen verschobenes Bild die Funktion f in einer Umgebung um die Bilder eines Punkts u E Rn lokal approximiert. Die Matrix ist aufgrund der Dimensionen von Urbild- und Bildraum eine m x nMatrix. Die mehrdimensionale Verallgemeinerung der Ableitung in einem Punkt ist also eine Matrix.

DEFINITION 8.29 Sei f : X -+ Rin eine Funktion und sei u E X ein Häufungspunkt von X. Die mit Funktion f ist differenzierbar im Punkt u, falls es eine affin lineare Funktion Lu(x) : X f (u) + Df (U) • (X u) für eine Matrix Df (U) E R" gibt, so dass die Funktion gu : X \ {u} JR x

Mit

x

f2(x)

111(x) - Lu(x)II llx - ull

ABBILDUNG 8.8

Eine Funktion, welche aus den reellen Zahlen in den 1112 abbildet. Die Urbilder sind auf der xi-Achse verzeichnet, die Bilder auf der x2 -x3-Ebene. Das Bild ist eine durch den Raum gekrümmte reelle Achse, wenn man so möchte.

WI ZU DEFINITION 8.29 Die Ableitung ist hier nicht ein Wert oder die Steigung einer Tangenten an den Funktionsgraphen, wie wir das aus dem Eindimensionalen kennen. Hier wird eine Ebene oder allgemein ein Untervektorraum als Bild einer Matrix beschrieben, welche(r) sich wie eine Tangente an den Funktionsgraphen anschmiegt, ihn an der Stelle u berührt. Die Norm ist beliebig, man könnte die euklidische wählen. Die Aussage hängt nicht von der Wahl der Norm ab, jede Norm tut's, denn alle Normen sind über den reellen Zahlen äquivalent, ohne an dieser Stelle ins Detail zu gehen.

157

II DIE MEHRDIMENSIONALE ABLEITUNG für x

u gegen 0 konvergiert. In diesem Fall nennen wir die Matrix Df (u) die Ableitung von f in u.

1( 1

f(x)

.1

ABBILDUNG 8.9

In Beispiel 8.30 wird die Ableitung der skizzierten Funktion an der Stelle u mit ui = 1 und u2 = 0 berechnet. Hier wird der Aspekt der lokalen Approximation der Ableitung durch eine lineare Funktion veranschaulicht. Die blau-graue Ebene entspricht dem verschobenen Bild der Ableitung in u. Wenn man ganz nahe „heranzoomt" stellt man fest, dass die orangene Oberfläche, der Graph von f, sich um u an die blau-graue Ebene anschmiegt.

BEISPIEL 8.30 Betrachte

die Funktion f :R2 —> IR mit 1 1 f(x) = 4 — — 2 • xi — — 2 • x2.

Sie ist in jedem Punkt ihres Definitionsbereichs differenzierbar. Wir betrachten beispielhaft den Punkt u =I 1 o) • Die Ableitung an dieser Stelle entspricht der Matrix

D f (u) = (-1 o), die zugehörige affin lineare Funktion ist Lu(x) = 41 + D f (u) • x. Dazu betrachtet man die Funktion : X \ ful IR. mit x1—•>.

(x) — Lu(x)II

II•

•4 —

• 4+

(x1 —S12)

Wählt man als Norm die euklidische (im eindimensionalen Fall entspricht die euklidische Norm dem Absolut-

158

DIE MEHRDIMENSIONALE ABLEITUNG 111

betrag), dann erhält man

1-1 - 2. xi - 2. 4 + xi i \ A., -1)2 + 4

9u(x) = 1-1 — 1 • xi — • 4 + xi I

(., -1) x2

v/x2i _ 2xi

=

2• 11+ 4 +

-

4 - 2., +1 + 4

2

+

1

2

\/X21 - 2X1 + 1 + x22'

Der letzte Ausdruck konvergiert für x —> u gegen 0, wie man leicht nachrechnen kann. Siehe Abbildung 8.9. Um nicht immer eine so umfangreiche Betrachtung, wie in Beispiel 8.30 gesehen, durchführen zu müssen, wäre es schön, mehrdimensionale Ableitungsregeln (evtl. auch nur für eine Klasse von Funktionen) wie im eindimensionalen Fall zu for-

mulieren. So einfach ist es aber leider nicht. Doch für viele Fälle gibt es einen gangbaren Weg, die Ableitung einer mehrdimensionalen Funktion zu berechnen, mittels partieller Ableitungen.

8.4.1 Die partielle Ableitung Eine mehrdimensionale Funktion f : X —> W' mit X c R kann man auch nur „teilweise" ableiten. Wählt man einen Punkt u E X aus dem Definitionsbereich, wird der Funktionsgraph einer Komponente f, durch f (u) mittels einer Ebene geschnitten, die senkrecht zu einer Koordinatenachse und parallel zu den übrigen Koordinatenachsen verläuft. Das Ergebnis ist eine eindimensionale Funktion. Man erhält sie im Übrigen auch, indem man für alle i E {1, , n} \ {k} in der Funktionsgleichung von fi die Werte xi = ui einsetzt. Die resultierende eindimensionale Funktion, die nur noch eine Funktionsvariable besitzt (nämlich

xk), kann man dann nach xk, wie im Eindimensionalen gewohnt, ableiten. Das Ergebnis ist die partielle Ableitung von fi in „Richtung" xk. Man verwendet die Bezeichnung „Richtung" an dieser Stelle, weil die partielle Ableitung die Steigung in die von der Koordinatenachse xk vorgegeben Richtung angibt. Um das nun umrissene Vorgehen formal durchzuführen, müssen zunächst Hilfsmengen definiert werden. Sie sind nichts anderes als die Definitionsbereiche der projizierten Funktion, also im Prinzip der projizierte Definitionsbereich von f .

DEFIN ITION 8.31 Sei v. E Rn. Dann definieren wir für alle j e Vj (u) = Ix E

: xi =- ui

, n} die n Mengen

lel ZU DEFINITION 8.31 Zunächst wählt man sich einen Punkt u E X aus. Die Mengen 17., (u) beinhaltet alle Vektoren des IR', welche in allen bis auf den j-ten Einträgen mit u übereinstimmen. Anschaulich gesprochen, legt man eine Gerade durch den Punkt u, welche senkrecht auf dem Unterraum steht, der von den Koordinaten außer x j aufgespannt wird. Die Menge x, (u), für eine gegebene Menge X c R", ist die Projektion des Schnitts von X und V, (u) auf die xj-Achse. Ersetzt man den j-ten Eintrag von u durch eine reelle Zahl, die in X j (u) liegt, verlässt man die Menge X nicht. Die Funktion p"'i(z) ersetzt in dem Vektor u nur den j-ten Eintrag durch z.

für alle i /=j} .

159



DIE MEHRDIMENSIONALE ABLEITUNG

Sei eine Menge X C W gegeben. Für jedes u e X und j = 1, . . . , n definieren wir die n Mengen

4 3—

m

Xi (u) =

2

Sei z E R und u

E Ilen. Dann

E : 3v E Vi (u) n X mit vi = z} .

definieren wir die Funktion pu'i : R —› lir mit piu 'j (z) =

ABBILDUNG 8.10

z sonst.

El

Die Mengen X1,„ (grün) und X2,, (blau) aus Beispiel 8.32. Dabei wird jeweils der Schnitt einer Gerade durch den Punkt a, die senkrecht auf einer Koordinatenachse steht auf diese projiziert.

{ ui falls i # j

r BEISPIEL 8.32 Betrachte die Menge

X = {x E IR2 : 1 < xi < 3 und 2 < x2 < 4}, deren Punkte im Koordinatensystem ein Quadrat bilden. Für a = 1 3 I E X ist

5

X t (a) = [1, 3] und X2,a = [2, 4].

Tatsächlich gilt für jeden Punkt in x E X, dass (x) = [1, 3] und X2,x = [2, 4]. Siehe Abbildung 8.10. L

BEISPIEL 8.33 Betrachte die Menge X = Ix E Ek2 : 1 < xi — x2 < 1 und 2 < x2 < 41,

ABBILDUNG 8.11 SM

deren Punkte im Koordinatensystem eine diagonal verlaufende Fläche bilden. Für

Die Mengen X1,„ (grün) und X2,, (blau) sowie X1,, (grün) und X2,,, (blau) aus Beispiel 8.33. Dabei wird jeweils der Schnitt einer Gerade durch den Punkt a bzw. c, die senkrecht auf einer Koordinatenachse steht auf diese projiziert.

a=

160

b= (01)

und

c

4)

= 3

ist Xi(a) = [0, 2] und X2,a = [0, 2],

ZU DEFINITION 8.34 gl Bei der partiellen Ableitung von L an einer Stelle u nach x, werden alle Koordinaten ungleich xj auf den Wert von u gesetzt und die Ableitung in Richtung x, bestimmt. Schreibt man alle partiellen Ableitungen an einer Stelle u in eine Matrix, nennt man diese die Jacobi-Matrix von f in Punkt u. Ähnlich, wie man das für Ableitungen im eindimensionalen Fall kennt, können mehrdimensionale Funktionen auf ihrem ganzen Definitionsbereich partiell differenzierbar sein. Man kann dann n - m viele Funktionen definieren, welche jedem Punkt des Definitionsbereichs seine partielle Ablitung zuordnen.

(1

(b) = [-1, 1] und X2,a = [0, 2],

1 2 , 42] und X2,a = [3, 5]. Xi(c) = [2 -

Siehe Abbildung 8.11. J

L

Wir sind nun in der Lage, die partiellen Ableitun- folgenden Beispiels 8.36, möchten wir dann die gen zunächst zu definieren. Anhand des darauf geometrische Interpretation erörtern. D EFINITION 8.34 Sei

X

c Rn und f

: X -+

km eine Funktion. Wir definieren für alle

x

E

DIE MEHRDIMENSIONALE ABLEITUNG •

und j = 1, . . . , n sowie i = 1,

, m die n • m vielen Funktionen

(z))

z 1—> A

: Xi (x) —> R,

Ist die Funktion fi u differenzierbar in ui, nennen wir ihre Ableitung die partielle Ableitung von f, nach x, im Punkt u, geschrieben als Ofi ux, ( u) =

,

und sagen, dass A an der Stelle u partiell nach x, differenzierbar ist. Sofern alle partiellen Ableitungen in u existieren, nennt man die m x n-Matrix Jf(U) = afi (- U OX ( )) i=1,...,m;j=1,...,n

die Jacobi-Matrix von f im Punkt u. Ist fi für alle u E X partiell nach xi differenzierbar, nennen wir die Funktion

afi

X

oxi

aA , --( u) az 3•

R,

f (r)

die partielle Ableitung von J..

4-

r

1

8.35 Das Bild der Jacobi-Matrix ist ein Untervektorraum, welcher von ihren n Spalten aufgespannt wird. Verzeichnet man die Funktion in einem Koordinatensystem, dann würde der Graph der zugehörigen linearen Funktion von n Spaltenvektoren aufgespannt. Jeder dieser Vektoren besteht aus einem Standardeinheitsvektor e(i) des Er, der um die entsprechende i-te Spalte der Jacobi-Matrix ergänzt wurde. BEMERKUNG

L

J 1 BEISPIEL

P."

8.36 Wir betrachten die Funktion f : R2 —› II8 mit 1

2

1

ABBILDUNG 8.12

2

f (x) = 4 — — • xi — — • x2 . 2

2

aus Beispiel 8.30 an der Stelle u = (1) . Die partiellen Ableitungen an dieser Stelle sind

af axi

( u)

= —1

und

af ax2

= 0.

deren Funktionsgraph dem Schnitt des Funktionsgraphen von Dazu betrachtet man die Funktionen f mit der x1-x3-Ebene entspricht und fi 2 u, deren Funktionsgraph dem Schnitt des Funktionsgraphen von f mit einer zur x2-x3-Ebene parallele Ebene durch u entspricht. Sie sind in Abbildung 8.12 skizziert. Es ist an der Stelle u2 = 0 abzuleiten. ft,t,u an der Stelle u i = 1 und

Die Funktion aus Beispiel 8.30 lässt sich mit Ebenen, die zu bestimmten Koordinatenachsen orthogonal verlaufen schneiden. Diese Schnitte entsprechen eindimensionalen Funktionen. Die Steigung in dem Punkt u entspricht dort den partiellen Ableitungen. Das rötlich unterlegte Koordinatensystem veranschaulicht die partielle Ableitung in x i -Richtung. Das gelblich unterlegte Koordinatensystem veranschaulicht die partielle Ableitung in x2 -Richtung.

161

DIE MEHRDIMENSIONALE ABLEITUNG

Es ist also die Jacobi-Matrix an der Stelle u = (1o die 1 x 2-Matrix der Form Jf(u) = ( - 1 o). Nach Bemerkung 8.35 wird die lineare Funktion also von den beiden Vektoren (20) und

(01 0)

aufgespannt und das ist in der Tat korrekt.

Die partielle Ableitung an einer Stelle u erhält dabei für die anderen Variablen den Wert von u man also, indem man j; nach x, differenziert und einsetzt und konstant belässt.

KOROLLAR 8.37 Sei X c R" und f : X —) Ern eine Funktion. Ist h für i E {1, ... m} auf ganz X nach xi für j e {1, , n} partiell differenzierbar, erhält man die partielle Ableitung e : X —› IR, indem man die Funktion fi als eine Funktion in der Variablen xi auffasst und nach x; ableitet. Die Variablen xi , .. • , xi-i, xi+1, • • • , x n werden dabei als Parameter aufgefasst. BEISPIEL 8.38 Wir

betrachten erneut die Funktion f : R2 mit 1 1 f(x)= 4 — —2 • xi — — • x22 . 2 aus Beispiel 8.30 und 8.36. Die Funktion ist auf ganz differenzierbar. Die partiellen Ableitungen sind '9 f • R 2 —›

L

tax ].

.

mit

R

r BEISPIEL 8.39 Wir

Of

ax1

(x) = xl

und

af : R2 -› R ax2

mit

af x) = —x2. ax2

1

betrachten die Funktion f :R3 -+ R2 mit fi (x) = 4 + sin (x3 )

und

f2 (x) = X2 + X3 • xl •

Die Funktion ist auf ganz R3 differenzierbar. Die partiellen Ableitungen sind allesamt Funktionen vom R3 in die reellen Zahlen mit ab a i

(x) = 5 •

af2 —x ) = x3, axi , ,

162

xl,

ab2 — (x) = 0, af2 —(x=1, ) ax2

J

— (x) = cos(x3) ax3 af2 , , — = x) xi• ax3

DIE MEHRDIMENSIONALE ABLEITUNG •

(2

An der Stelle u = 1 ausgewertet ist o

ahi (u) = 5 • 24 = 80, ax axi (

2) = 0,

—(u) = o, ax2 af2

ax2

(u) = 0,

—(u)= cos(o) =1, ax3 8,f2 u) = 2.

ax3 (

Wir möchten nun den Zusammenhang der mehr- ist, kann man die mehrdimensionale Ableitung dimensionalen Ableitung und den partiellen Ab- über die partiellen Ableitungen bestimmen. leitungen erörtern. Wenn man in guter Verfassung

8.40 Sei X C IV und f : X -+ IV eine Funktion, die in u E X differenzierbar ist. Dann ist L in u partiell nach x;differenzierbar für alle i E {1, . m} und j E {1, . , n}. Die Jacobi-Matrix in u entspricht der Ableitung D f (u) .

El LEMMA

7 BEISPIEL 8.41 In

Beispiel 8.30 haben wir gesehen, dass die Ableitung der dort behandelten Funktion an der

Stelle u = (o) der Matrix D f (u) = (-1 o) entspricht. In Beispiel 8.36 haben wir gesehen, dass die Jacobi-Matrix der selben Funktion an der Stelle u = (1) der Matrix J f (u) =. (-i o) entspricht. Sie sind identisch.

BEMERKUNG

8.42 Die Umkehrung von Lemma 8.40 gilt nicht im Allgemeinen. Aus der Existenz der Jacobi-

Matrix folgt nicht die Existenz der Ableitung an dieser Stelle. L

J

Man kann nach Lemma 8.40 also eine mehrdimen- renzierbarkeit, dass anhand der partiellen Ableisionale Funktion über die partiellen Ableitungen tungen eine Aussage darüber treffen kann, ob die bestimmen, wenn sie differenzierbar ist. Das fol- Funktion überhaupt differenzierbar ist. gende Lemma 8.43 liefert ein Kriterium für Diffe-

8.43 Sei X C Rn und f : X Wm eine Funktion, die auf ganz X partiell differenzierbar ist. Sei u E X. Sind die partiellen Ableitungen in einer Umgebung um u stetig, dann ist f in u

1111 LEMMA

163



DIE MEHRDIMENSIONALE ABLEITUNG

differenzierbar. ■

Beweis. Der Beweis übersteigt in seiner Komplexität den Anspruch dieser Darstellung.

Die Richtungsableitung So, wie die partiellen Ableitungen anschaulich tungen beschreiben, kann man diese Steigung in gesprochen die Steigung in die Koordinatenrich- beliebige Richtungen bestimmen.

DEFINITION 8.44 Sei X c IR" und f : X —> Irn eine Funktion. Sei außerdem v E IEV ein normierter Vektor und u E X. Wir definieren die Menge Xv (u)={hEIR:u+h•veX} und eine Funktion ft, :

xv(u)

R

mit h

(u h • v).

Ist f„ in 0 differenzierbar, dann ist die Richtungsableitung von f in Richtung v an der Stelle u definiert als Df,v (U) = fv (0).

BEISPIEL

8.45 Wir betrachten erneut die Funktion f :R2 -+ R mit 1 1 f(x) = 4 — —2 • xi — 2— • 4.

aus Beispiel 8.30 und 8.36 an der Stelle u = (öl und berechnen dort die Richtungsableitung in Richtung der normierten Vektoren v =( - I -v-i

und

—v— — G i‚

).

Zunächst beobachten wir, dass gilt Xv (u) = X_v (u) =1R. Nun betrachten wir die Hilfsfunktionen 1 1 2 1 (0 + h . ) = 3- — V-2- • h Mit fv (h)= 4 — — 2 • (1 4- h. 1 ) 2 -• fv : X, (u) —› R 2 i 2 /i f _v : X,(u) —> R

mit f_ v (h)

)2 _ 1_ . (0 _ h

= 4 _ 2 . (1 _ h . -‘/

1 )2 = 3 1 + 2 . /2

.h

und können die Richtungsableitungen berechnen. Wir erhalten Df,v(u) = g(0) = N/2

und

Df,v (u) = g(0) = ----‘,/.

Wir berechnen noch die Richtungsableitung in Richtung v' = ( —1o I . Zunächst betrachten wir wieder die

164

DIE MEHRDIMENSIONALE ABLEITUNG •

Hilfsfunktion 2 1 ,2 1 1 h) — — • (0 ± h • 0) = 3- + h — — • h2 2 2 2 und können dann die Richtungsableitung berechnen. Wir erhalten f ur : X, (U) —> IR

mit f v ,(h)= 4 —

1

— 2

• (i. —

D f,„, (u) = f,',, (0) = 1. L

J



1

BEMERKUNG 8.46 Dass die Richtungsableitungen entgegengesetzter Vektoren (falls beide existieren), wie in Beispiel 8.45 gesehen, betragsmäßig gleich aber mit unterschiedlichem Vorzeichen versehen sind, ist allgemein richtig.

L

J

Der Gradient

Betrachte eine Funktion f : X R für eine Menge X c IV und einen Punkt u E X. Man kann mittels partiellen Ableitungen nicht bloß die Jacobi-Matrix konstruieren, welche in diesem Fall eine 1 x n-Matrix ist (also eine Matrix mit einer Zeile und m Spalten), sondern auch einen Spaltenvektor, dessen Einträge die partiellen Ableitungen von f an der Stelle u sind. Dieser Vektor "lebt" im Urbildraum lir, gibt dort also eine Richtung vor und hat eine Länge. Beides hat eine Bewandtnis. Ist f an einer Stelle u differenzierbar, so zeigt der Gradient(envektor) in die Richtung des steilsten Anstiegs der Ebene, welche zu der Ableitung an dieser Stelle gehört und die Länge entspricht der Richtungsableitung an dieser Stelle. Da die Ableitung die lokale Approximation der Funktion an

der Stelle u ist, kann man auch formulieren, dass der Gradient in die Richtung des steilsten Anstiegs der Funktion an der Stelle u zeigt. Seinen Namen verdankt der Gradient seiner Verwendung in der Physik. Der Verlauf der Änderung einer physikalischen Größe in Abhängigkeit vom Ort wird dort als Gradient bezeichnet. Der Gradient einer solchen Größe gibt für jeden Ort an, wie sehr sich die Größe ändert und in welcher Richtung die Änderung am größten ist. Auf einer topographischen Höhenkarte ist der Gradient implizit zu finden. Er steht dort beispielsweise senkrecht zu den Höhenlinien und gibt für beliebige Punkte der Ebene an, in welche Richtung der steilste Anstieg zu finden ist und wie stark dieser ist.

DEFINITION 8.47 Es sei f : X -t R für eine Menge X c IV eine Funktion und ein Punkt u E X gegeben, so dass f in u partiell in alle Richtungen differenzierbar ist.

Es wird der Vektor 9'94 ( u )

grad f (u)

=

(.

:

e r

IM ZU DEFINITION 8.47 Der Gradient an einer Stelle ist ein Vektor, dessen Einträge den partiellen Ableitungen an dieser Stelle entsprechen - es sind also tatsächlich reellwertige Einträge. Die Funktion, die ebenfalls als Gradient bezeichnet wird, bildet jede Stelle des Definitionsbereichs von f auf den Gradienten an dieser Stelle ab. In den einzelnen Komponenten dieser Funktion stehen die partiellen Ableitungen von f.

aa.fr.. ( u )

165

U DIE MEHRDIMENSIONALE ABLEITUNG

als der Gradient von f an der Stelle u bezeichnet. Ist f auf ganz X differenzierbar, bezeichnen wir die Funktion grad f : X --+ IR"` mit u grad f (u) als den Gradient von f . r BEMERKUNG 8.48 Es gibt alternative Notation für den Gradienten. In der Vektoranalyse taucht er in der Regel als Nabla-Operator auf, dessen Symbol V (ein auf dem Kopf stehendes Delta) ist, welches selbst auch als Nabla bezeichnet wird. Manchmal schreibt man auch oder grid um deutlich zu machen, dass es sich um einen Vektor handelt.

e

r-

7 BEISPIEL

8.49 Wir betrachten erneut die Funktion f : R2 —> R mit f (x) =

4—

1

2

• xi —

2 • x2 .

1

aus den Beispielen 8.30 bis 8.36 an der Stelle u = (10 I . Der Gradient dort ist grad f (u) =

1 '

L

Der in der Einleitung angesprochene geometri- Richtungsableitung, seine Länge entspricht der schen Interpretation des Gradienten möchten wir Größe dieser Richtungsableitung. nun nachspüren. Er zeigt in Richtung der größten

LEMMA 8.50 Es sei f : X —› IR für eine Menge X c IR' eine Funktion und ein Punkt u E X gegeben, so dass f in u partiell in alle Richtungen differenzierbar ist. Dann zeigt der Gradient in die Richtung der größten Richtungsableitung. Die Ableitung in diese Richtung entspricht der Länge des Gradienten, also D f,gradf(u)(u) = Ilgradf (u)112.

II

BEISPIEL

8.51 In Beispiel 8.45 haben wir für die Funktion f : IR2 —> R mit f(x) = 4 _ 21 _ x2

1 x2

2

2

aus Beispiel 8.30 und 8.36 an der Stelle u = (10 die Richtungsableitung in verschiedene Richtungen berechnet. Unter anderem haben wir, wie Beispiel 8.49 erhellt, auch die Richtungsableitung des Gradienten berechnet. Es ist gradf(u) = (-01)

166

und

D f ,gradf(u)(u) = 1.

DIE MEHRDIMENSIONALE ABLEITUNG III

Tatsächlich zeigt dieser Vektor in die Richtung des steilsten Anstiegs und mit = \/ (-1.)2 + 02 = 1

ligradf(u)112

L

stimmt die Länge des Gradienten mit der Richtungsableitung in seine Richtung überein. Siehe auch nochmal Abbildung 8.9.

J

Für Anwendungen hilfreich ist das folgende Lem- Vektor Richtungsableitung 0 hat. Es ist eine schöne ma 8.52. Es schlussfolgert aus der Tatsache, dass Übung der linearen Algebra und grundlegenden der Gradient in Richtung des größten Anstiegs Analysis, dies zu beweisen. zeigt, dass jeder zu dem Gradienten orthogonale 8.52 Es sei f : X —> R für eine Menge X c RV eine Funktion und ein Punkt u e X gegeben, so dass f in u partiell in alle Richtungen differenzierbar ist. Sei v orthogonal zu grad f (u). Dann ist D f,v(U) = 0.

1111 LEMMA

Beweis. Der Beweis wird dem Leser zur Übung überlassen.



8.4.2 Höhere partielle Ableitungen Wie im eindimensionalen Fall lassen sich partielle höheren partiellen Ableitungen benötigt man im Ableitungen wieder partiell ableiten. Vorausset- Zusammenhang von Extremwerten von mehrdizung dabei ist natürlich, dass die partielle Ablei- mensionalen Ableitungen. tung überhaupt partiell differenzierbar ist. Solche DEFINITION 8.53 Es sei f : X —› IR eine auf ganz X c IV nach x, partiell differenzierbare Funktion. Ist die partielle Ableitung e für u E X partiell nach x, differenzierbar, bezeichnen wir mit 82f

lb ZU DEFINITION 8.53 Man bezeichnet die partiellen Ableitungen der partiellen Ableitung einer Funktion als ihre „höheren" partiellen Ableitungen.

eXiaXj (u)

die höhere partielle Ableitung (der Ordnung 2) von f nach x, und x an der Stelle u. Ist 1 ' L auf ganz X partiell nach x, differenzierbar, bezeichnen wir die Funktion

a2 oxi oxj

:

—> IR,

82 , u >axiaJx (u)

167



DIE MEHRDIMENSIONALE ABLEITUNG

als die höhere partielle Ableitung (der Ordnung 2) von f nach xi und xj.

BEMERKUNG 8.54 Das Konzept der höheren partiellen Ableitung lässt sich, wie im Eindimensionalen, iterieren. So könnte man unter den richtigen Voraussetzungen eine partielle Ableitung beliebig großer Ordnung erhalten, zum Beispiel

a5 f ax28x30x5ax2Oxi(u). Dabei gibt die Reihenfolge im Nenner vor; in welcher Reihenfolge partiell differenziert wird. Diese Reihenfolge ist im Allgemeinen wichtig. Nur unter bestimmten Voraussetzungen darf man sie ändern, wie beispielsweise der als Satz von Schwarz bekannte Satz 8.56 formuliert. L

J

rBEISPIEL 8.55 Wir

betrachten die Funktion f : 1R3 --> IR mit f (x) = x5i sin(x3) + x2 • x32 .

L

ZU SATZ 8.56

A

Es gilt, ohne zu sehr ins Detail zu gehen, dass unter den Voraussetzung des Satzes gilt a2f .92 f OXiaX,



aXiOXy .

Zunächst partiell nach xi und dann nach xi abzuleiten oder umgekehrt führt zu dem selben Ergebnis.

Die Funktion ist auf ganz R3 partiell in jede Richtung differenzierbar. Es sind die höheren partiellen Ableitungen beispielsweise 02 f 02f 02 f (x) = (), (x) 2 • xi (x) = 2 • x3. axi ax 2 ax3ax 2 Ox2ax 3

Dass die partiellen Ableitungen nach x3 und x2 bzw. x2 und x3 der Funktion aus Beispiel 8.55 identisch sind, ist kein Zufall. Sind die partiellen Ableitung höherer Ordnung stetig, kann man die Reihenfolge der „Richtungen"vertauschen, in

welche man partiell differenziert. Der Satz trägt den Namen zu Ehren von Hermann Amandus Schwarz (1843-1921), wobei er auch unter der Bezeichnung Satz von Clairaut oder auch als YoungTheorem bekannt ist.

EI

SATZ 8.56 (SATZ VON SCHWARZ) Sei f : X —› IR eine auf ganz X c IV mindestens 2-mal partiell differenzierbar, so dass diese partiellen Ableitungen stetig sind. Dann ist die Reihenfolge der partiellen Ableitungen unerheblich.

Beweis. Der Beweis des Satzes ist umfangreich. Wir geben ihn hier nicht an, nehmen den Satz aber

dankbar zur Kenntnis. BEMERKUNG 8.57 Der Satz von Schwarz kann iterativ angewendet werden. Die Reihenfolge der partiellen Ableitungen ist auch in solchen von höherer Ordnung unerheblich, wenn diese nur allesamt stetig sind.

168



EXTREMSTELLEN FÜR EINDIMENSIONALE FUNKTIONEN •

ZUSAMMENFASSUNG

Definition 8.29 verallgemeinert das Konzept der Ableitung auf mehrdimensionale Funktionen. Eine Matrix tritt an die Stelle der Ableitung. Solche Ableitungen lassen sich häufig über partielle Ableitungen bestimmen. Mit Definition 8.31 werden diese in Definition 8.34 eingeführt. Die partiellen Ableitungen können in der Jacobi-Matrix verzeichnet werden. Korollar 8.37 bringt die praktische Berechnung partieller Ableitungen auf den Punkt. Sei X C IV und f : X --> Rm eine Funktion. Ist f, für i E {1, .. , rn} auf ganz X nach xj für j E {1, , n} partiell differenzierbar, erhält man die partielle Ableitung e%- : X —› R, indem man die Funktion fi als eine Funktion von R nach IR in der Variablen x j auffasst und nach xi ablei, xi _i, xj+i, ,x7 , werden tet. Die Variablen

dabei als Parameter aufgefasst. Nach Lemma 8.40 ist für eine differenzierbare Funktion die Jacobi-Matrix gleich ihrer Ableitung. Lemma 8.43 gibt ein Kriterium für Differenzierbarkeit im Mehrdimensionalen. Sind die partiellen Ableitungen in einer Umgebung um u stetig, dann ist eine Funktion in u differenzierbar. Partielle Ableitungen sind ein Spezialfall der Richtungsableitung, die in Definition 8.44 eingeführt wird. Der Gradient (Definition 8.47) zeigt in Richtung der größten Richtungsableitung, seine Länge entspricht der Größe dieser Richtungsableitung, wie Lemma 8.50 bestätigt. Es können höhere partielle Ableitungen definiert werden (Definition 8.53). Der Satz von Schwarz (Satz 8.56) garantiert, dass die Reihenfolge der partiellen Ableitungen unerheblich ist, wenn die partiellen Ableitungen stetig sind.

8.5 Extremstellen für eindimensionale Funktionen Ziel ist es, über die lokale Entwicklung einer Funktion Aussagen zu treffen und dazu die Ableitung als Werkzeug zu verwenden. Zum Beispiel, um den Zusammenhang von Steigung bzw. Wachstum einer Funktion und dem Vorzeichen der Ableitung

an dieser Stelle herzustellen oder lokale Extremwerte mit Nullstellen der Ableitung zu charakterisieren. Dies wir im Kontext von Kurvendiskussionen in der Schule behandelt.

8.5.1 Wachstum von Funktionen Um etwas über extreme Werte einer Funktion aussagen zu können, studiert man zunächst ihr Wachstumsverhalten. Die folgenden Begriffe sind

schon aus dem Kontext von Folgen bekannt und werden nun auf allgemeine reelle Funktionen verallgemeinert.

DEFINITION 8.58 Wir nennen eine Funktion monoton wachsend, falls für je zwei reelle Zahlen x,yERmita x2 — 2x. Dann ist f weder monoton wachsend noch monoton fallend (insbesondere nicht streng monoton wachsend/fallend).

Denn für x = 0 und y = 1 und z = 2 gilt f (x) = f (0) = 0 > —1 f (1) = f (y)

und f(y) -= f(1) = —1 < 0 = f (2) = f(z).

L

Würde man die Funktion f : [1,100] —> IR mit x 1—> X2 - 2x betrachten, dann hätte man eine streng monoton wachsende Funktion zur Hand.

Mit Hilfe des Mittelwertsatzes stellt man einen Zusammenhang zwischen Monotonie und dem Vorzeichen der Ableitung her. Eine positive Ableitung - alias eine positive Steigung - korrespondiert

170

J

zu einer monoton wachsenden Funktion. Analog korrespondiert eine negative Ableitung - alias eine negative Steigung - zu einer monoton fallenden Funktion.

EXTREMSTELLEN FÜR EINDIMENSIONALE FUNKTIONEN •

8.62 Sei f : [a, b] —› JR differenzierbar. f'(c) < 0 für alle c E [a, b], so ist f monoton fallend. f'(c) < 0 für alle c E [a, b], so ist f streng monoton fallend. f'(c) > 0 für alle c e [a, b], so ist f monoton wachsend. f'(c) > 0 für alle c E [a, b], so ist f streng monoton wachsend.

11 LEMMA

Ist Ist Ist Ist

Beweis. Wir beweisen nur die erste Aussage, die anderen Aussagen werden analog bewiesen. Dazu verwenden wir das Beweisprinzip der Kontraposition. Wir möchten zeigen, dass

f' (c) > 0 V c E [a, b]

f ist monoton wachsend.

Wir zeigen jedoch gleichbedeutend —,(f ist monoton wachsend)

(c) > 0 V c E [a, b]),

f ist nicht monoton wachsend

also

3 c E [a, b] : f'(c) < 0.

Wenn f nicht monoton wachsend ist, gibt es also x, y E [a, b] mit a < x < y f (y). Da f auf [a, b] differenzierbar ist, ist f insbesondere auf [x, y] differenzierbar und es gibt nach dem Mittelwertsatz (Satz 8.27) ein c E [x, y] mit (c) =

f (y) — f (x)

y— x

0, weil x f (y)), was zu zeigen war.



8.5.2 Extrema einer Funktion Wir definieren nun, was wir unter lokaler Extremität einer Funktion verstehen. Letztlich ist eine Extremstelle ein Punkt aus dem DefinitionsbeDEFINITION

reich, dessen Funktionswert in einer Umgebung nicht überschritten wird.

8.63 Sei f : [a, b] —> JR eine Funktion.

Ein Punkt c E [a, b] heißt lokales Maximum von f , wenn es ein e > 0 gibt, so dass für alle x E [a, b] mit Ix — cl < E gilt f (x) < f (c). Ein Punkt c E [a, b] heißt lokales Minimum von f, wenn es ein E > 0 gibt, so dass für alle x E [a, b]

ä ZU DEFINITION 8.63 Ein lokales Extremum zeichnet sich dadurch aus, dass sein Funktionswert in einer (möglicherweise sehr kleinen) Umgebung nicht über- bzw. unterschritten wird. Ist ein lokales Extremum optimal in Bezug auf den ganzen Definitionsbereich (also vergisst man die Einschränkung auf eine Umgebung) so nennt man es häufig auch ein globales Extremum.

171



EXTREMSTELLEN FÜR EINDIMENSIONALE FUNKTIONEN

mit lx — < E gilt f(x) > f(c). Wenn c ein lokales Minimum oder Maximum von f ist, nennt man c ein lokales Extremum von f .

BEISPIEL 8.64 Die Funktion f : [ —10,10] —› UI mit x 1—> X2 — Minimum. Es gilt

2x + 4 hat an

der Stelle c = 2 eine lokales

f(x) =x 2 — 2x + 4 = — 2)2 . Es ist f (2) = 0 und f (x) > 0 für alle 118. Also kann man e > 0 beliebig wählen und die Bedingung aus Definition 8.63 für das lokale Minimum verifizieren. L

_J

Notwendige Bedingung für lokale Extrema

ZU LEMMA

8.65 El

Es ist c aus dem offenen Intervall (a, b) gewählt. Es ist möglich, dass ein Randpunkt des Intervalls [a, bi, also a oder b, zwar ein lokales Extremum ist, aber eine Ableitung ungleich 0 besitzt.

Wie findet man lokale Extrema? Das Vorgehen sollte, zumindest für differenzierbare Funktionen, aus der Schule unter der Bezeichnung "Kurvendiskussion" bekannt sein. Die Ableitung von lokalen Extrema (Randpunkte des Definitionsbereichs zunächst ausgeschlossen) ist stets 0, wie Lemma 8.65 formuliert. Um also solche Extrema zu fin-

LEMMA

den, besteht ein erster Schritt darin, die Ableitung auf Nullstellen hin zu untersuchen. Allerdings erhellt Bemerkung 8.85 und Beispiel 8.64, dass die Umkehrung von Lemma 8.65 nicht allgemein gilt. Nicht jede Nullstelle einer Ableitung ist lokale Extremstelle der ursprünglichen Funktion.

8.65 Sei f : [a, b] —› Il8 differenzierbar. Wenn c E (a, b) ein lokales Extremum ist, gilt

f' (c) = 0. Beweis. Wir nehmen an, dass c ein lokales Maximum ist. Dann gibt es ein s > 0, so dass für alle x e [a, b] mit Ix — c < e gilt f (x) < f (c). Seien nun xi, xT E [a, b] mit xi < c < x, beliebig gewählt. Dann ist f(x) — f(c)

gu(xI)= x—c



und

gu(xr) =

f (x) — f(c) > 0. x—c

Da gu (x) für x —> c gegen f' (c) konvergiert, konvergiert gu (x) für x —> c auch von links und rechts gegen f ' (c). Da in einer kleinen Umgebung um c die Funktion gu (x) links von c stets nicht positiv und rechts von c stets nicht negativ ist, konvergiert sie von links gegen einen nicht positiven und von rechts gegen einen nicht negativen Wert. Bleibt zusammengenommen in beiden Fällen nur die 0. Demnach ist ■ f' (c) = 0, wie behauptet. r BEMERKUNG 8.66 Liegt ein lokales Extremum vor, dann ist die Ableitung an dieser Stelle sicher gleich 0. Die Umkehrung gilt nicht allgemein. Dass die Ableitung an einer Stelle 0 ist, ist nur eine notwendige Bedingung für das Vorhandensein eines lokalen Extremums, jedoch keine hinreichende.

172

EXTREMSTELLEN FÜR EINDIMENSIONALE FUNKTIONEN •

L

x2 . Der Funktionsgraph ist BEISPIEL 8.67 Betrachte die quadratische Funktion f : [ —10,10] —> R mit x eine Parabel, welche in u = 0 ein lokales Minimum besitzt. Tatsächlich gilt f'(0) = 2 • 0 = 0. Siehe Abbildung 13. r-

x3. Es gilt f ' (0) = 3 • 02 = 0, BEISPIEL 8.68 Betrachte die kubische Funktion f : [ —10,10] —> R mit x jedoch hat die Funktion an der Stelle u = 0 kein lokales Extremum. Links von 0 ist die Funktion negativ, rechts positiv. Siehe Abbildung 15. 10

Beispiel 8.68 ist eine Blaupause für eine Situation, in welcher eine Nullstelle u der Ableitung keine Extremstelle ist. Die Ableitung in u ist zwar 0, aber in jeder noch so kleinen Umgebung um u

gibt es entweder links Funktionswerte, die kleiner und rechts Funktionswerte, die größer sind als der Funktionswert von u, oder eben umgekehrt. Der Funktionsgraph ähnelt einem Sattel.

-10

x3

10

Die quadratische Funktion f (x) = x 3 aus Beispiel 8.67 hat in u = 0 ein lokales Minimum.

.f(.) 1000

1

8.70 Die in Beispiel 8.68 betrachtete kubische Funktion f : [ —10,10] —› lt mit x u = 0 einen Sattelpunkt.

2

EI ABBILDUNG 8.13

b] —› R eine differenzierbare Funktion. Ein Punkt c E [a, b] heißt D EFINITION 8.69 Sei f : Sattelpunkt von f, wenn er kein lokales Extremum von f aber f' (c) = 0 ist.

BEISPIEL

-2

besitzt in 200

Ein dem Sattelpunkt ähnliches Konzept ist das Sattelplateau. Dabei wird die Funktion auf einem ganzen Intervall konstant. Jeder Punkt im offenen

Intervall dieses Intervalls ist dann sowohl lokales Minimum als auch lokales Maximum von f , die Intervallgrenzen entweder oder.

10

0

-1000

DEFINITION 8.71 Sei f : [a, b] —› R eine differenzierbare Funktion. Ein Teilintervall [ci, cr] C [a, b] heißt Sattelplateau von f, wenn es ein y E R gibt, so dass f (x) = y für alle x E [cl , cr ].

Anders als bei einem Sattelpunkt, bei dem kein Inneren eines Sattelplateaus sogar beides gleichlokales Extremum vorliegt, sind alle Punkte eines zeitig. Sattelplateaus lokale Extremstellen, die Punkte im R eine differenzierbare Funktion und [ci, cr ] c [a, b] ein 8.72 Sei f : [a, b] Sattelplateau von f. Jedes x E (ci, cr ) ist sowohl lokales Minimum als auch lokales Maximum von f.

EI KOROLLAR

IIABBILDUNG 8.14 Die kubische Funktion f (x) = x 3 aus Beispiel 8.68 hat in u = 0 ein lokales Minimum.

ä ZU DEFINITION 8.69 An einem Sattelpunkt befindet man sich nicht an einem Extremum, auch, wenn die Ableitung 0 ist. Es gibt jedoch eine Richtung, in welche die Funktion ansteigt, bewegt man sich auch nur ein noch so kleines Stück in diese.

r BEMERKUNG 8.73 An den Randpunkten eines Sattelplateaus liegt entweder ein lokales Minimum oder ein lokales Maximum vor.

173



EXTREMSTELLEN FÜR EINDIMENSIONALE FUNKTIONEN

Gr)

12A

ABBILDUNG 8.15

Die Extremstellen, ein Sattelpunkt und ein Sattelplateau in einer Abbildung. An der Stelle cmax liegt ein lokales Maxium, an der Stelle cmin liegt ein lokales Minimum und an der Stelle csat ein Sattelpunkt vor. Zwischen den Punkten cl und c, findet sich ein Sattelplateau. In orange ist die Ableitung von f verzeichnet. Sie wird sowohl für Extremstellen, als auch für Sattelpunkte 0.

Hinreichende Bedingung für lokale Extrema

ZU LEMMA 8.74

le

Ist eine Nullstelle der ersten Ableitung keine Nullstelle der zweiten Ableitung, ist sie sicher ein lokales Extremum. Ist die zweite Ableitung negativ, so liegt sicherlich ein lokales Maximum vor, ist sie positiv ein lokales Minimum. Ist f" (c) = 0, kann nicht mittels zweiter Ableitung entschieden werden, ob c ein lokales Extremum ist oder nicht.

Wie kann man nun hinreichend entscheiden, ob eine Nullstelle der Ableitung tatsächlich zu einem lokalen Extremum korrespondiert? Es gibt zwei Optionen: Man betrachtet die zweite Ableitung oder wendet das Vorzeichen-Wechsel-Kriterium an. Erste Option ist ein einseitiger Test (er kann die Frage nur positiv beantworten - eine negative

Antwort ist nicht möglich). Beide Kriterien machen sich folgende Beobachtung zu nutze. Liegt eine Nullstelle der ersten Ableitung vor, gibt es zwei Möglichkeiten: • Sie ist Extremstelle. • Sie ist ein Sattelpunkt.

LEMMA 8.74 Sei f : [a, b] —> R. differenzierbar und für c E (a, b) gelte f' (c) = 0. Ist f " (c) > 0, ist c ein lokales Minimum. Ist f " (c) < 0 ist c ein lokales Maximum. BEISPIEL 8.75 Die quadratische Funktion f : [-10,10] —> R mit xl—> X2 aus Beispiel 8.67 hat ein lokales Minimum bei v. = 0. Tatsächlich gilt neben f'(0) = 2 • 0 = 0 auch f"(0) = 2 > 0.

BEISPIEL 8.76 Die Funktion f : [-10,10] —> ]R mit x 1—> — x2 hat ein lokales Maximum bei u = 0 (sie ist die an der x-Achse gespiegelte quadratische Funktion aus Beispiel 8.67 und 8.75). Tatsächlich gilt neben f'(0) = —2 • 0 = 0 auch f"(0) = —2 < 0.

174

EXTREMSTELLEN FÜR EINDIMENSIONALE FUNKTIONEN 5

L

BEISPIEL 8.77 Die kubische Funktion f : [-10,10] •—> R mit x aus Beispiel 8.68 hat kein lokales Minimum bei u = 0. Tatsächlich gilt zwar f'(0) = 3 • 02 = 0 aber auch f"(0) = 6 • 0 = 0.

BEISPIEL 8.78 Die Funktion f : [-10,10] —› IR mit x x4 aus Beispiel 8.67 hat ein lokales Minimum bei u = 0. Tatsächlich gilt neben f'(0) = 4 • 03 = 0 aber auch f"(0) = 12 • 02 = 0. 1

Ist die Nullstelle der ersten Ableitung auch eine Kriterium kann in jedem Fall angewendet werden, Nullstelle der zweiten Ableitung sind beide Situa- um eine Nullstelle der ersten Ableitung zu untertionen möglich. Es kann ein lokales Extremum vor- suchen. liegen oder auch nicht. Das Vorzeichen-WechselV LEMMA 8.79 Sei f : [a, b] -3 1[8 differenzierbar und für c E (a, b) gelte f' (c) = 0.

Seien außerdem xl = max{suptx E [a, : f (0)} , a}

und

xr = minfinf{x E (a, : t(0)}, b). f , (x, +c

und

2

)

Gilt mi < 0 und mr > 0, dann ist c ein lokales Minimum von f . Gilt ml > 0 und mr. < 0, dann ist c ein lokales Maximum von f . Gilt ml < 0 und mr < 0 oder mi > 0 und mr > 0, dann ist c ein Sattelpunkt von f. Gilt mi = 0 und mr < 0 oder ml > 0 und mr = 0, dann ist c ein lokales Maximum von f . Gilt ml = 0 und rar > 0 oder mi < 0 und m r = 0, dann ist c ein lokales Minimum von f. Gilt ml = 0 und mr = 0, dann ist c sowohl ein lokales Maximum als auch ein lokales Minimum von f . B EISPIEL 8.80 Die kubische Funktion f : [ —10,10] —> R mit x 1-3 x3 aus Beispiel 8.68 und 8.77 hat kein lokales Minimum bei u = 0. Tatsächlich gilt zwar f'(0) = 3 • 02 = 0, aber auch f"(0) = 6 • 0 = 0. Die Ableitung f' (x) = 3 • x2 besitzt nur eine Nullstelle und so können wir die Voraussetzungen des VorzeichenWechsel-Kriteriums ermitteln mit xi = maxIsupfx E [10,0) : f i (0)}, —10} = —10 und ( —102+ 0)

L

=

=

und

xr = min{inf{x E (0,10] : f'(0)},10} = 10 mr

= f (10+ 2

c)

fi(5) = 75.

Also ist m, > 0 und mr > 0 und u = 0 ist ein Sattelpunkt von f.

BEISPIEL 8.81 Die Funktion f : [-10,10] -+ Ire mit x1-3 x4 aus Beispiel 8.67 und 8.78 hat ein lokales Minimum bei u = 0. Tatsächlich gilt neben f'(0) = 4 • 03 = 0, aber auch f"(0) = 12 • 02 = 0. Die Ableitung

Im

ZU LEMMA 8.79

Das Vorzeichen-Wechsel-Kriterium überprüft,

ob sich die Ableitung links und rechts einer Nullstelle der ersten Ableitung ändert oder nicht. Ist sie links kleiner 0, ist die Funktion dort monoton fallend, ist sie rechts größer 0, ist die Funktion dort monoton wachsend. Dann muss die Nullstelle ein lokales Minimum sein. Siehe auch Abbildung 15, um sich die verschiedenen Fälle zu veranschaulichen. Bei der Wahl der Teststellen x/ links und x,. rechts der Nullstelle muss man allerdings etwas aufpassen. Es darf sich keinesfalls zwischen Teststelle und Nullstelle der ersten Ableitung eine weitere Nullstelle befinden. Außerdem besteht die Möglichkeit, dass sich die Nullstelle im Inneren eines Sattelplateaus befindet, dann lässt sich keine Teststelle links oder rechts von c finden, so dass sich keine weitere Nullstelle der Ableitungen zwischen ihnen befindet (die Ableitung ist auf dem ganzen Sattelplateau gleich 0). Um diese Problematik mit abzudecken, sind die Teststellen x„. und x, auf diese zunächst etwas kompliziert anmutende Weise gewählt. Im "Normalfall" sucht man die nächste Nullstelle der Ableitung links und rechts von c und wählt als Teststellen jeweils die Mitte zwischen Nullstelle und c. Gibt es auf einer der Seiten keine weitere Nullstelle, darf man irgendeine Stelle wählen, in Lemma 8.79 sind die Intervallgrenzen vorgeschlagen. Die ersten drei angeführten Fälle sind die üblichen, die letzten drei Fälle treten nur im Zusammenhang mit einem Sattelplateau auf.

175



EXTREMSTELLEN FÜR EINDIMENSIONALE FUNKTIONEN

f' (x) = 4 x3 besitzt nur eine Nullstelle und so können wir die Voraussetzungen des Vorzeichen-WechselKriteriums ermitteln mit xi = max{sup{x E [10,0) : f' (0)}, —10} = —10

, mi = f

—10 + o ) 2

= f (-5) = 500

und und

xr = min{ inflx E (0,10] : f' (0)}, 101 = 10

f, (10 c 2 )

f,(5) 500.

Also ist mi < 0 und mr > 0 und u = 0 ist ein lokales Minimum von f. L

ZUSAMMENFASSUNG

Funktionen können auf ihr Wachstum hin untersucht werden. Wir nennen nach Definition 8.58 eine Funktion monoton wachsend, falls für je zwei reelle Zahlen x, y E IR mit a < x < y < b gilt f (x) < f(y). Wir nennen eine Funktion streng monoton wachsend, falls für je zwei reelle Zahlen x, y E 1K mit a 0 für alle c E [a, b], so ist f monoton wachsend. Ist f'(c) > 0 für alle c E [a, b], so ist f streng monoton wachsend. Nach Definition 8.63 führen wir überdies die folgenden Bezeichnung ein. Ein Punkt c E [a, b] heißt lokales Maximum von f, wenn es ein e > 0 gibt, so dass für alle x E [a, b] mit Ix — c < e gilt f (x) < f (c). Ein Punkt c E [a, b] heißt lokales Minimum von f, wenn es ein e > 0 gibt, so dass für alle x E [a, b] mit Ix — cl < e gilt f (x) > f (c). Wenn c ein lokales Minimum oder Maximum von f ist, nennt man c ein lokales Extremum von f . Nach Lemma 8.65 gilt dann, dass c E (a, b) ein lokales Extremum ist,

176

wenn f'(c) = 0. Ein Punkt c E [a, b] heißt nach Definition 8.69 Sattelpunkt von f, wenn er kein lokales Extremum von f aber f' (c) = 0 ist, in Teilintervall [c1 , cr] C [a, b] heißt nach Definition 8.71 Sattelplateau von f, wenn es ein y E R gibt, so dass f (x) = y für alle x E [c1 , cr]. Dabei ist nach Korollar 8.72 jedes x E (c1, cr ) sowohl lokales Minimum als auch lokales Maximum von f . Nach Lemma 8.74 ist c E (a,b) mit f'(c) = 0 ein lokales Minimum, wenn f" (c) > 0 ist und ein lokales Maximum, wenn f" (c) < 0 ist. Lemma 8.79 gibt für eine differenzierbare Funktion f : [a, b] —› 1K und ein c E (a, b) mit f'(c) = 0 ein als Vorzeichen-WechselKriterium bekanntes Kriterium für Extremstellen. Sei= en dazu xi = max{sup{x E [a, c) : f'(0)}, min{inf{x E (a, : .f / (0)}, b}, m1 = und mr = f'

Dann folgt: Gilt m1 < 0 und

mr > 0, dann ist c ein lokales Minimum von f. Gilt mi > 0 und mr < 0, dann ist c ein lokales Maximum

von f. Gilt ml < 0 und mr < 0 oder m1 > 0 und rn, > 0, dann ist c ein Sattelpunkt von f. Gilt mi = 0 und mr < 0 oder mi > 0 und rar = 0, dann ist c ein lokales Maximum von f. Gilt m1 = 0 und m,- > 0 oder m1 < 0 und rar = 0, dann ist c ein lokales Minimum von f. Gilt m1 = 0 und mr = 0, dann ist c sowohl ein lokales Maximum als auch ein lokales Minimum von f.

EXTREMSTELLEN FÜR MEHRDIMENSIONALE FUNKTIONEN

im

8.6 Extremstellen für mehrdimensionale Funktionen Wie man Extremstellen für eindimensionale reelle Funktionen definiert hat, möchten wir dies nun für mehrdimensionale Funktionen tun. Man kann sich

dabei am eindimensionalen Fall gut orientieren im Detail sind sicherlich etwas anspruchsvollere Aspekte zu durchdringen.

8.6.1 Extrema im Mehrdimensionalen Vorab schränken wir uns etwas ein. Wir werden nur Funktionen f : X —› R mit X c IEV betrachten. Der allgemeine Fall einer mehrdimensionalen Funktion f : X —> Rm von einer Menge X c in den Er' lässt sich schwierig auf extremale Werte der Bilder hin untersuchen. Das hat den einfachen Grund, dass die Vektoren im für n > 2 nicht angeordnet sind, es also zunächst nicht möglich ist, sie nach ihrer Größe zu vergleichen. Man behilft sich dadurch, dass man die Bilder mit einer Norm "messbar macht". Man könnte beispielsweise die euklidische Norm der Bilder vergleichen. Dann führt man im Prinzip zwei Funktionen hintereinander durch. Zunächst bildet man einen Vektor v E Ur mittels f auf einen Vektor f(v) E Hen ab. Diesen bildet man dann mit der euklidischen Norm auf eine reelle Zahl ab. Man kann diese beiDEFINITION

den Funktionen auch als eine einzige auffassen und erhält somit eine Funktion 7 : IR. Diese können wir mit den hier entwickelten Methoden untersuchen. Zusammengefasst: Der allgemeine Fall lässt sich prinzipiell nicht auf Extrema hin untersuchen, weil der Bildbereich nicht angeordnet ist. Das Konzept eines Extremums ergibt dort keinen Sinn. Behilft man sich mit einer sortierenden Funktion (einer Norm im Bildbereich) erhält man den Spezialfall, den wir nun hier studieren. Wir definieren zunächst, was wir unter lokaler Extremität einer mehrdimensionalen Funktion verstehen. Letztlich ist eine lokale Extremstelle, wie im Eindimensionalen, ein Punkt aus dem Definitionsbereich, dessen Funktionswert in einer Umgebung nicht überschritten wird.

8.82 Sei f : X —HR. eine Funktion für X c

Ein Punkt c E X heißt lokales Maximum von f, wenn es eine > 0 gibt, so dass für alle x E X mit 11x — c112 < E gilt f (x) < f (c). Ein Punkt c E [a, b] heißt lokales Minimum von f, wenn es ein e > 0 gibt, so dass für alle x E X mit 11x — c112 < e gilt f (x) > f (c).

ZU DEFINITION 8.82

Ein lokales Extremum zeichnet sich wie im eindimensionalen Fall dadurch aus, dass sein Funktionswert in einer (möglicherweise sehr kleinen) Umgebung nicht über- bzw. unterschritten wird. Ist ein lokales Extremum optimal in Bezug auf den ganzen Definitionsbereich (also vergisst man die Einschränkung auf eine Umgebung), so nennt man es häufig auch ein globales Extremum.

Wenn c ein lokales Minimum oder Maximum von f ist, nennt man c ein lokales Extremum von f. 1

177



EXTREMSTELLEN FÜR MEHRDIMENSIONALE FUNKTIONEN

BEISPIEL

8.83 Betrachte die Funktion f : R2 —> R mit 1 f (x) = 4 — —2 • xi — 1• x22 . 2

Sie hat an der Stelle c = (o0 eine lokales Maximum. Es gilt f (c) = 4 — 02 — 02 = 4

2 2 f (x) = 4 — — • xi — — • xi < 4 2 2

und

für alle x e 1R2, weil sowohl xi als auch 4 stets positiv sind. Also kann man E > 0 beliebig wählen und die Bedingung aus Definition 8.82 für das lokale Maximum verifizieren. Siehe Abbildung 7. L

_J

Notwendige Bedingung für lokale Extrema

ZU LEMMA 8.84

Es ist c aus dem Inneren von X gewählt. Es ist möglich, dass ein Randpunkt der Menge X, zwar ein lokales Extremum ist, aber einen Gradienten ungleich 0 besitzt.

Wie findet man lokale Extrema für mehrdimensionale Funktionen? Wir möchten die Methoden aus dem eindimensionalen Fall nun übertragen und verallgemeinern. Die Ableitung von lokalen Extrema im eindimensionalen Fall (Randpunkte des Definitionsbereichs zunächst ausgeschlossen) ist stets 0, wie Lemma 8.65 formuliert. Für mehr-

dimensionale Funktionen tritt die Jacobi-Matrix bzw. der Gradient an die Stelle der Ableitung. Es ist ein erster Schritt, den Gradienten auf Nullstellen hin zu untersuchen. Allerdings gilt, wie im eindimensionalen Fall, dass nicht jede Nullstelle des Gradienten auch eine lokale Extremstelle der Funktion ist.

III LEMMA 8.84 Sei f : X —> R für X E R' differenzierbar. Wenn c E X° ein lokales Extremum ist,

gilt gradf (c) = 0. Beweis. Den Beweis überlassen wir dem Leser zur Übung. Man kann sich an dem Beweis für die analoge Aussage im Eindimensionalen orientieren. Siehe Lemma 8.65. ■ r BEMERKUNG 8.85 Liegt ein lokales Extremum vor, dann ist der Gradient an dieser Stelle sicher gleich 0. Die Umkehrung gilt nicht allgemein. (Dass der Gradient an einer Stelle 0 ist, ist nur eine notwendige Bedingung für das Vorhandensein eines lokalen Extremums, jedoch keine hinreichende). J

L

BEISPIEL

8.86 Betrachte die Funktion f : ]R2 —> R mit f (x) = 4 — 2 • xi — 2 •x22

178

EXTREMSTELLEN FÜR MEHRDIMENSIONALE FUNKTIONEN

aus Beispiel 8.83. Sie hat an der Stelle c = °0 eine lokales Maximum. Tatsächlich ist dort auch

(

gradf(c) -- ( L

afc)

2f (c) — (c2) = (0) ‘-'.2

der Gradient gleich 0.

BEISPIEL

8.87 Betrachte die Funktion f : R2 -4 R mit x 1—> xi + x2. Es gilt für c = ° , dass zwar gradf (c) =

,a-f7 ( c) as2 f ( c)

L

= (31) 3c2 = (°o)

jedoch hat die Funktion an der Stelle c kein lokales Extremum. Siehe Abbildung 8.16.

Beispiel 8.68 ist eine Blaupause für eine Situation, in welcher eine Nullstelle des Gradienten keine Extremstelle ist. Die Ableitung in c ist zwar 0, aber in jeder noch so kleinen Umgebung um c gibt es Funktionswerte, die sowohl kleiner als auch größer als der Funktionswert von u sind, wie wir es auch schon im Eindimensionalen kennengelernt haben. Solche Punkte sind Sattelpunkte. Das eindimensionale Konzept verallgemeinert sich DEFINITION

8.88 Sei f :

leicht für den mehrdimensionalen Fall. Die Details überlassen wir dem Leser. Hinreichende Bedingung für lokale Extrema

Wie kann man nun hinreichend entscheiden, ob eine Nullstelle des Gradienten tatsächlich zu einem lokalen Extremum korrespondiert? Man betrach tet dazu eine Matrix, deren Einträge den zweiten partiellen Ableitungen von f entsprechen.

-+ IR eine in u E IR zweimal partiell differenzierbare Funktion. Dann

ist H f (U) =

(u)) i=-1,...,n;j=1,...,n

ABBILDUNG 8.16

Die Funktion aus Beispiel 8.87 hat im Ursprung einen Sattelpunkt.

zu

DEFINITION

8.88

Die Hesse-Matrix enthält die zweifachen partiellen Ableitungen an der Stelle u ausgewertet. Das sind reelle Zahlen, also gilt H f (X) E Igt"".

die Hesse-Matrix von f in et. Man kann etwas ungenau formulieren: Die HesseMatrix ist die zweite Ableitung einer mehrdimensionalen Funktion. Die hinreichende Bedingung für lokale Extrema aus dem Eindimensionalen im Hinterkopf, lässt sie in den Fokus rücken, möchte

man eine hinreichende Bedingung für lokale Extrema im Mehrdimensionalen finden. Und tatsächlich ist eine solche mit der Hesse-Matrix zu finden. Dazu müssen wir sie aber zunächst mit einer Art „Vorzeichen" versehen.

179

EXTREMSTELLEN FÜR MEHRDIMENSIONALE FUNKTIONEN

ZU DEFINITION

8.89 ei

Die Definitheit gibt so etwas wie ein Vorzeichen für die Matrix. Ein solches Konzept benötigt man, um die hinreichende Bedingung mittels zweiter Ableitung auf den mehrdimensionalen Fall zu verallgemeinern. Die Definitheit einer quadratischen Matrix ist nicht so leicht zu bestimmen. Es gibt mit Lemma 8.90 und Lemma 8.91 wenigstens Kriterien, die in manchen Fällen das Bestimmen der Definitheit erlauben.

DEFINITION 8.89 Sei A E W. Dann nennen wir A positiv definit falls xT Ax > 0 für alle x E \ {0}. Dann nennen wir A positiv semidefinit falls xT Ax > 0 für alle x E Rn \ {0}. Dann nennen wir A negativ definit falls xT Ax < 0 für alle x e \ Dann nennen wir A negativ semidefinit falls xTAx < 0 für alle x E II8n \ {0}. Ist A weder positiv noch negativ semidefinit, so nennen wir A indefinit. Die Hesse-Matrix ist symmetrisch. Für symmetri- 8.90 eine Möglichkeit über die Eigenwerte der sehe Matrizen gibt es mit dem folgenden Lemma Matrix etwas über die Definitheit zu sagen.

II

8.90 Sei A EienXn symmetrisch. Es ist A genau dann positiv definit, wenn alle Eigenwerte größer als null sind. Es ist A genau dann positiv semidefinit, wenn alle Eigenwerte größer oder gleich null sind. Es ist A genau dann negativ definit, wenn alle Eigenwerte kleiner als null sind. Es ist A genau dann negativ semidefinit, wenn alle Eigenwerte kleiner oder gleich null sind. Es ist A genau dann indefinit, wenn positive und negative Eigenwerte existieren. LEMMA

Für den zweidimensionalen Fall gibt es mit dem finitheit einer Matrix über ihre Determinante zu folgenden Lemma 8.91 eine Möglichkeit, die De- bestimmen.

IN LEMMA 8.91 Sei A E R2x2 und det(A) = d. Es ist A genau dann positiv definit, wenn A11 > 0 und x > 0.

Es ist A genau dann negativ definit, wenn A11 < 0 und x < 0. 1§1 LEMMA 8.92 Sei f : X —> R mit X c Rn eine in u E X zweimal partiell differenzierbare

Funktion mit grad(u) = 0. Ist H f (u) positiv definit, ist u ein lokales Minimum von f. Ist Hf (u) negativ definit, ist u ein lokales Maximum von f.

ZUSAMMENFASSUNG

Definition 8.82 verallgemeinert das Konzept lokaler Extrema auf mehrdimensionale Funktionen der Form f : X -+ EI für X c 11871. Nach Lemma 8.84 ist ein c E X° ein lokales Extremum von f, dann gilt grad f (c) = 0. Die Umkehrung gilt nicht allgemein. Ei-

180

ne hinreichende Bedingung für lokale Extrema erhält man über die in Definition 8.88 eingeführte HesseMatrix. Sie beinhaltet die partiellen Ableitungen von Ordnung 2. Definition 8.89 führt mit dem Begriff der Definitheit ein „Vorzeichen-Konzept" für quadratische

TAYLORENTWICKLUNG

Matrizen ein. Mit Lemma 8.91 kann man die Definitheit für zweidimensionale Matrizen über die Determinante und mit Lemma 8.90 für allgemeine Matrizen über die Eigenwerte bestimmen. Lemma 8.92 hält schließlich fest, dass für eine in u E X zweimal parti-

ell differenzierbare Funktion f : X IR mit X C wobei grad(u) = 0 ist, gilt: Ist H f (u) positiv definit, ist u ein lokales Minimum von f. Ist Hf (u) negativ definit, ist u ein lokales Maximum von f.

8.7 Taylorentwicklung haben wir geseFür eine Funktion f : [a, b] Approximaf' eine Jokale hen, dass die Ableitung tion" von f durch eine lineare Funktion darstellt. Für u und z E IR ist f (u z) = f (x) z • f (u) r(z)

mit lim r(z) = 0. Siehe Abbildung 8.17. Man z —q) kann die Funktion als die Fehlerfunktion der Approximation der Funktion f durch die Ableitung an der Stelle u auffassen. Dass der Fehler für 0 verschwindet lässt den Schluss zu, dass die z Approximation in der Nähe von u gut ist. Wie gut und wie nahe man dabei an u heranrücken muss,

hängt davon ab, wie f sich „nahe bei" u verhält. Zum Beispiel, ob sich in einer Umgebung um u die Steigung rasch ändert. Es stellt sich die Frage, ob sich diese Approximation verbessern lässt und man bessere Abschätzungen für eine größere Umgebung von u erlangen kann. Die Antwort ist positiv und der Schlüssel liegt darin, höhere Ableitungen in die Approximation miteinzubeziehen. Dazu macht man sich klar, dass die zweite Ableitung von f die erste Ableitung der ersten Ableitung von f ist. Sie gibt also an, wie stark sich die erste Ableitung ändert, wie die Steigung um u variiert. Darin liegt nützliche Information.

ABBILDUNG 8.17 Wir rekapitulieren den Aspekt der linearen Approximation durch die Ableitung.

8.7.1 Das Taylorpolynom Wir definieren ein Polynom, welches bei der Taylorentwicklung die Aufgabe der Approximation übernimmt. Das Taylorpolynom wird mit Hilfe der DEFINITION

8.93 Sei f : [a, b]

Ableitung und höheren Ableitungen gebildet. Es ist vielleicht zu erwarten, dass die höheren Ableitungen zu der Güte der Approximation beitragen.

R eine k-mal differenzierbare Funktion und u E [a, b] . Wir

181

111

TAYLORENTWICKLUNG

definieren das k-te Taylorpolynom von f im Entwicklungspunkt ri als k

tk (y) -= f (u) +

f

3=1

[1u) Yi • •

P BEMERKUNG 8.94 Wie man leicht nachrechnet, gilt tk (0) = f (x),

t k[ il (0) = f

(x)

für 1 < j < k.

Mit anderen Worten: Die ersten k Ableitungen von tim Punkt 0 stimmen mit den ersten k Ableitungen von f im Punkt x überein.

BEISPIEL 8.95 Betrachte die Funktion f : [ —10,10]

R mit x 1-4 x4 + 5x. Dann sind die Ableitungen von

f gegeben durch

f[1] = 4X3 + 5,

f [31 = 24x,

f 121 = 12x2 ,

> f [41 = 24,

f [k] =

für alle k E N> 5. Wir wählen u = 2 und erhalten die Taylorpolynome • ti (y) = 26 + 4 2 + 5 y = 26 + 31 • y, 1! 12 • 22 , t2(y) = 26 + 31 • y y" -= 26 + 31 • y + 24 • y2, 2! 24 • 2 t3(y) = 26 + 31 • y + 24 • y2 + - y3 = 26 + 31 • y + 24 • y2 + 8 • y3, 31 •y2 + 8y3 24 tk (y) = 26 + 31 • y + 24 y4, = 26 + 31 • y + 24 • y2 + 8 • y3 + 2 • y4 to (y) = 24 + 5 • 2 -=. 26,

+ 41

L

für k E N>4.

Die folgende Aussage quantifiziert, wie gut das über den Rahmen dieser Vorlesung hinaus. Wir beTaylorpolynom tk eine Funktion f approximiert. trachten im Anschluss stattdessen einige wichtige Der Beweis der sogenannten Taylor-Formel geht Beispiele.

SATZ 8.96 Sei eine (k + 1)-mal stetig differenzierbare Funktion f : [a, b] IR gegeben. Sei tk das k-te Taylorpolynom von f im Entwicklungspunkt u E [a, b] und sei z E [a, b]. Dann gibt es ein c E [0,1], so dass f ile+ 1.)

f (z) = t k (z — x) +

182

( k + 1)!

(z — x)k+1 ,

wobei y = (1 — c) • x + c • z.

TAYLORENTWICKLUNG

8.7.2 Beispiele der Taylorentwicklung Wir betrachten die Taylorentwicklung für die Exponentialfunktion und die trigonometrischen Funktionen Sinus und Cosinus. Dabei wird man einen

erstaunliche Ähnlichkeit dieser Funktionen feststellen.

Die Exponentialfunktion

Die Ableitung der Exponentialfunktion exp(x) ist einfach die Exponentialfunktion selbst. Es gilt exp'(x) = exp(x). Folglich ist die Exponentialfunktion k-mal differenzierbar für jede natürliche Zahl k. Ferner ist exp(0) = 1. Das k-te Taylorpolynom im Punkt x = 0 ist, mit der Konvention, dass

y° = 1, also tk (y) = exp(0) +

E exp(0) yi j=i

k J=o

• •

Mit Satz 8.96 erhalten wir nun in Proposition 8.97 eine Reihenentwicklung der Exponentialfunktion. co

PROPOSITION 8.97 Für jede reelle Zahl y gilt exp(y) =

E

j

i=o 3*

Beweis. Satz 8.96 zeigt, dass für jedes y E R exp(y) = tk(y) + rk(y),

wobei rk(y) =-

e xp (a k • Y) . k+1

(k + 1)! Y

für ein ak E [01].

Unser Ziel ist es zu zeigen, dass exp(y) = lim tk (y) gilt, was gleichbedeutend ist mit k—roo lim rk (y) = 0. k—roo

(8.9)

Sei dazu P die kleinste natürliche Zahl, die größer als IM ist. Dann können wir rk (y) für k > .e großzügig abschätzen durch .ek+1 Irk (y)l < exp(P) •

(k + 1)!

< exp(e) • i'+'

.ek-E k 11=2+1

exp(t) .e • &El

3

(8.10)

Der Zähler des letzten Ausdrucks ist unabhängig von k. Andererseits wird für große k der Nenner in (8.10) auch beliebig groß. Also folgt (8.9) aus (8.10). ■

183



TAYLORENTWICKLUNG

Die trigonometrischen Funktionen Sinus und Cosinus

Die trigonometrischen Funktionen sin und cos lassen eine der Exponentialfunktion ganz ähnliche Reihenentwicklung zu. Weil sin'(x) = cos(x) und cos'(x) = — sin(x), erhalten wir

COS[k]

(_i)k/2

falls k gerade ist,

0

falls k ungerade ist.

(0) =

Entsprechend erhält man sin[kl (0) =

(_ 1)(k-1)/2

falls k ungerade ist,

0

falls k gerade ist.

Das (2k+1)-te Taylorpolynom von sin(x) im Punkt 0 ist also (_1)23+1

Das 2k-te Taylorpolynom von cos(x) im Punkt 0 ist also

E (2i + 1)! i=o

2j+1

Y



k

2j

(-1)i

(20 j=0

Y

PROPOSITION 8.98 Für

jede reelle Zahl y gilt

cos(y) =( 1)3 y3 j=0 (2i)!

und

sin (y)

( 1) _ E /2k7±-,31,1 y23+1. 3=0

3

)

Beweis. Der Beweis von Proposition 8.98 beruht auf einem ähnlichem Argument, wie der von Proposition 8.97; wir verzichten auf die Details. •

ABBILDUNG 8.18

Es sind die Taylorpolynome für k = 2,4 und 6 im Entwicklungspunkt u = 0 gezeigt. Die Taylorentwicklung wird für wachsendes k eine immer bessere Approximation an den Cosinus.

184

TAYLORENTWICKLUNG

In Abbildung 8.18 wird deutlich, wie die Taylorentwicklung für wachsendes k immer bessere Approximationen an die Funktion cos(x) beschert.

Dabei sind die Taylorpolynome t2 (x), t4 (x) und ts (x) im Punkt 0 gezeichnet.

ZUSAMMENFASSUNG

Für eine Funktion f : [a, b] JR ist die Ableitung f' eine Jokale Approximation" von f durch eine lineare Funktion. Diese Approximation lässt sich verbessern, wenn man höhere Ableitungen in die Approximation miteinbezieht, die Taylorentwicklung tut genau dies. So ist nach Definition 8.93 für eine in u E [a, b] k-mal differenzierbare Funktion f : [a, b] —> JR das k-te Taylorpolynom von f im Entwicklungspunkt

u gegeben als tk(y) =

f (u) +

k

f [3 ] ( u)

3=1

j.

E

Y3 •

Der Satz 8.96 garantiert, dass für eine (k + 1)-mal R ein stetig differenzierbare Funktion f : [a, b] c E [0, 1], so dass f [k+i ] f (z) = t k (z — x) +

(k + 1

(z — x)k+1 ,

wobei y = (1 — c) • x c • z ist.

185

Kapitel

9

Nullstellen nummerisch finden Wir betrachten die Problemstellung: Finde für eine beliebige Funktion die Nullstellen. Häufig verwendet man dazu Iterationsfunktionen. Mit Hilfe des Banachschen Fixpunktsatztes lassen sich diese Verfahren gut untersuchen. Dabei lernen wir mit dem Newtonverfahren und dem Sekantenverfahren zwei Verfahren kennen, anhand derer das allgemeine Prinzip gut veranschaulicht wird.

In diesem Kapitel möchten wir ein sehr allgemeines Problem in den Blick nehmen. Es sollen für beliebige Funktionen Nullstellen gefunden werden. DieProblemstellung Formal lässt sich das Problem folgendermaßen formulieren. Für eine gegebene stetige Funktion f : I --> R auf einem Intervall I c R sei ein (oder seien mehrere oder alle) e c I zu bestimmen mit f (e) = 0. Solche Stellen bezeichnet man als Nullstellen der Funktion f auf dem Intervall I.

Schule behandelt wird) wie die Kurvendiskussion, deren essentielle Methode im Nullstellen-Finden besteht, für viele Funktionen zu lösen ist. Doch tatsächlich ist diese Sicht trügerisch. In der Schule werden häufig Polynome vom Grad höchstens 2 behandelt. Das Finden von Nullstellen ist für diese leicht mit der p-q-Formel (auch Mitternachtsformel genannt oder als eine leicht abgewandelte a-b-c-Formel bekannt) möglich. So hat zum Beispiel das Polynom p(x) = x 2 x — 6 mit p = 1 und q = —6 die beiden Nullstellen \

Die Herausforderung Das Problem hat für Laien den Anschein leicht zu sein. In der Schule, im Kontext von Kurvendiskussionen, ist es eine alltägliche Freude Nullstellen von Funktionen und ihren Ableitungen zu berechnen. Das ist dort in der Regel auch möglich. Man schließt daraus, dass für eine so wichtige mathematische Aufgabe (weil sie so zeitintensiv in der

()2

X1/ 2 -

q

= _ 1 2

±

1

2

(2) + 6 =

1 5 ± -2- ,

also x1 = 2 und x2 = 3. Hat das Polynom Grad 3 wird es schon schwieriger und mit einer geratenen Nullstelle lässt sich mittels Polynomdivision

ITERATIONSVERFAHREN - EINFÜHRUNG •

ein Polynom von Grad 2 ermitteln, welches die restlichen Nullstellen über die p-q-Formel liefert. Für Polynome von größerem Grad gibt es keine geschlossene Formel mehr - sprich, eine Formel vergleichbar mit der p-q-Formel, welche für jedes Polynom vom Grad, sagen wir 7, die Nullstellen ausspuckt. Das ist ernüchternd, sind Polynome in der Welt der Funktionen noch die einfachen.

Die Lösung

Das Problem ist für die meisten Funktionen kaum exakt zu lösen, numerische Verfahren müssen her. Dabei gibt es eine ganze Fülle von Verfahren, die je nach Typ der zu untersuchenden Funktion besser oder schlechter geeignet sind. Die wichtigsten Verfahren sind sogenannte Iterationsverfahren. Wir werden uns auf diese beschränken und zwei kennen lernen - weitere oft genutzte Verfahren sind Varianten dieser.

9.1 Iterationsverfahren - Einführung

Wir möchten uns auf Iterationsverfahren zur Bestimmung von Nullstellen beschränken. Dabei verfährt man nach dem folgenden Schema. Zunächst definiert man eine Folge, welche der gesuchten Nullstelle immer näher kommt, sprich gegen diese konvergiert. Um diese Folge zu definieren, beginnt man mit einem Startwert xo E I. Dann berechnet man weitere Näherungswerte für e alias Folgenglieder xr, für n E N>1 mit Hilfe einer Funktion 4, : / —> I. Dazu berechnet man schlicht aus dem Näherungswert xn den Näherungswert xn+i, indem man den Funktions-

wert von x.„ berechnet. Es ist also xn+1 =

4,( xn)

für alle n E N. Da man iterativ Funktionswerte von 4) berechnet, wird diese Funktion auch als Iterationsfunktion des Iterationsverfahrens bezeichnet. Damit dieser Ansatz funktioniert, die konstruierte Folge auch gegen die/eine Nullstelle konvergiert, muss die Iterationsfunktion bestimmte Eigenschaften aufweisen.

DEFINITION 9.1 Es sei 4) : / —> / eine Funktion. Wir nennen 4) eine gute Iterationsfunktion, wenn die beiden folgenden Eigenschaften erfüllt sind.

Für alle x E I mit 4)(x) = x ist f (x) = 0. Das heißt, dass jeder Fixpunkt von 4) eine Nullstelle von

f ist. 12. Die Iterationsfunktion 4) ist stetig.

ZU DEFINITION

9.1

Die Eigenschaft 11 soll dafür sorgen, dass jeder Grenzwert einer über die Iterationsfunktion gebildeten Folge auch tatsächlich eine Nullstelle ist. Dazu ist natürlich noch zu zeigen, dass Fixpunkte der Iterationsfunktion Grenzwerte von solchen Folgen sind - oder eigentlich natürlich die Umkehrung. Es soll jeder Grenzwert ein Fixpunkt und dann auch eine Nullstelle sein. Die zweite Eigenschaft 12 ist von technischer Natur Sie wird benötigt, um den Banachschen Fixpunktsatz anwenden zu können. Mit Hilfe dieses Satzes kann man zeigen, dass Iterationsverfahren über guten Iterationsfunktionen zum Ziel führen.

BEISPIEL 9.2 Sei ein beliebiges Intervall / c IR gegeben. Die einfachste gute Iterationsfunktion ist sicherlich die Funktion (1) : / —> / mit 4)(x) = x + f (x). Sie erfüllt die Eigenschaften Il und 12.

Il. Für alle x E / mit 4)(x) = x ist zwangsläufig f (x) = 0.

187



ITERATIONSVERFAHREN - EINFÜHRUNG

12. Die Iterationsfunktion 4) ist stetig, falls f stetig ist, denn sie ist dann die Summe zweier stetiger Funktionen (x 1—> x ist stetig). L

Tatsächlich sind gute Iterationsfunktionen die "richtigen" Iterationsfunktionen für Iterationsverfahren zur Nullstellenbestimmung, wie das folgende Lemma 9.3 zeigt. Es sagt nichts darüber aus, ob

_J

es solche Iterationsfunktionen gibt und wie man sie für ein konkretes Nullstellenproblem findet. Außerdem ist in keinster Weise klar, wie schnell ein solches Iterationsverfahren zum Ziel führt.

Es sei e I -+ I eine gute Iterationsfunktion und für ein festes xo e I sei die Folge (x.„,)„>0 rekursiv durch LEMMA 9.3

xri±i = (144

für alle n

gegeben. Besitzt die Folge (x7").>0 einen Grenzwert eo

E

EN

I, so gilt

geo) = 0. ABBILDUNG 9.1

Die Stützpunkte aus Beispiel 11.12 und die interpolierenden Polynome p(x) und q(x) sowie die interpolierende Funktion f (x) aus Beispiel 11.15. Eine Stützpunktmenge ist eine Menge von Punkten, die alle unterschiedliche x-Koordinaten besitzen. Der Graph einer interpolierenden Funktion geht durch alle diese Stützpunkte.

Beweis. Aus der Stetigkeit von e(x), welche nach 12 gegeben ist, und der rekursiven Definition der

Folge folgt o = lim

n—loo

xn

= lino

n—lco

4)(

n—>oo

e(eo•



Aus der Eigenschaft Il folgt daher f (e0) = 0.

BEISPIEL 9.4 Zur Bestimmung der positiven Nullstellen der quadratischen Funktion f : [-1,2] —> IR mit

f (x) = X2 — 1, wählen wir eine einfache Iterationsfunktion 4i : [-1,2] -4 [-1,2] mit 4.(x) = x —

X2 + 1.

Ähnlich wie in Beispiel 9.2 gesehen, ist diese Funktion eine gute Iterationsfunktion. Insbesondere gilt für x E R folgende offensichtliche Äquivalenz e(x) = x

f(x) = 0.

Mit dem Startwert xo = —1 erhalten wir mittels rekursiver Entwicklung der Folge (x,)„>0 folgende

188

ITERATIONSVERFAHREN - EINFÜHRUNG EI

Näherungswerte für die Nullstelle 1 X1 = 4

/ 1 )2 4

Es ist

1=



11 — 0 6875 16 —

11

16

+ 1 = 311 1,21484375 256 =

311 (311 2 1 — 48431 0,738998413 X3 = — — + 256 ) — 65536 r‘-' 256

cos(x)

48431 ( 48431 ) 2 5123379551 +1= ,,, 1,192879759 X4 = 65536 65536 4294967296 X5 =

5123379551 ( 5123379551 2) + 1 0,769917640 ,-, 4294967296 4294967296

Tatsächlich nähert sich diese Folge der 1 ganz langsam, indem sie immer zwischen Werten größer und kleiner 1 hin- und herwechselt, also um 1 alterniert. r 9.5 Zur Bestimmung der kleinsten positiven Nullstelle der Cosinus-Funktion (also eine einfache Iterationsfunktion. Es seien die beiden Funktionen f, 4) : [ 2,2] -+ [-1,2] mit

BEISPIEL

f (x) = cos(x),

43(x) = x

wählen wir ABBILDUNG 9.2

cos(x)

Mittels Iterationsfunktion wird, wie in Beispiel 9.5 beschrieben, die kleinste positive Nullstelle des Cosinus bestimmt.

gegeben. Wie in Beispiel 9.2 gesehen, ist diese Funktion eine gute Iterationsfunktion. Insbesondere gilt für x E IR folgende offensichtliche Äquivalenz 4)(x) = x

< >

f(x) = 0»

Mit dem Startwert xo = 1 erhalten wir mittels rekursiver Entwicklung der Folge (x,,,),-,EN folgende Näherungswerte Es ist für die Nullstelle x1 = 1 + cos(1) 1,540302306

x2 = xi cos(xi) r,1,570791601

x3 = x3 cos(x2) 1,570796327

xn = x”,_1 cos(xn_i)

X3 für n > 4.

Dabei ist schon x3 = e mit lel < 10-9, also x3 eine bis zur neunten Nachkommastelle gute Näherung an die Nullstelle lir. Siehe Abbildung 9.2. J

L

ZUSAMMENFASSUNG

Möchte man mit Iterationsverfahren die Nullstelle e einer Funktion f : I -+ IR im Intervall / c R bestimmen, konstruiert man sich zunächst eine Iterationsfunktion. Mit Hilfe dieser Iterationsfunktion wird dann eine Folge (x)nEN rekursiv definiert. Dazu wird ein Startwert xo E / gewählt und rekursiv = (P(Xn) berechnet.

für alle 72 E N

Damit das Iterationsverfahren gelingt, sollte man die Iterationsfunktion 4) so wählen, dass sie von / nach / abbildet und die Eigenschaften Il und 12 aus Definition 9.1 erfüllt. Die Eigenschaft Il gewährleistet, dass jeder Fixpunkt von 4) (das ist ein x E / mit 4)(x) = x) eine Nullstelle von f ist. Die Eigenschaft 12 besagt, dass 4) stetig ist. Eine Iterationsfunktion mit diesen Eigenschaften bezeichnen wir als gut. Nach Lemma 9.3 gilt für die iterierte Folge über einer

189

DER BANACHSCHE FIXPUNKTSATZ

guten Iterationsfunktion sicher, dass, besitzt sie einen Grenzwert eo E I auch f (o) = 0

gilt. Ziel ist es also, Grenzwerte für iterativ über gute Iterationsfunktionen gebildete rekursive Folgen zu finden - sie sind die gesuchten Nullstellen.

9.2 Der Banachsche Fixpunktsatz Wir entdecken nun einen sehr allgemeinen Satz Fixpunkten. Dazu definieren wir zunächst die folüber die Existenz und das iterative Auffinden von gende Eigenschaft einer Funktion.

ZU DEFINITION

9.6

Für je zwei Werte x und y aus dem Intervall [a, b] ist der Abstand der Funktionswerte f(x) und f (y) kleiner als der Abstand von x und y - er ist sogar höchstens L mal so groß, wobei L eine Zahl kleiner 1 ist. Der Abstand ist also durch Anwenden der Funktion kleiner geworden - er ist kontrahiert, daher die Bezeichnung.

DEFINITION 9.6 Es sei I c 118 ein Intervall. Eine Abbildung f :

heißt kontrahierend, falls

eine Kontraktionskonstante L E IR mit 0 < L < 1 existiert, so dass für alle x, y E I gilt I f (x)

f

I, • lx

yl.

r BEMERKUNG 9.7 Jede kontrahierende Funktion ist stetig (insbesondere Lipschitz-stetig) - die Umkehrung gilt nicht notwendigerweise - nicht jede stetige Funktion ist auch sicherlich kontrahierend, wie das einfache Beispiel f : [0,1] [0,1] mit f (x) = x zeigt. Insbesondere ist der Betrag der Steigung einer kontrahierenden Funktion durch L beschränkt.

7

9.8 Die Funktion f : [0,1] gewählt. Es gilt dann BEISPIEL

R mit f (x) = 2x ist kontrahierend. Seien dazu x, y E [0,1] beliebig

I f (x) — f (Y) I =

1 1 1 x —y = — • Ix — yl. 2 —2 2

Also ist f kontrahierend und L = eine Kontraktionskonstante. Es ist auch 4eine Kontraktionskonstante - so wie jede Zahl größer gleich 2und kleiner 1. J 7

BEISPIEL

9.9 Die Iterationsfunktion [-1,2] mit 4)(x) = x — x2 + 1

aus Beispiel 9.4 ist nicht kontrahierend. Dazu wählt man x = —1 und y = 0. Dann gilt 1 4)(-1) — 4)(0)1 =

— (-1)2 + 1

+

— 11 = 1

Es ist also I (x) — Cy)I > I x — YI und 4)(x) ist damit nicht kontrahierend. 190

21 = 2 1 — 1 + > 1 — 1 — 0 1.

DER BANACHSCHE FIXPUNKTSATZ

L

Es gibt einen offensichtlichen Zusammenhang zwischen Ableitung und Kontraktionseigenschaft. Stellt man die Bedingung aus Definition 9.6 um, erhält man I f(x)

f(Y)1

L • lx — YI

1E4 f(Y)i < L lx — yl

den Differenzenquotienten. Ist der Differenzenquotient für zwei Stellen x und y aus dem Definitionsbereich größer oder gleich 1, so gibt es zumindest für eine differenzierbare Funktion nach dem Mittelwertsatz eine Stelle, für welche die Ableitung größer oder gleich 1 ist. Die Umkehrung gilt im Übrigen ebenfalls, auch wenn sie etwas schwieriger zu beweisen ist. Wir halten diesen Sachverhalt fest.

LEMMA 9.10 Es sei eine differenzierbare Funktion f : 1 ---> 1 auf einem Intervall / c R gegeben. Die Funktion ist genau dann kontrahierend, wenn es eine reelle Zahl L E [0,1) gibt, so dass für alle x E / gilt I f (x)1 < L. Ist f kontrahierend, dann ist

L = sup{If'(x)1} sEI eine Kontraktionskonstante von f . Beweis. Den Beweis überlassen wir dem Leser.



Mit Hilfe von Lemma 9.10 lässt sich also beweisen, ob eine Funktion kontrahierend ist oder eben nicht. BEISPIEL

9.11 Die Iterationsfunktion cl) : 12] --> [-1,2] mit c(x) = x + cos(x)

aus Beispiel 9.5 ist kontrahierend. Es ist nämlich 4V(x) = 1 — sin(x) und es gilt

lei(x)1 < für alle x e

,2], wie man leicht verifiziert. Es ist also L = e eine Kontraktionskonstante von e.

L

Wir können nun den Banachschen Fixpunktsatz ses Kapitels über die nummerische Approximation formulieren. Der Beweis würde den Rahmen die- von Nullstellen sprengen.

191



DER BANACHSCHE FIXPUNKTSATZ

ZU SATZ 9.12 gl

V SATZ 9.12 (DER BANACHSCHE FIXPUNKTSATZ) Sei / C R ein Intervall und g : I —> / eine

Der Banachsche Fixpunktsatz liefert nicht nur eine Aussage über die Existenz eines Fixpunktes, sondern gibt zudem an, wie schnell die Iterationsfolge gegen diesen Fixpunkt konvergiert. Man nennt dies die Konvergenzgeschwindigkeit der Folge. Die Konvergenzgeschwindigkeit ist im Übrigen sehr hoch. Der Fehler nach n Iteration ist im Wesentlichen L" - wobei L eine Zahl kleiner 1 ist. Dieser Ausdruck geht für n —> oo sehr schnell - exponentiell schnell um genau zu sein - gegen 0.

kontrahierende Funktion mit Kontraktionskonstanten L. Sei außerdem xo E I beliebig gewählt und eine Folge (xn)n>0 rekursiv durch xri+1 = g(xn ) für n > 0 definiert. Dann besitzt g genau einen Fixpunkt eo E I und für alle n > 1 ist Ixn —er)! < 1

(9.1)

IX1

LnL

mit iiMn--+co X n = e0 • r BEMERKUNG 9.13 Die Kontraktionsgeschwindigkeit gibt eine Information, wie weit man nach n Iterationsschritten noch vom Fixpunkt entfernt ist. Das ist natürlich nur eine obere Abschätzung - es kann schneller gehen. Der Abstand Ix' — xo1wird häufig auch durch den maximal möglichen Abstand, also der Intervallbreite von I abgeschätzt. Diese Abschätzung ist dann für alle Anfangswerte xo E I korrekt.

BEISPIEL 9.14 Die Iterationsfunktion aus Beispiel 9.4 ist nach Beispiel 9.11 kontrahierend mit Kontraktionskonstanten L = ß. Damit gilt, für jeden Startwert xo E [1,2], dass der Abstand zur Nullstelle des Cosinus höchstens

Ln 1x1 1—L

xo 1 =

(e)n 3 3n 3 3 n

_3

5n-1 2

ist. Für n = 10 ist das schon kleiner 1. Vergleicht man das mit den tatsächlichen Zahlen aus Beispiel 9.4, stellt man fest, dass die Nullstelle für den dort verwendeten Anfangswert noch viel schneller approximiert wird, als diese grobe obere Schranke nahe legt. L

ZUSAMMENFASSUNG

Eine Funktion ist nach Definition 9.6 kontrahierend, wenn es eine sogenannte Kontraktionskonstante L mit 0 < L < 1 gibt, so dass für jedes Paar x, y E I gilt If(x) — f

I, • Ix —

Nach Lemma 9.10 ist eine differenzierbare Funktion genau dann kontrahierend, wenn der Betrag der Ableitung auf ganz I durch eine nicht-negative Zahl kleiner 1 beschränkt ist. Wenn also für alle x E I gilt 1f (x)1 < L für eine reelle Zahl L E [0,1). Ist f kontrahierend, dann ist L = supx EI flf /(x)11 eine

192

Kontraktionskonstante von f . Der Banachsche Fixpunktsatz besagt, dass eine mit einem Startwert xo E I rekursiv mittels kontrahierender Iterationsfunktion gebildete Folge stets gegen den eindeutigen Fixpunkt im Intervall I konvergiert. Ist L die Kontraktionskonstante der Iterationsfunktion, so wird die Konvergenzgeschwindigkeit ebenfalls angegeben. Ist e der Fixpunkt, dann gilt für alle n > 1

Ixn — mit lim x7, = eo. n—>oo

Ln

1i,

Ixi — X01.

(9.2)

ITERATIONSVERFAHREN ZUR NULLSTELLENBESTIMMUNG •

9.3 Iterationsverfahren zur Nullstellenbestimmung Wir lernen nun zwei Iterationsverfahren kennen, mit denen man für bestimmte Funktionen (stetig differenzierbare) Nullstellen finden kann. Beide haben einen großen Haken. Es ist zwar möglich zu beweisen, dass es ein kleines Intervall um jede Nullstelle mit solchen Startwerten gibt, so dass die iterierte Folge sicher gegen die Nullstelle kon-

vergiert. Allerdings ist natürlich weder die genaue Lage der Nullstelle bekannt (die wollen wir ja gerade finden), noch, wie groß dieses Intervall ist - es kann sehr klein sein. Die Verfahren werden durch die konkrete Wahl einer Iterationsfunktion definiert.

9.3.1 Das Newton-Verfahren

Wir definieren zu Beginn die Iterationsfunktion Nullstelle einer stetig-differenzierbaren Funktion. des Newton-Verfahrens zur Bestimmung einer DEFINITION 9.15 Sei / C IR ein Intervall und f : I --> JR sei stetig differenzierbar mit f' (x) für alle x E I. Definiere 1 I --> JR durch

eN (x) = x

lel ZU DEFINITION 9.15 Die Idee hinter der Iterationsfunktion lässt sich am besten geometrisch beschreiben. Zum Zeitpunkt n ist die aktuelle Schätzung für die Nullstelle x,. Ist x, noch nicht die Nullstelle, ist sie f (x„) davon entfernt Nullstelle zu sein. Wo sucht man nun am Besten nach der Nullstelle? Man berechnet die Steigung der Funktion f an der Stelle x„ und nimmt mangels besserer Alternativen an, die Funktion sei linear mit entsprechender Steigung. Der Schnittpunkt dieser approximierten Funktion mit der x-Achse findet sich genau an der Stelle x — f ('). Daher diese Formel. Anschaulich T bildet man ein Steigungsdreieck mit der Steigung f'(x„). Die Ecken sind x„ und x„+1 auf der x-Achse und der Punkt auf dem Graphen an der Stelle x„. Siehe Abbildung 9.3.

0

f(x)

f(x) .

Ist 4'(I) c I so wird das durch die Iterationsfunktion e gegebene Iterationsverfahren als NewtonVerfahren zur Bestimmung einer Nullstelle e von f bezeichnet. r

BEMERKUNG 9.16 Sind zwei Funktionen f, eiv wie in Definition 9.15 mit leicht nachprüfen, dass ''N die Minimalanforderungen Il. und 12. erfüllt.

'(I) C I gegeben, so lässt sich iaa

ABBILDUNG

9.3

L

Bevor wir ein Beispiel betrachten, formulieren wir eine Aussage über die Erfolgsaussichten des Newton-Verfahrens. Der Beweis dieses Satzes

sprengt den Rahmen der Darstellung, wir nehmen ihn dankend hin.

Die Iterationsfunktion des Newtonverfahrens berechnet eine neue Approximation x„+1 an die Nullstelle für eine gegebene Approximation x„, indem ein Steigungsdreieck mit der Steigung f' (x„) gebildet wird. Die Ecken sind x„ und x„+1 auf der x-Achse und der Punkt auf dem Graphen an der Stelle x,,.

193



ITERATIONSVERFAHREN ZUR NULLSTELLENBESTIMMUNG

ZU SATZ 9.17

ä

Die ersten beiden Punkte belegen, dass 4,N die Voraussetzungen des Banachschen Fixpunktsatzes auf einem kleinen Intervall [Z — 1, + 5] um die Nullstelle e erfüllt. Der dritte Punkt folgt aus dem Banachschen Fixpunktsatz. Das Newton-Verfahren zur Bestimmung einer Nullstelle e von f funktioniert also in einem Intervall um jede Nullstelle e, wenn f' (e) 4 0 ist.

SATZ 9.17 Sei f : I -# IR zweimal stetig differenzierbar auf einem Intervall I C R, sei f' (x) 0 für alle x E I und sei e E I eine Nullstelle von f , die kein Randpunkt von I ist. Dann gibt es ein 6 > 0 mit [e — 6, e + ä] C I, so dass die folgenden Aussagen gelten. I Es gibt ein L E [0,1), so dass für alle x

E [e — 6, e + b] gilt IVAT (x)1 < L.

II Es ist (1)Ar([e — (5, + 8]) C [e — 6, + 8]. II Für jeden Startwert xo E [e — 6, e + 6] folgt für die rekursiv definierte Folge xr, = 4)N (xn_i) für alle n E N dass lim x„.

n—>co

= e.

BEISPIEL 9.18 Wir approximieren numerisch die eindeutig bestimmte Nullstelle der streng monoton wachsenden Funktion f : IR —› IR, gegeben durch

f(x) =

X3 +

3x +1.

Für alle x E R ist dann f' (x) = 3x 2 + 3 > 0, und die Iterationsfunktion 5.

Es gilt für das Sekanten-Verfahren analog zum in der Praxis wenig hilfreiche (da reine ExistenzNewton-Verfahren die folgende sehr schwer zu be- )Aussage. weisende aber durchaus erhellende und dennoch

195



ITERATIONSVERFAHREN ZUR NULLSTELLENBESTIMMUNG

V SATZ 9.22 Sei f : I —› 111 zweimal stetig differenzierbar auf einem Intervall I C IR, sie f' (x) 0 für alle x E / und sei e E I eine Nullstelle von f, die kein Randpunkt von I ist. Dann gibt es ein 5 > 0 so dass für alle xo, x1 e [e — 6, e + 5] mit xo xi die Sekanten-Methode eine Folge (xn)rigego liefert mit = e.

ZUSAMMENFASSUNG

Wir haben zwei Iterationsverfahren zur Bestimmung einer Nullstelle einer Funktion kennengelernt. Das Newton-Verfahren ist über die Iterationsfunktion aus Definition 9.15 charakterisiert. Sie lautet : I —> R mit 'N(x) =



f(x)

f' (x) Das Verfahren ist anwendbar, wenn (D(I) C I, die Iterationsfunktion in ihren Definitionsbereich abbildet. Die Idee lässt sich folgendermaßen umreißen. Zum Zeitpunkt n ist die aktuelle Schätzung für die Nullstelle xn. Ist xn noch nicht die Nullstelle, ist sie f (xn) davon entfernt Nullstelle zu sein. Man berechnet die Steigung der Funktion f an der Stelle xn, und nimmt, mangels besserer Alternativen an, die Funktion sei linear mit entsprechender Steigung. Der Schnittpunkt dieser approximierten Funktion mit der x-Achse findet sich genau an der Stelle x P(2) . Anschaulich bildet man ein Steigungsdreieck mit der Steigung fi(xn ). Die Ecken sind x, und xn±i auf der x-Achse und der Punkt auf dem Graphen an der Stelle xn. Satz 9.17 erhellt, dass das Newton-Verfahren für zweimal stetig-differenzierbare Funktionen f, deren erste Ableitung ungleich 0 ist, in einem möglicherweise recht kleinen Intervall um jede Nullstelle gegen diese konvergiert. Er trifft eine reine Existenzaussage und ist nicht konstruktiv insofern er keine Vorschrift zum Auffinden dieses Intervalls angibt.

196

Das Sekanten-Verfahren ist über die Iterationsfunktion aus Definition 9.19 charakterisiert. Sie lautet (I) : / x / —› R mit es(x, y) = x — f(x)

—y

f(x) — f(y)

Y • f (x) — x • f (Y)

f(x) — f(y) • Das Verfahren ist anwendbar, wenn es (/ x I) C I gilt. Dann definieren wir eine Iterationsfunktion mittels i den Kreis in n gleich-große Kreisausschnitte alias „Kuchenstücke". Diese Kuchenstücke ordnet man dann nebeneinander an, wie in Abbildung 10.2 für n = 6 und n = 8 zu sehen. Man stellt fest,

ABBILDUNG 10.1

Welchen Flächeninhalt schließt eine nach unten geöffnete und um 1 nach oben verschobene Parabel mit der x-Achse zwischen —1 und 1 ein? Solche Fragen können mit dem Integral beantwortet werden.

dass der Flächeninhalt fast r • z entspricht (der grünen Fläche), wobei r der Radius und U der Umfang des Kreises ist. Der Kreisumfang entspricht 7r • r - also ist der Flächeninhalt der grünen Fläche genau Ir • r2. Der Unterschied der Kreisfläche, der bei der Zerlegung in n Kreisausschnitte zu dieser grünen Fläche entsteht, lässt sich mit den trigonometrischen Formeln abschätzen - siehe die untere Illustration in Abbildung 10.2 für eine Beweisskiz-

U

2

ze. Der Fehler wird für größer werdendes n immer kleiner. Die Kreisausschnitte überdecken immer mehr der grünen Fläche und befinden sich immer weiter innerhalb dieser Fläche, je größer n wird. Dabei ist anzumerken, dass die Fläche, die von den Kreisausschnitten überdeckt wird, für jedes n gleich groß ist - nämlich einfach die Fläche des Kreises.

U 2

IM ABBILDUNG 10.3 Es sind unterschiedliche Approximationen an den Flächeninhalt zwischen x-Achse und Funktionsgraphen mittels einer Streifenüberdeckungen angedeutet. Sie alle eint die gleiche Streifenbreite, die häufig mit dx bezeichnet wird. Für die Abschätzung des Flächeninhalts wurden entweder der kleinste (oben), irgendein (mitte) oder der größte (unten) Funktionswert in dem Intervall verwendet. Lässt man nun den Wert dx gegen 0 gehen, sollten diese Approximationen sich einander annähern.

Flächeninhalt einer durch eine Funktion begrenzten Fläche bestimmen

ABBILDUNG 10.2

BI

Die Zerlegung eines Kreises in n = 6 und n = 8 Kreisausschnitte zur Abschätzung seines Flächeninhalts über ein Rechteck mit Seitenlängen r und wobei r der Radius und U der Umfang des Kreises ist.

198

Wir haben bei der Kreisflächenberechnung gesehen: Man führt die Bestimmung des Flächeninhalts einer „komplizierten" Fläche auf die Bestimmung von Flächen zurück, deren Flächeninhalt leicht berechnet werden kann. Diese Idee findet auch Anwendung, möchte man für eine Fläche, die nach oben durch den Graphen einer Funktion und nach unten durch die x-Achse beschränkt ist, den Flächeninhalt berechnen. Dabei überdeckt man solche Flächen mit langen dünnen

Streifen, die alle eine Breite von dx haben und deren „Höhe" in etwa den Funktionswerten „an dieser Stelle" entspricht. Das lässt sich auf unterschiedliche Art und Weise realisieren. Man könnte den größten, den kleinsten oder irgendeinen Funktionswert in dem aktuellen Abschnitt der Breite dx wählen. In der Abbildung 10.3 sind für das gleiche dx unterschiedliche „Näherungen" des Flächeninhalts durch eine „Streifenüberdeckung' einer Funktion f : [a, b] —> R skizziert. Addiert man die Flächeninhalte der Streifen und lässt dann die Breite dx der Strei-

fen gegen 0 gehen, sollte man im Grenzübergang den Flächeninhalt der Fläche zwischen Funktionsgraph und x-Achse bestimmt haben. Dieses Vorgehen wird auch mit den Schlagworten „Bestimmung der Obersumme" und "Bestimmung der Untersumme" in Verbindung gebracht. Stimmen für jedwede solche Überdeckung die unterschiedlichen Schätzungen des Flächeninhalts im Grenzwert für immer kleiner werdende Streifenbreite dx überein, nennt man dies das Riemann-Integral der Funktion. Das Schlagwort „Infinitessimalrechnung" findet hier seinen Platz. Man rechnet mit „annähernd unendlich kleinen Abschnitten dx", um die Fläche beliebig gut zu approximieren. In der Praxis stellen sich natürlich noch einige Fragen: Wie verfährt man, wenn der Funktionsgraph die x-Achse schneidet, es also je einen Flächenteil gibt, der unterhalb und oberhalb der xAchse liegt? Wie geht man vor, wenn die Funktion nicht stetig ist, sondern wild springt, so dass eine Überdeckung mit solchen Streifen, egal wie dünn sie auch gewählt werden, nicht zum Ziel führt? Die erste Frage lässt sich leicht beantworten. Man führt ein Vorzeichen für den Flächeninhalt einer Fläche ein, je nachdem ob sie über oder unter der x-Achse liegt. Die zweite Frage hingegen legt den Finger in die Wunde und deckt ernsthafte Probleme auf. Tatsächlich gibt es Funktionen, die nicht mit einem Riemann-Integral versehen werden können. Betrachte beispielsweise die sogenannte DirichletFunktion D : R —> IR, die in Abbildung 4 illustriert ist. Sie ordnet jeder rationalen Zahl den Wert 1 und jeder irrationalen Zahl den Wert 0 zu. Möchte man für das Intervall [0,1] nun den Flächeninhalt der Fläche zwischen Funktionsgraph und x-Achse bestimmen, wird es schwierig. In jedem Balken

befinden sich unendlich viele rationale wie irrationale Zahlen auf der x-Achse. Es lässt sich also für jeden der beiden Funktionswerte 0 und 1 plausibel argumentieren, dass er „die richtige Näherung' in diesem x-Achsenabschnitt ist. Oder anders betrachtet, die „Untersummen" sind stets 0 und die „Obersummen" stets 1. Es fällt schwer, überhaupt eine Fläche „unterhalb" der Funktion zu definieren - „neben" jeder rationalen Zahl liegt in jedem Abstand eine rationale Zahl und umgekehrt. Die Funktion bleibt also für keinen noch so kleinen x-Achsenabschnitt konstant 1 oder 0. Um solchen Funktionen einen plausiblen Integralbegriff zuordnen zu können, entwickelten Mathematiker im Rahmen der Maßtheorie den Begriff der Messbarkeit. Ein auf diesem Konzept aufbauender Integralbegriff ist das sogenannte LebesgueIntegral. Die Darstellung dieses Objekt übersteigt jedoch den Rahmen dieser Einführung in die Analysis. Ein kurzer Blick Richtung Anwendungen und dem Zusammenhang zur Differentialrechnung

Möchte man die Fläche berechnen, die eine reelle Funktion mit der x-Achse zwischen zwei Punkten a und b einschließt, so berechnet man das bestimmte Integral von a nach b. Solche Berechnungen sind in vielen Anwendungen relevant. Beispielsweise entspricht in der Physik die Fläche unter der Kurve in einem Geschwindigkeits-ZeitDiagramm dem zurückgelegten Weg. In einem Weg-Zeit-Diagramm entspricht die Änderung der Steigung der Kurve einer Änderung der Geschwindigkeit. Man kann also den zurückgelegten Weg durch ein Integral aus einem GeschwindigkeitsZeit-Diagramm und die Geschwindigkeit durch die Ableitung aus einem Weg-Zeit-Diagramm er-

199

DAS BESTIMMTE INTEGRAL

mitteln. Dieser Zusammenhang von Integration und Differentiation führt häufig zu der Aussage, dass Integration auch als „Aufleitung" zu verstehen ist ein Begriff, den es in der Mathematik so nicht gibt.

D(x

ABBILDUNG 10.4 Die Dirichlet-Funktion, welche allen rationalen Zahlen den Wert 1 und den irrationalen Zahlen den Wert 0 zuordnet ist nicht Riemann-integrierbar. In jedem noch so kleinen Intervall auf der x-Achse gibt es sowohl rationale als auch irrationale Zahlen. Die Funktionswerte nähern sich also nicht einander an - in jedem noch so kleinen Intervall springt die Funktion wild zwischen 1 und 0 - ein Flächeninhalt kann nicht definiert werden.

Der Hauptsatz der Integral- und Differentialrechnung gibt den tatsächlichen Zusammenhang an. Mit Hilfe von Stammfunktionen, deren Ableitungen der zu integrierenden Funktion entsprechen, können bestimmte Integrale berechnet werden.

10.1 Das bestimmte Integral 10.1.1 Der orientierte Flächeninhalt Für eine Funktion f : [a, b] -t IR möchten wir den Flächeninhalt der Fläche, welche zwischen dem Graphen von f und der x-Achse liegt, bestimmen. Für die Funktion

f : [0, 1] —> R

mit 1—> 1

ist dieser Flächeninhalt 1, wie in dem rechten Diagramm in Abbildung 10.5 zu sehen ist. Verschiebt man die Funktion f um a nach oben, so wird der Flächeninhalt um das Rechteck 1 • a größer. Die

von dem Funktionsgraphen der Funktion fa :[0,1]-+R

mitx,—>l+a

und der x-Achse eingeschlossene Fläche hat den Flächeninhalt 1 - (1 + a) - zumindest falls a nicht kleiner —1 ist. Setzt man für a eine konkrete Zahl ein, die kleiner —1 ist, zum Beispiel a = —2, so erhält man über die Formel 1 • (1 + a) = —1 einen negativen Flächeninhalt, siehe Abbildung 10.5.

f (. •

A=1

A= 2

IIABBILDUNG 10.5 a ist 1. Verschiebt man Der Flächeninhalt der Fläche zwischen x-Achse und Funktionsgraph der Funktion f : [0,1] •—+ lP, x die Funktion um a, ändert sich der Flächeninhalt um 1 • a - ist a negativ, wir die Fläche zunächst kleiner und unterschreitet der Funktionsgraph die x-Achse, wird die so berechnete Größe negativ - das motiviert die Definition des orientierten Flächeninhalts.

200

DAS BESTIMMTE INTEGRAL

In dem mittleren Diagramm ist a = ä gewählt, der Flächeninhalt wächst und entspricht 1 • (1 + = 2 In dem rechten Diagramm ist a = —2 gewählt 2" und der Flächeninhalt wird negativ. Er ist dann konsequent berechnet 1 • (1 + (-2)) = 1 (-1) = —1. Das entspricht dem tatsächlichen Flächeninhalt, jedoch mit einem negativen Vor-

zeichen versehen, weil sich die Fläche unterhalb der x-Achse befindet. Das in dem Eingangsbeispiel motivierte Konzept des negativen Flächeninhalts gießen wir nun in eine Definition, versehen also den Flächeninhalt bestimmter Flächen mit einem negativen Vorzeichen.

le

is

ZU DEFINITION 10.1

Für eine Plausibilitätsbetrachtung sei auf das Eingangsbeispiel verwiesen. Der orientierte Flächeninhalt berechnet sich als Differenz der Flächeninhalte der Flächenanteile oberhalb und unterhalb der x-Achse.

DEFINITI ON 10.1 Sei f : [a, b] R eine Funktion. Ist der Flächeninhalt der Fläche zwischen dem Funktionsgraphen von f und der x-Achse zu bestimmen, so bezeichnet Aa (f, +) den Flächeninhalt der Flächen oberhalb der x-Achse und Aa (f, —) den Flächeninhalt der Flächen unterhalb der x-Achse. Die Differenz Aba(f) = Aba(f, +) Anf, —) 2

bezeichnet den orientierten Flächeninhalt der Fläche zwischen dem Funktionsgraphen von f und der x-Achse. ,1(f, -I-)

-41

BEISPIEL 10.2 Betrachte

die Funktion f : [0,3] -# R mit x 1—> x — 1. Es gilt Al (f,+) = 2,

Aba (f, —) -= 2 ,

denn die eingeschlossene Fläche entspricht jeweils einem Dreieck, einmal mit Grundseite 1 sowie Höhe 1 und einmal mit Grundseite 2 sowie Höhe 2. Also ist der orientierte Flächeninhalt der Fläche zwischen dem Funktionsgraphen von f und der x-Achse 1 Alt(f) = Aba(f, +) Aba ( f, — ) = 2 — — = 2 ' 2 siehe Abbildung 10.6. L

2

3

-)

ABBILDUNG 10.6

Der orientierte Flächeninhalt der Funktion aus Beispiel 10.2 berechnet sich als Differenz der Flächeninhalte der Flächenanteile oberhalb und unterhalb der x-Achse.

10.1.2 Das Integral von Treppenfunktionen Für bestimmte besonders einfache Funktionen kann man den Flächeninhalt zwischen Funktionsgraph und x-Achse leicht bestimmen. Es sind

Funktionen, für welche besagte Fläche in einfache geometrische Figuren zerfällt - am einfachsten Rechtecke.

201



DAS BESTIMMTE INTEGRAL

ZU DEFINITION

nEFINITION 10.3 Wir nennen eine Funktion t : [a, b] —› IR eine Treppenfunktion, wenn es

10.3 gl

Treppenfunktionen sind abschnittsweise konstant. Sie sind insbesondere stückweise stetig, können Sprungstellen an den "Klebestellen" a = aci R integrierbare Funktionen. Sei c E Dann sind die Funktionen fi + f2 und c • fi integrierbar mit

fa

(fl

f2)(X)dX

=

Ja

f

fi(x)dx

Wenn ferner fi(x) < f2(x) für alle x

e

fa

f2(x)dx

f bfi(x)dx.

(a, b), dann gilt fl(X)dX

Wir ergänzen nun zwei Konventionen und eine kleine Beobachtung. Bis dato haben wir das bestimmte Integral einer Funktion definiert, deren Definitionsbereich einem Intervall entspricht. In f (.)

Lb (c • fi)(x)dx = c •

und

< f

f2(x)dx.

der Praxis kann man das bestimmte Integral für eine gegebene Funktion über Teilintervallen berechnen. Es entspricht dem bestimmten Integral der Funktion eingeschränkt auf das Teilintervall. f (.)

)

2-

2-

2

ABBILDUNG 10.14

In

ZU DEFINITION 10.19 Mit f I [„ bi ist die Restriktion der Funktion auf das Intervall [a, 6] gemeint. Man kann also bestimmte Integrale auch für Teilintervalle des Definitionsbereichs berechnen.

210

Drei bestimmte Integrale, die mit der Identitätsabbildung über unterschiedliche Teilintervalle des Definitionsbereichs berechnet werden. Im linken Diagramm ist a = 0 und b = 1, im mittleren Diagramm ist a = 0 und b = 2 und im rechten Diagramm ist a = e und b = 2.

DEFINITION 10.19 Es sei f : D —> R mit D c integrierbar. Dann schreiben wir für jedes

DAS BESTIMMTE INTEGRAL •

Intervall [a, b] C D auch

f (x)dx =f 1[.,b] (X)dX.

b

a

1 BEISPIEL 10.20 Betrachte die Funktion f : IR —> mit x H x. Dann lassen sich mehrere bestimmte

Integrale über unterschiedliche Intervallgrenzen berechnen. Es sind 1

1

f2 o

xdx = 2 ,

2

xdx = 2,

7 8

xdx = —.

Jo

Siehe Abbildung 10.14. So, wie das bestimme Integral im Prinzip dem orientierten Flächeninhalt einer von dem Funktionsgraph und der x-Achse eingefassten Fläche entspricht, lassen sich die beiden anderen Begrenzungen - die zur y-Achse parallelen Strecken an DEFINITION 10.21 Wenn

den Intervallgrenzen orientieren. Man kann also auch das Integral für Grenzen definieren, bei denen die untere Grenze größer als die obere ist man versieht es dabei mit einem negativen Vorzeichen.

Streng genommen ist das bestimmte Integral nur für Grenzen definiert, bei welchen die untere Grenze kleiner als die obere ist. Ist dies nicht der Fall, entspricht es dem bestimmten Integral mit vertauschen Grenzen und einem negativen Vorzeichen es versteht sich ähnlich wie der orientierte Flächeninhalt, der dem Integralbegriff zu Grunde liegt.

f auf [a, b] integrierbar ist, dann ist a

f (x)dx = — f f (x)dx. Wenn f auf [a, b] integrierbar ist, gilt für alle c

E

ZU DEFINITION 10.21

[a, b] , dass

f (x)dx = 0.

Mit Definition 10.19 im Hinterkopf lässt sich nun das folgende Lemma zeigen. Es verdeutlicht, dass bestimmte Integrale als Summe von bestimmten

II LEMMA 10.22

Integralen über Teilintervallen berechnet werden können.

Wenn a < b < c reelle Zahlen sind und f auf [a, c] integrierbar ist, dann gilt c

f (x)dx = f f (x)dx f f (x)dx

Beweis. Der Beweis wird dem Leser zur Übung überlassen.



211

DAS BESTIMMTE INTEGRAL

ZUSAMMENFASSUNG

Es sei f : [a, b] —> 11 Funktion. Lässt sich der Flächeninhalt zwischen Funktionsgraph und x-Achse bestimmen, so präzisieren wir in Definition 10.1 und nennen Aba ( f, +) den Flächeninhalt der Flächen oberhalb der x-Achse und Aba (f, —) den Flächeninhalt der Flächen unterhalb der x-Achse. Die Differenz .Ae(f) = AIL (f , +) — f , —) wird als der orientierte Flächeninhalt dieser Fläche bezeichnet. Für Treppenfunktionen t : [a, b] —> IR ist der orientierte Flächeninhalt leicht zu bestimmen. Eine Treppenfunktion ist eine auf endlich vielen Abschnitten (jeweils als Stufe bezeichnet) konstante Funktion (siehe Definition 10.3). Der orientierte Flächeninhalt wird nach Definition 10.5 und Lemma 10.7 für solch eine Funktion als bestimmtes Integral bezeichnet und mit fa t(x)dx notiert.

von f über [a, b], als fab f (X)dX = supt tf

Nach Proposition 10.14 sind das bestimmte Integral integrierbarer Funktionen und der orientierte Flächeninhalt, zwischen Graph und x-Achse gleich. Nach Proposition 10.15 sind stückweise stetige Funktionen integrierbar. Nach Proposition 10.18 gelten für zwei integrierbare Funktionen fi : [a, b] —> R, f2 : [a, b] -+ R und ein c E R, dass die Funktionen fi f2 und c • fi integrierbar sind mit b Ja

b b (fi + f2)(X)dX = I h (x)dx + f f2 (x)dx

a

fab

Möchte man den orientierten Flächeninhalt für eine beliebige Funktion bestimmen, ist zunächst nicht klar, ob dieser auch für jede Funktion zu bestimmen ist. Man möchte es durch eine Approximation mittels der bestimmten Integrale von Treppenfunktionen definieren. Dazu erzeugt man in Definition 10.8 eine Menge T*(f, [a, b]), welche alle Treppenfunktionen beinhaltet, deren Funktionswerte größer oder gleich den Funktionswerten einer Funktion f auf dem Intervall [a, b] sind und eine Menge 77, ( f, [a, b]), welche alle Treppenfunktionen beinhaltet, deren Funktionswerte kleiner oder gleich den Funktionswerten einer Funktion f auf dem Intervall [a, b] sind. Man sagt, dass eine Funktion integrierbar ist, wenn nach Definition 10.10 gilt inf

f t(x)dx : t E T* (f, [a, b])}

= sup

(C •

a

b fi)(x)dx = c • f f I. (x)dx .

Wenn ferner fi (x) < f2 (x) für alle x E (a, b), dann gilt b

b

fi(x)dx < f

f2(x)dx.

Ja

Definition 10.19 definiert das bestimmte Integral auf einer Teilmenge des Definitionsbereichs als das bestimmte Integral über der Einschränkung der Funktion auf die Teilmenge. In Definition 10.21 werden noch die folgenden beiden Notationen gegeben. Wenn f auf [a, b] integrierbar ist, dann ist

L

a

f (x)dx — fb (x)dx

und für alle c E [a, b], dass

fcc f (x)dx = 0.

f t(x)dx : t E 7; (f [a, b])}

In diesem Fall definiert man das bestimmte Integral

(x)dx : t E T. (f , [a, /JD} .

Lemma 10.22 erhellt, für reelle Zahlen a < b < c und einer auf [a, c] integrierbaren Funktion f, dass gilt c

L

212

f (x)dx -= I (x)dx f f (x)dx

DER MITTELWERTSATZ (DER INTEGRALRECHNUNG)

10.2 Der Mittelwertsatz (der Integralrechnung)

Der Mittelwertsatz der Integralrechnung besagt: Das Integral über einem Intervall [a, b] einer dort stetigen Funktion entspricht dem Produkt der Intervallbreite b — a und dem Funktionswert an

ä ZU PROPOSITION

einer Stelle c E [a, b]. Der Betrag des Integrals entspricht also dem Volumen des Rechtecks mit Seitenlänge b — a und I f (c) I, das Vorzeichen dem Vorzeichen von f (c), siehe Abbildung 10.15.

PROPOSITION 10.23 (MITTELWERTSATZ DER INTEGRALRECHNUNG) es ein c e [a, b], so dass

11

Ist f : [a, b] —› stetig,

gibt

10.23

Ähnlich wie der Mittelwertsatz der Differentialrechnung oder der Zwischenwertsatz trifft der Mittelwertsatz eine Aussage über die Existenz einer Zahl c im Definitionsbereich mit der gewünschten Eigenschaft (hier, dass die Intervallbreite multipliziert mit dem Funktionswert an der Stelle c dem bestimmten Integral entspricht). Der Beweis ist nicht konstruktiv, er verwendet den nicht konstruktiven Zwischenwertsatz. Es gibt also keine algorithmische Konstruktionsanweisung, um dieses c tatsächlich zu finden.

fa b

f (x)dx -= (b — a) • f (c). f(b)

Beweis. Da f stetig auf [a, b] ist, ist f nach Proposition 10.15 dort auch integrierbar.

Wir betrachten die stetige Funktion h : [a, b] —> IR, x

f (x)(b — a). Es gilt

inf {h(x) : x E [a, b]l < f f (x)dx

sup [h(x) : x E [a, b]l .

.f(c1

Nach dem Zwischenwertsatz gibt es also ein c E [a, b], so dass (b — a) • f (c) = h(c) = I f (x)dx , Mal ABBILDUNG

wie behauptet.

Der Mittelwertsatz der Integralrechnung besagt, dass das Integral über ein Intervall [a, b] einer dort stetigen Funktion dem Produkt der Intervallbreite b — a und dem Funktionswert an einer Stelle c E [a, bi entspricht. Man kann also ein Rechteck finden, dessen Seitenlängen der Intervallbreite und dem Funktionswert an einer Stelle entsprechen, so dass der Flächeninhalt des Rechtecks dem (Betrag) des bestimmen Integrals entspricht.

BEISPIEL 10.24 In Beispiel 10.13 haben wir die Funktion f : [0,1] —> R, x > 1 — x2 integriert - in diesem Fall ist a = 0 und b = 1 und

2

L Tatsächlich ist mit c =

N/3

10.15

1 — x2 ds = 3.

eine Zahl aus dem Definitionsbereich [0,1] gefunden, so dass

(b — a) • f (c) = (1 — 0) • 1— ( 1—) 2 ) =- 2 = f 1 1 _ x2dx, NA

3

0

wie durch den Mittelwertsatz der Integralrechnung vorhergesagt - siehe Abbildung 10.16. 1

213

U DER HAUPTSATZ DER DIFFERENT.- & INTEGRALRECHNUNG

10.3 Der Hauptsatz der Differential- und Integralrechnung Bislang haben wir nur Aussagen über die Existenz von Integralen bzw. integrierbaren Funktionen getroffen, aber kein praktisches Schema zur Berechnung von Integralen kennen gelernt. Das ändert sich nun, wir werden den Hauptsatz der Differential- und Integralrechnung kennen lernen. Er ist das Verbindungsglied dieser bedeu-

f ()Ä

tenden Themen der Analysis. Ist umgangssprachlich manchmal davon die Rede, dass Integration die Umkehrung der Ableitung ist, Integrieren so etwas wie „Aufleiten" ist, klärt dieser Satz den tatsächlichen Zusammenhang. Doch zunächst brauchen wir die folgende Definition 10.25.

DEFINITION 10.25 Sei S c IR und f : S —› IR eine Funktion. Eine Funktion F : S differenzierbar ist, heißt Stammfunktion von f, falls ABBILDUNG 10.16

IR, die auf S

GA

Für die Funktion f aus Beispiel 10.24 lässt sich eine Stelle des Definitionsbereichs finden, so dass Funktionswert an dieser Stelle mal Intervallbreite des Definitionsbereichs genau dem bestimmten Integral entspricht. In diesem Fall ist es c = ±, mit f (c) = 4.

f (x) = (x)

für alle x E S.

r BEMERKUNG 10.26 Die Stammfunktion wird in Abgrenzung zum bestimmten Integral auch als unbestimmtes Integral bezeichnet. Später wird klar, dass man mit Hilfe von Stammfunktionen bestimmte Integrale berechnen kann. 1

BEISPIEL 10.27 Sei f : [0,5] —› R mit x H c.

Die Funktion F1 : [0,5] —› JR mit x -+ c • x ist auf [0,5] differenzierbar und es ist Fl (x) = c = f (x) für alle x E [0,5]. Sie ist daher eine Stammfunktion für f.

ZU DEFINITION 10.25

Eine Stammfunktion einer Funktion ist eine Funktion auf dem selben Definitionsbereich, deren Ableitung der ursprünglichen Funktion entspricht. Man könnte umgangssprachlich auch sagen, dass es die „Aufleitung" der Funktion f ist - aber die gibt es formal mathematisch nicht. Das liegt daran, dass die Stammfunktion nicht eindeutig ist, wie wir später sehen werden, die Ableitung schon.

Allerdings ist auch die Funktion F2 : [0,5] JR mit x c • x + 13 auf [0,5] differenzierbar und es ist F(x) = c = f(x) für alle x E [0,5]. Sie ist also auch eine Stammfunktion auf f. L

1

Wie Beispiel 10.27 zeigt, ist die Stammfunktion Stammfunktionen unterscheiden sich allerdings einer Funktion nicht eindeutig bestimmt, aber höchstens um einen additive Konstante. fast, wie die folgende Proposition 10.28 zeigt. PROPOSMON 10.28 Sei S c IR und f : S —› 118 eine Funktion. Angenommen F1, F2 sind

ZU PROPOSITION 10.28 gl

Zwei Stammfunktionen ein und der selben Funktion können sich höchstens um eine additive Konstante unterscheiden. Der Graph der Stammfunktionen ist demnach lediglich um c verschoben.

Stammfunktionen von f . Dann gibt es eine Zahl c E IR, so dass Fi(x) = F2(x) c

für alle x E S.

Beweis. Die Funktion F1 — F2 hat die Ableitung (F1 — F2)' (x) = (x) — F(x) = f(x) — f(x) = 0.

214

DER HAUPTSATZ DER DIFFERENT.- & INTEGRALRECHNUNG

Nach Lemma 8.62 ist F1 — F2 sowohl monoton wachsend als auch monoton fallend, also konstant. Das ■ bedeutet, dass es eine Zahl c E Ill gibt, so dass FL (x) — F2 (X) = c für alle x e S.

Der Hauptsatz der Differential- und Integralrech- mit „das Integral ist die Umkehrung der Ableitung" nung gibt den Zusammenhang von Differentiation umschreiben. und Integration. Er formalisiert, was Laien häufig

SATZ 10.29 (HAUPTSATZ DER DIFFERENTIAL- UND INTEGRALRECHNUNG) Sei

f : [a, b]

stetig. Dann ist

x

F: [a, b]

H fa

f (y)dy

eine Stammfunktion von f . Beweis. Sei x E [a, b]. Falls x < b, gibt es nach Proposition 10.23 zu jeder hinreichend kleinen Zahl z > 0 ein cz E [x, x + z], so dass x+ z F(x + z) — F(x) = f

x+z f (y)dy — f f (y)dy = fx f (y)dy = z • f (e).

(10.1)

a

Weil f stetig ist, gilt lim f (cz ) = (x). z—)o Falls x > a, gibt es nach Proposition 10.23 zu jeder hinreichend kleinen Zahle z > 0 ein cz e [x — z, x], so dass x—z x—z f (y)dy = —z • f (cz ). (10.2) F(x — z) — F(x) = f f (y)dy — f f (y)dy = f a

Aufgrund der Stetigkeit von f, gilt lim f (cz ) = (x). Aus (10.1) und (10.2) folgt also (x) = lim

z--q)

wie behauptet.

F(x z) — F(x) z

= (x) ■

215

DER HAUPTSATZ DER DIFFERENT.- & INTEGRALRECHNUNG

Der Hauptsatz der Differential- und Integralrechnung ermöglicht es bestimmte Integrale zu berechnen. Dazu ist die Kenntnis einer Stammfunktion nötig. Dass es in der Praxis für die meisten Funktionen schwierig ist, eine solche zu finden, lässt auf-

keimenden Enthusiasmus schnell verfliegen. Um Integrale zu berechnen, muss häufig auf numerische Approximationsverfahren zurückgegriffen werden. Siehe dazu auch Kapitel 12 zur numerischen Integration.

10.3.1 Integrale berechnen Mit Hilfe von Proposition 10.28 und Satz 10.29 ist es möglich, Integrale zu berechnen. Wir können nun ein allgemeines Rezept formulieren. Mit KOROL LA R 10.30 Sei f : [a, b]

Kenntnis von Stammfunktionen lassen sich bestimmte Integrale berechnen.

H stetig und sei F eine Stammfunktion von f. Dann gilt f (x)dx = F(b) — F(a).

Beweis. Sei G(y) = fa f (x)dx . Nach Satz 10.29 ist G eine Stammfunktion von f . Nach Proposition 10.28 existiert also eine Zahl c E RI, so dass F(x) = G(x) c für alle x E [a, b]. Daraus folgt, dass a

F(b) — F(a) = G(b) — G(a) = f f (x)dx — f f (x)dx = f f (x)dx — 0 = f f (x)dx, a

a

a

a

wie behauptet.

BEISPIEL

10.31 In Beispiel 10.12 haben wir ausgerechnet, dass

xdx = 2.

Mit Korollar 10.30 können wir dieses Integral einfacher ausrechnen. Denn die Funktion f : [0,1] —+ JR mit x x hat die Stammfunktion F : [0,1] —r JR mit x H ä• x2. Also erhalten wir 1

L BEISPIEL

1

2

1

xdx = F(1) — F(0) = — • 12 — — • 0 -- — . 2 2 2

10.32 In Beispiel 10.13 haben wir ausgerechnet, dass fö 1 — x2dx = 2.

Mit Korollar 10.30 können wir dieses Integral einfacher ausrechnen. Denn die Funktionf : [0,1] -+ x H 1 — x 2 hat die Stammfunktion F : [0,1] -+ JR mit x H x — s• x3 . Also erhalten wir

Jo

216

1 •13 —(0—•03

mit

DER HAUPTSATZ DER DIFFERENT.- & INTEGRALRECHNUNG



10.3.2 Zwei Integrationshilfen für stetig differenzierbare Funktionen

Mit Hilfe von Korollar 10.30 gewinnen wir aus den Ableitungsregeln, insbesondere der Produktund der Kettenregel, Rechenregeln für das Integrieren. Sie wenden diese Ableitungsregeln umgangssprachlich gesprochen "rückwärts" an. Um diese Einsicht muss man etwas kämpfen, einige Beispiele rechnen, doch dann erweist sie sich als gute "Merkhilfe" für die partielle Integration.

Partielle Integration Die erste Integrationsregel wird als partielle Integration bezeichnet. Dabei lassen sich bestimmte Integrale eines Produkts zweier Funktionen berechnen. Dies ist allerdings nur dann möglich, wenn die Stammfunktion der einen und die Ableitung der anderen Funktion bekannt sind.

Ko RO L L A R 10.33 Seien zwei stetig differenzierbare Funktionen fi , f2 : [a, --> IR gegeben. ä zu KoROLLAR 10.33 Dann gilt Betrachtet man den Beweis dieser Aussage,

b

la bf (X) f2(X)dX = J1(b)f2(b) — fi(a)f2(a) — J

.fi(x)f 2 (x)dx.

Betrachte die Produktfunktion (fi • f2) : [a, b] -+ R mit x 1 fi(x) • f 2(x). Sie ist eine Stammfunktion der Funktion

Beweis.

f; • f2 + fi • fä :

kann man sich das Schema der partiellen Integration gut merken und im Zweifelsfall wieder herleiten, wenn man die Produktregel der Differentialrechnung präsent hat.

mit x 1 —tfl(x) • f2(x) fi(x) • f 2 (x),

[a, b] —› R

wie man durch Anwenden der Produktregel der Differentialrechnung leicht nachrechnet. Mit Korollar ■ 10.30 folgt die Behauptung, wenn man die so erhaltene Gleichung leicht umformt. r BEISPIEL 10.34 Für das Beispiel setzen wir voraus, dass sin(x) und cos(x) stetig differenzierbar auf ganz IR d— sin(x) = cos(x) ist (kennt man die Ableitungen von Sinus und Cosinus wird das schnell sind und dass --ds klar). Außerdem prüft man leicht nach, dass f : IR —› It , x t—> x stetig differenzierbar ist. Man kann mit Hilfe der partiellen Integration für je zwei Zahlen a und b das folgende Integral über [a, b] berechnen

b

fa

cos(x) xdx.

Setze dazu fi (x) = sin(x)

und

f2 (x) = x.

Dann sind

fi (x) = sin(x),

fi(x) = cos(x)

und

f2 (x) = x, je(x) = 1.

217

I11 DER HAUPTSATZ DER DIFFERENT.- & INTEGRALRECHNUNG

sowie Lb

COS(X) •

xdx = f 6. (x)f 2(x)dx. a

Nach Korollar 10.33 gilt also cos(x) • xdx = fi.(b)h(b) — fi(a)/2(a) — f fi.(x).(x)dx b = sin(b) • b — sin(a) a — f b sin(x) • ldx a a

= sin(b) • b — sin(a) • a — f sin(x)dx. a

Substitutionsregel der Integration

ZU KOROLLAR 10.35 Betrachtet man den Beweis dieser Aussage, kann man sich das Schema der Integration durch Substitution gut merken und im Zweifelsfall wieder herleiten, hat man die Kettenregel der Differentialrechnung präsent. Möchte man eine Funktion f mittels Substitution integrieren, ist es im Prinzip das Ziel zwei Funktionen fr und 12 mit passendem Definitionsbereich zu identifizieren, für welche f (x) = f (f 2 (x)) f2 (x) gilt. Dann kann man gleich über fr integrieren, wobei man die Integralgrenzen entsprechend anpasst. Der Name Substitution leitet sich aus dem Lateinischen ab und ist mit „Ersetzung" zu übersetzen. Die Integration läuft statt über x über12 (x). Es wird x quasi durch f2 (x) ersetzt. Dabei werden die Grenzen und die zu integrierende Funktion angepasst.

Eine zweite Integrationsregel folgt aus der Ket- einer Verkettung von zwei Funktionen und der tenregel der Differentialrechnung. Dabei können Ableitung der inneren Funktion bilden. Funktionen integriert werden, welche das Produkt

KoROLLAR 10.35 Sei fi : [c, d] —> R stetig und 12 : [a, b] ---÷ [c, d] stetig differenzierbar. Dann gilt /b

(12(x)) f"(x)dx = ff 2f 2 ( a(b) ) f (x)dx

Wir sparen uns an dieser Stelle einen Beweis von Anhand des Beispiels sollte das Prinzip der InteKorollar 10.35 und betrachten direkt ein Beispiel. gration mittels Substitution deutlich werden.

BEISPIEL 10.36 Das

Integral Lb

sin(-7x 3)dx kann mit Hilfe der Substitutionsregel berechnet werden. Dazu setzt man (x) = sin(x)

und

12(x) = —7x + 3

und erhält f(x) = —7.

Also findet man Lb

1

sin( 7x + 3)dx = 1— • f b sin(-7x + 3) • (-7)dx = — • f fi(f2(x))f(x)dx. —7 a —7 Nach Korollar 10.35 gilt also fab

L

218

f2 (b) r-7•6+3 sin(-7x + 3)dx = f2(a) (x)dx fl = J-7.a+3 sin(x)dx. f

DER HAUPTSATZ DER DIFFERENT.- & INTEGRALRECHNUNG •

ZUSAMMENFASSUNG

Der Mittelwertsatz der Integralrechnung (Proposition 10.23) besagt, dass für eine stetige Funktion f : [a, b] -+ es immer ein e E [a, b] gibt, so dass

Für eine stetige Funktion f : [a, b] —> 118 mit der Stammfunktion F ist fa b

(x)dx = F(b) — F(a).

f ab

f (x)dx = (b — a) • f (c).

Für eine auf einer Menge S definierten reellen Funktion f ist nach Definition 10.25 eine auf S definierte differenzierbare Funktion F eine Stammfunktion, falls gilt (x) = F/ (x)

für alle x E S.

Mit Hilfe der partiellen Integration und der Substitutionsregel der Integration, lassen sich manche bestimmten Integrale berechnen. Nach Korollar 10.33 gilt für zwei stetig differenzierbare Funktionen , f2 : [a, b] —> 1K, dass b

fi.(x)f2(x)dx =f1(b)f2(b) — fi(a)f2(a) Ja

Proposition 10.28 macht deutlich, dass die Stammfunktion einer Funktion nicht eindeutig ist. Zwei Stammfunktionen können sich aber höchstens um eine additive Konstante unterscheiden. Der Hauptsatz der Differential- und Integralrechnung (Satzt 10.29) gibt den Zusammenhang von Differentiation und Integration. Er besagt, dass für eine stetige Funktion f : [a, b] —> IR, die Funktion F: [a, b] -4 1K,

x 1—> f f(y)dy

eine Stammfunktion ist. Er ermöglicht es, bestimmte Integrale zu berechnen, wie Korollar 10.30 festhält.

f f1(X) f2(X)dX • Diese als partielle Integration bekannte Integrationsregel fußt auf der Produktregel der Differentialrechnung. Nach Korollar 10.35 gilt für eine stetige Funktion fi : [c, d] —> IR und eine stetig differenzierbare Funktion f2 : [a, b] —> [c, d], dass

f,b a

f2 (b ) fl (h(X)).(X)dX = ff2 (a ) fi (x)dx.

Diese als Substitution bekannte Integrationsregel fußt auf der Kettenregel der Differentialrechnung.

219

Kapitel 11

Polynominterpolation Interpolation stellt sich der Aufgabe, zu einer gegebenen Menge von Punkten eine Funktion zu finden, deren Funktionsgraph diese Punkte berührt. Der Name erschließt sich aus der Idee zwischen gegebenen Punkten mittels gefundener Funktion weitere Punkte zu erhalten - diese interpolieren die gegebenen Punkte. Dabei kann man für gegebene Punkte unterschiedliche Funktionen finden, welche diese Aufgabe lösen. Welche Funktion die „richtige ist', muss der Kontext bestimmen. Häufig verwendet man interpolierende Polynome, weil sie effizient zu bestimmen und leicht auszuwerten sind. Wir lernen in diesem Kapitel die Grundlagen der Polynominterpolation kennen. Dabei reden wir über Existenz und Eindeutigkeit von interpolierenden Polynomen und betrachten mit der Lagrange-, der Aiteken-Neviell- und der Newton-Interpolation drei unterschiedliche Verfahren, die letztlich alle das optimale Polynom (von kleinem Grad) für ein Interpolationsproblem liefern. Zum Schluss nehmen wir mit Splines eine Variante der Polynominterpolation in den Blick. Sie interpolieren die gegebenen Punkte in Gruppen abschnittsweise. .2

ABBILDUNG

im El Bei der Interpolation handelt es sich um eine brei- An die gesuchte Funktion werden bei der Inter-

Die gegebenen (Stutz-)Punkte im 1E2 sollen interpoliert werden, für zwischen den (Stütz-)Stellen xo bis x2 gelegene x-Werte soll der jeweilige y-Wert geschätzt werden. Man erhält also die Information des Funktionswertes für endlich viele, in diesem Fall drei, Stützstellen, um die Funktionswerte dazwischen liegender Stellen zu rekonstruieren. Man sucht also eine Funktion, deren Graph durch die Stützpunkte läuft. Welche „Sorte" von Funktionen dabei berücksichtigt werden, muss häufig im vorhinein entschieden werden. Dabei spielen Erwägungen bezüglich des praktischen Kontextes der Stützpunkte die entscheidende Rolle. In der Abbildung sind zwei mögliche interpolierende Funktionen gezeichnet. Welche der beiden „mehr Sinn ergibt" muss der Kontext der Daten, die zu diesen Stützpunkten führten, entscheiden.

te Klasse von mathematischen Problemen. Sie eint, dass eine Menge von Punkten im lie (im zweidimensionalen Koordinatensystem) gegeben ist und eine Funktion gefunden werden soll, deren Funktionsgraph durch diese Punkte läuft. Diese Funktion „interpoliert" die gegebenen Punkte insofern, als dass für die Urbilder zwischen den gegebenen Punkten ein Funktionswert mit Kenntnis der gegebenen Punkte „geschätzt" wird. Das Wort „Interpolation" ist aus zwei lateinischen Wörtern zusammengesetzt: „inter", das mit „zwischen" und „polere", das mit „glätten, polieren" zu übersetzen ist. Man glättet die gegebenen Punkte zu dem Graphen einer Funktion, welche zwischen den gegebenen Punkten verläuft.

polation verschiedene Anforderungen gestellt. In der Regel soll sie stetig sein. Je nach Anwendung kommen weitere Anforderungen hinzu. So könnte es sein, dass die gesuchte Funktion sicher eine Exponentialfunktion, eine lineare Funktion oder sonst einer Klasse von Funktionen angehörig, zum Beispiel ein Polynom ist. Im letzteren Fall spricht man von einer Polynominterpolation. Interpolation von Messwerten

Es gibt zwei grundlegende Typen von Interpolationsproblemen. Beim ersten Typ gibt es eine nicht bekannte beziehungsweise nicht zu beschreibende Funktion im Hintergrund, die x-Werten je einen y-Wert zuordnet. Bekannt sind dabei aber nur endlich viele solcher Zuordnungspaare. Auf Grundla-

POLYNOME - DEFINITION UND EIGENSCHAFTEN

ge dieser Daten sollen nun für beliebige x-Werte die zugeordneten y-Werte geschätzt, tatsächlich also interpoliert werden. Solche Probleme tauchen bei der experimentellen Untersuchung des Zusammenhangs zweier Messgrößen auf. In der Physik wird beispielsweise eine mechanische Feder studiert, wobei ihre Auslenkung in Abhängigkeit zur anliegenden Kraft gemessen wird. Nachdem man die Auslenkung für die anliegenden Kräfte von einem, zwei und drei Newton gemessen hat, möchte man Rückschlüsse auf die Auslenkung bei einer anliegenden Kraft zwischen einem und drei Newton ziehen. Nach dem hookeschen Gesetz ist der Zusammenhang linear, die beschreibende Funktion eine lineare. Zusammengefasst möchte man auf Grundlage gemessener Werte auf „Schätzungen" für nicht-gemessene Werte schließen. Dabei hofft man, dass eine Funktion den Zusammenhang zwischen den Parametern (im Beispiel Auslenkung und anliegende Kraft) beschreibt oder zumindest zufriedenstellend gut beschreibt. Interpolation von Funktionen

Beim zweiten Typ von Interpolationsproblemen sollen komplizierte Funktionen durch leichtere

Funktionen approximiert werden. Kompliziert meint in diesem Fall „aufwendig zu berechnen". Man berechnet also die Funktionswerte an endlich vielen Stellen und sucht eine Funktion, die leichter zu berechnen ist und durch diese „Stützpunkte" verläuft. Diese leichtere Funktion verwendet man dann in Anwendungen als eine Approximation für die schwer zu berechnende Funktion. Möchte man auf einem Taschenrechner Werte der Exponentialfunktion berechnen, wird der Wert mit Hilfe eines Polynoms bestimmt, welches die Exponentialfunktion ausreichend gut approximiert. Den Kontext im Blick

In der Praxis kommt ein Interpolationsproblem in der Regel mit der Vorgabe, mit welchem Typen von Funktionen interpoliert werden soll. Man schränkt die Suche aus praktischen Erwägungen ein und gibt damit einen Ansatz vor. Ein reelles quadratisches Polynom p(x) E 18[42 zum Beispiel ist stets von der Form p(x) = ax2 bx c mit a, b, c E R. Ziel könnte es sein, sucht man nach einer Interpolation von einer Menge von Punkten durch ein solches quadratisches Polynom, nun die Parameter a, b, c E IR zu bestimmen, so dass der Graph von p(x) durch die gegebene Punkte läuft.

11.1 Polynome - Definition und Eigenschaften Da Polynome eine wichtige Rolle in diesem Kapitel Polynomen und betrachten wichtige Eigenschafspielen, erinnern wir zunächst die Definition von ten. D EFINITION 11.1 Ein (reellwertiges) Polynom ist ein Term der Form p(x)=

E i=o

= ao • xo + ai • xl

ar, • xn

221





POLYNOME - DEFINITION UND EIGENSCHAFTEN

ZU DEFINITION 11.1

IA

Ein (reellwertiges) Polynom ist zunächst einfach ein mathematischer Term, der aus einer Summe von Potenzen einer Variablen (häufig x) besteht, die jeweils noch mit einer reellen Zahl multipliziert werden können. In der Notation eines Polynoms lässt man häufig die Monome, deren Koeffizienten gleich 0 sind, einfach weg. Das Polynom p(x) = 0 • x° + 3 • xl + 0 • x2 + 5 • x3 notiert man dann als p(x) = 3 • x + 5 • x3. Das birgt Gefahren. Zwei Polynome sind gleich, wenn ihre Koeffizienten übereinstimmen - dann sind sie der gleiche Term. Formal sauber sind die Polynome Pi (x) = 0 • x 3 + 2 • x1 + 0 • x2 und P2 (x) = 0 • x° + 2 • x1nicht identisch, doch beide notiert man als p1 (x) = 2 • xl und p2(x) = 2 • x1. Das liegt daran, dass die beiden Terme äquivalent sind, für jede reelle Zahl stimmen die Ergebnisse überein. Da im weiteren Verlauf dies die entscheidende Eigenschaft für unsere Studien ist, werden wir diese Polynome nicht mehr unterscheiden. Die definierten Polynome haben den Namenszusatz reellwertig, weil ihre Koeffizienten reelle Zahlen sind. Aus diesem Grund kann man sie auch mit reellwertigen Zahlen auswerten. Grundsätzlich kann man Polynome auch über anderen Zahlenbereichen definieren. Dann sind die Koeffizienten aus diesem Zahlenbereich gewählt und man kann sie mit Zahlen aus diesem Zahlenbereich auswerten. Der mathematische Fachbegriff für „Zahlenbereich" lautet „algebraische Struktm". Um ein Polynom definieren zu können, benötigt man eine Addition und eine Multiplikation, diese sollte die algebraische Struktur zumindest bereitstellen. Im weiteren Verlauf werden wir den Zusatz „reellwertig" einfach weg lassen, wenn aus dem Kontext klar ist, dass es sich um ein solches handelt.

wobei die Zahlen ao, , an E IR als die Koeffizienten und die Summanden ak • x k als die Monome von p bezeichnet werden. Der Grad von p(x) ¢ 0 ist die größte x-Potenz deren Koeffizient nicht 0 ist. Man schreibt deg(p) = max {k E {0,

4 : ak 0} .

Man definiert den Grad des Nullpolynoms deg(0) = —oo. Möchte man ein Polynom an der Stelle xo E IR. auswerten, schreibt und berechnet man p(xo)

= Eaixo. i=0

BEISPIEL 11.2 Es sind p(x) = 2 • x 2 + 5 • x7 und q(x) = 3 • x 3 + 13 • x7 beides Polynome vom Grad 7 mit zwei Monomen. Die Koeffizienten von p(x) lauten a2 = 2 und a•T = 5 - außerdem sind die übrigen Koeffizienten alle gleich 0. Die Koeffizienten von q(x) lauten a3 = 3 und a7 = 13 - außerdem sind die übrigen Koeffizienten alle gleich 0. Die Monome von p(x) lauten 2 x2 und 5 • x7, die Monome von q(x) lauten 3 • x3 und 13 • x7.

Es sind p(2) = 2 • 22 + 5 • 27 = 648 und q(2) = 3 • 23 + 13 • 27 = 1688 die Polynome p(x) und q(x) an der Stelle xo = 2 ausgewertet. L

J

Die Menge aller reellwertigen Polynome fassen Polynome vom Grad höchstens n ebenfalls. wir in einer Menge zusammen, die Menge aller DEFINITION 11.3 Mit R[x] bezeichnet man die Menge aller reellen Polynome. Mit 1[1[4., = {p E R[x] : deg(p) < n} bezeichnet man die Menge aller reellen Polynome vom Grad höchstens n. 7

r

Die Menge IR[x],, bildet zusammen mit der gewöhnlichen Addition von Termen und der Multiplikation einer reellen Zahl mit einem Term einen 72+ 1-dimensionalen Vektorraum über K. In dieser Sicht der Dinge sind die Polynome in R[x]n, Vektoren. Dies kann man sich leicht vor Augen führen, wenn man jedem Polynom p(x) = aox° . . . an xn seinen Koeffizientenvektor (ao, )t E ]V+1 zuordnet (Es sind n + 1 Koeffizienten, weil die Nummerierung bei 0 beginnt und bei n endet). Die Addition von Polynomen wird so zur gewöhnlichen Vektoraddition in Rn±i . In der Sprache der algebraischen Strukturen sind die Vektorräume Dt[x]n der Polynome vom Grad höchstens n und der Vektorraum itn+1 der (n+ 1)-dimensionalen reellen Spaltenvektoren isomorph. BEMERKUNG 11.4

Eine Basis für Et[x]n der Polynome vom Grad höchstens n ist beispielsweise Bn = {x°, x1 , xn} . Jedes Polynom in R[x]n ist Linearkombination der Basiselemente, denn jedes Polynom hat die Form Ao • 1 + at • x A2 • X2 + A3 • X3.

222

POLYNOME - DEFINITION UND EIGENSCHAFTEN II

Die Menge .8„ ist linear unabhängig, denn aus )o •1+Ai •x-FA2 •x2 +Ä3 .x3 =

0 folgt

per Koeffizientenvergleich

Igt ZU DEFINITION 11.5

X0 = = X3 = 0. L

Ist man daran interessiert, welche Werte Polynome an unterschiedlichen Stellen annehmen, definiert man entsprechend eine Funktion, deren Funkti-

onswerte über ein Polynom berechnet werden. Die "rechte Seite" der Funktionsgleichung ist dann ein Polynom.

DEFINITION 11.5 Eine (reellwertige) Polynomfunktion p ist eine Funktion p : II8 --> IR mit für ein Polynom p(x) E R[x].

x H p(x)

BEISPIEL 11.6 Es ist p : R —› IR mit p(x) = 7x° (-2)x1 0x 2 4x3 eine Polynomfunktion. Ihr Graph ist in Abbildung 11.2 angedeutet.

Diese Definition erscheint vielleicht zunächst etwas überflüssig. Die Funktion p wird als p(x) = p(x) definiert. Allerdings liegt die Ursache darin, dass in der Gleichung p(x) = p(x) auf den beiden Seiten unterschiedliche Objekte stehen. Links ist die Polynomfunktion. Eine reelle Funktion mit Definitionsbereich Et und einem Bildbereich. Rechts steht ein mathematischer Term, der an der Stelle x ausgewertet werden soll. In der Praxis benutzen wir den Begriff „Polynom" auch dann, wenn wir eigentlich eine Polynomfunktion meinen.

11.1.1 Horner-Schema

Das Homer-Schema, benannt nach William George Homer (1786-1837), ist eine Darstellungsform für Polynome, die die Berechnung von Funktionswerten von Polynomfunktionen beschleunigt.

Wird ein Polynom im Homer-Schema angegeben, so benötigt man dazu nur die Hälfte der Multiplikationen, wie für ein Polynom in klassischer Darstellung.

DEFINITION 11.7 Für ein Polynom p(x) = ao +ai -x+a2 -x2 + . . . + an • xn lautet die Schreibweise im Horner-Schema p(x)

ao + x • (ai + x• (a2 + x • (a3 + ...))) 7

BEMERKUNG

11.8 Bei Polynomen p(x) E R[x]ri in klassischer Schreibweise müssen zum Berechnen von

p(xo) an einer Stelle x = xo insgesamt 2n — 1 Multiplikationen ausgeführt werden. Zunächst müssen nacheinander die Potenzen X0 2 , X03, XO" errechnet werden (n — 1 Multiplikationen). Danach müssen die Monome ak • xok berechnet werden (n-viele Multiplikationen).

ABBILDUNG 11.2 Jedes Polynom kann als eine Funktion, als Polynomfunktion bezeichnet, aufgefasst werden. Dabei wird eine reelle Zahl auf den Wert des Polynoms abgebildet, setzt man die reelle Zahl in das Polynom ein. Mit anderen Worten, der Funktionsterm ist in diesem Fall ein Polynom. In der Abbildung ist die Polynomfunktion p(x) = 4X3 — 2x aus Beispiel 11.6 skizziert.

Im umgeformten Polynom nach dem Horner-Schema kommen keine Potenzen, sondern nur noch Multiplikationen und Additionen vor. Je Exponent 1, . , n ist beim Berechnen von p(xo) nur eine Multiplikation nötig, d.h. insgesamt werden im Homer-Schema n Multiplikationen ausgeführt. r

1

223



POLYNOMINTERPOLATION

BEISPIEL 11.9 Für

das Polynom p(x) = 1 + 2x + 3x2 + 4x3 lautet die Schreibweise im Homer-Schema

schlicht p(x) -= 1 x • (2 + x • (3 + x • (4))). Man erhält die Darstellung durch sukzessives Ausklammern von x, wie man leicht nachprüft. Es ist nämlich L

p(x) = 1 + 2x + 3x2 + 4x3 = 1 + x • (2 + 3x1 + 4x2 ) = 1 + x • (2 + x • (3 + 4x)),

ZUSAMMENFASSUNG ZU DEFINITION 11.10 gl

Eine Stützstellenmenge ist eine Menge von n 1 unterschiedlichen reellen Zahlen. Diese sind der Größe nach geordnet und entsprechen den x-Werten der zu interpolierenden Punkte bei einem Interpolationsproblem. Die einzelnen Zahlen werden als Stützstellen bezeichnet. Eine Stützpunktmenge ist eine Meng von n 1 unterschiedlichen reellwertigen Tupeln, deren erste Komponente der Größe nach sortiert sind. Diese Punkte liegen im K2 auf dem Graphen des gesuchten Polynoms. Diese Begriffe sind naheliegend, denn der Graph des gesuchten Interpolationspolynoms geht durch die zu interpolierenden Punkte, wird also dort „gestützt". Haben je zwei aufeinanderfolgende Stützstellen einer Stützstellenmenge den gleichen Abstand wird die Menge als äquidistant bezeichnet - aus dem Lateinischen übersetzt „von gleichem Abstand". Ist eine Funktion gegeben und werden mit Hilfe einer Stützstellenmenge über die Stützpunkte auf dem graph der Funktion ausgewählt, so nennt man diese eine Stüzpunktmenge über der Funktion. Diese Stützpunktmengen sind für solche Probleme interessant, bei denen die Funktion schwer auszuwerten ist und deshalb durch eine Interpolationsfunktion approximiert werden soll.

224

Ein (reelles) Polynom ist zunächst ein Term der Form p(x) =

E ai • i=o

wobei die ai reelle Zahlen sind, die als Koeffizienten bezeichnet werden. Die Summanden werden als Monome bezeichnet. Der Grad des Polynoms entspricht dem Exponenten des Monoms mit größtem Index, dessen Koeffizient nicht Null ist. Ein Polynom kann man für jede reelle Zahl auswerten, indem man im Term x durch diese ersetzt und

den Term berechnet - umgangssprachlich setzt man für x die Zahl ein. Mit einem Polynom lässt sich eine Polynomfunktion über den reellen Zahlen definieren, welche auch als Polynom bezeichnet wird. Dabei wird jede reelle Zahl auf den Wert abgebildet, der seinem Wert unter dem Polynom entspricht. Das Horner-Schema ist eine Rechenvorschrift, mittels derer man effizient Polynome auswerten kann. Dabei wird nach Definition 11.7 ein Polynom in der Form p(x) = ao

x • (al

x • (a2

x • (as + • • •)))

geschrieben.

11.2 Polynominterpolation Wir möchten nun zunächst die allgemeine Sprache der Formulierung von Interpolationsproblemen kennen lernen. Mit dieser werden wir Interpolationsprobleme formulieren, für welche wir ein Lösungspolynom suchen. Polynome sind häufig die Interpolationsfunktionen der Wahl, weil sie einfach zu berechnen und somit effizient zu bestimmen und auszuwerten sind. Das Ziel der Polynominterpolation ist es, zu den

Punkten mit den Koordinaten (xo, Yo), • • • , (xn, yn) E R2 ein Polynom p e R[x] zu finden, für das 13(4 =

yO, . . • Y(Xn) = Yn

gilt. Anders ausgedrückt: Das gesuchte Polynom soll für alle i E {0,1, , n} an der Stelle x, den Funktionswert y, annehmen.

POLYNOMINTERPOLATION •

Um solche Probleme allgemein beschreiben zu Stützstellen und Stützpunkten kennen. können, lernen wir nun die Konzepte von DEFINITION 11.10 Eine Menge von n + 1 Zahlen xo, , x„ E R mit xo < xi < < xn wird als Stützstellenmenge bezeichnet. Jedes der Zahlen heißt Stützstelle der Stützstellenmenge. Gilt für alle i E {1,

Xi — xi_1 = X1 — XO

heißt die Stützstellenmenge xo,

, n},

äquidistant.

Eine Menge von n

E R2 , wobei xo, • • , xn eine Stützstellenmenge ist, 1 Tupeln (xo, yo), • • • , (xn, heißt Stützpunktmenge von Ordnung n. Jedes der Tupel wird als Stützpunkt der Stützpunktmenge bezeichnet.

Ist eine Funktion f : I —› R für ein Intervall I bezeichnet die Stützpunktmenge

C

(xo, f (x0)),

R gegeben und eine Stützstellenmenge X

c I, so

ZU DEFINITION

11.11

In Definition 11.11 haben wir der Menge aller Stützstellenmengen, deren kleinste Stützstelle a und größte Stützstelle b ist, einen Namen gegeben.

(xn , f (x,2))

die Stützpunktmenge der Stützstellenmenge X über der Funktion f. In Kapitel 12 werden wir uns mit der numerischen Intervallgrenzen einen Namen zu geben. Wir haBerechnung von Integralen befassen. In diesem ben die Definition hier platziert, denn hier gehört Kontext macht es Sinn für ein Intervall [a, b] der sie hin. Menge aller Stützstellenmengen "zwischen " den D EFINITION 11.11 Es sei für zwei reelle Zahlen a, b X (a, b)n = {(X 0 • • • X n)

e R mit

- xo < . . . < x n = e [a, b]n+1 : a =

b}

die Menge aller Stützstellenmengen zwischen a und b bezeichnet. BEISPIEL 11.12 Die Menge (0,1), (1,2) und (2,3) ist eine Stützpunktmenge der Ordnung 2 mit drei Stützpunkten. Die ersten Komponenten dieser Stützpunkte bilden mit xo = 0, xi = 1 und x2 = 2 eine Stützstellenmenge. Siehe Abbildung 11.3.

BEISPIEL 11.13 Seien die Abbildung f : [0,3] —> IR mit x -+ x2 und die Stützstellenmenge X der Ordnung 3 mit xo = 0, x l = 1, x2 = 2 und x3 = 3 gegeben. Dann ist (0, 0),

(1, 1),

(2, 4),

III ABBILDUNG 11.3 Die Stützpunkte aus Beispiel 11.12 und die interpolierenden Polynome p(x) und q(x) sowie die interpolierende Funktion f (x) aus Beispiel 11.15. Eine Stützpunktmenge ist eine Menge von Punkten, die alle unterschiedliche x-Koordinaten besitzen. Der Graph einer interpolierenden Funktion geht durch alle diese Stützpunkte. Offensichtlich ist für eine Stützpunktmenge die interpolierende Funktion nicht eindeutig.

(3, 9)

225

111 POLYNOMINTERPOLATION

die Stützpunktmenge der Stützstellenmenge X über der Funktion f. Siehe Abbildung 11.4. ZU DEFINITION 11.14

Eine interpolierende Funktion einer Stützpunktmenge hat schlichtweg die Eigenschaft, dass die Stützpunkte auf ihrem Funktionsgraphen liegen.

DEFINITION 11.14 Sei S C R. Sei außerdem eine Stützpunktmenge der Ordnung n gegeben, deren Stützstellenmenge in S liegt. Eine Funktion f : S H interpoliert die Stützpunkte, wenn gilt f (xi) =

yi

far alle i E 10,

Ein interpolierendes Polynom wird auch als Interpolationspolynom der Stützpunkte bezeichnet. 1

f(x)

BEISPIEL 11.15 Das

Polynom p(x) = x + 1 interpoliert die Stützpunkte aus Beispiel 11.12. Es gilt nämlich p(0)= 0 +1 = 1

Das Polynom q(x) = X3 -

3x2 +

p(1)-= 1+1 = 2

p(2) -= 2 + 1 =- 3.

3x + 1 interpoliert diese Stützpunkte ebenfalls. Es gilt

q(0) = 03 — 3 • 02 + 3 • 0 + 1 = 1,

q(1) = 13 — 3 • 12 + 3 • 1 + 1 = 2,

Tatsächlich interpoliert die Funktion f : f(0) = 1 + 0 • cos(27r • 0) = 1,

11 mit x

q(2) -= 23 — 3 • 22 + 3 2 + 1 = 3.

1 + x • cos(n- • x) diese Stützpunkte auch. Es gilt

f(1) = 1 + 1 • cos(27r • 1) = 2,

f (2) = 1 + 2 • cos(27 • 2) = 3

Siehe Abbildung 11.3. L

11.2.1 Existenz und Eindeutigkeit der Polynominterpolation

2

2

A

ABBILDUNG 11.4

Die Funktion f aus Beispiel 11.13 und die Stützpunktmenge der Stützstellenmenge xo = 0, x1 = 1, x2 = 2 und x3 = 3 über

In Beispiel 11.15 haben wir gesehen, dass zu ein Polynom, welches an den Stützstellen jeweils gegebenen Stützpunkten zwei unterschiedliche eine Nullstelle besitzt, addieren und erhält ein weiPolynome existieren, welche diese interpolieren. teres Interpolationspolynom. Wenn man Beispiel Sie unterscheiden sich in ihrem Grad. Allge- 11.15 betrachtet ist dies dort genau geschehen. Es mein kann man die Frage stellen, ob zu jeder ist nämlich Stützpunktmenge ein Interpolationspolynom exis(x) mit (x) = x3 — 3x 2 + 2x tiert oder ob es zumindest bis auf den Grad ein- q(x) = p(x) deutig ist. und das Polynom (x) = X3 — 3x2 2x besitzt Eine erste Antwort bringt die folgende leichte an den Stützstellen xo = 0, x1 = 1 und x2 = 2 Überlegung. Hat man ein Interpolationspolynom jeweils eine Nullstelle. einer Stützpunktmenge gefunden, so kann man

II

SATZ

11.16 Zu einer Stützpunktmenge der Ordnung n gibt es genau ein Interpolationspolynom

vom Grad höchstens n.

226

POLYNOMINTERPOLATION

Beweis. Der Ansatz p(x) = ao • x° Gleichungssystem

anxn ergibt nach Einsetzen der a das lineare

ao • xo

ai • xo

ao • xi

ai • xi

0 a0 • X n +

ai •

an • xrd" = Yo ...

an • xi = yt

1 X n + • • • + an • Xn = Yn

als Matrix-Vektor-Multiplikation haben wir n„V

7.2 .4 .1

• •

\

ao (a1

= (11 j1)

VT, •

an/

srj

an

Yn

wobei Vn die Koeffizientenmatrix des linearen Gleichungssystems ist. Dass dieses LGS stets eine Lösung hat beweisen wir, in dem wir zeigen, dass det(Vn) 0 ist. Durch Nachrechnen beweist man, dass die Determinante der Matrix Vn gerade die sogenannte VandermondeDeterminante det (Vn) =

11 (xk — xe ) 0 xi = 1 1—> x2 = 2 L

240

1 = y = Po ( ) 5 = Yt = (1) 3 = Y2 = P2 (D

3 = P0,1 (D 6 = P1,2 (D

(1\ 15 D 4 = 0,1,2 \

VERFAHREN ZUR BERECHNUNG DES INTERPOLATIONSPOLYNOMS VON KLEINEM GRAD •

Wir halten fest, dass der Aitken-Neville-Algorithms das Interpolationspolynom in der praktisch verwendeten Form nicht explizit aufstellt, sondern es nur an der Stelle aus. Dabei gibt es zwei offen-

sichtliche Probleme. Der Algorithmus ist ungeeignet zum Auswerten des Interpolationspolynoms an mehreren Punkten. Der Aufwand ist quadratisch in der Zahl der Stützstellen.

11.3.3 Newton-Interpolation Der Aitken-Neville-Algorithms ist unpraktisch, wenn man das Interpolationspolynom an mehreren Punkten auswerten möchte. Man muss eine ganze Reihe von Zwischenlösungspolynomen berechnen. Wir lernen nun ein Berechnungsverfahren kennen, welches auch für eine große Zahl von Stützpunkten moderaten Rechenaufwand benötigt. Der Newton-Algorithmus berech-

net zunächst eine interpolierende Funktion, deren Funktionsgleichung kein Polynom ist. Diese lässt sich jedoch leicht in ein Polynom umformen - man hat also tatsächlich eine Polynomfunktion berechnet - und zwar das eindeutige mit kleinem Grad. Diese interpolierende Funktion ist immer von der in Definition 11.43 gegebenen Form.

, x,} eine Stiitzstellenmenge und C = {co, DEFINITION 11.43 Es sei X = {xo, Dann nennen wir die Funktion P : JR JR mit Px(x) = co + ci(x - xo) + c2(x - x0 )(x - xi) +

, cn} C R.

+ cr,(x - xo) • • • (x - Xn)

die Newton-Interpolationsfunktion der Stützstellenmenge X zu den Parametern co,

, c,,

E

R.

E

BEISPIEL 11.44 Gegeben sei die Stützstellenmenge X = (0,1,2). Die Newton-Interpolationsfunktion von X

zu den Parametern co, c2, c2 lautet

Px (x) = co +

(x — 0) + c2(x — 0)(x — 1).

ZU DEFINITION 11.43

Die Newton-Interpolationsfunktion Px (x) einer Stützstellenmenge kommt immer mit einer Menge von n + 1 Parametern co, , c„. Ergänzt man die Stützstellen zu Stützpunkten, ist es die Aufgabe des Newton-Verfahrens die Parameter co , , c„ zu finden, so dass Px (x) die Stützpunkte interpoliert. Interessanterweise kommt die Stützstell xn in der Funktionsgleichung von Px (x) gar nicht vor. Das ist zunächst verwunderlich, sie spielt allerdings bei der Bestimmung des Parameters c„ beim Newton-Verfahren dann doch eine Rolle. Eine alternative aber völlig gleichwertige Schreibweise für die Newton-Interpolationsfunktion wäre übrigens

L

Px (x)

Setzt man die Stützstellen in die NewtonInterpolationsfunktion ein, stellt man fest, dass die letzten Summanden (deren Index größer als

derjenige der eingesetzten Stützstelle) alle sicher gleich 0 sind.

c.n E gilt

Px(xi) = co + ci(x - xo) + c2(x - x0)(x - xi) +

E i=o

.

11 x — xj).

It' ZU LEMMA 11.45

111 LEMMA 11.45 Für die Newton-Interpolationsfunktion einer Stützstellenmenge X der Ordnung n zu den Parametern co,

=

+ ci_i(x - xo) • • • (x - xi-i)

Es ist insbesondere darauf hinzuweisen, dass die Aussage darin besteht, dass die Newton-Interpolationsfunktion an den Stützstellen ausgewertet nur Summanden involviert, deren Index den Index der Stützstelle nicht über, sogar unterschreitet. Um Px (xi) zu berechnen, benötigt man die Stützstellen bis Index i — 1.

241

VERFAHREN ZUR BERECHNUNG DES INTERPOLATIONSPOLYNOMS VON KLEINEM GRAD

für alle i E 10,

,

Beweis. Man setzt ein i-1

Px (xi) =

E ci • 11 (xi — i=0

xi).

j=0

und stellt fest, dass in jedem Summanden mit Index mindestens i stets der Faktor (xi — xi) = 0 auftaucht. •

Für eine gegebene Stützpunktmenge wird im Newton-Interpolationsverfahren die zugehörige Newton-Interpolationsfunktion über der Stützstellenmenge mit passenden Parametern co, en gesucht, welche die Stützpunktmenge interpoliert. Dazu werden die Parameter

YI

P(xo) = P(x i ) =

Y2 Y3

P(x2)

=

P(x3)

=

ye

cn, sukzessive aus den n + 1 Gleichungen ermittelt, die Lemma 11.45 liefert. Es erhält dann das in Abbildung 11.12 angedeutete System von Gleichungen, welches eine sukzessive Berechnung der Unbekannten ermöglicht.

co, .

CO Co + cl (x1 — xo) co + cl (x2 — xo) + C2 (X2 X0)(X2 X1) CO + Cl (X3 - XO) + C2 (X3 - X0)(X3 - X1) C3(X3 — X2)(X3 — X1)(x3 — xo)

ABBILDUNG 11.12

Setzt man die Stützstellen in die Newton-Interpolationsfunktion ein und setzts sie mit den dort vorgegebenen Werten gleich, erhält man ein lineares Gleichungssystem in den unbekannten Parametern co , c„, welche sich leicht berechnen lassen

In der ersten Zeile lässt sich co bestimmen. Mit Kenntnis von co lässt sich in der zweiten Zeile cl bestimmen. Mit Kenntnis von co und ci lässt sich

in der dritten Zeile c2 bestimmen, etc. Wir können nun ein allgemeines Schema zur Anwendung der Newton-Interpolation angeben.

SCHEMA F 11.46 Für eine gegebene Stützpunktmenge (xo, 110),..., (x., yn) der Ordnung n ist das Interpolationspolynom vom kleinsten Grad zu bestimmen.

Schritt 1. Stelle die Newton-Interpolationsfunktion zur Stützstellenmenge mit Parametern , c„ auf. Schritt 2. Bestimme sukzessive die Parameter co, , cn aus den n + 1 Gleichungen, die Lemma 11.45 liefert. Schritt 3. Forme die Funktionsgleichung der Newton-Interpolationsfunktion zur Stützstellenmenge mit den in Schritt 2 gefundenen Parametern co, • • • , cn zu einem Polynom um.

242

VERFAHREN ZUR BERECHNUNG DES INTERPOLATIONSPOLYNOMS VON KLEINEM GRAD in

BEISPIEL 11.47 Gegeben seien die Stützpunktmenge (0,1), (1,5) und (2,3) zu den Stützstellen 0, 1 und 2. Wir wenden die Newton-Interpolation wie in Schema F 11.46 beschrieben an.

Schritt 1. Stelle die Newton-Interpolationsfunktion zur Stützstellenmenge mit Parametern co, cn, auf. Schritt 2. Bestimme sukzessive die Parameter co, cn aus den n+ 1 Gleichungen, die Lemma 11.45 liefert. Zunächst ist 1 =yo= P(x0) =co

co = 1.

Dann berechnen wir 5 = yi = P(xi) = co + ci(xl — xo) = 1+ ci(1 — 0) cl = 4. Schlussendlich ist 3 = y2 = P(x2) = co +

(xi — xo )c2(x — xo)(x — x1)

= 1 + 4 • (2 — 0) + c2(2 — 0)(2 — 1)

c2 = —3.

Schritt 3. Forme die Funktionsgleichung der Newton-Interpolationsfunktion zur Stützstellenmenge mit den in Schritt 2 gefundenen Parametern co, , c„ zu einem Polynom um. Es ist P(x) = 1 + 4(x — 0) — 3(x — 0)(x — 1) = 1+ x — 3x2 . r BEMERKUNG 11.48 Die Gleichungen aus Lemma 11.45 enstprechen den Zwischenlösungspolynomen Po,...,i(x), für die richtigen Parameter.

r BEMERKUNG 11.49 Der Aufwand des Newton-Algorithmus ist quadratisch in n, die Auswertung des Interpolationspolynoms an einer Stelle -± ist aber nur noch linear in n.

ZUSAMMENFASSUNG

Das Interpolationspolynom von kleinem Grad, also vom Grad höchstens n ist für ein Stützpunktproblem der Ordnung n eindeutig bestimmt. Wir haben mit der Lagrange-Interpolation, der Aitken-NevilleInterpolation und der Newton-Interpolation drei Verfahren kennen gelernt, das Interpolationspolynom von kleinem Grad zu berechnen. Dabei ist noch einmal wichtig darauf hinzuweisen, dass diese Verfahren für ein gegebenes Stützpunktproblem alle das gleiche, nämlich das Interpolationspolynom von kleinem Grad, berechnen, dies jedoch auf unterschiedliche Art und Weise. Bei der Lagrange-Interpolation werden zunächst nach Definition 11.24 n +1 unterschiedliche Lagrange-

Polynom der Form n

Lx,k(x) = 11

x — xi

i=0 Xk i4k

für k E {0, ...

Xi

berechnet. Nach Lemma 11.26 gilt Eigenschaft LIPa, welche besagt, dass Lx,k(X3 ) = 1, falls j = k und Lx,k(X 3 )= 0, falls j # k ist. Außerdem sagt Eigenschaft LIPb., dass die Lagrange-Polynome alle Grad n haben. Nach Definition 11.28 ist £X,Y (X)

=

E yic • Lx,k (x) k=0

das Lagrange-Interpolationspolynom zu den

243



SPLINE INTERPOLATION

Stützpunkten (xo, Yo ), • • • , (xn, yn). Lemma 11.29 zeigt, dass es interpoliert. Die Idee des Aitken-Neville-Algorithmus besteht darin, die Lösung des Interpolationsproblems schrittweise aus den Lösungen für weniger Punkte aufzubauen. Aus diesem Grund wird dieses Verfahren auch als die „Rekursionsformel für Polynome von AitkenNeville" bezeichnet. Nach Definition 11.36 wird für eine Stützpunktmenge der Ordnung n für k, P E {0, n} mit k < P das Polynom Pk,...,e E R[x]ri als Zwischenlösungspolynom bezeichnet, welches dem eindeutigen Interpolationspolynom von minimalem Grad der Stützpunkte (xk , yk ), , (xt , yi) entspricht. Lemma 11.38 gibt nur eine rekursive Vorschrift, das Interpolationspolynom Schritt-für-Schritt aus Zwischenlösungspolynome zu entwickeln. Es seien dazu k, P E {0, , n} mit k < P gewählt. Dann

gilt Pk,...,2(X) = Xe — XPk,...e-1(X) X — Xk X — Xk Xe — Xk

1- k+1,...2(X)

Bei der Newton-Interpolation wird zunächst eine interpolierende Funktion berechnet, deren Funktionsgleichung kein Polynom ist. Diese lässt sich jedoch leicht in ein Polynom umformen - es wurde also tatsächlich eine Polynomfunktion berechnet. Diese entspricht dem Interpolationspolynom von kleinem Grad. Die interpolierende Funktion ist nach Definition 11.43 von der Form P x (X) = CO + Cl (X — xo) + C2 (X — X0)(X — x1)+ • • •

+ Cn(X — X0) • • • (X — Xn)•

11.4 Spline Interpolation Im Kontrast zu den vorherigen Abschnitten,

möchten wir nun eine interpolierende Funktion finden, die selbst kein Polynom durch Stützpunkte ist. Der Grund liegt unter anderem darin verborgen, dass das Interpolationspolynom von kleinem Grad für eine große Zahl von Stützpunkten ein „unangenehmes" Verhalten zeigen kann. Interpoliert man beispielsweise die Stützpunkte ABBILDUNG

11.13

Bei einer großen Zahl von Stützpunkten beginnt das Interpolationspolynom von Meinem Grad stark zu schwingen. Dieser Effekt wird als Oszillation bezeichnet.

244

vorliegen, ist die Approximation der Interpolation durch eine Polynom aufgrund der starken Oszillation vielleicht nicht treffend.

Um dieses Problem zu lösen "'bastelt" man die interpolierende Funktion aus mehreren Polynomen zusammen, die jeweils nur einen Teil der Datenpunkte interpolieren. Auf dieser Teilmenge der Daten ist das interpolierende Polynom von kleinerem Grad und der Oszillationseffekt tritt (-3, 0), (-2, 1), (-1, 0), (0, 1), (1, 0), (2, 1), (3, 0) nicht auf. Allerdings muss man dann dafür sorgen, erhält man das in Abbildung 11.13 zu sehende dass an den „Klebestellen" die Polynome „zueinander passen". So sollte diese abschnittsweise deInterpolationspolynom. finierte interpolierende Funktion stetig sein, vielDer zu beobachtende Effekt wird als „Oszillation" leicht sogar stetig differenzierbar (möglicherweise bezeichnet, der Graph eines Polynoms mit hohem mehrfach). Damit die Funktion also nicht völlig Grad beginnt stark zu schwingen. Das ist natürlich „aneinandergestückelt erscheint", sollen die Polyetwas irritierend: Obwohl sehr viele Datenpunkte nome an den Stützpunkten verträglich sein, das

SPLINE INTERPOLATION I

heißt, eine gewisse Anzahl von Ableitungen sollen dort stetig sein. Die Anzahl der Ableitungen der Funktion, welche noch keine Sprungstelle besitzen, ist also ein Maß dafür, wie gut die Polynome auf den Teilintervallen an den Klebestellen (den Stützpunkten) verträglich sind. Bevor wir diese Überlegungen formalisieren, legen wir ein wenig Notationskonventionen für diesen Abschnitt fest.

Im Folgenden seien a, b E IR mit a < b und für ein n E N seinen n+ 1 Stützpunkte xo , xi, xn gegeben mit a = xo 1. Eine Funktion s : [a, to] —> Jl heißt Spline-Funktion (oder Spline) vom Grad m zur Stützstellenmenge X der Ordnung n, wenn die beiden folgenden Eigenschaften erfüllt sind.

Si. s ist m — 1 mal stetig differenzierbar S2. Auf dem Teilintervall /3 mit 1 < j < n stimmt s mit einem Polynom P3 E Et[x]„,, überein. Es bezeichne Sm ,m (X) die Menge der Splines vom Grad m zur Stützstellenmenge X. Splines vom Grad 3 werden als kubische Splines bezeichnet.

7

7

BEISPIEL 11.51 Betrachte die Funktion s : [0,3] —r E mit x

ftir 0 < x < 1

s(x) = —2x / + 3 für 1 < x < 2 x —3

für 2 < x < 3.

ZU DEFINITION 11.50

Ein Spline zu einer gegebenen Stützstellenmenge ist eine Funktion, die auf den Teilintervallen zwischen den Stützstellen je einem Polynom entspricht. Außerdem sind die Polynome an den Klebestellen bis zur (m — 1)-ten Ableitung verträglich - sprich ihre ersten (m — 1) Ableitungen stimmt dort überein. Tatsächlich sind die Klebestellen entscheidend, denn Polynome sind unendlich oft stetig differenzierbar. Für m = 1 muss also mit m — 1 = 1 — 1 = 0 die 0-te Ableitung übereinstimmen. Das meint, dass die Funktion s an sich stetig sein muss. Die ersten Ableitungen dürfen abweichen, was in der Regel auch nicht zu vermeiden ist. Die Eigenschaft S2 fordert in diesem Fall, dass zwischen den Klebestellen die Funktion s Polynomen aus K[ x]1 entspricht. Das sind Polynome vom Grad höchstens 1. Die Splines vom Grad 1 sind also Funktionen, welche auf den Teilintervallen geraden Streckenzügen von Stützpunkt zu Stützpunkt entsprechen. Haben aufeinanderfolgende Stützpunkte unterschiedliche y-Koordinaten, kann an den Klebestellen die Ableitung also gar nicht stetig sein. Natürlich ist jedes Polynom selbst ein Spline über jeder beliebigen Stützstellenmenge, der Grad entspricht dem Grad des Polynoms.

Sie entspricht einem Spline vom Grad m = 1 auf der Stützstellenmenge a = xo = 0, xl = 1, x2 = 2, b = x3 = 3. Sie ist stetig - an den Klebestellen passen die Funktionswerte der Funktionen auf den Abschnitten überein. Demnach erfüllt sie S1 - die 0-te Ableitung ist stetig. Auf den Teilintervallen entspricht sie Polynomen vom Grad höchstens m = 1 und erfüllt somit auch S2. Siehe Abbildung 11.14. L

BEISPIEL 11.52 Betrachte die Funktion 8 : [0,3] —r K mit X2 - 2x + 1 für 0 < x < 1 s(x) -= {0

für 1 < x < 2 -X2 + 4x — 4 für 2 < x < 3.

Sie entspricht einem Spline vom Grad m = 2 auf der Stützstellenmenge a = xo = 0, xi = 1, x2 = 2, b = x3 = 3. Sie ist stetig - an den Klebestellen passen die Funktionswerte der Funktionen auf den Abschnitten

ABBILDUNG 11.14

Der Spline vom Grad m = 1 auf der Stützstellenmenge a= = 0, x i = 1, x, = 2, = x3 = 3 aus Beispiel 11.51.

245

SPLINE INTERPOLATION

überein. Die Ableitung der Funktion lautet 2x — 2 für 0 < x < 1 s'(x) = {0 für 1 < x < 2 —2x + 4 für 2 < x < 3. Demnach erfüllt sie S1 - die 1-Ableitung ist stetig - die Funktionswerte der Ableitungen der Funktionen auf den Abschnitten stimmen überein. Auf den Teilintervallen entspricht sie Polynomen vom Grad höchstens m = 2 und erfüllt somit auch S2. Siehe Abbildung 11.15.

11.4.1 Kurzschreibweise für Splines Wir führen als weitere Notation ein Symbol für tive Teil des Polynoms x% betrachtet). Mit dieser Funktionen ein, welche im Positiven einem Mo- Notation lassen sich abschnittsweise definierte Ponom entsprechen, für negative Werte schlicht auf lynome ohne Fallunterscheidung notieren. Null gesetzt werden (es wird also nur der posiDEFINITION 11.53 Für x E IR und k E N sei (x)k

_

+

{xk für x > 0

0

fürx< 0

ABBILDUNG11.15

Der Spline vom Grad m = 2 auf der Stützstellenmenge a = xo = 0, = 1, = 2, b = x3 = 3 aus Beispiel 11.52 und seine erste Ableitung - sie ist stetig.

BEISPIEL 11.54 Betrachte die Funktion abschnittsweise definiert. Es ist f (x) =

f:

R —> I mit f (x) = 2x + (x — 2)+. Dann ist diese Funktion

tx — 3 für x < 2 x — 3 + (x — 2)2 für x > 2

Siehe Abbildung 11.16.

Wie schon eingangs angedeutet, lassen sich mit mittels Polynomen notieren. Es entfällt dann die Hilfe der Notation aus Definition 11.53 Splines abschnittsweise Definition einer Splinefunktion. E SATZ 11.55 Sei s ein Spline. Dann gibt es zu jedem j mit 1 < j < n 1 ein ej E Et, so dass für alle x E R gilt (x) = Pj + cj • (x — x jr

246

SPLINE INTERPOLATION •

Für alle x E [a, b] gilt n-1 S(X) = Pi(X)

(11.6)

ci • (x — x j)+ . =1

Beweis. Der Spline s ist insbesondere an der Stelle x, (mindestens) (m — 1)-mal stetig differenzierbar. Das bedeutet P1V1(x,) = P3P) (x,)

für 0 < j < m — 1.

Es gibt daher ein Polynom Q3, das die folgende Identität

PJ+1(x) — P, (x) = Q (x) • (x — x erfüllt. Wegen PJ+1 — Pi E R[x]m folgt

Qi (x) = cj

für ein c, E R.

Sei etwa x E [xk — i, xk] für passendes k mit 1 < k < n. Im Fall k = 1 ist s(x) = Pl (x), wie gewünscht. Für 2 < k < n liefert wiederholte Anwendung von der ersten Aussage des Satzes k-1

n-1 (x

Pk(X) = Pk-1(X) + Ck-1 ' (X Xk-1)m = Pl(X) +

xi )m =

(x) +

j=1

Cj X — Xj

mit s(x) = Pk(x) folgt die Behauptung.

BEISPIEL

11.56 Wir betrachten den Spline aus Beispiel 11.52. Es ist s : [0,3]

ABBILDUNG 11.16

,

j=1 •

Eine Abschnittsweise definierte Funktion tatsächlich ein Spline. Die Notation aus Definition 11.53 eingeführte Schreibweise vereinfacht die Beschreibung. Es ist f (x) = 2x + (x — 2)1_ .

IR mit

x2 — 2x + 1 für 0 < x < 1 s(x) = /0 für 1 < x < 2 —x2 + 4x — 4 für 2 < x < 3 ein Spline vom Grad m = 2 und n = 3. Die Stützstellenmenge ist xo = 0, xi = 1, x2 = 2 und x3 =- 3. Offensichtlich ist Pi (x) = x2 — 2x + 1 und damit suchen wir nun cl , c2 E IR, so dass gilt n-1

S(X) =

(X) +

E c;• ( x _ x j)r+n = X 2 — 2x +1 + cl • (x —

+ C2 • (X — ..2)4.•

j=1

Für die beiden mittleren Teilintervalle erhalten wir jeweils eine Gleichung. Dabei berücksichtigen wir die

247

SPLINE INTERPOLATION

Definition des Symbols (x)7 und erhalten 0 = x2 — 2x + 1 + ci • (x — x1)2 —X2 + 4x — 4 = x2 — 2x + 1 + Ci • (x — xi)2 + C2 • (x — x2)\ 2

s(

für 1 < x < 2 für 2 < x < 3.

Setzt man die Stützstellen ein, finden wir zunächst für die erste Gleichung

20 -

0 = x2 — 2x + 1 + ci • (x2 — 2x + 1)

für 1 < x < 2

und damit ci = —1. Das führt zu der folgenden Gleichung —x2 + 4x — 4 = c2 • (x2 — 4x + 4)

für 2 < x < 3

und damit c2 = 1. Also ist S(X) = X2 — 2x + 1 — 1 • (x — 1)1_ + 1 • (x — 2) E _J

11.4.2 Kubische Splines Wir betrachten des weiteren kubische Splines, also Spline-Funktionen zum Grad m = 3. Sie tauchen in der Natur beim Biegen von Material auf. Ein dünner Ast, der zu einem Korb oder im Inneren einer Wand eines Fachwerkhauses aufgeflochten wird, nimmt die Form eines kubischen Splines an. Der Ast versucht die Krümmung zu minimieren. Wie vielleicht aus der Schule bekannt, beschreibt

(„,

die zweite Ableitung die Krümmung einer Kurve - also die Änderung der Steigung alias der Richtungsänderung. Ein Ast, der seine Krümmung minimiert, hält die Richtungsänderung klein. Die Funktion, die seine aktuelle Biegung beschreibt, wird also eine minimal zweite Ableitung aufweisen.

11)

SATZ 11.57 Zu vorgegebener Stützpunktmenge mit Stützstellenmenge X der Ordnung n gibt es mindestens einen interpolierenden Spline s E S3,„(X). Der Spline s ist durch jeweils eine der folgenden Randbedingungen eindeutig bestimmt. Es ist entweder s"(a) = s"(b) = 0 oder yo = yn und s(3) (a) = s(3) (b) für 0 < j < 2 oder für vorgegebene 71, ry2 E gilt s' (a) = und s' (b) =

ABBILDUNG 11.17

Der natürliche Spline aus Beispiel 11.59. Die Krümmung - alias die zweite Ableitungen ist an den Rändern des Splines gleich 0.

248

Beweis. Wir geben nur die Beweisidee, Details werden dem Leser überlassen. Der Spline kann in Form (11.6) geschrieben werden. Man wird sich darüber klar, dass die Koeffizienten in dieser Darstellung über ein lineares Gleichungssystem der Stützpunkte bestimmt werden und zählt Unbekannte und bestimmende lineare Gleichungen. Dabei fällt auf, dass zwei Freiheitsgrade über bleiben, welche jeweils durch die Nebenbedingungen festgelegt werden. Der Beweis ist an der Stelle kompliziert, an welcher ■ man argumentiert, dass das aufgestellte LGS eine eindeutige Lösung besitzt.

SPLINE INTERPOLATION •

Zu vorgegebener Stützpunktmenge mit Stützstellenmenge X der Ordnung n gibt es genau dann einen eindeutigen interpolierenden kubischen Spline, wenn zwei zusätzliche Freiheitsgra-

de eingeschränkt werden. Geschieht das auf eine spezielle Art und Weise, so tragen diese Splines eine zusätzliche Bezeichnung.

DEFINITION 11.58 Es sei eine Stützpunktmenge der Ordnung n und ein diese interpolierender kubischer Spline s gegeben.

Es heißt s ein natürlicher Spline, falls s" (a) = s" (b) = 0. Es heißt s ein periodischer Spline, falls Yo = Yn

und

s(j) (a) = s(i) (b)

für j E {1,2}

11.59 Sei X = {0,1,2} eine Stützstellenmenge der Ordnung n = 2. Wir suchen den natürlichen Spline s = S3,2 (X) zu den folgenden Stützpunkten und Bedingungen

BEISPIEL

.s(0) = 1,

s(1) = 0,

s(2) = 11,

s"(0) = s"(2) = 0.

Mit dem Ansatz (11.6) ist also s(x) = ao + al x + a2x2 + a3x3 +

ZU DEFINITION 11.58

Der natürliche kubische Spline trägt seine Bezeichnung von in der Natur vorkommenden „Biegeprozessen" Dabei wird die Krümmung alias die zweite Ableitung an den Randpunkten auf Null gesetzt. Ein gekrümmtes Objekt wird an den Randpunkten nicht auf eine bestimmte Krümmung gezwungen, sondern läuft in beide Richtungen ungekrümmt aus. Der periodische kubische Spline kann beliebig oft aneinandergeklebt werden und ist an diesen Klebestellen immer noch kubisch - sprich, die Ableitungen stimmen dort bis zur zweiten Ableitung überein. Das sind tatsächlich zwei Einschränkungen, denn die Gleichung yo = y„ schränkt nicht die Freiheitsgrade des Splines ein, sondern ist zwingende Voraussetzung, dass ein „Aneinanderkleben" funktioniert.

(x — 1)+

mit den Ableitungen (x) = at + 2a2x + 3a3x2 + 3ci (x — 1)+ s"(x) = 2a2 + 6a3x + 6c1(x — 1)+ und wir erhalten ein lineares Gleichungssystem mit fünf Unbekannten ao, al, a2, a3 und ci s(0) = 1 = ao s(1) = 0 = ao + al + a2 + a3 s(2) =11 = ao + 2a1 + 4a2 + 8a3 + ct s"(0) =0 = 2a2 s"(2) =0 = 2a2 + 12a3 + 6ci Die Lösung dieses linearen Gleichungssystems ist leicht zu berechnen und lautet ao = 1,

al = —4,

a2 = 0,

a3 = 3,

c1 = —6

und damit ist der kubische Spline gegeben durch s(x) = 1 — 4x + 3x3 — 6(x — 1)1_,

249



SPLINE INTERPOLATION

wie in Abbildung 11.17 skizziert. Interpolationsfehler kubischer Splines

Abschließend beobachten wir noch eine Fehlerabschätzung für kubische Splines, wenn die Stützpunkte auf dem Graphen einer viermal stetig-

differenzierbaren Funktion liegen. Dazu definieren wir, ähnlich wie Normen für Vektoren, Normen für Funktionen.

DEFINITION 11.60 Für a, b E llre, mit a < b und eine stetige Funktion g : [a, b] -+ IR setzen wir

= sr2[T,b1 Ilg(x)11. Wir können nun für viermal stetig differenzierbare Funktionen den Interpolationsfehler für kubische Splines abschätzen. Der Beweis für Satz 11.61

sprengt den Rahmen dieser Darstellung. Der Satz ist jedoch der Vollständigkeit halber aufgeführt.

SATZ 11.61 Die Funktion f : [a, b] —› 118 sei viermal stetig differenzierbar. Weiter sei f E S3,7, ( X)

der nach Satz 11.57 eindeutig bestimmte kubische Spline mit s(x,,) = f (x u ) (a) = (a)

für 0 < v < n, und s' (b) = (b).

Weiter setze h = maxa R eine stetige Funktion. In Kapitel 10 haben wir gesehen, dass eine solche Funktion tatsächlich bestimmt integrierbar ist. Es macht demnach Sinn, die folgende Aufgabe zu stellen: Berechne das bestimmte Integral f

DEFINITION

=

f f (x)dx

(bzw. eine gute Näherung) Stammfunktion von f .

ohne Kenntnis einer

Um dieses Problem zu lösen, werden in der Regel Quadraturformeln eingesetzt; auf solche beschränken wir uns in dieser Darstellung. Wir erinnern an die Notation von Stützpunktprobleme aus Kapitel 11, insbesondere Definition 11.10 und 11.11. Es folgt die Definition von Quadraturformeln.

12.1 Es seien für ein n E N mit und

: X(a, b)n —> R

kt

gi : X (a, b)n

für alle i E {0,1, ...

R

77.}

insgesamt n + 2 Funktion gegeben. Wir nennen Pf eine Quadraturformel der Funktion f von Grad n mit Gewichten go, Stützstellenmenge xo, xi , xn, wenn gilt .F7 (Xo

Xn ) =

Egi(xo,

,

gn über der

• f (xi).

i=o

BEISPIEL 12.2 Es sei n = 2 und a, b E R mit a < b. Wir setzen P = b — a und definieren die Gewichtsfunktionen gi : X(a, b)n —› R für alle i E {0,1,2} als

go(a,

b) = (

1

+

2x1 — a — b

1

gi(a, xi,b) =

g2(a, xl, b) =

3 2 Damit erhalten wir die Quadraturformel .F7 : X(a, b)n -i R mit

3

1

T i (a, xi,b) = ( 3 +

2xi — a — b) 2

P f (a) +

= ä • ( f (a) + f (xi) + f(b)) + 2x1

1 3

(1 3



2x1 — a —

2

b

ZU DEFINITION

12.1

Das Herz einer Quadraturformel besteht in ihren Gewichtsfunktionen. Die i-te Gewichtsfunktion entscheidet darüber, wie stark der Funktionswert an der Stützstelle xi jeweils als Approximation der Funktionswerte eines Intervalls um x, zu verstehen ist. Das hängt natürlich von der gesamten Stützstellenmenge und ihrer Verteilung im Intervall [a, b] ab. Zudem versucht man sich dabei an einer Antwort, die für alle Funktionen f gut ist. Diese spielen bei der der Definition der Gewichtsfunktionen nämlich noch keine und erst bei der Berechnung der Quadraturformel eine Rolle.

2.

(1 2x1 — a — b) • 2 • f (x1) + 3 2 f(b) 2

—a—b 2

2

(f(a) — f (b))

253

In NUMERISCHE INTEGRATION - EINLEITUNG

Anschaulich gesprochen gewichtet diese Quadraturformel den Funktionswert von x i mit ä und je nachdem wie weit xi näher an a oder an b liegt, diese entsprechend weniger oder mehr. Siehe die Abbildungen 12.1 und 12.2. Sei nun f : [0,3]

R mitf(x) = — A x3 + 2x2 — Ix + 2. Berechnet man das tatsächliche Integral, erhält man fo 3 — 1 3 -- X3 + 2X2 — ;X + 2dx = — — 1 12

x4 + _2 32 4 3 xo

' + 2x

3

1

0 = 5i.

Wir approximieren mit Hilfe der Quadraturformel für unterschiedliche Stützstellenmengen eine Näherung. Siehe Abbildung 1 für eine Illustration. • Für die Stützstellen xo = 0, xi = 2 und x2 = 3 berechnet die Quadraturformel mit t = b — a also 3—0=3 (0,

2'

3) = —e • (f(0) + f (— ) + f (3)) + 2 3

2 • 23 — 0 — 3 2

t (1( 0 ) — f (3))

2 •i' — 0 — 3 11 3 = 2 + —+ 3 + 3 (2 — 3) = 6- . 8 2 8

• Für die Stützstellen xo = 0, xi = 1 und x2 = 3 berechnet die Quadraturformel mit E = b — a also 3—0=3 2 •1 — 0 — 3 t (f (0) — f(3)) 2 2 • 1 20-3 1 = 2+1 +3+ 3 (2 — 3) = 6-. 2 • Für die Stützstellen xo = 0, xi = 2 und x2 = 3 berechnet die Quadraturformel mit t = b — a also 3—0=3 2•2 —0—3 .77 (0,2,3) = — • (1(0) f(2) /(3)) e (1(0) — f (3)) 2 3 -7f" (0,1,3) = —3 . (1(0) + f(1) + f(3)) +

=2+2+3+ 2 Sei nun f : [0,3]

•2 — 3 (2 — 3) = 6 -. 20-3 2

111 mit f (x) =- — x + 3. Berechnet man das tatsächliche Integral erhält man

ABBILDUNG 12.1 Die in Beispiel 12.2 definierte Quadraturformel approximiert das bestimmte Integral der Funktion f (x) = - 3x3 2x2 - 13.x + 2 über dem Intervall [0,3] für unterschiedliche Stützstellen wie in den oberen Diagrammen dargestellt. Dabei erhält man die obere Approximation für die Stützstellen x0 = a, xi = 4 und x2 = 3, die mittlere Approximation für die Stützstellen xo = a, xi = 1 und x2 = 3 und die untere Approximation für die Stützstellen xo = a, xi = 2 und x2 = 3.

254

f o3 — X -I- 3dx

1

= [-- X2 + 3X1 = 42. 2

Wir approximieren mit Hilfe der Quadraturformel für unterschiedliche Stützstellenmengen eine Näherung. Siehe Abbildung 12.2. • Für die Stützstellen xo = 0, xi = t und x2 = 3 berechnet die Quadraturformel mit t = b — a also 3—0=3

771 0, 3 2 ,3) = • (.f (0) + I (23 ) f (3)) + 2

—2 — 3

t

(f(0)

f (3))

2 •- 0 — 3 3 3 (3 — 0) = 11. = 3 + —2 + 0 + 2 • Für die Stützstellen xo = 0, xi = 1 und x2 = 3 berechnet die Quadraturformel mit t = b — a also

DIE NEWTON-COTES-FORMELN

3—0=3 2 •1— 0 — 3 t

17 (0,1,3) = ä • (f(0) .f(1) =3+2+0+2

f (3)) +

• 1 2 0-3

(f (0) — f(3))

2 3 (3 — 0) =32 .

• Für die Stützstellen xo = 0, xi = 2 und x2 = 3 berechnet die Quadraturformel mit P = b — a also 3—0=3 2 • 2— 20— 3 77 (0,2,3) = • (.t (0) = 3+1+0+

f (2)

2 • 2 —2 0-3

L

(f(0)

f (3)) +

f(3))

1 3 (3 — 0) = 5- . 2

ZUSAMMENFASSUNG

Sei für zwei reelle Zahlen a, b E R mit a < b im R eine stetige Funktion. In KaFolgenden f : [a, b] pitel 10 haben wir gesehen, dass eine solche Funktion tatsächlich bestimmt integrierbar ist. Es macht demnach Sinn, die folgende Aufgabe zu stellen: Berechne das bestimmte Integral f (x)dx

Zf =

für zwei reelle Zahlen a, b e R mit X (a, b)n = {(xo, xn) E [a,b]n+1 : a = xo < . . < xn = b} die Menge aller Stützstellenmengen zwischen a und b bezeichnet. Nach Definition 12.1 benötigt man zum Bilden einer Quadraturformel für ein n E N solche 7}1 : X (a,

—> R

und

gi : X (a, b)n —> R

für alle i E {0,1, ... n}

J

(bzw. eine gute Näherung) ohne Kenntnis einer Stammfunktion von f. Um dieses Problem zu lösen, werden in der Regel Quadraturformeln eingesetzt. Wir definieren nun, was wir unter einer Quadraturformel verstehen. Vorher benötigen wir noch etwas Notation. Dazu haben wir in Definition 11.11

insgesamt n +2 Funktionen. Es ist dann .F7 eine Quadraturformel der Funktion f von Grad n mit Gewichten go , , gn über der Stützstellenmenge xo, xn, wenn gilt (xo,

gi(xo, ...,xn ) • f (x i).

xn) = i=o

111 ABBILDUNG 12.2

12.2 Die Newton-Cotes-Formeln Wir lernen nun einige Quadraturformeln kennen und werden feststellen, dass sich diese alle mit Hilfe eines grundlegenden Ansatzes beschreiben lassen. Für eine gegebene Menge von Stützstellen, wird mit Hilfe der Funktion f eine Menge von

n 1 Stützpunkten gebildet. Danach wird für dieses Stützpunktproblem das eindeutige Interpolationspolynom vom Grad n berechnet. Anschließend wird dieses Polynom integriert.

Die in Beispiel 12.2 definierte Quadraturformel approximiert das bestimmte Integral der Funktion f (x) = —x + 3 über dem Intervall [0,3] für unterschiedliche Stützstellen wie in den oberen Diagrammen dargestellt. Dabei erhält man die obere Approximation für die Stützstellen xo = 0, xl = e und x2 = 3, die mittlere Approximation für die Stützstellen xo = 0, x l = 1 und x2 = 3 und die untere Approximation für die Stützstellen x0 = 0, xl = 2 und x2 = 3. 255

DIE NEWTON-COTES-FORMELN

ZU DEFINITION

12.3

Anschaulich wird für gegebene Stützpunkte auf dem Graphen von f das Interpolationspolynom von kleinem Grad berechnet und dessen Integral über die Grenzen a und b berechnet. Ein durchaus nachvollziehbarer Ansatz, versucht man doch mit dem Interpolationspolynom eine gute Approximation an f zu erlangen. Das hier das Lagrange-Interpolationspolynom stellvertretend für das Interpolationspolynom von kleinem Grad steht, liegt an der Tatsache, dass man dieses als Summe der Lagrange-Polynome schreiben kann. Diese werden später im Zusammenhang mit den Gewichtsfunktionen stehen, wenn wir beweisen, dass Newton-Cotes-Formeln Quadraturformeln sind.

D EFIN ITION 12.3 Sei die Stützpunktmenge für eine Stützstellenmenge X der Ordnung n für die Funktion f gegeben. Dann ist die Newton-Cotes-Formel der Funktion f vom Grad n die Funktion, welche die Menge der Stützstellen X auf das Integral über das Lagrange-Interpolationspolynom .ex,y zu den Stützpunkten (x0, yo), , (x, , yr,) abbildet. Wir bezeichnen diese Funktion mit .V7 : X(a, b)n --> II8,

BEISPIEL

(x0, ... xn)

,exy(x)dx.

12.4 Betrachten wir die Funktion f : [0,3] —> R mit f (x) = — x 3 + 2x 2 — — 8x +2 3 3

die wir auch schon in Beispiel 12.2 gesehen haben. Wir approximieren das bestimmte Integral der Funktion f über ihrem Definitionsbereich mittels unterschiedlicher Stützstellen mit Hilfe der Newton-Cotes-Formel. Berechnet man das tatsächliche Integral erhält man, wie in Beispiel 12.2 berechnet, 3

1

8 +2 = 1 L — 3 r" + 2x2 — —x 3 Siehe Abbildung 12.3. • Für die Stützstellenmenge X mit x0 = 1 und xi = 2 von Ordnung n = 1 ist die Stützpunktmenge für f die Menge (1,1), (2,2), wie man durch Einsetzen der Stützstellen in f schnell nachrechnet. Die Newton-Cotes-Formel der Funktion f vom Grad 1 benötigt nun das Lagrange-Interpolationspolynom. Wie man schnell mit Schema F 11.30 nachrechnet ist rX,Y (X) = x

Also bildet die Newton-Cotes-Formel der Funktion f vom Grad 1 die Stützstellenmenge X ab auf 3 3 1 .A0 ((1,2)) = I ,Cx,y (x)dx = f xdx = 4- . 2

• Für die Stützstellenmenge X mit x0 = 0, xi = 1 und x2 = 3 von Ordnung n = 2 ist die Stützpunktmenge für f die Menge (0,2), (1,1), (3,3), wie man durch Einsetzen der Stützstellen in f schnell nachrechnet. Die Newton-Cotes-Formel der Funktion f vom Grad 2 benötigt nun das Lagrange-Interpolationspolynom. Wie man schnell mit Schema F 11.30 nachrechnet ist 22 5 —x — —X + 2 =3 3 Also bildet die Newton-Cotes-Formel der Funktion f vom Grad 2 die Stützstellenmenge X ab auf ,

£x,Y(x)

3

32 5 — x2 — — x + 2dx 3 3 2 5 2 , = (- • 3- — • 3- + 2 • 3) — (— • 0- — • 0- + 2 • 0) = 4,5. 9 9 6

((0,1,3)) =- f Cxx (x)dx = f

0

• Für die Stützstellenmenge X mit x0 = 0, xi = 2 und x2 = 3 von Ordnung n = 2 ist die

256

DIE NEWTON-COTES-FORMELN

Stützpunktmenge für f die Menge (0,2), (2,2), (3,3) wie man durch Einsetzen der Stützstellen in f schnell nachrechnet. Die Newton-Cotes-Formel der Funktion f vom Grad 2 benötigt nun das LagrangeInterpolationspolynom. Wie man schnell mit Schema F 11.30 nachrechnet ist

f(=>

rx,y(x) = 3 x2 — 3x + 2. Also bildet die Newton-Cotes-Formel der Funktion f vom Grad 2 die Stützstellenmenge X ab auf 3 2 (X)d.T = f —x2 — — x 2dx o 3 3 1 1 , 1 3 2 • 3 — • 3 + 2 • 3) — (5 • 0- — 0- + 2 • 0) = 6.

Jq((0,2,3)) = x / 3G

2

3

—(9

L

Wir werden uns nun direkt vergewissern, dass dort aufgeführten Gewichtsfunktionen gibt, um Newton-Cotes-Formeln Quadraturformeln sind. die Newton-Cotes-Formeln als geforderte Summe Dazu müssen wir die Form aus Definition 12.1 zu schreiben. nachweisen - also insbesondere zeigen, dass es die

V LEMMA 1 2.5 Die Newton-Cotes-Formel Ar7 der Funktion f vom Grad n ist eine Quadraturformel zur Funktion f vom Grad n mit den Gewichten gi : (a, br

xo,

f Lx,i(x)dx

für alle i E {0,

,

a

wobei Lx,,, das i-te Lagrange-Polynom zu den Stützstellen xo ,

ABBILDUNG 12.3

, xn ist.

Beweis. Das Lagrange-Interpolationspolynom ist von der Form

X ,Y (X)

=

E yi • L x

(X).

k=0

Integriert man dieses Polynom, erhält man bn

A17(X0, • • • ,xn) = f LX,y(x)dx =J

n

E Lx,i(x) • f (xi)dx = E i=o

Lx,i(x)dx • f (x i) •

i=o a

Die Newton-Cotes-Formel lässt sich also als eine Linearkombination der Gewichtsfunktionen g, für i = 0, , n schreiben. Somit sind Newton-Cotes-Formeln Quadraturformeln vom Grad n mit entsprechenden Gewichtsfunktionen. •

Anhand unterschiedlicher Stützstellenmengen kann man mit Hilfe der Newton-Cotes-Formel Approximationen an bestimmte Integrale berechnen. Dabei wird für Stützpunkte auf dem Graph der zu approximierenden Funktion das Interpolationspolynom von kleinem Grad berechnet und dann integriert. Für die Funktion f(x) = — 2x 2 — 3 x+ 2 aus Beispiel 12.4 sind diese Approximationen für drei Stützstellenmengen dargestellt. In dem oberen Diagramm wird die Newton-Cotes-Formel vom Grad 1 für die Stützstellen xo = 1 und x1 = 2 angewendet. In dem mittleren Diagramm wird die Newton-Cotes-Formel vom Grad 2 für die Stützstellen xo = 1, x l = 1 und x2 = 3 angewendet. In dem unteren Diagramm wird die Newton-Cotes-Formel vom Grad 2 für die Stützstellen xo = 1, xi = 2 und x2 = 3 angewendet.

257



DIE NEWTON-COTES -FORMELN

BEISPIEL 12.6 Wir betrachten die Funktion f : [0,3] —÷ mit

f (x) —

X3 + 2X2 - 8 —x + 3 3 die wir auch schon in Beispiel 12.2 und 12.4 gesehen haben. Außerdem wählen wir die unterschiedlichen Stützstellenmengen, die wir ebenfalls in Beispiel 12.4 in den Blick genommen haben. Dabei werden die Lagrange-Polynome wie in Definition 11.24 berechnet.

• Für die Stützstellenmenge X mit x0 = 1 und x1 = 2 von Ordnung n = 1 ist die Stützpunktmenge für f die Menge (1,1), (2,2). Die Gewichtsfunktionen der Newton-Cotes-Formel der Funktion f vom Grad 1 für diese Stützstellen lauten 3

3

= 9o ((1,2)) = f Lx ,o(x)dxf o 3

—x + 2dx = 3

91(0-'2)) = f L x i(x)dx = f x— ldx = 0

'

0

2

3 7

2.

Tatsächlich ist 3 3 3 1 .Afj(1,2) = 2 • f(1) + 2— • f (2) = — • 1 + 2— • 2 = 42 wie auch in Beispiel 12.2 berechnet. • Für die Stützstellenmenge X mit x0 = 0, xi = 1 und x2 = 3 von Ordnung n = 2 ist die Stützpunktmenge für f die Menge (0,2), (1,1), (3,3). Die Gewichtsfunktionen der Newton-CotesFormel der Funktion f vom Grad 2 für diese Stützstellen lauten 3 go((0,1,3)) = f

4

Lx,o(x)dx = f3 —x2 - -x ldx = 0 o3 3 3 3 3 9 91((01113)) = f Lx,i (X)dX = f --X2 + -xdx = 4 2 0 2 3 3 1 3 92(0,1,3)) = f Lx,2(x)dx = f —x2 — —xdx = — . 4 0 6 6 Tatsächlich ist Aq(0,1,3) = 0 • f(0)

9

9 3 1 • f(1) 3 • f(3) = 0 • 2 + • 1 + zi • 3 =

wie auch in Beispiel 12.2 berechnet. • Für die Stützstellenmenge X mit x0 = 0, xl = 2 und x2 = 3 von Ordnung n 2 ist die Stützpunktmenge für f die Menge (0,2), (2,2), (3,3). Die Gewichtsfunktionen der Newton-Cotes-

258

DIE NEWTON-COTES-FORMELN •

Formel der Funktion f vom Grad 2 für diese Stützstellen lauten 3 3 1 5 3 go ((0,2,3)) = L x 0(x)dx = - x2 - -x + ldx = 0 6 4 6 o 3 3 1 3 L x i(x)dx = 1 --x2 + - xdx = 91((0,2•3)) = 0 2 2 o 3 3 1 2 2 g2((0,2,3)) -= f LX 2(X)dX = / - x - - xdx = 0. 0 3 3 Tatsächlich ist 9 9 Afy (0,2,3) = i • f (0) + i-i • f (2) + 0 • f (3) -= z-i • 2 + i • 2 + 0 • 3 = 6, wie auch in Beispiel 12.2 berechnet.

12.2.1 Von allgemeinen zu äquidistanten Stützstellen Die Newton-Cotes-Formeln sind in ihrer Anwendung recht sperrig. Für jede Funktion und jede Menge von Stützstellen das Interpolationspolynom zu berechnen und zu integrieren erscheint ein enormer Aufwand zu sein. Es geht tatsächlich schneller. Wir haben schon bemerkt, dass die Gewichtsfunktionen unabhängig von der konkreten zu integrierenden Funktion f gebildet werden. Es ergibt Sinn, sich für jedes n allgemein auf n 1 Stützstellen zu einigen und ein für alle mal die Gewichtsfunktionen für diese Stützstellen zu berechnen und in einer Tabelle abzulegen. Beim Anwenden der Newton-Cotes-Formeln vom Grad n muss lediglich die Tabelle aufgerufen und die Gewichte der Funktionswerte ausgelesen werden. Dieser

Ansatz hat allerdings einen Haken. Der Definitionsbereich [a, b] der zu integrierenden Funktion variiert. Glücklicherweise lassen sich die Gewichte dennoch nahezu unabhängig auch von diesem Parameter berechnen. Einzig die Länge des Intervalls [a, b] taucht als Faktor auf, der als später zu ergänzender Parameter in den Formeln mit angegeben wird. Das Lagrange-Interpolationspolynom und die Lagrange-Polynome im Hinterkopf lassen folgende Wahl der Stützstellen plausibel erscheinen. Das Intervall [a, b] wird in n gleich große Teilintervalle aufgeteilt, die Stützstellen werden äquidistant gewählt.

lb ZU DEFINITION 12.7 Der Abstand aufeinander folgender äquidistanter Stützstellen in X4,;(a,b) ist

— xi = (a (i + 1)h) — (a + ih) =a+ih+1•h—a—ih = h. Außerdem ist xo = a + 0

x„ = a n

bna erhält man die äquidistanten DEFINITION 1 2.7 Sei a, b E R mit a < b. Für n e N und h = Stützstellen _nm; (a, b) Ix 0 , xn } des Intervalls [a, I)] der Ordnung n mit xi = a + i • h für alle i {0, , n}.

b—a n

b—a n

=a =a+b—a=b.

Die äquidistanten Stützstellen unterteilen das Intervall [a, b] in Teilintervalle der Länge h =

259



DIE NEWTON-COTES-FORMELN

Wir berechnen nun für die äquidistanten Gewichtsfunktionen alias Integrale über LagrangeStützstellen des Intervalls [a, b] der Ordnung n die Polynomen.

111 LEMMA 12.8 Für die äquidistanten Stützstellen des Intervalls [a, b] der Ordnung n sind die Gewichte der Newton-Cotes-Formel vom Grad n > 1 gegeben durch n n

g• (nqui (a, b)) = b — a f H x. — j. dx n ./0 ..1 =0 2 — .7

für alle i E {0, ... , n}.

.20i

Beweis. Sei i E {0,..., n}. Nach Lemma 12.5 ist die i-te Gewichtsfunktion der Newton-Cotes-Formel gegeben durch b

b)) = f

(12.1)

„,(a,b),i(x)dx q

a

Mit der Definition der äquidistanten Stützstellen 12.7 erhalten wir LX:qui (a,b),i

=

-Fr

( a +xi h ()a_+j (a IF%)

=

i=o

=

j=o

J#i

JOi

x _a j—) . • h j i=o

(12.2)

jOi

das i-te Lagrange-Polynom für i E 0 , n. Es bleibt das bestimmte Integral zu berechnen, dazu setzen wir 12.2 in 12.1 ein. Das Integral b n x—a—j•h gi(nqui (a, b)) = f H a 3=0 (i — j) • h

jOi

n

b

= f a

x—a h

1 (i i)

_j j) dx

3=0

i0i

lässt sich durch Substitution mit der Funktion t = f (x) = aha lösen. Weil f' (x) = 1 und f (a) = 0 und f (b) = n ist, erhalten wir gi(nqui(a, b)) =

ff

f (b)

h (a)

a

X

3

j=0 — 3)

und haben die Behauptung bewiesen.

260



dx =

f n h• fl 0 j=0

= b j)

n

a

f n fl 0 i=0

MI dx j)



NEWTON-COTES-FORMELN VON KLEINEM GRAD

ZUSAMMENFASSUNG

In Definition 12.3 haben wir eine Familie von Quadraturformeln kennengelernt. Die Newton-CotesFormel der Funktion f vom Grad n ist die Funktion, welche die Menge der Stützstellen X auf das Integral über das Lagrange-Interpolationspolynom Gx, y zu den Stützpunkten (zo yo )> • • • , (xn, yn ) abbildet. Wir bezeichnen diese Funktion mit My : X (a, b)n Mit b (Zo, . • • ,Xn)

f x (x)dx a

Anschaulich wird für gegebene Stützpunkte auf dem Graphen von f das Interpolationspolynom von kleinem Grad berechnet und dessen Integral über die Grenzen a und b berechnet. In Lemma 12.5 haben wir bewiesen, dass die NewtonCotes-Formel Ain der Funktion f vom Grad n eine Quadraturformel zur Funktion f vom Grad re mit den Gewichten gi : X (a, b)n

R b

X0,

• Xn

f x ,i(X)dX, (2

ist, wobei Lx,, das i-te Lagrange-Polynom zu den Stützstellen xo , • • • , xn ist.

Die Newton-Cotes-Formeln sind in ihrer Anwendung recht sperrig. Für jede Funktion und jede Menge von Stützstellen das Interpolationspolynom zu berechnen und zu integrieren erscheint ein enormer Aufwand zu sein. Die Gewichtsfunktionen werden unabhängig von der konkreten zu integrierenden Funktion f gebildet werden. Deshalb einigt man sich für jedes n allgemein auf n 1 Stützstellen und berechnet ein für alle mal die Gewichtsfunktionen für diese Stützstellen. Beim Anwenden der Newton-Cotes-Formeln vom Grad n muss lediglich auf diese zurückgegriffen werden. Dieser Ansatz hat allerdings einen Haken. Der Definitionsbereich [a, b] der zu integrierenden Funktion variiert. Glücklicherweise lassen sich die Gewichte dennoch nahezu unabhängig auch von diesem Parameter berechnen. Einzig die Länge des Intervalls [a, b] taucht als Faktor auf, der als später zu ergänzender Parameter in den Formeln mit angegeben wird. Das Intervall [a, b] wird in n gleich große Teilintervalle aufgeteilt, die Stützstellen werden äquidistant gewählt. In Definition 12.7 haben wir für a, b E R mit a < b und n e N sowie h= 12 die äquidistanten Stützstellen Xraui (a, b) = .....x} ,,} des Intervalls [a, b] der Ordnung n mittels xi = a+i•h für alle i E {0, , n} definiert.

12.3 Newton-Cotes-Formeln von kleinem Grad

Lemma 12.8 ermöglicht es nun, die jeweils n 1 Gewichte von Newton-Cotes-Formeln vom Grad n zum Einheitsintervall [0,1] der äquidistanten Stützstellen der Ordnung n zu berechnen und in einer Tabelle abzulegen. Für eine konkrete Funk-

tion f über einem Intervall [a, b] müssen diese lediglich mit der Länge des Intervalls [a, b] multipliziert werden, um die Gewichte der NewtonCotes-Formel der Funktion f vom Grad n zu erhalten. Dazu dient die folgende Definition.

n

gz

1

1 2

1 2

2

1 6

4 6

1

3

1

3

3

4

1

7 32 12 32 7 90 90 90 90 90

ABBILDUNG 12.4

Für 1z = 1,2,3 und 4 legen wir die Gewichtsfaktoren für die Newton-Cotes-Formeln über äquidistanten Stützstellen in einer Tabelle ab.

261



NEWTON-COTES-FORMELN VON KLEINEM GRAD

DEFINITION

12.9 Es werde mit n.

gi

1

=—•

f n -1—r n X— .

o 3=0 (2 3)

dx

das Bild der i-ten Gewichtsfunktion der Newton-Cotes-Formel der Ordnung n für äquidistante Stützstellen des Einheitsintervalls der Ordnung n bezeichnet. f(4

Wir können nun den allgemeinen Fall berechnen. über allgemeinen Intervallen über äquidistanten Der allgemeine Fall besteht in Gewichtsfunktionen Stützstellen.

V KOROLLAR 12.10 Sei f : [a, b] lEe, eine Abbildung. Dann ist die Newton-Cotes-Formel über f vom Grad rt an den äquidistanten Stützstellen Kanqui(a, b) ausgewertet J\17 (X4,;(a,b)) (b — a) • E gr • f

+ib—

a

i=o



Beweis. Die Aussage ist eine direkte Anwendung von Lemma 12.8. ABBILDUNG 12.5

IN

In allen drei Diagrammen hat die grüne Fläche den gleichen Flächeninhalt - es entspricht dem Wert, welche die Newton-Cotes-Formel vom Grad 1 über äqudistante Stützstellen ausgibt. Das obere Diagramm veranschaulicht, warum die Formel in diesem Fall auch als Trapezformel bezeichnet wird. Die Strecke durch die beiden Stützpunkte an den Intervallgrenzen liegt im Übrigen auf dem Interpolationspolynom von kleinem Grad durch die Stützpunkte. Wir erhalten erneut eine Veranschaulichung, dass Newton-Cotes-Formeln Interpolationspolynome von kleinem Grad integrieren. Das mittlere Diagramm veranschaulicht die Gewichtung der Funktionswerte, wenn man sich in Erinnerung ruft, dass die Newton-Cotes-Formel eine Quadraturformel ist. Das untere Diagramm verdeutlicht die Formel, sie bildet den Mittelwert der Funktionswerte. In allen drei Fällen wird mit der Intervallbreite verrechnet.

262

Wir erhalten für rt = 1,2,3 und 4 die Gewichtsfaktoren, die in der Tabelle in Abbildung 12.4 aufgeführt sind. Für kleine rt tragen die NewtonCotes-Formeln noch weitere Bezeichnungen. Für n = 1 heißt die Newton-Cotes-Formel auch Tra-

pezregel (Sehnentrapezregel), für n = 2 Simpsonsegel (Keplersche Fassregel), für st = 3 wird sie aus offensichtlichen Gründen -Regel und für rt = 4 als Milne-Regel bezeichnet.

12.3.1 Die Trapezregel

Für n = 1 wird die Newton-Cotes-Formel auch als Trapezregel bezeichnet. Wir berechnen dazu die

1 g° =

1

x— 1

0 0 — l dx =

fo 1 xdx =

1 2

Berechnet man nun die Newton-Cotes-Formel für äquidistante Stützstellen, erhält man die folgende

Gewichte und verifizieren die Tabelle in Abbildung 12.4. und

= 1

1 1 f1 x — dx = 1 xdx = — 2 0 1—0

Formel. Dabei verwenden wir die soeben ermittelten Werte und berechnen

NEWTON-COTES-FORMELN VON KLEINEM GRAD

All (X (a, b)Lit,i) = (b - a) •

Egl • f (xi) = (b - a)

(1 ,„ c/)

i=o

f (b)) = (b - a) f(a)2 f(b)

+

Diese Formel trägt eine besondere Bezeichnung. DEFINITION

12.11 Die

Newton-Cotes-Formel vom Grad 1 über äquidistanten Stützstellen lautet .4 (X (a, b)11„,) = (b a)

f (a)

Der Name Trapez ergibt sich aus der geometrischen Interpretation der Formel. Dabei bildet man ein Trapez dessen Eckpunkte die Stützstellen auf der x-Achse und die Stützpunkte bilden. Dessen Flächeninhalt ist die Approximation an das Integral - daher der Name. Tatsächlich ist es genau das Integral unter dem Interpolationspolynom von kleinem Grad welches in diesem Fall (zwei Stützpunkte) Grad 1 hat und der Geraden durch die beiden Stützpunkte entspricht. Die Newton-Cotes-Formel gewichtet die beiden Funktionswerte, welche den Intervallgrenzen zugeordnet werden jeweils gleich stark - also jeweils zur Hälfte. Die Formel aus Definition 12.11 bildet den Mittelwert, was auf das gleiche hinausläuft. In Abbildung 12.5 sind die drei Interpretationen veranschaulicht.

+ 2 f (b)

und wird auch als Trapezregel bezeichnet.

BEISPIEL 12.12 Betrachte die Funktion

f : [0,3] -+ IR mit f (x) = - 3 x3 + 2x2 — gx + 2. Dann ist

JV} (X (0 ,3)1qui) = (3

0) •

1(3) + /(0) = 3 • 3 + 2 = 7 -1 . 2

2

It' ZU DEFINITION 12.11

2

Siehe Abbildung 12.6. L

12.3.2 Die Simpsonregel

Für 0 = 2 wird die Newton-Cotes-Formel auch die Gewichte und verifizieren damit die Tabelle in als Simpsonregel bezeichnet. Wir berechnen dazu Abbildung 12.4. 1 f2 1 go2 = - • dx = • 2 00-10-2 4 2 2 1 f

gi =

2

2

1

(x - 1)(x - 2)dx = 7 ••f 2

Jo

2 —dx - 1• f (X Jo 1- 0 1 - 2 - 2 o



X

2



3x + 2dx =

o

0)(2 - x)dx = 1- • f 2 —X2 2 o

+

6

4 2xdx = 6

2 2 2 1 f2 1 g2 = 2 f o 2 - 0 2 - 1 dx = ,- • f (x - 0)(x - 1)dx = ,I.; • f x 2 - xdx = 7, 6 4 0 4 0

Berechnet man nun die Newton-Cotes-Formel für Formel. Dabei verwenden wir die soeben ermitteläquidistante Stützstellen, erhält man die folgende ten Werte und berechnen

Al (X (a ,

= (b - a) •

E e, • f (xi) = (b - a) • ( 61

f(a) + 64 f ( a + 2b) +1 6 10)

ABBILDUNG 12.6

Eine Illustration der Trapezregel zu der Funktion aus Beispiel 12.12.

i=o

263

NEWTON-COTES-FORMELN VON KLEINEM GRAD

Diese Formel trägt eine besondere Bezeichnung.

bEHNIIION

12.13 Die Newton-Cotes-Formel vom Grad 2 über äquidistanten Stützstellen lautet .4 (X (a, b)lqui ) = (b — a) •

1

+ • b)) • f (a) + -6 • f a-2 b) ) 6 j

und wird auch als Simpsonregel bezeichnet.

B EIS PIEL 12.14 Betrachte

2

die Funktion f : [0,3]

3

ABBILDUNG 12.7

Eine Illustration der Simpsonregel zu der Funktion aus Beispiel 12.14.

A/1(X(0, 3)iqui) = (3 — 0) •

(16 . f(0)

R mit f (x) = — 3x3 + 2x2 — s x + 2. Dann ist

.f (i) _1 6. .1(3)) = .

1.2+4 7 11 +

1 . 3) = 541

L Siehe Abbildung 12.7. _J

12.3.3 Die T3 -Regel Für n = 3 wird die Newton-Cotes-Formel auch die Gewichte und verifizieren damit die Tabelle in als Simpsonregel bezeichnet. Wir berechnen dazu Abbildung 12.4. 3 n x—i 1 H dx = — • f —x- + 6x2 — llx + 6dx = 1 18 o 8 (3 i=o,ioo 6 — i

3 1 3 3

go = • f

X —i dx = — 1 • f 3 X3 — 1— j.l o,i0i i 6 o 3 1i f 3 X —i 1

f3 A 3 =1 . gi 3 g2 = — •

11 n- i=o,i02 2—i

3

3 gs =

1L

f

—• n 3 -

3

3 LI x— i

5X2

+ 6xdx =

dx = — • f —x3 + 4x2 6 0 dx =

i=0 ,iO3 3— i

1

18

3



f

0



3

8

3 3xdx = — 8 1

x3 — 3x2 + 2xdx = . 8

Berechnet man nun die Newton-Cotes-Formel für äquidistante Stützstellen, erhält man die folgende Formel. Dabei verwenden wir die soeben ermittelten Werte und berechnen 3

JVAX(a, b)lqui)= (b — a) •E e • Axi)_

i=o

(b — 8

(f(a) + 3.f (3a + b) + 3.f (a + 3b) +10)) 4 ) 4 )

Diese Formel trägt die schon erwähnte Bezeichnung.

264

NEWTON-COTES-FORMELN VON KLEINEM GRAD •

D EFINITION 12.15 Die Newton-Cotes-Formel vom Grad 3 über äquidistanten Stützstellen lautet

f(a) + 3

(X (a, bgqui) — (b 8 a) (

b) +3 f (a +4 3b) f(b))

f





und wird auch als 1-Regel bezeichnet. A.) BEISPIEL

12.16 Betrachte wieder die Funktion f : [0,3]

1 .0(X(0 3rqui a ) = (3 — 0) • (8 L Siehe

3

R mit f (x) = — 3x3 + 2x2 — sx + 2. Dann ist

3 1

f(o) + 8— • f (1) + 8—

f (2)

8

• f (3)) = 3 (

2 3 2 3 1 54 + + + 8 8 8 8)

Abbildung 12.8.

ZUSAMMENFASSUNG

Lemma 12.8 ermöglicht es n + 1 Gewichte von Newton-Cotes-Formeln vom Grad n zum Einheitsintervall [0,1] der äquidistanten Stützstellen der Ordnung n zu berechnen und in einer Tabelle abzulegen. Für eine konkrete Funktion f über einem Intervall [a, b] müssen diese lediglich mit der Länge des Intervalls [a, b] multipliziert werden um die Gewichte der Newton-Cotes-Formel der Funktion f vom Grad n zu erhalten. Nach Definition 12.9 wird mit 1 e=-

I

0

nnX n =0

(i — j)

dx

J'\/ (X (a,

=

2 El ABBILDUNG 12.8

Eine Illustration der 1-Regel zu der Funktion aus Beispiel 12.15.

(b a) f (a) f (b)

2

Für n = 2 heißt die Newton-Cotes-Formel auch Simpsonregel (Keplersche Fassregel), Sie lautet nach Definition 12.13 .Ar:f2 (X (a, b)iqui) = (b — a)

das Bild der i-ten Gewichtsfunktion der Newton-CotesFormel der Ordnung n für äquidistante Stützstellen des Einheitsintervalls der Ordnung n bezeichnet. Im allgemeinen Fall - sprich, Gewichtsfunktionen über allgemeinen Intervallen über äquidistante Stützstellen - lassen sich diese Gewichte nutzen, um die NewtonCotes-Formel zu berechnen. Nach Korollar 12.10 ist die Newton-Cotes-Formel über f vom Grad n an den äquidistanten Stützstellen (a, b) ausgewertet JVT (nqui (a, b)) = (b — a) • E gr • f (a +i

Für kleine n tragen die Newton-Cotes-Formeln über äquidistanen Stützstellen noch weitere Bezeichnungen. Für n = 1 heißt die Newton-Cotes-Formel auch Trapezregel (Sehnentrapezregel). Sie lautet nach Definition 12.11

f(a)

fa+ 2 b)

f(b)) .

Für n = 3 heißt die Newton-Cotes-Formel aus offensichtlichen Gründen auch e -Regel. Sie lautet nach Definition 12.15 .1V-2 (X (a, b)2qui ) = (b —8 a)

(f(a) + 3.f (3a4 )

+3•f

f(b))

(a 4)

b— a ). n

265



QUADRATURFEHLER

12.4 Quadraturfehler Wie gut approximieren Newton-Cotes-Formeln das Integral über eine beliebige Funktion? Dabei kann man, ähnlich wie beim Interpolationsfehler, für eine Menge von Stützstellen berechnen, wie nah der von der Quadraturformel approximierte Wert an dem echten Wert des Integrals liegt. Das ist

natürlich in der Regel ein Wert, der nicht exakt zu bestimmen ist, verwendet man die Quadraturformel ja gerade deshalb, weil der echte Wert des Integrals nicht zu berechnen ist. Für bestimmte Funktionen lässt sich aber eine Schranke an den Quadraturfehler angeben.

12.4.1 Exakte Quadraturformeln Wenn eine Quadraturformel vom Grad n zumindest für Polynome vom Grad höchstens n das Integral nicht nur annähert sondern exakt berechnet,

ZU DEFINITION 12.17 ei Eine Quadraturformel integriert also „exakt" vom Grad n, wenn sie, egal für welche Stützstellen, exakt das bestimme Integral für Polynome vom Grad höchstens n ausgibt. Das ist dann nicht so überraschend, wenn die Quadraturformel zunächst ein Interpolationspolynom von kleinem Grad berechnet und dann integriert - jedes Polynom interpoliert sich selbst und es gibt auch kein Interpolationspolynom von kleinerem Grad, welches das Polynom interpoliert.

nennen wir sie exakt. In diesem Fall tritt kein Quadraturfehler auf, die Quadraturformel berechnet das Integral korrekt.

DEFINITION 12.1 7 Eine Quadraturformel 77 heißt exakt vom Grad n, wenn sie alle Polynome bis zum Grad n exakt integriert.

Wenig überraschend haben Newton-Cotes- zunächst und integrieren dann. Also sind sie Formeln diese Eigenschaft, sie interpolieren exakt von entsprechendem Grad.

SATZ

12.18 Newton-Cotes-Formeln vom Grad n sind exakt vom Grad n.

Beweis. Sei [a, b] ein reelles Intervall und sei p E lle.[x]„ ein Polynom vom Grad höchstens n. Sei 25 die Einschränkung von p auf [a, b]. Für jede Menge von n 1 paarweise verschiedenen Stützstellen X = {xo, , xn } und entsprechenden Stützpunkten über p, also Y = (yo = p(x0), , xn. = 25(x.)), entspricht das Lagrange-Interpolationspolynom genau p. Demnach ist fa b

p(x)dx =- f C X,Y (x)dx = .1‘17 (xo,

, xr,)

und da p beliebig aus der Menge aller Polynome vom Grad höchstens n gewählt ist, integriert die Newton-Cotes-Formeln .N vom Grad n jedes Polynom bis zum Grad n exakt. ■

266

QUADRATURFEHLER •

12.4.2 Quadraturfehler für beliebige Funktionen Wie gut ist die Approximation der Newton-CotesFormel für beliebige Funktionen? An dieser Stelle hilft uns der Interpolationsfehler aus Definition 11.19, den wir schon abgeschätzt haben. Wir erhalten eine Schranke für den maximalen Abstand des eindeutig bestimmten Interpolationspolynoms

vom Grad höchstens n zu der Funktion f, wenn f zumindest (n + 1)-mal differenzierbar ist. Diese Abschätzung machen wir uns nun zu nutze, um den Quadraturfehler von Newton-Cotes-Formeln abzuschätzen.

DEFINITION 12.19 Für eine Quadraturformel J7 über einer Funktion f vom Grad n und Stützstellen X = {xo, xn } nennen wir die Differenz Acivad(f, X) =

-F.nf(X)1

den Quadraturfehler der Quadraturformel .F7 über den Stützstellen X.

SATZ 12.20 Sei f : [a, b] R eine (n + 1)-mal differenzierbare Funktion. Die Newton-CotesFormel vom Grad n über f über äquidistanten Stützstellen hat den Quadraturfehler quad (f,

nqui (a, b)) =

1 (71 + 1)!

n

f (n+1)

. f 11(X — a i=0

xi)dx

wobei -± eine reelle Zahl aus dem Definitionsbereich [a, b] von f ist.

ZU DEFINITION 12.19

Im Kontrast zum Interpolationsfehler, der punktweise den Abstand zwischen Interpolationspolynom und Funktion berechnet, ermittelt der Quadraturfehler den Abstand, den das ganze Integral zu der Approximation mittels Quadraturformel besitzt. Dabei ist das einzusetzende Argument eine Menge von Stützstellen. Der Interpolationsfehler gibt also für ein festes Interpolationspolynom und eine Stelle den Abstand zwischen Interpolationspolynom und Funktion aus, der Quadraturfehler den Abstand zwischen der zu einer Stützstellenmenge gehörenden Integral-Approximation und dem tatsächlichen Integral.

Beweis. Die Aussage folgt „direkt" aus dem Interpolationsfehler. Die Details, die durchaus nicht trivial sind, überlassen wir dem Leser. •

12.4.3 Ausblick: Die summierten Newton-Cotes-Formeln Wie wir in Kapitel 11 gesehen haben, werden Interpolationspolynome mit zunehmendem Grad instabiler - sie beginnen zwischen den Stützpunkten zu oszillieren. Entsprechend verschlechtert sich die Güte der Approximation durch eine Newton-

Cotes-Formel, der Quadraturfehler wächst. Abhilfe schafft, was schon bei der Polynominterpolation half: Die abschnittsweise numerische Integration. Der Definitionsbereich [a, b] wird in Teilintervalle unterteilt, auf welchen jeweils mit Hilfe einer

267

QUADRATURFEHLER

Quadraturformel das Integral der Funktion angenähert wird. Die Approximation des Integrals der gesamten Funktion erhält man, wenn man dann die Approximationen auf den Teilintervallen addiert. Auch in diesem Fall kann man beim

Aufteilen des Intervalls in gleich große Abschnitte Gewichte für den Spezialfall „Intervallbreite gleich 1" berechnen und in einer Tabelle ablegen. Die Details möchten wir an dieser Stelle nicht ausführen.

ZUSAMMENFASSUNG

Wenn eine Quadraturformel vom Grad n zumindest für Polynome vom Grad höchstens n das Integral nicht nur annähert sondern exakt berechnet, nennen wir sie nach Definition 12.17 exakt. In diesem Fall tritt kein Quadraturfehler auf. Die Quadraturformel berechnet das Integral korrekt. Newton-Cotes-Formeln haben nach Satz 12.18 diese Eigenschaft. Wie gut ist die Approximation der Newton-CotesFormel für beliebige Funktionen? An dieser Stelle hilft uns der Interpolationsfehler aus Definition 11.19, den wir schon abgeschätzt haben. Nach Definition 12.19 bezeichnet man für eine Quadraturformel J7 über einer Funktion f vom Grad n und Stützstellen

268

X = {xo,..., xri} die Differenz Actuad(f, X) = If

(X)1

als den Quadraturfehler der Quadraturformel .77 über den Stützstellen X. Nach Satz 12.20 hat die Newton-Cotes-Formel vom Grad n über eine (n 1)mal differenzierbare Funktion f über äquidistanten Stützstellen den Quadraturfehler f(n+1)(-) Acinuad (f , X) = (n+1).

f

n

i j=0 -±

(x

_ x% )dx

wobei "x" eine reelle Zahl aus dem Definitionsbereich [a, b] von f ist.

Kapitel 13

Fehlerabschätzung Rechnet man statt mit exakten, mit gerundeten Werten, nimmt man zwangsläufig einen Fehler des Ergebnisses in Kauf. Bei der Verwendung von Rechnern ist man dazu gezwungen. Doch wie groß weicht das praktische, auf einem Rechner ermittelte Ergebnis von dem theoretischen, exakten Wert ab? Das ist eine philosophische Frage. Mit Hilfe der relativen Kondition einer Funktion kann der relative Fehler der Eingabe in Relation zum relativen Fehler der Ausgabe gesetzt werden.

In diesem Kapitel widmen wir uns der Fehlerfortpflanzung in Funktionen. Zahlen, die keine echten Binärbrüche sind, werden beim Eingeben in den Rechner auf eine Maschinenzahl gerundet. So ist I in Binärdarstellung die periodibeispielsweise A sche Zahl (0, 01)2. Diese wird in einem Rechner, abhängig vom Format, auf einen Binärbruch gerundet dargestellt, z.B. auf (0,01010101011). In diesem Kapitel untersuchen wir, was dies für Rechenergebnisse, die aus solchen gerundeten Zahlen berechnet werden, bedeutet. Hauptproblem der Fehleranalyse

Das Hauptproblem der Fehlerabschätzung in der Numerik besteht darin, dass der Input einer reellen Zahl x E R vom Rechner auf eine Maschinenzahl x = rd(x) gerundet wird. Der Rechner berechnet dann f (Y), wissen wollten wir aber f (x). Die offensichtliche Frage lautet dann, wie weit f (Y) von f (x) entfernt ist. Die Schwierigkeit besteht darin, dass man f (x) nicht kennt, denn sonst hätte der Rechner nicht rechnen müssen. Plakativ zusammengefasst: Numerisches Berechnen heißt

„Fehler raten". Um zu verstehen, was beim Rechnen mit einem Rechner das Problem sein könnte, machen wir das folgende Gedankenexperiment. Möchte man mit dem Taschenrechner die Zahl e' berechnen, kann man die folgenden drei Schritte anwenden. ■ Sie drücken auf dem Taschenrechner die Taste „7" und in der Anzeige erscheint die Zahl 3,141592653. ■ Sie drücken auf dem Taschenrechner die Taste „exp" oder „es" und erhalten die Zahl y = 23,14069263. ■ Mit etwas Mühe können Sie dem Taschenrechner die Stellen dahinter entnehmen (die sichtbaren Ziffern y abziehen), und Sie erhalten ein Endergebnis von z = 23,140692632779269002. Nach unserer einführenden Erläuterung müssen wir konsterniert feststellen, dass z e ist. Und tatsächlich sind noch nicht einmal alle berechneten Stellen richtig. Und tatsächlich kann man

U RUNDEN VON INPUTZAHLEN

mit dem Taschenrechner nicht einmal herausfinden, welche Stellen richtig sind. Und de facto wird man den Abstand der berechneten Lösung zur echten Lösung nie erfahren. Immerhin kann man abschätzen, wie weit man höchstens daneben liegt. In diesem Fall ist der Fehler höchstens Iz < 10-18. Auch wenn man e" übrigens auf einem anderen „größeren" Rechner nachschlägt,

löst man das Problem nicht. Die Zahl e" ist (wie auch 7r und e) eine transzendente (und somit auch irrationale) Zahl, also eine Zahl mit unendlich vielen, nicht periodischen Nachkommastellen. Das heißt, kein Rechner der Welt, kann e" vollständig korrekt darstellen. Wir werden den genauen Abstand lz - el also wirklich nie erfahren.

13.1 Runden von Inputzahlen

ZU DEFINITION

13.1

MI

Die Menge der zulässigen Zahlen könnten die Zahlen sein, die in einem bestimmten Datenformat dargestellt werden können. Prinzipiell erst einmal eine Menge von reellen Zahlen, die einen größten und einen kleinsten Wert besitzen. Da die reellen Zahlen geordnet sind, gibt es für jede reelle Zahl x eine größte Zahl in Z, die kleiner oder gleich x ist, der linke Nachbar (auf dem Zahlenstrahl links von x gelegen), und eine kleinste Zahl in Z, die größer oder gleich x ist, der rechte Nachbar (auf dem Zahlenstrahl rechts von x gelegen). Für z E Z ist z selbst sein linker und rechter Nachbar. Ist x nicht im Bereich der zulässigen Zahlen, dann ist der linke Nachbar nicht wirklich links, bzw. der rechte Nachbar nicht wirklich rechts auf dem Zahlenstrahl. In Ermangelung besserer Alternativen wird die kleinste bzw. größte zulässige Zahl gewählt, welche auch, egal für welche Rundungsart, die gerundete Zahl ist.

270

Runden ist dann nötig, wenn man sich auf eine Menge von „zulässigen" Zahlen verständigt und dann für Zahlen, die nicht zu den „auserwählten" Zahlen gehören, eine Zahl aus dieser Menge als zulässigen Vertreter zuordnet. Rundet man auf zwei Stellen nach dem Komma, so sind nur die Zahlen zulässig, deren Dezimaldarstellung maximal zwei Nachkommastellen besitzt. Liegt dann eine Zahl vor, die mehr als zwei Nachkommastellen besitzt, wird in der Regel die am nächsten liegende Zahl mit maximal zwei Nachkommastellen als gerundete Zahl gewählt - die beste Wahl,

möchte man meinen. In manchen Anwendungen ist eine andere Wahl besser - möglicherweise stets aufzurunden. Ist Motoröl beispielsweise nur in Literflaschen verfügbar, würde man die Anzahl der zu kaufenden Flaschen durch Aufrunden der benötigten Ölmenge bestimmen. Grundsätzlich gibt es jedoch zwei Arten, eine Zahl zu runden. Bei der einen Art möchte man die nächstgelegene der zulässigen Zahlen finden, bei der anderen ist die „Richtung" ausschlaggebend (auf- oder abrunden).

DEFINITION 13.1 Es sei Z eine Menge von zulässigen Zahlen in dem Bereich [zmia, zmax ], wobei zmm und zmax in Z enthaltene reelle Zahlen sind. Eine Zahl x E [zmin, zmax] besitzt einen linken definiert als zL (x)

= max {z E Z : z < x}

(x) E Z und einen rechten Nachbarn zR (x)

zR(x) = min {z E Z : z > x}.

E Z,

RUNDEN VON INPUTZAHLEN •

Als

gerichtetes Runden werden die Funktionen rd+, rd_ rd+ : [2_ min, Zmax]

Z mit

rd+ (x) = zR (x)

(Aufrunden)

rd_ (x) = zL (x)

(Abrunden)

zL (x) falls x > 0

rd + (x) =

zR(x)

(Abschneiden)

sonst

bezeichnet. Die Funktion rdo

Zmax

i Z mit falls x < 1 • ( zL(x) + zR(x)) zR(x) sonst zL (x)

rdo(x) = {

wird als korrektes Runden bezeichnet. BEISPIEL 13.2 Sei Z die Menge aller reellen Zahlen zwischen —5 und 5, deren Dezimaldarstellung höchstens vier Nachkommastellen involviert. Dann ist zmin = —5 und zma. = 5. Wir möchten die drei Zahlen x1= 1,234567

x2 = 3,23

x3 = —3,23232323

auf jede der in Definition 13.1 eingeführten Arten runden. Dann ist = 1,2345,

zR (xi) = 1,2346,

2 • (zi.(xi) zR(xi)) = 1,23455

zL (x2 ) = 3,23,

zR (x2) = 3,23,

1 — 2 • (zL (x2) + zR(x2)) = 3,23

zdx3) = —3,2324,

zR(x3) = —3,2323,

1

• (zdx3) + zR(x3)) = —3,23235.

Also runden wir rd+(xi) = 1,2346,

rd+ (x3) = 3,23,

rd+ (x2) = —3,2323,

rd_(xl) = 1,2345,

rd_ (x2) = 3,23,

rd_ (x3) = —3,2324,

rd±(xi) = 1,2345,

rd± (x2 ) = 3,23,

rd±(x3) = —3,2323,

rdo(x1) = 1,2346,

rdo(x2 ) = 3,23,

rdo(x3) = —3,2323.

Das folgende Lemma 13.3 möchten wir nicht be- besagt, dass zulässige Zahlen und gerundete Zahweisen. Es ist eine gute Möglichkeit den Umgang len stets auf sich selbst gerundet werden, egal mit unterschiedlichen Rundungsarten zu üben. Es welche Rundungsart man wählt.

271

RUNDEN VON INPUTZAHLEN

LEMMA

13.3 Es sei Z eine Menge zulässiger Zahlen. Dann gilt rd+(z) rd_ (z) = rd+ (z) = rdo(z) = z

Außerdem gilt für alle x E

für alle z E Z.

zmax]

rd+ (z) =• rd+(rd+(x)), rd_ (z) = rd_ (rd_ (x)),

rd±(z) = rd±(rd+(x)), rdo(z) = rdo(rdo(x)).

Außerdem gilt für alle x, y E [zmin, .x..] mit x < y, dass auch rd+(x) < rd+(y),

Der absolute Rundungsfehler gibt den tatsächlichen Abstand zwischen x und gerundeter Zahl n an. Der relative Fehler teilt noch durch den Betrag von x. Das macht durchaus Sinn. Denke man an die Ungenauigkeit von Längen. Wirft ein Quaterback beim American Football den Ball 10 Meter zu weit, kann sein Mitspieler den Ball nicht fangen. Bei einem Wurf von 50 Metern ein durchaus großer Fehler. Gibt ein Autoverkäufer die gelaufenen Kilometer eines Gebrauchtwagens um 10 Meter zu kurz an, ist dies zu vernachlässigen, wenn das Auto schon über hunderttausend Kilometer gefahren ist. Der relative Fehler ist dann sehr klein.

ABBILDUNG 13.1

rd+(x) < rd+(y),

rdo

(x) < rdo(y).

Beweis. Der Beweis wird dem Leser zur Übung überlassen.

ZU DEFINITION 13.4

2

rd_(x) < rd_(y),

R III

Beim korrekten Runden wird die Zahl x, die sich genau zwischen zwei zulässigen Zahlen x1 und x2 befindet auf x2 abgebildet. Der relative Rundungsfehler ist der Abstand von x zu x2, der für das x in der Mitte von x und x2 bei liegt.



Rundungsfehler Für eine gegebene Menge an zulässigen Zahlen gibt es zwei Größen, die angeben, wie stark eine Zahl aus dem darstellbaren Bereich x E [zmin, zmax ] beim Runden verändert wird. Einmal wird der Abstand zu der gerundeten Zahl gemes-

sen und einmal wird er noch durch den Betrag der Zahl geteilt. Nachvollziehbar nennt man den einen den absoluten und den anderen den relativen Rundungsfehler.

DEFINITION 13.4 Wird eine Zahl x E [zmin , z..] auf die zulässige Zahl = rd(x) gerundet, so sind 5(x) = — xl der absolute (Rundungs)-fehler und p(x) = 1 1;I I der relative (Rundungs)-fehler.

BEISPIEL 13.5 Der größte Fehler beim korrekten Runden einer Zahl x im darstellbaren Bereich tritt auf, wenn d genau in der Mitte zwischen zwei aufeinanderfolgenden (und besonders weit von einander entfernten) zulässigen Zahlen xi und x2 liegt. In diesem Fall gilt 5(X)

= 1rdo(x) — x1 = 1x2

xl =

1x2 — X11

2

siehe Abbildung 13.1. r

1 BEISPIEL 13.6 Ist

die Menge der zulässigen Zahlen die Menge der im binären Gleitkomma-Format mit Mantissenlänge M E N>1 und Bias B E N>1 darstellbaren Zahlen. Das entsprechende Intervall zwischen zwei aufeinanderfolgenden darstellbaren Zahlen [xi , x2] ist dann am größten, wenn der Exponent von x1 maximal ist.

272

RUNDEN VON INPUTZAHLEN •

Der Wert lx2 — xi I (um den der Nachfolger x2 größer ist als sein Vorgänger xl) ist stets 1x2 — xi I = 2-24. •

wobei e der Exponent von xl ist. Der Abstand lx2 — xi I ist also der Wert der letzten Mantissenstelle mal 2e—B

Wählen wir E = 4 und B = 7, so ist der größte mögliche Exponent erna. = (1111)2-7 = 15-7 = 8. Ist weiter M = 3, so ist der größte mögliche absolute Fehler (der beim Runden von x entsteht) 2—M • 2ema. 2-3 • 215-7 32 = = 16. 2 2 2 Die Differenz wird dabei durch 2 geteilt, weil x sich genau mittig zwischen xl und x2 befindet, wenn durch korrektes Runden der maximale absolute Fehler entsteht.

5() x=

x2 — xl 2

1

Der folgende Satz 13.7 gibt Schranken für die gewonnenen Messwerten abhängige Größen beEntwicklung des relativen Fehlers bei den Grund- rechnen, kann man die Fehlerfortpflanzung der rechenarten. Möchte man aus in Experimenten Messfehler so abschätzen. SATZ 13.7 Es seien x, y e II8 \ {0} und x, y e M die gerundeten Werte, so gilt also P(x) =

Ix

P(Y) =

IxI

1Y

yl

1Y1



Ferner nehmen wir an, dass ±' + g, x — g, x • g und vexakt berechnet werden. Dann gelten folgende Abschätzungen für die relativen Fehler der einfachen Rechenoperationen Addition, Subtraktion, Multiplikation und Division.

1

p(x + y) 5 lx +yi

falls x + y # 0

(P(x) • lx1 + P(Y) • WD,

1 (P(x) . lx1 + P(Y) • IM), lx — Y1

P(x —

falls x

y

P(x • Y) < P(x) + P(Y)+ P(x) • p(Y) ^ P(x)+ P(Y)

P ()

P(x) (P(Y) P(x) • P(Y)) •

y ^ P(x) P(Y)

Beweis. Man berechnet jeweils die relativen Fehler. Für x + y 0 gilt P(x + Y) =

1(x

lx —

— + 9)1 lx+yl



4



+ yl

= 1

lx+yl (P(x) • lx1 + P(Y) IYI).

273



FORTPFLANZUNG DES RUNDUNGSFEHLERS

Für x

y gilt p(x

< lx - ±- I + —

1(x — y) — — — yI



1 —

— yl

(P(x) • lx1

P(Y) • 1Y1).

Es gilt P(x • Y) =