Mathematik für die ersten Semester [4. Aufl.] 9783110377347, 9783110377330

This book teaches what is known as higher mathematics – in other words, mathematics that extends beyond simple calculati

203 30 4MB

German Pages 341 [342] Year 2015

Report DMCA / Copyright

DOWNLOAD FILE

Polecaj historie

Mathematik für die ersten Semester [4. Aufl.]
 9783110377347, 9783110377330

Table of contents :
Vorwort
Über Mathematik und Wirklichkeit und dieses Buch
Inhalt
Teil I: Grundlagen
1 Logik
2 Mengen
3 Relationen
3.1 Abbildungen
Teil II: Arithmetik
4 Die natürlichen Zahlen
4.1 Das Prinzip der vollständigen Induktion
4.2 Der binomische Satz
4.3 Primzahlen
5 Erweiterungen der Zahlenmenge
5.1 Die ganzen Zahlen
5.2 Gruppe
5.3 Die rationalen Zahlen
5.4 Körper
5.5 Die reellen Zahlen
5.6 Die komplexen Zahlen
Teil III: Elementare Geometrie
6 Ebene Geometrie
7 Trigonometrie
8 Vektoren
8.1 Vektoraddition
8.2 Skalarmultiplikation
8.3 Einheitsvektor
8.4 Skalarprodukt
8.5 Kreuzprodukt
8.6 Parallelverschiebung
8.7 Polarkoordinaten
8.8 Vektorraum
9 Geometrie des ℝ3
9.1 Geradengleichungen
9.2 Abstand eines Punktes von einer Geraden
9.3 Ebenengleichungen
9.4 Reguläre Polyeder
9.5 Orthonormalbasis
Teil IV: Lineare Algebra
10 Lineare Gleichungssysteme
10.1 Darstellung von linearen Gleichungssystemen
10.2 Elementaroperationen
10.3 Gaußsches Eliminationsverfahren
11 Matrizen
11.1 Addition und Multiplikation von Matrizen
11.2 Die transponierte Matrix
11.3 Elementarmatrizen
11.4 Inversion von Matrizen
11.5 Das Matrixinversionsverfahren
12 Determinanten
12.1 Sätze über Determinanten
12.2 Berechnung von Determinanten
12.3 Die adjungierte Matrix
12.4 Die Cramersche Regel
13 Transformationen mit Matrizen
13.1 Drehungen
13.2 Streckung und Spiegelungen
13.3 Orthogonale Matrizen
13.4 Lösungsmengen irregulärer linearer Gleichungssysteme
14 Iterative Lösung von linearen Gleichungssystemen
14.1 Das Verfahren nach Gauß und Seidel
14.2 Stabilität
Teil V: Algebra und Geometrie
15 Polynome
15.1 Geschlossene Lösungsverfahren
15.2 Approximation der Nullstellen
16 Zweidimensionale quadratische Formen
16.1 Allgemeine Gleichungen zweiten Grades
16.2 Eigenwerte und Eigenvektoren
17 Die Kegelschnitte
17.1 Die Ellipse
17.2 Die Parabel
17.3 Die Hyperbel
17.4 Tangenten und Polaren der Kegelschnitte
17.5 Vergleich der Kegelschnitte
17.6 Begründung der Bezeichnung „Kegelschnitt“
18 Sphärische Geometrie
18.1 Sphärische Trigonometrie
Teil VI: Infinitesimalrechnung
19 Folgen
20 Reihen
20.1 Zur Dezimaldarstellung von Zahlen
21 Stetige Funktionen
22 Funktionenfolgen und Funktionenreihen
Teil VII: Differentialrechnung
23 Der Differentialquotient
23.1 Ableitungen einfacher Funktionen
23.2 Ableitungsregeln
24 Die Exponentialfunktion
24.1 Der natürliche Logarithmus
24.2 Grenzwerte
24.3 Irrationalität der Basis der natürlichen Logarithmen
24.4 Die allgemeine Potenz
24.5 Logarithmisches Differenzieren
25 Die Winkelfunktionen
25.1 Die Kreisbogenfunktionen
25.2 Die Hyperbelfunktionen
26 Kurvendiskussion
26.1 Beispiel einer Kurvendiskussion
27 Approximation von Funktionen
27.1 Der allgemeine binomische Satz
27.2 Fourier-Analyse
27.3 Die Taylor-Reihe
28 Funktionen mehrerer Variablen
28.1 Partielle Differentiation
28.2 Das totale Differential
28.3 Implizite Differentiation
Teil VIII: Integralrechnung
29 Das Integral
30 Integrationsmethoden
30.1 Direkte Integration
30.2 Integration mittels Substitution
30.3 Partielle Integration
30.4 Logarithmische Integration
30.5 Partialbruchzerlegung
30.6 Uneigentliche Integrale
31 Kurvenlänge und Kurvenkrümmung
32 Mehrfachintegrale
32.1 Rotationskörper
33 Integraltransformationen
33.1 Beweis der Gleichungen für die Fourier-Koeffizienten
33.2 Fourier-Transformation
33.3 Etwas Funktionentheorie
33.4 Laplace-Transformation
33.5 Rechenregeln für die Laplace-Transformation
Teil IX: Vektoranalysis
34 Differentiation von Feldern
34.1 Vektoralgebra
34.2 Differentiation eines Vektorfeldes nach einem Skalar
34.3 Räumliche Differentiation eines Feldes
34.4 Mehrfache Differentiation eines Feldes
34.5 Der Laplace-Operator in Polarkoordinaten
35 Integralsätze
35.1 Der Satz von Gauß
35.2 Greensche Sätze
35.3 Der Satz von Stokes
Teil X: Differentialgleichungen
36 Gewöhnliche Differentialgleichungen
36.1 Homogene lineare DGL mit konstanten Koeffizienten
36.2 Lineare DGL mit Störfunktion
36.3 Trennung der Variablen
36.4 Lösen von DGL mit der Laplace-Transformation
Literatur
Stichwortverzeichnis

Citation preview

Wolfgang Mückenheim Mathematik für die ersten Semester De Gruyter Studium

Weitere empfehlenswerte Titel Mathematik. Eine Einführung für Praktiker Bernd Ulmann, 2015 ISBN 978-3-11-037511-4, e-ISBN (PDF) 978-3-11-037513-8, e-ISBN (EPUB) 978-3-11-039785-7

Komplexe Zahlen und Ebene Geometrie, 3. Auflage Joachim Engel, Andreas Fest, 2015 ISBN 978-3-11-040686-3, e-ISBN (PDF) 978-3-11-040687-0, e-ISBN (EPUB) 978-3-11-040688-7

Stochastik, 5. Auflage Hans-Otto Georgii, 2015 ISBN 978-3-11-035969-5, e-ISBN (PDF) 978-3-11-035970-1, e-ISBN (EPUB) 978-3-11-038686-8

Maß und Integral René L. Schilling, 2015 ISBN 978-3-11-034814-9, e-ISBN (PDF) 978-3-11-035064-7, e-ISBN (EPUB) 978-3-11-038332-4

Philosophie der Mathematik, 3. Auflage Thomas Bedürftig, Roman Murawski, 2015 ISBN 978-3-11-033117-2, e-ISBN (PDF) 978-3-11-033118-9, e-ISBN (EPUB) 978-3-11-038226-6

Wolfgang Mückenheim

Mathematik für die ersten Semester | 4. Auflage

Autor Prof. Dr. Wolfgang Mückenheim Hochschule Augsburg Fakultät für Allgemeinwissenschaften Baumgartnerstr. 16 86161 Augsburg [email protected]

ISBN 978-3-11-037733-0 e-ISBN (PDF) 978-3-11-037734-7 e-ISBN (EPUB) 978-3-11-042347-1 Library of Congress Cataloging-in-Publication Data A CIP catalog record for this book has been applied for at the Library of Congress. Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.dnb.de abrufbar. © 2015 Walter de Gruyter GmbH, Berlin/Boston Umschlaggestaltung: shawn_hempel/iStock/thinkstock Satz: PTP-Berlin, Protago TEX-Produktion GmbH Druck und Bindung: CPI books GmbH, Leck ♾ Gedruckt auf säurefreiem Papier Printed in Germany www.degruyter.com

Vorwort Es ist eine erfreuliche Entwicklung, dass innerhalb weniger Jahre schon die vierte Auflage dieses Lehrbuches notwendig wurde. Ich habe die Gelegenheit genutzt, um neuen Erfahrungen, die sich auch nach Jahrzehnten des praktischen Unterrichts noch immer einstellen, Rechnung zu tragen. Dazu zählen didaktische Verbesserungen in Form von zusätzlichen Erläuterungen und Beweisen, aber auch mathematische Präzisierungen. Zur vorläufigen Charakterisierung der reellen Zahlen im ersten Kapitel wird nunmehr ihre Trichotomie-Eigenschaft verwendet, also das arithmetische Pendant des geometrischen Zahlenstrahls. Außerdem wird der Unterschied zwischen der Partialsummenfolge der unendlichen Reihe und ihrem Grenzwert deutlicher als bisher hervorgehoben. Dem Stoff liegt unverändert eine potentielle Auffassung des Unendlichen zugrunde. Dieser Ansatz wird auf den folgenden Seiten skizziert und begründet. Wie in den bisherigen Auflagen auch, ist die Zeichensetzung in Zeilen mit Formeln sparsam gehalten. Kommas treten nach isoliert gedruckten Formeln überhaupt nicht auf, denn der Zeilenumbruch genügt als Trennungssymbol. Formeln, die durch einen Doppelpunkt eingeleitet werden, enthalten keinerlei abschließende Zeichen. Die Lösungen zu den Übungsaufgaben sind unverändert geblieben und stehen auf meiner Webseite und auf der des Verlages kostenlos zur Verfügung (Links dazu auf S. 314). Ich danke dem Walter de Gruyter Verlag und insbesondere meiner Lektorin Silke Hutt für allzeit sachkundige und reibungslose Zusammenarbeit und meiner Frau Christa-Luise für alles. Wolfgang Mückenheim

Über Mathematik und Wirklichkeit und dieses Buch Die Zahlen sind freie Schöpfungen des menschlichen Geistes, sie dienen als ein Mittel, um die Verschiedenheit der Dinge leichter und schärfer aufzufassen. (Richard Dedekind)

Mathematik dient dem Überblick, der Einteilung und Erkenntnis der Wirklichkeit. Zu diesem Zweck werden mathematische Objekte wie Zahlen, Figuren, Symbole oder Strukturen geschaffen, ihre Eigenschaften untersucht und in Aussagen zusammengefasst, die – mit den Mitteln der Logik bewiesen – zu Lehrsätzen werden. Dies alles geschieht in einer möglichst klaren Sprache. Zur Beschreibung der Bedeutung eines Wortes benötigt man aber andere, bereits bekannte Wörter. Um einen Circulus vitiosus zu vermeiden, ist ein Grundstock von Wörtern erforderlich, die nicht weiter sinnvoll hinterfragt werden können. Aussagen, die nur solche grundlegenden Wörter enthalten und so evident erscheinen, dass sie keines Beweises bedürfen, wurden bereits von Euklid in die Geometrie der Antike eingeführt und als Axiome bezeichnet. Es ist eine strittige Frage, ob die Mathematik eine Naturwissenschaft ist. An deutschen und englischsprachigen Hochschulen findet man mathematisch-naturwissenschaftliche Fakultäten, was den engen Zusammenhang zwischen beiden dokumentiert. Andererseits ist aus moderner Sichtweise die Wahl eines Axiomensystems nicht mehr an der Wirklichkeit orientiert, sondern vollkommen willkürlich, solange das System keine erkennbaren Widersprüche zulässt und umfangreich genug erscheint, die mathematisch als richtig erkannten Sätze zu beweisen. Aus dieser letzten Bemerkung erhellt allerdings bereits, dass es nicht das Axiomensystem ist, welches über die Richtigkeit mathematischer Sätze entscheidet, sondern dass die Wirklichkeit darüber entscheidet, ob ein Axiomensystem akzeptabel ist oder nicht. Da moderne Axiomensysteme leider zu mancherlei wirklichkeitsfernen Konsequenzen führen, sollte eine wirklichkeitsnahe Mathematik aus den Grundlagen entwickelt werden, aus denen sie tatsächlich entstanden ist, nämlich aus dem Zählen von Einheiten und dem Zeichnen von Linien. Denn die Mathematik verdankt ihre Entstehung der Abstraktion aus Beobachtungen der Wirklichkeit. Eine Aussage wie „I + I = II“ muss nicht aus einem über viele Seiten sich hinziehenden Beweise hergeleitet werden. Diese Aussage selbst ist eine viel natürlichere Grundlage der Arithmetik als irgendein dazu erdachtes Axiom. Sie kann mit einem Abakus zwingender bewiesen werden als durch jede noch so tiefgründige Kette von logischen Schlüssen. Im Zuge ihrer Axiomatisierung wurde die Mathematik auf Georg Cantors Lehre von den transfiniten Zahlen aufgebaut, die er nach eigener Aussage entwickelte, um die von ihm vermuteten aktualen, d. h. vollendeten Unendlichkeiten in der Natur und jedem noch so kleinen, ausgedehnten Teil des Raumes beschreiben zu können [1]. Im Lichte moderner Naturerkenntnis ist aber klar geworden, dass die Wirklichkeit nichts enthält, worauf transfinite Zahlen angewandt werden könnten. Im geistigen Gesamt-

VIII | Über Mathematik und Wirklichkeit und dieses Buch bilde unseres Jahrhunderts wirkt das aktual Unendliche geradezu anachronistisch [2]. Die Endlichkeit des zugänglichen Universums führt aber auch zu der Erkenntnis, dass die Mathematik wie jede andere Wissenschaft gezwungen ist, mit endlichen Mitteln auszukommen. Doch ohne unendliche Mittel gibt es auch keine unendlichen Resultate. Eine Zahlenmenge besteht aus Zahlen, die in irgendeiner Weise voneinander unterscheidbar sein müssen, die also unterschiedliche Bezeichnungen erfordern. Eine Zahl kann durch einen Namen, durch eine Definition, durch eine Ziffernfolge oder durch andere Merkmale eindeutig bezeichnet und von allen übrigen Zahlen unterschieden werden. Ist die Anzahl aller Merkmale aber begrenzt, so gilt dies auch für die Menge der unterscheidbaren Elemente. Das Universum mit seinen 1080 Protonen und erst recht jeder zum Denken und Rechnen nutzbare Teilbereich besitzen eine endliche Informationsspeicherkapazität und beschränken so die Zahl der Unterscheidungsmerkmale aus rein materiellen Gründen. Können nur deutlich weniger als 10100 Informationseinheiten oder Ziffern gespeichert werden, so ist es ganz gewiss nicht möglich, 10100 Zahlen zu unterscheiden. Was aber nicht bezeichnet, nicht unterschieden und daher auch nicht gedacht werden kann, kann auch keine Zahl sein – Ungedachtes und niemals Denkbares gehört nicht zur Menge der Gedanken. Um hier einer müßigen Existenzdiskussion aus dem Wege zu gehen, kann wohl Konsens darüber vorausgesetzt werden, dass es unmöglich ist und für immer unmöglich bleiben wird, „Zahlen“, die nicht bezeichnet werden können, in irgendeiner Weise als Individuen zu verwenden. Sie gehören nicht zur Mathematik, sofern die Mathematik zur Wirklichkeit gehört. Die Endlichkeit aller Zahlenmengen impliziert aber nicht die Existenz einer größten Zahl, wie zuweilen fälschlich angenommen wird. Die Zahl 10100 und auch viel größere Zahlen wie 101000 können benannt und identifiziert werden, z. B. hier auf dem Papier oder im Bewusstsein der Leser.¹ Aber viele Zahlen, deren Darstellung 10100 verschiedene Ziffern erfordern würde, können nicht definiert und deshalb auch nicht 100 verwendet werden. Es ist unmöglich, von 1 bis 1010 zu zählen – unabhängig von der verfügbaren Zeit. Die Folge der natürlichen Zahlen kommt nicht makellos daher wie ein nicht endender ICE. Sie weist Lücken auf [3]. Und diese Lücken wachsen mit zunehmender Zahlengröße. Deswegen kann man nicht sinnvoll von einer aktual unendlichen Zahlenfolge sprechen, und im vorliegenden Buch wird auch nicht der Versuch gemacht, die Existenz von aktual unendlichen Mengen zu postulieren oder mit transfiniten Zahlen zu rechnen. Die wichtigen Sätze einer wirklichkeitsorientierten Mathematik können mit Hilfe von Experimenten – vor allem auf leistungsfähigen Rechenmaschinen – in guter Näherung nachgeprüft werden. Rechenmaschinen sind für den Mathematiker das, was Teleskope für den Astronomen sind. Sie bringen das Ent-

1 Man versteht diese ungewohnte Überlegung sofort am Beispiel eines Taschenrechners mit zehnstelliger Anzeige, der zwar Zahlen wie 1050 bearbeiten und anzeigen kann, eine Zahl wie 123 456 789 012 345 aber nicht.

Über Mathematik und Wirklichkeit und dieses Buch |

IX

fernte näher und erlauben eine Unterscheidung von Details, die ohne Hilfsmittel nicht gelingt. Zwar werden die Begriffe „unendliche Menge“ oder „Menge aller Zahlen mit einer bestimmten Eigenschaft“ in diesem Buch verwendet, doch sind darunter Mengen zu verstehen, die nicht aktual existieren, die nicht überschaubar und also in des Wortes eigentlicher Bedeutung unendlich sind. Im Gegensatz zu einer aktual unendlichen Menge kann die Anzahl der Elemente einer solchen potentiell unendlichen Menge weder bestimmt noch übertroffen werden, denn sie ist ja niemals vollendet. Zahlen sind freie Schöpfungen des menschlichen Geistes [4]. Deren Anzahl ist endlich und wird stets endlich sein. Eine Konstruktion existiert nicht, ehe sie gemacht wurde. Wenn etwas neu gemacht wurde, so ist es etwas Neues und nicht eine Auswahl aus einer vorher schon existierenden Kollektion [5]. Daher sind Zahlenmengen nicht fixiert. Die natürlichen Zahlen von heute sind nicht die natürlichen Zahlen von gestern [6]. Das Unendliche findet sich nirgends realisiert; es ist weder in der Natur vorhanden, noch als Grundlage in unserem verstandesmäßigen Denken zulässig – eine bemerkenswerte Harmonie zwischen Sein und Denken [7]. Mit der Endlichkeit einer jeden Menge ist auch die Menge aller Ziffern einer Zahl endlich. Die meistens stillschweigend angenommene Voraussetzung, dass jede reelle Zahl „beliebig genau“ approximierbar sei, gilt nicht uneingeschränkt – die Zahlenachse weist Lücken auf; die Stetigkeitsannahme, der Konvergenzbegriff und andere Grundpfeiler der Infinitesimalrechnung werden problematisch; schon der Zwischenwertsatz oder der Fundamentalsatz der Algebra „leiden Ausnahmen“. Das kann niemand ändern! Die Mathematik steht nicht außerhalb der Wirklichkeit. Es hilft wenig, die Existenz aktual unendlicher Mengen axiomatisch zu fordern und so die Vollständigkeit der reellen Zahlen zu „beweisen“. Damit behebt man den Mangel ebenso wenig, wie ein Kaufmann seine Bilanz durch Anhängen einiger Nullen aufbessern kann – wie Immanuel Kant in einem ähnlichen Zusammenhang feststellte [8]. Das wirklich zugängliche „Kontinuum“ besitzt eine körnige Struktur. Die Korngröße hängt von der verfügbaren Rechenkapazität ab. Dem mit einem Abakus allein ausgerüsteten Mathematiker stellt sie sich als 1 dar, denn ihm sind nur ganze Zahlen zugänglich. Glücklicherweise ist die Körnung in der Regel fein genug, um ohne nachteilige Auswirkungen zu bleiben. Ebenso wie die Quantisierung der Erdbahn für astronomische Probleme ohne jede Relevanz ist und die molekulare Struktur von Butter deren Portionierbarkeit nicht merklich beschränkt, wird die prinzipielle Unsicherheit von Zahlen ihren im Eingangszitat genannten Zweck nicht beeinträchtigen. In der Regel genügt schon die zehnstellige Genauigkeit des Taschenrechners oder die 100stellige Genauigkeit einfacher Rechenprogramme. Die Kenntnis von 10100 Stellen wird man äußerst selten anstreben und bei irrationalen Zahlen niemals erreichen [9]. Doch dieser Mangel ist allenfalls für die mathematische Grundlagenforschung von Bedeutung, und selbst dafür hat der Erfinder der Non-Standard-Analysis festgestellt: Unendliche Gesamtheiten existieren in keinem Sinne des Wortes, weder real noch ideell. Genauer gesagt, jede Erwähnung oder Behauptung unendlicher Gesamtheiten ist buchstäblich sinnlos. Trotzdem sollten wir weiterhin wie gewohnt Mathematik machen,

X | Über Mathematik und Wirklichkeit und dieses Buch d. h. wir sollten so tun als ob unendliche Gesamtheiten wirklich existierten [10]. Ohne also den Mangel aus unserem Bewusstsein zu verdrängen, können und dürfen wir zur Erkenntnis der Verschiedenheit der Dinge in der Wirklichkeit weiterhin so vorgehen, als gäbe es unendliche Mengen.

Inhalt Vorwort | V Über Mathematik und Wirklichkeit und dieses Buch | VII Teil I: Grundlagen 1

Logik | 3

2

Mengen | 8

3 3.1

Relationen | 15 Abbildungen | 17

Teil II: Arithmetik 4 4.1 4.2 4.3

Die natürlichen Zahlen | 25 Das Prinzip der vollständigen Induktion | 25 Der binomische Satz | 26 Primzahlen | 28

5 5.1 5.2 5.3 5.4 5.5 5.6

Erweiterungen der Zahlenmenge | 31 Die ganzen Zahlen | 31 Gruppe | 33 Die rationalen Zahlen | 34 Körper | 35 Die reellen Zahlen | 36 Die komplexen Zahlen | 38

Teil III: Elementare Geometrie 6

Ebene Geometrie | 45

7

Trigonometrie | 51

8 8.1 8.2 8.3 8.4

Vektoren | 55 Vektoraddition | 55 Skalarmultiplikation | 57 Einheitsvektor | 58 Skalarprodukt | 59

XII | Inhalt 8.5 8.6 8.7 8.8 9 9.1 9.2 9.3 9.4 9.5

Kreuzprodukt | 61 Parallelverschiebung | 63 Polarkoordinaten | 64 Vektorraum | 65 Geometrie des ℝ3 | 68 Geradengleichungen | 68 Abstand eines Punktes von einer Geraden | 70 Ebenengleichungen | 71 Reguläre Polyeder | 72 Orthonormalbasis | 73

Teil IV: Lineare Algebra 10 10.1 10.2 10.3

Lineare Gleichungssysteme | 81 Darstellung von linearen Gleichungssystemen | 83 Elementaroperationen | 84 Gaußsches Eliminationsverfahren | 85

11 11.1 11.2 11.3 11.4 11.5

Matrizen | 90 Addition und Multiplikation von Matrizen | 90 Die transponierte Matrix | 92 Elementarmatrizen | 93 Inversion von Matrizen | 94 Das Matrixinversionsverfahren | 96

12 12.1 12.2 12.3 12.4

Determinanten | 99 Sätze über Determinanten | 101 Berechnung von Determinanten | 103 Die adjungierte Matrix | 107 Die Cramersche Regel | 109

13 13.1 13.2 13.3 13.4

Transformationen mit Matrizen | 114 Drehungen | 115 Streckung und Spiegelungen | 117 Orthogonale Matrizen | 118 Lösungsmengen irregulärer linearer Gleichungssysteme | 121

14 14.1 14.2

Iterative Lösung von linearen Gleichungssystemen | 127 Das Verfahren nach Gauß und Seidel | 127 Stabilität | 128

Inhalt |

Teil V: Algebra und Geometrie 15 15.1 15.2

Polynome | 133 Geschlossene Lösungsverfahren | 137 Approximation der Nullstellen | 141

16 16.1 16.2

Zweidimensionale quadratische Formen | 144 Allgemeine Gleichungen zweiten Grades | 147 Eigenwerte und Eigenvektoren | 149

17 17.1 17.2 17.3 17.4 17.5 17.6

Die Kegelschnitte | 152 Die Ellipse | 152 Die Parabel | 158 Die Hyperbel | 160 Tangenten und Polaren der Kegelschnitte | 164 Vergleich der Kegelschnitte | 167 Begründung der Bezeichnung „Kegelschnitt“ | 168

18 18.1

Sphärische Geometrie | 175 Sphärische Trigonometrie | 178

Teil VI: Infinitesimalrechnung 19

Folgen | 183

20 20.1

Reihen | 191 Zur Dezimaldarstellung von Zahlen | 194

21

Stetige Funktionen | 197

22

Funktionenfolgen und Funktionenreihen | 200

Teil VII: Differentialrechnung 23 23.1 23.2

Der Differentialquotient | 207 Ableitungen einfacher Funktionen | 208 Ableitungsregeln | 210

24 24.1 24.2 24.3

Die Exponentialfunktion | 214 Der natürliche Logarithmus | 217 Grenzwerte | 218 Irrationalität der Basis der natürlichen Logarithmen | 219

XIII

XIV | Inhalt 24.4 24.5

Die allgemeine Potenz | 220 Logarithmisches Differenzieren | 221

25 25.1 25.2

Die Winkelfunktionen | 224 Die Kreisbogenfunktionen | 224 Die Hyperbelfunktionen | 226

26 26.1

Kurvendiskussion | 230 Beispiel einer Kurvendiskussion | 231

27 27.1 27.2 27.3

Approximation von Funktionen | 234 Der allgemeine binomische Satz | 234 Fourier-Analyse | 236 Die Taylor-Reihe | 239

28 28.1 28.2 28.3

Funktionen mehrerer Variablen | 245 Partielle Differentiation | 245 Das totale Differential | 247 Implizite Differentiation | 247

Teil VIII: Integralrechnung 29

Das Integral | 253

30 30.1 30.2 30.3 30.4 30.5 30.6

Integrationsmethoden | 257 Direkte Integration | 257 Integration mittels Substitution | 258 Partielle Integration | 259 Logarithmische Integration | 261 Partialbruchzerlegung | 262 Uneigentliche Integrale | 265

31

Kurvenlänge und Kurvenkrümmung | 268

32 32.1

Mehrfachintegrale | 270 Rotationskörper | 271

33 33.1 33.2 33.3

Integraltransformationen | 274 Beweis der Gleichungen für die Fourier-Koeffizienten | 274 Fourier-Transformation | 275 Etwas Funktionentheorie | 277

Inhalt |

33.4 33.5

Laplace-Transformation | 279 Rechenregeln für die Laplace-Transformation | 282

Teil IX: Vektoranalysis 34 34.1 34.2 34.3 34.4 34.5

Differentiation von Feldern | 289 Vektoralgebra | 289 Differentiation eines Vektorfeldes nach einem Skalar | 290 Räumliche Differentiation eines Feldes | 291 Mehrfache Differentiation eines Feldes | 294 Der Laplace-Operator in Polarkoordinaten | 294

35 35.1 35.2 35.3

Integralsätze | 299 Der Satz von Gauß | 299 Greensche Sätze | 302 Der Satz von Stokes | 302

Teil X: Differentialgleichungen 36 36.1 36.2 36.3 36.4

Gewöhnliche Differentialgleichungen | 307 Homogene lineare DGL mit konstanten Koeffizienten | 307 Lineare DGL mit Störfunktion | 309 Trennung der Variablen | 309 Lösen von DGL mit der Laplace-Transformation | 310

Literatur | 313 Stichwortverzeichnis | 315

XV

| Teil I: Grundlagen

1 Logik Um mathematische Sätze aufzustellen, macht und verknüpft man Aussagen. Diese können wahr (w) oder falsch (f ) sein, d. h. ihnen kann ein Wahrheitswert unabhängig vom persönlichen Standpunkt zugeordnet werden. Beispiele für mathematische Aussagen sind: – 1 ist kleiner als 2. (w) – Zu jeder natürlichen Zahl gibt es eine größere natürliche Zahl. (w) – Für drei Punkte gibt es immer eine Ebene, zu der sie gehören. (w) – 2 ist kleiner als 1. (f ) – Es gibt eine natürliche Zahl, die größer als jede andere ist. (f ) – Für drei Punkte gibt es immer eine Gerade, zu der sie gehören. (f ) Dagegen sind die folgenden Aussagen zwar zu begrüßen, aber nicht mathematisch: – Mathematischer Unterricht sollte stärker gefördert werden. – Es ist unangemessen, die Null als natürliche Zahl zu bezeichnen. Außerdem gibt es Aussageformen, deren Wahrheitswert erst nach Festlegung der Variablen entschieden werden kann: – 3n ist eine gerade Zahl. – m teilt n ohne Rest. Um auch bei der Beschreibung und Erklärung komplexerer Zusammenhänge von der oft unpräzisen Alltagssprache unabhängig zu sein, um Schreibarbeit zu sparen und vor allem um eine möglichst übersichtliche Darstellung zu gewinnen, hat man eine prägnante Symbolsprache geschaffen. Zum Verständnis mathematischer Texte muss man diese Symbole wie Vokabeln und Grammatik einer fremden Sprache lernen. Die Aussage ist kleiner als kann man mit den speziellen Definitionen H1 := , H2 := allgemeinen Definition „ q}¹. – Die Menge der komplexen Zahlen ist ℂ = {x + iy | x, y ∈ ℝ, i2 = −1}. Diese Mengen stehen in einem besonderen Verhältnis, einer besonderen Relation ℕ ⊂ ℤ ⊂ ℚ ⊂ ℝ ⊂ ℂ. Hier bedeutet ⊂ das Symbol der strikten Inklusion. A ⊂ B bzw. B ⊃ A besagt, dass alle Elemente der Menge A auch zur Menge B gehören und B außerdem noch mindestens ein weiteres Element enthält. A ist echte Untermenge (oder echte Teilmenge) von B, und B ist echte Obermenge von A, wenn (∀x : x ∈ A ⇒ x ∈ B) ∧ (∃x : x ∈ B ∧ x ∉ A).

Abb. 2.1: A ist echte Teilmenge von B.

Gilt nur die erste dieser beiden Aussagen, so spricht man von schwacher Inklusion. Jede Menge ist eine unechte Untermenge (oder unechte Teilmenge) ihrer selbst A ⊆ A.

1 Für die reelle Zahl x und jede beliebige rationale Zahl q gilt (mindestens und wie leicht ersichtlich auch höchstens, also) genau eine der drei Beziehungen: x < q oder x = q oder x > q. Diese Eigenschaft bezeichnet man als Trichotomie (vgl. Axiom (5.12)). Geometrisch bedeutet das: x liegt auf dem Zahlenstrahl.

10 | 2 Mengen Mit der schwachen Inklusion lässt sich Gleichheit definieren (A ⊆ B ∧ B ⊆ A) ⇔ (A = B). Weitere Beispiele für Mengen sind die Menge G der geraden Zahlen, die Menge K der Punkte des Einheitskreises um den Ursprung des kartesischen Koordinatensystems und die Menge S der Schnittpunkte dieses Einheitskreises mit den Achsen des Koordinatensystems: G = {. . . , −2, 0, 2, 4, . . . } = {x | x/2 ∈ ℤ} K = {(x, y) | x, y ∈ ℝ ∧ x2 + y2 = 1} S = {(x, y) | (x = 0 ∨ y = 0) ∧ (x2 + y2 = 1)} = {(1, 0), (0, 1), (−1, 0), (0, −1)} Außerdem definieren wir noch die zuweilen aus formalen Gründen nützliche leere Menge 0={} die kein Element enthält und daher Untermenge einer jeden Menge ist 0 ⊆ M. Die leere Menge kann auch folgendermaßen dargestellt werden: 0 = {x | x ≠ x} Der Definitionsbereich D umfasst alle betrachteten Mengen und ist daher auch Obermenge von allen 0, A, B, . . . , M, . . . , D ⊆ D. Durch Mengenoperationen können neue Mengen gebildet werden. Die Ergebnisse solcher Operationen können durch Verknüpfung logischer Aussagen oder mit Hilfe von Mengendiagrammen (man spricht auch von Euler- oder Venn-Diagrammen) ermittelt werden. In den Wahrheitstafeln in Abschn. 1 haben wir darauf geachtet, alle möglichen Kombinationen von Wahrheitswerten zu den Grundaussagen zu erfassen. Enthielt die Wahrheitstafel in einer Spalte nur Einsen, so war die in dieser Spalte geprüfte Aussage allgemeingültig. In den Mengendiagrammen müssen wir ebenso darauf achten, alle Kombinationen zu erfassen: Für jede betrachtete Menge M muss es Punkte im Diagramm geben, die zu M gehören, und solche, die nicht zu M gehören. Für die graphische Untersuchung allgemeiner Eigenschaften von zwei Mengen sind demnach die Anordnungen in den Abb. 2.1 und 2.2 ungeeignet, während die Anordnung in Abb. 2.3 sämtliche Zugehörigkeitskombinationen enthält: Es gibt Punkte, die nur zu A gehören, Punkte, die nur zu B gehören, Punkte, die zu beiden Mengen gehören, und Punkte, die zu keiner der beiden Mengen gehören.

2 Mengen | 11

Abb. 2.2: Zwei disjunkte Mengen.

Abb. 2.3: Alle Kombinationen sind vorhanden.

Der Durchschnitt (oder die Schnittmenge) der Mengen A und B A ∩ B = {x | x ∈ A ∧ x ∈ B} enthält alle Elemente x, die gleichermaßen zu beiden Mengen gehören. In Abb. 2.1 und 2.3 sind das alle Punkte der doppelt schraffierten Flächen. In Abb. 2.2 ist der Durchschnitt von A und B leer, enthält also keine Punkte. Solche Mengen nennt man disjunkt (unverbunden). Die Vereinigung der Mengen A und B A ∪ B = {x | x ∈ A ∨ x ∈ B} enthält alle Elemente x, die zu mindestens einer der beiden Mengen gehören. In Abb. 2.1 bis 2.3 sind das alle Punkte von mindestens einfach schraffierten Flächen. Die Differenz der Mengen A und B A \ B = {x | x ∈ A ∧ x ∉ B} enthält alle Elemente, die zu A aber nicht zu B gehören, also in Abb. 2.1 bis 2.3 die Punkte der ausschließlich waagrecht schraffierten Flächen. Die Differenz A \ B kann auch dann nicht negativ werden, wenn A echte Teilmenge von B ist. Dieser Fall ist in Abb. 2.1 dargestellt. Im Gegensatz zur arithmetischen Subtraktion wie 1 − 2 = −1 ergibt Mengensubtraktion minimal die leere Menge {1} \ {1, 2} = 0. Deswegen ist es zweckmäßig, nicht das arithmetische Subtraktionssymbol „−“ zu verwenden. Das Produkt der Mengen A und B ist die Menge aller geordneten Paare (a, b), wobei a aus A und b aus B stammt A ⊗ B = {(x, y) | x ∈ A ∧ y ∈ B}. Das Produkt der Mengen {a, b, c} und {1, 2} ist {a, b, c} ⊗ {1, 2} = {(a, 1), (b, 1), (c, 1), (a, 2), (b, 2), (c, 2)}. Die Elemente der Produktmenge sind Paare. Die Reihenfolge der Paare ist daher gleichgültig – nicht aber die der Partner! Paare wie (1, a) gehören nicht dazu; vgl. die kartesischen Koordinaten (x|y) und Abb. 2.4.

12 | 2 Mengen

Abb. 2.4: Die Mengen {a, b, c} und {1, 2} und ihr Produkt.

Das Produkt dreier Mengen A ⊗ B ⊗ C besteht aus geordneten Tripeln (a, b, c), wobei a ∈ A, b ∈ B, c ∈ C. Falls alle Faktoren identisch sind, z. B. alle gleich ℕ, so schreibt man anstelle von ℕ⊗ℕ⊗ℕ auch einfach ℕ3 ; dies ist die Menge aller Tripel natürlicher Zahlen. Die Anzahl der Faktoren eines Produktes ist nicht auf drei beschränkt. Zum Beispiel bezeichnet ℝn den n-dimensionalen euklidischen Raum, dessen Elemente die n-Tupel (x1 , x2 , x3 , . . . , xn ) sind: ℝn = {(x1 , x2 , x3 , . . . , xn ) | xk ∈ ℝ, 1 ≤ k ≤ n} Die Bildung von Durchschnitt und Vereinigung ist kommutativ, d. h. die Reihenfolge ist ohne Bedeutung: ∀A, B : A ∩ B = B ∩ A ∀A, B : A ∪ B = B ∪ A Dies geht aus der Kommutativität von Konjunktion und Disjunktion ebenso hervor wie aus der Tatsache, dass die Reihenfolge des Anbringens von Schraffuren für die fertige Zeichnung keine Rolle spielt. Differenz und Produkt sind dagegen nicht kommutativ: ∃A, B : A \ B ≠ B \ A ∃A, B : A ⊗ B ≠ B ⊗ A Vereinigung und Durchschnitt sind außerdem assoziativ, d. h. Klammern werden nicht benötigt, wenn nur Vereinigungen oder nur Durchschnitte gebildet werden: ∀A, B, C : (A ∪ B) ∪ C = A ∪ (B ∪ C) = A ∪ B ∪ C ∀A, B, C : (A ∩ B) ∩ C = A ∩ (B ∩ C) = A ∩ B ∩ C Aber im Allgemeinen gilt (A ∪ B) ∩ C ≠ A ∪ (B ∩ C). Die Distributivgesetze zur Auflösung von Klammern werden anhand der Abb. 2.5 und 2.6 ersichtlich: ∀A, B, C : A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C) ∀A, B, C : A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C)

(2.1) (2.2)

2 Mengen |

13

Abb. 2.5: Veranschaulichung von A ∪ (B ∩ C).

Abb. 2.6: Veranschaulichung von A ∩ (B ∪ C).

Das Komplement A∗ einer Menge A (bezüglich des Definitionsbereichs D) ist A∗ = {x | x ∈ D ∧ x ∉ A}. Offensichtlich gelten die Identitäten: A ∪ A∗ = D A ∩ A∗ = 0 A = A∗∗ Mit Hilfe der Komplementbildung beweist man die Sätze von de Morgan: (A ∪ B)∗ = A∗ ∩ B∗ ∗



(A ∩ B) = A ∪ B

D



(2.3) (2.4)

Abb. 2.7: Veranschaulichung der Sätze von de Morgan.

14 | 2 Mengen

Übungen 2.1 Seien A = {1, a, b, c} und B = {1, 2, 3, c}. Bilden Sie den Durchschnitt A ∩ B, die Vereinigung A ∪ B und die Differenz A \ B sowie B \ A. 2.2 Finden Sie ein Beispiel für (A ∪ B) ∩ C ≠ A ∪ (B ∩ C). 2.3 Für die nicht leere Menge M prüfe man durch logische Herleitung und mit Mengendiagrammen die Sätze: (a) M ∩ M = M (Idempotenzgesetz) (b) M ∪ M = M (Idempotenzgesetz) (c) M \ M = 0 (d) M ∩ 0 = 0 (e) M ∩ D = M (D ist neutrales Element der Schnittbildung) (f) M ∪ 0 = M (0 ist neutrales Element der Vereinigung) (g) M ∪ D = D (h) A ∩ (A ∪ B) = A (Absorptionsgesetz) (i) A ∪ (A ∩ B) = A (Absorptionsgesetz) 2.4 (a) (b) (c) (d) (e)

Vereinfachen Sie: A ∩ (B ∩ A) (A ∪ B) ∩ 0 (A ∩ B∗ ) ∪ (A∗ ∩ B) ∪ (A ∩ B) (A ∩ B∗ )∗ ∪ (A∗ ∩ B)∗ (((A ∩ (B ∪ C)) ∪ B) \ C) ∪ ((A ∪ B ∪ A∗ ) \ B)

[Hinweis: A \ B = A ∩ B∗ ]

2.5 Führt man in einer logischen Aussage die folgenden Ersetzungen bzw. ihre Umkehrungen durch: ⊆ → ⊇, ∪ → ∩ und M → M ∗ (einschließlich D → 0), so erhält man die duale Aussage. Beispiel: M ∪ D = D ist dual zu M ∗ ∩ 0 = 0. Bilden Sie die dualen Aussagen zu (a) A ∩ (B ∪ A) = A (b) M ∪ 0 = M (c) M ∪ M ∗ = D und prüfen Sie deren Gültigkeit. 2.6 A = {1, a} und B = {1, 2}. Bilden Sie das Produkt A ⊗ B sowie das Produkt B ⊗ A.

3 Relationen Jede Teilmenge R des Produktes zweier Mengen¹ A und B heißt zweistellige oder binäre Relation zwischen den Elementen von A und B (oder im kartesischen Produkt der Mengen A und B) R ⊆ A ⊗ B. Man schreibt (a, b) ∈ R oder kurz a ist äquivalent zu b unter R aRb. Zur vollständigen Angabe einer binären Relation gehören die beiden Mengen und die Teilmenge, so dass die Relation als geordnetes Tripel (A, B, R) aufgefasst werden kann. Einige Beispiele für Relationen sind: A=B=ℕ:

R1 = {(m, n) | m < n < 4} = {(1, 2), (1, 3), (2, 3)}

A=B=ℕ:

aber

(2, 1) ∉ R1

R2 = {(m, n) | m ≤ n} = {(1, 1), (1, 2), (2, 2), (1, 3), (2, 3), (3, 3), . . . }

A=B=ℝ: A = ℝ, B = ℕ :

R3 = {(x, y) | x + y = 1}

(s. Abb. 3.1)

2

R4 = {(x, y) | x − y = 0} = {. . . , (−√2, 2), (−1, 1), (1, 1), (√2, 2), . . . }

A=B=M:

R5 = {(x, x) | x ∈ M)} ⇒ (xR5 y ⇔ y = x)

A=B=M:

R6 = A ⊗ B

A=B=M:

R7 = 0

Eine binäre Relationen R ⊆ M ⊗ M zwischen den Elementen einer einzigen Menge M heißt auch binäre Relationen auf M. Sie kann folgende Eigenschaften besitzen: – ∀x ∈ M : xRx (Reflexivität) – ∀x, y ∈ M : xRy ⇒ yRx (Symmetrie) – ∀x, y, z ∈ M : (xRy ∧ yRz) ⇒ xRz (Transitivität) – ∀x, y ∈ M : xRy ⇒ ¬(yRx) (Asymmetrie) – ∀x, y ∈ M : (xRy ∧ yRx) ⇒ x = y (Antisymmetrie)

1 Eine Teilmenge des Produktes dreier Mengen ist entsprechend eine dreistellige oder ternäre Relation, z. B. die Menge der Abmessungen von Quadern (Länge, Breite, Höhe). Eine Relationen R zwischen n Mengen M1 , M2 , M3 , . . . , Mn heißt n-stellige Relation. Sie ist ein n + 1-Tupel (M1 , M2 , M3 , . . . , Mn , R).

16 | 3 Relationen

Abb. 3.1: Graph der Relation R3 = {(x, y) | x + y = 1}.

Eine binäre Relation heißt Äquivalenzrelation genau dann, wenn sie reflexiv, symmetrisch und transitiv ist. Beispiele für Äquivalenzrelationen sind: R8 = {(x, y) | x, y ∈ ℤ ∧ x − y ist ohne Rest durch 3 teilbar.} R9 = {(x, y) | x, y ∈ ℝ ∧ x = y} Eine Äquivalenzrelation R auf einer Menge M induziert eine Klasseneinteilung der Elemente von M in disjunkte² Äquivalenzklassen [x] = {y ∈ M | yRx}. Jedes Element y ∈ M gehört dann zu einer und nur zu einer Äquivalenzklasse. x heißt Repräsentant der Äquivalenzklasse [x]. Einige Beispiele für Äquivalenzklassen sind – alle ohne Rest durch 3 teilbaren Zahlen, – alle mit Rest 1 durch 3 teilbaren Zahlen, – alle mit Rest 2 durch 3 teilbaren Zahlen, – alle zur x-Achse parallelen Geraden, – alle Orte, deren Postleitzahl mit 8 endet. Eine Relation R auf M heißt strenge Ordnungsrelation genau dann, wenn sie transitiv und asymmetrisch ist. Beispiele für strenge Ordnungsrelationen sind: R10 = {(m, n) | m, n ∈ {1, 2, 3, 4} ∧ m < n} R11 = {(A, B) | A, B ∈ D ∧ A ⊂ B} Eine Relation R auf M heißt (partielle) Ordnungsrelation (auch Halbordnung) genau dann, wenn sie transitiv, antisymmetrisch und reflexiv ist. Beispiele dafür sind: R12 = {(m, n) | m, n ∈ {1, 2, 3, 4} ∧ m ≤ n} R13 = {(A, B) | A, B ∈ D ∧ A ⊆ B}

2 Der Durchschnitt zweier Äquivalenzklassen ist leer.

3.1 Abbildungen | 17

Eine Ordnungsrelation auf M heißt linear (auch vollständig), wenn für jedes Paar gilt ∀x, y ∈ M : xRy ∨ yRx. R10 und R12 geben Beispiele für lineare Ordnungen bzw. Halbordnungen. Ordnung und Halbordnung unterscheiden sich durch die Diagonalelemente (s. Abb. 3.2).

Abb. 3.2: Graphen der strengen Ordnungsrelation R10 (links) und der Ordnungsrelation (Halbordnung) R12 (rechts).

Ein Beispiel für eine nichtlineare Ordnungsrelation: Sei M = {1, 2}, dann ist die Menge P(M) = {0, {1}, {2}, {1, 2}}

die Potenzmenge von M, d. h. die Menge aller Kombinationen von Elementen von M. Alle Untermengen von M, die leere Menge und M selbst eingeschlossen, sind die Elemente von P(M). Die Ordnungsrelation R14 = {(A, B) | A, B ∈ P({1, 2}) ∧ A ⊆ B} ist nicht linear, denn es gilt weder {1} ⊆ {2} noch {2} ⊆ {1}. Zur Darstellung von endlichen Ordnungsrelationen: Im Beispiel zeichne man die Obermenge B oberhalb von A und verbinde beide, falls keine Menge C ≠ A, C ≠ B existiert, so dass A ⊆ C und C ⊆ B.

3.1 Abbildungen Abbildungen (X, Y, f ) von X nach Y sind spezielle Relationen, die auch als f :X→Y notiert werden. Hier bedeutet f eine Abbildungsvorschrift, die als Gleichung oder in Form einer Liste oder eines Diagramms gegeben sein kann. X heißt Definitionsbereich (oder Urbildbereich), Y heißt Wertebereich oder Bildbereich und f (X) ⊆ Y heißt Wertevorrat oder Bildmenge oder kurz Bild (von X unter f ). Eine Abbildung von X nach Y ist

18 | 3 Relationen

Abb. 3.3: Graphen der Ordnungsrelationen R14 (links, nicht linear) und R12 (rechts, linear).

eine Teilmenge der Produktmenge X ⊗ Y. Für x ∈ X und y ∈ Y schreibt man anstelle von xRy oder (x, y) ∈ f x → y. x heißt Urbild und y = f (x) heißt Bild (von x unter f ), so dass die Abbildung auch geschrieben werden kann: x → f (x) Eine Relation (f , X, Y) ist eine Abbildung, wenn für jedes x ∈ X genau ein y ∈ Y mit y = f (x) existiert. Sie ist also „links total und rechts eindeutig“, formal ausgedrückt: ∀x ∈ X ∃y ∈ Y : y = f (x)

(3.1)

∀x ∈ X : (y1 = f (x) ∧ y2 = f (x)) ⇒ y1 = y2

(3.2)

Abbildungen von Zahlenmengen auf Zahlenmengen bezeichnet man meist als Funktionen. Alle Folgen und alle Funktionen sind also Abbildungen. Die Veranschaulichung einer Abbildung heißt Graph der Abbildung. Sie kann für endliche Mengen auf vielfältige Weise erfolgen, z. B. nach Abb. 3.4. Meistens wird das kartesische Koordinatensystem verwendet (vgl. Abb. 3.1).

Abb. 3.4: (a) Abbildung, (b) keine Abbildung.

3.1 Abbildungen | 19

Eine Abbildung f von X nach Y heißt – surjektiv (oder Abbildung auf Y), wenn jedes y ∈ Y ein Bild ist, – injektiv (oder eindeutig), wenn aus f (x1 ) = f (x2 ) folgt x1 = x2 , – bijektiv (oder eineindeutig), wenn f injektiv und surjektiv ist. Es folgen einige Beispiele, aus denen hervorgeht, dass die Kenntnis von Definitionsbereich X und Bildbereich Y entscheidend für die Beurteilung der Abbildungseigenschaften ist. Sei X = Y = ℝ: f (x) = 3 ist nicht surjektiv und nicht injektiv. f (x) = sin x ist nicht surjektiv und nicht injektiv. f (x) = x2 ist nicht surjektiv und nicht injektiv. f (x) = x3 ist bijektiv. f (x) = ±√|x| ist eine Relation, aber keine Funktion. Sei X = Y = [0, 1]: f (x) = x2 ist bijektiv. Sei X = Y = ℕ: f (x) = x + 1 ist injektiv, aber nicht surjektiv. {1 für x = 1 f (x) = { x − 1 sonst { f (x) = x ist bijektiv.

ist surjektiv aber nicht injektiv.

Sei X = Y = ℤ: f (x) = x + 1 ist bijektiv. Für eine bijektive Abbildung kann die Umkehrabbildung definiert werden: Sei f : X → Y bijektiv, dann ist g : Y → X mit g = f −1 = {(y, x) | (x, y) ∈ f } die inverse Abbildung oder Umkehrabbildung von f . Die Verknüpfungen g(f (X)) = g(Y) = X und f (g(Y)) = f (X) = Y liefern identische Abbildungen: id : X → X id : Y → Y Eine lineare Abbildung f ist eine Abbildung mit den Eigenschaften f (x1 + x2 ) = f (x1 ) + f (x2 ) f (α ⋅ x) = α ⋅ f (x)

(3.3) (3.4)

20 | 3 Relationen für jede reelle Zahl α . (3.3) und (3.4) kann man mit α , β ∈ ℝ auch zusammenfassen als f (α ⋅ x1 + β ⋅ x2 ) = α ⋅ f (x1 ) + β ⋅ f (x2 ).

(3.5)

Aus (3.4) folgt insbesondere mit α = 0, dass für eine lineare Abbildung stets gilt f (0) = 0.

(3.4󸀠 )

Eine Abbildung mit der Eigenschaft (3.3) heißt auch Homomorphismus. Eine bijektive lineare Abbildung nennt man auch Isomorphismus. Beispiel: f (x) = k ⋅ x mit k ∈ ℝ ist linear, da f (x1 + x2 ) = k ⋅ (x1 + x2 ) = k ⋅ x1 + k ⋅ x2 = f (x1 ) + f (x2 ) f (α ⋅ x) = k ⋅ (α ⋅ x) = α ⋅ k ⋅ x = α ⋅ f (x). Beispiel: f (x) = x + 1 ist nicht linear, da f (x1 + x2 ) = (x1 + x2 ) + 1 ≠ x1 + 1 + x2 + 1 = f (x1 ) + f (x2 ) f (0) = 0 + 1 ≠ 0. Die Aktion „zu jeder Pizza gibt es einen Salat“ ist eine lineare Abbildung der Form f (x) = k⋅x. „Zu jeder Bestellung gibt es einen Salat“ (auch wenn die Bestellung mehrere Pizzas umfasst) ist dagegen nicht linear.

Übungen 3.1 Welche Eigenschaften besitzen die folgenden Relationen? (a) {(x, y) | x, y ∈ {Menschen} ∧ x ist älter als y} (b) {(x, y) | x, y ∈ {Menschen} ∧ x ist Bruder von y} (c) {(x, y) | x, y ∈ {Menschen} ∧ x ist Bruder oder Schwester von y} (d) {(x, y) | x, y ∈ {Menschen} ∧ x ist Mutter von y} (e) {(x, y) | x, y ∈ {Menschen} ∧ x ist Tochter von y} (f) {(x, y) | x, y ∈ {Menschen} ∧ x ist Onkel von y} (g) {(x, y) | x, y ∈ {Menschen} ∧ x ist Nachkomme von y} (h) {(x, y) | x, y ∈ {Städte} ∧ x ist mindestens 100 km entfernt von y} (i) {(x, y) | x, y ∈ {Städte} ∧ x ist eine Stunde Weges entfernt von y} (j) {(x, y) | x, y ∈ {Geraden} ∧ x ist parallel zu y} (k) {(x, y) | x, y ∈ {Geraden} ∧ x ist senkrecht zu y} (l) {(x, y) | x, y ∈ ℕ ∧ x ⋅ y ist ungerade} (m) {(x, y) | x, y ∈ ℕ ∧ x teilt y} 3.2 Zu welchen Klassen (Äquivalenzrelation, Ordnungsrelationen) gehören die folgenden Relationen?

3.1 Abbildungen | 21

(a) (b) (c) (d) (e) (f)

x besitzt dieselbe Größe (Farbe, Dichte, Ladung, . . . ) wie y. x>y x≥y x=y x + y = −2 x=2

3.3 Zeichnen Sie die Relationsgraphen für die Übungen 3.2 (b) bis (f). 3.4 (a) (b) (c) (d)

Geben Sie jeweils ein Beispiel für folgende Relationen an: Eine Äquivalenzrelation, die ebenfalls partielle Ordnungsrelation ist. Eine Äquivalenzrelation, die nicht partielle Ordnungsrelation ist. Eine partielle Ordnungsrelation, die nicht Äquivalenzrelation ist. Eine Relation, die weder Äquivalenzrelation noch partielle Ordnungsrelation ist.

3.5 Prüfen Sie die folgenden Abbildungen auf Linearität: (a) f (x) = 2x (b) f (x) = 2x + 1 (c) f (x) = x2 (d) f (x) = |x| Für weitere Übungen zur Linearität siehe Übung 13.8 und 13.9.

| Teil II: Arithmetik

4 Die natürlichen Zahlen Die Menge der natürlichen Zahlen ℕ = {1, 2, 3, . . . } wird durch die folgenden Axiome definiert: 1∈M

(4.1)

n ∈ M ⇒ (n + 1) ∈ M

(4.2)

Erfüllt M (4.1) und (4.2), so gilt ℕ ⊆ M.

(4.3)

Diese Menge ist potentiell unendlich, das heißt, zu jeder natürlichen Zahl n kann eine größere natürliche Zahl gefunden werden. Und von jedem mathematischen Objekt kann im Prinzip entschieden werden, ob es eine natürliche Zahl ist oder nicht. Schon mit Hilfe der Axiome (4.1) und (4.2) allein können die natürlichen Zahlen sofort gebildet werden: 1 ∈ ℕ ⇒ 1 + 1 = 2 ∈ ℕ ⇒ 2 + 1 = 3 ∈ ℕ usw. Aber die Menge der ganzen Zahlen oder die Menge der reellen Zahlen erfüllen diese Axiome ebenfalls. Für die Einschränkung auf die natürlichen Zahlen ist die Bedingung (4.3) erforderlich, dass ℕ Untermenge einer jeden so gebildeten Menge ist.¹

4.1 Das Prinzip der vollständigen Induktion Die Eigenschaft (4.2) der natürlichen Zahlen dient häufig als bequeme Beweistechnik für mathematische Sätze: Wenn aus der Richtigkeit einer Aussage für eine natürliche Zahl n stets die Richtigkeit der Aussage für die Zahl n + 1 folgt und wenn die Aussage für n = 1 richtig ist, so ist sie für jede natürliche Zahl richtig. Das Prinzip der vollständigen Induktion gliedert sich demnach in zwei Schritte: 1. Man beweist, dass die Behauptung für die Zahl n = 1 wahr ist.² 2. Aus der Wahrheit für n folgert man die Wahrheit für n + 1. Dass die Behauptung gilt, braucht dabei weder für n noch für n + 1 bewiesen zu werden, denn aus der Wahrheit für n = 1 folgt mit dem zweiten Schritt die Wahrheit für n = 2, daraus die für n = 3 usw.

1 ℕ ist also die kleinste der Mengen M, der Durchschnitt von allen. ℕ enthält nur die durch Addition von Einsen zur Eins darstellbaren Zahlen. 2 Anstelle von 1 kann man auch eine andere Zahl k wählen. Dann zeigt der Induktionsbeweis die Richtigkeit für jede Zahl n ≥ k. Zum Beispiel kann man den Induktionsbeweis für die Behauptung n3 > 1000 nur mit k = 11 oder größer beginnen.

26 | 4 Die natürlichen Zahlen Beispiel: Die Behauptung lautet n

1 + 2 + 3 + ⋅⋅⋅ + n = ∑ k = k=1

n(n + 1) . 2

(4.4)

Diese Behauptung kann man für beliebige natürliche Zahlen n nachrechnen und bestätigen. Ob sie aber wirklich immer gilt, wird selbst der leistungsfähigste Großrechner niemals auf diese Art herausfinden können. Hier hilft die vollständige Induktion. Im ersten Schritt zeigt man die Induktionsannahme für die Zahl n = 1 1

1= ∑k= k=1

1(1 + 1) 2 = = 1. 2 2

Nun nehmen wir die Wahrheit der Behauptung (4.4) für die natürliche Zahl n an, ohne n festzulegen, denn der Schluss von n auf (n + 1) soll ja für jede natürliche Zahl gelten. Addition von (n + 1) auf beiden Seiten von (4.4) liefert 1 + 2 + 3 + ⋅ ⋅ ⋅ + n + (n + 1) =

n(n + 1) + (n + 1). 2

Rechts kann der gemeinsame Faktor (n + 1) ausgeklammert werden: n + 1) 2 (n + 1)(n + 2) 1 + 2 + 3 + ⋅ ⋅ ⋅ + n + (n + 1) = 2

1 + 2 + 3 + ⋅ ⋅ ⋅ + n + (n + 1) = (n + 1) (

(4.5)

Der Vergleich von (4.4) und (4.5) zeigt, dass für (n + 1) dieselbe Formel gilt wie für n. Nennen wir nämlich (n + 1) jetzt m, so lautet (4.5) m

1 + 2 + 3 + ⋅⋅⋅ + m = ∑ k = k=1

m(m + 1) . 2

(4.4󸀠 )

Ist also (4.4) richtig, so ist sicher auch (4.4󸀠 ) und damit (4.5) richtig.

4.2 Der binomische Satz Die binomische Formel (a + b)2 = a2 + 2ab + b2 kann auch in der allgemeineren Form 2 2 2 (a + b)2 = ( ) a2 b0 + ( ) a1 b1 + ( ) a0 b2 0 1 2 mit den Binomialkoeffizienten ( 20 ) = 1, ( 21 ) = 2 und ( 22 ) = 1 geschrieben werden. Diese Form ist deswegen vorzuziehen, weil die Kenntnis der allgemeinen Formel die

4.2 Der binomische Satz

| 27

n n n n (a + b)n = ( ) an b0 + ( ) an−1 b1 + ( ) an−2 b2 + ⋅ ⋅ ⋅ + ( ) a0 bn 0 1 2 n

(4.6)

Berechnung eines jeden Binoms erlaubt:

n n (a + b)n = ∑ ( )an−k bk k k=0

(4.6󸀠 )

Satz. Die Binomialkoeffizienten sind n n! ( )= . k (n − k)! ⋅ k!

(4.7)

Dabei gilt die Vereinbarung, dass n! = 1 ⋅ 2 ⋅ 3 . . . n und 0! = 1. Für n ≠ 0 ≠ k kann (4.7) auch in der Form n n(n − 1)(n − 2) . . . (n − k + 1) ( )= k 1 ⋅ 2 ⋅ 3...k

(4.8)

geschrieben werden. Beweis. Um (4.7) durch vollständige Induktion zu beweisen, beginnen wir ausnahmsweise bereits mit 0. 0! Für n = 0 ist (a + b)0 = 1 = ( 00 ) a0 b0 = ( 00 ) = 0!⋅0! und allgemein ( 0n ) = ( nn ) = 1. Nun folgt der Induktionsschluss von n auf n + 1 für jedes beliebige positive k ≤ n. n ) Aus n Faktoren (a + b) ergeben sich nach (4.6󸀠 ) ( nk ) Terme der Form an−k bk und ( k−1 n−(k−1) k−1 n+1−k k−1 Terme der Form a b =a b : n n ) an+1−k bk−1 + ( ) an−k bk + . . . k−1 k

(a + b)n = ⋅ ⋅ ⋅ + (

Nur diese Terme können bei Multiplikation von (a + b)n mit einem weiteren, (n + 1)ten Faktor der Form (a + b) zu an+1−k bk führen, da b ⋅ an+1−k bk−1 = an+1−k bk

und

a ⋅ an−k bk = an+1−k bk .

Alle anderen Produkte aus (a + b) ⋅ (a + b)n ergeben davon verschiedene Exponenten. Infolgedessen liefert unser Schluss n+1 n n )=( ) + ( ). k k−1 k

(

(4.9)

28 | 4 Die natürlichen Zahlen Dieses Bildungsgesetz folgt aus (4.7) auch über Äquivalenzumformungen n n n! n! )+( )= + k−1 k (n − (k − 1))! ⋅ (k − 1)! (n − k)! ⋅ k!

(

n! n! ⋅ k + (n − (k − 1))! ⋅ k! (n − k)! ⋅ k! n! ⋅ k n! ⋅ (n + 1 − k) = + (n + 1 − k)! ⋅ k! (n + 1 − k)! ⋅ k! n! ⋅ (n + 1) = (n + 1 − k)! ⋅ k! (n + 1)! = (n + 1 − k)! ⋅ k! =

n+1 ) k

=(

womit unser Induktionsschluss fertig ist. Wegen (4.9) lassen sich die Binomialkoeffizienten mit Hilfe des Pascalschen Zahlendreiecks auffinden, in dem jede Zahl die Summe der rechts und links über ihr stehenden Zahlen ist. n=0 n=1 n=2 n=3 n=4 n=5

1 1 1 1 1 1

1 2

3 4

5

1 3

6 10

1 4

10

1 5

1

Die Schenkel des Dreiecks werden von ( 0n ) = 1 und ( nn ) = 1 gebildet. Parallel dazu n ) = n. verlaufen die Folgen ( 1n ) = n und ( n−1 Die Summe der Binomialkoeffizienten ( nk ) in Zeile n ist n n ∑ ( ) = 2n k k=0

denn (a + b)n liefert genau 2n Produkte.

4.3 Primzahlen Eine natürliche Zahl, die sich ohne Rest nur durch 1 und durch sich selbst teilen lässt, heißt Primzahl. Die einzige Ausnahme ist die 1 selbst, die man aus Gründen der Eindeutigkeit der Primfaktorzerlegung nicht zu den Primzahlen zählt. Die einzige gerade Primzahl ist 2, da jede gerade Zahl per Definition durch 2 teilbar ist.

4.3 Primzahlen

| 29

Satz (Fundamentalsatz der Zahlentheorie). Jede natürliche Zahl besitzt eine bis auf die Reihenfolge eindeutige Primfaktorzerlegung. Beweis (nach Zermelo). Ist die natürliche Zahl eine Primzahl, dann ist sie selbst der einzige und damit eindeutige Primfaktor. Andernfalls ist sie aus mehreren Faktoren zusammengesetzt. Die kleinen zusammengesetzten natürlichen Zahlen wie 4 = 2⋅2 und 6 = 3⋅2 besitzen eindeutige Zerlegungen. Sei p⋅P =q⋅Q mit den Primfaktoren p und q die kleinste Zahl, die mehr als eine Zerlegung besitzt. Gleiche Faktoren sind in p ⋅ P und q ⋅ Q nicht vorhanden, sonst könnte gekürzt und eine kleinere mehrdeutige Zerlegung erzeugt werden. Ohne Beschränkung der Allgemeingültigkeit (oBdA) sei p > q, und also Q > P. Wir bilden (p − q) ⋅ P = p ⋅ P − q ⋅ P = q ⋅ Q − q ⋅ P = q ⋅ (Q − P) < q ⋅ Q. (p − q) enthält nicht den Faktor q, da p und q Primzahlen sind und (p − q) = n ⋅ q sofort auf p = (n + 1) ⋅ q führen würde. Also gibt es eine kleinere als die als kleinste angenommene mehrdeutige Zerlegung, nämlich (p − q) ⋅ P = q ⋅ (Q − P). Dies steht im Widerspruch zur Annahme. Satz (Primzahlsatz von Euklid). Es gibt unendlich viele Primzahlen. Beweis. Der Beweis erfolgt ebenfalls durch Widerspruch. Man nimmt an, dass es nur eine endliche Menge Π = {p1 , p2 , p3 , . . . , pn } von Primzahlen gibt. Bildet man das Produkt P aller Primzahlen aus Π und addiert 1 P = p1 ⋅ p2 ⋅ p3 ⋅ ⋅ ⋅ pn + 1 so ist die Zahl P durch keine der Primzahlen aus Π ohne Rest teilbar (der Rest beträgt immer 1). Folglich ist P eine Primzahl oder teilbar nur durch Primzahlen, die in der Menge Π nicht enthalten sind. Ist n eine Primzahl, so sind alle inneren Binomialkoeffizienten (d. h. alle mit Ausnahme von ( 0n ) und ( nn )) Vielfache von n, denn im Zähler von (4.8) kann die Primzahl n nicht weggekürzt werden, bevor sie selbst im Nenner auftritt. Daraus ergibt sich eine spezielle Version des sogenannten kleinen Fermatschen Satzes: Satz. Ist p eine ungerade Primzahl, so ist 2p−1 − 1 = k ⋅ p ein ganzzahliges Vielfaches von p. Beweis. p p p )+1 2p = (1 + 1)p = 1 + ( ) + ( ) + ⋅ ⋅ ⋅ + ( 1 2 p−1

30 | 4 Die natürlichen Zahlen Alle Binomialkoeffizienten einer ungeraden Zahl sind doppelt vorhanden, jeder innere ist durch p teilbar, d. h. 2p = 2 ⋅ k ⋅ p + 2 und 2p−1 = k ⋅ p + 1. Beispiele: 23−1 = 4 = 1 ⋅ 3 + 1, 25−1 = 16 = 3 ⋅ 5 + 1, 27−1 = 64 = 9 ⋅ 7 + 1

Übungen 49 4.1 Man berechne die Binomialkoeffizienten ( 32 ), ( 75 ), ( 10 8 ), ( 6 ).

4.2 Man beweise die Bernoullische Ungleichung: (1 + x)n ≥ 1 + n ⋅ x für x ≥ 0 und n∈ℕ (a) mit Hilfe des binomischen Satzes, (b) durch vollständige Induktion. 4.3 Man beweise die folgenden Formeln für jedes n ∈ ℕ mit vollständiger Induktion: n

(a) ∑ k2 = k=1

n(n + 1)(2n + 1) 6

n

(b) ∑ k3 = [ k=1 n

(c) ∑ qk−1 = k=1

n(n + 1) ] 2

2

1 − qn ; q ≠ 1 1−q

4.4 Man beweise, dass √3 keine rationale Zahl ist. [Hinweis: Es wäre sonst 3 = p2 /q2 .] 4.5 Man beweise: Sind p und q ≠ 1 teilerfremd, so ist pn /q mit n ∈ ℕ keine ganze Zahl. 4.6 Ist 210 − 1 durch 11 teilbar?

5 Erweiterungen der Zahlenmenge Die natürlichen Zahlen sind zwar abgeschlossen unter Addition und Multiplikation, denn für n, m ∈ ℕ ist (n + m) ∈ ℕ und (n ⋅ m) ∈ ℕ. Dagegen ist n − m und n/m nicht immer eine natürliche Zahl. Die Umkehrung der direkt ausführbaren Operationen ist nicht immer möglich. Um das Ergebnis jeder Subtraktion und jeder Division angeben zu können, muss das Zahlensystem erweitert werden.

5.1 Die ganzen Zahlen Die Erweiterung zu den ganzen Zahlen geschah im 13. Jahrhundert, im Zeitalter des aufblühenden Bankwesens, durch Leonardo von Pisa über die Interpretation von negativen Zahlen als Schulden ℤ = {. . . , −3, −2, −1, 0, 1, 2, 3, . . . }. Die ganzen Zahlen können als Äquivalenzklassen von Paaren aus natürlichen Zahlen, n1 , n2 ∈ ℕ, definiert werden. Beispiele: 2 ≡ [(1, 3)] = {(n1 , n2 ) | n2 − n1 = 2} = {(1, 3), (2, 4), (3, 5), . . . } 0 ≡ [(1, 1)] = {(n1 , n2 ) | n2 = n1 }

= {(1, 1), (2, 2), (3, 3), . . . }

(−1) ≡ [(2, 1)] = {(n1 , n2 ) | n1 − n2 = 1} = {(2, 1), (3, 2), (4, 3), . . . } (−2) ≡ [(3, 1)] = {(n1 , n2 ) | n1 − n2 = 2} = {(3, 1), (4, 2), (5, 3), . . . } Auf der Menge der ganzen Zahlen können wiederum Äquivalenzklassen mit Hilfe des Divisionsalgorithmus gebildet werden. So wie die Multiplikation lediglich eine Abkürzung für wiederholte Addition ist, m = q ⋅ n ⇒ m = q + q + q + . . . + q (n mal) so ist die Division eine Abkürzung für wiederholte Subtraktion q = m/n ⇒ 0 = m − q − q − q − . . . − q

(n mal).

Wenn eine Division in den ganzen Zahlen nicht „aufgeht“, so gibt es zwei mögliche Auswege. Entweder geht man zu den rationalen Zahlen über, oder man begnügt sich mit der Angabe eines Restes, zum Beispiel 17/5 = 3 Rest 2. Dies führt auf die ergiebige Lehre von den Restklassen in der Zahlentheorie. In der Restklasse 2 modulo 5 fasst man diejenigen Zahlen zusammen, die wie 2, 7, 12, 17, . . . oder auch −3, −8, −13, . . . bei Division durch 5 den Rest 2 lassen. Man schreibt 17 ≡ 2 (mod 5), gesprochen „17 ist kongruent zu 2 modulo 5“, um damit auszudrücken, dass 17 − 2 durch den Modul 5 teilbar ist. Damit lassen sich so interessante Sätze formulieren wie der Satz von Wilson:

32 | 5 Erweiterungen der Zahlenmenge Satz. Ist p eine Primzahl, dann und nur dann gilt (p − 1)! ≡ −1 (mod p). Beispiele: 1 = (2 − 1)! ≡ −1 (mod 2) ≡ 1 (mod 2) 2 = (3 − 1)! ≡ −1 (mod 3) ≡ 2 (mod 3) 24 = (5 − 1)! ≡ −1 (mod 5) ≡ 4 (mod 5) Wir wollen hier aber lediglich die grundlegenden Gesetze darlegen, die später benötigt werden, z. B. für die Partialbruchzerlegung von Integranden zur Berechnung von Integralen. Die ganze Zahl m ist durch die ganze Zahl n > 0 teilbar, wenn es eine ganze Zahl q mit m = q ⋅ n gibt. n heißt Teiler oder Divisor des Dividenden m; q = m/n heißt Quotient. Das bedeutet nichts anderes, als dass nach dem n-fachen Abziehen des q von m nichts mehr übrig bleibt. Ist das Abziehen nicht restlos möglich, so bleibt in m=q⋅n+r ein Rest r mit 0 < r < n. Zwei ganze Zahlen m und n können einen oder mehrere gemeinsame Teiler besitzen. Ist g ihr größter gemeinsamer Teiler (ggT), dann gibt es zwei ganze Zahlen x0 und y0 , so dass g = x0 ⋅ m + y0 ⋅ n. Um dies zu sehen, betrachte man alle Linearkombinationen x ⋅ m + y ⋅ n mit ganzen Zahlen x und y, z. B. für m = 12 und n = 18 x ⋅ 12 + y ⋅ 18 = . . . , −18, −12, −6, 0, 6, 12, 18, 24, 30, ⋅ ⋅ ⋅ = (x ⋅ 2) ⋅ 6 + (y ⋅ 3) ⋅ 6. Ihre Werte unterscheiden sich um den ggT von 12 und 18, nämlich 6. Denn wir können die Linearkombinationen auch wie rechts geschehen anschreiben. Daraus wird ersichtlich, dass jedes Vielfache von 6 dargestellt werden kann. Aber für die kleineren gemeinsamen Teiler 2 und 3 kann nicht jedes Vielfache erzeugt werden; z. B. ist es unmöglich ungeradzahlige Vielfache von 3 zu erhalten. (x ⋅ 4) ⋅ 3 + (y ⋅ 6) ⋅ 3 liefert für jedes Paar x, y von ganzen Faktoren eine geradzahlige Linearkombination von 12 und 18. Der ggT von zwei ganzen Zahlen m und n ist also die Differenz in der Folge ihrer Linearkombinationen, und da die Null für x = y = 0 stets vorkommt, ist ggT gleichzeitig der kleinste positive Wert aller Linearkombinationen dieser beiden Zahlen m und n. Zwei Zahlen m und n heißen teilerfremd, wenn ihr ggT = 1 ist (insbesondere also, wenn die beiden Zahlen Primzahlen sind). In diesem Falle kann man durch Linearkombination jede ganze Zahl erhalten, z. B. für 5 und 12: x ⋅ 5 + y ⋅ 12 = . . . , 0 ⋅ 5 + 0 ⋅ 12, 5 ⋅ 5 − 2 ⋅ 12, −2 ⋅ 5 + 1 ⋅ 12, 3 ⋅ 5 − 1 ⋅ 12, . . . = ..., 0, 1, 2, 3, ...

5.2 Gruppe | 33

Für zwei teilerfremde Zahlen m und n gibt es also immer zwei ganze Zahlen x0 und y0 , so dass 1 = x0 ⋅ m + y0 ⋅ n. Die Abbildung Absolutbetrag bildet die ganze Zahl x auf die nicht negative Zahl |x| ab { x falls x ≥ 0 |x| = { −x falls x < 0 {

.

Die ganzen Zahlen bilden eine Gruppe (ℤ, +), denn mit der üblichen Addition erfüllen sie die Gruppenaxiome.

5.2 Gruppe Eine Gruppe (G, ∘) ist eine endliche oder unendliche Menge G zusammen mit einer Operation ∘ mit den folgenden Eigenschaften: G ist abgeschlossen bezüglich der Operation ∘ ∀a, b ∈ G : (a ∘ b) ∈ G.

(5.1)

∀a, b, c ∈ G : (a ∘ b) ∘ c = a ∘ (b ∘ c).

(5.2)

Die Operation ∘ ist assoziativ

In G existiert ein neutrales Element n (für alle Elemente dasselbe) ∃n ∈ G ∀a ∈ G : a ∘ n = a = n ∘ a.

(5.3)

Zu jedem Element a der Gruppe existiert ein Inverses a−1 ∀a ∈ G ∃a−1 ∈ G : a ∘ a−1 = n. Ist ∘ außerdem kommutativ ∀a, b ∈ G : a ∘ b = b ∘ a so heißt (G, ∘) eine abelsche Gruppe. Beispiele: (ℕ, +) ist keine Gruppe (denn es fehlen das Neutrale 0 und das Inverse −n). (ℤ, ⋅) ist keine Gruppe (denn es fehlt für |z| ≠ 1 das Inverse z−1 ). ({r ∈ ℝ | r ≥ 0}, +) ist keine Gruppe (denn es fehlt für r > 0 das Inverse −r). (ℝ, +) ist eine abelsche Gruppe. (ℝ, ⋅) ist keine Gruppe (denn es fehlt das Inverse zu 0). ({r ∈ ℝ | r > 0}, ⋅) ist eine abelsche Gruppe.

(5.4)

34 | 5 Erweiterungen der Zahlenmenge Es sei ℝ3 die Menge der dreikomponentigen Vektoren und + die Vektoraddition (s. S. 55 ff.). Dann ist (ℝ3 , +) eine abelsche Gruppe. Es sei M die Menge der umkehrbaren n×n-Matrizen und ∙ die Matrixmultiplikation (s. S. 90 ff.). Dann ist (M, ∙) eine nichtabelsche Gruppe. Es sei G = {0, 1} und die Verknüpfung ⊕ definiert durch die Liste: 0⊕0=0 0⊕1=1=1⊕0 1⊕1=0 Dann ist (G, ⊕) eine abelsche Gruppe. Es sei M eine beliebige Menge. F(M) sei definiert durch F(M) = {f | f : M → M ist bijektive lineare Abbildung} und ∘ sei die Verknüpfung von Abbildungen (g ∘ f )(M) = g(f (M)). Diese Verknüpfung ist assoziativ, und es existiert ein neutrales Element id : M → M. Wegen der Bijektivität existiert zu jedem f die Umkehrabbildung f −1 . (F(M), ∘) ist eine nichtabelsche Gruppe, nämlich die Gruppe der Transpositionen (Umstellungen) von M.

5.3 Die rationalen Zahlen Für das Rechnen im täglichen Leben ist das Verfahren der Teilung mit Rest weniger nützlich. Wenn sich zwei Personen einen Kuchen teilen wollen, so ist die Entscheidung, dass 1 nicht durch 2 teilbar ist und somit der jeder Person zustehende Anteil 0 ist, der Kuchen aber als Rest übrig bleibt und vertrocknet, zumindest unpraktisch. Natürlich wird der Kuchen möglichst gleichmäßig in zwei Teile zerlegt, die man Hälften nennt und mit Kuchen ⋅ 1/2 bezeichnet. Das Wort halb geht direkt auf die indogermanische Wurzel skel = schneiden, spalten zurück. Auch wenn die Teilung nicht immer unmittelbar durchführbar ist, so kann die Verwendung eines Bruches doch nützliche Erkenntnisse beinhalten. Mit Hilfe von aufgehenden Divisionen kann man kürzen und erkennen, dass 26 = 2/2 = 13 . Brüche las6/2 sen sich addieren und subtrahieren, indem durch Erweitern ein gemeinsamer Nenner erzeugt wird: a c a⋅d c⋅b a⋅d+c⋅b + = + = b d b⋅d d⋅b b⋅d

5.4 Körper |

35

Man kann Brüche miteinander multiplizieren und durch Brüche dividieren (mit dem Kehrwert des Divisors multiplizieren): a⋅c a c ⋅ = b d b⋅d a c a d / = ⋅ b d b c Schon im 14. Jahrhundert hat Nicole von Oresme mit Hilfe von Identitäten wie 43 = 82 sogar gebrochene Exponenten eingeführt 43/2 = 8. Lediglich bei negativen Zahlen ist eine gewisse Vorsicht angebracht, denn (−8) = (−2)3 = (−2)6/2 = √64 = 8 enthält offenbar einen Fehler. Grundsätzlich dürfen nur positive Zahlen mit gebrochenen Exponenten versehen werden. Mit Hilfe der Exponentialrechnung kann man die rationalen Zahlen als Dezimalzahlen (d) oder Binärzahlen (b) darstellen: Dezimal: 725d

= 7 ⋅ 102 + 2 ⋅ 101 + 5 ⋅ 100

0, 129d

= 0 ⋅ 100 + 1 ⋅ 10−1 + 2 ⋅ 10−2 + 9 ⋅ 10−3

0,333 . . .d = 0 ⋅ 100 + 3 ⋅ 10−1 + 3 ⋅ 10−2 + 3 ⋅ 10−3 + . . . Binär: 1101b

= 1 ⋅ 23 + 1 ⋅ 22 + 0 ⋅ 21 + 1 ⋅ 20 = 13d

11,01b

= 1 ⋅ 21 + 1 ⋅ 20 + 0 ⋅ 2−1 + 1 ⋅ 2−2 = 3, 25d

Jede andere positive Zahl außer 1 kann anstelle von 10 oder 2 ebenfalls als Basis dienen. Die Menge der Brüche ist die Menge ℚ der rationalen Zahlen. ℚ ist abgeschlossen unter Addition, Subtraktion, Multiplikation und Division (außer Division durch Null). Da jeder Bruch einen Zähler aus ℤ und einen Nenner aus ℕ besitzt, können die rationalen Zahlen auch als Äquivalenzklassen von Zahlenpaaren definiert werden. Sie bilden einen angeordneten Körper. Beispiele (mit z ∈ ℤ und n ∈ ℕ): 1/2 ≡ [(1, 2)] = {(z, n) | 2 ⋅ z = n} = {(1, 2), (2, 4), (3, 6), . . . } 0 ≡ [(0, 1)] = {(z, n) | z = 0}

= {(0, 1), (0, 2), (0, 3), . . . }

(−1/2) ≡ [(−1, 2)] = {(z, n) | 2 ⋅ z = −n} = {(−1, 2), (−2, 4), (−3, 6), . . . }

5.4 Körper Ein Körper (K, +, ⋅) ist eine endliche oder unendliche Menge K (mit mindestens zwei Elementen) zusammen mit zwei Verknüpfungen, die üblicherweise durch + und ⋅ ge-

36 | 5 Erweiterungen der Zahlenmenge kennzeichnet werden, so dass gilt: (K, +, ⋅) ist abgeschlossen unter Addition und Multiplikation.

(5.5)

+ und ⋅ sind assoziativ und kommutativ.

(5.6)

⋅ ist distributiv über +: ∀a, b, c ∈ K : a ⋅ (b + c) = a ⋅ b + a ⋅ c

(5.7)

Neutrales Element (+): ∃0 ∈ K ∀a ∈ K : a + 0 = a = 0 + a

(5.8)

Neutrales Element (⋅): ∃1 ∈ K ∀a ∈ K : 1 ⋅ a = a = a ⋅ 1

(5.9)

󸀠

󸀠

󸀠

Inverses (+): ∀a ∈ K ∃a ∈ K : a + a = 0 = a + a −1

Inverses (⋅): ∀a ∈ K \ {0} ∃a

−1

∈K :a⋅a

(5.10) −1

=1=a

⋅a

(5.11)

Dazu kommen die Axiome der Anordnung ∀a, b, c ∈ K: Es gilt genau eine der drei Aussagen: a < b, a = b, a > b

(5.12)

a 1 berechnen. (Die Determinante einer 1 × 1-Matrix, also einer reellen Zahl ist diese selbst.) Dazu streicht man die i-te Zeile und die j-te Spalte der Matrix und berechnet die Determinante der verbleibenden Untermatrix. Man erhält so eine Unterdeterminante Dij (n−1)-ter Ordnung. Multiplikation mit (−1)i+j ergibt die Adjunkte Aij = (−1)i+j Dij

(12.25)

des Matrixelementes aij . Nach dem Entwicklungssatz von Laplace ist die durch (12.21) definierte Determinante dann gegeben als D = ∑ aij Aij = ∑ aij Aij . j

(12.26)

i

Man sagt, die Determinante wird nach der i-ten Zeile bzw. der j-ten Spalte entwickelt. a a12 ), berechnet mit Hilfe Beispiel: (12.27) Die Determinante der 2 × 2-Matrix ( a11 21 a22 des Laplaceschen Entwicklungssatzes (hier nach der ersten Zeile entwickelt) D = a11 (−1)1+1 D11 + a12 (−1)1+2 D12 = a11 (−1)2 a22 + a12 (−1)3 a21 ist in Übereinstimmung mit (12.22). Kann man Aij nicht unmittelbar ausrechnen, weil die Ordnung der Unterdeterminante größer als n = 3 ist, so verfährt man mit der Unterdeterminante genauso wie mit der ursprünglichen Determinante D. Man entwickelt eine Determinante zweckmäßig nach der Zeile oder Spalte mit den meisten Nullen, denn für Koeffizienten aij = 0 braucht man die zugehörigen Adjunkten gar nicht zu berechnen. Nun bleibt noch zu zeigen, dass Definition (12.21) und damit die Laplace-Entwicklung der Determinante mit der ursprünglichen Definition (12.1–12.3) identisch ist. Beweis. Zu (12.1): Zum Beweis der Linearität in jeder Spalte betrachten wir alle Elemente einer Spalte als aus zwei Summanden der Form (α a + β b) bestehend und entwickeln die Determinante nach dieser Spalte. (Der Beweis für die Zeilen verläuft analog.) 󵄨󵄨α a + β b 󵄨󵄨 11 11 󵄨󵄨 󵄨󵄨󵄨α a21 + β b21 󵄨󵄨 󵄨󵄨 ... 󵄨󵄨 󵄨󵄨󵄨α an1 + β bn1

a1n 󵄨󵄨󵄨󵄨 󵄨 a2n 󵄨󵄨󵄨󵄨 󵄨 = ∑ (α ai1 + β bi1 )Ai1 = ∑ α ai1 Ai1 . . . 󵄨󵄨󵄨󵄨 i i 󵄨 ann 󵄨󵄨󵄨 󵄨󵄨 󵄨󵄨b 󵄨󵄨a 󵄨󵄨 11 󵄨󵄨󵄨 11 a12 . . . a1n 󵄨󵄨󵄨 󵄨󵄨 󵄨 󵄨󵄨a 󵄨󵄨b 󵄨󵄨 21 a22 . . . a2n 󵄨󵄨󵄨 = α ∑ ai1 Ai1 + β ∑ bi1 Ai1 = α ⋅ 󵄨󵄨 󵄨󵄨 + β ⋅ 󵄨󵄨󵄨 21 󵄨󵄨 . . . 󵄨󵄨󵄨 . . . . . . . . . . . . 󵄨󵄨󵄨 i i 󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨b 󵄨 n1 󵄨󵄨an1 an2 . . . ann 󵄨󵄨 a12 a22 ... an2

... ... ... ...

+ ∑ β bi1 Ai1 i

a12 a22 ... an2

... ... ... ...

a1n 󵄨󵄨󵄨󵄨 󵄨 a2n 󵄨󵄨󵄨󵄨 󵄨 . . . 󵄨󵄨󵄨󵄨 󵄨 ann 󵄨󵄨󵄨

106 | 12 Determinanten Zu (12.2): Vertauscht man zwei Reihen (d. h. zwei Zeilen oder zwei Spalten) miteinander, so ändert die Determinante ihr Vorzeichen. Jede Vertauschung bedeutet bei jedem Summanden in (12.21) eine Transposition mehr oder weniger. t wird zu t + 1 oder t − 1. Damit ändert sich das Vorzeichen der Permutation und ebenso der Faktor (−1)i+j in den Adjunkten, die in (12.26) verwendet werden. Um dies zu sehen, beginne man die Berechnung der Adjunkten in zwei nebeneinander liegenden vertauschten Zeilen nach dem Schema aus (12.22). Die Vertauschung von nicht nebeneinander liegenden Reihen lässt sich stets auf eine ungerade Anzahl von Transpositionen nebeneinander liegender Reihen zurückführen: Mit einer Transposition erreicht man (1, 2, 3) → (3, 2, 1) ebenso wie mit dreien (1, 2, 3) → (1, 3, 2) → (3, 1, 2) → (3, 2, 1). Zu (12.3): Die Determinante der Einheitsmatrix ist D(I) = 1. Für die Adjunkten aller Diagonalelemente (t = 0) ist der Vorfaktor nach Laplace (−1)i+j = (−1)2i = 1 und alle Diagonalelemente der Einheitsmatrix sind gleich 1. Die Laplace-Entwicklung ebenso wie (12.21) ergibt somit 1⋅1 ⋅ ⋅ ⋅ 1 = 1. Alle anderen Glieder enthalten den Faktor Null und verschwinden. Die Determinante mit den Eigenschaften (12.1–12.3) kann also nach (12.21) ebenso wie nach (12.26) berechnet werden. Beispiel: Berechnung der Determinante der Drehmatrix nach Sarrus 󵄨󵄨 󵄨 󵄨󵄨cos x − sin x 0󵄨󵄨󵄨 󵄨󵄨 󵄨 󵄨󵄨 sin x cos x 0󵄨󵄨󵄨 = cos x ⋅ cos x ⋅ 1 − 1 ⋅ sin x ⋅ (− sin x) = 1 󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨 0 1󵄨󵄨󵄨 󵄨󵄨 0 oder durch Laplace-Entwicklung nach der dritten Zeile (oder Spalte) D = 1 ⋅ (−1)3+3 ⋅ [cos2 x − (− sin2 x)] = 1. Beispiel: Gegeben sei die Determinante 󵄨󵄨 1 3 −4 0󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨 󵄨󵄨 7 2 5 2󵄨󵄨󵄨 󵄨󵄨 . D = 󵄨󵄨󵄨 󵄨 󵄨󵄨󵄨−2 1 1 0󵄨󵄨󵄨 󵄨󵄨 󵄨 󵄨󵄨 2 2 −1 0󵄨󵄨󵄨 Wenn wir nach der letzten Spalte entwickeln, so wird nur eine einzige Unterdeterminante benötigt 󵄨 󵄨󵄨 󵄨󵄨 1 3 −4󵄨󵄨󵄨 󵄨󵄨 󵄨󵄨 D24 = 󵄨󵄨󵄨−2 1 1 󵄨󵄨󵄨 . 󵄨 󵄨󵄨 󵄨󵄨 2 2 −1󵄨󵄨󵄨 󵄨 󵄨 Diese berechnen wir nach Sarrus oder entwickeln sie z. B. nach der ersten Zeile D24 = 1 ⋅ [1 ⋅ (−1) − 2 ⋅ 1] − 3 ⋅ [(−2) ⋅ (−1) − 2 ⋅ 1] + (−4) ⋅ [(−2) ⋅ 2 − 2 ⋅ 1] = (−3) − 0 + 24 = 21.

12.3 Die adjungierte Matrix |

107

Damit wird die Determinante D D = a24 A24 = a24 (−1)2+4 D24 = 2 ⋅ (−1)6 ⋅ 21 = 42. Diese Berechnung ist aber umständlich und verleitet zu Fehlern. Deswegen schauen wir die Untermatrix genauer an und denken daran, dass auch ihre Determinante durch die Elementaroperation Ri → Ri + α Rj (i ≠ j) nicht verändert wird. (R steht für Reihe, also Zeile oder Spalte. Es dürfen aber nur Zeilen durch Zeilen und Spalten durch Spalten ersetzt werden.) Die Zeilenoperation 󵄨󵄨󵄨 1 3 −4󵄨󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨 󵄨 Z3 → Z3 + Z2 ergibt 󵄨󵄨󵄨−2 1 1 󵄨󵄨󵄨 󵄨󵄨 󵄨 󵄨󵄨 0 3 0 󵄨󵄨󵄨 󵄨 󵄨 und bei Entwicklung nach der letzten Zeile ist dort nur das Element a32 ≠ 0. So kann D24 wesentlich leichter als vorher ausgerechnet werden D24 = 3 ⋅ (−1)3+2 ⋅ [1 ⋅ 1 − (−4) ⋅ (−2)] = 21. Natürlich könnte man den Reduktionsprozess auch noch weiter fortsetzen 󵄨󵄨󵄨−7 0 0󵄨󵄨󵄨 󵄨󵄨󵄨−7 0 −4󵄨󵄨󵄨 󵄨󵄨󵄨 1 0 −4󵄨󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨󵄨−2 0 1 󵄨󵄨󵄨 → 󵄨󵄨󵄨 0 0 1 󵄨󵄨󵄨 → 󵄨󵄨󵄨 0 0 1󵄨󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨 󵄨 󵄨󵄨 󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨 0 3 0󵄨󵄨󵄨 󵄨󵄨 0 3 0 󵄨󵄨󵄨 󵄨󵄨 0 3 0 󵄨󵄨󵄨 bis in jeder Reihe nur noch ein nicht verschwindendes Element steht, jedoch trägt dies meistens nicht wesentlich zur Übersichtlichkeit bei.

12.3 Die adjungierte Matrix Es sei A eine n × n-Matrix und Aij die Adjunkte zum Element aij , also die mit (−1)i+j multiplizierte Determinante Dij der Untermatrix, die sich bei Streichung der i-ten Zeile und der j-ten Spalte aus A ergibt. Da es n × n Adjunkte gibt, kann man daraus wieder eine Matrix bilden. Wir nennen die so gebildete Matrix  T . Ihre transponierte Form ( T )T =  nennen wir die zu A adjungierte Matrix. Satz. (12.28)

A ∙ Â = |A| ⋅ I

Beispiel: a A = ( 11 a21

a12 ) a22

A Â T = ( 11 A21

A12 ) A22

A Â = ( 11 A12

A21 ) A22

108 | 12 Determinanten mit A11 = a22 , A12 = −a21 , A21 = −a12 , A22 = a11 . a A + a12 A12 A ∙ Â = ( 11 11 a21 A11 + a22 A12 a a − a12 a21 = ( 11 22 a21 a22 − a22 a21

a11 A21 + a12 A22 ) a21 A21 + a22 A22 |A| −a11 a12 + a12 a11 )=( 0 −a21 a12 + a22 a11

0 ) = |A| ⋅ I |A|

Beweis. Das Matrixelement in der i-ten Zeile und der j-ten Spalte der Produktmatrix ist n (A ∙ A)̂ = ∑ a â ij

ik kj

k=1

wobei aik aus A und â kj aus A,̂ d. h. â kj = Ajk . Daher ist n

(A ∙ A)̂ ij = ∑ aik Ajk .

(12.29)

k=1

Falls j = i, so ist (12.29) die Laplace-Entwicklung der Determinante von A nach der i-ten Zeile, d. h. (A ∙ A)̂ ii = |A|. (12.30) Falls i ≠ j, so ist (12.29) die Entwicklung der Determinante einer Matrix mit den folgenden Zeilen a11 . . . . . . . . . . . . . . . a1n ........................ ai1 . . . . . . . . . . . . . . . . . . ain i-te Zeile ........................ (12.31) a(j−1)1 . . . . . . . . . . . . . . . a(j−1)n ai1 . . . . . . . . . . . . . . . . . . ain j-te Zeile a(j+1)1 . . . . . . . . . . . . . . . a(j+1)n ........................ an1 . . . . . . . . . . . . . . . . . . ann nach der j-ten Zeile. Bei Entwicklung nach der j-ten Zeile ergeben sich die Adjunkten Ajk (mit festem j) aus allen Zeilen außer der j-ten, die dann ja zu streichen ist. Bei der Entwicklung der Determinante nach Laplace (12.26) sind diese Adjunkten mit den Elementen ajk der j-ten Zeile zu multiplizieren. In (12.29) stehen an deren Stelle aber die Elemente der i-ten Zeile aik . Dies ist bei der Laplace-Entwicklung der Determinante der Matrix (12.31) der Fall. Deren i-te und j-te Zeile sind identisch, womit die Determinante verschwindet (A ∙ A)̂ ij = 0 für j ≠ i. (12.32) Zusammenfassung von (12.30) und (12.32) liefert (12.28). Korollar. (12.28󸀠 ) Die Matrix A ∙ Â ist diagonal, alle Diagonalelemente sind gleich |A| und alle Außerdiagonalelemente verschwinden, d. h. (A ∙ A)̂ ij = |A|δij .

12.4 Die Cramersche Regel |

109

12.4 Die Cramersche Regel Satz. (12.33) Die n × n-Matrix A ist umkehrbar ⇔ |A| ≠ 0. In diesem Falle gilt außerdem A−1 =

 . |A|

(12.34)

Beweis. (⇒): Wenn A umkehrbar ist, dann existiert A−1 mit A ∙ A−1 = I. Nach (12.20) ist dann |A| ⋅ |A−1 | = 1, woraus folgt |A| ≠ 0. (⇐): Sei |A| ≠ 0. Nach Satz (12.28) ist A∙ Â = |A|⋅I, und durch |A| ≠ 0 kann dividiert ̂ werden mit dem Ergebnis A ∙ (A/|A|) = I. Also ist A umkehrbar und die inverse Matrix ̂ ist A/|A|. Nun betrachten wir das lineare Gleichungssystem mit n Zeilen und n Unbekannten A∙X =B das mit Rang (A) = r = n genau eine Lösung besitzt X = A−1 ∙ B =

1 ̂ A ∙ B. |A|

Wie sieht diese Lösung aus? Mit  = (â ij ) und B = (bj ) ergibt sich xi =

1 n ∑ â b |A| j=1 ij j

und wegen â ij = Aji folgt xi =

1 n 1 n ∑ Aji bj = ∑b A . |A| j=1 |A| j=1 j ji

(12.35)

Die Summe (12.35) ist nach (12.26) eine Entwicklung der Determinante von A, wobei die Elemente aji der Entwicklungsspalte i durch die Elemente bj des Vektors B der Konstanten ersetzt wurden a11 a Bi = ( 21 ... an1

a12 a22 ... an2

... ... ... ...

a1(i−1) a2(i−1) ... an(i−1)

b1 b2 ... bn

a1(i+1) a2(i+1) ... an(i+1)

... ... ... ...

a1n a2n ). ... ann

Wir nennen diese modifizierte Matrix Bi . Damit erhalten wir eine einfache Möglichkeit, lineare Gleichungssysteme zu lösen. Satz (Cramersche Regel). Ist A regulär, dann ist die Lösung des linearen Gleichungssystems A ∙ X = B eindeutig, und zwar ist für 1 ≤ i ≤ n xi =

|Bi | . |A|

(12.36)

110 | 12 Determinanten Die Matrix Bi entsteht, indem die i-te Spalte von A durch den Spaltenvektor B ersetzt wird. Ist dabei mindestens eine Determinante |Bi | ≠ 0, so ist mindestens eine Unbekannte xi ≠ 0. Sind alle |Bi | = 0, so ist der Nullvektor die einzige Lösung. Beispiel: Das Gleichungssystem 1x1 + 2x2 = 3 4x1 + 5x2 = 6 mit |A| = −3, |B1 | = 3 und |B2 | = −6 besitzt die Lösung X = ( −1 2 ). Ist A singulär, also |A| = 0, aber mindestens ein |Bi | ≠ 0, so liefert (12.36) noch die Aussage, dass das Gleichungssystem keine Lösung besitzt. Beispiel: Das Gleichungssystem 1x1 + 0x2 = 0 1x1 + 0x2 = 1 mit |A| = 0, |B1 | = 0 und |B2 | = 1 besitzt keine Lösung. Für |A| = 0 und alle |Bi | = 0 sind verschiedene Fälle möglich: 0x1 + 0x2 = 0 0x1 + 0x2 = 0 x

besitzt unendlich viele Lösungen X = ( x12 ). 1x1 + 0x2 = 1 1x1 + 0x2 = 1 besitzt unendlich viele Lösungen X = ( x12 ). 0x1 + 0x2 = 1 0x1 + 0x2 = 1 besitzt keine Lösung.

Übungen 12.1 Zeigen Sie, dass die Laplace-Entwicklung für 3 × 3-Matrizen auf die Regel von Sarrus führt. 12.2 Lösen Sie das Gleichungssystem aus Übung 10.2 auf S. 89 mit der Cramerschen Regel.

12.4 Die Cramersche Regel |

111

12.3 Gegeben sind die Matrizen 968 A=( 255

0 413

4711 ) 146

a B = (0 0

und

0 0 1

6 3) a

mit a ≠ 0.

Bestimmen Sie die Determinanten von A, B und A∙B und berechnen Sie die Inversen – wo möglich. 12.4 Bestimmen Sie die Adjunkten A13 , A23 , A33 und A42 von 󵄨󵄨3 󵄨󵄨 󵄨󵄨 󵄨󵄨0 A = 󵄨󵄨󵄨 󵄨󵄨1 󵄨󵄨 󵄨󵄨3 󵄨

4 0 7 3

2 3 7 3

1󵄨󵄨󵄨󵄨 󵄨 4󵄨󵄨󵄨󵄨 󵄨. 6󵄨󵄨󵄨󵄨 󵄨 0󵄨󵄨󵄨

̂ 12.5 Bilden Sie die adjungierte Matrix  von A = ( 13 24 ). Berechnen Sie |A| und |A|. 12.6 Bilden Sie die adjungierte Matrix  von a A = (2 5

7 b 1

6 3) . c

̂ Berechnen Sie |A| und |A|. 12.7 Erklären Sie mit eigenen Worten die Begriffe: Untermatrix, Adjunkte, adjungierte Matrix, reguläre Matrix. 12.8 Erklären Sie die Umformungen: 󵄨 󵄨 󵄨 󵄨 󵄨 󵄨 󵄨󵄨 󵄨 󵄨2 3󵄨󵄨󵄨 󵄨󵄨󵄨4 6󵄨󵄨󵄨 󵄨󵄨󵄨4 1󵄨󵄨󵄨 󵄨󵄨󵄨0 5󵄨󵄨󵄨 󵄨󵄨 + 󵄨󵄨 󵄨󵄨 = 󵄨󵄨 󵄨󵄨 = 󵄨󵄨 󵄨󵄨 (a) 2 ⋅ 󵄨󵄨󵄨󵄨 󵄨󵄨3 4󵄨󵄨󵄨 󵄨󵄨󵄨3 4󵄨󵄨󵄨 󵄨󵄨󵄨3 4󵄨󵄨󵄨 󵄨󵄨󵄨3 4󵄨󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨󵄨4 3󵄨󵄨󵄨 󵄨󵄨󵄨4 6󵄨󵄨󵄨 󵄨󵄨󵄨7 10󵄨󵄨󵄨 󵄨󵄨󵄨1 2󵄨󵄨󵄨 󵄨󵄨 = 󵄨󵄨 󵄨󵄨 = 󵄨󵄨 󵄨󵄨 = 󵄨󵄨 󵄨󵄨 = − 󵄨󵄨󵄨3 4󵄨󵄨󵄨 = 󵄨󵄨󵄨4 3󵄨󵄨󵄨 (b) 2 ⋅ 󵄨󵄨󵄨󵄨 󵄨 󵄨󵄨 󵄨 󵄨󵄨 󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨 󵄨 󵄨 󵄨 󵄨󵄨3 2󵄨󵄨 󵄨󵄨3 4󵄨󵄨 󵄨󵄨3 4 󵄨󵄨 󵄨󵄨3 4󵄨󵄨 󵄨󵄨1 2󵄨󵄨 󵄨󵄨2 1󵄨󵄨󵄨 󵄨 󵄨 󵄨 󵄨 󵄨 󵄨󵄨 󵄨󵄨1 2 3󵄨󵄨󵄨 󵄨󵄨󵄨1 2 3󵄨󵄨󵄨 󵄨󵄨󵄨1 2 3󵄨󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨 (c) 󵄨󵄨󵄨4 5 6󵄨󵄨󵄨 = 󵄨󵄨󵄨2 1 0󵄨󵄨󵄨 = 󵄨󵄨󵄨2 1 0󵄨󵄨󵄨 = 0 󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨 󵄨󵄨7 8 9󵄨󵄨 󵄨󵄨4 2 0󵄨󵄨 󵄨󵄨0 0 0󵄨󵄨󵄨 󵄨 󵄨 󵄨 󵄨 󵄨 󵄨 󵄨 󵄨 󵄨 󵄨󵄨󵄨 󵄨󵄨󵄨1 0 󵄨󵄨󵄨1 2 3󵄨󵄨󵄨 󵄨󵄨󵄨1 2 3 0 󵄨󵄨󵄨 󵄨󵄨󵄨1 0 0 󵄨󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨 (d) 󵄨󵄨4 2 8󵄨󵄨 = 󵄨󵄨0 −6 −4󵄨󵄨 = 󵄨󵄨0 −6 −4󵄨󵄨󵄨 = 󵄨󵄨󵄨0 0 5 󵄨󵄨󵄨 󵄨 󵄨 󵄨 󵄨 󵄨 󵄨󵄨 󵄨 󵄨 󵄨󵄨3 4 6󵄨󵄨󵄨 󵄨󵄨󵄨0 −2 −3󵄨󵄨󵄨 󵄨󵄨󵄨0 −2 −3󵄨󵄨󵄨 󵄨󵄨󵄨0 −2 −3󵄨󵄨󵄨 󵄨 󵄨 󵄨 󵄨 󵄨 󵄨 󵄨 󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨1 0 0󵄨󵄨 󵄨󵄨1 0 0󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨 = 󵄨󵄨󵄨0 0 5󵄨󵄨󵄨 = − 󵄨󵄨󵄨0 −2 0󵄨󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨 󵄨󵄨󵄨0 0 5󵄨󵄨󵄨 󵄨󵄨󵄨0 −2 0󵄨󵄨󵄨

112 | 12 Determinanten 12.9 Berechnen Sie:

(a)

(c)

󵄨󵄨0 1 2 󵄨󵄨 󵄨󵄨 󵄨󵄨1 2 3 󵄨󵄨 󵄨󵄨2 3 4 󵄨󵄨 󵄨󵄨 󵄨󵄨3 4 5 󵄨󵄨 󵄨󵄨4 5 6 󵄨 󵄨󵄨 1 2 󵄨󵄨 󵄨󵄨 󵄨󵄨 10 20 󵄨󵄨 󵄨󵄨100 300 󵄨󵄨 󵄨󵄨 󵄨󵄨 2 3

4󵄨󵄨󵄨󵄨 󵄨 5󵄨󵄨󵄨󵄨 󵄨 6󵄨󵄨󵄨󵄨 󵄨 7󵄨󵄨󵄨󵄨 󵄨 8󵄨󵄨󵄨

3 4 5 6 7

3 30 200 7

󵄨󵄨 1 󵄨󵄨 󵄨󵄨 󵄨󵄨 10 󵄨󵄨 󵄨󵄨󵄨100 󵄨󵄨 󵄨󵄨 2 󵄨

(b)

2 20 300 3

3 30 300 6

4 󵄨󵄨󵄨󵄨 󵄨 50 󵄨󵄨󵄨󵄨 󵄨 500󵄨󵄨󵄨󵄨 󵄨 8 󵄨󵄨󵄨

4 󵄨󵄨󵄨󵄨 󵄨 50 󵄨󵄨󵄨󵄨 󵄨 600󵄨󵄨󵄨󵄨 󵄨 5 󵄨󵄨󵄨

Vor dem Rechnen genau hinsehen! [Hinweis: In (a) die Differenzen der Zeilen oder Spalten bilden. In (b) die erste Zeile zweimal von der letzten subtrahieren. Mit der sich ergebenden „Jokerzeile“ (0, −1, 0, 0) die übrigen Elemente in der zweiten Spalte eliminieren und die verbleibenden Teile der zweiten und dritten Zeile vergleichen. In (c) die überflüssigen Nullen beseitigen und die Summe der Zeilen 2 bis 4 mit der ersten Zeile vergleichen.] 12.10 Berechnen Sie:

(a)

󵄨󵄨1 󵄨󵄨 󵄨󵄨 󵄨󵄨1 󵄨󵄨 󵄨󵄨a 󵄨󵄨 󵄨󵄨 󵄨󵄨2

2 2 b 9

3 3 c 7

4󵄨󵄨󵄨󵄨 󵄨 5󵄨󵄨󵄨󵄨 󵄨 d󵄨󵄨󵄨󵄨 󵄨 8󵄨󵄨󵄨

(b)

󵄨󵄨3 󵄨󵄨 󵄨󵄨 󵄨󵄨0 󵄨󵄨 󵄨󵄨1 󵄨󵄨 󵄨󵄨 󵄨󵄨3

4 2 7 3

2 3 7 3

0󵄨󵄨󵄨󵄨 󵄨 4󵄨󵄨󵄨󵄨 󵄨 6󵄨󵄨󵄨󵄨 󵄨 0󵄨󵄨󵄨

12.11 Welche Lösungsmenge besitzt das folgende Gleichungssystem? 0x1 + 0x2 = 0 1x1 + 0x2 = 0 12.12 Berechnen Sie die zur Anwendung der Cramerschen Regel erforderlichen Determinanten und interpretieren Sie das Ergebnis. 0x1 + 0x2 = 3 1x1 + 0x2 = 0 12.13 Berechnen Sie die zur Anwendung der Cramerschen Regel erforderlichen Determinanten und interpretieren Sie das Ergebnis. 1 (−2 3

2 3 0

−1 2 −3

13 9) 9

12.4 Die Cramersche Regel |

12.14 (a) Berechnen Sie die Darstellung des Vektors 13 (19) −1

in der Basis

4 0 2 (4) , ( 2 ) , (0) . 2 −3 1

(b) Berechnen Sie nach Cramer die Lösung des Gleichungssystems 2 (4 1

0 2 −3

4 0 2

13 19) . −1

113

13 Transformationen mit Matrizen Manche geometrischen Probleme lassen sich leichter lösen, wenn man das Koordinatensystem „geeignet“ wählt, d. h. die Vektoren transformiert oder abbildet. Offensichtlich werden lineare Abbildungen durch Matrizen bewirkt. In diesem Abschnitt werden daher Transformationen mit Hilfe von Matrizen behandelt. Sei A eine m×n-Matrix und X eine n×1-Matrix, d. h. ein Vektor mit n Komponenten, so führt die Abbildung fA : ℝn → ℝm Y = fA (X) = A ∙ X auf einen Vektor Y mit m Komponenten. Die Umkehrabbildung ergibt sich mit Hilfe der inversen Matrix A−1 (falls diese existiert) A−1 ∙ Y = fA−1 (Y) = X. Wie wir bereits wissen, bewirkt In die identische Abbildung id : ℝn → ℝn . Gegeben sei die Matrix 2 0 ). M = 2 ⋅ I2 = ( 0 2 2a ) abgebildet. Die Matrix M Jeder Vektor ( ba ) ∈ ℝ2 wird durch diese Abbildung auf ( 2b vermittelt also eine Maßstabsstreckung um den Faktor 2. Der ℝ2 wird damit auf den ℝ2 abgebildet, fM : ℝ2 → ℝ2 . Offensichtlich ist diese Abbildung bijektiv (surjektiv und injektiv) und außerdem linear, also ein Isomorphismus. Die Umkehrabbildung wird durch

1/2 0

M −1 = (

0 ) 1/2

erzeugt. Gegeben sei nun die 2 × 3-Matrix 2 0

A=(

0 2

1 ). 1

Sie wird auf Dreiervektoren angewandt und liefert Zweiervektoren, vermittelt also eine lineare Abbildung fA : ℝ3 → ℝ2 a 2a + c ). A ∙ (b) = ( 2b + c c Diese Abbildung eines Raums auf eine Ebene ist wieder surjektiv, aber nicht mehr a+c/2

2a+c ) auch durch das Urbild ( b+c/2 ) erzeugt. injektiv. Zum Beispiel wird das Bild ( 2b+c 0

13.1 Drehungen |

115

Die Matrix 2 B = (0 1

0 2) 1

bildet eine Ebene in den Raum ab fB : ℝ2 → ℝ3 2a a B ∙ ( ) = ( 2b ) . b a+b Diese Abbildung ist injektiv, aber nicht surjektiv.

13.1 Drehungen Die entgegen dem Uhrzeigersinn um den Winkel φ um die Achse Z 0 = W 0 gedrehten Basisvektoren U 0 (φ ), V 0 (φ ), W 0 (φ ) besitzen in der gedrehten Basis B(φ ) = {U 0 , V 0 , W 0 } die kanonische Darstellung. In der festen Basis B = {X 0 , Y 0 , Z 0 } werden sie nach (9.16) ausgedrückt. Diese Abbildung von B(φ ) nach B = B(0) (vgl. Abb. 9.6) lässt sich mit Hilfe der Drehmatrix cos φ D = ( sin φ 0

− sin φ cos φ 0

0 0) 1

für die Rotation um die z-Achse durchführen: cos φ D ∙ U 0 = ( sin φ 0

− sin φ cos φ 0

0 1 cos φ 0) ∙ (0) = ( sin φ ) = U 0 (φ ) 1 0 0

cos φ D ∙ V = ( sin φ 0

− sin φ cos φ 0

− sin φ 0 0 0) ∙ (1) = ( cos φ ) = V 0 (φ ) 0 0 1

cos φ D ∙ W 0 = ( sin φ 0

− sin φ cos φ 0

0 0 0 0) ∙ (0) = (0) = W 0 (φ ) 1 1 1

0

Die Koordinaten eines in der gedrehten Basis B(φ ) festen Vektors u A = (v) w sind in B cos φ D ∙ A = ( sin φ 0

− sin φ cos φ 0

u cos φ − v sin φ u 0 0) ∙ ( v ) = (u sin φ + v cos φ ) = A(φ ). w w 1

(13.1)

116 | 13 Transformationen mit Matrizen Um den Übergang von B nach B(φ ) zu finden, benötigen wir die inverse Matrix D−1 . Nach dem bekannten Verfahren rechnen wir sie aus: D cos φ ( sin φ 0

I3

− sin φ cos φ 0

0 0) 1

1 (0 0

0 1 0

0 0) 1

Die erste Zeile mit cos φ und die zweite Zeile mit sin φ multiplizieren: cos2 φ ( sin2 φ 0

− sin φ cos φ cos φ sin φ 0

0 0) 1

cos φ ( 0 0

0 sin φ 0

0 0) 1

cos φ ( 0 0

sin φ sin φ 0

0 0) 1

Die zweite Zeile zur ersten addieren cos2 φ + sin2 φ ( sin2 φ 0

0 cos φ sin φ 0

0 0) 1

und berücksichtigen, dass cos2 φ + sin2 φ = 1. Dann die erste Zeile mit sin2 φ multipliziert von der zweiten subtrahieren 1 (0 0

0 cos φ sin φ 0

0 0) 1

cos φ (− cos φ sin2 φ 0

sin φ sin φ − sin3 φ 0

0 0) 1

und berücksichtigen, dass sin φ ⋅ (1 − sin2 φ ) = sin φ ⋅ cos2 φ . Dann die zweite Zeile durch cos φ ⋅ sin φ teilen: 1 (0 0

0 1 0

0 0) 1

cos φ (− sin φ 0

sin φ cos φ 0

0 0) 1

D−1

I3

Die inverse Matrix D−1 ergibt sich also in diesem Falle durch Spiegelung der ursprünglichen Matrix D an der Hauptdiagonale, d. h. durch Transposition: D−1 = DT . Solche Matrizen heißen orthogonale Matrizen. Denselben Effekt erhält man durch Umkehrung der Drehrichtung, d. h. durch Ersetzen von φ durch (−φ ) und damit von sin φ durch − sin(φ ) bei unverändertem Vorzeichen der Kosinusterme. Anstelle der Drehung um die z-Achse kann auch die Drehung um die x-Achse oder die y-Achse erreicht werden. Zur Unterscheidung gibt man Drehwinkel und Drehachse als Indizes an, neben der nun mit Dφ , z bezeichneten Drehmatrix aus (13.1) also noch 1 Dφ , x = (0 0

0 cos φ sin φ

0 − sin φ ) cos φ

und

cos φ Dφ , y = ( 0 − sin φ

0 1 0

sin φ 0 ). cos φ

(13.1󸀠 )

13.2 Streckung und Spiegelungen |

117

Alle Drehmatrizen besitzen die Determinante |Dφ , n | = 1. Sie lassen Winkel und Längen unverändert. Werden mehrere Drehungen um verschiedene Achsen hintereinander geschaltet, so ist das Endergebnis von der Reihenfolge der Drehungen abhängig, weil die Matrixmultiplikation nicht kommutativ ist. Beispiel: Eine Drehung um π /2 im mathematisch positiven Sinne, zuerst um die x-Achse und dann um die z-Achse wird mit der folgenden Matrix erreicht Dπ /2, z ∙ Dπ /2, x

−1 0 0

0 = (1 0

0 1 0) ∙ (0 1 0

0 0 1

0 0 −1) = (1 0 0

0 0 1

1 0) . 0

Dreht man zuerst um die z-Achse und anschließend um die x-Achse, so ergibt sich ein anderes Resultat 1 Dπ /2, x ∙ Dπ /2, z = (0 0

0 0 1

−1 0 0

0 0 −1) ∙ (1 0 0

0 0 0) = (0 1 1

−1 0 0

0 −1) . 0

Anwendung auf den Einheitsvektor X 0 liefert im ersten Falle eine Ausrichtung in Y 0 (Dπ /2, x bleibt wirkungslos), im zweiten Falle eine Ausrichtung in Z 0 (über die Zwischenposition Dπ /2, z ∙ X 0 = Y 0 ): 0 (1 0

0 0 1

0 (0 1

0 1 1 0) ∙ (0) = (1) 0 0 0

−1 0 0

0 1 0 −1) ∙ (0) = (0) 1 0 0

13.2 Streckung und Spiegelungen Die Streckungsmatrix α (0 0

0 β 0

0 0) 𝛾

bewirkt eine Streckung um α in der x-Achse, um β in der y-Achse und um 𝛾 in der z-Achse. Beispiel: Streckung eines Kreises in der x-y-Ebene (z = 0) mit α = 1,5 und β = −0,5. Der negative Wert bewirkt eine Vertauschung von positiver und negativer Richtung in der y-Achse. Die Matrix S0 einer Punktspiegelung am Ursprung bewirkt die Vertauschung aller Vorzeichen: −1 0 0 S0 = ( 0 −1 0 ) 0 0 −1 Die Matrix Sx einer Spiegelung an der x-Achse lässt nur das Vorzeichen der x-Koordinate unverändert. Analoges gilt für die Spiegelungen an y-Achse und z-Achse. Die

118 | 13 Transformationen mit Matrizen

Abb. 13.1: Streckung eines Kreises. Die Polkappe deutet die Richtung an.

entsprechenden Matrizen sind Spezialfälle der Drehmatrizen für den Drehwinkel φ = π = 180°: 1 Sx = (0 0

0 −1 0

0 0) −1

−1 Sy = ( 0 0

0 1 0

0 0) −1

−1 Sz = ( 0 0

0 −1 0

0 0) 1

Die Matrix Sxy für eine Spiegelung an der x-y-Ebene lässt nur die Vorzeichen der xKoordinate und der y-Koordinate unverändert. Analoges gilt für die anderen Ebenen: 1 Sxy = (0 0

0 1 0

0 0) −1

−1 Sy,z = ( 0 0

0 1 0

0 0) 1

1 Sz,x = (0 0

0 −1 0

0 0) 1

Die Matrix einer Spiegelung am x-y-z-Raum lässt nur die Vorzeichen der drei Raumkoordinaten unverändert: Sx,y,z

1 = (0 0

0 1 0

0 0) = I3 1

Eine weitere Koordinate, z. B. die Zeitkoordinate würde bei dieser Spiegelung ihr Vorzeichen ändern.

13.3 Orthogonale Matrizen Wir wollen nun untersuchen, welche Abbildungen Längen und Winkel unverändert lassen, also Metrik und Skalarprodukt respektieren. Eine solche Transformation f mit f (A) = X und f (B) = Y muss die Bedingung X T ∙ Y = (f (A))T ∙ f (B) = AT ∙ B = λ ∈ ℝ

(13.2)

erfüllen. Sie heißt orthogonale Transformation. Die Matrix der von uns gesuchten orthogonalen Transformation nennen wir M. Sie muss sicher quadratisch sein. Dann erhalten wir X = M ∙ A und Y = M ∙ B.

13.3 Orthogonale Matrizen | 119

Nach Anwendung der Bedingung (13.2) ergibt sich X T ∙ Y = (M ∙ A)T ∙ (M ∙ B) = AT ∙ (M T ∙ M) ∙ B = AT ∙ B. Dies muss auch für Vektoren A und B der Form (0, . . . , 0, 1, 0, . . . , 0)T gelten. Daraus, wie auch aus (M T ∙ M) ∙ B = B, folgt M T ∙ M = I.

(13.3)

Satz. Orthogonale Transformationen werden durch Matrizen vermittelt, für die gilt M −1 = M T .

(13.4)

Man nennt alle Matrizen M mit dieser Eigenschaft orthogonale Matrizen. Beispiele dafür hatten wir mit den Dreh- und Spiegelungsmatrizen bereits kennengelernt. Das Produkt (13.3) (bzw. seine kommutierte Form) zeigt: Das Skalaprodukt von zwei gleichen Spalten (bzw. Zeilen) ist 1, das Skalarprodukt von zwei verschiedenen Spalten (bzw. Zeilen) verschwindet. Wir betrachten nun eine beliebige Basis {V1 , V2 , . . . , Vn }, die keine ONB zu sein braucht. Die beiden Vektoren A und B können in dieser Basis analog zu (8.7) dargestellt werden als A = ∑i αi Vi und B = ∑j βj Vj . Ihr Skalarprodukt ist T

AT ∙ B = (∑ αi Vi ) ∙ (∑ βj Vj ) i

=

∑ αi βj (ViT ij

= ∑ αi cij βj

j

∙ Vj ) (13.5) mit cij = (ViT ∙ Vj )

ij

= XT ∙ C ∙ Y mit der Matrix C = (cij ) der Skalarprodukte der Basisvektoren und den Koordinatenvektoren X T und Y in dieser Basis {V1 , V2 , . . . , Vn } X T = (α1 , α2 , . . . , αn )

und

β1 β2 Y = ( ). ... βn

Das Skalarprodukt wird also durch Multiplikation der Koordinatenvektoren mit einer Matrix C vermittelt. In einer ONB ist dies natürlich die Einheitsmatrix In , denn für die Basisvektoren {X10 , X20 , . . . , Xn0 } gilt Xi0T ∙ Xj0 = Xj0T ∙ Xi0 = δij . Das Skalarprodukt der beiden Vektoren A und B in der kanonischen Basis kann also folgendermaßen geschrieben werden 1 0 A ∙ I ∙ B = (a1 , a2 , . . . , an ) ∙ ( ... 0 T

0 1 ... 0

... ... ... ...

0 b1 b 0 ) ∙ ( 2) . ... ... bn 1

120 | 13 Transformationen mit Matrizen Doch auch für beliebige Basen unterliegt C einigen Einschränkungen. Für das Skalarprodukt gilt stets AT ∙ A ≥ 0 und falls AT ∙ A = 0,

so ist A = 0.

Definition. Eine reelle n × n-Matrix C heißt positiv definit, wenn gilt ∀X ∈ ℝn : X T ∙ C ∙ X ≥ 0

und

X T ∙ C ∙ X = 0 ⇒ X = 0.

Für das Skalarprodukt λ als reelle Zahl gilt weiterhin die Symmetriebedingung AT ∙ B = λ = λ T = (AT ∙ B)T = BT ∙ A. Daher gilt auch für beliebige Basisvektoren ViT ∙ Vj = VjT ∙ Vi so dass die Matrix C = (cij ) = (cji ) symmetrisch sein muss. Satz. Die Matrix C der bilinearen Abbildung „Skalarprodukt“ ist symmetrisch und positiv definit. Beispiel: Wir wählen als Basis in der Ebene die Vektoren V1 = ( 11 ) und V2 = ( 20 ). Der Vektor A = ( 53 ) besitzt in dieser Basis den Koordinatenvektor X = ( 31 ), der Vektor B = ( 62 ) den Koordinatenvektor Y = ( 22 ). Die Matrix C = ( 22 24 ) enthält die Skalarprodukte der Basisvektoren (s. 13.5). Als Ergebnis finden wir: 2 X T ∙ C ∙ Y = (3, 1) ∙ ( 2

2 2 ) ∙ ( ) = 36 4 2

1 0

0 6 ) ∙ ( ) = 36 1 2

AT ∙ I ∙ B = (5, 3) ∙ (

Wie transformiert sich die Matrix C des Skalarproduktes, wenn die Transformationsmatrix M orthogonal ist? In der ursprünglichen Basis gilt XT ∙ C ∙ Y = λ . Die transformierten Koordinatenvektoren seien X󸀠 = M ∙ X

und

Y 󸀠 = M ∙ Y.

Wir bezeichnen die in der neuen Basis zum Skalarprodukt gehörige Matrix mit C󸀠 . Dann ist λ = X 󸀠T ∙ C󸀠 ∙ Y 󸀠 = (M ∙ X)T ∙ C󸀠 ∙ (M ∙ Y) = X T ∙ (M T ∙ C󸀠 ∙ M) ∙ Y. Somit folgt C = M T ∙ C󸀠 ∙ M und wegen M T = M −1

C󸀠 = M ∙ C ∙ M T .

Man erhält die Matrix C󸀠 durch Multiplikation von C von links und rechts mit der Transformationsmatrix M und ihrer Transponierten M T .

13.4 Lösungsmengen irregulärer linearer Gleichungssysteme |

121

13.4 Lösungsmengen irregulärer linearer Gleichungssysteme Irreguläre lineare Gleichungssysteme besitzen keine eindeutige Lösung und sind daher in der Praxis von geringerem Interesse als reguläre. Trotzdem ist die Kenntnis möglicher Lösungen für Optimierungsprobleme von Bedeutung. Definition. Das zu A ∙ X = B gehörige Gleichungssystem A∙X =0

(13.6)

heißt homogenes Gleichungssystem. A ∙ X = B mit B ≠ 0 heißt inhomogenes Gleichungssystem. Besitzt das inhomogene Gleichungssystem mehrere Lösungen, so kann man diese durch Kombination mit den Lösungen des homogenen Gleichungssystems finden. Das homogene Gleichungssystem lässt sich naturgemäß leichter behandeln als das inhomogene. Satz. (13.7) Sei c1 c C = ( 2) ... cn eine feste Lösung des inhomogenen Gleichungssystems A ∙ X = B. Alle anderen Lösungen sind dann von der Gestalt C󸀠 = C + C∗ , wobei C∗ eine Lösung des homogenen Gleichungssystems ist, also A ∙ C∗ = 0. Beweis. C󸀠 = C + C∗ ist eine Lösung von A ∙ X = B, denn A ∙ (C + C∗ ) = A ∙ C + A ∙ C∗ =B+0 = B. 󸀠

Es sei C eine beliebige und C die bekannte Lösung, dann ist A ∙ (C󸀠 − C) = A ∙ C󸀠 − A ∙ C = B − B = 0. 󸀠



󸀠



Also ist (C − C) = C ⇒ C = C + C . Jedes homogene Gleichungssystem besitzt mindestens eine Lösung, nämlich die triviale Lösung C∗ = 0. Aber nicht jedes inhomogene Gleichungssystem besitzt eine Lösung. A∙X =B

hat genau eine (bzw. mehrere) Lösung(en)

⇒A∙X =0

hat genau eine (bzw. mehrere) Lösung(en).

A∙X =0

hat nur eine Lösung

⇒A∙X =B

hat eine oder keine Lösung.

122 | 13 Transformationen mit Matrizen Wir wollen die Lösungsmengen nun etwas genauer definieren. Durch die m × n-Matrix A wird der n-Vektor X abgebildet. Das Bild ist der m-Vektor B. A vermittelt also eine lineare Abbildung vom n-dimensionalen Vektorraum in den m-dimensionalen Vektorraum, fA : ℝn → ℝm . Für m < n gehen dabei Dimensionen verloren. Definition. Die Menge aller Vektoren aus ℝn , die auf den Nullvektor abgebildet werden, also die Lösungsmenge des homogenen Gleichungssystems, nennen wir Kern der Abbildung: Kern(fA ) = {X ∈ ℝn | fA (X) = 0} Kern(fA ) ist ein Unterraum des Definitionsbereichs, also des n-dimensionalen Vektorraums, denn Addition zweier Vektoren aus Kern(fA ) sowie Multiplikation mit einem Skalar ergibt wieder einen Vektor aus Kern(fA ). A ∙ X = 0 ∧ A ∙ X 󸀠 = 0 ⇒ A ∙ (X + X 󸀠 ) = 0 A ∙ X = 0 ⇒ A ∙ λ X = λ (A ∙ X) = λ 0 = 0 Definition. Die Menge aller Vektoren aus ℝm , die Bilder von Vektoren X aus ℝn sind, nennen wir Bild der Abbildung: Bild(fA ) = {B ∈ ℝm | B = fA (X)} Bild(fA ) ist ein Unterraum des m-dimensionalen Bildraums. Sind B und B󸀠 Bilder, d. h. A ∙ X = B und A ∙ X 󸀠 = B󸀠 , so ist auch B + B󸀠 ein Bild, nämlich von X + X 󸀠 , das mit X und X 󸀠 auch zum Urbildraum gehört. A ∙ X = B ∧ A ∙ X 󸀠 = B󸀠 ⇒ A ∙ (X + X 󸀠 ) = B + B󸀠 A ∙ X = B ⇒ A ∙ λ X = λ (A ∙ X) = λ B Definition. Die Dimension des Kerns dim(Kern(fA )) heißt Defekt der Abbildung. Definition. Die Dimension des Bildes dim(Bild(fA )) heißt Rang der Abbildung. Nun können wir die für Abbildungen mit der m×n-Matrix A gewonnenen Erkenntnisse zusammenfassen: 1. Die Lösungsmenge des homogenen Gleichungssystems A ∙ X = 0 ist Kern(fA ). Das homogene Gleichungssystems besitzt nur eine Lösung ⇔ Defekt(fA ) = 0. 2. Das inhomogene Gleichungssystem A ∙ X = B besitzt mindestens eine Lösung C ⇔ B ∈ Bild(fA ). 3. Sei C eine solche Lösung, dann ist die gesamte Lösungsmenge von A ∙ X = B die Menge {C + Kern(fA )}. A ∙ X = B hat dann genau eine Lösung ⇔ Defekt(fA ) = 0. 4. Defekt(fA ) + Rang(fA ) = dim(ℝn ) = n. Beispiel: Wir konstruieren eine Abbildung fA : ℝ2 → ℝ2 , deren Kern ( λλ ) mit x = y = λ die Hauptdiagonale im Urbildraum a ( 11 a21

λ 0 a12 )∙( )=( ) λ 0 a22

(13.8)

123

13.4 Lösungsmengen irregulärer linearer Gleichungssysteme |

Abb. 13.2: Zur Veranschaulichung der Mengen Kern und Bild des folgenden Beispiels.

und deren Bild ( μ0 ) die mit fx bezeichnete x-Achse im Bildraum ist (

a11 a21

x μ a12 ) ∙ ( ) = ( ). y 0 a22

μ steht hier als Abkürzung für a11 x + a12 y und durchläuft alle reellen Zahlen. Aus (13.8) folgt ∀λ : a11 λ + a12 λ = 0



a12 = −a11

∀λ : a21 λ + a22 λ = 0



a21 = −a22

∀x, y : a11 (x − y) = μ



a11 = a ∈ ℝ \ {0}

∀x, y : a22 (y − x) = 0



a22 = 0

und aus (13.9) folgt ∀x, y : a11 x + a12 y = μ ∀x, y : a21 x + a22 y = 0 also mit dem Ergebnis von (13.8)

Die Abbildungsmatrix ist ( 0a −a 0 ) mit a ∈ ℝ \ {0}.

Übungen 13.1 Bestimmen Sie alle Lösungen, Kern und Bild von 2 0

0 x 6 ) ∙ ( ) = ( ). 0 y 0

2 0

0 x 3 )∙( )=( ) 0 y 1

( Warum besitzt

( keine Lösung?

13.2 Bestimmen Sie alle Lösungen, Kern und Bild von 1 0

(

1 x 2 ) ∙ ( ) = ( ). 0 y 0

(13.9)

124 | 13 Transformationen mit Matrizen 13.3 Bestimmen Sie alle Lösungen, Kern und Bild von (

1 2

1 x 2 ) ∙ ( ) = ( ). 2 y 4

13.4 Gegeben sei das lineare Gleichungssystem: 4x1 + 2x2 − 1x3 = −2 12x1 − 7x2 − 3x3 = −6 −8x1 + 5x2 + 2x3 = 4 (a) (b) (c) (d) (e) (f)

Schreiben Sie das lineare Gleichungssystem als A ∙ X = B. Schreiben Sie das lineare Gleichungssystem als X T ∙ AT = BT . Bestimmen Sie sämtliche Lösungen. Prüfen Sie die lineare Abhängigkeit der Zeilen von A. Prüfen Sie die lineare Abhängigkeit der Spalten von A. Bestimmen Sie zwei Punkte und die Normale der Bildebene.

13.5 Gegeben sei das lineare Gleichungssystem: 30x1 + 40x2 + 50x3 = 0 20x1 + 20x2 + 50x3 = 30 15x1 + 18x2 + 30x3 = 9 Bestimmen Sie alle Lösungen, Defekt, Rang, Kern und Bild. 13.6 Gegeben sei das Gleichungssystem A∙X =B

1 mit A = (−2 3

2 3 0

−1 2) −3

und

13 B = ( 9 ). 9

Man bestimme Defekt(A), Rang(A). Man gebe alle Lösungen C an. Man beschreibe anschaulich die Mengen Kern und Bild. Sollte das Bild eine Ebene sein, bestimmen Sie bitte die Normale der Bildebene. 13.7 (a) Konstruieren Sie eine Abbildung ℝ2 → ℝ2 , deren Kern die x-Achse im Urbildraum ist und deren Bild fy die y-Achse im Bildraum ist. (b) Konstruieren Sie eine Abbildung ℝ2 → ℝ2 , deren Kern die Form y = 2x besitzt und deren Bild die Form fy = 3fx besitzt. 13.8 Zeigen Sie, dass die folgenden Abbildungen des Vektors A linear sind und beschreiben Sie ihre Wirkung. (Der Punkt symbolisiert das Skalarprodukt.)

13.4 Lösungsmengen irregulärer linearer Gleichungssysteme |

125

(a) f (A) = (A ⋅ X 0 )X 0 + (A ⋅ X 0 )Y 0 (b) f (A) = (A ⋅ X 0 )Y 0 + (A ⋅ Y 0 )X 0 13.9 Welche der folgenden Abbildungen sind linear? Beschreiben Sie ihre Wirkung. (a) f (x) = xX 0 + 2xY 0 + 3xZ 0 (b) f (x) = X 0 + 2xY 0 13.10 Die Vektoren 6 U = (6) 2

3 V = (−4) 0

und

sollen in der Basis 3 { {

0

0 } }

B = {(0) , (2) , (0)} } {

1 } 0 { 0 als Koordinatenvektoren X und Y dargestellt werden. Man berechne U T ∙ I ∙ V in der kanonischen Basis und X T ∙ C ∙ Y in der Basis B. 1 1 13.11 Die Vektoren U = (0) und V = (2) sollen in der Basis 1 3 1 { {

1

{ 1

0

0 } }

B = {(1) , (1) , (1)} { }

1 }

als Koordinatenvektoren X und Y dargestellt werden. Man berechne U T ∙ I ∙ V in der kanonischen Basis und X T ∙ C ∙ Y in der Basis B. 13.12 Die Basis B󸀠 geht aus der Basis 3 { {

2

0 } }

B = {(1) , (1) , (0)} { }

0 2 } { 0 durch Drehung um φ = 30° in mathematisch positiver Richtung um die z-Achse hervor. (a) Man bestimme B󸀠 . (b) Man drücke die Vektoren 1 U = (2) 3

und

−1 V = (−1) 2

durch die Koordinatenvektoren X und Y in der Basis B bzw. X 󸀠 und Y 󸀠 in der Basis B󸀠 aus.

126 | 13 Transformationen mit Matrizen (c) Man bestimme die Matrizen C bzw. C󸀠 des Skalarproduktes in den beiden Basen, so dass U T ∙ I ∙ V = 3 = X T ∙ C ∙ Y = X 󸀠T ∙ C󸀠 ∙ Y 󸀠 . (d) Man ermittle die Transformationsmatrix M in C󸀠 = M ∙ C ∙ M T . 13.13 Die Basis B󸀠 geht aus der Basis { {

3

{

0

2

0 } }

B = {(−1) , (1) , (0)} } {

0

2 }

durch Drehung um φ = 30° in mathematisch positiver Richtung um die y-Achse hervor. (a) Man bestimme B󸀠 . (b) Man drücke die Vektoren 1 U = (2) 3

und

−1 V = (−1) 2

durch die Koordinatenvektoren X und Y in der Basis B bzw. X 󸀠 und Y 󸀠 in der Basis B󸀠 aus. (c) Man bestimme die Matrizen C bzw. C󸀠 des Skalarproduktes in den beiden Basen, so dass U T ∙ I ∙ V = 3 = X T ∙ C ∙ Y = X 󸀠T ∙ C󸀠 ∙ Y 󸀠 . (d) Man ermittle die Transformationsmatrix M in C󸀠 = M ∙ C ∙ M T . 13.14 Man drehe die Gerade y = 2x + 1 mit Hilfe der Drehmatrix um den Winkel φ um die z-Achse und bestimme den Schnittpunkt mit der x-Achse in Abhängigkeit vom Drehwinkel.

14 Iterative Lösung von linearen Gleichungssystemen Die exakte Lösung von linearen Gleichungssystemen n-ter Ordnung erfordert ungefähr n3 Schritte – unabhängig vom gewählten Verfahren. Bei sehr großen Gleichungssystemen sind selbst leistungsfähige Rechner überfordert. In vielen Fällen muss man sich daher mit einer numerischen Approximation (lateinisch für Annäherung) begnügen, indem in einem ersten Schritt nur eine sehr grobe Abschätzung durchgeführt wird, die in weiteren Schritten verbessert wird. Ein schrittweise sich wiederholendes Verfahren wird iteratives Verfahren oder Iteration genannt.

14.1 Das Verfahren nach Gauß und Seidel Zu diesem Zweck wird das quadratische (m = n) und eindeutig lösbare Gleichungssystem gegebenenfalls durch Umstellung der Gleichungen oder Umbenennung der Variablen so vorbereitet, dass in a11 x1 + a12 x2 + . . . + a1n xn = b1 a21 x1 + a22 x2 + . . . + a2n xn = b2 ...

...

...

...

...

an1 x1 + an2 x2 + . . . + ann xn = bn alle Diagonalkoeffizienten aii von Null verschieden sind. Nun isoliert man die Unbekannten in der Form x1 = (b1 − a12 x2 − . . . − a1n xn )/a11

(14.1)

x2 = (b2 − a21 x1 − . . . − a2n xn )/a22

(14.2)

...

...

...

...

...

xn = (bn − an1 x1 − . . . − an,n−1 xn−1 )/ann

(14.3)

indem durch die Diagonalkoeffizienten dividiert wird. Man rät oder schätzt dann einen Startvektor (x1(0) , x2(0) , x3(0) , . . . , xn(0) ) für die Werte der Unbekannten. Wenn jede Information fehlt, setzt man z. B. einfach den Vektor (0, 0, 0, . . . , 0) ein. Ist bereits eine Vorstellung über die Größe der Unbekannten vorhanden, so geht man davon aus. Diese nullte Näherung verwendet man, um durch Einsetzen von (x2(0) , x3(0) , . . . , xn(0) ) in die rechte Seite von (14.1) eine erste Näherung x1(1) für die erste Unbekannte zu gewinnen. In die rechte Seite von (14.2) werden anschließend die Werte (x1(1) , x3(0) , . . . , xn(0) ) eingesetzt, woraus sich eine erste Näherung x2(1) für die zweite Unbekannte ergibt. Auf diese Weise verwendet man alle Gleichungen einschließlich (14.3) mit dem Ergebnis der vollständigen ersten Näherung (x1(1) , x2(1) , x3(1) , . . . , xn(1) ). Sie wird eingesetzt, um nach demselben

128 | 14 Iterative Lösung von linearen Gleichungssystemen Verfahren die zweite und beliebig viele weitere Näherungen zu berechnen – so lange bis sich der Lösungsvektor im Rahmen der geforderten Rechengenauigkeit nicht mehr verändert. Beispiel: 10x1 + 2x2 + x3 = 20 ⇒ x1 = 2 − 0, 2x2 − 0, 1x3 x1 + 5x2 + 2x3 = 0 x2 + 2x3 = 10



x2 = −0, 2x1 − 0, 4x3



x3 = 5 − 0, 5x2

Näherungen (mit vier Nachkommastellen): i

x1(i)

x2(i)

x3(i)

0 1 2 3 4 5 6 7 ... ∞

0 2 1,56 1,8588 1,9275 1,9433 1,9470 1,9478 ... 1,9481

0 –0,4 –2,392 –2,8502 –2,9555 –2,9798 –2,9853 –2,9866 ... –2,9870

0 5,2 6,196 6,4251 6,4778 6,4899 6,4927 6,4933 ... 6,4935

Die Lösung wurde bereits nach der sechsten Iteration mit einem Fehler von weniger als ein Promille erreicht.

14.2 Stabilität Ein lineares Gleichungssystem ist schlecht konditioniert, wenn die Determinante klein ist. Dann führen kleine Änderungen in den Koeffizienten zu großen Änderungen im Lösungsvektor. Die Lösung ist also nicht stabil. In der Praxis können kleine Messfehler zu großen Fehlern im Ergebnis führen. Beispiel: Das Gleichungssystem 2,00 ⋅ x1 + 4,05 ⋅ x2 = 10,10 3,00 ⋅ x1 + 6,00 ⋅ x2 = 15,00 besitzt die Determinante D = 2 ⋅ 6 − 3 ⋅ 4,05 = −0,15. Die Lösung ist x1 = 1,00 und x2 = 2,00.

14.2 Stabilität

Eine leichte Veränderung der Koeffizienten von x2 (um 1 %) liefert 2, 00 ⋅ x1 + 4,01 ⋅ x2 = 10,10 3, 00 ⋅ x1 + 6,06 ⋅ x2 = 15,00 mit der Determinante D = 2 ⋅ 6,06 − 3 ⋅ 4,01 = 0,09. Die Lösung ist nun x1 = 11,73 und x2 = −3,33.

| 129

| Teil V: Algebra und Geometrie

15 Polynome Definition. Eine formale Summe mit der Variablen x n

p(x) = a0 + a1 x + a2 x2 + ⋅ ⋅ ⋅ + an xn = ∑ ak xk

(15.1)

k=0

mit k ∈ ℕ0 , ak ∈ ℝ, an ≠ 0 heißt reelles Polynom des Grades n. p(x) = a0 mit a0 ≠ 0 ist wegen a0 = a0 x0 ein Polynom vom Grad 0. Die Addition und Multiplikation zweier Polynome ist definiert durch n

max(m,n)

m

∑ ak x k + ∑ b k x k =



k=0

k=0

n

k=0 m

(ak + bk ) xk

m+n i

( ∑ ak xk ) ⋅ ( ∑ bk xk ) = ∑ ∑ (ai−j ⋅ bj ) xi . k=0

k=0

(15.2) (15.3)

i=0 j=0

Beispiel: (1x0 + 2x1 + 4x2 ) + (3x0 + 5x1 + 6x3 ) = 4x0 + 7x1 + 4x2 + 6x3 (1 + 2x + 4x2 ) ⋅ (3 + 5x + 6x3 ) = 3 + 11x + 22x2 + 26x3 + 12x4 + 24x5 Die Menge aller reellen Polynome ist „fast“ ein Körper. Seien p(x), q(x) und r(x) Polynome, dann gilt: Addition und Multiplikation sind assoziativ und kommutativ. – p(x) ⋅ [q(x) + r(x)] = p(x) ⋅ q(x) + p(x) ⋅ r(x). – p(x) + 0(x) = p(x) mit 0(x) := 0. – p(x) ⋅ 1(x) = p(x) mit 1(x) := 1. – Zu jedem p(x) existiert ein p󸀠 (x) mit p(x) + p󸀠 (x) = 0(x). Aber Bedingung (5.11) ist nicht für alle p(x) erfüllt: Zum Beispiel existiert zu p(x) = x kein p−1 (x) mit p(x) ⋅ p−1 (x) = 1(x). p−1 (x) müsste x−1 sein, aber (−1) ∉ ℕ0 . Ein mathematisches System, das außer dem letzten alle Axiome eines Körpers erfüllt, heißt kommutativer Ring mit Eins. Falls die Multiplikation nicht kommutativ und kein Einselement vorhanden ist, so spricht man lediglich von einem Ring. Nach (15.2) und (15.3) gilt: Grad(p(x) + q(x)) ≤ max{Grad(p(x)), Grad(q(x))} Grad(p(x) ⋅ q(x)) = Grad(p(x)) + Grad(q(x)) Damit die zweite Bedingung auch dann noch gilt, wenn das Nullpolynom ∀x ∈ ℝ : 0(x) ≡ 0 als Faktor auftritt, setzt man formal Grad(0(x)) = −∞. Division liefert b(x) = q(x) ⋅ a(x) + r(x) mit Grad(r(x)) < Grad(a(x)).

134 | 15 Polynome Beispiel: b(x) : a(x) = q(x) Rest r(x) (2x3 + 1x2 + 3x − 1) : (1x2 + 2x + 1) = (2x − 3) Rest (7x + 2) −(2x3 + 4x2 + 2x) (−3x2 + 1x − 1) −(−3x2 − 6x − 3) (7x + 2) ⇒

b(x) = q(x) ⋅ a(x) + r(x) (2x3 + x2 + 3x − 1) = (2x − 3) ⋅ (x2 + 2x + 1) + (7x + 2) Grad(a(x)) = 2,

Grad(r(x)) = 1.

Beispiel: b(x) : a(x) = q(x) Rest r(x) (2x3 + 1x2 + 3x − 1) : (x) = (2x2 + 1x + 3) Rest (−1) −(2x3 ) (1x2 + 3x − 1) −(1x2 ) (3x − 1) −(3x) (−1) ⇒

b(x) = q(x) ⋅ a(x) + r(x) (2x3 + x2 + 3x − 1) = (2x2 + x + 3) ⋅ (x) + (−1) Grad(a(x)) = 1,

Grad(r(x)) = 0.

Definition. α ∈ ℝ heißt Nullstelle des Polynoms p(x), wenn p(α ) = 0. Nach dem Divisionsalgorithmus gilt für a(x) = (x − α ): Es existiert ein q(x) und ein r(x) mit Grad (r(x)) < 1, also r(x) = r0 = konstant, so dass p(x) = q(x) ⋅ (x − α ) + r0 . Wird die Nullstelle α eingesetzt, so folgt 0 = p(α ) = q(α ) ⋅ (α − α ) + r0 = r0 . Satz. Wenn α eine Nullstelle des Polynoms p(x) ist, so ist p(x) ohne Rest durch (x − α ) teilbar. a(x) ist ein Teiler von b(x), wenn es ein Polynom q(x) gibt, so dass b(x) = q(x) ⋅ a(x).

(15.4)

Also ist (x − α ) ein Teiler von p(x). Ein Teiler kann auch als Faktor aufgefasst werden. Weil (x − α ) in x linear ist (x in der ersten Potenz auftritt), heißt (x − α ) Linearfaktor.

15 Polynome

| 135

Dieselbe Überlegung können wir auf q(x) = p(x)/(x−α ) anwenden. Ist β eine Nullstelle von q(x), so ist (x−β ) ein Teiler von q(x). Jeder Teiler von q(x) ist aber gleichzeitig Teiler von p(x) = q(x) ⋅ (x − α ). Damit folgt der Satz. Sind α1 , . . . , αs Nullstellen von p(x), so gilt für geeignetes q(x) p(x) = q(x) ⋅ (x − α1 ) ⋅ ⋅ ⋅ (x − αs ). Definition. Ein Polynom p(x) heißt genau dann irreduzibel, wenn es außer der reellen Zahl λ und Polynomen der Form λ ⋅ p(x) mit 0 ≠ λ ∈ ℝ keinen weiteren Teiler besitzt. (Analogie zur Primzahl.) Beispiel: p(x) = x2 + 1 ist irreduzibel. Diese Definition beruht allerdings darauf, dass wir bisher nur reelle Nullstellen betrachtet haben. Lassen wir auch komplexe Zahlen zu, so ist x2 + 1 reduzibel, denn mit i = √−1 ist x2 + 1 = (x + i) ⋅ (x − i). Polynome nullten und ersten Grades sind nach Definition immer irreduzibel. Nach obigem Beispiel gibt es für x ∈ ℝ auch irreduzible Polynome zweiten Grades. Verwenden wir dagegen auch komplexe Zahlen x ∈ ℂ als Nullstellen und Variablenwerte, so gilt der 1799 von Gauß bewiesene Fundamentalsatz der Algebra: Jedes nichtkonstante Polynom hat mindestens eine Nullstelle α ∈ ℂ ⊃ ℝ. Also gilt mit komplexen Nullstellen α : p(x) = q(x) ⋅ (x − α ). Wenn q(x) wieder ein reduzibles Polynom ist, d. h. Grad(q(x)) ≥ 2, so können wir den Fundamentalsatz abermals anwenden usw. Satz. Jedes nichtkonstante Polynom p(x) vom Grade n besitzt eine bis auf die Reihenfolge eindeutige Zerlegung p(x) = λ ⋅ (x − α1 )n1 ⋅ (x − α2 )n2 ⋅ ⋅ ⋅ (x − αr )nr

(15.5)

mit λ ∈ ℝ, x, α1 , . . . , αr ∈ ℂ und r, n1 , . . . , nr ∈ ℕ. α1 , . . . , αr sind die verschiedenen Nullstellen von p(x). ni heißt Multiplizität der Nullstelle αi , und es gilt n1 + n2 + ⋅ ⋅ ⋅ + nr = n. Satz. Ist α = u + iv mit u, v ∈ ℝ eine komplexe Nullstelle von p(x), so ist die konjugiert komplexe Zahl α ∗ = u − iv ebenfalls eine Nullstelle von p(x). Beweis. Für komplexe Zahlen gilt (α + β )∗ = α ∗ + β ∗ und (α ⋅ β )∗ = α ∗ ⋅ β ∗ : (α + β )∗ = [(u + iv) + (w + iz)]∗ = [(u + w) + i(v + z)]∗ = (u + w) − i(v + z) = (u − iv) + (w − iz) = α ∗ + β ∗ (α ⋅ β )∗ = [(u + iv)(w + iz)]∗ = [uw − vz + i(vw + uz)]∗ = uw − vz − i(vw + uz) = (u − iv)(w − iz) = (u + iv)∗ (w + iz)∗ = α ∗ ⋅ β ∗

136 | 15 Polynome Sei nun α eine komplexe Nullstelle von p(x), dann ist p(α ) = 0 = 0∗ = [p(α )]∗ = a∗0 + a∗1 α ∗ + ⋅ ⋅ ⋅ + a∗n α ∗n und da ai ∈ ℝ, folgt 0 = a0 + a1 α ∗ + ⋅ ⋅ ⋅ + an α ∗n = p(α ∗ ). Also ist α ∗ ebenfalls eine Nullstelle von p(x). Jedes Polynom kann demnach in der Form p(x) = λ (x − α1 )(x − α1∗ ) ⋅ ⋅ ⋅ (x − αs )(x − αs∗ )(x − β1 ) ⋅ ⋅ ⋅ (x − βt )

(15.6)

geschrieben werden, wobei αi die komplexen und βi die reellen Nullstellen bedeuten. Wegen (x − α )(x − α ∗ ) = [x − (u + iv)] ⋅ [x − (u − iv)] = [(x − u) − iv] ⋅ [(x − u) + iv] = (x − u)2 + v2 = x2 − 2ux + u2 + v2 ist das Produkt von zwei komplex-konjugierten Linearfaktoren ein reelles Polynom zweiten Grades. Damit folgt der Satz. Jedes reelle Polynom lässt sich faktorisieren als Produkt aus reellen Polynomen ersten und zweiten Grades. Satz. Jedes reelle Polynom von ungeradem Grade 2n −1 mit n ∈ ℕ besitzt mindestens eine reelle Nullstelle. p(x) = a0 + a1 x + a2 x2 + ⋅ ⋅ ⋅ + an xn = an xn (

a a0 a1 a2 + + + ⋅ ⋅ ⋅ + n−1 + 1) an xn an xn−1 an xn−2 an x

Für x → ±∞ verschwinden außer 1 alle Summanden in der Klammer, und es folgt lim p(x) = an xn .

x→±∞

(15.7)

Für ungeraden Grad und an > 0 fällt der Graph von p(x) nach links unendlich weit ab und steigt nach rechts unendlich weit auf (und umgekehrt für an < 0). Dabei muss er mindestens einmal die Abszisse kreuzen. Also existiert mindestens eine reelle Nullstelle. Beispiele (die Nullstellen sind nicht in der Reihenfolge der Linearfaktoren geordnet): p(x) = x3 + x = (x − 0)(x − i)(x + i)

⇒ α1 = 0, α2 = (−i), α3 = i

3

⇒ α = 0 (Multiplizität 3)

3

⇒ α1 = (−1), α2 = 0, α3 = 1

p(x) = x = (x − 0)(x − 0)(x − 0) p(x) = x − x = (x − 1)(x − 0)(x + 1)

15.1 Geschlossene Lösungsverfahren

|

137

Für geraden Grad beginnt und endet der Graph auf derselben Seite der Abszisse. Es ist möglich, dass keine reelle Nullstelle existiert. Beispiele (die Nullstellen sind nicht in der Reihenfolge der Linearfaktoren geordnet): p(x) = x2 + 1 = (x − i)(x + i)

⇒ keine reelle Nullstelle

2

⇒ α = 0 (Multiplizität 2)

2

⇒ α1 = (−1), α2 = 1

p(x) = x = (x − 0)(x − 0) p(x) = x − 1 = (x − 1)(x + 1)

Jedes Polynom n-ten Grades besitzt höchstens n verschiedene Nullstellen. Zur Berechnung einzelner Punkte eines Polynoms verwendet man das HornerSchema. Um nicht ständig Potenzen von x bilden zu müssen, formt man p(x) folgendermaßen um: p(x) = a0 + a1 x + a2 x2 + ⋅ ⋅ ⋅ + an xn = (. . . ((an x + an−1 )x + an−2 )x + ⋅ ⋅ ⋅ + a1 )x + a0 Beispiel: p(x) = 2x3 − 5x2 + 0x − 4 = ((2x − 5)x + 0)x − 4 p(6) = ((2 ⋅ 6 − 5) ⋅ 6 + 0) ⋅ 6 − 4 = 248 Terme mit ai = 0 nicht vergessen!

15.1 Geschlossene Lösungsverfahren Die Menge der Nullstellen eines Polynoms bildet dessen Lösungsmenge. Statt von einer Nullstelle oder Lösung spricht man auch von einer Wurzel des Polynoms. Wie findet man nun diese Wurzeln? Für n ≤ 4 gibt es explizite Lösungsverfahren. Besitzt das Polynom einen höheren Grad, so ist man i. A. auf numerische Verfahren angewiesen. Da die Lösungsverfahren für n = 3 und n = 4 sehr umständlich sind und andererseits überall leistungsfähige Computer zu Verfügung stehen, wendet man diese Verfahren heute kaum noch an. Für den Fall n = 2, die quadratische Gleichung, haben sich gewisse Symbole, darunter p, fest eingebürgert, weshalb wir das Polynom als f (x) = ax2 + bx + c

(15.8)

schreiben. Seine beiden Nullstellen werden mit x1 und x2 bezeichnet. Um sie zu finden, normieren wir f (x), d. h. wir teilen durch a und erhalten mit b/a := p und c/a := q (p und q sind hier reelle Zahlen!) ohne Änderung der Lösungsmenge die Normalform xi2 + pxi + q = 0 mit i = 1, 2.

138 | 15 Polynome Fügen wir auf beiden Seiten die „quadratische Ergänzung“ (p/2)2 hinzu, so folgt xi2 + pxi +

p2 p 2 = − q. 4 4

Nun ist die linke Seite gerade gleich (xi + 2p )2 , so dass xi = −

p √ p2 ± −q 2 4

(15.9)

also x1 = −

p √ p2 − −q 2 4

und

x2 = −

p √ p2 + −q 2 4

oder mit den ursprünglichen Bezeichnungen xi = −

b ± √b2 − 4ac . 2a

Wie erwartet, finden wir zwei Lösungen, die im Grenzfall

(15.10) p2 4

= q zu einer Lösung der

Multiplizität 2 verschmelzen. Die Lösungen sind aber nur dann reell, wenn d. h. wenn 󵄨󵄨 󵄨 a 󵄨󵄨󵄨 󵄨󵄨b/2 󵄨󵄨 󵄨󵄨 ≥ 0. 󵄨󵄨 c b/2󵄨󵄨󵄨 󵄨 Die Lösung der kubischen Gleichung ohne quadratisches Glied x3 + px + q = 0

p2 4

≥ q,

(15.11)

(15.12)

wurde zu Beginn des 16. Jahrhunderts von Scipione del Ferro und Nicole Tartaglia gefunden. Sie basiert auf dem binomischen Satz für Kuben, der auf die Form (u1/3 − v1/3 ) angewandt wird, um eine spezielle Darstellung für x3 zu erzeugen x3 = (u1/3 − v1/3 )3 = u3/3 − 3u2/3 v1/3 + 3u1/3 v2/3 − v3/3 . Dieser Bedingung gehorchen unendlich viele Zahlenpaare (u, v). In (15.12) eingesetzt, ergibt sich die Gleichung u − 3u2/3 v1/3 + 3u1/3 v2/3 − v + p(u1/3 − v1/3 ) + q = 0. Sie wird zu einer Identität mit den Substitutionen q = −u + v

(15.13)

(um die äußeren Glieder des Binoms wegzuheben) und p = 3u1/3 v1/3

(15.14)

(um die inneren Glieder des Binoms wegzuheben). Ist (15.12) gegeben, so berechnet man zunächst u und v aus (15.13) und (15.14) und daraus x = u1/3 − v1/3 .

(15.15)

15.1 Geschlossene Lösungsverfahren

|

139

Beispiel: x3 + 5x − 42 = 0 Die Substitutionen −u + v = −42 und uv = (5/3)3 führen auf eine quadratische Gleichung: (v + 42)v = 125/27 oder v2 + 42v − 125/27 = 0 v = −21 ± √ 441 + ⇒ x = u1/3 − v1/3

125 ≈ 0,11 oder − 42,11 u = v + 42 ≈ 42,11 oder − 0,11 27 ≈ 3,48 − 0,48 = −0,48 − (−3,48) = 3.

Die kubische Gleichung mit quadratischem Glied x3 + px2 + q = 0

(15.16)

wurde von Geronimo Cardano durch die Substitution x = y − p/3 3

2

2

3

(y − 3y p/3 + 3yp /9 − p /27) + p(y2 − 2yp/3 + p2 /9) + q = 0

(15.17)

auf (15.12) zurückgeführt. Denn die in y quadratischen Glieder in (15.17) heben sich damit weg. Bemerkenswert ist, dass Cardano erstmals drei Lösungen einer kubischen Gleichung gefunden hat. Wir betrachten nun wieder ein allgemeines Polynom, das allerdings in Normalform sein soll, d. h. normiert auf an = 1, mit den Wurzeln xi p(x) = a0 + a1 x + a2 x2 + ⋅ ⋅ ⋅ + an−1 xn−1 + xn = (x − x1 )(x − x2 ) ⋅ ⋅ ⋅ (x − xn−1 )(x − xn ). Ausmultiplizieren der Linearfaktoren ergibt p(x) = xn − (x1 + x2 + ⋅ ⋅ ⋅ + xn ) ⋅ xn−1 + ⋅ ⋅ ⋅ + (−1)n (x1 ⋅ x2 ⋅ ⋅ ⋅ xn ) und Koeffizientenvergleich liefert die Sätze von Vieta: (x1 + x2 + ⋅ ⋅ ⋅ + xn ) = −an−1

(15.18)

n

(15.19)

(x1 ⋅ x2 ⋅ ⋅ ⋅ xn ) = (−1) a0

In normierten Polynomen ist der Koeffizient der zweithöchsten Potenz gleich der negativen Summe aller Wurzeln. Das absolute Glied ist das Produkt aller Wurzeln, multipliziert mit (−1)n . Diese Sätze dienen als Probe zur Kontrolle der Rechenergebnisse. Wenden wir die Sätze (15.18) und (15.19) auf die Lösung (15.9) der quadratischen Gleichung an, so bestätigen wir leicht: x1 + x2 = −p x1 ⋅ x 2 = q Insbesondere folgt für a0 = 0: Wenn das absolute Glied verschwindet, so muss mindestens eine Nullstelle des Polynoms den Wert 0 besitzen. Der Graph des Polynoms läuft durch den Ursprung des Koordinatensystems.

140 | 15 Polynome Satz. Sind alle Koeffizienten mi eines Polynoms ganzzahlig, so enthält das absolute Glied unter seinen ganzzahligen Faktoren auch alle existierenden ganzzahligen Lösungen. Beweis. Sei p(x) = m0 + m1 x + m2 x2 + ⋅ ⋅ ⋅ + mn−1 xn−1 + mn xn

mit mi ∈ ℤ, m0 ≠ 0

und es existiere eine Nullstelle x1 ∈ ℤ, d. h. p(x1 ) = 0, so folgt m0 /x1 = −(m1 + m2 x1 + ⋅ ⋅ ⋅ + mn−1 x1n−2 + mn x1n−1 ). Da rechts eine ganze Zahl steht (Summe aus Produkten aus ganzen Zahlen), muss auch m0 /x1 ∈ ℤ sein, d. h. x1 ist Teiler von m0 . Beispiel: p(x) = 2x2 + x − 1. Als ganzzahlige Lösungen kommen nur (−1) und 1 in Frage. (−1) ist eine Lösung oder Wurzel des Polynoms. Beispiel: p(x) = x4 − x3 − 21x2 + x + 20. Die Faktoren des absoluten Gliedes sind ±1, ±2, ±4, ±5, ±10, ±20. Rechnet man p(x) z. B. unter Verwendung des HornerSchemas für diese Werte von x aus, so zeigt sich, dass −4, −1, 1 und 5 Wurzeln sind. Auf diese einfache Weise hat man also bereits alle Wurzeln gefunden. Das ist natürlich nicht immer so einfach. Beispiel: p(x) = x2 − 2. Dieses Polynom besitzt überhaupt keine ganzzahlige Wurzel. Bevor man zu approximieren beginnt, ist es zweckmäßig, gezielt zu raten. Dazu dient auch der folgende Satz. Sind alle Koeffizienten eines normierten Polynoms ganzzahlig, so können die Nullstellen nicht gebrochen rational sein, sondern nur ganzzahlig, irrational oder komplex. Beweis (durch Widerspruch). Sei p(x) = m0 + m1 x + m2 x2 + ⋅ ⋅ ⋅ + mn−1 xn−1 + xn und es existiere eine Nullstelle x1 = u/v mit teilerfremden u, v ∈ ℤ, so folgt aus 0 = m0 + m1

u u2 un−1 un + m2 2 + ⋅ ⋅ ⋅ + mn−1 n−1 + n v v v v

nach Multiplikation mit vn−1 −

un = m0 vn−1 + m1 uvn−2 + m2 u2 vn−3 + ⋅ ⋅ ⋅ + mn−1 un−1 . v

Rechts steht eine ganze Zahl, also muss auch links eine solche stehen. Wenn aber u und v teilerfremd sind, so sind es auch un und v (wegen der Eindeutigkeit der Primfaktorzerlegung von u, vgl. S. 29). Die Annahme war also falsch.

15.2 Approximation der Nullstellen

|

141

15.2 Approximation der Nullstellen Führt Erraten nicht zum Ziel und ist eine geschlossene Lösung nicht möglich oder zu aufwendig, so bedient man sich der näherungsweisen Lösung. Die älteste Methode ist die Regula falsi (das Prinzip des falschen Ansatzes, schon um 870 n. Chr. im arabischen Raum bekannt). Man sucht zwei x-Werte, x+ und x− , für die gilt p(x+ ) > 0

und

p(x− ) < 0.

Da p(x) stetig ist (s. S. 197 f.) muss im Intervall zwischen x− und x+ mindestens eine Nullstelle x1 liegen (s. S. 198). Nun approximiert man p(x) in diesem Intervall durch eine Sekante. Nach dem Strahlensatz folgt für den Schnittpunkt x∗ der Sekante mit der Abszisse p(x+ ) − p(x− ) p(x+ ) = := m. (15.20) x+ − x ∗ x+ − x − Kürzen wir die rechte Seite (die Steigung der Sekante) mit m ab, so finden wir für den Schnittpunkt der Geraden mit der Abszisse x∗ = x+ −

p(x+ ) . m

(15.21)

Abb. 15.1: Zur Regula falsi.

Nun wird p(x∗ ) berechnet. Ist p(x∗ ) > 0, so setzen wir x∗ als neues x+ in (15.20) ein und wiederholen den Rechengang. Ist p(x∗ ) < 0, so setzen wir x∗ als neues x− in (15.20) ein und wiederholen den Rechengang. Durch dieses Iterationsverfahren wird der Abstand zwischen der Nullstelle x1 des Polynoms und der Nullstelle x∗ der Sekante immer kleiner. x1 kann also durch wiederholte Anwendung der Regula falsi beliebig genau bestimmt werden. Allerdings hat die Regula falsi den Nachteil, dass unter Umständen einer der Punkte x+ , x− weit von x1 entfernt bleibt und der Fehler |x∗ −x1 | daher nur sehr langsam abnimmt. Deswegen wendet man die Regula falsi meist nur für die ersten Iterationen an und bedient sich in der Nähe der Nullstelle des Newton-Verfahrens. Anstelle der Steigung m einer Sekante berechnet man die Steigung einer Tangente an p(x), d. h. die Ableitung dp/dx (s. S. 207 ff.) an der Stelle x+ p(x+ ) dp (x ) = ∗ x+ − x dx +

142 | 15 Polynome

Abb. 15.2: Zum Newton-Verfahren.

Abb. 15.3: Ungünstige Wahl des Anfangspunktes x+ beim Newton-Verfahren.

und findet für

dp (x ) dx +

≠ 0 x∗ = x+ −

p(x+ ) . dp (x ) + dx

(15.22)

Ist der Verlauf von p(x) wie in Abb. 15.2 dargestellt, so gelangt man durch Wiederholung des Verfahrens (x+ in (15.22) durch x∗ ersetzen und damit ein neues x∗ ausrechnen) immer näher an die Nullstelle. Besitzt p(x) zwischen x+ und der Nullstelle dagegen einen komplizierteren Verlauf, so führt das Verfahren nicht unbedingt zum Ziel. Man suche dann einen näher an der Nullstelle liegenden Anfangswert x+ . Durch den Einsatz moderner Rechner hoher Leistung sind die genannten Verfahren in vielen Anwendungen durch einfache Intervallschachtelung abgelöst worden. Dabei wird das untersuchte Intervall durch x∗ = (x− + x+ )/2

(15.23)

lediglich halbiert und x∗ im nächsten Schritt je nach dem Ergebnis von p(x∗ ) als x− oder x+ eingesetzt.

Übungen 15.1 Dividieren Sie 2x3 − 2,2x2 − 2, 4x + 1, 8 durch (x + 1). Schließen Sie aus dem Ergebnis auf eine Nullstelle. 15.2 Dividieren Sie x5 − 2x4 + 3x − 6 durch (x − 2). Schließen Sie aus dem Ergebnis auf eine Nullstelle.

15.2 Approximation der Nullstellen

|

143

15.3 Lösen Sie (a) x2 + 2x − 8 = 0 (b) x2 − 9 = 0 (c) x2 + 9 = 0 und prüfen Sie die Lösungen mit den Sätzen von Vieta. 15.4 Finden Sie eine Lösung der kubischen Gleichung x3 + x + 30 = 0. [Hinweis: Suchen Sie zunächst einen negativen und einen positiven Wert des Polynoms. Verkleinern Sie das Intervall (x− , x+ ). Vermuten Sie, dass die Lösung ganzzahlig ist.] 15.5 Finden Sie eine Lösung der kubischen Gleichung x3 − x2 − 100 = 0. [Hinweis: Suchen Sie zunächst einen negativen und einen positiven Wert des Polynoms. Verkleinern Sie das Intervall (x− , x+ ). Vermuten Sie, dass die Lösung ganzzahlig ist.] 15.6 (a) Approximieren Sie eine Nullstelle von p(x) = x3 + 5,7x2 − 0,6x − 20,4 zwischen 0 und 2 mit Hilfe der Regula falsi auf 1 % genau. (b) Die Ableitung lautet dp/dx = 3x2 + 11,4x − 0,6. Führen Sie die Approximation mit dem Newtonschen Näherungsverfahren durch. (c) Führen Sie die Approximation mittels Intervallhalbierungen durch.

16 Zweidimensionale quadratische Formen Eine zweidimensionale lineare Form ist ein Ausdruck l = a1 x + a2 y. Er lässt sich als Skalarprodukt (a1 , a2 ) ∙ ( xy ) schreiben. Für festes l ∈ ℝ ergibt sich eine Gerade. Analog dazu definiert man die zweidimensionale quadratische Form q = a11 x2 + a12 xy + a21 yx + a22 y2 oder mit der 2 × 2-Matrix A a11 a21

q = X T ∙ A ∙ X = (x, y) ∙ (

x a12 ) ∙ ( ). y a22

(16.1)

Die Matrix einer quadratischen Form ist wegen xy = yx nicht eindeutig bestimmt. Zum Beispiel ergibt sich q = x2 + 4xy + y2 aus 1 0

4 x )∙( ) 1 y

1 2

2 x ) ∙ ( ). 1 y

(x, y) ∙ ( und ebenso aus

(x, y) ∙ (

Es gibt jedoch immer nur eine symmetrische Matrix A (mit a12 = a21 ) für die quadratische Form q. Diese ist besonders wichtig, denn man kann sie durch orthogonale Koordinatentransformation auf eine sehr einfache Form bringen. Wenn zwischen U T = (u, v) und X T = (x, y) der folgende Zusammenhang besteht X =D∙U

(16.2)

wobei D eine umkehrbare 2 × 2-Matrix sein soll, so ergibt diese Transformation q = X T ∙ A ∙ X = U T ∙ DT ∙ A ∙ D ∙ U = U T ∙ C ∙ U. Durch orthogonale Koordinatentransformation mit Hilfe der zweidimensionalen Drehmatrix cos φ − sin φ ) D=( (16.3) sin φ cos φ geht die Matrix A der quadratischen Form in die Matrix C = DT ∙ A ∙ D

(16.4)

16 Zweidimensionale quadratische Formen |

145

mit |C| = |DT | ⋅ |A| ⋅ |D| = |A| über. Die quadratische Form verändert ihren Charakter dadurch nicht, denn es wird lediglich das Koordinatensystem in die Hauptachsenlage (vgl. Abschn. 17) gedreht. Durch orthogonale Koordinatentransformation kann jede quadratische Form vereinfacht werden. Jede symmetrische Matrix A lässt sich mit Hilfe einer Drehmatrix D auf die Diagonalform C (mit c12 = c21 = 0) bringen. Jede quadratische Form lässt sich also in der reduzierten Form q = c11 u2 + c22 v2 schreiben. (Wenn der Rang der Matrix A kleiner als zwei ist, so enthält die Summe weniger als zwei Summanden.) Beispiel: Die symmetrische Matrix A = ( 12 21 ) soll durch Drehung um die z-Achse auf Diagonalform gebracht werden. Zu suchen ist die zweidimensionale Drehmatrix D, so dass C in (16.4) Diagonalmatrix ist. Wir berechnen zunächst DT ∙ A (

cos φ − sin φ

sin φ 1 )∙( cos φ 2

2 cos φ + 2 sin φ )=( 1 − sin φ + 2 cos φ

2 cos φ + sin φ ) −2 sin φ + cos φ

und multiplizieren dies von rechts mit D cos φ + 2 sin φ ( − sin φ + 2 cos φ

2 cos φ + sin φ cos φ )∙( −2 sin φ + cos φ sin φ

− sin φ ) cos φ

1 + 4 sin φ cos φ =( −2 sin2 φ + 2 cos2 φ

−2 sin2 φ + 2 cos2 φ ). 1 − 4 sin φ cos φ

Aus der Forderung C=(

c11 0

0 ) c22



c12 = c21 = 2(cos2 φ − sin2 φ ) = 0

ergibt sich der Drehwinkel φ zu ±45° oder ±135°. Wählen wir φ = +45° oder φ = −135°, so wird C=(

3 0

0 ) −1

⇒ q = 3u2 − v2 .

(16.5)

Die beiden anderen Winkel φ = −45° oder φ = +135° führen zur Matrix −1 0

C󸀠 = (

0 ) 3

⇒ q = −u󸀠2 + 3v󸀠2

(16.6)

wobei also lediglich eine unwesentliche Koordinatenvertauschung v󸀠 = u und u󸀠 = v stattfindet. Die zu D inverse Matrix ist D−1 = DT . Wegen (16.2) folgt: U = DT ∙ X u = x cos φ + y sin φ v = −x sin φ + y cos φ

146 | 16 Zweidimensionale quadratische Formen Für festes q ∈ ℝ unterscheiden wir spezielle Klassen quadratischer Formen: q = c11 x2 + c22 y2 (16.7) Besitzen beide Koeffizienten cii dasselbe Vorzeichen wie q, so heißt die quadratische Form Ellipse und im Spezialfall c11 = c22 Kreis. (16.8) Besitzen die beiden Koeffizienten cii verschiedene Vorzeichen, so heißt die quadratische Form Hyperbel. (16.9) Besitzen beide Koeffizienten cii das zu q entgegengesetzte Vorzeichen, so lässt sich q nicht mit reellen Zahlen x, y darstellen. Die ersten beiden Fälle sind die reellen zweidimensionalen quadratischen Formen. Ellipse und Hyperbel sowie Kreis und Parabel (S. 158) heißen Kegelschnitte, weil sie beim Schnitt eines Kegels mit einer Ebene entstehen (als Grenzfälle entstehen auch Geraden und Punkte). Zur Darstellung unseres Beispiels wählen wir q = 1. Jede andere Wahl von q kann mit Koeffizienten cii /q auf diesen Fall zurückgeführt werden. Es ergibt sich eine Hyperbel 1 = 3u2 − v2

(16.10)

v2 = 3u2 − 1.

(16.11)

oder

Um den Vorteil der Koordinatentransformation zu veranschaulichen, vergleichen wir mit der Darstellung in den ursprünglichen Koordinaten 1 = x2 + 4xy + y2 .

(16.12)

Zur Isolierung von y müssen wir hier zunächst eine quadratische Gleichung lösen. Und dann ergibt sich der wesentlich unübersichtlichere Ausdruck y = −2x± √3x2 + 1, der jedoch dieselbe geometrische Figur beschreibt (s. Abb. 16.1).

Abb. 16.1: Die Hyperbel des Beispiels in zwei verschiedenen Lagen (16.12) und (16.11).

16.1 Allgemeine Gleichungen zweiten Grades |

147

16.1 Allgemeine Gleichungen zweiten Grades Wir betrachten eine um (α , β ) parallelverschobene (s. Abschn. 8.6) allgemeine quadratische Form mit der symmetrischen Matrix A = (aij ) q = a11 (x − α )2 + 2a12 (x − α )(y − β ) + a22 (y − β )2 .

(16.13)

Durch Ausmultiplizieren ergibt sich: q = a11 x2 − 2a11 xα + a11 α 2 + 2a12 xy − 2a12 xβ − 2a12 α y + 2a12 αβ + a22 y2 − 2a22 yβ + a22 β 2 Fassen wir alle Glieder der Potenzen von x und y sowie die absoluten Glieder zusammen, so folgt nach Umbenennung ein Ausdruck der Form 0 = b11 x2 + 2b12 xy + b22 y2 + 2b13 x + 2b23 y + b33

(16.14)

wobei: b11 = a11

(16.15)

b12 = a12

(16.16)

b22 = a22

(16.17)

b13 = −a11 α − a12 β

(16.18)

b23 = −a12 α − a22 β 2

(16.19) 2

b33 = a11 α + 2a12 αβ + a22 β − q

(16.20)

Ist also eine allgemeine quadratische Gleichung der Form (16.14) mit den sechs Koeffizienten bij gegeben, so lässt sich daraus die symmetrische quadratische Form (16.13) berechnen. Einsetzen von (16.15) und (16.16) in (16.18) und von (16.16) und (16.17) in (16.19) liefert α und β ; damit folgt q aus (16.20). Durch Parallelverschiebung des Koordinatensystems um α längs der x-Achse und um β längs der y-Achse werden α und β eliminiert. Jede quadratische Gleichung in zwei Variablen lässt sich daher durch Parallelverschiebung in die bekannte quadratische Form mit einer symmetrischen 2 × 2-Matrix A überführen. Durch Drehung kann diese dann zu einer diagonalen 2 × 2Matrix C reduziert werden. Beispiel: Gegeben sei die Gleichung 0 = x2 + 4xy + y2 − 10x + 16y − 84

(16.21)

also eine Gleichung der Form (16.14) mit linearen und quadratischen Gliedern in den Variablen x und y. Um daraus eine Gleichung der Form (16.13) zu gewinnen, berechnen

148 | 16 Zweidimensionale quadratische Formen wir: a11 = b11 = 1

(16.15󸀠 )

a12 = b12 = 2

(16.16󸀠 )

a22 = b22 = 1

(16.17󸀠 )

b12 β = −b11 α − b13

(16.18󸀠 )

b12 α = −b22 β − b23

(16.19󸀠 )

q = b11 α 2 + 2b12 αβ + b22 β 2 − b33

(16.20󸀠 )

Einsetzen von (16.19󸀠 ) in (16.18󸀠 ) liefert mit b13 = −5 und b23 = 8 b22 β + b23 − b13 b12 b b − b13 b12 1 ⋅ 8 − (−5) ⋅ 2 18 β = 11 23 = = = 6. b12 b12 − b11 b22 2⋅2−1⋅1 3

b12 β = b11

Damit ergibt sich α aus (16.19󸀠 ) 2α = −6 − 8 ⇒ α = −7 und dann q aus (16.20󸀠 ) mit b33 = −84 q = 1 ⋅ 49 + 2 ⋅ 2 ⋅ (−7) ⋅ 6 + 1 ⋅ 36 − (−84) = 1. Die gegebene Gleichung (16.21) lautet also umgeformt 1 = (x + 7)2 + 4(x + 7)(y − 6) + (y − 6)2 .

(16.22)

Parallelverschiebung des Koordinatensystems um β = 6 Einheiten in y-Richtung und α = (−7) Einheiten in x-Richtung führt mit q = 1 auf die bereits bekannte Form (16.12) mit der symmetrischen Matrix A. Drehung ergibt dann die quadratische Form (16.10) mit der Diagonalmatrix (16.5). Die Koeffizienten bij der allgemeinen Gleichung zweiten Grades (16.14) lassen sich formal zu einer symmetrischen 3 × 3-Matrix zusammenfassen b11 B = (b21 b31

b12 b22 b32

b13 b23 ) b33

mit bij = bji .

Um ohne Transformation feststellen zu können, welche Art von Kegelschnitt vorliegt, berechne man die Determinante |B| dieser Matrix. Nicht-entartete Kegelschnitte ergeben sich nur für |B| ≠ 0, andernfalls ergeben sich entartete Kegelschnitte, das sind Geraden oder Punkte, reell oder komplex. Ist |B| ≠ 0, so berechne man die Determinante der Untermatrix 󵄨 󵄨󵄨󵄨b b12 󵄨󵄨󵄨 󵄨󵄨 = b11 b22 − b212 = |A| |B33 | = 󵄨󵄨󵄨󵄨 11 󵄨󵄨b21 b22 󵄨󵄨󵄨

16.2 Eigenwerte und Eigenvektoren | 149

Abb. 16.2: Punkte der parallelverschobenen Hyperbel (16.22).

sowie die Spur (das ist die Summe der Diagonalelemente) Spur(B33 ) = b11 + b22 = Spur(A). Nicht entartete Kegelschnitte lassen sich folgendermaßen erkennen: |B33 | < 0 ∧ |B| ≠ 0

⇒ Hyperbel

(16.23)

|B33 | = 0 ∧ |B| ≠ 0

⇒ Parabel

(16.24)

|B33 | > 0 ∧ |B| ⋅ Spur(B33 ) < 0

⇒ Ellipse oder Kreis

(16.25)

Zur Bestimmung und Vereinfachung einer beliebigen quadratischen Gleichung mit zwei Variablen und vorgegebenen Koeffizienten kann folgendes Schema dienen: 1. Ablesen der Koeffizienten bij der Matrix B (s. 16.14) aus den gegebenen Zahlen. 2. Bestimmung der Art des Kegelschnittes aus |B| , |B33 | und Spur(B33 ). 3. Berechnung von α , β , q nach (16.18–16.20) unter Berücksichtigung der Identität A = B33 (16.15–16.17). 4. Drehung der symmetrischen 2 × 2-Matrix B33 = A nach (16.4), so dass eine diagonale 2 × 2-Matrix C entsteht.

16.2 Eigenwerte und Eigenvektoren Wenn die Gleichung A∙X =λ ⋅X

(16.26)

mit λ ∈ ℝ besteht, dann heißt λ ein Eigenwert und X ein Eigenvektor der Matrix A. Ein zweidimensionales Beispiel ist (

λ 0

x x 0 ) ∙ ( ) = λ ⋅ ( ). λ y y

Satz. Die Eigenwerte der n × n-Matrix A sind Lösungen der Gleichung D(A − λ I) = 0.

(16.27)

150 | 16 Zweidimensionale quadratische Formen Beweis. Die Determinante der Matrix (A − λ I) verschwindet genau dann, wenn der Kern der von ihr vermittelten Abbildung mindestens einen Vektor X ≠ 0 enthält, so dass (A − λ I) ∙ X = 0, also A ∙ X = λ I ∙ X = λ X. Beispiel: Für 1 2

A=(

2 ) 1

ist

󵄨󵄨 󵄨1 − λ D(A − λ I) = 󵄨󵄨󵄨󵄨 󵄨󵄨 2

󵄨 2 󵄨󵄨󵄨 󵄨󵄨 . 1 − λ 󵄨󵄨󵄨

Die Eigenwerte folgen also aus (1 − λ )2 − 4 = 0 ⇒ λ 2 − 2λ − 3 = 0 ⇒ λ1 = 3, λ2 = −1. Die Eigenvektoren ergeben sich nach (16.26) aus (

1 2

2 x x )∙( )=3⋅( ) 1 y y

und

1 ( 2

2 x x ) ∙ ( ) = −1 ⋅ ( ) . 1 y y

Die zugehörigen linearen Gleichungssysteme sind: x + 2y = 3x

x + 2y = −x

2x + y = 3y

2x + y = −y

⇒x=y

⇒ x = −y

λ ) mit λ ∈ ℝ, z. B. ( 1 ) und ( 1 ) . Die Eigenvektoren sind ( λλ ) und ( −λ −1 1 1 ) und berechnen ihre Bilden wir aus diesen Eigenvektoren eine Matrix M = ( 11 −1 Inverse 1/2 1/2 ) M −1 = ( 1/2 −1/2

dann ist 1/2 1/2

C = M −1 ∙ A ∙ M = (

1/2 1 )∙( −1/2 2

2 1 )∙( 1 1

1 3 )=( −1 0

0 ) −1

Diagonalmatrix, deren Diagonale die Eigenwerte enthält.

Übungen 16.1 Beweisen Sie anhand der folgenden Gleichung: Bei der Drehung einer symmetrischen 2 × 2-Matrix bleibt die Spur erhalten (

cos φ − sin φ

sin φ a ) ∙ ( 11 cos φ a21

cos φ a12 )∙( sin φ a22

− sin φ c ) = ( 11 cos φ c21

c12 ). c22

16.2 1 = 5x2 + 3xy + 7y2 . Finden Sie die Diagonalmatrix C. Finden Sie die Drehwinkel für die Hauptachsenlage. 16.3 5 = 3x2 − 2xy + y2 . Finden Sie die Diagonalmatrix C. Finden Sie die Drehwinkel für die Hauptachsenlage.

16.2 Eigenwerte und Eigenvektoren | 151

16.4 1 = x2 + 2xy + y2 . Finden Sie die Diagonalmatrix C. Finden Sie die Drehwinkel für die Hauptachsenlage. 16.5 Gegeben ist die allgemeine Gleichung zweiten Grades 0 = 9x2 + 4y2 −54x−32y + 109. Formen Sie um in Mittelpunktslage. Bestimmen Sie |B|, |B33 | und Spur(B33 ). Skizzieren Sie die quadratische Form im kartesischen Koordinatensystem. 16.6 (a) Gegeben ist die quadratische Form −4 = x2 + 3y(x − y). Man bestimme die Art des Kegelschnittes und die Richtung seiner Achsen. Skizzieren Sie die quadratische Form im kartesischen Koordinatensystem. (b) Zur alternativen Berechnung der C-Matrix benutze man |C| = |A| und Spur(C) = Spur(A). 16.7 1 = xy. Bestimmen Sie |B|, |B33 | und Spur(B33 ). Finden Sie die Diagonalmatrix C. Skizzieren Sie die quadratische Form im kartesischen Koordinatensystem.

17 Die Kegelschnitte Da sich alle quadratischen Formen durch Koordinatentransformationen diagonalisieren lassen, betrachten wir im Folgenden nur quadratische Formen in solcher einfachen Gestalt. Zu den Kegelschnitten gehören Kreis, Ellipse, Parabel und Hyperbel sowie die entarteten Kegelschnitte Punkt, Gerade und gekreuzte Geraden.

17.1 Die Ellipse Die quadratische Form q = c11 x2 + c22 y2 mit sgn c11 = sgn c22 = sgn q, d. h. alle Vorzeichen sind gleich, heißt Ellipse und im Grenzfall c11 = c22 Kreis. Durch Streckung kann jede Ellipse in einen Kreis überführt werden. Analog entsteht eine Ellipse, wenn ein Kreis in einer Richtung gestreckt wird. Durch Umbenennung der Koeffizienten q = a2 c11

q = b2 c22

erhält man die implizite Mittelpunktsgleichung der Ellipse y 2 x 2 1=( ) +( ) . a b

(17.1)

OBdA sei a ≥ b: Dann heißt a große Halbachse und b kleine Halbachse der Ellipse. 2a ist die Hauptachse, 2b die Nebenachse. Für a = b = r heißt r Radius und 2r Durchmesser des Kreises. Umformung der impliziten Mittelpunktsgleichung ergibt die explizite Mittelpunktsgleichung für die Ellipse b y = ± √ a2 − x 2 a

(17.2)

y = ±√r2 − x2 .

(17.3)

bzw. für den Kreis

Die liegende Ellipse geht somit aus einem Kreis mit dem Radius r = a durch Stauchung seiner y-Koordinaten um den Faktor b/a = b/r hervor. (Eine Streckung um einen Faktor kleiner als 1 wird auch Stauchung genannt.) Da jedes Flächenelement der Ellipse um diesen Faktor verkleinert wird, geht die Fläche A der Ellipse aus der des Kreises (s. S. 49) hervor AEllipse =

b b = π a2 = π ab. A a Kreis a

(17.4)

17.1 Die Ellipse

|

153

Abb. 17.1: Ellipse und Kreis vom Radius r = a.

Die Schnittpunkte des Ellipsenrandes mit den Achsen heißen Scheitel. Die Hauptscheitel liegen auf der (längeren) Hauptachse, die Nebenscheitel auf der (kürzeren) Nebenachse. Bei der Ellipse bezeichnet man e = √ a2 − b 2

(17.5)

als lineare Exzentrizität. Die lineare Exzentrizität des Kreises ist e = 0. Die im Abstand e vom Mittelpunkt M auf der Hauptachse gelegenen Punkte F1 und F2 heißen Brennpunkte. Sie sind um e aus dem Zentrum gerückt, also „exzentriert“. Wegen e2 + b2 = a2 ist die Strecke zwischen einem Brennpunkt und einem Nebenscheitel gleich a.

Abb. 17.2: Die Ellipse in Mittelpunktslage und ihre Bestimmungsgrößen.

Das Verhältnis von linearer Exzentrizität und großer Halbachse ε=

e a

heißt numerische Exzentrizität. Für jede Ellipse ist ε < 1.

(17.6)

154 | 17 Die Kegelschnitte Die Länge des von F1 zum Punkt P führenden Radius r1 (s. Abb. 17.3) ist r12 = (e + x)2 + y2 b2 2 (a − x2 ) a2 b2 = a2 − b2 + 2ex + x2 + b2 − 2 x2 a a2 − b2 2 2 = x + 2ex + a a2 2 e = 2 x2 + 2ex + a2 a 2 e = ( x + a) a ⇒ r1 = a + ε x. = e2 + 2ex + x2 +

(17.7)

Entsprechend findet man für die Länge des zum selben Punkt P führenden, von F2 ausgehenden Radius (s. Abb. 17.3) r22 = (e − x)2 + y2 ⇒ r2 = a − ε x.

(17.8)

Die Summe der Radiuslängen ist daher mit (17.7) und (17.8) r1 + r2 = 2a.

(17.9)

Abb. 17.3: Zur Berechnung der Radiensumme und zur Ableitung der Polargleichung.

Abb. 17.4: Fadenkonstruktion der Ellipse.

Diesen Umstand benutzt man zur zeichnerischen Gärtner- oder Fadenkonstruktion der Ellipse nach Anthemios von Tralleis (Erbauer der Hagia Sophia in Konstantinopel).

17.1 Die Ellipse

|

155

Eine andere zeichnerische Konstruktion geht von Gleichung (17.2) aus, die leicht umgeformt zu der Proportionalität √a2 − x2 y =± b a

(17.2󸀠 )

führt. Konstruktion der Ellipse (a und b gegeben): Nach Abb. 17.5 konstruiert man zwei konzentrische Kreise mit Radien a und b, zeichnet einen Radius ein und fällt von seinem Ende das Lot L auf die x-Achse. Vom Schnittpunkt des Radius mit dem kleineren Kreis fällt man das Lot auf das erste Lot L. Der Schnittpunkt beider Lote ist ein Punkt der Ellipse, denn nach dem Strahlensatz verhält sich die Lothöhe L = √a2 − x2 zum großen Radius a wie die Ordinate y zum kleinen Radius b.

Abb. 17.5: Zweikreiskonstruktion der Ellipse.

Durch Parallelverschiebung der Ellipse um a in x-Richtung erreicht man, dass der linke Scheitel im Ursprung liegt. Die explizite Mittelpunktsgleichung der Ellipse wird dann zu y2 =

b2 2 x2 b2 2 b2 2 2 2 (2x ). [a ] (a ) − (x − a) − x + 2xa − a − = = a a a2 a2

b2 a heißt Parameter der Ellipse. Damit erhält man die Scheitelgleichung p y2 = 2px − x2 = 2px − (1 − ε 2 ) x2 . a Für den Kreis mit Radius r ergibt sich analog die Scheitelgleichung p=

(17.10)

y2 = r2 − (x − r)2 = r2 − x2 + 2rx − r2 = 2rx − x2 . Für x → 0 sind quadratische Glieder vernachlässigbar. Beide Kurven stimmen dann überein, wenn r = p. In den Scheitel der Halbachse a kann man einen Schmiegekreis des Radius p einbeschreiben. p heißt daher Scheitelkrümmungsradius ra ra =

b2 = p. a

(17.11)

156 | 17 Die Kegelschnitte Der Mittelpunkt dieses Schmiegekreises (s. Abb. 17.6 und Abb. 17.9) ist nicht der Brennpunkt! Es sei denn, die Ellipse ist zu einem Kreis entartet. Den Scheitelkrümmungsradius des Nebenscheitels erhält man durch Vertauschen von a und b zu rb =

a2 . b

Abb. 17.6: Ellipse in Scheitellage mit Schmiegekreisen in Hauptscheitel und Nebenscheitel.

Abb. 17.7: Zur Parameterform der Polargleichung.

Wir wollen nun die Ellipse von ihrem linken Brennpunkt F1 aus beschreiben. Wir bezeichnen diesen Punkt, um den sich alles dreht, als Pol und die sich ergebende Gleichung als Polargleichung. Um den Abstand zwischen Pol F1 und Ellipsenpunkt P als Funktion des Winkels φ zu berechnen, entnehmen wir aus Abb. 17.3 mit r := r1 cos φ =

e+x r



x = r cos φ − e.

Die Länge des unter dem Winkel φ zur Hauptachse liegenden Radius r ist nach (17.7) r = a + ε x, so dass r = a + ε r cos φ − ε e. Mit εe =

e2 a2 − b2 = =a−p a a

folgt r (1 − ε cos φ ) = p und damit die von der Wahl des Koordinatensystems unabhängige Polargleichung der Ellipse p r= . (17.12) 1 − ε cos φ Die Ordinate in den Brennpunkten (cos φ = 0) ist |y| = p. Der Radius r kann auch als Vektor betrachtet werden. Damit gelangen wir zur Parameterform der Polargleichung (s. Abb. 17.7): rx =

p cos φ 1 − ε cos φ

ry =

p sin φ 1 − ε cos φ

17.1 Die Ellipse

|

157

Mit den Koordinaten x und y der Mittelpunktsgleichung besteht der Zusammenhang (s. r1 in Abb. 17.3) rx = x + e und ry = y. Eine weitere Definition der Ellipse geht von einer Leitgeraden L und einem nicht auf ihr liegenden Brennpunkt F aus. Die Ellipse ist der geometrische Ort aller Punkte, deren Abstände d von L und r von F im Verhältnis r =ε 1.

17.3 Die Hyperbel | 161

Durch Parallelverschiebung der Hyperbel um (−a) in x-Richtung erreicht man, dass der rechte Scheitel im Ursprung liegt.¹ Aus der Mittelpunktsgleichung ergibt sich dann die Scheitelgleichung y2 =

x2 b2 2 b2 b2 2 2 2 2 (2x ). [(x ] (x ) + + a) = = − a + 2xa + a − a a a a2 a2

Mit dem Parameter der Hyperbel p=

b2 a

(17.10󸀠 )

lautet ihre Scheitelgleichung y2 = 2px +

p 2 x = 2px − (1 − ε 2 ) x2 . a

Wie für Ellipse und Parabel ist der Parameter p gleichzeitig der Radius des Schmiegekreises und die Ordinate im Brennpunkt |y(F)| = p. Ersteres folgt aus der Scheitelgleichung für x → 0 im Vergleich mit der Scheitelgleichung des Kreises, Letzteres für cos φ = 0 aus der Polargleichung r=

p . 1 − ε cos φ

(17.12󸀠 )

Da bei der Hyperbel ε > 1 ist, kann r in (17.12󸀠 ) negativ werden. Dies ist der Fall, wenn der Winkel φ < arctan(b/a) ist. Dann trifft der Radius nicht auf den näher liegenden Zweig der Hyperbel. Auch hier hilft die Vorstellung von der Durchmessung des Unendlichen. Trägt man nämlich die negative Strecke in Richtung φ , also die positive in der Gegenrichtung auf, so erhält man einen Punkt des ferner liegenden linken Hyperbelastes. In (17.12󸀠 ) gehen wir vom rechten Brennpunkt aus, den wir als F1 bezeichnen (s. Abb. 17.12 und Abb. 17.13 sowie die Fußnote). Unter Beachtung dieses Zusammenhangs ist die Summe der Längen der Radien −p p unter den Winkeln 0 und π , |r(0)| = 1−ε und r(π ) = 1+ε von F1 zu den beiden Scheiteln der Hyperbel und damit der Abstand ihrer Brennpunkte |r(0)| + r(π ) =

−p(1 + ε ) + p(1 − ε ) −2pε −2pε 2pε = = b2 = p = 2e. 2 2 1 − ε2 1 − a a+b − 2 a a2

1 Dies entspricht der Vorstellung, dass der linke Brennpunkt F1 der Ellipse ins negativ Unendliche auswandert und als Brennpunkt einer Hyperbel aus dem positiv Unendlichen wiederkehrt. F2 nimmt den umgekehrten Weg. Die „Durchmessung des Unendlichen“ hat selbstverständlich nur rein symbolische Bedeutung. Sie lässt sich durch die Hyperbelfunktion f (x) = 1/x auf dem Intervall [−1, 1] \ {0} veranschaulichen.

162 | 17 Die Kegelschnitte

Abb. 17.13: Konstruktion von Punkten der Hyperbel mit der Polargleichung (17.12󸀠 ).

Der Radius vom Brennpunkt F1 unter dem Winkel φ kann auch als Vektor verstanden und durch seine Komponenten ausgedrückt werden. Damit gelangen wir zur Parameterform der Polargleichung: rx =

p cos φ 1 − ε cos φ

ry =

p sin φ 1 − ε cos φ

Mit den Koordinaten x und y der Mittelpunktsgleichung besteht der Zusammenhang (s. r1 in Abb. 17.14) rx = x − e und ry = y. Die Länge des von F1 zum Punkt P führenden Radius r1 ist in Mittelpunktskoordinaten r12 = (x − e)2 + y2 b2 2 (x − a2 ) a2 b2 = x2 − 2ex + a2 + b2 + 2 x2 − b2 a a2 + b2 2 = x − 2ex + a2 a2 e2 = 2 x2 − 2ex + a2 a 2 e = ( x − a) a ⇒ r1 = ε x − a. = x2 − 2ex + e2 +

(17.24)

Entsprechend findet man für die Länge des zum selben Punkt P führenden, von F2 ausgehenden Radius r22 = (e + x)2 + y2 ⇒ r2 = ε x + a.

(17.25)

17.3 Die Hyperbel | 163

Abb. 17.14: Zur Differenz der Radien bei der Hyperbel.

Abb. 17.15: Fadenkonstruktion der Hyperbel mit Hilfe eines drehbar fixierten Lineals (nach Guido Ubaldi del Monte). Genau genommen muss sich das Lineal um seinen in F2 gelegenen Eckpunkt links unten drehen, nicht um das Loch zum Aufhängen!

Abb. 17.16: Hyperbelkonstruktion mit einer Leitgeraden.

Die Differenz der Längen der Radien ist daher r2 − r1 = 2a.

(17.26)

Eine weitere Definition der Hyperbel geht von einer Leitgeraden L und einem nicht auf ihr liegenden Brennpunkt F aus. Die Hyperbel ist der geometrische Ort aller Punkte,

164 | 17 Die Kegelschnitte deren Abstände d von L und r von F im Verhältnis r =ε >1 d

(17.27)

stehen. Mit (17.12󸀠 ) und der aus Abb. 17.16 folgenden Beziehung d = f + r cos φ ergibt sich die Bedingung 1 d f f fε = = + cos φ = − cos φ + cos φ = const. ε r r p p Diese Bedingung ist erfüllbar und erfüllt für f =

b2 p = . ε √a2 + b2

(17.28)

Der Scheitelabstand vom näheren Brennpunkt ist r(π ) = e − a =

p . 1+ε

Wie bei Ellipse und Parabel gilt daher (17.15).

Abb. 17.17: Übersicht: Von kartesischen Koordinaten unabhängige Größen der Hyperbel.

17.4 Tangenten und Polaren der Kegelschnitte Eine Gerade, die den Kreis in einem Punkte berührt, heißt Tangente an den Kreis. Die Tangente t steht senkrecht auf dem zum Berührungspunkt weisenden Radiusvektor R. Mit dem zu einem anderen Punkt der Tangente weisenden Vektor T folgt die Gleichung R⋅(T−R) = 0 ⇒ R⋅T = R⋅R = R2 . Dies ist die Mittelpunktsform der Tangentengleichung, vektoriell also R⋅T R ⋅ T = R2 oder =1 (17.29) R2

17.4 Tangenten und Polaren der Kegelschnitte | 165

Abb. 17.18: Eine Tangente t an den Kreis mit Radius R sowie zwei auf t liegende Punkte R und T .

und als Koordinatengleichung xR xT + yR yT = R2

oder

xR xT y y + R 2T = 1. R2 R

(17.30)

Liegt der Kreismittelpunkt nicht im Ursprung des Koordinatensystems, sondern bei M, so sind die Gleichungen entsprechend zu transformieren: (R − M) ⋅ (T − M) = R2 (xR − xM ) ⋅ (xT − xM ) + (yR − yM ) ⋅ (yT − yM ) = R2 Um die Tangentengleichung der Ellipse abzuleiten, kann man nicht vom Verschwinden des Skalarproduktes R ⋅ (T − R) ausgehen, da hier die Tangente im Allgemeinen nicht senkrecht auf dem Radiusvektor R des Berührungspunktes steht. Man erhält die Mittelpunktsform der Tangentengleichung aber aus (17.30), indem alle x-Koordinaten mit R/a und alle y-Koordinaten mit R/b multipliziert werden x R xT y y + R 2 T = 1. a2 b

(17.31)

Für die um M aus dem Mittelpunkt verschobene Ellipse haben wir (xR − xM ) ⋅ (xT − xM ) (yR − yM ) ⋅ (yT − yM ) + = 1. a2 b2 Die Tangenten der Hyperbel ergeben sich ganz analog, in Mittelpunktsform also aus xR xT yR yT − 2 = 1. a2 b

(17.32)

Eine Gerade, die den Kreis schneidet, heißt Sekante. Ihr im Kreisinnern gelegener Teil heißt Sehne. Von einem Punkt S außerhalb eines Kreises lassen sich immer zwei Tangenten an den Kreis legen. Die Sehne, welche diese beiden Berührungspunkte verbindet, heißt Polare. Wie man aus Symmetriegründen erkennt, liegt die Polare p in der Richtung von R1 − R2 und damit senkrecht zu dem Vektor S, dem Schnittpunkt t1 ∩ t2 der beiden Tangenten. Für alle Punkte P der Polare p gilt daher S ⋅ (P − R1 ) = 0 oder S ⋅ P = S ⋅ R1 . Wegen S ⋅ R1 = |S| |R1 | ⋅ cos φ = |S| |R1 | ⋅ |R1 |/|S| = |R1 |2 = R2 gilt die Mittelpunktsform der Polarengleichung S ⋅ P = R2

oder

S⋅P =1 R2

(17.33)

166 | 17 Die Kegelschnitte und als Koordinatengleichung xS xP + yS yP = R2

oder

xS xP yS yP + 2 = 1. R2 R

(17.34)

Liegt der Kreismittelpunkt nicht im Ursprung des Koordinatensystems, sondern bei M, so sind die Gleichungen entsprechend zu transformieren: (S − M) ⋅ (P − M) = R2 (xS − xM ) ⋅ (xP − xM ) + (yS − yM ) ⋅ (yP − yM ) = R2 Um die Polarengleichung der Ellipse abzuleiten, kann man nicht vom Verschwinden des Skalarproduktes S ⋅ (P − R1 ) ausgehen, denn die Polare p steht im Allgemeinen nicht senkrecht auf dem Vektor S. Man erhält die Mittelpunktsform der Polarengleichung aber aus (17.34), indem alle x-Koordinaten mit R/a und alle y-Koordinaten mit R/b multipliziert werden xS xP yS yP + 2 = 1. a2 b

(17.35)

Für die um M aus dem Mittelpunkt verschobene Ellipse haben wir (xS − xM ) ⋅ (xP − xM ) (yS − yM ) ⋅ (yP − yM ) + = 1. a2 b2 Die Polare der Hyperbel ergibt sich ganz analog, in Mittelpunktsform also aus xS xP yS yP − 2 = 1. a2 b

Abb. 17.19: Zum Punkt S gehörende Tangenten t1 und t2 und Polare p eines Kreises vom Radius R.

(17.36)

17.5 Vergleich der Kegelschnitte | 167

Abb. 17.20: Zum Punkt S gehörende Tangenten t1 und t2 und Polare p einer Ellipse.

17.5 Vergleich der Kegelschnitte Kreis

Ellipse

Parabel

Hyperbel

a

a



a

p

r=a=b

b2 a

b2 a

b2 a

[M, F ] = e e ε = a π r( ) 2 [F , S] = r(π )

0

√a2 − b2



√a2 + b2

0

0 2 p > 2 >p

p 2 p < 2

0 ist der absolute Term, d. h. die rechte Seite von (17.50) positiv. Da der Koeffizient von v2 gleich (+ 1) ist, ergibt sich eine Ellipse. Für z0 < 0 ist b13 ≤ 0 (vgl. (17.48), denn bei der Wahl des Drehwinkels φ zwischen 0 und π wird sinφ niemals negativ). Daher ist der Mittelpunkt der Ellipse um |b13 /b11 | in u-Richtung verschoben. In diesem Falle schneidet die u, v-Ebene den oberen Kegel (vgl. Abb. 17.21 und Abb. 17.22). Der Schnittpunkt des rechten Kegelrandes mit der u, v-Ebene wandert mit wachsendem Drehwinkel φ immer schneller in u-Richtung, während sich ihr Schnittpunkt mit dem linken Kegelrand kaum verändert (vgl. Abb. 17.22). Daher wandert der Mittelpunkt der Ellipse immer weiter in die u-Richtung. (Ein Schnitt der u, v-Ebene mit dem unteren

17.6 Begründung der Bezeichnung „Kegelschnitt“ | 171

Abb. 17.23: (a) Parabel und (b) Hyperbel.

Kegel, also z0 > 0, würde b13 ≥ 0 implizieren und den Mittelpunkt der Ellipse um −|b13 /b11 |, also in die negative u-Richtung verschieben.) Für b11 = 0 folgt aus (17.47) cos2 φ = k2 sin2 φ oder cos2 φ = tan2 𝛾 ⋅ sin2 φ , d. h. 1 = tan2 𝛾 ⋅ tan2 φ oder kurz φ = π /2 − 𝛾. Nun schneidet die u, v-Ebene den Kegel nicht mehr vollständig (s. Abb. 17.23 (a)). Der Mittelpunkt der Ellipse ist nicht mehr vorhanden; man sagt, er sei „ins Unendliche ausgewandert“. Wie man aus (17.49) abliest, ergibt sich eine Parabel. Im Grenzfalle z0 = 0 wird auch b13 = 0, und die Parabel entartet zu der Geraden v = 0 in der u, v-Ebene. Der Schnitt des Kegels mit der u, vEbene ist also in diesem Falle die u-Achse. Weitere Drehung φ > π /2 − 𝛾 führt zu einer Hyperbel, da b11 nun negativ ist und die Koeffizienten von u und v in (17.50) somit verschiedene Vorzeichen besitzen (s. Abb. 17.23 (b)). Für den Drehwinkel φ = π /2 liefert (17.46) ein Paar sich kreuzender Geraden v2 = [k(u − z0 )]2 ⇒ v = ±k(u − z0 ).

Übungen 17.1 x = 0 ist die Gleichung der y-Achse in der x, y-Ebene. Welche Geraden beschreiben die folgenden Gleichungen in der x, y-Ebene? (a) x − 3 = 0 (b) y + 5 = 0 (c) y − 2 = 3(x − 5) + 3 17.2 x2 + y2 = 0 ist die Ursprungsgleichung eines entarteten Kreises, also eines Punktes. Welche Punkte beschreiben die folgenden Gleichungen in der x, y-Ebene? (a) (x − 3)2 + y2 = 0 (b) x2 + (y + 5)2 = 0 (c) (x + 1)2 + (y − 2)2 = 0 17.3 Wo schneiden sich die Ellipsen 1 = (x/10)2 + (y/5)2 und 1 = ((x − 5)/10)2 + (y/5)2 ?

172 | 17 Die Kegelschnitte 17.4 Wo schneiden sich die quadratische y2 = 25 − (x/2)2 und die lineare Form y = 2x + 1? Skizzieren Sie die Formen! 17.5 Welche Kegelschnitte beschreiben die folgenden quadratischen Formen? (a) 2x2 − y2 = 2 (b) (x − 2)2 = 0 (c) x2 − 3y2 − 2 = 0 (d) 2 − 4x2 − y2 = 0 17.6 Eine Ellipse besitzt den Parameter p = 3,2 und die Fläche 20π . (a) Bestimmen Sie die Halbachsen und geben Sie die explizite Mittelpunktsgleichung an, so dass die Hauptachse in der x-Achse liegt. (b) Wie lautet diese Gleichung, wenn die Ellipse so weit verschoben wird, dass ihr linker Scheitel die Koordinaten x = 2 und y = 2 besitzt? (c) Bestimmen Sie lineare und numerische Exzentrizität der Ellipse. (d) Bestimmen Sie den Abstand ihrer Brennpunkte. (e) Tragen Sie die berechneten Größen in eine Skizze ein. 17.7 Die Fläche einer Ellipse beträgt A = 50π , ihre numerische Exzentrizität ist ε = (√3)/2. Im Mittelpunkt der Ellipse ist eine Höhe h = 10 errichtet. Von ihrem oberen Punkt führen Geraden zu den Scheiteln der Ellipse. (a) Wie groß sind die Winkel zwischen den Geraden? (b) Wie groß sind die Winkel zwischen den Geraden und der Höhe? 17.8 (a) Berechnen Sie die charakteristischen Größen (a, b, e, ε ) für eine Ellipse, deren Fläche A = 25 beträgt und deren Schmiegekreis im Hauptscheitel den Radius 2 besitzt. (b) Der Mittelpunkt der Ellipse besitzt die Koordinaten (1, −3). Wie lautet die implizite Mittelpunktsgleichung dieser Ellipse? 17.9 (a) Berechnen Sie die charakteristischen Größen (a, b, e, ε ) für eine Ellipse, deren Fläche A = 17 beträgt und deren Schmiegekreis im Hauptscheitel den Radius 2 besitzt. (b) Der Mittelpunkt der Ellipse besitzt die Koordinaten (1, −3). Wie lautet die implizite Mittelpunktsgleichung dieser Ellipse? 17.10 Eine Hyperbel besitzt den Parameter p = 8 und die numerische Exzentrizität ε = 3. Ihre Brennpunkte liegen auf der x-Achse. Stellen Sie die Polargleichung auf, tabellieren Sie die Radiuslängen r(φ ) für φ = 0°, 30°, 120°, 150°, 180° und skizzieren

17.6 Begründung der Bezeichnung „Kegelschnitt“ | 173

Sie die Hyperbel mit ihren Bestimmungsgrößen (a, e) sowie die Endpunkte der berechneten Radien. 17.11 Eine Ellipse besitzt den Parameter p = 30/7 und die numerische Exzentrizität ε = 4/7. Skizzieren Sie einige Punkte der Ellipse mit Hilfe der Polargleichung. Berechnen Sie a, b und die lineare Exzentrizität e. 17.12 Die Polargleichung einer Ellipse liefert r(0) = 10, r(π /3) = 6. Was wissen Sie über diese Ellipse? 17.13 Konstruieren Sie mit Hilfe der Polargleichung die Ellipse mit p = 5 und ε = 1/2 und die Hyperbel mit p = 5 und ε = 2. 17.14 Eine Hyperbel besitzt den Parameter p = 3 und die numerische Exzentrizität ε = 1/3. Was stimmt nicht an diesem Aufgabentext? 17.15 Eine Straße soll in 50 m Höhe verlaufen. Ihre Stützpfeiler besitzen einen Abstand von 10 m voneinander und ruhen auf einer Parabel (s. folgende Abbildung). Die markierten Punkte besitzen die Koordinaten in der Einheit Meter: P1 = (30, 20), P2 = (60, 40), P3 = (120, 30). Wie lang müssen die Pfeiler bei 30, 40, 50, . . . , 120 m sein?

17.16 Skizzieren Sie eine Parabel mit p = 10 mittels Schnellkonstruktion. 17.17 Gegeben ist eine Ellipse mit den Halbachsen a = 5 (in der x-Richtung) und b = 3 (in der y-Richtung). Ihr Mittelpunkt besitzt die Koordinaten (xM , yM ) = (3, −2). Die Ellipse wird von einer Geraden geschnitten, welche die Punkte (1, 1) und (3, 7) enthält. (a) Wie lautet die implizite Mittelpunktsgleichung der Ellipse? (b) Wie lautet die Gleichung der Geraden? (c) In welchen Punkten (x1 , y1 ) und (x2 , y2 ) schneidet die Gerade die Ellipse?

174 | 17 Die Kegelschnitte 17.18 Man berechne alle Bestimmungsgrößen der folgenden quadratischen Formen und skizziere sie unter Verwendung der Schmiegekreise: (a) 0,32 ⋅ x2 + 0,5 ⋅ y2 − 8 = 0 (b) 0,32 ⋅ x2 − 0,5 ⋅ y2 − 8 = 0 (c) 0,32 ⋅ x2 − 0,5 ⋅ y2 + 8 = 0 (d) y2 − 8x = 0 17.19 (a) Wie lauten die Gleichungen der Tangenten durch den Punkt (x, y) = (7, 3) an den Kreis xK2 + yK2 = 1? (b) Man bestimme die Gleichungen der vom Punkt (8, 13) an den Kreis xK2 + yK2 = 25 gelegten Tangenten. 17.20 (a) Wie lautet die Gleichung einer Tangente, die in xE = 2 die Ellipse xE2 /16 + yE2 /25 = 1 berührt? (b) Berechnen Sie eine Tangente, die in xE = 3 dieselbe Ellipse berührt. (c) Und dasselbe noch einmal für xE = 4. 17.21 Wie lautet die Gleichung einer Tangente, welche die Hyperbel xH2 /16 − yH2 /25 = 1 in yH = 20 berührt? 17.22 Wie lauten die Gleichungen der Tangenten, welche den Kreis (xK − 1)2 + (yK + 3)2 = 9 bei xK = 2 berühren? 17.23 Der Kreis xK2 + yK2 = 36 wird von der Geraden y = 3x + 1 geschnitten. In welchem Punkt S schneiden sich die in den Schnittpunkten R1 und R2 an den Kreis gelegten Tangenten t1 und t2 (vgl. Abb. 17.19)? Wie lang ist die Sehne (die Sekante p im Kreisinnern)?

18 Sphärische Geometrie Gegenstand der sphärischen Geometrie ist die Geometrie auf der Kugeloberfläche. Zur Vereinfachung der Notation wählen wir den Kugelradius R = 1 und legen den Ursprung des Koordinatensystem in den Kugelmittelpunkt. Dann ist die Kugeloberfläche S2 die Menge aller Punkte¹ R = (x | y | z) mit Abstand 1 vom Koordinatenursprung S2 = {R | x2 + y2 + z2 = 1}.

(18.1)

Nach (8.20) genügen zur Bestimmung eines Punktes auf der Kugeloberfläche zwei Koordinaten: θ

mit

0≤θ ≤π

φ

mit

0 ≤ φ < 2π

In kartesischen Koordinaten ergibt sich mit (8.21) R(θ , φ ) = (sin θ ⋅ cos φ | sin θ ⋅ sin φ | cos θ ).

(18.2)

Abb. 18.1: Zur Definition der Kugelkoordinaten in mathematischen und physikalischen Systemen.²

1 In diesem Abschnitt benutzen wir die übliche, Zeilenvektoren entsprechende Koordinatenschreibweise. 2 Die geographische Einteilung der als kugelförmig angenommenen Erdoberfläche in Längen- und Breitengrade geht auf Claudius Ptolemäus (im zweiten Jahrhundert n. Chr.) zurück. Die Meridiane erstrecken sich vom Nordpol zum Südpol. Sie werden durch Längengrade von 0° bis 180° östlicher bzw. 0° bis 180° westlicher Länge unterschieden. Der Nullmeridian schneidet die britische Sternwarte in Greenwich. Die Breitenkreise liegen konzentrisch um die Erdachse. Die Zählung der Breitengrade beginnt am Äquator bei 0° und läuft bis 90° nördlicher bzw. südlicher Breite. Mit Ausnahme des Äquators sind dies keine Großkreise.

176 | 18 Sphärische Geometrie Am Nordpol N ist θ = 0 und z = 1. Am rechten Kugelrand (s. Abb. 18.1) befindet sich der Nullmeridian, d. h. dort ist φ = 0. Mit dieser Vereinbarung geht aus (18.2) hervor, dass die y-Richtung nach hinten weist. Ein kleines Oberflächenelement hat die Fläche dΩ = dθ dφ sin θ .

(18.3)

Die gesamte Kugeloberfläche ist somit (vgl. auch (32.10)) 2π

π

2

Ω (S ) = ∫ dφ ∫ sin θ dθ = 4π . 0

(18.4)

0

Als Großkreis bezeichnet man den Schnitt einer Ebene E durch das Kugelzentrum (0|0|0) mit der Kugeloberfläche S2 . Wird die Ebene durch den auf ihr senkrechten Vektor RE definiert, so ergibt sich aus E = {R | R ⋅ RE = 0} und S2 = {R | R ⋅ R = 1} die Großkreismenge G(RE ) = {R | R ⋅ R = 1 ∧ R ⋅ RE = 0}.

(18.5)

Die kürzeste Verbindung zwischen zwei Punkten R1 und R2 aus S2 mit R1 ≠ ±R2 liegt in der von ihnen aufgespannten Ebene G(R1 , R2 ) = {R | R ⋅ R = 1 ∧ R = α R1 + β R2 , α , β ∈ ℝ} in Koordinaten also wegen R21 = R22 = 1 α 2 + 2αβ cos(R1 , R2 ) + β 2 = 1.

Abb. 18.2: Ein Großkreis, definiert durch die Normale RE oder durch zwei Vektoren der Schnittebene.

(18.6)

18 Sphärische Geometrie

| 177

Abb. 18.3: (a) Ein Kugelzweieck wird begrenzt durch zwei Großkreise. (b) Ein Kugeldreieck wird begrenzt durch drei Großkreise.

Ein Großkreis teilt S2 in zwei gleiche Hälften. Zwei Großkreise, die nicht zusammenfallen, teilen S2 in vier Kugelzweiecke, von denen mindestens zwei kongruent sind. Wir betrachten nur eines von ihnen. OBdA kann ein Schnittpunkt der beiden Großkreise in den Kugelnordpol (θ = 0) gelegt werden. Der zweite Schnittpunkt ist dann der Gegenpunkt des Nordpols, der Südpol. Der Winkel zwischen den Großkreisen ist identisch mit dem Winkel zwischen den Tangenten an die Großkreise am Nordpol (s. Abb. 18.3). Die Fläche eines Kugelzweiecks ist Ω (φ ) = 2φ

(18.7)

denn sie wächst linear mit dem Winkel und für den Vollkreiswinkel 2π ergibt sich nach (18.4) die Gesamtfläche 4π . Ein Kugeldreieck kann durch drei Großkreise definiert werden. Die Flächen der Kugelzweiecke in Abb. 18.3 (b) sind nach (18.7): Ω (α ) = 2α

Ω (β ) = 2β

Ω (𝛾) = 2𝛾

(18.8)

Im Folgenden wollen wir uns an die Eulersche Konvention halten, wonach kein Winkel größer als π sein soll. Ein Dreieck und das durch die Gegenpunkte seiner Eckpunkte definierte Gegendreieck sind kongruent, besitzen also gleiche Flächen Ω (A󸀠 , B, C) = Ω (A, B󸀠 , C󸀠 ).

(18.9)

Die in Abb. 18.3 (b) durch β und 𝛾 definierten Kugelzweiecke liegen vollständig auf der vorderen Kugelseite. Der auf der hinteren Kugelseite liegende Teil des durch α definierten Zweiecks kann mit (18.9) auf die Vorderseite projiziert werden. Damit wird jeder Punkt der vorderen Hemisphäre (Halbkugel) von Zweiecken bedeckt, und zwar die innerhalb der Fläche Ω (A, B, C) gelegenen Punkte dreimal und die außerhalb gelegenen einmal. Die Summe der drei Zweiecksflächen ist also die gesamte Hemisphärenfläche 2π und zusätzlich die zweifache Dreiecksfläche Ω (α ) + Ω (β ) + Ω (𝛾) = 2π + 2Ω (A, B, C). Unter Berücksichtigung von (18.8) ergibt sich daraus die Dreiecksfläche zu Ω (A, B, C) = α + β + 𝛾 − π .

(18.10)

178 | 18 Sphärische Geometrie Die Innenwinkelsumme von Kugeldreiecken ist stets größer als π . Der Überschuss (18.10) wird auch als sphärischer Exzess bezeichnet. Er bestimmt die Fläche des Dreiecks. Auf der Einheitskugel sind demnach Dreiecke, die gleiche Winkel besitzen, nicht nur ähnlich, sondern sogar kongruent.

18.1 Sphärische Trigonometrie Im Folgenden werden einige Sätze der sphärischen Trigonometrie hergeleitet; das ist die Lehre vom Zusammenhang zwischen Winkeln und Seiten in Kugeldreiecken. Zur Unterstützung des Vorstellungsvermögens kann das Koordinatensystem so gewählt werden, dass ein Eckpunkt des Kugeldreiecks im Nordpol und ein weiterer auf dem Nullmeridian liegt (s. Abb. 18.3b): A = (xA | yA | zA ) B = (xB | 0 | zB ) C = (0 | 0 | 1) Unabhängig von dieser speziellen Wahl, die im Folgenden nicht benutzt wird, gilt (da alle Vektoren den Betrag 1 besitzen): cos a = B ⋅ C

(18.11)

cos b = A ⋅ C

(18.12)

cos c = A ⋅ B

(18.13)

Der Winkel 𝛾 wird von den Vektoren U und V aufgespannt (s. Abb. 18.3 (b)). U liegt in der von C und A aufgespannten Ebene senkrecht zu C. Wir können U also darstellen, indem wir A verwenden, den zu C parallelen Anteil aber subtrahieren, so dass U = A − C cos b. Analog ergibt sich der Vektor V = B − C cos a. Somit gilt für 𝛾: (A − C cos b) ⋅ (B − C cos a) |A − C cos b| ⋅ |B − C cos a| AB − AC cos a − CB cos b + C2 cos b cos a cos 𝛾 = √A2 − 2AC cos b + C2 cos2 b ⋅ √B2 − 2BC cos a + C2 cos2 a cos 𝛾 =

Mit (18.11)–(18.13) sowie A2 = B2 = C2 = 1 folgt cos 𝛾 =

cos c − cos b cos a − cos a cos b + cos b cos a √1 − 2 cos b cos b + cos2 b ⋅ √1 − 2 cos a cos a + cos2 a

cos𝛾 =

cos c − cos a cos b . sin a sin b

(18.14)

Daraus ergibt sich der Seitenkosinussatz cos c = cos a cos b + sin a sin b cos 𝛾.

(18.15)

18.1 Sphärische Trigonometrie | 179

Durch zyklische Vertauschung folgen die analogen Sätze für die übrigen Seiten. Speziell für das rechtwinklige Kugeldreieck mit 𝛾 = π /2 folgt daraus cos c = cos a cos b.

(18.16)

Mit Hilfe von (18.15) finden wir: sin 𝛾 = √1 − cos2 𝛾 = √ 1 − ( sin 𝛾 = √ sin 𝛾 =

cos c − cos a cos b 2 ) sin a sin b

sin2 a sin2 b − (cos c − cos a cos b)2 sin2 a sin2 b

√sin2 a sin2 b − cos2 c + 2 cos c cos a cos b − cos2 a cos2 b

sin a sin b √1 − cos2 a − cos2 b − cos2 c + 2 cos a cos b cos c sin 𝛾 = sin a sin b sin 𝛾 √1 − cos2 a − cos2 b − cos2 c + 2 cos a cos b cos c = sin c sin a sin b sin c

(18.17)

Zyklische Vertauschung liefert √1 − cos2 a − cos2 b − cos2 c + 2 cos a cos b cos c sin α = sin a sin a sin b sin c (auf der rechten Seite ändert sich nichts). Daraus folgt der Sinussatz sin 𝛾 sin β sin α = = . sin a sin b sin c

(18.18)

Für das rechtwinklige Kugeldreieck mit 𝛾 = π /2 speziell sin α =

sin a . sin c

(18.19)

Aus den beiden vorangehenden Sätzen kann der Winkelkosinussatz abgeleitet werden. Wir beginnen mit dem Quadrat von (18.17) 1 − cos2 a − cos2 b − cos2 c + 2 cos a cos b cos c = sin2 a sin2 b sin2 𝛾 multiplizieren auf beiden Seiten mit cos a und verwenden gleichzeitig rechts einmal sin b sin 𝛾 = sin c sin β aus (18.18) cos a − cos3 a − cos a cos2 b − cos a cos2 c + 2 cos2 a cos b cos c = sin2 a sin b sin c sin β sin 𝛾 cos a.

180 | 18 Sphärische Geometrie Ergänzung der linken Seite durch cos b cos c und Umordnung führt auf [cos a − cos b cos c − cos3 a + cos2 a cos b cos c] + [cos b cos c − cos a cos2 b − cos a cos2 c + cos2 a cos b cos c] = sin2 a sin b sin c sin β sin 𝛾 cos a [(cos a − cos b cos c)(1 − cos2 a)] + [(cos b − cos a cos c)(cos c − cos a cos b)] = sin2 a sin b sin c sin β sin 𝛾 cos a cos a − cos b cos c cos b − cos c cos a cos c − cos a cos b + ⋅ = sin β sin 𝛾 cos a. sin b sin c sin c sin a sin a sin b Mit Gleichung (18.15) und ihren durch zyklische Vertauschung entstehenden Varianten ergibt sich cos α + cos β cos 𝛾 = sin β sin 𝛾 cos a und damit der Winkelkosinussatz cos α = − cos β cos 𝛾 + sin β sin 𝛾 cos a.

(18.20)

Übungen 18.1 Wie groß ist die Fläche des Kugeldreiecks (|R| = 1) mit α = π /2, β = π /3, 𝛾 = π /4? 18.2 Bestimmen Sie die Seitenlängen im Kugeldreieck aus Übung 18.1. 18.3 Der Mond hat einen Radius von 1738 km. Da die Erde ausgedehnt ist und der Mond etwas schwankt, sind nur 41 % seiner Fläche für uns unsichtbar. (a) Welchem Kugelzweieck entspricht das? (b) Welches gleichseitige Kugeldreieck auf dem Mond besitzt dieselbe Fläche? 18.4 Neapel (14° östliche Länge) und New York (76° westliche Länge) liegen beide auf 41° nördlicher Breite. (a) Wie groß ist der Abstand zwischen den Orten auf der Erdoberfläche? (b) Wie lang ist der Weg von Neapel bis New York auf dem 41. Breitengrad? [Hinweis: Die Zählung der Breitengrade beginnt am Äquator, nicht wie in Abb. 18.1 am Nordpol. Die Erde kann als Kugel mit Radius 6370 km angenommen werden.] 18.5 Berechnen Sie die Fläche des Kugeldreiecks, dessen Eckpunkte im mathematischen System (θ , φ ) durch A = (π /2, 0), B = (π /2, π /3), C = (π /6, 0) gegeben sind. [Hinweis: Zwei Seiten stehen senkrecht aufeinander und besitzen die Länge π /3.]

| Teil VI: Infinitesimalrechnung

182 | Teil VI Infinitesimalrechnung Das Rechnen mit dem Unendlichen, dem Infiniten, unterscheidet sich deutlich von der finiten Mathematik. Dieses Kapitel vermittelt die grundlegenden Kenntnisse der Infinitesimalrechnung oder Analysis, vor allem den Grenzwertbegriff bei Folgen und Reihen, der zur Grundlegung der reellen Zahlen und ihrer Dezimaldarstellung benötigt wird. Die wichtigsten Anwendungen, die Differential- und Integralrechnung mit ihren speziellen Techniken bis hin zur Laplace-Transformation sowie Vektoranalysis und Differentialgleichungen werden dann in gesonderten Kapiteln behandelt.

19 Folgen Eine (reelle, unendliche Zahlen-) Folge ist eine Abbildung von den natürlichen Zahlen in die reellen Zahlen, so dass jeder natürlichen Zahl n genau eine reelle Zahl an zugeordnet wird. Wir bezeichnen die Folge mit (an )n∈ℕ oder kurz (an ), wodurch sie von ihren Gliedern an deutlich unterschieden ist. Endliche Folgen wie 4, π , √2, 7, 5, die auch als Vektoren aufgefasst werden können, sind in der Infinitesimalrechnung im Allgemeinen von geringem Interesse. Wir wollen von jetzt an unter Folgen nur noch unendliche Folgen verstehen. (n) = 1, 2, 3, . . . ↓ ↓ ↓ (an ) = a1 , a2 , a3 , . . . Unendliche Folgen kann man nur dann geschlossen behandeln, wenn ihren Gliedern ein Bildungsgesetz zugrunde liegt. Sie werden entweder durch Aufzählung der ersten Glieder, aus denen das Bildungsgesetz ablesbar sein muss, beschrieben oder mit Hilfe des Bildungsgesetzes selbst oder rekursiv, indem jedes Glied aus dem vorhergehenden berechnet wird¹. Dann muss aber zusätzlich auch das erste Glied angegeben werden. Einige Beispiele sind in der folgenden Tabelle zusammengestellt:

Aufzählung

Bildungsgesetz

Rekursionsformel

Anfangsglied

(an ) = 2, 4, 6, 8, 10, . . .

an = 2 ⋅ n

an = 2 + an−1

a1 = 2

(bn ) = 8, 10, 12, 14, . . .

bn = 2 ⋅ (n + 3)

bn = 2 + bn−1

b1 = 8

(cn ) = 2, 4, 8, 16, . . .

cn = 2n

cn = 2 ⋅ cn−1

c1 = 2

(dn ) = 1, 4, 9, 16, . . .

2

dn = n

dn = (1 + √dn−1 )2

d1 = 1

(en ) = 9, 16, 25, 36, . . .

en = (n + 2)2

en = (1 + √en−1 )2

e1 = 9

(fn ) = 1, 1/2, 1/3, . . .

fn = 1/n

fn = (1 + 1/fn−1 )−1

f1 = 1

gn = − gn−1

g1 = − 1

(gn ) = −1, 1, −1, 1, −1, . . .

n

gn = (−1)

In dieser Tabelle wird selbstverständlich vorausgesetzt, dass die Rekursionsformel erst ab n = 2 anzuwenden ist. Eine Folge wie (an ) oder (bn ) mit konstanter Differenz zwischen benachbarten Gliedern heißt arithmetische Folge. Eine Folge wie (cn ) mit konstantem Quotienten benachbarter Glieder heißt geometrische Folge. Die Folge (fn ) der Stammbrüche 1/n

1 Das ist allerdings nicht immer möglich. Ein Beispiel für eine unendliche Folge, die nicht mit einer expliziten Formel beschrieben werden kann, ist die Folge (pn ) = 2, 3, 5, 7, 11, 13, 17, 19, 23, . . . der Primzahlen. Hier muss jede Zahl einzeln auf Zugehörigkeit untersucht werden.

184 | 19 Folgen nennt man auch die harmonische Folge. Eine Folge wie (gn ) mit wechselnden Vorzeichen benachbarter Glieder, allgemein eine Folge der Form an = (−1)n |an |, heißt alternierende Folge. Definition. Eine Folge (an ) ist beschränkt, wenn es zwei reelle Zahlen S− und S+ gibt, so dass ∀n ∈ ℕ : S− ≤ an ≤ S+ . (19.1) S− heißt untere Schranke, S+ heißt obere Schranke. Gilt nur eine der beiden Ungleichungen (19.1), so heißt die Folge nach unten beschränkt bzw. nach oben beschränkt. Bei S muss es sich keineswegs um die kleinstmögliche obere oder die größtmögliche untere Schranke handeln. Die Folge der Stammbrüche besitzt eine obere Schranke S+ = 10, denn jede reelle Zahl S+ ≥ 1 ist eine obere Schranke dieser Folge. Die kleinste obere Schranke heißt obere Grenze oder Supremum der Folge. Die größte untere Schranke heißt untere Grenze oder Infimum der Folge. Definition. Ein Häufungspunkt einer Folge ist eine Zahl h, in deren Umgebung (h − ε , h + ε ) für jedes ε > 0 unendlich viele Glieder der Folge liegen. (Eine Umgebung ist also ein offenes Intervall (a, b) = {x | a < x < b}, das oft auch in der Form ]a, b[ dargestellt wird.) Besitzt eine beschränkte Folge nur einen Häufungspunkt, so heißt dieser Häufungspunkt Grenzwert der Folge². In Abb. 19.1 sind die beiden Häufungspunkte der Folge 50 + 10 ⋅ (−1)n und der einzige Häufungspunkt der Folge 100/n durch h markiert. Definition. Eine Folge (an ) konvergiert gegen den endlichen Grenzwert a, wenn zu jeder reellen Zahl ε > 0 eine natürliche Zahl nε ∈ ℕ existiert, so dass für alle n ≥ nε gilt (19.2) |an − a| < ε . Man schreibt dann mit der Abkürzung „lim“ für „Limes“ lim an = a

n→∞

oder kurz (an ) → a. Die Beispielfolgen (an ) bis (en ) wachsen mit zunehmendem n beständig an. Sie besitzen keinen Grenzwert. Die Folge (fn ) dagegen konvergiert gegen einen Grenzwert. Folge (gn ) konvergiert nicht gegen einen Grenzwert. Sie besitzt zwei Häufungspunkte, h1 = −1 und h2 = 1.

2 Es wäre verfehlt, den Grenzwert als dasjenige Folgenglied zu betrachten, das auf alle nummerierten Glieder folgt. Das Wort „alle“ trägt bei unendlichen Mengen nicht den Sinn von Vollständigkeit (vgl. die Fußnote auf S. 4). Der Grenzwert ist lediglich eine reelle Zahl, die sich aus der Definition einer konvergenten Folge ergibt.

19 Folgen |

185

Abb. 19.1: Veranschaulichung einiger Folgen.

Der Grenzwert der Folge (fn ) ist offenbar Null. Wählen wir ε = 1/k, so gilt für jede natürliche Zahl m ≥ nε := k + 1 |am − 0| = |am | = 1/m < 1/k = ε . Das Konvergenzkriterium (19.2) ist also erfüllt. Und es gibt keine andere Zahl als 0, für die es erfüllt wäre. Eine Folge, die gegen den Grenzwert Null konvergiert, heißt Nullfolge. Eine Folge, die nicht gegen einen endlichen Grenzwert konvergiert, heißt divergent. Häufig schreibt man für Folgen, die entweder keine untere oder keine obere Schranke besitzen, lim an = −∞ oder lim an = ∞. n→∞

n→∞

Hierbei handelt es sich nicht um Grenzwerte nach (19.2). Solche Folgen sind nicht konvergent. Jede nicht konvergente Folge ist divergent. Jedoch können wir die Angabe uneigentlicher Grenzwerte dadurch rechtfertigen, dass die Kehrwerte der Folgenglieder von einer Seite (also nur aus dem Positiven oder nur aus dem Negativen) gegen 0 konvergieren. Satz. Jede konvergente Folge ist beschränkt. Beweis. Für eine endliche Menge von Folgengliedern, wie die ersten nε Glieder, kann man stets Schranken finden, so dass für diese Glieder (19.1) erfüllt ist. Für die gesamte Folge gilt dann wegen (19.2) S− − ε ≤ an ≤ S+ + ε . Aber nicht jede beschränkte Folge ist konvergent. Die Folge (gn ) z. B. ist sicher durch S− = −10 und S+ = 10 beschränkt. Aber sie besitzt keinen Grenzwert, denn schon für ε = 1/2 ist (19.2) nicht erfüllbar. Definition. Eine Folge heißt monoton steigend bzw. monoton fallend, wenn gilt an ≤ an+1

bzw.

an ≥ an+1 .

186 | 19 Folgen Gelten die strikten Ungleichungen an < an+1

bzw.

an > an+1

so heißt die Folge streng monoton steigend bzw. streng monoton fallend. Satz. Jede beschränkte monotone Folge ist konvergent. Beweis. OBdA sei die Folge monoton steigend. Sie besitzt keine Glieder außerhalb eines Intervalls [S− , S+ ]. Wir zerlegen dieses Intervall in zwei Teilintervalle, ein unteres I1 und ein oberes I2 . Mindestens eines enthält unendlich viele Glieder, sonst wäre die Folge endlich. Höchstens eines enthält unendlich viele Glieder, denn sobald ein Glied in I2 fällt, kann aufgrund der Monotonie kein weiteres mehr in I1 erscheinen. Also müssen alle Glieder in I1 oder fast alle³ Glieder in I2 liegen. Um zu zeigen, dass nur ein einziger Häufungspunkt existiert, kann die Halbierung beliebig oft auf dem jeweils unendlich viele Folgenglieder enthaltenden Intervall wiederholt werden, bis jede gewünschte Breite b < ε erreicht ist. Das Argument gilt unverändert, wenn das ursprüngliche Intervall sogleich in k = (S+ −S− )/b Teilintervalle der Breite b unterteilt wird. Aufgrund der Monotonie kann nur eines unendlich viele Glieder enthalten. Verfeinerung auf beliebig schmale Teilintervalle b < ε erlaubt im Grenzfalle k → ∞ den Schluss auf einen Häufungspunkt. Definition. Eine Teilfolge entsteht dadurch, dass Glieder der Folge weggelassen werden, wobei noch unendlich viele übrig bleiben. Definition. Ein Glied as der Folge (an ) heißt Spitze der Folge, wenn es von keinem der darauf folgenden Glieder übertroffen wird: n > s ⇒ an ≤ as . Beispiel: Die konstante Folge 1, 1, 1, . . . enthält nur Spitzen, ebenso wie die Folge der Stammbrüche (fn ). Die Folge der natürlichen Zahlen enthält keine Spitze.

Abb. 19.2: Eine nach einem einfachen Bildungsgesetz aufgebaute Folge. Ihre Spitzen sind durch schwarz gefüllte Kreise markiert.

3 „Fast alle“ bedeutet „alle mit endlich vielen Ausnahmen“.

19 Folgen

| 187

Satz. Jede Folge enthält eine monotone Teilfolge. Beweis. Eine Folge enthält entweder endlich viele Spitzen (z. B. gar keine) oder unendlich viele Spitzen. Im ersten Fall existiert nach der letzten Spitze zu jedem Glied ein größeres Glied. Die Teilfolge dieser größeren Glieder ist streng monoton steigend. Im zweiten Fall bildet die Folge der unendlich vielen Spitzen eine monoton fallende Folge. Da aus Beschränkung und Monotonie Konvergenz folgt, gilt der Satz. Jede beschränkte Folge enthält eine konvergente Teilfolge. Mit dem Cauchyschen Konvergenzkriterium gelingt es, das Konvergenzverhalten auch dann zu prüfen, wenn ein Grenzwert nicht bekannt ist. Satz. Die Folge (an ) konvergiert genau dann, wenn es zu jedem ε > 0 eine natürliche Zahl nε ∈ ℕ gibt, so dass für alle m, n ≥ nε gilt |an − am | < ε .

(19.3)

Beweis (⇒). Die Folge (an ) sei konvergent. Dann besitzt sie einen Grenzwert a. Also existiert zu jeder reellen Zahl ε /2 > 0 eine natürliche Zahl nε /2 , so dass für alle m, n ≥ nε /2 gilt |an − a| < ε /2 und |a − am | < ε /2. Mit der Cauchy–Schwarzschen Ungleichung (s. Übung 5.4) folgt dann ε > |an − a| + |a − am | ≥ |an − a + a − am | = |an − am |. Das Cauchysche Konvergenzkriterium (19.3) ist also erfüllt. Beweis (⇐). Nun gelte (19.3). (an ) ist sicher beschränkt und enthält daher eine konvergente Teilfolge (ank ) mit Grenzwert a. Für alle n, nk ≥ nε /2 gilt |an − ank | < ε /2 und wegen der Konvergenz der Teilfolge (ank ) gegen a gilt auch |ank − a| < ε /2. Wieder folgt mit der Cauchy–Schwarzschen Ungleichung ε > |an − ank | + |ank − a| ≥ |an − ank + ank − a| = |an − a|. Die Folge (an ) ist nach (19.2) konvergent. Eine konvergente Folge nennt man deshalb auch Cauchy-Folge. In den reellen Zahlen besitzt jede Cauchy-Folge einen Grenzwert. In den rationalen Zahlen ist dies nicht der Fall.

188 | 19 Folgen Beispiel: Eine Folge sei definiert durch die Rekursionsformel an+1 =

1 2 (an + ) 2 an

(19.4)

mit a1 = 1. Jedes Glied ist eine rationale Zahl. Für den Grenzwert a muss gelten a=

1 2 (a + ) 2 a

da sich an und an+1 für n → ∞ nicht mehr unterscheiden. Daraus folgt a = √2 ∉ ℚ . Folge (19.4) erlaubt √2 mit beliebig kleinem, aber nicht ohne, Fehler zu berechnen. Selbst eine unendliche Ziffernfolge wäre dafür nicht ausreichend, denn jede Ziffer steht an einer endlich indizierten Stelle. Die Ziffernfolge repräsentiert nur die Folge der rationalen Approximationen durch Dezimalbrüche. Der irrationale Grenzwert ist kein Bruch, natürlich auch kein Dezimalbruch, und deshalb nicht durch Ziffern darstellbar (s. Abschnitt 20.1). Auch die Quadratwurzeln anderer Zahlen lassen sich in dieser Art approximieren. Als Ausgangspunkt wählt man z. B. die Gleichung 2x2 = x2 + k die offenbar dann erfüllt ist, wenn x2 = k gilt. Da x unbekannt ist, formt man die Gleichung um 1 k x = (x + ) 2 x setzt für die rechts stehenden Unbekannten x einen Anfangswert a1 ein, z. B. x = a1 = 1, und rechnet aus, ob sich derselbe Wert für das links stehende x ergibt. Dies ist für irrationale Wurzeln niemals der Fall, sondern man erhält a2 =

1 k (a + ) = ̸ a1 2 1 a1

und eine Folge analog zu (19.4). Der Prozess wird fortgesetzt, bis sich an+1 im Rahmen der gewünschten Genauigkeit nicht mehr von an unterscheidet. Auf diese Weise lassen 3 sich auch höhere Wurzeln als Grenzwerte von Folgen berechnen, z. B. √k 2x3 = x3 + k ⇒ an+1 =

1 k (an + 2 ) . 2 an

(19.5)

Die reellen Zahlen ℝ können gleichermaßen durch Dedekind-Schnitte (s. Abschn. 5.5) wie durch Äquivalenzklassen von Cauchy-Folgen definiert werden. Die in den rationalen Zahlen nicht existierenden Grenzwerte bilden die Menge der irrationalen Zahlen.

| 189

19 Folgen

Zum Umformen von Folgen kann man die folgenden trivialen Regeln anwenden. Seien (an ) und (bn ) konvergente Folgen und c ∈ ℝ, dann gilt: lim (c ⋅ an ) = c ⋅ lim an

n→∞

n→∞

lim (an + bn ) = lim an + lim bn

n→∞

n→∞

n→∞

lim (an ⋅ bn ) = lim an ⋅ lim bn

n→∞

n→∞

n→∞

1 1 lim = , n→∞ a lim n n→∞ an lim ac n→∞ n

c

= ( lim an ) , n→∞

an ≠ 0 und lim an ≠ 0

falls falls

n→∞

acn

c

und ( lim an ) existieren n→∞

Eine Folge (an ) konvergiert gegen den Grenzwert a genau dann, wenn die Folge (an −a) eine Nullfolge ist. Seien (an ) und (bn ) konvergente Folgen mit an ≤ bn für fast alle n, dann gilt lim an ≤ lim bn .

n→∞

n→∞

(bn ) heißt dann Majorante von (an ), und (an ) heißt Minorante von (bn ). Bei der Berechnung der Grenzwerte von verwickelten Ausdrücken verwende man diese Regeln und Sätze, um einfache Ausdrücke mit klar ersichtlichem Grenzverhalten zu erzeugen, vor allem die Folgen (n) und (1/n) sowie ihre Potenzen.

Übungen 19.1 Man setze a1 = 1 und berechne mit Hilfe der Folge (19.5) die dritte Wurzel aus 3 auf vier zählende Stellen genau. 19.2 Man bestimme die Grenzwerte der unten definierten Folgen oder stelle ihre Divergenz fest (große Buchstaben bezeichnen positive reelle Zahlen). an = n−1/2 bn =

J n5 + Cn4 U − Vn + Wn2 n ( n − Kn) I ⋅ ⋅√ 5 2 2 Un + n Kn D + n2 E

n+B cn = A + √n dn =

L (Kn3/4 + Mn5/8 ) 2 4 √n (7 + L√n)

+

Ln6 (5n −

3n2

+

2 n3 )

+

1 (1 − 1n n2 1 + Vn13 Un2

− −

1 ) n2 1 Wn4

+ G√H n

19.3 Fibonacci-Folge: Ein Mann bekommt im Januar ein Pärchen Kaninchen geschenkt, die gerade geboren sind und erst im übernächsten Monat (März) und dann in jedem folgenden Monat ein Pärchen erzeugen. Auch dieses und alle weiteren Pärchen

190 | 19 Folgen erzeugen ab dem zweiten Monat nach ihrer Geburt jeweils ein Pärchen monatlich. Wie viele Pärchen hat der Mann im Dezember? Wie lautet die Rekursionsformel für diese erste implizit definierte Folge? [„Fibonacci“ (Sohn des Gutchens) war der Spitzname von Leonardo von Pisa.]

20 Reihen Definition. Sei (an )n∈ℕ eine Folge, dann heißt die Summe ihrer ersten k Glieder k

sk = ∑ an = a1 + a2 + a3 + . . . + ak

(20.1)

n=1

die k-te Partialsumme oder Teilsumme der Reihe ∑ an = a1 + a2 + a3 + . . .

(20.2)

n∈ℕ

in welcher die Folge (sk )k∈ℕ = s1 , s2 , s3 , . . . der Partialsummen abkürzend als unendliche Summe der Glieder an aufgeschrieben ist. Die Folge (an )n∈ℕ heißt Stammfolge dieser Reihe. Jedem Glied ak der Stammfolge entspricht ein Glied sk der Partialsummenfolge.¹ Definition. Ist die Folge der Partialsummen konvergent, ist also die Reihe konvergent, so heißt ihr Grenzwert Wert oder Summe s der Reihe² k



lim sk = lim ∑ an = ∑ an = s.

k→∞

k→∞

n=1

(20.3)

n=1

Satz. Ist ∑n∈ℕ an konvergent, so verschwindet der Grenzwert der Stammfolge³: limn→∞ an = 0. Die Notwendigkeit der Bedingung ist trivial. Die Umkehrung des Satzes gilt nicht. So besitzt die harmonische Reihe ∑n∈ℕ 1n trotz limn→∞ 1n = 0 nur den uneigentlichen 1 Grenzwert ∑∞ n=1 n = ∞. Der Beweis erfolgt durch Reihenverdichtung, s. (20.10). Existiert kein endlicher Grenzwert s der Partialsummenfolge, so heißt die Reihe divergent. Ein Beispiel dafür bilden die arithmetischen Reihen a1 + (a1 + d) + (a1 + 2d) + (a1 + 3d) + . . . deren Stammfolgen durch eine konstante Differenz d ihrer Glieder ausgezeichnet sind. Eine spezielle und sehr wichtige Klasse von Reihen sind die geometrischen Reihen. Der Quotient von zwei aufeinanderfolgenden Gliedern ist konstant a q = n+1 . an

1 Die Reihe (20.2) fasst die Partialsummen sk in einer einzigen Zeile zusammen, aber auch in dieser Schreibweise enthält die Reihe einer streng monotonen Partialsummenfolge nur die Folgenglieder ohne den Grenzwert. 2 Die Bezeichnung des Grenzwertes (20.3) als „Summe der Reihe“ verleitet dazu, ihn mit der Reihe (20.2) selbst, also der Summe über die Stammfolge, zu identifizieren. Das ist praktisch, aber ungenau, wenn auch im Allgemeinen nicht fehlerträchtig. 3 Das bedeutet nicht, dass Glieder an verschwänden und der Grenzwert s die Summe der übrigen sei.

192 | 20 Reihen In der einfachsten Form lautet die Partialsumme n

sn = 1 + q + q2 + ⋅ ⋅ ⋅ + qn−1 = ∑ qk−1 = k=1

1 − qn . 1−q

(20.4)

Beweis. (1 + q + q2 + ⋅ ⋅ ⋅ + qn−1 ) ⋅ (1 − q) = 1 − qn . n

1 Für |q| < 1 konvergiert die geometrische Reihe gegen limn→∞ 1−q = 1−q . 1−q In allgemeiner Form lautet die Summenformel der geometrischen Reihe daher

a1 + a1 q + a1 q2 + a1 q3 + ⋅ ⋅ ⋅ → a1

1 1−q

für |q| < 1.

(20.5)

Beispiel: Trinkt man ein Glas Wasser zur Hälfte aus und dann immer nur die Hälfte dessen, was man beim letzten Mal getrunken hat, so könnte man unendlich lange von einem Glas Wasser trinken (vorausgesetzt, es gäbe keine Atome), denn die Hälfte bleibt immer übrig 1 1 1 1 1 1 1 1 + + + ⋅ ⋅ ⋅ = (1 + + + . . .) → ⋅ 2 4 8 2 2 4 2 1−

1 2

= 1.

Satz. Konvergenzkriterien für Reihen mit nichtnegativen Gliedern. (20.6) Die Reihe ∑n∈ℕ an konvergiert genau dann, wenn die Folge (sk ) = (∑kn=1 an ) der Partialsummen beschränkt ist. (20.7) Majorantenkriterium: Sei bn ≥ an für n ≥ n0 , und es konvergiere ∑n∈ℕ bn , dann konvergiert auch ∑n∈ℕ an . a (20.8) Quotientenkriterium: Für n ≥ n0 und 0 < q < 1 gelte an+1 ≤ q, dann n konvergiert ∑n∈ℕ an . Anstelle von „für n ≥ n0 “ kann die Bedingung auch in die Form a limn→∞ an+1 ≤ q gefasst werden. Man beachte, dass q echt kleiner als 1 sein muss. n (20.9) Wurzelkriterium: Für n ≥ n0 und 0 < q < 1 gelte √n an ≤ q bzw. es gelte limn→∞ √n an ≤ q, dann konvergiert ∑n∈ℕ an .

Abb. 20.1: Zur Reihenverdichtung. Darstellung der Reihenglieder an als senkrechte Balken. Links sind jeweils 2k−1 Balken der Größe des Gliedes a2k dunkel markiert; sie werden von der Reihe vollständig überdeckt. Rechts sind 2k Balken der Größe des Gliedes a2k dunkel markiert. Sie überdecken alle Glieder der Reihe mit Ausnahme des ersten Gliedes a1 .

20 Reihen |

193

(20.10) Reihenverdichtung: Sei (an ) eine monoton fallende Nullfolge. ∑n∈ℕ an konvergiert genau dann, wenn ∑k∈ℕ 2k a2k konvergiert. Beweis. (20.6) folgt aus Beschränktheit und Monotonie der Partialsummenfolge (sk ) und letztere aus der Voraussetzung an ≥ 0. (20.7) ist trivial. (20.8) und (20.9) wurden mit (20.5) bereits bewiesen, denn als Majorante lässt sich immer eine konvergente geometrische Reihe finden. Zu (20.10): Da eine monoton fallende Folge (an ) vorausgesetzt wurde, ist a2k nicht größer als irgendein vorhergehendes und nicht kleiner als irgendein darauf folgendes Glied. Teilt man die Reihe geschickt auf (s. Abb. 20.1), so ergeben sich die Ungleichungen: a1 + (a2 ) + (a3 + a4 ) + (a5 + a6 + a7 + a8 ) + ⋅ ⋅ ⋅



≥ a1 + 1 ⋅ a2 + 2 ⋅ a4 + 4 ⋅ a8 + ⋅ ⋅ ⋅ → a1 + ∑ 2k−1 a2k k=1

a1 + (a2 + a3 ) + (a4 + a5 + a6 + a7 ) + (a8 + ⋅ ⋅ ⋅



≤ a1 + 2 ⋅ a2 + 4 ⋅ a4 + 8 ⋅ a8 + ⋅ ⋅ ⋅ → a1 + ∑ 2k a2k k=1

Mit ∞

∑ 2k−1 a2k = k=1

1 ∞ k ∑ 2 a2k 2 k=1

folgt

a1 +

∞ ∞ 1 ∞ k ∑ 2 a2k ≤ ∑ an ≤ a1 + ∑ 2k a2k . 2 k=1 n=1 k=1

Ist die rechte Summe endlich, so auch die linke. Da die mittlere Summe aber nicht größer als die rechte ist, muss sie dann auch endlich sein. Für die zugehörigen Reihen bedeutet dies: Konvergiert die rechte so konvergiert auch die linke. Umkehrschluss: Konvergiert die mittlere Reihe, so konvergiert notwendig auch die linke (Minorante) und damit auch die rechte, da sich beide (abgesehen von dem Glied a1 , das für die Konvergenzbetrachtung keine Rolle spielt) nur um den Faktor 1/2 unterscheiden. Reihenverdichtung ist ein äußerst nützliches Konvergenzkriterium, das in vielen Fällen zum Ziele führt, in denen andere Kriterien versagen, z. B. bei der harmonischen Reihe, die weder mit dem Wurzelkriterium noch mit dem Quotientenkriterium behana delt werden kann, da sich wegen limn→∞ √n an = 1 und limn→∞ an+1 = 1 kein q < 1 finden lässt, aber für n ∈ ℕ gilt √n an < 1 und

an+1 an

n

< 1, so dass das Konvergenzverhalten

ungewiss bleibt. Die Reihenverdichtung zeigt aber, dass ∑n∈ℕ ∑n∈ℕ 2k 21k = ∑n∈ℕ 1 nicht konvergiert.

1 n

nicht konvergiert, weil

Satz (Leibniz-Kriterium für alternierende Reihen). Sei (an )n∈ℕ eine monoton fallende Nullfolge. Dann konvergiert ∑n∈ℕ (−1)n+1 an . Beweis. Die Notwendigkeit der Bedingung ist klar. Sei nun m ∈ ℕ, dann ist 2m

2m+1

∑ (−1)n+1 an ≤ s ≤ ∑ (−1)n+1 an . n=1

n=1

194 | 20 Reihen Also liegt s in einem Intervall der Größe 2m+1

2m

∑ (−1)n+1 an − ∑ (−1)n+1 an = a2m+1 n=1

n=1

und diese geht gegen Null für m → ∞. Definition. ∑n∈ℕ an heißt absolut konvergent, wenn ∑n∈ℕ |an | konvergiert. Satz. Eine absolut konvergente Reihe lässt sich beliebig umordnen, ohne den Grenzwert zu ändern. Eine nicht absolut konvergente Reihe besitzt eine divergente Umordnung. Beispiel: Nach dem Leibniz-Kriterium ist die alternierende harmonische Reihe ∑ (−1)n+1 n∈ℕ

1 n

konvergent. Die Konvergenz ist nicht besonders stark; man benötigt viele Glieder der Reihe 1 − 12 + 13 − 14 + − . . . für eine genauere Berechnung ihres Wertes ∞

s = ∑ (−1)n+1 n=1

1 = ln 2 n

(s. Übung 27.8), aber die ersten vier Glieder liefern bereits die Abschätzung Wir ordnen die Reihe nun folgendermaßen um:

7 12

< s < 56 .

1 1 1 1 1 1 1 1 1 1 1 − )+( + − )+( + − )+( + − ) + ... 3 2 5 7 4 9 11 6 13 15 8 Jedes negative Glieder erscheint, wenn auch etwas später. Der Wert der ersten Klammer ist 5/6 und der Wert der zweiten Klammer 13/140. Keine Klammer kann negativ werden, denn das kleinere positive Glied ist stets größer als der halbe Betrag des negativen Gliedes. Damit hat sich der Grenzwert geändert: s > 5/6. Wird immer erst dann ein negatives Glied (−1/k) eingeschaltet, wenn die Summe der direkt davor stehenden positiven Glieder größer als 2/k ist, was bei unendlich vielen Gliedern stets möglich ist, so divergiert die so gebildete Reihe. (1 +

Definition. Eine Reihe konvergiert unbedingt, wenn jede Umordnung gegen denselben Grenzwert konvergiert. Satz. ∑n∈ℕ an konvergiert absolut ⇔ ∑n∈ℕ an konvergiert unbedingt.

20.1 Zur Dezimaldarstellung von Zahlen Zum gewöhnlichen Rechnen werden meistens Dezimalbrüche in der abkürzenden Zifferndarstellung verwendet, wobei der nicht ganzzahlige Teil die Form z z z z ∑ nn = 11 + 22 + 33 + . . . := 0, z1 z2 z3 . . . 10 10 10 10 n∈ℕ

20.1 Zur Dezimaldarstellung von Zahlen |

195

besitzt. Diese Darstellung muss in allen Fällen eine Approximation bleiben, in denen die Partialsummenfolge nicht konstant wird, also ein n0 existiert, so dass zn = 0 für alle n ≥ n0 gilt. Eine streng monotone Partialsummenfolge kann ihren Grenzwert nicht enthalten. Diese Überlegung betrifft aber auch alle Dezimalbrüche mit anderen Primfaktoren als 2 oder 5 im Nenner und alle irrationalen Zahlen, denn mit Ausnahme der Summanden mit zn = 0 ist deren Partialsummenfolge streng monoton steigend; sie wird niemals konstant. Für Brüche kann man durch Wechsel der Basis eine exakte Darstellung erreichen. So besitzt 1/3 im Ternärsystem die Darstellung 0,1. Eine Zifferndarstellung für irrationale Zahlen ist dagegen nicht möglich – auch eine unendliche nicht! Denn jeder Dezimalbruch definiert gleichzeitig den Abschluss und den Hauptnenner einer rationalen Partialsumme – und damit nicht den von allen Partialsummen verschiedenen und überdies irrationalen Grenzwert der Partialsummenfolge. Da die Ziffern, selbst wenn „alle“ aufgeschrieben und verglichen werden könnten, nicht den Grenzwert, sondern nur die unendlich vielen Partialsummen definieren, muss eine eindeutige Formel existieren, die den Grenzwert liefert. Sie erlaubt gleichzeitig jede gewünschte, z. B. für Trichotomie-Untersuchungen erforderliche Ziffernfolge zu berechnen. Dafür kommt schon ein Bruch wie 1/9 oder der endliche (hier mit acht Zeichen dargestellte) Ausdruck „0,111 . . . “ in Betracht, aber auch kompliziertere Formeln wie die Newtonsche Reihe für e (24.1) oder das Wallissche Produkt für π /2 (s. S. 261). Ausdrücke wie a1 + a2 + a3 + . . . oder 0,111 . . . werden in der Literatur gewöhnlich nicht als Reihen, sondern stillschweigend als deren Grenzwerte aufgefasst, so dass eine korrekte Bezeichnung wie 0,111 . . . → 1/9 kurz als 0,111 . . . = 1/9 notiert wird. Diese vereinfachende Konvention ist darauf zurückzuführen, dass ein Ausdruck wie 0,111 . . . sowohl zur Berechnung des Grenzwertes und jeder Partialsumme dienen kann, als auch zur Kennzeichnung der unendlichen Reihe, also der Folge der Partialsummen selbst. Sie führt weder beim Rechnen, noch in der Mathematik des potentiell Unendlichen zu Irrtümern, weil von den Gliedern einer unendlichen Reihe ohnehin niemals Vollständigkeit erwartet werden kann. Wird dagegen diese Vollständigkeit axiomatisch oder mit anderer Begründung gefordert oder vorausgesetzt, so muss zwischen der Reihe, d. h. der Partialsummenfolge oder Ziffernfolge, und ihrem Grenzwert unterschieden werden. Denn es ist mit mathematischer Strenge unvereinbar, die unendliche Folge aller Endziffern von Näherungen, die für jeden noch so großen Index den Grenzwert verfehlen, mit eben diesem zu identifizieren.

196 | 20 Reihen

Übungen 20.1 Man untersuche das Konvergenzverhalten folgender Reihen: (a)

∑ (−1)n+2 n∈ℕ

(e)

∑ n∈ℕ

1 n



(b)

n∈ℕ

1 2n

(c)

∑ n∈ℕ

2

1 n + n2

(f)

∑ n∈ℕ

n 1 + n3

(g)

∑ n∈ℕ

n2 2n

(d)

∑ n∈ℕ

2n n!

1 ln 2n

n

[Hinweis: Für ln 2 beachte man Abschn. 24.1, insbesondere (24.9).] 20.2 Für welche Zahlen q konvergiert die Reihe ∑n∈ℕ qn−1 ? 20.3 Für welche Zahlen q konvergiert die Reihe ∑n∈ℕ

qn ? n!

20.4 Man bestimme eine konvergente Majorante für (a)

∑ n∈ℕ

1 n + n2 + n3

(b)

∑ n∈ℕ

1 . 3n2 + ln 3n

n

[Hinweis: Für ln 3 beachte man Abschn. 24.1, insbesondere (24.9).] [Anmerkung: Selbstverständlich kann man auch ∑n∈ℕ a2 als konvergente Majorante angeben, wenn man weiß, dass ∑n∈ℕ

1 an

n

konvergiert.]

20.5 Man stelle den Grenzwert des periodischen Dezimalbruchs 0,123 123 123 . . . als endlichen Bruch dar. [Hinweis: Umformung mit Hilfe der geometrischen Reihe.] 20.6 97 ist als Summe einer geometrischen Reihe mit dem Anfangsglied 1 darzustellen. 20.7 In einen Würfel von 1 m Kantenlänge ist eine Kugel einbeschrieben, in diese wieder ein Würfel, in diesen eine Kugel usw. Wie groß ist die Oberfläche aller Würfel? [Hinweis: Der Durchmesser der Kugel im Würfel n ist die Raumdiagonale des Würfels n + 1.]

21 Stetige Funktionen Die Definition einer Funktion als einer Abbildung zwischen Zahlenmengen wurde bereits in Abschn. 3.1 gegeben. Demnach gehören auch Folgen und Reihen zu den Funktionen. Da ihr Definitionsbereich nur aus den Indizes 0, 1, 2, 3, . . . besteht, werden sie zuweilen auch als Indexfunktionen bezeichnet. Wir wollen in diesem Abschnitt reelle Funktionen betrachten; Definitionsbereich und Wertebereich sind Untermengen der reellen Zahlen. Von besonderem Interesse sind stetige Funktionen. Eine Funktion ist dann stetig, wenn man ihren Graphen ohne abzusetzen zeichnen kann. Das zeichnerische Prüfverfahren scheitert allerdings in manchen Fällen, z. B. bei schnell oszillierenden Funktionen. Zur formalen Prüfung der Stetigkeit gibt es zwei äquivalente Definitionen, die Epsilon-Delta-Definition und die Folgen-Definition. Definition. Die Funktion f (x) ist genau dann stetig in x0 ∈ D, wenn es zu jeder Zahl ε > 0 eine Zahl δ > 0 gibt, so dass für alle x ∈ ℝ mit 0 < |x−x0 | < δ gilt |f (x)−f (x0 )| < ε . Anmerkung: Eine heute weit verbreitete Definition fordert nur, dass für alle x ∈ D (nicht ℝ) mit |x − x0 | < δ gilt |f (x) − f (x0 )| < ε . Damit sind auch Indexfunktionen stetig, was jedoch dem Grundgedanken der Stetigkeit reeller Funktionen zuwiderläuft. Definition. Die Funktion f (x) ist genau dann stetig in x0 ∈ D, wenn für jede Folge (xn ) mit xn ≠ x0 und Grenzwert x0 gilt: limn→∞ f (xn ) = f (x0 ). Da dies für jede Folge gelten muss, kann man auch limx→x0 f (x) = f (x0 ) schreiben. Gilt dies nicht für jede Folge oder existiert keine Folge (xn ) auf D mit xn ≠ x0 und Grenzwert x0 , so ist die Funktion nicht stetig an der Stelle x0 . Definition. Die Funktion f (x) ist nicht stetig an der Stelle x0 ∈ D, wenn es eine Zahl ε > 0 gibt, so dass zu jeder Zahl δ > 0 ein x ∈ ℝ existiert mit 0 < |x − x0 | < δ und |f (x) − f (x0 )| ≮ ε . Hinweis: Die Bedingung |f (x) − f (x0 )| ≮ ε bedeutet nicht allein |f (x) − f (x0 )| ≥ ε , sondern schließt auch den Fall ein, dass f (x) nicht definiert ist.

Abb. 21.1: (a) stetige Funktion, (b) in x0 unstetige Funktion, (c) in (x1 , x2 ) und sonst nirgends stetige Funktion.

198 | 21 Stetige Funktionen Ist eine Funktion an der Stelle x0 nicht erklärt, also x0 ∉ D, so ist sie dort auch nicht stetig, z. B. f (x) = x/x ist unstetig an der Stelle x0 = 0. Definition. Die Funktion f (x) heißt stetig im Intervall B ⊆ D, wenn f (x) an jeder Stelle x ∈ B stetig ist. Beispiel: Jedes reelle Polynom ist überall stetig. Satz (Zwischenwertsatz von Bolzano). Sei f (x) stetig auf dem abgeschlossenen Intervall [a, b] ⊆ D und sei f (a) ≤ y ≤ f (b). Dann gibt es eine Stelle x0 ∈ [a, b] mit f (x0 ) = y. Wenn f (a) und f (b) verschiedene Vorzeichen besitzen, so liegt im Intervall mindestens eine Nullstelle. Nicht jede stetige Funktion ist beschränkt, wie f (x) = x mit D = (−∞, ∞) oder f (x) = 1/x mit D = (0, 1) zeigen. Aber wenn f (x) an der Stelle x0 stetig ist, dann gibt es eine Umgebung U = (x0 − ε , x0 + ε ) von x0 mit ε > 0, so dass f (U ∩ D) beschränkt ist. Definition. Die Funktion f (x) heißt gleichmäßig stetig auf dem Intervall B ⊆ D, wenn es zu jeder Zahl ε > 0 eine Zahl δ > 0 gibt, so dass für alle x, y ∈ B mit |x − y| < δ gilt |f (x) − f (y)| < ε . δ (ε ) ist dabei für das gesamte Intervall B dasselbe, unabhängig von der speziellen Wahl von x und y. Jede auf einem abgeschlossenen Intervall stetige Funktion ist dort gleichmäßig stetig. Beispiele für gleichmäßig stetige Funktionen auf ℝ sind die konstante Funktion f (x) = c und die lineare Funktion f (x) = m⋅x + c sowie der Absolutbetrag f (x) = |x|. Polynome zweiten und höheren Grades sind auf ℝ zwar stetig, aber nicht gleichmäßig stetig. Die lineare Funktion f (x) = x ist auf ℝ gleichmäßig stetig. Wählen wir einfach δ = ε , so folgt aus |x − y| < δ , dass auch |f (x) − f (y)| = |x − y| < δ = ε . Die Hyperbel-Funktion f (x) = 1/x ist im Intervall (0, ∞) nicht gleichmäßig stetig. Um |f (x) − f (y)| = |1/x − 1/y| = |(x − y)/(x ⋅ y)| < ε sicherzustellen, muss |x − y| < ε ⋅ x ⋅ y gelten. δ ≤ ε ⋅ x ⋅ y hängt also nicht allein von ε ab, sondern auch von den Argumenten x und y, die beliebig klein werden können, so dass δ sehr klein werden muss. Auch die Parabel-Funktion f (x) = x2 ist auf ℝ nicht gleichmäßig stetig. |f (x) − f (y)| = |x2 − y2 | = |(x − y) ⋅ (x + y)| < ε gilt nur, falls |x − y| < δ ≤ ε /|x + y|.

Übungen 21.1 Man prüfe mit der ε , δ -Definition die Stetigkeit der folgenden Funktionen auf ℝ: (a) f (x) = x + 2 (b) f (x) = |x| (c) f (x) = x3

21 Stetige Funktionen |

199

21.2 Man zeige die Stetigkeit der Funktion f (x) = √x im Intervall (0, ∞). Wie ist δ zu wählen? [Hinweis: |√x − √x0 | = |(x − x0 )/(√x + √x0 )| ] 21.3 Man zeige die gleichmäßige Stetigkeit der Funktion f (x) = x−1 im Intervall [1, 10]. Wie ist δ zu wählen? [Hinweis: |1/x − 1/x0 | = |(x − x0 )/x ⋅ x0 | ] 21.4 Man zeige die gleichmäßige Stetigkeit der Funktion f (x) = x2 im Intervall [0, 10] mit Hilfe eines nur von ε abhängenden δ .

22 Funktionenfolgen und Funktionenreihen Die Glieder einer Folge oder einer Reihe können auch Funktionen sein. Definition. Sei D ⊆ ℝ fest. Für jedes n ∈ ℕ sei fn : D → ℝ gegeben. Dann heißt (fn )n∈ℕ oder kurz (fn ) eine Funktionenfolge. Definition. Die Funktionenfolge (∑nk=1 fk )n∈ℕ dargestellt als ∑k∈ℕ fk heißt Funktionenreihe¹ und ∑∞ k=1 fk heißt die Summenfunktion der Funktionenreihe. Definition. Sei (fn ) eine Funktionenfolge und B ⊆ D. (fn ) heißt konvergent im gewöhnlichen Sinne oder punktweise konvergent auf B, wenn eine Funktion f : B → ℝ existiert, so dass für alle x ∈ B gilt f (x) = limn→∞ fn (x). f heißt Grenzfunktion und ist eindeutig bestimmt. Definition. Die Funktionenfolge (fn ) mit der Grenzfunktion f : B → ℝ heißt gleichmäßig konvergent auf B ⊆ D, wenn zu jedem ε > 0 ein nε existiert, so dass für alle n ≥ nε und für alle x ∈ B gilt |fn (x) − f (x)| < ε .

Abb. 22.1: Grenzfunktion mit Epsilon-Umgebung.

Die zweite Definition ist schärfer, denn sie besagt, dass von einem gewissen nε an die Funktionen fn (x) an keinem Punkt x des Intervalls stärker als um ±ε von f (x) abweichen. Ist eine Funktionenfolge gleichmäßig konvergent, so ist sie auch punktweise konvergent. Sind die Funktionen fn stetig und gleichmäßig konvergent, so ist auch die Grenzfunktion f stetig. Sind die Funktionen dagegen nur punktweise konvergent, so kann die Grenzfunktion unstetig sein. Definition. (fn ) ist nicht gleichmäßig konvergent, wenn es ein ε > 0 und ein x ∈ B gibt, so dass zu jedem nε ein n ≥ nε existiert mit |fn (x) − f (x)| ≥ ε . Beispiel: fn (x) = xn . Die Funktionen der Folge (xn )n∈ℕ sind offenbar stetig und konvergieren auf dem Intervall B = [0, 1] punktweise gegen die unstetige Grenzfunktion {0 für 0 ≤ x < 1 f (x) = { . 1 für x = 1 {

1 Die Partialsummenfolge f1 , f1 + f2 , f1 + f2 + f3 , . . . wird durch die Schreibung als Reihe f1 + f2 + f3 + . . . lediglich abgekürzt, ohne die Summenfunktion hinzuzufügen.

22 Funktionenfolgen und Funktionenreihen |

201

Es gibt ein ε > 0 und ein x ∈ B, so dass für n ≥ nε gilt |fn (x) − f (x)| ≥ ε . Man wähle ε = 1/2 und die Stelle x = √n 3/4 < 1. Dort ist fn (x) = 3/4 und f (x) = 0, also |fn (x) − f (x)| = 3/4 ≥ 1/2. Im Intervall [0, a] mit 0 < a < 1 herrscht aber gleichmäßige Konvergenz, da xn < an → 0 für n → ∞. (Da a fest ist, kann x nicht mit dem Trick x = √n 3/4 beliebig nahe an 1 herangezogen werden.)

Abb. 22.2: Beispiel einer nicht gleichmäßig konvergenten Folge stetiger Funktion mit stetiger Grenzfunktion.

Beispiel: Die in Abb. 22.2 skizzierte Funktionenfolge konvergiert auf dem Intervall [0, 1] nur punktweise, obwohl die Glieder der Funktionenfolge ebenso wie die Grenzfunktion stetig sind. Man wähle x > 0 und n so groß, dass 1/n < x. Dann ist fn (x) = 0. Für alle x > 0 strebt also fn (x) gegen Null. Für x = 0 und alle n ist fn (x) = 0 (s. Abb. 22.2). Die Grenzfunktion ist also auf dem gesamten Intervall [0, 1] f (x) = 0 und damit stetig. Für den Beweis der nicht gleichmäßigen Konvergenz wähle man ε = 1/2, n = nε und x = 1/2nε . Dann ist fn (x) = 1 und |fn (x) − f (x)| = 1 ≥ 1/2. k k Beispiel: fn (x) = ∑nk=0 xk! . Die Funktionenreihe ∑k∈ℕ0 xk! konvergiert auf dem Intervall [−a, a] gleichmäßig gegen f (x) = ∑∞ k=0

xk , k!

denn

∞ ∞ k k 󵄨󵄨 ∞ xk 󵄨󵄨 󵄨󵄨 ≤ ∑ |x| ≤ ∑ a |f (x) − fn (x)| = 󵄨󵄨󵄨 ∑ 󵄨 󵄨 k! 󵄨 k=n+1 k! k! k=n+1 k=n+1

und das ist der Wert des Restes einer konvergenten Reihe, der beliebig klein wird. Die Definition der gleichmäßigen Konvergenz kann auch mit dem Cauchy-Kriterium erfolgen: Satz. Die Funktionenfolge fn (x) konvergiert gleichmäßig auf B ⊆ D, wenn zu jedem ε > 0 ein nε existiert, so dass für alle m, n ≥ nε und für alle x ∈ B gilt |fn (x) − fm (x)| < ε . Das Weierstraßsche Majorantenkriterium vereinfacht den Beweis der gleichmäßigen Konvergenz: Satz. ∑n∈ℕ fn (x) ist auf B ⊆ D gleichmäßig konvergent, wenn es eine konvergente Reihe ∑n∈ℕ an gibt, so dass |fn (x)| ≤ an für alle x ∈ B. Beispiel: Die Reihe ∑k∈ℕ 1 k2

und ∑k∈ℕ

1 k2

sin(kx) k2

󵄨 󵄨󵄨 konvergiert gleichmäßig für alle x ∈ ℝ, denn 󵄨󵄨󵄨 sin(kx) ≤ k2 󵄨󵄨

konvergiert gegen

π2 , 6

wie erstmals von Euler gezeigt wurde.

202 | 22 Funktionenfolgen und Funktionenreihen Fast alle Funktionen einer gleichmäßig konvergenten Funktionenfolge weichen also im gesamten Definitionsbereich nur um ein beliebig kleines ε von der Grenzfunktion ab. Daher muss die Grenzfunktion dieselben Stetigkeitseigenschaften wie die Funktionen der Folge besitzen. Damit ergibt sich der Satz: Satz. Ist die Funktionenfolge (fn ) gleichmäßig konvergent und sind die Funktionen fn (x) stetig, so ist auch die Grenzfunktion f (x) stetig. Dann ist die Bildung der Grenzfunktion mit einer Grenzwertbildung im Argument vertauschbar: lim lim f (x) x→x0 n→∞ n

= lim f (x) = f (x0 ) = lim fn (x0 ) = lim lim fn (x) x→x0

n→∞

n→∞ x→x0

(22.1)

Auch für Funktionenreihen ist dann die Bildung der Summenfunktion mit einer Grenzwertbildung im Argument vertauschbar: ∞



n=1

n=1

lim ∑ fn (x) = ∑ lim fn (x).

x→x0

x→x0

(22.2)

Falls alle Funktionen fn (x) stetige Ableitungen besitzen (s. Abschn. 23) und die Folge der Partialsummen der Ableitungen fn ’(x) gleichmäßig konvergiert, gilt außerdem noch ∞ d d ∞ ∑ fn (x) = ∑ (22.3) fn (x). dx n=1 dx n=1 Definition. ρ heißt Konvergenzradius einer Potenzreihe ∑n∈ℕ an xn , wenn die Reihe für alle x mit −ρ < x < ρ konvergiert. Nach dem Quotientenkriterium konvergiert die Potenzreihe mit den Gliedern an xn , 󵄨 a xn+1 󵄨󵄨 wenn für jedes n > n0 oder für n → ∞ gilt 󵄨󵄨󵄨 n+1 < 1. Daraus ergibt sich sofort an xn 󵄨󵄨 󵄨 a 󵄨 |x| < limn→∞ 󵄨󵄨󵄨 a n 󵄨󵄨󵄨 und damit der Konvergenzradius n+1 󵄨󵄨 a 󵄨󵄨 󵄨 󵄨 ρ = lim 󵄨󵄨󵄨 n 󵄨󵄨󵄨 . (22.4) n→∞ 󵄨󵄨 a 󵄨 n+1 󵄨 Beispiel: Der Konvergenzradius der Reihe ∑n∈ℕ0 xn ist ρ = 1, denn die geometrische Reihe konvergiert für |x| < 1 gegen (1 − x)−1 . Denselben Konvergenzradius besitzt n ∑n∈ℕ nx k mit beliebigem aber festem k. Für |x| < 1 ist die geometrische Reihe Majorante. Für |x| > 1 divergiert die Reihe nach dem Quotientenkriterium, denn für n ≥ n0 > (√k |x| − 1)−1 ist 1 1 n+1 < √k |x| − 1 ⇒ 1 + < √k |x| ⇒ < √k |x| n n n k n 1 n+1 k ) < |x| ⇒ ( ) > , ⇒( n n+1 |x| und es folgt k |x|n+1 n |x|n ) > 1. / k = |x| ( k n+1 (n + 1) n Die Reihenglieder wachsen also ab n0 beständig an, und die Reihe – ob alternierend oder nicht – kann nicht konvergieren. Für x = 1 hängt das Konvergenzverhalten von

22 Funktionenfolgen und Funktionenreihen |

203

der Größe von k ab: Für k = 1 ergibt sich die divergente harmonische Reihe, für k ≥ 2 liegt Konvergenz vor. Für x = −1 konvergiert die Reihe nach dem Leibniz-Kriterium. Satz. Ist die Potenzreihe ∑n∈ℕ an xn konvergent, so konvergiert auch die Reihe ∑ nr a n y n

mit r ∈ ℝ und

|y| < |x|.

n∈ℕ

Beweis. 󵄨󵄨 󵄨 1 󵄨󵄨󵄨r 󵄨󵄨󵄨󵄨 an+1 x 󵄨󵄨󵄨󵄨 󵄨󵄨 (n + 1)r an+1 yn+1 󵄨󵄨󵄨 󵄨󵄨󵄨󵄨 (n + 1)r 󵄨󵄨󵄨󵄨 󵄨󵄨󵄨󵄨 an+1 y 󵄨󵄨󵄨󵄨 󵄨󵄨󵄨 󵄨󵄨 󵄨 󵄨󵄨 ⋅ 󵄨 󵄨 = ⋅ < 1 + 󵄨 󵄨 󵄨 󵄨. 󵄨 󵄨 󵄨 󵄨 󵄨 󵄨 󵄨 󵄨󵄨 󵄨󵄨 nr 󵄨󵄨 󵄨󵄨 an 󵄨󵄨 󵄨󵄨 nr a n y n n 󵄨󵄨 󵄨󵄨󵄨 an 󵄨󵄨󵄨 󵄨󵄨󵄨 󵄨 Für n → ∞ strebt der linke Faktor gegen 1 und der rechte nach Voraussetzung gegen q < 1. Satz (Identitätssatz für Potenzreihen). Sei ∑ an (x − x0 )n = ∑ bn (x − x0 )n n∈ℕ

n∈ℕ

für alle x innerhalb des Konvergenzintervalls (x0 − ρ , x0 + ρ ), dann gilt an = bn .

Übungen n

22.1 Welchen Konvergenzradius besitzt die Reihe ∑n∈ℕ (−1)n ( 12 + x) ? [Hinweis: Man substituiere x + 1/2 := y.] 22.2 Man zeige, dass die folgenden Grenzwerte für jedes x endlich sind, die zugehörigen Reihen (vgl. Kap. VII) also den Konvergenzradius ρ = ∞ besitzen: (a) ex = ∑∞ n=0

xn n!

n x (b) cos x = ∑∞ n=0 (−1) (2n)! 2n

n x (c) sin x = ∑∞ n=0 (−1) (2n+1)! 2n+1

[Hinweis: Man setze x2n = (x2 )n := (y)n und zerlege x2n+1 (2n + 1)!

in

x x2n 2n + 1 (2n)!

worin der erste Faktor für n → ∞ verschwindet, also gewiss kleiner als 1 ist.]

| Teil VII: Differentialrechnung

23 Der Differentialquotient Die Differentialrechnung dient zur Ermittlung der Steigung von Tangenten an Kurven. Tangenten können aber nur angelegt werden, wenn der Definitionsbereich der die Kurven erzeugenden Funktionen nicht zu willkürlich ist, z. B. wie bei einer Folge nur aus isolierten Punkten besteht. Daher soll im Folgenden die Einschränkung gelten: Definition. Eine Teilmenge D ⊆ ℝ heißt zulässig als Definitionsbereich, wenn jeder Punkt x ∈ D Häufungspunkt ist, d. h. unendlich viele Punkte aus D in jeder Umgebung von x liegen.

Abb. 23.1: Strebt die Folge (xn ) = x1 , x2 , x3 , . . . gegen x0 , so strebt die Folge der Differenzenquotienten (Steigung der Sekanten) gegen den Differentialquotienten (Steigung der Tangente an der Stelle x0 ).

Definition. Die Funktion f (x) heißt an der Stelle x0 differenzierbar, wenn der Grenzwert der Folge der Differenzenquotienten eindeutig, d. h. für jede Folge (xn ) → x0 , existiert. Da der Grenzwert von der Wahl der speziellen Folge unabhängig ist, schreiben wir kurz f (x) − f (x0 ) df (x ) ≡ f 󸀠 (x0 ). lim := (23.1) x→x0 x − x0 dx 0 Dieser Grenzwert heißt Differentialquotient oder Ableitung von f an der Stelle x0 . Die Bezeichnung df /dx stammt von Leibniz, die Bezeichnung f 󸀠 (eigentlich ein f mit einem Punkt darüber) von Newton. Satz. Ist f an der Stelle x0 differenzierbar, so ist f dort stetig. ⇒ Ist f an der Stelle x0 nicht stetig, so ist f dort nicht differenzierbar. Stetigkeit ist also eine notwendige, aber nicht hinreichende Voraussetzung für die Differenzierbarkeit. Ein Beispiel für eine überall stetige, aber nicht überall differenzierbare Funktion ist der Absolutbetrag f (x) = |x|.

208 | 23 Der Differentialquotient Für x0 > 0 ist df /dx = 1, für x0 < 0 ist df /dx = (−1), für x0 = 0 existiert kein Differentialquotient. Um dies zu sehen, wählen wir für den Grenzübergang x → 0 die Folge xn = (−1)n /n, die zweifellos den Grenzwert x0 = 0 besitzt. Dort gilt aber für die Folge der Differenzenquotienten n 󵄨 n 󵄨󵄨 󵄨 n 󵄨󵄨 󵄨 − |0| 󵄨󵄨󵄨 (−1) 󵄨 ) − f (x0 ) 󵄨󵄨󵄨󵄨 (−1) f ( (−1) 1 n n 󵄨󵄨 n 󵄨󵄨 = (−1)n = ⇒ (an ) = −1, 1, −1, 1, . . . = 󵄨 (−1) an = n (−1)n (−1)n − x0 −0 n

n

n

Sie besitzt also keinen Grenzwert. Wenn wir Funktionen betrachten, die in ihrem gesamten Definitionsbereich differenzierbar sind, brauchen wir uns nicht auf einen speziellen Punkt x0 zu beschränken, sondern können Regeln aufstellen, die für alle x ∈ D gelten. Wir können dann den Differentialquotienten an jeder beliebigen Stelle x bilden. Ersetzen wir x durch x0 + Δ x und lassen anschließend den Index 0 weg, so erhält (23.1) die für viele Zwecke übersichtlichere Form lim

Δ x→0

f (x + Δ x) − f (x) df := (x) ≡ f 󸀠 (x). Δx dx

(23.2)

Ist die Ableitung f 󸀠 (x) einer differenzierbaren Funktion f (x) wieder eine differenzierbare Funktion, so kann die zweite Ableitung d 󸀠 d d d 2 f (x) ≡ f 󸀠󸀠 (x) f (x) = f (x) = dx dx dx dx2

(23.3)

gebildet werden. Ist diese wieder differenzierbar, so kann die dritte Ableitung f 󸀠󸀠󸀠 gebildet werden usw. Höhere als dritte Ableitungen werden nicht durch Striche sondern durch in Klammern gesetzte Exponenten angegeben: f (4) , f (5) , . . . Es ist aber stets zu untersuchen, ob die bearbeitete Funktion auch differenzierbar ist. Die mehrfache And wendung des Differentialoperators dx bezeichnet man in exponentieller Schreibweise n d durch ( dx ) . Gewöhnlich wird der Exponent aber am oberen und am unteren Teil angebracht, und zwar so, wie aus (23.3) ersichtlich – also im Zähler vor dem Funktionssymbol.

23.1 Ableitungen einfacher Funktionen Für die lineare Funktion f (x) = m ⋅ x + c mit D = ℝ ist die Ableitung gleich der konstanten Steigung m lim

Δ x→0

[m(x + Δ x) + c] − [mx + c] mΔ x = lim = m. Δ x→0 Δ x Δx

Daran erkennen wir drei Regeln, die sofort aus der Definition des Differentialquotienten (23.1) bzw. (23.2) folgen: Die Ableitung der konstanten Funktion f (x) = c verschwindet c󸀠 = 0.

(23.4)

23.1 Ableitungen einfacher Funktionen | 209

Die Ableitung der Summe zweier Funktionen ist die Summe der beiden Ableitungen (f + g)󸀠 = f 󸀠 + g󸀠 .

(23.5)

Eine additive Konstante entfällt also bei der Differentiation ersatzlos. Eine multiplikative Konstantem bleibt dagegen bei der Differentiation unverändert (f ⋅ m)󸀠 = f 󸀠 ⋅ m.

(23.6)

Die Ableitung der Funktion f (x) = x2 mit D = ℝ ist (x + Δ x)2 − x2 x2 + 2xΔ x + (Δ x)2 − x2 d 2 x = lim = lim = 2x. Δ x→0 Δ x→0 dx Δx Δx Die Ableitung der Funktion f (x) = xn mit D = ℝ und n ∈ ℕ erhalten wir ebenfalls mit Hilfe der binomischen Formel (x + Δ x)n − xn nxn−1 Δ x + R(Δ x)2 d n x = lim = lim = nxn−1 Δ x→0 Δ x→0 dx Δx Δx

(23.7)

denn der Rest R(Δ x)2 enthält den Faktor Δ x mindestens in der zweiten Potenz, so dass er beim Grenzübergang verschwindet. Wie man aus folgendem Beispiel ersieht, sind Polynome unendlich oft differenzierbar: f (x) = x3

f 󸀠 (x) = 3x2

f 󸀠󸀠 (x) = 6x

f 󸀠󸀠󸀠 (x) = 6 f (4) (x) = 0 f (5) (x) = 0

usw.

Dagegen ist die zweite Ableitung f 󸀠󸀠 (x) = 6|x| der Funktion f (x) = |x|3 zwar überall stetig, aber an der Stelle 0 nicht differenzierbar. Mit (23.7) erhalten wir für alle Polynome und sogar für Potenzreihen (die obere Summationsgrenze ist dann ∞) n d n ∑ ak xk = ∑ ak kxk−1 . dx k=0 k=1

(23.8)

Zu beachten ist, dass die untere Summationsgrenze von 0 auf 1 gesetzt werden muss (denn die Ableitung von x0 ist 0 und nicht 0 ⋅ x−1 , weil das für x = 0 einen unbestimmten Ausdruck ergäbe). Wie später noch gezeigt wird (s. Abschn. 27.1), lässt sich der binomische Satz verallgemeinern, so dass wir nicht nur für natürliche Zahlen k, sondern für alle reellen Zahlen r außer Null erhalten d r x = r ⋅ xr−1 dx

für r ∈ ℝ \ {0}.

(23.9)

Zum Beispiel besitzt die Funktion f (x) = x−1 auf ihrem gesamten Definitionsbereich D = ℝ \ {0} die Ableitung f 󸀠 (x) = −x−2 d 1 = lim dx x Δ x→0

1 x+Δ x



Δx

1 x

= lim

Δ x→0

x − (x + Δ x) 1 −Δ x 1 ⋅ = lim = − 2. (x + Δ x)x Δ x Δ x→0 (x + Δ x)x ⋅ Δ x x

210 | 23 Der Differentialquotient

23.2 Ableitungsregeln Satz (Kettenregel). Seien g(y) in y0 und f (x) in x0 differenzierbare Funktionen mit y = f (x), dann gilt dg dg df (x ) = (y ) (x ). dx 0 dy 0 dx 0 Beweis.

g(y) − g(y0 ) g(y) − g(y0 ) y − y0 dg (x0 ) = lim = lim ⋅ . x→x x→x 0 0 dx x − x0 y − y0 x − x0

Da f (x) = y in x0 differenzierbar ist, ist f dort auch stetig und es gilt lim y = lim f (x) = f ( lim x) = f (x0 ) = y0 = lim y

x→x0

x→x0

x→x0

y→y0

d. h. y → y0 für x → x0 . Man erhält das Produkt der Limites g(y) − g(y0 ) f (x) − f (x0 ) dg df dg ⋅ lim = (x ) = lim (y ) ⋅ (x ) y→y0 x→x0 dx 0 y − y0 x − x0 dy 0 dx 0 oder kurz

dg dg dy = ⋅ dx dy dx wie es vom Grenzwert einer Folge von Brüchen zu erwarten ist.

(23.10)

Bemerkung: In Fällen wie diesem ist die Leibnizsche Notation der Newtonschen vorzuziehen. Satz. Sei f (x) = y auf D streng monoton und differenzierbar. Dann existiert die Umkehrfunktion f −1 (y) = x und es gilt dy dx ⋅ = 1. (23.11) dx dy Beweis. Der Beweis folgt abermals aus der Tatsache, dass der Differentialquotient Grenzwert einer Folge ist, für welche die Regeln der Bruchrechnung ohne Einschränkung gelten 1 df (x) df (x) = df −1 (y) . = −1 dx df (f (x)) dy

Man kann auch von (23.10) ausgehen, wobei dg/dx = 1, da g = f −1 (f (x)) = x. Satz (Produktregel). Seien f (x) und g(x) auf D differenzierbar, dann gilt d (f ⋅ g) = f 󸀠 ⋅ g + f ⋅ g󸀠 . dx Beweis. f (x)g(x) − f (x0 )g(x0 ) d(f ⋅ g) (x0 ) = lim x→x0 dx x − x0 f (x)g(x) − f (x)g(x0 ) + f (x)g(x0 ) − f (x0 )g(x0 ) = lim x→x0 x − x0 g(x) − g(x0 ) f (x) − f (x0 ) = lim f (x) lim + g(x0 ) lim . x→x0 x→x0 x→x 0 x − x0 x − x0

(23.12)

23.2 Ableitungsregeln

| 211

(23.7) ergibt sich auch durch wiederholte Anwendung von (23.12): d 2 x = (x ⋅ x)󸀠 = 1 ⋅ x + x ⋅ 1 = 2x dx d 3 x = (x2 ⋅ x)󸀠 = 2 ⋅ x ⋅ x + x2 ⋅ 1 = 3 ⋅ x2 dx

usw.

Der Beweis durch vollständige Induktion benutzt x󸀠 = 1 ⋅ x0 und den Schritt d n+1 = (xn ⋅ x)󸀠 = n ⋅ xn−1 ⋅ x + xn ⋅ 1 = (n + 1) ⋅ xn . x dx Satz (Quotientenregel). Seien f (x) und g(x) auf D differenzierbar, wobei auf dem gesamten Definitionsbereich g(x) ≠ 0 gelten soll, dann gilt d f f 󸀠 g − fg 󸀠 . = dx g g2

(23.13)

Beweis. Die Produktregel liefert d 1 1 1 󸀠 (f ⋅ ) = f 󸀠 ⋅ + f ⋅ ( ) . dx g g g Mit der Kettenregel folgt für den zweiten Term 1 d 1 d g dg −1 󸀠 = ⋅ = 2 ⋅g . dx g dg dx g

Erweitern des ersten Terms mit g liefert (23.13). Satz (Mittelwertsatz). Sei f : [a, b] → ℝ auf dem offenen Intervall (a, b) differenzierbar und auf dem abgeschlossenen Intervall [a, b] stetig. Dann gibt es ein x0 ∈ (a, b) mit f (b) − f (a) (23.14) = f 󸀠 (x0 ). b−a Dies ist eine Folge des Zwischenwertsatzes (S. 198) für die stetige Ableitung f 󸀠 der differenzierbaren Funktion f . Verallgemeinerung: Seien f und g auf [a, b] differenzierbar und g 󸀠 ≠ 0 für x ∈ D. Dann gibt es ein x0 ∈ (a, b) mit f 󸀠 (x ) f (b) − f (a) = 󸀠 0 . g(b) − g(a) g (x0 ) Satz (l’Hospitalsche Regel). Seien f und g auf dem abgeschlossenen Intervall B differenzierbar, sei g󸀠 ≠ 0 für x ∈ B und a ein Endpunkt von B. Ist lim(x∈B)→a f (x) = lim(x∈B)→a g(x) = 0 und existiert lim(x∈B)→a lim (x∈B)→a

f 󸀠 (x) , g󸀠 (x)

dann ist

f (x) f 󸀠 (x) = lim 󸀠 . g(x) (x∈B)→a g (x)

(23.15)

Beweis. lim (x∈B)→a

f (x) f (x) − f (a) = lim = lim g(x) (x∈B)→a g(x) − g(a) (x∈B)→a

f (x)−f (a) x−a g(x)−g(a) x−a

= lim (x∈B)→a

f 󸀠 (x) g󸀠 (x)

212 | 23 Der Differentialquotient

Abb. 23.2: Zum Mittelwertsatz. Die Tangente muss an mindestens einer Stelle zwischen a und b parallel zur Sekante verlaufen, wenn die Funktion f dort überall differenzierbar ist (also keine Ecken oder Lücken hat).

Übungen 23.1 Man berechne die ersten und zweiten Ableitungen der Funktionen √x, √3 x, x3,14 , 3x + 3, (7x + 2) ⋅ (3x3 − 2x6/7 ), (x2 − 3x)/(x − 1), (x + 7)/(x − 3), (3x2 + 2)1/2 , (3x2 + 2)−1/2 , ((x3 + 2x2 + x + 2)−1 + 2x)−1 , √√x, ((x1/2 )1/2 )1/2 , x1/2 ⋅ x1/2 und gebe die Definitionsbereiche der Funktionen und ihrer Ableitungen an. 23.2 Man berechne mit Hilfe der Kettenregel d 1x d2x

,

d(3x + 5) d df (x) df (x) , ((x + f (x))2 )󸀠 , ((x5 + 1)3 + 3x)4 , , . d(2x − 3) dx dg(x) d 1 x

23.3 Man berechne mit Hilfe der Quotientenregel d 3x + 5 d 5x + 5 d (f (x))3 , . , dx 2x − 3 dx 2x2 + 3 dx 1 + g(y) 23.4 Man berechne mit Hilfe der Produktregel: d (a) dx (f (x)g(y) + h(z)) [Hinweis: Funktionen, die nicht von x abhängen, ändern sich nicht bei Änderung von x.] (b)

d (f (x)g(x)h(x)) dx

[Hinweis: f ⋅ g ⋅ h = (f ⋅ g) ⋅ h.] (c)

d dx

∏nk=1 fk (x)

[Hinweis: ∏ ist eine Abkürzung für das Produkt aller Funktionen von f1 bis fn .]

23.2 Ableitungsregeln | 213

23.5 Man berechne mit Hilfe der l’Hospitalschen Regel die Grenzwerte lim x→(−1)

x2 − 1 , x+1

√x − 1 lim , x→1 √x − 1

lim

x→1

x3 + x2 − 2 , x−1

x2 − 1 lim , x→1 √x − 1

lim

x→1

(x − 1)3 , x5 + x3 − 2

lim

x→3

(x − 3)4 , (x − 3)3

sin2 x − 1 lim . x→π /2 cos x

sin x , lim x→0 x

[Hinweis: (sin x)󸀠 = cos x, (cos x)󸀠 = − sin x, s. Abschn. 25.] 23.6 An welcher Stelle läuft die Tangente der Kurve

2x2 x+1

23.7 An welcher Stelle läuft die Tangente der Kurve

−2 x2

parallel zur Geraden 1 − 2x? parallel zur Geraden 2 + x/3?

23.8 An welcher Stelle stimmen die Ableitungen von x2 und √x überein? 23.9 Bilden Sie die erste Ableitung: 3

3

3



∑ n2 x n ,

∑ x2 xn ,

∑ (x2 + 2) (1 − x2n ),



n=0

n=0

n=0

n=0

xn . n!

24 Die Exponentialfunktion Die Reihe funktion¹

x0 0!

+

x1 1!

+

x2 2!

+

x3 3!

+ . . . konvergiert für jedes x ∈ ℝ gegen die Exponential∞

exp(x) = ∑ n=0

xn . n!

(24.1)

Ihr Wertebereich ist (0, ∞). Der Grenzwert der auf Newton zurückgehenden Reihenentwicklung kann nach Euler auch als Grenzwert exp(x) = lim (1 + n→∞

x n ) n

(24.2)

einer Folge gewonnen werden. Die binomischen Formel (S. 27) liefert eine Darstellung (1 +

x n n x n(n − 1) x2 n(n − 1)(n − 2) x3 ) =1+ + + ... + n 1n 1 ⋅ 2 n2 1⋅2⋅3 n3 n(n − 1) xn−2 n xn−1 xn + + + 1 ⋅ 2 nn−2 1 nn−1 nn

der Folgenglieder, aus der sich (24.1) im Grenzfalle n → ∞ ergibt. Beweis (für x ≥ 0.). Die Eulersche Folge ist Minorante der Newtonschen Reihe ∀n ∈ ℕ : (1 +

n n n xk xk n(n − 1) . . . (n − k + 1) x n ) = ∑( ) k =1+ ∑ k k n n k! k=0 k=1 n n

≤1+∑ k=1

n xk xk =∑ . k! k=0 k!

Ihr Grenzwert kann also (24.1) nicht übertreffen. Andererseits ist für jedes m ≤ n (1 +

m m − 1 m xk xk n(n − 1) ⋅ ⋅ ⋅ (n − k + 1) 1 x n ) ≥1+∑ (1 ) ⋅ ⋅ ⋅ (1 − )) ∑ ≥ 1 + ⋅ (1 − n k! n n k! nk k=1 k=1

und mit lim (1 ⋅ (1 −

n→∞

m−1 1 ) ⋅ ⋅ ⋅ (1 − )) = 1 n n

gilt für die monotone Folge lim (1 +

n→∞

m xk x n ) ≥∑ n k! k=0

woraus für m → ∞ die zu beweisende Identität von (24.1) und (24.2) folgt. Um den Beweis auf x < 0 auszudehnen, verwendet man (24.4). Siehe auch die Ableitung von (24.2) aus (24.11󸀠 ) auf S. 219 sowie Übung 24.10.

1 Die Schreibweise exp x ist ebenfalls möglich, aber etwas verwirrend, weil die Funktionsbezeichnung bereits ein x enthält.

24 Die Exponentialfunktion |

215

Eine dritte Definition der Exponentialfunktion ergibt sich mit Hilfe der Funktionalgleichung (24.3) exp(x1 + x2 ) = exp(x1 ) ⋅ exp(x2 ). Beweis.



exp(x1 ) ⋅ exp(x2 ) = ∑ n=0

x1n ∞ x2m ⋅ ∑ n! m=0 m!

Das Produkt der Grenzwerte kann durch Multiplikation der Reihen und anschließende Limesbildung auf die übliche Art berechnet werden (alle Summanden der zweiten Reihe mit dem ersten Summanden der ersten Reihe multiplizieren, dann mit dem zweiten Summanden der ersten Reihe usw.) oder aber nach dem Cauchyschen Diagonalverfahren:

Abb. 24.1: Zum Cauchyschen Diagonalverfahren.

Anstelle der Indexkombinationen (0, 0), (0, 1), (0, 2), . . . ,

(1, 0), (1, 1), (1, 2), . . . ,

(2, 0), (2, 1), (2, 2), . . .

werden die Indexkombinationen (0, 0),

(0, 1), (1, 0),

(0, 2), (1, 1), (2, 0),

...

summiert. Auch auf die zweite Art kommt jede Kombination genau einmal zustande. ∞

∑ n=0

∞ ∞ k x1n ∞ x2m xn ⋅ xm xn ⋅ xk−n ⋅ ∑ =∑ ∑ 1 2 =∑∑ 1 2 n! m=0 m! k=0 n+m=k n! ⋅ m! k=0 n=0 n! ⋅ (k − n)!

Der letzte Ausdruck kann mit k! erweitert werden. Da k in der zweiten Summe nicht als Summationsindex, sondern nur als Grenze, also als Konstante vorkommt, kann 1/k! vor das letzte Summenzeichen gezogen werden. Es ergibt sich dann mit (4.7), wobei dort die Buchstaben k und n vertauscht sind, was aber belanglos ist, ∞

∑ k=0

∞ 1 k k! 1 k k n k−n ∞ 1 ∑ ∑ ( )x1 ⋅ x2 = ∑ (x1 + x2 )k x1n ⋅ x2k−n = ∑ k! n=0 n! ⋅ (k − n)! k! k! n=0 n k=0 k=0

also exp(x1 + x2 ). Damit ist (24.3) bewiesen. Aus historischen Gründen schreibt man die Exponentialfunktion auch als ex mit der nicht durch Ziffern darstellbaren, irrationalen Basis (s. Abschn. 24.3) 2,718 281 828 459 ⋅ ⋅ ⋅ → e = lim (1 + n→∞

1 n ) . n

216 | 24 Die Exponentialfunktion

Abb. 24.2: Graph der Exponentialfunktion.

Die Funktionalgleichung lautet dann (24.3󸀠 )

ex1 +x2 = ex1 ⋅ ex2 . Satz. exp(−x) = 1/ exp(x).

(24.4)

Beweis. 1 = exp(0) = exp(x − x) = exp(x) ⋅ exp(−x). Satz. exp(x) ist streng monoton wachsend mit dem Wertebereich (0, ∞). Beweis. Für x ≥ 0 gilt nach (24.1) exp(x) ≥ 1. Nach (24.3) ist für Δ x > 0 und alle x ∈ ℝ exp(x + Δ x) = exp(x) ⋅ exp(Δ x) > exp(x). Und nach (24.4) ist exp(x) auch für negative Argumente positiv mit den Grenzwerten exp(x) → ∞ für x → ∞

und

exp(x) → 0 für x → −∞.

Satz. exp(x) wächst stärker als jedes Polynom von x: lim

x→∞

xn = 0. exp(x)

Beweis. ∞

ex = ∑ n=0

xn+1 xn > n! (n + 1)!



xn (n + 1)! < → 0 für exp(x) x

x → ∞.

Satz. Die Ableitung der Exponentialfunktion exp(x) ist exp(x).

(24.5)

Beweis. exp󸀠 (x) =

∞ ∞ ∞ ∞ d xn nxn−1 xn−1 xm d ∞ xn ∑ =∑ =∑ =∑ = ∑ = exp(x) dx n=0 n! n=0 dx n! n=1 n! n=1 (n − 1)! m=0 m!

denn es ist ganz gleichgültig, mit welchem Buchstaben der laufende Index bezeichnet wird. Satz. Die Exponentialfunktion ist die einzige Funktion mit den Eigenschaften exp󸀠 (x) = exp(x) und

exp(0) = 1.

24.1 Der natürliche Logarithmus | 217

Beweis. Sei f (x) = f 󸀠 (x). Dann ist f 󸀠 (x) ⋅ exp(x) − f (x) ⋅ exp(x) f 󸀠 (x) − f (x) d f (x) = = = 0. dx exp(x) exp(x) (exp(x))2 Also ist

f (x) exp(x)

konstant, f (x) = C ⋅ exp(x), f (0) = C.

24.1 Der natürliche Logarithmus Die Umkehrfunktion der Exponentialfunktion heißt natürlicher Logarithmus oder logarithmus naturalis mit der Abkürzung ln. Man schreibt ln(x) oder kurz ln x. Der natürliche Logarithmus einer Zahl x ist der Exponent², mit dem man die Zahl e potenzieren muss, um x zu erhalten. Wie sich aus den Eigenschaften der Exponentialfunktion ergibt, ist ln x eine streng monoton wachsende Funktion mit dem Definitionsbereich (0, ∞) und dem Wertebereich ℝ. Funktion und Umkehrfunktion erfüllen ln ex = x = eln x

(24.6)

wobei die rechte Gleichung x > 0 erfordert. Im Definitionsbereich gelten die im Folgenden beschriebenen und bewiesenen Rechenregeln. Man vergleiche zum Beweis jeweils das in eckige Klammern gesetzte Argument der Exponentialfunktion links und rechts. Wegen der strengen Monotonie der Exponentialfunktion implizieren gleiche Funktionswerte gleiche Argumente. ln 1 = 0 denn

exp[ln 1] = 1 = exp[0].

ln e = 1 denn

exp[ln e] = e = exp[1].

ln(1/x) = − ln(x) denn

(24.7)

exp[ln(1/x)] = 1/x = 1/ exp ln x = exp[− ln x].

ln(x1 ⋅ x2 ) = ln x1 + ln x2 denn

exp[ln(x1 ⋅ x2 )] = x1 ⋅ x2 = exp ln x1 ⋅ exp ln x2 = exp[(ln x1 + ln x2 )].

a

ln(x ) = a ⋅ ln(x) denn

(24.8) (24.9)

a

ln(x ) = ln(x ⋅ x ⋅ ⋅ ⋅ x) = ln x + ln x + ⋅ ⋅ ⋅ + ln x = a ⋅ ln x.

(24.8) ist die Funktionalgleichung der Logarithmusfunktion; sie führt direkt auf (24.9) und diese mit negativem Exponenten auf (24.7).

2 Die Bezeichnung Logarithmus ist daher eigentlich überflüssig. Man hätte ebensogut Exponent benutzen können.

218 | 24 Die Exponentialfunktion b

b

Zur Bezeichnungsweise: ea := e(a ) ≠ (ea )b ≡ eab denn

ln((ea )b ) = b ⋅ ln(ea ) = b ⋅ a ⋅ ln(e) = a ⋅ b = (a ⋅ b) ⋅ ln(e) = ln(eab )

aber

ln(ea ) = ab ⋅ ln(e) = ab ≠ a ⋅ b,

b

z. B. für a = b = 0.

Abb. 24.3: Graph der Logarithmusfunktion.

ln x xn

Satz. ln x wächst schwächer als jede Potenz von x : limx→∞

= 0.

Beweis. Mit der Substitution x = exp(y) wird lim

x→∞

ln x ln ey y = lim = lim yn = 0 y→∞ (ey )n y→∞ e xn

denn exp(y) und damit auch exp(yn) wächst stärker als jedes Polynom von y. Satz. Die Ableitung der Logarithmusfunktion ist d ln x 1 = . dx x Beweis.

d ln x = dx

1 d exp ln x d ln x

=

(24.10)

1 1 = . exp ln x x

24.2 Grenzwerte ex − 1 =1 x→0 x folgt unmittelbar aus (24.1). Also gilt auch x lim = 1. x→0 ex − 1 Damit ergibt sich ln x lim =1 x→1 x − 1 denn ln x y ln x = = und y → 0 x − 1 exp(ln x) − 1 ey − 1

(24.11)

lim

Die Behauptung folgt mit (24.11󸀠 ).

(24.11󸀠 )

für

x → 1.

24.3 Irrationalität der Basis der natürlichen Logarithmen

| 219

(24.2) lässt sich ebenfalls durch eine derartige Grenzwertbetrachtung gewinnen. Mit (24.11󸀠 ) ist y ) ey − 1 ln(1 + x/n) ) = lim exp (x n→∞ exp(ln(1 + x/n)) − 1

exp(x) = lim exp (x y→0

da ln(1 + x/n) → 0 für n → ∞. Und mit (24.6) folgt exp(x) = lim exp (x n→∞

ln(1 + x/n) ) x/n

= lim exp(n ⋅ ln(1 + x/n)) n→∞

= lim exp ln(1 + x/n)n n→∞

= lim (1 + x/n)n . n→∞

Auch ln x lässt sich als Grenzwert einer Folge schreiben ln x = lim n (√n x − 1)

für x > 1.

n→∞

(24.12)

Abermals wird (24.11) angewandt ln x = lim ln(x) ⋅ y→0

ey − 1 y

= lim ln(x) ⋅

)−1 exp ( ln(x) n

n→∞

= lim n ⋅ (exp ( n→∞

ln(x) n

ln(x) ) − 1) n

= lim n ⋅ (exp ln(x1/n ) − 1) n→∞

= lim n ⋅ (x1/n − 1) . n→∞

24.3 Irrationalität der Basis der natürlichen Logarithmen Satz. e ist eine irrationale Zahl. p 1 Beweis. Wir nehmen an, e = ∑∞ n=0 n! = q mit natürlichen Zahlen p und q. Da e nicht ganzzahlig ist, muss gelten q ≥ 2. Summiert man nur vom nullten bis zum q-ten Glied, so bleibt der Rest: q

R=e− ∑ n=0

1 n!

∞ ∞ ∞ 1 1 1 p 1 1 1 1 + + ... + ) = ∑ −∑ = ∑ =∑ = − (1 + q 1! 2! q! n=0 n! n=0 n! n=q+1 n! n=1 (q + n)! q

220 | 24 Die Exponentialfunktion q! ist Hauptnenner der linken Seite, also muss q! ⋅ R eine positive ganze Zahl sein. Multiplizieren wir auch die rechte Seite mit q!, so ergibt sich die Abschätzung ∞

q! ⋅ R = ∑ n=1

∞ q! 1 0 ⇒ (Lokales) Minimum: Die Steigung nimmt zu, die Kurve ist linksgekrümmt.

26.1 Beispiel einer Kurvendiskussion



| 231

f 󸀠󸀠 (x) = 0 ∧ f 󸀠󸀠󸀠 (x) ≠ 0 (oder f 󸀠󸀠󸀠 (x) = 0 und die erste darauf folgende nicht verschwindende Ableitung ist eine ungerade) ⇒ Die Krümmung ändert ihren Charakter. Es liegt ein Wendepunkt vor. Ist außerdem noch f 󸀠 (x) = 0, so besteht im Wendepunkt eine horizontale Tangente, es handelt sich um einen Sattelpunkt.

Abb. 26.2: Spezielle Punkte einer Kurve.

Diese Hilfsmittel eignen sich vorzüglich, um mit möglichst geringem Aufwand die Eigenschaften komplizierter Funktionen zu erkennen, ohne die Graphen aufzuzeichnen. (Man sollte allerdings niemals auf wenigstens eine grobe Skizze des Graphen verzichten.)

26.1 Beispiel einer Kurvendiskussion f (x) = x3 − 4x f (x) ist für jedes x eindeutig bestimmt. Es handelt sich um eine Funktion. x ist nicht für jedes f (x) eindeutig bestimmt. Die Funktion ist nicht im gesamten Definitionsbereich umkehrbar. Definitionsbereich: −∞ < x < ∞ Symmetrieeigenschaften: Die Funktion ist ein Polynom mit ausschließlich ungeradzahligen Exponenten; das bedingt Punktsymmetrie zum Ursprung: f (−x) = −f (x). (Besitzt ein Polynom nur geradzahlige Exponenten, so besteht Spiegelsymmetrie zur Ordinate: f (−x) = f (x).) Grenzwerte: limx→−∞ x3 − 4x = −∞, limx→∞ x3 − 4x = ∞ Die Funktion geht asymptotisch gegen x3 . Wertebereich: −∞ < f (x) < ∞ Linearfaktoren: f (x) = (x + 2) ⋅ x ⋅ (x − 2) Nullstellen: x01 = −2, x02 = 0, x03 = 2 Erste Ableitung: f 󸀠 (x) = 3x2 − 4 Extremstellen: xM1 = − 23 √3, xM2 = 23 √3

232 | 26 Kurvendiskussion

Abb. 26.3: Der Graph von f (x) = x 3 − 4x.

Zweite Ableitung: f 󸀠󸀠 (x) = 6x f 󸀠󸀠 < 0 für x < 0



f 󸀠󸀠 > 0 für x > 0



16 √ 3. 9 16 bei xM2 liegt ein lokales Minimum f (xM2 ) = − √3. 9 bei xM1 liegt ein lokales Maximum f (xM1 ) =

f 󸀠󸀠 (0) = 0 Dritte Ableitung: f 󸀠󸀠󸀠 (x) = 6 ≠ 0 Wendestelle: xW1 = 0 ist Wendestelle; der Wendepunkt (0|0) ist aber kein Sattelpunkt, da die Funktion dort keine horizontale Tangente besitzt: f 󸀠 (0) = −4 ≠ 0.

Übungen 26.1 Man diskutiere die Funktion f (x) = x4 + x 26.2 Man diskutiere die Funktion f (x) = x7 /7 + x4 /2 + x 26.3 Man diskutiere die Funktion f (x) = x2 /ex . 26.4 Wie muss der Grundriss eines rechteckigen Hauses aussehen, wenn bei einer Grundfläche von A = 100 m2 die Außenwände so kurz wie möglich sein sollen? [Hinweis: Die Wandlänge ist als Funktion von Länge und Breite darzustellen und das Minimum zu suchen. Durch die Flächenvorgabe wird die freie Wahl von Länge und Breite auf eine freie Variable eingeschränkt.] 26.5 In eine Kugel ist ein Zylinder von möglichst großem Volumen zu legen.

26.1 Beispiel einer Kurvendiskussion

| 233

26.6 Aus einem Baumstamm von 27 cm Durchmesser ist ein rechtwinkliger Balken von größtmöglicher Tragfähigkeit t zu schneiden. t ist proportional zur Breite B und zum Quadrat der Höhe H des Balkens. 26.7 Aus einem Kreis vom Durchmesser D ist ein Rechteck der Breite B und der Höhe H zu schneiden, so dass das Produkt B ⋅ H 3 maximal wird.

27 Approximation von Funktionen Approximation bedeutet Annäherung. Wir wollen in diesem Kapitel Verfahren kennenlernen, mit denen man Funktionen als konvergente Reihen darstellen kann. Diese Methode dient zum einen zur leichteren numerischen Berechnung von Funktionswerten, zum anderen bietet sie eine einfache und manchmal sogar die einzige Möglichkeit zur Integration dieser Funktionen.

27.1 Der allgemeine binomische Satz Die für natürliche Zahlen n erklärte binomische Formel (4.8) soll verallgemeinert werden. Dazu teilen wir in (4.6󸀠 ) durch den größeren Summanden, oBdA sei dies a, d. h. wir gehen aus von (1 + b/a)n = (1 + x)n n n (1 + x)n = ∑ ( )xk k k=0

(27.1)

und fragen nach ( nk ) für n = (−1). Bei Beschränkung auf |x| < 1 steht links die Summe der alternierenden geometrischen Reihe, denn nach (20.5) gilt für negatives Vorzeichen von x 1 − x + x2 − x3 + − . . .





∑ (−x)m = m=0

1 1 = = (1 + x)−1 . 1 − (−x) 1 + x

Daraus finden wir die Binomialkoeffizienten 1, −1, 1, −1, 1, . . . , denn dies sind die Faktoren in der Potenzreihenentwicklung: 1 ⋅ x0 + (−1) ⋅ x1 + 1 ⋅ x2 + (−1) ⋅ x3 + − . . .



(1 + x)−1

Für |x| < 1 und n = (−2) multiplizieren wir diese Reihe mit sich selbst: (1 + x)−2 =

1 1 ⋅ 1+x 1+x

(1 − x + x2 − + . . . ) ⋅ (1 − x + x2 − + . . . ) = (1 − x + x2 − + . . . ) − x ⋅ (1 − x + x2 − + . . . ) + x2 ⋅ (1 − x + x2 − + . . . ) − + . . . = 1 − x + x2 − x3 + x4 − x5 + − . . . − x + x2 − x3 + x4 − x5 + − . . . + x2 − x3 + x4 − x5 + − . . . − + ... = 1 − 2x + 3x2 − 4x3 + 5x4 − 6x5 + − . . .



(1 + x)−2

und für |x| < 1 und n = (−3) analog: (1 + x)−3 =

1 1 1 2 1 1 ⋅ ⋅ =( ) ⋅ 1+x 1+x 1+x 1+x 1+x

27.1 Der allgemeine binomische Satz

|

235

(1 − 2x + 3x2 − + . . . ) ⋅ (1 − x + x2 − + . . . ) = 1 − 2x + 3x2 − 4x3 + 5x4 − 6x5 + − . . . − x + 2x2 − 3x3 + 4x4 − 5x5 + − . . . + x2 − 2x3 + 3x4 − 4x5 + − . . . − x3 + 2x4 − 3x5 + − . . . + −... 2

= 1 − 3x + 6x − 10x3 + 15x4 − 21x5 + − . . .



(1 + x)−3

Wir können das Pascalsche Dreieck für negative Exponenten somit folgendermaßen erweitern:

Abb. 27.1: Das erweiterte Pascalsche Dreieck.

Man rechnet nach, dass Gleichung (4.8) auch für negative ganze Zahlen n erfüllt ist und, wie in (4.9) gefordert, jede Zahl die Summe der beiden über ihr stehenden ist. Nun wollen wir den Fall gebrochener Exponenten n untersuchen. Sei wieder |x| < 1 und n = − 12 : √1 − x + x 2 − x 3 + − . . .





√ ∑ (−x)m = (1 + x)−1/2 = m=0

1 √1 + x

Es ist also eine Reihe zu finden, die mit sich selbst multipliziert die alternierende geometrische Reihe ergibt, für die also gilt: −1 −1 −1 −1 −1 −1 [( 2 ) + ( 2 ) x + ( 2 ) x2 + . . . ] ⋅ [( 2 ) + ( 2 ) x + ( 2 ) x2 + . . . ] = 0 1 2 0 1 2 1 − x + x2 − + . . . Wird die linke Seite nach dem Cauchyschen Multiplikationsschema (s. Abb. 24.1) ausmultipliziert und nach Potenzen von x geordnet, so ergeben sich die Binomialkoeffizienten durch Vergleich mit den Koeffizienten der entsprechenden Potenzen von x auf der rechten Seite: −1 −1 −1 −1 −1 −1 −1 −1 [( 2 ) ( 2 )] + [2 ( 2 ) ( 2 )] x + [( 2 ) ( 2 ) + 2 ( 2 ) ( 2 )] x2 + . . . 0 0 0 1 1 1 0 2 Setzen wir fest, dass ( 0n ) immer positiv ist, so erhalten wir (

− 12 ) = 1, 0

− 12 1 )=− , 1 2

(

− 12 3 )= 2 8

(

usw.

236 | 27 Approximation von Funktionen Wie man durch Nachrechnen feststellt, werden auch diese Binomialkoeffizienten von (4.8) geliefert. Dieselbe Betrachtung kann für die Stammbrüche n = ± 12 , ± 13 , ± 14 usw. angestellt oder allgemein bewiesen werden (Abschn. 27.3), dass (4.8) für beliebige rationale Exponenten q ∈ ℚ richtig ist. Und da sich zu jeder reellen Zahl r eine rationale Zahl q finden lässt, so dass die Differenz (r − q) beliebig klein wird¹, gilt (4.8) für beliebige reelle Exponenten r r r(r − 1)(r − 2) ⋅ ⋅ ⋅ (r − k + 1) ( )= k 1 ⋅ 2 ⋅ 3⋅⋅⋅k

für k ∈ ℕ und r ∈ ℝ.

(27.2)

Davon wurde bei der Herleitung von (23.9) bereits Gebrauch gemacht. Beispiele (es wird stets 0 < x < 1 vorausgesetzt): 1 1 1 3 x − x2 + x − + ... → √1 + x (27.3) 2 8 16 1 1 3 1 x − −... → √1 + (−x) = √1 − x 1 − x − x2 − 2 8 16 1 5 3 1 3 1 − x + x2 − x + − − ... → 2 8 16 √1 + x 3 1 1 5 3 1 x + ... = 1 + x + x2 + → 2 8 16 √ √1 + (−x) 1−x 5 2 40 3 2 −2/3 x + − − . . . → (1 + x) 1− x+ x − 3 9 81 Für |x| ≪ 1 konvergieren die Reihen im Allgemeinen sehr schnell. Unter Vernachlässigung höherer Potenzen ergibt sich dann z. B. 1+

1 √1 + x ≈ 1 + 1 x ≈ . 2 √1 − x

(27.3󸀠 )

27.2 Fourier-Analyse Das Argument x einer periodischen Funktion wird häufig in der parametrischen Form t := ω0 t T mit dem Parameter t, der Periodenlänge T oder der Grundkreisfrequenz ω0 angegeben, um den periodischen Charakter x = 2π

f (t + T) = f (t) deutlich um Ausdruck zu bringen. Sobald der Parameter um eine Periodenlänge gewachsen ist, besteht wieder der ursprüngliche Zustand.

1 Jede reelle Zahl r kann als Grenzwert einer Folge (qn ) → r von rationalen Zahlen qn dargestellt werden. Da die binomischen Reihen für |x| < 1 absolut und gleichmäßig konvergieren, können nach (22.1) die Grenzübergänge vertauscht werden: limn→∞ (1 + x)qn = (1 + x)lim qn = (1 + x)r .

27.2 Fourier-Analyse | 237

Nach einem Satz von Fourier kann eine (abschnittsweise stetig differenzierbare) periodische Funktion der Periodenlänge T = 2π /ω0 durch eine Reihe aus Winkelfunktionen mit ganzzahligen Vielfachen der Grundkreisfrequenz ω0 dargestellt werden: a0 + a1 cos(1 ⋅ ω0 t) + a2 cos(2 ⋅ ω0 t) + a3 cos(3 ⋅ ω0 t) + ⋅ ⋅ ⋅ + b1 sin(1 ⋅ ω0 t) + b2 sin(2 ⋅ ω0 t) + b3 sin(3 ⋅ ω0 t) + ⋅ ⋅ ⋅ → f (t) ∞

f (t) = a0 + ∑ [ak cos(k ⋅ ω0 t) + bk sin(k ⋅ ω0 t)]

(27.4)

k=1

Man nennt (27.4) die spektrale Zerlegung oder das Spektrum der Funktion f (t). Um die spektrale Zerlegung zu gewinnen, müssen die reellen Koeffizienten ak und bk berechnet werden. Dafür gibt es einige einfache Regeln. Seien m und n zwei beliebige natürliche Zahlen oder Null, wobei allerdings nicht beide gleichzeitig verschwinden dürfen, so gelten die folgenden, in Abschn. 33.1 verifizierten Gleichungen: T/2

{0 ∫ cos(mω0 t) ⋅ cos(nω0 t) dt = { T −T/2 {2 T/2

{0 ∫ sin(mω0 t) ⋅ sin(nω0 t) dt = { T −T/2 {2

für m ≠ n für m = n ≠ 0 für m ≠ n für m = n ≠ 0

(27.5)

(27.6)

T/2

∫ cos(mω0 t) ⋅ sin(nω0 t) dt = 0

(27.7)

−T/2 T/2

∫ dt = T

(27.8)

−T/2

Multipliziert man beide Seiten der Gleichung (27.4) mit cos(mω0 t) und integriert dann von −T/2 bis T/2, so bleibt wegen (27.5) und (27.7) auf der rechten Seite nur am T/2 übrig. Damit ergeben sich für m ≠ 0 die Koeffizienten T/2

am =

2 ∫ f (t) ⋅ cos(mω0 t) dt. T

(27.9)

−T/2

Für m = 0 ergibt sich wegen (27.5), (27.7), (27.8) und cos 0 = 1 T/2

1 ∫ f (t) dt.² a0 = T

(27.10)

−T/2

a0 ist also der Mittelwert der Funktion f (t). 2 Viele Autoren setzen f (t) in (27.4) mit a0 /2 statt a0 an, um für a0 dasselbe Bildungsgesetz (27.9) wie für die anderen Koeffizienten zu haben: T/2

T/2

∫ f (t) cos 0 dt = ∫ −T/2

−T/2

T/2

a0 a 2 dt = 0 T ⇒ a0 = ∫ f (t) cos 0 dt 2 2 T −T/2

238 | 27 Approximation von Funktionen Multiplikation von (27.4) mit sin(mω0 t) und anschließende Integration liefert entsprechend für m ≠ 0 und wegen sin 0 = 0 auch für m = 0 T/2

2 ∫ f (t) ⋅ sin(mω0 t) dt. bm = T

(27.11)

−T/2

Als Beispiel wollen wir die Kastenfunktion aus Abb. 27.2 darstellen. Zum Verständnis sind allerdings Grundkenntnisse der Integralrechnung (s. Kap. VIII) erforderlich. (27.10) liefert T/2

T/2

1 1 1 ∫ f (t) dt = ∫ dt = a0 = T T 2 −T/2

0

denn zwischen −T/2 und 0 verschwindet f (t), und zwischen 0 und T/2 ist f (t) = 1. Die Berechnung von a1 erfolgt nach (27.9) T/2

T/2

2 2 ∫ f (t) ⋅ cos(ω0 t) dt = ∫ cos(ω0 t) dt = 0. a1 = T T −T/2

0

Ebenso wie a1 verschwinden alle am für m ≥ 1. Entweder rechnet man dies anhand von (27.9) nach, oder man überlegt sich, dass jede Kosinusfunktion cos(mω0 t) gerade, also zur Ordinate symmetrisch ist, unsere Wahl des Zeitnullpunktes für die Kastenfunktion (vgl. Abb. 27.2) aber eine asymmetrische Funktion s(t) zur Folge hat. Somit bleiben nur noch die Koeffizienten bm übrig. Wir berechnen die ersten nach (27.11): T/2

T/2

2 2 2 ∫ f (t) ⋅ sin(ω0 t) dt = ∫ sin(ω0 t) dt = b1 = T T π

b2 =

b3 =

−T/2

0

T/2

T/2

2 2 ∫ f (t) ⋅ sin(2ω0 t) dt = ∫ sin(2ω0 t) dt = 0 T T −T/2

0

T/2

T/2

2 2 2 ∫ f (t) ⋅ sin(3ω0 t) dt = ∫ sin(3ω0 t) dt = T T 3π −T/2

0

Die vollständige Reihenentwicklung nach (27.4) lautet f (t) =

1 2 ∞ sin((2k + 1)ω0 t) + ∑ . 2 π k=0 2k + 1

Wie Abb. 27.3 zeigt, liefern bereits die ersten fünf nicht verschwindenden Glieder eine recht gute Approximation der Kastenfunktion.

27.3 Die Taylor-Reihe |

239

Abb. 27.2: Kastenfunktion.

Abb. 27.3: Approximation der Kastenfunktion aus Abb. 27.2 mit den FourierKoeffizienten a0 , b1 , b3 , b5 , b7 .

27.3 Die Taylor-Reihe Wir stellen uns nun die Aufgabe, eine Funktion f (x) durch ein Polynom bzw. eine Potenzreihe zu approximieren. Nach dem folgenden Satz ist diese Aufgabe lösbar, wenn die Funktion lediglich stetig ist: Satz (Weierstraßscher Approximationssatz). Jede auf dem abgeschlossenen Intervall B ⊆ D stetige Funktion lässt sich gleichmäßig auf B durch Polynome approximieren. Wir wollen aber eine auf B ⊆ D mindestens (n + 1)-mal differenzierbare Funktion voraussetzen, wobei n eine feste natürliche Zahl ist. Zunächst betrachten wir die Stelle x0 ∈ B mit dem Funktionswert f (x0 ). Der Funktionswert f (x) an der nahe bei x0 gelegenen Stelle x ∈ B wird sich nur wenig davon unterscheiden, denn wegen der Stetigkeit von f gilt f (x) → f (x0 ) für x → x0 . Wenn allerdings f (x) nicht konstant ist, ist diese nullte Näherung nur für sehr kleine Differenzen (x − x0 ) befriedigend. Eine bessere Näherung ergibt sich, wenn auch die Steigung der Tangente berücksichtigt wird, denn wegen der Differenzierbarkeit von f gilt mit (23.1) f (x) → [f (x0 ) + (x − x0 ) ⋅ f 󸀠 (x0 )] für x → x0 . Wenn allerdings f 󸀠 (x) nicht konstant ist, ist auch diese erste Näherung nur für sehr kleine Differenzen (x−x0 ) befriedigend. Eine bessere Näherung ergibt sich, wenn auch die Änderung der Steigung und deren Änderung usw. berücksichtigt werden. Wir konstruieren daher ein Polynom, das an der Stelle x0 in den ersten n nicht verschwindenden Ableitungen mit den Ableitungen f (k) (x0 ) der zu approximierenden Funktion übereinstimmt. Dies ist das Taylor-Polynom n-ter Ordnung um den Entwicklungspunkt x0 n

Tn,x0 (x) = ∑ k=0

f (k) (x0 ) (x − x0 )k . k!

(27.12)

240 | 27 Approximation von Funktionen

Abb. 27.4: Der Wert des Taylor-Polynoms an der Stelle x für verschiedene Entwicklungspunkte x0 . (Die Striche bezeichnen keine Ableitungen, sondern unterscheiden nur die Entwicklungspunkte.) Die Taylor-Reihe (27.16) stimmt im Konvergenzintervall (hier überall) mit der approximierten Funktion überein.

Man überzeugt sich leicht, dass es die gewünschte Eigenschaft besitzt, denn da f (k) (x0 )/k! nicht von x abhängt, also konstant ist, ist nur der Term (x − x0 )k abzuleiten. Und solange der verbleibende Exponent größer als Null ist, stellt dieser Term an der Stelle x = x0 den Faktor Null dar; lediglich (x0 − x0 )0 = 00 = 1. f (0) (x0 ) = f (0) (x0 ) (x0 − x0 )0 + 0 + 0 + 0 + ⋅ ⋅ ⋅ + 0 0! f (1) (x0 ) ⋅ 1 ⋅ (x0 − x0 )0 + 0 + 0 + ⋅ ⋅ ⋅ + 0 = f (1) (x0 ) T(1) n,x0 (x0 ) = 0 + 1! f (2) (x0 ) T(2) ⋅ 1 ⋅ 2 ⋅ (x0 − x0 )0 + 0 + ⋅ ⋅ ⋅ + 0 = f (2) (x0 ) n,x0 (x0 ) = 0 + 0 + 2! ... T(0) n,x0 (x0 ) =

T(n) n,x0 (x0 ) = 0 + 0 + ⋅ ⋅ ⋅ + 0 +

f (n) (x0 ) ⋅ 1 ⋅ 2 ⋅ ⋅ ⋅ n ⋅ (x0 − x0 )0 = f (n) (x0 ) n!

Abb. 27.5: Das Restglied an der Stelle x als Funktion des Entwicklungspunktes x0 (vgl. Abb. 27.4).

27.3 Die Taylor-Reihe |

241

Auf den Spezialfall f (x) = (1 + x)r wurde dieses Verfahren bereits in Abschn. 27.1 angewandt, denn für diese Funktionen sind die Binomialkoeffizienten nach (27.2) nichts anderes als die Koeffizienten des Taylor-Polynoms an der Stelle x0 = 0 1 dk r(r − 1)(r − 2) ⋅ ⋅ ⋅ (r − k + 1) 1 dk . f (0) = lim (1 + x)r = x→0 k! dxk k! dxk k! Wir wollen nun den Fehler Rn+1 abschätzen, der sich am Punkt x ergibt, wenn die Funktion f (x) durch das um den Punkt x0 entwickelte Taylor-Polynom Tn,x0 (x) vom Grad n ersetzt wird. Dieser Fehler wird auch als Restglied bezeichnet. Er hängt sicher vom Grad n sowie von x und x0 ab Rn+1 (x, x0 ) = f (x) − Tn,x0 (x).

(27.13)

Betrachten wir nun x als fest und x0 als variabel, so ergibt sich durch Differenzieren von (27.12) nach x0 mit der Produktregel: n n f (k+1) (x0 ) f (k) (x0 ) d Tn,x0 (x) = ∑ (x − x0 )k − ∑ (x − x0 )k−1 dx0 k! (k − 1)! k=0 k=1 n

=∑ k=0

=

n−1 (k+1) f (k+1) (x0 ) f (x0 ) (x − x0 )k − ∑ (x − x0 )k k! k! k=0

f (n+1) (x0 ) (x − x0 )n n!

(27.14)

dTn,x0 (x) ist die Änderung des Wertes des Taylor-Polynoms am Punkt x, bei Veränderung des Entwicklungspunktes x0 um dx0 . In Abb. 27.4 rücken die durch Punkte gekennzeichneten Werte immer näher an den tatsächlichen Funktionswert heran, wenn x0 sich x nähert. Wenn x0 = x gewählt wird, stimmt der Wert des Taylor-Polynoms am Punkt x mit f (x) überein. Nach dem Mittelwertsatz (23.14) gibt es (mindestens) eine spezielle Stelle ξ zwischen x0 und x, an der die Ableitung mit dem Differenzenquotienten übereinstimmt (s. Abb. 27.5) Tn,x (x) − Tn,x0 (x) f (x) − Tn,x0 (x) Rn+1 (x, x0 ) d Tn,ξ (x) = = = . dx0 x − x0 x − x0 x − x0 Nach (27.14) gilt an dieser Stelle ξ f (n+1) (ξ ) d (x − ξ )n . Tn,ξ (x) = dx0 n! Damit ergibt sich das Restglied nach Cauchy zu Rn+1 (x, x0 ) =

f (n+1) (ξ ) (x − ξ )n (x − x0 ) n!

󵄨 Dessen Betrag kann also durch das Maximum von 󵄨󵄨󵄨 f zwischen x und x0 abgeschätzt werden.

mit ξ ∈ (x0 , x). (n+1)

n!

(ξ )

(27.15)

󵄨 (x − x0 )n+1 󵄨󵄨󵄨 für ξ im Intervall

242 | 27 Approximation von Funktionen Wenn an der Stelle x0 alle Ableitungen der Funktion f existieren und das Restglied Rn+1 (x, x0 ) für x0 − ρ < x < x0 + ρ mit wachsendem n gegen Null konvergiert, so gibt die Summenfunktion der Taylor-Reihe ∞

Tx0 (x) = ∑ k=0

f (k) (x0 ) (x − x0 )k k!

(27.16)

den Funktionsverlauf im Konvergenzintervall (x0 − ρ , x0 + ρ ) exakt wieder. Für die praktische Rechnung ist es am bequemsten, wenn möglich x0 = 0 zu wählen. Dann erhält man die MacLaurin-Reihe mit der Summenfunktion ∞

T(x) = ∑ k=0

f (k) (0) k x . k!

(27.17)

Definition. Eine auf B erklärte Funktion f (x) ist um den Punkt x0 ∈ B entwickelbar, wenn es eine Potenzreihe P(x) = ∑n∈ℕ ak (x − x0 )k gibt, die in einer Umgebung (x0 − ρ , x0 + ρ ) von x0 gegen f konvergiert. Definition. Wenn die Funktion f (x) um jeden Punkt x0 ∈ B entwickelt werden kann, so heißt sie analytisch auf B. Jede analytische Funktion ist unendlich oft differenzierbar, und alle ihre Ableitungen sind ebenfalls wieder analytisch. Satz. Die Funktion f (x) sei in der Umgebung U = (x0 − ρ , x0 + ρ ) von x0 unendlich oft differenzierbar und für k > k0 gelte |f k! (x)| ρ k+1 ≤ C, wobei C eine positive reelle Zahl ist. Dann konvergiert die Taylor-Reihe für jedes x ∈ U gegen f . (k+1)

Beweis. Da die Umgebung ein offenes Intervall ist, gilt stets |x − x0 | < ρ . Wählt man n0 |x−x |n groß genug, so lässt sich für jedes ε > 0 und jedes n > n0 die Ungleichung ρ n0 < Cε erfüllen. Wegen |x − ξ | ≤ |x − x0 | ist außerdem |(x − ξ )n (x − x0 )| ≤ |(x − x0 )n+1 |. Für n > k0 und n > n0 gilt dann 󵄨󵄨 󵄨󵄨 f (n+1) (ξ ) 󵄨󵄨 f (n+1) (ξ ) (x − x0 )n+1 󵄨󵄨󵄨󵄨 ε 󵄨 󵄨 󵄨 (x − x0 )n+1 󵄨󵄨󵄨 = 󵄨󵄨󵄨 ρ n+1 Rn+1 (x, x0 )| ≤ 󵄨󵄨󵄨 󵄨 0. Das Integral ∫0 e−kx x dx berechnen wir mit f 󸀠 (x) = e−kx und g(x) = x: ∞

−kx

∫e 0







e−kx e−kx e−kx 1 x] − ∫ dx = 0 − [ 2 ] = 2 x dx = [ −k 0 −k k k 0 0

(30.15)

260 | 30 Integrationsmethoden b

Beispiel: Das Integral ∫a cos2 x dx berechnen wir mit f 󸀠 (x) = cos x und g(x) = cos x: b

b

∫ cos x cos x dx = [sin x cos x]ba − ∫ sin x(− sin x) dx a

a b

= [sin x cos x]ba + ∫ sin2 x dx a b

=

[sin x cos x]ba

+ ∫ (1 − cos2 x) dx a b

b

= [sin x cos x]ba + ∫ dx − ∫ cos2 x dx a

a

b

Nun wird der rechts auftretende Term − ∫a cos2 x dx nach links gebracht: b

2 ⋅ ∫ cos2 x dx = [sin x cos x]ba + [x]ba a b

∫ cos2 x dx = a

1 [x + sin x cos x]ba 2

(30.16)

Dieses Verfahren liefert ebenfalls das Integral b

∫ sin2 x dx = a

insbesondere ist

1 [x − sin x cos x]ba 2

π

π

π ∫ cos x dx = = ∫ sin2 x dx 2 2

0

0

und es erlaubt die Aufstellung einer Rekursionsformel: π

∫ sin 0

π n+2

(30.16󸀠 )

x dx = ∫ (− cos x)󸀠 sinn+1 x dx 0 π n+1

= [(− cos x) sin

π

x]0 − ∫ (− cos x)(n + 1) sinn x cos x dx 0

π

= 0 + ∫ cos2 x ⋅ (n + 1) sinn x dx 0 π

= (n + 1) ∫ (1 − sin2 x) sinn x dx 0

(30.16󸀠󸀠 )

30.4 Logarithmische Integration π

π

⇒ (n + 2) ∫ sin

n+2

x dx = (n + 1) ∫ sinn x dx

0 π

0 π

∫ sinn+2 x dx =

n+1 ∫ sinn x dx n+2

0 π

| 261

0

Für n = 8 führt dies wegen ∫0 sin x dx = π auf 0

π

∫ sin8+2 x dx = 0

9⋅7⋅5⋅3⋅1 ⋅π 10 ⋅ 8 ⋅ 6 ⋅ 4 ⋅ 2

π

für n = 9 wegen ∫0 sin x dx = 2 auf π

∫ sin9+2 x dx = 0

10 ⋅ 8 ⋅ 6 ⋅ 4 ⋅ 2 ⋅ 2. 11 ⋅ 9 ⋅ 7 ⋅ 5 ⋅ 3 ⋅ 1

Für n → ∞ werden die Integrale gleich, und wir erhalten das Wallissche Produkt 2 ⋅ 2 ⋅ 4 ⋅ 4 ⋅ 6 ⋅ 6 ⋅ 8 ⋅ 8... 1 ⋅ 3 ⋅ 3 ⋅ 5 ⋅ 5 ⋅ 7 ⋅ 7 ⋅ 9...



π . 2

30.4 Logarithmische Integration Wegen b

ln f (b)

a

ln f (a)

d ln f (x) b ∫ dx = ∫ d ln f (x) = [ln f (x)]a dx ergibt die Integration beider Seiten von (24.21) für 0 < a < b b b [ln f (x)]a

=∫ a

f 󸀠 (x) dx. f (x)

(30.17)

Kann also der Integrand in der Form f 󸀠 /f geschrieben werden, so ist die Stammfunktion ln f (x) + C. Wie in Abschn. 30.6 gezeigt wird, gilt aber nicht nur für 0 < a < b, sondern für beliebige Integrationsgrenzen mit Ausnahme von 0 und ±∞ b

∫ a

󵄨󵄨 f (b) 󵄨󵄨 f 󸀠 (x) 󵄨 󵄨󵄨 dx = ln |f (b)| − ln |f (a)| = ln 󵄨󵄨󵄨 󵄨. 󵄨󵄨 f (a) 󵄨󵄨󵄨 f (x)

(30.18)

b

dx auszuführen, berücksichtigen wir, dass p die AbleiBeispiel: Um das Integral ∫a px+q tung von px + q ist. Also schreiben wir b 1 p 1 1 1 󵄨󵄨󵄨 pb + q 󵄨󵄨󵄨󵄨 ∫ dx = [ln |px + q|]ba = (ln |pb + q| − ln |pa + q|) = ln 󵄨󵄨󵄨 󵄨. p px + q p p p 󵄨󵄨 pa + q 󵄨󵄨󵄨 a

262 | 30 Integrationsmethoden b

Beispiel: Zu bestimmen ist das Integral ∫a tan x dx für 0 ≤ a < b ≤ π /2. b

b

a

a

b

sin x − sin x 󵄨󵄨 cos a 󵄨󵄨󵄨 󵄨󵄨 . ∫ tan x dx = ∫ dx = − ∫ dx = − [ln |cos x|]ba = ln 󵄨󵄨󵄨󵄨 cos x cos x 󵄨 cos b 󵄨󵄨 a

Beispiel: Der Integrand in ∫ ∫

dx sin x cos x

kann mit cos x erweitert werden.

1 1 cos−2 x cos x dx = ∫ sin x dx = ∫ dx = ln | tan x| + C. 2 2 tan x sin x cos x cos x cos x

30.5 Partialbruchzerlegung Eine echt gebrochen rationale Funktion kann in Teilbrüche oder Partialbrüche zerlegt werden. Dazu bestimmt man die Linearfaktoren des Nenners und formt den Bruch damit in eine Summe von Brüchen um. Diese können dann elementar integriert werden. Für zwei teilerfremde Zahlen kann man nach Abschn. 5.1 immer zwei ganzzahlige Multiplikatoren finden, so dass die Linearkombination der Produkte 1 ergibt. Einen ähnlichen Satz können wir auch für Polynome formulieren, die nach Abschn. 15 einen Ring bilden. Satz. Seien a(x), b(x) und p(x) drei teilerfremde Linearfaktoren, dann gibt es zwei Zahlen A und B, so dass ∀x : B ⋅ a(x) + A ⋅ b(x) = p(x).

(30.19)

Beweis. Die Linearfaktoren seien (x − α ), (x − β ) und (x − 𝛾). Wir berechnen A und B und zeigen damit die Existenz. Um für alle x die Gleichung ∀x : B ⋅ (x − α ) + A ⋅ (x − β ) = (x − 𝛾)

(30.20)

zu erfüllen, vergleichen wir die Glieder mit verschiedenen Potenzen von x (hier nur x0 und x1 ) separat miteinander. Denn bei Änderung von x ändern sich diese Glieder in unterschiedlicher Weise. Da wir in den resultierenden Gleichungen (30.21) und (30.22) die Potenzen von x nicht aufzuführen brauchen (sie kürzen sich für x ≠ 0 heraus), werden nur deren Faktoren oder Koeffizienten verglichen. Daher heißt diese Methode Koeffizientenvergleich. x0 : B ⋅ α + A ⋅ β = 𝛾

(30.21)

1

x :B+A=1 Mit B = 1 − A aus (30.22) führt (30.21) auf A =

𝛾−α β −α

(30.22) und B =

𝛾−β α −β

.

Bemerkung: Auch für ein konstantes p(x) = −𝛾 liefert (30.19) eine Lösung. Das Gleichungssystem lautet dann B ⋅ α + A ⋅ β = 𝛾, B + A = 0 und führt auf B = 𝛾/(α − β ) und A = 𝛾/(β − α ).

30.5 Partialbruchzerlegung |

263

Eine echt gebrochen rationale Funktion zweiten Grades ist der Quotient zweier Polynome, worin der Zähler (vom Grad 0 oder 1) nicht durch einen Linearfaktor des Nenners (vom Grad 2) teilbar ist. Wie gerade gezeigt wurde, können wir in diesem Falle folgende Umformung durchführen, wenn α ≠ β , die Linearfaktoren des Nenners also verschieden sind: p(x) A B = + (30.23) a(x) ⋅ b(x) a(x) b(x) denn nach (30.19) ist A B A⋅b B⋅a A⋅b+B⋅a p + = + = = . a b a⋅b b⋅a a⋅b a⋅b dx ist mit Partialbruchzerlegung zu integrieren. Beispiel: ∫ x2x+3 +x−2 A B x+3 x+3 = + = x2 + x − 2 (x − 1) ⋅ (x + 2) x − 1 x + 2

(30.24)

∀x : x + 3 = A ⋅ (x + 2) + B ⋅ (x − 1)

(30.24󸀠 )

Koeffizientenvergleich oder die Festlegung bestimmter Werte wie 1 und −2 für x (denn (30.24󸀠 ) soll ja im Gegensatz zu (30.24) für alle x gelten) liefert A = 4/3 und B = −1/3. ∫

4 1 1 1 x+3 dx = ∫ dx − ∫ dx 3 x−1 3 x+2 x2 + x − 2 4 1 = ln |x − 1| − ln |x + 2| + C 3 3 = ln √ 3

|x − 1|4 +C |x + 2|

Wenn die beiden Linearfaktoren des Nenners identisch sind, führt der Ansatz (30.23) nicht zum Ziel. Man benutzt stattdessen den Ansatz A A p(x) = 1 + 22 . 2 a (x) a(x) a (x)

(30.25)

7x+2 Beispiel: ∫ (x+1) 2 dx ist zu integrieren.

A1 A2 7x + 2 = + (x + 1) ⋅ (x + 1) (x + 1) (x + 1)2



∀x : 7x + 2 = A1 ⋅ (x + 1) + A2

führt auf A1 = 7 und A2 = −5. Dies entspricht einer Umformung des Zählers von 7x + 2 auf 7(x + 1) − 5. ∫

1 1 5 7x + 2 dx − 5 ∫ +C dx = 7 ∫ dx = 7 ln |x + 1| + x+1 x+1 (x + 1)2 (x + 1)2

Für echt gebrochen rationale Funktionen höheren Grades kann man die Partialbruchzerlegung ebenfalls anwenden. Bei drei verschiedenen Linearfaktoren wird (30.23) fortgesetzt zu p(x) A B C = + + . (30.26) a(x) ⋅ b(x) ⋅ c(x) a(x) b(x) c(x)

264 | 30 Integrationsmethoden Bei mehreren gleichen Linearfaktoren ist (30.25) so fortzusetzen, dass jeweils eine Potenz hinzugefügt wird. Bei drei gleichen Linearfaktoren wird (30.25) fortgesetzt zu A A A p(x) = 1 + 22 + 33 . 3 a (x) a(x) a (x) a (x)

(30.27)

Und bei noch mehr Linearfaktoren wird entsprechend weiter fortgesetzt. Ist eine unecht gebrochen rationale Funktion zu integrieren, so teilt man den Zähler durch den Nenner und integriert das bei der Division entstehende ganze Polynom direkt. Beispiel: 2x4 + x3 + 3x2 − x + 1 ∫ dx x3 + 2x2 + x ist nicht echt gebrochen, doch durch Polynomdivision ergibt sich ein ganzes Polynom und eine echt gebrochen rationale Funktion ∫(2x − 3) dx + ∫

7x2 + 2x + 1 dx. (x − 0)(x + 1)2

Zur Bestimmung der Partialbrüche beachten wir die doppelte Nullstelle: B1 B2 7x2 + 2x + 1 A + = + x x + 1 (x + 1)2 (x − 0)(x + 1)2 7x2 + 2x + 1 = A ⋅ (x + 1)2 + B1 ⋅ x ⋅ (x + 1) + B2 ⋅ x Koeffizientenvergleich liefert: x0 : 1 = A



A =1

2



B1 = 6

1



B2 = −6

x : 7 = A + B1 x : 2 = 2A + B1 + B2 Damit wird das Integral zu:

B B2 A dx dx + ∫ 1 dx + ∫ x x+1 (x + 1)2 1 1 1 dx = ∫(2x − 3) dx + ∫ dx + 6 ∫ dx − 6 ∫ x (x + 1) (x + 1)2 6 +C = x2 − 3x + ln |x| + 6 ⋅ ln |x + 1| + x+1

∫(2x − 3) dx + ∫

Im Falle komplex-konjugierter Nullstellen zerlegt man nur bis zum irreduziblen quadratischen Polynom und bringt es durch Substitution auf die Form 1 + t2 . Die komplexe Nullstelle sei u + iv, das irreduzible Polynom x2 − 2ux + u2 + v2 = (x − (u + iv)) ⋅ (x − (u − iv)).

30.6 Uneigentliche Integrale |

265

Mit der Substitution x − u := y vereinfacht sich das Polynom zu y 2 (y − iv) ⋅ (y + iv) = y2 + v2 = v2 (( ) + 1) . v Der Faktor v2 wird vor das Integral gezogen, so dass nur noch y 2 ( ) + 1 := t2 + 1 v zu integrieren bleibt. Damit wird die Partialbruchzerlegung: Dt + E D 1 2t = ⋅ +E⋅ 2 1 + t2 1 + t2 1 + t2 D Dt + E ∫ dt = ln |1 + t2 | + E ⋅ arctan t + C 2 1 + t2

(30.28)

30.6 Uneigentliche Integrale Gelegentlich lässt sich eine Funktion f auch über einem Intervall integrieren, wenn sie nicht auf dem gesamten Intervall definiert ist. Man spricht dann von uneigentlicher Integration. 󵄨 󵄨 b Satz. f (x) ist uneigentlich integrierbar über [a, ∞), wenn 󵄨󵄨󵄨∫a f (x)dx󵄨󵄨󵄨 für jedes b > a existiert und zu jedem ε > 0 ein b0 ∈ [a, ∞) existiert, so dass für b1 , b2 ≥ b0 gilt: 󵄨󵄨 󵄨󵄨 b2 󵄨󵄨∫b1 f (x) dx󵄨󵄨 < ε . Zur Prüfung kann das Majorantenkriterium herangezogen werden.

Abb. 30.2: Zur Begründung von ∫ dx/x = ln |x| + C.

266 | 30 Integrationsmethoden Insbesondere erhalten wir für Funktionen der Form 1/xc : ∞



1

1

0 0 die Existenz des Integrals ermöglicht. Im Folgenden wollen wir diese Funktion der Einheitlichkeit halber mit G(p) bezeichnen (zumal ω nicht mehr explizit auftritt). Als Integrationsvariable kann auch t dienen. Damit erhalten wir die LaplaceTransformierte oder Bildfunktion ∞

G(p) = ∫ g(t) e−pt dt

(33.22)

0

der Zeitfunktion oder Originalfunktion g(t). (33.22) ist die Definitionsgleichung der Laplace-Transformation. Die in (33.21) auftretenden Faktoren √2π e−σ t sind darin bereits enthalten. Ein nach (33.22) korrespondierendes Paar von Funktionen g(t) und G(p) heißt eine Korrespondenz. Die Korrespondenz notiert man durch² G(p) = L[g(t)] oder

G(p) ∙ ∘ g(t).

Wenn die Zeitfunktion g(t) folgende Bedingungen erfüllt, ist das uneigentliche Integral (33.22) definiert: – ∀t < 0 : g(t) = 0 ∞ – ∃a ∈ ℝ : ∫0 |g(t)| dt < a – ∃b, c ∈ ℝ : |g(t)| < b ⋅ ec⋅t – Es existiert der rechtsseitige Grenzwert lim0 0 führt auf Die Stufenfunktion sx (t) = { 1 für t ≥ x { ∞ −pt

L[sx (t)] = ∫ 1 ⋅ e



dt = [

x

e−pt e−px ] = ∙ ∘ sx (t). −p x p

(33.24)

{0 für t < 0 Die lineare Funktion l(t) = { ergibt bei partieller Integration oder t für t ≥ 0 { durch Ableitung der Funktion (33.23) unter dem Integral ∞



L[t] = ∫ t ⋅ e

−pt

dt = −

d d 1 1 ∫ e−pt dt = − ∙ ∘ t. = dp dp p p2

0

(33.25)

0

Wiederholte Anwendung liefert tn ∘ ∙ {0 Die Exponentialfunktion { exp at { mierte

für t < 0 für t ≥ 0



at

at

−pt

L[e ] = ∫ e ⋅ e 0

n! . pn+1

(33.25󸀠 )

mit a ∈ ℂ besitzt die Laplace-Transfor∞

e(a−p)t 1 ] = . dt = [ a−p 0 p−a

(33.26)

3 Unter der Voraussetzung, dass g(t) für t < 0 stets verschwindet, könnten wir auch 1/p ∙ schreiben, nur wäre dies für die Funktion sx (t) im nächsten Beispiel nicht möglich.

∘1

282 | 33 Integraltransformationen Bedingung ist allerdings Re(a) < Re(p), damit e(a−p)t für t → ∞ wie oben vorausgesetzt verschwindet, denn wegen a = Re(a) + Im(a) = α + iβ at

e ⋅e

−pt

= e(α −σ )t [cos(β t − ω t) + i sin(β t − ω t)]

ist allein α < σ die Bedingung für limt→∞ eat ⋅ e−pt = 0. {0 Für die Kosinusfunktion { cos ω t {

für t < 0 für t ≥ 0



L[cos ω t] =





0 ∞

0

1 1 1 iω t ∫ (e + e−iω t ) ⋅ e−pt dt = ∫ eiω t e−pt dt + ∫ e−iω t e−pt dt 2 2 2 0 (iω −p)t

=

finden wir mit (25.10)



(−iω −p)t

1 1 1 e 1 1 1 e [ ] + [ ] = + 2 iω − p 0 2 −iω − p 0 2 p − iω 2 p + iω

cos ω t ∘ ∙

p . p2 + ω 2

(33.27)

{0 Analog ergibt sich für die Sinusfunktion { sin ω t { ∞

für t < 0 für t ≥ 0 ∞



0 ∞

0

1 1 1 iω t ∫ (e − e−iω t ) ⋅ e−pt dt = ∫ eiω t e−pt dt − ∫ e−iω t e−pt dt L[sin ω t] = 2i 2i 2i 0 (iω −p)t

=



(−iω −p)t

1 1 1 e 1 1 1 e [ ] − [ ] = − 2i iω − p 0 2i −iω − p 0 2 ip + ω 2 ip − ω

sin ω t ∘ ∙

ω . p2 + ω 2

(33.28)

33.5 Rechenregeln für die Laplace-Transformation Aus den Grundregeln des Rechnens mit Summen und Integralen ergeben sich einige Rechenregeln für die Laplace-Transformation. Funktionen in Summen können getrennt behandelt werden L[g1 (t) + g2 (t)] = L[g1 (t)] + L[g2 (t)]

(33.29)

allgemein gilt n

n

L[ ∑ gk (t)] = ∑ L[gk (t)]. k=1

(33.29󸀠 )

k=1

Eine multiplikative Konstante kann ausgeklammert werden L[a ⋅ g(t)] = a ⋅ L[g(t)].

(33.30)

33.5 Rechenregeln für die Laplace-Transformation | 283

Eine additive Konstante a führt analog zu (33.23) auf a/p L[g(t) + a] = L[g(t)] + a ⋅ L[1] = L[g(t)] + a/p.

(33.31)

Mit diesen Regeln und den oben berechneten Korrespondenzen können bereits alle Polynome und viele andere Strukturen berechnet werden. Beispiel: Mit (33.23), (33.24), (33.29) und (33.30) ist die Laplace-Transformierte des Rechteck- oder Kastenimpulses (Abb. 33.4) der Höhe h {h für 0 < t < x Kx (t) = { 0 sonst { 1 − e−px . L[Kx (t)] = h p

(33.32)

Satz (Verschiebungssatz). −pt0



L[g(t)] = G(p)

L[g(t − t0 )] = e

G(p),

t0 > 0.

(33.33)

Beweis. Bei der Substitution u = t − t0 ändert sich die untere Integrationsgrenze ∞



L[g(t − t0 )] = ∫ g(t − t0 )e

−pt

dt = ∫ g(u)e−p(u+t0 ) du −t0

0



0

= e−pt0 [ ∫ g(u)e−pu du + ∫ g(u)e−pu du] = e−pt0 G(p). −t0

0

Der erste Summand in den eckigen Klammern verschwindet, weil die Bildfunktion für t < 0 verschwindet und das Koordinatensystem um (−t0 ) verschoben wird, also um t0 nach links. Satz (Ähnlichkeitssatz). ⇒

L[g(t)] = G(p)

L[g(a ⋅ t)] =

p 1 G( ). a a

(33.34)

Beweis. Bei der Substitution u = a ⋅ t ändern sich die Integrationsgrenzen nicht ∞



−pt

L[g(a ⋅ t)] = ∫ g(a ⋅ t)e

p 1 1 dt = ∫ g(u)e−up/a du = G ( ) . a a a

0

0

Satz (Dämpfungssatz). L[g(t)] = G(p)

Beweis.



∞ −δ t

L[e

g(t)] = G(p + δ ).

∞ −δ t

g(t)] = ∫ e 0

−δ t

L[e

−pt

g(t)e

dt = ∫ g(t)e−(p+δ )t dt = G(p + δ ). 0

(33.35)

284 | 33 Integraltransformationen Zur Rücktransformation ist entweder eine Integration im Komplexen auszuführen σ0 +i∞

g(t) =

1 ∫ ept G(p) dp mit t > 0 2π i

(33.36)

σ0 −i∞

oder es ist auf die bekannten Korrespondenzen und allgemeine Rechenregeln zurückzugreifen. Beispiel: Die Zeitfunktion zu der Bildfunktion 1 1 G(p) = 3 + 5 p p ist mit (33.25󸀠 ) und der Summenregel (33.29) t2 t4 g(t) = + . 2 24 Beispiel: Die Bildfunktion L[e−δ t s0 (t)] der abklingenden Exponentialfunktion ist 1 wegen L[s0 (t)] = 1p und mit (33.35) L[e−δ t s0 (t)] = p+δ . Also ist e−δ t (für t > 0) die Zeitfunktion zu dieser Bildfunktion. Beispiel: Die Bildfunktion L[e−δ t cos ω t] der gedämpften Schwingung ist mit p −δ t L[cos ω t] = p2 +ω cos ω t] = (p+δp+δ . Also ist e−δ t cos ω t (für t > 0) 2 und (33.35) L[e )2 +ω 2 die Zeitfunktion zu dieser Bildfunktion.

Übungen 33.1 Man berechne das Fourier-Spektrum für einen Rechteckimpuls der Höhe h, der sich von (−t0 ) bis (+ t0 ) erstreckt. 33.2 Zeigen Sie, dass für jedes t0 > 0 gilt ∞



sin(ω t0 ) π dω = . ω 2

0

[Hinweis: Verwenden Sie anstelle des in Abb. 33.2 dargestellten Impulses den Impuls aus Übung 33.1.] 33.3 Warum sind die folgenden Funktionen (mit x, y ∈ ℝ) für x, y ≠ 0 nicht komplex differenzierbar? (a) w = x [Hinweis: x = (1 ⋅ x + 0 ⋅ y) + i(0 ⋅ x + 0 ⋅ y)] (b) w = iy [Hinweis: iy = (0 ⋅ x + 0 ⋅ y) + i(0 ⋅ x + 1 ⋅ y)] (c) w = z ⋅ z∗ = x2 + y2 [Hinweis: v = 0] 33.4 Man prüfe (33.15) für die folgenden Funktionen (mit x, y ∈ ℝ): (a) w = z = x + iy (b) w = z2 = (x + iy)2 (c) w = exp(x + iy) = ex cos y + iex sin y

33.5 Rechenregeln für die Laplace-Transformation | 285

33.5 Man prüfe (33.16) für die folgenden Funktionen (mit x, y ∈ ℝ): (a) w = z = x + iy (b) w = z2 = (x + iy)2 33.6 Wie sind a, b, c, d zu wählen, damit w = (ax + by) + i(cx + dy) differenzierbar ist? 33.7 Man berechne die Laplace-Transformierte von g(t) = 2 + 3t − tn . 33.8 Man berechne die Fourier-Transformierte und die Laplace-Transformierte für einen Impuls der Höhe 1, der sich von 0 bis 1 erstreckt. 33.9 Man beweise tn ∘ ∙ n!/pn+1 . 33.10 Man berechne die Laplace-Transformierte von sin(2ω t). 33.11 Man berechne die Laplace-Transformierte von e−δ t sin(ω t).

| Teil IX: Vektoranalysis

34 Differentiation von Feldern Eine Funktion, deren Funktionswerte reelle Zahlen sind und deren Definitionsbereich ein n-dimensionaler Vektorraum wie { (x, y, z, t) | x, y, z, t ∈ ℝ } ist, bezeichnet man auch als Skalarfeld. Eine Funktion, deren Funktionswerte m-dimensionale Vektoren sind und deren Definitionsbereich ein n-dimensionaler Vektorraum ist, heißt Vektorfeld. In jedem Punkt des Raums ist nicht nur eine Zahl f (V), sondern auch eine Richtung A(V) definiert. Ein Beispiel ist das Vektorfeld A(x, y, z, t) = xX 0 + yZ 0 + tY 0 oder der rotierende Einheitsvektor A0 (x, y, z, t) = X 0 cos ω t + Y 0 sin ω t. Wir wollen uns im Folgenden auf Felder im dreidimensionalen Raum beschränken, da sie für die Anwendung, z. B. in der Elektrotechnik, von großer Bedeutung sind. Bevor wir aber mit der Differentiation und Integration von Feldern beginnen, benötigen wir noch einige algebraische Regeln für dreidimensionale Vektoren.

34.1 Vektoralgebra Das in (8.16) definierte Kreuzprodukt kann mit Hilfe der Matrixschreibweise leicht memorierbar als formale Determinante ausgedrückt werden 󵄨󵄨 0 󵄨󵄨X 󵄨󵄨 A × B = 󵄨󵄨󵄨Y 0 󵄨󵄨 0 󵄨󵄨 Z 󵄨 z. B.

󵄨󵄨 0 󵄨󵄨X 󵄨󵄨 X × Y = 󵄨󵄨󵄨Y 0 󵄨󵄨 0 󵄨󵄨 Z 󵄨 0

0

ax ay az 1 0 0

󵄨 bx 󵄨󵄨󵄨 󵄨󵄨 by 󵄨󵄨󵄨 󵄨󵄨 bz 󵄨󵄨󵄨

(34.1)

󵄨 0󵄨󵄨󵄨 󵄨󵄨 1󵄨󵄨󵄨 = Z 0 . 󵄨󵄨 0󵄨󵄨󵄨

Das Spatprodukt besitzt folgende zyklische Umformungen: A ⋅ (B × C) = C ⋅ (A × B) = B ⋅ (C × A)

(34.2)

Das Produkte aus Seitenfläche und zugehöriger Höhe, zum Beispiel aus der Fläche |A|⋅|B| sin(A, B) und der zugehörigen Höhe C⋅N 0 (vgl. (8.18) und Abb. 8.5), ist für einen gegebenen Spat in jedem Falle dasselbe, denn bei Scherung bleibt das Spatvolumen unverändert.

290 | 34 Differentiation von Feldern Die direkte Rechnung bestätigt (34.2) ebenfalls, z. B. (A × B) ⋅ C = (ay bz − az by )cx + (az bx − ax bz )cy + (ax by − ay bx )cz = ay bz cx − az by cx + az bx cy − ax bz cy + ax by cz − ay bx cz = ax by cz − ax bz cy + ay bz cx − ay bx cz + az bx cy − az by cx = ax (by cz − bz cy ) + ay (bz cx − bx cz ) + az (bx cy − by cx ) = A ⋅ (B × C). Häufig benötigt man das Produkt A × (B × C) = B ⋅ (A ⋅ C) − C ⋅ (A ⋅ B).

(34.3)

Der Beweis durch direktes Ausrechen sei dem Leser als Übung 34.3 überlassen. Wir überlegen uns, dass (B × C) senkrecht auf B und C steht. A × (B × C) steht wiederum senkrecht auf dieser Senkrechten, ist also eine Linearkombination A × (B × C) = β B + 𝛾C mit den reellen Zahlen β und 𝛾 in der aus B und C aufgespannten Ebene. A × (B × C) steht aber auch senkrecht auf A, so dass das Skalarprodukt mit A verschwindet 0 = A ⋅ (A × (B × C)) = A ⋅ (β B + 𝛾C) = β A ⋅ B + 𝛾A ⋅ C. Diese Gleichung ist erfüllt für β =A⋅C

und

𝛾 = −A ⋅ B

oder

β = −A ⋅ C

und

𝛾 = A ⋅ B.

Das in (34.3) gewählte Vorzeichen bestätigt man mit X 0 × (Y 0 × X 0 ) = X 0 × (−Z 0 ) = Y 0 = Y 0 ⋅ (X 0 ⋅ X 0 ) − X 0 ⋅ (X 0 ⋅ Y 0 ).

34.2 Differentiation eines Vektorfeldes nach einem Skalar Die Differenzierbarkeit des Vektorfeldes sei im Folgenden stets vorausgesetzt. Die Definitionsgleichung des Differentialoperators kann direkt angewandt werden: A(t + Δ t) − A(t) dA = lim = dt Δ t→0 Δt

dax dt da ( dty ) daz dt

(34.4)

Aus einem Vektor entsteht so wieder ein Vektor. Wie im Fall reeller Funktionen folgen Summen- und Produktregel: dA dB d (A + B) = + dt dt dt d dA dα αA =α +A dt dt dt dB dA d A⋅B =A +B dt dt dt

(34.5) mit α ∈ ℝ

(34.6) (34.7)

34.3 Räumliche Differentiation eines Feldes |

291

Aus einem Skalar entsteht so wieder ein Skalar. Und aus einem Kreuzprodukt wird schließlich wieder ein Kreuzprodukt: dB dA d A×B=A× −B× (34.8) dt dt dt Das negative Vorzeichen in (34.8) ergibt sich aus der Umstellung der Faktoren. Man schreibt den Faktor B besser vor den Differentialoperator, um deutlich zu machen, dass B nicht differenziert werden soll.

34.3 Räumliche Differentiation eines Feldes Zur partiellen Differentiation nach den drei Raumkoordinaten dient der Nabla-Operator¹ 𝜕 𝜕x

𝜕 𝜕 𝜕 𝜕 ). + Y0 + Z0 = ( 𝜕y ∇ = X0 𝜕x 𝜕y 𝜕z

(34.9)

𝜕 𝜕z

Dieser Differentialoperator ist ein Vektor, der sowohl auf Skalarfelder als auch auf Vektorfelder angewendet werden kann. Eine reelle Funktion F(x, y, z) = F(R) der Raumkoordinaten ist ein Skalarfeld. Ihr totales Differential ist nach (28.6󸀠 ) 𝜕F 𝜕F 𝜕F dx + dy + dz. dF = 𝜕x 𝜕y 𝜕z Das ist gerade das Skalarprodukt des auf F angewandten Nabla-Operators grad F(R) := ∇F(R) = X 0

𝜕F 𝜕F 𝜕F + Y0 + Z0 = 𝜕x 𝜕y 𝜕z

𝜕F 𝜕x ) ( 𝜕F 𝜕y 𝜕F 𝜕z

(34.10)

mit dem differentiellen Wegstück dR = X 0 dx + Y 0 dy + Z 0 dz

(34.11)

dF = ∇F ⋅ dR so dass wir formal schreiben können dF . (34.12) dR Diese Operation wird auch als Gradientenbildung bezeichnet. Sie erzeugt aus einem Skalarfeld F ein Vektorfeld ∇F oder grad F. Wenn sich F in der Richtung dR nicht ändert, so verschwindet das Skalarprodukt ∇F =

0 = dF = ∇F ⋅ dR. 1 benannt nach einem phönizischen Saiteninstrument dieser Form.

292 | 34 Differentiation von Feldern Also steht ∇F senkrecht auf dieser Richtung dR. grad F weist in die Richtung der stärksten Änderung von F. Die räumliche Differentiation eines Vektorfeldes erzeugt ein Skalarfeld. Diesen Vorgang bezeichnet man auch als Divergenzbildung 𝜕ay 𝜕az 𝜕a div A(R) := ∇ ⋅ A(R) ≡ ∇A(R) = x + + . (34.13) 𝜕x 𝜕y 𝜕z Hier wird ein Skalarprodukt gebildet. Der Nabla-Operator kann auch in Form des äußeren Produktes mit dem Vektorfeld verknüpft werden. Dann ergibt sich wieder ein Vektorfeld. Diesen Vorgang bezeichnet man auch als Rotationsbildung. Mit (34.1) und (34.9) finden wir rot A(R) := ∇ × A(R) = X0 (

(34.14)

𝜕ay 𝜕ax 𝜕az 𝜕ay 𝜕a 𝜕a ) + Y 0 ( x − z ) + Z0 ( ). − − 𝜕y 𝜕z 𝜕z 𝜕x 𝜕x 𝜕y

Die für diese Differentialoperationen geltenden Produktregeln sind im Folgenden aufgeführt: ∇(AF) = F(∇A) + A ⋅ ∇F = F div A + A grad F

(34.15)

∇ × (AF) = F(∇ × A) − A × ∇F

(34.16)

∇(A × B) = B ⋅ (∇ × A) − A ⋅ (∇ × B)

(34.17)

Zur Herleitung der letzten Zeile wird die zyklische Vertauschung der Faktoren so angewandt, dass hinter dem Nabla-Operator jeweils nur ein Vektorfeld steht. Zur Auflösung der Rotation eines Kreuzproduktes verwenden wir zunächst die BACCAB-Regel (34.3) in der Form, dass alle Vektoren hinter dem Nabla-Operator stehen, sodann die Produktregel ∇ × (A × B) = (∇B)A − (∇A)B = (B ⋅ ∇)A + A(∇B) − B(∇A) − (A ⋅ ∇)B

(34.18)

wo

𝜕 𝜕 𝜕 + cy + cz . (34.19) 𝜕x 𝜕y 𝜕z Die Berechnung von ∇(A⋅B) gestaltet sich etwas schwieriger, weil A⋅B ein Skalar ist, die Anwendung des Nabla-Operators auf die einzelnen Faktoren aber keinen Gradienten, sondern eine Divergenz liefert. Nach (34.3) ist (C ⋅ ∇) = cx

B × (∇ × A) = ∇(B ⋅ A) − (B ⋅ ∇)A A × (∇ × B) = ∇(A ⋅ B) − (A ⋅ ∇)B wobei ∇(B ⋅ A) und ∇(A ⋅ B) anzeigen, dass der Nabla-Operator nur auf den jeweils zweiten Faktor anzuwenden ist. Damit ergibt sich ∇(A ⋅ B) = ∇(B ⋅ A) + ∇(A ⋅ B) = (B ⋅ ∇)A + (A ⋅ ∇)B + B × (∇ × A) + A × (∇ × B).

(34.20)

34.3 Räumliche Differentiation eines Feldes |

293

Im Folgenden werden einige Beispiele zur Differentiation von Feldern vorgestellt; dabei ist x R = (y ) = X 0 x + Y 0 y + Z 0 z z und A ist ein fester Vektor. ∇ ⋅ R = X0

𝜕(X 0 x + Y 0 y + Z 0 z) 𝜕(X 0 x + Y 0 y + Z 0 z) 𝜕(X 0 x + Y 0 y + Z 0 z) + Y0 + Z0 𝜕x 𝜕y 𝜕z

= X 0 X 0 + Y 0 Y 0 + Z 0 Z 0 = 3. ∇|R| = X 0 =X =

𝜕√x2 + y2 + z2 𝜕x x

0

√ x 2 + y2 + z 2

+ Y0

+Y

𝜕√x2 + y2 + z2 𝜕y y

0

√ x 2 + y2 + z 2

+ Z0

+Z

𝜕√x2 + y2 + z2 𝜕z z

0

√ x 2 + y2 + z 2

R = R0 . |R|

Wenn F nur vom Abstand vom Ursprung abhängt, liefert die Kettenregel ∇F(|R|) =

dF dF ⋅ ∇|R| = R0 . d|R| d|R|

Mit diesem Ergebnis und der Produktregel erhalten wir ∇R0 = ∇

R 2 1 1 3 −R0 = ∇R + R∇ = +R 2 = . |R| |R| |R| |R| |R| |R|

∇|R0 | = ∇1 = 0. ∇ × R = X0 (

𝜕z 𝜕y 𝜕x 𝜕z 𝜕y 𝜕x − ) + Y 0 ( − ) + Z 0 ( − ) = 0. 𝜕y 𝜕z 𝜕z 𝜕x 𝜕x 𝜕y

Mit A = const. und ∇ × R = 0 ergibt sich aus (34.20) ∇(A ⋅ R) = (A ⋅ ∇)R = (ax

x 𝜕 𝜕 𝜕 + ay + az ) (y) 𝜕x 𝜕y 𝜕z z

1 0 0 = ax (0) + ay (1) + az (0) = A 0 0 1 und außerdem: ∇(A × R) = −A ⋅ (∇ × R) = 0 ∇ × (A × R) = A(∇R) − (A ⋅ ∇)R = A ⋅ 3 − A = 2A

294 | 34 Differentiation von Feldern

34.4 Mehrfache Differentiation eines Feldes Die Divergenz eines Gradientenfeldes ∇F berechnet man mit dem Laplace-Operator Δ F 𝜕2 F 𝜕2 F 𝜕2 F (34.21) div grad F = ∇(∇F) = (∇ ⋅ ∇)F = 2 + 2 + 2 := Δ F. 𝜕x 𝜕y 𝜕z Der Laplace-Operator kann auch auf Vektorfelder angewendet werden, in kartesischen Koordinaten: div grad A = (∇ ⋅ ∇)A = Δ A = (

𝜕2 𝜕2 𝜕2 + 2 + 2 ) (X 0 ax + Y 0 ay + Z 0 az ) 2 𝜕x 𝜕y 𝜕z

(34.22)

Davon zu unterscheiden ist grad div A = ∇(∇A) = (X 0

𝜕ay 𝜕az 𝜕a 𝜕 𝜕 𝜕 ) + Y0 + Z0 ) ( x + + 𝜕x 𝜕y 𝜕z 𝜕x 𝜕y 𝜕z

(34.23)

worin auch die gemischten Ableitungen auftreten. Weiterhin definiert man rot rot A, während die Rotation eines Gradientenfeldes (34.25) und die Divergenz eines Wirbelfeldes (34.26) identisch verschwinden: rot rot A = ∇ × (∇ × A) = ∇(∇A) − Δ A

(34.24)

rot grad F = ∇ × (∇F) = (∇ × ∇)F ≡ 0

(34.25)

div rot A = ∇(∇ × A) = (∇ × ∇)A ≡ 0

(34.26)

34.5 Der Laplace-Operator in Polarkoordinaten Für die Differentiation kugelsymmetrischer Felder ist die Darstellung des LaplaceOperators (34.21) in Polarkoordinaten von Vorteil. Dazu sind die kartesischen Differentiale dx, dy, dz mit Hilfe der Kettenregel durch die Differentiale der Polarkoordinaten dr, dθ , dφ auszudrücken: 𝜕φ 𝜕 𝜕 𝜕 𝜕r 𝜕 𝜕θ 𝜕 𝜕φ 𝜕r 𝜕 𝜕θ 𝜕 = ⋅ + ⋅ + ⋅ = ⋅ + ⋅ + ⋅ 𝜕x 𝜕r 𝜕x 𝜕θ 𝜕x 𝜕φ 𝜕x 𝜕x 𝜕r 𝜕x 𝜕θ 𝜕x 𝜕φ

(34.27)

Die partiellen Differentialquotienten wurden rechts vor die mit ihnen verketteten Differentialoperatoren gezogen, um zu verdeutlichen, dass Letztere nicht auf sie anzuwenden sind. Mit der Produktregel gibt sich daraus die zweite partielle Ableitung nach x: 𝜕2 φ 𝜕 𝜕φ 𝜕 𝜕 𝜕 𝜕 𝜕2 r 𝜕 𝜕r 𝜕 𝜕 𝜕2 θ 𝜕 𝜕θ 𝜕 𝜕 ⋅ = 2⋅ + ⋅ + 2⋅ + ⋅ + + ⋅ (34.28) 2 𝜕x 𝜕x 𝜕x 𝜕r 𝜕x 𝜕x 𝜕r 𝜕x 𝜕x 𝜕θ 𝜕x 𝜕x 𝜕φ 𝜕x 𝜕θ 𝜕x 𝜕φ

34.5 Der Laplace-Operator in Polarkoordinaten

| 295

Nun wird 𝜕/𝜕x nach (34.27) in die Differentialoperatoren eingesetzt 𝜕φ 𝜕 𝜕φ 𝜕r 𝜕 𝜕θ 𝜕 𝜕 𝜕r 𝜕2 𝜕2 𝜕2 𝜕θ 𝜕 𝜕 ) =( ⋅ + ⋅ + ⋅ = ⋅ 2 + ⋅ + ⋅ 𝜕x 𝜕r 𝜕x 𝜕r 𝜕x 𝜕θ 𝜕x 𝜕φ 𝜕r 𝜕x 𝜕r 𝜕x 𝜕θ 𝜕r 𝜕x 𝜕φ 𝜕r 𝜕φ 𝜕 𝜕φ 𝜕r 𝜕 𝜕θ 𝜕 𝜕 𝜕r 𝜕2 𝜕θ 𝜕2 𝜕2 𝜕 𝜕 ) =( ⋅ + ⋅ + ⋅ = ⋅ + ⋅ ⋅ + 2 𝜕x 𝜕θ 𝜕x 𝜕r 𝜕x 𝜕θ 𝜕x 𝜕φ 𝜕θ 𝜕x 𝜕r𝜕θ 𝜕x 𝜕θ 𝜕x 𝜕φ 𝜕θ 𝜕φ 𝜕 𝜕φ 𝜕2 𝜕 𝜕 𝜕r 𝜕 𝜕θ 𝜕 𝜕 𝜕r 𝜕2 𝜕θ 𝜕2 ) =( ⋅ + ⋅ + ⋅ = ⋅ + ⋅ + ⋅ 𝜕x 𝜕φ 𝜕x 𝜕r 𝜕x 𝜕θ 𝜕x 𝜕φ 𝜕φ 𝜕x 𝜕r𝜕φ 𝜕x 𝜕θ 𝜕φ 𝜕x 𝜕φ 2 so dass (34.28) schließlich folgende Form erhält: 𝜕r 𝜕r 𝜕2 𝜕2 𝜕r 𝜕φ 𝜕2 𝜕2 𝜕2 r 𝜕 𝜕r 𝜕θ + ⋅ ⋅ 2 + ⋅ ⋅ + ⋅ ⋅ = 2 ⋅ 2 𝜕x 𝜕x 𝜕θ 𝜕r 𝜕x 𝜕x 𝜕φ 𝜕r 𝜕x 𝜕x 𝜕r 𝜕x 𝜕x 𝜕r +

𝜕2 θ 𝜕 𝜕θ 𝜕φ 𝜕θ 𝜕r 𝜕2 𝜕θ 𝜕θ 𝜕2 𝜕2 ⋅ + + ⋅ ⋅ + ⋅ ⋅ ⋅ ⋅ 2 2 𝜕x 𝜕x 𝜕r𝜕θ 𝜕x 𝜕x 𝜕θ 𝜕x 𝜕x 𝜕φ 𝜕θ 𝜕x 𝜕θ

+

𝜕φ 𝜕r 𝜕φ 𝜕θ 𝜕φ 𝜕φ 𝜕2 𝜕2 φ 𝜕 𝜕2 𝜕2 + ⋅ ⋅ + ⋅ ⋅ + ⋅ ⋅ ⋅ 2 𝜕φ 𝜕x 𝜕x 𝜕r𝜕φ 𝜕x 𝜕x 𝜕θ 𝜕φ 𝜕x 𝜕x 𝜕φ 2 𝜕x

(34.28󸀠 )

Analoge Gleichungen ergeben sich für die Differentialoperatoren 𝜕2 /𝜕y2 und 𝜕2 /𝜕z2 des Laplace-Operators. Nun werden die einzelnen Differentialquotienten berechnet. Dazu verwenden wir (8.20) und (8.21), schreiben aber wie schon oben zur Abkürzung r statt |R| r = √ x 2 + y2 + z 2

θ = arccos(z/r)

x = r ⋅ sin θ ⋅ cos φ

y = r ⋅ sin θ ⋅ sin φ

φ = arctan(y/x)

(8.20󸀠 ) (8.21󸀠 )

z = r ⋅ cos θ

⇒ √x2 + y2 = r ⋅ sin θ und erhalten die ersten Differentialquotienten: 𝜕r x 𝜕r y = = sin θ ⋅ cos φ = = sin θ ⋅ sin φ 𝜕x r 𝜕y r ⇒(

𝜕r z = = cos θ 𝜕z r

(34.29)

𝜕r 2 𝜕r 2 𝜕r 2 ) +( ) +( ) =1 𝜕x 𝜕y 𝜕z

cos θ ⋅ cos φ 𝜕θ xz = = 𝜕x r 2 2 2 r √x + y

cos θ ⋅ sin φ 𝜕θ yz = = 𝜕y r 2 2 2 r √x + y

x 2 + y2 − sin θ 𝜕θ =− = 𝜕z r 2 2 2 r √x + y ⇒(

𝜕θ 2 𝜕θ 2 𝜕θ 2 1 ) +( ) +( ) = 2 𝜕x 𝜕y 𝜕z r

𝜕φ − sin φ −y = 2 = 2 𝜕x r ⋅ sin θ x +y ⇒(

𝜕φ cos φ x = 2 = 2 𝜕y r ⋅ sin θ x +y

𝜕φ 2 𝜕φ 2 𝜕φ 2 1 ) +( ) +( ) = 2 𝜕x 𝜕y 𝜕z r sin2 θ

(34.30) 𝜕φ =0 𝜕z (34.31)

296 | 34 Differentiation von Feldern Die zweiten reinen Differentialquotienten sind: 𝜕2 r 1 x2 = − 3 r r 𝜕x2

𝜕2 r 1 y2 = − 3 r r 𝜕y2

𝜕2 r 1 z2 = − 3 r r 𝜕z2

𝜕2 r 𝜕2 r 𝜕2 r 2 + + = r 𝜕x2 𝜕y2 𝜕z2



(34.32)

z(r2 √x2 + y2 ) − xz(2x√x2 + y2 + r2 x/√x2 + y2 ) 𝜕2 θ = 𝜕x2 (r2 √x2 + y2 )2 z(r2 √x2 + y2 ) − yz(2y√x2 + y2 + r2 y/√x2 + y2 ) 𝜕2 θ = 𝜕y2 (r2 √x2 + y2 )2 (x2 + y2 )2z√x2 + y2 𝜕2 θ = 𝜕z2 (r2 √x2 + y2 )2 ⇒

𝜕2 θ 𝜕2 θ 𝜕2 θ z cos θ + 2 + 2 = = 2 2 𝜕x 𝜕y 𝜕z r sin θ 2 2 2 r √x + y

𝜕2 φ 2xy = 2 2 𝜕x (x + y2 )2 ⇒

𝜕2 φ −2xy = 2 2 𝜕y (x + y2 )2

𝜕2 φ 𝜕2 φ 𝜕2 φ + + =0 𝜕x2 𝜕y2 𝜕z2

(34.33)

𝜕2 φ =0 𝜕z2 (34.34)

Es zeigt sich, dass die gemischten Differentialquotienten, die als Faktoren bei den gemischten Differentialoperatoren auftreten, bei der Summation über die drei kartesischen Koordinaten alle verschwinden: sin θ cos θ cos2 φ sin θ cos θ sin2 φ cos θ sin θ 𝜕r 𝜕θ 𝜕r 𝜕θ 𝜕r 𝜕θ ⋅ + ⋅ + ⋅ = + − 𝜕x 𝜕x 𝜕y 𝜕y 𝜕z 𝜕z r r r cos θ cos φ − sin φ cos θ sin φ cos φ 𝜕θ 𝜕φ 𝜕θ 𝜕φ 𝜕θ 𝜕φ ⋅ + ⋅ + ⋅ = ⋅ + ⋅ +0 𝜕x 𝜕x 𝜕y 𝜕y 𝜕z 𝜕z r r sin θ r r sin θ cos φ 𝜕φ 𝜕r 𝜕φ 𝜕r 𝜕φ 𝜕r − sin φ ⋅ + ⋅ + ⋅ = sin θ cos φ + sin θ sin φ + 0 𝜕x 𝜕x 𝜕y 𝜕y 𝜕z 𝜕z r sin θ r sin θ So bleiben für den vollständigen Laplace-Operator in Polarkoordinaten nur die aus den Gleichungen (34.29) bis (34.34) resultierenden Faktoren; sie sind in die Summe

34.5 Der Laplace-Operator in Polarkoordinaten

| 297

aus (34.28󸀠 ) und den entsprechenden Gleichungen für 𝜕2 /𝜕y2 und 𝜕2 /𝜕z2 einzusetzen: Δ =

𝜕2 𝜕2 𝜕2 + + 𝜕x2 𝜕y2 𝜕z2

2 𝜕 cos θ 𝜕 𝜕 𝜕2 1 𝜕2 1 𝜕2 + 0 ⋅ ⋅ ⋅ +1⋅ 2 + 2 + 2 ⋅ + ⋅ r 𝜕r 𝜕φ 𝜕r r sin θ 𝜕θ r 𝜕θ 2 r2 sin2 θ 𝜕φ 2 2 2 2 𝜕 2 𝜕 1 1 cos θ 𝜕 𝜕 𝜕 ) = 2 + ⋅ + + 2( ⋅ + ⋅ 2 2 r 𝜕r r sin θ 𝜕θ 𝜕r 𝜕θ sin θ 𝜕φ 2 =

= Δ =

1 1 𝜕 2 𝜕 1 𝜕 𝜕 1 𝜕2 ( (r ) (sin ) ) ⋅ ⋅ ⋅ + ⋅ θ ⋅ + ⋅ 𝜕r sin θ 𝜕θ 𝜕θ r2 𝜕r r2 sin2 θ 𝜕φ 2 1 𝜕 2 𝜕 1 𝜕 𝜕 1 𝜕2 (sin θ ⋅ )+ [ (r ⋅ ) + ] ⋅ ⋅ 2 2 𝜕r sin θ 𝜕θ 𝜕θ r 𝜕r sin θ 𝜕φ 2

Beispiel: Ein Zentralpotential gehorcht der Gleichung ϕ = des Laplace-Operators liefert 1 r2 1 = 2 r 1 = 2 r 1 = 2 r =0

Δϕ =

c r

(34.35)

für r ≠ 0. Anwendung

1 𝜕 𝜕 1 𝜕 2 𝜕 𝜕2 c (r ⋅ ) + (sin θ ⋅ )+ ] ⋅ ⋅ 2 𝜕r 𝜕r sin θ 𝜕θ 𝜕θ sin θ 𝜕φ 2 r 𝜕 2 𝜕 c (r ⋅ ) 𝜕r 𝜕r r 𝜕 2 −c r 𝜕r r2 𝜕 (−c) 𝜕r für r ≠ 0. [

Übungen 34.1 Berechnen Sie für X ≠ 0: X × (A × X) + X ⋅ (A ⋅ X) 34.2 Berechnen Sie: (a) Y 0 × (X 0 × (X 0 × Y 0 )) (b) A ⋅ (A × B) (c) (X 0 × Y 0 ) × X 0 (d) X 0 ⋅ (A ⋅ X 0 ) + Y 0 ⋅ (A ⋅ Y 0 ) + Z 0 ⋅ (A ⋅ Z 0 ) 34.3 Zeigen Sie die BACCAB-Regel: A × (B × C) = B ⋅ (A ⋅ C) − C ⋅ (A ⋅ B) 34.4 Zeigen Sie die Lagrange-Identität: (A × B) ⋅ (C × D) = (A ⋅ C) ⋅ (B ⋅ D) − (A ⋅ D) ⋅ (B ⋅ C) [Hinweis: Nach (34.2) ist (A × B) ⋅ C = A ⋅ (B × C), also (A × B) ⋅ (C × D) = A ⋅ (B × (C × D)).]

298 | 34 Differentiation von Feldern 34.5 Berechnen Sie für R ≠ 0: (a) div R (b) grad 1/|R| (c) div R/|R3 | (d) rot R/|R3 | [Hinweis: ∇ × R|R−3 | = |R−3 |∇ × R − R × ∇|R−3 |. (Ein Feld, für das die Rotation verschwindet, nennt man konservatives Feld.)] 34.6 Es gibt neun Möglichkeiten, Paare aus grad, div, rot zu bilden. Prüfen Sie, welche dieser Kombinationen auf Vektoren und welche auf Skalare (oder beides) angewandt werden können. Beschreiben Sie ebenfalls die Bildmengen. Prüfen Sie ferner, welche identisch verschwinden [Hinweis: 2 Paare] und welche nicht definiert sind [Hinweis: 4 Paare].

35 Integralsätze Die Integralsätze stellen einen Zusammenhang her zwischen dem Feld in einem Gebiet G und an dessen Rand 𝜕G. Ist das Gebiet ein Volumen, so kann es durch das Integral differentieller Volumenelemente (dies sind keine Vektoren) in orthogonalen Koordinaten d 3 R = dx dy dz beschrieben werden. Der Rand eines Volumens ist eine Fläche, das Integral differentieller Flächenelemente. Wird jedes Flächenelement nicht allein durch seinen Betrag, sondern auch durch seine Richtung gekennzeichnet, zum Beispiel d 2 R = (X 0 × Y 0 ) dx dy so muss das Integral über die geschlossene Oberfläche eines Volumens verschwinden, weil sich gegensinnige Vektoren aufheben (s. Abb. 35.1). Die Wahl der Normalenrichtung (entweder nach innen oder nach außen weisend) ist zwar freigestellt, muss aber für alle Flächenelemente dieselbe sein, denn insbesondere bei kantenlosen Flächen wie der Kugeloberfläche gibt es keine Grenze, an der ein Wechsel erfolgen könnte. 0

z

No

Nl

0

Nr

y

0

0

Nu

x

Abb. 35.1: Darstellung von Flächennormalen eines Würfels. Die Vektoren Nr0 und Nl0 der rechten und linken Seite heben sich ebenso auf wie die Vektoren No0 und Nu0 von Ober- und Unterseite oder die hier nicht dargestellten Vektoren von Vorder- und Hinterseite.

35.1 Der Satz von Gauß Das Integral eines Feldes über eine geschlossene Oberfläche muss ebenfalls verschwinden, wenn das Feld konstant ist. Ändert es sich, so gilt die hier am Beispiel der x-Richtung dargestellte Überlegung (s. Abb. 35.1 und Abb. 35.2): An der linken Würfelseite haben wir A(x, y, z) ⋅ d 2 R = ax X 0 ⋅ dy dz Nl0 = −ax dy dz

300 | 35 Integralsätze wegen X 0 ⋅ Nl0 = −1, und an der rechten Würfelseite A(x + dx, y, z) ⋅ d 2 R = (ax + dax )X 0 ⋅ dy dz Nr0 = (ax +

𝜕ax dx) dy dz 𝜕x

𝜕a

wegen X 0 ⋅ Nr0 = 1. Netto bleibt 𝜕xx dx dy dz. Analog werden die beiden übrigen Flächenpaare behandelt. Für die gesamte Oberfläche 𝜕V des Würfels erhalten wir ∮ A(R) ⋅ d 2 R = 𝜕V

𝜕ay 𝜕a 𝜕ax dx dy dz + dx dy dz + z dx dy dz. 𝜕x 𝜕y 𝜕z

Es ist üblich, in diesem Zusammenhang nur ein Integralzeichen zu verwenden, weil d 2 R ebenso wie d 3 R als ein Differential interpretiert werden kann. Geteilt durch das differentielle Volumen dx dy dz ergibt sich 𝜕ax 𝜕ay 𝜕az 1 + + ≡ ∇A(R) = lim ∮ A(R) ⋅ d 2 R. V→0 V 𝜕x 𝜕y 𝜕z 𝜕V

Fügt man mehrere Volumenelemente zusammen, so entfallen die inneren Flächen im Integral aufgrund der gegensinnigen Normalenvektoren. Somit bleibt nur das Integral über die äußere Oberfläche. Bei genügender Verfeinerung der Würfelstruktur gilt daher für jedes beliebige Volumen der Satz von Gauß: ∫ d 3 R div A(R) = ∮ d 2 R ⋅ A(R)

(35.1)

𝜕V

V

z

dz

ax X

0

(a x + dax)X dy

y

dx x

0

Abb. 35.2: In das Skalarprodukt aus Flächenelement (Y 0 × Z 0 )dydz und Vektor A geht nur dessen x-Komponente ax X 0 ein, da Y 0 ⋅ (Y 0 × Z 0 ) = 0 und Z 0 ⋅ (Y 0 × Z 0 ) = 0. ax kann sich mit dx ändern.

Abb. 35.3: Bei zwei zusammengesetzten Würfeln entfallen die Beiträge der inneren Oberflächen.

35.1 Der Satz von Gauß |

301

Als Beispiel integrieren wir die Divergenz des Vektorfeldes R über eine konzentrisch um den Ursprung gelegte Kugel. Für jedes Oberflächenelement ist d 2 R ⋅ R = |d 2 R| ⋅ |R|, weil R parallel zu der Normalen des betreffenden Oberflächenelementes steht. Mit |R| als multiplikativer Konstante, (32.11) und div R = 3 (vgl. ∇ ⋅ R auf S. 293 und Übung 34.5 (a)), wird (35.1) zu 3 ∫ d 3 R = |R| ∮ |d 2 R| = 4π |R|3 . V

𝜕V

Als Nächstes betrachten wir ein Skalarfeld F(R) und übertragen Abb. 35.2 auf diesen Fall. An der linken Würfelseite haben wir F(x, y, z) d 2 R = F dy dz Nl0 = F dy dz (−X 0 ) wegen Nl0 = −X 0 , und an der rechten Würfelseite wegen Nr0 = X 0 F(x + dx, y, z) d 2 R = (F + dF) dy dzNr0 = (F +

𝜕F dx) dy dz X 0 . 𝜕x

Mit den entsprechenden Ergebnissen für die übrigen Flächen folgt ∮ F(R) d 2 R = 𝜕V

oder X0

𝜕F 𝜕F 𝜕F dx dy dzX 0 + dx dy dz Y 0 + dx dy dz Z 0 𝜕x 𝜕y 𝜕z

𝜕F 𝜕F 𝜕F 1 + Y0 + Z0 ≡ ∇F(R) = lim ∮ F(R) d 2 R. V→0 V 𝜕x 𝜕y 𝜕z 𝜕V

Setzt man mehrere Volumenelemente zusammen, so entfallen die inneren Flächen im Integral aufgrund der gegensinnigen Normalenvektoren. Somit bleibt nur das Integral über die äußere Oberfläche. Bei genügender Verfeinerung der Würfelstruktur gilt daher für jedes beliebige Volumen ∫ d 3 R grad F(R) = ∮ d 2 R F(R).

(35.2)

𝜕V

V

Dieser Zusammenhang kann auch direkt aus (35.1) hergeleitet werden. Dazu definieren wir A(R) = N 0 F(R) für einen beliebigen, aber festen Einheitsvektor N 0 . ∇A(R) = ∇(N 0 F(R)) = N 0 ⋅ ∇F(R). Dies eingesetzt in (35.1) liefert N 0 ⋅ ∫ d 3 R grad F(R) = N 0 ⋅ ∮ d 2 R F(R) 𝜕V

V

und da N beliebig war, folgt (35.2). Sei schließlich das Feld A(R)×N 0 mit einem beliebigen, aber festen Einheitsvektor 0 N gegeben. Hierfür liefert der Satz von Gauß (35.1) 0

∫ d 3 R ∇(A × N 0 ) = ∮ d 2 R ⋅ (A × N 0 ) V

𝜕V

302 | 35 Integralsätze also mit (34.2) und (34.17) N 0 ⋅ ∫ d 3 R(∇ × A) = N 0 ⋅ ∮ d 2 R × A 𝜕V

V

und da N beliebig ist, folgt 0

∫ d 3 R rot A(R) = ∮ d 2 R × A(R).

(35.3)

𝜕V

V

35.2 Greensche Sätze Die Greenschen Sätze sind eine einfache Folge des Satzes von Gauß. Ersetzen wir den Vektor A durch den Vektor F∇G, so folgt mit (35.1) und der Produktregel der erste Greensche Satz ∮ F∇G ⋅ d 2 R = ∫ ∇(F∇G) d 3 R = ∫ (∇F ⋅ ∇G + FΔ G) d 3 R 𝜕V

V

(35.4)

V

und analog mit dem Vektor G∇F ∮ G∇F ⋅ d 2 R = ∫ ∇(G∇F) d 3 R = ∫ (∇G ⋅ ∇F + GΔ F) d 3 R. 𝜕V

V

V

Subtraktion der zweiten von der ersten Gleichung liefert den zweiten Greenschen Satz ∫ (FΔ G − GΔ F) d 3 R = ∮ (F∇G − G∇F) ⋅ d 2 R.

(35.5)

𝜕V

V

35.3 Der Satz von Stokes Wir betrachten ein in z-Richtung orientiertes, quadratisches Flächenelement G. Die Zirkulation des Vektorfeldes A(R) ist definiert als das Integral ∮ A(R) ⋅ dR 𝜕Gz

über den Rand 𝜕G, der wie in Abb. 35.4 dargestellt zu durchlaufen ist (rechte-HandRegel). Die einzelnen Beiträge sind (vgl. Abb. 35.4): 1.

(X 0 ax + Y 0 ay + Z 0 az )dxX 0 = ax dx

2.

(X 0 (ax +

𝜕ay 𝜕a 𝜕ax dx) + Y 0 (ay + dx) + Z 0 (az + z dx)) dyY 0 𝜕x 𝜕x 𝜕x 𝜕ay = (ay + dx) dy 𝜕x

35.3 Der Satz von Stokes

| 303

𝜕ay 𝜕a 𝜕ax dy) + Y 0 (ay + dy) + Z 0 (az + z dy)) dx(−X 0 ) 𝜕y 𝜕y 𝜕y 𝜕ax dy) dx = − (ax + 𝜕y

3.

(X 0 (ax +

4.

(X 0 ax + Y 0 ay + Z 0 az )dy(−Y 0 ) = −ay dy

Fast alle Terme heben sich weg, übrig bleibt nur ∮ A(R) ⋅ dR = ( 𝜕Gz

𝜕ay



𝜕x

𝜕ay 𝜕ax 𝜕ax ) dx dy = Z 0 ( ) ⋅ Z 0 dx dy. − 𝜕y 𝜕x 𝜕y

y 3 dy 4

G

2

1 dx

Abb. 35.4: Der Rand eines in z-Richtung orientierte Flächenelementes G wird umlaufen.

x

Das ist die z-Komponente der Rotation von A multipliziert mit der in z-Richtung orientierten Fläche G. Da die Koordinaten beliebig gewechselt werden können und die Fläche damit beliebig gedreht wird, gilt allgemein rot A(R) = lim

G→0

1 ∮ dR ⋅ A(R). G 𝜕G

Fügt man mehrere Flächen aneinander, deren Ränder alle im selben Richtungssinne durchlaufen werden, so entfallen die Beiträge an den inneren Grenzen und es gilt der Satz von Stokes ∫ d 2 R⋅ rot A(R) = ∮ dR ⋅ A(R). (35.6) 𝜕G

G

Sei nun A(R) = N F(R) ein Skalarfeld mit einem konstanten Einheitsvektor multipliziert. Dann führt der Stokessche Satz auf 0

∫ d 2 R ⋅ (∇ × (N 0 F)) = ∮ dR ⋅ (N 0 F) 𝜕G

G 2

0

∫ (d R×∇) ⋅ (N F) = ∮ (dR F) ⋅ N 0 𝜕G

G 0

2

N ⋅ ∫ d R×∇F = N 0 ⋅ ∮ dR F G

𝜕G

304 | 35 Integralsätze und da N 0 beliebig ist, erhalten wir allgemein ∫ d 2 R × grad F(R) = ∮ dR ⋅ F(R).

(35.7)

𝜕G

G

Übungen 35.1 Wird der Satz von Gauß (35.1) auf ein Vektorfeld der Form B = rot A angewendet, so kann das Ergebnis mit dem Satz von Stokes (35.6) weiterverarbeitet werden ∫ d 3 R div rot A(R) = ∮ d 2 R ⋅ rot A(R) = ∮ dR ⋅ A(R). V

𝜕V

𝜕𝜕V

Man zeige den bereits aus (34.26) bekannten Sachverhalt, dass das Ergebnis identisch verschwindet. [Hinweis: Der Rand 𝜕𝜕V der geschlossenen Oberfläche 𝜕V eines Volumens V existiert nicht.] 35.2 Ein Vektorfeld heißt quellenfrei, wenn seine Divergenz verschwindet. Man zeige, dass ein quellenfreies Vektorfeld stets als Rotation eines Vektorfeldes dargestellt werden kann, d. h. div B ≡ 0 ⇒ B = rot A. 35.3 Analog zu Übung 35.1 wende man (35.3) und (35.7) auf ein Vektorfeld an, das der Gradient eines Skalarfeldes ist und berechne rot grad F(R) mit Hilfe von 𝜕𝜕V = 0. [Bemerkung: In differentieller Form ist dieser Sachverhalt bereits aus (34.25) bekannt. Er gilt für jedes einfach zusammenhängende Volumen (das ist ein Volumen, in dem sich jeder geschlossene Weg auf einen Punkt zusammenziehen lässt – Gegenbeispiel: Torus).] 35.4 Ein Vektorfeld heißt wirbelfrei, wenn seine Rotation verschwindet. Man zeige, dass ein wirbelfreies Feld stets als Gradient eines Skalarfeldes dargestellt werden kann: rot B ≡ 0 ⇒ B = grad F. [Hinweis: Man benutze das Ergebnis von Übung 35.3.]

| Teil X: Differentialgleichungen

36 Gewöhnliche Differentialgleichungen Differentialgleichungen (DGL) n-ter Ordnung enthalten die n-te Ableitung f (n) sowie eventuell weitere Ableitungen niedrigerer Ordnung einer Funktion f (x), die Funktion selbst und das Argument x. Gewöhnliche Differentialgleichungen enthalten keine partiellen Differentialquotienten. Lineare Differentialgleichungen enthalten keine Produkte der Funktion oder ihrer Ableitungen mit der Funktion oder ihren Ableitungen. Homogene Differentialgleichungen enthalten kein absolutes Glied. Eine Differentialgleichung liegt in Normalform vor, wenn der Koeffizient der höchsten Ableitung 1 ist. Beispiele: f 󸀠󸀠 + f = 0 ist eine gewöhnliche, lineare und homogene DGL 2. Ordnung. f 󸀠󸀠󸀠 ⋅ f + (f 󸀠󸀠 )2 + h = 0 mit h ≠ 0 ist eine gewöhnliche, nichtlineare und inhomogene DGL 3. Ordnung. b

d

d

2

∫ dx ∫ dy ∫ dz f (x, y, z) + ( a

c

a

𝜕f (x, y, z) h⋅x ) = k ⋅ y + f 2 (x, y, 0) ⋅ sin ( ) 𝜕z f (0, y, z)

ist eine partielle nichtlineare Integro-Differentialgleichung „mit allem“; so etwas wird im Folgenden nicht behandelt. Aufgabe der Theorie der Differentialgleichungen ist es, Funktionen anzugeben, welche die Differentialgleichungen erfüllen. Dazu ist es nützlich, einen Vorrat an Funktionen zur Verfügung zu haben. Zum Beispiel wissen wir bereits ohne Rechnung: – Die DGL f 󸀠 − f = 0 wird gelöst durch die Funktion ex . – Die DGL f 󸀠󸀠 − f = 0 wird gelöst durch sinh x und cosh x und ex . – Die DGL f 󸀠󸀠 + f = 0 wird gelöst durch sin x und cos x und eix . Linearkombinationen dieser Lösungsfunktionen und deren Produkte mit konstanten Faktoren sind ebenfalls Lösungen.

36.1 Homogene lineare DGL mit konstanten Koeffizienten¹ Homogene lineare DGL mit konstanten Koeffizienten ak werden am einfachsten gelöst, indem die DGL n

0 = a0 f + a1 f 󸀠 + a2 f 󸀠󸀠 + ⋅ ⋅ ⋅ + an f (n) = ∑ ak f (k)

(36.1)

k=0

1 Falls die inhomogene DGL ∑nk=0 ak f (k) = c mit a0 = ̸ 0 vorliegt, führt die Koordinatentransformation f → g mit a0 g(0) = a0 f (0) − c und g(k) = f (k) für k ∈ ℕ zu einer homogenen DGL.

308 | 36 Gewöhnliche Differentialgleichungen durch die Substitution (Lösungsansatz) f = Cepx ⇒ f (k) = pk Cepx = pk f

(36.2)

in eine algebraische Gleichung umgewandelt wird. Meistens ist die triviale Lösung C = 0 uninteressant. In allen anderen Fällen ist f ≠ 0, so dass durch f dividiert werden kann. Dann ergibt sich die sogenannte charakteristische Gleichung der DGL, eine algebraische Gleichung n

0 = a0 + a1 p + a2 p2 + ⋅ ⋅ ⋅ + an pn = ∑ ak pk

(36.3)

k=0

die nach bekannten Methoden gelöst wird. Nach Abschn. 15 existieren n (verschiedene oder identische) Wurzeln pi . Sind alle pi verschieden, so ergibt sich die allgemeine Lösung der DGL aus der Linearkombination f (x) = C1 ep1 x + C2 ep2 x + ⋅ ⋅ ⋅ + Cn epn x .

(36.4)

Die Konstanten Ci müssen durch Nebenbedingungen festgelegt werden. Sind mindestens zwei Exponentialfaktoren gleich, z. B. pi = pj , so erhält man mit Cij = Ci + Cj eine unvollständige, da nur aus (n − 1) Summanden bestehende Lösung. In diesem Fall bilde man eine vollständige Lösung unter Verwendung des Terms (Ci + xCj )epi x f (x) = C1 ep1 x + C2 ep2 x + ⋅ ⋅ ⋅ + (Ci + xCj )epi x + ⋅ ⋅ ⋅ + Cn epn x .

(36.5)

Als Beispiel betrachten wir die DGL f 󸀠󸀠 + f 󸀠 − 2f = 0. Die charakteristische Gleichung p2 + p − 2 = 0 besitzt die beiden Lösungen p1 = 1 und p2 = −2. Die allgemeine Lösung der DGL lautet damit f (x) = C1 ex + C2 e−2x . Durch zwei Nebenbedingungen wie z. B. f (0) = A ⇒ C1 + C2 = A

und

f 󸀠 (0) = B ⇒ C1 − 2C2 = B

werden die freien Konstanten festgelegt C1 = 2A+B und C2 = 3 Lösung ist unter diesen Nebenbedingungen 2A + B x A − B −2x f (x) = e + e . 3 3 Weitere Beispiele in Normalform:

f

A−B 3

und die allgemeine

f 󸀠󸀠 − f = 0



p1,2 = ±1

f (x) = C1 ex + C2 e−x .

f 󸀠󸀠 = 0



p1,2 = 0

f (x) = C1 + xC2 .

󸀠󸀠

+f =0



p1,2 = 0, p3 = −1

f (x) = C1 + xC2 + C3 e−x .

f 󸀠󸀠 + f = 0



p1,2 = ±i

f (x) = C1 eix + C2 e−ix .

󸀠󸀠󸀠

Die komplexen Exponentialfaktoren pi im letzten Beispiel können mit Hilfe der Eulerschen Gleichung (25.9) aufgelöst werden C1 eix + C2 e−ix = (C1 + C2 ) cos x + i(C1 − C2 ) sin x.

36.2 Lineare DGL mit Störfunktion

| 309

36.2 Lineare DGL mit Störfunktion Häufig enthalten DGL neben der Funktion f (x) und ihren Ableitungen noch eine Funktion g(x); Letztere wird Störfunktion genannt: n

g(x) = a0 f + a1 f 󸀠 + a2 f 󸀠󸀠 + ⋅ ⋅ ⋅ + an f (n) = ∑ ak f (k)

(36.6)

k=0

Um (36.6) zu lösen, suche man zunächst die allgemeine Lösung der homogenen DGL (36.1) und bilde dann die Linearkombination mit einer speziellen Lösung von (36.6). Beispiel: f 󸀠 − f = 3 [mit der konstanten Funktion g(x) = 3]. Die Lösung der homogenen DGL lautet (mit p = 1): fhom = Cex ; eine spezielle Lösung der inhomogenen DGL ist finh = −3. Damit ergibt sich die allgemeine Lösung der inhomogenen DGL zu f (x) = Cex − 3. Sie hätte nach der Fußnote auf S. 307 auch durch Koordinatentransformation gewonnen werden können. Das ist im folgenden Beispiel nicht möglich. Beispiel: f 󸀠 − f = 3x. Wiederum ist fhom = Cex . Eine spezielle Lösung der inhomogenen DGL findet man mit dem Ansatz: finh = Ax + B 󸀠 ⇒ finh − finh = A − (Ax + B) = 3x

Koeffizientenvergleich liefert A − B = 0 und −A = 3, d. h. finh = −3x − 3. Von der Richtigkeit der vollständigen Lösung f (x) = Cex − 3x − 3 überzeuge man sich durch Einsetzen in die DGL.

36.3 Trennung der Variablen Nichtlineare DGL lassen häufig eine Separation der Variablen auf verschiedenen Seiten der Gleichung zu, wobei das folgende Schema anwendbar ist dy = y󸀠 = g(x) ⋅ f (y) dx



y󸀠 = g(x) f (y)



dy = g(x) dx f (y)

und anschließend integriert werden kann. Beispiel: y󸀠 = x2 ⋅ √y ⇒

y(x) = (



dy = x2 dx √y

x3 C + ) 6 2

2



∫ y−1/2 dy = ∫ x2 dx



2√y =

x3 +C 3

310 | 36 Gewöhnliche Differentialgleichungen

36.4 Lösen von DGL mit der Laplace-Transformation Die Laplace-Transformierte L[g󸀠 (t)] der Ableitung einer Zeitfunktion g(t) kann durch partielle Integration auf die Laplace-Transformierte L[g(t)] der Zeitfunktion zurückgeführt werden: ∞ 󸀠

󸀠

−pt

L[g (t)] = ∫ g (t) ⋅ e

dt = [g(t) ⋅

∞ e−pt ]0

0





+ p ∫ g(t) ⋅ e−pt dt 0

󸀠

L[g (t)] = p ⋅ L[g(t)] − g(0)

(36.7)

Die Differentiation im Zeitbereich entspricht der Multiplikation mit einem Faktor im Bildbereich. Die zweite Ableitung wird mit (36.7) 󸀠󸀠

󸀠

󸀠

2

󸀠

L[g (t)] = p ⋅ L[g (t)] − g (0) = p ⋅ L[g(t)] − p ⋅ g(0) − g (0).

(36.7󸀠 )

Höhere Ableitungen findet man entsprechend. Durch eine Laplace-Transformation kann eine DGL in eine algebraische Gleichung verwandelt werden, die auch schon die Anfangswerte enthält. Beispiel: Die Laplace-Transformierte der Lösung der DGL g󸀠󸀠 (t) − 4g(t) + t2 = 0 mit den Anfangsbedingungen g(0) = 0 und g 󸀠 (0) = 1 findet man mit Hilfe von (36.7󸀠 ) und (33.25󸀠 ) aus 2 p2 ⋅ L[g(t)] − p ⋅ g(0) − g󸀠 (0) − 4L[g(t)] + 3 = 0 p zu −2 + p3 L[g(t)] = 3 . p ⋅ (p2 − 4) Damit ist die algebraische Gleichung gelöst. Die Zeitfunktion g(t) berechnet man durch Rücktransformation der Bildfunktion. Zu diesem Zweck ist eine Partialbruchzerlegung der Bildfunktion nützlich p3

B B B C p3 − 2 A + 1 + 22 + 33 + = 2 p p+2 ⋅ (p − 4) p − 2 p p 3 1 1 1 1 1 1 1 5 = ⋅ + ⋅ +0⋅ 2 + ⋅ 3 − ⋅ 16 p − 2 8 p 2 p 16 p + 2 p

denn mit (33.25󸀠 ) und (33.26) ergibt sich daraus die Zeitfunktion 5 3 1 1 t2 1 t2 5e−2t 3e2t ⋅ e2t + ⋅ t0 + ⋅ − ⋅ e−2t = + − + . 16 8 2 2 16 8 4 16 16 Durch Umstellung von (36.7) erhält man auch die Laplace-Transformierte L[∫ g(t) dt] der Stammfunktion einer Zeitfunktion g(t) g(t) =

L [∫ g(t) dt] = p

−1

⋅ (L[g(t)] + C(0))

(36.8)

wobei die Integrationskonstante C(0) den Anfangswert der Stammfunktion bezeichnet. Dies kann zur Lösung von Integro-Differentialgleichungen genutzt werden.

36.4 Lösen von DGL mit der Laplace-Transformation | 311

Übungen 36.1 Man bestimme die allgemeinen Lösungen der folgenden DGL: (a) f (4) = x [Hinweis: Schrittweise direkt integrieren und die Konstanten nicht vergessen!] (b) f 󸀠󸀠 + f 󸀠 − f = 0 (c) f 󸀠󸀠 + 2f 󸀠 + f = 0 36.2 Welche der Lösungen aus Übung 36.1 erfüllen die Anfangsbedingung f (0) = 0? 36.3 Welche der Lösungen aus Übung 36.1 sind stabil, d. h. |f (x)| < ∞ für x → ∞? 36.4 Man löse die folgenden DGL durch Trennung der Variablen: (a) f 󸀠 ⋅ sin x = f ⋅ cos x (b) 1f + 2f = f 󸀠 36.5 Bei konstanter Temperatur sinkt der Luftdruck p mit zunehmender Höhe dh um den Beitrag der Luftschicht in diesem Intervall, der wiederum proportional zum Luftdruck in dieser Höhe ist. Mit der Proportionalitätskonstante K > 0 ist also dp = −Kp dh. Stellen Sie eine Formel für p(h) auf. Passen Sie K so an, dass p (5,54 km) = p(0)/2. 36.6 Innerhalb des kleinen Zeitintervalls dt ändert sich die Anzahl von N radioaktiven Atomen um dN = −K ⋅ N ⋅ dt (K > 0). Wie lautet das Zerfallsgesetz N(t)? Nach welcher Zeit ist noch die Hälfte der Atome vorhanden? 36.7 Gegeben sei eine homogene Kugel mit Radius R. Der Laplace-Operator der Funktion f lautet in Polarkoordinaten Δ f (r ≤ R) = K > 0, Δ f (r > R) = 0. Man bestimme f (r) innerhalb und außerhalb der Kugel. Nebenbedingungen: f (∞) = 0, f (0) < ∞, f und ∇f sind überall stetig, auch bei R. 36.8 Lösen Sie die DGL des Beispiels von S. 309 f 󸀠 − f = 3x mit der Anfangsbedingung f (0) = 0 mit Hilfe einer Laplace-Transformation.

Literatur [1]

E. Zermelo (Hrsg.): Georg Cantor, Gesammelte Abhandlungen mathematischen und philosophischen Inhalts, Springer, Berlin 1932, S. 399. [2] P. Lorenzen: Das Aktual-Unendliche in der Mathematik, Philosophia naturalis 4, 1957, S. 3. http://www.sgipt.org/wisms/geswis/mathe/ulorenze.htm#Das Aktual-Unendliche in der Mathematik [3] W. Mückenheim: Physical Constraints of Numbers, Proceedings of the First International Symposium of Mathematics and its Connections to the Arts and Sciences, A. Beckmann, C. Michelsen, B. Sriraman (Hrsg.), Franzbecker, Berlin 2005, S. 141. http://arxiv.org/pdf/math. GM/0505649 [4] R. Dedekind: Was sind und was sollen die Zahlen?, Vieweg, Braunschweig 1888, S. III. http://gdz.sub.uni-goettingen.de/no_cache/dms/load/img/?IDDOC=46393 [5] E. Nelson: Predicative Arithmetic, Princeton University Press, Princeton 1986, S. 2. [6] D. Isles: What evidence is there that 2^65536 is a natural number?, Notre Dame Journal of Formal Logic 33, No. 4, 1992, S. 478. [7] D. Hilbert: Über das Unendliche, Math. Ann. 95, 1925, S. 190. http://gdz.sub.uni-goettingen. de/no_cache/dms/load/img/?IDDOC=26816 [8] I. Kant: Critik der reinen Vernunft, 1. Aufl., Hartknoch, Riga 1781, Kap. 102. http://gutenberg. spiegel.de/buch/3508/102 [9] W. Mückenheim: Die Mathematik des Unendlichen, Shaker, Aachen 2006, S. 137. [10] W. A. J. Luxemburg, S. Koerner (Hrsg.): A. Robinson: Selected Papers, Band 2, North Holland, Amsterdam, 1979, S. 507.

Lexika und Formelsammlungen K. Bosch: Mathematik-Lexikon, Oldenbourg, München 2000. J. J. O’Connor, E. F. Robertson: The MacTutor History of Mathematics archive. http://www-history.mcs.st-andrews.ac.uk/ N. Egge, A. Krowne et al.: PlanetMathOrg. http://planetmath.org/ M. Hazewinkel et al.: Encyclopaedia of Mathematics. http://www.encyclopediaofmath.org/index.php/Main_Page H. Meschkowski: Mathematisches Begriffswörterbuch, Bibl. Inst., Mannheim 1971. L. Sanger, J. Wales et al.: Wikipedia. http://en.wikipedia.org/wiki/Portal:Mathematics G. Walz et al.: Lexikon der Mathematik, Spektrum, Heidelberg 2003. E. Weisstein et al.: WolframMathworld. http://mathworld.wolfram.com/ M. Abramowitz, I. Stegun (Hrsg.): Pocketbook of Mathematical Functions, Harri Deutsch, Frankfurt 1984. M. Abramowitz, I. Stegun (Hrsg.): Handbook of Mathematical Functions, National Bureau of Standards, 1972. http://www.math.hkbu.edu.hk/support/aands/index.htm K. Bosch: Formelsammlung Mathematik, Oldenbourg, München 2002. I. N. Bronstein, K. A. Semendjajew, G. Musiol, H. Mühling: Taschenbuch der Mathematik, Harri Deutsch, Frankfurt 2005. G. Merziger, T. Wirth: Repetitorium der Höheren Mathematik, Binomi, Springer, Berlin 2006. E. Müller-Horsche, Online-Formelsammlung Ingenieurmathematik. http://www.hs-augsburg.de/~horschem/medium/ingmaterial/FSIngMathe.pdf

314 | Literatur L. Papula: Mathematische Formelsammlung für Ingenieure und Naturwissenschaftler, Vieweg+Teubner, Wiesbaden 2006. L. Rade, B. Westergren: Springers Mathematische Formeln, Springer, Berlin 2000. K. Rottmann: Mathematische Formelsammlung, Spektrum, Heidelberg 1991. H. Stöcker: Taschenbuch mathematischer Formeln und moderner Verfahren, Harri Deutsch, Frankfurt 2003.

Ergänzende und weiterführende Literatur G. Bärwolff: Höhere Mathematik für Naturwissenschaftler und Ingenieure, Spektrum, Heidelberg 2006. W. Brauch, H.-J. Dreyer, W. Haacke: Mathematik für Ingenieure, Vieweg+Teubner, Wiesbaden 2006. R. Dobbener: Analysis, Oldenbourg, München 2007. R. Dobbener: Lineare Algebra, Oldenbourg, München 2001. G. Dobner, H.-J. Dobner: Lineare Algebra für Naturwissenschaftler und Ingenieure, Spektrum, Heidelberg 2007. J. Erven, D. Schwägerl: Mathematik für Ingenieure, Oldenbourg, München 2008. G. H. Hardy, E. M. Wright: Einführung in die Zahlentheorie, Oldenbourg, München 1958. N. Herrmann: Höhere Mathematik, Oldenbourg, München 2007. H. Heuser: Lehrbuch der Analysis, Teil 1–2, Vieweg+Teubner, Wiesbaden 2006, 2008. K. Jänich: Lineare Algebra, Springer, Berlin 2008. K. Jänich: Vektoranalysis, Springer, Berlin 2005. T. Needham: Anschauliche Funktionentheorie, Oldenbourg, München 2001. I. Niven, H. S. Zuckermann: Einführung in die Zahlentheorie, Band I, Bibl. Inst., Mannheim 1991. I. Niven, H. S. Zuckermann: Einführung in die Zahlentheorie, Band II, Bibl. Inst., Mannheim 1987. L. Papula: Mathematik für Ingenieure und Naturwissenschaftler, Band 1–3, Vieweg+Teubner, Wiesbaden 2007–2008. L. Papula: Mathematik für Ingenieure und Naturwissenschaftler – Klausur- und Übungsaufgaben, Vieweg+Teubner, Wiesbaden 2007. T. Rießinger: Mathematik für Ingenieure, Springer, Berlin 2007. H.-J. Runckel: Höhere Analysis – Funktionentheorie und gewöhnliche Differentialgleichungen, Oldenbourg, München 2000. F. Schulz: Analysis 1, Oldenbourg, München 2002. G. Strang: Lineare Algebra, Springer, Berlin 2003. H. P. Tuschik, H. Wolter: Mathematische Logik – kurzgefasst, Springer, Berlin 2002. W. Walter: Gewöhnliche Differentialgleichungen, Springer, Berlin 2000. M. Weiß et al.: Computer-Mathematik-System math4u2. http://www.math4u2.de T. Westermann: Mathematik für Ingenieure, Springer, Berlin 2008. Die angegebenen Links zu Internetseiten gelten für den Zeitpunkt der Drucklegung. Erfahrungsgemäß fallen sie im Laufe der Zeit nach und nach aus. Kontakt: [email protected] Homepage: http://www.hs-augsburg.de/~mueckenh/ Lösungen zu den Übungsaufgaben (Auflage 3, unverändert): http://www.hs-augsburg.de/~mueckenh/Mathematerial/Loesungen%20Auflage%203.pdf http://www.degruyter.com/view/supplement/9783486719710_Loesungen_zum_Buch.pdf

Stichwortverzeichnis Abbildung 17–20, 33, 56, 58, 59, 61, 65, 68, 99, 100, 102, 114, 115, 120, 122, 123, 125, 150, 173, 183, 197, 225, 274, 277 Abbildungsmatrix 123 abelsche Gruppe 33, 34, 65 abgeschlossen 31, 33, 35, 36, 83 Ableitung 6, 51, 52, 141, 143, 154, 207–209, 211, 213, 214, 216, 218, 221, 223, 224, 228, 230–232, 241, 242, 245, 248, 253, 256–258, 261, 268, 281, 307, 310 Ableitungsregeln 210 Absolutbetrag 33, 198, 207 absolutes Glied 139, 140, 147, 307 absolut integrierbar 276 absolut konvergent 194 Absorptionsgesetz 14 Abstand 68, 70–72, 76, 81, 141, 153, 156, 157, 159, 161, 172, 173, 175, 180, 278, 293 Abszisse 48, 136, 137, 141, 160, 230 Abtrennungsregel 6 Achse 16, 38, 39, 48, 75, 76, 115–118, 123, 125, 126, 145, 147, 155, 159, 168, 169, 171, 172, 246, 247, 271, 272 Achsenabschnitt 76 adjungierte Matrix 107, 111 Adjunkte 105, 107, 111 Ähnlichkeitssatz 283 algebraisch 36, 289, 308, 310 Algorithmus 86 allgemeine Gleichung 69, 151 allgemeine Lösung 308, 309 allgemeine Potenz 220 allgemeine quadratische Form 147 Allquantor 4 alternierende Folge 184 alternierende Reihe 193 alternierend in den Zeilen 99 Analysis IX, 39, 182, 277 analytische Funktion 242, 243 Anfangswert 142, 188, 258, 310 Ankathete 51 Anordnung 10, 36, 62 antikommutativ 62 antisymmetrisch 16 Approximation 127, 141, 143, 195, 234, 238, 239

Äquator 175, 180 Äquivalenz 4, 6, 101 Äquivalenzklasse 16, 55, 60, 61 Äquivalenzrelation 16, 20, 21, 58 Äquivalenzumformung 4, 6 Archimedes 49 Arcuskosinus-Funktion 225, 226 Arcuskotangens-Funktion 225, 226 Arcussinus-Funktion 225 Arcustangens-Funktion 225, 226 arithmetische Folge 183 assoziativ 12, 33, 34, 36, 56, 57, 59, 63, 90, 91, 133 Assoziativgesetz 6 Ast 253 asymmetrisch 16 Aussage VII, 3–6, 8–10, 14, 25, 68, 110 äußeres Produkt 61 Axiom VII, 9, 27, 33, 36, 37, 42, 68, 133 BACCAB-Regel 292, 297 Basis 35, 46, 49, 67, 73–76, 82, 113, 115, 119–121, 125, 126, 195, 215, 219–221, 224, 272 Basisvektor 73–75, 82, 115, 119, 120 Bernoullische Ungleichung 30 beschränkt IX, 12, 53, 65, 184, 185, 187, 192, 198, 280 bestimmtes Integral 255 Betrag 38–40, 55, 57–59, 64, 68, 70, 71, 74, 81, 178, 194, 241, 278, 299 bijektiv 19, 55, 114, 225 Bild 17–19, 41, 56, 65, 101, 114, 122–125 Bildbereich 17, 19, 310 Bildebene 124, 125 Bildfunktion 280, 283, 284, 310 Bildmenge 17 Bildraum 122, 123, 125 Bildungsgesetz 28, 183, 186, 237 Binomialkoeffizienten 26–30, 234–236, 241, 242 binomische Formel 26, 234 Bolzano 198 Breitengrad 180 Brennpunkt 153, 156, 157, 159–164, 167

316 | Stichwortverzeichnis Bruch 35, 36, 188, 195, 196, 262 Bruchrechnung 210, 228 Cantor VII, 8 Cardano 139 Cauchy 37, 42, 68, 187, 188, 201, 215, 235, 241, 278 Cauchy-Folge 37, 187, 188 charakteristische Gleichung 308 Cornu-Spirale 269 Cramersche Regel 109 Dämpfungssatz 283 Dedekind Schnitt 37, 188 Defekt 122–125 Definitionsbereich 10, 17, 19, 53, 197, 202, 207–209, 211, 217, 231, 289 Definitionsgleichung 58, 224, 269, 280, 290 Definitionslücke 256 Descartes 48 Determinante 99–110, 117, 128, 129, 148, 150, 289 Dezimaldarstellung 182, 194 DGL 307–311 Diagonale 49, 76, 150, 247 Diagonalmatrix 145, 148, 150, 151 Differential 182, 247, 300 Differentialgleichung 307 Differentialoperator 208, 246, 290, 291 Differentialquotient 207, 208, 210, 228 Differentialrechnung 207, 245, 253, 259 Differentiation 209, 245, 247, 248, 259, 278, 289–291, 293, 294, 310 Differenz 11, 12, 14, 32, 56, 68, 90, 163, 183, 191, 226, 236, 269, 281 differenzierbar 207–212, 224, 242, 247, 256, 258, 278, 285 differenzieren 225, 248 Dimension 122, 123 Dimensionszahl 82 disjunkt 11 Disjunktion 4, 5, 12 Distanz 68 distributiv 36, 57, 59, 62, 91 Distributivgesetz 6, 12, 62 divergent 185, 191 Division 31, 35, 39–41, 58, 133, 221, 264 Divisionsalgorithmus 31, 134 Divisor 32

Dodekaeder 73 Doppelindizierung 83, 93 Drehachse 116, 168 Drehmatrix 106, 115, 117, 126, 144, 145, 168, 170 Drehrichtung 116, 168 Drehung 40, 116, 117, 126, 145, 147–150, 168, 171, 271, 272 Drehwinkel 116, 118, 126, 145, 150, 151, 170, 171 Dreieck 46, 47, 51–53, 177, 235, 270 Dreiecksform 86 Dreiecksungleichung 68 duale Aussage 14 Durchmesser 152, 196, 233 Durchschnitt 11, 12, 14, 16, 25 Ebene 3, 38, 45, 64, 71–73, 76, 77, 81, 82, 114, 115, 117, 118, 120, 125, 146, 168–171, 176, 178, 248, 278, 290 Ebenengleichung 72 Eckpunkt 163, 178 Eigenvektor 149 Eigenwert 149 eindeutig VIII, 19, 55, 82, 88, 96, 100, 102, 109, 127, 144, 168, 200, 207, 231, 270 eineindeutig 19 einfach zusammenhängend 304 Einheit 173 Einheitskreis 45, 224 Einheitskugel 178, 272 Einheitsmatrix 91, 94, 95, 99, 103, 106, 119 Einheitsvektor 58, 68, 76, 117, 289, 301, 303 Einselement 65, 133 Einsvektor 58 Element 8–10, 16, 33, 36, 37, 56, 65, 102, 107 Elementarmatrix 93–95, 98 Elementaroperation 84, 85, 88, 94, 95, 100, 101, 103, 107 Eliminationsverfahren 85, 89 Ellipse 146, 149, 152–161, 164–167, 170–174, 249, 267, 269 endlich IX, 98, 186–188, 193, 203, 280 Endpunkt 49, 211 entartet 148, 149, 152, 156, 168, 171 entwickelbar 242 Entwicklungspunkt 239 Entwicklungssatz von Laplace 105 Entwicklungsspalte 109 Epsilon-Delta 197 Epsilon-Umgebung 200

Stichwortverzeichnis

erweitern 34, 211, 235 Euklid VII, 29, 45 euklidischer Raum 12, 55 Euler 10, 39, 40, 46, 177, 201, 214, 226 Eulersche Gleichung 39, 226, 308 Evolute 268 Exhaustionsverfahren 49 Existenzquantor 4 explizit 137, 183, 247, 248, 269, 280 explizite Mittelpunktsgleichung 152, 155, 160, 172 Exponent 27, 35, 208, 217, 220, 231, 235, 236, 240 Exponentialfunktion 214–217, 220, 223, 227, 257, 277, 281, 284 Exponentialrechnung 35, 40 Extremstelle 230 Extremum 230 Exzentrizität 153, 158 Fadenkonstruktion 154, 163 faktorisieren 136 fallend 185, 186, 230 fast alle 186, 189 Feld 298, 299, 301, 304 Fermat 29, 42, 48 del Ferro 138 Fibonacci 189, 190 Fläche 46–50, 152, 172, 176–178, 180, 253, 254, 259, 267, 270–273, 289, 299, 303 Flächenelement 152, 271, 299, 300, 303 Folge VIII, 32, 103, 183–189, 191–193, 197, 200–202, 207, 208, 210, 211, 214, 219, 236, 238, 302 Fourier 236, 237, 239, 274–276, 284, 285 Fourier-Analyse 236, 274 Fourier-Koeffizient 239, 274, 275 Fourier-Spektrum 284 Fourier-Transformation 275 Fourier-Transformierte 276, 285 Fundamentalsatz der Algebra IX, 135 Fundamentalsatz der Zahlentheorie 29 Fünfeck 47 Funktion 19, 156, 197–201, 207–209, 211, 212, 216, 217, 221, 223, 228, 230–232, 236–243, 245–248, 253–259, 262–268, 270–275, 278–281, 289, 307, 309, 311 Funktionalgleichung 215–217 Funktionenfolge 200–202

| 317

Funktionenreihe 200, 201 Funktionentheorie 277 Funktionswert 239, 241, 247, 248, 271 ganzzahlig 140, 143, 219 Gauß 38, 85, 86, 89, 100, 127, 135, 299, 300–302, 304 Gauß-Ebene 38 Gauß-Jordan-Algorithmus 86 Gaußsches Eliminationsverfahren 85 Gauß und Seidel, Verfahren 127 Gebiet 277–279, 299 gebrochen 35, 140, 235, 262–264 Gegendreieck 177 Gegenkathete 51 Gegenpunkt 177 Gegenrichtung 161 geometrische Folge 183 geometrische Reihe 192, 193, 202, 220, 235 geordnetes n-Tupel 55 geordnetes Tripel 15, 55 Gerade 3, 45, 46, 48, 61, 68, 69, 71, 72, 76, 81, 82, 126, 144, 152, 164, 165, 173, 268, 269 Geradenabschnitt 45 Geradengleichung 69, 71 gerade Zahl 3, 28 geschlossen 183 ggT 32 Gleichheit 10, 57 gleichmäßig konvergent 200–202 gleichmäßig stetig 198 Gleichungssystem 81, 82, 84–89, 93, 96, 97, 100, 102, 110, 112, 121–124, 127, 128, 169, 262 Grad 133–137, 241, 263, 291 Gradientenbildung 291 Greensche Sätze 302 Grenze 215, 255, 270, 299 Grenzfall 138, 152, 158, 253, 254, 266, 268, 269 Grenzfunktion 200–202 Grenzübergang 208, 209 Grenzwert V, 184, 185, 187–189, 191, 194–197, 207, 208, 210, 214, 219, 228, 229, 236, 254, 270, 280 Großkreis 176, 177 größter gemeinsamer Teiler 32 Grundfläche 63, 232 Grundkreisfrequenz 236, 237 Grundseite 52

318 | Stichwortverzeichnis Gruppenaxiome 33 Guldinsche Regel 272 Halbachse 152, 153, 155 Halbkreis 46, 273 Halbkreisfläche 273 Halbkugel 177 Halbordnung 16, 17 harmonische Folge 184 harmonische Reihe 191, 194, 203 Häufungspunkt 184, 186, 207 Hauptachse 152, 153, 156, 172 Hauptachsenlage 145, 150, 151 Hauptdiagonale 91, 92, 116, 123 Hauptnenner 195, 220 Hauptscheitel 153, 156, 172 Hemisphäre 177 Hessesche Normalform 71, 72 Hexagon 47, 49, 73 hinreichende Bedingung 86 hinreichende Voraussetzung 207 Höhe 15, 46, 48, 49, 51, 52, 63, 172, 173, 224, 233, 245, 248, 272, 273, 283–285, 289, 311 Höhenlinie 248 Höhenliniendiagramm 245 holomorphe Funktion 278 homogen 97, 100, 121–123, 307, 309, 311 Homomorphismus 20 horizontale Tangente 231, 232 Horner-Schema 137, 140 l’Hospital 211, 213 Hyperbel 146, 149, 152, 160–167, 171–174, 198, 249, 267, 269 Hyperbelfunktion 161, 226, 227 Hyperbelkonstruktion 163 Hyperebene 83 Hypotenuse 46, 49, 51 Idempotenzgesetz 14 identische Abbildung 19, 114 identische Zeilen 100 Identitätssatz 203 Ikosaeder 73 imaginäre Einheit 38 Imaginärteil 38, 278 Implikation 4, 5, 73 implizit 190, 249 implizite Differentiation 248

implizite Mittelpunktsgleichung 152, 160, 172, 173 Index 91, 104, 208, 216, 220 Indexfolge 87 Indexvertauschung 93 Indizes 55, 62, 87, 93, 104, 117, 197 Indizierung 83 Induktion 25, 30 Induktionsannahme 26 Induktionsbeweis 25 Induktionsschluss 27, 28 Infimum 184 Infinitesimalrechnung IX, 182, 183 injektiv 19, 56, 58, 114, 115 Inklusion 9, 10 Innenwinkelsumme 47, 178 inneres Produkt 59 Integral 253–255, 258–262, 264, 265, 270–276, 278–281, 299–302 Integralfunktion 253, 256, 258 Integralrechnung 182, 238, 253, 257 Integralsätze 299 Integraltransformationen 274 Integrand 32, 253, 258, 261, 262, 274, 275 Integration 234, 238, 255, 257–259, 261, 265, 267, 270, 271, 278, 281, 284, 289 Integrationsgrenze 254, 258, 266, 270, 271, 283 Integrationsintervall 270 Integrationskonstante 253, 255, 310 Integrationsmethoden 257 Integrationsreihenfolge 270 Integrationsvariable 258, 275, 280 Integrationsweg 278 integrierbar 265 integrieren 263–265, 270, 301, 311 Integro-Differentialgleichung 307, 310 Intervall 141–143, 161, 186, 194, 198–201, 211, 239, 241, 245, 253, 255, 258, 265, 267–269, 271, 272, 280, 311 Intervallschachtelung 142 inverse Abbildung 19 inverse Matrix 94–96, 102, 109, 116, 145 Inverses 33, 36, 59 Inversion 94 irrational IX, 36, 37, 140, 188, 195, 215, 219 irreduzibel 135 Isomorphismus 20, 114 Iteration 127, 128 Iterationsverfahren 141

Stichwortverzeichnis

kanonische Basis 74, 75, 120, 125 Kante 72 Kantenlänge 196 Kastenfunktion 238, 239 Kastenimpuls 281 Kegel 168–171 Kegelschnitt 146, 148, 149, 151, 152, 164, 167–169 Kehrwert 35, 51, 268 Kern 122–125, 150 Kettenregel 210–212, 220, 221, 223, 248, 278, 293, 294 Klassen quadratischer Formen 146 Klothoide 269 Koeffizient 85, 86, 139, 170, 275, 307 Koeffizientenvergleich 139, 262–264, 309 kollinear 72 kommutativ 12, 33, 36, 56, 57, 59, 90, 91, 94, 117, 133 Kommutativgesetz 6 Komplement 13 komplex 38, 42, 136, 140, 148, 264, 278, 284 komplex differenzierbar 278, 284 komplexe Analysis 277 komplexe Ebene 38, 42 komplexe Funktion 277 komplexe Nullstelle 135, 136, 264 komplexe Zahl 38, 39, 135 komplex konjugiert 38, 42 Komponente 57, 62, 300, 303 Komponentenform 39–42 komponentenweise 38, 56 konditioniert 128 kongruent 31, 177, 178 Konjunktion 4, 5, 12 Konklusion 5 konservatives Feld 298 Konstruktion IX, 46–49, 155, 162 Kontradiktion 6 Kontraposition 5, 256 konvergent 185–187, 191, 194, 200, 203 Konvergenz 187, 194, 201, 203 Konvergenzintervall 203, 240, 242 Konvergenzkriterium 185, 187, 193 Konvergenzradius 202, 203, 243, 267 Konvergenzverhalten 187, 193, 196, 202 konvex 278 konzentrisch 64, 155, 175, 301

| 319

Koordinaten 11, 48, 55, 63–65, 82, 83, 115, 146, 152, 157, 159, 162, 164–166, 169, 170, 172, 173, 175, 176, 294, 296, 299, 303 Koordinatengleichung 165, 166 Koordinatensystem 18, 48, 55, 62, 63, 65, 75, 114, 145, 151, 168, 169, 175, 178, 283 Koordinatentransformation 146, 158, 307, 309 Koordinatenvektoren 119, 120, 125, 126 Korrespondenz 280 korrespondierendes Paar 280 Kosinus 51, 227 Kosinusfunktion 224, 226, 238, 282 Kosinus hyperbolicus 227 Kosinussatz 51, 52, 59 Kotangens 51, 225, 227 Kotangensfunktion 224 Kotangens hyperbolicus 227 Kreis 41, 46, 49, 146, 149, 152, 153, 155, 156, 158, 159, 164, 165, 167, 168, 174, 233, 273, 279 Kreisbogen 45, 49, 269, 271, 273 Kreisfläche 49, 259 Kreismittelpunkt 165, 166 Kreisradius 45, 49 Kreisumfang 45, 269 Kreuzprodukt 61–63, 65, 71, 289, 291 Kronecker 61 Krümmung 230, 231, 268, 269 Krümmungsmittelpunkt 268 Krümmungsradius 268 kubische Gleichung 139 Kugel 64, 180, 196, 232, 272, 273, 301, 311 Kugeldreieck 177, 179, 180 Kugelkoordinaten 65, 175 Kugelmittelpunkt 175 Kugeloberfläche 175, 176, 299 Kugelradius 175 Kugelzentrum 176 Kugelzweieck 177, 180 Kurve 155, 207, 213, 230, 231, 248, 268, 271, 272 Kurvendiskussion 230, 231 Kurvenkrümmung 268 Kurvenlänge 268, 272 Lagrange-Identität 297 Laplace 105, 106, 108, 110, 182, 277–283, 285, 294–297, 310, 311 Laplace-Entwicklung 105, 106, 108, 110

320 | Stichwortverzeichnis Laplace-Operator 294–297, 311 Laplace-Transformation 182, 277, 279, 280, 282, 310, 311 Laplace-Transformierte 280, 281, 283, 285, 310 leere Menge 10, 11, 14, 17 leere Zeile 100 Leibniz 193, 194, 203, 207 Leibniz-Kriterium 193, 194, 203 Leibnizsche Notation 210 Leitgerade 157, 158, 167 Limes 184 linear 17, 18, 20, 73–75, 82, 99, 100, 102, 114, 125, 135, 177, 269 linear abhängig 73, 102 linear unabhängig 73–75, 82, 100 lineare Abbildung 19, 20, 34, 99, 114, 122 lineare DGL 307 lineare Exzentrizität 153, 160, 173 lineare Form 144, 172 lineare Funktion 198, 208, 281 lineare Gleichung 81, 88, 94, 96, 103, 109, 121, 124 lineares Gleichungssystem 81 ff., 90, 94, 96, 101, 103, 109, 121, 124, 127, 128, 150 Linearfaktor 135, 263 Linearität 21, 100, 101, 105 Linearkombination 32, 73, 82, 100, 262, 290, 308, 309 linksgekrümmt 230 Linksinverses 95 links total 18 Logarithmus 217, 220, 221 Logarithmusfunktion 217, 218 logarithmus naturalis 217 Logik VII, 3 Lösung 3, 4, 36, 37, 41, 81–84, 88, 90, 96, 97, 101, 102, 109, 110, 121–124, 127–129, 137–141, 143, 255, 262, 308–310 Lösungsansatz 308 Lösungsmenge 81, 84, 85, 89, 112, 122, 123, 137, 168 Lösungsvektor 128 Lösungsverfahren 103, 137 Lot 45, 46, 49, 155 MacLaurin-Entwicklung 243 MacLaurin-Reihe 242, 243 Majorante 189, 193, 196, 202 Majorantenkriterium 192, 201, 265

Mantelfläche 168, 271, 272 Maßstabsstreckung 114 mathematisch positiv 39, 75, 117, 126, 168 Matrix 90–105, 107–110, 114–123, 144, 145, 147–151, 274 Matrixaddition 90, 91 Matrixelement 105, 108 Matrixinversionsverfahren 96 Matrixmultiplikation 34, 91, 94, 95, 101, 117 Matrixprodukt 92 Matrixschreibweise 289 maximal 88, 100, 233 Maximum 230, 232, 241 Mehrfachintegral 270 Menge VIII, IX, 8–13, 15–17, 25, 29, 31, 33–35, 37, 41, 48, 55, 65, 66, 70, 81, 83, 122, 123, 133, 137, 175, 185, 188 Mengenklammer 9 Mengensubtraktion 11 Metrik 68, 70, 118 metrischer Raum 68 Minimum 230, 232 Minorante 189, 193, 214 Mittelpunktsgleichung 152, 157, 160–162 Mittelwert 237 Mittelwertsatz 211, 212, 241 Modul 31 modulo 31 modus ponens 6 modus tollens 6 Moment 271 monoton 185–187, 193, 195 Monotonie 186, 187, 193, 217 de Morgan 6, 13 multilinear 102 Multilinearität 102 Multiplizität 135–138 Nabla-Operator 291, 292 Näherung VIII, 127, 239, 247, 253 natürliche Zahl 3, 4, 25, 26, 28, 29, 31, 36, 55, 184, 185, 187, 209, 234, 237, 239 natürlicher Logarithmus 217 n-dimensional 12, 61, 71, 82, 122, 289 Nebenachse 152, 153 Nebenbedingung 248 Nebenscheitel 153, 156 n-Eck 47 Negation 4–6

Stichwortverzeichnis

negativ 11, 33, 65, 72, 100, 104, 105, 117, 161, 169–171, 194, 216, 235, 291 negative Zahl 33 Nenner 29, 34, 35, 195, 264 neutrales Element 14, 33, 34, 56, 59 Newton 141, 142, 207, 214 Newton-Verfahren 141, 142 Nordpol 175–178, 180 Normale 45, 71, 76, 124, 125, 176 Normalenrichtung 299 Normalenvektor 63, 70–72, 81 normiert 74, 139 Null 3, 32, 35, 86, 101, 106, 127, 185, 194, 201, 209, 230, 237, 240, 242, 246, 248, 255, 276 Nullfolge 185, 189, 193 Nullmeridian 175, 176, 178 Nullpolynom 133 Nullpunkt 67, 245, 246, 279 Nullstelle 134–137, 139–143, 198, 264 nullte Näherung 127, 239 Nullvektor 56, 58, 62, 83, 110, 122 Nullzeile 85, 100 numerische Exzentrizität 153, 160, 172, 173 n-Tupel 12, 15, 55, 83 OBdA 29, 152, 177, 186, 234 obere Grenze 184, 258 obere Schranke 184, 185, 254 Oberfläche 196, 272, 273, 299–301, 304 Oberflächenelement 176, 301 Obermenge 9, 10, 17 Obersumme 254 offenes Intervall 184, 242 Öffnungswinkel 168, 273 Oktaeder 73 ONB 74, 119 Ordinate 48, 53, 155, 156, 159, 161, 231, 238 Ordinatenabschnitt 230 Ordnung 17, 36, 41, 104, 105, 127, 239, 246–249, 271, 307 Ordnungsrelation 16, 17 Oresme 35 Originalfunktion 280 orthogonale Koordinaten 144, 145, 299 orthogonale Koordinatentransformation 144, 145 orthogonale Transformation 119 Orthonormalbasis 73, 74 Ortsvektor 55

| 321

Paar 11, 17, 31, 32, 55, 56, 171, 280, 298 paarweise 74 Parabel 146, 149, 152, 158, 159, 161, 164, 167, 171, 173, 198, 249, 253, 267, 269, 273 Parabelscheitel 159 parallel 20, 57, 60, 61, 81, 82, 212, 213, 301 Parallelschaltung 5 Parallelverschiebung 63, 64, 147, 148, 155, 159, 161 Parameter 70, 72, 155, 158, 161, 172, 173, 236, 269 Parameterdarstellung 69, 269 Parameterform 156, 162 Parkettierung 47 Partialbruchzerlegung 32, 262, 263, 265, 267, 310 Partialsumme 191, 192, 195 Partialsummenfolge V, 191, 193, 195, 200 partielle Ableitung 245, 246, 248, 294 partielle Differentiation 245, 278, 291 partielle Integration 259, 281, 310 partielle Ordnungsrelation 16, 21 Pascal 28, 235 Pentagon 47, 49, 73 Periode 53 Periodenlänge 236, 237, 274 periodisch 53, 196, 236, 237, 274 Peripheriewinkel 48 Permutation 104, 106 Pfeil 55 von Pisa 31, 190 Pivotelement 85 Platonischer Körper 72 Platzhalter 88 Polardarstellung 40 Polare 165–167 Polarengleichung 165, 166 Polarform 39–42, 279 Polargleichung 154, 156, 159, 161, 162, 172, 173 Polarkoordinaten 39, 64, 65, 294, 296, 311 Polarvektor 55 Polyeder 72, 73 Polygon 47, 72, 73 Polynom 133–137, 139, 140, 198, 216, 218, 231, 239, 264, 265, 277 Polynomdivision 264, 267 positiv definit 120 potentiell unendlich IX, 25 Potenz 135, 139, 209, 218, 264

322 | Stichwortverzeichnis potenzieren 217, 220 Potenzmenge 17 Potenzrechnung 36 Potenzreihe 202, 203, 239, 242 Potenzreihenentwicklung 234 Primfaktor 29 Primfaktorzerlegung 28, 29, 36, 140 Primzahl 28, 29, 32, 135 Primzahlsatz 29 Prinzip des falschen Ansatzes 141 Produkt 11, 12, 14, 15, 29, 60–63, 90, 92, 98, 119, 136, 139, 195, 210, 212, 215, 233, 261, 272, 290 Produktmatrix 108 Produktmenge 11, 18 Produktregel 210–212, 241, 259, 290, 292–294, 302 Produktreihe 229 Projektion 61, 71, 76 Prämisse 5 Ptolemäus 175 punktierte Funktion 256, 258 Punktspiegelung 118 Punktsymmetrie 231, 266 punktsymmetrisch 53 punktweise konvergent 200 Pyramide 67 Pythagoras 46, 48, 51, 55, 60, 268, 269 Quadrat 36, 38, 47, 49, 68, 179, 233 quadratische Ergänzung 138 quadratische Form 144–148, 151, 152, 160 quadratische Gleichung 137, 139, 146, 147 quadratische Matrix 91, 94, 99, 101 quadratisches Flächenelement 302 quadratisches Glied 138 Quadratwurzel 36, 39, 40, 188 quellenfrei 304 Quotient 32, 191, 263 Quotientenkriterium 192, 193, 202 Quotientenregel 211, 212, 246 Radius 45, 46, 49, 64, 152–156, 159, 161, 162, 165, 166, 168, 172, 180, 268, 272, 273, 279, 311 Radiusvektor 164, 165 Radizieren 40, 41 Rang 88, 97, 100, 109, 123–125, 145

rational 9, 30, 31, 34–37, 140, 187, 188, 236, 262–264 Raum 12, 55, 58, 65, 68, 73, 83, 115, 118, 141, 267, 289 Raumdiagonale 76, 196 Raumkoordinaten 118, 291 räumliche Differentiation 292 Raum-Zeit-Kontinuum 83 Realteil 38, 278 Rechte-Hand-Regel 63, 302 Rechteck 46, 61, 233, 270, 283 Rechteckimpuls 276, 277, 281, 284 rechter Winkel 46 rechts eindeutig 18 rechtsgekrümmt 230 Rechtsinverses 95 Rechtssystem 55, 63 reduzibel 135 reduzierte Normalform 86, 88, 89, 94 reell 3, 4, 38, 138, 148 reelle Funktion 66, 197, 277, 291 reelle Nullstelle 135–137 reelle Zahl IX, 9, 20, 37, 55, 57, 58, 65, 68, 120, 137, 183, 184, 189, 236, 242, 289 reelles Polynom 133, 136 reflexiv 16 Regula falsi 141, 143 reguläre Matrix 97, 103, 111 reguläres Polyeder 72 Reihe V, 103, 107, 191–196, 200–203, 214, 215, 220, 234, 235, 237, 243, 244, 267 Reihenentwicklung 39, 214, 227, 238, 242, 267 Reihenschaltung 5 Reihenverdichtung 191–193 Rekursionsformel 183, 188, 190, 260 rekursiv 88, 183 Relation 9, 15, 16, 18, 19, 21, 58, 247 Repräsentant 16, 55 Rest 3, 16, 28, 29, 31, 32, 34, 134, 209, 219 Restglied 240–242 Restklasse 31 Richtung 39, 55, 58, 60, 62–64, 68, 69, 71, 117, 118, 126, 148, 151, 152, 155, 159, 161, 165, 170, 173, 176, 245, 247, 289, 291, 292, 299, 302, 303 Riemann 278 Ring 133, 262 Rotation 115, 272, 292, 294, 298, 303, 304 Rotationsachse 75

Stichwortverzeichnis

Rotationsbildung 292 Rotationskörper 64, 271, 272 Rücktransformation 284, 310 Sarrus 104, 106, 110 Sattelpunkt 230–232 Scheitel 48, 153, 155, 157–159, 161, 167, 172 Scheitelabschnitt 158 Scheitelabstand 164 Scheitelgleichung 155, 158, 161 Scheitelkrümmungsradius 155, 156 Schenkel 28, 46 Schmiegekreis 155, 159, 172, 268 Schnitt 146, 168, 170, 171, 176, 268 Schnittaxiom 37 Schnittbildung 14 Schnittebene 176 Schnittmenge 11, 81, 169 Schnittpunkt 10, 46, 126, 141, 153, 155, 165, 170, 174, 177 Schranke 184, 185, 254 Schwarz 42, 68, 247 Schwerpunkt 272, 273 Sechseck 47 Sehne 48, 165, 174 Seitendiagonale 66 Seitenkosinussatz 178 Sekante 141, 165, 174, 212 Separation der Variablen 309 sgn 152 Sinus 51, 52, 224, 226, 227, 229 Sinusfunktion 224, 225, 282 Sinus hyperbolicus 227 Sinussatz 51, 52, 179 Skalar 57, 122, 289–292, 301, 303 Skalarfeld 289, 291, 292, 301, 303 Skalarmultiplikation 57, 58, 65, 83 Skalarprodukt 57, 59–61, 63, 65, 68, 70–72, 74, 92, 118–121, 125, 144, 290–292, 300 Spaltenoperation 102 Spaltenvektor 92, 99, 110 Spat 289 Spatprodukt 63, 289 Spatvolumen 63, 289 spektrale Zerlegung 237 Spektralfunktion 279 Spektrum 237, 277 spezielle Lösung 309 sphärischer Exzess 178

| 323

sphärisches Koordinatensystem 65 Spiegelsymmetrie 231 spiegelsymmetrisch 53 Spiegelung 116, 118 Spiegelungsmatrizen 119 Spur 149–151 Stabilität 128 Stammfolge 191 Stammfunktion 253, 255, 257, 261, 310 Stauchung 152 steigend 185–187, 195, 230 Steigungswinkel 230, 248, 269 stetige Teilung 49 Stetigkeit 197–199, 207, 239, 256 Stetigkeitseigenschaften 202 Stirnfläche 272 Stokes 302–304 Störfunktion 309 Strahl 45 Strahlensatz 45, 49, 141, 155 Strecke 45, 49, 153, 161, 247 Streckung 117, 118, 152 Streckungsmatrix 117 Streifenbreite 254, 276 streng monoton 186, 187, 191, 195, 210, 216, 217 strenge Ordnungsrelation 16 Stufenfunktion 281 Substitution 139, 218, 258, 259, 264, 265, 274, 276, 283, 308 Subtraktionssymbol 11 Südpol 175, 177 Summationsgrenze 209, 228 Summenformel 192, 220 Summenfunktion 200, 202, 242 Summenregel 284 Supremum 184 surjektiv 19, 56, 58, 114, 115 Syllogismus 6 Symmetrie 15 Symmetriebedingung 120 Symmetrieeigenschaften 226, 231 symmetrisch 16, 92, 97, 120, 238 symmetrische Matrix 97, 144, 145 symmetrische quadratische Form 147 Systemmatrix 88, 90 Tangens 51, 225, 227, 230, 248 Tangensfunktion 224 Tangens hyperbolicus 227

324 | Stichwortverzeichnis Tangente 141, 164, 165, 174, 207, 212, 213, 230, 239, 248, 268 Tangentengleichung 164, 165 Tartaglia 138 Taylor-Entwicklung 249 Taylor-Polynom 239–241 Taylor-Reihe 239, 240, 242, 243, 247, 278 Teiler 32, 134, 135, 140 teilerfremd 30, 32, 140 Teilfolge 186, 187 Teilmenge 9, 11, 15, 18, 207 Teilsumme 191 Term 62, 170, 211, 240, 260 Terrassenpunkt 230 Tertium non datur 6 Tetraeder 73 Thalessatz 46, 48 totales Differential 247, 291 von Tralleis 154 Transformation 114, 118, 119, 144, 148, 158, 169, 274 transitiv 16 transponierte Matrix 92, 93, 102 Transposition 34, 93, 104, 106, 116 Trennung der Variablen 309, 311 Trichotomie V, 9, 36, 195 Trigonometrie 51, 59, 178 Tripel 12, 73 triviale Lösung 97, 122, 308 Ubaldi del Monte 163 Uhrzeigersinn 39, 75, 115, 168 Umfang 47–49 Umgebung 184, 198, 207, 242, 278 Umkehrabbildung 19, 34, 114 umkehrbar 95, 101, 102, 109, 231 Umkehrfunktion 210, 217, 220, 258 Umordnung 180, 194 Unbekannte der Klasse 87 unbestimmtes Integral 255 unechte Untermenge 9 unecht gebrochen 264 uneigentlicher Grenzwert 185 Unendlichkeitsstelle 279 ungerade 20, 29, 36, 106, 230, 231 Ungleichung 42, 68, 187, 242 Unterdeterminante 105, 106 untere Grenze 184, 255, 258 untere Schranke 184

Untermatrix 105, 107, 111, 148 Untermenge 9, 10, 25 Unterraum 83, 122 Untersumme 254 Urbild 18, 41, 114 Urbildbereich 17 Urbildraum 122, 123, 125 Ursprung 10, 48, 53, 55, 63, 67–72, 76, 81, 118, 139, 155, 158, 159, 161, 165, 166, 175, 231, 273, 293, 301 Ursprungsgleichung 171 Vektoraddition 34, 55, 57, 59, 62 Vektoranalysis 182, 287 Vektorfeld 289, 291, 292, 304 Vektorprodukt 61 Vektorraum 65, 66, 82, 83, 122, 289 Vektorsubtraktion 57 Venn-Diagramm 10 Vereinigung 11, 12, 14 Verknüpfung 4, 10, 34, 57, 59 Verschiebungssatz 283 Vertauschungsregeln 270 Verzinsung 223 Vielfaches 29, 102 Vielflach 72 Viereck 47 Vollkreiswinkel 45, 46, 177 vollständige Induktion 26, 27, 30, 211 vollständige Lösung 308 Volumen 63, 232, 245, 270–273, 299–301, 304 Volumenelement 271, 299–301 Wahrheitstafel 4–6, 10 Wahrheitswert 3, 4, 7 Wallis 195, 261 Weg 161, 180, 272, 278, 279, 304 Wegintegral 278 Weierstraß 201, 239 Wendepunkt 230–232 Wendestelle 230, 232 Wertebereich 17, 197, 214, 216, 217, 224, 231 Wertevorrat 17 Widerspruch 29, 140 Wilson 31 Winkel 39, 45–47, 51–53, 59–61, 66, 67, 74, 75, 77, 115, 117, 118, 126, 145, 156, 159–162, 168, 169, 172, 177, 178, 224, 269, 271, 272

Stichwortverzeichnis

Winkelfunktionen 39, 52, 53, 224, 225, 227, 229, 237, 274 Winkelhalbierende 48 Winkelkosinussatz 179, 180 Winkelsatz 60 Wirbelfeld 294 wirbelfrei 304 Würfel 73, 76, 196, 299, 300 Würfeldiagonale 66, 76 Würfelstruktur 300, 301 Wurzel 34, 36, 37, 42, 137, 140, 189 Wurzelkriterium 192, 193 Zahlenmenge VIII, IX, 18, 31, 197 Zahlensystem 31 Zahlentheorie 29, 31 Zähler 29, 35, 208, 263, 264

| 325

Zehnersystem 222 zeichnerische Addition 57 zeichnerische Konstruktion 155 Zeilenoperation 93, 95, 100, 102, 107 Zeilenvektor 92, 99, 175 Zeitbereich 310 Zeitfunktion 276, 277, 280, 284, 310 Zentralpotential 297 Zentrum 48, 153, 160 Zentrumswinkel 48 Zerlegung 29, 135, 237 Zermelo 29 Zirkulation 302 Zuwachs 253 Zweikreiskonstruktion 155 Zwischenwertsatz IX, 198 zyklometrische Funktion 224