LEHRBUCH - Mathematik für die Informatik 1 - Lineare Algebra und Diskrete Mathematik.pdf 978-3-947940-00-4

1,805 179 178MB

German Pages 476

Report DMCA / Copyright

DOWNLOAD FILE

Polecaj historie

ÜBUNGSBUCH - Mathematik 1 - Grundlagen, Lineare Algebra und Diskrete Mathematik 978-3-947940-10-3

1,254 114 100MB Read more

Mathematik 1 für Nichtmathematiker: Grundbegriffe - Vektorrechnung - Lineare Algebra und Matrizenrechnung - Kombinatorik - Wahrscheinlichkeitsrechnung [7., verb. Aufl.] 9783486593655

Für viele angewandte Wissenschaften ist die Mathematik ein zwar oft ungeliebtes, gleichwohl unumgängliches Hilfsmittel g

194 47 24MB Read more

Algebra und diskrete Mathematik: Skriptum zur Vorlesung im Sommersemester 2019 [version 29 Apr 2019 ed.]

690 68 589KB Read more

Lineare Algebra: Ein Lehrbuch über die Theorie mit Blick auf die Praxis [1 ed.] 3662627418, 9783662627419

Dieses Lehrbuch über die Lineare Algebra deckt den gesamten Stoff der zweisemestrigen Grundvorlesung ab. Seine anschauli

514 71 4MB Read more

Lineare Algebra 1 9783658024130, 9783658039455

676 62 594KB Read more

Lineare Algebra: Ein Lehrbuch über die Theorie mit Blick auf die Praxis [1 ed.] 3662627418, 9783662627419

Dieses Lehrbuch über die Lineare Algebra deckt den gesamten Stoff der zweisemestrigen Grundvorlesung ab. Seine anschauli

397 36 20MB Read more

Lineare Algebra und Analytische Geometrie [1. Auflage 2018] 9783658226190, 3658226196

974 53 5MB Read more

Angewandte Lineare Algebra 3110121077

715 60 61MB Read more

Lineare Algebra [1. Aufl.] 9783662613399, 9783662613405

Dieses vierfarbige Lehrbuch wendet sich an Studierende der Mathematik, der Physik und Informatik in Bachelor- und Lehram

892 142 8MB Read more

Mathematik 1 für Nichtmathematiker: Grundbegriffe - Vektorrechnung - Lineare Algebra und Matrizenrechnung - Kombinatorik - Wahrscheinlichkeitsrechnung [8., korr. Aufl.] 9783486708035, 9783486705195

Für viele angewandte Wissenschaften ist die Mathematik ein zwar oft ungeliebtes, gleichwohl unumgängliches Hilfsmittel g

255 105 8MB Read more

LEHRBUCH - Mathematik für die Informatik 1 - Lineare Algebra und Diskrete Mathematik.pdf
978-3-947940-00-4

Author / Uploaded
Samuel Hetterich

Categories
Mathematics

Citation preview

LEHRBUCH Mathematik für die Informatik 1 Lineare Algebra und Diskrete Mathematik Samuel Hetterich 1. Auflage

LEHRBUCH Mathematik für die Informatik 1 Lineare Algebra und Diskrete Mathematik Samuel Hetterich

Analogverlag

Bibliographische Informationen Der Deutschen Bibliothek Die Deutsche Bibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliographie; detailliertere bibliographische Daten sind im Internet über http://dnb.ddb.de abrufbar.

ISBN 978-3-947940-00-4 1. Auflage ©2018 Analogverlag Samuel Hetterich, Idsteiner Straße 149, D-60326 Frankfurt Umschlaggestaltung: Analogverlag Samuel Hetterich, Idsteiner Straße 149, D-60326 Frankfurt Druck: buchdruckerei24.de, Morgenbergstraße 41, D-08525 Plauen Das Werk, einschließlich seiner Teile, ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages und des Autors unzulässig. Dies gilt insbesondere für die elektronische oder sonstige Vervielfältigung, Übersetzung, Verbreitung und öffentliche Zugänglichmachung. Printed in Germany

Meiner geliebten Frau Janice und unserem Sohn.

Vorwort Das Studium der Grundlagen der Mathematik stellt viele Studierende der Informatik vor große Herausforderungen. Mit diesem Buch möchte ich all jenen ein Hilfsmittel an die Hand geben, diese erste Klippe des Informatikstudiums zu umschiffen. Ich lese im dritten Jahr epochal die Grundlagenvorlesungen „Mathematik für die Informatik I" und „Mathematik für die Informatik II" über die Themenfelder der lineare Algebra, Analysis, diskreten Mathematik und Numerik an der Goethe-Universität Frankfurt am Main. Das vorliegende Lehrbuch entstand in der Dynamik eines kritischen Prozesses zwischen der von mir gehaltenen Vorlesung und dem Austausch mit meinen Studierenden der vergangenen Jahre. Viele Beispiele und Abbildungen entwickelte ich, um gezielt meine Vorlesung anschaulicher und lebendiger zu gestalten. In seiner jetzigen Form vermag es sicherlich auch Studierenden anderer Universitäten eine Hilfe in den ersten Semestern ihres Studiums sein. Auch deshalb bin ich dankbar für jede Anmerkung, jeden Verbesserungsvorschlag und ehrliche Kritik der Vergangenheit aber auch der Zukunft. Die Skripte zu der gleichnamigen Vorlesung vorangegangener Semester gehalten von Herrn Dr. Hartwig Bosse und Professor Dr. Amin Coja-Oghlan dienten mir als Quelle der Inspiration, Abschnitte durfte ich übernehmen - dafür danke ich herzlich. Ein Wort zum Inhalt des Lehrbuchs Bei der Auswahl der Themen haben mich zwei Grundsätze geleitet. k Methodisch sollen Leser befähigt werden, mathematische Inhalte lesen und formulieren zu können. Dabei sollen Sie ein solides Fundament und ein grundlegendes Verständnis der formalen und abstrakten mathematischen Herangehensweise entwickeln. ie. Inhaltlich sollen Leser über grundlegende Themen der linearen Algebra und diskreten Mathematik informiert werden. Es ist sicherlich

9

nicht möglich, alle diejenigen Themenfelder der linearen Algebra und der diskreten Mathematik in vollem Umfang zu behandeln, die Studierende der Informatik im Laufe ihrer weiteren Studien konfrontieren werden. Deshalb muss eine Auswahl geschehen, die ich sorgfältig und im Gespräch mit meinen Kollegen aus der Informatik getätigt habe. Dabei habe ich den Fokus bewusst auf die saubere Vermittlung der Grundlagen gelegt. Anwendungen können dann leicht erschlossen werden. Insbesondere habe ich davon abgesehen, übermäßig viele, aus der Informatik motivierte, zum Teil sehr sperrige Anwendungen zu skizzieren. Andere Bücher tun dies um sich den Anstrich der für Studierende der Informatik leicht zu verdauenden und dadurch auch leichter zu vermittelnden Mathematik zu geben. Ich bin davon überzeugt, dass viele dieser zum Teil sehr komplexen Objekte gerade Studierende zu Beginn ihres Studiums überfordern und dadurch nicht zu einer wachsenden Motivation beitragen. Sie sind meist nicht die optimalen ersten Beispiel für die behandelten Themen, verwischen wesentliche Merkmale und machen die Relevanz der Objekte nur ungenügend deutlich. Hat man das vorliegende Lehrbuch mit viel Einsatz und Ausdauer durchgearbeitet, sollte es einem ohnehin leicht fallen, komplexere mathematische Fragestellungen, wie sie in der Informatik auftauchen, zu studieren. Schlussendlich mündete dieser Ansatz in ein Lehrbuch mit vier Teilen und insgesamt 13 Kapiteln. Dabei möchte der erste Teil Grundlagen vermitteln. Grundlegende Begriffe und Objekte, wie Zahlen, Mengen und Abbildungen aber auch einführende Worte zur formalen Sprache und Beweisprinzipien finden hier ihren Platz. Ein Kapitel über Graphen schließt sich an. Graphen spielen in der Informatik als Werkzeug der Modellierung eine wichtige Rolle. In einem zweiten Teil wird die Theorie des Rechnens entfaltet. Rechnen ist sicherlich eine grundlegende Kompetenz für jeden, der mit „Rechnern" zu tun hat. In einem ersten Kapitel werden zunächst die Konzepte von Teilbarkeit, Faktorisierung und dem Rechnen mit Resten entfaltet und der euklidische Algorithmus eingeführt. Dieses algorithmische Verfahren ist ein starkes Werkzeug und ein Grundbaustein in vielen praktischen Anwendungen der Informatik. Neben dem chinesischen Restsatz wird außerdem die eulersche co-Funktion studiert. Das Kapitel hat überdies vorbereitendem Charakter für das zweite Kapitel dieses Teils. Dort wird die mathematische Abstraktion des Rechnens betrachtet. Rechnen wird abstrahiert und algebraische Strukturen mit ihren Verknüpfungen treten

10

an die Stelle von Zahlen und bekannten Rechenoperationen. Gruppen, Ringe, Körper und Vektorräume sind solche Strukturen, studiert werden sie über strukturerhaltende Abbildungen. Auf Vektorräumen werden diese als lineare Abbildungen bezeichnet. Anwendung finden viele Konzepte dieses Teils vor allem im vierten Teil des Buchs. Im dritten Teil des Buchs werden Vektorräume studiert. Sie werden beschreiben und klassifiziert, indem ihnen Basis und Dimension zugeordnet werden. Bei diesem Unterfangen helfen lineare Abbildungen, welche sich als Matrizen darstellen lassen. Dabei erschließt sich der Name „lineare Algebra" - das Rechnen mit linearen Abbildungen. Im Kontext des Studiums von Matrizen und linearen Abbildungen tauchen Konzepte wie Kerne, Orthogonalität, Normen, Metriken, Eigenwerte und Eigenräume, Diagonalisierbarkeit und die Determinante auf. Lineare Gleichungssysteme sind allgegenwärtig in diesem Unterfangen, welche mithilfe des Gaußschen Eliminationsverfahren gelöst werden. Im vierten Teil werden zwei Aspekte der Kommunikation von Daten studiert. Dabei sind die Kryptographie und die Kodierungstheorie nicht zu verwechseln. In der Kryptographie geht es um die sichere Kommunikation von Geheimnissen. In der Kodierungstheorie geht es um die fehlererkennende und fehlerkorrigierende Kommunikation und Speicherung von Daten. In der Kryptographie beschränken wir uns auf das RSA-Schema und die RSA-Signatur. Das erste realisiert sichere Kommunikation ohne vorherigen Schlüsselaustausch, das zweite eine fälschungssichere digitale Unterschrift zur eindeutigen Authentifizierung. In der Kodierungstheorie werden vor allem lineare Codes im Fokus des Interesses stehen. Ein Wort zum Studium mit dem Lehrbuch

Dieses Lehrbuch möchte genau das sein: Ein Lehrer für jeden grundlegend am Thema interessierten Leser. Es hat zum Ziel, die abstrakten mathematischen Theorien nicht bloß sauber (und deshalb nur für Experten), sondern vor allem für Jedermann lesbar darzustellen. Es will das Wissen an den Mann bringen, möchte lehren. Damit dies gelingt, sind einige Hinweis notwendig. „Eine Sprache erlernt man, indem man sie spricht" und „Wiederholung ist die Mutter allen Lernens", dies beiden zweifellos wahren Aussagen gelten auch für das Erlernen mathematischer Inhalte. Nur wer sich mit den abstrakten Definitionen und Aussagen auseinandersetzt und sie dadurch „verdaut", Zeit investiert und übt, wird sie wirklich erfassen. Diesen Aufwand können Ihnen weder noch so gute (und praxisorientierte) Bü-

11

cher, keine noch so „freshen" Erldärvideos und online Tutorials aber auch keine Vorlesung abnehmen - diesen Aufwand werden Sie selbst betreiben müssen. Doch es gibt Bedingungen, die diesen Prozess begünstigen - bei der Konzeption dieses Lehrbuchs habe ich dies berücksichtigt. Wenn Sie sich die folgenden Aspekte durchlesen, sollte Ihnen auch klar werden, warum ich immer noch an das „analoge Lehrbuch" glaube, dass man anfassen, beschreiben, blättern und zerlesen kann. 1. Schlüssige, klare Darstellung „aus einem Guss". Möchte man neue mathematische Inhalte erfassen, dann stellt die Abstraktion vor große Herausforderung. Es gibt nichts dem Lernerfolg gleich hinderliches, wie sekundäre Aspekte, die den klaren Blick auf das Wesentlich verwehren. Solche Aspekte können die ungenau und wechselnde Notation (Benennung) der auftretenden mathematischen Objekte, die unterschiedlichen ersten Sicht- und Herangehensweisen oder ungenügende oder falsche Motivation der Inhalte sowie schlecht gewählte Beispiele sein. Das vorliegende Buch ist „aus einem Guss geschrieben". Die gleiche Symbolik der Mengenlehre beispielsweise, wie sie in dem Grundlagenkapitel eingeführt wird, findet sich auch noch auf der letzten Seite des Buchs. Verwirrung durch variierender Notation sollte so vermieden sein. Das Lehrbuch setzt an keiner Stelle etwas voraus, das der Leser sich nicht aus der Darstellung erschließen könnte. Auch deshalb werden in den unterschiedlichen Kapiteln hin und wieder zunächst unwichtig erscheinende Aspekte studiert, die in einem späteren Kapitel dann jedoch nützlich sind. In dem Lehrbuch wird verlässlich alle das erklärt, was zum Verständnis notwendig ist. Damit sollte das Lesen dieses Lehrbuchs eine Wohltat im Vergleich zur Recherche im Internet sein. Viele Online-Inhalte, welche vorgeben, ein mathematisches Thema verständlich zu behandeln, entpuppen sich bei näherem Hinsehen vor allem für Lernende als verwirrend und nur schwer eingängig. Einen zweiten interessanten Blickpunkt liefert die Lerntheorie. Lernen heißt Verknüpfen. Dazu muss Wissen aufbereitet, sortiert und an existierendes Wissen angedockt werden. In einer Zeit ständiger Verfügbarkeit allen Wissens (man kann schnell googeln oder auf Wikipedia nachlesen) sind wir es nicht mehr gewohnt (oder vielleicht schon nicht mehr in der Lage), Wissen dauerhaft für uns selbst zu

12

erschließen. Das ist fatal. Das Lehrbuch möchte Ihnen helfen, die behandelten Inhalte wirklich zu lernen. Dabei fördert es durch seine aufeinander aufbauende Struktur das Verknüpfen von Wissen. In diesem Lehrbuch wird das mathematische Wissen aus der Schule vorausgesetzt. Sollten Sie dabei eigene Defizite feststellen, empfehle ich einen Online-Mathematik-Brückenkurs, der den Übergang von der Schule an die Universität unterstützten möchte. Abiturrelevantes mathematisches Grundlagenwissen kann dort wiederholt und aufgefrischt werden. Sie finden Ihn unter www.. ombplus . de. k Intuitive Beispiele. Um abstrakte Definitionen oder Objekte aber auch mathematische Aussagen zu erfassen, helfen intuitive Beispiele. In dem vorliegenden Lehrbuch findet sich eine Vielzahl ausführlich kommentierter Beispiele. Dabei wird besonders auf eine ausführliche Darstellung der Rechenwege Wert gelegt. Das hilft den Durchblick zu erlangen und Abstraktes mit Leben gefüllt besser zu erinnern. 1. Unterstützende Illustrationen. Was in Worten umständlich beschrieben wird, kann oft leichter in einer Grafik erfasst werden. Deshalb verfügt das Lehrbuch über zahlreiche als Illustration und Beweisskizze unterstützende Abbildungen. k Hilfreiche Bemerkungen. Das Lehrbuch ist durchsetzt mit einer großen Zahl von Bemerkungen. Sie ergänzen den Lesefluss und helfen Neues zu erfassen, es abzugrenzen und einzuordnen. Wieder gilt der Grundsatz: „Lernen heißt Verknüpfen". In Bemerkungen möchte der Autor mit den Lesenden und dem schon gelernten Wissen in den Dialog treten. k Übungsaufgaben. Wer nicht selbst Hand anlegt, wird schnell wieder vergessen. An jedes Kapitel schließt sich eine Sammlung von Übungsaufgaben an. Dabei finden sich Übungsaufgaben in unterschiedlicher Farbkodierung. Grüne Aufgaben sind sehr einfache Aufgaben, blaue Aufgaben sind generelle Aufgaben von unterschiedlichem (aber nicht sehr leichtem) Schwierigkeitsgrad. Orange Aufgaben sind Programmieraufgaben in Sage - siehe unten. Rote Aufgaben sind Beweisaufgabe, die in der Regel von höherem Schwierigkeitsgrad sind. Dabei stehen Ihnen insgesamt über 400 Übungsaufgaben zur Verfügung. k Kontrolle und Rekapitulation. Um Ihren eigenen Lernfortschritt zu kontrollieren, sind die Übungsaufgaben um eine gelbe Kategorie ergänzt. Dabei handelt es sich um eine Sammlung von „einfachen" Verständnisfragen, die mit Ja oder Nein zu beantworten sind. Kontrollieren Sie mit diesen Aufgaben Ihr Verständnis und Ihren 13

Lernfortschritt nach der Lektüre eines jeden Kapitels. k Platz für Entfaltung. Das Lehrbuch bietet einen breiten Schreibrand. Dieser breite Streifen an der Buchaußenseite fasst nicht nur gedruckte Anmerkungen und Abbildungen, sondern bietet Raum für Ihre Notizen. Markieren und kommentieren Sie die Inhalte, notieren Sie Ihre Fragen oder gefundene Antworten, ergänzen Sie Zwischenschritte und halten Sie Eselsbrücken fest. Der Raum gehört Ihnen, nutzen Sie ihn. k Ein gutes Gefühl. Mit Emotionen verknüpftes Wissen bleibt. Der berühmte erste Kuss, der Ort an dem Sie das Fußball-WM-Finale 2014 gesehen haben, aber auch Ihre erste 5 in der Schule. Das Lehrbuch ist bewusst wertig produziert, also in Farbe gedruckt mit einem Hartcover versehen. Sie sollen gerne Zeit mit ihm verbringen. Das Lehrbuch darf Ihnen ein treuer Begleiter sein. Bücher sind Freunde. Sie werden viel zusammen durchmachen, das schweißt zusammen. Mein Lehrbuch der linearen Algebra aus dem ersten Semester findet immer noch seinen Ehrenplatz in meinem Bücherregal. Die von Notizen übersäten Seiten sehe ich immer noch vor mir, wenn ich meine Augen schließe und mich erinnere. Diese Erfahrung wünsche ich mit Ihrem persönlichen Exemplar des Lehrbuchs auch Ihnen . k Sage. Was wäre ein Lehrbuch der Mathematik für Informatiker ohne den Einsatz von hilfreicher Software. Verteilt über das Buch helfen Ihnen kleine „Sage-Boxen„ und „Sage-Aufgaben" die mathematische Software Sage zu erlernen. Mit ihr können Sie sich den Inhalten programmierend nähern. Das hilft sicherlich beim Verständnis und dem besseren Erinnern dieser. 1. Übersichtlichkeit. Das Buch ist in Farbe gedruckt. Das soll die Übersichtlichkeit verbessern. Definitionen sind gelb, Beispiel grün, Bemerkungen blau, mathematische Aussagen rot und alles, was mit Sage zu tun hat orange markiert. Die Beispiele und Bemerkungen, die den Lesefluss ergänzen sollen, sind etwas kleiner gedruckt. Beweise, wie zusammenhängende den Lesefluss ergänzende Teil,e werden jeweils durch eine Überschrift und eine kleine Box, einen kleinen Fuchs oder eine feine Linie in entsprechender Farbe eingefasst. Zwei gut gemeinte Ratschläge sollen diese „Gebrauchsanweisung" abrunden: Bleiben Sie am Ball und lassen Sie sich nicht frustrieren. Das Studium der Mathematik bedarf Ausdauer und Frustrationstoleranz. Geben Sie sich die Zeit, die Sie brauchen - beißen Sie sich rein. Es ist sicherlich naiv zu glaube, Sie könnten das Buch an einem Wochenende verschlingen.

14

Das Erlernen der Mathematik braucht „Verdauungszeit". Vertrauen Sie mir jedoch, dass Sie in drei Jahren, wenn sie die Inhalte verdaut und Komplexeres in Ihrem Studium erlernt haben werden, das Lehrbuch ungläubig aufschlagen. Ungläubig, weil Ihnen die Inhalte lange nicht mehr so schwer und abstrakt erscheinen, wie sie das in den nächsten Wochen und Monaten tun werden. Ein Wort zu Sage Das Lehrbuch ist gewürzt mit Anmerkungen, die Ihnen die mathematische Software SageMath, oder kurz Sage, näher bringen möchten. Sage ist ein freies Open Source Mathematiksystem. Es ist eine auf Python basierende Oberfläche und stellt Ihnen ein starkes Werkzeug zur computergestützten Analyse von mathematischen Objekten zur Verfügung. Ich gehe davon aus, dass Sie, als Informatik affiner Leser, in der Lage sein sollten, Sage auf Ihrem Rechner verfügbar und sich mit der grundlegend Syntax vertraut zu machen. Sie finden die Software unter www.. sagemath. org/de/ . Erste Schritte in einem online Tutorial können Sie unter doc. sagemath. org/html/de/tutorial/ gehen. Grundsätzlich gibt es über die behandelte Materie verteilt computerorientierte Aspekte. Dann sind Sie herzlich eingeladen die Software Sage zu nutzen, um „spielerisch" programmierend den Stoff zu erfassen. Unter den Übungsaufgaben finden Sie einige Anstöße und Anregungen dazu. Verteilt im Buch sind manche und zum Teil recht ausführliche Programme in Sage eingestreut. Sicherlich könnte dies noch ausführlicher geschehen, denn bei vielen der behandelten Inhalte ist das Rechnen mit der Hand mühsam. Ist beispielsweise in der linearen Algebra der fünfzehnte Kern einer Matrix zu berechnen, greift man sicherlich gerne auf Sage zurück. Tun Sie das bitte, doch gehen Sie dabei sicher, dass Sie verstanden haben, wie jeweils per Hand gerechnet werden müsste, stünde kein Computer zur Verfügung. Letzte erste Worte Bei Anregungen, Kritik, Verbesserungsvorschlägen oder falls Sie Fehler finden, melden Sie sich gerne per Mail unter [email protected]. Dann ist nun alles gesagt und es kann losgehen. Ich wünsche Ihnen viel Erfolg bei Ihren Studien. Frankfurt, im Sommer 2018 Samuel Hetterich

15

3.

16

0 Inhaltsverzeichnis I

Grundlagen

23

1

Grundbegriffe

25

1.1 Mathematische Aussagen 1.1.1 Bausteine mathematischer Aussagen 1.1.2 Ein Wort zu logischen Operatoren 1.1.3 Implikation und Äquivalenz 1.1.4 Operatorrangfolge 1.1.5 Mathematische Aussagen sortieren und beweisen 1.2 Mengen 1.3 Zahlen 1.3.1 Die natürlichen Zahlen 1.3.2 Die ganzen, rationalen und reellen Zahlen 1.4 Abbildungen 1.4.1 Injektivität, Surjektivität und Bijektivität 1.4.2 Spezielle Abbildungen 1.5 Beweise 1.5.1 Direkter und indirekter Beweis 1.5.2 Beweis von Äquivalenzen 1.5.3 Nützliche Beweistechniken 1.5.4 Vollständige Induktion 1.5.5 Beweise - mehr als ein Weg führt nach Rom 1.6 Relationen 1.6.1 Äquivalenzrelationen 1.7 Aufgaben

28 28 30 33 35 36 38 43 43 45 46 49 51 56 58 60 61 65 67 69 72 78

2 Grundlagen der Graphentheorie

2.1 Grundlegende Definitionen 2.1.1 Nachbarschaft in Graphen 2.1.2 Gewichtetet Graphen 2.1.3 Vollständige Graphen 2.2 Darstellung von Graphen 2.2.1 Planare Graphen

83

83 87 89 90 91 92

1. INHALTSVERZEICHNIS

2.3 Wege durch Graphen 2.3.1 Eulerzüge durch Graphen 2.3.2 Kürzeste Wege finden - der Dijkstra-Algorithmus 2.4 Bäume 2.4.1 Spannbäume 2.4.2 Minimale Spannbäume finden - der Kruskal-Algorithmus 2.5 Matchings 2.5.1 Der Heiratssatz von Hall 2.6 Aufgaben

96 99 106 112 114 116 120 121 126

II Rechnen

131

3 Rechnen mit ganzen Zahlen

133

3.1 Teilbarkeit 133 3.1.1 Primzahlen 134 3.2 Modulo-Rechnung 137 3.2.1 Reste 137 3.2.2 Modul-Gleichungen 140 3.3 Der euklidische Algorithmus 144 3.3.1 Der größte gemeinsame Teiler (ggT) 144 3.3.2 Berechnung des ggT für kleine Zahlen 145 3.3.3 Vorüberlegung zum euklidischen Algorithmus 146 3.3.4 Der euklidische Algorithmus 148 3.4 Das Lemma von Bezout 149 3.4.1 Der erweiterte euklidische Algorithmus 150 3.4.2 Lemma von Euklid 154 3.5 Der chinesische Restsatz 155 3.5.1 Anwendung des chinesischen Restsatzes: Ein probabilistischer Gleichheitstest 160 3.6 Die eulersche (p-Funktion 163 3.6.1 Rückwärtsberechnung von (p 165 3.7 Der Satz von Euler 175 3.7.1 Schnelles Potenzieren 177 3.8 Aufgaben 180 4 Algebraische Strukturen

4.1 Algebraische Strukturen - Einleitung 4.1.1 Rechenoperationen sind Abbildungen 4.1.2 Rechenregeln sind (zunächstmal) Axiome

18

185

185 186 189

INHALTSVERZEICHNIS

4.2 Gruppen 4.2.1 Weitere Rechenregeln in Gruppen 4.2.2 Die Gruppenordnung 4.2.3 Verknüpfungstabellen von Gruppen 4.2.4 Die Gruppe Z;!`,, 4.2.5 Die Gruppe Sr, 4.3 Ringe und Körper 4.3.1 Ringe 4.3.2 Körper 4.4 Vektorräume 4.4.1 Der Vektorraum 4.4.2 Der Vektorraum 1K 4.4.3 Interpretation von Vektoren des 1W1 4.4.4 Weitere Regeln in Vektorräumen 4.4.5 Untervektorräume 4.5 Strukturerhaltende Abbildungen 4.5.1 Gruppenhomomorphismen 4.5.2 Isomorphe Gruppen 4.5.3 Körperhomomorphismen 4.5.4 Homomorphismen auf Vektorräumen alias lineare Abbildungen 4.5.5 Isomorphie von Vektorräumen - Teil 1 4.6 Aufgaben

Ill

Lineare Algebra

5 Basis und Dimension

5.1 Erzeugung und lineare Abhängigkeiten 5.1.1 Linearkombinationen 5.1.2 Der Spann von Vektoren 5.1.3 Die Standardeinheitsvektoren 5.1.4 Lineare Unabhängigkeit 5.2 Die Basis 5.3 Die Dimension 5.3.1 Isomorphie von Vektorräumen - Teil 2 5.3.2 Basisaustauschsätze 5.4 Basis - eine Frage der Existenz 5.5 Aufgaben

A

190 195 200 207 208 211 214 214 215 218 218 220 225 229 231 234 235 236 238 241 244 245

251 253

253 254 256 260 261 266 269 270 271 274 277

19

ie INHALTSVERZEICHNIS

20

6 Matrizen 6.1 Die Matrix 6.2 Rechnen mit Matrizen über algebraischen Strukturen 6.2.1 Addition von Matrizen 6.2.2 Multiplikation von Matrizen mit Skalaren 6.2.3 Multiplikation von Matrizen mit Spaltenvektoren 6.2.4 Multiplikation von Matrizen mit Matrizen 6.2.5 Transposition 6.3 Spezielle Matrizen 6.4 Aufgaben

281 281 283 283 284 285 287 289 290 293

7 Matrizen & lineare Abbildungen 7.1 Darstellungsmatrix zur Standardbasis 7.2 Dimensionssatz 7.3 Basiswechsel 7.3.1 Basiswechselmatrix 7.3.2 Darstellungsmatrizen zu beliebigen Basen 7.3.3 Ähnliche Matrizen Lineare 7.4 Gleichungssysteme 7.4.1 Das Gaußsche Eliminationsverfahren 7.4.2 Rückwärtseinsetzen findet die Lösungsmenge 7.4.3 Gaußsches Eliminationsverfahren im Kleid der Matrixmultiplikation 7.4.4 Zeilen- und Spaltenrang 7.5 Aufgaben

295 295 299 304 306 309 312 313 314 318 324 327 330

8 Orthogonalität 8.1 Das Standardskalarprodukt und die euklidische Norm 8.1.1 Rechenregeln für das Skalarprodukt und die euklidische Norm 8.1.2 Geometrische Interpretation der euklidischen Norm 8.1.3 Geometrische Interpretation des Skalarprodukts 8.1.4 Matrix-Vektor-Multiplikation mit Skalarprodukten 8.2 0 rthonormalbasen 8.3 Das orthogonale Komplement 8.4 Orthogonalisierungsverfahren 8.4.1 Das Gram-Schmidt-Orthogonalisierungsverfahren 8.5 Die orthogonale Projektion 8.6 Orthogonale Abbildungen 8.6.1 Orthogonale Matrizen 8.7 Aufgaben

333 333 334 335 336 339 341 343 346 347 352 355 355 357

INHALTSVERZEICHNIS

9 Normen und Metriken

9.1 Norm - ein Längenbegriff für Vektoren 9.1.1 p-Normen für Vektoren über den Vektorräumen Kn 9.2 Metrik - ein Abstandsbegriff auf Mengen 9.2.1 Induzierte Metriken 9.2.2 Hammingabstand 9.2.3 Geometrie unterschiedlicher (induzierter) Metriken 9.3 Norm - ein allgemeiner Längenbegriff 9.3.1 Matrixnormen 9.4 Aufgaben 10 Die Determinante

361

361 362 364 365 366 368 370 370 376 379

380 10.1 Das Parallelotop und das orientierte Volumen 384 10.1.1 Volumen von Parallelotopen und LGS 386 10.2 Vom orientierten Volumen im IV zur Determinanten beliebiger Vektorräume . . 391 10.3 Berechnung der Determinante 391 10.3.1 Die Determinante in den Spezialfällen n = 2 und n = 3 392 10.3.2 Die Determinante durch Entwicklung nach Zeile und Spalte bestimmen 395 bestimmen Eliminationsverfahrens 10.3.3 Die Determinante mithilfe des Gauß'schen 396 10.4 Aufgaben 11 Eigen- und Singulärwerte

11.1 Eigenwerte und Eigenvektoren 11.2 Eigenwerte und Eigenvektoren berechnen 11.2.1 Eigenräume berechnen 11.2.2 Eigenwerte berechnen 11.3 Diagonalisierbarkeit 11.3.1 Algebraische und geometrische Vielfachheiten 11.3.2 Diagonalisierbarkeit - Symmetrische Matrizen 11.3.3 Diagonalisierbarkeit - allgemeine Matrizen (Singulärwertzerlegung) 11.4 Aufgaben

399

399 401 401 403 406 407 409 412 414

IV Kommunikation - mathematische Grundlagen

417

12 Daten verschlüsseln

419

12.1 Einleitung 12.2 Public-Key-Kryptographie 12.2.1 Das RSA-Schema 12.3 Das RSA-Signaturschema

419 420 421 427

21

A

k INHALTSVERZEICHNIS

12.4 Aufgaben 13 Daten übertragen

13.1 Allgemeine Codes über allgemeinen Alphabeten 13.2 Dekodierung 13.2.1 Das mLD-Verfahren 13.2.2 Daten aufbereiten 13.3 Lineare Codes 13.3.1 Beschreibung von Untervektorräumen 13.3.2 Lineare Codes sind Untervektorräume 13.3.3 Die Generatormatrix linearer Codes 13.3.4 Prüfstellen aus Daten berechnen 13.3.5 Die Kontrollmatrix linearer Codes 13.4 Binäre Hammingcodes 13.4.1 Hamming Codes über beliebigen Körpern 13.4.2 Hamming Codes sind perfekt 13.5 Aufgaben

22

430 433

433 436 436 444 445 446 448 450 459 461 464 469 470 471

I Grundlagen

1Grundbegriffe Das Wort Mathematik stammt aus dem Griechischen mathüliatikö tichnö, was sich als „die Kunst des Lernens" übersetzen lässt. Mittels Beobachtung von Zahlen und geometrischen Mustern werden Regelmäßigkeiten erkannt (erlernt) und in einer formalen und abstrakten Sprache beschrieben. Diese abstrakten Strukturen werden dann durch logische Denkschritte untersucht und weiter entfaltet. Man kann die Mathematik also auch als durch reale Muster inspirierte philosophische (gedankliche) Übung verstehen. Ob diese abstrakten Gebilde noch etwas mit einer realen Anwendung zu tun haben, ist (für einen echten Mathematiker) dann erst mal sekundär. Dennoch lassen sich (für einen Informatiker) glücklicherweise viele reale Fragestellungen in einer mathematisch abstrakten Formulierung fassen. Eine Lösung des formalen Problems in der abstrakten Welt der Mathematik verhilft dann zu einer ganz praktischen Lösung in der realen Welt der ursprünglichen Fragestellung. Die Mathematik als solch ein starkes Werkzeug begreifen und hoffentlich auch verwenden zu können, setzt eine intensive Auseinandersetzung mit ihr voraus. Insbesondere sind grundlegende Konzepte zu begreifen. In diesem Kapitel möchten wir quasi die DNA der Mathematik untersuchen. Dazu gehören Zahlen, die mathematische Logik, der Mengenbegriff, Abbildungen und Relationen. Bevor wir dies tun, wollen wir noch kurz etwas genauer erörtern, wie das Gebilde der Mathematik entfaltet wird.

Die Mathematik - ein auf Axiomen gegründetes logisches Bauwerk Möchte man mit dem Bundesminister für Finanzen über den Bundeshaushaltsplan diskutieren, sollte man sich zur Vorbereitung des Gesprächs zumindest mit Budgetprinzipien, Konjunkturparametern und dem Bundesfinanzplan auseinandergesetzt haben. Bevor man über komplexere Fragestellungen nachdenkt und diskutiert, sollte man sich also zunächst mit dem Grundlagenwissen vertraut machen. T tiefer liegende Komplexe bauen auf Grundlagen auf. Diese Binsenweisheit, dass Wissen aufeinander aufbaut und es tiefer liegendes Wissen und Grundlagenwissen gibt, ist ein treffendes Bild für die Mathematik.

1.

Jeder weiß, was eine gerade natürliche Zahl ist. Es ist eine natürliche Zahl, welche durch 2 teilbar ist. Aber was ist überhaupt eine „natürliche Zahl" und wie ist „Teilbarkeit durch 2" definiert? Offensichtlich liegen der Definition einer geraden natürlichen Zahl weitere Definitionen zugrunde. Weiter kann man fragen, ob die 10 eine gerade natürliche Zahl ist? Ja, wenn Teilbarkeit einer Zahl m durch 2 definiert ist, als die Existenz einer Zahl k, so dass 2 • k = m ist. In dem Beispiel wäre dann k = 5 und es gilt 2 • 5 = 10. Eine Definition beschreibt oder benennt also ein Objekt, welches bestimmte Eigenschaften besitzt. Diese Eigenschaften wiederum sind Aussagen, welche den Wert „wahr" oder „falsch" annehmen können. Aber wie tief muss man graben? Lässt sich jede Eigenschaft einer Definition auf eine andere Definition zurückführen? Die Antwort lautet Nein! Es gibt Definitionen, welche (manche geforderten) Eigenschaften ganz grundlegend festsetzen. Die Definition der natürlichen Zahlen ist ein Beispiel für eine solche grundlegende Definition. Die Eigenschaften, welche die natürlichen Zahlen beschreiben, werden einfach als wahr angenommen. Eine Menge, welche diese Eigenschaften besitzt, ist per Definition die Menge der natürlichen Zahlen. Die grundlegenden Aussagen, welche sich nicht mehr auf andere Definitionen beziehen, werden Axiome genannt. Axiome sind sozusagen das Fundament der Mathematik. Höher liegende Aussagen sind durch logische Schlüsse aus den Axiomen als „wahr" abgeleitet worden. Die geschickte und richtige Wahl der Axiome ist also dafür ausschlaggebend, wie sich das Gebäude der Mathematik darstellt, welche Aussagen „wahr" oder „falsch" sind. Die Mathematik ist somit ein abstraktes Modell unseres Denkens, welches mit den passenden Axiomen und den Gesetzen der Logik eine Sammlung von Aussagen als wahr benennt. Zum Beispiel, dass in einem rechtwinkligen Dreieck die Quadrate der kurzen Seiten dem Quadrat der langen Seite entsprechen - der Satz des Pythagoras. Hilft diese Einsicht in der abstrakten Welt der Mathematik auch in der Praxis, beim Bau eines Hauses beispielsweise, dann stellt sich die Wahl der Axiome, aus denen sich diese Aussage als wahr ableiten lässt, als durchaus sinnvoll heraus. In der Praxis begegnen einem Axiome eher selten. Vielmehr kennt man eine Reihe von höher liegenden Definitionen und mathematischen Aussagen. Der Satz des Pythagoras ist eine solche Aussage. Wir möchten nicht viel tiefer in diese philosophische Grundlage der Mathematik eintauchen, uns aber bewusst halten: Jede mathematische Aussage, die wir als „wahr" benennen, müssen wir logisch auf eine Aussage zurückführen, von der wir wissen, dass sie als „wahr" aus den Axiomen abgeleitet wurde. Dieser

26

Vorgang des logischen Ableitens wird als Beweis bezeichnet. Eine ganze Reihe von Aussagen, werden wir nennen und darauf vertrauen, dass die Mathematiker ihre Arbeit gut und zuverlässig getan und sie auf die Axiome zurückgeführt haben (das wird vor allem bei der Schulmathematik der Fall sein). Wir werden diese Aussagen also nicht beweisen, sondern als Grundlage eigener Beweise nutzen. Warum macht man sich diese „Beweisarbeit"? Es gibt zwei Gründe: Verlässlichkeit und Verständnis.

k Eine Aussage, die als wahr bewiesen wurde, gilt. Sie kann angewendet werden. Lässt sich ein Problem mathematisch modellieren, dann gelten für das mathematische Modell sofort jegliche als wahr bewiesene Aussagen. Das kann zum Beispiel die Laufzeit eines durch einen Graphen modellierten Suchalgorithmus betreffen. Möglicherweise kann mittels einer Formel, die bewiesenermaßen auf allen Graphen gilt, diese berechnet werden. Dazu muss diese Formel dann nicht für jeden Graphen neu überprüft werden, der Beweis hat ein für alle Mal die Verlässlichkeit der Formel belegt. 1. Beweise schärfen aber auch den Blick auf mathematische Zusammenhänge und steigern damit das tatsächliche Verständnis der Aussage. Kennt man zum Beispiel einen geometrischen Beweis des Satzes von Pythagoras, wie in Abbildung 1.1 skizziert, dann erscheint einem die Aussage weniger mystisch oder beliebig zu sein. Die Informatik ist historisch betrachtet aus der Mathematik hervorgegangen. Durch die Entwicklung von Computern wurde es in der Mitte des vergangenen Jahrhunderts möglich, durch automatisierte Rechenverfahren anspruchsvolle Berechnungen durchzuführen. Bis heute müssen Probleme zunächst in eine mathematische, formale Sprache übersetzt und dann für den Computer implementiert werden. Es ist deshalb unabdingbar für einen Informatiker die grundlegende Mathematik, formale Sprachen und logisches Schließen zu studieren. Wir haben jetzt schon von mathematischen Aussagen und Beweisen aber auch von Zahlen, Mengen, Abbildungen und Relationen gesprochen. Wir werden uns nun diese Begriffe näher anschauen. Dabei werden wir in den einzelnen Abschnitten immer wieder vorgreifen oder besser auf Schulwissen zurückgreifen (werden also zum Beispiel im Abschnitt über mathematische Aussagen von Mengen und den natürlichen Zahlen reden). Das hätten wir durch einen formal sauberen und stringenten Ansatz auch umgehen können. Wir sind allerdings davon überzeugt, dass das vielleicht

Abb. 1.1. Geometrischer Beweis des Satzes von Pythagoras.

27

S. MATHEMATISCHE AUSSAGEN

noch nicht formale, aber anschauliche Verständnis dieser Objekte ungemein hilft, nach und nach die formal sauberen, sicherlich zum Teil recht abstrakten, Definitionen jeweils mittels Beispielen mit Leben füllen zu können.

1.1 Mathematische Aussagen

Unter einer mathematischen Aussage versteht man eine mathematische Formel oder eine formal-logische Aussage, der ein Wahrheitswert „wahr" oder „falsch" zugewiesen werden kann. Dabei gelten zwei Regeln. k Eine mathematische Aussage ist entweder „wahr" oder „falsch" (es

gibt keine dritte Möglichkeit). Anmerkung. Diese zwei grundlegenden Regeln werden auch als das Prinzip des ausgeschlossenen Dritten und das Prinzip der Widerspruchsfreiheit genannt.

k Eine mathematische Aussage kann nicht gleichzeitig „wahr" und

„falsch" sein. BEISPIEL 1.1. Wir betrachten für verschiedene Ausdrücke, ob sie unsere Definition einer mathematischen Aussage entsprechen. k Der Ausdruck „x3 — 7x + 1" ist keine mathematische Aussage, sondern nur ein mathematischer Term. S. Der Ausdruck „x2 — 2x + 1 = 0" ist eine mathematische Aussage (die je nach Wert von x wahr oder falsch ist). S. Der Ausdruck „1 = 0" ist eine mathematische Aussage, die falsch ist. k Der Ausdruck „4 ist eine Quadratzahl" ist eine mathematische Aussage, die richtig ist. S. Die Goldbach Vermutung „Jede gerade natürliche Zahl größer als 2 kann als Summe zweier Primzahlen geschrieben werden." ist eine mathematische Aussage, von der bisher nicht klar ist, ob sie wahr oder falsch ist.

1.1.1 Bausteine mathematischer Aussagen # Variablen definieren sage: n=var('n' )

Wir möchten nicht zu tief in die Aussagenlogik (welche in der Prädikatenlogik fortgeführt wird) einsteigen und sehen von einer vollständig formalen Einführung der verwendeten Begrifflichkeiten ab. Im Folgenden ein kleiner Überblick der „Bausteine", welche in mathematischen Aussa-

28

MATHEMATISCHE AUSSAGEN

A

gen verwendet werden. Im Anschluss werden wir logische Operatoren etwas ausführlicher betrachten. I. Ein mathematisches Objekt ist eines der in den unterschiedlichsten Teilgebieten der Mathematik eingeführten und studierten abstrakten Objekte. Das können Zahlen, Mengen, Vektoren oder geometrische Körper, aber auch Abbildungen, Graphen, Terme und vieles mehr sein. k Eine Variable ist ein Platzhalter für mathematische Objekte in einer mathematischen Aussage und wird manchmal auch als Veränderliche bezeichnet. Als Variable dienen beliebige Zeichen. An jeder Stelle in einer mathematischen Aussage, an der dieselbe Variable auftaucht, muss bei einer Belegung der Variable dasselbe mathematische Objekt auftauchen. Eine Variable kann mit einem Definitionsbereich (eine Menge zulässiger Objekte) ausgestattet sein, muss dies jedoch nicht. Ist kein Definitionsbereich angegeben, darf eine Variable in der mathematischen Aussage mit jedem mathematischen Objekt belegt werden. Abhängig von der konkreten Belegung kann die Aussage dann wahr oder falsch sein. k. Ein Operator ist eine mathematische Vorschrift, zur Erzeugung von mathematischen Objekten aus mathematischen Objekten (Summenzeichen, Rechenvorschriften, Integral, Elementzeichen, Gleichheitszeichen). k Ein logischer Operator ist eine Vorschrift zur Erzeugung von mathematischen Aussagen aus mathematischen Aussagen oder mathematischen Objekten (vergleichen oder verknüpfen). In der folgenden Tabelle sind die von uns verwendeten logischen Operatoren aufgelistet. Negation ODER V Exklusives ODER V UND A

> 2]) „ Es gilt nicht ... " ?_ 2] V [n < 2]) „ Es gilt ... oder „ Es gilt entweder ... oder ..." ([n ?» 2] V [n < 2]) ([n > 2] A [n < 2]) „ Es gilt ...und ..."

k Ein Quantor spezifiziert, ob eine Aussage für (mindestens) ein, für genau ein, für alle oder für kein mathematisches Objekt gilt. Allquantor V „Für alle..." (Vn N : n 0) Existenzquantor 3 „ Es existiert (min.) ein ... " (3n E N : n 5) 3! „ Es existiert genau ein ... " (3!n E N : n2 = 9) „ Es existiert kein ... " (11n E N : n < 0) s. Es werden Klammern in mathematischen Aussagen gesetzt, um

29

k MATHEMATISCHE AUSSAGEN

sage: # Negation und ODER sage: n = var ('n' ) sage: (n>=2) negation () n „es existiert eine natürliche Zahl n mit n mal n ist gleich 40" •-•-+ Die Aussage ist wahr (n = 6). Vn EN:n•n= 36

4-> „für alle natürlichen Zahlen ist n mal n gleich 36" -s.-> Die Aussage ist falsch. •

1 .1 .2 Ein Wort zu logischen Operatoren Man kann Aussagen mithilfe von logischen Operatoren verändern oder miteinander verknüpfen. Wir beschreiben die drei wichtigsten logischen Operatoren etwas genauer. k Negation. Die Negation oder auch Verneinung einer Aussage A ist die Aussage --LA, welche genau dann wahr ist, wenn A falsch ist und genau dann falsch ist, wenn .4 wahr ist. Wendet man diese Definition auf an, stellt man fest, dass A die Negation der Aussage ist. Konjunktion. Die Konjunktion oder UND-Verknüpfung zweier Aussagen A und .6 ist eine Aussage ,A A B welche wahr ist, wenn A und 8 wahr sind und falsch ist, wenn mindestens eine der Aussagen .A oder B falsch ist.

30

MATHEMATISCHE AUSSAGEN

.4

Die Disjunktion oder ODER-Verknüpfung zweier AusB ist eine Aussage A v B welche wahr ist, wenn und .A sagen mindestens eine der Aussagen A oder 8 wahr ist, und falsch ist, wenn beide Aussagen A und 13 falsch sind. k exklusives ODER. Die exklusive ODER-Verknüpfung zweier Aussagen A und B ist eine Aussage A \:/ Ci welche wahr ist, wenn genau eine der Aussagen A und B wahr und eine Aussage falsch ist. Sie ist falsch, wenn entweder beide Aussagen A oder B wahr oder beide Aussagen .A oder B falsch sind. Sie wird auch als ausschließende ODER-Verknüpfung bezeichnet. Man schließt aus, dass beide Aussagen entweder beide wahr oder beide falsch sind.

1. Disjunktion.

BEISPIEL 1.3. Es

seien die folgenden Aussagen

A = [n E N : n < 5]

und

B = [n E N : n > 3]

gegeben. Wir finden die folgenden Verknüpfungen. Negation. Es ist [n E N : n, > 5] die Negation der Aussage A = [n E N : n < 5]. E N : n < 5] = [n e N : n > 5]. = Man schreibt dann Konjunktion. Die Konjunktion

A A 13 = [n E N : n < 5] A [n E N : n > 3]

[n E N : 3 < n < 5]

ist nur für n = 3, 4 und 5 wahr. Disjunktion. Die Disjunktion

A V 13 = [n E N : n < 5] V [n N : n > 3] = [n N : [n < 5] V [n > 3]] ist für alle natürlichen Zahlen wahr. Exklusives ODER. Die exklusive ODER-Verknüpfung

AV

= [n E N : n < 5] V [n E N : n > 3]

ist für alle natürlichen Zahlen außer für n = 3, 4 und 5 wahr.

In der Praxis ist es nicht immer leicht, negierte Aussagen zu formulieren. Die folgenden Bemerkungen 1.4 und 1.5 erklären die Negation von Quantoren, Konjunktionen und Disjunktionen. 1.4. Wie wir später sehen werden, ist das Formulieren von negierten Aussagen beispielsweise in Widerspruchsbeweisen wichtig. Dabei ist die einleitende Widerspruchsannahme die negierte Originalaussage. Negiert man eine Aussage, die mit einem All- oder Existenzquantor beginnt, so gilt der folgende Merksatz. BEMERKUNG

Negation von Quantoren.

31

MATHEMATISCHE AUSSAGEN

In negierten Aussagen wird ein Existenzquantor zu einem Allquantor und ein Allquantor zu einem Existenzquantor. Folgendes Beispiel erhellt den Merksatz. -.[Vn E N :

E N : n + > 40] = [3n E N : Vm EN:n±m< 40].

In Worten lautet die linke Aussage ohne die Negation: „für jede natürliche Zahl n gibt es eine natürliche Zahl in so dass n in = 40 ist" Die rechte Seite lautet: „Es gibt eine natürliche Zahl n, so dass für jede Zahl m E N gilt n

< 40" •

seien A und 13 mathematische Aussagen. Negiert man Konjunktionen oder Disjunktionen gilt der folgende Merksatz. BEMERKUNG 1.5. Es

Negation von Konjunktionen oder Disjunktionen. Die Aussagen werden negiert, Konjunktionen werden zu Disjunktionen und Disjunktionen zu Konjunktionen. Wir überlegen uns, warum diese Regel gilt. I. Die Negation der Konjunktion A A B entspricht der Disjunktion der negierten Aussagen --,Av -B. Es ist also

-.[A A B] = HA V -13]. In Worten: Wann sind A und 13 nicht beide wahr? Wenn entweder A falsch (also -IA wahr) oder 13 falsch (also wahr) ist. k Die Negation der Disjunktion AV B entspricht der Konjunktion der negierten Aussagen A -.B. Es ist also

-,[A V 8] = [-A A -B]. In Worten: Wann ist nicht entweder A oder 13 wahr? Wenn sowohl A falsch (also wahr) und B falsch (also X13 wahr) ist.

• Es folgen Beispiele für Bemerkung 1.5. BEISPIEL 1.6. Es seien, wie in Beispiel 1.3, die Aussagen A= [n E N : und 13 = [n E N : n > 3] gegeben.

71
3] ist HA. A /3]

= = =

[n E N : n < 5] A E N n < 5] V [n E N : n > 5] V

[n E N : n > 3]] [n E N : n > 3] [n E N : n < 3].

Die Aussage [n E N : n > 5] V [n E N : n < 3] ist für alle natürlichen Zahlen außer n = 3, 4 und 5 wahr.

32

MATHEMATISCHE AUSSAGEN

A

k Die Negation der Disjunktion A V B = [n E N : n < 5] v [n E N : n > 3] ist

—[A v 5] = [ [n E N : n < 5] V [n E N : n > 3]] = =

E : n < 5] A [n E N : n > 3] [n E N : n > 5] A [n E N : n < 3].

Die Aussage [n E N : n > 5] A [n E N : n < 3] ist für keine natürlichen Zahlen wahr.

■

1.1.3 Implikation und Äquivalenz

Es gelten in gewissem Sinne „Rechenregeln" für mathematische Aussagen. Dabei spielen die Begriffe der Äquivalenz und der Implikation eine entscheidende Rolle, welche mathematische Aussagen in Relation setzen. Diese beiden Begriffe sind wahrlich Schlüsselkonzepte der Mathematik. Sie sind die Formalisierung logischer Schlüsse. DEFINITION 1.7. Es seinen A und 13 mathematische Aussagen.

Es impliziert A die Aussage 13 wenn gilt: 13 ist immer wahr, wenn A wahr ist. In diesem Fall schreibt man A

B.

Es sind A und 13 äquivalent, wenn A die Aussage 13 impliziert und umgekehrt auch 13 die Aussage A impliziert. In diesem Fall schreibt man A< > B . BEMERKUNG 1.8. Es seinen A und 13 mathematische Aussagen. k Es impliziere die Aussage A die Aussage 13. Man sagt dann auch, dass 13 aus A folgt oder dass A hinreichend für 13 ist und umgekehrt, dass 13 notwendig für A ist. In mathematisch-sprachlichen Formulierungen findet man die Formel „wenn A, dann 13". k Es seien die Aussagen A und 13 äquivalent. Man sagt dann auch, dass A notwendig und hinreichend für 13 ist. In mathematisch-sprachlichen Formulierungen findet man die Formel „A genau dann, wenn 13". Die Begriffe „notwendig" und „hinreichend" kann man sich gut merken. Ist .A hinreichend für 13 (also A impliziert 8), dann ist 13 sicher wahr, wenn A wahr ist. Es ist also 13 unter Garantie wahr, wenn A wahr ist. Das A wahr ist, reicht aus (ist hinreichend), um zu wissen, dass auch 13 wahr ist. Im Umkehrschluss kann man allerdings nichts über 13 sagen, wenn A nicht wahr ist. Denn dann kann 13 wahr oder falsch sein.

33

MATHEMATISCHE AUSSAGEN

Ist 13 notwendig für .A (also A impliziert 5), dann ist .4 bestimmt nicht wahr, wenn 13 nicht wahr ist. Denn wäre A wahr, wäre sicher auch 13 wahr. ■ Betrachten wir je ein Beispiel für eine Implikation, die keine Äquivalenz ist und eine Äquivalenz, die per Definition eine zweifache Implikation ist. BEISPIEL

1.9. Es ist [n > 5]

[n > 3]

Die Aussage A = [n > 5] impliziert die Aussage 13 = [n > 3] (wenn n > 5 ist, dann gilt sicherlich auch n > 3). Umgekehrt ist dies jedoch nicht der Fall, 13 impliziert A nicht. Wähle dazu n = 3. Dann ist Aussage 13 wahr, Aussage A jedoch nicht. Also sind die Aussagen .A und 13 nicht äquivalent, es impliziert A zwar 13 aber 13 impliziert .A nicht. ■ BEISPIEL 1.10. Es gilt sicherlich, dass ein Dreieck genau dann gleichseitig ist, wenn alle Seiten die gleiche Länge haben.

Formal betrachtet, liegen zwei Aussagen vor = [ „Ein Dreieck ist gleichseitig."] 13 = [ „Die Seiten eines Dreiecks sind gleich lang."]. Die Aussage A impliziert die Aussage 5. Ist ein Dreieck gleichseitig, dann sind die Seiten gleich lang. Die Umkehrung ist in diesem Fall ebenfalls richtig. Die Aussage 13 impliziert auch die Aussage A, denn ein Dreieck, dessen Seiten gleich lang sind, ist ein gleichseitiges Dreieck. Es gilt also [ „Ein Dreieck ist gleichseitig."] [ „Die Seiten eines Dreiecks sind gleich lang."] •

Wir sammeln nun noch einige recht nützliche und erhellende Hinweise bezüglich Implikation und Äquivalenz. BEMERKUNG 1.11. Im Fall der Äquivalenz sind die Aussagen entweder beide wahr oder beide falsch - sie sind gleichwertig. Daher erschließt sich der Name aus dem Lateinischen: aequus „gleich" und valere „wert sein". ■

BEMERKUNG 1.12. Eine schöne Veranschaulichung für den Unterschied zwischen Äquivalenz und Implikation ist diese Eselsbrücke, welche den Sachverhalt der Implikation veranschaulicht. Implikation. Wenn es geregnet hat, ist die Straße nass. Keine Implikation. Wenn die Straße nass ist, heißt das nicht zwangsläufig, dass es geregnet hat. „Es hat geregnet."

„Die Straße ist nass."

„Die Straße ist nass." / > „Es hat geregnet."

34

MATHEMATISCHE AUSSAGEN

A

Aber es ist nach Bemerkung 1.14 [„Die Straße ist nass."] = --4„Es hat geregnet."]. Umformuliert heißt das „Die Straße ist nicht nass." = „Es hat nicht geregnet.".

■

BEMERKUNG 1.13. Um Verwirrung vorzubeugen, ist die folgende Bemerkung wichtig. Eine Implikation kann selbst eine mathematische Aussage sein, welche selbst wieder eine andere Aussage impliziert. Es seien die beiden Aussagen A = [a, b E Z : a und b sind gerade = a b ist gerade]. 13 = [6 + 2014 ist gerade] formuliert. Dann gilt A BEMERKUNG 1.14.

■

B.

Interessanterweise sind die Implikationen A=B

und -,.13

gleichbedeutend. Denn wenn A die Aussage 13 impliziert, dann kann A nicht wahr sein, wenn B nicht wahr ist. Ergo impliziert -43 die Aussage

1.1.4 Operatorrangfolge Wir haben jetzt schon eine Menge Bausteine mathematischer Aussagen kennengelernt. Es ist nun an der Zeit etwas über die Reihenfolge der Anwendung dieser zu sagen. Aus der Schule ist bekannt, wenn man eine Gleichung auf Korrektheit überprüfen möchte, wie zum Beispiel 12 • (3 + 5) — 14 = 22 + 12 • 4 wendet man den Merksatz Punkt-vor Strich-vor-Gleichheitszeichen an. Erst werden Zahlen der beiden Terme multipliziert, dann addiert und am Schluss auf Gleichheit hin überprüft. Möchte man diese Reihenfolge verändern, dann setzt man Klammern. Es ist nämlich 12 • 3 + 5 = 41 84 = 12 • (3 + 5). Eine vergleichbare Regel gibt es für logische Operatoren. Operatorrangfolge. Es gilt Negation-vor-Konjunktion-vor-Disjunktion-vor-Implikation.

35

MATHEMATISCHE AUSSAGEN

BEISPIEL 1.15. Wir vergleichen die beiden mathematischen Aussagen

A= [nEN:n 3] V [n E N : n > 10] 13 = [nEN:n3]V[nEN:n>10]). Nach der Merkregel interpretiert gilt also

A =[n

E

= [n E

N:n 3] V [n E N : n > 10] : 3 < n < 5] V [n E N : n > 10] .

Die Aussage A ist wahr für n = 3, 4, 5 und alle natürlichen Zahlen größer gleich 10. Die Aussage 13 interpretieren wir ebenfalls nach der Merkregel, aber berücksichtigen die Klammern. Also gilt B = [n E N : n < 5] A ([n E : n > 3] V [n E N : n > 10]) =[n E N : n < 5] A [n E N : n > 3] . Die Aussage B ist wahr für n = 3, 4 und 5. Das Beispiel macht deutlich, dass es tatsächlich notwendig ist, eine Reihenfolge in der Anwendung logischer Operatoren festzulegen, wie wir es getan haben. ■

1.1.5 Mathematische Aussagen sortieren und beweisen

Das Fundament der Mathematik sind Axiome. Axiome sind mathematische Aussagen, welche per Definition oder vielleicht besser per Absprache wahr sind. Jede weitere mathematische Aussage muss bei den Axiomen beginnend durch Implikationen als wahr bewiesen werden. Man spricht dann von einem Beweis. Das kann sehr mühsam sein. Deshalb werden mathematische Aussagen in Sätzen formuliert und mit einem solchen Beweis versehen. Jede mathematische Aussage, welche als weitere Implikation aus einem Satz folgt, muss dann nur als eine solche bewiesen werden. Der Beweis darf den Satz als wahr voraussetzen. Das vereinfacht das Spiel ungemein und verkürzt die nötigen Beweise. DEFINITION 1.16. Ein (mathematischer) Satz ist eine widerspruchsfreie logische Aussage, die aus Axiomen und bereits bekannten Sätzen hergeleitet werden kann. Das Herleiten wird als Beweis bezeichnet und besteht aus Implikationen an deren Anfang widerspruchsfreie logische Aussagen und an deren Ende der Satz steht. BEMERKUNG 1.17. Es gibt unterschiedliche Namen für mathematische Sätze. Grundsätzlich werden Sätze auch als Theoreme oder Propositionen bezeichnet. Satz ist die Übersetzung, Theorem das ins Deutsche übernommene griechische Wort theörema und Proposition das ins Deutsche übernommene lateinische Wort, welches ebenfalls mit Satz zu übersetzen ist. Manche Autoren nennen Sätze grund-

36

MATHEMATISCHE AUSSAGEN

A

sätzlich Theoreme. Andere verwenden den Begriff Theorem für einen Satz der als grundlegend für eine entfaltete Theorie gilt. Ein Satz, welcher von vorbereitender Natur ist, wird als Proposition bezeichnet. Dann ist der Satz an sich nicht so bedeutend, allerdings notwendig, um einen wichtigeren Satz zu beweisen. Darüber hinaus gibt es zwei weitere Bezeichnungen für mathematische Sätze. Ist der Satz ein wichtiges technisches Werkzeug, welches in vielen Beweisen nützlich ist, bezeichnet man ihn als Lenuna. Lässt sich ein Satz sehr leicht aus einem anderen Satz herleiten, wird er als Korollar bezeichnet. Viele Namen also für ein ■ und dasselbe Konzept mit leicht unterschiedlichem Geschmack. Sind die Sätze sehr berühmt, werden Sie meist nach dem Mathematiker, der sie bewiesen hat oder nach ihrer Aussage benannt. Berühmte Beispiele sind die folgenden Sätze. SATZ 1.18 (Satz des Pythagoras). Seien a und b die kurzen Seiten und c die lange Seite eines rechtwinkligen Dreiecks. Dann gilt a2 + b2 = c2. SATZ 1.19 (Pizza-Theorem). Sei n E N und x ein beliebiger Punkt im inneren eines Kreises. Es zerlegen 4+2n Geraden durch x, wobei benachaeo° schneiden, den Kreis barte Geraden sich in einem Winkel von 2.(4+2n ) in 2 • (4 + 2n) Flächen. Nummeriert man diese nun im Uhrzeigersinn, so ist die Summe der Flächen mit geraden Nummern gleich der Summe der Flächen mit ungeraden Nummern. Wir werden im Verlauf des Buchs das Lemma von Betout und ein Korollar daraus kennen und verstehen lernen. LEMMA 1.20 (Lemma von Betout). Alle Paare von natürlichen Zahlen a und b E N besitzen 136zout Multiplikatoren. KOROLLAR 1.21. In der Menge Verknüpfung 0,, ein Inverses.

besitzt jedes Element bezüglich der

Wir formulieren direkt einen mathematischen Satz über mathematische Aussagen. Im Prinzip gibt er „Rechenregeln" für mathematische Aussagen vor, welche natürlich immer wieder Anwendung finden werden. Deshalb handelt es sich um ein Lemma. LEMMA 1.22. Für beliebige mathematische Aussagen .4, t3 und C gelten die folgenden Gesetze bezüglich des UND- und des ODER-Operators. S. Die Kommutativgesetze An813nAundAv88vA

37

MENGEN

3. Die Assoziativgesetze

[AAMACe.›..AA[BAC]undAvBal3v.A. Je. Die Distributivgesetze

[AA13]vC[AvC]A[13vC]und[AV/3]Ae[AAC]V[BAC] Tatsächlich müsste man dieses Lemma nun als wahr beweisen. Das ist nicht weiter schwer und wer möchte, darf dies gerne tun (die Definitionen der logischen Operatoren noch einmal näher betrachten). Bevor wir uns näher mit Beweisen beschäftigen, führen wir Mengen und Abbildungen ein, um Sätze formulieren zu können, anhand derer wir grundlegende Beweisprinzipien erlernen können.

1.2 Mengen Um Mathematik betreiben zu können, ist der Begriff der Menge unumgänglich. Aufgrund einiger Komplikationen in den Details können wir Mengen leider nicht im strengen mathematischen Sinne sauber definieren. Für unsere Zwecke bedienen wir uns der (naiven) Mengendefinition von Georg Cantor (1845-1918), dem Begründer der Mengentheorie. DEFINITION 1.23. Eine Menge ist eine Zusammenfassung bestimmter wohlunterschiedener Objekte unserer Anschauung oder unseres Denkens zu einem Ganzen. Diese Objekte werden als Elemente bezeichnet. Diese sehr einleuchtende und der alltäglichen Verwendung des Begriffs der Menge sehr nahe Umschreibung führt allerdings bei näherer Untersuchung zu Problemen. BEMERKUNG 1.24. Definiert man Mengen als „Zusammenfassung unterscheidbarer Objekte", wie wir es getan haben, so ergibt sich das folgende als das „Russelsche Antinomie" bezeichnete Paradoxon. Sei A die Menge der Mengen, welche sich nicht selbst enthalten. Wir werden nun zeigen, dass es diese Menge nicht geben kann. Dazu betrachten wir die einfache Aussage [die Menge A enthält sich selbst].

Es gibt nun zwei Möglichkeiten für den Wahrheitsgehalt dieser Aussage.

wahr -+ Die Menge A enthält sich selbst. Dann ist A keine Menge, die sich selbst nicht enthält. Dann ist A aber per Definition der Menge A nicht in A enthalten. 1 Ein Widerspruch.

38

MENGEN

A

falsch —› Die Menge A enthält sich nicht selbst. Dann ist A eine Menge, die sich selbst nicht enthält. Dann ist A aber per Definition der Menge A in A enthalten. 1 Ein Widerspruch. • Wir werden uns dennoch an die naive Definition der Menge halten. In der grundlegenden Mathematik spielen die angedeuteten Komplikationen keine Rolle. Wir wollen uns direkt einige Konventionen und Definitionen bezüglich der Notation grundlegender Begriffe im Kontext von Mengen anschauen. DEFINITION 1.25. Es sei A eine Menge.

# Menge sage: M=Set([1,2]) sage: 6 in M

False

sage: 2 in M True # Kardinalität einer Menge sage: M.cardinality() 2 # die leere Menge sage: Ket(M).is_emptyl) i. Die Schreibweise x e A bedeutet, dass x ein Element der Menge A True sage: M.random_elementE) ist. Je Mengen werden mit „{ " und „ }" den Mengenklammern geschrieben. S. Eine Menge ist definiert, wenn angegeben ist, welche Elemente in ihr enthalten sind. Dies kann deskriptiv - durch Angabe einer definierenden Eigenschaft (A = {n E N : n ist gerade}) - und konstruktiv - durch Aufzählung aller in ihr enthaltenen Elemente (A = {2, 4, 6, 8,10}) - geschehen. Wenn bei Mengen mit unendlich vielen Elementen das Bildungsgesetz klar ist, können auch unendliche Aufzählungen verwendet werden (A = {2, 4, 6, 8, . .}). k Eine Menge A heißt endlich, wenn A nur endlich viele Elemente besitzt. k Die Anzahl der Elemente einer endlichen Menge A wird als die Kardinalität von A bezeichnet und mit IAH notiert (auch Mächtigkeit genannt). Ist A nicht endlich, so schreibt man 1AI = co. k Die leere Menge notiert mit 0 ist diejenige Menge, die keine Elemente enthält. Sie hat Kardinalität 0.

BEME R KUNG 1.26. Elemente in Mengen tauchen nur einmal auf. So ist die Menge

M1 = {1, 2,2} gleich der Menge M2 = {1, 2}. Manchmal unterscheidet man diese Mengen und bezeichnet erstere dann als Multimengen. In einer Multimenge ■ darf ein und dasselbe Element mehr als einmal aufgezähWwerden. BEISPIEL 1.27. Die Menge A = {1, 4, 8} ist eine endliche Menge mit der Kardi-

= 3. Die Menge B = {1, 3, 5, 7, ...} der ungeraden natürlichen Zahlen ■ = oo. ist keine endliche Menge und es ist

nalität BAI

Man kann Mengen auf Gleichheit hin untersuchen und aus ihnen weitere Mengen gewinnen.

39

S. MENGEN

DEFINITION

Abb. 1.2. Die Teilmenge A C B.

Abb. 1.3. Der Schnitt A n

B und die Vereinigung A U B.

Abb. 1.4. Die Differenz A — B und die symmetrische Differenz AAB.

# Identische Mengen M1,M2=Set([1,2]),Set([1,2,2]) M1==M2 True M3=Set([2,3] ) # Teilmengen • list(Ml.subsets()) [fl, )1}, {2), (1, 211 Set([11) in Ml.subsets() True # Vereinigung sage: M1 .union (M3) (1,2,3) # Durchschnitt sage: M1. intersection (M3 ) (2) # Differenz sage: M1 . difference (M3) (21 sage: M1-M3—M1 .difference (M3) True # Symmetrische Differenz sage: M1 symmetric_difference (M3) )1, 3) # Kartesisches Produkt sage: cartesian_product([M1, M3]) The Cartesian product of (1,2, 1, 3) # Potenzmenge sage: Set(Ml.subsets()) [{1, )1), )21, (1, 2)]

40

1.28. Es seien A und B zwei Mengen.

s. Wir nennen die Mengen A und B gleich, wenn sie die gleichen Elemente enthalten. 3. Es bedeutet A c B (bzw. B D A), dass A eine Teilmenge von B ist, das heiEt jedes Element von A ist auch ein Element von B. N. Eine Teilmenge A von B heilk echt, wenn A nicht gleich B oder der leeren Menge ist. I. Mit A U B bezeichnen wir die Vereinigung von A und B; die Menge aller Elemente, die in A oder in B enthalten sind. • AuBerdem ist A n B der Durchschnitt von A und B; die Menge aller Elemente, die in A und B enthalten sind. S. Mit A \ B, gesprochen „A ohne B", bezeichnen wir die Menge aller Elemente von A, die nicht Element von B sind (auch Differenz genannt). k Mit AAB bezeichnen wir die symmetrische Differenz von A und B; die Menge aller Elemente, die entweder in A oder in B aber nicht in beiden Mengen enthalten sind. 5. Es bezeichnet A x B die Produktmenge von A und B, die Menge aller geordneten Paare (x, y) mit x E A und y E B (auch kartesisches Produkt genannt). k Mit An bezeichnen wir das n-fache kartesische Produkt von A mit sich selbst. Die Elemente von An sind die geordneten n-Tupel (xi, x„) mit xi , ...,x„ E A. • Fiir eine Menge A is die Potenzmenge P(A) die Menge aller Teilmengen von A inklusive der leeren Menge O.

BEMERKUNG 1.29. In den Abbildungen 1.2 bis 1.4 sind Venn-Diagramme gezeigt, welche grundlegende Konzepte von Mengen veranschaulichen. Es sei darauf hingewiesen, dass das Malen eines Venn-Diagramms keine mathematisch formale Argumentation ist. Dennoch konnen solche Diagramme helfen, notige Argumentationsschritte zu identifizieren. ■ BE ISP I EL 1.30. Es seien die drei Mengen A = {1, 4, 6, 8, 9}, B und C = {3, 6} gegeben.

= {1, 2, 3, 6, 7}

S. Es ist weder A gleich B noch A gleich C noch B gleich C. Denn die 9 ist nur in A enthalten, die 2 nur in B. 3. Es ist C c B, denn jedes Element aus C ist ebenfalls ein Element aus B. S. Es ist AU B = {1, 2, 3, 4, 6, 7, 8, 9} die Vereinigung der Mengen A und B. k Es ist A fl B = {1, 6} der Schnitt der Mengen A und B. k Es ist A \ B = {4, 8, 9} die Menge A ohne B.

MENGEN

k Es ist AAB = {2, 4, 7, 8, 9} die symmetrische Differenz von A und B. Es seien die Mengen A' = {1, 2, 3} und B' = {3, 4} gegeben. Dann ist A' x

= {(1, 3), (1, 4), (2, 3), (2, 4), (3, 3), (3, 4)1.

das kartesische Produkt von A' und B'. Außerdem ist P(A') = 10, {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}, {1, 2, 3}1 . die Potenzmenge von A'.

■

Ein weiteres sehr nützliches Konzept ist die Partition einer Menge. Dabei wird eine Menge A in disjunkte Teilmengen aufgeteilt, so dass jedes Element von A in genau einer dieser Teilmengen liegt. DEFINITION 1.31. Es sei A eine Menge. Dann nennt man die Mengen B1, . B,. eine Partition der Menge A, wenn Bi C A für alle i = 1, n kO • B1U...UBn = A • Bi n Bi = 0 für alle i, j E N mit 1 < < j f (x) bildet Werte aus dem Definitionsbereich D, eine beliebige Menge, in den Bildbereich B, eine beliebige Menge, ab. Jedem Element x E D wird durch f genau ein Bild f (x) E B zugeordnet. Gilt f (x) = y für ein y E B, so nennt man x das Urbild von y. DEFINITION

BEMERKUNG 1.46. Die Schlüsselerkenntnis bei der Definition von Abbildungen besteht darin, dass wirklich jedem(!) Element des Definitionsbereichs genau ein(!) Element (sein Bild) aus dem Bildbereich zugeordnet wird. Andersherum gilt das nicht, nicht jedes Element des Bildbereichs muss auch tatsächlich das Bild eines Elements (ein Urbild) aus dem Definitionsbereich sein und ein und dasselbe Element aus dem Bildbereich kann das Bild mehrerer Elemente aus dem Definitionsbereich B, x ti f (x) hat jedes x E D genau ein sein. Also, für eine Abbildung f : D Bild f(x), aber nicht jedes Element y E B muss ein Urbild besitzen.

D

Das kann man sich anhand des eingangs erwähnten Beispiels klar machen. Jeder Abb. 1.5. Student, der die Klausur mitgeschrieben hat, bekommt eine Klausurnote zugeordnet. Aber es könnten alle Studenten (die Urbilder) die gleiche Note, zum Beispiel Illustration der Abbildung aus Beispiel die Bestnote, (ihr Bild) erhalten. Alle anderen Noten sind in diesem Fall keinem 1.47. Studenten zugeordnet worden, sie besitzen keine Urbilder. Die Bestnote, vorausgesetzt, es haben mindestens zwei Studenten die Klausur mitgeschrieben, wurde in dem geschilderten Fall mehreren Studenten zugeordnet, besitzt also mehr als ein Urbild.

{0,

4, 1} und B = {3, 7, 9, 10}, BEISPIEL 1.47. Betrachtet man die Mengen D = dann gibt es eine Abbildung f : D -+ B mit 1 1 f( 2 ) = 8, 1 f(1) = 3, 01—> f (0) = 9, welche die Elemente aus D auf Elemente aus B abbildet. Siehe dazu die Skizze in • Abbildung 1.5. BEISPIEL 1.48. Betrachte die Menge N = {2, 3, 4, 5, 6, 7}. Dann ordnet die Abbildung f : N --> Z mit 21—> f (2) = 2, f (5) = 5, 5

f (3) = 3, 3 61—> f (6) = 3,

Abb. 1.6. Illustration der Abbildung aus Beispiel 1.48. y2

4 i—> f (4) = 2, 7 f (7) = 7

den natürlichen Zahlen 2, ... , 7 die größte Primzahl zu, die sie teilt. Siehe dazu ■ die Skizze in Abbildung 1.6. BEISPIEL 1.49. Die Abbildung g : I -4 111>o mit y 1—> f(y) = y2 bildet jede reelle Zahl auf ihr Quadrat ab. Siehe dazu den skizzierten Funktionsgraphen in ■ Abbildung 1.7. Noch eine kleine Bemerkung bezüglich der Notation. BEMERKUNG 1.50. In Beispiel 1.49 wird deutlich, dass die Mengen, die den

y Abb. 1.7. Illustration der Abbildung aus Beispiel 1.49.

47

ABBILDUNGEN

Definitionsbereich und den Bildbereich bilden, nicht zwangsläufig mit D und B bezeichnet werden müssen. Auch kann die Abbildung einen anderen Namen als f tragen und die Abbildungsvariable muss nicht zwangsläufig x heißen. In der Literatur wird der Bildbereich manchmal auch als Wertebereich bezeichnet. ■

Da Abbildungen in der Mathematik eine weitreichende Bedeutung haben, gibt es eine Vielzahl weiterer Definitionen. Zunächst verallgemeinern wir die Begriffe des Bildes und Urbildes auf Teilmengen des Bild- bzw. Definitionsbereichs. DEFINITION 1.51. Sei f : D -+ B, x H f (x) eine Abbildung. Für eine Teilmenge Z c D ist

f(Z)={f(z):

zE

Z}

die Bildmenge (manchmal auch einfach das Bild) von Z unter f . Wir nennen f (D) auch das Bild von f und schreiben Bild( f) = f (D). Umgekehrt bezeichnen wir für C c B mit f l ( C) {x e D : f(x)E C}

die Urbildmenge (manchmal auch einfach das Urbild) von C unter f . BEISPIEL 1.52. Wir betrachten die Abbildung f : N —h N aus Beispiel 1.52. Dann ist Z = {3, 5, 6} eine Teilmenge von N, dem Definitionsbereich. Es gilt f (Z) {f (3), f (5), f (6)} = 5} ist die Bildmenge von Z unter f.

Für die Menge C = {2, 7}, eine Teilmenge des Bildbereichs N, ist f -1(C) {2, 4, 7} die Urbildmenge von C unter f, die Menge aller Urbilder von 2 und 7, den Elementen aus C. ■ Man kann eine Funktion durch eine Restriktion in ihrem Definitionsbereich einschränken. Sei f : D —> B, x H f (x) eine Abbildung und D' C D eine Teilmenge des Definitionsbereichs von f . Dann nennen wir die Abbildung f I D1 : D' —>, x 1—> f (x) die Restriktion von f auf D'. DEFINITION 1.53.

BEMERKUNG 1.54. Die Restriktion einer Abbildung „vergisst die Elemente aus dem Definitionsbereich, die nicht in der Teilmenge D' von D liegen und bildet nur noch Elemente aus D' ab. Auf dieser Teilmenge D' entsprechen die Bilder jedoch ihren Bildern unter f. Die Restriktion wird manchmal auch als Einschränkung, die deutsche Übersetzung von Restriktion, bezeichnet, denn man schränkt den Definitionsbereich auf eine Teilmenge ein. • BEISPIEL 1.55. Wir betrachten erneut die Abbildung f : N N aus Beispiel 1.52 und die Teilmenge Z = {3, 5, 6} von N, dem Definitionsbereich. Dann ist

48

ABBILDUNGEN

flz

:Z

A

./\T die Restriktion von f aufZ mit

3

f (3) -= 3, 5H f (5) = 5, 6 H f (6) = 3.

•

1.4.1 Injektivität, Surjektivität und Bijektivität Abbildungen können, egal welche Mengen beteiligt sind, ob Zahlen oder sonstige mathematische Objekte, drei ganz grundlegende Eigenschaften besitzen. Dabei kommt es alleine auf die Zuordnung der Elemente und nicht deren mathematische Eigenschaften an. Grob gesprochen wird geklärt, ob Elemente aus dem Definitionsbereich alle Elemente des Bildbereichs „treffen"und ob es manche Elemente gibt, die mehrfach „getroffen" werden. DEFINITION 1.56. Eine Abbildung f : D —› B heißt

S. injektiv, wenn je zwei verschiedene x, x'

E D auch verschiedene

Bilder besitzen, wenn also gilt x

x' = f (x) f (x').

f. surjektiv, wenn jeder Bildpunkt y E B tatsächlich auch ein Urbild x E D besitzt mit y= f (x),wenn also gilt VyEB3xED: f (x) = y.

s. bijektiv, wenn f injektiv und surjektiv ist.

nicht injektiv

1nicht surjektiv 1nicht bijektiv Es helfen die Skizzen in den Abbildungen 1.8 bis 1.11 und die folgenden Abbildunfür Begriffe grundlegenden drei diese erklärenden Worte, sich Abb. 1.8. gen vorzustellen. Es sei vorweg noch einmal betont, dass jede Abbildung Illustration einer nicht injektiven und jedem Element des Definitionsbereichs auch ein Element aus dem Bildbe- nicht surjektiven Abbildung. reich zuordnet. k Injektivität. Die Definition der Injektivität kann man sich anschaulich vorstellen als dass die Definitionsmenge D in den Bildbereich „injiziert wird. Jeder Punkt im Definitionsbereich besitzt einen eigenen Punkt im Bildbereich.

✓ injektiv

1nicht surjektiv 1nicht bijektiv

• Surjektivität. Eine surjektive Abbildung dagegen „deckt den ganzen Bildbereich ab", jeder Bildpunkt im Bildbereich wird bei einer surjektiven Abbildung auch tatsächlich getroffen. Bei einer surjek- Abb. 1.9. tiven Abbildung stimmen also Bildbereich und Bildmenge überein. Illustration einer injektiven aber nicht surjektiven Abbildung.

49

ABBILDUNGEN

Die Bildmenge ist nämlich die Menge der Punkte im Bildbereich, die tatsächlich getroffen werden. j. Bijektivität. Eine bijektive Abbildung stellt eine eins-zu-eins-Relation zwischen Definitionsmenge D und Bildbereich B her. Jedes x E D hat zum einen „sein eigenes" Bild f (x) E B (injektiv) und zum anderen hat jeder Punkt y E B auch ein Urbild 2 E D mit f (x') = y (surjektiv). Bei endlichem Definitions- und/oder Bildbereich folgt daraus direkt, dass diese gleich viele Elemente besitzen.

1 nicht injektiv ✓ surjektiv 1 nicht bijektiv

Abb. 1.10. Illustration einer nicht injektiven aber surjektiven Abbildung. Es helfen nun sicherlich einige Beispiele. B

BEISPIEL 1.57. Wir betrachten die Mengen D' = {1, 2, 3, 4}, D = {1, 2, 3}, B = {5, 6, 7, 8} und B' = {5,6,7}. k Die Abbildung f : D —> B mit

✓ injektiv ✓ surjektiv ✓ bijektiv Abb. 1.11. Illustration einer injektiven und surjektiven also bijektiven Abbildung.

11—> f (1)

5, 2

f (2) = 5, 31—> f (3) = 7.

ist nicht injektiv und nicht surjektiv. Es gibt mit x = 1 und x' = 2 zwei verschiedene Elemente in D mit 5 = f (1) = f (x) = f (x') = f (2) = 5 (nicht injektiv) und es gibt mit y = 8 ein Element in B, für welches kein Urbild in D existiert (nicht surjektiv). k Die Abbildung f : D -+ B mit 11—> f(1) = 5, 21—> f (2) = 6, 31—> f(3) = 7. ist injektiv aber nicht surjektiv. Es gibt nicht zwei verschiedene Elemente x, x' in D mit f (x) = f (2) (injektiv) aber es gibt mit y = 8 jedoch ein Element in B, für welches kein Urbild in D existiert (nicht surjektiv). k Die Abbildung f : D' --> B' mit 1

f (1) = 5, 21—> f (2) = 5, 31—> f (3) = 6, 3 H f (4) = 7.

ist nicht injektiv aber surjektiv. Es gibt mit x = 1 und x' = 2 zwei verschiedene Elemente in D mit 5 = f (1) = f (x) = f (xl) = f (2) = 5 (nicht injektiv) und es gibt kein Element in B', für welches kein Urbild in D existiert (surjektiv). k Die Abbildung f : D --+ B' mit 11—> f (1) = 5, 21—> f (2) = 6, 3

f (3) = 7.

ist injektiv und surjektiv. Es gibt nicht zwei verschiedene Elemente x, x' in D mit f (x) = f (x') (injektiv) und es gibt kein Element in B', für welches kein Urbild in D existiert (surjektiv).

BEISPIEL 1.58. Wir betrachten nun noch Abbildungen über unendlichen Mengen. Da bieten sich die reellen Zahlen an. Am besten macht man sich zu den einzelnen Abbildungen jeweils eine kleine Skizze, um sich die Aussagen klar zu machen. S. Die Abbildung f : —> I x 1->x3 x ist nicht injektiv aber surjektiv. 3. Die Abbildung f : x 2x ist injektiv aber nicht surjektiv.

50

ABBILDUNGEN

x2 ist weder injektiv noch surjektiv. S. Die Abbildung f : R —+ x k Die Abbildung f : R —› R>0 x )-+ x2 ist nicht injektiv aber surjektiv. x2 ist injektiv und surjektiv, also k Die Abbildung f : R>0 --> R>c, x bijektiv.

Wir möchten exemplarisch nur für die Abbildung f : >0 —> R>0 x 1—> Beweis formal sauber führen.

x2

den

Injektivität. Es ist zu zeigen, dass für je zwei verschiedene x, x' E IFt>0 gilt f (x) # f (2). Dazu nehmen wir an, dass es zwei verschiedene x, x' E 11Z;0 gibt, Dann wäre aber f (x) = X2 = a =7 22 = mit f (x) = f (2) = a für ein a E f (2). Es gibt aber nur zwei Zahlen in R, deren Quadrat a ist, nämlich N/ii und —.V7t. Da — N/J, nicht im Definitionsbereich R>0 enthalten ist, muss x = x' gelten, ein Widerspruch zu unserer Annahmen. Es gibt also keine zwei verschiedenen x, x' E R>o, mit f (x) = f (xi ). Also ist f injektiv. Surjektivität. Es ist zu zeigen, dass für jedes y E R>1) ein Urbild x E R>0 existiert mit f (x) = y. Sei also y E R>0 beliebig gewählt. Dann ist x = f E R>0 und es gilt f (x) = f (,/ü) = f 2 = y. Da y beliebig aus >c, gewählt war, besitzt jedes y E R>0 ein Urbild. Also ist f surjektiv. Bijektivität. Weil f injektiv und surjektiv ist, ist f auch bijektiv.

■ Die Beispiele legen nahe, dass es immer möglich ist, eine Abbildung durch eine geschickte Restriktion zu einer injektiven Abbildung zu machen. Durch Verkleinern des Bildbereichs auf f (D) (das Bild des Definitionsbereich) kann man aus jeder Abbildung eine surjektive Abbildung gewinnen. Der Beweis dieser Aussage ist eine Übungsaufgabe.

1.4.2 Spezielle Abbildungen Abbildungsverknüpfungen

Man kann aus gegebenen Abbildungen neue bilden, indem man sie entweder mit Rechenoperationen Punktweise verknüpft oder hintereinander ausführt. B gegeben, DEFINITION 1.59. Es seien zwei Abbildungen f , g : D definiert Multiplikation eine und Addition eine wobei auf dem Bildbereich ist. Die Abbildung f +g mit (f +g) (x) 1—> f (x) + g(x) nennen wir die Summe der Abbildungen f und g.

51

A

ABBILDUNGEN

Die Abbildung f • g mit (f • g)(x) der Abbildungen f und g.

f(x) • g(x) nennen wir das Produkt

BEISPIEL 1.60. Betrachte die Abbildungen f,g : R mit (x) = x2 und g(x) = x. Dann ist f g die Abbildung mit (f g)(x) = f (x) g(x) = x2 + x und die Abbildung (f • g)(x) = f (x) • g(x) = X2 • X = X3. ■ DEFINITION 1.61.

Es seien zwei Abbildungen f : D

/3' und g : B

B'

gegeben. Die Abbildung f og mit (f og)(x) = f(g(x)) nennen wir die Komposition der Abbildungen f und g. BEMERKUNG 1.62. Die Komposition zweier Abbildungen wird manchmal auch als Hintereinanderausfiihrung von Abbildungen bezeichnet. ■

BEISPIEL 1.63. Betrachte die Abbildungen f,g R mit f(x) = x2 und g(x) = x -1. Dann ist Komposition f o g die Abbildung mit (f og)(x) = f (g(x)) = (x - 1)2 T. x2 - 2x + 1. ■

Die Identitätsabbildung

Für jede Menge M gibt es eine Abbildung von M nach M, welches jedes Element auf sich selbst abbildet. Diese Abbildung trägt den folgenden treffenden Namen. DEFINITION 1.64. Sei M eine beliebige Menge. Dann nennen wir die Abbildung idM : M -> M die Identitätsabbildung auf M, falls f (m) m für alle m E M. BEISPIEL 1.65. Auf der Menge M = {1, 2, 3} ist die Identitätsabbildung idM definiert über idM (1) = 1,idm (2) = 2 und idM (3) = 3. ■

Die Umkehrabbildung Eine Abbildung sorgt dafür, dass jedem Element genau ein Element aus dem Bildbereich zugeordnet wird. Gilt jedoch auch, dass jedes Element aus dem Bildbereich genau ein Urbild im Definitionsbereich hat, ist die Abbildung bijektiv und man kann die Abbildung umkehren, quasi rückgängig machen. DEFINITION 1. 66. Sei f eine bijektive Abbildung. Dann hat für jedes y E B die Menge f -1({y}) genau ein Element x E D und wir schreiben einfach x = f -1(y). Die Abbildung f -1 : B D,y H f -1 (y) ist in diesem Fall ebenfalls bijektiv und heißt die Umkehrabbildung von f.

52

ABBILDUNGEN

A

BEISPIEL 1.67. Die Abbildung f : D -> B' aus Beispiel 1.57 ist bijektiv. Wir D mit erhalten die Umkehrabbildung von f in f --1 : B'

51-> f -1(5) =- 1, 61-> f -1(6) =- 2, 71-> f -1(7) = 3. Die Abbildung f :11Z>0 -> IRA x 1-> X 2 aus Beispiel 1.58 ist ebenfalls bijektiv. Wir II erhalten die Umkehrabbildung von f in f -1 : B' --> D mit x H f -1 (x) = Hat eine Abbildung eine Umkehrabbildung, dann gibt es einen Zusammenhang zur Identitätsabbildung. LEMMA 1.68. Sei f : D -> B eine bijektive Abbildung. Dann ist f

0

rl

10

f -

f

Beweis. Der Beweis ist eine Übungsaufgabe.

id p.

■

Die Summe und das Produkt In der Mathematik treten häufig Verknüpfungen von Elementen auf. Das können zum Beispiel die Vereinigung oder der Schnitt von Mengen oder die Summe oder das Produkt von reellen Zahlen sein. Möchte man mehr als je zwei Elemente miteinander verknüpfen, gibt es dafür eine abkürzende Schreibweise, die wir nun kennenlernen. Um das zu tun, definieren wir den Index einer Menge B. Dazu nutzen wir allgemein Abbildungen einer Indexmenge I in die mit einem Index zu versehende Menge B. Man gibt Elementen aus der Menge B quasi einen Namen aus I. Das formale Konzept kann sehr verwirrend aussehen, in der Praxis sind die Symbole doch meist harmlos. Wen die Definitionen und Bemerkungen in diesem Abschnitt verwirren, sollte sich einfach mit den Beispielen begnügen. DEFINITION 1.69. Es seien D und B eine Menge. Es sei weiterhin eine injektive Abbildung f : D -+ B, x 1-> f (x) gegeben. Wir nennen f dann einen Index von B über der Indexmenge D und nennen für ein b E f (D) mit f (d) = b das Element d den Index von b. Wir schreiben dann mitunter etwas lax für die Abbildung f auch einfach (f (X)) x D und für ein Element d E D auch f (d) = f d . , k} c N, dann entsprechen die Bilder unter BEMERKUNG 1.70. Ist D = {1, 2, dem Index f einer Menge B über der Indexmenge D einem Tupel (f (1), ... f (k)) welches in dem kartesischen Produkt Bk enthalten ist. Ein solcher Index wählt sich also k Elemente aus B aus und schreibt sie „sortiert" und „nummeriert" in ein Tupel.

53

k ABBILDUNGEN

Ist B eine endliche Menge der Kardinalität k und f eine bijektive Abbildung, wird jedem Element aus der Menge B ein Index aus der Menge der natürlichen Zahlen von 1 bis k zugeordnet. Dieser Fall ist sicherlich der am häufigsten auftretende. Manchmal bezeichnet man die Indexmenge D auch den Index, dann sollte aber klar sein, welches Element aus D, welchem Element aus B zugeordnet ist. ■ BEISPIEL 1.71. Sei D = {a, ß, ry} eine Menge griechischer und B = {a, b, c, d, e} eine Menge lateinischer Buchstaben. Wir erhalten durch die Abbildung f : D B mit

fa

= f (a) = b,

f ß = f (ß) = d,

f-y = f(1') = b

einen Index von B über D. Sei D' = {1, 2, 3, 4,5}. Dann erhalten wir durch die Abbildung f : D'

B mit

= f(1) = a, f2 = f (2) d, f3 = f (3) b, f4 = f (4) = f 5 = f (5) = d ■

einen Index von B über D'.

Wir wenden das Konzept von Indexmengen direkt an, um die Vereinigung und den Schnitt von beliebig vielen Mengen verkürzt aufschreiben zu können. DEFINITION 1.72. Seien A und D beliebige Mengen und B : D --> 2(A) ein Index auf der Potenzmenge, also der Menge aller Teilmengen von A. Dann bezeichnet

U Bi = Ix E A : es gibt ein i E / mit x E Bi} iED

die Vereinigung aller Mengen in (Bi)iEI. Analog ist

n Bi ={x e A : für alle i E / gilt x E Bi}

ieD

der Durchschnitt aller Mengen in (Bi)iEI• 1.73. Betrachte die Menge A = {a, b, c, d, e, f, g, h} und die Menge I = {1,2, 3, 4} mit dem Index B : I -+ A mit

BEISPIEL

B1

= B(1) = {a, b, c}, B2 = B(2) = {a, h}, c, h}, B4 = B(4) = h}

B3 = B(3) =

Dann ist U Bi = u B2 U B3 U B4

iEI

= {a, b, c} U {a, b, h} U {a, c, h} U {a, h} = {a, b, c, h}

n Bi=Bl n

B2

n B3 n B4

iEI

= {a, b,

54

n

h} n {a, c, h} n {a, h} =

ABBILDUNGEN

A

Ähnlich wie für den Schnitt und die Vereinigung von Mengen erleichtern Indexmengen das Aufschreiben von Summen und Produkten mit vielen Summanden und Faktoren. Allerdings müssen wir dafür sorgen, dass Anmerkung. Wie man eine Summe mit unendlieh vielen Summanden berechnet, wird in der nur endlich viele Summanden und Faktoren addiert bzw. multipliziert Analysis, ein Teilgebiet der Mathematik, untersucht.

werden. DEFINITION 1.74. Sei f : A —› IR ein Index der reellen Zahlen IR über einer endlichen Menge A 0 0. Dann existiert ein bijektiver Index g : {1, , k} —> A von A über der Indexmenge {1, , k} c N. Wir definieren die Summe

> f(a) =

f(g(k))

f(g(0)) f(g(1))

aEA

und das Produkt

H

f(a) = f(g(0)) • f(g(1)) • • • f(g(k)).

aE A

Falls A die leere Menge ist, interpretieren wir die Summe als 0 und das Produkt als 1. BEMERKUNG 1.75. Ist

A = {kJ.,

, k2} c N, dann schreibt man auch

k2 E f (i) = f (ki) + f (ki + 1) + . + f (k2) ic2 f (i) = f (ki) • f (ki + 1) • • • f (k2). i= k 1 •

BEISPIEL 1.76. Wir betrachten ein Beispiel für die am häufigsten auftretende Situation, welche in Bemerkung 1.75 beschrieben wird. Es sei die Abbildung R mit f(x) = x2 gegeben, dann ist f :N 6

6

Ef(i) _ Ei2 i=3 6 i=3

6 1 f(i) = 1

32 + 42 1_ 52 + 62

-2 32 42 52 0

86

129600.

i=3

55

S• BEWEISE

1.5 Beweise

Was versteht man unter dem Beweis einer mathematischen Aussage A? Ein Beweis ist eine logisch nachvollziehbare Kette von Implikationen an deren Anfang Axiome - also Grundannahmen - und schon als wahr gezeigte Aussagen stehen und an deren Ende die Aussage A steht. Seien die Axiome und schon gezeigten Aussagen in der mathematischen Aussage 8 zusammengefasst sein. Ein Beweis zeigt also die Implikation Ci > A. Wenn Axiome das Fundament und mathematische Aussagen die Bausteine des großen Bauwerks der Mathematik sind, so sind Beweise der Mörtel zwischen den Steinen. Axiome sind per Definition oder besser Konvention, wahr. Jede weitere Aussage muss als eine logische Schlussfolgerung, als eine Folge von Implikationen als wahr bewiesen werden. Das bedarf Kreativität, die Fähigkeit abstrakte Objekte zu sehen, zu durchdenken und tiefer zu begreifen, Zusammenhänge aufzudecken. Beweisen zu lernen stellt viele Studenten zu Beginn ihrer Studien vor eine große Herausforderung. Es gibt zwei grundlegende Herausforderungen, das Nachvollziehen von Beweisen und das Führen von Beweisen. Zunächst erscheint jeder Beweis eine großes Kunstwerk zu sein, schleierhaft, wie ein Mensch solche verworrenen Gedankenstränge erdenken kann. Jede Aussage, ein völlig anderer Beweis. Und das macht ja durchaus Sinn, zwei unterschiedliche Aussagen erfordern unterschiedliche Beweisführungen. Doch bald entdeckt man, dass gewisse Muster, Tricks, Abkürzungen oder besser Methoden immer wieder auftauchen. Je schneller solche Kniffe erkannt werden, umso leichter fällt das Nachvollziehen von Beweisen. Man stellt fest, das logisches Denken eine Sprache ist, die man leichter spricht, je mehr man geübt hat. Das Nachvollziehen von Beweisen ist ein erster Schritt, Beweise zu führen ein notwendiger zweiter. Nur so wird man sich darüber klar, ob man die Richtigkeit einer mathematischen Aussage auch wirklich verstanden hat. Die Herausforderung besteht darin, sich zunächst selbst mit Bleistift und Notizzettel bewaffnet einen Weg logischer Implikationen von den Voraussetzungen zur zu beweisenden Aussage zu bahnen. Wie oft gerät man dabei auf Holzwege, bleibt stecken und sieht keinen Ausweg, bestreitet unnötige Umwege, weil eine Abkürzung nicht entdeckt wird. Nachdem man einen Weg, eine Folge von Implikationen gebahnt hat, steht eine weitere Herausforderung ins Haus. Der Beweis muss zu Papier gebracht 56

BEWEISE Ä

werden. Das hat zwei gute Gründe und ist keine Schikane. s. Beim Aufschreiben eines Beweises fällt auf, ob man vielleicht eine Implikation zu leichtfertig gezogen, einen Spezialfall vergessen, etwas schlicht übersehen hat und so eine Lücke im Beweis noch zu schließen ist. i. Außerdem sollte der Beweis für eine unbeteiligte Person nachvollziehbar sein. Wir sollten uns ganz grundsätzlich im Leben häufiger der Kritik anderer aussetzen. Das hilft uns selbst zu allererst. Es ist kaum müßig zu erwähnen, dass dieser zweite Grund voraussetzt, dass ein Beweis leserlich notiert wird. Alle Gedanken, die für die Implikation wichtig sind sollen erwähnt, alle Variablen definiert, jede leicht zu übersehende Schlussfolgerung schriftlich gezogen werden. Dabei helfen Regeln eines guten Stils. Diesen zu erwerben bedarf Übung. Dieses Buch führt viele Beweise auf, überspringen Sie diese nicht leichtfertig. Nur wer eine Sprache im Alltag spricht, beherrscht sie wirklich. Zusammenfassend setzt die Fähigkeit zu beweisen Kreativität und Fingerfertigkeit voraus. Letztere holen sie sich, indem Sie üben, üben und üben. Wir werden nun einige Kniffe kennenlernen, die in Beweisen häufig auftreten. Im Laufe der Lektüre dieses Buches können Sie gerne in diesen Abschnitt zurückblättern und sich diese Methoden erneut in Erinnerung rufen. Zum Schluss dieser einführenden Worte noch ein Hinweis an Informatiker, die sich vor Beweisen scheuen. Ein Informatiker ist häufig mit der Notwendigkeit von Beweisen konfrontiert. Selbst dann, wenn er nicht in der theoretischen Informatik tätig ist. In der Praxis stellt sich oft die Frage, ob ein Protokoll funktioniert, ein Algorithmus in erlebbarer Zeit selbst für leicht zu übersehende Spezialfälle die gewünschte Ausgabe liefert. Zudem werden praktische Probleme häufig in mathematische Modelle übersetzt. Dann profitieren Sie, als Informatiker, von der reichhaltigen mathematischen Theorie, die sich entfaltet und werden in den Genuss kommen, sichere Schlussfolgerungen für Ihre Implementierung zu ziehen, die sie ohne die Fähigkeit zu beweisen, mit großer Unsicherheit vage vermutet hätten.

57

k BEWEISE

1.5.1 Direkter und indirekter Beweis Wir nehmen an, eine mathematische Aussage A sei zu zeigen. Der direkte Beweis nimmt die in 13 zusammengefassten Axiome und schon als wahr bewiesenen Aussagen und stellt eine Kette von Implikationen auf, die A implizieren. Direkter Beweis. C2 BEISPIEL 1.77.

•.•

Crt =

A

Sei die mathematische Aussage

A = [Das Quadrat einer ungeraden natürlichen Zahl ist gerade.] zu beweisen. Es gilt für eine ungerade Zahl n E N, dass man sie schreiben kann n = 2 • k + 1 für eine natürliche Zahl k E N. Dann ist nach der 1. Binomischen Formel n2 = (2 • k + 1)2 = (2 • k)2 + 2•2 • k 12 = 2 • (2 • k2 1- 2 • k) + 1. Da k' = (2 • k2 + 2 • k) wieder eine natürliche Zahl k' also ist n2 eine ungerade Zahl.

e

N ist, gilt n2 = 2 • k' + 1,

Formal notiert lautet dieser Beweis 13 = [[n e N ist ungerade ] = [3k EN:n=2•k+ 1] ] = Cl [3k EN: n2 = (2 • k)2 + 4 • k 12]] = C2 [ [n E N ist ungerade ] [ [n E N ist ungerade ] [31e E N : n2 = 2 • k' + 1] ] = C3 [ [n E N ist ungerade ] [n2 ist ungerade ] = A.

Das logische Prinzip hinter dem Beweisprinzip des indirekten Beweises haben wir schon in Bemerkung 1.14 beobachtet. Um zu zeigen, dass 13 = A kann man auch zeigen, dass Indirekter Beweis. C1

C2 = • • • = en

[5 == A]

BEMERKUNG 1.78. In anderen Worten wird beim indirekten Beweis vorausgesetzt, setzt diese Aussage als dass 13 wahr ist. Dann negiert man die Aussage A zu wahr und schlussfolgert, dass die zu I3 negierte Aussage -'13 wahr ist - im Widerspruch zur Voraussetzung, dass 13 wahr ist. Also kann nicht wahr sein - also ist A wahr Aus diesem Grund wird ein indirekter Beweis auch als Widerspruchsbeweis bezeichnet. ■ BEISPIEL 1.79.

Sei die mathematische Aussage

A = [Es gibt keine bijektive Abbildung von D = {2, 3} in die Menge B = {O}]

58

BEWEISE

zu beweisen. Angenommen, es gibt eine bijektive Abbildung f zwischen D und B. Dann ist f insbesondere injektiv. Offensichtlich gilt f (2) = 0 und f (3) = 0 - ein Widerspruch, ■ dass f injektiv ist.

Beweis durch Kontrapositon

Das Beweisprinzip durch Kontraposition ist ein Spezialfall des indirekten Beweises, wenn die zu beweisende mathematische Aussage von der Form

= [Ai

> A2]

für zwei mathematische Aussagen Ai und A2 ist. Dann darf wiederum unter Verwendung von in 13 zusammengefassten Axiomen und schon als wahr bewiesenen Aussagen geschlussfolgert werden, dass --.A2 die Aussage impliziert. Beweis durch Kontraposition. HA2 A r3

= Cl = C2 = • • •

[Al = A2]

Die Verfeinerung zum indirekten Beweis besteht darin, dass der Widerspruch aus einer Implikation der negierten Aussage .A1 resultiert und nicht zu einer beliebigen Aussage in 13 besteht. BEISPIEL

1.80. Sei die mathematische Aussage

A=

E

N ist eine gerade Quadratzahl.]

[/ ist gerade.]

Die Kontraposition ist

—[/ ist gerade]

-,[n ist gerade Quadratzahl]

also

['h ist ungerade]

[n ist ungerade]

Sei also -A eine ungerade, natürliche Zahl. Dann gibt es ein k1 E N, so dass .177. = 2 • k1 + 1. Dann ist

n = (/)2 = (2k1 + 1)2 = 4k? + 4k + 1 = 2(2k? 2k1) + 1. Setze k2 = 2k? 2k1. Dann ist n = 2k2 + 1 also ungerade, was zu zeigen war.

59

A

5. BEWEISE

1.5.2 Beweis von Äquivalenzen

Möchte man eine mathematische Aussage der Form A = [Ai < >A2]

für zwei mathematische Aussagen Al und A2 beweisen, so hat man insgesamt zwei Implikationen zu zeigen. Nämlich Al = A2 und A2 > Ai. Wir sprechen dann von zwei Richtungen. Äquivalenzbeweis. [Ai

A2] A [Ä2

All

[Al « A21

Wenn eine Äquivalenz so bewiesen wird, kennzeichnet man die Teilbeweiund "-": . Man se der jeweiligen „Richtung" mit den Symbolen könnte diese Symbole lesen als „

>"

„Wir Zeigen: [Ai

> A2]".

„Wir Zeigen: [A2

>

Diese Symbole sind also Abkürzungen und nicht als mathematische Symbole zu deuten.

Der Ringschluss

Möchte man eine mathematische Aussage von der Form A = [Vi,jEN:1 A, >, wobei der Index bei n 1 auf 1 springt.

60

BEWEISE

A

Äquivalenzbeweis per Ringschluss. [.41

.Ari

Ai]

[Vi,jEN:1 „Wir Zeigen: [B C A]".

Diese Symbole sind also Abkürzungen und nicht als mathematische Symbole zu deuten. BEISPIEL 1.86. Wir beweisen exemplarisch die erste der beiden als Distributivgesetze bezeichneten Gleichungen in Lemma 1.1. Zu zeigen ist

(A n B) u C = (A u c)n (B u C) Wir zeigen, dass die rechte Menge in der linken und die linke in der rechten Menge enthalten ist. „c": Es sei x E (A n B) u C beliebig gewählt. Für x gilt dann: x E (A nB)uC [x E (A n B) v x eC] [(xcAnxes)vxeC] Es gibt nun zwei Fälle. Fall 1- x E C. Es gilt demnach x E A U C und x E B U C. Fall 2 - x e C. Es folgen aus (1.1) demnach sofort x E A und x E B. Damit gilt auchxEAUCundx EBUC. In beiden Fällen gilt also x E A U C und x E B U C und damit x E (A U C) n (B u C). Da x beliebig gewählt war, gilt also allgemein für alle x E (A n B) u C, dass x E (A n B) u C

=

x E (A u c)n (B u C).

Damit gilt nach der Definition von „c" also (A n B) U C c (A U C) n (B U C).

64

BEWEISE

„D": Es sei x E (A U C) n (B U C) beliebig gewählt. Für x gilt dann: x E (A u c) [x E (A U C) [(xEAVxEC)

n

(B u c)

A A

xE (B U C)] (xEBVxEC)]

(1.2)

Es gibt nun zwei Fälle. Fall 1 - x E C. Es folgt demnach x E (A n B) U C. Fall 2 - x C. Es folgen aus (1.2) demnach sofort x E A und x E B und damit sA, x E (A U C) n (B U C). In beiden Fällen gilt also x E (A n B) U C Da x beliebig gewählt war, gilt also allgemein für alle x E (A U C) n (B U C), dass x E (A n B) uC

=

xE (Au C)n (B u C).

Damit gilt nach der Definition von Teilmengen also (AnB)uC

(A U c)n(BuC).

■

1.5.4 Vollständige Induktion Die Beweismethode der vollständigen Induktion beruht auf dem Induktionsprinzip der natürlichen Zahlen, welches sich zur folgenden Aussage zusammenfassen lässt. Jede nicht-leere Menge natürlicher Zahlen enthält eine kleinste Zahl. Aus dieser Tatsache folgt das folgende Lemma. LEMMA 1.87 (Induktionsprinzip). Angenommen, eine Menge A C N hat die beiden folgenden Eigenschaften. i. 0 E A ii. Wenn 0, , n E A, dann gilt auch n + 1 E A.

Dann gilt A = N. Beweis. Angenommen, es ist A 0 N. Dann ist die Menge B = N \ A nicht leer. Folglich gibt es eine kleinste Zahl x E B. Aufgrund von i. ist x 0. Ferner gilt 0, , x — 1 E A, weil x ja die kleinste Zahl in B ist. Nach ii. • gilt also x E A, im Widerspruch zu unserer Annahme, dass x E B. Das Induktionsprinzip ermöglicht es uns, Aussagen der Form [Vn E N : A(n)] zu beweisen. Dabei geht man nach dem folgendem Schema vor. i. Zeige, dass die Behauptung für n = 0 stimmt.

65

A

ih. BEWEISE

ii. Weise ferner nach, dass die Behauptung für n 1 gilt, wenn sie für 0, , n gilt. Dann folgt die Behauptung für alle n E N. Vollständige Induktion Wir führen die Induktion über n.

Induktionsverankerung: Die Aussage A(0) ist wahr. Induktionsannahme: Wir nehmen an die Aussage .A(n) ist wahr für ein n E N. Induktionsschluss: Wir zeigen, dass dann die Aussage A(n + 1) wahr ist, also A(n)

A(n + 1) gilt.

BEMERKUNG 1.88. Es gibt unterschiedliche gebräuchliche Bezeichnungen der drei Schritte einer vollständigen Induktion. Die Induktionsverankerung wird auch als Induktionsanfang, der Induktionsschluss auch als Induktionsschritt bezeichnet. ■

Als Beispiel zeigen wir die „gaußsche Summenformel" (auch „kleiner Gauß" genannt). Im Verlauf des Buchs wird das Beweisprinzip der vollständigen Induktion noch häufig auftauchen. SATZ 1.89 (Kleiner Gauß). Die Summe der ersten n natürlichen Zahlen ist 1 +2±...±n=Ei -=

n(n + 1)

i=1

2

Beweis. Wir führen die Induktion über n. Induktionsverankerung: Im Fall n = 1 ist die rechte Seite 1(1 + 1) _ 2 was tatsächlich der Summe der ersten 1 vielen natürlichen Zahlen entspricht. Induktionsannahme: Wir nehmen als Induktionsvoraussetzung nun an, dass die Formel für n E N gilt, also dass

E n(n i=i

1) . 2

(1.3)

Induktionsschluss: Für den Induktionsschluss berechnen wir nun die

66

BEWEISE

A(

Summe der ersten n + 1 vielen natürlichen Zahlen n+1

Ei=(n+1)+Ei n(n + 1) [nach Induktionsannahme (1.3)] 2 2n + 2 + n2 + n (n + 1)((n + 1) + 1) 2 2

= (n + 1) +

wie behauptet.

■

1.5.5 Beweise - mehr als ein Weg führt nach Rom

In der Mathematik lassen sich Aussagen häufig auf unterschiedliche Weisen zeigen. Für den Satz des Pythagoras sind beispielsweise mehrere hundert verschiedene Beweise bekannt. Der Satz des Pythagoras ist damit übrigens der meist bewiesene mathematische Satz. Für das folgende Lemma ist ebenfalls mehr als ein Beweis bekannt. LEMMA 1.90. Sei A eine endliche Menge mit Kardinalität n. Die Potenzmenge P(A) von A hat Kardinalität 2'. Man kann die Menge aller Teilmengen, also die Potenzmenge, mit einer zweiten Menge in Eins-zu-eins-Relation bringt. Der Trick besteht darin, dass dabei jedem Element aus der Potenzmenge genau ein Element aus der zweiten Menge und tatsächlich jedem Element aus der zweiten Menge auch ein Element der Potenzmenge zugeordnet wird. Folglich enthalten beide Mengen genau gleich viele Elemente. Die zweite Menge stellt sich dann schlussendlich als leicht zu zählen heraus. Eine zweite Möglichkeit die Aussage zu zeigen, besteht in der Anwendung der vollständigen Induktion. Wir betrachten aus Übungszwecken beide Beweise. Beweis. [von Lemma 1.90 - Variante 1] Sei A eine Menge mit n Elementen. Sei W„, die Menge aller „Wörter" bestehend aus den Buchstaben i und d mit genau n Buchstaben. Es sei f eine bijektive Abbildung der Elemente in A in die Menge der natürlichen Zahlen 1 bis n. Diese Abbildung ordnet die Elemente in A. Für jedes a E A existiert also eine eindeutiges 1 < j < n, so dass f (a) = j. Sei g eine Abbildung die jedem B E P(A) das Wort w e W„ zuordnet, so 67

BEWEISE

dass für alle a E A gilt k der f (a)-te Buchstabe von w ist i, wenn a E B und s. der f (a)-te Buchstabe von w ist d, wenn a V B.

Diese Abbildung ist bijektiv. Surjektivität. Es ist zu zeigen, dass für jedes Wort w E 144, sich eine Menge B E P(A) finden lässt, so dass g(B) = w. Formal schreibt sich das als [VwEV14, B E P(A) : g(B) = to]. Sei Q die Menge der Positionen von w, an welchen ein i steht. Sei B = f (Q). Es ist nun der f (a)-te Buchstabe von w ein i, wenn a E B und ein d, wenn a V B. Demnach wird B von g auf w abgebildet. Injektivität. Es ist zu zeigen, dass es keine zwei verschiedenen Mengen B, B' E P(A) mit g(B) = g(B') gibt. Formal schreibt sich das als B' E P(A) : [B B' A g(B) = g(B')]]. Angenommen, es gibt zwei verschiedene Mengen B, B' E P(A), so dass g(B) = g(B'). Dann gibt es ohne Beschränkung der Allgemeinheit ein Element a E B, dass nicht in B' enthalten ist (sonst wäre B eine Teilmenge von B' - aber beide Mengen sind verschieden und somit gäbe es dann ein Element a E B', dass nicht in B enthalten ist - Umbenennung der Mengen liefert die Behauptung). Dann ist aber der f (a)-te Buchstabe von g(B) ein i und der f (a)-te Buchstabe von g(B') ein d und somit ist g(B) g(B') - ein Widerspruch zu unserer Annahme. Wie wir schon bemerkten, haben zwei endliche Mengen genau dann die gleiche Kardinalität, wenn es eine bijektive Abbildung zwischen ihnen gibt. Wir müssen also nur noch zählen, wie viele Wörter es mit den zwei Buchstaben d und i der Länge n gibt. Für jede der n Positionen gibt es zwei Möglichkeiten. Entweder steht dort ein i oder ein d. Insgesamt gibt es also 2' unterschiedliche Wörter und somit hat die Potenzmenge einer 111 endlichen Menge mit Kardinalität n selbst Kardinalität 2'. Beweis. [von Lemma 1.90 - Variante 2] Wir führen die Induktion über n. Induktionsverankerung: Im Fall n = 1 ist die Aussage einfach zu prüfen. Die Potenzmenge besteht in diesem Fall aus den beiden Mengen 0 und A selbst. Induktionsannahme: Wir nehmen als Induktionsvoraussetzung an, dass

68

RELATIONEN

A

die Potenzmenge einer Menge mit n Elementen Kardinalität 2' habe. Induktionsschluss: Für den Induktionsschluss nehmen wir an A habe n 1 Elemente. Nun zeichnen wir ein Element a E A aus und betrachten die Menge A' = A \ {a}. Es gilt IA'1 = n. Nach Induktionsvoraussetzung ist IP(A')I = 2n. Wir beobachten, dass jede Teilmenge B von A entweder eine Teilmenge von A' ist oder das Element a enthält (in diesem Fall ist aber B \ {a} eine Teilmenge von A' ) . Also können wir jeder Teilmenge B c A genau eine Teilmenge von A' zuordnen, nämlich B \ {a}. Dabei wird jede Teilmenge von A' genau zwei Teilmengen von A zugeordnet. Es gibt also zweimal so viele Mengen in P(A) als in P(A'). Demnach ist IP(A)I = IP(A')I • 2 = 2n • 2 = was zu zeigen war.

■

1 .6 Relationen Ähnlich wie Abbildungen, sind Relationen ein universell einsetzbares Werkzeug. Dabei werden Objekte, die zwar nicht identisch sind, aber dennoch in Bezug zueinander stehen, einander zugeordnet. Der mathematische Begriff der Relation greift dieses „in (einem bestimmten) Bezug zueinander stehen" auf. Er gibt für zwei Objekte entweder die Antwort „Ja, die beiden Objekte stehen in (diesem bestimmten) Bezug zueinander" oder „Nein, die Objekte stehen nicht in (diesem bestimmten) Bezug zueinander". Man könnte zum Beispiel bei einer Menge von Gegenständen den Bezug „hat die gleiche Farbe" herstellen. Dann stehen alle Gegenstände in diesem Bezug zueinander oder man sagt auch in Relation zueinander, wenn sie die gleiche Farbe haben. Mathematisch formal sauber ist eine Relation eine Sammlung von Paaren, die in Bezug zueinander stehen. DEFINITION 1.91. Eine (binäre) Relation zwischen zwei Mengen A und

B ist eine Teilmenge R c A x B. Im Falle A = B spricht man von einer Relation auf A. Eine Relation zwischen A und B ist also eine Teilmenge aller Tupel der

69

RELATIONEN

Form (a, b) mit a E A und b E B. Ist ein Tupel (a, b) in einer Relation R enthalten, dann steht das Element a aus der Menge A und das Element b aus der Menge B in der Relation R zueinander. Wir veranschaulichen den Begriff der Relation an den folgenden sehr unterschiedlichen Beispielen. B EISPIEL 1.92. Der Operator >, in Worten „größer als", erzeugt eine Relation auf der Menge der natürlichen Zahlen N. Es ist

R={(a,b)ENxN:a>b} = {(1,0), (2,0), (2, 1), (3,0), (3,1), (3,2), (4, 0), ...} ■ BEISPIEL 1.93. Die Relation =-, in Worten „ist gleich", erzeugt ebenfalls eine Relation auf der Menge der natürlichen Zahlen N. Es ist

R = {(a,b) ENxN:a= b} = 1(0, 0), (1,1), (2, 2), ...} ■

BEISPIEL 1.94. Jede Abbildung ist eine Relation. Sie bringt Urbilder und Bilder in Relation zueinander. Die Tupel, bestehend je aus einem Element aus dem Definitionsbereich x E D und seinem Bild f(x) einer Abbildung f : D B, bilden eine Relation zwischen den Mengen D und B. Es ist dann R = {(x,y) EDxB:y= f(x)}. Betrachten wir dazu die Abbildung f : D B aus Beispiel 1.52 zwischen den Mengen D = {0, 2 1} und B = {3, 7, 9,10} mit 0

1 f(0) = 9, — 2

1 f (-2 ) = 8, 1

f(1) = 3

Dann ist die zugehörige Relation schlicht R = {(x, y) EDxB:y=f(x)}

G, 8 1 ,(1, 3) ■

BEISPIEL 1.95. Ein auf den ersten Blick ungewöhnliches aber dennoch sehr einleuchtendes Beispiel bildet der Begriff „verwandt sein mit", im Englischen related to. Er beschreibt eine Relation auf der Menge aller Menschen. ■

Ähnlich wie Abbildungen die grundlegenden Eigenschaften Injektivität, Surjektivität und Bijektivität haben, können Relationen reflexiv, symmetrisch und transitiv sein. Was wir darunter verstehen erklärt die folgende Definition.

70

RELATIONEN

DEFINITION 1.96. Eine Relation auf einer Menge A heißt ...

S.

... reflexiv,

wenn für alle a E A gilt (a, a) e R.

•

. . symmetrisch,

wenn für alle a, b E A gilt (a, b) E R

s.

... transitiv,

(b, a) E R.

wenn für alle a, b, c E A gilt (a, b) E R und (b, c) E R z (a, c) E R.

Wir betrachten direkt einige Beispiel, die wir auf Reflexivität, Symmetrie und Transitivität hin untersuchen.

1.97. Die durch den Operator > induzierte Relation auf den natürlichen Zahlen aus Beispiel 1.92 ist transitiv, aber nicht reflexiv oder symmetrisch.

BEISPIEL

Reflexivität. Es gilt sicherlich für keine natürliche Zahl n E N, dass n > n ist. Es reicht allerdings dies nur für ein Element, beispielsweise die 7 E N, zu zeigen. Es gilt nicht 7 > 7. Symmetrie. Gilt für zwei natürliche Zahlen ni, n2 E N, dass ni > n2 ist, dann sicherlich nicht n2 > n1. Auch hier reicht es schon für zwei Elemente, zum Beispiel 7 und 9 E N zu zeigen, dass aus 9 > 7 nicht 7 > 9 folgt. Transitivität. Gilt für drei natürliche Zahlen ni, n2, n3 E N, dass ni > n2 und n2 > n3 ist, dann auch ni > n3. Zum Beispiel ist 9 > 7 und 7 > 5, also auch 9 > 5. Hier ist es dann wichtig, dies für jede mögliche Auswahl von drei natürlichen Zahlen zu zeigen. ■

durch den Operator = induzierte Relation auf den natürlichen Zahlen aus Beispiel 1.93 ist reflexiv, symmetrisch und transitiv.

BEISPIEL 1.98. Die

Reflexivität. Es gilt sicherlich für jede natürliche Zahl n E N, dass n = n ist. .v4 Symmetrie. Gilt für zwei natürliche Zahlen ni, n2 E N, dass wenn ni = n2 ist, dann sicherlich auch n2 = nl . Transitivität. Gilt für drei natürliche Zahlen ni, n2, n3 E N, dass ni = n2 und n2 = n3 ist, dann auch ni = n3. ■ BEISPIEL 1.99. Die Teilbarkeitsrelation R = {(a, b) EN xN:a teilt b} auf der Menge der natürlichen Zahlen ist reflexiv und transitiv, aber nicht symmetrisch.

Reflexivität. Jede natürliche Zahl teilt sich selbst. Symmetrie. Gilt für zwei natürliche Zahlen ni, n2 E N, dass wenn ni die Zahl

71

A(

k RELATIONEN n2 teilt, dann muss n2 nicht zwangsläufig nj teilen. Zum Beispiel teilt die 3 die 9, aber 9 ist kein Teiler von 3. Transitivität. Gilt für drei natürliche Zahlen n1, n2, n3 E N, dass n1 die Zahl nz teilt und n2 die Zahl n3 teilt, dann teilt ni auch n3.

■ BEMERKUNG 1.100. Für eine endliche Menge A kann man Relationen auf A durch einen gerichteten Graphen illustrieren. Von einem Element a E A führt genau dann eine gerichtete Kante zu einem Element b E A, wenn (a, b) E R ist. Der gerichtete Graph in Abbildung 1.12 zeigt den Graphen zur Teilbarkeitsrelation auf {1, ... 8}. Konkret ist R = {(a, b) E {1, . Abb. 1.12. Die Relation aus Bemerkung 1.100 als gerichteter Graph.

8} x{1:, ...,8} a teilt b1

die dargestellte Relation.

■

1.6.1 Äquivalenzrelationen Das Ziel bei der Verwendung von Äquivalenzrelationen ist, den Begriff „gleich" (im Sinne von identisch) zu verallgemeinern auf „ähnlich" bzw. „gleich bezüglich einer Eigenschaft". Wir haben eingangs schon erwähnt, dass man unterschiedliche Gegenstände in Bezug auf ihre Farbe vergleichen kann. Bei diesem Unterfangen helfen uns die drei schon kennengelernten Eigenschaften von Relationen. Um den Begriff „gleich" auf „ähnlich" zu verallgemeinern, müssen wir nämlich sicherstellen, dass für die Verallgemeinerung weiter gilt, dass ... s. ... ein Gegenstand stets zu sich selbst ähnlich ist. (Reflexivität) 1. ... wenn a zu b ähnlich ist, dann auch b zu a. (Symmetrie) 11. ... wenn a ähnlich ist zu b und dies wiederum ähnlich ist zu c, so ist auch a ähnlich zu c. (Transitivität) DEFINITION 1.101. Eine Relation heißt Äquivalenzrelation, wenn sie reflexiv, symmetrisch und transitiv ist. Anmerkung. Die folgenden Argumente klingen sehr einfach, sind sie auch. Aber ohne sie geht's leider nicht. Sie sind ein sanfter Einstieg, für andere Relationen sind die Argumente anspruchsvoller. Da hilft der Rückblick auf diese leichten Argumente, um das Wesentliche der Beweise nicht aus den Augen zu verlieren.

Wir schauen uns einige Beispiele von Relationen an. BEISPIEL 1.102. Es sei A die Menge aller Schüler einer Schule. Wir definieren die Relation R = {(a, b) EAxA:a ist in derselben Schulklasse wie b}. Die Relation R ist eine Äquivalenzrelation. Reflexivität. Natürlich ist jeder Schüler a e A ein Schüler seiner (eigenen) Schulklasse, es gilt also (a, a) E R.

72

RELATIONEN

Symmetrie. Ist (a, b) E R, dann ist der Schüler a in derselben Schulklasse wie Schüler b. Dann gilt auch umgekehrt, dass der Schüler b in der gleichen Schulklasse wir wie Schüler a ist. Also ist auch (b, a) E R. Transitivität. Dass (a, b) E R und (b, c) E R ist, bedeutet, dass der Schüler a in derselben Schulklasse wie Schüler b und der Schüler b in derselben Schulklasse wie der Schüler c ist. Dann ist aber auch der Schüler a in derselben Schulklasse wk wie der Schüler c. Also ist auch (a, c) E R. ■

BEISPIEL 1.103. Es sei die Relation R = {(n, m) ENxN:m hat denselben Rest beim Teilen durch 2 wie n} auf den natürlichen Zahlen definiert. Die Relation R ist eine Äquivalenzrelation Reflexivität. Jede Zahl n E N hat natürlich denselben Rest beim Teilen durch 2 wie sie selbst. Es gilt also (n, n) E R. Symmetrie. Ist (n, m) E R, so hat m denselben Rest beim Teilen durch 2 wie n. Also ist auch (m, n) E R, denn n hat denselben Rest beim Teilen durch 2 wie m. Transitivität. Wenn (71, k) E R und (k, m) E R gelten, dann gilt beim Teilen durch 2, dass k denselben Rest wie n und m denselben Rest wie k hat. Das wiederum wl bedeutet, dass m denselben Rest wie n beim Teilen durch 2 hat. Ähnlich wie die Äquivalenzrelation aus Beispiel 1.102, wird die zugrundeliegende Menge in „Klassen" eingeteilt. In diesem Beispiel sind es die beiden Mengen der ■ geraden und der ungeraden natürlichen Zahlen. BEMERKUNG 1.104. Es sei A = 0 und R c A x A. Dann ist R = 0, weil A x A = 0 x 0 = 0. Wir zeigen nun, dass R eine Äquivalenzrelation ist.

Reflexivität. Wegen A = 0 gibt es kein a E A. Also gibt es insbesondere kein a E A, so dass (a, a) R. Kein a E A verletzt die Reflexivität von R, also ist R 41. reflexiv. Symmetrie. Wegen R = 0 gibt es kein Tupel (a, b) E R. Also gibt es insbesondere kein Tupel (a, b) E R, so dass (b, a) e R. Kein Tupel (a, b) E R verletzt also die 41, Symmetrie von R, also ist R symmetrisch. Transitivität. Wegen R = 0 gibt es kein Tupel (a, b) E R. Also gibt es insbesondere kein Tupel (a, b) E R, so dass es ein weiteres Tupel (b, c) E R gibt. Also gibt es kein Tupel (a, b) für das zwar (b, c) E IR gilt, aber nicht (a, c) E R. Kein Tupel (a, b) E R verletzt also die Transitivität von R, also ist R transitiv. ■

Wir betrachten noch eine Relation, die keine Äquivalenzrelation ist. BEISPIEL 1.105. Die Relation R = {(n, m) ENxN:n< m} ist nicht symmetrisch und deswegen keine Äquivalenzrelation. Es gilt zwar (1, 2) E R wegen 1 < 2 aber es gilt nicht (2, 1) E R, weil 2 g 1. Man kann zeigen, dass die Relation ■ R zwar reflexiv und transitiv ist, aber sie ist sicherlich nicht symmetrisch.

73

RELATIONEN

BEMERKUNG 1.106. An Beispiel 1.105 sieht man, dass es reicht zu zeigen, dass eine der drei benötigten Eigenschaften nicht gilt, um zu zeigen, dass eine Relation keine Äquivalenzrelation ist. Um wiederum zu zeigen, dass eine Relation zum Beispiel nicht symmetrisch ist, genügt ein einziges Gegenbeispiel. ■

Die Äquivalenzrelation verallgemeinert also die vertraute Gleichheitsrelation des Operators „=". Wir führen nun ein Symbol ein, welches anzeigt, dass zwei Elemente a und b einer Menge A in Relation bezüglich einer Äquivalenzrelation R über A stehen. Es sei R eine Äquivalenzrelation auf einer Menge R schreibt man kurz a ^,Ft b und sagt dann a und b sind äquivalent bezüglich R. DEFINITION 1.107.

A. Für (a, b)

E

BEMERKUNG 1.108. Wenn zu vereinfacht.

klar ist, welche Relation gemeint ist, wird das Symbol •

BEISPIEL 1.109. Bezüglich der Äquivalenzrelation R auf den natürlichen Zahlen aus Beispiel 1.103 können wir schreiben 2 ^,R 4 und 2 ^ R 18 oder auch 3 ,-, Ft 27. •

Äquivalenzklassen

Die bislang betrachteten Beispiele für Äquivalenzrelationen legen die Vermutung nahe, dass Äquivalenzrelationen auf einer Menge A die zugrundeliegende Menge A in „Klassen" von äquivalenten Elementen einteilt. Das ist tatsächlich der Fall. Um das einzusehen, geben wir zunächst der Menge aller äquivalenten Elemente zu einem festen Element a aus A einen Namen. DEFINITION 1.110. Es sei R eine Äquivalenzrelation auf einer Menge A. Für jedes Element a E A ist die Äquivalenzklasse [a]rt = {b E A : (a, b) E die Menge der zu a äquivalenten Elemente aus A. BEISPIEL 1.111. Wir betrachten die Äquivalenzrelationen aus Beispiel 1.102. Es ist also A die Menge aller Schüler einer Schule und

R = {(a, b) E A x A:a ist in derselben Schulklasse wie Für jeden Schüler a bilden die Mitschüler seiner Schulklasse seine Äquivalenzklasse. [a]ii =- {b E A : (a,b)ER} = {b E A : b ist in derselben Schulklasse wie a} = {alle Schüler in der Schulkasse von a}

74

RELATIONEN

Gilt (a, b) E R, dann sind a und b in derselben (Schul-)Klasse (z.B. „5G") und es gilt [a] R = [a]R = {alle Schüler in der Schulklasse von a} = {alle Schüler der 5G } [b]R = {alle Schüler in der Schulklasse von b} = {alle Schüler der 5G }. ■ BEISPIEL 1.112. Wir betrachten ebenfalls die Äquivalenzrelationen auf den natürlichen Zahlen aus Beispiel 1.103

R = {(n, m) E N x N : m hat denselben Rest beim Teilen durch 2 wie n} Die Äquivalenzklassen der Zahlen 7 und 8 seien beispielhaft bestimmt. k Die Zahl 7 hat den Rest 1 beim Teilen durch 2, es gilt also [7]R = {m E N : (7, m) E R} = {m E N : m hat selben Rest beim Teilen durch 2 wie 7} = {m E N : m hat Rest 1 beim Teilen durch 2} = {alle ungeraden Zahlen} Analog gilt [3] R = {alle ungeraden Zahlen} [5] R = {alle ungeraden Zahlen}

} Die Zahl 8 hat den Rest 0 beim Teilen durch 2, es gilt also [8]R = {m E N : (8,m) E R} = {m E N : m hat selben Rest beim Teilen durch 2 wie 8} = {m E N : m hat Rest 0 beim Teilen durch 2} = {alle geraden Zahlen} Analog gilt [0] R = { alle ungeraden Zahlen} [2] R = {alle ungeraden Zahlen}

■

Anhand der Beispiele erkennt man, dass zwei Äquivalenzklassen entweder „grundverschieden" (leerer Schnitt) oder aber identisch sind. Dies ist einleuchtend, denn die Äquivalenzklasse [a] R besteht aus allen Elementen, die zu a äquivalent sind, das meint gleich sind bezüglich der Eigenschaft, die R definiert. Ist man beispielsweise auf der Suche nach allen Gegenständen, welche die gleiche Farbe wie ein Gegenstand a haben und wählt sich unter diesen einen Gegenständen b aus, dann findet man bei der Suche nach allen Gegenstände, welche die gleiche Farbe wie Gegenstand b haben, dieselben Gegenstände. Umgekehrt, wählt man einen

75

Ä

RELATIONEN

Gegenstand c, der nicht die gleiche Farbe wie Gegenstand a hat, wird die Suche nach allen Gegenständen, welche die gleiche Farbe wie Gegenstand c haben, nicht einen einzigen Gegenstand finden, der die gleiche Farbe wie Gegenstand a hat. In der formalen Sprache der Realtion übersetzt sich diese Einsicht zu der Aussage, dass zwei Elemente aus A bezüglich einer Äquivalenzrelation R auf A genau dann dieselbe Äquivalenzklasse haben, wenn sie bezüglich R äquivalent sind. Sind sie nicht äquivalent, dann sind ihre Äquivalenzklassen disjunkt. LEMMA 1.113. Es sei R eine Äquivalenzrelation über einer Menge A. Für zwei Elemente a, b E A ist genau dann [a] R = [b]R, wenn a b. Ist a 9t R b, so gilt [(J]ll n [b]./i = 0.

Beweis. Es ist zunächst zu zeigen, dass für je zwei Elemente a, b E A genau dann [a] R = [b]R ist, wenn a ^,R b. Wir zeigen die beiden Richtungen dieser Äquivalenz. Sei [a] R = [b]R für zwei Elemente a, b E A. Aufgrund der Reflexivität von R ist (b, b) E R und somit b E [b]R. Da [a]r? = [b] Ft ist, gilt auch b E [a] R. Also ist (a, b) E R und somit a ", ft b. Es gelte a ^,R b für zwei Elemente a, b E A. Um die Mengengleichheit [a] Ft = [b] R zu zeigen, zeigen wir die beiden Inklusionen [a] R C [b] R und [a]R 3 [NI?. ,,C" Sei x E [a] R beliebig gewählt. Dann ist (a, x) E R. Da a "-'R b ist auch (a, b) E R: Da R eine Äquivalenzrelation ist, gilt (a, b), (a, x) E R (b, a), (a, x) E R = (b, x) E R, also ist x E [b] R. Da x beliebig aus [c]R gewählt war, gilt [a] R C [MR. „3" Diese Richtung zeigt man analog zu „C".

Es ist demnach [a] R = R. Bleibt zu zeigen, dass für zwei Elemente a, b E A mit a SR b stets [a]R n = 0 gilt. Angenommen es gibt zwei Elemente a, b E A mit a $R b, so dass [a] R n [b]R 0. Dann gibt es ein Element x E A mit (a, x) E R und (b, x) E R. Dann ist aber aufgrund der Symmetrie von R auch (x, b) E R und aufgrund der Transitivität von R gilt dann auch (a, b) E R. Also gilt dann a b - ein Widerspruch. Daher gilt [a] R n [b]Ft = Aus Lemma 1.113 schließen wir, dass es genügt, ein einziges Element einer

76

RELATIONEN

Äquivalenzklasse zu kennen, um die Äquivalenzklasse zu rekonstruieren. DEFINITION 1.114. Es sei M C A eine Äquivalenzklasse einer Äquivalenzrelation R auf einer Menge A. Ein Element x E M heißt Vertreter der Äquivalenzklasse M, denn es gilt [x]R = M. BEMERKUNG 1.115. Es ist wichtig darauf hinzuweisen, dass jedes Element einer Äquivalenklasse Vertreter dieser ist. Es gibt kein Element in einer Äquivalenklasse, dass „gleicher" als die übrigen Elemente ist oder die Äquivalenzklasse besser oder ■ eindeutiger vertritt.

Wir betrachten erneut die Äquivalenzrelation aus Beispiel 1.102. Es ist also A die Menge aller Schüler einer Schule und

BEISPIEL 1.116.

R = {(a, b) E A x A:a ist in derselben Schulklasse wie b}. Es sei nun Josua ein Schüler der Schulklasse 5G. Alle Mitschüler aus der Schulklasse von Josua bilden die Äquivalenzklasse von Josua [Josua]R = {b E A : (Josua, b) E R} = {b E A : b ist in derselben Schulklasse wie Josua} = {alle Schüler der 5G}. Jeder Schüler und jede Schülerin aus der 5G ist ein Vertreter seiner (Schul-)Klasse, denn anhand des einzelnen Schülers kann man natürlich die ganze Klasse ermitteln. Ist Gideon auch in der 5G, also sind Josua und Gideon in derselben (Schul-)Klasse 5G, so gilt [Josua]R = [Gideon]R, denn [Gideon]R

= {alle Schüler in der Schulklasse von Gideon} = {alle Schüler der 5G} =- [Josua] R

■ BEISPIEL 1.117. Wir betrachten ebenfalls erneut die Äquivalenzrelationen auf den natürlichen Zahlen aus Beispiel 1.103

R = f(n, m) ENxN:m hat denselben Rest beim Teilen durch 2 wie n} Die beiden Äquivalenzklassen von R sind und : n E N} (alle geraden Zahlen) Mg = {2n MM = {2n + 1 : n E N} (alle ungeraden Zahlen). Ein Vertreter von Mg ist x = 6 E Mg und es gilt tatsächlich [6]R = Mg.

■

77

AUFGABEN

1.7 Aufgaben

MATHEMATISCHE AUSSAGENLOGIK. A

1.1 Welche der folgenden Aussagen ist korrekt?

symbolischer Notation. ii. Negieren Sie die erhaltenen Aussagen in symbolischer Notation und vereinfachen Sie diese soweit Ihnen ersichtlich.

i. Es gibt mathematische Aussagen, die gleichzei- wrk 1.8 Gegeben seien die Aussagen A = [Vn E N : tig wahr und falsch sind. 3m E N n2 = m + 32]. Negieren Sie diese Aussage ii. Negiert man eine Aussage mit dem Allquantor und vereinfachen Sie diese soweit Ihnen ersichtlich. V tritt der Existenzquantor 3 an seine Stelle. 1.9 Ist die folgende Aussage wahr? iii. Impliziert eine Aussage A eine Aussage 13, so impliziert die Aussage 13 auch die Aussage A. [x E R : x2 = —2x — 1] [x E 11k : (x + 1)2 = 0] iv. Sind zwei Aussagen A und 13 äquivalent, dann sind auch die jeweils negierten Aussagen und äquivalent. MENGEN.

1.2 Welche der Aussagen "a2 b2,7, "a2 b2 (a b)2" und "18 ist durch 4 teilbar" ist eine mathematische Aussage. WI 1.3 Nennen Sie die Bausteine mathematischer Aus-

sagen, die wir kennen gelernt haben. wir 1.4 Negieren Sie die Aussage [A < > wir 1.5 Gegeben sei die Aussage A= [n,mEN:n+m=7]. Negieren Sie dies Aussage, also bilden sie —.A. Finden Sie dann alle Belegungen von n und m, so dass ... A wahr ist. —.A wahr ist. wrl' 1.6 Negieren Sie die Konjunktion und Disjunktion der beiden Aussagen [n, m E N : n + m > 7] und [n,mEN:n+m< 13]. Beachten Sie bei den folgenden Aufgaben, dass nicht danach gefragt wird, ob die genannten Aussagen wahr oder falsch sind.

A 1.10 Welche der folgenden Aussagen ist korrekt?

i. Die Vereinigung zweier Mengen A und B hat stets eine größere Kardinalität als jeweils die Mengen A und B. ii. Jede nicht-leere Menge hat mindestens zwei Teilmengen. iii. Jede nicht-leere Menge A hat mindestens zwei Teilmengen, deren Vereinigung eine größerer Kardinalität hat als A. iv. Jede nicht-leer Menge A hat mindestens zwei Teilmengen, deren Summe ihrer Kardinalitäten größer als die Kardinalität von A ist. wir 1.11 Es seinen A und B zwei Mengen. Zu welcher aus A und B gewonnenen Menge korrespondiert das jeweilige Venn-Diagramm?

01) wrir 1.12 Es seien die drei Mengen A = {3, 5, 7, 8, 10} B = {1, 2, 3, 6, 7} C = {3, 8}

4.4"

1.7 Gegeben seien die Aussagen `Jede natürliche Zahl ist von der Form n = k — 2 mit einer natürlichen Zahl k" und "Es gibt eine natürliche Zahl n, so dass für jede natürliche Zahl k das Ergebnis von n k die Zahl 5 ist.". i. Formulieren Sie diese sprachlichen Aussagen in

78

gegeben. a) Gilt A -= B, A = C oder B = C? b) Ist C eine Teilmenge von A oder B? Ist B eine Teilmenge von A?

AUFGABEN

Ä

a) ... rationale aber keine ganze Zahl ist? c) Geben Sie die Vereinigung der Mengen A und b) ... reelle aber keine rationale Zahl ist? C an. c) ... ganze aber keine reelle Zahl ist? d) Geben Sie den Schnitt der Mengen A und B an. an. B \ A Differenz die Sie e) Geben wyl 1.24 Zeigen Sie, dass -V-2. keine rationale Zahl ist. f) Geben Sie die symmetrische Differenz von A und B. g) Geben Sie drei unterschiedliche Partitionen von ABBILDUNGEN. A an. A 1.25 Welche der folgenden Aussagen ist korrekt? wri' 1.13 Erörtern Sie den Unterschied zwischen einer Seien dazu die Mengen D, B und die Abbildung f : Menge, einer Multimenge und einem Tupel. D —> B gegeben. b} und B = 1.14 Es seien die Mengen A = i. Für jedes Element des Definitionsbereichs x E {x, y, z} gegeben. Geben Sie das kartesische Produkt D gibt es eine Element des Bildbereichs y E B, von A und B und die Potenzmenge von B an. so dass f (x) = y ist. r.1' 1.15 Es seinen A und B zwei endliche Mengen. ii. Für jedes Element des Definitionsbereichs x E Welche der beiden folgenden Mengen hat die größte D gibt es eine Element des Bildbereichs y E B, Kardinalität? (Das kann auch in einer Fallunterscheiso dass f (x) = y ist. dung von der Beschaffenheit von A und B abhängen.) iii. Sei D' eine Teilmenge von D. Es gibt eine Restriktion von f auf D'. a) A n B oder B U A? Die Abbildung f ist injektiv, wenn jedes Element iv. b) A B oder B A? y E B ein Urbild besitzt. c) A\ B oder B A? Die Abbildung f ist surjektiv, wenn je zwei verv. d) P(A) oder A x B? schiedenen Elemente des Definitionsbereichs uner' 1.16 Lassen Sie sich die aus den Mengen A, B terschiedliche Bilder haben. und C gewonnenen Mengen aus Beispiel 1.30 mit den vi. Es gibt Abbildungen, die surjektiv aber nicht entsprechenden Sage-Befehlen ausgeben. injektiv sind. gibt Abbildungen, die injektiv aber nicht surEs vii. B und A Mengen zwei für wir 1.17 Zeigen Sie, dass sind. jektiv genau dann A n B # 0 ist, wenn es eine Menge C gibt, Abbildungen, die weder surjektiv noch gibt Es viii. ist. die Teilmenge sowohl von A als auch von B injektiv sind. wr./ 1.18 Zeigen Sie, dass für Mengen A und B stets ix. Es gibt Abbildungen, die bijektiv aber nicht surgilt, dass AnB=B .;=> B c A. jektiv sind. Es gibt Abbildungen, die bijektiv aber nicht inx. '.4 1.19 Zeigen Sie, dass für Mengen A, B und C stets sind. jektiv \C). (B n C) gilt, dass (A n B)\C = (A xi. Jede Abbildung besitzt eine Umkehrabbildung. 1.20 Zeigen Sie, dass für Mengen A und B stets 4Jr 1.26 Es seien die Mengen D = {1, 4, 6, 8, 10, 12} gilt, dass A\ B = A\ (B n A). und B = {3, 4, 5} gegeben. Dann gibt es eine Abbil1.21 Zeigen Sie, dass für Mengen A und B stets dung f : D —> B mit gilt, dass P(A n B) = P(A) n P(B). 11—> f (1) = 3, 4 1-> f (4) = 4, 61—> f (6) = 4, f (10) = 4, 121—> f (12) = 5. 81—> f (8) = 5, 10 ZAHLEN. A 1.22 Welche der folgenden Aussagen ist korrekt?

i. Die Zahl 34 ist eine reelle Zahl. 1. ist eine rationale Zahl. ii. Die Zahl 34 ).- 1.23 Können Sie eine Zahl finden, die zwar eine...

a) Wie sieht die Menge f —1(4) aus. b) Wie sieht die Menge f —1({4, 5}) aus. c) Sei D' = {1, 6, 10} c D. Geben Sie die Restriktion f I D, von f auf die Menge D' an. R eine Abbildung mit wir 1.27 Es sei f : R x 1—> x2 + 3x. Ist die Abbildung f injektiv, surjektiv

79

AUFGABEN

und/oder bijektiv?

diger Induktion

1.28 Es sei f : R>0 mit x 1-4 x2 eine Abbildung. Ist die Abbildung f surjektiv, injektiv und/oder bijektiv?

2

(:) = k=1

n 2 k)

für alle n E N.

.0r 1.29 Es sei f : R \ {0} R mit x H eine Abbil- 0.1* 1.38 Beweisen Sie die folgende Aussage per volldung. Ist die Abbildung f surjektiv, injektiv und/oder ständiger Induktion. bijektiv? = n(n + 1)(2n + 1) für alle n E N. 6 .0•4 1.30 Es seien A und B endliche Mengen. Zeik=1 gen Sie, dass genau dann eine bijektive Abbildung vri' 1.39 Zeigen Sie, dass eine endliche nicht-leere f :A B existiert, wenn IA1 = IB1 ist. Menge genauso viele Teilmengen mit einer geraden v,/' 1.31 Seien mit X und Y zwei nicht-leere Mengen Kardinalität wie Teilmengen mit einer ungeraden Karund zwei Abbildungen f : X Y und g : Y X dinalität hat. gegeben mit g o f = idx . Zeigen Sie, dass f injektiv und g surjektiv ist.

Ek2

vIr 1.32 Es seien A und B endliche Mengen. Zeigen Sie, dass eine injektive Abbildung f : A —* B genau dann surjektiv ist, wenn IA! = 1BI ist.

wt.' 1.33 Beweisen Sie Lemma 1.68, also dass für eine bijektive Abbildung f : D B gilt f

f

=

f

-1

f

= id p.

BEWEISE.

A 1.34 Welche der folgenden Aussagen ist korrekt?

RELATIONEN.

A 1.40 Welche der folgenden Aussagen ist korrekt? i. Eine Relation auf einer Menge M ist eine Teilmenge des kartesischen Produkts M x M. ii. Eine Reflexive Relation auf einer Menge M besitzt eine Umkehrabbildung. iii. Die durch den Operator < - in Worten „Weiner als" - auf den ganzen Zahlen ist eine Relation. iv. Die 2 Kanten auch als kelementige Teilmengen von V definieren. Solche sogenannten Hyperkanten sind also beliebig große Teilmengen der Knotenmenge V. Ein Graph, der Hyperkanten besitzt, wird als Hypergraph bezeichnet. ■ 4

Wir möchten nun zwei Möglichkeiten kennen lernen, wie man aus einem Graphen neue Graphen gewinnen kann. Zum Beispiel kann man einfach Verallgemeinerte Graphkonzepte aus Teilmengen der Knoten- und Kantenmenge eines Graphen wählen, wenn Bemerkung 2.4. diese selbst einen Graphen bilden. Abb. 2.3.

84

GRUNDLEGENDE DEFINITIONEN

A

Sei G = (V, E) ein Graph. Wir nennen einen Graphen = (V', E') einen Teilgraphen von G, wenn V' E V und E' E E und e C V' für alle e E E' . DEFINITION 2.5.

Ist V' c V, dann nennen wir den Teilgraphen G' = (V', E') den von V' induzierten Teilgraph von G, wenn E' = teEE:eCV1.

Wir betrachten direkt in einem Beispiel, was wir unter einem (induzierten) Teilgraphen verstehen.

nage: G=Graph({1:[2,3,4],2,[3],3:[ 4])) # Graph sage, G.subgraph([1,2,3],[(1,2)]) • # Teilgraph mit einer Kante Graph on 3 vertices sage: G.subgraph([1,2,3]) # induzierter Teilgraph Graph on 3 vertices sage, H=Graph(1:[2,3],2:[3]) sage: H.is_subgraph(G) True

BEISPIEL 2.6. Betrachten wir den Graphen G aus Beispiel 2.3, so ist beispielsweise der Graph G' = (V', E') mit V' = {1,3, 4,5,6,7} c V E' = {{1,4}, {3, 4}, {5,6}1 c E

8 • 9

ein Teilgraph von G - siehe Abbildung 2.4. Wählt man statt E' die Teilmenge E" = «1,41,12, 41, {3, 4}, {5,6}1 c E von E, bildet G" = (V', E") keinen Teilgraphen von G, weil die Kante {2, 4} nicht in V' enthalten ist. Tatsächlich ist G' kein induzierter Teilgraph von G, denn zum Beispiel sind die Knoten 1 und 3 in V' enthalten, die Kante {1, 3} jedoch nicht in E' obwohl sie in E enthalten ist. Der durch die Knoten in V' induzierte Teilgraph von G ist der Graph G"' = (V', E"') mit Kantenmenge

10 Abb. 2.4. Der Teilgraph G'

(V', E') aus

Beispiel 2.6.

E"' = {11,41, {1,3}, {3, 4}, {4, 7}, {5, 6}, {5, 7}} c {e EE:ec

• Alternativ kann man zusätzliche Knoten und Kanten einfügen, indem man Kanten in zwei Kanten unterteilt und einen zusätzlichen Knoten einfügt, der die beiden entstandenen Kanten mit den Endknoten der ursprünglichen Kante verbindet. DEFINITION 2.7. Sei G = (V, E) ein Graph. Wir nennen einen Graphen = (V', E') eine Unterteilung von G, wenn V' = V c {v} und für eine Kante e = {ui, u2} E E gilt E' = E \ {e} U {{ui, u}, {v, u2}}.

s,ge: G=Graph([1.[2,3,4],2:[3],3:[ ' 411) # Graph sage: G.subdivide_edge(1,2,1) • # Kantenunterteilung Graph on 5 vertices

Wir nennen einen Graphen G' = (V', E') einen Unterteilungsgraphen von G, wenn G' aus einer Reihe von Unterteilungen aus G hervorgeht. BEISPIEL 2.8. Betrachten wir erneut den Graphen G aus Beispiel 2.3, dann ist der Graph G' = (V', E') mit V' = {1,2,3,4,5,6, 7,8,9,10,11} E' = {{1, 4}, {1, 3}, {2, 3}, {2, 4}, {2, 7}, {3, 4}, {4, 7}, {5, 6}, {5, 7}, {9,11}, {11,10}1

85

ib‘

GRUNDLEGENDE DEFINITIONEN

4

8 •

eine Unterteilung von G - siehe Abbildung 2.5. Außerdem ist der Graph G" = (V", E") mit 9

6

10

V" = {1,2,3, 4,5, 6, 7, 8,9,10,11,12,13} E" = {{1, 13}, {13, 4}, {1, 3}, {2, 3}, {2, 4}, {2, 7}, {3,4}, {4, 7}, {5, 6}, {5, 12}, {12, 7}, {9, 11}, {11,10}1 ■

ein Unterteilungsgraph von G - siehe Abbildung 2.6.

Abb. 2.5. Die Unterteilung G' von G aus Beispiel 2.8.

8

•

13

12

9

Zwei Graphen G = (V, E) und G' = (V', E'), die auf unterschiedlichen Knotenmengen V und V' definiert sind, können dennoch von der gleichen kombinatorischen Struktur sein, wenn IV! = 1V'1 gilt. Man kann in diesem Fall einfach mit einer bijektiven Abbildung Knoten in V mit Knoten in V' identifizieren. Sinnvollerweise sind die Graphen dann gleich zu nennen, wenn die Bilder von adjazenten Knoten in G auch adjazent in G' sind.

DEFINITION 2.9. Es seien G = (V, E) und G' = (V', E') Graphen. Gibt es eine bijektive Abbildung f zwischen V und V', dann nennen wir G Abb. 2.6. und G' isomorph, wenn für alle Kanten {u, v} E E gilt { f (u), f (V)} E E Der Unterteilungsgraph G" von G aus und für alle Kanten {w, x} E E' gilt {f -1(w), f (x)} E E. Beispiel 2.8. 6

10

sage: G=Graph({1:[2,3,4],2:[3],3:[ • 4]1) sage: H=Graph((1.[2],3:[1,2,4),4:[ • 1]1) sage: H.is_isomorphic(G) True

BEMERKUNG 2.10. Es gilt sofort, dass zwei isomorphe Graphen die gleiche Ordnung haben. Das ist nicht explizit gefordert, doch folgt es implizit aus der Existenz einer bijektiven Abbildung zwischen V und V'. Denn für eine bijektive Abbildung auf endlichen Mengen gilt stets, dass die Kardinalität des Bildmenge der Kardinalität der Urbildmenge entspricht. ■ BEISPIEL 2.11. Die Graphen G = (V, E) und G' = (V', E') mit V = {a, b, c, V' = {1, 2, 3,4}

E = {{a, b}, {c, d}, {b, d}} E' {{3, 1}, {4, 2}, {1, 2}}

sind isomorph, denn es gibt eine bijektive Abbildung f : V --+ V' mit f (a) = 3,

f(b) = 1,

f(c) = 4,

f(d) = 2

so dass { f (a), f(b)} = {3, 1} E E', Abb. 2.7. Die beiden isomorphen Graphen G und G' aus Beispiel 2.11.

und {f -'(3),f -1-(1)} = {a,b} E E, {f -1(1), f -1(2)} = {b, d} E E. Siehe Abbildung 2.7 für eine Illustration.

86

{f(c), f(d)} = {4, 2} E E',

{ f (b), f(d)} = {1,2} E E'

{f -1(4), f

(2)1 = {c, 6/} E E,

GRUNDLEGENDE DEFINITIONEN

A

2.1.1 Nachbarschaft in Graphen Es macht Sinn, über eine Kante miteinander verbundene Knoten besonders in den Blick zu nehmen. Solche Knoten und Kanten stehen in einer „nachbarschaftlichen" Beziehung zueinander, für entsprechende Situationen finden wir nun treffende Namen. DEFINITION 2.12. Sei G = (V, E) ein Graph. Man nennt eine Kante e E E und einen Knoten v E V inzident, wenn v E e. Man nennt den Knoten w einen Nachbarn des Knotens v, wenn {w, v} E E. Man sagt dann auch, dass v und w adjazent sind. Wir nennen für einen Knoten v E V die Menge aller Nachbarn N(v) = {u, E V : v und w sind adjazent} die Nachbarschaft von v in G und allgemein für eine Menge von Knoten UcV N(U) = U N(v) vEU

die Nachbarschaft von U in G. BEISPIEL 2.13. Betrachte den Graphen G aus Beispiel 2.3. Dann ist beispielsweise 4 adjazent zu 7, weil die Kante {4, 7} in E ist. Die Kante {4, 7} ist inzident zu den Knoten 4 und 7. Außerdem ist die Nachbarschaft von 4

•8

N(4) = {1,2,3, 7}. Die Nachbarschaft des Knotens 8 ist leer, es ist also N(8) = 0. Siehe Abbildung 2.8 ■ für eine Illustration.

3

10

Abb. 2.8.

Die Anzahl der Nachbarn eines Knotens v E V spielt in vielen AnwenNachbarschaft N(4) aus Beispiel dungen eine entscheidende Rolle. Wir geben ihr deshalb einen eigenen Die 2.13. Namen. DEFINITION 2.14. Sei G = (V, E) ein Graph. Wir bezeichnen mit deg (v) N (v)I den Grad von v in G. Es ist minvE v {deg(v)} der Minimalgrad von G und max, E v {deg(v)} der Maximalgrad von G. Einen Knoten v e V mit deg(v) = 0 nennt man auch isolierten Knoten von G. BEMERKUNG

2.15. Die Größe der Nachbarschaft eines Knotens v lässt sich in

87

GRUNDLEGENDE DEFINITIONEN

einem Graphen ohne Multikanten auch berechnen als deg(v) = (v)I =IfeEE:v ist inzident zu 01 In gerichteten Graphen unterscheidet man manchmal den Eingangs- und den Ausgangsgrad. Der Eingangsgrad eines Knotens v entspricht dann der Anzahl der inzidenten Kanten der Form (w, v) E E, der Ausgangsgrad der Anzahl der inzidenten Kanten der Form (v, w) E E mit w E V. ■ BEISPIEL 2.16. Betrachte den Graphen G aus Beispiel 2.3. Wir finden die folgenden Knotengrade

deg(1) = 2, deg(2) = 4, deg(3) = 3, deg(4) = 4, deg(5) = 2 deg(6) = 1, deg(7) = 3, deg(8) = 0, deg(9) = 1, deg(10) = 1 Demnach ist 8 ein isolierter Knoten. Der Maximalgrad von G ist vier und der Minimalgrad von G ist Null. ■ Das folgende, sogenannte Handschlaglemma stellt fest, dass in jedem Graphen die Summe der Knotengrade genau zweimal der Größe des Graphen, also der Anzahl seiner Kanten, entspricht. LEMMA 2.17 (Handschlaglemma).

Sei G = (V, E) ein Graph, dann gilt

E deg(v) = 2 • I v

.

EV

Beweis. Es ist nach Bemerkung 2.15

E deg(v) = E I N (v)1 = E I {e E E : v ist inzident zu e}l vEV

vEV

vEV

Da jede Kante (v, w) E E inzident zu genau zwei Knoten ist, wird sie in zwei Nachbarschaften berücksichtigt (nämlich in den Nachbarschaften von v und w). Daraus folgt die Behauptung. ■

Aus dem Handschlaglemma lässt sich nun leicht folgern, dass jeder Graph eine gerade Anzahl von Knoten ungeraden Grades hat. KOROLLAR 2.18. Sei G = (V, E) ein Graph. Die Anzahl der Knoten mit ungeradem Grad in G ist gerade.

Das Thema Nachbarschaft abrundend lernen wir jetzt noch Graphen kennen, deren Knotenmenge in zwei „kantendisjunkte" Teilmengen zerfällt. Das meint, dass die Knoten keine Nachbarn in der eigenen Teilmenge haben. Solche Graphen treten tatsächlich in praktischen Anwendungen häufig auf, wenn die Knoten des Graphen unterschiedliche Objekte repräsentieren. Zum Beispiel könnten manche Knoten in einem Graphen die

88

GRUNDLEGENDE DEFINITIONEN

A

Mitarbeiter eines Unternehmens repräsentieren und andere Knoten zu erledigende Aufgaben. Ein Kante liegt zwischen einem „Mitarbeiterknoten" und einem "Aufgabenknoten", wenn der entsprechende Mitarbeiter die entsprechende Aufgabe übernimmt. In einem solchen Graphen gibt es sicherlich keine Kante zwischen zwei „Mitarbeiterknoten". DEFINITION 2.19. Wir nennen einen Graphen G = (V, E) bipartid, wenn es zwei echte Teilmengen V1, C V gibt, so dass je zwei Knoten der selben Teilmenge nicht adjazent sind. BEISPIEL 2.20. Betrachte den Graphen G aus Beispiel 2.3. Dieser Graph ist nicht bipartid. Das Dreieck der Knoten 1, 3 und 4 macht Probleme. Liegt 1 E V1, dann müssen die Knoten 3 und 4 in 2 enthalten sein. Doch zwischen 3 und 4 gibt es eine Kante, was in einem bipartiden Graphen nicht erlaubt ist.

•8 9

Der Teilgraph Graph G' = (V', E') von G mit V' = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10} E' = {{1, 4}, {1, 3}, {2,3}, {2, 4}, {2, 7}, {5, 6}, {5, 7}, {9,10}}

10

9

ist allerdings bipartid bezüglich der Mengen 1 = {1,2, 5, 9}

und

2 = {3,4, 6,7, 8,10}.

Siehe dazu Abbildung 2.9.

3 4 6 7 8 10 Abb. 2.9.

Der bipartide Teilgraph G' von G aus Beispiel 2.20 in zwei Darstellungen.

2.1.2 Gewichtetet Graphen Wir haben nun beobachtet, dass in Graphen tatsächlich nur die Tatsache darstellbar ist, dass zwei Knoten miteinander verbunden sind. Ob diese Interaktion stark, schwach, teuer oder in einem sonstigen Sinne messbar ist, wird durch die Graphenstruktur nicht ersichtlich. Bei der Modellierung eines konkreten angewandten Problems durch einen Graphen geht durch diese Abstraktion oft mehr Information verloren, als gewünscht. Wir werden deshalb nun Graphen mit Abbildungen sowohl aus der Kantenmenge als auch aus der Knotenmenge in die reellen Zahlen ausstatten. Insbesondere die Abbildung, welche jeder Kante eine reelle Zahl zuordnet, hilft bei der Modellierung vieler alltäglicher Probleme. DEFINITION 2.21. Ein Graph G wird gewichteter Graph genannt, wenn es eine Abbildung g : E -4 R gibt. Ein Graph heißt knotengewichteter Graph, wenn es eine Abbildung gv : V --> gibt. BEISPIEL 2.22. Wir ergänzen den Graphen G aus Beispiel 2.3 nun um eine

89

1. GRUNDLEGENDE DEFINITIONEN

Abbildung g : E 8 •

18, die ihn zu einem gewichteten Graphen macht. Es sei

g({1,4}) = 2 , g({2,3}) = 1, g({2,4}) = 1, g({1,3}) = 0, g({2, 7}) = -1 g({3, 4}) = 7r, g({4, 7}) = 10, g({5, 6}) = g({5, 7}) = 0, g({9,10}) = 7. Siehe Abbildung 2.10 für eine Illustration.

3

6

•

10 Abb. 2.10.

2.1.3 Vollständige Graphen

Der gewichtete Graph aus Beispiel 2.22.

Graphen, die jede mögliche Kante auch tatsächlich enthalten, nennt man vollständig. Sie modellieren Situationen, in denen alle Knoten untereinander interagieren.

DEFINITION 2.23. Wir nennen den Graphen Kr, = (V, E) den vollständigen Graphen auf n Knoten, wenn für alle Knoten v, w E V auch Abb. 2.11. (v, w) E E ist. Der vollständige Graph K5.

Abb. 2.12. Der vollständige bipartide Graph K3,3.

Abb. 2.13. Der vollständige bipartide Graph K2,4.

Wir nennen den Graphen Kn ,m = (V, E) den vollständigen bipartiden Graph auf n und m Knoten, wenn es eine Partition der Knotenmengen V2 mit I VI I = rt und 1V21 = m gibt, so dass Kn,m bipartid bezüglich dieser Mengen ist. Hat ein Graph G = (V, E) einen Teilgraphen G', der dem vollständigen Graphen Kr, für ein n E N entspricht, dann nennt man G' eine Clique von G. BEISPIEL 2.24. Es sind in Abbildung 2.11 der vollständige Graph K5 auf fünf Knoten, in Abbildung 2.12 der vollständige bipartide Graph K3,3 auf 3 und 3 Knoten und in Abbildung 2.13 der vollständige bipartide Graph K2,4 auf 2 und 4 Knoten dargestellt. Der Graph G = (V, E) mit V = {1, 2, 3, 4, 5, 6, 7} E = {{1, 2}, {1, 3}, {1, 4}, {2, 3}, {2, 4}, {2, 7}, {3,4}, {4, 7}, {5, 6}, {5, 7}} besitzt eine Clique G' = (V', E') mit

6

V' = {1, 2, 3, 4} E' = {{1,2}, {1, 3}, {1, 4}, {2, 3}, {2, 4}, {3, 4}1.

Abb. 2.14. Siehe Abbildung 2.14 für eine Illustration.

Ein Graph mit einer Clique.

90

■

DARSTELLUNG VON GRAPHEN

A

2.2 Darstellung von Graphen

Üblicherweise werden Graphen als eine Menge von Punkten und Linien gezeichnet, welche die Knoten und Kanten des Graphen repräsentieren. So haben wir Graphen auch schon in den Abbildungen illustriert. Dabei werden die Knoten durch fette Punkte gekennzeichnet um Überschneidungen der Kantenlinien nicht fälschlicherweise als Knoten zu interpretieren. Aber in welcher Form werden die Daten eines Graphen gespeichert, sprich die Information darüber, welcher Knoten mit welchem in einer Kante verbunden ist? Die Datenstruktur der Wahl ist in der Regel eine Adjazentsliste. In ihr wird für jeden Knoten die Nachbarschaft als Liste gespeichert. DEFINITION 2.25. Sei G = (V, E) ein Graph. Die Adjazenzliste AL (G) von G enthält für jeden Knoten eine Liste mit dessen Nachbarknoten.

BEMERKUNG 2.26. Ist G ein ungerichteter Graph, reicht es, je nach Verwendung des Graphen, beim Speichern der Nachbarschaftsliste für den Knoten mit Index i stets nur die Knoten mit Index größer i aufzuführen. Die Information, dass der Knoten mit Index i mit einem Knoten mit kleinerem Index über eine Kante verbunden sind, erschließt sich dann schon aus dessen Nachbarschaftsliste. Möchte man allerdings möglichst schnell auf die gesamte Nachbarschaft eines Knotens zugreifen, sollte diese in der Adjazenzliste nicht erst durch das Suchen in Nachbarschaften kleinerer Knoten erzeugt werden müssen. Handelt es sich um einen gewichteten Graphen, dann werden in der Nachbarschaftsliste nicht nur die Indizes der Nachbarn, sondern der Index und das Kantengewicht ■ gespeichert. BEISPIEL 2.27. Der als „das Haus vom Nikolaus" bekannte Graph G = (V, E) auf fünf Knoten, der in Abbildung 2.15 dargestellt ist, auf der Knoten- und Kantenmenge V = {1,2, 3,4,5} E = {{1, 2}, {1, 3}, {1, 4},{1, 5}, {2, 3}, {3, 4}, {3, 5}, {4, 5}1

4 Abb. 2.15.

hat die Adjazenzliste

Der Graph G aus Beispiel 2.27.

AL (G) = [[2, 3, 4, 5], [1, 3], [1, 2, 4, 5], [1, 3, 5], [1, 3, 4]].

■ Alternativ kann man in einer Matrix die existierenden Kanten speichern. Eine Matrix ist im Prinzip eine große Tabelle, deren Spalten wie Zeilen mit den Knoten indiziert sind.

91

Si. DARSTELLUNG VON GRAPHEN

DEFINITION 2.28. Sei G = (V, E) ein Graph der Ordnung n = I VI. Die Adjazenzmatrix AM (G) von G ist eine n x n-Matrix mit den Einträgen

1 wenn {vi, vi } E E Az;(G)= sage: G-Graph( [1: [2, 3, 4],2, [3], 3: [ 4]1) sage. G.adjacency_matrix)) [0 1 1 1] [1 0 1 0] [1 1 0 1] [1 0 1 0]

0 sonst

für alle i , j E {1, 2, ... , n}.

BEMERKUNG 2.29. Ist der Graph ungerichtet, dann ist die Matrix symmetrisch,

spiegeln (mehr zu Matrizen in Kapitel 6). Es man kann sie an den Einträgen reicht, ähnlich wie bei der Adjazenzliste, für manche Anwendungen nur die eine Hälfte der Matrix zu speichern. Ist der Graph gewichtet, dann speichert man statt der 1 im Eintrag Ati das Gewicht der Kante (i, j). ■ BEISPIEL

2.30. Der Graph G = (V, E) aus Beispiel 2.27 hat die Adjazenmatrix 1 O 1 O O

1 1 0 1 1

1 0 0 1 0 1 0

Betrachtet man zum Beispiel die erste Zeile, so finden sich dort Einsen genau in den Spalten der Nachbarn von vi nämlich N(1) = {2, 3, 4, 5}. Das gleiche gilt für die zweite Zeile und den Knoten 2, denn es ist N(2) = {1, 3} und die übrigen Zeilen. ■

2.2.1 Planare Graphen Tatsächlich treten in der Praxis häufig Graphen auf, welche man frei von Kantenkreuzungen auf ein Blatt Papier zeichnen kann. Solche Graphen sind Abstraktionen von Landkarten. Die Knoten repräsentieren einzelne Abb. 2.16. Länder, die Kanten zeigen gemeinsame Grenzen zwischen Ländern an. Nachbarschaft auf einer Landkarte wird durch einen Graphen repräsentiert. Schon vor langer Zeit stellte man sich die Frage, wie viele Farben ausreichen, eine beliebige Landkarte zu färben. Färben meint, dass die Fläche jedes Landes eine Farbe erhält, wobei niemals benachbarte Länder die Anmerkung. Eine solche Färbung erhöht die gleiche Farben erhalten. Vereinfachend ist dabei angenommen, dass die Lesbarkeit einer Landkarte, Grenzen können Fläche eines Landes nicht in mehrere nicht zusammenhängende Teile schneller erkannt werden. zerfällt, siehe Abbildung 2.16. Diese Frage lässt sich in Begriffen der Anmerkung. Die Vereinigten Staaten von Amerika erfüllen die Voraussetzung des ZusammenGraphentheorie formulieren. Doch zunächst die wichtige Definition. hangs zum Beispiel nicht. Mit Alaska besitzen Sie eine sogenannte Exklave, eine Gebiet, dass vom Mutterland durch Grenzen räumlich separiert ist und nur über fremdes Gebiet zu erreichen ist.

92

DARSTELLUNG VON GRAPHEN

A

2.31. Sei G = (V, E) ein Graph. Sei f eine Einbettung der Knotenmenge V in den R2, also eine Abbildung f : V H 1182. Wir nennen G planar, wenn es für alle Kanten (v, w) E E je einen Streckenzug von f (v) nach f (w) gibt, so dass sich die Streckenzüge von je zwei verschiedeDEFINITION

nen Kanten nicht schneiden. BEMERKUNG 2.32. Unter einem Streckenzug stellt man sich am besten eine (gerne gekrümmte oder gezackte) Linie vor, die man ohne den Stift abzusetzen zeichnen kann. Mathematisch korrekt formuliert, ist ein solcher Streckenzug eine stetige Abbildung .s : [0,1] -+ 1it2, mit s(0) = f (v) und s(1) = f (w). Dabei wird das Vorbild aller Streckenzüge, das Intervall von 0 bis 1, stetig in die Ebene abbildet. Die Stetigkeit der Abbildung sorgt dafür, dass der Abbildungsgraph (nicht zu verwechseln mit dem kombinatorischen Graphen) keine Sprünge macht, also ■ kein anderer Streckenzug „übersprungen" werden kann. BEISPIEL 2.33. Der bekannte Graph aus Beispiel 2.27 ist planar, wie in Abbildung 2.17 zu sehen ist. Tatsächlich gibt es in Abbildung 2.15 nur eine Streckenzugüberkreuzung, die wir durch Verschieben des rechten unteren Knotens oder das Verändern des Streckenzugs einer der sich kreuzenden Streckenzüge lösen können. Der vollständige Graph auf fünf Knoten K5 ist genau so wenig planar, wie der vollständige bipartide Graph auf 3 und 3 Knoten K3,3 . Egal wie man die Knoten und die Streckenzüge verschiebt, es gelingt nicht jegliche Streckenzugkreuzungen ■ zu vermeiden. Siehe dazu Abbildung 2.18 und 2.19.

Abb. 2.17. Zwei planare Einbettungen des Graphen aus Beispiel 2.27.

Abb. 2.18. Der vollständige Graph K5 ist nicht planar.

In Beispiel 2.33 wird deutlich, dass die Einbettung in eine Ebene nicht eindeutig ist. Es gibt sehr viele (sogar unendlich viele Möglichkeiten) einen Graphen in eine Ebene zu malen. Um zu beweisen, dass ein Graph planar ist, reicht eine Einbettung ohne Streckenzugüberkreuzungen. Wie kann man aber jemals entscheiden, ob ein Graph nicht planar ist? Vielleicht hat man die Einbettung, welche die Planarität beweist, nur noch 2.19. nicht gefunden. Glücklicherweise gibt es ein einfacheres Zertifikat, als Abb. vollständige Der jede mögliche Einbettung zu prüfen, um einen Graphen auf Planarität hin ist nicht planar. bipartide Graph K3,3 zu untersuchen. SATZ 2.34 (Satz von Kuratowski). Ein Graph ist genau dann planar, wenn er keinen Teilgraphen besitzt, der ein Unterteilungsgraph des K5 oder des K3,3 ist. Beweis. Der Beweis übersteigt den Rahmen unserer Darstellung der Grund-

lagen der Graphentheorie.

■

Wir betrachten zwei Beispiele, um die Aussage des Satzes zu illustrieren. Tatsächlich genügt es beim Test auf Planarität nach einem Teilgraphen zu suchen, der ein Unterteilungsgraph des K5 oder des K3,3 ist. BEISPIEL 2.35. Der Graph G1 in Abbildung 2.20 enthält einen farblich hervor-

93

Ä DARSTELLUNG VON GRAPHEN

gehobenen Teilgraphen, der ein Unterteilungsgraph des K5 ist. Der Graph G2 in Abbildung 2.21 enthält einen farblich hervorgehobenen Teilgraphen, der ein Unterteilungsgraph des K3,3 ist. Demnach sind beide Graphen nach Satz 2.34 nicht planar. ■

Historischer Exkurs - der Vier-Farben-Satz

Abb. 2.20. Der Graph G1 aus Beispiel 2.35.

Wie viele Farben genügen nun, eine Landkarte einzufärben? Dieser Frage möchten wir jetzt nachspüren. Eine Frage, die schon vor über 150 Jahren formuliert wurde, in der Zeit der grundlegenden Entwicklung der Graphentheorie. Wir abstrahieren diese Fragestellung zunächst, indem wir Färbungen von Graphen definieren. DEFINITION 2.36. Sei G = (V, E) ein Graph. Eine Abbildung f : V --> {1, 2, ... , k} heißt k-Färbung von G, wenn für jede Kante (v, w) E E gilt f (v) f (w). Eine Graph, für den eine k-Färbung existiert, nennen wir k-färbbar.

Abb. 2.21. Der Graph G2 aus Beispiel 2.35.

4

BEISPIEL 2.37. Jede Färbung eines vollständigen Graphen auf n Knoten benötigt n Farben, weil jeder Knoten mit jedem anderen verbunden ist. So besitzt zum Beispiel der K5 nur k-Färbungen für k > 5 also insbesondere keine 4-Färbung. Jeder bipartide Graph kommt mit zwei Farben aus, indem jeder der beiden Mengen der Knotenpartition eine Farbe zugeordnet wird. Sobald er mindestens eine Kante hat, benötigt er auch mindestens zwei Farben.

Abb. 2.22. Der Graph G = (V, E) aus Beispiel 2.3.

Anmerkung. Das sieht man ein, indem man sich klar macht, dass jeder vollständige Graph jeden vollständigen Graphen mit weniger Knoten als Teilgraphen besitzt. Ein vollständige Graph mit n > 5 besitzt also den vollständige Graphen K5 als Teilgraph, und ist somit nicht planar.

Der Graph aus Beispiel 2.3 besitzt unter anderem die in Abbildung 2.22 gezeigte 3-Färbung. Er ist nicht 2-färbbar, das Dreieck auf den Knoten 1, 3 und 4 ist eine Clique und somit ein vollständiger Graph K3 und kann demnach nicht mit zwei Farben gefärbt werden. ■

Früh wurde vermutet, dass vier Farben zur Färbung jeglichen planaren Graphens genügen. Vollständige Graphen stellen keinen Widerspruch zu dieser Aussage da. Nach dem Satz von Kuratowski, ist der vollständige Graph Kn genau dann planar, wenn n < 4 ist. Wir formulieren nun die als Vier-Farben-Satz berühmt gewordene mathematische Aussage über die Färbung planarer Graphen. SATZ 2.38 (Der Vier-Farben-Satz). Jeder planare Graph ist 4-färbbar. Dieser kurze Satz lässt sich beweisen. Doch so knapp die Aussage formuliert ist, so umfangreich und langwierig war die Suche nach einem korrekten Beweis für diesen Satz. Es vermutete der südafrikanische Mathematiker Francis Guthrie schon 1852 beim Färben einer Landkarte der Grafschaften von England, dass vier Farben zum Färben jeglicher Landkar-

94

DARSTELLUNG VON GRAPHEN

te genügen. Der englische Mathematiker Augustus De Morgan diskutierte dann auch schon 1852 in einem Brief an den irischen Mathematiker William Rowan Hamilton diese Frage. Im Jahr 1878 stellte der Engländer Arthur Cayley das Problem der mathematischen Gesellschaft Londons vor. Ein Beweis von Alfred Kempe, den er nur wenige Monate später veröffentlichte, wurde von Percy Heawood 1890 widerlegt. Peter Guthrie Tait veröffentlichte derweilen 1880 ebenfalls einen eigenen Beweis, welcher sich 1891 allerdings auch als falsch herausstellte. Heawood bewies im Zuge der Widerlegung von Kempes Beweis des Vier-Farben-Satzes den Fünf-Farben-Satz. Damit gab er eine obere Schranke für die benötigte Anzahl von Farben beim Färben planarer Graphen an. Erst in den 60er und 70er-Jahren des vorherigen Jahrhunderts erarbeitete Heinrich Heesch einen ersten Entwurf eines computergestützten Beweises für den Vier-Farben-Satz. Doch aufgrund der großen benötigten Rechenzeit, wurde dieser Beweis niemals tatsächlich auf einem Rechner ausgeführt. Der Ansatz wurde dann von Kenneth Appel und Wolfgang Haken 1976 verbessert. Die zugrundeliegende Idee des Beweises ist einfach erklärt. Die Menge der planaren Graphen ist unendlich groß. Doch die meisten Graphen sind in weiten Teilen leicht mit vier Farben zu färben. Tatsächlich gibt es allerdings gewisse Teilgraphen, die zu Komplikationen führen können, sprich möglicherweise dazu führen, dass vier Farben zum Färben nicht ausreichen. Diese problematischen Fälle kann man charakterisieren und beschreiben. Dabei stellt man fest, dass ihre Anzahl endlich ist. Es sind nämlich, mit dem Ansatz von Appel und Haken genau 1936. Für diese sucht und findet man unter Computereinsatz 4-Färbungen. Zur Charakterisierung dieser „Problemfälle" verwendeten Appel und Haken erstaunlicher weise grundlegende Ideen, die Kempe in seinem fehlerhaften Beweis fast hundert Jahre zuvor entwickelt hatte. Da der Vier-Farben-Satz das erste renommierte mathematische Problem war, dass durch einen computergestützten Beweis gelöst wurde, schlugen Appel und Haken eine immense Skepsis ihrer Kollegen entgegen. Viele Mathematiker stellte der computergestützte Beweis vor Probleme. Sollte ein Beweis nicht durch einen Menschen direkt nachvollziehbar sein? Ein computergestützter Beweis verlässt sich im Gegensatz auf die Korrektheit des Compilers und der Hardware. Um die Kritiker zu überzeugen, veröffentlichten Appel und Haken 1989 eine ausführliche Erläuterung des Beweises.

95

A

WEGE DURCH GRAPHEN

Mittlerweile konnten Neil Robertson, Daniel Sanders, Paul Seymour und Robin Thomas 1996 einen überarbeiteten Computerbeweis angeben, welcher die Anzahl der kritischen Fälle auf 633 reduziert. Dennoch bleibt der Einsatz eines Computers der Schlüssel des Beweises. Computergestützte Beweise haben sich zwischenzeitlich durchaus zu einem anerkannten und probaten Mittel in der Mathematik und der Informatik entwickelt. Dennoch geht ihnen sicherlich, neben der schon angesprochenen Transparenz, in der Regel, aus einer ästhetischen Perspektive betrachtet, die Eleganz ab.

2.3 Wege durch Graphen

Im Jahr 1724 wurde Königsberg die königliche Haupt- und Residenzstadt in Preußen, heute liegt sie in einer russischen Enklave und wird Kaliningrad genannt. Die Pregel, ein Fluß der von Osten nach Westen durch Kaliningrad fließt, teilt sich weit vor der Stadt in zwei, nur wenige hundert Meter getrennt und parallel verlaufende Arme. In Kaliningrad vereinen sich diese beiden Arme wieder. Kurz bevor sie das tun, gibt es einen Verbindungsarm, so dass eine kleine Insel entsteht. Insgesamt gibt es nun also das nördliche Ufer, das südliche Ufer, die kleine und die lange Insel zwischen den beiden Pregelarmen. Es gibt je zwei Brücken, die vom nördlichen bzw. südlichen Ufer auf die kleine Insel führen und je eine, von dort aus auf die lange Insel. Außerdem ist die kleine Insel mit der langen Insel durch eine Brücke verbunden. Wir wollen uns nicht mit Geographie oder Geschichte langweilen, doch im 18. Jahrhundert kam die folgende Frage auf. Ist es möglich, durch Königsberg zu spazieren und dabei jede Brücke genau einmal zu überqueren? Und verschärft, ob dies als Rundweg möglich ist, man also dabei zum Startpunkt zurückkehren kann? Diese Frage wurde das Königsberger Brückenproblem genannt. Abb. 2.23. Das Königsberger Brückenproblem.

96

Der Schweizer Mathematiker Leonhard Euler löste das Problem 1736 mit einem graphentheoretischen Ansatz. In seinem Beweis abstrahierte er die geographische Situation, indem er einen (Multi-)Graphen zeichnete, in welchem die Knoten jeweils die Ufer bzw. Inseln und die Kanten je eine Brücke repräsentierten, siehe Abbildung 2.23. Er beobachtete, dass alle Knoten ungeraden Grad hatten. Damit war die Frage nach einem Rundweg beantwortet, es war nicht möglich.

WEGE DURCH GRAPHEN

Denn startet man an einem Knoten mit ungeradem Grad, wird man die Tour dort nicht beenden können. Kehrt man (auch nach mehrmaliger Rückkehr und mehrmaligem Verlassen) zurück, hat man eine gerade Anzahl von Kanten verwendet und muss mindestens eine weitere inzidente Kante verwenden, verlässt den Knoten also wieder. Selbst wenn man zulässt, dass Start- und Endpunkt des Rundweges nicht identisch sind, müsste jeder weitere Knoten, der nicht Start- oder Endpunkt ist, einen geraden Grad haben. Denn besucht man ihn über eine Kante, so muss man ihn über eine weitere wieder verlassen können (weil er ja kein Endpunkt ist). Einzig der Endknoten darf wiederum einen ungeraden Grad haben. In dieser Geburtsstunde der Graphentheorie stellte Euler allgemein die Vermutung auf, dass ein solcher Weg in allgemeinen Graphen genau dann existiert, wenn alle bis auf zwei Knoten (Start- und Endpunkt des Rundgangs) geraden Grad haben. Carl Hierholzer veröffentlicht 1873 einen Beweis dieser allgemeinen Aussage, indem er einen Algorithmus zum Finden solcher Wege angab. Wir möchten diese Konzepte von Wegen nun formal fassen. Dabei unterscheiden wir Wege, die aneinander grenzende Kanten und solche, die adjazente Knoten „ablaufen". DEFINITION 2.39. Sei G = (V, E) ein Graph. Es seinen r +1 viele Knoten er mit ei = (vt , vi+i ) für alle vi , vr±i E V und die Kanten ei , 1 < i < r gegeben.

er} in E enthalten und sind die Kanten paarweise Ist die Menge {ei , verschieden, dann nennen wir das Tupel der Kanten s = (ei , . , er ) einen Kantenzug von vi nach vr+i der kombinatorischen Länge r in G. Gilt zusätzlich vi = vr+i, dann nennen wir s einen Zyklus. Sind die Knoten vi , , vr+i paarweise verschieden, dann nennen wir s einen Weg von vi nach vr±i der kombinatorischen Länge r in G. Gilt zusätzlich vi = vr+i, dann nennen wir s einen Kreis. Man sagt, dass ein Kantenzug die Knoten vi , vr±i berührt . Ein Kantenzug s wird auch als Tupel der berührten Knoten (vi, vr+i) angeben. Die Knoten vi und v, werden Endknoten von s genannt. BEMERKUNG 2.40. In ungewichteten Graphen nennt man die kombinatorische Länge auch einfach Länge. In gewichteten Graphen gibt es ein alternatives Längenkonzept, wie wir in Definition 2.63 sehen werden. In gerichteten Graphen wird die ■ Richtung der Kanten berücksichtigt.

BEISPIEL 2.41. Betrachte den Graphen in Abbildung 2.24. Dort ist der Kantenzug

97

k WEGE DURCH GRAPHEN

s2

= (1, 4,5, 6, 8, 7) ein Weg aber kein Zyklus. = (1, 4,5, 6, 8, 7, 5, 3, 2) kein Weg.

s3 = (1, 4,5, 6, 8, 7, 5, 3, 2,1) ein Zyklus, aber kein Weg und damit kein Kreis. S. ... 84 = (1, 4,5, 3, 2) ein Zyklus und ein Weg und damit ein Kreis.

•

1 2

4

1

sz

BEISPIEL 2.42. Das berühmte Haus vom Nikolaus, also der Graph aus Abbildung 15 kann mit einem (Kanten-)Zug gezeichnet werden, welcher dann ein Zyklus,

to 6

allerdings kein Weg und somit kein Kreis ist.

■

Wege dürfen Knoten nicht doppelt berühren, bei Kantenzügen ist dies zulässig, wenn nur unterschiedliche Kanten involviert werden. Offensichtlich ist dann also jeder Weg auch ein Kantenzug, die umgekehrte Richtung gilt nicht zwangsläufig. Dennoch kann man schlussfolgern, dass, gibt es einen Kantenzug, der zwei Knoten verbindet, auch einen Weg zwischen diesen beiden Knoten existiert.

1 2

7

LEMMA 2.43. Sei G = (V, E) ein Graph. Es gibt für zwei Knoten v, w E V genau dann einen Kantenzug von v nach w, wenn es einen Weg von v nach w gibt.

1 2 3

Beweis. Sei s ein Kantenzug von v nach w mit vi = v und vr+i = w. Dann gibt es für jeden von s berührten Knoten ü einen kleinsten Index i Der Graph mit den enthaltenden so dass v, = v und einen größten Index j so dass v, = v. Der Kantenzug Kantenzügen aus Beispiel 2.41. = (ei, . e,_i, es , , er ) ist ebenfalls ein Kantenzug von v nach w, so dass ü nur zu genau zwei Kanten inzident ist. Diesen Vorgang wiederholt Anmerkung. Das ist wenig überraschend, man „löscht" einfach alle Kreise, die auf dem Kanten, vr+1 mehr als einmal auftauchen. Der man für alle Knoten, die in vi zug liegen. ■ resultierende Kantenzug ist ein Weg. Abb. 2.24.

7 8

sie

6

•5

1 2 3

1 2 3 Abb. 2.25. Aus jedem Kantenzügen lässt sich ein Weg gewinnen.

98

LEMMA 2.44. Sei G = (V, E) ein Graph und s ein Kantenzug. Dann gelten die beiden folgenden Aussagen. i. Jeder Knoten, der nicht ein Endknoten von s ist, ist mit einer geraden Anzahl von Kanten in s inzident. ii. Die beiden Endkonten von s sind genau dann mit einer geraden Anzahl von Kanten in s inzident, wenn s ein Zyklus ist (also die beiden Endknoten von s identisch sind). Beweis. Der Beweis ist eine Übungsaufgabe.

■

WEGE DURCH GRAPHEN

wt

2.3.1 Eulerzüge durch Graphen

In der Sprache der Kantenzüge können wir Probleme wie das Königsberger Brückenproblem allgemein formulieren. DEFINITION 2.45. Sei G = (V, E) ein Graph. Einen Kantenzug, der jeden Knoten aus V berührt, nennt man eine offenen Eulerzug. Ist er ein Zyklus, nennt man ihn einen (geschlossenen) Eulerzug. Hat G einen Eulerzug, dann nennen wir G eulersch. BEMERKUNG 2.46. Ein Eulerzug wird auch als Eulertour oder Eulerkreis bezeichnet. Ein geschlossener Eulerzug unterscheidet sich von einem offenen Eulerzug in der Forderung, dass die beiden Endknoten des Kantenzuges identisch sind. Ein offener Eulerzug ist also nur fast ein Zyklus, die Kante zwischen den beiden Endknoten ■ muss nicht zwangsläufig vorhanden sein. BEISPIEL 2.47. Betrachte den Graphen G aus Beispiel 2.41. Mit Kantenzug s3 haben wir einen Zyklus gefunden, der alle Knoten im Graphen berührt, er ist also ein Eulerzug und G ist eulersch.

Auch der Graph aus Abbildung 2.15, der dem Haus vom Nikolaus entspricht, besitzt zumindest einen offenen Eulerzug. Sie dürfen gerne beweisen, dass dieser Graph ■ keinen geschlossenen Eulerzug besitzt.

Es ist eine offensichtliche Voraussetzung für die Existenz eines Eulerzugs, dass zwischen je zwei Knoten ein Kantenzug existiert, denn ein Eulerzug ist ein solcher. Gibt es nicht zwischen je zwei beliebigen Knoten eines Graphen einen Kantenzug, dann auch sicherlich keinen Eulerzug. Ein Eulerzug berührt jeden Knoten des Graphen, sorgt also dafür, das je zwei beliebige Knoten durch einen Kantenzug und nach Lemma 2.43 dann auch über einen Weg miteinander verbunden sind. D EFINITION 2.48. Sei G = (V, E) ein Graph. Wir nennen v erreichbar von w, wenn es einen Weg in G von v nach w gibt. Wir nennen G zusammenhängend, wenn jeder Knoten v E V von jedem Knoten w E V erreichbar ist.

8

Einen maximalen zusammenhängenden Teilgraphen von G nennt man eine Zusammenhangskomponente von G. BEMERKUNG 2.49. Ist G ein gerichteter Graph, dann nennen wir G schwach zusanunenhängend, wenn der zugehörige ungerichtete Graph zusammenhängend ist. ■

6

10

Abb. 2.26.

BEISPIEL 2.50. Wir betrachten den Graphen aus Beispiel 2.3. Der Graph zerfällt in drei Zusammenhangskompontenen. Die Knoten, die vom Knoten 1 erreichbar ■ sind, den isolierten Knoten 8 und die Knoten 9 und 10.

Die Zusammenhangskomponenten aus Beispiel 2.50.

99

S► WEGE DURCH GRAPHEN

Tatsächlich kann man in jedem Graphen, dessen Knoten alle geraden Grad haben, einen Eulerzug finden. Wir geben einen Algorithmus an, der zunächst Zyklen in einem solchen Graphen findet. Mithilfe dieses Algorithmus findet man dann Zyklen, die man zu einem Eulerzug „zusammenldebt". Algorithmus 2.51 (FINDZYKLUSEULER). Input: Einen einfachen Graphen G = (V, E) mit deg(v) gerade für alle v E V und einen Startknoten D1 E V. Output: Ein Zyklus in G, welcher v1berührt. 1.Setze s als leeren Kantenzug und i = 1. while s ist kein Zyklus und s # E do 2. Wähle eine zu vi inzidente nicht in s enthaltende Kante ei E E mit ei = (vi, vi+1) aus. 3. Ergänze s um ei. 4. Setze i = i 1. end while 5. Bricht die While-Schleife ab, weil s ein Zyklus ist, gebe diesen aus.

Der Algorithmus FINDZYKLUSEULER ist also prinzipiell ziemlich naiv. Er beginnt bei einem Knoten vi und läuft die Knoten des Graphen ab. Dabei hofft er, solange er sich noch nicht wieder bei dem Startknoten vi befindet, stets eine inzidente Kante vorzufinden, die er noch nicht abgelaufen ist. Diese Hoffnung ist zumindest für Graphen mit geraden Knotengeraden nicht trügerisch, wie das folgende Lemma beweist. BEMERKUNG 2.52. Beim Algorithmus 2.51 handelt es sich um einen so genannten Greedy-Algorithmus. Ins Deutsche übersetzt ist er also ein gieriger Algorithmus. Ein solcher Algorithmus versucht in jedem einzelnen Schritt die aktuelle Situation zu verbessern. Dabei berücksichtigt er nicht, dass eine vorübergehende Verschlechterung ihn in eine Situation bringen kann, die ihm in einem späteren Schritt bessere Optionen ermöglicht. ■

LEMMA 2.53. Sei G = (V, E) ein einfacher Graph dessen Knoten alle geraden Grad haben. Der Algorithmus FINDZYKLUSEULER(G, v) findet für jeden Knoten v E V einen Zyklus, der diesen berührt.

Beweis. Der Kantenzug s ist nach dem i-ten Durchlauf der While-Schleife ein Zyklus, wenn vi = vi±i ist. Es sei istop der erste Zeitpunkt zu dem dies der Fall ist, also der Zeitpunkt an dem die While-Schleife abbricht. Es ist zu zeigen, dass der Schritt 2 in der While-Schleife stets eine inzidente Kante zu vi findet, die noch nicht in s enthalten ist, so lange i < istop ist. Wir werden nun sogar zeigen, das es nach dem i-ten Durchlauf der WhileSchleife für alle Knoten v E V \ {vi,vi±i} eine gerade und für {vi, eine ungerade Anzahl von noch nicht in s enthaltenden inzidenten Kanten

100

WEGE DURCH GRAPHEN

gibt, so lange i < istop. Daraus folgt die Behauptung. Wir beweisen induktiv über i, dass dies der Fall ist. Induktionsverankerung: Vor dem ersten Schleifendurchlauf ist der Kantenzug s leer und keine Kante ist in s. Da G zusammenhängend ist, ist insbesondere deg(vi) 0, es gibt also eine zu vi inzidente, nicht in s enthaltende Kante ei = (vi, v2). Nachdem diese in s eingefügt wurde, ist v1 inzident zu genau einer Kante in s. Das gleiche gilt für v2. Es ist vi # v2, weil G einfach ist. Da jeder Knoten in G geraden Grad hat, sind nun vi und v2 inzidient zu einer ungeraden Anzahl in s enthaltender Kanten und 1 = i < istop. Induktionsannahme: Es sei i E N so, dass i < istop und es nach dem i-ten Durchlauf der While-Schleife genau für die Knoten V \ {vi, vi} eine gerade Anzahl inzidenter nicht in s enthaltender Kanten gibt.

\l

•

V1 V2 V3

vi-1vi

Abb. 2.27. Skizzen zum Algorithmus FindEulerZyklus.

Induktionsschluss: Vor dem (i 1)-ten Durchlauf der While-Schleife ist vz+i mindestens zu einer nicht in s enthaltenden Kante inzident. Denn nach Induktionsannahme ist dies für eine ungerade Anzahl von solchen Kanten der Fall. Ist dies Kante ebenfalls inzident zu vi, dann ist i 1 = istop. Ist diesee Kante nicht inzident zu vi, dann ist i 1 < istop und es ist e2+1 = (vi+i , v,4.2) mit vi+2 E V \ {vi,v,+1}. Der Knoten vo-2 ist nach Voraussetzung vor dem i 1-ten Durchlauf zu einer geraden Anzahl von nicht in s enthaltender Kanten inzident. Nach dem Einfügen der Kante e,+1 in s ist diese Anzahl ungerade. Analog ist vi±i nach dem Einfügen der Kante ez+1 in s inzident zu einer geraden Anzahl nicht in s ■ enthaltender Kanten.

SCHEMA

F 2.54 (Zyklen in einfachen Graphen mit geraden Knotengraden finden).

Eingabe: Einen einfachen Graphen G = (V, E) mit deg(v) gerade für alle v E V (mit einem Startknoten vi E V). Schritt 1. Wähle einen beliebigen Startknoten vi aus V (falls noch nicht ausgewählt). Schritt 2. Setzte den Weg s = 0. Schritt 3. Wähle eine beliebige nicht in s enthaltende zu vi inzidente Kante ei = (vi, v2 ) aus und füge sie s an. Führe dies sukzessive für die Knoten v2 , v3,

... durch bis vi = vi für ein j E N.

Schritt 4. Gebe den Weg s als einen vi berührenden Zyklus aus.

101

S► WEGE DURCH GRAPHEN

BEISPIEL 2.55.

Eingabe: Betrachte den einfachen Graphen G = (V, E) aus Abbildung 2.29. Tatsächlich sind alle Knotengrade gerade.

6 4 1 2

Schritt 1. Wähle mit vi = 3 einen Startknoten aus V aus. Schritt 2. Setzte den Weg s = 0. Schritt 3.

6 4

Wähle zu vi = 3 inzidente Kante ei = {3, 6} aus -> Wähle zu v2 = 6 inzidente Kante e2 = {6, 5} aus -> Wähle zu v3 = 5 inzidente Kante e3 = {5, 4} aus -> Wähle zu v4 = 4 inzidente Kante e4 = {4, 7} aus -> Wähle zu v5 = 7 inzidente Kante e6 = {7, 8} aus -+ Wähle zu v6 = 8 inzidente Kante e6 = {8, 5} aus -> Wähle zu v7 = 5 inzidente Kante e7 = {5, 2} aus -+ Wähle zu v8 = 2 inzidente Kante e8 = {2, 3} aus -+

6 4 1

Schritt 4. Gebe den Weg s = (3, 6, 5, 4, 7, 8, 5, 2, 3) als einen vi = 3 berührenden ■ Zyklus aus.

6 4

1

2

s = (3, 6). s = (3, 6, 5). s = (3, 6, 5, 4). s = (3, 6, 5, 4, 7). s = (3, 6, 5, 4, 7, 8). s = (3, 6, 5, 4, 7, 8, 5). s = (3, 6, 5, 4, 7, 8, 5, 2). s = (3, 6, 5, 4, 7, 8, 5, 2, 3).

2 3 Abb. 2.28. Skizzen zum Algorithmus

BEMERKUNG 2.56. Man kann an Beispiel 2.55 leicht erkennen, dass der gefundene Zyklus für einen festen Startknoten vi nicht eindeutig ist. Gibt es zu einem Zeitpunkt mehr als eine nicht in s enthaltende inzidente Kante, darf man sich eine von diesen frei wählen. Die unterschiedlichen Wahlen führen zu unterschiedlichen Zyklen. ■

FindEulerZyklus.

Mithilfe des Algorithmus FindZyklusEuler lassen sich sukzessive Zyklen in einem zusammenhängenden Graphen finden, die sich zu einem Eulerzug verbinden lassen, wie der folgende Satz von Euler-Hierholzer beweist. SATZ 2.57 (Satz von Euler- Hierholzer). Ein zusammenhängender Graph ist genau dann eulersch, wenn jeder Knoten geraden Grad hat. Beweis. Eine Richtung der Äquivalenz ist leicht, denn gibt es einen Knoten von ungeradem Grad, kann es nach Lemma 2.44 keinen Zyklus geben, der alle Kanten verwendet.

Wir nehmen also an, dass jeder Knoten in G geraden Grad hat. Außerdem nehmen wir an, dass G ein einfacher Graph ist. Hat G Schlingen, kann man diese Löschen und erhält einen einfachen Graphen. Das Löschen einer Schlinge an Knoten v reduziert den Grad von v um 2, er ist also weiterhin gerade. Die Schlingen können in jeden Eulerzug des einfachen Graphen eingefügt werden, um einen Eulerzug des ursprünglichen Graphen zu erhalten.

102

WEGE DURCH GRAPHEN

A

Wir gehen auf der Suche nach einem Eulerzug Schrittweise vor, indem wir das Problem auf immer kleiner werdende Teilgraphen aufteilen. Dazu findet man einen Zyklus Si = FINDZYKLusEuLER(G, v) für einen beliebigen Startknoten v E G. Dann löscht man alle Kanten aus si aus E und erhält einen Graphen G' = (V, E'). Da s1 ein Zyklus ist, reduzieren sich die Knotengrade nach Lemma 2.44 um eine gerade Zahl. Da die Knotengrade in G gerade sind, sind sie dies auch in G'. Der resultierende Graph G' zerfällt möglicherweise in Zusammenhangskomponenten. Allerdings ist gewährleistet, dass in jeder Zusammenhangskomponente mindestens ein Knoten von si in G berührt wird. Seien dazu mindestens zwei Zusammenhangskomponenten Gi und G'2 aus G' gegeben. Sei u ein Knoten aus G'1 und w ein Knoten aus G. Da G zusammenhängend ist, gibt es einen Weg s = (ei, , et ) in G von u nach w. Da u und w in zwei unterschiedlichen Zusammenhangskomponenten von G' liegen, muss es eine Kante et mit minimalen Index geben, die beim Löschen von si gelöscht wurde. Da et = (vz, vt+i) eine Kante in Si ist, wird v, von si in G berührt. Gleichzeitig ist vi jedoch auch in da der Weg (ei, ei-i) in G' enthalten ist und den Knoten vi mit v, verbindet. Sei für jede Zusammenhangskomponente ein solcher Knoten, der Si berührt, als Ankerknoten ausgezeichnet. Eulerzüge auf den Zusammenhangskomponenten lassen sich dann mit so zu einem Eulerzug auf dem Graphen G zusammenfügen, indem man den Eulerzug der Zusammenhangskomponenten an dem Ankerknoten in den ■ Zyklus so einfügt.

SCHEMA F 2.58 (Eulerzug finden). Eingabe: Einen zusammenhängenden Graphen G = (V, E). Schritt 1. Prüfe, ob alle Knoten geraden Grad haben. Wenn das der Fall ist, dann setze einen beliebigen Knoten v E V als Ankerknoten al = v und gehe zu Schritt 2. Ist dies nicht der Fall, dann ist G nicht eulersch. Schritt 2. Finde für den Ankerknoten ai als Startknoten mit Schema F 2.54 einen Zyklus Si in G, der al berührt. Schritt 3. Lösche die Kanten aus G und wähle in jeder Zusammenhangskomponente des resultierenden Graphen, der kein isolierter Punkt ist, einen Ankerknoten a2 , a3, ..., der von si in G berührt wird. Wieder-

103

k WEGE DURCH GRAPHEN hole die Schritte 2 und 3 für jede solche entstehende Zusammenhangskomponente mit dem Startknoten a2 , a3, ..., bis es keine Kanten mehr gibt. Schritt 4. Klebe die gefundenen Zyklen der Teilgraphen an den Ankerknoten zu einem Eulerzug von G zusammen. 7 8 9 • 5 6 4 41\e, 6 .3 6 • 1 2 7 8 • .3

.2

•

BEISPIEL 2.59. Eingabe: Wir betrachten den gleichen Graphen G = (V, E) wie in Beispiel 2.55. Er ist tatsächlich zusammenhängend

2 3 8 9

Schritt 1. Alle Knoten haben geraden Knotengrad, er ist also nach Satz 2.57 eulersch.

N

Schritt 2. Wir starten mit dem Knoten ai = 3 und finden mit dem Algorithmus FindEulerZyklus wie in Beispiel 2.55 einen Zyklus .81 = (3, 6, 5, 4, 7, 8, 5, 2, 3), der ai berührt.

6 4 5 •

.3

6

• 1 2 3 1 2 3

Schritt 3. Lösche die Kanten von s1 aus G. Wir erhalten zwei ZusammenhangsAbb. 2.29. komponenten G2 = (V2, E2 ) und G3 = (V3, E3), die keine isolierten Knoten sind Skizzen zum Algorithmus mit FindEulerZyklus. V2 = {1., 2, 4}, E2 = {{1, 2}, {1, 4}, {2,4}1 V3 = {6, 8, 9}, E3 = {{6, 8}, {6, 9}, {8, 9}1 In jeder dieser Zusammenhangskomponenten markieren wir einen Ankerknoten mit a2 = 2 und a3 = 6, der von s1 in G berührt wird. Wir wiederholen den Schritt 2 und 3 für die beiden Zusammenhangskomponenten und finden mit dem Algorithmus FindEulerZyxlus in .82 = (2, 4,1, 2) und s3 = (6, 8, 9, 6) je einen Zyklus, der die Ankerknoten a2 = 2 und a3 = 6 berührt. Löscht man die Kanten von s2 und s3 nun wie die Kanten von sl aus G, hat der Graph keine Zusammenhangskomponente mehr, die nicht bloß ein isolierter Knoten ist. Schritt 4. Wir kleben die gefundenen Zyklen an den Ankerknoten zusammen und erhalten einen Eulerzug mit a2 ai a3 = (3, 6,8,9,6,5,4,7,8,5, 2,4,1,2,3). s3

s2 81

Hamiltonkreise in Graphen Wir möchten uns nun ein den Eulerzügen verwandtes Konzept anschauen, die sogenannten Hamiltonkreise. Dabei besteht die Aufgabe nicht darin einen Zyklus über alle Kanten eines zusammenhängenden Graphen zu finden, sondern einen Kreis aufzutun, der jeden Knoten berührt. Der Eu-

104

WEGE DURCH GRAPHEN A

lerzug zielt auf die Verwendung aller Kanten eines Graphen, wobei Knoten möglicherweise mehrfach berührt werden, der Hamiltonkreis möchte alle Knoten genau einmal berühren und lässt dabei möglicherweise Kanten ungenutzt links liegen. Das Problem ist nach dem irischen Mathematiker Sir William Rowan Hamilton benannt. Er stellte die Aufgabe, einen Dodekaeder (ein regelmäßiges dreidimensionales Vieleck mit zwölf Seitenflächen) so über die Kanten abzulaufen, dass man jede Ecke einmal besucht und die Startecke mit der Zielecke übereinstimmt. Eine Abstraktion einer Weltreise, wie er fand. DEFINITION 2.60. Sei G = (V, E) ein Graph. Ein Kreis, der alle Knoten in V berührt, heißt Hamiltonkreis. BEISPIEL 2.61. Das Haus vom Nikolaus besitzt einen Hamiltonkreis. Man beginnt bei einem beliebigen Knoten und fährt nun die „außen" liegenden Kanten ab. Es ist zum Beispiel s = (1, 2, 3, 5, 4, 1) ein Hamiltonkreis, siehe Abbildung 2.30.

Der Graph aus Abbildung 2.31 besitzt keinen Hamiltonkreis.

■

Auf den ersten Blick ähnelt das Problem, einen Hamiltonkreis zu finden, der Suche nach Eulerzügen. Für das Finden von Eulerzügen haben wir ein einfaches, effizientes Verfahren kennen gelernt. Vielleicht ist es überraschend, dass das Hamiltonkreisproblem zu den besonders schwer algorithmisch zu lösenden Problemen zählt. Es gibt bis heute keinen bekannten effizienten Algorithmus zum Auffinden von Hamiltonkreisen in einem zusammenhängenden Graphen.

4 Abb. 2.30. Ein Graph G aus Beispiel 2.61 mit Hamiltonkreis.

Das Hamiltonkreisproblem ist in einer speziellen Variante auch unter dem Namen des „Problems des Handlungsreisenden" oder im Englischen „Travelling salesman problem" (kurz TSP) bekannt. Die Aufgabenstellung ist schnell umrissen. Ein Händler möchte, bei seinem Heimatort beginnend 6 eine Zahl, sagen wir 54 Städte besuchen, um seine Waren dort anzubieten. Wir nehmen an, dass es zwischen je zwei Städten auf seiner Liste eine di- 1 2 3 rekte Verbindung ohne Umwege (Luftlinine) gibt. In welcher Reihenfolge Abb. 2.31. soll der Händler nun die Städte besuchen? Immerhin gibt es 53! 1069 Der Graph G aus Beispiel 2.61 ohne mögliche Routen. Das sind mehr als es Moleküle im ganzen Universum Hamiltonkreis. gibt (ca. 1068). Die Abstraktion dieses Problems ist ein vollständiger Graph mit Kantengewichten, wobei die Knoten die Städte, die Kanten die Verbindungen und die Gewichte den Entfernungen entsprechen. Eine Reiseroute entspricht einem Hamiltonkreis. Da jegliche Kanten in dem Graphen vorhanden sind, ist jede Reihenfolge des Städtetripps erlaubt, ein Hamiltonkreis.

105

S. WEGE DURCH GRAPHEN

Den Unterschied machen alleine die Gewichte der verwendeten Kanten, denn diese stehen für die zurückgelegte Entfernung auf der Reise. Die Aufgabe besteht nun darin eine Reihenfolge der Städte zu finden, so dass die Summe der Kantengewichte der verwendeten Kanten minimal ist. Dass es sich bei dieser Fragestellung nicht um reine Spielerei handelt, leuchtet schnell ein. In der Logistik, bei der Planung von Touren jeglicher Art oder bei der Anordnung von Bauteilen, zum Beispiel auf Mikrochips, taucht dieses Problem praktisch relevant auf. Dabei entspricht die Abstraktion den problemspezifischen Objekten. Die Knoten repräsentieren dabei beispielsweise die Bauelemente auf einem Chip und die Gewichte dort tatsächlich auch ihrem Abstand. Aufgrund der hohen praktischen Relevanz wurde die letzten 100 Jahre viel an diesem Problem geforscht. Viele Optimierungsverfahren und Heuristiken für spezifische Fälle wurden dabei entwickelt. Das Problem gilt als sogenanntes „Benchmark"-Problem (dt. Bezugspunktproblem) um Optimierungsverfahren zu testen. Funktionieren Optimierungsverfahren für das TSP, dann möglicherweise auch für andere (nicht so schwere) Optimierungsprobleme. Obwohl das Problem im worst-case Fall algorithmisch nicht effizient zu lösen ist, gibt es für praktische, in der Realität auftauchende Problemfälle, äußerst effiziente Heuristiken und exakte Algorithmen zum Auffinden optimaler Routen.

2.3.2 Kürzeste Wege finden - der Dijkstra-Algorithmus

In einem gewichteten Graphen G = (V, E) kann man auch Teilgraphen ein Gewicht zuordnen, indem man die Gewichte der verwendeten Kanten addiert. Dann unterscheiden sich zum Beispiel verschiedene Wege in einem Graphen möglicherweise auch durch ihr Gewicht. Gibt es zwischen zwei Knoten v, w E V mehr als einen Weg, dann berechnet sich das Gewicht dieser verschiedenen Wege als Summe der Gewichte der jeweils involvierten Kanten. Im Kontext von Wegen spricht man vermutlich intuitiver von Längen. Betrachtet man allgemeine Teilgraphen in gewichteten Graphen, spricht man in der Regel von Gewichten. DEFINITION 2.62. Sei G = (V, E) ein gewichteter Graph mit der Gewichtsfunktion g : E —> R>0 und G' = (V', E') ein Teilgraph von G.

106

WEGE DURCH GRAPHEN

A

Dann nennen wir w(G') =

E g(e). eE

das Gewicht von G' in G. Wir führen weitere Notation im Kontext gewichteter Teilgraphen ein. D EFINITION 2.63. Ist der Teilgraph eines gewichteten Graphen ein Kantenzug s = (ei,. . er ) dann nennen wir das Gewicht i(s)

Eg(ei).

von s auch die gewichtete Länge von s. Für zwei Knoten u, v E V nennt man distG(u, v) =

min{w(s) : s ist Weg von u nach v} w von v erreichbar sonst oo

den (gewichteten) Abstand von u und v in G. BEMERKUNG 2.64. Wird aus dem Kontext klar, dass sich der Abstand auf den Graphen G bezieht, schreibt man statt distG (u, v) auch einfach dist(u, v) für den • Abstand zweier Knoten u und v.

Wir lernen nun einen Algorithmus kennen, welcher für einen gewichteten Graphen und einen beliebigen Knoten v E V den Abstand zu einem weiteren Knoten w E V berechnet. Anders formuliert suchen wir nach dem kürzesten Weg von v nach w. Algorithmus 2.65 (DIJKSTRA-ALGORITHMUS). Input: Ein gewichteter Graph G = (V, E) mit Gewichtsfunktion g : E 118>o und einen Knoten vo E V. Output: Für alle w E V den kürzesten Weg von vo nach w. 1. Setze d(vo) = 0 und B = 0. 2. Setze d(w) = oo und a(w) = 0 für alle v.) E V \ {vo} while B # V do 3. Wähle einen Knoten u E V \ B mit d(u) = min„E v B{d(v)} 4. Setze B = B U {u}. for all u‚ E N(u) \ B do if d(u') > d(u) + g(fu, u'l) then

107

WEGE DURCH GRAPHEN

5. Setze d(u') = d(u) + g({u, u'}) 6. Setze a(u') = u end if end for end while 7. Gib d(w) für alle w E V aus als kürzesten Weg von vo nach w.

Der Algorithmus „besucht" nach und nach die Knoten des Inputgraphen G. Während dieses Prozesses speichert er schon besuchte Knoten in der Menge B. In den Listen d(w) und a(w) wird der „aktuelle Abstand" und der „aktuelle Vorgänger auf dem aktuell kürzesten Weg" von w zu vo gespeichert. Der Zusatz „aktuell" deutet darauf hin, dass nur Pfade über schon besuchte, also Knoten in B, dabei berücksichtigt werden. Für jeden weiteren besuchten Knoten, der in B hinzugefügt wird, kann sich dieser Abstand reduzieren (und entsprechend der aktuelle Vorgänger verändern). Zu Beginn ist kein Knoten besucht und einzig der Abstand von Knoten vo ist auf 0 gesetzt. Der Abstand d(w) aller übrigen Knoten w E V \ {vo} ist auf oo und der Vorgänger a(w) gleich der leeren Menge gesetzt, es gibt schlicht noch keinen Weg von vo zu irgend einem anderen Knoten in G über Knoten aus B. Ist ein Knoten besucht worden, dann befindet er sich in B und sein Abstand und Vorgänger wird bis zum Schluss nicht mehr verändert. Wir möchten jetzt zeigen, dass dieser Algorithmus tatsächlich kürzeste Wege berechnet. Man sagt, dass wir die Korrektheit des Dijkstra-Algorithmus nun prüfen. SATZ 2.66. Der Dijkstra-Algorithmus berechnet für jeden Knoten u E V in einem zusammenhängenden Graphen G = (V, E) kürzeste Wege s„, = vo = a(vi), vi = a(v2), • • • vi -i = a(vi), vi der Länge dist(vo, u) = d(u) zu einem ausgezeichneten Knoten vo. Beweis. Zunächst machen wir uns klar, dass der Algorithmus terminiert. Er bricht also nach endlich vielen Schritten ab. Da der Algorithmus nach n Schritten alle Knoten besucht hat, gibt er nach n, also endlich vielen Schritten, die berechneten Daten aus. Es seien die Knoten indiziert in der Reihenfolge der Besuche, also vo, VI, V2, • • • , Vn—l• Wir führen eine vollständige Induktion über den Index i der Reihenfolge der Besuche. Es sei dazu B, die Menge der besuchten Knoten bevor Knoten v, besucht wird. Induktionsverankerung: Der Knoten vo selbst wird über den leeren Weg

108

WEGE DURCH GRAPHEN

Ä

so von vo zu vo erreicht, dieser hat Länge 0, Dijkstra berechnet d(vo ) = 0 und es ist dist(vo) = 0. Induktionsannahme: Sei nun ein i E N mit 0 < i < n — 1 fest gewählt und es gelte für alle vj E Bi, dass vj über den Weg s j über die Knoten vo = a(wi ), wi = a(w2), , wr = a(vj), vj erreicht wird. Außerdem ist der Weg sj ein kürzester Weg von vo nach vj der Länge dist(vo, vj) = d(vi). Induktionsschluss: Es sei vi+i der Knoten, der über den Weg si+1 über die Knoten vo = a(wi), wi = a(w2), ,W r = a(vi+i), vi±1 erreicht wird. Es gibt zwei Möglichkeiten, wie ein kürzester Weg von vo bis vi+1 verlaufen kann. Fall 1 - Es sei s ein Weg von vo zu vi+1 mit Knoten sowohl in B, als auch in V \ 13,4_1. Sei w' der erste Knoten auf dem Weg s, der nicht in B, liegt und sei w der zu w' adjazente Knoten in Bi. Dann zerfällt der Weg s in drei Abschnitte. Einen Weg von vo nach w, die Kante von w nach w' und einen Weg von w' zu vo-i. Nach Induktionsannahme ist di+i (w) = dist(vo, w) und somit ist der erste Abschnitt von s durch dist(vo, w) nach oben beschränkt. Es gilt also dist(vo, w) + g({w, w'})

dist(si+i),

wobei sw,,„ der Weg ist, der s,,±1 zwischen w' und vz+1 entspricht. Da w besucht ist, gilt (w') < di±i (w') + g({w, w'}) = d(ui)-1- g(w,w') = dist(vo, + g({w, Da w' nicht in Bo_i enthalten ist, wird w' erst nach v,+1 besucht, es gilt also di±i < do,i(w /). Also gilt di+i (vi+i ) < di+i (w') < dist(vo, w) + g({w,

< e(si-f-i)•

Fall 2 - Es sei s ein Weg von vo zu vi+1 über Knoten alleine in g+1. Seien die vor vi+i besuchten Nachbarknoten von vi±i indiziert mit wi , • • • , wt • Dann zerfällt s in zwei Abschnitte. Einen Weg s j von vo bis zu einem Nachbar /v.; von v.,+1 und die Kante (wj, vi+i) für ein j E {1, ... t}. Es gilt also £(s) = e(sj)± g({wi,vi+11). Das heißt, eine kürzester Weg von

109

S. WEGE DURCH GRAPHEN vo zu vi±i über vi involviert einen kürzesten Weg von vo bis wi. Kürzeste Wege von vo nach wi haben nach Induktionsannahme die Länge d(wi) = dist(vo, wi ). Der kürzeste Weg von vo nach vi+1 führt über den Knoten wj, für welchen d(w;) g ({wi , vi+1 }) minimal ist unter allen vor vi+1 besuchten Nachbarn von vi+i. Der Vorgänger w* = a(vi+i) hat diese Eigenschaft. Gäbe es einen von a(vi+i) verschiedenen vor vi+1 besuchten Nachbarn w** von vi+i mit d(w**) g ({w* * ,vi+1}) < d(w*) g ({w* vi+1.}),

(2.1)

dann gibt es zwei Fälle. Fall 2.1 - Es wird w** vor w* besucht. Dann wird w* aufgrund der Ungleichung (2.1) beim Besuch von w* nicht als Vorgänger ausgezeichnet. Ein Widerspruch, dass w* der Vorgänger von v„+1 ist. Fall 2.2 - Es wird w** nach w* besucht. Dann wird w** aufgrund der Ungleichung 2.1 beim Besuch von w** als Vorgänger ausgezeichnet. Ein Widerspruch, dass w* der Vorgänger von v,±1 ist. Es führt also ein kürzester Weg von vo nach vi+i über einen kürzesten Weg von vo zum Vorgänger w* = a(vi+i ) von v,+1. Nach Induktionsannahme ist der Weg s* über die Knoten vo = a(wi), w1 = a(w2),

,Wr = a(w*), w*

ein kürzester Weg der Länge d(w*) von VO zu w*. Demnach ist der Weg über die Knoten vo = a(w wl = a(w2),

, wr = a(a(v,.+1)), vr_Fi = a(v2+1),

ein kürzester Weg von vo nach vi±i der Länge d(vz+i ), was zu zeigen war.

■

SCHEMA F 2.67 (Kürzeste Wege in gewichteten Graphen finden). Eingabe: Ein gewichteter Graph G = (V, E) mit Gewichtsfunktion g : E —> 118> 0 und einen Knoten vo E V. Schritt 1. Setze den Abstand d(vo) = 0 und die Menge der besuchten Knoten B = 0 sowie die Abstände d(w) = oo und a(w) = 0 für alle w E V \ {vo}. Schritt 2. Wiederhole die Schritte 2.1 und 2.2 bis alle Knoten besucht sind, also B = V ist.

110

WEGE DURCH GRAPHEN A

Schritt 2.1. Wähle einen Knoten u E V \B mit d(u) = min.„E v B{d(v)} und setze B = B U {u}. Schritt 2.2. Für alle nicht besuchten Nachbarn von u, also u' E N(u) \ B setze d(u') = d(u) g ( [u , u'}) und a(u') = u wenn d(u') > d(u) g (ft u'}). Schritt 3. Gebe d(v) und a(v) für alle v E V aus.

6 BEISPIEL 2.68.

Eingabe: Wir betrachten den Graphen G = (E; V) aus Abbildung 2.32 mit der Gewichtsfunktion g : E —rill mit g({1, 2}) = 1, g({1, 3}) = 5, g({1, 4}) = 3, g({2, 4}) = 1, g({3,4}) = 1, g({3,5}) = 3, g({4, 5}) = 2

Init.

oo co co oo

1 1 2 Abb. 2.32. Der gewichtete Graph aus Beispiel 2.22.

Schritt 1. Es ist Abstand Knoten 1 2 3 4 5 6

3

Vorgänger 123456

B

\ 0 00 0 0

0

Schritt 2. Schritt 2.1 Wir wählen die Knoten u E V \ U in der Reihenfolge 1, 2, 4, 3, 5, 6 und erhalten die unter Schritt 2.2 aufgeführten Daten. Schritt 2.2 Wir erhalten diese Belegungen der Variablen in den einzelnen Schleifendurchläufen. Vorgänger Abstand B Knoten 1 2 3 4 5 6 1 2 3 4 5 6 Init. 0 oo oo oo oo oo

\0000 0

0

u = 1 0 1 5 3 00 00

\ 1 11 0 0

{1}

u = 2 0 1 5 2 00 00

\1120 0

{1,2}

u = 4 0 1 3 2 500

\1424 0

{1,2,4}

u = 3 0 1 3 2 5 00

\1424 0

{1,2,4,3}

u = 5 0 1 3 2 5 oo

\1424 0

{1,2,4,3,5}

u = 6 0 1 3 2 5 oo

\1424 0

{1,2,4,3,5,6}

Es wird zum Beispiel im Schleifendurchlauf u = 4 der Abstand des Knotens 3 verändert, weil 5 = d(3) > d(4) g({3, 4}) = 2 + 1 = 3 ist. Schritt 3. Der kürzeste Weg vom Knoten 1 zum Knoten i E {2, 3, 4, 5, 6} beträgt d(i) mit d(2) = 1,

d(3) = 3,

d(4) = 2,

d(5) = 5

111

S. BÄUME über die Vorgänger a(2) = 1,

a(3) = 4,

a(4) = 2,

a(5) = 4.

2.4 Bäume

Graphen können unübersichtliche sein, es kann viele Wege zwischen ein und dem selben Knotenpaar geben. Wir möchten nun Graphen kennen lernen, in denen es höchstens einen Weg zwischen jedem Knotenpaar gibt. Solche Graphen, Wälder bzw. Bäume genannt, finden in der Informatik vielfältige Anwendung. Ein Beispiel sind Suchbäume. Dabei sind die zu durchsuchenden Daten an den Knoten eines Graphen, in diesem Fall einem Baum, befestigt. Beginnend an einem Knoten arbeitet sich ein Suchalgorithmus stets in alle Richtungen, durch diesen Graphen. Dabei • möchte er nicht öfter als nötig, die Information an einem Knoten auf die Suchanfrage hin überprüfen, der Weg zu jedem Knoten soll eindeutig sein. Abb. 2.33. DEFINITION 2.69. Einen Graphen, der keinen Kreis enthält, nennen wir Dieser Graph ist kein Wald und kein einen Wald. Ist er zusätzlich zusammenhängend, nennen wir ihn einen Baum. Baum. Ein Knoten in einem Baum mit Grad 1 wird Blatt genannt, alle anderen Knoten innere Knoten. Manche Bäume besitzen einen besonders • ausgezeichneten Knoten, der Wurzel genannt wird. Hat ein Baum eine Wurzel, wird er auch als gewurzelt bezeichnet. BEMERKUNG 2.70. Die Bezeichnung als Baum ist intuitiv eingängig. Ein Baum in der Natur wächst auch stets beginnend am Stamm in alle Richtungen, wobei er Abb. 2.34. sich immer weiter verästelt. Dabei wachsen zwei Äste in der Regel nicht wieder Dieser Graph ist ein Wald und kein zusammen. Zwei Punkte in der Krone eines Baums sind durch einen eindeutigen Baum. Weg über die Äste verbunden. ■ BEISPIEL 2.71. Der Graph in Abbildung 2.33 ist kein Wald, er besitzt Kreise. Der Graph in Abbildung 2.34 ist ein Wald, weil er keine Kreise enthält. Er ist allerdings nicht zusammenhängend und damit kein Baum. Der Graph in Abbildung 2.35 ist ein Baum, weil er keine Kreise enthält und zusammenhängend ist. Er hat vier innere Knoten und drei Blätter. ■

Abb. 2.35. Dieser Graph ist ein Wald und ein Baum. Wir möchten nun zeigen, dass die beschreibende Eigenschaft „in einem

Baum sind je zwei Knoten über genau einen Weg miteinander verbunden" und die definierende Eigenschaft „ein Baum ist kreisfrei" gleichbedeutend 112

BÄUME

sind. 2.72. Es sei G = (V, E) ein Graph. Es ist G genau dann ein Baum, wenn es zwischen je zwei Knoten v, w E V genau einen Weg gibt. LEMMA

Beweis. Wir zeigen zwei Richtungen der Äquivalenz. Wir nehmen an, G ist ein Baum und es gibt zwei Knoten in v, w E V = w die mit zwei Wegen si , .92 von v nach w. Seien v = = w die Knoten auf Knoten auf Weg si und seien v = v,vL Weg s2 . Dann gibt es einen Index i1, so dass v.; = 'z). für alle j < +1. Des Weiteren gibt es zwei Indices d und d so dass aber zdi v22 für alle i1 < j1 < i2 und i1 < j2 < d, aber= v2.2. Also v'1 3 3 i2 z2 die keinen Knoten gemeinsam erhält man zwei Wege von vi, zu vl1 = 2 - ein Widerspruch, da G ein haben. Diese beiden Wege bilden dnen Kreis Baum und deshalb per Definition kreisfrei ist. Wir zeigen die Aussage über die Kontraposition. Angenommen G ist kein Baum. Dann gibt es zwei mögliche Gründe. Fall 1 - Der Graph G ist nicht zusammenhängend. Dann gibt es zwei Knoten v, w E V, so dass es keinen Weg zwischen v und w in G gibt. Dann gibt es also nicht für je zwei Knoten in v, w E V genau einen Weg von v nach w. Fall 2 - Im Graph G gibt es einen Kreis. Wir bezeichnen diesen Kreis mit s und wählen eine Kante e aus s aus. Dann gibt es zwischen den Endknoten von e einen Weg über die Kante e und über einen weiteren Weg, den Kreis ohne die Kante e. Es gibt also zwischen diesen Knoten mehr als einen Weg und damit nicht für je zwei Knoten in v, w E V genau einen Weg von v nach w. ■

Die Kreisfreiheit von Bäumen hat zur Folge, dass ein Baum, entfernt man eine Kante, nicht mehr zusammenhängend ist. Man kann also auch sagen, dass ein Baum minimal zusammenhängend ist. 2.73. Entfernt man eine Kante aus einem Baum, ist er nicht mehr zusammenhängend. KOROLLAR

Beweis. Es sei G = (V, E) ein Baum. Sei e = (v, w) eine Kante aus E. Dann gibt es nach Lemma 2.72 genau eine Weg von v nach w. Die Kante e ist ein solcher Weg. Entfernt man e, dann gibt es keinen Weg von v nach

113

BÄUME

w, der Graph ist also nicht mehr zusammenhängend.

■

Man kann einen Baum also über die Eindeutigkeit von Wegen, die Kreisfreiheit oder die Minimalität des Zusammenhangs beschreiben. Es gibt noch eine vierte Möglichkeit: Das Verhältnis von Ordnung und Größe. SATZ 2.74. Sei G = (V, E) ein Graph der Ordnung n und Größe m. Dann ist G genau dann ein Baum, wenn m = n — 1 gilt. Beweis. Wir beweisen die Aussage über vollständige Induktion über die Ordnung von G. Induktionsverankerung: Sei n = 1, dann gibt es nur einen kreisfreien Graphen, nämlich den ohne Kanten, also m = n — 1 = 0. Jeder weitere Graph, der eine Kante enthält, enthält eine Schleife und ist somit nicht kreisfrei. Induktionsannahme: Es ist für eine natürliche Zahl n jeder Graph der Ordnung n genau dann ein Baum, wenn m = n — 1 gilt. Induktionsschluss: Es sei G = (V, E) ein Graph der Ordnung n 1. Entfernt man einen beliebigen Knoten v E V und dessen inzidenten Kanten aus G, erhält man einen Graphen G' mit Ordnung n und Größe 1E1 — deg v . ■

2.4.1 Spannbäume Es ist immer möglich, in einem zusammenhängenden Graphen G = (V, E) einen Teilgraph auf der gesamten Knotenmenge zu finden, der ein Baum ist. Einen solchen Baum nennt man eine aufspannende Struktur von G. Man löscht quasi überflüssige Kanten, so dass der Graph immer noch zusammenhängend ist. Dabei ist nicht gesagt, dass dieser Baum eindeutig ist. DEFINITION 2.75. Es sei G = (V, E) ein zusammenhängender Graph. Dann nennt man einen zusammenhängenden Teilgraphen G' auf ganz V einen Spannbaum, wenn er ein Baum ist. BEMERKUNG 2.76. Ein Spannbaum wird sinniger Weise auch als das Gerüst, Skelett oder als aufspannender Baum eines Graphen bezeichnet. Für zusammenhängende Graphen kann man einen Spannwald definieren, der aus Spannbäumen der Zusammenhangskomponenten besteht.

114

BÄUME

de

Nach Satz 2.74 hat jeder Baum auf n Knoten genau n — 1 Kanten. Die Güte eines Spannbaums lässt sich also nicht durch seine Größe bemessen. Er ist im Allgemeinen auch nicht eindeutig und dennoch gilt nach Satz 2.74, dass zwei ■ unterschiedliche Spannbäume die gleiche Anzahl an Kanten besitzen. BEISPIEL 2.77. Es sei der Graph aus Abbildung 2.14 gegeben. Dieser besitzt genau ■ 21 Spannbäume, wie in Abbildung 2.4 gezeigt. SATZ 2.78. Jeder zusammenhängende Graph besitzt einen Spannbaum. Beweis. Sei G = (V, E) ein zusammenhängender Graph der Ordnung n und der Größe in. Dann ist er nach Satz 2.74 genau dann ein Baum, wenn m = n — 1 ist. Gilt rn = n — 1, dann ist G ein Baum und somit sein eigener Spannbaum. Ist m > n 1 dann ist G kein Baum. Es gibt also einen Kreis in G. Löscht man eine beliebige Kante e E E aus einem Kreis in G ist der resultierende Graph G' immer noch zusammenhängend. Denn für zwei Knoten v, w E G, die ein Weg über Kante e verbindet, verbindet auch ein Kantenzug, der statt der Kante e die übrigen Kanten des Kreises involviert. Diese Kanten sind auch noch in G' enthalten, also gibt es einen Kantenzug von v nach w in G'. Nach Lemma 2.43 fällt jeder Kantenzug zu einem Weg zusammen. Der Graph G' ist also zusammenhängend und hat eine Kante weniger als G. Diesen Prozess führt man so lange aus, bis der resultierende Graph ein Baum ist. Dieser ist dann ein Spannbaum von ■ G.

Ein Graph - viele Spannbäume.

Der Beweis von Satz 2.78 gibt eine algorithmische Vorschrift zum Finden von Spannbäumen an. Man löscht sukzessive Kanten aus Kreisen, bis kein Kreis mehr existiert. Das setzt allerdings Kenntnis über die großen Zusammenhänge des Graphen voraus. Ein Graph kann sehr unübersichtlich werden, wie findet man Kreise? Es gibt Verfahren, die sogenannte Breiten- v oder Tiefensuche, mit denen Kreise effizient gefunden werden können. Abb. 2.37. Die nähere Betrachtung dieser Verfahren sprengt den Rahmen unserer Ein Graph - viele Spannbäume. Einführung in die Graphentheorie, wir verwenden sie als Blackbox um das folgende Schema F formulieren zu können. SCHEMA

F 2.79 (Spannbaum finden).

Eingabe: Einen zusammenhängenden Graphen G = (V, E) mit Ordnung I VI = n. Schritt 1. Wiederhole den Schritt 1.1 so lange, bis der resultierende Graph genau n — 1 Kanten oder

gleichbedeutend keinen Kreis mehr besitzt.

115

w

BÄUME Schritt 1.1. Wähle einen Kreis s aus G und lösche eine beliebige Kante von s aus G. Schritt 2. Gib den Graphen mit den gelöschten Kreiskanten als Spannbaum von G aus.

BEISPIEL 2.80. Wir wenden das Schema F 2.79 an. Siehe dazu auch Abbildung 2.38. Eingabe: Wir betrachten wieder den Graphen G = (V, E) aus Abbildung 2.14. Schritt 1. Wir wählen zunächst den Kreis si = (1, 3, 4, 1) und löschen die Kante {1, 4}. Dann wählen wir den Kreis s2 = (2, 3, 4, 2) und löschen die Kante {2, 3}. Und schließlich wählen wir den Kreis 83 = (2, 4, 7, 2) und löschen die Kante {4, 7}.

3

3

6

6

Schritt 2. Gib den Graphen mit den gelöschten Kreiskanten als Spannbaum, in diesem Fall den Graphen G' = (V, E') mit = {{1, 3}, {3, 4}{4,2}{2, 7}{7, 5}{5, 6}1, aus.

■

5 3

3

6 Abb. 2.38.

2.4.2 Minimale Spannbäume finden - der Kruskal-Algorithmus

Spannbäume in einem Graphen finden Wir wissen nun, dass jeder zusammenhängende Graph mindestens einen zu Beispiel 2.80.

Spannbaum besitzt und dass man einen finden kann. Häufig ist man allerdings an einem Spannbaum eines gewichteten Graphen interessiert. Dann sucht man nicht nur einen Spannbaum, sondern den Spannbaum mit maximalem oder minimalem Gewicht.

Algorithmus 2.81 (KRUSKAL-ALGORITHMUS). Input: Ein gewichteter, zusammenhängender Graph G = (V, E) mit Gewichtsfunktion g : E —> R. Output: Einen Spannbaum von G mit minimalem Kantengewicht. 1. Sortiere die Kanten in E nach ihrem Gewicht aufsteigend el, • • em . 2. Setze E' = 0 for all i = 1, , m do if der Graph G' = (V, E' U {ei}) ist kreisfrei then 3. Setze E' = u feil end if end for 4. Gib G' = (V, E') aus.

Auch dieser Algorithmus nutzt einen recht naiven Ansatz. Die Kanten werden einfach nach aufsteigenden Gewichten sortiert und dann einzeln der Reihe nach in einer Kantenmenge E' gespeichert. Dabei ist die Kantenmenge E' zu Beginn leer und wird dann um eine Kante ei ergänzt, wenn durch das Hinzufügen von ei kein Kreis entsteht.

116

BÄUME

A

BEMERKUNG 2.82. Berechnet der Kruskal-Algorithmus einen mininmalen Spannbaum, was er, wie wir in Satz 2.83 sehen werden, tut, so ist dieser nicht eindeutig. Die Sortierung der Kanten in Schritt 1 ist im Allgemeinen nicht eindeutig. Gibt es Kanten mit gleichem Gewicht, lassen sich diese untereinander in der Reihenfolge vertauschen (permutieren), wobei die Eigenschaft einer Sortierung aufsteigender ■ Gewichte erhalten bleibt.

SATZ 2.83. Der Kruskal-Algorithmus berechnet für einen gewichteten, zusammenhängenden Graphen G = (V, E) mit Gewichtsfunktion g : E —> R einen minimalen Spannbaum. Beweis. Der Algorithmus terminiert, weil er die endlich vielen Kanten in E durchläuft und dann abbricht. Nun zeigen wir, dass die Ausgabe G' = (V, E') tatsächlich ein minimaler Spannbaum von G ist. Zusammenhang. Angenommen es gibt zwei Knoten v und w, so das w C(v) C(w) in G' nicht von v erreichbar ist. Seien C(v) die Knoten, die von v in G' erreichbar sind und seien C(w) die Knoten, die von w in G' erreichbar sind. Dann gibt es, da G zusammenhängend ist, Wege in G von Knoten in C(v) zu Knoten in C(w). Sei s ein solcher Weg und sei ui der letzte Abb. 2.39. Knoten auf diesem Weg in C(v). Sei v,2 der nächste Knoten auf s nach Zusammenhang des Outputgraphen des ui. Dann ist u2 nicht in C(v) und deshalb nicht von v erreichbar. Es gibt Kruskal-Algorithmus. also keinen Weg in G' von v und insbesondere von ui zu u2. Also erzeugt das Einfügen der Kante {ui, u2} keinen Kreis. Würde es das, gäbe es bereits einen Weg von ui nach u2, was wir mit der Wahl von ui und u2 ausgeschlossen haben. Daraus folgt direkt der Zusammenhang und das G' ein Graph auf ganz V ist. Kreisfreiheit. Die if-Abfrage im Algorithmus garantiert die Kreisfreiheit der Ausgabe. Minimalität. Sei die Kantenmenge E' nach dem Überprüfen der i-ten Kante. Wir zeigen, dass es einen minimalen Spannbaum Si von G gibt, der Ei enthält in einer vollständigen Induktion über den Index i. Induktionsverankerung: Die Behauptung ist für i = 0 korrekt. Zum Zeitpunkt i = 0 wurde noch keine Kante überprüft, es ist E() = 0. Jeder Spannbaum von G enthält die leere Menge an Kanten. Jeder zusammenhängende Graph besitzt nach Satz 2.78 einen Spannbaum, jeder Abb. 2.40. gewichtete einen minimalen. Illustration von Fall 2.2. im Induktionsannahme: Wir nehmen an, dass die Behauptung für ein 0 < i < m wahr ist.

Induktionsschluss des Beweises von Satz 2.83

117

1

BÄUME

Induktionsschluss: Es gibt für die im (i 1)-ten Schritt überprüfte Kante ei+i drei Fälle. Fall 1 - Die Kante e,+1 wird nicht zu der Menge E' hinzugefügt. Dann enthält der minimale Spannbaum Si die Kantenmenge E41, was zu zeigen war. Fall 2.1 - Die Kante r',_ 1 wird zu der Menge E' hinzugefügt und es ist ei+i E Si. Dann enthält der minimale Spannbaum Si die Kantenmenge E41, was zu zeigen war. Fall 2.2 - Die Kante ea wird zu der Menge E' hinzugefügt und es ist e,±1 e Si. Seien ui und u2 die Endknoten von ei+i. Dann gibt es in Si genau einen Weg von ui nach u2 und die Kante ei+i ergänzt diesen Weg zu einem Kreis. In diesem Kreis gibt es nun eine Kante e', die nicht in EL liegt, denn sonst hätte ei±i nicht hinzugefügt werden dürfen. Außerdem ist g (e' ) > g(e+i).

(2.2)

Andernfalls wäre e' vor ei±i überprüft und eingefügt worden. Denn weil e' E Si ist, ist die Kante e' in keinem Kreis mit Knoten aus Ez enthalten. Entfernt man nun e' aus S, und fügt et+i hinzu, dann ist der resultierende Graph S,±1 ein Baum und kreisfrei. Außerdem ist das Gewicht von Si+1 mit (2.2) kleiner gleich dem Gewicht von Si. Da Si ein minimaler Spannbaum ist, ist das Gewicht von S„±1 sicher nicht kleiner, also gleich dem von Si. Also ist S,±1 ein minimaler Spannbaum von G.

SCHEMA F 2.84

(Einen minimalen Spannbaum finden).

Eingabe: Einen gewichteten, zusammenhängenden Graphen G = (V, E) mit Gewichtsfunktion g : E Schritt 1. Sortiere die Kanten in E nach ihrem Gewicht aufsteigend ei,

,

Schritt 2. Setze E' = 0. Schritt 3. Wiederhole den Schritt 3.1 für jede Kante ei mit i E {1, Schritt 3.1. Ist der Graph G' = (V, E' u feil) kreisfrei, setze E' =

118

, m} in aufsteigender Reihenfolge. U

]R.

BAUME

Schritt 4. Gib den Graphen G = (V, E') als minimalem Spannbaum von G aus. 5 BEISPIEL 2.85. Wir

wenden das Schema F 2.79 an. Siehe dazu auch Abbildung 10

2.42. Eingabe: Wir betrachten den zusammenhängenden, gewichteten Graphen G = (V, E) aus Abbildung 2.41. Schritt 1. Sortiere die Kanten in E nach ihrem Gewicht aufsteigend, also et = {1, 2} mit g(ei) = 1, e2 = {2, 4} mit g(e2) = e3 = {3, 4} mit g(e3) = 1, e4 = {4, 5} mit g(e4) = 2, e5 = {1,4} mit g(e5) = 3, es = {3, 5} mit g(e6) = = {1, 3} mit g(e7) = 5, e8 = {4, 6} mit g(e8 ) = 10.

3

1

4

2

Abb. 2.41. Der gewichtete Graph aus Beispiel 2.85.

Schritt 2. Setze E' = 0.

Schritt 3.1. Ist der Graph G' = (V, E' U {ei}) kreisfrei, setze E' = E' U

6

6

Schritt 3. Wiederhole den Schritt 3.1 für jede Kante ei mit i E {1, ... 772} in aufsteigender Reihenfolge.

3

10

4 3

4

10 3 5

= (V, E' U {{1,2}}) ist kreisfrei -› E' = {{1, 2}1. G' = (V, E' u {{2,4}}) ist kreisfrei Prüfe e2 : --> E' = {{1, 2}, {2, 4}}. = (V, E' u {{3,4}1) ist kreisfrei Prüfe e3 : -> E' =- {{1, 2}, {2, 4}, {3, 4}}. = (V, E' U {{4, 5}}) ist kreisfrei Prüfe e4 : -› E' = {{1, 2}, {2, 4}, {3, 4},{4,5}}. (V, E' u {{1,4}}) ist nicht kreisfrei Prüfe e5 : = {{1, 2}, {2, 4}, {3, 41, {4, 5}1. = (V, E' U {{3, 5}}) ist nicht kreisfrei Prüfe e6 : -E'= {{1, 2}, {2, 4}, {3, 4}, {4, 5}}. = (v, E' u {{1, 3}}) ist nicht kreisfrei Prüfe e7 : - E' = {{1, 2}, {2,4}, {3, 41, {4,5}1. = (V, E' u {{4,6}1) ist kreisfrei Prüfe e8 : = «1,4, {2, 4}, {3, 41, {4,5}, {4, 6}1. -

Prüfe ei :

Schritt 4. Gib den Graphen G = (V, E') mit

= {{1, 2}, {2, 4}, {3,4}, {4,5}, {4, 6}1 als minimalen Spannbaum von G aus.

1

3

2 1 6 5

2 6

10

10

4 3 1 5

4

2 1 6

2

10 3

4

1 Abb. 2.42. Die Suche nach einem minimalen Spannbaum des gewichteten Graphen aus Beispiel 2.85.

119

MATCHINGS

2.5 Matchings Häufig tritt das Problem auf, Objekten einer Menge ein eindeutiges Gegenüber in dieser zuzuordnen. Oder anders ausgedrückt, man sucht in einer Menge von Objekten Pärchen. Solche Problemstellungen können graphentheoretisch studiert werden. Als Graphen interpretiert, repräsentieren Knoten die Objekte, Kanten mögliche Pärchen. Man sucht dann einen Teilgraph, in welchem jeder Knoten höchstens Grad 1 hat. Das ist gleichbedeutend damit, dass der Teilgraph nur aus unzusammenhängenden Kanten besteht. Jede Kante repräsentiert ein zugeordnetes Pärchen. Knoten die Grad 0 haben, konnten keinem Gegenüber zugeordnet werden. Einen solchen Teilgraphen nennt man Matching oder Paarung. DEFINITION 2.86. Sei G = (V, E) ein Graph. Dann nennen wir eine Teilmenge M c E von G Matching, wenn der Maximalgrad des Graphen = (V, M) höchstens 1 ist. Knoten vom Grad 1 nennen wir gebunden, Knoten vom Grad 0 nennen wir frei. Gibt es kein von M verschiedenes Matching M' von G, so dass M c M' ist, nennen wir M ein lokal maximales Matching von G. Ist IMI > M'1 für alle Matchings M' von G, nennen wir M ein global maximales Matching von G. Ist der Minimalgrad von G' =- (V, M) gleich 1, dann nennen wir M ein perfektes Matching von G. 64 1 2 3 1 2 3 Abb. 2.43. Ein lokal und ein global maximales

BE ISPIEL 2.87. In Abbildung 2.43 sind für den Graphen G = (V, E) mit V = {1,2,3,4,5,6,7,8,9} E -= {{1, 2}, {2, 5}, {3, 6}, {4, 5}, {5, 6}, {5, 8},16, 9}, {7, 8},{8, 9}}

Matching. sowohl ein lokal (aber nicht global) maximales Matching

Ml= {{1,2},{5,6}, {7,8}1 und ein global (und auch lokal) maximales Matching M2 = {{1,2},{3,6}, {4, 5}, {7, 8}} 2 Abb. 2.44. Ein perfektes Matching.

eingezeichnet. Dieser Graph besitzt kein perfektes Matching. Der Teilgraph

= (V', E') von G mit V' = V {3}

und

E' = E \ {13, 61}

besitzt ein perfektes Matching, wie in Abbildung 2.44 zu sehen ist.

120

■

MATCHINGS

A

2.5.1 Der Heiratssatz von Hall

Man kann nun verschiedene Fragen stellen. Ist es immer möglich einen Matching zu finden, welches jeden Knoten involviert? Wenn nicht, was sind die Kriterien an den Graph, dass dies möglich ist? Oder kann man wenigstens effizient ein Matching mit möglichst vielen Kanten finden? In einer gewichteten Version kann man nach dem Matching mit dem größten Gewicht fragen. Ein frühes, sehr berühmtes Resultat Matchings betreffend ist der Heiratssatz von Hall. Benannt ist dieser Satz nach dem englischen Mathematiker Philip Hall, welcher diesen 1935 formulierte. Der Name des Satzes leuchtet ein, wenn man sich dessen Aussage näher betrachtet. Für einen bipartiden Graphen G = (V1 U V2, E) gibt Hall eine hinreichende Bedingung an die Kantenmenge E, so dass ein perfektes Matching existiert. Die spezielle Bezeichnung als „Heiratssatz" liefert die folgende Interpretation. Die Knoten der Knotenmenge V1 des bipartiden Graphen repräsentieren heiratswillige Frauen, entsprechend die Knoten der Knotenmenge V2 heiratswillige Männer. Eine Kante zwischen „Frauenknoten" v und „Männerknoten" W existiert in G genau dann, wenn die durch Knoten v vertretene Frau Interesse an dem durch Knoten w vertretenen Mann hat. Ein Matching verheiratet nun Frauen- und Männerknoten. Ein perfektes Matching zeigt an, dass jede Frau mit einem Mann verheiratet wurde und zwar mit einem, an dem sie auch Interesse hatte.

Anmerkung. Eine solche unromantische, kühle, emotionslose Sicht von Liebe kann wohl nur ein Mathematiker entwickeln. Der hoffnungslose Versuch eines Nerds das Problem des Liebeskummers zu lösen.

Eine notwendige Voraussetzung für die Existenz eines perfekten Matchings ist offensichtlich die folgende. Zählt man für eine beliebige Teilmenge von heiratswilligen Frauen die Zahl der für mindestens eine dieser Frauen in Frage kommenden Männer, sollte diese mindestens der Zahl der Frauen in der Teilmenge entsprechen. Ist dies nicht der Fall, steht man vor der unmöglichen Herausforderung eine größere Anzahl von Frauen mit einer kleineren Anzahl von Männern zu verheiraten (für jede Frau kommt ja sicherlich kein anderer Mann in Frage, sonst hätten wir ihn mitgezählt). Es ist also der klassische Fall auszuschließen, dass sich viele Frauen für nur wenige Männer interessieren. Erstaunlicherweise ist diese notwendige Bedingung auch hinreichend. Es kann also nicht passieren, dass auf ungünstige Verkettungen zurückgehende Widersprüche auftauchen, wenn die erwähnte Bedingung erfüllt ist. Es gibt also stets eine Zuordnung, so dass jede Frau einen präferierten Mann heiraten darf.

121

k MATCHINGS

2.88 (Heiratssatz von Hall). Sei G = (Vi U V2, E) ein bipartider Graph mit Vi I = I V2 I. Es gibt genau dann ein perfektes Matching in G, wenn für jede Teilmenge U C VI gilt SATZ

IN(U)I ?_

Bevor wir den Heiratssatz von Hall beweisen, möchten wir ein Konzept kennenlernen, welches häufig in Algorithmen und Beweisen zu Matchings Anwendung findet. DEFINITION 2.89. Sei G = (V, E) ein Graph und seien El und E2 Teilmengen von E. Dann heißt ein Kantenzug s alternierend bezüglich El und E2, wenn s nur Kanten aus El und E2 in abwechselnder Reihenfolge verwendet. Sei M ein Matching auf G. Ein alternierender Kantenzug s für Ei = E\ M und E2 = M heißt alternierend bezüglich M. Sind zusätzlich die Endknoten von s frei, nennt man s erweiternd bezüglich M. BEMERKUNG 2.90. Erweiternde Wege involvieren genau eine Kante mehr, die nicht in M liegt, als Kanten, die in M liegen. Mit erweiternden Wegen lassen sich ■ also größere Matchings konstruieren, wie in Lemma 2.93 gezeigt. 5 10

8

13

14

6

BEISPIEL 2.91. Der Graph G = (V, E) mit V = {1, 2, 3,4,5, 6, 7,8,9,10,11,12,13,14,15} E = {{1, 2}, {2, 3},12, 81, {4, 10}, {5, 6}, {6, 12}, {7, 8}, {8, 9}, {9, 10}, {9, 14}, {10, 11}, {13, 14}, {14,15}1

11 12

15 Abb. 2.45.

aus Abbildung 2.45 besitzt alternierende Wege bezüglich der Kantenmengen

Alternierende Wege des Graphen G aus Beispiel 2.91. 7 8 • • 4

E1 = {{1,2}, {2, 3}, {4, 10}, {7, 8}, 19,101,114,15D E2 = {{2,8}, {5, 6}, {8, 9}, {10,11}1.

und

Es sind zum Beispiel die Kantenzüge (1, 2, 7) und (7, 8, 9, 10, 11) alternierend bezüglich Ei. und E2. ■

9 6

•-• 1 2 3

BEISPIEL 2.92. Betrachtet man den Graphen G aus Beispiel 2.46, so stellt man fest, dass der alternierende Kantenzug (4, 5, 6, 9) erweiternd bezüglich des Matchings

M1= 111,21,15, 61, {7, 8}}

Abb. 2.46.

Ein erweiternder Kantenzug. ist.

■

Mithilfe von erweiternden Kantenzügen ist es möglich, Matchings zu erweitern und größere Matchings zu finden. LEMMA 2.93. Sei G = (V, E) ein Graph und M ein Matching auf G und s ein erweiternder Kantenzug bezüglich M. Sei S die Menge der Kanten

122

MATCHINGS

A

aus s. Dann ist M' = M AS ein Matching von G mit IM' I = AMI + 1. Beweis. Es ist IS \ MI = IS n mi + 1. Also gilt für die symmetrische Differenz IM'I = 'MASI = IM I + 1. Bleibt zu zeigen, dass M' ein Matching ist. Der Graph G* = (V, M) unterscheidet sich vom Graphen G' = (V, M') nur durch die Kanten in S. Also unterscheiden sich höchstens die Grade von Knoten, die s berührt. Die Knotengrade von Knoten außer die Endknoten bleiben in s beim Bilden der symmetrischen Differenz gleich 1. Die Endknoten sind frei bezüglich M, haben also Grad 0 in G* und Grad ■ 1 in G'. Der Maximalgrad ist also 1 in G', M' ist ein Matching. 2.94. Sei G = (V, E) ein Graph, M1 und M2 zwei Matchings auf G. Sei E' = M AM' und H eine Zusammenhangskomponente von = (V, E'). Dann gilt für H einer dieser Fälle. Es ist H . . . LEMMA

... ein

isolierter Knoten. s. ... ein alternierender Kreis sowohl bezüglich M als auch bezüglich M' gerader Länge. s. ... ein alternierender Weg sowohl bezüglich M und M' dessen Endknoten frei sind bezüglich des jeweils anderen Matchings der inzidenten Kante auf dem Weg. Beweis. Sei v E V ein beliebiger Knoten. Seien also G1 = (V, MO und (V, M2). Wir unterscheiden drei Fälle.

G2 =

Fall 1 - v ist frei bezüglich M1 und M2. Dann hat v Grad 0 in G', ist s). also ein isolierter Knoten. Fall 2 - v ist frei bezüglich genau eines der Matchings M1 und M2. Sei o.B.d.A. v frei bezüglich M1. Dann gibt es eine Kante e E M2 die inzident zu v ist. Da v frei ist bezüglich M1 gibt es keine Kante in M1 die inzident zu v ist. Also ist e in M AM' enthalten und v hat Grad 1 in G' . Fall 3 - v ist gebunden bezüglich M1 und M2. Dann gibt es genau eine Kante ei E M1 und eine Kante e2 E M2 die beide inzident zu v sind. Ist el = e2, dann ist diese Kante nicht in M AM' , also ist v isoliert in G'. Ist ei e2, dann sind beide Kanten in MIM' enthalten, also hat v Grad 2 in G' Wir fassen zusammen, dass es in G' nur isolierte Knoten und Knoten vom Grad 1 und Grad 2 gibt. Es gibt also neben den isolierten Knoten nur Kreise und Wege. Da kein Knoten inzident zu zwei Kanten aus dem selben Matching ist, sind die Kreise und Wege alternierend. Ein alternierender

• 1 •• • • • J • ••• Abb. 2.47.

Es entstehen in solchen Situationen isolierte Knoten in G = (V, M AM') nach Lemma 2.94.

Abb. 2.48.

Es entstehen in solchen Situationen alternierende Kreise in G = (V, M AM') sowohl bezüglich M und M' nach Lemma 2.94.

.I

•

•

•

Abb. 2.49.

Es entstehen in solchen Situationen altemierende Wege sowohl bezüglich M als auch bezüglich M' deren Endknoten frei sind bezüglich des jeweils anderen Matchings der inzidenten Kante auf dem Kantenzug in G = (V, MAM') nach Lemma 2.94.

123

1‘. MATCHINGS

Kreis kann nur gerade Länge haben. Die Endknoten der kreisfreien Wege sind Knoten vom Grad 1, und solche sind nach Fall 2 frei bezüglich eines ■ der beiden Matchings M1 oder M2. Der folgende Satz von Berge scheint auf den ersten Blick erstaunlich zu sein. Es ist immer möglich ein lokal maximales Matching mittels Erweiterung durch erweiternde Wege zu einem global maximalen Matching zu ergänzen. Man läuft sich mit einem lokal maximalen Matching niemals in irgendeiner Weise so fest, dass jedes global maximale Matching völlig außer Reichweite gerät. SATZ 2.95 (Satz von Berge). Sei G = (V, E) ein Graph. Dann ist ein Matching von G genau dann ein global maximales Matching in G, wenn es keine erweiternden Wege in G bezüglich M gibt. Beweis. Es sind zwei Richtungen der Äquivalenz zu zeigen. " >": Sei M ein größtes Matching in G und s ein erweiternder Weg bezüglich M. Dann lässt sich M nach Lemma 2.93 mittels symmetrischer Differenz mit den Kanten in s zu einem größeren Matching ergänzen - ein Widerspruch. Es gibt keinen erweiternden Weg in G bezüglich M. Sei M ein Matching, so dass es keinen erweiternden Kantenzug bezüglich M in G gibt. Sei M' ein global maximales Matching in G. Wir zeigen, dass IMI= M' I ist. Es lassen sich die Mengen M und M' mittels M= (M' n M)U (M \ M') und M' = (M n /141) u (4' \ M) disjunkt zerlegen. Das ist leicht einsichtig und liefert folgende Erleichterung. Möchte man die Differenz I MI — IM' I berechnen, kann man auch einfach die Differenz IM \ M' I — IM' \ MI berechnen. Sprich, die Kanten, die M und M' gemeinsam haben, tragen sicher nicht zur Differenz der Kardinalitäten bei. Wir zählen nun also die Kanten, die in M aber nicht in M' und die Kanten die in M' aber nicht in M liegen. Die Menge all dieser Kanten entspricht genau der symmetrischen Differenz von M und M'. Nach Lemma 2.94 gibt es nur drei Typen von Zusammenhangskomponenten in G' = (V, MAM'). Isolierte Knoten, alternierende Kreise bezüglich M und M' von gerader Länge und kreisfreie alternierende Wege bezüglich M und M'. Die Kreise involvieren gleich viele Kanten aus M wie aus M'. Problematisch sind alleine Wege ungerader Länge. Doch diese kann es nicht geben. Denn die Endkanten eines alternierenden Weges ungerader Länge liegen in ein und dem selben Matching. Außerdem sind diese Endkanten frei bezüglich des anderen Matchings. Ein solcher Weg ist entweder ein erweiternder Weg bezüglich M, das ist nach Vorausset-

124

MATCHINGS

A

zung ausgeschlossen oder von M'. Das Matching M' ist jedoch ein global maximales Matching von G, einen erweiternden Kantenzug kann es auch dort nicht geben. Also sind alle alternierenden Wege von gerader Länge, ■ involvieren also gleich viele Kanten aus M und M'. Beweis. (Heiratssatz von Hall) Es sind zwei Richtungen der Äquivalenz zu zeigen. "=": Es sei M ein perfektes Matching in G. Dann gilt für jede Teilmenge U c V1, dass sie mindestens SUI viele verschiedene Nachbarn in V2 hat, denn jeder Knoten ist mit einem eigenen Knoten in V2 verbunden. Also gilt IN(U)I > 11/1. Sei nun 1N(U)I > UI für alle Teilmengen U c V1. Wir nehmen an, es gibt kein perfektes Matching in G. Für jedes Matching M in G gibt es also mindestens einen Knoten v in V1, der frei bezüglich M ist. Sei M' ein global maximales Matching und v E Vl frei bezüglich M'. Wir werden nun mithilfe des Satzes von Berge und dem Wissen über alternierende Wege eine Teilmenge von V1 konstruieren, die einen Widerspruch erzeugt, weil sie zu wenige Nachbarn in V2 hat. Nach dem Satz von Berge gibt es keinen erweiternden Weg in G bezüglich M', bzw. alle alternierenden Wege bezüglich M' sind von gerader Länge. Sei nun U1 die Menge der Knoten in VI. \ {v} und U2 die Menge der Knoten in V2, die über einen alternierenden Weg mit v verbunden sind. Wir zeigen nun, dass lt/11 = 1U21. Wir zeigen, dass jeder Knoten in U1 über genau eine Kante in M' mit einem Knoten aus U2 verbunden ist. Sei dazu u E U1 beliebig gewählt. Dann gibt es einen alternierenden Weg von v zu u. Da v und u beide in Vi liegen, ist die Länge von s gerade. Da s zudem alternierend ist und die erste Kante in s nicht in M enthalten ist (da sonst v nicht frei bezüglich M' wäre), muss die letzte Kante in M enthalten sein. Diese verbindet u mit einem Knoten in V2. Umgekehrt ist jeder Knoten aus U2 mit einem Knoten aus U1 verbunden. Sei dazu u E U2 beliebig gewählt. Angenommen u wäre nicht über eine Kante aus M' mit einem Knoten aus U1 verbunden. Dann gibt es zwei Fälle. Fall 1 - u ist auch mit keinem Knoten aus Vi \ U1 verbunden. Dann ist u aber frei bezüglich M'. Und damit gäbe es einen alternierenden Weg von v zu u dessen beiden Endpunkte frei bezüglich M' sind - mit dem

125

AUFGABEN

Satz von Berge ein Widerspruch zur globalen Maximalität von M'. Fall 2 - u ist mit einem Knoten aus Vi Ui verbunden. Sei ui E V1 \ dieser Knoten. Dann ist aber mit u auch ui über einen alternierenden Weg mit v verbunden, also /Li E U1 und U \ U1 - ein Widerspruch. 44, Also war die Annahme falsch, und u ist mit genau einem Knoten aus Ui verbunden. Also gilt Ut I = 1U21. Außerdem zeigen wir nun, dass N(Ui) C U2 gilt. Wähle dazu ein /Li E Ul beliebig. Es ist 'al also über einen alternierenden Weg s gerader Länge mit v verbunden und wie schon gezeigt mit einem Knoten in U2 über eine Kante aus M' verbunden. Jeder weitere Nachbar u2 E N (ui) ist dann sicher nicht mit einer Kante aus M' mit ui verbunden und kann durch Anhängen dieser Kante an den Weg s alternierend mit v verbunden werden, ergo ist in U2 enthalten. Außerdem ist N(v) E U2 enthalten, denn jeder Knoten u2 in der Nachbarschaft von v ist über genau eine Kante mit v verbunden. Eine Kante ist ein alternierender Weg, also ist u2 E U2. Wir fassen zusammen, dass I Ui I = U2 und I N (Ui U {v})1 < 1U21. Also gilt 1U1U{v}1=

+1= IU21 + 1 ? INW1U {OA +1> N(Ui U {v})

ein Widerspruch zur Hall-Bedingung.

•

2.6 Aufgaben

GRUNDLEGENDE DEFINITIONEN. A

2.1 Welche der folgenden Aussagen ist korrekt? i. In einem Graphen ist jeder Knoten durch eine Kante mit jedem anderen Knoten verbunden. ii. In einem vollständigen Graphen sind je zwei Knoten adjazent. iii. Die Ordnung eines Graphen ist immer größer als seine Größe. iv. Ein gewichteter Graph ist größer, als der ent-

126

sprechende ungewichtete Graph. v. In einem Graphen sind stets zwei Kanten mit dem gleichen Knoten adjazent. vi. Ein Unterteilungsgraph eines Graphen G ist stets größer und hat größere Ordnung als G selbst. vii. Ein Graph der Ordnung n, in dem alle Knoten genau Grad 10 haben, hat genau 5n Kanten. viii. Die Nachbarschaft eines Knotens v E V eines Graphen G = (V, E) ist die Menge der zu v inzidenten Kanten aus E.

AUFGABEN

wrir 2.2 Zeichnen Sie einen gewichteten Graphen der Ordnung 6, der Größe 18, mit Minimalgrad 2, mit Maximalgrad 4, dessen Kantengewichte sich zu 0 addieren und der den K3 als Teilgraph enthält. wrir 2.3 Zeigen Sie, dass ein Graph G genau dann bipartid ist, wenn alle Kreise in G gerade Länge haben. 'orl 2.4 Zeigen Sie, dass in einem Graphen G = (V, E) der Ordnung n und der Größe rn = 10n + 1 mit Maximalgrad 10 keinen isolierten Knoten gibt. wrl' 2.5 Zeigen Sie, dass der vollständige Graph K„ für jede natürliche Zahl k < n den vollständigen Graphen Kk als Teilgraph enthält.

4 2.6 Zeigen Sie, dass der vollständige Graph Kn für jede natürliche Zahl k < n den vollständigen Graphen Kk als Teilgraphen enthält.

DARSTELLUNG VON GRAPHEN.

A 2.7 Welche der folgenden Aussagen ist korrekt? i. Die Adjazenzmatrix eines Graphen ist stets symmetrisch. ii. Ein Planarer Graph kann auf die Oberfläche einer Kugel gezeichnet werde, so dass sich die Streckenzüge von Kanten nicht überschneiden. iii. Das Haus vom Nikolaus ist planar. iv. Ein planarer Graph ist 6-färbbar. v. Ein Graph ist nicht planar, wenn er den K5 als Teilgraphen besitzt. vi. Jeder 6-färbbare Graph ist auch 7-färbbar. vii. Ein planarer Graph ist 3-färbbar. viii. Es gibt einen planaren 3-färbbaren Graphen. WI 2.8 Stellen Sie die Adjazenzliste und die Adjazenzmatrix Ihres Graphens aus Aufgabe 2.2 auf. 0,1

2.9 Ist Ihr Graph aus Aufgabe 2.2 planar?

A

2.11 Ist der Graph in Abbildung 2.50 3-färbbar? Für welche k E N ist der Graph k-färbbar?

4.1"

WI 2.12 Zeigen Sie, dass ein vollständiger Graph Kn genau dann planar ist, wenn n < 4 ist. WEGE DURCH GRAPHEN.

A 2.13 Welche der folgenden Aussagen ist korrekt? i. Jeder Weg ist auch ein Kantenzug in einem Graphen, aber nicht jeder Kantenzug ist auch ein Weg. ii. Ein Kreis ist ein Kantenzug, ein Weg und ein Zyklus in einem Graphen. iii. Jeder zusammenhängende Graph besitzt einen Eulerzug. iv. Es gibt nicht-zusammenhängende Graphen, die einen Eulerzug besitzen. v. Ein isolierter Knoten ist eine Zusammenhangskomponente. vi. In einem zusammenhängenden Graphen ist jeder Knoten von jedem anderen Knoten aus erreichbar. vii. Der Algorithmus FindZyklusEuler findet in jedem Graphen und für jeden Knoten einen Zyklus, der diesen berührt. viii. Ein Graph ist genau dann eulersch, wenn jeder Knoten geraden Grad hat. ix. Jeder Hamiltonkreis ist auch ein Eulerzug. wir 2.14 Zeigen Sie, dass der Graph des berühmten Hauses vom Nikolaus keinen geschlossenen Eulerzug besitzt. WI 2.15 Wenden Sie Schema F 2.54 an, um in dem Graphen aus Abbildung 2.51 einen Zyklus durch den Knoten 1 zu finden.

wrk 2.16 Wenden Sie Schema F 2.54 an, um in dem Graphen aus Abbildung 2.51 einen weiteren Zyklus durch den Knoten 1 zu finden. 2.17 Wenden Sie Schema F 2.58 an, um in dem Graphen aus Abbildung 2.51 einen Eulerzug zu finden.

WI

64\8 Abb. 2.50.

10 11 12

Der Graph aus Aufgabe 2.10 und 2.11. "' 2.10 Stellen Sie die Adjazenzliste und die Adjazenzmatrix des Graphen aus Abbildung 2.50 auf.

127

AUFGABEN

12 13

ii. Die beiden Endkonten von s sind genau dann mit einer geraden Anzahl von Kanten in .9 inzident, wenn s ein Zyklus ist (also die beiden Endknoten von s identisch sind).

11 8 1

2

3

4

BÄUME.

Abb. 2.51.

A 2.25 Welche der folgenden Aussagen ist korrekt?

Der Graph aus den Aufgaben 2.18 bis 2.17.

• 3

1

6

4 0 Abb. 2.52.

Der Graph aus Aufgabe 2.18 und 2.19. WI 2.18 Finden Sie in dem Graphen aus Abbildung 52 einen Teilgraphen mit Gewicht 2. • 2.19 Wenden Sie Schema F 2.67 an, um in dem Graphen aus Abbildung 52 kürzeste Wege ausgehend vom Knoten 1 zu finden. 41' 2.20

Zeigen Sie, dass ein Graph mit Ordnung n nur dann einen Hamiltonkreis besitzen kann, wenn seine Größe mindestens n ist.

i. Ein Wald ist zusammenhängend. ii. Ein Baum ist ein kreisfreier und zusammenhängender Graph. iii. In einem Wald gibt es zwischen je zwei Knoten höchstens einen Weg. iv. Ein Baum auf n Knoten hat genau n — 1 Kanten. v. Jeder Graph besitzt einen Baum als Teilgraph. vi. Jeder zusammenhängende Graph besitzt einen Spannbaum. vii. Mit dem Kruskal-Algorithmus kann man in gewichteten Graphen minimale Spannbäume finden. viii. Jeder zusammenhängende gewichtete Graph besitzt einen eindeutigen minimalen Spannbaum. NJ' 2.26

Zeichnen Sie einen Baum mit 5 Kanten und 2 Blättern.

WI' 2.27

Wie viele unterschiedliche Bäume (bis auf Isomorphie) auf 6 Knoten gibt es?

,r4 2.28 Zeigen Sie, dass ein Baum genau einen Spannbaum besitzt.

,$)r 2.21 Zeigen Sie, dass für jeden Graph G = (V, E)

WI 2.29 Wenden Sie Schema F 2.79 an, um in dem die Relation R auf der Knotenmenge V mit R = Graphen aus Abbildung 2.51 einen Spannbaum zu fin{(u, v) E V x V : u ist erreichbar von v} eine Äquiva- den. lenzrelation ist. WI' 2.30 Wenden Sie Schema F 2.84 an, um in dem wy4 2.22 Zeigen Sie, dass je zwei Wege längster Länge Graphen aus Abbildung 2.52 einen minimalen Spannin einem zusammenhängenden Graphen mindestens baum zu finden. einen Knoten gemeinsam haben.

• 2.23 Zeigen Sie, dass ein Graph G = (V, E) genau dann zusammenhängend ist, wenn für je zwei nicht- MATCHINGS. leere Teilgraphen G1 = (V1, ) und G2 = (V2, E2) A 2.31 Welche der folgenden Aussagen ist korrekt? von G mit E1 U E2 = E gilt, dass Vl n v2 e 0. i. Ein Matching hat Maximalgrad 1. wrl 2.24 Beweisen Sie Lemma 2.44. Seien dazu G = ii. Ein Matching eines Graphen der Ordnung n hat (V, E) ein Graph und s ein Kantenzug gegeben. Zeigen Größe USie also die beiden folgenden Aussagen. iii. Ein lokal maximales Matching ist auch ein global maximales Matching. i. Jeder Knoten, der nicht ein Endknoten von s ist, iv. Ein perfektes Matching ist ein lokal maximales ist mit einer geraden Anzahl von Kanten in s Matching. inzident.

128

AUFGABEN

v. In einem vollständigen bipartiden Graphen gibt es ein perfektes Matching. vi. Ein global maximales Matching besitzt immer einen erweiternden Kantenzug.

A

global maximales Matching ist. wr4 2.33 Finden Sie einen Graphen der Ordnung 8 und Größe 8, in welchem es zwei kantendisjunkte, perfekte Matchings gibt.

'' 2.32 Zeigen Sie, dass ein perfektes Matching ein

129

S► AUFGABEN

130

II rechnen

3 Rechnen mit ganzen Zahlen Ein Mathematiker rechnet. Ein Informatiker lässt den Computer rechnen. Beide Aussagen greifen natürlich viel zu kurz, sind aber nicht falsch. Wir möchten nun die Grundlagen des Rechnens mit Zahlen erlernen. Dazu werden wir Zahlen zerlegen (Teilbarkeit, Primzahlen), mit den Zerlegungen rechnen (Reste) und diese wieder zusammenbauen (chinesischer Restsatz). Vieles in diesem Kapitel erscheint zunächst einfach, weil es vielleicht schon aus der Schule bekannt ist. Teilweise stimmt das sicherlich auch, manches entpuppt sich dann jedoch als komplexer als zunächst erwartet. Das Kapitel hat zudem vorbereitenden Charakter für das zweite Kapitel in diesem Abschnitt über das „Rechnen", in welchem wir die mathematische Abstraktion des Rechnens betrachten werden. Wichtig zu erwähnen ist noch der euklidische Algorithmus, den wir in diesem Kapitel als starkes Werkzeug zum Berechnen des größten gemeinsamen Teilers zweier Zahlen kennen lernen werden.

3.1 Teilbarkeit

Die Teilbarkeit für natürliche Zahlen ist ein bekanntes Konzept. Die Zahl 7 teilt die Zahl 14 aber nicht die Zahl 15. Wir werden dieses Konzept nun formal fassen und auf die ganzen Zahlen Z ausweiten. Dabei werden Vorzeichen schlicht „ignoriert". D EFINITION 3.1. Seien a,b E Z zwei ganze Zahlen. Es teilt die Zahl a die Zahl b, wenn es eine ganze Zahl k E Z gibt mit k • a = b. Für a teilt b schreiben wir alb. Teilt a nicht b, schreiben wir a b. Im Fall alb nennt man a einen Teiler von b und man sagt b ist ein Vielfaches von a. Gilt zusätzlich 1 < a < IbI, so nennt man a einen echten Teiler von b.

sage: # positive Teiler von 28 sag=: divisors(28) [1, 2, 4, 7, 14, 28]

14. TEILBARKEIT BEISPIEL 3.2. Es gelten

weil k ist

3 I 15

-3 I 15

5 • 3 = 15 5

-5 • (-3) = 15 -5

-3 I -15

-3 I -15

3 = -15

5 • (-3) = -15 5

-5 • -5

Es ist 3 ein echter Teiler von 15 und -15. Die -3 ist ein Teiler von 15 und -15 aber jeweils kein echter Teiler, denn die Ungleichung 1 < -3 < 15 ist falsch. Die 15 und die -15 sind beide ein Vielfaches sowohl der 3 als auch der -3. ■ BEMERKUNG 3.3. Es gelten zwei Merkregeln die Teilbarkeit bezüglich der Null

betreffend. k Jede Zahl teilt die Null Die Null ist Vielfaches von jeder Zahl a E Z. Mit k = 0 findet man eine ganze Zahl, so dass die Gleichung k•a=0•a=0 für alle a E Z wahr ist. 1. Die Null teilt keine andere Zahl Die Null teilt keine anderen Zahl b E Z \ {0}. Man findet keine ganze Zahl k E Z, so dass die Gleichung k•

0=0=

b

für b E Z \ {0} wahr ist.

# Auf Primalität prüfen is_prime(3), is_prime(4) (True, False) ,agc. # Die Primzahlen von 0 bis 10 sage: for d in range(0,11): print d, is_prime(d) 0 False 1 False 2 True 3 True 4 False 5 True 6 False 7 True 8 False 9 False 10 False sa.ge: # Eine Alternative ist prime_range(0,11) [2, 3, 5, 7] # Nützliche Funktionen primes_first_n(4) [2, 3, 5, 7] next_prime(2018) 2027 sage: previous_prime(2018) 2017

134

3.1.1 Primzahlen

Mithilfe des Konzepts der Teilbarkeit kann eine wesentliche Klasse von natürlichen Zahlen, die Primzahlen, definiert werden. Die Primzahlen bilden die Atome der Zahlen, die kleinsten un(zer)teilbaren Elemente. D EFINITION 3.4. Eine Zahl n E N heißt Primzahl, falls n genau zwei Teiler in N hat.

BE ISPIEL 3.5. Die ersten Primzahlen bis 100 lauten 2, 3, 5, 7, 11, 13, 17, 19, 23, ■ 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89 und 97. BEMERKUNG 3.6. Die Zahl 1 ist keine Primzahl, denn sie hat genau einen Teiler in N (nämlich die 1 selbst). Das ist auch der Grund für die möglicherweise ungewohnte Definition, in der Schule lautet die Definition einer Primzahl häufig "Jede Zahl, die nur durch 1 und sich selbst teilbar ist." Nach dieser Definition wäre die 1 eine Primzahl. Dass die 1 jedoch keine Primzahl ist, ist bei der Primzahldefinition bewusst so gehalten, damit die Primfaktorzerlegung von Zahlen in den natürlichen Zahlen N eindeutig ist. ■

TEILBARKEIT

A

Bemerkung 3.6 motiviert den folgenden Satz, welcher die Eindeutigkeit der Primfaktorzerlegung feststellt. Man findet ihn schon in Gauß' berühmter „Disquisitiones Arithmeticae" aus dem Jahre 1801. SATZ 3.7 (Fundamentalsatz der Arithmetik). Jede natürliche Zahl n E N mit n > 2 besitzt eine eindeutige Darstellung als Produkt von Primzahlen n = pki.1 • p22 • • • p,

(Primfaktorzerlegung von n).

Dabei seien ... k ... die Anzahl der Primzahlen m und die Exponenten kl, , natürliche Zahlen. s.... die Primzahlen aufsteigend sortiert, also pi < • • • < pm. Beweis. Wir weisen zunächst nach, dass eine Primfaktorzerlegung existiert und dann, dass es genau eine gibt.

Anmerkung. Wären die Primzahlen nicht der Größe nach sortiert, wäre die Darstellung nicht eindeutig. Es könnten dann zum Beispiel Primzahlen mehrfach als Faktoren vorkommen.

Existenz. Zum Nachweis der Existenz verwenden wir eine Induktion über n. Induktionsverankerung: Für n = 2 ist die Aussage klar, die Primfaktorzerlegung von 2 lautet 2 = 21 mit pi = 1 und ml = 1. Induktionsannahme: Es existiere für alle Zahlen 1, , n — 1 eine eindeutig Primfaktorzerlegung in der gewünschten Form. Induktionsschluss: Sei nun n E N mit n > 2. Fall 1 - n ist eine Primzahl. Dann ist die Primfaktorzerlegung n = pi mit pi = n und mi = 1. Fall 2 - n ist keine Primzahl. Es gibt einen echten Teiler k von n mit 2 < k < n — 1 und damit gleich zwei echte Teiler von k, denn für gilt ebenfalls 2 < < n 1 mit k • k = n. Wendet man nun die Induktionsvoraussetzungen auf k und an, so erhält man Primfaktorzerlegungen von k und und das Produkt dieser ist eine Primfaktorzerlegung von n = ;I, • k.

Eindeutigkeit. Der Beweis der Eindeutigkeit der Faktorisierung benötigt das Lemma von Euklid, welches wir später beweisen. Es besagt, dass wenn eine Primzahl p das Produkt a • b zweier Zahlen a, b E N teilt, p auch mindestens einen der Faktoren a oder b teilt. Wir nehmen an, dass es eine kleinste natürliche Zahl n mit zwei verschie-

135

TEILBARKEIT

denen Primfaktorzerlegungen gibt. Es gelte n = Pik • • • Pm

=

£1

ta

(3.1)

• • qn-i

mit jeweils aufsteigend sortierten Primzahlen p1 , ...pm und q l , Nach Korollar 3.54 (eine Verallgemeinerung des Lemmas von Euklid auf das Produkt endlich vieler natürlicher Zahlen) teilt jede Primzahl p, als Teiler von n einen der Faktoren q,. Da p, eine Primzahl ist, ist pi 1 und weil q, eine Primzahl ist, hat q, nur die Teiler 1 und q,. Also muss pi = q, gelten. Analog ist jede Primzahl q, identisch zu einer der Primzahlen p,. Die beiden Mengen von Primzahlen sind demnach identisch. Es ist {pi : 1 < i < ml = fq, : 1 < j
k und a

k' • m

> k1 • m

< >

a m

— > k'.

Dann ist k aber nicht die größte ganze Zahl mit k < - ein Widerspruch. Also ist r = Rest„ (a).

■

BEISPIEL 3.15. Es gilt Rest9 (40) = 4, weil 40 = 4 • 9 + 4 ist. Außerdem gilt ■ Rest9 (-40) = 5, weil —40 = 5 — .9 + 5 ist. Möchte man den Rest bezüglich der Summe oder eines Produkts von

138

MODULO-RECHNUNG

i

ganzen Zahlen berechnen, dann kann man zunächst den Rest bezüglich der Summanden oder Faktoren bilden. LEMMA 3.16. Es seien a, b, m E 71 und k e N. Dann gelten

Rest, (a + b) = Rest, (Rest, (a) + b) Rest„ (a • b) = Rest, (Rest, (a) • b) ii. iii. Rest„ (ak ) = Rest, (Rest, (a)k ) i.

Beweis. Wir führen nur den Beweis für ii. - der Beweis der anderen Aussagen ist eine Übungsaufgabe. Nach der Definition des Rests gibt es ein k E Z mit a = k • n + Rest, (a). Wir können also berechnen a•b=(k•n+Restm (a))•b=k•n•b+Restm (a) • b.

(3.2)

Außerdem ist

Restm (k • m • b) = 0,

(3.3)

da k • ni • b ein Vielfaches von n, also durch n, teilbar ist. Also erhalten wir [setze (3.2) ein] Rest, (a • b) = Restm (b • k • m + Restm (a) • b) = Rest, (Rest, (b • k • m) + Restm (a) • b) [nach i.] [mit (3.3)] = Rest, (0 + Restm (a) • b) = Restm (Rest, (a) • b) wie behauptet. BEMERKUNG

■

3.17. Natürlich folgt aus i. von Lemma 3.16 auch

Restm (a + b) = Restm (a + Restm (b)) = Restm (Restm (a) + Restm (b)) und aus ii. auch

Restm (a • b) = Restm (a • Restm (b)) = Restm (Restm (a) • Restm (b)). Es ist wichtig darauf zu achten, dass der Modul 7n sich in den Gleichungen von ■ ändert. BEISPIEL 3.18. Möchte man Restis (33 • 174 + 27) berechnen, hilft Lemma 3.16

Lemma 3.16 nicht

139

I. MODULO -RECHNUNG

enorm. Es ist nämlich Resti5 (33 • 174 + 27) = Resti5 (Resti5 (33 • 174) + Restes (27)) [nach i.] Resti5 (Resti5 (33) • Resti5 (174) + 12) [nach ii.] = Resti5 (3 • Resti5 (Resti5 (17)4) + 12) [nach iii.] Resti5 (3 • Resti5 (24) + 12) Resti5 (3 • Resti5 (16) + 12) Rest15 (3 • 1 + 12) = 0

3.2.2 Modul-Gleichungen

Wir haben schon gesehen, dass man für eine gegebene Zahl in mit den Resten rechnen kann, welche beim Teilen durch m entstehen. Diese Rechnung kann man kompliziert mit Resten, wie in Beispiel 3.18 gesehen, aufschreiben. Wir führen zur Vereinfachung nun allerdings die Modulo-Rechnung ein. DEFINITION 3.19. Es sei m E N>2, dann gilt für a, b E Z a ==_ b sage, sage: True sage: True sage: True sage: True

# Modulgleichungen 8 == mod(1,7) 14 == mod(21,7)

(mod m)

.

Restm (a) = Restm (b)

und wir sagen dann, „a und b sind äquivalent mod m". Die Zahl m bezeichnet man dabei als (den) Modul der Modul-Gleichung a b (mod m).

1 == mod(8,7) 14 == mod(0,7)

BEMERKUNG 3.20. Zunächst ist darauf hinzuweisen, dass die Zahl b in a b (mod 7n) nicht kleiner als der Modul m sein muss. Denn fälschlicherweise wird häufig angenommen, dass auf der rechten Seite einer Modul-Gleichung stets der Rest der linken Seite bezüglich m stehen muss. Das ist nicht der Fall. Es ist durchaus korrekt zu schreiben 7 32 (mod 5). ■

BEISPIEL 3.21. Für den Modul m = 7 gelten beispielsweise 8 EE 1 (mod 7), 1

14 21 (mod 7),

8 (mod 7) und 14 0 (mod 7).

Modul-Gleichungen als Äquivalenzrelation

Die Definition von Modulgleichungen lässt den Verdacht aufkommen, dass diese Äquivalenzrelationen auf den ganzen Zahlen induzieren. Zunächst ist zu klären, wie die Relation aussieht. Für eine feste natürliche Zahl 140

MODULO-RECHNUNG

in größer 1 sind zwei ganze Zahlen a und b genau dann in Relation zueinander, wenn sie die Modulgleichung zu dem Modul m erfüllen. LEMMA

3.22. Für jedes m E N>2 ist = {(a, b) EZ x Z:aab (mod m)}

eine Äquivalenzrelation. ■

Beweis. Der Beweis ist eine Übungsaufgabe.

3.23. Es ist wichtig darauf hinzuweisen, dass Lemma 3.22 eine ganze Familie von Relationen als Äquivalenzrelationen ausweist. Für jede natürliche ■ Zahl m größer 1 erhält man eine solche „Resteäquivalenzrelation".

BEMERKUNG

LEMMA 3.24. Es sei m E N>2. Dann sind für zwei Zahlen a, b E Z die folgenden Aussagen äquivalent. Al. Es teilt m die Differenz a — b. A2. EsgibteinkEZmita=-k•m+ b. A3. Es gilt Rest, (a) = Rest, (b). Beweis. Wir zeigen einen Ringschluss.

A2": Teilt m die Differenz a — b, dann gibt es ein k E 7L mit k • m = a — b. Addiert man auf beiden Seiten der Gleichung b, erhält man a = b k • m. Es gilt also A2.

„A1

A3": Gibt es ein k E z mit a = b k • m, so gilt nach Lemma „A2 3.16, dass Rest, (a) = Rest, (b k • 7n) = Rest„ (b

Rest„ (k • m)) = Rest, (b)

un damit die Aussage A3. „A3 = Al": Mit der Definition des Rests folgern wir, dass es ganze Zahlen k, k' E Z gibt mit a=k•m

Rest„ (a)

und

b = k' • 7n + Rest,„ (b).

Demnach ist die Differenz Rest, (a)) — (k' • m + Rest, (b)) = (k — k') • rn Rest„ (a) — Rest, (b)

a — b = (k • m

-= k" • in

[mit A3]

mit der ganzen Zahl k" = k — k'. Also ist in ein Teiler von a — b. Es gilt

141

MODULO -RECHNUNG

■

also Al.

BEMERKUNG 3.25. Eine weitere nützliche Beobachtung zum Zusammenhang von Resten und Modulgleichungen ist, dass a

Rest, (a)

(mod m)

für eine ganze Zahl a E Z und einen Modul m E N>2 immer richtig ist. Denn offensichtlich gilt Rest,,,, (a) = Rest„ (Rest„ (a)). Insbesondere ist die Aussage A3 nach der Definition gleichbedeutend mit der Aussage, dass a äquivalent zu b modulo m ist. ■

Lemma 3.24 und Bemerkung 3.25 betonen den engen Zusammenhang zwischen Resten und Modulgleichungen. Sind zwei Zahlen a, b E Z äquivalent modulo einer Zahl m E N>2, so teilt m ihre Differenz a — b und beim Teilen durch m ergeben a und b den selben Rest. Wir können die Rechenregeln für das Rechnen mit Resten aus Lemma 3.16 auf Modulgleichungen übertragen. KOROLLAR 3.26. Es sei m E N>2. Dann gilt für Zahlen al, a2 E Z mit al = a2 (mod m) und b E Z i. ii.

ai + b = al • b aki

a2 + b a2 • b a2k

(mod m) (mod m) (mod m)

für k E N

Das Beispiel 3.18 zum Rechnen mit Resten lässt sich auch in Modulgleichungen formulieren. BEISPIEL 3.27.

Es gilt beispielsweise 33 • 174 + 27

3 • 24 + 12 3• 1 0

+ 12

(mod 15) (mod 15) (mod 15)

• Jede Äquivalenzrelation auf einer Menge partitioniert die zugrundeliegende Menge in Äquivalenzklassen. Nach Lemma 3.24 sind zwei Zahlen a und b genau dann äquivalent modulo eines Moduls m, wenn die Differenz a — b ein Vielfaches von m ist. Das hilft, die Äquivalenzklassen der Äquivalenzrelation Rom,, zu charakterisieren. LEMMA 3.28. Sei m E N>2. Für a E Z ist die Äquivalenzklasse von 'R,,

142

MODULO-RECHNUNG

die Menge [a],x,r, = {k•m+a mit k E Z}. Es gibt m verschiedene Äquivalenklassen in nm, welche von den natürlichen Zahlen kleiner m repräsentiert werden. Beweis. Nach Lemma 3.24 und Bemerkung 3.25 sind zwei Zahlen a und b genau dann äquivalent modulo m, wenn es ein k E Z mit b=k•m±a gibt. Die Äquivalenzklassen sind also von der genannten Form. Bleibt zu zeigen, dass es m verschiedene Äquivalenzklassen gibt, welche von den natürlichen Zahlen von 0 bis m — 1 vertreten werden. Wir zeigen zunächst, dass diese Zahlen unterschiedliche Äquivalenzklassen repräsentieren und dann, dass es keine weitere Äquivalenzklasse gibt (also jede weitere ganze Zahl in einer dieser Äquivalenzklassen liegt). i. Es seien zwei solche verschiedene natürliche Zahlen ri und r2 E N mit 0 < ri < r2 < m gegeben. Dann ist 0 < r2 — ri < m, die Differenz ri — r2 also kein Vielfaches von m. Dann gilt nach Lemma 3.24, dass ri r2 (mod m) und somit ist [ri]rz m [rd-R.,, • Demnach repräsentiert jede natürliche Zahl kleiner m eine eigene Äquivalenzklasse von R.m. } Für jede ganze Zahl a E Z ist Restr, (a) = Rest?, (Restm (a)). Also ist nach Lemma 3.24 [al-Rm = [Restin (a)]-7-zm . Da 0 < Restm (a) < m gilt, ist [a]R„, = [r],m,.„ für ein natürlichen Zahl r = Restm (a), welche kleiner m ist. Es gibt also keine weiter, als die m von den natürlichen Zahlen kleiner m vertretenen Äquivalenzklasse von Rin.

■ BEMERKUNG 3.29. Wie im Beweis von Lemma 3.28 gesehen, ist jede ganze Zahl a E Z in der Äquivalenzklassen a E [Restb (a)]ry,„., enthalten, welche von der ■ natürlichen Zahl Restb (a) < m repräsentiert wird. BEISPIEL 3.30. Es hat 7Z4 genau die vier Äquivalenzklassen

[0]./z4 ={4•k+0:kEZ}, [2].24 ={4•k+1:kEZ}, [1]7z4 = {4 • k 1 : k E Z}, [3],4 = {4 • k + 2 : k E Z}.

Tatsächlich sortieren die Äquivalenklassen die ganzen Zahlen nach dem Rest, 4 [19]74 = [3],k4, welcher beim Teilen durch 4 entsteht. Es ist zum Beispiel [11] = ■ weil Rest4 (11) = Rest4 (19) = Rest4 (3) = 3 gilt.

143

A

Ibe

DER EUKLIDISCHE ALGORITHMUS

3.3 Der euklidische Algorithmus Der euklidische Algorithmus zur Berechnung des größten gemeinsamen Teilers (ggT) gehört zu den ältesten bekannten Rechenverfahren. Er war schon dem Griechen Eudoxus (375 v.Chr.) bekannt und ist im Band 7 „der Elemente" von Euklid (300 v.Chr.) beschrieben. In der diskreten Zahlentheorie ist er von zentraler Bedeutung und kommt in vielen Rechenprozeduren zur Anwendung.

3.3.1 Der größte gemeinsame Teiler (ggT) Beim Arbeiten mit ganzen Zahlen, auch in der abstrakten Welt der Gruppen, die wir noch kennen lernen, spielt der größte gemeinsame Teiler zweier Zahlen eine zentrale Rolle. DE FINITION 3.31. Für zwei ganze Zahlen a, b E Z, nicht beide 0, ist der größte gemeinsame Teiler ggT(a, b) = max{n E N : nia und njb}. sage # Der ggT sag gcd(18,27) 9

die größte natürliche Zahl, die sowohl a als auch b teilt. BEMERKUNG 3.32. Was ist ggT(a, 0) und ggT(0, a)? Es gilt nach Bemerkung 3.3 für jedes n E N stets, dass n die 0 teilt und damit ist das gesuchte Maximum max{n E N : nla und ni0}. Also ist ggT(a, 0) = ggT(0, a) = Dass ggT(a, 0) = jal gilt, wird im Übrigen später die Notation rund um den euklidischen Algorithmus erleichtern. ■ DEFINITION 3.33. Zwei Zahlen a, b E Z heißen teilerfremd, wenn ggT(a, b) = 1 gilt. Man sagt auch „a und b sind relativ prim".

sage: # Der ggT sage: gcd (15,44) 1

BEISPIEL 3.34. Die

1.

Zahlen 15 und 44 sind realtiv prim, denn es gilt ggT(15, 44) =

•

Für den ggT gilt die folgende (auf den ersten Blick überraschende) Inklusion. LEMMA 3.35. Für drei ganze Zahlen a, b, n e Z ist ggT(a • b, n) ein Teiler von ggT(a, n) • ggT(b, n).

144

DER EUKLIDISCHE ALGORITHMUS

A

■

Beweis. Der Beweis ist eine Übungsaufgabe.

BEISPIEL 3.36. Wählt man die Zahlen a = 12, b = 9 und n = 45 so stellt man fest, dass ggT(12 • 9, 45) = ggT(108, 45) = 9 ist. Allerdings ist ggT(12, 45) = 3 und ggT(9, 45) = 9. Also gilt tatsächlich ggT(108, 45) = 9127 = ggT(12, 45) • ggT(9, 45).

3.3.2 Berechnung des ggT für kleine Zahlen

Eine Möglichkeit zur Berechnung des ggT(a, b) zweier natürlicher Zahlen a und b besteht darin, a und b zunächst in dieselben Primfaktoren zu zerlegen. Dann vergleicht man für jede auftauchende Primzahl den Exponenten in den beiden Faktorisierungen und verwendet entsprechend die kleinere Primpotenz als Faktor zur Berechnung des ggTs. Wir werden uns im Folgenden auf natürliche Zahlen beschränken. Die entsprechenden Aussagen über ganze Zahlen erhält man leicht, wenn man das Vorzeichen in die Überlegung mit einbezieht. LEMMA 3.37. Seien für zwei natürliche Zahlen a, b E N die Faktorisierung a = p71 • pr2n2 • • • 737'

und

b

P2n2 • P ent

in die selben .e Primfaktoren pj mit Exponenten m j, n j E N für i E {1, 2, ... , e gegeben. Dann ist ggT(a, b) = piP • piP • • • p.ek£ mit ki = minfmi, na- für i E {1, 2, ... , Beweis. Der Beweis ist eine Übungsaufgabe.

■

BEMERKUNG 3.38. Die Exponenten mj, ni E N der Primfaktoren in den Faktorisierungen von a und b in Lemma 3.37 können den Wert 0 haben. Dann zeigt beispielsweise für m j = 0 der Faktor p7' = p? = 1 an, dass pi in der Primfaktor■ zerlegung von a nicht vorkommt. BEISPIEL 3.39. Wir betrachten für die Zahlen 350000 und 125000 die Faktorisie-

145

DER EUKLIDISCHE ALGORITHMUS

rungen in die Potenzen der Primzahlen pi = 2, p2

=

5 und p3 = 7.

350000 = 21 • 51 • 71 125000 = 23 • 56 • 7o ggT(350000, 125000) = 23 • 55 • 7°

= 25000

Der jeweilige Exponent einer Primzahl in der Faktorisierung des ggT entspricht dem Minimum des Exponenten dieser Primzahl in den Faktorisierungen der Zahlen. ■

Anmerkung. Einen Algorithmus bezeichnen wir als effizient, wenn die für die Aufgabe benötigte Zeit höchstens quadratisch in der Eingabelänge ist. Um den ggT zu berechnen, sollte ein Algorithmus für Zahlen a und b mit n Stellen höchstens C • n2 viele Elementarrechnungen durchführen (C ist eine Konstante unabhängig von n).

In der Praxis hat die Berechnung des ggT nach Lemma 3.37 einen Haken. Voraussetzung ist eine Faktorisierung der Zahlen a und b in Primfaktoren. Für kleine Zahlen lässt sich eine Faktorisierung in Primzahlen noch finden, für große Zahlen gestaltet sich das als äußerst schwierig. Es ist schlicht kein effizienter Algorithmus zur Faktorisierung großer Zahlen bekannt. Diese „Wissenslücke" werden wir uns in der Kryptographie zu nutze machen. Für die Berechnung des ggTs brauchen wir einen anderen Ansatz.

3.3.3 Vorüberlegung zum euklidischen Algorithmus

Der euklidische Algorithmus beruht auf der Division mit Rest. Nach der Definition des Rests, gibt es für zwei natürliche Zahlen a, b E N mit b 0 Zahlen k, r E N mit a=k•b+r

und

0 b > 0. Wir setzten r= Restb (a).

Dann gilt ggT(a, b) = ggT(a — b, b) = ggT(r, b). Beweis. Es seien a, b e N mit a > b > 0. Wir zeigen ggT(a, b) = ggT(a — b, b) und benutzen dies iterativ für den Beweis der zweiten Gleichung.

Zunächst zeigen wir, dass eine natürliche Zahl c E N+ genau dann a und b teilt, wenn sie die Differenz a — b und b teilt. " >": Es teile c die beiden Zahlen a und b. Das heißt, es gibt zwei ganze Zahlen k1, k2 E Z mit a = ki • c und b = k2 • c. Dann ist a — b =- ki • c — k2 • c = (k — k2) • c = k3 • c mit der ganzen Zahl k3 = k1 — k2. Also teilt c auch a — b und b nach Voraussetzung. Es teile c die beiden Zahlen a — b und b. Das heißt, es gibt zwei ganze Zahlen k1 , k2 E Z mit a — b = ki • c und b = k2 • c. Dann ist a = a—b+b= ki •c+ k2 •c= (ki k2)•c= k3 • c

mit der ganzen Zahl k3 = k1 + k2. Also teilt c auch a und sowieso b nach Voraussetzung. Jeder gemeinsame Teiler von a und b ist also auch ein gemeinsamer Teiler von a — b und b. Demnach ist auch ggT(a, b) = ggT(a — b, b). Das lässt sich iterieren, so dass ggT(a, b) = ggT(a — 2 • b, b) für alle B E N mita—t b>Oist. Nach Lemma 3.14 ist 0 < Restb (a)=a— k•bmitk = W. Also gilt ggT(a, b) = ggT(a — k • b, b) = ggT(Restb (a), b) und mit r = Restb (a) folgt die Behauptung.

■

BEISPIEL 3.41. Betrachtet man die Zahlen a = 75 und b= 20 mit ggT(75, 20) = 5. So gilt Rest20 (75) = 15, weil 75 = 3 • 20 + 15 und nach Lemma 3.40 ist dann ■ ggT(75, 20) = ggT(15, 20) = 5.

147

DER EUKLIDISCHE ALGORITHMUS

3.3.4 Der euklidische Algorithmus

Anmerkung. Ein Algorithmus terminiert, wenn er für jede zulässige Eingabe nach endlich vielen Schritten eine Ausgabe produziert.

Wir sind nun in der Lage, die algorithmische Herangehensweise des euklidischen Algorithmus zu lesen. Außerdem können wir beweisen, dass er nach endlich vielen Schritten terminiert und seine Ausgabe dem korrekten ggT der eingegebenen Zahlen entspricht.

Algorithmus 3.42 (Euklidischer Algorithmus). Input: a, b E N mit a < b. Output: d = ggT(a, b).

while b > 0 do Setze k = Setzer=a—k• b. Setze a = b und b = r. end while return a. LEMMA 3.43. Der euklidische Algorithmus mit Input a, b E N terminiert nach endlich vielen Schritten und liefert als Ausgabe ggT(a, b). Beweis. Es seien a, b E N der Input für den euklidischen Algorithmus. Weiter seien ak und bk die Werte von a und b im k-ten Aufruf der whileSchleife. Terminieren. In der while-Schleife berechnet der Algorithmus r = Rest(ak , bk) aus den aktuellen Werten für ak und bk. Außerdem wird (unter anderem) die Zuweisung bk+1 = Rest(ak , bk ) ausgeführt, d.h. es gilt stets 0 < bk+l < bk • Da der Wert von b1 endlich ist, liegen zwischen b1 und 0 nur endlich viele mögliche bk, d.h. der Algorithmus terminiert in endlich vielen Schritten. Korrekter Output. Gilt bn = 0 im n-ten Aufruf der while-Schleife, so terminiert der Algorithmus mit der Ausgabe von an = ggT(an, 0) = ggT(a„, Wir zeigen nun, dass dann für alle k E

, n} die Gleichheit

ggT(ak , bk ) = ggT(a, b) und insbesondere ggT(an, b,i ) = ggT(a, b) gilt.

148

DAS LEMMA VON BEZOUT

A

Induktionsverankerung: Für k = 1 gilt wegen {al , b1 } = {a, b} sofort ggT(ai, bi ) = ggT(a, b). Induktionsannahme: Es sei 1 < k < n und es gelte ggT(ak , bk) ggT(a, b). Induktionsschluss: Es ist zu zeigen, dass dann ggT(ak+i, bk+i) = ggT(a, b) gilt. Wie oben beschrieben, gilt im k-ten Aufruf der while-Schleife stets r = Rest(ak , bk ). Damit gilt ak+i = bk und 6/0_1 = Rest(ak , bk) im nachfolgenden (k + 1)-ten Aufruf der while-Schleife. Es gilt also für alle k stets ggT(ak , bk ) = ggT(ak+1, bk+1) nach Lemma 3.40.

■ Bevor wir den euklidischen Algorithmus in einem Beispiel betrachten, erweitern wir ihn. Diese erweiterte Form wenden wir dann in der Praxis häufig an.

3.4 Das Lemma von Bezout Eine erweiterte Version des euklidischen Algorithmus bietet die Möglichkeit, zusätzlich (parallel) zum ggT(a, b) die folgende Darstellung zu berechnen. DEFINITION 3.44. Es seien a, b E N. Gibt es ganze Zahlen s, t E Z, so dass s•a+t•b=ggT(a,b) gilt, nennen wir die Zahlen s und t die B6zout-Multiplikatoren zu a und b. BEISPIEL 3.45. Die Zahlen a = 75 und b = 20 mit ggT(75, 20) = 5 besitzen die 136zout-Multiplikatoren s = —1 und t = 4. Es ist nämlich

,ge: # Der ggT mit Berout-Multiplikatoren xgcd(75,20) (5, -1, 4)

ggT(75, 20) .= 5 = (-1) • 75 + 5 • 20.

149

DAS LEMMA VON BEZOUT

Die Bezout-Multiplikatoren spielen im RSA-Verfahren, einer kryptographischen Anwendung, siehe dazu Kapitel 12, und beim chinesischen Restsatz eine wichtige Rolle. Um diese Multiplikatoren zu berechnen, hält man zu allen im euklidischen Algorithmus auftretenden Resten ri stets zwei passende Zahlen s, und t, fest, so dass ri = 5, • a + t, • b gilt. Da der Algorithmus am Schluss den Rest rn, = ggT(a, b) ausgibt, hat man mit sr, und tr, die gesuchten Faktoren, welche die Darstellung sr, • a + t, • b = r, = ggT(a, b) liefern. Wir passen die Notation des euklidischen Algorithmus leicht an und benennen den Input a und b mit To = a und ri = b. Setzt man dann so = 1 und to = 0 sowie si = 0 und ti = 1, gilt sicherlich ro=a=l•a+O• b = so • a±to• b ri = b = O•a+1 • b = si •a+ti • b

Die im Laufe des euklidischen Algorithmus zu berechnenden Reste sind von der Form ri = Rest(r3-2 , r3 _1). Es gilt dann r3+1 = r3 _1 - ki • ri mit geeignetem ki E N. Tatsächlich lassen sich die Multiplikatoren ganz ähnlich berechnen. Es ist nämlich ri 1 rj

= k • ri =

k • si

• •

rj_i — kj • rj = (sj _ 1 — ki • sj) •

a+ a+

• k j • ti

b

•b

a + (ti _ i - ki • ti) •

b.

Offensichtlich ist bei gespeicherten Werten r3 _1,r3, s3 _1, s3 , t3 _1 und t, der beiden vorangegangen Iterationen nur der Faktor lc, zu bestimmen, um die Werte r3+1, .93+1 und t2+1 mittels gleicher Formel zu berechnen.

3.4.1 Der erweiterte euklidische Algorithmus Wir geben nun den erweiterten euklidischen Algorithmus zur Berechnung der Bezout Multiplikatoren an. In dieser Version werden die Zwischenprodukte r, s und t mit einem Laufindex i abgespeichert. Dies dient lediglich dazu, später den Beweis der Korrektheit leichter führen zu können.

150

DAS LEMMA VON BEZOUT

Algorithmus 3.46 (Erweiterter euklidischer Algorithmus). Input: a, b E N mit a > b. Output: rj _1 = ggT(a, b) und die Gleichung rj_ i = s Setze ro = a und r1 = b. Setze so = 1 und 51 = 0. Setze to = 0 und t1 = 1. Setze j = 1. while ri > 0 do

• a +tj _1 • b.

I Setze mj = Setze rj+1 = rj_ i — mi rj. Setze sj+1 = sj_ i — m j s j . Setze tj+1 = tj _ i — mjtj. Setze j = j 1. end while return (rj_i,sj—i,

LEMMA 3.47. Es sei (rn, sn , tn ) der Output des erweiterten euklidischen Algorithmus mit Input a, b E N mit a > b. Dann gilt für die Zwischenergebnisse ri = s • a

ti • b

für alle i E {0, 1, ...,n}.

Insbesondere gilt also rn = ggT(a, b) = sn • a + t,„ • b. Beweis. Wir zeigen die Aussage ri = s j • a + t j • b für alle j e {0,1,..., n} per Induktion über j. Zum Berechnen eines jeden ri+i wird sowohl der Vorgänger rj als auch der Vorvorgänger rj _ j benötigt. Dies spiegelt sich in der Induktion wieder. Induktionsverankerung: Für j = 0 gilt wegen ro = a, so = 1 und to = 0 sofort ro = so • a + to • b. Für j = 1 gilt wegen r i = b, Si = 0 und ti = 1 sofort ri = si • a t1 • b. Induktionsannahme: Es sei 1 < j < n, und es gelte

Tj-i = Sj-i • a tj_ i . b r j = s j • a + tj • b. Induktionsschluss: Zu zeigen ist, dass rj.4.4 = .93+1 • a t j+1 • b gilt. Mit dem in der while-Schleife berechneten k, gilt nach Lemma 3.14

151

i► DAS LEMMA VON BEZOUT

rj±i = rj_i — kjrj. Also

gilt •a+ k • si • a +

= ki • ri = ri = rj_ 1 — ki • T • = (Si-1 -

Es gilt also r3 +1 = 33 +1

• a t3 +1 •

ki • ') •

a

•b k • ti • b (tj_1 — ki • tj) •

b, was zu zeigen war.

6. ■

Wir können nun das Lemma von Bdzout formulieren und beweisen. LEMMA 3.48 (Lemma von Bdzout). Alle Paare von natürlichen Zahlen a und b E N besitzen Bdzout Multiplikatoren. Beweis. Der Beweis ist eine direkte Konsequenz aus Lemma 3.47, man berechnet s und t mittels erweitertem euklidischem Algorithmus. ■ BEISPIEL 3.49. Für die Zahlen a = 75 und b = 20 ist wie in Beispiel 3.41 gesehen ggT(75, 20) = 5. Dann ist 1 • 75 + (-3) • 20 = 5 mit den Bdzout Multiplikatoren s = 1 und t = 20. ■

Der erweiterte euklidische Algorithmus in Form von Algorithmus 3.46 lässt sich angenehm übersichtlich in Tabellenform durchführen. SCHEMA F 3.50 (Der erweiterte euklidische Algorithmus in Tabellenform).

Eingabe: Zwei Zahlen a.b E N mit a > b. Schritt 1. Lege eine Tabelle der folgenden Form mit den Einträgen in den ersten zwei Zeilen an. ki

ri

0 1

b

si

tj

1

0

0

1

Schritt 2. Wiederhole die folgenden Schritte 2.1 und 2.2 bis r • = 0 ist.

152

DAS LEMMA VON BEZOUT A

Schritt 2.1. Berechne den Wert k3 mithilfe der Wert rj_i und r3.

kJ -1

—1

■-I:l

1111

Sj-1

tj-1

53

tj

Schritt 2.2. Mithilfe von k3 können nun die Werte r3 +1, 53 +1 und t3 +1 aus den Werten r3 _1, 53 _ 1und ti_j sowie r3 , 53 und t3 berechnet werden.

j—1

k3-1

j j+1

Schritt 3. Ist rj = 0, dann gib die Werte rj als ggT(a, b), si und tj als 136zout Multiplikatoren mit ri = si • a tj • b aus.

BEISPIEL 3.51. Es sei der ggT der Zahlen 42 und 5 zu berechnen. Schritt 1. Zunächst stellen wir die Tabelle auf, indem wir in die erste Zeile die 42 und in die zweite Zeile die 5 eintragen. rj

sj

tj

0

42

1

0

1

5

0

1

ki

Schritt 2. Nun wird die Tabelle Schritt für Schritt ausgefüllt, wobei zunächst k2 berechnet wird, um die zweite Zeile zu vervollständigen. Dann werden die Zeilen in der Reihenfolge rj, s j, t j und ki ausgefüllt, bis rj = 0 ist für ein j E N.

153

1. DAS LEMMA VON BEZOUT

ti

kj

rj

83

0

\

42

1

0

1 2

8= 2 = []

[21

5

0

1

2

1

—8,

3

2 = []

1

—2

17

4

0

Tastsächlich ist r4 = 0. Also gilt ggT(42, 5) = 1 mit (-2) • 42 + 17 • 5 = 1.

■

3.4.2 Das Lemma von Euklid

Bevor wir uns mit dem chinesischen Restsatz beschäftigen, ernten wir noch eine zahlentheoretische Aussage über die Faktorisierung natürlicher Zahlen. LEMMA 3.52 (Lemma von Eu kl id). Teilt eine Primzahl p das Produkt a • b zweier Zahlen a, b E N, so teilt p auch mindestens einen der Faktoren a oder b. Beweis. Wir nehmen o.B.d.A. an, dass p kein Teiler von a ist und zeigen, dass plb gelten muss.

Es sei p t a. Da p eine Primzahl ist, hat p nur die Teiler 1 und p und demnach ist ggT(a, p) = 1 (der ggT(a, p) teilt a und p. Es kommen also nur 1 und p in Frage, doch nach Voraussetzung teilt p nicht a). Nach dem Lemma von B6zout gibt es damit s, t E Z mit s • p +t • a = 1. Multiplikation mit b auf beiden Seiten der Gleichung ergibt s•p•b+t•a•b=b.

Nach Voraussetzung teilt p das Produkt a • b und demnach beide Summanden der linken Seite. Also teilt p auch die rechte Seite, was zu zeigen war.

■

BEISPIEL 3.53. Die Primzahl p = 7 teilt das Produkt der Zahlen a = 4 und ■ b = 35, denn 4 • 35 = 140 und 140 = 20 • 7. Induktiv ergibt sich daraus unmittelbar das folgende Korollar.

154

DER CHINESISCHE RESTSATZ .4 KOROLLAR 3.54. Ist ein Produkt Er , ai von m > 2 natürlichen Zahlen durch die Primzahl p teilbar, so ist mindestens ein Faktor ai durch p teilbar.

Beweis. Wir beweisen die Aussage mit vollständiger Induktion und führen die Induktion über m. Induktionsverankerung: Der Fall m = 2 entspricht dem Lemma von Euklid. Induktionsannahme: Wir nehmen als Induktionsvoraussetzung an, dass az teilt, wenn eine Primzahl p das Produkt von m natürlichen Zahlen sie auch einen der Faktoren a, teilt.

Fr

Induktionsschluss: Für den Induktionsschluss interpretieren wir ein Produkt von m 1 natürlicher Zahlen als ein Produkt zweier Zahlen m.+1

n

Are

ai = am±i • n ai•

i=1

(3.4)

i=i

Nach dem Lemma von Euklid teilt eine Primzahl p entweder am±i oder 1-17 a.„, wenn p das Produkt Him±i I. az teilt. Da außerdem das Produkt auf der rechten Seite von (3.4) rn Faktoren beinhaltet, teilt p nach Induktionsannahme einen der Faktoren a„,, wenn p das Produkt nim 1 ai teilt. ■ BEMERKUNG 3.55. Das Lemma von Euklid und Korollar 3.54 gelten auch für das 1641 der absolut Beträge m Produkt ganzer Zahlen. Denn teilt p das Produkt fl ganzer Zahlen, dann auch Fulla2. ■

3.5 Der chinesische Restsatz

Der chinesische Restsatz trifft eine Aussage darüber, welche ganzen Zahlen x E Z nicht bloß eine Modulgleichung x = a (mod m) sondern gleich mehrere erfüllen. Wir definieren zunächst. DEFINITION 3.56. Es sei s E N. Dann nennen wir das System x x x

az

(mod ml) (mod m2) (mod mn )

155

S. DER CHINESISCHE RESTSATZ

von n Modulgleichung simultane Kongruenz bezüglich der ganzen Zahlen ai, a2, E Z modulo ml, m2, • • • rnn E N>2. Der chinesische Restsatz beschäftigt sich also mit der Frage nach der Lösbarkeit und dem Finden von Lösungen simultaner Kongruenzen. Anwendungen des chinesischen Restsatzes sind vielfältig. Beispielsweise ermöglicht der chinesische Restsatz Berechnungen mit großen Zahlen in viele (n viele) Probleme mit kleineren Zahlen aufzuteilen. Das setzt natürlich voraus, dass sich die Lösungen der Probleme mit den kleineren Zahlen zu einer Lösung mit den ursprünglichen, größeren Zahlen zusammensetzten lassen. Diese Frage der Rekonstruierbarkeit und die durch den chinesischen Restsatz gegebene Lösung war in einem speziellen Fall bereits dem chinesischen Gelehrten Sun Tsu etwa 300 n. Chr. bekannt. , a, E N und Module ml , m2 ,...,mn gibt Für welche Zahlen ai, a2, es denn überhaupt eine Lösung der zugehörigen simultanen Kongruenz? Das folgende Beispiel versucht einen ersten Anlauf einer Klärung dieser Frage. BEISPIEL

3.57. Die folgende simultane Kongruenz ist nicht lösbar. x x

x ist gerade wegen x = k • 6 A- 0 x ist ungerade wegen x = f • 8 + 1

0 (mod 6) 1 (mod 8)

Die erste Gleichung impliziert, dass x gerade ist. Aber x muss ungerade sein, um die zweite Gleichung zu erfüllen - ein Widerspruch. Die simultane Kongruenz x 4 x --=7 2

(mod 6) (mod 8). ■

ist dagegen mit x = 10 lösbar.

Sind die entsprechenden Module jedoch teilerfremd, so garantiert derchinesische Restsatz immer eine Lösung. SATZ 3.58 (Chinesischer Restsatz). Seien mi, teilerfremd und ai , , an E Z.

,

E N>2 paarweise

1. Dann existiert eine Lösung x = a mit a E Z der simultanen Kongru-

156

DER CHINESISCHE RESTSATZ

Ä

enz x x

(mod a2 (mod m2)

x

an (mod inn )

k Die Lösung ist modulo m = mi • m2 • ... • mit eindeutig. k Die Menge aller Lösungen ist {a + .e • m : P E Z}. Beweis. Betrachte die im Satz gegebene simultane Kongruenz zu ganzen ,mn E N>2. Zahlen ai , , a, E Z mit teilerfremden Modulen

.;2 paarweise teilerfremd und al , Eingabe: Seien ml , kleinste positive Lösung der simultanen Kongruenz

a„, E Z. Es sind alle Lösung und die

al (mod ml) a2 (mod m2)

x x

an

(mod mr,)

zu finden. Schritt 1. Berechne für jedes P E {1, 2, ... ,n} den Wert

Schritt 2. Berechne für jedes t E {1, 2, ... n} mittels erweitertem euklidischen Algorithmus die 136zout Multiplikatoren se und te von me und Me, so dass gilt 1 = se • Me + te • me. Schritt 3. Lese für jedes P E {1, 2, ... n} die Basislösung be = se • Me aus der Gleichung von Schritt 2 aus. Schritt 4. Eine spezielle Lösung der simultanen Kongruenz findet sich in a = al • bi + a2 • b2 +

+ an • bn•

Schritt 5. Es sei M = m1 • m2 • • • mn. Die Menge aller Lösung der simultanen Kongruenz ist {a+k•M:kEZ}. Schritt 6. Die kleinste positive Lösung ist Rest, (a). BE ISPIEL 3.61. Es sei die folgende simultane Kongruenz gegeben. 3 4 1

x x x

(mod 4) (mod 5) (mod 9)

Schritt 1. Wir berechnen =f 71=1 mi = m2 • m3

=

5 • 9 = 45

=

rrti • m3

=

4 • 9 = 36

=

Mi • M2

=

4 • 5 = 20

M2 = f;`=1 mi i#2 M3 = 117=1

i#3

159

A

DER CHINESISCHE RESTSATZ

Schritt 2. Mittels erweitertem euklidischen Algorithmus berechnen wir die Darstellungen 1 = si • ti • mi = 1 • 45 + (-11) • 4 1 = s2 • M2 + t2 • M2 = 1 • 36 + (-7) • 5 1 = s3 • M3 + t3 • Ms = —4.20+ 9•9 Schritt 3. Lese die Basislösungen b1 = si • Ml = 1 . 45 = 45 b2 = s2 • M2 = 1. 36 = 36 b3 = s3 • M3 = = —4 • 20 = —80 aus Schritt 2 aus. Schritt 4. Eine spezielle Lösung der simultanen Kongruenz findet sich in a= a1 • bt a2 • b2 a3 • b3 = 3 • 45 + 4 • 36 + 1 • (-80) = 199. Schritt 5. Es ist M = ml • m2 • m3 = 4 • 5 • 9 = 180. Die Menge aller Lösung der simultanen Kongruenz ist somit {199 + k • 180 : k E Z}. Schritt 6. Die kleinste positive Lösung ist Restim (199) = 19.

■

3.5.1 Anwendung des chinesischen Restsatzes: Ein probabilistischer Gleichheitstest Wir möchten nun eine Anwendung des chinesischen Restsatzes diskutieren. Dabei sind zwei große Zahlen zu vergleichen, indem nur wenige Bits tatsächlich verglichen werden.

Die Aufgabe Zwei Personen an den Enden eines Nachrichtenkanals wollen zwei 10 000 Bit lange, binäre Nachrichten auf Gleichheit hin überprüfen. Dabei sollen möglichst wenige Bits übertragen werden. Sicherlich erschwert die Einschränkung, dass nur wenige Bits übertragen werden dürfen, die Aufgabe enorm. Sonst könnte eine Person einfach die ganze Zahl übertragen, so dass die zweite Person die Zahlen auf Gleichheit hin überprüft. Die Einschränkung ist nicht bloß eine theoretische Spielerei. Man stelle sich Anwendungen vor, bei denen jedes übertragene Bit kostet (entweder Zeit oder Geld). In einem solchen Fall ist man sicherlich daran interessiert, mit möglichst wenig Kommunikation die Aufgabe zu lösen.

160

DER CHINESISCHE RESTSATZ

Der Algorithmus Das folgende Verfahren erlaubt einen Vergleich der beiden als Zahlen a, b < 210 000 interpretierbaren Nachrichten, wobei anstatt der bis zu 10 000 Bits für die gesamte Nachricht nur k •101 Bits gesendet werden (bzw. k • 202 Bits bei erforderlicher Übertragung der Moduln). Das Verfahren garantiert schon für k = 1 sehr hohe Sicherheit. Algorithmus 3.62 (Probabilistischer Gleichheitstest). Input: a, b E N mit a, b < 210 000. Output: „a 0 b" oder „mit großer Wahrscheinlichkeit a = b". 1.Wähle zufällig Primzahlen pi, pk E [21°°, 2101]. 2. Übertrage a modulo pi für alle i = 1, , k. if a 0 b (mod pi) für ein i then return „a 0 b"

else return „mit großer Wahrscheinlichkeit a = b" end if

Die Analyse

Ist die Ausgabe des Verfahrens „a 0 b", so ist dies stets richtig, da aus a b (mod A) (für eine der Primzahlen p2) sofort a b folgt. Wir schätzen nun die Wahrscheinlichkeit ab, dass das Verfahren zu einer Fehlentscheidung der Form „a = b" führt, obwohl a # b gilt. Zentral ist dabei, dass es für a b nicht viele p, mit a b (mod p,) geben kann. Folgende Beobachtung hilft enorm bei der Analyse. b gibt es LEMMA 3.63. Für zwei natürliche Zahlen a, b E N mit a z j mit a = b (mod pi). höchstens 99 Primzahlen pi E [2100 2101] Beweis. Wir beweisen die Aussage durch Widerspruch.

Angenommen, es gibt 100 verschiedene Primzahlen qi, • • • gloo E mit a

b (mod q.,) für

[2 100 , 2101i

i = 1, ... 100.

Nach dem chinesischen Restsatz ist dann aber a = b (mod m) mit m = qi • • • gm. Es gilt nach der Wahl der Primzahlen aus dem Intervall [2100, 2101] , dass m > (2

100.100

)

= ,210000

161

A

Ä DER CHINESISCHE RESTSATZ

Da jedoch a, b < 21000° < m gilt, sind a und b identisch. (Denn x b (mod m) wird durch x = b erfüllt und sonst keiner Zahlen zwischen 0 ■ und m.) Eine Fehlentscheidung ist also überhaupt nur dann möglich, wenn das Verfahren zufälligerweise ausschließlich solche Primzahlen q > 2199 auswählt, für welche a b (mod q) gilt. Von diesen gibt es höchstens 99. Wie groß die Wahrscheinlichkeit für dieses Ereignis ist, hängt von der Anzahl der Primzahlen in dem Intervall [2100, 2101] ab. Mithilfe des berühmten Primzahlsatzes lässt sich diese Anzahl abschätzen. KOROLLAR 3.64. In dem Intervall [2199, 2101 ] gibt es ungefähr 293 Primzahlen. Beweis. Nach dem berühmten Primzahlsatz gilt für die Anzahl ir(n) der Primzahlen in dem Intervall [1, n] die asymptotische Formel r(x) n/ ln(n). In [2199, 2101] gibt es daher approximativ 293 Primzahlen, denn es gilt 2

. (21.00

( 101) _ 71

9101

) — ln (2191) 2100 100 • ln (2)

2100

ln (2199

1 (2101 _ 2boo) ln (2190 )

> 293.

LEMMA 3.65. Bei unterschiedlichen Inputzahlen a, b < 210000 ist die 99 ) k Fehlerwahrscheinlichkeit durch/ — nach oben beschränkt. 293 Beweis. Nach Lemma 3.63 gibt es höchstens 99 „ungeeigneten" Primzahlen in [2199, 2101]. Die Wahrscheinlichkeit zufällig eine von diesen zu erwischen ist nach Korollar 3.64 ungefähr 99/293 ^ 0,9996 • 10-26. Bei k-facher unabhängiger Wahl einer Primzahl aus [2199, 2101] ist die Fehlerwahrscheinlichkeit also höchstens ( 29993 ) k . • BEMERKUNG 3.66. Schon für k = 1 ist die Fehlerwahrscheinlichkeit des probabilistischen Gleichheitstest also verschwindend klein.

Man beachte, dass diese Schranke für die Fehlerwahrscheinlichkeit unabhängig von den Nachrichten a und b ist. Wenn wir dagegen an zufälligen Bitpositionen prüfen, erkennen wir die Ungleichheit oft nicht, wenn a und b an fast allen Bitpositionen ■ übereinstimmen.

162

DIE EULERSCHE -FUNKTION

A

3.6 Die eulersche 90-Funktion In diesem Abschnitt untersuchen wir eine im Folgenden wichtige Funktion auf den natürlichen Zahlen. Die eulersche 99-Funktion zählt zu einer Eingabe n die teilerfremden Zahlen von 1 bis n. Sie wird sowohl in der Betrachtung von Gruppen als auch bei Anwendungen wie dem RSASchema eine zentrale Rolle spielen. DEFINITION 3.67. Die eulersche cp-Funktion p : N+ —› N+ lautet (p(n) = {m E {1,... , n} : ggT(m,n) = 111.

ge # Die Eulersche 2. Dann ist m gerade, wenn es ein n E N gibt mit p(n) = m. Außerdem ist (p(n) = 1 nur für n = 1, 2 erfüllt. Beweis. Sei m E N. Wir nehmen an, es gibt ein n E N, so dass (p(n) = m ist. Wir unterscheiden zwei Fälle. Fall 1 - n > 3. Diesen Fall unterscheiden wir ebenfalls in zwei Fälle. Fall 1.1 - n = 2k . Nach Satz 3.70 gilt m = (p(n) = (p(2k )

=

2k-1(2 - 1).

Nach Voraussetzung ist n > 3 und somit k > 2. Also ist mit (3.5)

(3.5) m =

165

14. DIE EULERSCHE :i2 -FUNKTION

cp(n) gerade und m 1. Fall 1.2 - n = 2k • n' mit 2I. n' und n' > 1. In der Primfaktorzerlegung von n' taucht die Potenz von mindestens einer ungerade Primzahl p auf, so dass n = pk • n" mit p t n". Nach Satz 3.70 gilt m = 49(n) = So(pk ) • 4P (nn) = Pk-1 (I)

1) •

99(n")

(3.6)

Da p ungerade ist, ist p - 1 gerade und mit (3.6) auch c,o(n) und somit m. Außerdem ist p > 3, also (p - 1) > 2 und mit (3.6) m > 2, also insbesondere m 1. Fall 2 - n < 3. Es bleiben die beiden Möglichkeiten n = 1 oder n = 2. In beiden Fällen prüft man ganz leicht 99(n) = 1. ■

3.76. Das Lemma 3.75 impliziert nicht, dass es für jede gerade Zahl m tatsächlich auch eine natürliche Zahl n E N gibt, so dass w(n) = m. Beispielsweie gibt es keine natürliche Zahl, die durch die eulersche c,o-Funktion auf die 14 abgebildet wird, wie wir in Beispiel 3.86 sehen werden. ■ BEMERKUNG

Der Fall m = 1 ist durch Lemma 3.75 gelöst. Weiterhin suchen wir für gerade m > 2 alle Zahlen n mit c,o(n) = m. Wir erreichen das Ziel nach der folgenden Definition in drei „einfachen" Schritten. DEFINITION 3.77. Sei m E N. Wir sagen n E N ist eine reine Lösung für m wenn c,o(n) = m und n = pk für eine Primzahl p und k E N ist. BEISPIEL 3.78. Für m = 100 sind die reinen Lösungen 1011 und 53 = 125 und es gilt 99(101) = 100 und (p(53) = 52 • (5 — 1) 100. ■

Schema F zur Rückwärtsberechnung von y, Um die Urbilder bezüglich der eulerschen w-Funktion einer natürlichen Zahl m E N zu ermitteln, bedient man sich ihrer Multiplikativität. Das heißt, um nicht alle Zahlen von 1 bis n untersuchen zu müssen, hilft die Tatsache, dass, wenn eine Zahl n auf m abgebildet wird, sich der Funktionswert (also (p(n) = m) in ein Produkt der Bilder der Primfaktoren aus der Primfaktorzerlegung von n zerlegen lässt. Es ist nämlich n = ilpik i

166

t

t

49(n) = 149(Piki ) = fl ai , i=i

DIE EULERSCHE

,j-FUNKTION A

wobei die a, nach Lemma 3.75 gerade oder 1 sind. Der letzte Fall tritt nur ein, wenn n durch 2 aber nicht durch 4 teilbar ist. Außerdem sind die Primfaktoren p!'' reine Lösungen der ch. Man geht also zunächst auf die Suche nach Faktorisierungen von m in gerade Faktoren. Für jede dieser Faktorisierungen sucht man daraufhin für jeden Faktor reine Lösungen, um teilerfremde Lösungen des Problems zusammenzubauen. Wir geben jetzt drei Schritte an, welche dieses Programm zum Auffinden aller Lösungen für die Rückwärtsberechnung der eulerschen (p-Funktion umsetzen. Im Anschluss werden wir beweisen, dass das Anwenden dieser Schritte zu korrekten Lösungen führt und auch jede korrekte Lösung gefunden wird. Das Schema kommt zunächst etwas sperrig daher, doch kann man es ganz stumpf abarbeiten. Die echte richtige Herausforderung besteht in Schritt 1, dem systematischen Auffinden von Faktorisierungen der Zahl m. SCHEMA F

3.79 (Rückwärtsberechnung der eulerschen 99-Funktion).

Aufgabe. Finde für eine Zahl m e N alle Zahlen n mit (p(n) = m. Schritt 1. Finde alle Faktorisierungen von m in ausschließlich gerade Faktoren. Schritt 2. Es werden für jede Faktorisierung m = al • a2 • • • ai aus Schritt 1 die folgenden Schritte durchgeführt. Schritt 2.1. Finde für alle Faktoren a, die Menge aller reinen Lösungen. Es kommen jeweils nur zwei Zahlen in Frage: S. Die Zahl ai + 1 ist eine reine Lösung von ai, wenn sie eine Primzahl ist. Dann setze b[ill = ai + 1 j prüft man ob S. Für die größte Primzahl pi aus der Primfaktorzerlegung von a, = jrj=i p;•1

j=2

Ist dies der Fall, ist bfi21 = pki +1 eine reine Lösung von Gibt es für einen Faktor keine reine Lösung, dann wird die Faktorisierung m = al • a2 • • • at verworfen und Schritt 2.2 nicht ausgeführt. Schritt 2.2. Nun werden je paarweise teilerfremde reine Lösungen der Faktoren miteinander multipliziert. Dazu setzt man b[81's2'•••' 321 = ei . b[82 1 • • •

et]

wobei die b si] jeweils reine Lösung des Faktors ai sind.

167

1. DIE EULERSCHE ,p-FUNKTION

Schritt 3. Für jede gefundene ungerade Lösung b ist auch 2b eine Lösung.

Die drei Schritte in algorithmischer Schreibweise. Algorithmus 3.80 (Auffinden aller Lösungen von yo(n) = m). Input: m E N. Output: Alle Zahlen n mit 4)(n) = m. 1. Setze L = {}. 2. Bestimme alle möglichen Faktorisierungen mu = aui • • • aut(u) von m in gerade Faktoren aui• 3. Sei d die Anzahl aller Faktorisierungen aus 2. for u = 1 to d do for i = 1 to Au) do 4. Berechne für aui die Primfaktorzerlegung von aui = if auz + 1 ist eine Primzahl then Setze b111 = aui + 1 else if Fr=1 phi= p1 — 1 then Setze bl21 = pki 1 +1 else Setze u=u+1 und Exit for end if end for 5. Für alle Tupel (b[is d , . bie mit paarweise tederfrernden L = L U {bils11 • • • btl'I} end for 6. Für jede ungerade Lösung n E L füge Lösung 2n in L ein: L=LU{2•n : nEL, nungerade} return L.

füge Lösung in L ein:

Im Folgenden ist die Implementierung des zweiten Schritts in Sage gezeigt. sage: def phirueck_2(a): #Eingabe: Liste a der Faktoren einer Faktorisierung ell = len(a) b = [[0,0] for i in range(0,e11)] #Schritt 2.1 solution=[] for i in range(0,e11): pl = factor(a[i])[-1] if a[i]+1 in Primes(): b[i][0]=a[i]+1 if a[i]/(p1[0]-P1[1])==(p1[0]-1): b[i][1]=p1[0]^(p1[1]+1) #Schritt 2.2 solution=[] if ell>=2:

168

DIE EULERSCHE

d=((b[i][mod(floor(j/(2 - i)),2)] for i in range(0,e11)] for j in range(0,2"e11)) for c in d: if (prodUgcd(c[s],c[t]) for s in range(0,e11) for t in range(s+1,e11)]))==1: solution.append(prod(bb)) else: solution = set(b[0])-set([0]) return set(solution) • sage: phirueck_2([2,10]) set((33, 441)

Wir beweisen nun, dass der Algorithmus 3.80 alle und nur korrekte Lösungen findet. Dazu betrachten wir zunächst die insbesondere in Schritt 2 konstruierten Lösungen. LEMMA 3.81. Schritt 2.1 findet für jeden Faktor aus einer fixierten Faktorisierung al • a2 • • • at aus Schritt 1 die Menge aller reinen Lösungen.

Beweis. Erfüllt die größte Primzahl pi aus der Primfaktorzerlegung von ai die Gleichung (3.7), dann gilt i l+1 ) (pk

IV

P1

'

pk •

3'

(P1 1) = PIP •

—

H

,

pi ' =

Man prüft das alleine für die größte Primzahl aus der Faktorisierung, denn schon für die zweitgrößte Primzahl p2 in der Primfaktorzerlegung von ai gilt 11/.7ci

pi •

npi3 > p2 — 1 j=3

j02

und somit 2

y,(7

,2

2+1

k2

)

P

• (p2 —

1)

kg P

•

n pkj

2

k p'

i=1 j2

Für eine Primzahl m + 1 ist 99(m + 1) = (m + 1 — 1) = m.

■

LEMMA 3.82. Sei a • a2 • • • at eine fixierte Faktorisierung aus Schritt 1, welche nicht in Schritt 2.1 verworfen wurde. Die in Schritt 2.2 gebildeten Produkte von reinen Lösungen werden auf m abgebildet. Eine in Schritt 3 gefundene Zahl wird ebenfalls auf m abgebildet.

Beweis. Sei b[81 "92 "••"5 £1

=

e]] • b[2921 - • •

et] eine in Schritt 2.2 gebildete

169

S4. DIE EULERSCHE 92 -FUNKTION

Lösung. Da die lel paarweise teilerfremd sind, gilt für eine solche Lösung ((bf 91 '82 —" 9 t1 ) = yo (1)11' 1 • b2821 • • • bf;£1 ) =

(14511) • yo (b[2821) • • • yo (e)

= ai • a2 • • • ae = m. Sei b eine ungerade gefundene Lösung. Es gelte also (p (b) = in und 2 und b sind teilerfremd. Dann gilt aber yo(2 • b) = (i) (2) • v(b) = 1 • c,o (b) = m. ■ LEMMA

3.83. Es werden alle Lösungen gefunden.

Beweis. Sei n E N eine Zahl mit w(n) = 7n. Wir prüfen, ob diese Zahl mithilfe der vier Schritte gefunden wird. Betrachtet man die Primfaktorzerlegung von n = 2k • fi=1 Ak' in das Produkt paarweise verschiedener ungerader Primzahlen 19., für i = 1, , t und einer Potenz von 2. Dann gibt es drei Fälle. Fall 1 - Es ist k = 0. Dann ist n ungerade. Es ist cp(n)= f P(Pk' ) = 11 ai i=1 i=i wobei pik' jeweils eine reine Lösung zu ai ist. Die Faktoren ai sind nach Lemma 3.75 alle gerade. Die Zahl n wird also bezüglich der Faktorisierung ai = rn gefunden. Fall 2 - Es ist k = 1. Dann ist z ungerade. Es ist außerdem 49 (n) = 49(2 ) • H(pcp't") = H (.0(pitci) = t=i t=i und H (p(p't") = i=i

Hai,

wobei pik' jeweils eine reine Lösung zu ai ist. Die Faktoren ai sind nach Lemma 3.75 alle gerade. Die Zahl 71 wird also bezüglich der Faktorisierung [Jai = rn gefunden. Da ä ungerade ist, findet man n in Schritt 3, in welchem alle ungeraden Lösungen mit 2 multipliziert werden.

170

DIE EULERSCHE ,J,-FUNKTION

A

Fall 3 - Es ist k > 2. Es ist ai, t=o

i=1

wobei p"' jeweils eine reine Lösung zu at; und 2k eine reine Lösung zu 2k-1 ist. Die Faktoren at und 2k-1 sind nach Lemma 3.75 und weil k > 2 ist alle gerade. Die Zahl n wird also bezüglich der Faktorisierung 2 k-1 nit=i = m gefunden.

Es wird Zeit für Beispiele. BEISPIEL 3.84. Wir betrachten zunächst nur die Schritte 2.1 und 2.2 für m = 400

und die Faktorisierung m = 4 • 100. Faktorisierung m = 4 • 100. Schritt 2.1. k Finde reine Lösungen für al = 4. — 4 + 1 = 5 ✓ Primzahl

b[111 =5 b121 = 22+1 = 8

— 4 = 22 prüfe (2 — 1) 1 ✓

} Finde reine Lösungen für a2 = 100 —101 + 1 = 101 V Primzahl —100 = 52 • 22 —› prüfe (5 — 1) = 22 1

= 101 b121 = 52+1 = 125

Schritt 2.2. Wir kombinieren die reinen Lösungen b[1,11 = bin.]

= 5 • 101 = 505

✓ - weil 5 und 101 teilerfremd sind

b[2,1] = /ei

= 8 • 101 = 808

V - weil 8 und 101 teilerfremd sind

b[1,21

= by.] •b221 = 5 • 125

0,2]

=

r [2] • 42•

1 - weil 5 und 125 nicht teilerfremd sind

= 8 • 125 = 1000

✓ - weil 3 und 25 teilerfremd sind

und erhalten drei Lösungen für die Faktorisierung 400 = 4 • 100.

■

BEISPIEL 3.85. Gegeben ist m = 20, gesucht sind alle Lösungen n von cp(n) = 20. Schritt 1. Es ist m = 20 = 2.10 - also hat m = 20 zwei Faktorisierungen in gerade Faktoren. Für jede Faktorisierungen führe die Schritte 2.1 und 2.2 durch.

171

DIE EULERSCHE ,)-FUNKTION

Faktorisierung m = 20. Schritt 2.1. k Finde reine Lösungen für ai = 20. - 20 + 1 = 5 1 keine Primzahl. - 20 = 51 •-•2 —> prüfe (5 - 1) 22 V

b121

= 51+1 =

25

Schritt 2.2. Ist für diese Faktorisierung trivial. Wir erhalten eine Lösungen b[21 = b121 = 25 für die Faktorisierung m = 20.

Faktorisierung m = 2 • 10. Schritt 2.1. k Finde reine Lösungen für ai = 2 - 2 + 1 = 3 V Primzahl - 2 = 21 -› prüfe (2 - 1) 1 V Je. Finde reine Lösungen für a2 = 10 - 10 + 1 = 11 V Primzahl - 10 = 51 -1 z -> prüfe (5 - 1) Z- 21 1

b =3 1 1.21 .= 21+1 = 4 b211 = 11

Schritt 2.2. Lösungen für Faktorisierung m = 2 • 10 sind ... b1[.1] = 3.11 = 33 V - weil 3 und 11 teilerfremd sind 0,11 =b121 • 411 = 4 • 11 = 44

✓ - weil 4 und 11 teilerfremd sind

Zusammentragen der bisherigen Lösungen ergibt {25, 33, 44}. Schritt 3. Für jede gefundene ungerade Lösung n füge 2n hinzu. Wir erhalten die Lösungsmenge v(20)-1 = {25,33, 44, 50, 66}. ■ BEISPIEL 3.86. Gegeben ist m = 14, gesucht sind alle Lösungen n von (p(n) = 14. Schritt 1. Es ist m = 14 die einzige Faktorisierungen der 14 in gerade Faktoren. Führe für diese Faktorisierungen die Schritte 2.1 und 2.2 durch. Faktorisierungen m = 14. Schritt 2.1. S. Finde reine Lösungen für al = 14.

172

A

DIE EULERSCHE

—14 + 1 = 15 f keine Primzahl. —14 = 71 • 21 —› prüfe (7 — 1)2-- 21

f

Es gibt für den Faktor ai = 14 keine reine Lösung, die Faktorisierung m = 14 wird verworfen. Da die einzige Faktorisierung der 14 in gerade Faktoren keine Lösung lieferte, liefert auch Schritt 3 keine Lösungen mehr. Es gibt also kein n E N mit cp(n) = 14.

■

BEISPIEL 3.87. Gegeben ist m = 40, gesucht sind alle Lösungen n von cp(n) = 40.

Schritt 1. Es ist m = 40 = 4.10 = 2.20 = 2 • 2 • 10 - also hat m = 40 vier Faktorisierungen in gerade Faktoren. Für jede Faktorisierungen führe die Schritte 2.1 und 2.2 durch. Faktorisierung m = 40. Schritt 2.1. k Finde reine Lösungen für ai = 20. — 40 + 1 = 41 ✓ Primzahl — 40 = 51 • 23 —> prüfe (5 — 1)

b1111 = 41 22

I

Schritt 2.2. Ist für diese Faktorisierung trivial. Wir erhalten eine Lösungen b[1] = b11~ = 41 für die Faktorisierung m = 40.

Faktorisierung m = 4 • 10. Schritt 2.1.

S. Finde reine Lösungen für al = 4. —4 + 1 = 5 ✓ Primzahl —4 = 22 —÷ prüfe (2 — 1) Z- 1 S. Finde reine Lösungen für a2 = 10. —10 + 1 = 11 ✓ Primzahl z --> prüfe (5 — 1) 2-- 21 f — _ 51 "1

./

1411 = 5 = 22+1 = 8 [11

b2 = 11

Schritt 2.2. Lösungen für Faktorisierung m = 2 • 10 sind ... b[1,11 = ✓ - weil 5 und 11 teilerfremd sind 2. = 5 • 11 = 55 041 = b[1.2]

2. = 8 • 11 = 88

✓ - weil 8 und 11 teilerfremd sind

173

3.

DIE EULERSCHE ..j-FUNKTION

Faktorisierung m = 2 • 20. Schritt 2.1. k Finde reine Lösungen für al = 2. —2 + 1 = 3 V Primzahl —2 = 21 I. prüfe (2 — 1) 1 k Finde reine Lösungen für a2 = 20. —20 + 1 = 21 1 keine Primzahl —20 _ 51 "2 —› prüfe (5 — 1) 1 - 22 ✓

b[1] = 3 [2] — _z _ —4

b221 = 51+1 = 25

Schritt 2.2. Lösungen für Faktorisierung m = 2 • 10 sind ... =611ib[211 _ 3 . 25 = 75 b[2,1] = b121

• bri]

✓ - weil 3 und 25 teilerfremd sind V - weil 4 und 25 teilerfremd sind

4 25 = 100

Faktorisierung m = 2 • 2 10. Schritt 2.1. lk Finde reine Lösungen für al = a2 = 2. — 2 + 1 = 3 V Primzahl — 2 = 21 prüfe (2 — 1) :-= 1 V } Finde reine Lösungen für a3 = 10. —10 + 1 = 11 V Primzahl —10 = 51 • 21 prüfe (5 — 1) -/ 21 1

—> bf» = 19211 = 3 b[i21 = 1)221 = 21+1 = 4 = b[31] = 11

Schritt 2.2. Lösungen für Faktorisierung m = 2 •2 • 10 sind ... 19[41,1] = by.] • b11] = 3 • 1 - weil 3 und 3 nicht teilerfremd sind 3 • 11 b12,1,11 = bV]

Ei] = 4 • 3 • 11 = 132

19[1,2,1] = byl • b[1] 19[2,2,1] =

b[12]

=

V- weil 3, 4, 11 paares. teilf. sind

3 • 4 • 11 = 132 1- gleich zu b12,1,11 4 • 4 • 11

1 - weil 4 und 4 nicht teilerfremd sind

Zusammentragen der bisherigen Lösungen ergibt {41, 55, 75, 88, 100, 132}. Schritt 3.

174

DER SATZ VON EULER

Für jede gefundene ungerade Lösung n füge 2n hinzu. Wir erhalten die Lösungsmenge cp(40)-1 = {41,55, 75,82, 88,100,110,132,150}.

3.7 Der Satz von Euler

Wir greifen nun auf den Satz 4.56 vor, welchen wir im Kontext von Gruppen in Kapitel 4 beweisen und verstehen lernen. Mithilfe dieser abstrakteren Einsicht in die mathematische Theorie des Rechnens möchten wir den Satz von Euler und den kleinen Satz von Fermat beweisen. Das folgende Korollar folgt direkt aus Satz 4.56 und der Tatsache, dass (Z*, Gri) eine endliche abelsche Gruppe ist - was das genau bedeutet, lernen wir später. KOROLLAR 3.88. Es sei n E N und n > 2. In der abelschen Gruppe (Z7„ On ) gilt e(n) = 1 für jedes a E Z.

Aus diesem Korollar folgern wir den Satz von Euler. SATZ 3.89 (Satz von Euler). Es seien a, n E N teilerfremd mit n > 2.

Dann ist a`P(n) = 1 (mod n). Der folgende kleine Satz von Fermat ist im Prinzip ein Spezialfall des Satzes von Euler. SATZ 3.90 (kleiner Satz von Fermat). Es seien a, n E N, wobei n eine Primzahl ist. Dann ist a" a (mod n). Beweis. Es seien a, n E N und es sei n eine Primzahl. Wir untersuchen zwei Fälle. Fall 1 - ggT(a,n) = 1. Dann folgt, wegen (7) (n) = n - 1, aus dem Satz von Euler a n-1 • a

1 • a (mod n).

175

DER SATZ VON EULER

Fall 2 - ggT(a, n) 1. Dann folgt sofort ggT(a, n) = n (weil n nur die Teiler 1 und n hat, kommt als gemeinsamer Teiler von a und n nur noch n in Frage).

r

Es gilt also a = e • n mit .e E N und damit ist auch an = • nn ein Vielfaches von n, dh. es gilt Rest, (a) = 0 = Rest., (an) und demnach a' = a (mod n). •

BEMERKUNG 3.91. Der kleine Satz von Fermat stellt keine Bedingung an a E N, im Gegensatz zum Satz von Euler bei dem ggT(a, n) = 1 gelten muss (a`P(n) = 1 (mod n) falls ggT(a, n) = 1). Dafür muss aber der Modul (die Zahl n) eine Primzahl sein. Im Beweis wurde ersichtlich, dass a und n entweder teilerfremd sind - dann folgt der kleine Satz von Fermat direkt aus dem Satz von Euler - oder a ein Vielfaches von n ist - dann ist an-1 mod n nichts anderes als an-1 0n-1 0 a (mod n). ■

Wir beobachten, dass der Satz von Euler besonders für die Reduktion von Kongruenzen großer Zahlen nützlich ist. BEISPIEL 3.92. Wir wählen konkrete Zahlen a = 3 und n = 5. Diese sind teilerfremd, es gilt ggT(3, 5) = 1. Berechnet man cp(5) = 4, dann lässt sich 34 = 81 leicht modulo 5 auf 1 reduzieren. Nach dem Satz von Euler ist nämlich a9"1 = 34 = 1 (mod 5).

BEISPIEL 3.93. Wählt man etwas größere Zahlen wird die Stärke des Satzes von Euler deutlich. Sei dazu a = 7 und n = 22 = 2 • 11. Diese sind teilerfremd, es gilt ggT(7, 22) = 1. Berechnet man yo22 = 10, dann lässt sich 710 = 282475249 leicht modulo 22 auf 1 reduzieren. Nach dem Satz von Euler ist nämlich don 710 1 (mod 22).

BEMERKUNG 3.94. Im Satz von Euler kann die Voraussetzung ggT(a, n) = 1 (also die Teilerfremdheit) nicht weggelassen werden. Wählt man beispielsweise nicht-teilerfremde Zahlen a = 3 und n = 12, so gilt (p (12) = cp (22

176

) • (p(3) = 2 • 2 = 4

und

34 = 81 = 9 (mod 12).

DER SATZ VON EULER

A

3.7.1 Schnelles Potenzieren In diesem Abschnitt beschäftigen wir uns mit zwei Methoden zum effizienten Berechnen von Potenzen. Zunächst werden wir in Anwendung des Satzes von Euler Potenzen in Modulgleichungen reduzieren. Danach werden wir eine Methode kennen lernen, mit deren Hilfe prinzipiell Potenzen mit großen Exponenten effizienter berechnet werden können. Das meint, dass die Anzahl der benötigten Multiplikationen verringert werden kann.

Schnelles Potenzieren in Modulgleichungen

Das folgende Lemma ist eine klassische Anwendung des Satzes von Euler. LEMMA 3.95. Seien a,n E N teilerfremd mit n > 2. Dann ist a Restn(o(n))

für alle in E No

(mod n)

Beweis. Es seien a, m, n E No mit n > 2 und es gelte ggT(a, n) = 1. Dann

gilt nach dem Satz von Euler as°(n) = 1 (mod n). Sei nun r = Rests ,(, ) (m) dann gibt es ein P E N mit 17/ Daraus folgern wir a

m _ at•so(n)-1-r = aP• cp( n) •• a r =

=2•

lp(n)

r.

a w(n) ) • ar = le • ar (mod n).

Wir betrachten ein ausführliches Beispiel. BEISPIEL

3.96. Es soll Rest24 (334) berechnet werden. Zunächst berechnen wir cp (24) = w(3) • v(23) = 2 • 4 = 8

und wenden den Satz von Euler an. Es gilt dann nämlich v(24) 3- EE 1 (mod 24). Allgemein kann ein Exponenten m E N um cp(24) = 8 reduziert werden, denn es gilt 3m 3m—cp(24)-Ho(24) = 3m—w(24) 3cp(24) - 3m—w(24) (mod 24). Dies wendet man mehrfach an und erhält 334 326 _ 318 --- 310 _

32

_

9 (mod 24).

177

DER SATZ VON EULER

Insgesamt gilt also 334

= 3Rest8 (34) _ =

32 8 (mod 24).

•

Allgemeines schnelles Potenzieren Will man nun eine Potenz am berechnen und ist nicht an dem Rest modulo

einer Zahl n interessiert, führt man mit dem naiven Ansatz am = a • a • ... • a also insgesamt m — 1 Multiplikationen durch. Das lässt sich beschleunigen, wenn man sukzessive Potenzen mit Zweierpotenzen im Exponenten berechnet. Dazu berechnet man die Binärdarstellung von m. Setze dazu s = Llog2 (m)] und beobachte, dass die Binärdarstellung den Koeffizienten der Darstellung m

=E bi • 2i

mit bi E {0,1}

i=0

entspricht. BEISPIEL 3.97. Betrachten wir die natürliche Zahl 43. Es ist s = Llog2(43) J = 5. Demnach lässt sich 43 schreiben als

E 5

.

= 1 . 25 + o . 24 + 1 . 23 + o . 2 2 + . 21 + 1 2o

i=o =1•32+0•16+1•8+0•4+1•2+1•1=43

Dabei sind die Koeffizienten b5 = 1, b4

= 0, b3 = 1, b2 = 0, bl = 1 und bo = 1. ■

Mithilfe der Binärdarstellung lässt sich die Potenz am geschickt umschreiben. Es ist nämlich am =

bi • 2' = abo •2°±bi .21 +62 .22 +.

= a bo • 2° • a61.2' • a b2.22 • ... • abs .2s 22 ) b2 20 ) b0 ( 21 ) b1i (a • a = (a

•2s

a2

s bs

a2'

Hat man die folgende Liste von Zahlen zur Verfügung, dann lässt sich am als Produkt von höchstens s 1 vielen Faktoren berechnen. DE FINITION 3. 98. Seien a und n natürliche Zahlen. Dann sei P„,s = {a, a2 ,a4 ,a8 ,

,a

2'

,a

2s

}

die Menge aller Potenzen von a mit Zweierpotenz im Exponenten.

178

DER SATZ VON EULER

A

Diese Menge oder Liste Pa,s beinhaltet s 1 Zahlen. Bleibt die Frage, wie viele Multiplikationen nötig sind, die Zahlen in 26,,, zu berechnen. LEMMA

3.99. Die Menge Pa , s lässt sich mit s Multiplikationen berech-

nen. Beweis. Wir beweisen die Aussage mit vollständiger Induktion und führen die Induktion über s. Induktionsverankerung: Im Fall s = 1 ist die Aussage einfach zu prüfen. Die Menge Pao_ = {2,2'} besteht aus zwei Elementen und lässt sich mit einer Multiplikation (nämlich 2 • 2) berechnen. Induktionsannahme: Wir nehmen als Induktionsvoraussetzung an, dass sich die Menge Pa,s mit s Multiplikationen berechnen lässt. Induktionsschluss: Für den Induktionsschluss beobachten wir, dass Pa,s+1

U a2'+'

und

a

2'

E

Also berechnet man in s Multiplikationen Pa,s und mit einer Multiplikati8+1 • = a2' • a 2s und erhält Pc„s+1 in s 1 Multiplikationen. on a2 BEMERKUNG 3.100. Praktisch berechnet man die Zahlen in Pc„,, also Schritt für ■ Schritt. Denn es ist allgemein a2' = a2'-1 • a2' für alle i E N. In algorithmischer Schreibweise liest sich das schnelle Potenzieren nun folgendermaßen. Algorithmus 3.101 (SPoT). Input: a, m E N. Output: am. 1. Berechne die Binärdarstellung von m = EL0 bi • 2i mit bi E {0, 1}. 2. Setze s = Llog2(m)f 3. Setze Pa,s = {a}. for i = 1 to s do a2i1 a2i1. 1 5. Lese a2i aus Pa,s aus und berechne a2' = 6. Speichere a2' in Pa,s • end for 7. Berechne durch Aufrufen der Liste Pa,s am =

77

a2'.

Wir fassen unsere Beobachtung über die Komplexitätsreduktion in der folgenden Proposition zusammen.

179

k

AUFGABEN

PROPOSITION 3.102. Seien a, rn E N. Der Algorithmus SPOT benötigt höchstens 2 • [log2 (m)] Multiplikationen um am zu berechnen. Beweis. Nach Lemma 3.99 brauchen wir s = [log, (m)] viele Multiplikationen um Pa,., zu erzeugen. In Schritt 7 des Algorithmus wird mit diesen Werten in P der Wert am berechnet. Schritt 7 benötigt höchstens s = Llog2 (m) j weitere Multiplikationen. ■ BEISPIEL 3.103. Wähle a -= 7 und m = 10. Es sind naiv neun Multiplikationen nötig um 710 = 282475249 zu berechnen.

Es ist allerdings s = Llog2 (10)] = 3. Der Algorithmus benötigt also höchstens sechs Multiplikationen. Tatsächlich sind es sogar nur vier. Die Binärdarstellung von 10 ist 10 = 2 + 8 = 0 • 1 + 1 • 2 + 0 • 4 + 1 • 8. Also sind b0 = 0, b1 = 1, b2 = 0, b3 = 1. Wir bestimmen die Menge p7,3 =

= 7, a2 = 72 = 49,a 22 = 492 = 2401,a23 = 24012 = 5764801}.

Damit ist dann 710 = 49 • 5764801 = 282475249.

■

3.8 Aufgaben 3.2 Geben Sie alle echten Teiler von 10, 15 und 17 TEILBARKEIT.

an.

A 3.1 Welche der folgenden Aussagen ist korrekt?

wri' 3.3 Zeigen Sie, dass eine Zahl n E N genau dann eine Primzahl ist, wenn sie keine echten Teiler besitzt.

i. Ist a ein Teiler von b, dann ist b auch ein Teiler von a. ii. Ist a ein echter Teiler von b und a # NA, dann hat b mindestens einen weiteren von a verschiedenen echten Teiler. iii. Ist a ein Teiler von b, dann ist auch —a ein Teiler von b. iv. Jede ganze Zahl teilt die 0, die 0 teilt jedoch keine andere ganze Zahl. v. Eine natürliche Zahl heißt Primzahl, wenn sie genau zwei Teiler besitzt. vi. Eine natürliche Zahl heißt Primzahl, wenn sie genau zwei Teiler in N besitzt. vii. Die 47 ist eine Primzahl. viii. Die Primfaktorzerlegung einer natürlichen Zahl ist (bis auf Reihenfolge der Faktoren) eindeutig. ix. Die Zahl 3139 ist durch 15 teilbar.

180

wir 3.4 Zeigen Sie, dass die Zahl 4.531.893.868 keine Quadratzahl ist, indem Sie den Rest modulo 11 betrachten. 4' 3.5 Schreiben Sie eine sage-Funktion teilerfremd (), welche für eine natürliche Zahl n eine Liste aller zu n teilerfremden natürlichen Zahlen kleiner gleich n ausgibt. wri' 3.6 Sei n E N keine Primzahl und n > 4. Zeigen Sie, dass dann n1(n — 1)! gilt. M% 3.7 Sei m E N. Zeigen Sie, dass m genau dann eine Primzahl ist, wenn für jeden Teiler k von 177, mit k 1 gilt k > 4.13.8 Beweisen Sie i. und iii. aus Lemma 3.16. Es seien dazu a, b, m E 7L und k e N. Zeigen Sie, dass

AUFGABEN

Modul-Gleichung korrekt ergänzen

dann gelten i.

iii.

Rest,,,, (a b) Rest,,,. (ak)

= Rest,,,, (Restr, (a) b) = Rest,,,, (Rest., (a)k )

3.9 Seien a, b, c E Z. Beweisen Sie

3

41' 3.16 Finden Sie ein z E Z, das die ModulGleichung 3 a: z

eia und eia b clb. Zeigen Sie, dass nur eine Richtung der Äquivalenz eia und clb.

cla + b gilt.

' 3.10 Seien a, b, c, d E Z. Zeigen Sie, dass die folgenden Aussagen gelten.

WI

21 (mod n).

(mod 7)

korrekt ergänzt. Ist die Lösung eindeutig? - Wenn nicht, nennen Sie alle Lösungen für z E Z. 4 3.17 Finden sie zwei unterschiedliche Zahlen zi, z2 E Z mit izi.1 < 9 und 1z21 < 9, so dass für i E {1, 2} gilt (4102)1° = zi (mod 9).

alc. i. alb und blc 41' 3.18 Finden Sie eine Zahl z E N mit z < 19, so ii. alb und cld = a • clb • d. dass gilt alx • b + y • c für alle x, y E Z. iii. albund 7717 = z (mod 19). eine natürliche Zahl n E N dass Sie, wri` 3.11 Zeigen WI 3.19 Zeigen Sie genau dann eine Primzahl ist, wenn nla • b = nla oder nlb für alle a, b E N gilt. 3.12 Zeigen Sie, dass a2 ungeraden a E N.

1 (mod 4) für alle

für i > 0.

10' .7,1- (-1)' (mod 11)

Wie lässt sich daraus für eine allgemeine Zahl der Rest beim Teilen durch 11 errechnen? Hinweis: Was ist a • 102 + b • 101 + c • 10° modulo 11? 3.20 Berechnen Sie

MODULO-RECHNUNG.

3.13 Welche der folgenden Aussagen ist korrekt? i. Der Rest bezüglich der Zahl m ist niemals größer m. ii. Der Rest bezüglich der Zahl m ist höchstens m. iii. Es ist richtig 5 2 (mod 3) aber falsch 5 14 (mod 3) zu schreiben. iv. Es seien a, b E Z und m E N>2. Dann ist a genau dann äquivalent zu b modulo rn, wenn a — b durch M teilbar ist. v. Die untere/obere Gaußklammer entspricht dem (kaufmännischen) Ab-/Aufrunden. 3.14 Finden Sie ein n E N, das die folgende ModulGleichung korrekt ergänzt 4

19 (mod n).

Ist die Lösung eindeutig? - wenn nicht, nennen Sie alle Lösungen für n E N.

1. Rest8137 (2167) (3167 ) ii. iii. Rest3 (125) (mithilfe des kleinen Satzes von Fermat)

5'' 3.21 Berechnen Sie Rest17 (357)• wel‚3.22 Zeigen Sie, dass jede Quadratzahl (d.h. ein Quadrat einer ganzen Zahl) bei Division durch 4 den Rest 0 oder 1 hat. wir 3.23 Bestimmen Sie alle ganzen Zahlen n E Z, für die n2 — 8n + 15 durch 8 teilbar ist. wrl' 3.24 Es seien a, p, q E N, wobei p # q Primzahlen sind. Beweisen Sie, dass gilt x >x

a (mod p) und a (mod p • q).

x

a (mod q)

,..1` 3.25 Beweisen Sie Lemma 3.22, also dass für jedes rn E N>2 die Relation R.„„, = {(a, b) EZXZ:a

b

(mod m)}

4' 3.15 Finden Sie alle n E N, welche die folgende

181

Ä AUFGABEN

eine Äquivalenzrelation ist.

DER EUKLIDISCHE ALGORITHMUS UND DAS

zweier von 0 verschiedener ganzer Zahlen a, b E N ist die kleinste natürliche Zahl 7n E N, so dass alm und blm. Beweisen Sie, dass folgende Gleichung gilt

LEMMA VON BEZOUT.

kgV(a, b) • ggT(a, b) = ab.

A 3.26 Welche der folgenden Aussagen ist korrekt?

(Sie können beispielsweise die Primfaktorzerlegung des ggT(a, b) und des kgV(a, b) verwenden.) i. Die Zahlen 15 und 64 sind teilerfremd. ü. Die Zahlen 15 und 64 sind relativ prim. wr'' 3.32 Zeigen Sie, dass kgV(a, b) = ab, wenn iii. Es gilt ggT(197, 22) = ggT(175, 22). ggT(a, b) = 1. iv. Für je zwei ganze Zahlen a, b E Z gibt es stets 3.33 Sei durch co = 1, ci = 1 und ci = + zwei ganze Zahlen u, v E Z mit u•a+v•b= 1. Ci_2 für alle i E N>2 eine Folge von natürlichen Zahv. Für je zwei ganze Zahlen a, b e Z gibt es stets len gegeben (also 1, 1, 2, 3, 5, 8, 13, 21, ...). Diese Zahzwei ganze Zahlen u, v E Z, mit u•a+v•b= len werden die Fibonacci Zahlen genannt. Zeigen Sie, ggT(a, b). dass bei der Berechnung des erweiterten euklidischen vi. Der euklidische Algorithmus terminiert stets. Algorithmus mit der Eingabe a = c,, und b = c.„_1die vii. Der erweiterte euklidische Algorithmus termikleineren Fibonacci Zahlen als Reste ri auftauchen. niert nicht für alle Eingaben. wri` 3.34 Seien a, b E N zwei natürliche Zahlen mit ,r4 3.27 Berechnen Sie mithilfe des erweiterten euklidischen Algorithmus die folgenden größten gemeinsa- c,, > a > cn _i für zwei aufeinanderfolgende Fibonacmen Teiler (geben Sie jeden Rechenschritt in Tabellen- ci Zahlen cn _i und cn und a > b. Zeigen Sie, dass der erweiterte euklidische Algorithmus für die Eingabe a form an, wie in Schema F 3.50 beschrieben). und b höchstens so viele Schritte rechnet, wie für die Eingabe cn und cn—i. i. ggT(110, 34) ii. ggT(55, 34) 4' 3.35 Beweisen Sie Lemma 3.37. Seien für zwei iii. ggT(3993, 132) natürliche Zahlen a, b E N die Faktorisierung iv. Finden Sie dabei ganze Zahlen u, v, w, z und x, y, so dass gilt a= • p2m2 • • • p7e und b = pn1 1 • p'2 2 • • • pe'e ggT(110, 34) = u • 110 + v • 34 ggT(55, 34) = w • 55 + z • 34. ggT(3993, 132) = x • 3993 + y • 132.

in dieselben 2 Primfaktoren pi mit Exponenten E N für i E {1, 2, ... , g} gegeben. Zeigen Sie, dass dann gilt ggT(a, b) = plic1 • p2' • • • p£kt

wir 3.28 Für welchen Input a, b E N terminiert der euklidische Algorithmus zur Berechnung des ggT(a, b) nach nur einem Schritt?

mit ki = min{mi, nj} für i E {1, 2, ... , e}.

ble4 3.29 Es seien a, b, n E N

wrk 3.36 Betrachte die folgende rekursive, binäre Variante des euklidischen Algorithmus für die Eingabe zweier verschiedener natürlicher Zahlen a, b E N.

i. Beweisen Sie Lemma 3.35, also dass gilt ggT(a • b, n) 1 ggT(a, n) • ggT(b, n). ii. Wann gilt ggT(a b, n) = ggT(a, n) • ggT(b, n)? 3.30 Beweisen Sie, dass die Gleichung s•a+t•b = c genau dann eine Lösung s, t E Z hat, wenn c ein Vielfaches von ggT(a, b) ist. vek. 3.31 Das kleinste gemeinsame Vielfache kgV(a, b)

182

Falls a gerade und b gerade. Bestimme ggT (e, so dass ggT(a, b) = 2 • ggT (e,

e),

e).

Falls a gerade und b ungerade. Bestimme ggT (3- , b), so dass ggT(a, b) = 2 • ggT (i b). Falls a ggT (a,

ungerade und b gerade. Bestimme so dass ggT(a, 6) = 2 • ggT (a, 3).

Falls a ungerade und b ungerade. Bestimme

AUFGABEN

ggT (a — b, b), so dass ggT(a, b) = 2 • ggT (a — b, b).

falls möglich. x a- 1 (mod 5) x a 4 (mod 6) x -a 6 (mod 7)

Implementieren sie diesen Algorithmus in Sage als Funktion binaerEuklid 0 .

WI' 3.37 Zeigen Sie, dass die rekursive, binäre Variante des euklidischen Algorithmus aus Aufgabe 3.36 Geben Sie sowohl die kleinste positive Lösung als auch höchstens c • log2(n)2 Bitoperationen benötigt, wobei die Menge aller Lösungen an. n = max{a, b} und c ein von n unabhängiger Parame3.43 Lösen Sie die folgende simultane Kongruenz ter ist. Dabei kann man annehmen, dass eine einfache falls möglich. Rechenoperation auf Zahlen der Bitlänge k höchstens x a 2 (mod 3) c' • k viele Bitoperationen benötigt, wobei c' ein von k x —= 3 (mod 8) unabhängiger Parameter ist. x a 1 (mod 11) DER CHINESISCHE RESTSATZ. A

Geben Sie sowohl die kleinste positive Lösung als auch die Menge aller Lösungen an.

3.38 Welche der folgenden Aussagen ist korrekt?

wrl 3.44 Es seien nicht-teilerfremde natürliche Zahlen ml , m2 E N >2 gegeben. Für welche Wahlen von i. Jede simultane Kongruenz hat eine Lösung. , a2 E N hat die folgende simultane Kongruenz eine ai ii. Hat eine simultane Kongruenz eine Lösung, Lösung? dann auch unendlich viele. x al (mod mi) iii. Der chinesische Restsatz besagt, dass jede simultane Kongruenz mit teilerfremden Modulen x a a2 (mod m2) unendlich viele Lösungen hat. iv. Der Beweis des chinesichen Restsatzes ist kon- 54 3.45 Es seien nicht-teilerfremde natürliche Zahlen struktiv (es wird eine Lösung für eine simultane ml, m2 E N>2 und al , a2 E N gegeben, so dass die Kongruenz teilerfremder Modulen berechnet). folgende simultane Kongruenz eine Lösung hat.

Lösen Sie die folgende simultane Kongruenz falls möglich.

13.39 4.

xa3 xa7

(mod 5) (mod 10)

wel' 3.40 Lösen Sie die folgende simultane Kongruenz falls möglich. xa5 x 10

(mod 6) (mod 12)

3.41 Lösen Sie die folgende simultane Kongruenz falls möglich. x a 1 (mod 4) x .7÷_- 2 (mod 7) x :=_- 3 (mod 9) Geben Sie sowohl die kleinste positive Lösung als auch die Menge aller Lösungen an. 4rir

3.42 Lösen Sie die folgende simultane Kongruenz

x x

al (mod mi.) a2 (mod m2)

Nennen Sie alle Lösungen der simultane Kongruenz. wir 3.46 Der Lehrer D. Bonaker möchte seine Schüler für eine Gruppenarbeit in gleich große Gruppen einteilen. Legt er die Gruppengröße auf 5 Schüler fest, bleiben 3 Schüler übrig, sollen je 6 Schüler eine Gruppe bilden, bleiben 4 Schüler über. Erst als er die Gruppengröße auf 7 Schüler setzt, geht es genau auf. Wie viele Schüler sind in der Klasse von Herrn Bonaker mindestens? '54 3.47 Die Schüler einer Klasse sollen sich zu Gruppen gleicher Größe ordnen. Sie versuchen zuerst, sich zu Zweiergruppen zusammenzufinden, doch es bleibt ein Schüler übrig. Bei Dreiergruppen bleiben zwei Schüler übrig. Bei Vierergruppen bleibt ein Schüler übrig. Bei Fünfergruppen klappt es auch nicht, es bleibt eine gerade Anzahl an Schülern übrig. Wie viele Schüler sind mindestens in der Klasse? vel' 3.48 Schreiben

Sie

eine

sage-Funktion

183

A

AUFGABEN

BasisSol (m,M), welche für eine Zahl in und eiv. Es gibt keine natürliche Zahl n mit co(n) = 3. ne Liste M von zu rn und paarweise teilerfremden ".4 3.52 Berechnen Sie die eulersche (p-Funktion für natürlichen Zahlen die Basislösung zum chinesischen n1 = 17, n2 = 204, n3 = 104 und n4 = 540. Restsatz berechnet. welr 3.53 Finden Sie alle n E N mit co(n) = 60. S.13.49 Schreiben Sie eine sage-Funktion Equal P r im ( a, b), welche für zwei unterschiedliche ganze Zahlen a, b < 220 den prozentualen Anteil der Primzahlen p im Intervall [24°, 241] ermittelt, für DER SATZ VON EULER. welche a = b (mod p) gilt. A 3.54 Welche der folgenden Aussagen ist korrekt? 4..1 3.50 Schreiben Sie eine Sage-Funktion i. Es gilt für alle a, n E N stets aw(n) = 1. ProbEqual (a, b) , welche für zwei ganze Zahlen ü. Für eine Primzahl n E N gilt stets an a a, b < 220 den probabilistischen Gleichheitstest imple(mod n). mentiert. iii. Es gibt keine natürliche Zahl n E N, die keine Primzahl ist, so dass gilt an a (mod n). iv. Der Satz von Euler ist für die Reduktion von DIE EULERSCHE (,o-FUNKTION. Kongruenzen großer Zahlen nützlich. v. Der Algorithmus 3.101 SPot benötigt für A 3.51 Welche der folgenden Aussagen ist korrekt? a, m E N höchstens 2 • Llog2 (m) J Multiplikatioi. Für jede natürliche Zahl gibt es eine natürliche nen um am zu berechnen. Zahl m mit (,o(n) = m. SA' 3.55 Berechnen Sie mit Hilfe des Algorithmus ii. Es ist (p(8) = 4. SPOT die Potenz a = 1114 (benutzen Sie für die einiii. Es gibt genau zwei natürlich Zahlen, deren euzelnen Rechnungen gerne einen Taschenrechner). Wielersche (p-Funktionswert gleich 1 ist. viele Multiplikationen benötigen Sie dafür? iv. Es ist co (12) = 10.

184

4 Algebraische Strukturen Wir möchten uns nun mit der allgemeinen Theorie vom Rechnen beschäftigen. Dazu werden wir alltägliche Konzepte des Rechnens, wie das Zählen, das Bruchrechnen, das Rechnen mit reellen Zahlen abstrahiert und mathematisch beschreiben. Das geschieht in der Beschreibung von sogenannten algebraischen Strukturen. Das Wort Algebra kommt aus dem Arabischen von al-dschabr was mit „das Zusammenfügen gebrochener Teile" ins Deutsche zu übersetzen ist. Es geht also tatsächlich um das Rechnen mit Elementen einer festen Menge bezüglich jeweils definierter Rechenoperationen. Das Wort „Struktur" konkretisiert, dass diese Rechenoperationen bestimmten Regeln folgen.

4.1 Algebraische Strukturen - Einleitung Eine algebraische Struktur besteht aus drei Komponenten und wird definiert über k . . . eine zugrunde liegende Menge von Elementen.

[Zum Beispiel die Menge der natürlichen Zahlen.] . .. eine Sammlung von Rechenoperationen, Verknüpfungen genannt. [Zum Beispiel die Addition in den natürlichen Zahlen.] . eine Sammlung von Rechenregeln, welche für die Rechenoperak tionen gelten. [Zum Beispiel, dass für je zwei natürliche Zahlen n1, n2 E N gilt ni + n2 = 722 Die erste Komponente ist auf den ersten Blick sicherlich die uninteressanteste. Doch steckt in der freien Wahl der zugrundeliegenden Menge ein wesentlicher Teil der Abstraktion, denn auf ihr ist die zweite Komponenten, die Rechenoperationen alias die Verknüpfungen, definiert. Wir werden in Verlauf des Kapitels feststellen, dass beispielsweise die Addition in den ganzen Zahlen Z strukturell nichts anderes als die Multiplikation in den von 0 verschiedenen rationalen Zahlen Q \ {0} ist. Das

ALGEBRAISCHE STRUKTUREN - EINLEITUNG

kann man sich auf einem wenig abstrakten Level plausibel machen. Zunächst beobachtete man, dass man je zwei beliebige Elemente aus der Grundmenge (also den ganzen Zahlen Z bzw. den rationalen Zahlen ohne die Null Q \ {0}) addieren bzw. multiplizieren kann und wieder eine ganzen Zahl bzw. rationalen Zahlen ungleich 0 erhält. Dann beobachtet man, dass folgende Rechenregeln diese Rechenoperationen im Kern kennzeichnen. k Man darf die Reihenfolge dieser Addition bzw. Multiplikation vertauschen. [Denn 4 + (-2) = —2 + 4 bzw. • -1 = • 2 .1 s. Man kann diese Addition bzw. Multiplikation „rückgängig machen". [Denn 4 + (-2) + 2 = 4 bzw. 2• • — .1 k Es gibt ein Element, dass sich neutral gegenüber dieser Addition bzw. Multiplikation verhält. [Die 0, denn es ist 4 + 0 = 4 bzw. die 1, denn es ist 2• 1 =

4.1.1 Rechenoperationen sind Abbildungen Das Rechnen mit (natürlichen, rationalen, reellen, ... ) Zahlen, wie die Addition oder Multiplikation, ist auf das Wesentliche reduziert eine Abbildung von zwei Zahlen auf ihre Summe oder ihr Produkt. Es werden zum Beispiel die 5 und die 4 bei der Addition auf die 9 und bei der Multiplikation auf die 20 abgebildet. Letztlich sind solche Rechenoperationen also Abbildungen von einem Tupel von zwei Zahlen auf eine weitere Zahl. Die folgende Definition fasst dieses Konzept abstrakt. DEFINITION 4.1. Seien M und M' zwei beliebige Mengen mit M c M'. Dann nennen wir eine Abbildung o : M' x M' —> M' eine Verknüpfung auf M. Wir schreiben dann für das Bild von zwei Elementen ml, m2 E M auch ml o m2. BEMERKUNG 4.2. Es ist zu beachten, dass eine Verknüpfung auf der Menge M einer Abbildung auf einer möglicherweise größeren Menge M' entspricht. Zum Beispiel ist die Addition von natürlichen Zahlen N die gleiche Addition, wie die Addition der rationalen Zahlen Q, wenn man die natürlichen Zahlen als rationale Zahlen auffasst. Es ist nämlich 7 + 8 in N das gleiche wie 7 + 8 in Q.

Es können mehr als nur eine Verknüpfung auf derselben Menge definiert sein. Deshalb steht das Symbol o nur stellvertretend für ein Verknüpfungssymbol, welches man für jede Verknüpfung individuell und sinnvoll wählen sollte. Für die Addition auf Zahlen wählt man für gewöhnlich +, für die Multiplikation •. ■ BEISPIEL 4.3. Die

186

Addition auf den natürlichen Zahlen N ist eine Verknüpfung.

ALGEBRAISCHE STRUKTUREN - EINLEITUNG

Für je zwei natürliche Zahlen n1 und n2 definiert die Abbildung „Addition auf den natürlichen Zahlen", die wir + nennen, welche Zahl der „Summe von ni und nz" nämlich +(ni, n2) entspricht. Diese Addition auf den natürlichen Zahlen N ist demnach eine Verknüpfung mit + : N x N -+ N. Wir schreiben dann statt +(ni, n2) einfach ni + n2. Zum Beispiel • bildet + die beiden Zahlen 5 und 7 auf die 12 ab. Es ist also 5 + 7 = 12. Neben der Addition der natürlichen Zahlen N aus Beispiel 4.3, gibt es weitere bekannte Verknüpfungen auf Zahlen, wie die Addition und Multiplikation auf den ganzen, rationalen und reellen Zahlen, also auf Z, Q und R. Für das nächste Beispiel definieren wir Verknüpfungen, welche auf Reste der gewöhnlichen Addition und Multiplikationen modulo einer Zahl n abbilden. DEFINITION 4.4. Für Zahlen s, t, n E N mit n > 2 sei s On t = Resin (s • t)

und

sage: # Rest berechnen sa ge: 8%4

s en t = Rest., (s t).

0

wir n = 10. Dann sind die „Resteaddition" und „Restemultiplikation" bezüglich der 10 beispielsweise

BEISPIEL 4.5. Betrachten

sage: 9%4

7 eio 5 = Restio (7 + 5) = Restio (12) = 2 7 01, 5Restio ( 7' 5) = Restio (35) = 5. •

Wir definieren nun zwei endliche Teilmengen, auf welchen diese Verknüpfungen Sinn ergeben. DEFINITION

4.6. Für eine Zahl n E

und

N>2

definieren wir

{k EN:k< n1 Zn* = fkEN:k (ä o a) o x eox

x

=

b ä b t ob stob wob

[H2 - Assoziativität] [G4 - Inverses Element] [G3 - Neutrales Element]

Aus Axiom H1, der Abgeschlossenheit einer Gruppe als Halbgruppe bezüglich der Verknüpfung o, folgt, dass die gefundene Lösung x=Tiob in G liegt. 111

Das zeigt die Behauptung.

BEMERKUNG 4.27. Tatsächlich werden beim Auflösen der Gleichung aox=b nach x alle Gruppenaxiome G1 bis G3 beziehungsweise H1 und H2, sowie G2 und G3 verwendet. Erfüllt eine algebraische Struktur nicht diese Eigenschaften, dann gibt es lineare Gleichungen, die nicht lösbar sind. In diesem Sinne ist also die Gruppe die „kleinste" algebraische Struktur, in welcher lineare Gleichungen stets ■ lösbar sind. BEISPIEL 4.28. Wir wissen aus Beispiel 4.18, dass Q \ {0} mit der gewöhnlichen Multiplikation eine Gruppe bildet. Betrachten wir die Gleichung 4 • x = 13. Dann ist a = 4 und b = 3. Es ist ä = 4 E Q und e = 1. Somit können wir die Gleichung auflösen.

ao x

=

3

< >

1 • (4 • x)

=

1.3

(1

•4) • x

=

1•

= =

4 3 4 3

.

3 4

Eine Gleichung der Form a • x = b mit a, b E Q \ {0} hat also immer eine Lösung x= 1• b. Dabei ist 1das multiplikativ Inverse zu a E Q \ {0}. Das Inverse 1zu bilden ist ■ immer möglich, da a 0 gilt. BEISPIEL 4.29. Eine Gleichung der Form a + x = b mit a, b E Z hat immer eine ■ Lösung x = (—a) + b. Dabei ist —a das additiv Inverse zu a E Z. BEISPIEL 4.30. Das Paar (N, +) ist keine Gruppe. Es gibt also Gleichungen der Form a + x = b mit a, b E N, die keine Lösung in N besitzen.

Ein Beispiel für eine solche Gleichung ist 5 + x = 0. Die „Lösung" x = —5 liegt nicht in N, man verlässt beim Lösen der Gleichung also die vorgegebene Menge. ■ BEISPIEL 4.31. Das Paar (Q, •) ist keine Gruppe. Es gibt also Gleichungen der Form a • x = b mit a, b E Q, die keine Lösung in Q besitzen.

197

GRUPPEN

Ein Beispiel für eine solche Gleichung ist 0 • x = 5. Diese Gleichung besitzt keine Lösung in Q. ■

Abelsche Gruppen

Für die meisten Gruppen, die wir bisher kennen gelernt haben, ist die Verknüpfungsreihenfolge bei der Verknüpfung a o b gleichgültig. Es gilt a o b = b o a. Das ist aber an keiner Stelle für Gruppen gefordert und lässt sich auch nicht aus den Axiomen ableiten. Gruppen, für welche die Verknüpfungsreihenfolge gleichgültig ist, haben einen eigenen Namen. DEFINITION 4.32. Eine

Gruppe (G, o) heißt abelsch, wenn das folgende

Axiom erfüllt ist. GS. aob=boa

Va, b E G

(Kommutativität (Symmetrie))

Die geläufigen Gruppen sind in der Regel abelsch. In der tieferen Mathematik tauchen jedoch immer wieder Gruppen auf, die nicht abelsch sind. BEISPIEL 4.33. Die Gruppen (Q \ {0},•) und (4`, Os) sind abelsch. Vergleichen Sie dazu die Beispiele 4.18 und 4.19. ■

Wir nenne noch zwei Gruppen, die wir erst im weiteren Verlauf des Kapitels bzw. Buchs kennen lernen werden, welche nicht abelsch sind. BEISPIEL 4.34. Die

Permutationsgruppe

für n > 2 ist nicht abelsch.

■

BEISPIEL 4.35. Die Menge 0(n) der orthogonalen Matrizen bildet zusammen mit ■ der Matrix-Matrix-Multiplikation eine nicht-abelsche Gruppe.

Untergruppen

In manchen Gruppen (G, o) gibt es Teilmengen U von G, welche mit der Verknüpfung o ebenfalls eine Gruppe bilden. DEFINITION 4.36. Sei (G, o) eine Gruppe. Sei U eine Teilmenge von G. Bildet (U, o) eine Gruppe, so nenne wir diese eine Untergruppe von (G, 0).

Tatsächlich „erbt" eine solche Untergruppe manche der Eigenschaften der ursprünglichen Gruppe, denn sie „verwendet" die gleiche Verknüpfung. Ist die Verknüpfung auf G assoziativ, dann sicherlich auch auf U. Wir lernen nun ein Kriterium kennen, anhand dessen man für eine beliebige

198

GRUPPEN

Teilmenge von G schnell überprüfen kann, ob sie zusammen mit der zu G gehörenden Verknüpfung eine Untergruppe bildet. LEMMA 4.37 (Untergruppenkriterium). Sei (G, o) eine Gruppe. Eine Teilmenge U von G ist zusammen mit der Verknüpfung o genau dann eine Untergruppe von (G, o), wenn gelten UG1. a o b E U Va,bEU Va E U UG2. iE U

(Abgeschlossenheit) (Inverses Element)

Beweis. Es sind zwei Richtungen zu zeigen. ".": Ist (U, o) eine Untergruppe von (G, o), dann ist (U, o) insbesondere eine Gruppe mit der Verknüpfung o. Nach dem Gruppenaxiom G1 gilt auch H1, die Untergruppe ist abgeschlossen bezüglich o und es gilt UG1. Außerdem gilt G3, was UG2 impliziert. Gelten für eine Teilmenge U von G mit der Verknüpfung o nun also UG1 und UG2. Dann gelten mit derselben Argumentation wie oben auch G1 und Hl. Da G eine Gruppe ist, gilt nach H2 für alle a, b, c E G die Assoziativität (a o b) o c = a o (b o c). Da U eine Teilmenge von G ist, gilt demnach H2 auch für U. Bleibt zu zeigen, dass G2 gilt. Wir zeigen, dass das neutrale Element e von G auch das neutrale Element von U ist. Sei u E U ein beliebig gewähltes Element. Da UG3 gilt, ist das inverse Element i7 von u in G auch in U enthalten. Es gilt aber uou=e und da U bezüglich der Verknüpfung mit o abgeschlossen ist, ist e E U. Da u beliebig gewählt war, ist e auch das ■ neutrale Element von U. BEISPIEL 4.38. Es ist 27Z = {z E Z : z ist gerade}, die Menge aller geraden ganzen Zahlen, zusammen mit der gewöhnlichen Addition eine Untergruppe von (Z, +). Denn es gelten

UG1. Es seien zi und z2 zwei beliebig gewählte Elemente aus 27Z. Dann ist zi = 2 • zi und z2 = 2 • 4 für 4, z2 E Z. Dann ist aber auch + z2 = 2 • + 2 • = 2 • (4 + gerade und damit in U. UG2. Sei z aus 2Z beliebig gewählt. Dann ist z = 2 • z' für ein z' E Z und es gilt 2 = 2 • (—z'), denn z + = 2 • z' + 2 • (—z') = 0. Da aber —z' E Z ist auch in 2Z. ■ BEISPIEL 4.39. Betrachte die Gruppe (765,05). Die Menge U = {1,4} bildet zusammen mit der „Restemultiplikation" 05 eine Untergruppe von (765, 05). Denn

199

N. GRUPPEN es gelten UG1. Wir rechnen für je zwei Elemente aus U = {1, 4} nach 1 05 1 = Rest5 (1 • 1) = 1, 4 05 1 = Rest5 (1 • 1) = 4,

1 05 4 = Rest5 (1 • 4) = 4, 4 05 4 = Rest5 (1 • 4) = 1.

Also ist a 05 b E U für alle a, b E U. UG2. Es gilt, wie unter UG1 nachgerechnet 1 05 1 = 1 und 4 05 4 = 1. Also ist 1 das inverse Element von 1 und 4 das inverse Element von 4. Also gilt für alle a E U, dass ä E U. •

LEMMA 4.40. Untergruppen abelscher Gruppen sind abelsche Gruppen.

Beweis. Es ist nicht viel zu zeigen, denn ist U eine Untergruppe einer abelschen Gruppe G, so gilt für alle a, b E G, dass a o b = b o a. Da aber U C G ist, gilt demnach auch aob= b o b für alle a, b E U. Also gilt GS. •

4.2.2 Die Gruppenordnung

In einer Gruppe (G, o) werden Potenzen, also die mehrfache Verknüpfung eines Elementes mit sich selbst, wie gewohnt bezeichnet. DEFINITION 4.41. Seien eine Gruppe (G, o), ein Gruppenelement a E G und eine natürliche Zahl n E N gegeben. Dann nennen wir die n-fache Verknüpfung von a mit sich selbst verknüpft mit e

an

=

aoao...oa oe Stück

die n-te Potenz von a. BEMERKUNG 4.42. Es wird das neutrale Element verknüpft, damit die Potenz für

n = 0 wohl definiert ist. Es gilt dann nämlich a° = e. Für höhere Exponenten fällt es einfach weg, dann ist zum Beispiel al = a und a2 = a o a. Wieder der Hinweis - ist die Verknüpfung o von additiver Geschmacksrichtung, schreibt man für die n-fache Verknüpfung von a mit sich selbst auch häufig na = aoao...oa J oe. ■ Stück

Die Mächtigkeit einer Gruppe trägt einen Namen.

200

GRUPPEN

DEFINITION 4. 43. Sei G eine Gruppe. Wir nennen die Kardinalität der Menge G die Ordnung der Gruppe G. Man schreibt für die Ordnung von G auch 1G1. Ist G von endlicher Ordnung, nennt man G eine endliche Gruppe. BEISPIEL 4.44. Die Gruppe (7Z5, 05) ist eine endliche Gruppe von Ordnung 4. Die Gruppe (Z, +) hingegen hat Ordnung co und ist somit keine endliche Gruppe. ■

Sei (G, o) eine Gruppe. Für jedes Gruppenelement a E G definieren wir die Ordnung des Elements a als DEFINITION 4.45.

1 al = minIn

e 14+

: an = el

den kleinsten Exponenten, so dass an dem neutralen Element entspricht. Gibt es kein n E N+ mit an = e, dann setzten wir an = oo. BEISPIEL 4.46. Betrachte die Gruppe (Z;, 05). Dann gilt

11 = 1 05 1 = 1, 21 = 2 05 1 = 2, 22 = 2 05 21= 4, 23 = 2 05 22 = 3, 24 = 2 05 23 = 1 31 = 3051 = 3, 32 = 30531 =4, 41 = 4 051 = 4, 42 = 4 05 21 = 1

33

= 3 05 32 = 2, 34 =30533 = 1

Also gilt 111 = 1, 121 = 4, 131 = 4 und 141 = 2.

In Gruppen der Ordnung oo kann es Elemente geben, welche selbst unendliche Ordnung haben. In endlichen Gruppen ist das nicht der Fall. Um das einzusehen, definieren wir zunächst die Menge aller Potenzen für ein festes Gruppenelement a. DEFINITION 4.47. Sei G eine Gruppe und a E G eine beliebiges Gruppenelement. Dann definieren wir (a)={a"`:nE N} die Menge aller Potenzen von a. BEISPIEL 4.48. Betrachte die Gruppe (Z5, 05) und das Gruppenelement 4. Dann ist wie in Beispiel 4.46 zu sehen (4) = {41 = 4,42 = 1,43 = 4,44 = 1,...}

{1,4}

■

Dass die Menge (4) aus Beispiel 4.48 endlich ist, ist kein Zufall.

201

Se GRUPPEN LEMMA 4.49. Sei (G, o) eine Gruppe und a E G eine beliebiges Gruppenelement. Es ist ((a), o) eine Untergruppe von G der Ordnung mit (a) = la°, ai , ,a1a1-11.

Beweis. Wir zeigen zunächst anhand des Untergruppenkriteriums, dass ((a), o) eine Untergruppe von (G, o) ist. UG1. Für zwei beliebig gewählte Elemente as und at aus (a) ist

a8 oat = ao...oa o ao...oa = ao...oa = a8+t t Stück s+t Stück s Stück wieder in (a). UG2. Sei a8 aus (a) beliebig gewählt. Sei k E N so gewählt, dass k • > s und somit k • lal - s > 0 ist. Dann ist das inverse Element zu as einfach (as) = ak* l a ' —s . Denn es gilt as = ao...oa , o , ao...oa ,

(as) o as =

s Stück

k• la' —s Stück

=ao

o

o a = aial o I

k•Ial Stück

J

o e = e.

=eo I

k Stück

k Stück

Bleibt zu zeigen, dass ... i. ... für 0 s < t < 164 - 1 stets as at gilt. ii. ... für t > stets at = as für ein 0 < s
2. Dann ist (Z;,,, On ) eine abelsche Gruppe.

Beweis. Wir prüfen die drei Gruppenaxiome G1 bis G3 und das Axiom GS bezüglich der Kommutativität. Gl. Es ist zu prüfen, ob (Z;„ on ) eine Halbgruppe ist. Hl. Seien a, b E 7Gn beliebig gewählt. Dann gilt ggT(a, n) = ggT(b, n) = 1. Nach Lemma 3.35 gilt ggT(a • b, n)

ggT(a, n) • ggT(b, n) = 1 • 1 = 1

und damit ist ggT(a • b, n) = 1. Sei r = Reste (a • b) (damit ist 0 < r < n). Nach Lemma 3.40 ist ggT(a • b, n) = ggT(r, n). Also ist a On b = Restn (a • b) = r

und

ggT(r, n) = 1.

Aus ggT(r, n) = 1 folgt r # 0 und somit gilt 1 < r < n und ggT(r, n) = 1, also ist a On b = r E Z. H2. Für alle a, b, c E Z gilt (a On b) On C = Restn (a • b) On c = Rest„ (Reste (a • b) • c) = Restn (a • b • c) = Reste (a • Reste (b • c)) = a On Restre (b • c) = a On (b On c). G2. Das neutrale Element ist hier die Zahl e = 1, sie erfüllt für alle aEn 1 On a = Restn (1 • a) = a. G3. Es sei a E 7Gn beliebig gewählt und so ist insbesondere ggT(a, n) = 1. Nach dem Lemma von 136zout gibt es 136zout Multiplikatoren s, t E Z mit s •a+t •n = ggT(a,n) = 1.

(4.1)

Stellt man diese Gleichung um, erhält man s • a = 1 — t • n. Es ist also 1 = Reste (1 — t • n) = Reste (s • a) = Reste (Reste (s) • a) = Reste (s) On a.

209

GRUPPEN

Wir setzten nun s' = Restn (s) und zeigen, dass s' E Zn*, also ggT(s', n) = 1 ist. Dazu sei P E Z so gewählt, dass s = s' • n ist. Dann ist mit Gleichung (4.1) •n) • a + t • n = s' • a + (i • a + t) • n = 1

(4.2)

Der ggT(s', n) teilt s' • a + (f •a + t) • n und nach Gleichung (4.2) auch 1, es ist also ggT(s', n) = 1. Somit hat a das inverse Element s' in Z. GS. Es gilt für alle a, b E Z;'„ dass a en b = Restn (a • b) = Restn (b • a) = b on a. ■

BEMERKUNG 4.68. In der Definition 4.6 der Menge Z*, welche wir mit der Restemultiplikation ausstatten, werden nur Zahlen berücksichtige, die relativ prim zu n sind. Warum ist das so? Wir betrachten das Rechnen mit Resten modulo 12. Die möglichen Zahlen, die als Rest beim Teilen durch 12 auftreten können sind in Z12 = {0, 1, 2, 3, . , 11} gesammelt. Rechnet man nun auf diesen Zahlen mit der Multiplikation modulo 12, also a 012 b = Resti2 (a • b), so gilt stets a 012 b E 7612. Die Menge 7612 ist also abgeschlossen bezüglich der Restemultiplikation modulo 12. Trotzdem ist (Z12 ,012 ) leider keine Gruppe. s. Ein neutrales Element lässt sich mit e = 1 noch finden, denn es ist 1 012 a = Rest12 (1 • a) = a für alle a E Z12. k Doch die 0 macht Probleme, denn sie besitzt kein inverses Element in (7Z12, 012). Es gilt nämlich a 012 0 = Rest12 (a • 0) = 0 für alle a E Z12. Deswegen gibt es kein a E Z12, welches das zu 0 inverse Element ist. Geht man zu der Menge Z12 \ {0} = {1, 2, 3, ... 11} über, bildet diese mit der Restemultiplikation modulo 12 immer noch keine Gruppe. Die Menge ist schlussendlich nicht mehr abgeschlossen bezüglich der Restemultiplikation modulo 12.

S. Zum Beispiel gilt 6 012 4 = Rest12 (6 • 4) = 0. Das Problem ist hier, dass 6 = 2 • 3 den Teiler 3 mit 12 = 3 • 4 gemeinsam hat. Dann wird die Gleichung s • 6 = t • 12 unter anderem mit s = 4 und t = 2 mit s 12 lösbar. ■

210

GRUPPEN

SCHEMA

F 4.69 (Berechnen von inversen Elementen in z2.

Eingabe: Es sei n E N>2 gegeben und es besteht die Aufgabe, für eine Zahl a E Z das inverse Element zu berechnen. in Schritt 1. Berechne mittels erweitertem euklidischen Algorithmus die Bezout-Multiplikatoren s, t E Z von a und n so dass s•a+t•n= ggT(a, n) = 1 ist. Schritt 2. Berechne ä = Rest, (s).

Wir wenden Schema F 4.69 direkt an. BEISPIEL 4.70. Es sei n = 25 gegeben und es besteht die Aufgabe für 9 E Z25 das inverse Element in 7625 zu berechnen.

Schritt 1. Berechne mittels erweitertem euklidischen Algorithmus die BdzoutMultiplikatoren s = —11 und t = 4 von 9 und 25, so dass —11 • 99 + 4 • 25 = ggT(9, 25) = 1 ist. Schritt 2. Berechne das inverse Element von 9 als 14 = Rest25 (-11). Und tatsächlich ist 9 025 14 = Rest25 (9 • 14) = Rest25 (126) = 1.

■

4.2.5 Die Gruppe Sn

Wir lernen noch eine weitere Gruppe kennen, welche in vielen Bereichen der Mathematik und Informatik eine wichtige Rolle spielt. Die Menge aller Permutationen von n Elementen bildet eine Gruppe. Wir definieren zunächst, was wir unter einer Permutation verstehen. DEFINITION

4.71. Eine Permutation der Länge n für n E N+ ist eine

Bijektion a : {1,...,n}

{1, ... ,n}.

Man schreibt eine Permutation auch als o- = [a(1), o- (2), . ,o- (n)] und bezeichnet mit Sn die Menge aller Permutationen der Länge n. Ferner definiert man das Vorzeichen oder Signum von a E Sn als sign(o-) =

H

u(i)

a (i)

1

3 = (1, 3) und q = 4 )—› 6 = (4, 6), dass 3 — 1 = 6 — 4 ist. Also in Relation zueinander, siehe Abbildung 4.8. III sind sie bezüglich der Relation in Relation BEISPIEL 4.111. Im 1112 sind zwei Pfeile bezüglich der Relation zueinander, wenn sie ebenfalls gleich lang sind und in die gleiche Richtung deuten. Anders als im R1gibt es nun natürlich sehr viel mehr potentielle Richtungen. Zum Beispiel gilt für die Pfeile p = (1, 1) >—> (4, 3) = ((1, 1), (4, 3)) und q = (5,3) (8,5) = ((5,3), (8,5)), dass (4 — 1, 3 — 1) = (8 — 5,5 — 3) ist. Also sind sie ■ bezüglich der Relation in Relation zueinander, siehe Abbildung 4.9.

Tatsächlich handelt es sich bei der Relation um eine Äquivalenzrelation. LEMMA 4.112. Die

Relation 4 ist eine Äquivalenzrelation.

Die Relation 4 ist eine Äquivalenzrelation, weil die Relation = dies ist. ■

Beweis.

PI p2 (11 0

1 P1

2 1 PI ql

Cri X1

Abb. 4.8. Äquivalente Pfeile in R. X2

„I

2

q2 P

2 P2

2

1 g2 P2 0 P

i

2 PI q1

Abb. 4.9. Äquivalente Pfeile im R2 .

Schlussendlich identifizieren wir die Äquivalenzklassen der Relation auf dem kartesischen Produkt W mit Vektoren des Vektorraums en. DEFINITION 4.113. Es sei eine Abbildung fi von den Äquivalenzklassen

227

IN. VEKTORRÄUME

von

auf IR:, auf dem Vektorraum R" definiert durch (/1 f i ( [pl , p2]

) =

1

P2 — P2

72 , — 1,n.

und eine Abbildung f2 die umgekehrt von dem Vektorraum W> auf die Äquivalenzklassen von = auf le,±_, durch 7/',\\ /2

(vi, v2, •. • • vom)],

= [(0, 0, • • •

\ abbildet. BEMERKUNG 4.114.

Es ist leicht nachzurechnen, dass fi die inverse Abbildung

zu f2 ist.

■ vl v2

Anschaulich gesprochen, wird nun je ein Spaltenvektor v =

des vv )

IV repräsentiert durch alle Pfeile, in der Äquivalenzklasse von [(O, 0,

, 0) >—› (vi, v2,

vri)]=

- also alle Pfeile, welche in Länge und Richtung mit dem Pfeil (0, 0,

, 0) >--> (vi , v2, • .

v.)

übereinstimmen. Mithilfe dieser Identifikation von Spaltenvektoren und Pfeilen können wir die Addition und skalare Multiplikation in den Vektorräumen W> veranschaulichen.

Geometrische Interpretation der Addition zweier Vektoren im Ir

Wir betrachten die Summe von Vektoren des Vektorraums W' in der zugehörigen Menge von Pfeilen. Seien zwei Vektoren und tr) E gegeben. Die Äquivalenzklasse bezüglich 4 von if und ui sind

228

f2(1-0

=

f2 (11j)

= [( 0,

[( 0,0,•••,0) •

und w2 • • • • wn)]= •

(v1,v2,•••,vn)]=

0) >—> (wi

VEKTORRÄUME

A

Die Äquivalenzklasse bezüglich = von v + w ist , 0)

12 (V+ v71) = [(0, 0,

(v1 + wi, v2 +

. . . vri + wn)] .

Diese Äquivalenzklasse wird repräsentiert durch den Pfeil, der durch aneinander hängen der Pfeile von v und ü, entsteht. Siehe Abbildung 4.10.

Geometrische Interpretation der Multiplikation eines Vektors aus Il.' einem Skalar aus R

mit

Wir betrachten das Produkt eines Vektors des Vektorraums IV mit einem Skalar aus ie in der zugehörigen Menge von Pfeilen. Sei ein Vektor '6 E lEr gegeben. Die Äquivalenzklasse bezüglich = von 7.7 ist 12 (V)

=

[(0, 0, • • • , 0)

Abb. 4.10.

Die Summe von Spaltenvektoren des R2.

(vi, v2, • • •7vn)] X2

Die Äquivalenzklasse bezüglich = von A 0 v ist 12 (A 0 ff) = [(0, 0,

,

(A •

0>—* (A •

A • v2)

A • v2, • • • , • vn)I= •

Diese Äquivalenzklasse wird repräsentiert durch den Pfeil, der durch das Strecken des Pfeils von if um den Faktor A entsteht. Siehe Abbildung 4.11.

4.4.4 Weitere Regeln in Vektorräumen

Wie wir das bei den anderen algebraischen Strukturen beobachtet haben, ergeben sich auch aus den Axiomen der Definition von Vektorräumen direkt weitere Aussagen alias Regeln, die in Vektorräumen allgemein gelten. LEMMA 4.115. Es sei (V, ED, 0) ein Vektorraum über einem Körper K. Dann gilt Va. Die Menge V ist nicht leer. Vb. Für alle A E K und '6 E V gilt A0

=

Abb. 4.11.

Ein gestreckter Spaltenvektor des R2. sage: # Vektoren sage: x = vector([0,

(0, -4, -1)

-4, -1])

sage: # Rechnen mit Vektoren sag=, a = vector([1, 2, 3])

sage: b = vector([4, 5, 6]) sage: s = 2 ag e a + b (5, (2,

7, 9) s* 4, 6)

a

A = OK oder 27 =

Vc. Für alle A e K und ti E V gilt —1K 0 v = Beweis.

229

Ä VEKTORRÄUME

Va. Ein Vektorraum ist nach Axiom V1 eine abelsche Gruppe (V, e). Die Aussage folgt daher direkt aus der Definition einer Gruppe, also aus Axiom G2 - es gibt eine neutrales Element, also ist die Gruppe nicht leer. Vb. Es sind zwei Richtungen zu zeigen. Wir zeigen zunächst die Rückrichtung. = d ist für alle "< ": Es sei ) = OK . Dann ist zu zeigen, dass OK E V. Sei nun i e V beliebig gewählt. Dann ist V

V3

V3 1K 11= (1K + OK) 0 V = V (1) OK

Also ist OK O fi gleich dem eindeutig bestimmten neutralen Element der Gruppe (V, G), also Ö. Es gilt demnach OK 0 v = Ö. Es sei V = Ö. Dann ist zu zeigen, dass A 0 = Ö für alle A E IR ist. Für A = OK haben wir die Aussage schon gezeigt (siehe oben und setze V = 6). Sei also ) beliebig aus K \ {OK} gewählt. Dann hat ein multiplikatives inverses Element A-1 in K. Es gilt also

fr- 1,0 v=

oil

V4

A 0 (A-1

0 2-1

0 (Ä --i oveil VD2

(a•),-1) 0/7®x015 V®a 0

0.

Also ist A 0 v gleich dem eindeutig bestimmten neutralen Element der Gruppe (V, 0), also Ö. Es gilt also A 0 v = 0. Es sei A 0 =i. Sei zunächst v # Ö. Dann ist vi 0 für ein i e {1, 2, ... , n}. Dann ist die i-te Komponente von ) 0 v genau dann OK, wenn A = OK ist. Denn sonst wäre mit ). • vi = OK , die Multiplikation in K nicht abgeschlossen. Also ist A = OK, wenn v Ö ist. Sei umgekehrt ) O. Dann ist

'dr i„

= ()- A) cD ,C A-1 0 () 0 /7) = A-1

was zu zeigen war. Vc. Der Beweis dieser Aussage ist eine Übungsaufgabe.

230

=

VEKTORRÄUME

A

4.4.5 Untervektorräume Wie wir das schon bei Gruppen beobachtet haben, gibt es auch in einem Vektorräumen (V, EI), 0) über einem Körper 1K Teilmengen von V, die mit der gegeben inneren und äußeren Verknüpfung über 1K einen Vektorraum bilden. DEFINITION 4. 116. Sei (V, ED, 0) ein Vektorraum über einem Körper K. Sei U eine Teilmenge von V. Bildet (U, e, 0) einen Vektorraum über dem Körper K, so nenne wir diesen eine Untervektorraum (oder Unterraum) von ( V, ED, C)). Wie für Untergruppen lernen wir nun ein Kriterium kennen, anhand des- Anmerkung. Wer die Pfeile über den Vektoren sucht, lese bitte Bemerkung 4.91. sen man für eine beliebige Teilmenge von V schnell überprüfen kann, ob sie zusammen mit der zu V gehörenden inneren und äußeren Verknüpfung einen Untervektorraum bildet. LEMMA 4.117 (U nterraum kriterium). Sei (V, ED, 0) ein Vektorraum über einem Körper 1K. Eine Teilmenge U von V ist zusammen mit den Verknüpfungen e und 0 genau dann eine Unterraum von (V, e, 0), wenn gelten

uVO. 0 U c V veiDEU UV2. ÄGvEU

Vv, w E U VAEK,VvEU

(Abgeschl. der Addition) (Abgeschl. der Skalarmutliplikation)

Beweis. Es sind zwei Richtungen zu zeigen. Ist (U, e, 0) eine Unterraum von (V, ED, 0), dann ist (U, e, 0) insbesondere ein Vektorraum. Nach dem Axiom V1 ist (U, e) eine abelsche Gruppe, also nicht leer (es existiert das neutrale Element), demnach gilt UVO. Außerdem ist mit H1 der Unterraum abgeschlossen bezüglich EID, demnach gilt auch UV1. Es gilt auch V2, was UV2 entspricht. "-": Sei also U eine Teilmenge von V und es gelten UVO bis UV2. Mit Vc aus Lemma 4.115 ist für jedes v E U auch —u E U. Dann erfüllt (U, 0) das Untergruppenkriterium und nach Lemma 4.37 ist (U, 0) eine Untergruppe von (V, ED). Das heißt, mit Lemma 4.40 ist (U, 0) eine abelsche Gruppe. Also gilt Vl. Es entspricht UV2 genau V2 und die Axiome V3, die Neutralität der 1K , V4, die Assoziativität, sowie die Distributivgesetz VD1 und VD2 gelten ■ für alle Vektoren in V und somit auch in U.

231

VEKTORRÄUME

KOROLLAR 4.118. Sei (V, e, 0) ein Vektorraum über einem Körper 1K. Dann sind (V, ED, 0) und ({0}, ED, 0) Unterräume von (V, ED, 0).

Beweis. Trivialerweise ist jeder Vektorraum sein eigener Unterraum. Für U = {0} gilt tatsächlich, dass U 0, also UVO, und mit 0 + 0 = 0 auch UV1 und nach Vb aus Lemma 4.115 gilt A • 0 = 0 für alle A E 1K, also auch UV2. ■

Es gelten die beiden folgenden Regeln für Untervektorräume. LEMMA 4.119. Sei (V, ED, 0) ein Vektorraum über einem Körper 1K und

(U, , 0) ein Untervektorraum von (V, •ED, 0). Dann gelten UVa. 0 E U UVb. —v E U

Vv E U

(Abgeschl. der Addition)

Beweis. Als Untervektorraum erfüllt (U, ED, 0) nach Lemma 4.117 die Kriterien UVO bis UV2. Setzt man A = OK ist nach UV2 auch OK O v E U und mit Vb aus Lemma 4.115 ist OK O v = 0 und somit gilt UVa. Setzt man A = 1K ist nach UV2 auch —1K OvEUund mit Vc aus Lemma 4.115 ist —1K 0v=-7.1. Somit gilt UVb.

■ BEMERKUNG 4.120. Zu erkennen, ob eine Teilmenge U C V ein Untervektorraum eines Vektorraumes (V, ED, 0) ist, erfordert also nach dem Unterraumkriterium Lemma 4.117 zu prüfen, ob U unter der Vektoraddition ED und der skalaren Multiplikation 0 abgeschlossen ist. Ein erster Anhaltspunkt bietet Lemma 4.119. Ist das neutrale Element 0 der abelschen Gruppe (V, Ea) nicht in U enthalten, dann kann U kein Untervektorraum sein. Gleiches gilt für die inversen Elemente. Die Umkehrung gilt jedoch nicht. Selbst wenn die 0 und alle additiven Inversen enthalten sind, heißt das noch nicht, dass die Teilmenge einen Untervektorraum bildet. Ein Beispiel wäre die Menge

C 2. Der Nullvektor 0 ist enthalten und für alle Ele(1) 1) mente jeweils das additive Inverse. Aber UV2 ist nicht erfüllt. Denn setzt man

U=

A = 2 erhält man • (1) = 2 • (11) = (22 ) 1;1 U.

•

Kommen wir nun zu Beispielen, die wir anhand des Unterraumkriteriums überprüfen können.

232

VEKTORRÄUME 4

BEISPIEL

4.121. Betrachte die Menge U

= (y) :xERundy= 3 •xl,

eine Teilmenge des Vektorraums ) 1 i enthalten. UVO. Die Menge U ist nicht leer, der Spaltenvektor 3 (st UV1. Seien (3aa ) und (3bb) mit a, b E zwei beliebige Spaltenvektoren aus der Menge U. Dann gilt a b

(3a) (36) =

(3a

a = (3(a + b)) E U.

UG2. Sei (3)a mit a E ein beliebiger Spaltenvektoren aus der Menge U und Ä E R. Dann gilt (3a.) =

.•3.) a = (3()Ä, •. a)) E v3.

Alle Vektoren des U zeigen in die gleiche bzw. genau entgegengesetzte Richtung, ■

die Richtung von Vektor (3) ' BEISPIEL

4.122. Die Untervektorräume von 1R2 sind

k die trivialen Unterräume {0} und der gesamte Vektorraum R2 selbst (siehe Korollar 4.118), alle Mengen der Form V= (xy) : x E R und y = c • x} mit c E R und } die Menge Voa = (y°) : y E Rj. Geometrisch ist eine Menge Va mit festem a eine Gerade durch den Ursprung 0 = (30) (genauso auch Vom ). sind entsprechend die Mengen {0} und Ina selbst Die Untervektorräume des sowie die Geraden und Ebenen durch 0. 1 hat nur zwei Untervektorräume. Die Menge Der Vektorraum die Menge {0}, die nur den Nullvektor enthält.

selbst und ■

BEISPIEL 4.123. Die Menge C ZN ist ein Untervektorraum des Z.

■

233

k STRUKTURERHALTENDE ABBILDUNGEN

4.5 Strukturerhaltende Abbildungen In unterschiedlichen Exemplaren derselben algebraische Strukturen gelten die gleichen in den definierenden Axiomen festgelegten Rechenoperationen. In diesem Sinne sind sie sich ähnlich. Eine Gruppe mag auf einer sehr komplizierten Menge, wie beispielsweise auf den Polynomen eines festen Grads und mit entsprechend involvierten Verknüpfungen sehr komplex erscheinen. Oder sie lautet einfach (Z, +). In beiden Fällen ist die Verknüpfung abgeschlossen, assoziativ, es gibt ein neutrales Element und für jedes Gruppenelement ein Inverses. Diese Abstraktion ist ja gerade die Stärke des Konzeptes algebraischer Strukturen. Ein großes Gleichmachen und Abstrahieren, um möglichst allgemeine Aussagen zu gewinnen und insbesondere komplizierte Exemplare besser zu verstehen. Aber wie weit geht die Ähnlichkeit? Gibt es strukturell überhaupt unterschiedliche Gruppen? Oder gilt, dass man beispielsweise alle endlichen Gruppen, sagen wir mit n Elementen, komplett versteht, wenn man nur eine von diesen kennt? Wie kann man unterschiedliche Objekte ein und derselben algebraische Struktur vergleichen? Wir werden dazu Abbildungen definieren, welche Elemente unterschiedlicher Exemplare derselben algebraischen Struktur aufeinander abbilden. In einem gewissen Sinne identifiziert man Elemente in den beiden Exemplaren derselben algebraischen Strukturen miteinander, so dass Rechnen im Urbild dem Rechnen im Bild entspricht.

Homomorphismen

Wie schon angeklungenen, möchten wir Abbildungen konstruieren, welche solche Elemente aus dem Urbildexemplar einer algebraischen Struktur auf solche Elemente des Bildexemplars derselben algebraischen Struktur abbilden, die sich beim Rechnen identisch verhalten. Diese Abbildungen werden Homomorphismen genannt, von Lateinisch homo (auf Deutsch „gleich/ähnlich") und morphismus (auf Deutsch „Struktur"). Letztlich werden diese Abbildungen für die uns bekannten algebraischen Strukturen (Gruppe, Körper, Vektorräume, ... ) sehr ähnlich aussehen. Dennoch betrachten wir sie separat, um die Implikationen für die jeweilige algebraische Struktur zu betonen. Wir beginnen mit Gruppenhomomorphismen, um das grundlegende Konzept von Homomorphismen zu

234

STRUKTURERHALTENDE ABBILDUNGEN

begreifen und werden nach den Körpern schließlich Homomorphismen auf Vektorräumen betrachten.

4.5.1 Gruppenhomomorphismen Wir beginnen direkt mit der Definition von Homomorphismen auf Gruppen. DEFINITION 4.124. Seien (G, o) und (H, *) Gruppen. Wir nennen eine Abbildung f : G H einen Gruppenhomomorphismus, wenn gilt f (x y) = f (x) * f (Y)

für alle x, y E G.

Die folgende Bemerkung 4.125 erläutert, in wie fern Gruppenhomomorphismen die in der Einleitung angeklungenen Motivation von Homomorphismen für Gruppen realisieren. BEMERKUNG 4.125. Die Gleichung in Definition 4.124 lässt sich wie folgt interpretieren. Für das Element x o y =z EG müssen die zu x, y und z zugeordneten Elemente f (x), f (y), f (z) E H in H die Gleichung f (x) * f (y) = f (z)

erfüllen. In anderen Worten müssen sich f (x) und f (y) in H wie x und y innerhalb von G verhalten oder die Verknüpfung der beiden Elemente x und y muss auf die Verknüpfung der Elemente f (x) und f (y) abgebildet werden, also xoy = z

=

f(x)* f(y)= f(z).

Das Rechnen in G überträgt sich auf das Rechnen in H.

■

BEISPIEL 4.126. Betrachte die Gruppe (Z, +) der ganzen Zahlen mit der gewöhnlichen Addition und (2Z, +) der geraden ganzen Zahlen mit der gewöhnlichen Addition aus Beispiel 4.38 mit

276 = {0, 2, —2,4, —4, 6, —6, ...}. Dann ist die Abbildung f : (Z, 4-) —› (2Z, +)

mit

f (z) = 2 • z

ein Gruppenhomomorphismus von (Z, +) nach (276, +). Es gilt nämlich für zwei beliebige Elemente zi und z2 aus Z, dass f (zi z 2) = 2 • (zi + z2 ) = 2 • zi + 2 • z2 = f (zi) + f (z2)• ■ BEISPIEL

4.127. Betrachte die Gruppen (765,0s) und (762,G2). Dann ist die

Abbildung f (z5*, 05) -+ (Z2, ED2)

235

A

S4 STRUKTURERHALTENDE ABBILDUNGEN

mit f (1) = 0,

05 1

2 3 4

1 02

0 1

1 0

1 2 3 4

0

0 1 1 0

2 2 4 1

1 1

0 0

3

3 3 1 4

1 1

0

0

2 1

4

0

4

0

3 2

1 1

f (2) = 1, f (3) = 1 und

f (4) = 0

ein Gruppenhomomorphismus von (Z5, 05) nach (7Z23 02). Das sieht man ein, indem man die Verknüpfungstabelle von (Z5*, 05) ansieht, welche um die Bilder unter f in (Z2, 02 ) ergänzt wurden, siehe Abbildung 4.12. Es gilt zum Beispiel f (4 05 3) = f (2) = 1 = 0 02 1= f (4) 02 f(3)•

■ BEISPIEL 4.128. Betrachte die triviale einelementige Gruppe ({1}, *) aus Beispiel 4.20. Sei (G, o) eine beliebige Gruppe. Dann ist die einzige Abbildung f von (G, o) nach ({1}, *) gegeben durch

1 1

0 f (x) -= 1 für alle x E G. Abb. 4.12. Es ist f ein Gruppenhomomorphismus, denn für zwei beliebige Element x und y Verknüpfungstabelle von (Z's' , 05) aus aus (G, o) gilt Beispiel 4.127, versehen mit den Bildern f (x o y) = 1 = 1 * 1 = f (x) * f (y). in (Z2, 02).

■

4.5.2 Isomorphe Gruppen

Wir haben in den Beispieln 4.126 bis 4.128 gesehen, dass Gruppenhomomorphismen zwischen Gruppen ermöglichen, statt in der Urbildgruppe in der Bildgruppe zu rechnen. Allerdings verliert man dabei Information über die Gruppenstruktur. Betrachtet man die Terme 3 05 3 und 2 05 3 in Vg, dann werten diese zu 4 und 1 aus. Bildet man jedoch mit dem Gruppenhomomorphismus f aus Beispiel 4.127 ab, erhalten wir f(3 05 3) = f (3) 02 f (3) f(2 05 3) = f (2) 02 f (3)

= 102 1 = 0 = 1 02 1= o.

Die Bilder der Tenne 3 05 3 und 2 05 3 sind identisch. Der Grund ist offensichtlich. Die 2 und die 3 werden auf dasselbe Element in Z2 abgebildet und sind dort nicht mehr zu unterscheiden. Dieses Beispiel inspiriert uns, Gruppenhomomorphismen zu suchen, die bijektiv sind. Unterschiedliche Gruppenelemente in der Urbildgruppe sollen unterschiedlichen Elementen in der Bildgruppe zugeordnet werden. In anderen Worten soll jedes Element in der Urbildgruppe einen eindeutigen Repräsentanten in der Bildgruppe haben (Bijektivität), der sich beim Rechnen in der Bildgruppe verhält, wie sein Urbild in der Urbildgruppe (Homomorphismus).

236

STRUKTURERHALTENDE ABBILDUNGEN

A

DEFINITION 4.129. Zwei Gruppen (G, o) und (H, *) heißen isomorph, wenn es einen bijektiven Gruppenhomomorphismus f von G nach H gibt. Wir nennen f dann einen Gruppenisomorphismus. Für g E G mit f (g) = h schreiben wir g = h. Gruppenisomorphie bringt uns ans Ziel. Zwischen zwei Gruppen lässt sich ein Gruppenisomorphismus finden, wenn es eine eins-zu-eins-Zuordnung von Gruppenelementen gibt, die sich beim Rechnen identisch verhalten. Das wirft die Frage auf, ob nicht alle Gruppen zueinander isomorph sind. Eine erste leichte Antwort finden wir die Gruppenordnung betreffend. LEMMA 4.130. Seien (G, o) und (H, *) isomorphe Gruppen. Dann gilt = IHI. Beweis. Wir unterscheiden drei Fälle. Fall 1 - Es sind G und H unendliche Gruppen. Dann gilt die Aussage. Fall 2 - O.B.d.A ist G eine endliche und H eine unendliche Gruppe. Dann kann es keine surjektive Abbildung von G nach H geben. Es können höchstens endlich viele Elemente aus H ein Urbild in G haben. Also gibt es auch keine bijektive Abbidlung von G nach H. Fall 3 - Es sind G und H endliche Gruppen.. Dann gilt, dass es nur dann eine bijektive Abbildung zwischen G und H geben kann, wenn •,4r = 1111 ist.

BEISPIEL 4.131. Wir betrachten die folgenden drei Gruppen von Ordnung 2. k (Z2, er2) = ({0,1}, 02) (7z;, 03) = ({1, 2}, 03) k ({falsch, wahr}, V)

02

0

1

0

0

1

1

1

0

03

1

1

1

2

2

2

1

F W V Betrachtet man die Verknüpfungstabellen in Abbildung 4.13, stellt man fest, dass die Gruppen strukturell gleich erscheinen. Es Bedarf mit Aufgabe 4.54 im HinterF F kopf keine große gedankliche Anstrengung, dass Gruppenisomorphismen jeweils W WW das neutrale Element 0 E Z2, 1 E Z und falsch E {falsch, wahr} und das jeweils andere miteinander identifizieren. Es sind dann Gruppenisomorphismen .ft : Z2 -4 Z; und f2 : Z2 -› {falsch, wahr} gegeben durch Abb. 4.13. 2, {falsch, wahr} Verknüpfungstabellen von 4-- Z2 f Z (Z2, 02), (Z; 05) und falsch = 0 `•-' 1 ({falsch, wahr}, V) aus Beispiel 4.131 wahr. = 1 = 2

237

It. STRUKTURERHALTENDE ABBILDUNGEN Dann gelten nämlich Z ;`

1 G2 1 = 1 2 EB2 1 = 2 1 (132 2 = 2 2 G2 2 = 1

Z2

4-, 4— 4—

0 G2 0 = 0 1 92 0 = 1 0 ED2 1 = 1 1 92 1 = 0

f2 —> ',"-> ,---> —+

{falsch, wahr} falsch V falsch = falsch wahr V falsch = wahr falsch V wahr = wahr wahr V wahr = falsch

Die drei Gruppen sind also isomorph. KOROLLAR

■

4.132. Alle Gruppen der Ordnung 2 sind isomorph zueinan-

der. Wir betrachten nun ein Beispiel für endliche Gruppen, die nicht isomorph sind. •

1

2

3

4

1

1

2

3

4

2

2

4

1

3

3

3

1

4

2

4

4

3

2

1

BEISPIEL 4.133. Wir betrachten die folgenden zwei Gruppen von Ordnung 4. 05) = ({1{a,,4}, 3 05) (V, 0) mit V = , b, c, d1 wobei die Verknüpfung • über die Verknüpfungstabelle in Abbildung 4.14 definiert ist.

Angenommen, es gibt einen Gruppenisomorphismus f von Zg nach V. Aus der Verknüpfungstabelle von V lässt sich ablesen, dass a das neutrale Element in V ist. Also ist f (1) = a. Wir suchen also ein Bild für die übrigen Zahlen {2, 3, 4}. Abb. 4.14. Angenommen es sei f (2) = x für x E {b, c, Dann wäre

Verknüpfungstabellen von (V, •) aus Beispiel 4.133

f(4)

f (2 05 2) = f (2) • f(2) = x • x = a,

für alle x E {b, c, d} . Da f jedoch eine bijektive und insbesondere injektive Abbildung ist, ergibt sich der Widerspruch f (4) = a = f (1). Es gibt also keinen Gruppenisomorphismus von Z nach V. Die beiden Gruppen sind nicht isomorph.

■

Die Aufgabe der Gruppentheorie besteht nun darin, Gruppen jeglicher Ordnung zu klassifizieren, wobei jede Klasse von Gruppen isomorphe Gruppen vereint. Tatsächlich gibt es, wie wir gesehen haben, nur eine Klasse von Gruppen der Ordnung 2. Für die Ordnung 4 gibt es nur zwei Klassen. Jede Gruppe der Ordnung 4 ist also isomorph entweder zur Gruppe (Z; , 03) oder zur Gruppe (V, .), welche Kleinsche Vierergruppe genannt wird.

4.5.3 Körperhomomorphismen

Wir möchten nun in aller Kürze Homomorphismen auf Körpern untersuchen. Dazu definieren wir analog zur Gruppenhomomorphie Körperho-

238

STRUKTURERHALTENDE ABBILDUNGEN

A

momorphismen. DEFINITION 4.134. Seien (K, + •) und (K', ED, 0) Körper. Wir nennen eine Abbildung f : K --> K' einen Körperhomomorphismus, wenn für alle x, y E K gilt

f

+

= f (x) ®f (y) und

f (x • y) = f (x) f (y).

Ein Körperhomomorphismus ist also ein doppelter Gruppenhomomorphismus, je einer auf den (additiven) Gruppen (K ,+) und (K', ED) und auf den (multiplikativen) Gruppen (K, •) und (K', 0). DEFINITION 4.135. Zwei Körper (K , +, .) und (K' , ED, 0) heißen isomorph, wenn es eine bijektiven Körperhomomorphismus f von K nach K' gibt. Wir nennen f dann einen Körperisomorphismus. Für x E K mit f (x) = y schreiben wir x = y.

Tatsächlich gilt, anders als für Gruppen, dass alle Körper mit endlich vielen Elementen isomorph zueinander sind. Wir halten nun einige Aussagen über endliche Körper fest, ohne die komplizierten Beweise zu betrachten. Zunächst die Aussage, dass tatsächlich Körper gleicher Ordnung stets isomorph sind. SATZ 4.136. Sei n E N. Alle endlichen Körper der Ordnung n sind isomorph.

Nun klären wir, für welche Ordnungen es endliche Körper gibt. SATZ 4.137. Für jede Primzahl p und jede positive natürliche Zahl n existiert (bis auf Isomorphie) genau ein Körper mit IP Elementen. Die beiden Sätze zusammen genommen, können wir nun von dem Körper mit Ordnung pn sprechen, was wir in der folgenden Definition in Stein meißeln. D EFINITION 4.138. Sei p E N eine Primzahl und n E N. Dann bezeichnen wir den (bis auf Isomorphie) eindeutigen Körper mit pn Element als F.. Dabei heißt p die Charakteristik von Fp, Unendliche Körper haben Charakteristik 0. Wir halten noch eine amüsante Beobachtung zum Schluss fest.

sage: # endliche Körper sage: GF(2) Finite Field of size 2 sage: GF(9) Finite Field in z2 of size 3- 2

239

S. STRUKTURERHALTENDE ABBILDUNGEN

LEMMA 4.139. In endlichen Körpern mit der Charakteristik p gilt die „falsche binomische Formel" (x + y)P = xP yP . Beweis. Wir beweisen die Aussage nur für endliche Körper IFp wobei p

eine Primzahl ist. Nach Satz 4.136 können wir von dem endlichen Körper IF„ sprechen, der insbesondere isomorph zu Z,, ist. Wir rechnen also in Z,. Dann ist nach dem binomischen Lehrsatz für alle x, y E Z, (x

+

(Pi)xiyP-i i=0

und demnach = yP

weil () o

P 1)xp—l y1

)xl yP-1

(1

xp

(mod p), (4.3)

= 1 und (PP) = (P) !•(P P! = 1 (da 0! = 1 definiert ist). —P)! Wir beobachten nun, dass (Pi) 0 (mod p) ist für 0 < i < p. Betrachte dazu P!

0! (p— p )!•

P! (p — i)! • i!

(2)

(p — i)! • i! • (:) =p!.

Die rechte Seite der Gleichung der rechten Aussage ist durch p teilbar, also muss auch die linke Seite durch p teilbar sein. Die linke Seite enthält drei Faktoren, wobei gilt pt

- i)!

und

p t (i)!

da alle Zahlen in dem Produkt (p — i)! = 1 • 2 • • • ((p — i) — 1) • (p — i) echt kleiner sind als p und p als Primzahl nur die Teiler 1 und p besitzt gleiches gilt für i! (das Argument funktioniert nicht für i = p und i = 0). Demnach muss (Pi) durch p teilbar sein. Es gilt also nach (4.3), dass (x

y)P yP

yP-1 (mod

yP

was zu zeigen war.

240

xP

.

P i)XP-1y1 -1-XP

(mod p)

(mod

(mod p), ■

STRUKTURERHALTENDE ABBILDUNGEN

4.5.4 Homomorphismen auf Vektorräumen alias lineare Abbildungen Homomorphismen auf Vektorräumen werden traditionell als lineare Abbildungen bezeichnet. 4.140. Seien (V, El), 0) und (V', -I-, •) Vektorräume über dem V' heißt VektorraumhomomorphisAbbildung f : V Eine Körper K. mus oder linear, falls sie die folgenden Bedingungen erfüllt. DEFINITION

Ll. f (v w) = f (v) f (w) L2. f (A • v) = A • f (v) BEMERKUNG 4.141.

Vv , w E V Vv E V, A E K

(Additivität) (Homogenität)

Der Begriff Additivität erschließt sich schnell.

Homogenität ist ein Begriff, der in der Mathematik in verschiedenen Kontexten vorkommt. Zum Beispiel heißt ein Polynom mit mehr als einer Veränderlichen homogen, wenn die Summen der Exponenten in jedem Summanden übereinstimmt. Für das Polynom p(x, y) = 4x2y + 2xy2 2x3 ist dies der Fall (es ist x = x1 und y = y1). Es klingt eine Gleichmäßigkeit dabei an und so wie bei Abbildungen von Vektoren der „Streckungsfaktor" sich überträgt. Der um A gestreckte Vektor v im Urbildvektorraum wird auf den um A gestreckten Bildvektor f (v) abgebildet. ■ Ein Vektorraumhomomorphismus oder eine lineare Abbildung ist also ein Gruppenhomomorphismus der additiven abelschen Gruppe und „vertauschbar" mit der Multiplikation mit Skalaren. Es gibt einige offensichtliche Beispiele linearer Abbildungen. BEISPIEL

4.142. E seien zwei Vektorräume V, V' über dem Körper K gegeben.

0, die also alle Vektoren auf den Nullvektor k Die Abbildung f : V --+ V I , v abbildet, ist linear. Denn es gilt Für je zwei Vektoren v, w E V ist f(v+w) = 0 = 0 + 0 = f(v)+ f (w). L2. Für jeden Vektor v E V und jedes Skalar A E K gilt f (A•v)= 0 =A•0=A•f(v). v, die einfach v auf sich selbst abbildet, ist V, v 11.. Die Abbildung id : V linear. Denn es gilt Ll. Für je zwei Vektoren v, w E V ist f(v + w) = v + w -= f(v) + f(w). L2. Für jeden Vektor v E V und jedes Skalar A E K gilt f (A•v)=A•v=A•f(v).

k Ist allgemeiner c E K ein Skalar, so ist die Abbildung fc : V

V v 1-+ c • v,

241

A

k STRUKTURERHALTENDE ABBILDUNGEN

welche v auf des c-fache von sich selbst abbildet, linear. Ll. Für je zwei Vektoren v, w E V ist f(v -1-w) =c• (v+w)= c•v c•w = f(v) L2. Für jeden Vektor v E V und jedes Skalar A E K gilt f (A•v)=c•A•v=A•c•v=A•f(v). •

Wir betrachten nun weniger offensichtliche Beispiele für den Vektorraum R2 BEISPIEL 4.143.

A. Die Abbildung f : R 2

R2 , (x ) F-+

x ) ist, geometrisch gesprochen,

—Y

die Spiegelung an der x-Achse und eine lineare Abbildung. Denn es gilt Ll. Für je zwei Vektoren ( ab) , Cd) E R2 ist

(( b )

f

((4)

()+

L2. Für jeden Vektor ( ab)

f

CO)

(b1))

()

= f (( b ))

f (W)

und jede reelle Zahle A E IR gilt

= f (0,• ab)) = = A (b)

ab)

A f ((b))

k Die Abbildung f : R 2 —> R2 , (x ) 1-4 ( v) x ist die Rotation um 90° gegen v den Uhrzeigersinn und ebenfalls linear. — sin(a)y } Allgemeiner ist f : 2 __0. 212 x i_+ cos(a)x sin(a)x + cos(a)y die Rotation Y gegen den Uhrzeigersinn um den Winkel a und ebenfalls linear. • BEMERKUNG 4.144. In der Schulmathematik versteht man unter einer linearen Abbildung eine Abbildung f : R IR mit x H a • x für ein a E R. Tatsächlich, interpretiert man die reellen Zahlen als den Vektorraum IY 1, so sind diese Abbildungen vom dritten Typ in Beispiel 4.142. Man kann ganz leicht die beiden Bedingungen Ll und L2 nachrechnen.

Außerdem ist in der Schulmathematik gemeinhin bekannt, dass die Abbildung f Ilik — RillitxHx2 keine lineare Abbildung ist. Interpretiert man erneut die reellen Zahlen als den Vektorraum , so stellt man fest f (2

242

+ 3) = f (5) = 25 0 4 + 9 = f (2) + f (3),

STRUKTURERHALTENDE ABBILDUNGEN

A

die Bedingung Ll ist nicht erfüllt. Tatsächlich gilt die Bedingung L2 ebenfalls nicht, es ist nämlich f (2

• 3) = f(6) = 36 0 2 • 9 -= 2 • f (3).

■ Aus gegebenen linearen Abbildungen kann man neue basteln. DEFINITION 4.145. Seien f,g : V -+ V' lineare Abbildungen auf den Vektorräumen V und V' über dem Körper K und A E K. V' durch xi-01/4 • f (x). • Wir definieren die Abbildung A f : V • Wir definieren die Abbildung f g : V -4 V' durch x 1-> f (x) + g (x). BEMERKUNG 4.146. Damit wird die Menge der linearen Abbildungen auf Vektor■ räumen selbst zu einem Vektorraum. Bei diesen Abbildungen handelt es sich tatsächlich um lineare Abbildungen. V" lineare KOROLLAR 4.147. Seien f,g : V - V' und h : V' Abbildungen auf den Vektorräumen V, V' und V" über dem Körper K. Dann gelten die folgenden Aussagen. La. Für jede Zahl A E K ist A • f linear. Lb. Die Abbildung f + g ist linear. Lc. Die Abbildung h o f :V -4 V" ist linear. Beweis. Man rechnet die Eigenschaften Li und L2 nach.

■

V' eine bijektive lineare Abbildung. PROPOSITION 4.148. Sei f : V Dann ist auch ihre Umkehrabbildung f 1 : V -> V' linear. Beweis. Seien v', w' E V' Vektoren. Dann gibt es v, v E V mit v' = f (v) = f (v + w) und weil und w = f (w). Weil f linear ist, gilt v' folgt außerdem bijektiv ist, f -1(v' w') = f -1(f (v + w)) = v + w = f -1(v) + f -1(w). Ist ferner A E K, so gilt f 1(A • v') -= f -1(A • f (v)) ---A•v=A•f -i (v). Also erfüllt f -1 die Bedingungen Li und L2.

243

S. STRUKTURERHALTENDE ABBILDUNGEN

4.5.5 Isomorphie von Vektorräumen - Teil 1

Wir definieren an dieser Stelle, was wir unter der Isomorphie von Vektorräumen verstehen. Später werden wir eine erstaunliche Beobachtung bezüglich der Isomorphie von Vektorräumen über einem festen Körper machen. DEFINITION 4.149. Zwei Vektorräume (V, 0) und (V', +, -) über demselben Körper IK heißen isomorph, wenn es eine bijektive lineare Abbildung f von V nach V' gibt. Wir nennen f dann auch einen Vektorraumisomorphismus. Für v E V mit f (v) = w schreiben wir v = w. BEISPIEL 4.150. Die Vektorräume (1[83 ,+, -) und (R[x]2, ED, 0) sind isomorph. Der Isomorphismus lautet

V1 f : (02)H V1X2 V2X + V3. v3

Es ist also zu prüfen, ob f eine lineare Abbildung und bijektiv ist. Linearität. Ll. Für je zwei Vektoren v, w E R3 ist O (v w) = (vi + wi)x 2 + (v2 + W2)X + (v3 + w3) = ViX2 V2X + V3 + w1x2 W2X + W3 =

f (v) + f (tv)•

L2. Für jeden Vektor v E R3 und jedes Skalar a E R gilt f (A • v) = A • vix2

+ A • v2x + A • v3 = • (vix2 v2x + v3) = A • f (v).

Surjektivität. Sei p = cc- X2 +b-X-1-c E R[x]2 beliebig gewählt, so wird ( b) E R3 c auf p abgebildet. Injektivität. Seien v, w E 1183 mit f(v) = f (w). Dann ist 0 = f(v) — f(w) = f (v — w), also ist vi — wl = 0, v2 — w2 = 0 und v3 — w3 = 0. Also ist v = w.

■

244

AUFGABEN A

4.6 Aufgaben

EINLEITUNG ALGEBRAISCHE STRUKTUREN. A 4.1 Welche der folgenden Aussagen ist korrekt?

i. Rechenoperationen werden auch als Verknüpfungen bezeichnet. ii. Eine Verknüpfung auf einer Menge M bildet Thpel von Elementen aus M auf ein Thpel von Elementen aus M ab. iii. In einer Verknüpfungstabelle einer Verknüpfung auf einer beliebigen Menge kann es eine Zeile geben, in welcher alle Einträge identisch sind. iv. Es ist 6 EN 7 = 9 EB4 12.

x. Abelsche Gruppen haben symmetrische Verknüpfungstabellen, aber nicht alle Gruppen mit symmetrischer Verknüpfungstabelle sind abelsch. orl 4.6 Betrachte für eine endliche Menge von Vektoren v1, • • • , vs E IR° die Menge aller Positivkombinationen 1C(vi,

, vs)

= Iv E1R:v=Ea •v mitai,...,as i=i

}

vs , wobei + = {x E R : x > 0} ist, den von vi, aufgespannten Kegel. Zeigen Sie, dass Kegel zusam4.14.2 Stellen Sie die Verknüpfungstabelle der Ver- men mit der Vektoraddition im ItIn Halbgruppen sind. knüpfung 06 auf der Menge Z6 auf. Es sei G1 = {a, b, c, d, g, h} und o : G1 x G1 Gi wri' 4.3 Stellen Sie die Verknüpfungstabelle der VerVerknüpfungstafolgenden der mit Verknüpfung eine knüpfung 06 auf der Menge Z6 auf. belle. wrir 4.4 Zeigen Sie, dass die Abbildung f : Zn 0 abcdgh Zn, x H x en 2 bijektiv ist. b a h d a c d h b b c d b h c GRUPPEN. A

d h

i. Jede Gruppe ist eine Halbgruppe. ii. In einer Gruppe (G, o) gilt für alle a, b E G stets a b. iii. Eine Menge G kann mit unterschiedlichen Verknüpfungen o und * jeweils eine Gruppe bilden. iv. Es gibt endliche Gruppen ungerader Ordnung mit einer geraden Anzahl von Elementen. v. In der Verknüpfungstabelle der Verknüpfung einer Gruppe der Ordnung mindestens 2 kann es eine Zeile geben, in welcher alle Einträge identisch sind. vi. Eine abelsche Gruppe hat immer gerade Ordnung. vii. Jede Gruppe besitzt eine Untergruppe. viii. In endlichen Gruppen teilt die Ordnung von Gruppenelementen stets die Gruppenordnung. ix. Es gibt Gruppen, in denen es zwei Elemente der Ordnung 1 gibt.

b

c

d 9

c

d a

h

4.5 Welche der folgenden Aussagen ist korrekt?

d

h

9 c b

b

Das Paar (G1, o) bildet eine Gruppe (dies muss/soll nicht bewiesen werden). 4.7 Untersuchen Sie die Gruppe (G1, °)•

i. Nennen Sie das neutrale Element ein (G1, o). ii. Ist (G1, o) eine abelsche Gruppe? iii. Bestimmen Sie für alle Elemente in Gi jeweils das Inverse. iv. Zeigen Sie, dass das Assoziativgesetz in (G1 o) für die Elemente a, b, c (das sind keine Variablen - also beliebige Gruppenelemente - sondern speziell die Gruppenelemente a, b, c) gilt. Zeigen Sie also, dass (a o b) o c = a o (b o c). MO` 4.8 Es sei G2 = {a, b, c, d, g, h} und o : G2 x

G2 —? G2 eine Verknüpfung, sodass das Paar (G2, o) eine Gruppe bildet. Vervollständigen Sie die folgen-

245

k

AUFGABEN

de Verknüpfungstabelle (mit Begründung - Relationen und Rechnungen angeben). abcdgh c b d h 9

0

a b c d

dass (IR, +) eine abelsche Gruppe ist. 4.15 Welche Ordnung hat die Gruppe (G4, 0)? '' 4.16 Zeigen Sie, dass die Menge u = { () : X2 E R}

d

g

h

a

d

41' 4.9 Nennen Sie alle Quadrate in (G2 , o), d.h. Elemente x E G2 der Form x=yoy mit y E G2.

zusammen mit der Verknüpfung 0 eine Untergruppe von (G4, e) bildet. 41' 4.17 Finden Sie weiter Untergruppen dieser Gruppe (G4, o)? Finden Sie endliche Untergruppen?

41' 4.18 Zeigen Sie, dass das Paar ({1, 2, 3, 4, 5, 6}, 07) 41' 4.10 Bestimmen Sie sowohl das kleinste k E N+ eine abelsche Gruppe ist. mit ak = e (hier ist a E G2 und e das neutrale Element in G2) als auch das kleinste 2 E N mit ct = e. wir 4.19 Zeigen Sie, dass das Paar ({1, 2, 4}, 07) eine Untergruppe der Gruppe ({1, 2, 3, 4, 5, 6}, 07) ist. Es sei G3 = {a, b, c, d} und o : G3 x G3 G3 eine Verknüpfung mit der folgenden Verknüpfungstabelle. wir 4.20 Zeigen Sie, dass die Menge 0

a

c

b

a

c d

d b

b c d xi b c d c b x2 d x3 c a

Das Paar (G3, o) bildet eine abelsche Gruppe mit x1,x2,x3 E G3. wir 4.11 Nennen Sie das neutrale Element der Gruppe (G3, 0)• wri' 4.12 Nennen Sie für jedes Element das inverse Element in (G3, o).

U = {0, 3,6, 9} = {x E Z12 : X E 3n (mod 12) für ein n E N} mit der Verknüpfung 012 eine Gruppe ist. Offensichtlich gilt U" C 7612 = {0, 1, 2, ..., 10,11} und Sie dürfen voraussetzen, dass (Z12, 012) eine Gruppe ist. 41' 4.21 Geben Sie alle Elemente der Permutationsgruppe S4 an. 41' 4.22 Berechnen Sie sign([45321]).

4.1" 4.13 Vervollständigen Sie die Verknüpfungstabelle, WI 4.23 Berechnen Sie mit Hilfe des erweiteren Euindem Sie die Variablen x1, x2 , x3 begründet mit Wer- klidischen Algorithmus sowohl ggT(15, 109) als auch ten aus G belegen. Denken Sie daran, dass (G, o) eine das Inverse von e = 15 in der multiplikativen Gruppe abelsche Gruppe ist. (Z*10930109)• Sei x 1) 3. G4 ={ x2 : Xl, X2, X3 E R x3 .1 91) k für x, y E G mit x = (x21 und y = (92 die x3 \93 / x1 + yi) Addition definiert als x 0 y = ( .2 + 92 x3 + 93 rjr 4.14 Zeigen Sie, dass das Paar (G4, 0) eine abel-

W

sche Gruppe ist. Hinweis: Sie dürfen als bereits bewiesen voraussetzen,

246

Wir 4.24 Berechnen Sie mit Hilfe des erweiteren Euklidischen Algorithmus das Inverse von e = 12 in der multiplikativen Gruppe (Z*119, 0119)• 41' 4.25 Berechnen Sie das inverse Element zur 7 in der Gruppe (Z30 , 030). 41' 4.26 Berechnen Sie das inverse Element zur 11 in der Gruppe (Z:1, 041). wir 4.27 Beweisen Sie Gb und Gc aus Lemma 4.25. Zeigen Sie also, dass in einer Gruppe (G, o) für alle a E G gelten

AUFGABEN

Gb. Es gibt genau ein inverses Element ä zu a. Gc. Das inverse Element zu ä ist a.

4.1' 4.28 Hat 12 ein inverses Element modulo 15 (d.h. es gibt ein s

Z mit 12 • s 1 (mod 15))?

,..J` 4.29 Sei n E N, n > 2. Beweisen Sie, dass eine

A.

iii. Jeder Körper ist sowohl bezüglich der Addition als auch bezüglich der Multiplikaton eine abelsche Gruppe. iv. Jeder Ring ist eine abelsche Gruppe. v. Die Elemente eines Körpers werden, analog zu der Bezeichnung Vektoren eines Vektorraums, selbst als Körper bezeichnet.

ganze Zahl a E 7.3 genau dann ein inverses Element modulo n besitzt (d.h. es gibt ein s E 73 mit a • .s 1 wir 4.37 Nennen Sie mindestens zwei endliche Körper (mod n)), wenn ggT(a, n) = 1? und geben Sie jeweils die beiden Verknüpfungstabellen v.)" 4.30 Betrachten Sie die Gruppe (Z*, OP) wobei p der Addition und Multiplikation an. eine Primzahl ist. Eine Zahl a E Zp* heißt quadratischer wri` 4.38 Zeigen Sie, dass die Menge aller reellen PolyRest, wenn es eine Zahl b E Z gibt, mit norne R[x] ein unitärer kommutativer Ring ist. a = b Opb oder gleichbedeutend a

b2 (mod p).

Zeigen Sie, dass für jeden quadratischen Rest a E Zp* gilt a 2

1 (mod p).

Bemerkung: Umgangssprachlich sind "quadratische Reste" einfach die "Quadratzahlen" in Z; (sie heißen "Reste", weil es sich um einen Rest beim Teilen durch p handelt). Wie in N sind natürlich nicht alle Zahlen in Z Quadratzahlen. 4.31 Sei (G, o) eine endliche abelsche Gruppe. Zeigen Sie, dass für jedes Element g E G die Ordnung WI stets die Gruppenordnung von G teilt. 4.32 Sei (G, o) eine Gruppe. Es gelte g2 = e für alle g E G. Zeigen Sie, dass G abelsch ist. wh. 4.33 Für welche n e N ist (Z,-, \ {0}, 0„) eine Gruppe? Beweisen Sie Ihre Antwort. '14" 4.34 Beweisen Sie Lemma 4.76, also dass die Permutationsgruppe .9r, Ordnung n! hat.

,ri` 4.35 Beweisen Sie Lemma 4.77, also dass die Menge Sn, mit der Verkettung von Abbildungen o für n > 2 eine nicht-abelsche Gruppe bildet.

RINGE UND KÖRPER. 4.36 Welche der folgenden Aussagen ist korrekt? i. Jeder Körper ist ein Ring. ii. Jeder Ring ist ein Körper.

4.39 Sei R ein Ring. Ein Element a E R für welches es ein Element b # 0 in R gibt, so dass a • b = 0 ist, wird Nullteiler von R genannt. Nennen Sie alle Nullteiler des Resüdassenrings 7212. Können Sie allgemein für n E N mit n > 2 alle Nullteiler von charakterisieren? wir 4.40 Zeigen Sie die Rückrichtung aus Satz 4.88. Zeigen Sie also, dass n eine Primzahl ist, wenn Zn ein Körper ist.

VEKTORRÄUME. 4.41 Welche der folgenden Aussagen ist korrekt? i. Jeder Vektorraum bildet mit der inneren Verknüpfung eine abelsche Gruppe. ii. Es gibt in Vektorräumen einen eindeutigen Nullvektor 0. iii. In Vektorräumen besitzt jeder Vektor eine eindeutiges inverses Element bezüglich der äußeren Verknüpfung. in den iv. In der Darstellung der Vektorräume kartesischen Koordinatensystemen IRn wird jeder Vektor des lEr als genau ein Pfeil repräsentiert. v. In der Darstellung der Vektorräume likn in den kartesischen Koordinatensystemen Rh wird die Vektoraddition als das aneinander Hängen von Pfeilen repräsentiert. vi. Jeder Vektorraum ist ein Ring. vii. Jeder Körper ist ein Vektorraum über sich selbst. viii. Anhand des Unterraumkriteriums wird entschieden, ob ein Vektorraum Untervektorräume besitzt. ix. Jeder Untervektorraum ist auch eine Untergrup-

247

AUFGABEN

pe der abelschen Gruppe, welche der Vektorraum mit der inneren Verknüpfung darstellt. x. Jeder Körper ist ein Vektorraum und jeder Vektorraum ein Körper. 4.42 Es sei IR[x]3 = {ax3 bx 2 + ex + d : a, b, c, d E IR} die Menge der Polynome vom Grad höchstens 3. Zeigen Sie, dass K[43 ein Vektorraum ist. whr 4.43 Es sei fp E R[x]3 : p(1) = 0} die Menge der Polynome in R[x] 3 mit einer Nullstelle bei xo = 1 Zeigen Sie, dass U ein Untervektorraum vom R[x]3 ist. WI 4.44 Ist die Menge {(b):a,b,c

4.49 Welche der folgenden Aussagen ist korrekt? i. Ein Gruppenhomomorphismus ist eine bijektive Abbildung zwischen zwei Gruppen. ii. Es gibt Gruppenhomomorphismen zwischen einer Gruppe und einem Vektorraum. iii. Zwei Gruppen heißen isomorph, wenn es einen Gruppenhomomorphismus zwischen ihnen gibt. iv. Zwei isomorphe Gruppen sind von gleicher Ordnung. v. Die Gruppe (Z;` , 03) ist isomorph zur Gruppe (Z2, $2). vi. Es gibt zwei nicht isomorphe Körper der Ordnung 5. vii. Vektorraumhomomorphismen werden auch lineare Abbildungen genannt. viii. Umkehrabbildungen linearer Abbildungen sind ebenfalls linear. wr4 4.50 Zeigen Sie, dass die Abbildung

R und a±b c} CR3

f:

R2 , (x)

(z .)

ein Untervektorraum des IR3?

eine lineare Abbildung ist.

',ei' 4.45 Es sei

WI 4.51 Es sei f : R —›I^ mit x H x3 eine Abbildung. Ist f eine lineare Abbildung?

a 62) : a, b E IR} {( eine Teilmenge des R2?

. Ist U ein Untervektorraum des

«..4 4.46 Zeigen Sie, dass die Abbildungen fi und f2 aus Definition 4.113 invers zueinander sind. wri' 4.47 Beweisen Sie die Aussage Vc aus Lemma 4.115. Zeige Sie, dass in einem K-Vektorraum V für alle A E IK und if E V gilt —1K 0 = — wri` 4.48 Es seien V und V' zwei K-Vektorräume. Zeigen Sie, dass V x V' zusammen mit der inneren Verknüpfung (v, v') + (w, w') =- (v + w, v' + w') für alle (v, v'), (w, w') E V x V und der äußeren Verknüpfung A • (v, v1) ---- (A • v, A • v') für alle A E K(v, v') E V x V ein Vektorraum ist.

STRUKTURERHALTENDE ABBILDUNGEN.

248

4.52 Zeigen Sie, dass die Abbildung f : R3 (u.z)

(:

eine lineare Abbildung ist. wel 4.53 Zeigen Sie, dass IR[x]3 isomorph zu einem Rn mit n E N ist (Nennen Sie dabei explizit n). Wir 4.54 Zeigen Sie, dass für jeden Gruppenhomomorphismus f : G —› H zweier Gruppen G und H gilt f (ec) = ex • wri` 4.55 Beweisen Sie Korollar 4.132. Zeigen Sie, dass alle Gruppen der Ordnung 2 isomorph sind. 4. 1' 4.56

Zeigen Sie, dass die Menge der linearen Abbildungen von einem Vektorraum IR' in einen Vektorraum Rn mit den Verknüpfungen aus Definition 4.145 selbst einen Vektorraum bildet. wrl' 4.57 Ist die Gruppe (Z;, 05) isomorph zur Gruppe (7Z4, EB4)? wpir 4.58 Zeigen Sie Korollar 4.147. Es seien also f, g : V —› V' und h : V' -÷ V" lineare Abbildungen auf

AUFGABEN

den Vektorräumen V, V' und V über dem Körper K. Zeigen Sie, dass dann gilt

A

La. Für jede Zahl A E K ist A • f linear. Lb. Die Abbildung f g ist linear. Lc. Die Abbildung h o f :V V" ist linear.

249

k AUFGABEN

250

IH Lineare Algebra

5

Basis und Dimension

Wir werden in diesem Kapitel den Begriff der Basis kennen lernen. Eine Basis ist eine Menge von Vektoren eines Vektorraums, welche die gesamte Information über diesen in sich trägt. Eine Basis ist wie die DNA oder besser eine Bauanleitung des Vektorraums, oder auch die Elemente einer Wegbeschreibung beim Orientieren auf einer Landkarte. Nachdem wir Basen definiert haben, werden wir feststellen, dass ein Vektorraum unterschiedliche Basen, also insbesondere mehr als eine besitzt. Doch all diese Basen eint, dass sie die gleiche Anzahl von Vektoren beinhalten. Man kann einen Vektorraum also mit unterschiedlichen Basen beschreiben, die Anzahl der Vektoren, die man dabei benötigt, ist gleich. Diese Invariante, wie man in der Mathematik zu sagen pflegt, werden wir als die Dimension eines Vektorraums kennen lernen. Die Dimension ist grob gesagt ein Maß für die Bewegungsmöglichkeiten in einem Vektorraum, den sogenannte „Freiheitsgrade". Mithilfe von Basen können wir dann schlussendlich zeigen, dass Vektorräume über demselben Körper 1K genau dann isomorph sind, wenn ihre Basen die gleiche Anzahl von Vektoren beinhaltet. Auf dem Weg zu diesen Aussagen werden wir uns die abstrakten Konzepte am IV verdeutlichen, um eine Intuition zu entwickeln. Dabei wollen wir nicht vergessen, dass die Aussagen auf beliebigen Vektorräumen, wenn auch keinen anschaulichen, dennoch einen anlogen Sinn ergeben.

5.1 Erzeugung und lineare Abhängigkeiten

Betrachtet man die Vektorräume R', R2 und R3 stellt man fest, dass sie sich umgangssprachlich in ihren Raumdimensionen unterscheiden. Der R1 lässt sich als eine Gerade auffassen, ist also 1-dimensional, der R2 kann als eine Ebene dargestellt werden und ist damit 2-dimensional und schließlich ist der R3 ein 3-dimensionaler Raum. Dabei wird deutlich, die Dimensionen entsprechen Freiheitsgeraden, möglichen „Laufrichtungen".

S. ERZEUGUNG UND LINEARE ABHÄNGIGKEITEN

Das kann man sich gut an unterschiedlichen Verkehrsmitteln verdeutlichen. } Eine Zug kann auf einer langen Schiene nur vor- oder rückwärts

fahren, bewegt sich auf einer Geraden und hat somit nur einen Freiheitsgrad. k Ein Auto bewegt sich auf einer Ebene, kann vor- und rückwärts aber auch nach links oder rechts fahren, hat also zwei Freiheitsgerade. s. Ein Hubschrauber kann sich in drei Raumrichtungen frei bewegen. Er kann vor- und rückwärts aber auch nach links oder rechts, oben oder unten fliegen, hat also drei Freiheitsgerade. Eine weiter Illustration bietet das Bewegen in einem großen Gebäude mit vielen Stockwerke und senkrecht oder parallel zueinander verlaufenden langen Gängen. k In einem Gang kann man sich nur vor- oder rückwärts bewegen.

Eine Bewegung auf einer Geraden mit einem Freiheitsgrad also. ie In einem Stockwerk kann man sich in einen Gang vor- oder rück-

wärts bewegen, aber auch nach links oder rechts in Gänge abbiegen. Zwei Freiheitsgrade auf der Ebene des Stockwerks. k Schlussendlich kann man über Treppen die Stockwerke wechseln und sich somit in einer dritten Raumrichtung bewegen. Wir möchten diese anschaulichen Konzepte nun formal fassen und definieren, was es heißt, sich „mit bestimmten Laufrichtungen mittels Vektoren durch einen von den Vektoren aufgespannten Raum zu laufen".

5.1.1 Linearkombinationen

.3

yl Abb. 5.1. Laufrichtungen im

254

3

Der 1R3 ist in unserer Anschauung der kartesische Raum mit drei Koordinatenachsen, in welchem wir Pfeile mit Vektoren assoziieren. Möchte man, im Ursprung startend, einen bestimmten Punkt P = (p1, p2 , p3) ansteuern, kann man einfach den Pfeil der vom Ursprung auf den Punkt P zeigt, entlang laufen. Alternativ kann man aber auch erst einem pi langen Pfeil in Richtung der xi -Achse, dann einem p2 langen Pfeil in Richtung der x2 -Achse und schließlich einem p3 langen Pfeil in Richtung der x3-Achse folgen. Man erreicht ebenfalls den Punkt P durch Aneinanderhängen von drei Pfeilen - siehe dazu Abbildung 5.1. Das Aneinanderhängen von Pfeilen entspricht der Vektoraddition, das Strecken der Pfeile der Multiplikation mit Skalaren im 1R3.

ERZEUGUNG UND LINEARE ABHÄNGIGKEITEN A

Wir möchten diese „Laufanweisungen" nun abstrahieren. DEFINITION 5.1. Es seien v1, Eine Summe der Form

, vk Vektoren in einem K-Vektorraum V.

µi vi=µ1'v1+•••+ µk •vk E i=i

EK

mit

nennen wir eine Linearkombination der Vektoren v1,

vk.

Lässt sich ein Vektor v E V als Linearkombination der Vektoren vi , schreiben, also v = /..ti • vi + . • • + ilk •

, ptk E K

mit

Vk

vk

sagen wir, dass v eine Linearkombination der Vektoren vi,

vk ist.

BEMERKUNG 5.2. Ein sprachlicher Hinweis ist nun angebracht. Natürlich ist die spezielle Form der Summe (also damit meinen wir die Koeffizienten) die Linear, vk . Rechnet man die Summe aus erhält man kombination der Vektoren vi, einen Vektor, der nach Definition 5.1 auch als Linearkombination der Vektoren , vk bezeichnet wird. Dabei vergisst man die konkrete Form der Summe vi (also die Koeffizienten). Tatsächlich besteht die Möglichkeit, dass ein Vektor v unvk (wir meinen natürlich terschiedliche Linearkombinationen der Vektoren vi, die Summen mit unterschiedlichen Koeffizienten) besitzt, wie wir in Beispiel 5.3 sehen. , vk, dann sagt man auch, dass Ist v eine Linearkombination der Vektoren vi, • vk linear kombinieren lässt. sich v aus den Vektoren vi, 0

2) BEISPIEL

5.3. Betrachten wir die Vektoren vi = o und v2 =

2

i

0

0

Dann ist 4 v = (2) =

0)

2

2 • (o) + 1 • (2

eine Linearkombination von vi und v2 mit /Li = 2 und ft2 = 1. Tatsächlich handelt es sich dabei um die einzige Linearkombination der Vektoren vi und v2 von Vektor v. Betrachtet man die erste Komponente, dann hat v dort den Wert 2 • Ai. Damit dies 4 wird muss µl = 2 gesetzt werden. Analog argumentiert man, dass iu.2 = 1 gesetzt werden muss. Siehe Abbildung 5.2 für eine Illustration.

Abb. 5.2. Linearkombination aus Beispiel 5.3 - Teil 1.

(2

stellt man fest, dass 2 o der Vektor v mehr als eine Linearkombination der Vektoren vi, v2 und v3 besitzt. Es ist nämlich Ergänzt man die Vektoren v1 und v2 um den Vektor v3 =

(4 2) =

2

0

2)

2 • (o) + 1 • (o2) + 0 • (2

255

k

ERZEUGUNG UND LINEARE ABHÄNGIGKEITEN

aber auch (4 2)

2 0 2) = 1 • (0) + 0 • (2) + 1 • (2 0 0 0

und auch (0

2

0

2

2) = 0 • (0 ) + (-1) • (2) + 2 • (2) . 0 0 0

Siehe Abbildung 5.3 für eine Illustration. BEISPIEL 5.4. Betrachten

■

wir die Vektoren vi =

und vz = (1 4 ) im 1Fs2 .

Dann ist v=

(4) = 3 (2) + 3 (1)

eine Linearkombination von vi und v2 mit µl = 3 und /22 = 3.

Abb. 5.3. 5.1.2 Der Spann von Vektoren Linearkombinationen aus Beispiel 5.3 Teil 2. Wir möchten nun die Menge der Vektoren, die wir aus einer gegebene Menge von Vektoren linear kombinieren können, untersuchen. Zunächst geben wir dieser Menge einen Namen. DEFINITION 5.5. Es seien vi, • • • , vk Vektoren in einem K-Vektorraum V. Die Menge aller Linearkombinationen der Vektoren v1, , vk k

span(vi, ... , vk) = {Ei.tivi : pti, ... , ottk E Zig i=1 nennen wir den Spann von vi ,

vk.

Außerdem setzten wir für Teilmengen U von V mit

span(U) =

U

= 00

span(W)

wculwi Bd > Ba. Sei also eine endliche Menge mit 181 = n. Im Folgenden seien die endlich vielen Elemente aus B bezeichnet mit v1, . , vn . „Ba Bb": Es sei 13 ein Basis von V. Dann ist 8 nach B2 ein Erzeugendensystem von V. Bleibt zu zeigen, dass 13 ein minimales Erzeugendensystem ist. Angenommen ist kein minimales Erzeugendensystem. Dann gibt es einen Vektor v, E B, so dass 1i \ {v,} immer noch Erzeugendensystem von V ist. Dann lässt sich v, als Linearkombination der Vektoren in 13 \ {v,} schreiben, nach Lemma 5.23 ein Widerspruch zu B2, der linearen Unabhängigkeit der Basis 8. „Bb Bc": Es sei C3 ein minimales Erzeugendensystem von V. Angenommen, 13 sei nicht linear unabhängig. Dann gibt es nach Lemma 5.23 einen Vektor v, E B, welcher sich als Linearkombination der Vektoren in 13 \ {v3 } schreiben lässt. Dann ist aber nach Lemma 5.11 span(U) = span(U \ {v,} und weil U ein Erzeugendensystem ist, auch U \{v,} - ein Widerspruch zur Minimalität des Erzeugendensystems U. Bleibt zu zeigen, dass U maximal linear unabhängig ist. Sei v E V ein beliebiger Vektor. Da U ein Erzeugendensystem von V ist, lässt sich v als Linearkombination von U schreiben. Nach Lemma 5.23 ist U U {v} dann linear abhängig. Also ist U maximal linear unabhängig. „Bc = Bd": Es sei 13 eine maximal linear unabhängige Menge in V und angenommen, es gibt einen Vektor v E V, welcher keine Linearkombination von 13 ist, also v e span(B). Angenommen, es lässt sich ein Vektor v,

268

DIE DIMENSION

aus 13 als Linearkombination der Vektoren in 13 U {v} schreiben. Dann ist •vi + t,,•v

Vj =

für 1,11 • • •

P9+1, • • •

E 1K. (5.3)

i=i i~3

Es gibt nun zwei Fälle. Fall 1 - µ = 0. Dann ist eine Linearkombination der Vektoren in 13 \ {v,} nach Lemma 5.23 ein Widerspruch zur linearen Unabhängigkeit von B. Fall 2 - µ # 0. Dann lässt sich Gleichung (5.3) umformen zu k 1 V =V-• L., i'li • 'VJ + - • Vj. it i=1 i-t ij

Dann ist v eine Linearkombination der Vektoren in 13, ein Widerspruch zu unserer Annahme, dass v e span(13). Zusammengefasst lässt sich also weder ein Vektor aus 13 als Linearkombination der Vektoren aus 13 U {v} noch v als Linearkombination der Vektoren aus 13 schreiben. Nach Lemma 5.23 ist die Menge 13 U {v} dann linear unabhängig - ein Widerspruch zur Maximalität von B. Es lässt sich also jeder Vektor v E V als Linearkombination der linear unabhängig Vektoren aus 13 schreiben. Nach Proposition 5.25 ist diese Darstellung eindeutig. „Bd = Ba": Jeder Vektor aus V hat eine eindeutige Darstellung als Linearkombination von Vektoren aus B. Dann gilt nach Proposition 5.25, dass 13 linear unabhängig ist, also gilt Bl. Da span(13) = V ist, gilt auch ■ B2. Also ist 13 eine Basis von V.

5.3 Die Dimension Wir würden gerne die Dimension eines Vektorraums V als die Anzahl der Vektoren in einer Basis von V definieren. Dazu müssen wir uns allerdings noch zwei Dinge überlegen. s. Jeder Vektorraum hat eine Basis.

269

A

k DIE DIMENSION

s. Alle Basen eines Vektorraums bestehen entweder alle aus unendlich vielen oder alle aus gleich vielen Vektoren. Dazu benötigen wir den folgenden Satz. SATZ 5.35. Sind vi , , vn und wi , V, dann ist k = n.

vk Basen eines K-Vektorraums

Satz 5.35 folgt direkt aus Lemma 5.43, dessen Beweis ist allerdings etwas technisch, weswegen wir ihn am Ende dieses Abschnitts führen. Satz 5.35 motiviert die folgende Definition. , DEFINITION 5.36. Hat ein Vektorraum V eine Basis B = tvi , mit n E N so sagen wir, dass V die Dimension n hat und schreiben dim(V) = n. Hat V keine endliche Basis von V, so sagen wir, dass V unendlich Dimension hat. BEMERKUNG 5.37. In Linie mit der Definition 5.36 hat der Nullvektorraum nur die leere Menge als Basis und demnach Dimension 0. ■ BEISPIEL 5.38. Die Standardeinheitsvektoren bilden eine Basis des Kn. Also hat der Vektorraum Kn die Dimension n. ■ BEISPIEL 5.39. Die Menge {1, x, X2 } ist eine Basis von R[x]2 = {ax2 bx c : a,b, c E R} , wie man leicht nachprüft. Also hat der Vektorraum IR[x]2 die Dimension 3.

■

BEISPIEL 5.40. Die Menge R[x] aller Polynome ist ein Vektorraum, der keine endliche Basis besitzt. Also hat der Vektorraum Ill[x] die Dimension unendlich. ■

5.3.1 Isomorphie von Vektorräumen - Teil 2 Mithilfe der Dimension können wir nun unsere Untersuchung isomorpher Vektorräume fortsetzen. Wir werden einen sehr überraschenden Zusammenhang herstellen. Tatsächlich sind alle n-dimensionalen K-Vektorräume isomorph. Da der Kn Dimension n hat, sind alle n-dimensionalen K-Vektorräume isomorph zum Kn. SATZ 5.41. Jeder n-dimensionale 1K Vektorraum ist isomorph zum Kn mit n e N. Beweis. Es sei V ein n-dimensionaler Vektorraum, dann besitzt V eine Basis vi , • • • , vn . Zu jedem Vektor w E V gibt es nach Proposition 5.34 genau ein n-Tupel von Koeffizienten (aw,i , , ai„,„) E Kn (als kartesiches

270

DIE DIMENSION

Produkt aufgefasst) mit w = ai,wvi +

+ an w vn .

Wir zeigen nun, dass der Vektorraumhomomorphismus f : V —> W' mit W

bijektiv ist (die Additivität Ll und Homogenität L2 von f

prüft man leicht nach). Injektivität. Aus der Eindeutigkeit der Linearkombination aus Basiselew aus V auch menten, sind für zwei unterschiedliche Vektoren w unterdie n-Tupel der Koeffizienten (aw,i, , aw,n) (aff,,i, • • • , schiedliche und so auch die Bilder unter f. Surjektivität. Umgekehrt gilt, für jeden Vektor a E 1K" ist u = aivi + anan ein Vektor in V mit f(u) = a.

5.3.2 Basisaustauschsätze Die folgenden zwei Lemmata sind von Ihren Aussagen nur scheinbar rein technische Hilfssätze. Das Lemma 5.43 zeigt insbesondere, dass ... ... es Sinn ergibt von „n-dimensionalen" Vektorräumen zu sprechen. f. ... in einem n-dimensionalen Vektorraum eine Menge von linear

unabhängigen Vektoren höchstens n Elemente haben kann. Insgesamt beweist Lemma 5.43 den Satz 5.35. vk eine Basis eine K-Vektorraumes V. Sei z = LEMMA 5.42. Sei vi, 0 ist. Dann ist auch + ...+pkvk eine Linearkombination wobei vi .. • , V3-17 z, V3+1 7 • . • 7 yr, eine Basis von V. Beweis. Wir zeigen, dass vi ,

, v3-1, z, v3+1,

, 14, eine Basis von V ist.

Angenommen, die Vektoren vi • , v3-1, z, V3+17 • • • 7 vk sind linear abhängig. Es gibt demnach Zahlen A1, , Ak E K, nicht alle Ai = 0 für i E {1, , k}, so dass gilt Ä,

+Exivi = 0.

271

A

1. DIE DIMENSION

Setzt man für z die Linearkombination der Vektoren v1, , vk ein und erhält Ai • E

i=i

+ E Aivi =

+ E(A,,a + Ai)vi = 0. (5.4) i=1

i=1 jOi

jOi

Da die Vektoren vi , vk linear unabhängig sind, sind in (5.4) alle Koeffizienten gleich 0. Also gilt insbesondere A31i = 0. Wir haben vorausgesetzt, dass it, 0 und somit A, = 0 ist. Die Gleichung (5.4) wird dann zu 0 V j + E Ai vi = 0

und damit a2 = . . = Ak = 0, da die Vektoren vi, vk linear unabhängig sind - ein Widerspruch. Demnach sind die Vektoren v,_1, z, v3+1, , vk linear unabhängig. vi, B2. Da z = Ei /..t,v, mit pi # 1 können wir diese Gleichung nach v, umformen und erhalten 1 vj = — Pj

•

Z+

(5.5)

(— ) •

i=i jOi

Sei nun w E V beliebig. Weil v1, , vk eine Basis und somit nach B2 ein Erzeugendensystem von V ist, gibt es Skalare At , , Ak E K mit

w=E A v •e .

(5.6)

Setzen wir (5.5) in (5.6) ein, erhalten wir w = Aj z Nj

E (Ai

vi.

i=1\

Es gilt also w E snan(vi, , vi _ i , v3+1, vk ). Da w beliebig aus V gewählt war, gilt V C span(vi, , v3 _1, v3+1, vk ) und somit gilt span(vi, , v3 _1, v3+1, vk ) = V, was zu zeigen war.

•

272

DIE DIMENSION

A

Wir können nun den Basisaustauschsatz von Steinitz beweisen. (Basisaustauschsatz von Steinitz). Es seien wi, , wk linear unabhängige Vektoren und vi, , v. eine Basis eines K-Vektorraums V. Dann gilt k < n und es gibt n - k paarweise verschiedene Vektoren VO, so dass wi, . • • ,W1c,iik+1, • • • , vn eine Basis •• • , vn E von V ist. LEMMA 5.43

Beweis. Wir führen eine Induktion über k, beginnend bei k = 1. Induktionsverankerung: Es sei wi linear unabhängig, also insbesondere wi 0 0. Der Vektor wi lässt sich darstellen als wi = Ein /22,v2, mit 111, , µn E K. Da wi * 0 und die Vektoren vi, , vn lineare unabhängig sind, ist mindestens ein Koeffizient 0 0. Nach Lemma 5.42 ist dann vi , .. • , v3 -1, wi, v3 +1, • • • vri eine Basis. Induktionsannahme: Die Aussage gelte für ein k mit 1 < k < n - 1. Induktionsschluss: Es seien wi, ••• wk, wk+1 linear unabhängig. Dann sind auch wi, , wk linear unabhängig. Nach Induktionsannahme gibt es k + 1 Basisvektoren Uk.+.1, , V)n aus vi, , v., so dass W1 7

• • •

Wk, ik+1, • • • ,

eine Basis von V ist. Insbesondere lässt sich der Vektor wk+i, da er ein Vektor aus V ist, als Linearkombination dieser Basis darstellen mit Wk+1 =

n k Emiwk + Ep,i_:i. i i-1 =k-I-1

mit ii,., ... , m,,, E K.

Da die Vektoren wi, • • • , wk+1 linear unabhängig sind, lässt sich wk+1 , wk schreinicht als Linearkombination nur der restlichen Vektoren wi , ben. Also gibt es (mindestens) ein j E {k + 1, . . , n} mit p.j 0 0. Vertauscht man die Nummerierung der Vektoren ijk+i, iin so, dass p•k+i # 0 gilt, ist nach Lemma 5.42 wi, wk, wk+i, ijk+2 , Un eine Basis von V. Es bleibt zu zeigen, dass k < n. Wir nehmen an, dass wi , , wk linear unabhängige Vektoren mit k > n sind. Dann ist die Menge der ersten n Vektoren uh., , wn linear unabhängig und nach der Aussage des Satzes lassen sich dies um n - n = 0 Vektoren aus der Basis zu einer Basis ergänzen. Das heißt die Vektoren wi, wT, bilden eine Basis des V. Damit lässt sich aber jeder Vektor aus V, insbesondere auch Vektor w.+1, als Linearkombination der Vektoren w1, w. schreiben. Ein Widerspruch

273

k BASIS - EINE FRAGE DER EXISTENZ

zur linearen Unabhängigkeit der Vektoren wi ,

wk •

■

BEMERKUNG 5.44. Der Basisaustauschsatz von Steinitz gilt auch für Vektorräume unendlicher Dimension, deren Basen also unendlich viele Elemente beinhalten. Weil der Fokus diese Buchs nicht auf diesen Vektorräumen liegt, haben wir uns für eine bessere Darstellbarkeit auf endlich dimensionale Vektorräume beschränkt. ■ BEMERKUNG 5.45.

Lemma 5.43 beweist also ...

•

für 1 W eine lineare Abbildung. Zeigen oder widerlegen Sie die beiden folgenden Aussagen. WI'

i. Das Bild einer linear unabhängigen Teilmenge von V unter f ist eine linear unabhängige Teilmenge in W. ii. Das Bild einer linear abhängigen Teilmenge von V unter f ist eine linear abhängige Teilmenge

278

DIE BASIS.

A 5.18 Welche der folgenden Aussagen ist korrekt? i. Jedes Erzeugendensystem eines Vektorraums hat die gleiche Größe. ii. Ein Erzeugendensystem eines Vektorraums heißt minimal, wenn es weniger als halb so viele Elemente enthält wie der Vektorraum selbst. iii. Eine Basis eines Vektorraums ist ein linear unabhängiges Erzeugendensystem des Vektorraums. iv. Die Menge der n-dimensionalen Standardeinheitsvektoren bilden eine Basis des Kn . v. Jede maximal linear unabhängige Menge eines

AUFGABEN

A

wir 5.24 Zeigen Sie, dass die Polynome 1, x, x2 eine Vektorraums ist eine Basis des Vektorraums. Basis des R[x]2 bilden. vi. Jeder Vektorraum besitzt eine Basis. vii. Jeder Vektorraum besitzt (mit nur zwei Ausnahmen) mehr als eine Basis. viii. Zwei unterschiedliche Basen desselben Vektor- DIE DIMENSION. raums haben stets gleich viele Elemente. A 5.25 Welche der folgenden Aussagen ist korrekt? 4 5.19 Zeigen Sie, dass die Vektoren aus Aufgabe 5.2 i. Es gibt einen 3-dimensionalen Vektorraum mit eine Basis des R2 bilden. einer Basis, die nur zwei Elemente enthält. #.1' 5.20 Zeigen Sie, dass die Vektoren aus Aufgabe 5.5 ii. Alle n-dimensionalen K-Vektorräume sind isoeine Basis des in bilden. morph. S. 5.21 Bilden die Vektoren 1) 1) 2 = (2 und v3 = (5 vl = (3) , 6 3 4 eine Basis des IR3? wri" 5.22 Für welche a E R bilden die Vektoren , V2 = Cal) Vi = (—a1)— a

o) und v3 = (—a 1

eine Basis des R3. wri' 5.23 Bilden die Vektoren vi und v2 aus Aufgabe 5.11 eine Basis des IR3?

',mir 5.26 Finden sie für jeden der beiden Vektoren aus Aufgabe 5.5 einen Vektor des Fg, so dass nach dem Austausch dieser beiden Vektoren immer noch eine Basis vorliegt. WI' 5.27 Welche Dimension hat der R[x]2? Vielleicht hilft Ihnen Aufgaben 5.24?

WI' 5.28 Bestimmen Sie die Dimension des von den Vektoren 3) und b3 = (39 bl = (3) b2 = 12 1) des R3 aufgespannten Vektorraums.

279

k AUFGABEN

280

6

Matrizen

In diesem Kapitel lernen wir Matrizen kennen. Den meisten sind sie sicherlich aus der Schulmathematik für kleine Größen bekannt. Wir werden Matrizen als Abbildungen ähnlich den Spaltenvektoren kennen lernen. Man kann sie sich aber auch gut als ein Tabellenschema mit Einträgen aus einer festgelegen Menge vorstellen. Da Matrizen im Studium von linearen Abbildungen eine wesentliche Rolle spielen werden, widmen wir ihnen ein ganzes Kapitel. Mit Matrizen, deren Einträge aus einem Vektorraum sind, kann man rechnen, weil man mit den Einträgen rechnen kann. Nachdem wir Matrizen eingeführt haben, werden wir uns ausführlich die verschiedenen Rechenoperationen mit Matrizen anschauen. In einem letzten Abschnitt lernen wir dann noch wichtige Matrizen, wie Einheitsmatrizen, inverse, diagonale und symmetrische Matrizen kennen.

6.1 Die Matrix

Wir beginnen direkt mit der Definition von Matrizen. DEFINITION 61. Sei S eine beliebige Menge und n, m E N. Einem x nMatrix A ist eine Abbildung A : {1,

,

x {1,

,

S,

(i, j) 1—> Aii.

Die Menge aller m x n-Matrizen bezeichnen wir mit Snx n. Wir schreiben eine Matrix in der Form A1,3 • • • A23 • • • A3,3 • • .

A1,n A2,n A3,n

Am 1 Anr2 Arn3 • • 1

Arn,n

A1,2 A2,2 A3,2

nennen die 1 x n-Matrix A(i) = (An, , Azn ) die i-te Zeile von A und

k DIE MATRIX

(Ali : die j-te Spalte von A. Die Am, einzelnen Zahlen Aii heißen die Einträge von A. Falls m = n, nennen wir M eine quadratische Matrix. entsprechend die m x 1-Matrix A(i) =

Wir bezeichnen die Menge der Einträge Aii mit i E min{ m, n} als die Diagonale der Matrix A. BEMERKUNG 6.2. Eine Matrix A E x" ist grob gesagt eine Tabelle von rn mal n Zahlen, die in einem rechteckigen Schema von m Zeilen und n Spalten angeordnet sind, dessen Felder Elemente aus der Menge S enthalten, leere Felder sind nicht zulässig Man spricht „In x n-Matrix" als „m Kreuz n Matrix".

sage, # Matrix Alternative I sage: A = Matrix(([1,2,3],[3,2,1]]) sage: A [1 2 3] [3 2 1] sage: # Matrix Alternative II sage: M = MatrixSpace(QQ,2,3) sage: A — M([1,2,3,3,2,1]) sage: A [1 2 3] [3 2 1]

In A E Rin' steht die erste Variable rn für die Anzahl der Zeilen, die zweite Variable n für die Anzahl der Spalten der Matrix. Als Eselsbrücke dient: Beim Lesen von links nach rechts stößt man von rechts gegen die Matrix und nimmt zunächst die Anzahl der Zeilen wahr, bevor man beim Weiterlesen die Anzahl der Spalten erkennt. Matrizen sind ein Schlüsselkonzept der linearen Algebra und tauchen in fast allen Gebieten der Mathematik auf. Dabei stellen sie Zusammenhänge, in denen Linearkombinationen eine Rolle spielen, übersichtlich dar und werden insbesondere benutzt, um lineare Abbildungen darzustellen. ■ BEISPIEL 6.3. Wir betrachten eine 2 x 3-Matrix über R, also einen Matrix aus der Menge R2 x3. Es ist

A

= (1 2 3) 456

eine solche Matrix mit den Einträgen A1,1 = 1, A1,2 = 2, A1,3 = 3, A2,1 = 4 , A2,2=5, A2,3=6,

den Zeilen 21(1) = (1,2,3),

A(2) = (4,5,6)

und Spalten A(1)

= (4), A(2) = (52) , A(3) = (36) ■

Matrizen sind sehr nützliche Hilfsmittel in einer Vielzahl von Anwendungen. Sie eignen sich als Kurzschreibweise für größere Mengen von Daten. Die wahrscheinlich wichtigste solcher Anwendungen sind lineare Gleichungssyteme. BEMERKUNG

282

6.4. Vergleicht man die Definition von Spaltenvektoren, dann stellt

RECHNEN MIT MATRIZEN ÜBER ALGEBRAISCHEN STRUKTUREN iC

man fest, dass ein n-dimensionaler Spaltenvektor eine n x 1-Matrix ist.

■

6.2 Rechnen mit Matrizen über algebraischen Strukturen

Ist die der Matrix zugrundeliegende Menge S eine algebraische Struktur, also können wir mit den Einträgen der Matrix rechnen, so können wir das auch mit der Matrix selbst.

6.2.1 Addition von Matrizen

Matrizen mit gleichen Dimensionen lassen sich addieren. Die Addition funktioniert komponentenweise. DEFINITION 6.5. Es sei S eine Gruppe mit additiver Verknüpfung und seien A, B e S""°. Die Matrix C = A + B ist die Matrix mit den Einträgen Cii = Air + BEMERKUNG 6.6. Die Einträge der Summenmatrix C entspricht also der Matrix,

deren Einträge den Summen der Einträge der Summandenmatrizen A und B entspricht. Es ist deshalb wichtig darauf hinzuweisen, dass nur Matrizen gleicher Größe miteinander addiert werden können. Die Summe (1 2 3 4 5 6)

(7 8) 9 10

■

ist nicht definiert. BEISPIEL

6.7. Wir betrachten zwei Matrizen A, B E IR 2 x 3 . A=

(1 2 3) 456

und

B=

io 11 12

sage: # Matrix Rechnen — Addition sage: A = Matrix([[0,6],[2, 8],[4,10]]) sage: B = Matrix([[1,7],[3, 9],[5,11])) sage: C = A + B sage: C [1 13) [5 17] [9 21]

und erhalten aufgrund der einträgeweisen Addition jeweils Cii = Aij Bii, also = 1 + 7 =8, C1,2 = 2 + 8 =10, C2,1 = 4 + 10 = 14, C2,2 = 5 + 11 = 16,

C1,1

C1,3 = 3 + 9 =12, C2,3 = 6 + 12 = 18

und die Summenmatrix C=A+B

/ 8 10 12 1 .

14 16 18) ■

283

S. RECHNEN MIT MATRIZEN ÜBER ALGEBRAISCHEN STRUKTUREN

6.2.2 Multiplikation von Matrizen mit Skalaren

Die Multiplikation einer Matrix A mit einem Skalar A E 11 funktioniert genauso wie bei Vektoren. Man multipliziert jeden Eintrag von A mit A. DEFINITION 6.8. Es sei S ein Vektorraum über einem beliebigen Körper K. Ist A E Sm" und A E K, dann ist B=A•A=A•A die Matrix mit den Einträgen Big = A •

sage: 8 Matrix Rechnen Multiplikation age: A = Matrix([[1,2,3], [4,5,6]]] sage: 5 (, A [ 5 10 15] [20 25 30]

BEMERKUNG 6.9. Die Multiplikation einer Matrix mit einem Skalar ist für alle Matrizen über einem Vektorraum definiert. Tatsächlich werden wir uns in der Regel für Matrizen interessieren, deren Einträge Körperelemente, also S ein Körper ist. Jeder Körper ist ein Vektorraum, die Definition hält also auch für diesen speziellen Fall. •

BEISPIEL 6.10. Wir betrachten die Matrix A E

A

_

2 >(3 über dem Vektorraum R mit

(1 2 3) 456

und das Skalar A = 3. Wir erhalten aufgrund der einträgeweisen Multiplikation mit dem Skalar jeweils A• also B1,1 = 3 • 1 = 3, B1,2 = 3 • 2 = 6, = 12, B2,2 = 3 • 5 = 15,

B1,3 = 3 •

B2 ,1 = 3 • 4

B2,3

3 = 9, = 3 • 6 = 18

und die Matrix B= A • A=

2 14 16

10'

• Bei der Multiplikation einer Matrix mit einem Skalar müssen wir uns keine Gedanken um passende Zeilen- und Spaltenanzahl machen. Diese Multiplikation ist immer definiert. Es gelten die folgenden Rechenregeln. LEMMA 6.11. Sei S ein Vektorraum über dem Körper K. Dann gelten Ma. A+B=B+A VA, B E Sm" (Kommutativg.) MAa. (A + B) + C = A + (B + C) VA, B,CESmxn (Assoz. d. Add.) MAb. (A • p) • A = A • (p • A) VA, p E K, A E Sm"(Assoz. d. Mult.) MDa. (A + p)•A=A•A-1-µ•S VA, p, E K, A E Sm" (Distrib. I) MDb. A • (A + B) = A • A + A • B VA E K, A, B E Sm" (Distrib. II)

Beweis. Folgt aus der Definition und den Rechenregeln für Vektorräume, da die Matrixaddition und die Multiplikation einer Matrix mit einem Skalar einträgeweise definiert sind. •

284

RECHNEN MIT MATRIZEN ÜBER ALGEBRAISCHEN STRUKTUREN

PROPOSITION

6.12. Sei IK ein beliebiger Körper und n, m

E

N+. Es

bildet IK'm mit der Addition von Matrizen und der Multiplikation von Matrizen mit einem Skalar einen Vektorraum. Beweis. Mithilfe von Lemma 6.11 lassen sich die Vektorraumaxiome leicht

■

nachrechnen.

6.2.3 Multiplikation von Matrizen mit Spaltenvektoren

Die Multiplikation einer Matrix mit einem Spaltenvektor ist „fast" einträgeweise definiert. Eine Matrix A E Km" hat allerdings im Allgemeinen viel mehr Einträge als ein Spaltenvektor aus dem Kn. Deshalb werden die Einträge des Spaltenvektors mehrfach verwendet und mit Einträgen aus der Matrix verrechnet. Das geschieht zeilenweise. DEFINITION 6.13. Sei A E Km "und v E Kn . Dann ist w = A • v der Vektor mit Einträgen w, = Enk— i Ai,k2)k für i E {1, ... m}, also A11 A21

Al2 ' • • A22 • • •

Aln A2n .

w=

V1 V2 . . • vy,

1

A11v1 + Al2 . v2 + • • • + Ai r,V,., A21 V1 + A22 • V2 + • • • + A2ntM . •

\ Am i vi + An/2 • v2 + • • ' + AmnVn (7 Arnn Amt Am2 ' ''

BEMERKUNG 6.14. Die Anzahl der Spalten der Matrix A muss der Anzahl der Zeilen des Vektors v entsprechen, damit dass Matrix-Vektor-Produkt A • v überhaupt definiert ist. Das Produkt A • v mit A E Kmxn und v E Kri ist ein Spaltenvektor ■ aus dem Km . BEISPIEL 6.15. Wir

betrachten die Matrix A E R2 x 3 und den Spaltenvektor

v E R3 mit A=

(1 2 3)

45 6

und

sage: # Matrix Rechnen Matrix-Vektor-Multiplikation sage: A = Matrix([[9,7,5],[8,6,4]1) sage: v = vector([1,2,3]) sage: A * v (38,32)

( im v = io .

Wir erhalten die Einträge des Produktvektors w = A • v mittels w = EZ=1Ai,kVk, also wi = 1 • 100 + 2 • 10 + 3 •1 = 123 W2 = 4 • 100 + 5 • 10 + 6 • 1 =456

und den Vektor W

aus dem R2 .

123

= A • v = (456) ■

285

N. RECHNEN MIT MATRIZEN OBER ALGEBRAISCHEN STRUKTUREN

Interpretation der Multiplikation von Matrizen mit Spaltenvektoren

Die Multiplikation einer Matrix A mit einem Vektor v lässt sich auf zwei Weisen begreifen. Die erste Interpretation verstehen wir schon und ist eine für die weitere Studie von Vektorräumen sehr nützliche Beobachtung. LEMMA 6.16. Das Produkt einer Matrix A E 1lC2 und einem Vektor v E Kn ist eine Linearkombination der Spalten von A, deren Koeffizienten den Komponenten von v entsprechen. Es ist also A•v=

E

vi • A(').

i=i

Betrachtet man das Produkt A • v und formt leicht um, so erhält

Beweis.

man mit A11v1 + Al2 • v2 + • • • + A lr,vn A21v1 + A22 • V2 + • • • + A2,,Vn

A•v= (

AmiV1

Am2 • V2 + • • • + AmnVn Al2

All ( A21)

+ v2

(

( A22) +

vn,

= Ami =

V

• A (1) +

ArrIn

Amt

V2

'V, • A( n)

• A(2)

die gewünschte Darstellung.

•

BEISPIEL 6.17. Wir betrachten, wie schon in Beispiel 6.15, die Matrix A E 1R2 x3 und den Spaltenvektor v E R3 mit A

=

(1 2 ) 456

und

loo

v = io) .

Die Spalten von A entsprechen A(1)

= (41) ,

A(2) — (2) — 5 '

A(3) = (36) .

Wir berechnen die Linearkombination 3

Evi • A(i) = 100 • 0) + 10 • 0) + 100 • (36) i=1

welche tatsächlich dem Produkt A • v entspricht.

(123 456)

■

Die zweite Interpretation werden wir erst im Verlauf der weiteren Studien verstehen, an dieser Stelle ist sie jedoch richtig platziert. Um die Einträge des Produktvektors A • v zu erhalten, berechnet man das Skalar-

286

RECHNEN MIT MATRIZEN ÜBER ALGEBRAISCHEN STRUKTUREN

produkt (nicht die Multiplikation mit Skalaren) der i-ten Zeile von A (als Spaltenvektor interpretiert) mit v. LEMMA 6.18. Das Produkt einer Matrix A E Krnxn und einem Vektor v e Kn ist ein Vektor w E Km, dessen Komponenten dem Skalarprodukt der transponierten Zeilenvektoren von A mit dem Vektor v entsprechen. Es ist also

wi = ( ATi) v Beweis. Betrachtet man die Definition des Produkts A • v und des Skalarprodukts, stellt man fest, dass die Einträge des Produktvektors A • v ■ genau den beschriebenen Skalarprodukten entspricht.

6.2.4 Multiplikation von Matrizen mit Matrizen

Hat man die Multiplikation einer Matrix mit Spaltenvektoren definiert, lässt sich die Multiplikation von Matrizen mit Matrizen leicht beschreiben. Dazu fasst man die zweite Matrix im Produkt A • B als Sammlung von Spaltenvektoren auf, die je einzeln in einer Multiplikation einer Matrix mit einem Vektor (wie schon definiert) mit der Matrix A multipliziert werden. Die entsprechenden Produktvektoren sammelt man als Spalten der Produktmatrix C = A • B. Dabei muss man natürlich äußerste Vorsicht bei der Wahl der Größen der Matrizen walten lassen, damit die entsprechenden Multiplikationen von Matrizen mit Spaltenvektoren auch definiert sind. und B E Km" gegeben. Dann ist DEFI NITION 6.19. Seien A E die Matrix C = A • B gegeben durch die Matrix C, deren Spaltenvektoren den Produkten C(') = A • B(') mit i E {1, , n} entsprechen.

ex-

BEMERKUNG 6.20. Die Produktmatrix C = A • B hat n-viele Spalten der Form C(3 ) = A • B(3 ) E le. Also ist , A • B(n) ) . A • B = (A • B(1) , A • B(2) Das heißt, das Produkt A • B zweier Matrizen A und B kann nur dann gebildet werden, wenn die Spaltenanzahl von A gleich der Zeilenanzahl von B ist. Es ist A • B eine k x n-Matrix. Die Matrix A • B „erbt" von A die Anzahl der Zeilen und • von B die Anzahl der Spalten.

287

A

k

RECHNEN MIT MATRIZEN ÜBER ALGEBRAISCHEN STRUKTUREN

BEISPIEL 6.21. Wir

betrachten zwei Matrizen A E R3 x 2 und B E R2x4 mit 1 2) 5 4) A = (3 4 und B = (73 6 210 56

Wir berechnen also vier Produkte C(l) =

A • B(1) =

1 2 ( 3 4 • 5 6

c(2) =

A • B(2) =

(1 2 1•6+2•2 (10) 3 ) = (3 • 6 + 4 • 2) = 26 5 6 ' 1) . (26 5•6+6•2 42

C(3)

=

A • B(3) =

(1 2 5 3 4 6) • ) (i 5

C(4)

=

A • B(4) =

(1 2 3 64 • S

3 7

1•7+2•3 13 3 • 7 + 4 • 3 = ( 33 = 5 • 7 + 6 • 3 53)

1•5+2•1 = (3 • 5 + 4 • 1) = (19 7) 5 - 5 -I- 6 • 1 31

1•4+2•0 4 0 = 3 • 4 + 4 • 0 = (1.) 5•4+6•0 20

und erhalten die Produktmatrix C = A

. B (c(i),

c(4)) =

7 14 2 (1 33 1 26 9 19 53 42 31 20

Die Rechenregeln für die Multiplikation von Matrizen aus Lemma 6.22 sehen im Prinzip aus, wie Rechnen mit reellen Zahlen. Allerdings gilt für Matrizen das Kommutativgesetz nicht. Selbst wenn die beiden Produkte der folgenden Ungleichung definiert sind, gilt im Allgemeinen A • B B • A. LEMMA 6.22. Sei S ein Vektorraum über dem Körper K. Dann gelten VA E smxn,B E snxk , c e Skxt Ma. (A • B) • B = A • (B • C) Mb. A • (B-I-B')=A•B±A•B' bA E smxn,B,B1 E snxk Mc. (A+A')•B=A•B+A'•B VA, A' e smxn,B G snxk Beweis. Die Beweise der Aussagen gehen letztlich auf die Regeln im Vektorraum S und die Definitionen der Verknüpfungen zurück. ■ KOROLLAR 6.23. Es sei S ein beliebiger 1K Vektorraum. Dann gilt MMa. (A • B) • v = A • (B • v) VA E Sk Beweis. Folgt direkt aus Lemma 6.22

B E Sm ",v E Sn

(Assgstz.) ■

BEISPIEL 6.24. Wir möchten nun an einem Beispiel illustrieren, dass die Multiplikation zweier Matrizen nicht kommutativ ist. Wir wollen also zeigen, dass im Allgemeinen A•B=B•A nicht gilt. Dazu müssen grundsätzlich die Produkte durch die passenden Größen der Matrizen definiert sein. Das ist nur dann der Fall,

288

RECHNEN MIT MATRIZEN ÜBER ALGEBRAISCHEN STRUKTUREN Ä

wenn A und B quadratisch, also A, B E beiden Matrizen A, B E R2 x2 mit A = (13 42)

Kn x n, sind. Betrachte zum Beispiel die

und

3 B = ( 12 4) .

Dann ist (1 3) (1 2) 3 5 11 10 14 A • B = (13 21 3 4 = B • A. 4) (2 4) = (11 25) 7— (14 20) = 2 4 ■

6.2.5 Transposition Zum Schluss lernen wir noch eine praktische Operation kennen, die Transposition von Matrizen. Dabei werden schlicht Spalten und Zeilen einer Matrix vertauscht. DE FINITION 6.25. Es sei S eine beliebige Menge. Es sei A E Smxn eine Matrix. Die zu A transponierte Matrix AT E S' ist die Matrix, mit den Einträgen A = sage: 4 Matrix Rechnen BEMERKUNG 6.26. Anschaulich gesprochen, werden die Einträge der Matrix an Transposition der Diagonalen A11, , A„ mit r = min{ n, n} gespiegelt. Der Eintrag aus Zeile slae, A = Matrix([[1,2,3],[4,5,6]]) i und Spalte j rutscht in Zeile j und Spalte i. Man kann auch sagen, dass die Spalten der Matrix A zu den Zeilen der Matrix A und umgekehrt werden. ■ [1 2 3] [4 5 6]

BEMERKUNG 6.27. Es ist für eine Matrix A E Rrn x n Rn "71 die transponierte Matrix des Produkts B • A das

und eine Matrix B E sage: transpose(A) Produkt der einzelnen [1 4]

transponierten Matrizen in umgekehrter Reihenfolge, also (B • A)T

= AT • BT

[2 5] [3 6]

Es ist für eine invertierbare Matrix A auch die transponierte Matrix invertierbar und es gilt (AT)— 1 = (A-1)T. Die Matrix A-1 ist die zu A inverse Matrix aus Definition 6.32. ■ BEISPIEL 6.28. Aus A E IY 3x2 wird wie folgt eine Matrix AT E R 2x3 17

A= (2 8 39

1 23 A" = (7 8 9) •

Liest man einen Spaltenvektor als eine reelle n x 1-Matrix, so kann man diesen auch transponieren. Zum Beispiel wird aus einem „stehenden" Spaltenvektor v e R3 auf diese Weise ein „liegender Vektor" alias eine 3 x 1-Matrix v= (2 I 3

— (1 2 3). VT —

289

34, SPEZIELLE MATRIZEN

6.3 Spezielle Matrizen

Wir möchten noch einige speziellen Matrizen Namen geben, die im Folgenden häufiger auftauchen werden. Die Menge der quadratischen Matrizen über Vektorräumen besitzt ein neutrales Element bezüglich der MatrixMatrix-Multiplikation. DEFINITION 6.29. Wir nennen die quadratische n x n-Matrix über einem

Körper, deren i-ter Spaltenvektoren dem i-ten Standardeinheitsvektor entspricht Einheitsmatrix der Dimension n, welche wir mit idn bezeichnen. BEISPIEL 6.30. Die Einheitsmatrix in der Dimension 2 ist 10 id2

= o i) • •

Man rechnet leicht nach, dass die Einheitsmatrix sich bezüglich der MatrixMatrix-Multiplikation neutral verhält. LEMMA 6.31. Für jede n x n-Matrix A gilt idn • A = A • idn = A. Ferner gilt idn • v = v für jeden Vektor v E Beweis. Der Beweis ist eine Übungsaufgabe.

•

Mithilfe des neutralen Elements können nun inverse Elemente definiert werden. DEFINITION 6.32. Seien A, B n x n-Matrizen über einem Körper. Wir sagen, dass B zu A invers ist, wenn A • B = B • A = idn. Falls es eine Matrix B gibt, die zu A invers ist, heißt A invertierbar oder regulär, andernfalls heißt A singulär. Wir sparen uns an dieser Stelle ein direktes Beispiel und lernen ein Schema F kennen, mit dessen Hilfe man zum einen entscheiden kann, ob eine 2 x 2Matrix invertierbar ist und zum anderen die inverse Matrix berechnen kann.

290

SPEZIELLE MATRIZEN

SCHEMA F 6.33 (Inverse Matrizen im

berechnen).

b ) des R2 X2 mit ad — cb # 0. Gegeben. Eine Matrix A = (ac d

Schritt 1. Bestimme A-1 =

1

d —c

ad—cb

a)

BEMERKUNG 6.34. Man rechnet leicht nach, dass für eine mittels Schema F 6.33 bestimmte Matrix A-1gilt

A-1•A =

1

1 db

ad — cb

ac b d

(ad — cb

0)

0 ad cb = id 2. ad — cb ■

BEISPIEL 6.35. Wir berechnen die Inverse der Matrix A =

23 4 5

des 12 X 2 mit

2 • 5 — 3 • 4 0 0.

Schritt 1. Bestimme A -1=

1 2•5—3•4

5 —4) = (-2,5 2 1,5 —1 •

( —3 2

Wir prüfen nach A 1• A =

2) (2 3) 1,5 —1 • 4 5

(-2 '5

( —2,5 • 2 +1,5 • 4 —2.5 • 3 -I- 1,5 • 5 ) —1,5.2+ (-1) • 4 —1,5.3+ (-1) • 5

=

1C12. •

DEFINITION 6.36. Für einen Vektor v E 1K" bezeichnen wir mit diag(v) die n x n-Matrix, deren Diagonale gerade dem Vektor v entspricht, während alle anderen Einträge gleich 0 sind. Wir sagen, dass eine m x n-Matrix Diagonalform hat (oder eine Diagonalmatrix ist), wenn kein Einträg außerhalb der Diagonalen ungleich Null ist.

BEISPIEL 6.37. Die Matrix A = (

20 Matrix B = ( 0 5

4 5)des R2 x 2 ist keine Diagonalmatrix. Die 2

des R2x2 ist genauso eine Diagonalmatrix wie die Matrix

C = (0 10 °) des R2X2 und die Einheitsmatrix idn für beliebiges n E N.

(1 Gegeben den Vektor v =

2 3

1o o erhlaten wir die Diagonalmatrix diag(v) =

020. 003

• Man rechnet leicht die folgende Aussage nach.

291

A

N. SPEZIELLE MATRIZEN

LEMMA 6.38. Mir jeden Vektor x E K'gilt v12:12) diag(v) • x = vn., •

Beweis. Der Beweis ist eine Übungsaufgabe. Für quadratische Matrizen benutzen wir auch die Potenzschreibweise. DEFINITION 6.39. Sei A E K""`. Mit Ak für k das Produkt

E

N bezeichnen wir also

Ak = A • A • . . . • A • idr, k Stück BEISPIEL 6.40. Wir berechnen die dritte Potenz der Matrix A =

2 4

35 ) des R2X2.

Es ist A3 —

(2 )32 ( 32 3 4 5 • 4 5) (4 5)

(2 316 (1124 1643 ) ( 31 4 5 • 28 37) — 1484 2237) . •

Abschließend lernen wir noch symmetrische Matrizen kennen. DEFINITION 6.41. Eine n x n-Matrix A heißt symmetrisch, wenn AT = A. BEISPIEL 6.42. Die Matrix A = (24 35 ) des R2 x 2 ist nicht symmetrisch, denn AT = (23 54 ) 0 A.

234 234 Die Matrix B = (3 5 6 des R3x3 ist symmetrisch, denn BT = 3 5 6 467 467

=

B. •

292

AUFGABEN

A

6.4 Aufgaben

WI 6.6 Berechnen Sie EINFÜHRUNG.

A 6.1 Welche der folgenden Aussagen ist korrekt? i. Eine m x n-Matrix ist eine Abbildung, die jeder „Position" in einer Tabelle mit m Zeilen und n Spalten ein Element aus einer zugrundeliegenden Menge S zuordnet. ii. Ein n-dimensionaler Spaltenvektor über einem Körper K ist eine Matrix aus der Menge Kn x 1. iii. Die i-te Spalte einer m x n-Matrix A ist einen , Aim). m x 1-Matrix A(i) = (Ail , iv. Die Einträge einer quadratischen Matrix sind stets Quadratzahlen. w.16.2 Es sei S = {1, 2, 3}. Geben Sie eine Matrix aus der Menge S3 X4 an. vet' 6.3 Addieren Sie die Elemente auf der Diagonalen Ihrer Matrix aus Aufgabe 6.2. WI 6.4 Geben Sie die Spalten und die Zeilen Ihrer Matrix aus Aufgabe 6.2 an.

RECHNEN MIT MATRIZEN.

A 6.5 Welche der folgenden Aussagen ist korrekt?

i.

(1 2 1 -1 1 0

•

112 102 (

(11 1) (2 3 0 2 5 -1) • 12 2) T 1i1. ( 1 -1 1 0 2 3 iv. ) (175 -91) — (1 12

v. Sei a --

2 (3 7

Berechnen Sie diag(a) • (-1) 4

A= Sage-Codes des Hilfe "el 6.7 Mit random_matrix (ZZ, 4, 3) können Sie sich eine zufällige 4 x 3-Matrix mit Einträgen aus Z ausgeben lassen. Allgemein können Sie für zwei natürliche Zahlen n, m E N Mit A = random_matrix (ZZ, m, n) eine zufällige m x n-Matrix über Z ausgeben lassen. i. Lassen Sie sich eine 4 x 3-Matrix A und eine 3 x 4-Matrix ausgeben B und berechnen Sie A • B und B • A per Hand. ii. Lassen Sie sich zwei 4 x 3-Matrizen ausgeben und addieren Sie diese per Hand. iii. Lassen Sie sich eine 4 x 3-Matrix A ausgeben und multiplizieren Sie diese mit dem Vektor a aus Teilaufgabe v. von Aufgabe 6.6 per Hand. iv. Lassen Sie sich eine 4 x 3-Matrix ausgeben und multiplizieren Sie diese mit A = 3 per Hand. v. Lassen Sie sich eine 4 x 3-Matrix ausgeben und transponieren Sie diese per Hand.

i. Die Addition von Matrizen ist einträgeweise definiert. ii. Die Multiplikation einer Matrix über einem Vektorraum mit einem Skalar ist nicht einträgeweise definiert. iii. Man kann nur Matrizen gleicher Größe miteinÜberprüfen Sie Ihre handschriftlichen Rechnungen mit ander multiplizieren. iv. Man kann einen n-dimensionalen Spaltenvektor Hilfe von Sage. nur dann von rechts mit einer Matrix multipliwrir 6.8 Gegeben sei die Matrix A zieren, wenn die Matrix n Spalten besitzt, die A= (1 Anzahl der Zeilen der Matrix ist dabei unwichö). tig. v. Man kann die beiden Matrizen A und B nur Zeigen Sie mithilfe von vollständiger Induktion, dass dann addieren, also A + B berechnen, wenn A A' = (a"+1 a") ist für alle n > 1, wobei an genauso viele Spalten besitzt, wie B Zeilen. an a n _1 vi. Die Multiplikation zweier quadratischer Matri- durch ao = 0, al = 1 und an+i = an+an_1 definiert zen ist kommutativ.

293

S. AUFGABEN

ist. Man nennt die Folge an auch die Fibonacci-Folge.

keit einer Matrix A können Sie die Funktion A. s_invert ible () verwenden oder Sie benutzen

Schreiben Sie mithilfe von Sage ein Programm, wel- das Invertierbarkeitskriterium für 2 x 2-Matrizen, nämches a2. für n > 1 mit n Matrixmultiplikationen be- lich rechnet. A invertierbar < > A1,1 • A2,2 — A1,2 • A2,1 0 0. Hinweis: A2 = A • A, A4 = A2 • A2, A8 = A4 . A4, wie in Schema F 6.34 angedeutet.

SPEZIELLE MATRIZEN.

A 6.9 Welche der folgenden Aussagen ist korrekt? i. Die Matrix, dessen i-ter Spaltenvektor dem i-ten n-dimensionalen Standardeinheitsvektor entspricht, bezeichnen wir mit id,. ii. Diese Matrix wird auch als die Einheitenmatrix bezeichnet. iii. Die Eigenschaften invertierbar und regulär bedeuten für eine quadratische Matrix dasselbe. iv. Ein quadratische Matrix, die nicht regulär ist, ist entweder invertierbar oder singulär. v. Eine symmetrische Matrix ist immer quadratisch. MA' 6.10 Invertieren Sie die Matrix A = (12—3) 7 des R2 x 2 mit Hilfe von Schema F 6.33. 41' 6.11 Invertieren Sie die Matrix A = (21 — 4 ) des R2 x 2 mit Hilfe von Schema F 6.33. w l` 6.12 Berechnen Sie für die Matrix A aus Aufgabe 6.11 die dritte Potenz A3. wrir 6.13 Seien A, B, C E R2 x 2 Matrizen, welche Ziffern als Einträge haben, also A, j , .13,0

E {0, 1, 2, 3, 4, 5, 6, 7, 8,9}

für alle i, j E {1, 2}. Es gibt 104 unterschiedliche Matrizen dieser Form und demnach 1012 mögliche Dreiertupel (A, B, C) insgesamt. Für wie viele dieser 1012 Dreiertupel ist das Produkt A•B•C invertierbar? Zum Überprüfen der Invertierbar-

294

Hinweis: Versuchen sie nicht alle 1012 Möglichkeiten durchzuprobieren. Das Produkt von Matrizen ist invertierbar, wenn die einzelnen Matrizen invertierbar sind. wrir 6.14 Zeigen oder widerlege Sie die Aussage, dass eine symmetrische Matrix immer invertierbar ist. 's4 6.15 Zeigen Sie, dass das Produkt zweier invertierbarer Matrizen wieder invertierbar ist. wir 6.16 Zeigen Sie, dass das Produkt zweier symmetrischer Matrizen wieder symmetrisch ist. orAr 6.17 Beweisen Sie Lemma 6.31. Zeigen Sie also, dass für jeden x n-Matrix A gilt id„ • A = A • id„ = A. Zeigen Sie außerdem, dass für jeden Vektor v E 1Rn gilt id„ • v = v . 0. 16.18

Beweisen Sie Lemma 6.38. Zeigen Sie also, dass für jeden Vektor x E Kn gilt

diag(v) • x =

*el' 6.19 Es sei A E R2 x 2. Zeigen Sie, dass genau dann AT • A = A AT gilt, wenn entweder A=(

a b) —b a

mit a, b E R oder A= (ab

b

a •

mit a, b, c E R gilt. Hinweis: Nutzen Sie, dass x2 = y2 < > (x = y V x = —y) z•x=z•y(x=y V z=0).

7 Matrizen & lineare Abbildungen Wir haben das vorherige Kapitel 6 mit dem Versprechen begonnen, lineare Abbildungen zwischen IK-Vektorräumen V und V' mithilfe von Matrizen beschreiben zu können. Lineare Abbildungen bilden jeden Vektor aus dem Vektorraum V auf einen Vektor im Vektorraum V' ab. Wir haben gesehen, dass jeder 1K Vektorraum endlicher Dimension isomorph zu einem Kn ist. Wir beschränken uns deshalb auf Abbildungen zwischen Vektorräumen V C Kn und V' C Km. Wir erinnern zunächst, was die uns geläufige Schreibweise von Spaltenvektoren des Kn letztlich bedeutet.

7.1 Darstellungsmatrix zur Standardbasis Wir haben einen Spaltenvektoren v des Vektorraums Kn als eine Abbildung der natürlichen Zahlen 1, 2, ... , n in die Menge K definiert. Wählt man die Standardbasis des Kn, steckt in den Komponenten eines Spaltenvektors noch zusätzliche Information. Die Komponenten von v entsprechen den Koeffizienten der eindeutigen Darstellung von v als Linearkombination der Standardeinheitsvektoren in der Standardbasis. Das heißt, es lässt sich v schreiben als 0\ 1

0

0

v = Evie(i) = vi • i=1

° 0 0

+ v2 •

° +.. + v. • 0

0 1/

Das nutzen wir nun beim Studium linearer Abbildungen aus. DEFINITION 7.1. Sei f : 11(n —› Km eine lineare Abbildung. Wir nennen die m x n-Matrix M(f), deren Spalten den Bildern der Standardeinheitsvektoren des Kn unter der Abbildung f entsprechen, die Darstellungs-

S4, DARSTELLUNGSMATRIX ZUR STANDARDBASIS

matrix (oder darstellende Matrix) von m(f)(1) = f (e(1) ) M (f)(2) = f

f . Es ist also

(e(2)) •

M(f)(") =

f (e(n) ) •

Mithilfe dieser Darstellungsmatrix lässt sich die lineare Abbildung f nun als Multiplikation einer Matrix mit einem Spaltenvektor darstellen. LEMMA 7.2.

Sei f : Kn -÷ Km eine lineare Abbildung. Dann gelten

Da Für alle v E Kn ist f (v) = M(f) • v. Db Es gibt genau eine Matrix A E Km" mit f (v) = A • v für alle vE

Kn.

Beweis. Wir zeigen die beiden Aussagen.

Da Sei v E Kn beliebig gewählt. Dann ist v von der Form v = (vj und es gilt v =

V, (i) .

f (v) = f CEvie(1

i=i

(L1)

Da f eine lineare Abbildung ist, gilt

E i=i

e(i)) (L-2) E vi . f (e(i)) .

Die Spalten von M(f) entsprechen genau den Bildern der Standardeinheitsvektoren f . Da die Multiplikation einer Matrix mit einem Vektor nach Lemma 6.16 der Linearkombination der Spaltenvektoren der Matrix mit den Komponenten des Vektors als Koeffizienten entspricht, gilt M(f) • v = f (v). Db Sei A E K" mit f (v) = A • v für alle v E Kn. Dann ist die i-te Spalte von A nach nach Lemma 6.16 genau Abi) = A • e(i). Nach Voraussetzung ist A • e(i) = f (e(i) ). Also ist A = M(f).

Wir haben schon gezeigt, dass man jede lineare Abbildung des Kn in den Km mithilfe einer Darstellungsmatrix passender Größe des Km" repräsentieren kann. Das folgende Lemma zeigt die Rückrichtung. Jede in x n-Matrix repräsentiert eine lineare Abbildung. LEMMA 7.3. Sei A E Km". Dann gibt es eine lineare Abbildung f : Kn. —> Km mit M(f) = A.

Beweis. Es ist zu zeigen, dass die Abbildung f : K"

eine lineare Abbildung ist.

296

Km mit f (v) = A • v

DARSTELLUNGSMATRIX ZUR STANDARDBASIS

A

Ll. Seien v, w E NV beliebig gewählt. Nach Mb aus Lemma 6.22 gilt

A • (v + w) = A • v + A • w. Also gilt f (v + = A • (v + w)=A•v+A•w=f(v)±f(w) L2. Seien v E K" und A E K beliebig gewählt. Es gilt nach der Definition

6.8 A • A = A • A. Also gilt f(A•v)=A•A•v=A•A•v=A•f(v).

• Das Lemma 7.3 rechtfertigt die folgende Definition.

DEFINITION 7.4. Sei A E Km". Dann bezeichnen wir die durch A dargestellte linear Abbildung mit fA : K" -+ Km, wobei IA (v) = A • v.

Eine lineare Abbildung f kann also immer als Multiplikation mit der Matrix M(f) dargestellt werden. Umgekehrt stellt unsere Definition der Multiplikation einer Matrix mit einem Vektor sicher, dass für jede m x re—> Km, v A • v linear ist. Matrix A die Abbildung f : Die Bilder aller Vektoren des 110 sind durch die Bilder der Standardeinheitsvektoren, welche in der Standardbasis gesammelt sind, eindeutig vorgegeben. Die lineare Abbildung ist eindeutig festgelegt, sind erst einmal die Bilder der Basisvektoren fixiert. BE ISPIEL 7.5. Alle linearen Abbildung von R nach 11 sind von der Form f a (x) = a • x. Fassen wir die reellen Zahlen als Vektorraum auf, wird dieser von dem einzigen und in diesem Fall eindimensionalen Einheitsvektor (1) aufgespannt. Das Bild dieses Vektor ist f ((1)) = (a) und die Darstellungsmatrix ist also die 1 x 1Matrix M ( f a ) = (a). Sowohl die Vektoren als auch die Matrizen sind in diesem Fall einfach reelle Zahlen. ■ BEISPIEL 7.6. Wir wählen konkret die Abbildung f : IR2 -+ R2, die durch die folgenden Bilder der Einheitsvektoren des R2 bestimmt ist. Es seien

und

f

= —D•

Dann ist die Darstellungsmatrix von f gleich 1 -0 5 M(f) = (-0, 5 ' 1). Um zu verdeutlichen, was geometrisch bei dieser linearen Abbildung geschieht, 2 a2 = betrachten wir das Dreieck, dessen Ecken die Stützvektoren a l = (2 2

()

297

DARSTELLUNGSMATRIX ZUR STANDARDBASIS

und a3 = (2) haben, wird abgebildet auf f (al) = M(f) • al = f (a2)

= M(f)

•

a2 =

( 1 -0,5

-0'51

—0,1.3

0,5 i.

1

f (a3) = M(f) • a3 = ( _0,5

•

-0,51 ) • •

Siehe Abbildung 7.1 für eine Illustration.

Wir halten noch einige Rechenregeln für Abbildungen und Darstellungsmatrizen fest, studieren die Verträglichkeit der Verknüpfung von linearen Abbildungen, den Verknüpfungen auf Matrizen und jeweils die Verknüpfungen mit Skalaren.

.2

PROPOSITION 7.7. Es gelten DLa. M(f g) = M(f) M(g) DLb. M(A • f) = A • M(f) DLc. M(g o f) = M(g) • M(f).

VA E

V f, g : 11(n Km f : Kn —*Km V f, g : Kn -+ Km

.1Beweis. Der Beweis der Aussagen ist eine Übungsaufgabe.

•

Wir zeigen nun, dass die Invertierbarkeit von Matrizen und die Invertierbarkeit von linearen Abbildungen sich bezüglich Darstellungsmatrizen Das Urbild und das Bild eines Dreiecks unter einer linearen Abbildung aus vertragen. Abb. 7.1.

Beispiel 7.6

PROPOSITION 7.8. Sei A E Kn x n. Dann ist A genau dann invertierbar, wenn die lineare Abbildung IA ein Isomorphismus ist.

Beweis. Wir haben zwei Richtungen zu zeigen. Sei A invertierbar. Dann gibt es eine Matrix A-1 E Kn X n mit A • A-1 = idn. Also gilt für jeden beliebigen Vektor v E Kr% dass A • v = w und A-1 • w = v. Dann gilt aber auch f A (v) = w und f A (w) = v. Also ist f A-1 = f,T1 und damit f invertierbar, also bijektiv, also ein Isomorphismus. Sei IA ein Isomorphismus. Dann gibt es ein lineare Abbildung fT11 mit f,T,1 o f A (v) = v für alle v E Kn. Damit ist aber auch M(fA-1) • M(fA ) • V = v für alle v E Kn, also ist M(f A -1) • M(f) = idn . Da M( f A ) = A • folgt die Behauptung. Wir führen jetzt noch einige konkrete lineare Abbildungen mit ihren

298

DIMENSIONSSATZ A

Darstellungsmatrizen beispielhaft auf. BEISPIEL 7.9. Die Abbildung f : R2

:2 entspricht der

,

Spiegelung des IR2 an der Geraden xi = x2. 0) und f (e(2)) = (01), also

Die Darstellungsmatrix hat die Spalten f (e(1)) M (f) =

)• ■

BEISPIEL

7.10. Die Abbildung h : i 2

x1) entspricht einer R2, (x1)( X2 X2

Spiegelung des R2 an der x2-Achse. Die Darstellungsmatrix hat die Spalten f (eil)) = ( 10) und f (e(2)) = (°), also

m(f) = (-1 o o 1) . ■ BEISPIEL 7.11. Die Abbildung h o f : R2 —* R2, wobei f die Abbildung aus

Beispiel 7.9 und h die Abbildung aus Beispiel 7.10 ist, entspricht der Hintereinanderausführung beider Spiegelungen. Also ist h ° f ((:2))

h ((:21))

x1)

Die Darstellungsmatrix hat die Spalten h o f (e(1)) = (0 und h o f (e(2)) = (—I also o)' M(f) =

)•

0 1

7.2 Dimensionssatz

Wir betrachten nun zwei Mengen, welche die wesentlichen Eigenschaften einer linearen Abbildung beschreiben. Im Kern einer linearen Abbildung (eine dieser Mengen) liegen all jene Vektoren, die auf den Nullvektor abgebildet werden. Das Bild einer linearen Abbildung haben wir schon definiert, die Menge aller Vektoren im Bildraum, die ein Urbild besitzen. Wir verallgemeinern diese Begriffe nun auf Matrizen.

299

DIMENSIONSSATZ

Das Bild einer linearen Abbildung liegt im Bildraum, wohingegen der Kern eine Teilmenge des Urbildraums ist. Beide Mengen bilden Untervektorräume. Tatsächlich gibt es einen Zusammenhang zwischen den Dimensionen dieser beiden Vektorräume und der Dimension des Urbildvektorraums. Der Dimensionssatz besagt, dass die Summe der Dimensionen von Kern und Bild immer gleich der Dimension des Urbildraums ist. Um dies formal zu fassen und zu beweisen, definieren wir zunächst den Kern und das Bild einer Matrix. DEFINITION 7.12. Sei f : Kn .+ Km eine lineare Abbildung. Wir definieren den Kern von f als

Kern( f) = {v E Kn : f (v)

01.

Sei A E Km". Wir definieren den Kern und das Bild von A als Kern(A)={vEKn:A•v=0} Bild(A)

und

A•v:v E Kn }.

Analog definieren wird den Linkskern und das Linksbild von A als LKern(A) ={vEKn:vT •A= 0} LBild(A) =

und

v•A:vT EKn }.

BEMERKUNG 7.13. Der Kern ist eine Menge im Urbild, das Bild „lebt" in der Bildmenge. Ist A eine m, x n-Matrix mit Einträgen aus IK, dann „lebt" Kern(A) im Urbild Kn und Bild(A) im Km. ■ BEMERKUNG 7.14. Der Linkskern und das Linksbild sind über das Produkt vT • A definiert. Dabei wird der Spaltenvektor v E Kn als n x 1-Matrix aufgefasst. Das Bild der Matrix-Matrix-Multiplikation vT • A ist eine 1 x m-Matrix, welche wiederum als transponierter Spaltenvektor des Km aufgefasst werden kann.

Im Kontext von linearen Codes, wie wir sie im Kapitel 13 untersuchen werden, ■ spielen der Linkskern und das Linksbild eine wichtige Rolle. BEISPIEL 7.15. Die

1012 111 0000

Matrix A = o

des 1E3 X 4 besitzt —1

Kern(A) =

ii.

o : Ai , A2 E

{1 . -A2 • —1 XI. • _ 1-

R1

Bild(A) = {.X1 • (0) + A2 • (1) : al> A2 E

300

.

DIMENSIONSSATZ

A

Außerdem berechnen wir LKern(A) = at • (o) : al E RI , LBild(A) = {Ai • (i) + A2 • 2

1 : Ai, ()

E 118} .

1

• Wir halten ein Schema F fest, nach welchem man den Kern einer Matrix bestimmen kann. SCHEMA F 7.16 (Den Kern einer Matrix berechnen). Gegeben. Eine Matrix A E Km".

Aufgabe. Bestimme Kern(A). Schritt 1. Man löst das lineare Gleichungssystem

A • v = 0. Ausgabe. Es ist Kern(A) = L, wobei L die Lösungsmenge des linearen Gleichungssystems aus Schritt 1 ist.

Wir möchten nun drei Lemmata im Kontext von Kern und Bild von Matrizen festhalten. Das erste Lemma lässt sich umschreiben mit den Worten „die Lösungsmenge eines inhomogenen linearen Gleichugnssystems entspricht einer speziellen Lösung plus der Lösung des homogenen linearen Gleichungssystems". Erhellend wird diese Interpretation im Abschnitt über lineare Gleichungssysteme. b E Km und x E IV so, dass A • x = b. LEMMA 7.17. Es sei A E Km Dann gilt für jeden Vektor z E Kern(A), dass A • (x+z) = b. Ist umgekehrt x' ein Vektor mit A • x' = b, so ist z = x — x' im Kern von A. Beweis. Die Aussagen lassen sich leicht nachrechnen. Das ist eine Übungs• aufgabe. Im Folgenden halten wir fest, wie das Bild einer Matrix zu berechnen ist man identifiziert es mit dem Spann von Spaltenvektoren. LEMMA 7.18. Sei A c Km". Dann ist Bild(A) = span (A(1),

, A(71) ) .

Beweis. Die Aussage folgt aus Lemma 6.16 und der Beobachtung, dass für alle v E Kn und damit alle möglichen Linearkombinationen der Spalten

301

1. DIMENSIONSSATZ

von A in Bild(A) = {A • v : v E Kn} enthalten sind.

■

Vielleicht wenig überraschend, sowohl der Kern, als auch das Bild einer Matrix bilden Vektorräume. LEMMA 7.19. Sei

A E Km ". Dann sind Kern(A) und Bild(A) Vektorräu-

me. Beweis. Nach Lemma 7.18 ist Bild(A) = span (A(1) , ... , AN) und der Spann beliebiger Vektoren ist immer ein Vektorraum. Um zu zeigen, dass Kern(A) ein Vektorraum ist, wenden wir das Unterraumkriterium an. Es ist nämlich Kern(A) c Kn. UVO. Es gilt A • 0 = 0. Also ist 0 E Kern(A) und somit ist Kern(A) 0. UV1. Seien v, u E Kern(A) beliebig gewählt. Dann ist A • u = 0 und A.v = 0.AußerdemistA•(u+v)=A•u+A•v= 0+0 = 0. Demnach ist v + u E Kern(A). UV2. Seien v E Kern(A) und A E K beliebig gewählt. Dann ist A • u = 0. Außerdem ist A • (A • v) = A • (A • v) = A • 0 = 0. Demnach ist A • v e Kern(A). • Schlussendlich formulieren und beweisen wir nun den Dimensionssatz. SATZ

7.20. Sei A E Km". Dann gilt dim (Kern(A)) + dim (Bild(A)) = n.

Beweis. Wir konstruieren aus einer Basis von Kern(A) und (den Urbildern) einer Basis von Bild(A) eine Basis von Kn. Dann folgt die Behauptung. E 1K eine Es sei ui, .. • , uk E Kn eine Basis von Kern(A) und wi, Basis von Bild(A). Es ist also dim(Kern(A)) = k und dim(Bild(A)) = g. Da die Vektoren wi , /De in Bild(A) liegen, haben sie alle mindestens ein Urbild. Es seien vi , ve E IV so gewählt, dass für jedes i = {1, .„ gilt A • vi = wi. Wir zeigen nun, dass die Vektoren ui , bilden.

302

uk, vi , ve eine Basis des K'

DIMENSIONSSATZ

A

Bl. Wir zeigen, dass die Gleichung

E Ai • ui E Ai • vi = 0

(7.1)

i=

i=1

= At = 0 besitzt. nur die triviale Lösung µ1 = = µk = Al = Dazu multiplizieren wir auf beiden Seiten der Gleichung die Matrix A von links und erhalten mit der Linearität von A E µi • ui +

A

• ( i=1

E Ai • vi) = A • 0 i=1

Ai • A • ui + E Ai • A • vi = E i=i i=1

0.

Da die Vektoren ui , . . uk in Kern(A) liegen, gilt A • Ui = 0 für alle , k} außerdem ist A • vi = wi für alle i E {1, ... t} und i E {1, wir erhalten

E Ai • A • ui + E Ai • A • vi

0

i=1

i=i

E Ai • wi

0.

i=1

, wt linear unabhängig sind, hat die letzte Da die Vektoren wi = At = 0. Setzt man Gleichung nur die triviale Lösung Ai = dies in Gleichung (7.1) ein, folgt

E u • + E Ai • vi = 0. i

i=1

ui

i=i

uk linear unabhängig sind, hat die letzte Da die Vektoren ui , = µk = 0. Also hat (7.1) Gleichung nur die triviale Lösung Ai = uk , v1, ... ve tatsächlich nur die triviale Lösung, die Vektoren u1, sind linear unabhängig. uk , vi , Vt ) beliebig gewählt. Wir bezeichB2. Sei x E spar(ui , nen mit y = A • x das Bild von x unter A. Weil y E Bild(A) ist, lässt sich y als Linearkombination der Basisvektoren, also als y = E j=, Ai • wi schreiben. Diese Koeffizienten nehmen wir auf und berechnen mit ihnen x' = Eti=, Ai • vi, eine Linearkombination

303

BASISWECHSEL

der Vektoren v1, A • s' = A •

E

ue. Dann gilt sicherlich A • x = A • x', weil Ai • vi =

i=1

E

Ai • A • vi =

i=1

E

A, • wi = A • x.

i=1

Damit ist aber A • (x — x') =A•x—A•x' = 0 und somit x — x' E Kern(A). Wir setzen x" = x — x' und finden x = x" + x' mit x" E Kern(A) = span(ui, , uk) und x' E epan(vi, 'w) also x E span (u1, ••• , uk , vi, ye). Da x E Kn beliebig gewählt war, ist ve ein Erzeugendensystem von Kn, was zu zeigen Ui , . . • , uk, vi , war. •

7.3 Basiswechsel Die Basis eines Vektorraums ist nicht eindeutig, so lassen sich mit Leichtigkeit neben der Standardbasis weitere Basen des K' definieren. Seien die Vektoren bi, . b, eine von der Standardbasis verschiedene Basis des Kn. Dann besitzt jeder Vektor v E Kn eine Darstellung als Linearkombination entweder der Standardeinheitsvektoren oder der Vektoren b1 ,. ..

v = E A, • e(i) = z=i

• bi i=i

mit A i , An, Jki, E 1K. Die Koeffizienten sind für die meisten Vektoren nicht identisch. Es gibt also mindestens ein i E {1, , n} mit Wie schon besprochen, sind die Koeffizienten der Linearkombination zur Standardbasis genau die Komponenten von v, also vi = A1, , v, = An. Nichts hindert uns allerdings daran, einen Spaltenvektor aufzuschreiben, dessen Komponenten den Koeffizienten der Linearkombination zur neuen Basis b1, , bn entsprechen. Um dabei nicht durcheinander zu kommen, kennzeichnen wir diesen Spaltenvektor durch einen Index mit dem Hinweis auf die Basis. DEFINITION 7.21. Sei B = {b1 , . • bn} eine Basis des 1Kn. Dann nennen

304

BASISWECHSEL

A

wir für jeden Vektor v E v [B]

[13 ]

mit v =

:

V [81 =

Ev

14.1

den Spaltenvektor von v zur Basis B. BEMERKUNG 7.22. Die Spaltenvektoren des Kn sind die Spaltenvektoren zur

■

Standardbasis. BEISPIEL 7.23. Betrachte den 1 3 und neben der Standardbasis die Basis B

(1) (o i) (0) } • 1

1

Es ist tatsächlich nicht schwer zu zeigen, dass es sich bei 13 um eine Basis handelt. (1 Dann gilt für den Vektor 3 E 1R3 , dass er bezüglich der Basis 13 die Darstellung 6 ( ) [B] = 1 23

+ . (1)

() +

. (0)

11

(3 1)

1

6

■

besitzt.

BEMERKUNG 7.24. Betrachtet man die Bilder einer linearen Abbildung f : Kn -+ Km von Spaltenvektoren zu einer Basis 13 = { bi, • • • ,bri} des 1K", ist f (v) = ■ f (v[g1), weil v und v [B1 den gleichen Vektor des IK" repräsentieren.

SCHEMA F 7.25 (Spaltenvektoren zu unterschiedlichen Basen). Gegeben. Ein Vektorraum IK" und neben der Standardbasis 138 eine weitere Basis 13 =

, bn )-

Aufgabe. Zu einem Vektor v C TK" soll die Darstellung v la] berechnet werden. Schritt 1. Man löst das Lineare Gleichungssystem

(bi,...,bn ) • ( :

=v

2, Sei

. ,p, die eindeutig

bestimmte Lösung, welche den Koeffizienten der Linearkombination v =

Er—i /4 • b1 entspricht.

305

1. BASISWECHSEL

Ausgabe. Es ist also vfisl = la und FS v[131

=

:

.

7.3.1 Basiswechselmatrix Es ist leicht, die Spaltenvektordarstellung eines Vektors v E Kn bezüglich zweier Basen Bi und 132 ineinander zu transformieren. Dazu verwendet man eine sogenannte Basiswechselmatrix. 7.26. Seien Bi = {al , , an} und 82 = {bi,. b,,,} zwei Basen des Kn. Dann heißt die Matrix /1/[81-B21 die Basiswechselmatrix von der Basis Bi zur Basis 132, deren i-te Spalte dem Spaltenvektor a!,821 von ai zur Basis 132 entspricht. DEFINITION

Wir prüfen nun, ob eine Basiswechselmatrix das tut, was ihre Bezeichnung suggeriert. bn} zwei Baan} und 132 = {bi, LEMMA 7.27. Seien Bi = {ai, sen des K'. Dann lässt sich für jeden Vektor v e Kn, dessen Spaltenvektor v(811 zur Basis Bi gegeben ist, der Spaltenvektor zur Basis 132 berechnen mittels M[131,1321 . ,[1311 = ,[132] . Außerdem gilt m[131.,B21 . m182,611 = Beweis. Der Beweis ist nicht weiter schwer, doch die Darstellung sperrig. Wir verweisen deshalb auf die Literatur oder Beispiel 7.30 für eine Illus■ tration. BEMERKUNG 7.28. Lemma 7.27 zeigt insbesondere, dass die Basiswechselmatrizen M[81,E321 und M[B2,B11 für zwei Basen Bi und 132 invers zueinander sind. ■

306

BASISWECHSEL

SCHEMA F 7.29

(Basiswechselmatrix berechnen).

Gegeben.

Zwei Basen /31 und 132 eines K-Vektorraums.

Aufgabe.

Bestimme die Basiswechselmatrix M[81,82].

Schritt 1.

Bestimme die Spaltenvektoren der Basisvektoren aus .61 zur Basis 132 mittels Schema F 7.25.

Schritt 2. Die in Schritt 1 bestimmten Spaltenvektoren der Basisvektoren aus ./31 zur Basis 132 bilden die Spalten der Basiswechselmatrix M[01,82].

BEISPIEL 7.30. Betrachte den R3 und die Basen , (o) \ 0/ Wir wenden Schema F 7.29 an. 81 = (i) ,

und

B2 = (10) , 0 , C1) } • 0 1

Schritt 1. Um die Basiswechselmatrix von der Basis .61 zur Basis 132 und umgekehrt zu berechnen, betrachten wir zunächst die Spaltenvektoren der Basisvektoren aus Bi. zur Basis 132 und umgekehrt. Es ist ( 1)1821 o) i) i (1) o = 1 • (o) + 0 • (i. + 1 • (1 = i o o i ( 1) [82 ] (oi) 1 = 1 • (o) + (-1) • (1) + 2 • (1) = 2 0 i (0)

1 0 = (_il [82] 1 (1) = 1 • (0) + (-1) • (1 ) + 1 • 0 0

Außerdem berechnet man ( 1) [ si] o o (o) = 1 • (1) + (-1) • (1) + 1 • (o ) = —1 1 1 i 1) [Bil o o i (11) = 1 • 0 + 0 • (i) + (-1) • (o ) = ( o 1 ( o) [81] o o 1 (oi) = 0 • (1) + 1 • (1) + (-1) • (o) = 1 Schritt 2. Wir erhalten also

[B1,821 M[81'82] —

und

— 1 —1) 1 2 1

( 1 1 o [82,81] . M [82,81] = —1 o 1 1 -1 -1

Wir kennen aus Beispiel 7.23 und berechnen den Spaltenvektor zur Basis 132 [81] 2 3

1 = (3) = 6 6

1

1

0

• + (-5) • (1) + 8 • (1) = • (0) 1

0

0

6) [821 (-5 8

307

A

BASISWECHSEL

Wir überprüfen nun 1) [Bil 1031,B21 . (2 31

=

(1 1 1) [B1'62] 0 —1 —1 2

1

(1) [B1]

• 2 3

(1 . 1 + 2 1 + 3 • 1 )[621 1 • 0 + 2 • (-1) + 3 • (-1) 1 1+ 2 2 +3• 1

[1321

( =

—$ 8

Außerdem ist 6 [B21 — M[132,1311 . (-5 8

1 1 0 [B2 '611 —1 0 —1 1 —1 —1

6 [1321 8

(1) (6 • 1 + (-5) • 1 + 8 • 0 ) [I31] \ [511 6 • (-1) + (-5) • 0 ± 8 • 1 = 2 1 / 6 . 1 + (-5) • (-1) + 8 • (-1) 3/

=

Tatsächlich lässt sich der Spaltenvektor zur Basis 131 durch die Multiplikation mit der Basiswechselmatrix in einen Spaltenvektor zur Basis 82 transformieren. Nun berechnen wir noch 1 M1131•821 . M[13 2,131]

1 1[Bl•B2 ] —1 —1 • 2 1)

= ((:)

LEMMA 7.31. Sei 13 = {bi,

1 1 0) [132,131] —1 0 1 1 —1 —1

10 0 1 0) 00 1

= (0

,b,d eine Basis des Kn . Dann gilt für alle

v, w E Kn und A E K

BWa w[B] + v[81 = (w 21)[5] BWb A • v[13] = (A • v)IBI Beweis. Beide Aussagen folgen direkt, berücksichtigt man die Rechenregeln für die Multiplikation einer Matrix mit einem Vektor für die Basiswechselmatrix von der Standardbasis zur Basis B. Es ist

w1131 + v1131 = A • v[B] =

m[B-B] • w

/1/ [8s 'B1 • v = M[8s 43] . (w + v) = (w V)[131 A • M[Bs 'B1 • v = M [Bs '131 • (A • v) = (A • v)

wie behauptet.

•

BEISPIEL 7.32. Wir betrachten den mit der Basis Bi aus Beispiel 7.30. Man berechnet die Basiswechselmatrix von der Standardbasis Bs zu Basis Bi über Schema F 7.29 und erhält

miBs•Bil =

Weiter wählen wir zwei Vektoren v =

308

( 1 0 0 —1 1 0 0 —1 1 (4 i 2 und w =2)aus dem R3 und ein 4 1

BASISWECHSEL

Skalar A = 2 E IR. Wir berechnen 0 0)

(_11

10 • 0 -1 1 = (-11. 0 0 10 • w[61] = MIt3s,B1I . w 0 -1 1 0 1 0 1) (2V + v)[611 = MIBs,B11 • (w + v) = ( -1 1 0 • 0 -1 1 0 0 (Ä • '0E211 = M[B.' 1311 • Pt • V) = (-1 1 0 • 0 -1 1 v [1311= MIB.,1311

v

=

(1

2) = 4 2 = 41 5 4 = 5 2 4 = 8

Man kann nun leicht die Identität BWa und BWb aus Lemma 7.31 überprüfen. II BEMERKUNG 7.33. Möchte man aus einer Basis 13 zur Standardbasis wechseln, ist die Basiswechselmatrix sehr einfach. In den Spalten stehen die Basisvektoren von 13 zur Standardbasis. Die Basiswechselmatrix von der Basis /31 aus Beispiel 7.30 zur Standardbasis ist dann schlicht 1 0 0 M[131 '13s ] = (1 1 0). 1 1 1

•

7.3.2 Darstellungsmatrizen zu beliebigen Basen Die Idee des Basiswechsels lässt sich auf die Darstellungsmatrizen linearer Abbildungen f : Kn -+ 1K" übertragen. Die Darstellungsmatrix besteht per Definition aus den Spaltenvektoren zur Standardbasis des Km der Bilder der Standardeinheitsvektoren des Kn. In beiden Fällen, also auf beiden Seiten, im Urbild und im Bild, ist die Standardbasis beteiligt. Das lässt sich verallgemeinern, indem man für eine feste lineare Abbildung 1K" Darstellungsmatrizen zu Basen des Kn im Urbildraum und f: Km im Bildraum wählt. DEFINITION 7.34. Sei f : 1K" -÷ Km eine lineare Abbildung, B1 = an} eine Basis des Kn und 82 = {b1, , bm} eine Basis des {ai , Km. Wir nennen die m x n-Matrix Mt B1' 821 (f), deren Spalten den Spaltenvektoren zur Basis 82 der Bilder der Basisvektoren aus Bi unter der Abbildung f entsprechen, die Darstellungsmatrix von f bezüglich der Basen Bi und 82 . Es ist also (M[81'621 (f)) (') =

(f

(a1))[821

BEISPIEL 7.35. Betrachte die Abbildung f :

für alle i E {1, ... n}. —> 11l2, welche durch die Darstel-

309

BASISWECHSEL

lungsmatrix M(f) (1 1 —1)

2

= o —1

gegeben ist und eine Basis

Bi= { 1 , 1 , 0 1

1

1

des R3 und eine Basis B2 -- { (o) ,(1) } des R2 .

Wir berechnen zunächst die Bilder der Basisvektoren aus 81 unter f und berechnen den zugehörigen Spaltenvektor zur Basis 82

. (1 11) = (

'

f (0) = 0

f

(0 • °1 = (-21) =

=

(01) + 1.

o\ = _, . 1 . 1 . I 0 T '•

. '3]. =

f CO) =

0

—3

' (ol) + 2 '

Wir erhalten die Darstellungsmatrix von f zu den Basen Bi und 82 als m [Bi ,132 } (f) =

(0 —1 —3 1 1 2).

• LEMMA 7.36. Sei f : Kn —> Km eine lineare Abbildung und Bi = {a1, , an} eine Basis des Kn sowie 82 = {bi, b,„„} eine Basis des Km. Dann gilt M(f) M[82,8.91

Sei außerdem v

E

M[81,821(f) M[8s,811

Kn mit w = f (v). Dann gilt M [81,821( f )

.

=

w[621.

Beweis. Sei v E IV beliebig gewählt und w = f (v). Wir zeigen, dass w _ M[82,8.51 M[81,821(f) M[8s ,811 v •

gilt. Daraus folgen beide Behauptungen. Seien dazu c% = f (%) für alle i E {1, , n} die Bilder der Basisvektoren aus 81 unter f. Dann ist per Definition M [81,82] ( f ) _ (432] c[2132]

4621).

In der folgenden Rechnung beachten wir, dass die ell die Komponenten des Spaltenvektors v[Bil und die c[r2] die Spaltenvektoren zur Basis 132

310

BASISWECHSEL

A

sind. Es ist cL521) . v11311

M[131'821 (1) • y[811 = (41321 ,[2132]

[nach Lemma 7.31]

[Linearität von f]

Außerdem ist nach Lemma 7.27 •V

= 0311

m[13243.] w[B21 = w.

und

Zusammengenommen gilt M[I32•Bs]

m[B2,13,1 . 0131,821(f). m[B.,t311. v

= M[8218s1

•

0511821(f) v1811

• w[521

w,

■

was zu zeigen war.

R2 und die Basen BEISPIEL 7.37. Wir betrachten die lineare Abbildung f : R3 Bi und 132 aus Beispiel 7.35. Wir berechnen mit Schema F 7.29 die Basiswechselmatrizen M [B.,811

= (-11 °1 0)

und

m [52 ,Bs]

0 —1 1

(1 1 — 0 1).

Tatsächlich gilt M(f)

= m[52,B.s1 . m[81,B21(f) . (0 —1 —3 = (1 0

1 1

2)

Vergleiche erneut M mit Beispiel 7.35.

m[733,.611

00 1 0) = (0 —1 2). i —1 1 0

■

311

IN.

BASISWECHSEL

7.3.3 Ähnliche Matrizen Jede Matrix A repräsentiert viele lineare Abbildungen. Jedes Basispaar des Urbild und des Bildraums korrespondieren zu einer linearen Abbildung, welche durch die Matrix A repräsentiert wird. Man kann den Spieß allerdings auch umdrehen. Matrizen, die durch einen Basiswechsel ineinander übergehen, repräsentieren (unter anderen) die gleiche lineare Abbildung. Solche Matrizen nennen wir ähnlich. Im Übrigen lässt sich daraus auch ableiten, dass jede invertierbare Matrix eine Basiswechselmatrix ist. DEFINITION 7.38. Zwei quadratische Matrizen A, B E Kn" heißen ähnlich, wenn es eine invertierbare quadratische Matrix S E Kn" gibt mit

S-1 • A • S = B. BEMERKUNG 7.39. Die Gleichung S-1- A • S = B ist im Übrigen gleichbedeutend zuA•S=S•BundA .=S•B•S-1. ■ BEISPIEL 7.40. Die

Matrizen

1 0) A = ( —1 1

und

B= ( 4 11 )

des 2 X 2 sind ähnlich. Denn mithilfe der invertierbaren Matrix S = (37 52)

mit

S-1 =

3 -2

57 )

=

4

lässt sich überprüfen S-1 • A • s =

-2

5

•

0 -1 1

) 7 5

11

= B.

• Bezüglich der Einheitsmatrix gilt die interessante Beobachtung, dass sie nur zu sich selbst ähnlich ist. LEMMA

7.41. Die Einheitsmatrix ich, ist nur zu sich selbst ähnlich.

Beweis. Sei B E Kn" eine zu idn, ähnliche Matrix. Dann gibt es eine invertierbare Matrix S E Kn" mit S-1 • ich, • S = B. Das ist aber gleichbedeutende mit S-1 • S = B und damit id, = B, was zu zeigen war. ■

312

LINEARE GLEICHUNGSSYSTEME

lt

7.4 Lineare Gleichungssysteme

Schon häufig standen wir vor der Aufgabe, ein lineares Gleichungssystem zu lösen. Wir möchten uns nun etwas ausführlicher mit linearen Gleichungssystemen beschäftigen. Interessanterweise lässt sich ein lineares Gleichungssystem in der Sprache der Multiplikation von Matrix und Vektor formulieren. Wir werden gleich sehen, dass die Lösung eines linearen Gleichungssystems der Menge der Vektoren entspricht, welche eine Matrix A E Km" auf einen festen Vektor b E Km abbildet. Es spielen also lineare Abbildungen eine entscheidende Rolle beim Studium linearer Gleichungssysteme. Doch zunächst wollen wir definieren, was wir unter einem linearen Gleichungssystem verstehen. DEFINITION 7.42. Ein lineares Gleichungssystem (LGS) ist ein System von m Gleichungen in n Unbekannten xi, ,xn, der Form A1,1 • xl + A1,2 • x2 + • • • + A1, n • x ,1

=

b1

A2,1 • xl + A2,2 • x2 + • • • + A2,,, • xr, = b2

• xi + Am,2 • x2 + • • . + Arno., • x, = 6,,

mit Koeffizienten A1,1, • • • , Am,n E 1K und der rechten Seite b1, . 1K.

E

bm = 0, nennt man das Ist die rechte Seite gleich 0, also b1 = LGS homogen. Ein nicht homogenes LGS wird auch inhomogenes LGS genannt. Wir bezeichnen mit L = {x des LGS. BEISPIEL

E Kn :

x löst das LGS} die Lösungsmenge

7.43. Es ist 2 • x1 + 1 • x2 + 0 • s3 = 5 0 • xi + 2 • x2 + 2 • x3 = 8 4 • xi + 0 x2

0 • x3 = 8

ein inhomogenes lineares Gleichungssystem mit Koeffizienten und rechter Seite aus 111, in den drei Unbekannten xl, x2 und x3. Die Lösungsmenge ist 1) E L= (3

,

313

LINEARE GLEICHUNGSSYSTEME

also ist xi = 2, x2 = 1 und x3 = 3 die einzige Lösung des LGS.

•

Wir können lineare Gleichungssysteme in der Sprache der linearen Algebra studieren, weil das folgende Lemma den offensichtlichen Zusammenhang herstellt. LEMMA 7.44. Die Lösungsmenge eines lineare Gleichungssystem entspricht (lässt sich identifizieren mit) II, = {x EK"` :A• x=b}, wobei A E Br"' die Matrix, deren Einträge den Koeffizienten des LGS und b E Er' der Spaltenvektor ist, dessen Einträge der rechten Seite des LGS entsprechen. BEISPIEL 7.45. Wir betrachten das LGS aus Beispiel 7.43. Die aus den Koeffizien-

ten und der rechten Seite gebildeten Matrix und Vektor sind A=

2 1 0) 0 2 2 (4 0 0

5

und

b = (8) .

(2

Tatsächlich gilt für den Lösungsvektor x = i , dass 3

A

x

=

2 1)02 ( = ( 0 2 2 • 1 4 0 0 3

5 8 8)

ist.

•

7.4.1 Das Gaußsche Eliminationsverfahren

Das bekannteste Lösungsverfahren für lineare Gleichungssysteme ist das Gaußsche Eliminationsverfahren. Dazu werden Tableaus Alb bestehend aus einer Matrix A E Km" und einem Vektor b E Km definiert, welche linearen Gleichungssystemen, bzw. deren Übersetzung A • x = b, entsprechen. Übersetzt man nun ein zu lösendes lineares Gleichungssystem in ein Tableau, werden auf diesem Umformungen, die sogenannten GaußSchritte durchgeführt, um die Matrix (der vordere Teil des Tableaus) auf Zeilen-Stufen-Form zu bringen. Im Hintergrund, auf dem Tableau nicht sichtbar, entsprechen diese Umformungen einer schrittweisen Elimination von Unbekannten in den Gleichung des ursprünglichen linearen Gleichungssystems. Das Tableau, dessen Matrix in Zeilen-Stufen-Form vorliegt, wird dann wiederum in ein lineares Gleichungssystem übersetzt, dessen Lösung ...

314

LINEARE GLEICHUNGSSYSTEME

A

j. ... genau der Lösung des ursprünglichen linearen Gleichungssystems entspricht. leicht auszulesen ist. k Wir müssen die folgenden Konzepte definieren, bzw. Fragen beantworten. 5. Was ist ein Tableau und wie funktioniert die Entsprechung von linearem Gleichungssystem und zugehörigem Tableau? k Welche Umformungsschritte auf dem Tableau sind zulässig? 5. Lässt sich jedes Tableau durch erlaubte Umformungsschritte auf Zeilen-Stufen-Form bringen? k Bleibt bei der Umformung eines Tableaus die Lösungsmenge unverändert? k Wie liest man die Lösung eines linearen Gleichungssystems, dessen Tableau Zeilen-Stufen-Form hat, leicht aus? Wir legen mit diesem Programm sofort los. D EFINITION 7. 46. Sei A E Km" und b E Km. Die Gleichung A • x = b schreiben wir als Tableau, indem wir die Einträge der Matrix A um den Vektor b ergänzen, jedoch durch eine senkrechte Linie abgegrenzt, in eckigen Klammern notieren. Es ist dann A1,1 • • • A1,n

bl

[Alb] = [ •

... Am ,n

b,,,

Die Lösungen eines Tableaus sind die Lösungen der zugehörigen Gleichung A • x = b. Zwei Tableaus heißen äquivalent, wenn sie dieselben Lösungen haben. Wir schreiben dann [Alb] [A' 1bl, falls [Alb] und [A' b'] äquivalent sind. 2 "und

BEISPIEL 7.47. Sei A E

A

b E 1R2 mit

(o 1 —3) und b = () 1 2

(1) Dann entspricht die Gleichung A . x = b dem Tableau 2] 0 —1 —3 1 1 2 1

[

• hat Zeilen-Stufen-Form (ZSF), DEFINITION 7.48. Eine Matrix A E wenn es ein P E N mit 1 < P < m + 1 gibt, so dass gelten.

315

lit.

LINEARE GLEICHUNGSSYSTEME

ZSF1 Für alle i E N mit 2 < i < Q enthält die i-te Zeile mindesten eine führende Null mehr, als die (i — 1)-te Zeile. ZSF2 Für alle i E N mit f < i < m enthält die i-te Zeile nur Nullen. BEMERKUNG 7.49. Eine Matrix A E 1Rm x n hat Zeilen-Stufen-Form, wenn in jeder Zeile entweder mehr führende Nullen stehen, als in der vorherigen Zeile (die erste Zeile ist davon natürlich ausgenommen) oder sie komplett aus Nullen besteht. Der Index .e gibt den Zeilenindex der Zeile an, auf welche nur noch Nullzeilen folgen.

Die Bedingung ZSF2 ist für 2 = m 1 immer erfüllt. Es gibt schlicht keine zu prüfenden Zeilen. ■ BEISPIEL 7.50. Wir schauen uns zwei Matrizen in Zeilen-Stufen-Form an. Jeweils gilt, dass .e = 4 der gesuchte Wert aus Definition 7.48 ist. Es sind

A=

1 2 3 4 5 1 2 3 4 5 (0 2 3 5 7 0 2 3 5 7 und B = 00039 0 0 0 3 9 0 0 0 0 0 0 0 0 0 0

Wir schauen uns zwei Matrizen an, die nicht in Zeilen-Stufen-Form sind. Es sind (1 2 3 4 5)

C

=

0 2 3 5 7 0 i. 1 3 9

und D=

1 0 0 0 0

2 2 0 0 0

3 3 0 0 0

4 5 5 7 0 0 3 9 0 0

Es ist Zeile 3 in C, die das Spiel kaputt macht, denn sie besteht weder nur aus Nullen noch hat sie eine führende Null mehr als die vorhergehende Zeile 2. In D ist es Zeile 4 mit dem gleichen Argument. ■

7.51. Ein Tableau [Alb] hat Zeilen-Stufen-Form, wenn die Matrix A Zeilen-Stufen-Form hat. Wir nennen eine Zeile von [Alb] Nullzeile, wenn die Matrix A in dieser Zeile nur Nullen hat und der Eintrag von b in dieser Zeile Null ist. DEFINITION

Wie wir später sehen werden, ist ein Gleichungssystem A • x = b mit einer Matrix in Zeilen Stufen-Form leicht rekursiv zu lösen. In der Tat erhält man so unmittelbar alle Lösungen des LGS. Aufgabe ist es nun, Umformungsschritte auf Tableaus zu definieren, die äquivalente Tableaus erzeugen. Das meint Tableaus, deren zugehörige LGS die gleichen Lösungsmengen besitzen. DEFINITION 7.52. Es sei [Alb] ein Tableau. Dann bezeichnen wir die folgenden Umformungen auf [Alb] als Gauß-Schritte.

316

LINEARE GLEICHUNGSSYSTEME Ä

Gl. G2. G3. G4.

Addition des Vielfachen einer Zeile zu einer anderen Zeile. Multiplikation einer Zeile mit einem Skalar. Vertauschen zweier Zeilen. Streichen einer Nullzeile.

Gauß-Schritte ändern die Lösungsmenge nicht. LEMMA 7.53. Sei [Alb] ein Tableau. Das Tableau [A' I ist äquivalent zu [Alb], wenn es durch einen Gauß-Schritt aus [Alb] hervorgeht. Beweis. Der Beweis, das bei den Gauß-Schritten G1 bis G4 sich die Lösungsmenge des zugehörigen LGS nicht ändert, ergibt sich direkt aus den ■ Eigenschaften von Gleichungen. BEISPIEL 7.54. Gegeben sei ein Tableau [Alb] mit A E R3 X3 und b e R3. Wir führen jeden der unterschiedlichen Gauß-Schritte G1 bis G3 beispielhaft durch.

Gl.

[ 1 2 3 5 -2 -2

1 1 2

1] 1 2

G2.

[ 1 2 3 5 -2 -2

1 1 2

1 1 2

EE

G3.

[ 1 2 3 5 -2 -2

1 1 2

1 1 2

_=

I -› { 1 2 1 0 -1 -2 -3 • I +II -> III -› -2 -2 2 4 8 4 4•I 3 5 1 II -> III -› -2 -2 2 3 5 1 2 I -› III -› -2 -2

1 1 2

—211 2

41 1 2 1] 1 2

• PROPOSITION 7.55. Jedes Tableau [Alb] lässt sich in endlich vielen GaußSchritten in ein äquivalentes Tableau [A' in Zeilen-Stufen-Form umformen.

Beweis. Wir führen den Beweis nicht im Detail und skizzieren das Argument bloß. Sukzessive werden Einträge links unten der Matrix A auf 0 gesetzt. Sei dazu — 1 der größte Zeilenindex von Einträgen in den Spalten 1 bis j, die nicht gleich 0 sind (für die erste Spalte, also j = 1 ist i1 = 0). Es lassen sich die Einträge der j-ten Spalte von A unterhalb der Zeile durch Gaußschritte eliminieren (das heißt auf mithilfe des Eintrags 0 setzen), vorausgesetzt, er ist nicht 0. Ist er 0, dann sind entweder alle Einträge in Zeilen mit größerem Index dieser Spalte schon 0 oder mit dem Gaußschritt der Zeilenvertauschung kann der Eintrag Aji,i auf einen Wert ungleich 0 gesetzt werden. Bei all diesen Gaußschritten bleiben die ersten j — 1 Spalten in den Zeilen mit Index oder größer unberührt gleich 0. ■ Am Ende des Prozesses steht eine Matrix in ZSF. 317

k LINEARE GLEICHUNGSSYSTEME

BEMERKUNG 7.56. Die Umformung ist nicht eindeutig. Das heißt, sowohl die Reihenfolge der anzuwendenden Gaußschritte, als auch die endgültige ZSF können sich unterscheiden. Ein Tableau kann also mehr als ein äquivalentes Tableau in ZSF besitzen ■

BEISPIEL 7.57. Gegeben sei ein Tableau 1 2 1 [Ab] = [ 3 5 1 -2 -2 2

1] 1 2

mit A E R3 x 3 und b E R3, das per Gauß-Schritte in ZSF gebracht werden soll. Wir sind schnell am Ziel. [ 1 2 3 5 -2 -2

1 1 2

1] I 1 2 1 1 II +(-3) • II [ 0 -1 -2 2) • III 2 0 2 4

1 I -2 II 4 III+ (2) - III

1 2 1 0 -1 -2 0 0 0

1 I -2 II 0 III

7.4.2 Rückwärtseinsetzen findet die Lösungsmenge Liegt ein Tableau in Zeilen-Stufen-Form vor, dann lässt sich die Lösungsmenge leicht auslesen. Das Verfahren wird „Rückwärtseinsetzen" genannt, weil man mit der letzten Zeile des Tableaus, die keine Nullzeile ist, beginnend sich nach oben arbeitend in jedem Schritt die Lösung für einige Variablen fest legt. Das Prinzip in Worten lautet: Lösche Nullzeilen und übersetze das Tableau in ein LGS. Hat eine Gleichung genau k — 1 führende Koeffizienten die Null sind, dann lässt sich der Wert der Variablen x k bestimmen, wenn die Werte der Variablen xk+i , , x,„.. bestimmt sind. OXI +... + OXk -1+ Alc Sk

gkxk

Pk+1Sk+i +... + =b

rk =

4-

Mk-Flx/0-1-1

- Art .n

Fik Xkl-1 - • • • - ec-Xrt

Diese Beobachtung wollen wir nun in ein algorithmisches Verfahren gießen, welches die Lösungsmenge eines Tableaus in ZSF ausliest. DEFINITION 7.58. Sei [Alb] ein Tableau in Zeilen-Stufen-Form mit A E Km'n. Für alle Zeilen mit Index i, die keine Nullzeilen sind definieren wir die Weite w(i) = min{j E {1,

318

:

0} — 1

LINEARE GLEICHUNGSSYSTEME

von Zeile i als den kleinsten Spaltenindex, der von 0 verschiedenen Einträge in Zeile i minus 1. Nullzeilen haben Weite n. Außerdem definieren wir die Schrittweite s(i) = w(i 1) — w(i) von Zeile i als die Differenz der Weiten von Zeile i + 1 und i für alle i E {1, ... m — 1} und die Schrittweite s(m) = n — w(m) von Zeile m. Für Zeile i ist /i(A) = {j E {1 ...n} : w(i) + 1 < j < w(i 1) + 1} die Indexmenge der Spalten mit Index größer w(i) + 1 und kleiner w(i + 1) + 1. BEMERKUNG

7.59. Die Indexmenge Ii (A) ist leei falls Zeile i Schrittweite 1 hat. ■

BEISPIEL 7.60. Wir berechnen die Weiten und Schrittweiten der Zeilen des Tableaus in ZSF aus Beispiel 7.50. Es sind

A=

(1 2 3 4 5 ) w(1) = 0 und s(1) = w(2) — w(1) = 1 — 0 = 1 0 2 3 5 7 w(2) = 1 und s(2) = w(3) — w(2) = 3 — 1 = 2 5— w(3) = 5— 3= 2 w(3) = 3 und s(3) = 00 03 9

B=

(1 2 3 4 02 35 oo 03 00 00 00 00

und 5 7 9 0 0

w(1) w(2) w(3) w(4) w(5)

= = = = =

0 1 3 5 5

und und und und und

s(1) s(2) s(2) s(0) s(0)

= = = = =

w(2) — w(1) w(3) — w(2) w(4) — w(3) w(5) — w(4) 5— w(3)

= = = = =

1— 0 = 1 3— 1= 2

5—3=2 5—5=0 5— 5= 0

Außerdem berechnen wir die Mengen /i(A) für Matrix 1 2345 ) /i(B) = 0 B=

O 2 3 5 7 /2(B) = {3} 0 0 0 3 9 /3(B) = {5} O 0 0 0 0 14(B) = 0 15(B) = 0. O 0 0 0 0

• Wir beschreiben dies direkt als Schema F.

319

k

LINEARE GLEICHUNGSSYSTEME

SCHEMA F 7.61 (Durch Rückwärtseinsetzen die Lösungsmenge eines LGS finden). Gegeben sei ein Tableau [Alb] in ZSF mit A E Km" und b E Km, so dass A1,1 • . .

Al

611

[Alb] = b,,,

Vorbereitung des Tableaus. Schritt 1.1. Lösche alle Nullzeilen von [Alb] per Gauß-Schritt G4. Man erhält ein modifiziertes Tableau welches nur noch 0 < 2 < m viele Zeilen hat. Statte das Tableau nun noch mit einer ersten Zeile aus, welche die Spaltenindizes von A führt. Es ist dann 1

..

n bi

be

Schritt 1.2. Prüfe, ob die unterste Zeile von der Form [0... 0 I 14] mit bt # 0 ist. Ist dies der Fall, hat das LGS keine Lösung. Es ist L = 0. Schritt 1.3. Setze Jr. = Uz 1 Iz (A). Für alle j e Jr ergänze die j-te Spalte des Tableaus rechts neben der rechten Seite und multipliziere die Einträge mit —1. Lösche die entsprechende Spalte auf der linken Seite. Auf der linken Seite bleiben also nur noch Spalten mit Index in J1 = {1, , n} \ Jr stehen. Es ist dann [

Jr _ A(Jr)J

.

Lösungen finden. Schritt 2. Für jede Zeile i mit i E {1, Schritte durch.

g} des ergänzten Tableaus, in absteigender Reihenfolge, führe die folgenden

Zeile i: Sei t = w(i) 1. Die Weite w(i) ist im ursprünglichen Tableau [Alb] zu berechnen. Man kann auch einfach nach dem Spaltenindex in der ersten Zeile des ersten von 0 verschiedenen Eintrags in Zeile i suchen. Schritt 2.1 Multipliziere in der rechten Zeile des Tableaus die Zeile i mit dem Faktor A. Schritt 2.2 Subtrahiere in der rechten Zeile des Tableaus und in Spalte t die Zeile i genau Ai,t mal von der Zeile j füralle1< j 0, so dass A = ( 3 c

nal ist.

WI 8.32 Finden Sie eine Belegung der Variablen a, b E .12b orthogonal ist. Z, so dass A = (

,r1"8.33 Zeigen Sie, dass das Produkt zweier ortho-

gonaler Matrizen gleicher Größe wieder orthogonal ist.

v2 = 4 (3)

wir 8.34 Sei C E R3>< 3 eine Matrix deren Spaltenvekdes R2 gegeben. Dann ist U = span(vi) ein Unter- toren orthogonal und normiert sind. Zeigen Sie, dass vektorraum des R3. Geben Sie Piti- (v2 ) und Du (v2) dann für alle Vektoren v E Re gilt an. IIC • vI = 114.

359

Ä AUFGABEN

360

9

Normen und Metriken

Wir haben in Kapitel 8 die euklidische Norm als ein Maß für die Länge eines Vektors im RT kennen gelernt. Wir möchten dieses Konzept nun verallgemeinern und ein verwandtes, das des Abstands, einführen. Ziel ist es unter anderem, die Norm einer Matrix zu definieren. Auf dem Weg dorthin lernen wir auch den Hammingabstand kennen, den wir für die Kodierungstheorie in Kapitel 13 benötigen. Mithilfe der Abstände, die wir definieren, können wir einfache geometrische Objekte studieren, wir werden das vor allem für Kreise tun. Letztlich eine Spielerei, das Konzept der Hammingkugel liefert für die Kodierungstheorie eine hilfreiche intuitive Anschauung.

9.1 Norm - ein Längenbegriff für Vektoren Wir kennen schon die euklidische Norm. Der Name legt nahe, dass es neben der euklidischen Norm noch weiter Normen gibt. Und tatsächlich versteht man anschaulich unter einer Norm (auf Latein nonna zu Deutsch „Richtschnur") in einem Vektorraum, das ,jedem Vektor eine Länge zugeordnet wird". Das kann man tatsächlich auf unterschiedliche Weisen realisieren. Dabei sollten aber bestimmte Eigenschaften des alltäglichen Längenbegriffs erhalten bleiben. Die euklidische Norm entspricht beispielsweise im dreidimensionalen Vektorraum dem gewohnten Längenbegriff. Wir legen drei (eigentlich vier) Eigenschaften fest, die eine „Länge" aufweisen sollte. Sie sollte stets positiv sein, der und auch nur der Nullvektor sollte Länge 0 haben, die Länge eines skalierten Vektors sollte sich um den Skalierungsfaktor verändern und die Länge der Summe zweier Vektoren sollte nicht länger sein, als die Längen der beiden Vektoren selbst. Diese Eigenschaften nun sollte eine Abbildung besitzen, die wir Norm nennen. DEFINITION 9.1. Es sei V ein Vektorraum. Eine Abbildung norm : V —› nennt man eine Norm auf V, falls die folgenden Axiome für alle x, y E V

NORM - EIN LÄNGENBEGRIFF FÜR VEKTOREN

und A E K gelten. norm(x) > 0 N2. norm (x) = 0 x = 0 N3. norm(x y) < norm(x) norm(y)

Nl.

(Positivität) (Absolute Homogenität) (Dreiecksungleichung)

BEMERKUNG 9.2. Die Dreiecksungleichung verdankt ihren Namen der Anschauung, dass die beteiligten Vektoren v1, v2 und vi + v2 die Seiten eines Dreiecks bilden. •

X2

Eine Norm hat also per Definition die drei Eigenschaften Nl, N2 und N3. Ein gewohntes Beispiel ist die aus dem Alltag bekannte und schon in Kapitel 8 besprochene euklidische Norm.

xi Abb. 9.1. Die Dreiecksungleichung.

BEISPIEL 9.3. Die euklidische Norm auf 2, notiert als II • 112 : R2 —) IR mit 1142 = Vx? 4, ist eine Norm. Es gelten die definierenden Eigenschaften.

Nl. Vx1+x22 >0 VxE VX2/ + X22 = 0

= X2 = 0 . nf, = 1 ist und mit (9.3) dann gilt lim 1141/3 = lx11 = 11x11.0•

13 —>co

Allgemein halten wir fest, dass für wachsendes p die betragsmäßig großen Komponenten des Vektors die p-Norm dominieren. In der oo-Norm bestimmt alleine der betragsmäßig größte Eintrag den Wert der Norm. ■

Die p-Normen sind tatsächlich Normen, denn sie erfüllen die Eigenschaften Nl bis N3. LEMMA 9.8. Für jedes p E N± und p = co ist die p-Norm 11 • IIP eine

Norm. Beweis. Der Beweis ist eine Übungsaufgabe.

■

9.2 Metrik - ein Abstandsbegriff auf Mengen Grundsätzlich kann man sich für eine Menge von Objekten eine Geometrie konstruieren. Die einfachste Idee ist sicherlich, je zwei Elementen einer Menge einen Abstand zuzuordnen. Ein Abstand sollte stets positiv sein,

364

METRIK - EIN ABSTANDSBEGRIFF AUF MENGEN

A

symmetrisch (x ist von y genauso weit entfernt wie y von x) und der Umweg über ein drittes Element sollte nicht kürzer sein, als der direkte Weg. Genau diese drei Eigenschaften definieren eine Metrik. DEFINITION 9.9. Es sei A eine beliebige Menge. Eine Abbildung d : A x A -4 R ist eine Metrik, wenn folgende Axiome gelten. (Positivität) (Symmetrie) (Dreiecksungleichung)

Vx, y E A Ml. d(x, y) > 0 Vx, y E A M2. d(x, y) = d(y, x) M3. d(x, y) < d(x, z) + d(z, y) Vx, y, z E A

R BEISPIEL 9.10. Wir definieren für A = Rn die Abbildung d2 : Rn x 1E' so, dass d2 (x, y) = 11x — 02. Diese Abbildung ordnet zwei Vektoren x und y die Länge (in der euklidischen Norm) des Differenzenvektors als Länge zu. Ist diese Abbildung auch wirklich eine Metrik? Wir überprüfen die Eigenschaften M1 bis M3. Ml. Folgt direkt aus der Positivität der euklidischen Norm. Denn nach Ni ist d2 (x, Y) = 11x — Y112 > 0 für alle x, y E M2. Folgt aus der Symmetrie der euklidischen Norm. Denn nach N2 ist d2(x,Y) = Ilx — y112 = II — 1 • (y — 412

= I — 11 • IIy — xII2 =

—

= d2 (y,x)

für alle x, y E n M3. Folgt aus der Richtigkeit der Dreiecksungleichung der euklidischen Norm. Denn nach N3 ist d2(x, y) = Ilx — y112 = Ilx — z + z — y112 Ilx — z112 + 11z — YI12

= d2 (x,z) + d2 (z,y) für alle x, y, z E R'.

■

9.2.1 Induzierte Metriken Das Beispiel 9.10 legt nahe, dass man für jede Norm eine Metrik durch Abbilden auf die Länge der Differenzenvektoren erhält. Das ist in der Tat so. Im Prüfen der Metrikeigenschaften in dem Beispiel ist an keiner Stelle die konkrete Formel für die euklidische Norm eingegangen. Wir halten allgemein fest. auf IV ist die Abbildung d : W x Rn LEMMA 9.11. Für jede Norm R mit d(x, y) = 11y — x11 eine Metrik. Beweis. Ersetze in der Überprüfung der Eigenschaften Ml bis M3 in Bei-

365

k METRIK - EIN ABSTANDSBEGRIFF AUF MENGEN

spiel 9.10 die euklidische Norm 11 . 112 durch eine beliebige Norm 11 • 11. IN

Das Lemma 9.11 motiviert solche aus Normen entstehende Metriken auszuzeichnen. D EFINITION 9.12. Sei d eine Metrik auf einem Vektorraum 1Kn und sei 11 • 11 eine Norm auf diesem. Gilt d(x, y) = 11x — yll für alle x, y E 1K, dann nennt man die Metrik d durch die Norm II II induziert. Wir kennen nun schon viele Metriken auf Vektorräumen, denn jeder der unendlich vielen p-Normen induziert eine Metrik. Wir lernen nun noch eine weiter Metrik kennen, welche in der Kodierungstheorie eine wichtige Rolle spielen wird.

9.2.2 Hammingabstand In der Informationstheorie spielt der Hammingabstand eine wichtige Rolle. Er ist ein Maß für den Abstand zweier Zeichenfolgen oder Wörter (Strings) gleicher Länge. Dabei ist er nur sensibel für die Anzahl der Stellen, an denen sich diese Zeichenfolgen unterscheiden. Man zählt die benötigte Anzahl von Überschreibungen, um die eine in die andere Zeichenfolge zu überführen. Anders ausgedrückt, entspricht der Hammingabstand der Anzahl von Fehlern, welche die eine in die andere Zeichenfolge verändert haben könnte. Formal definieren wir den Hammingabstand folgendermaßen. DEFINITION 9.13. Es sei A eine beliebige Menge. Der Hammingabstand ist die Abbildung dist : An x An —› IR mit

dist(x, y) = I{i E {1, ... n} : xi

yi}1,

welche zwei Tupeln x, y E An die Anzahl der Positionen, an denen sie sich unterscheiden, zuordnet. BEISPIEL 9.14. Für die beiden Tupel x = (1, 0, 3) und y = (0, 0, 0) aus N3 gilt dist(x, y) = 2.

x= =

(1, 0, 3) (0, 0, 0) ungleich gleich ungleich

Es wird ersichtlich, dass sich x und y im ersten und dritten Eintrag unterscheiden xi yt, x2 = y2 und X3

366

METRIK - EIN ABSTANDSBEGRIFF AUF MENGEN Ä

BEMERKUNG 9.15. Beim Hammingabstand geht nicht ein, „wie sehr" sich zwei einzelne Einträge unterscheiden, sondern nur, „ob" sie sich unterscheiden. Es ist zum Beispiel

dist((3, 0, 0), (2, 0, 0)) = dist((27, 0, 0), (0, 0, 0)) = dist((47, 0, 0), (11, 0, 0)) = 1.

Wir rechnen nach, ob der Hammingabstand eine Metrik ist. LEMMA 9.16. Sei A eine beliebige Menge. Dann ist der Hammingabstand eine Metrik auf A'. Beweis. Wir prüfen, ob der Hammingabstand die Eigenschaften M1 bis M3 erfüllt. Ml. Folgt direkt aus der Definition des Hammingabstands. Eine Anzahl von Positionen ist stets positiv. M2. Folgt direkt aus der Definition des Hammingabstands. Die Anzahl von Positionen an denen sich x von y unterscheidet ist gleich der Anzahl von Positionen an denen sich y von x unterscheidet für zwei beliebige Tupel x, y E A". M3. Es seien x, y, z E A' Tupel der Länge n über A. Man kann immer das Tupel z erzeugen, wenn man in x die Stellen, an denen sich x und z unterscheiden, auf den Wert von z setzt. Dafür muss man genau dist(x, z) viele Stellen ändern. Setzt man danach in z die Positionen, an welchen sich z von y unterscheidet auf den Wert von y, erhält man y. Dazu muss man dist(z, y) viele Positionen verändern. Dieser Vorgang startet bei x und endet bei y. Diese beiden Tupel können sich demnach höchstens um dist(x, z)±dist(z, y) viele Stellen unterscheiden. Es gilt die Dreiecksungleichung dist(x, y) < dist(x, z)

dist(z, y). ■

BEMERKUNG 9.17. Dass in der Dreiecksungleichung tatsächlich ein < steht (und nicht ein = oder ein 0 = dist(x, y).

367

S. METRIK - EIN ABSTANDSBEGRIFF AUF MENGEN

BEMERKUNG 9.18. Ist A = R und interpretiert man Vektoren als Tupel, dann ist der Hammingabstand eine induzierte Metrik auf den Vektorräumen Rn. Das sieht man ein, wenn man die 0-Norm 11 ' 110 : Rn —) R als 11x110 = dist(x, 0), die Anzahl der von 0 verschiedenen Einträge von x, definiert. (Dass es sich dabei tatsächlich um eine Norm handelt, ist eine Übungsaufgabe - die 0-Norm ist keine p-Norm!)

Es gilt dann für zwei beliebige Vektoren x, y E Rn, dass dist(x, y) = dist(x — y, 0) = 11x — y110 ist - der Hammingabstand also von der 0-Norm induziert ist. Ein Eintrag des Vektors x — y ist nämlich genau dann 0, wenn die beiden Vektoren in diesem übereinstimmen. ■

9.2.3 Geometrie unterschiedlicher (induzierter) Metriken Bei vielen geometrischen Objekten spielt der Abstand und damit die zugrundeliegende Metrik eine definierende Rolle. Eine Kreisscheibe oder Kugel sind nichts anderes als Mengen von Punkten, deren Abstand zu einem fest definierten Punkt (dem Mittelpunkt) höchstens einem fest definierten Wert (dem Radius) entspricht. Ändern wir die Metrik, also die Abstandsdefinition in einer (Punkt-)Menge, dann ändert sich die „Form" solcher geometrischer Objekte, deren Definition die Metrik involviert. Kugeln sind solche Objekte und wir definieren zunächst, was eine Kugel bezüglich einer allgemeinen Metrik ist. DEFINITION 9.19. Sei A eine Menge, auf welcher eine Metrik d definiert ist und x E A. Dann definieren wir

Br (x, A) = {y E A : d(x, y) < r} die Kugel (oder den Ball) um x mit Radius r in A und

Sr (x, A) ={y

e

A: d(x , y) -= r}

die Sphäre (oder die Oberfläche) um x mit Radius r in A bezüglich der Metrik d. Handelt es sich bei der Metrik d um den Hammingabstand auf A', so nennen wir Br (x, An ) auch die Hammingkugel um x mit Radius r. BEMERKUNG 9.20. Ist aus dem Kontext klar, um welche Menge A es sich handelt, wird diese in den Symbolen auch weggelassen. Aus 13, (x, A) bzw Sr (x, A) wird dann 13, (x) bzw. 8,-(x). ■

BEISPIEL 9.21. Wir werden im Folgenden die Kugel /31(0, V) zunächst im reellen Vektorraum, dann auch in Vektorräumen über endlichen Körpern bezüglich

368

METRIK - EIN ABSTANDSBEGRIFF AUF MENGEN

A

unterschiedlicher Metriken betrachten. S. Sei V = Rn. Die euklidische Norm induziert eine Metrik auf dem Rn. Es gilt nach Lemma 9.11 d2 (v, w) = 11v — w112. Ist einer der Vektoren 0, dann gilt d2 (v, 0) = 11v — 0112 = 11 7412 . Es ist also ( x?„ < 1} . Bi (0,Rn) =Ev Rn : d2 (v, 0) = 1142 = \/x? + Das sind genau die Punkt, die im Kreis/in der Kugel mit Radius 1 um die 0 liegen, wie Abbildung 9.2 für n = 2 veranschaulicht. • Die 1-Norm induziert die Metrik di (v, w) = 11v — will. Die durch diese Metrik definierte Kugel mit Radius 1 und die 0 lautet Bi (0, Rn ) = {V E Rn : di (v, 0) = IIvil =

Eivil

i=i

Abb. 9.2. Die Kugel Bi (0, R") bezüglich der durch die euldidische Norm induzierten Metrik.

wie in Abbildung 9.3 für n = 2 veranschaulicht. k Die co-Norm, welche jeden Vektor v E W auf My 111 = maxi Ivi 1 abbildet, induziert die Metrik dc,..(v, w) = 11v — w1100- Die durch diese Metrik definierte Kugel mit Radius 1 und die 0 lautet 51(0,

= {V E

: dn. (v, 0) = 11v11 = max1vi I < 11 .

Das sind genau die Punkte, die in einem auf der Seite(nfläche) liegenden Quadrat/Würfel um die 0 liegen, wie in Abbildung 9.4 für n = 2 veran- Abb. 9.3. Die Kugel 13 (0, R") bezüglich der schaulicht. durch die 1-Norm induzierten Metrik. } Die Kugel im IR2 bezüglich des Hammingabstands ist 131(0, 2 ) = {v E Rn : dist(v, 0) < 1} .

X2

Das sind genau die Punkte, die auf den Achsen liegen. Für einen anderen Mittelpunkt sind es die verschobenen Achsen durch diesen Punkt, wie in Abbildung 9.5 veranschaulicht. 5. Die Kugel im iq bezüglich des Hammingabstands ist

x1

/31(0,Rn) = {v E Rn : dist(v, 0) < 1} . Das sind genau die Punkte, die „auf den Achsen liegen". Für einen anderen Mittelpunkt sind es die verschobenen Achsen durch diesen Punkt. So sind die ) mit R dius 1 im 1R2 gegeben Hammingkugeln um die Punkte (c)o) und (iia durch

Abb. 9.4. bezüglich der Die Kugel 13 (0, durch die oo-Norm induzierten Metrik. X2

131 ( (00 , F3) =

(0) ,

, (0) , (0i) , (2) }

1

und

xl

/31 ( (1)

F3) = {G), (1), (0, (7), (201

alle Punkte die Hammingabstand höchstens 1 zu (1 bzw. (1) haben, wie

Abb. 9.5.

in den Abbildungen 9.6 und 9.7 veranschaulicht.

Die Kugel Bi (0,112 ) bezüglich des Hammingabstands.

369

k NORM - EIN ALLGEMEINER LÄNGENBEGRIFF

• X2

2

•

1•

•

• 1

Auf den ersten Blick sind Hammingkugeln also ein nicht sehr anschauliches Konstrukt. Ist aber, wie im Kontext der Kodierungstheorie, der Hammingabstand der „richtige" Abstandsbegriff, kann man diese Vorstellung eines Abstandes für die Anschauungen wiederum intuitiv verwenden • IP (wir haben Metriken mit dem Ziel definiert, intuitiv von Abständen reden 2 xl Abb. 9.6. zu können). Wir werden im Kontext der Kodierungstheorie häufig von Hammingkugeln um Codewörter oder Wörter sprechen.

Die Hammingkugel Bi ( (°0) n) .

9.3 Norm - ein allgemeiner Längenbegriff X2 2

•

Grundsätzlich haben wir Normen auf beliebigen Vektorräumen definiert. Die Elemente der Vektorräume können die unterschiedlichsten mathe• 1 matischen Objekte sein. Es kann sich um reelle Funktionen, Matrizen, • .I Polynome und vieles mehr handeln. Die Vektorräume müssen auch nicht 2 xi 1 zwangsläufig unendlich-dimensional und damit isomorph zu einem 1K' Abb. 9.7. sein. Die p-Vektornormen sind für diese Vektorräume nicht definiert. Wir Die Hammingkugel r i ( (C)0) n)• möchten uns nun mit Matrixnormen beschäftigen.

9.3.1 Matrixnormen

Die Menge der reellen m x n-Matrizen ist ein IE8-Vektorraum. Die Matrizen Efi'31 deren einziger von 0 verschiedener Eintrag der Eintrag in der i-ten Zeile und j-ten Spalte gleich 1 lautet, bilden eine Basis des Vektorraums Rm X n . Demnach hat dieser Vektorraum Dimension 772,• 7/ und ist isomorph zum Vektorraum Et' . Die Isomorphie ist über die Existenz einer isomorphen Abbildung definiert (die Abbildung, welche Vektoren aus dem Vektorraum Rm X n mit Vektoren aus dem Vektorraum Rm'n identifiziert.). Mithilfe dieser Abbildung kann aus jeder Norm auf dem I"""'•" eine Norm auf dem Rmx n gewonnen werden. D EFINITION 9.22. Sei f :Rm x n -+ lEkm - ' ein Isomorphismus und H ' r eine Vektornorm auf Rmm. Dann nennen wir die Abbildung H • : Rm I mit I I A I`= Hf(A)r die über die Vektornorm 11 • I gebildete Matrixnorm 118"1".

r

370

NORM - EIN ALLGEMEINER LÄNGENBEGRIFF

Diese Matrixnormen sind tatsächlich Normen auf dem Vektorraum Rm". SATZ 9.23. Sei eine Norm II • 11V auf Rm'n gegeben. Die über II • 11* gebildete Matrixnorm auf Rm" ist eine Norm. Beweis. Wir prüfen, ob II • 11* die Eigenschaften Nl bis N3 erfüllt.

>

Ni. Da II • N1 erfüllt, ist 11A11* = 11 f (A)r 0 für alle A e Rm". 0, wenn N1 erfüllt, gilt genau dann IIAII* = 11 f (A) Da 11 • f (A) = 0 ist. Da f aber eine injektive lineare Abbildung ist, gilt genau dann f (v) = 0, wenn v = 0 ist. Also gilt genau dann IIAII = 0, wenn A = 0 ist. N2. Da f eine lineare Abbildung ist und II • HV N2 erfüllt, ist

r

r=

• A)ii v = II. • f(A)ii v = a • ii.f(A)iiv = Ä •

IIA • Ali * =

für alle A E ie und A e "1". N3. Da f eine lineare Abbildung ist und II • 11' N3 erfüllt, ist IIA+BII* =lif(A+ B)liv = f (A) + f Ilf(A)11v + Ilf(B)11v = IIAII` + IBII* für alle A, B E

mxn

■ Bevor wir uns Beispiele von über Normen gebildeten Matrixnormen auf dem Rm" anschauen können, einigen wir uns auf einen zugrundeliegenm X n Rm•n den Isomorphismus f . Dazu wählen wir die Abbildung f : mit f (E [%ii) = e(i±in) , welche als der kanonische Isomorphismus von nach Rm.n bezeichnet wird. Diese Abbildung bildet eine Matrix A auf den Vektor ab, welcher aus den aneinandergehängten Spalten der Matrix A entsteht.

11;k m n

BEISPIEL 9.24. Betrachte den Vektorraum der 2 x 2 Matrizen. Die Basis besteht aus den vier Matrizen

E[1,11 =. (1 )

o

E[2,1] _ (0

o

o)'

Ep.,2] _ (o o) l 0

E[2,2] _ (o o ) . o 1) .

Den kanonischen Isomorphismus angewendet erhalten wir f (( 10.

= (0o)

f ((oo

=

371

A

NORM - EIN ALLGEMEINER LÄNGENBEGRIFF

und

f

((°, ,7) ) = (ooi) , f

= (o0) . I.

Eine beliebige Matrix A = (04 _ 2 wird also auf f ((0

_ 2)) = f

• E[1-11 + 0 • E[2'11 + 2 • E[1-2] + (-2) • E[2,21)

= 4 • f (E[1,11 ) + 0 • f (E[241 ) + 2 • f (E [1,21) + (-2) • f (E [2' 21 ) = 4 - (°o) + 0 (°) +20 1

1

0 1

+ (-2) ( ()0o) = 1

° 42 -2 )

■

abgebildet.

Wir betrachten unterschiedliche über p-Normen gebildete Matrixnormen. 9.25. Betrachten wir zunächst die über der euklidischen Norm auf dem gebildete Matrixnorm. Dann gilt

BEISPIEL

10111 = II f (A)112

m EE1A j=1. i=1

Diese Norm wird auch als Frobeniusnorm bezeichnet.

■

BEISPIEL 9.26. Betrachten wir dann die über der oo-Norm auf dem Rrn ' 71 gebildete Matrixnorm. Dann gilt

MAlgo = ilf(A)1100 = max {iAiii} i=1,...,m

Diese Norm entspricht dem Betrag des betragsmäßig größten Eintrags.

■

Klassischer Weise ist man an Matrixnormen mit der folgenden Eigenschaft interessiert. DEFINITION 9.27. Eine Abbildung f : IRm" x lien X2 -# IR+ heißt submultiplikativ, wenn für alle A E R"1"1 und B E fel x£ gilt f (A • B) f (A) • f (B).

Leider haben nicht alle über Vektornormen definierte Matrixnormen diese Eigenschaft. BEISPIEL

372

9.28. Die über der oo-Norm gebildete Matrixnorm ist nicht submultipli-

NORM - EIN ALLGEMEINER LÄNGENBEGRIFF

kativ. Wählt man A= 1 (1

1)

und

mit

B = (11)

A • B = (22 2). 2

ist 11A • /3117;. = 2 ?_ 1 • 1 = IIA117;‘, • Es gibt einen alternativen Weg submultiplikative Matrixnormen aus Vektomormen zu gewinnen. Natürliche Matrixnormen

Für jede Vektornorm lässt sich, wie in Definition 9.22 gesehen, eine zugehörige Matrixnorm definieren. Die dort gezeigte Konstruktion ist jedoch nicht die einzige Möglichkeit. Alternativ lässt sich eine anschauliche Matrixnorm als so genannte Operatornorm definieren. Diese Normen „messen" für eine Matrix A, um welchen Faktor sich die Länge eines Vektors, welcher mit der Matrix A multipliziert wird, höchstens verändert. Dabei wird die Länge des Vektors x E 111n und die Länge des Vektors A • x E E8' 2 mit der zugrundeliegenden Vektornorm „vermessen" und der Quotient gebildet. DEFINITION 9.29. Sei 11 . 11 v eine Norm auf dem 1[87 und dem Re.m. Dann nennen wir eine Abbildung I • II : lRm —› IR>o mit IIAll

A

= !T2Z*' s00

"

I X. 17v "v

die durch die Norm II • ih" induzierte (natürliche) Matrixnorm (oder Operatornorm). BEMERKUNG 9.30. Die Definition 9.29 der induzierten Matrixnorm involviert ein Optimierungsproblem über eine überabzählbar große Menge von Vektoren. Die Berechnung erscheint auf den ersten Blick schwierig zu sein. In Lemma 9.36 werden wir alternative Formeln für drei wichtige induzierte Matrixnormen kennen ■ lernen.

Wie rechnen nach, ob induzierte Matrixnormen Normen sind. auf Rn und Wz'. Die durch LEMMA 9.31. Gegeben sei eine Norm 11 • 11' liv induzierte Matrixnorm II • 11 auf I.nx,n ist eine Norm.

r

Beweis. Wir prüfen, ob die induzierte Matrixnorm 11 • II die Eigenschaften

N1 bis N3 erfüllt. 373

NORM - EIN ALLGEMEINER LÄNGENBEGRIFF

Ni. Da II • 11V N1 erfüllt, ist für alle x E \ {0} auch WI > 0 und somit HAI! > 0 für alle A E mXn Da II • r Ni erfüllt, ist IIAII = 0 falls für alle x e 1R' \ {0} gilt Ax = 0. Diese ist aber alleine für die 0 e ' Xn (die Nullmatrix) der Fall. N2. Da II • 11" N2 erfüllt, ist 1p, .A _ ll

0x max {11A.Aii

max

.:11v

so

rEutn xo

J

r HA • xr

f ), 11A • xliv 1 11xIlv I

= A • "A"

3‘ = A • 1roo für alle A E R und A E Rm x n. N3. Da II • r N3 erfüllt, ist IIA+ BII•=max

.Ea'

f

max .Ea"

B)

xo

N3

< max xeln xes)

liA x B xliv Ilxlly

.00

{ IIA • xlr

• Xil v

Ilxlly

x00

s00

" BI x; "

}

für alle A, B . Die letzte Ungleichung gilt, weil das Maximum der einzelnen Summanden nicht für das gleiche x auftreten muss.

■ Eine erste „Vereinfachung" im Berechnen von induzierten natürlichen Matrixnormen erhält man, wenn man einsieht, dass das Maximum nicht über alle von 0 verschiedenen Vektoren zu ermitteln ist, sondern es die Menge der normierten Vektoren schon tut. LEMMA 9.32. Sei II • r eine Norm auf IR" und IR"". Dann lässt sich für jede Matrix A E Il8n X m die induzierte natürliche Matrixnorm berechnen mittels

1011= sE rnax {MA • xli v}. R' 1141=1

Beweis. Jeder Vektor x E IV lässt sich als das Produkt von 1141 mit seinem

374

NORM - EIN ALLGEMEINER LÄNGENBEGRIFF

A

-I- • x schreiben. Offensichtlich gilt - = 11.11 normierten Vektor X' 11A • x11'

11A • "X. •11x1rr

IIxII v

IIxII v

11A •

e • lixr =i1A . ±r. lie

Das Maximum ändert sich also nicht, wenn man die zugrundeliegende ■ „Prüfmenge" auf normierte Vektoren reduziert. Wir erhalten mit Lemma 9.32 die schon zu Beginn angedeutete Anschauung induzierter natürlicher Matrixnormen. Die der Maximumsbildung zugrundeliegende Menge von normierten Vektoren ist die Sphäre S1 (0,1Rn) mit Radius 1 um den Ursprung. Um die induzierte Matrixnorm einer Matrix A zu berechnen, betrachtet man schlicht das Bild dieser Sphäre und sucht den Vektor mit der größten Länge bezüglich der zugrunde liegenden Vektornorm 11 •

r.

BEISPIEL 9.33. Wir betrachten die durch die euklidischen Norm 11 • 112 auf leg induzierte Matrixnorm auf R2 x 2 . Wähle dazu

A=

(1 0)

o

Das Bild der Sphäre S1(0, Illn ) bezüglich der euldidischen Norm entspricht dem in x2-Richtung gestauchten Einheitskreis. Siehe Abbildung 9.8 für eine schwache ■ Illustration. Induzierte natürliche Matrixnormen sind submultiplikativ. und IR'. Die induzierte natürliLEMMA 9.34. Sei 11 • 11 eine Norm auf iv. submultiplikat ist X"' 1W' auf che Matrixnorm 11 . 11 Beweis. Der Beweis ist eine Übungsaufgabe.

■ Abb. 9.8.

Natürliche Matrixnormen berechnen

Die Einheitssphäre bezüglich der euldidischen Norm und das Bild bezüglich A.

Für manche durch p-Normen induzierte natürliche Matrixnormen gibt es einfache Formeln. DEFINITION 9.35. Wir bezeichnen die durch die p-Norm auf 1W' und IR' induzierte natürliche Matrixnorm auf IR' als p-Matrixnorm und schreiben für diese ebenfalls ll • II,. Die versprochenen einfachen Regeln folgen nun. Die Eigenwerte behandeln wir in Kapitel 11.

375

X

AUFGABEN

LEMMA

9.36. Sei A E

n. Es gelten folgende Formeln. m

=

max E lAijl j =1,••• n i=1

1 IIA11 2

wobei k der größte Eigenwert von AT • A ist.

=

11 A11 00 = i=i,••• maxm E j=1 BEMERKUNG 9.37. Aus offensichtlichen Gründen wir die 1-Matrixnorm als „Spaltensummennorm", die oo-Matrixnorm als „Zeilensummennorm" und die 2-Matrixnorm als „Spektralnorm" (das Spektrum einer Matrix ist die Menge der Eigenwerte) bezeichnet. • 2) BEISPIEL 9.38. Für die Matrix A = (4 0 —2 berechnen wir ihre Normen

11A111 = max {141 + 10141 + — 21} = max {4,4} = 4 11A1100 = max{141+ 121,101 + 1 — 21} = max {6,2} = 6. Außerdem ist AT • A = (168 1s ) dessen charakteristische Polynom det

16 8)16 — .0) = (16 — A)2 — 64 = (x — 8) • (x — 24)

die Eigenwerte k1 = 24 und k2 = 8 liefert. Es ist demnach 11A112 = .Vmax {8,24} = 24. •

9.4 Aufgaben

NORM - EIN LÄNGENBEGRIFF FÜR VEKTOREN. At

9.1 Welche der folgenden Aussagen ist korrekt?

bezeichnet. vi. Die 2-Norm ist die euklidische Norm. vr' 9.2 Es seien die Vektoren

3 —) 9 i. Es gibt neben der euklidischen Norm weitere v— (-4) und w= ( 2 Normen auf den Vektorräumen Rn. 12 3 ii. Die Norm eines Vektors ist immer positiv, unabgegeben. Berechnen Sie die 1-, 2-, 3- und oo-Normen hängig von der konkreten Norm. iii. Anschaulich gesprochen bedeutet die Dreiecks- des Vektors v. ungleichung, dass die Längen der Seitenkanten 4 9.3 Berechnen Sie die 1-Norm und die 5-Norm der in unterschiedlichen Normen ungleich sind. Vektoren v1 = (01) und v2 = iv. Die oo-Norm wird auch als Maximumsnorm bezeichnet. wri' 9.4 Zeigen Sie, dass für einen beliebigen Vektor v. Die 1-Norm wird auch als die Minimumsnorm

376

AUFGABEN

{0} gilt IIv11p1 > IIvIIP2 für alle pi,P2 E N+ U lool mit pi < p2.

v E Rn

wrir 9.5 Zeigen Sie, dass für einen Standardeinheitsvektor eis) aus dem RV für Pi, P2 E N+ U {oo} gilt iie(s) ilpi = lie(s) 11792,r19.6 Zeigen Sie, dass für einen beliebigen Vektor v E Rn \ {0}, welcher nicht einem Vielfachen eines Einheitsvektors entspricht, gilt 1141,1 > Ilv112,2 für alle Pi P2 E N+ U { oo} mit Pi < P2. wr1' 9.7 Finden Sie für alle p-Normen alle Vektoren der Form Ä • (1), mit E R und

= 1.

erl 9.8 Beweisen Sie Lemma 9.8. Zeigen Sie also, dass für jedes p e N> 1 und p = oo die p-Norm II • 11 eine Norm ist. METRIK EIN ABSTANDSBEGRIFF AUF MENGEN. A 9.9 Welche der folgenden Aussagen ist korrekt?

i. Es kann auf jeder Menge eine Metrik definiert werden. ii. Jede Norm auf einem Vektorraum induziert eine Metrik. iii. Der Hammingabstand ist nur auf Vektorräumen definiert. iv. Die Hammingkugel mit Radius 1 über dem Vektorraum Fn hat endliche Kardinalität. wrir 9.10 Berechnen Sie den Abstand der Vektoren v und w bezüglich der von der 4-Norm induzierten Metrik. wel` 9.11 Nennen Sie den Hammingabstand der Tupel (1, 0, 0, 1, 1, 0) und (1, 0, 1, 1, 0, 1), also dist ((1, 0, 0,1, 1, 0), (1, 0,1,1, 0, 1)) %' 9.12 Welche Vektoren des 2 liegen in der Menge 131

((g) ,R2 ) n

(0) ,N,2)

bezüglich der Metrik, die durch die 1-Norm induziert wird? % 9.13 Skizzieren Sie die Sphäre (Oberfläche) S1(0, R2 ) bezüglich der durch die 1-Norm induzierten IR mit di (v, w) = Iv — Metrik d1 : R2 x R2 wrk 9.14 Wie viele Punkte liegen in der Hammingkugel

133 (0, (F7)4 ), wobei 0 = (0, 0, 0, 0)? orl' 9.15 Es sei die Menge A = {a, b, c} und die Punkte x1 = (a, a, c, c) und x2 = (c, a, b, b) im A4 gegeben. i. Wie viele Punkte des A4 liegen in der Hammingkugel 82 (x1, A4)? ü. Wie viele Punkte des A4 liegen im Schnitt der Hammingkugeln B2 (Xi, A4) und 132 (x2 , A4)? vek 9.16 Sei p eine Primzahl und n E N und S = {0, 2, p, 1 + n • (p — 1)}. Zeigen Sie, dass für ein beliebiges Paar von Vektoren v, w E (Fp)n stets gilt 1/31 (v, (Fp)n) n Bi (w, (Fp)n)1 E S. wri' 9.17 Wie viele Punkte liegen in der Hammingkugel 133(0, (1F7)4), wobei 0 = (0, 0, 0, 0)? 41' 9.18 Zeigen Sie, dass die zu Beginn von Abschnitt 9.3.1 definierten Matrizen E[i, j1 eine Basis des Vektorraums Rm" bilden. WI' 9.19 Seid : V x V R eine Metrik auf einem Vek-

torraum V. Zeigen Sie, dass die Abbildung f : V —› V mit v ti d(v, 0) eine Norm auf V ist. NORM - EIN ALLGEMEINER LÄNGENBEGRIFF. A 9.20 Welche der folgenden Aussagen ist korrekt?

i. Die Menge aller reellen m x n-Matrizen bildet einen R-Vektorraum. ii. Die über der co-Norm gebildete Matrixnorm ist submultiplikativ. iü. Es gibt mindestens zwei Möglichkeiten, aus einer Vektornorm eine Matrixnorm zu gewinnen. iv. Natürliche Matrixnormen werden auch als Operatornormen bezeichnet. (3 2 1 wrir 9.21 Es sei die Matrix A = — 4 2 1 . gegeben. 12 2 2 *. Berechnen Sie IIAIIi , 1121112 und 11A110‹, NJ' 9.22 Zeigen Sie, dass die Frobeniusnorm auf 2 x 2Matrizen submultiplikativ ist. wrl 9.23 Es sei normx () eine Funktion in Sage, welche für einen Vektor der Dimension n • m eine Länge berechnet und auf dem Fn'm eine Norm bildet. Implementieren Sie eine Funktion normmatrix ( ) welche für eine n x m-Matrix die über die Vektornorm normx ( ) gebildete Matrixnorm ausgibt. Zum Testen

377

1.

AUFGABEN

Ihrer Funktion normmatrix ( ) nutzen Sie die euklidi- dass für II .11, eine Norm auf Rn und m, die induzierte sche Norm def normx (v) : return v . norm () . natürliche Matrixnorm II auf Rn X m submultiplikativ ist. wrk 9.24 Beweisen Sie Lemma 9.34. Zeigen Sie also,

378

13 Die Determinante Wir werden nun einer quadratischen Matrix A E 1K"" über einem Körpern K eine Zahl aus diesem zuordnen, die etwas über die Invertierbarkeit der Matrix A verrät. Diese Zahl werden wir die Determinante der Matrix A nennen. Eine solche Zahl kennen wir schon, denn die Dimension des Kerns, die man leicht ausrechnen kann, gibt darüber Auskunft, ob A invertierbar ist oder nicht. Die Determinante soll mehr können. Historisch studierte man die Determinante im Kontext von (homogenen) linearen Gleichungssystemen. Wie wir schon wissen, hat ein lineares Gleichungssystem A • x = b (mit einer quadratischen Matrix A) genau dann eine eindeutige Lösung, wenn die Zeilen und/oder Spalten von A linear unabhängig sind, der Rang von A also gleich n ist. Die Determinante soll nun die Eigenschaft haben, dass Gauß-Schritte sie nicht bzw. nur nachvollziehbar verändern. Tatsächlich werden wir mit einer geometrischen Interpretation der Deeinsteigen, ein bestimmtes Volumen entspricht der terminanten im Determinanten. Dann werden wir die Determinante auf Matrizen über beliebigen Körpern verallgemeinern. Grundlegend wichtig werden die drei folgenden Einsichten des Kapitels, welche nun vielleicht noch schleierhaft erscheinen. Der Schleier wird sich im Studium des Kapitels lüften. • Die Determinante einer Matrix A ist genau dann 0, wenn die Spalten von A linear abhängig sind. s. Die Determinante ist multilinear (dies hilft beim Berechnen per Gauß-Verfahren). k Die Determinante lässt sich... — ... per Zeilen- oder Spaltenentwicklung berechnen [Verfahren hat theoretische Bedeutung, in der Praxis nur für kleine Matrizen geeignet.] — ... per Gauß Verfahren berechnen [Verfahren hat große praktische Bedeutung.]

k DAS PARALLELOTOP UND DAS ORIENTIERTE VOLUMEN

10.1 Das Parallelotop und das orientierte Volumen

Wir definieren zunächst das von endlich vielen Vektoren aufgespannte Paralleloptop. DEFINITION 10.1. Es seinen m Vektoren b1, nennen die Menge

P. (bi, • • • , bm)

{Ai • bi +

E 1Rn gegeben. Wir

1, + Ani • by,, : .

das Parallelotop der Vektoren Wir sagen ein Parallelotop Pri (bi, sion n', wenn dim(span(bi,

E IV in Dimension n. , bm) in der Dimension n hat Dimen= n'.

Für eine Matrix A E IR' schreibt man statt P({A(1) , kurz P(A).

X2

I

Das Parallelotp P2 (b1, b2) der beiden Vektoren b1 und b2 aus Beispiel 10.3.

A(n)l) auch

BEMERKUNG 10.2. Anschaulich gesprochen, entspricht ein Parallelotop einer Menge von Vektoren genau den Vektoren, die man erreicht, wenn man in jede von den Vektoren angezeigte Richtung höchstens deren Länge läuft. Oder anders gesprochen, alle Linearkombinationen, deren Koeffizienten zwischen 0 und 1 liegen. ■ BEISPIEL 10.3. Wählt man die zwei Vektoren

Abb. 10.1.

E [0, 1 ]}

b1 = (52) und b2 = (42) des

R2, so ist das Parallelotop P2(b1 , b2 ) dieser Vektoren ein Parallelogramm. Ein Parallelogramm ist im Prinzip ein verzerrtes Rechteck - siehe Abbildung 10.1 für eine Illustration. ■ 4

BEISPIEL 10.4. Wählt man die drei Vektoren

(i

1

b1 = 1 , 62 = 3 und b3

des R3, so ist das Parallelotop P2 (b1 b2 , b3) ein verzerrter Quader - siehe

3

■

Abbildung 10.2 für eine Illustration.

Wir definieren nun, was wir unter dem Volumen eines Parallelotops verstehen. DEFINITION 10.5. Es seien bi , ... E Rn und U = span(th, bm-i). Dann setzen wir V(0) = 1 und Abb. 10.2. Das Parallelotp P2 (bi , b2, b3) der drei Vektoren b1, b2 und b3 aus Beispiel 10.28.

V (P(bi ,

bm )) =V(P(bi,... ,bm-i)) • Du(b.)

das Volumen des Parallelotops P(bi,

bm ).

BEMERKUNG 10.6. Das Volumen von Parallelotopen ist rekursiv definiert. Wählt

380

DAS PARALLELOTOP UND DAS ORIENTIERTE VOLUMEN

A

E Rn, so entspricht das man einen beliebigen Vektor aus der Menge b1, dem Produkt des Volumens des Parallelotps ohne den Volumen von P (bi , • • . gewählten Vektor und des Abstands zu dem von den übrigen Vektoren aufgespann■ ten Unterraum. 0

3

2 BEISPIEL 10.7.

Gegeben seien die Vektoren b1 = (0) , 62 = (4) und b3 = (c) . 2

Dann ist V(P(191, 62, b3)) =V(P(bi, 62)) • Dspan(bi,b2)(b3) =V(P(bi)) . Dspan(bi)(b2) • Dspan(bi,b2)(b3 ) =WO) • Dspan (0) (bi.) • Dspan(bi)(b2) • Dspan(61,62) (1)3)

Es ist Dspan(0)(b1) = 2, Dspan(bi) (b2) =

4,

Dspan(b i. ,b2) ( 63) =

2

und somit ist V(P(bi , 62, b3)) = 1 • 2 • 4 • 2 = 16. - siehe Abbildung 10.3 für eine ■ Illustration. Das folgende Lemma liefert einen Zusammenhang zwischen der linearen Abhängigkeit der ein Parallelotop aufspannenden Vektoren und dessen Volumen. E Rn. Dann ist genau dann LEMMA 10.8. Es seien b1, . V (P (bi wenn die Vektoren b1,

x3

0,

,b„, linear abhängig sind.

Abb. 10.3. Das Parallelotp P2 (bi , b2, b3) der drei Vektoren b,, 62 und 63 aus Beispiel V(P(b1, , b„,„)) = 0 Es gibt ein bi, so dass Du (bz ) = 0 ist, mit 10.7. U = span(bi, • • • , bz-1). < > Der Vektor bi lässt sich als Linearkombinati, b„ und on der Vektoren b1, ... bz-1 schreiben. < > Die Vektoren b1, ■ ,b,„, sind linear abhängig. somit auch die Vektoren b1, Beweis. Wir zeigen die Äquivalenz der beiden Aussagen als eine Folge von Äquivalenzen.

Das Paralleltop von Vektoren b1, . ,b„,, ist unabhängig von der Reihenfolge der Vektoren. In der Definition des Volumens spielt die Reihenfolge jedoch eine Rolle. Wir zeigen, dass das Vertauschen der Vektoren in b1, . , bm das Volumen des zugehörigen Parallelotops nicht ändert. LEMMA 10.9. Es sein b1, . , bn,_ 2 , a, b Vektoren des Rn . Dann gilt V (P (bi • • ,

—2, a, b)) = V (P

, bm_ 2, b, a)).

381

DAS PARALLELOTOP UND DAS ORIENTIERTE VOLUMEN

Beweis. Es sei U = {b1,... ,bn_2}. Dann gilt a= ai + 4 b= g + bi a = a'2 + 4 b = b2 + b2

mit ai E span(U), ai E span(U)1 mit bi E span(U U {a}), bi E span(U u {a})± mit a2 E span(U U {b}), 4 E span(U U {b})-' mit b'2 E span(U), b2 E span(U)1

Dann gilt V(P(bi ,

br,_2 , a, b)) = V (P (bi b,_ 2, b, a)) =

-2)) • 11411 ' Ilb~ II --2)) • libn • Ilan.

Es ist also zu zeigen, dass KM • iia211 gilt. Dazu berechnen = wir aus 4, b2 E span(U)1 die beiden Vektoren b - b2

(b'2', Hda2 a1

und

a - a1

(4,

)

111g2

„ b2 ,

aus span(U)1 (Abgeschlossenheit) indem wir jeweils den Algorithmus = 0. Da d , 1/2 E span(U) und b, ä E span(U)1 gelten GramSchmidtStep anwenden. Es ist also (b, an = 0 und (a,

(b, a) = (-6, + 4) = (T), di ) + (T), a') = 0 + 0 = 0 b) = = (a-, bi2 ) + (a, 1/0 = 0 + 0 = . Also ist 6 E span(U U {a})-L und a E span(U U {b})1. Außerdem gilt b = 1/2

= b'2 ±6

(a di ) E span(UU{a}). Also ist

mit

und T), so dass gilt b = 1)1! E span(U U {a})±. Analog gilt a = ai + 4 = ai + mit

(b2 a1) ( Han 2 a 61'1)

b'1' mit

on112'2 )

= b2 k.

■ BEISPIEL 13.20. Wir betrachten den binären Code c2 =

(0,

0, 0, 0, 0, 0),

(1, 0, 1, 0, 1, 0),

(1, 1, 1, 1, 1, 1)

}

• Der Code ist 2-fehlererkennend. Das Ändern von einem oder zwei Stellen bei einem der Codewörter liefert in keinem Fall ein Codewort. Setzt man allerdings im zweiten Codewort alle Stellen auf 1, dann erhält man das dritte Codewort - der Code ist also nicht 3-fehlererkennend. S. Der Code ist 1-fehlerkorrigierend. Das Ändern von einer Stelle bei einem der Codewörter liefert in keinem Fall ein Wort, welches einem anderen Codewort näher ist, als dem ursprünglichen. Setzt man allerdings im zweiten Codewort zwei der Nullen auf 1, dann erhält man das Wort (1, 1, 1, 1, 0, 1), welches das miz-Verfahren auf (1, 1, 1, 1, 1, 1) abbildet - der Code ist also nicht 2-fehlerkorrigierend.

■ Wir übersetzen die Eigenschaft der k-Fehlererkennung und k-Fehlerkorrektur nun in die Sprache der Hammingkugeln. LEMMA 13.21. Ein Blockcode C ist genau dann k-fehlererkennend, wenn

für jedes Codewort c E C gilt C n Bk (C) = { c}. Beweis. Wir zeigen zwei Richtungen. ".": Für jedes Codewort c E C gilt {c} c CnBk (c), weil c ein Codewort und in der Hammingkugel um c selbst mit Radius 0 und sicherlich mit größerem Radius enthalten ist. Nehmen wir also an, es gibt ein weiteres von c verschiedenes Codewort c' in C n Bk (C) . Dann lässt sich c' durch das Ändern von höchstens k Stellen aus c erzeugen (da c' E Bk (c) und Bk (c) nur Wörter mit Abstand höchstens k zu c beinhaltet). Das ist aber, da C k-fehlererkennend ist, nicht möglich - ein Widerspruch. Also ist c tatsächlich das einzige Codewort in C n Bk (C) . Angenommen, C ist nicht k-fehlererkennend. Dann gibt es ein Codewort c E C, welches durch das Ändern von höchstens k Stellen in ein

441

A

S4.

DEKODIERUNG

weiteres Codewort c' verändert werden kann. Dann ist aber dist(c, c') < k, also c' n 13k (c) - ein Widerspruch, dass c das einzige Codewort in !3k (c) ■ ist. LEMMA 13.22. Ein Blockcode C ist genau dann k-fehlerkorrigierend,

wenn für jedes Codewort c E C gilt C n B2k (C) = {C}.

Beweis. Wir zeigen zwei Richtungen. {c} " >": Angenommen, es gibt ein c E C für welches C n 132k(c) c von weiteres ein es muss also (w), Bk n C {c} gilt. Sicherlich ist c ist Offensichtlich geben. verschiedenes Codewort c' E C n B2k (c) dist(c, c') < 2k.

(13.1)

Wir unterscheiden zwei Fälle. Fall 1 - dist(c, c') < k. Dann ist c' E Bk(c) und Pilz (c) = c' (da c' ein Codewort ist) also ist C nicht k-fehlerkorrigierend. Denn c' ist ein Wort, welches durch das Ändern von höchstens k Stellen aus c erzeugt werden kann und durch das miz-Verfahren nicht auf c abgebildet wird. Fall 2 - dist(c, c') > k. Es gibt ein Wort w, welches durch Setzen von k vielen Stellen in c auf den Wert von c' entsteht. Dann ist dist(c, w) = k und dist(c', w) = dist(c', c) — dist(c, w) = dist(c', c) — k

(13.2)

Setzt man (13.1) in (13.2) ein, erhalten wir dist(c', w) < 2k — k = k. Zusammengefasst ist dist(c, w) = k und dist(c', w) < k. Das MLD-Verfahren gibt demnach c' (falls dist(c', w) < k) oder Fehler (falls dist(c', w) = k) aber sicher nicht c aus. Also ist C nicht k-fehlerkorrigierend. "< ": Angenommen, C ist nicht k-fehlerkorrigierend. Dann gibt es ein c mit Codewort c E C und ein w E Bk (c), so dass MLD(w) = c' E C oder Fehler ausgibt. Im ersten wie im zweiten Fall gibt es ein E C mit dist(c', w) < dist(c, w) < k. Nach der Dreiecksungleichung

442

DEKODIERUNG A

gilt dist(c, c') < dist(c, w) dist(w, c') < k k = 2k. Also ist c' E 132k (c) - ein Widerspruch, dass c das einzige Codewort in 82k (w) ist. •

Wir halten nun den Zusammenhang zwischen Minimalabstand und Fehlererkennung bzw. -korrektur fest. SATZ 13.23. Ein

s. s.

... genau ... genau

Code C mit Minimalabstand d = d(C) ist . . .

dann k-fehlererkennend, wenn k < d mit k E N. dann k-fehlerkorrigierend, wenn k < g- für k E N.

Beweis. Die Aussagen folgen direkt aus Korollar 13.17 und Lemma 13.21. Nach Lemma 13.21 ist ein Code C genau dann k-fehlererkennend, wenn C n13 k (c) = {c} für alle c E C. Doch nach Korollar 13.17 ist genau dann

C n Bk (C) = {c} für alle c E C, wenn k < d. Analog gilt, dass ein Code genau dann k-fehlerkorrigierend ist, wenn C n .62k (c) = {c} für alle c E C. Doch nach Korollar 13.17 ist genau dann C n B2k (C) = {c} für alle c E C, wenn 2k < d, also k < 2.

•

BEMERKUNG 13.24. Es soll betont werden, dass der Zusammenhang zwischen dem Minimalabstand und Fehlererkennung bzw. -korrektur stark ist. Der Minimalabstand bildet einen Schwellwert. Für alle k E N mit k < d(C) ist ein Code C k-fehlererkennend und für alle k E N mit k > d(C) ist er nicht k-fehlererkennend. Analog ist für alle k E N mit k < 41ein Code C k-fehlerkorrigierend und für alle k E N mit k > d 2) ist er nicht k-fehlerkorrigierend. ■

SATZ 13.25 (Hamming-Schranke). Seien lAl = a und n E N. Sei C ein k-fehlerkorrigierender Blockcode der Länge n über A. Dann gilt 1

ICI
U Bk(C) = cEC

Die Behauptung folgt damit.

iBk(c)i ccc

ici

• Z-d

i=o

(z )• (a — 1)z . ■

13.2.2 Daten aufbereiten Wir haben bislang noch nicht darüber nachgedacht, wie Daten mit Codewörtern in Beziehung gesetzt werden. Daten können beliebig vielfältig sein, wie Einträge eines Adressbuchs, ganze Dokumente (welche in verwertbare Teile zerlegt und dann kodiert werden), Pixel eines Bildes, Töne von Musik und vieles mehr. Für die Überlegungen in den folgenden Kapiteln gehen wir davon aus, dass die Daten so aufbereitet sind, dass sie schlichtweg alle Wörter in der Menge An sind, für ein Alphabet A und eine Wortlänge n. Grundsätzlich heißt das, dass man in der Praxis eine Abbildung der realen Daten auf Wörter der Länge n über dem Alphabet A benötigt. Dabei entsteht ein Code. Ist man mit den Eigenschaften bezüglich Fehlererkennung und -korrektur nicht zufrieden (in dem Fall das nicht alle Wörter getroffen werden - sonst ist man sicherlich mit diesen Parametern unzufrieden), müssen diese Datenwörter in einem zweiten Schritt kodiert, also mittels einer weiteren Abbildung auf einen Code mit besseren Eigenschaften abgebildet werden. D EFINITION 13.26. Wir bezeichnen eine endliche Menge von Daten als Datenmenge. Es sei D eine Datenmenge und A ein Alphabet mit k unterschiedlichen Symbolen. Wähle n E N± so, dass kn > IDI. Wir nennen eine injektive Abbildung CONVERT : D —> An eine Konvertierung der Datenmenge D. Wir nennen die Bilder der Abbildung CONVERT Datenwörter der Datenmenge D unter A. BEMERKUNG

13.27.

S. Wir gehen im Folgenden davon aus, dass die Anzahl der Daten in einer Datenmenge genau einer k-Potenz entspricht, dass also SDI = kn für eine natürliche Zahl n E N. Sollte dies in einer praktischen Anwendung nicht der Fall sein, füllt man die Datenmenge mit zusätzlichen Daten auf, welche keine Information tragen. k Die Menge der Datenwörter selbst ist ein Code. Berücksichtigt man die obige Einleitung, stellt man allerdings fest, dass in diesem Code alle Wörter des An enthalten sind, ein denkbar schlechter Code im Lichte der Fehlererkennung

444

LINEARE CODES

und -korrektur. Die Datenwörter sollten nach der Konvertierung also auf einen weiteren Code mit besseren Eigenschaften diesbezüglich abgebildet werden. • BEISPIEL

13.28. Es sei eine Datenmenge = { (HALLO), (WAS), (MACHST), (DU) }

mit vier Daten gegeben. Setze zudem A = .F2 = {0, 1} und n = 2, denn dann ist IDI = kn = 22 mit k = IAH = 2. Wir wählen eine Convertierung CONVERT : D 11, welche diese Daten auf die Wörter im lq abbildet. (HALLO) H (0, 0), (WAS)

(0, 1) (MACHST) H (1, 0) (DU) H (1, 1)

Die Daten liegen nun als Datenwörter des 1F2 vor.

•

13.3 Lineare Codes

Wir betrachten nun folgend stets Codes, deren zugrundeliegendes Alphabet ein endlicher Körper F, ist. Bei der Konstruktion von Codes sind drei Dinge zu beachten. s. Minimalabstand vs. Kardinalität. Ziel ist es, für eine gegebene Wortlänge und ein fixiertes Alphabet A eine Menge mit möglichst vielen Codewörtern aber dennoch großem Minimalabstand zu konstruieren. s. Leichtes Enkodieren und Dekodieren. Die Abbildung, welches einem Datenwort ein Codewort zuordnet (Enkodierung) und ihre Umkehrabbildung (Dekodierung) sollte leicht zu berechnen sein. s. mix -Verfahren effizient anwendbar. Bei der Anwendung des MLDVerfahrens sollten für Wörter nächstliegende Codewörter leicht zu finden sein. Nach dem Prozess der Konvertierung liegen die Daten als Ak, die Menge aller Wörter über einem Alphabet A der Länge n, vor. Der Minimalabstand in dieser Menge ist minimal, er ist 1. Da alle Wörter enthalten sind, gibt es für ein beliebiges Wort w immer ein Wort w' E F,k, welches sich von w an genau einer Position unterscheidet, also Abstand 1 zu W hat. Es verbleibt die Notwendigkeit die Datenwörter auf einen Code mit größerem Minimalabstand abzubilden. Bestenfalls wählt man einen Code über dem gleichen Alphabet Eq. Den Code erhält man, indem man die einzelnen Datenwörter auflistet und um P E N viele Prüfstellen

n

445

A

k LINEARE CODES

Anmerkung. Dabei wird man tatsächlich nicht gezwungen, die ersten k Stellen als den Sitz der Datenbits zu wählen. Siehe das Konzept der Systematik in Stellen (Definition 13.45).

ergänzt. Zur besseren Anschaulichkeit sagen wir, die ersten k Stellen, entsprechen den Datenwörtern. Die ergänzten .e Codewörter haben somit Länge k + = n. Die Prüfstellen müssen nun dafür sorgen, dass die Codewörter einen größeren Minimalabstand bekommen. Wir skizzieren das Konzept für Datenwörter der Länge k über dem F2 mit .e Prüfstellen wl (0, , 0, 0) W2 = (0, , 0, 1) W2 = (0, ... 0)

w2k = (1, • • • , 1,

1—› 1—> 1—>

(0, 0, ,p1e) = Cl (0,... , 0, 1, p21, ,p2.e) =C2 (0, . . , 1, 0, P31, • • • , P22) = C2

(13.3)

(1, ... , 1, 1,132ki, • . . ,P2ke) = c2k •

Bleibt zu überlegen, wie die Prüfstellen zu wählen sind. Dazu verwendet man bestenfalls eine Abbildung, welche das Datenwört auf die Prüfstellen abbildet. Bei linearen Codes sind die Prüfstellen Bilder von linearen Abbildungen der Datenwörter, daher auch ihr Name. Man berechnet also für das Datenwort wi = (ui]., wi2 , • • • , wik) die Prüfstellen

®q Al2 Oq Wi2 EBq ' . ' fflg Alk Oq Wik Pi2 = P2 (Wi — A21 Oq Wil eq X22 Oq Wi2 eq ' ' ' 0g X2k Oq Wik pii = pl (wi) —

All Oq Wil

pie = Pe(Wi) — )'elOq Wil

eq A22 Oq Wi2 eq • • • EDg )'ek Oq Wik •

wobei die A„ aus dem 1Fq gewählt sind. Die einzelnen Prüfstellen werden also jeweils als eine lineare Abbildung des Datenworts gewonnen. Wir werden im Folgenden sehen, dass die Berechnung der Prüfstellen mittels linearer Abbildungen dazu führt, dass die Menge der Datenwörter In und die Menge der Codewörter aus dem FZ Vektorräume darstellen. Tatsächlich wird das die Definition von linearen Codes sein. Die in der linearen Algebra entfaltete Theorie der linearen Abbildungen von Vektorräumen hilft enorm bei der Konstruktion, beim Kodieren und der Analyse linearer Codes.

13.3.1 Beschreibung von Untervektorräumen

Die Unterräume des reellen Vektorraums 1113 der Dimension 3 sind schlicht Ebenen und Geraden, die den Nullvektor enthalten.

446

LINEARE CODES

A

Zum Beispiel sind die x1-x2 -Ebene Ex, = Ix ER3 : x3 = 01 { e(1) + e(2) : A, pt E RI , in der alle Vektoren als letzte Koordinate eine 0 haben und die Gerade Giii = fx E R3 : x1 + x2 — 2 • x3 = 0 und xi — 2 • x2 + x3 = 01 = {A • (1) : e JR} (1 durch den Punkt 1 und den Ursprung Unterräume des R3. 1 Die Darstellung oder Beschreibung eines solchen Unterraumes kann auf zwei unterschiedliche Art und Weisen erfolgen. 3. Man

gibt ein „Herstellungsrezept" an, wie man die Vektoren in einem Unterraum aus einer Basis mittels Linearkombination herstellt. k Man gibt ein Set von „Gleichungen" an, die alle Punkte in einem Unterraum erfüllen müssen.

In den beiden obigen Darstellungen von Ex, ... k ... ist die Menge der einschränkenden Gleichung(en)

0 • xi + 0 • x2 + 1 • x3 = 0 I.... bilden die Standardeinheitsvektoren eM und e(2) eine Basis, aus

der sich alle Elemente in Ex, linear kombinieren lassen. In den beiden obigen Darstellungen von Gi 1 ... s. ... ist die Menge der einschränkenden Gleichung(en) xl + x2 — 2 • x3 = 0 xl — 2 • x2 + x3 = 0

k ... bildet der Vektor (1 eine Basis, aus der sich alle Elemente in 1

Gi ll linear kombinieren lassen.

Beide Darstellungsformen haben ihre Vorzüge. So lassen sich mittels Basen Elemente von Unterräumen leicht „herstellen", mittels Gleichungs-

447

k LINEARE CODES

systemen lassen sich beliebige Vektoren des 1183 darauf „testen", ob sie in Unterräumen liegen. Beides werden wir später bei linearen Codes genauso wiederfinden, in Form der Generatormatrix - alias das „Herstellungsrezept" - alias die Basen - und der Kontrollmatrix - alias das „Prüfinstrument" - alias die Gleichungen.

13.3.2 Lineare Codes sind Untervektorräume

Wir haben schon angedeutet, dass Codes üblicherweise mithilfe von linearen Funktionen gebildet werden. Tatsächlich führt dieses Verfahren dazu, dass diese Codes immer Unterräume von Vektorräumen über endlichen Körpern sind. Wir definieren nun also diese spezielle Klasse von Codes, mit denen man, wegen der zugrundeliegenden Vektorraumstruktur, gut arbeiten kann. DEFINITION 13.29. Ein Code C über dem Alphabet F, heißt linearer Code, wenn C ein Untervektorraum von IF, ist. Einen linearen Code, der als Vektorraum die Dimension k hat, nennt man einen [n, k]-Code. Hat ein [n, k]-Code Minimalabstand d, dann nennt man ihn einen [n, k, Code. BEISPIEL 13.30. Der folgende Code ist ein [4, 2, l]-Code über dem Alphabet 1F3 = {0, 1, 2, 3}. (0 0 0 0) =1

(1, 1, 1,1), (2 2, 2, 2),

(0,1, 1,1), (0, 2, 2, 2),

(1, 2, 2, 2), (2, 1, 1, 1),

(2, 0, 0, 0), 1 (1, 0, 0, 0) J

11. Es ist C ein Unterraum des IF3. Dazu prüft man die Unterraumkriterien. UVO. Die Menge C ist nicht leer. UV1. Abgeschlossenheit bezüglich der Addition ist erfüllt, so ist beispielsweise (1,1, 1,1)T e3 (0, 2, 2, 2)T = (1, 0, 0, 0)T E C. UV2. Abgeschlossenheit bezüglich der Skalarmultiplikation ist erfüllt, so ist beispielsweise 2 03 (2, 1, 1, 1)T = (1, 2, 2, 2)T E C. 1. Die Dimension des Codes ist 2, da die Vektoren der Wörter (1, 1, 1, 1) und (0, 1, 1, 1) eine Basis des Vektorraums C bilden. Das überprüfen wir anhand der Definition einer Basis. Bl. Die Vektoren sind linear unabhängig. Es gibt kein A E F3 = {0, 1, 2}, so dass A 03 (1, 1,1, 1) = (0,1, 1,1). B2. Der Spann von (1, 1, 1,1) und (0,1, 1,1) ist ganz C. Dazu rechnet man nach, dass jedes Codewort als Linearkombination Al 03 (1,1, 1,1) IED3 A2 03 (0,1, 1,1) mit Ai , A2 E F3 geschrieben werden kann. Außerdem gibt es je drei

448

LINEARE CODES A

mögliche Belegungen von Ai und X2 in einer solchen Linearkombination, also höchstens neun Vektoren im Spann von (1, 1, 1, 1) und (0, 1, 1,1). Der Code hat genau neun Wörter, wird also von (1, 1, 1, 1) und (0, 1, 1, 1) aufgespannt. s. Es gilt d(C) = 1, denn die Codewörter (0, 0, 0, 0) und (1, 0, 0, 0) haben Abstand 1. Zwei verschiedene Codewörter können nicht Abstand 0 haben, 1 ist demnach der Minimalabstand. Der Code C ist ein Blockcode der Länge 4 und somit ein linearer [4, 2, 1]-Code über dem Alphabet ]F3 . • BEMERKUNG 13.31. Den Parameter n liest man an der Länge der Codewörter ab. Die Dimension k und der Minimalabstand d(C) hingegen sind nicht sofort zu erkennen, man muss sie berechnen. ■

Um den Minimalabstand d(C) zu berechnen, müssen ungefähr 1012 viele Hammingabstände berechnet werden. Für lineare Codes lässt sich der Aufwand reduzieren. LEMMA 13.32. Der Minimalabstand eines linearen Codes C erfüllt

Anmerkung: Exakt sind der Abstand von i) - ic, vielen Wortpärchen zu berechnen.

eg

d(C) = min{ dist(c, 0) : c E C, c 0}. Beweis. Wir zeigen die Gleichheit, indem wir zwei Ungleichungen zeigen. „": Seien c und c' zwei unterschiedliche Codewörter aus C deren Abstand dem Minimalabstand von C entspricht, also dist(c', c") = d(C). Da C ein linearer Code ist, ist auch 2 =

—

c" in C enthalten.

Es ist aber dist(c', c") = I{i E {1, . . . , n} : ={iE {1,

:

"

} 0 }I =dist(2, 0).

Daraus folgt d(C) = dist(c', c") = dist(c, 0) > min{ dist(c, 0) : c E C, c 0}.

449

LINEARE CODES

Zusammengenommen bleibt also nur die Möglichkeit, dass d(C) = min{ dist(c, 0) : c E C, c # 0} ■

gilt, wie behauptet.

BEMERKUNG 13.33. Lemma 13.32 ist äußerst hilfreich beim Berechnen des Minimalabstands von linearen Codes. Nach der eigentlichen Definition des Minimalabstands müsste man in einem Code den Abstand für alle Paare von Codewörtern berechnen, um diesen zu bestimmen. Für einen linearen Code genügt es bereits, ■ den Abstand einzelner Codewörter zur 0 zu berechnen. B EISPIEL 13.34. Es sei ein [4, 2]-Code über dem 1F3 gegeben. j. (0 0 0 0) =

(1, 1, 0, 0), (2 2, 0, 0),

(0, 0, 1, 1), (0, 0, 2, 2),

(1, 1, 1, 1), (2, 2, 2, 2),

(1, 1, 2, 2), (2, 2, 1, 1)

Dass es sich dabei wirklich um einen linearen Code mit den angegebenen Parametern handelt, ist eine Übungsaufgabe. Der Minimalabstand d(C) = 2, denn dist((0, 0, 0, 0), (1, 1, 0, 0)) = 2, dist((0, 0, 0, 0), (2, 2, 0, 0)) = 2, dist((0, 0, 0, 0), (1, 1, 1, 1)) = 4, dist( (0, 0, 0, 0), (2, 2, 2, 2)) = 4,

dist((0, 0, 0, 0), (0, 0,1, 1)) = 2, dist((0, 0, 0, 0), (0, 0, 2, 2)) = 2, dist( (0, 0, 0, 0), (1,1, 2, 2)) = 4, dist( (0, 0, 0, 0), (2, 2, 1, 1)) = 4.

Der Code C ist also ein [4, 2, 2]-Code. Nach Satz 13.23 ist er 1-fehlererkennend • und 0-fehlerkorrigierend.

13.3.3 Die Generatormatrix linearer Codes Ist C ein linearer Code, so ist C ein Vektorraum. Damit hat C eine Basis,

mit welcher alle Elemente in C dargestellt werden können. Jede Basis kann als Matrix geschrieben werden, so dass die Zeilen den Basisvektoren und das Linksbild der Matrix dem Spann der Basisvektoren, also dem von der Basis aufgespanntem Vektorraum entspricht. Eine solche Matrix werden wir im Folgenden als „Generatormatrix" kennenlernen. Die Generatormatrix wird nicht nur die Codewörter erzeugen, sondern auch die Kodierungsabbildung sein, welche Datenwörtern ihre Codewörter zuordnet. DEFINITION 13.35. Sei C ein [n, k] -Code und 91, . . . gk E C seien linear

450

LINEARE CODES

unabhängig. Dann ist die Matrix ei G= (: ek mit Zeilen G(i) = gi eine Generatormatrix von C. BEMERKUNG 13.36.

S. Da die k Zeilen gi , , gk von G linear unabhängig sind, und der zugehörige Code genau Dimension k hat, ist gi, , gk eine Basis des Vektorraums C. S. Wie wir in Beispiel 13.66 sehen, ist die Generatormatrix in der Regel nicht eindeutig, man kann die Reihenfolge der Zeilen verändern. Doch auch unterschiedliche Mengen von Vektoren sind möglich. Zusammen mit der obigen Bemerkung ergibt das Sinn, denn die Basis in einem Vektorraum ist ebenfalls nicht eindeutig. S. Für einen linearen [n, k]-Code über dem Alphabet ]Fq ist eine Generatormatrix stets eine k x n-Matrix mit Einträgen aus Fq, also G E FP< n . ■ BEISPIEL 13.37. Es sei der [4, 2]-Code

C = {co = (0, 0, 0, 0), ci = (1,1, 0, 0),

c2 = (0, 0,1,1),

C3 = (1, 1, 1, 1)}

über dem IF2 gegeben. Je zwei der von 0 verschiedenen Vektoren cl , c2 und c3 in C sind linear unabhängig. Es lassen sich also sechs verschiedene Generatormatrizen von C angeben. G12

=

1 o (o

01

G13 = ( 1 1 0 ° 1 1 1)'

oo1 L'21

= (1

0 0),

10 1 1 G23 = (0 1 1 1)

1111

G31 = (1 1 0 0) 1 1 1 1 G32 = (0 0 1 1) •

■ LEMMA 13.38. Jeder [n, k]-Code

besitzt eine Generatormatrix.

Beweis. Jeder Vetorraum besitzt eine Basis. Da jeder lineare Code ein Untervektorraum und damit ein Vektorraum ist, besitzt er eine Basis, also eine Menge von k-vielen linear unabhängigen Vektoren. Mit diesen lässt sich eine Generatormatrix bilden. ■ LEMMA 13.39. Es sei G eine Generatormatrix eines [n,k]-Codes C. Dann ist C = LBild(G).

Beweis. Die Generatormatrix G ist aus der Menge Fqk ". Somit ist das Linksbild von G die Menge aller Vektoren w E r: mit w = v • G für ein v E F. Die Vektoren in LBild(G) sind also alle Linearkombinatio-

451

A

LINEARE CODES

nen der Zeilenvektoren in G. Die sind aber nach der Konstruktion einer Generatormatrix eine k-elementige linear unabhängige Menge in einem k-dimensionalen Vektorraum, also eine Basis, welche ganz C aufspannt. ■

Datenwörter auf Codewörter abbilden

Mit einer Generatormatrix eines linearen Codes werden Datenwörter ihren Codewörtern zugeordnet. Um eine Menge von Datenwörtern über einem endlichen Körper F, zu kodieren, verwendet man einen linearen Code über demselben endlichen Körper. Haben die Datenwörter Länge k, verwendet man einen [n, k]-Code, wobei n > k ist. DEFINITION 13.40. Sei D eine Menge von Datenwörtern der Länge k über dem endlichen Körper F,. Für einen [n, k]-Code C mit n > k über F, n, Fq Fqk sei G eine Generatormatrix. Wir definieren eine Abbildung KG so dass ein Datenwort w E D auf

KG (W) = W • G das w mittels G zugeordnete Codewort in C abgebildet wird. LEMMA 13.41. Sei D eine Menge von Datenwörtern der Länge k über dem endlichen Körper F. Für einen [n, k]-Code C mit n > k über F, sei G eine Generatormatrix.

k Es ist Bild(KG) = C. k Die Abbildung KG ist injektiv. Beweis. Die erste Aussage folgt direkt aus Lemma 13.39. Für die zweite Aussage ist zu zeigen, dass für zwei verschiedene Datenwörter w' und w" stets KG (W') KG (W") ist. Angenommen, es gibt zwei verschiedene Datenwörter w', w" E Fqk mit 1C9 (72) = w' • G = w" • G = KG (W"). Dann wird das von 0 verschiedene Datenwort w = w' — w" auf die 0 abgebildet, denn iTu • G = (w' — w'') • G = w' • G — w• = 0. Dies ist aber gleichbedeutend damit, dass die Zeilen gi , , gk von G linear abhängig sind - ein Widerspruch. Es ist nämlich ro • G = Wi • gi + . . +

452

• gk

LINEARE CODES

und nicht alle wi = 0.

■

13.42. Es sei IF1 die Menge der Datenwörter und G = 01 2102 eine Generatormatrix eines linearen Codes über dem IF3. Dann ist ( (0, 2)) = (0, 1, 0), KG ((0,0)) = (0, 0, 0), KG((0 ,1)) = (1, 2, 0), /Cc((1, 0)) = (1,1,2), /C0((1, 1)) = (1,0,2), 1CG ((1, 2)) = (1,2,2), KG((2,0)) = (2, 2, 1), KG((2,1)) = (2,1,2), ICG((2,2)) = (2,0,2). BEISPIEL

Man bemerke, dass die Abbildung KG injektiv ist.

■

Wir fassen zusammen, dass eine Generatormatrix einen linearen Code repräsentiert. Multipliziert man einen beliebigen (passenden) Vektor von links an die Generatormatrix, erhält man ein Codewort. Tatsächlich gibt es für jedes Codewort einen solchen Vektor, welcher auf dieses abbildet. Nebenbei kann die Generatormatrix genutzt werden, Datenwörter auf den Code abzubilden. Da es mehr als eine Generatormatrix gibt, ist dies nicht eindeutig. Unterschiedliche Generatormatrizen desselben Codes führen zu unterschiedlichen Kodierungen der Datenwörter. Welche Wahl der Generatormatrix ist dann die richtige? Bevor wir diese Frage beantworten, ernten wir eine Aussage über die Anzahl von Codewörtern in linearen Codes. KOROLLAR 13.43. Ein [n, k]-Code über dem Fq enthält qk Codewörter. Beweis. Der Beweis besteht im Wesentlich im Zählen und ist ein Übungs■ aufgabe.

13.44. Korollar 13.43 erhellt, dass die Anzahl der Codewörter eines linearen Codes nicht von der Länge der Codewörter n, sonder einzig von der ■ Dimension k abhängt.

BEMERKUNG

Systematische Positionen

Wir haben in der Einführung des Abschnitts die praktische Konstruktion von linearen Codes besprochen. Dabei entfalteten wir das Bild, dass die ersten k Stellen der Codewörter stets den zu kodierenden Datenwörtern entsprechen. Das ist natürlich sehr praktisch, kann man beim Dekodieren die Datenwörter dadurch schnell auslesen. In der formalen Definition 13.29 linearer Codes war davon nicht mehr die Rede. Wo „landen" die Datenwörter, wenn ich sie mittels Generatormatrix auf einen linearen Code abbilde? Sind sie überhaupt noch in ihrer ursprünglichen Form (zum Beipiel, wenn ich jede zweite Stelle auslese) im Code zu finden? Diese

453

1, LINEARE CODES

Fragen möchten wir nun beantworten. Dazu betrachten wir zunächst beliebige Blockcodes und definieren formal, was wir mit „Datenwörter in Codewörter finden" meinen. DEFINITION 13.45. Ein Blockcode C über dem IF, heißt systematisch in den Stellen J = {ji , , jk}, wenn zu jedem Vektor x E Fpk genau ein Codewort c E C existiert mit x =

BEISPIEL 13.46.

Der binäre Code

c - f (0, 0,0, 0, 0), (1, 1,0, 0, 0),

(1, 0, 0,1, 0), (0, 1, 0, 1, 0),

(0, 0, 1, 0, 1), (1, 1, 1, 0, 1),

(1, 0, 1, 1, 1), 1 (0, 1,1, 1, 1) f

ist systematisch in den Stellen J = {2, 3, 4}. Betrachtet nur diese Stellen der Codewörter (und vergisst die Stellen 1 und 5) erhält man

f( 0,0,0 ), 1( 1,0,0 ),

( 0,0,1 ), ( 1,0,1 ),

( 0,1,0 ), ( 1,1,0 ),

( 0,1,1, ( 1,1,1,

),1 _ )f

Doch der Code ist auch systematisch in den Stellen J = 2, 4, 5. Betrachtet man nur diese Stellen der Codewörter (und vergisst die Stellen 1 und 3) erhält man

f ( 0, 1( 1,

0,0), 0,0),

( 0, 1,0), ( 1, 1,0),

( 0, ( 1,

0,1), 0,1),

( 0, 1,41 _ T,3 ( 1, 1,1) f

Der Code C ist jedoch nicht systematisch auf weniger als drei oder mehr als drei Positionen, weil bei weniger als acht zu suchenden Wörtern in acht Wörtern immer mindestens ein Wort mehrfach vorkommt und bei mehr als acht zu suchenden Wörtern, nicht jedes in acht Wörtern zu finden sein wird. Außerdem ist der Code nicht systematische in den Stellen J = {3, 4, 5}. Zum Beispiel findet sich das Wort (0, 0, 0) an diesen Positionen der Codewörter (1, 1, 0, 0, 0) und (0, 0, 0, 0, 0). ■

Wir wenden uns den linearen Codes zu und stellen einen Zusammenhang zwischen der Eigenschaft „systematisch in Stellen zu sein" und Generatormatrizen her. Doch vorher beobachten wir, dass ein linearer Code der systematisch in k-vielen Stellen ist, Dimension k hat. LEMMA 13.47. Für jeden [n, k]-Code über dem F4, der systematisch in den Stellen J C {1, 2, . . . , n} ist, gilt I JI = k. Beweis. Es gibt nach Korollar 13.43 genau qk Codewörter in C. Damit C systematisch in den Stellen J ist, müssen die Vektoren des Fs, mit s = JI bijektiv auf die Codewörter abgebildet werden können - jedes Wort aus IF,' findet sich in genau einem Codewort von C an den Stellen von J wieder. ■ Also muss s = k sein, was zu zeigen war.

454

LINEARE CODES

DEFINITION 13.48. Eine Generatormatrix der Form G = (idk A) eines linearen [n, 10]-Codes über einem IF, nennen wir die kanonische Generatormatrix.

BEISPIEL 13.49. Der Code C aus Beispiel 13.46 ist ein [5, 3]-Code. Die Codewörter (1, 0, 0, 1, 0), (0, 1, 0, 1, 0) und (0, 0, 1, 0, 1) sind linear unabhängig (in den ersten drei Einträgen finden sich die Einheitsvektoren des FZ). Also ist die Matrix 1 0 0 1 0) G= (0 1 0 1 0 0 0 1 1 1

10 1 o gilt, ist G die

eine Generatormatrix von C. Da G = (id k A) mit A =

11

B

kanonische Generatormatrix von C.

Man kann leicht überprüfen, dass die kanonische Generatormatrix eindeutig ist. Wir stellen nun einen Zusammenhang zwischen den Positionen der Codewörter und Spalten der Generatormatrix her. Dazu benötigen wir die folgende Definition. . , i,} C D EFINITION 13.50. Sei G eine k x n-Matrix und J = {1, 2, . . . , n} eine Menge von Stellen. Dann ist G J die k x s-Matrix, deren Spaltenvektoren den Spaltenvektoren von G mit Index in J entsprechen. LEMMA 13.51. Sei G eine Generatormatrix eines [n, k]-Codes C über einem Fq und J = {i1, i2, , is } C {1, 2, . , n} eine Menge von Stellen. Sei w E Fqk ein Datenwort mit zugeordnetem Codewort c = w • G. Dann ist c[J] = w • G[J].

Beweis. Bildet man ein Datenwort w E Frik auf das Codewort c = w • G ab, entspricht die i-te Stelle des Codeworts c dem Produkt des Datenworts w mit dem i-ten Spaltenvektor von G Gli (G2i ci = W • G(i) = (W1, W2, • • • , Wk) '

•

•

Gki

Möchte man nun für eine Menge von Stellen J • • • , is} C {1, 2, ... , n} das Wort auf diesen Positionen von c auslesen, entspricht dies dem Produkt von w mit der Matrix, welche nur aus den Spaltenvektoren mit Index in J besteht. Es ist dann ci2

) = w • (a('i) G(i2)

455

LINEARE CODES

•

was zu zeigen war.

KOROLLAR 13.52. Sei G eine Generatormatrix zu einem [n, k]-Code. Ein Datenbit i E {1, 2, ... , k} trägt genau dann zur Berechnung des Codenbits j E {1, 2, ... , n} bei, wenn G„ 0. BEMERKUNG 13.53. Betrachtet man die i-te Zeile einer Generatormatrix, so trägt das i-te Datenbit zur Berechnung genau der Codebits bei, für welche der Eintrag in dieser Zeile nicht 0 ist. ■

13.54.. Betrachten wir einen [4, 2]-Code über dem F2 mit der Genera= (o o ' Sei J = {2, 3}. Dann entsprechen die Codewörter in tormatrix G o BEISPIEL

den Stellen 2 und 3 dem Produkt der Datenwörter mit der Matrix G J = Es ist nämlich

0

ii 1) O 1

= (0, 0, 0, 0)

(0, 0) • WO = (0, 0)

o ) = (0,1, 1, 0)

(0,0) • (01 1 ) = (1, 1)

o ) = (1,0,1,1)

(0, 0) • WO = (0, 1)

o

(0,0) • (ol 1) =(1, 0)•

ii 1 O 1 1 1 1 O 1 1 1 1 O 1

) =(1, 1, 0, 1)

■ LEMMA 13.55. Jeder [n, k]-Code C ist genau dann in k Stellen J C {1, 2, ... , n} systematische, wenn für alle Generatormatrizen die Spalten von G J linear unabhängig sind.

Beweis. Es sind zwei Richtungen zu zeigen. " >": Sei also C systematisch in den k-Stellen in J. Sei G eine beliebige Generatormatrix von C. Dann ist nach der Definition von „systematisch in den Stellen" LBild(GJ ) = IFS. Also ist nach dem Dimensionssatz LKern(GJ) = {0} und die Zeilen in GJ sind linear unabhängig. Da G J eine k x k-Matrix ist und Spalten- gleich Zeilenrang ist, sind auch die Spalten von GJ linear unabhängig. Da G beliebig gewählt war, gilt dies für alle Generatormatrizen von C. ".": Sei also für eine Generatormatrix G des Codes C die Spalten mit Index in J linear unabhängig. Dann sind in der k x k-Matrix GJ sowohl die Spalten als auch die Zeilen linear unabhängig (Zeilen- ist gleich Spaltenrang). Dann ist aber LKern(GJ ) = {0} und somit ist die zu G J gehörige Abbildung injektiv. Da es nach Korollar 13.43 qk viele Codewörter in C

456

LINEARE CODES A

gibt und aufgrund der Injektivität nicht für zwei der qk vielen Datenwörter die Codewörter auf den Stellen in J übereinstimmen, ist C systematisch in den Stellen in J. ■ LEMMA 13.56. Jeder [n, k]-Code C ist genau dann in den ersten k Stellen

systematisch, wenn er eine kanonische Generatormatrix besitzt. Beweis. Es sind zwei Richtungen zu zeigen. Da C systematisch in den ersten k Stellen ist, gibt es für jeden der k vielen liegenden Einheitsvektor des lEgic ein Codewort in C, dessen ersten k Stellen diesem entsprechen Cl = (1, 0, 0, c2

Ck-1 ck

= (0, 1, 0, = (0,

0, 0, = (0, 0, 0, .

, 0, 0, ...) , 0, 0, ...) , 1, 0, ...) , 0, 1, . ..).

Schreibt man diese in die Zeilen einer Matrix hat diese die Form (idk A). Diese ist eine Generatormatrix, wenn die Zeilen linear unabhängig sind. sind also Die ersten k Spalten bilden die Standardeinheitsbasis des linear unabhängig. Demnach ist der Spaltenrang mindestens k. Da der Zeilenrang gleich dem Spaltenrang ist und die Matrix G nur k Zeilen hat, sind diese linear unabhängig. Was zu zeigen war. ": Sei G die kanonische Generatormatrix und J = {1, 2, .. . , k}. Dann ist GJ = idk und die Datenwörter in IF,k werden nach Lemma 13.51 bijek■ tiv auf die Codewörter abgebildet. Also ist C systematisch in J. KOROLLAR 13.57. Jeder [n, k]-Code C ist genau dann in den ersten k Spalten linear unabhängig, wenn er eine kanonische Generatormatrix besitzt.

Beweis. Folgt direkt aus Lemma 13.55 und 13.56.

■

LEMMA 13.58. Jeder [n, k -Code ist systematisch in k Stellen.

Beweis. Jeder [n, k]-Code hat nach Lemma 13.38 eine Generatormatrix. Sei also G eine beliebige Generatormatrix von C. Dann sind die k Zeilen von G linear unabhängig. Da Zeilen- gleich Spaltenrang ist, besitzt G mindestens eine Menge von k linear unabhängige Spalten. Nach Lemma

457

S. LINEARE CODES

13.55 ist C systematisch in den Stellen, welche den Indizes der k linear ■ unabhangigen Spalten entsprechen. Wir fassen zusammen, dass jeder k]-Code C systematisch in mindestens einer Menge von k vielen Stellen ist. Ist C systematisch in den ersten k Stellen, dann besitzt er eine kanonische Generatormatrix. Ist er nicht systematisch in den ersten k Stellen, besitzt er keine kanonische Generatormatrix. Man kann aber die Stellen so permutieren, dass der Code in den ersten Stellen systematisch wird. Abschliegend mochten wir noch Sage bemiihen, um einen linearen Code auf systematische Stellen zu untersuchen. Dazu formulieren wir eine Aufgabe, an der Sie sich gerne versuchen diirfen. Die Losung ist allerdings direkt angefiigt. 131 Schreiben Sie ein Sage-Programm, welches fiir einen durch eine Generatormatrix (Input) definierten linearen Code C fiber einem endlichen Korper Fq in Sage GF (q) - alle Mengen von Stellen ausgibt, in welchen C systematisch ist. Sicherlich hilft Ihnen die Funktion Combinations (list, k) um sich eine Liste mit alien k-elementigen Teillisten einer Liste list ausgeben zu lassen. Haben Sie einen Vektorraum V definiert, dann hilft Ihnen sicherlich auch die [ ], welche True zuriickgibt, falls es Abfrage V . I inear_dependence (vs) tatsachlich keine Abhangigkeit zwischen den Vektoren in der Liste vs gibt, sie also linear unabhangig sind and False, falls sie doch linear abhangig sind.

Die Losung von Aufgabe 13.1 finden Sie hier. sage, def SystStellen(A): #Eingabe: Matrix A V = VectorSpace(GF(5),A.nrows()) solution = [a for a in Combinations(A.columns(),A.nrows()) if V.linear_dependence(a)==[]] index , n =[], A.ncols()-1 for a in solution: indexa=[] for c in a: for i in [0..n]: if A.column(i)==c: • if c==a[0]: indexa.append((i]) else: for j in [0..len(indexa)-1]: indexa[j].append(i) index.append(indexa) return(solution,index) #Ausgabe, unabh. Spaltenvek. - ffir j'de eine Liste zugeh6rigeer !pal_tenind sage : # : A = matrix(GF(5),([1,0,1,2,0],[0,2,0,2,1],[3,2,3,2,1]]) A [1 0 1 2 0]

458

s]

LINEARE CODES

[0 2 0 2 1] [3 2 3 2 1] sage: SystStellen(A) ([1(1, 0, 3), (0, 2, 2), (2, 2, 2)], [(1, 0, 3), (2, 2, 2), (0, 1, 1)11, [[[0, 1, 3], [2, 1, 3]], [[0, 3, 4], [2, 3, 4]]])

13.3.4 Prüfstellen aus Daten berechnen Zu Beginn des Abschnitts über lineare Codes haben wir uns die Konstruktion von Codes mit Daten- und Prüfstellen angeschaut. Ein Codewort besteht aus Datenbits und wird um Prüfstellen ergänzt welche aus den Datenbits berechnet werden. Sind die Berechnungen der Prüfstellen lineare Abbildungen der Datenbits in das zugrundeliegende Alphabet, dann ist der Code ein linearer Code. DEFINITION 13.59. Es seien n,k E N so dass m = n - k > 0 ist und k Abbildungen von IF,k nach 1Fq . Dann nennen wir einen Code p1, C = (w, pi (w),

, p„,(w)) : w E Figc

einen (n, k)-Kontrollstellencode über den Abbildungen p1,

, pm.

BEMERKUNG 13.60.

1. Jeder Kontrollstellencode ist ein Blockcode. S. Die Datenwörter können an den ersten k Stellen der Codewörter ausgelesen werden. k Das einem Kontrollstellencode zugrundeliegende Alphabet ist in den Abbilpm versteckt. dungen pi, k Jeder (n, k)-Kontrollstellencode ist systematisch in den ersten k Stellen. ■ BEISPIEL 13.61. Sei n = 4, k = 2 und q = 3, dann ist m = n - k = 4 - 2 = 2. Außerdem seien pi : n -> F3, W 1-> 1 03 wi 03 2 03 w2 P2 1F3 F3, W 1-> 0 03 Wi ®3 1 03 W2

definiert. Möchte man einen Kontrollstellencode mit diesen Parametern erzeugen, müssen die Codewörter zu den Datenwörtern in Fi berechnet werden. Das berechnen der Codewörter läuft wie in dem folgenden Beispiel für w = (1, 2) E n gezeigt, indem man das Wort w durch die Bilder der Abbildungen Pi ((1, 2)) P2((1, 2))

=- 1 03 1 03 2 03 2 = 2 = 0 03 103 103 2 = 2.

ergänzt. Also ist das zu dem Datenwort (1, 2) gehörende Codewort (1, 2, 2, 2). Berechnet man die Codewörter für alle Wörter in 1E1 dann erhält man den (4, 2)-

459

A

k LINEARE CODES

Kontrollstellencode über den Abbildungen pi und P2 (0, 0, 0, 0),

(1,0,1,0), C= {(2, 0, 2, 0),

(0, 1,

2, 0), (1,1,0,1), (2,1, 1, 2),

(0, 2, 1, 0), (1,2,2,1),}. (2, 2, 0, 2)

SATZ 13.62. Es ist ein (n, k)-Kontrollstellencode über den Abbildungen py,, genau dann ein [n, k] -Code, wenn die Abbildungen /31, • • • , prn lineare Abbildungen sind. /31,

Beweis. Wir zeigen die beiden Richtungen der Aussage. " >": Es sei C sowohl ein (n, k)-Kontrollstellencode als auch ein [n, Code. Weil C ein (n, k)-Kontrollstellencode ist, ist C systematisch in den ersten k Stellen. Nach Korollar 13.57 besitzt C eine kanonische Generatormatrix G. Nach Lemma 13.51 ist für jedes Datenwort w E In die i-te Stelle des zugehörigen Codeworts c = w • G genau das Produkt von w und der i-ten Spalte von G. Es ist also ci = w • G(i) und somit ci = A(w) mit pi (w) = w • G(i) einer lineare Abbildung deren Koeffizienten den Einträgen der Generatormatrix G in der i-ten Spalte entsprechen. Die Codewörter in C lassen sich also durch Datenwörter und das Berechnen von n — k linearen Abbildungen in den Datenwörtern berechnen. Die Abbildungen des (n, k)-Kontrollstellencode über den Abbildungen pl , prn sind also lineare Abbildungen. "-": Sei also C ein (n, k)-Kontrollstellencode über den linearen Abbildungen pi , , pn_ k mit pi(w)= All' wi + • • • + Aki • wk P2 (W) = A21 • W1 " '

Ä2k • Wk

Pm (W) = Alm • WI + • "

)km • Wk•

Dann kann aber für ein gegebenes Datenwort w E In das Codewort (w, pl(w), . • pm(w)) über das Produkt

(W, P1 (W), • • • Pm (4) = w • (idkA)

mit A =

:

Ä, ›12

1 1 "lm

22

2m

: •.

:

41 42 ' " %~km

berechnet werden. Also ist der Code C das Linksbild einer Matrix und damit ein Untervektorraum des FZ der Dimension k. Also ist C eine [n, Code mit Generatormatrix (idk A). ■

460

LINEARE CODES

13.63. Jeder in den ersten k Stellen systematische [n, k]-Code C ist ein (n, k)-Kontrollstellencode mit den linearen Abbildungen pen_ k = Gn_k, , pn. = G, für die kanonische Generatormatrix G von C. LEMMA

Beweis. Nach Lemma 13.56 besitzt jeder in den ersten k Stellen systematische [n, k]-Code C eine kanonische Generatormatrix. Demnach lassen sich die letzten n — k Stellen der Generatormatrix als lineare Abbildungen interpretieren, welche die ersten k Datenbits auf die angehängten n — k ■ Prüfstellen abbilden. Wir haben nun die anfängliche Behauptung bewiesen, dass lineare Codes Codewörter mit ausgewiesenen Daten- und Prüfstellen enthalten, wobei die Prüfstellen über lineare Abbildungen aus den Datenstellen berechnet werden können. Im Beweis zu Satz 13.62 wird zudem deutlich, dass die Koeffizienten der linearen Abbildungen eines Kontrollstellencodes und die letzten Spalten der kanonischen Generatormatrix miteinander korrespondieren. Man kann das eine aus dem anderen herleiten.

13.3.5 Die Kontrollmatrix linearer Codes Wir lernen nun noch die Kontrollmatrix eines linearen Codes kennen. Dabei handelt es sich um eine Matrix, anhand derer man leicht prüfen kann, ob ein Wort in dem linearen Code enthalten ist. DEFINITION 13. 64. Es sei C ein [n, k]-Code. Eine Matrix H E eine Kontrollmatrix von C, falls für alle x E In' gilt

xEC