Algebra

Table of contents :
Kapitel 1. Einführung
1.1. Was ist Algebra?
1.2. Quellen
1.3. Literatur
1.4. Vorkenntnisse
1.5. Notation
1.6. Algebraische Strukturen
Kapitel 2. Ringe
2.1. Grundlagen
2.2. Polynome
2.3. Kommutative Ringe und Teilbarkeit
2.4. Ideale
2.5. Kongruenzen
2.6. Faktorringe
2.7. Anwendung: Das RSA-Kryptosystem
2.8. Brüche und Quotientenkörper
2.9. Nullstellen von Polynomen und Irreduzibilität
Kapitel 3. Gruppen
3.1. Grundlagen
3.2. Zyklische Gruppen
3.3. Symmetrische und alternierende Gruppen
3.4. Diedergruppen
3.5. Normalteiler und Faktorgruppen
3.6. Operationen
3.7. Endlich erzeugte abelsche Gruppen
3.8. Übersicht über die Gruppen kleiner Ordnung
Kapitel 4. Körper
4.1. Grundlagen
4.2. Algebraische Körpererweiterungen
4.3. Konstruktion von Körpererweiterungen
4.4. Endliche Körper
4.5. Normale Körpererweiterungen
4.6. Separable Körpererweiterungen
4.7. Automorphismen und Galois-Gruppen
4.8. Der Hauptsatz der Galois-Theorie
4.9. Auflösen von Gleichungen durch Wurzelziehen

Citation preview

ALGEBRA Skript zur Vorlesung Technische Universität Dortmund Wintersemester 2016

Daniel Plaumann

Fassung vom 26. Juli 2017

Inhaltsverzeichnis Kapitel 1. Einführung 1.1. Was ist Algebra? 1.2. Quellen 1.3. Literatur 1.4. Vorkenntnisse 1.5. Notation 1.6. Algebraische Strukturen

5 5 6 6 7 7 7

Kapitel 2. Ringe 2.1. Grundlagen 2.2. Polynome 2.3. Kommutative Ringe und Teilbarkeit 2.4. Ideale 2.5. Kongruenzen 2.6. Faktorringe 2.7. Anwendung: Das RSA-Kryptosystem 2.8. Brüche und Quotientenkörper 2.9. Nullstellen von Polynomen und Irreduzibilität

11 11 16 20 26 34 37 45 47 52

Kapitel 3. Gruppen 3.1. Grundlagen 3.2. Zyklische Gruppen 3.3. Symmetrische und alternierende Gruppen 3.4. Diedergruppen 3.5. Normalteiler und Faktorgruppen 3.6. Operationen 3.7. Endlich erzeugte abelsche Gruppen 3.8. Übersicht über die Gruppen kleiner Ordnung

59 59 68 70 76 79 86 89 96

Kapitel 4. Körper 4.1. Grundlagen 4.2. Algebraische Körpererweiterungen 4.3. Konstruktion von Körpererweiterungen 4.4. Endliche Körper 4.5. Normale Körpererweiterungen 4.6. Separable Körpererweiterungen 4.7. Automorphismen und Galois-Gruppen 4.8. Der Hauptsatz der Galois-Theorie 4.9. Auflösen von Gleichungen durch Wurzelziehen

3

99 99 101 106 110 113 115 118 123 126

Algebra

Daniel Plaumann Technische Universität Dortmund Wintersemester 2016 Fassung vom 26. Juli 2017

. EINFÜHRUNG

1.1. Was ist Algebra? Ursprünglich versteht man unter Algebra das Auflösen und Umformen von Gleichungen durch Rechnen mit Symbolen. Im Unterschied zur Analysis wird in der Algebra auf Grenzwertbildung verzichtet — Gleichungen sollen immer in endlich vielen Rechenschritten exakt gelöst werden und nicht zum Beispiel durch Reihenentwicklung oder Approximation. Wenn die Gleichungen linear sind, ist das die lineare Algebra; durch Elimination lassen sich im Prinzip beliebig viele lineare Gleichungen in beliebig vielen Variablen lösen. Wenn die Gleichungen nicht linear sind, ist das nicht mehr so einfach. Lineare und quadratische Gleichungen in einer Variablen wurden schon im Altertum (zuerst von den Babyloniern) untersucht. Heute lernt man das in der Schule. Entsprechende allgemeine Formeln für Gleichungen dritten und vierten Grades wurden im 16. Jahrhundert in Italien gefunden (Cardano, del Ferro, Ferrari, Tartaglia). Die Suche nach Lösungsformeln für Gleichungen vom Grad  blieb lange erfolglos. Im Jahr 1824 bewies schließlich Abel, aufbauend auf einem unvollständigen Beweis von Ruffini, dass geschlossene Lösungsformeln nicht existieren. Der Beweis dieser erstaunlichen Aussage (die man erst einmal präzise formulieren muss) ist ein Meilenstein in der Geschichte der Mathematik und soll auch ein Glanzlicht dieser Vorlesung werden. In den darauf folgenden Jahrzehnten wurde die Theorie erheblich weiter entwickelt, unter anderem durch Galois, wodurch auch die Prinzipien hinter dem Satz von Abel-Ruffini deutlich klarer wurden. Daraus entstand schließlich, unter dem Einfluss von Cayley und anderen, die Theorie der Gruppen und damit allmählich die abstrakte Algebra als Strukturtheorie. Die systematische Untersuchung von Strukturen ist ein wesentliches Merkmal der modernen Mathematik. Heute lernt man schon im ersten Semester, was Körper, Vektorräume und Gruppen sind und bekommt ein Gefühl für die abstrakte Heransgehensweise an die Lösungstheorie von Gleichungen und andere Fragen vermittelt, und auch die angewandte Mathematik kommt nicht ganz ohne sie aus. Den souveränen Umgang mit algebraischen Strukturen zu trainieren, ist deshalb auch das wichtigste Ziel der Vorlesung Algebra. Andererseits erscheint die reine Strukturtheorie leicht trocken und unmotiviert, wenn sie nicht zusammen mit einem Teil der konkreten Fragen präsentiert wird, aus denen sie entstanden ist. Das sind neben Fragen der Algebra selbst, wie der Lösungstheorie von algebraischen Gleichungen, vor allem Fragen der Geometrie und der Zahlentheorie. So weit es in nur einem Semester möglich ist, werde ich daher versuchen, auch auf diese Ursprünge und auf einige klassische und moderne Anwendungen der Algebra einzugehen. Wir beginnen in §1.6 mit einem Überblick über die wichtigsten Strukturen und ihre Ursprünge.

5

6

1. EINFÜHRUNG

1.2. Quellen Dies ist ein Vorlesungsskript und kein Lehrbuch. Entsprechend habe ich die Darstellung teils selbst entwickelt, teils aus verschiedenen Quellen mehr oder minder abgeschrieben, ohne das immer im Einzelnen kenntlich zu machen. (Tun Sie das nicht in Ihrer Seminar- oder Abschlussarbeit!) Neben den unten angegebenen Lehrbüchern habe ich mich dabei auch aus diversen Vorlesungsskripten bedient, vor allem von Wolf Barth (Erlangen), Wulf-Dieter Geyer (Erlangen), Franz Kalhoff (Dortmund), Rudolf Scharlau (Dortmund) und Claus Scheiderer (Konstanz).

1.3. Literatur Es gibt zahllose Lehrbücher der Algebra, mit unterschiedlichen Konzepten und Schwerpunkten, Zielgruppen und Anforderungen. Ich will nur ein paar ganz kurz besprechen. Alle tragen originellerweise den Titel Algebra. [Bo] S. Bosch, Algebra. Springer Lehrbuch, Sechste Auflage, 2005. Ein Lehrbuch, das den Standardstoff an deutschen Universitäten sehr vollständig abdeckt, zusammen mit vielen weiterführenden Themen (entsprechend gekennzeichnet). Teilweise recht anspruchsvoll, aber sehr gut geschrieben.

[KM] C. Karpfinger und K. Meyberg, Algebra. Springer-Spektrum, dritte Auflage (2010). Dieses Lehrbuch ist ziemlich beliebt, wie schon sein Vorgänger, das Buch von Meyberg allein. Es ist sehr ausführlich und dadurch sieht man nach meiner Meinung häufig den Wald vor Bäumen nicht. Dafür gibt es viele Beispiele und Aufgaben und kaum Lücken oder gedankliche Sprünge. Gerade wenn einem ein Thema mal Schwierigkeiten bereitet, kann dieses Buch eine Hilfe sein.

[La] S. Lang, Algebra. Springer Graduate Texts in Mathematics 211, revised 3rd edition (2001). Am anderen Ende der Skala findet sich dieses bekannte amerikanische Lehrbuch, sozusagen der Anti-Meyberg. Es ist ein sehr umfangreiches und anspruchsvolles Buch, das sich trotzdem bei jedem Thema auf das Wesentliche konzentriert. In einer Reihe von Standardwerken, die von berühmten Algebraikern verfasst wurden und jeweils die Grundlagen der Algebra als Forschungsgebiet darstellen sollen (van der Waerden, Jacobson, M. Artin), ist es vielleicht das modernste.

[Co] P. M. Cohn, Algebra I-III. John Wiley & Sons, second edition (1981). Ein Buch, das mir persönlich sehr gefällt, ist dieses ältere britische Lehrbuch. Auswahl und Reihenfolge des Stoffs passen nicht so gut in das deutsche System, und die weiterführenden Themen (vor allem in Band III, die erste Auflage war nur zweibändig) entsprechen mehr den persönlichen Interessen des Autors. Die Klarheit und Eleganz der Präsentation sind aber vorbildlich.

Wikipedia ist eine gute Referenz auf die Schnelle, aber die Qualität, Ausführlichkeit und Klarheit der Einträge variieren sehr stark. Grobe Fehler sind allerdings selten geworden. Die deutsche und englische Wikipedia unterscheiden sich oft erheblich von einander. In der Regel ist eher die englische Version die bessere.

1.6. ALGEBRAISCHE STRUKTUREN

7

1.4. Vorkenntnisse Sie sollten den Stoff der linearen Algebra möglichst sicher beherrschen. Zur Wiederholung verweise ich hier auf einige Kapitel aus dem Skript von Herrn Scharlau, die für die Algebra besonders wichtig sind, nämlich gerade die ersten: §1.2 Eigenschaften ganzer Zahlen §1.3 Zahlbereiche und algebraische Strukturen §1.5 Restklassen, Äquivalenzklassen und Isomorphie

1.5. Notation Ein paar Hinweise zur Notation: ○ In den natürlichen Zahlen N = {, , , . . . } ist die  nicht enthalten. Wenn die Null dabei sein soll, schreiben wir N = N ∪ {}. (In der englischsprachigen Literatur ist das häufig anders.) ○ Wir schreiben A ⊂ B um auszudrücken, dass jedes Element der Menge A in der Menge B enthalten ist. Dabei ist auch die Gleichheit A = B möglich. Wenn die Gleichheit ausgeschlossen sein soll, schreiben wir A ⊊ B. Die Notation A ⊆ B wird nicht verwendet. ○ Abbildungen zwischen Mengen A und B schreiben wir mit einem Pfeil A → B, während die Abbildungsvorschrift für einzelne Elemente mit dem Pfeil a ↦ b beschrieben wird. ○ Hin und wieder verwenden wir zur Verdeutlichung die logischen Formelzeichen: ∀ für alle,

∃ es gibt,

⇒ impliziert,

∧ und,

∨ oder.

1.6. Algebraische Strukturen Die grundlegenden Strukturen der Algebra sind Gruppen, Ringe und Körper. Die Begriffe sind aus der linearen Algebra bekannt, aber wir werden sie jetzt wiederholen. Vorab führen wir noch eine allgemeinere Struktur ein, um die anschließenden Definitionen zu vereinheitlichen. Es sei M eine nichtleere Menge. Eine Verknüpfung auf M ist eine Abbildung φ∶ M × M → M, die also jedem geordneten Paar (a, b) von Elementen aus M ein Element φ(a, b) in M zuordnet. In der Regel schreibt man eine Verknüpfung wie eine Rechenoperation, etwa a ∗ b statt φ(a, b), wobei ∗ ein Plus- oder Malzeichen oder sonstiges Symbol ist. Definition. Ein Monoid ist eine nicht-leere Menge M zusammen mit einer Verknüpfung M × M → M, (a, b) ↦ a ⋅ b, die die folgenden Eigenschaften besitzt. (A) Für alle a, b, c ∈ M gilt (ab)c = a(bc). (Assoziativität) (N) Es gibt ein Element  ∈ M mit a = a = a für alle a ∈ M. (Neutrales Element) Hier haben wir die Verknüpfung multiplikativ geschrieben, also mit einem Malzeichen, und dann, wie bei der Multiplikation von Zahlen üblich, das Malzeichen gleich wieder weggelassen. Ein Monoid M heißt kommutativ, wenn außerdem gilt (K) Für alle a, b ∈ M gilt ab = ba. (Kommutativität)

8

1. EINFÜHRUNG

Die natürlichen Zahlen N mit der Addition oder Multiplikation bilden ein kommutatives Monoid. Natürlich wird die Addition mit einem + geschrieben und das neutrale Element ist dann , auch wenn wir in der Definition die multiplikative Schreibweise benutzt haben.1 Die Monoide haben als algebraische Struktur kaum eigenständige Bedeutung. Definition. Eine Gruppe ist ein Monoid G mit invertierbarer Verknüpfung, d.h. es gilt: (I) Zu jedem g ∈ G gibt es ein g − ∈ G mit g g − = g − g = . (Existenz von Inversen) Aus der linearen Algebra bekannt sind zum Beispiel: ○ Lineare Gruppen. Ist V ein Vektorraum über einem Körper K, so ist GL(V ) die Gruppe der invertierbaren linearen Abbildungen V → V ; passend dazu die Gruppen GLn (K), SLn (K) usw. von invertierbaren Matrizen. ○ Symmetrische Gruppen. Die Gruppe S n aller Permutationen der Menge {, . . . , n}. Kommutative Gruppen heißen von jeher auch abelsche Gruppen. Die genannten linearen und symmetrischen Gruppen sind aber nicht abelsch (für n ⩾  bzw. n ⩾ ). Allgemein kommen Gruppen immer dann vor, wenn es um die Symmetrien anderer mathematischer Objekte geht. Wie schon erwähnt spielen Gruppen auch eine wichtige Rolle bei der Lösbarkeit von algebraischen Gleichungen, nämlich in der Galois-Theorie, die die Symmetrien der Lösungen solcher Gleichungen untersucht. Definition. Ein Ring ist eine Menge R zusammen mit zwei Verknüpfungen +∶ R × R → R (Addition) und ⋅ ∶ R × R → R (Multiplikation), die die folgenden Eigenschaften besitzen. (R1) Unter der Addition ist R eine abelsche Gruppe. (R2) Unter der Multiplikation ist R ein Monoid. (R3) Addition und Multiplikation sind distributiv: Für alle a, b, c ∈ R gelten a(b + c) = ab + ac

und (a + b)c = ac + bc.

Ein Ring heißt kommutativ, wenn seine Multiplikation kommutativ ist. Der Ring Z der ganzen Zahlen und der Ring K[x] der Polynome über einem Körper K sind kommutative Ringe. Worauf es bei den kommutativen Ringen ankommt, ist die Teilbarkeit. In einem kommutativen Ring R teilt ein Element b ein Element a, wenn es ein Element c mit a = bc gibt. Jede ganze Zahl ist in eindeutiger Weise ein Produkt von Primzahlen, die sich nicht weiter teilen lassen. Viele Ideen der Ringtheorie sind aus dem Versuch entstanden, die Teilbarkeit in allgemeineren Zahlbereichen, den sogenannten Zahlringen, besser zu verstehen, in denen die eindeutige Zerlegbarkeit in Primzahlen im allgemeinen nicht mehr gegeben ist. Eine große Rolle spielen außerdem Polynomringe in einer oder mehreren Variablen. Auf der kommutativen Ringtheorie bauen deshalb zwei große moderne Forschungsgebiete auf, die algebraische Zahlentheorie und die algebraische Geometrie. Besonders die Verbindungen zur Zahlentheorie werden auch in dieser Vorlesung immer wieder eine Rolle spielen. Verdeutlichung verwendet man bei Monoiden und Gruppen auch gern neutrale Symbole, z.B. ∗ für die Verknüpfung und e für das neutrale Element. Man muss sich aber so oder so daran gewöhnen, dass die Bedeutung von Symbolen variabel ist und eben bloß eine Frage der Schreibweise.

1Zur

1.6. ALGEBRAISCHE STRUKTUREN

9

Das wichtigste Beispiel für einen nicht-kommutativen Ring ist der Ring der quadratischen Matrizen mit Einträgen in einem Körper (oder in einem Ring). Die kommutative und die nichtkommutative Ringtheorie haben aber außer den Grundlagen keine großen Überschneidungen. Die nicht-kommutativen Ringe lassen wir daher aus Zeitgründen fast völlig außer Acht. Definition. Ein kommutativer Ring K heißt ein Körper, wenn K ∖ {} unter der Multiplikation eine Gruppe bildet, wenn es also multiplikative Inverse gibt. Bekannt aus der linearen Algebra sind die Körper Q, R und C sowie die endlichen Körper F p . Zusätzlich werden wir u.a. weitere endliche Körper und Teilkörper von C konstruieren. In der Körpertheorie geht es meistens in der einen oder anderen Form um die Frage, welche Gleichungen im welchem Körper lösbar sind. Zum Beispiel hat die algebraische Gleichung x  − x  + x  − x −  =  die vier Lösungen +

√ ,

−

√ ,

+

√ −,

−

√ −.

Ihre Lösbarkeit hängt also davon ab, über welchem Körper man sie betrachtet: Über Q ist sie unlösbar, über R hat sie zwei Lösungen und über C schließlich vier. Es hat sich dabei gezeigt, dass die Konstruktion und die Eigenschaften von Körpern, die ganz bestimmte Gleichungen lösen, auch für das Verständnis der Gleichungen selbst entscheidend ist. Wir haben gesehen, dass die Grundbegriffe Gruppe, Ring und Körper zwar logisch auf einander aufbauen, aber jeweils die abstrakte Sprache für die Untersuchung unterschiedlicher Phänomene darstellen. Diese Phänomene sind zusammengefasst: Gruppen : Symmetrie Ringe : Teilbarkeit Körper : Lösbarkeit von algebraischen Gleichungen Da wir zusammen mit den abstrakten Strukturen auch diese Phänomene möglichst gründlich verstehen wollen, werden wir Gruppen, Ringe und Körper die meiste Zeit getrennt behandeln. Wir beginnen mit den Ringen.

Algebra

Daniel Plaumann Technische Universität Dortmund Wintersemester 2016 Fassung vom 26. Juli 2017

. RINGE

2.1. Grundlagen Als erstes wiederholen wir die Definition aus der Einleitung: Definition. Ein Ring ist eine Menge R zusammen mit zwei Verknüpfungen +∶ R × R → R (Addition) und ⋅ ∶ R × R → R (Multiplikation), die die folgenden Eigenschaften besitzen. (R1) Unter der Addition ist R eine abelsche Gruppe. (R2) Unter der Multiplikation ist R ein Monoid. (R3) Addition und Multiplikation sind distributiv: Für alle a, b, c ∈ R gelten a(b + c) = ab + ac

und (a + b)c = ac + bc.

Wir schreiben immer  für das neutrale Element der Addition und  für das neutrale Element der Multiplikation. Das additive Inverse von a ∈ R wird −a geschrieben und a − b ist Kurzschreibweise für a + (−b), die Subtraktion. Die Multiplikation muss nicht kommutativ sein. Das ist auch der Grund, warum das Distributivgesetz in zwei Versionen dasteht. Der Ring R heißt kommutativ, wenn die Multiplikation kommutativ ist, also wenn ab = ba

für alle a, b ∈ R

gilt. Die Addition ist immer kommutativ. In jedem Ring R gilt a = a = 

für alle a ∈ R.

Denn es gilt a = a( + ) = a + a, also folgt a =  durch Subtraktion von a auf beiden Seiten. Analog zeigt man a = . Für a ∈ R und n ∈ N verwenden wir die Schreibweisen na = a + a + ⋯ + a ´¹¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹¸ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¶

und

a n = a⋯a , ± n Faktoren

n Summanden

wobei a =  und a  = . In jedem Ring gilt (−) =  wegen  = ( − ) =  −  + (−) . Bemerkung 2.1.1. Manche Autoren verlangen nicht, dass ein Ring ein neutrales Element für die Multiplikation, also eine Eins, besitzen muss. Wenn das doch der Fall ist, heißt der Ring dann ein ’Ring mit Eins’. In dieser Vorlesung ist jeder Ring ein Ring mit Eins. Man muss aber manchmal auf diesen Punkt achten, wenn man in die Literatur schaut.

Beispiele 2.1.2. (1) Der Prototyp aller Ringe ist der kommutative Ring Z der ganzen Zahlen. Er zeigt auch gleich die charakteristische Eigenschaft eines Rings: Multiplikative Inverse braucht es nicht zu geben. In Z haben nur die Zahlen  und − ein solches Inverses. (2) Der Ring K[x] der Polynome mit Koeffizienten in einem Körper K ist neben den ganzen Zahlen das zweite fundamentale Beispiel. (Eine exakte Definition geben wir im nächsten 11

12

2. RINGE

Abschnitt.) Wir wir sehen werden, kann man in der Sprache der Ringtheorie viele Aussagen treffen, die für ganze Zahlen und Polynome gleichermaßen gelten. (3) Wie aus der linearen Algebra bekannt, kann man in Z auch modulo einer Zahl n ∈ N rechnen, im kommutativen Ring Z/n = {, , , . . . , n − }. Dabei habe ich über die Reste , . . . , n −  einen Querstrich geschrieben, weil es die Restklassen modulo n sind. Mit der Modulo-Rechnung und ihrer Verallgemeinerung in allgemeinen Ringen, den Faktorringen, befassen wir uns später in §2.5 und §2.6. (4) Ist R ein Ring, dann ist die Menge Matn (R) der n × n-Matrizen mit Einträgen in R ein Ring unter der üblichen Addition und Multiplikation von Matrizen. Der wichtigste Fall ist der, in dem R = K ein Körper ist. Für n ⩾  ist der Matrizenring nicht kommutativ. (5) Der Nullring {} besteht nur aus der Null und ist natürlich denkbar langweilig. Er ist der einzige Ring, in dem  =  gilt. Denn ist R irgendein Ring mit  = , dann gilt a =  ⋅ a =  ⋅ a =  für alle a ∈ R, und damit ist R der Nullring. (6) Sind R und S zwei Ringe, dann ist auch das kartesische Produkt R×S ein Ring mit den komponentenweisen Verknüpfungen (a, b) + (a′ , b′ ) = (a + a′ , b + b ′ )

und (a, b)(a ′ , b ′ ) = (aa ′ , bb ′ ).

Das ist klar, weil die zwei Komponenten ja völlig getrennt bleiben, so dass sich die Ringeigenschaften direkt von R und S auf R×S übertragen. Die Null ist (, ) und die Eins ist (, ). Genauso kann man auch das Produkt von mehr als zwei, auch von unendlich vielen Ringen bilden. (7) Ist R ein Ring und X eine Menge, dann bilden die Funktionen Abb(X, R) = { f ∣ f ∶ X → R} einen Ring mit den Verknüpfungen ( f + g)(x) = f (x) + g(x)

und

( f g)(x) = f (x)g(x)

für x ∈ X. Es ist wieder klar, dass sich die Ringgesetze punktweise von R auf Abb(X, R) übertragen1. Die Eins in Abb(X, R) ist also die konstante Funktion f (x) =  für alle x ∈ X und die Null die Nullfunktion. Dieser Ring ist kommutativ, wenn R kommutativ ist. Ein solcher Ring braucht nicht unbedingt aus allen Funktionen zu bestehen. Zum Beispiel gibt es den Ring C  (X, R) aller stetig differenzierbaren Funktionen von einer offenen Teilmenge X ⊂ Rn nach R, weil Summen und Produkte von stetig differenzierbaren Funktionen wieder stetig differenzierbar sind. Definition. Eine Teilmenge S von R heißt ein Teilring (oder Unterring), wenn sie mit der Addition und Multiplikation aus R wieder einen Ring bildet. Explizit bedeutet das: (1) Für alle a, b ∈ S sind auch a + b und a − b wieder in S; (2) für alle a, b ∈ S ist auch ab in S; (3) es gilt  ∈ S. 1Wenn man will, ist dieses Beispiel auch ein Spezialfall des vorigen, denn Abb(X, R) ist die kartesische Potenz

RX.

2.1. GRUNDLAGEN

13

Ein Teilring enthält immer die , denn er enthält  und damit auch  =  −  nach (1). Obwohl der Nullring auch ein Ring ist, ist S = {} kein Teilring von R, da er die  nicht enthält, es sei denn natürlich, R ist selbst der Nullring. Beispiele 2.1.3. (1) Die ganzen Zahlen sind ein Teilring der rationalen Zahlen, diese ein Teilring der reellen Zahlen, welche wiederum ein Teilring der komplexen Zahlen sind. Der gerade beschriebene Ring C  ((, ), R) aller stetig differenzierbaren Funktionen (, ) → R ist ein Teilring des Rings Abb((, ), R) aller Funktionen (, ) → R. √ (2) Es sei d ∈ Z eine ganze Zahl und d ∈ C eine komplexe Quadratwurzel von d (reell, falls d ⩾ , sonst imaginär). Dann ist die Menge aller ganzzahligen Linearkombinationen √ √ Z[ d] = {a + b d ∣ a, b ∈ Z} √ √ √ von d und  ein Teilring von C (gelesen: ’Z adjungiert d’). Dass Z[ d] die  enthält, ist klar, und für alle a, b, a′ , b ′ ∈ Z gelten √ √ √ √ (a + b d) + (a ′ + b ′ d) = (a + a′ ) + (b + b′ ) d ∈ Z[ d] und √ √ √ √ (a + b d)(a′ + b ′ d) = aa′ + bb ′ d + (ab′ + a ′ b) d ∈ Z[ d]. √ Besonders wichtig ist der Fall d = −. Die Elemente von Z[ −] = Z[i] werden auch Gaußsche ganze Zahlen genannt. √ Wenn d ein Quadrat in Z ist, dann ist d eine ganze Zahl und es gilt natürlich einfach √ √ Z[ d] = Z. Andernfalls ist d auch keine rationale Zahl2. Daraus folgt dann, dass zwei Zahlen √ √ √ a + b d und a ′ + b ′ d in Z[ d] genau dann gleich sind, wenn a = a′ und b = b′ gilt. Es sei R ein Ring. Ein Element u ∈ R heißt invertierbar oder eine Einheit, wenn es v, w ∈ R gibt mit uv = wu = . In diesem Fall folgt v =  ⋅v = wuv = w ⋅  = w. Also besitzt u ein beidseitiges Inverses und man schreibt u− für v = w. Außerdem verwenden wir die Notation R ∗ = {u ∈ R ∣ u ist eine Einheit}. Wegen  ∈ R gilt immer R ∗ ≠ ∅. Weil jede Einheit ein beidseitiges Inverses besitzt und die Multiplikation assoziativ ist, ist die Menge R∗ unter der Multiplikation damit eine Gruppe, genannt die Einheitengruppe von R. Die Einheitengruppe von Z ist zum Beispiel eine zyklische Gruppe mit zwei Elementen, bestehend aus  und −. Beispiel 2.1.4. Wir bestimmen die Einheitengruppe der Gaußschen ganzen Zahlen: Sei x = a + √ bi ∈ Z[i], i = −, und angenommen es gibt x − = c + di ∈ Z[i] mit xx − = . Dann folgt auch xx − = , wobei x = a − bi die komplexe Konjugation bezeichnet. Also gilt  = xx − xx − = xxx − x − = (a  + b  )(c  + d  ). Bei der zweiten Gleichheit haben wir die Multiplikativität der komplexen Konjugation benutzt (siehe 2.1.6 unten). Weil a, b, c, d ganze Zahlen sind, folgt daraus nun a  + b  = . Das hat nur die Lösungen a = ±, b =  oder a = , b = ±. Die Einheiten in Z[i] sind deshalb gerade , −, i, −i 2Das kann man direkt wie für

√  beweisen. Wir zeigen das später auch allgemeiner (Kor. 2.9.13).

14

2. RINGE

mit Inversen , −, −i, i. Die Gruppe Z[i]∗ hat also vier Elemente. Es handelt sich um die Kleinsche Vierergruppe (auf die wir später im Abschnitt über Gruppen zurückkommen). In den Übun√ gen bestimmen wir in ähnlicher Weise die Einheitengruppe von Z[ ]. Definition. Ein Element a in einem Ring R heißt ein Nullteiler, wenn es ein b ∈ R gibt mit b≠

und (ab =  oder ba = ).

In jedem Ring ist  ein Nullteiler, außer im Nullring. Ein Ring, der außer  keine Nullteiler besitzt und nicht der Nullring ist, heißt nullteilerfrei. Ein kommutativer, nullteilerfreier Ring heißt ein Integritätsring (in der Literatur oft Integritätsbereich, englisch domain). Der Nullring ist per Definition kein Integritätsring; in Integritätsringen gilt immer  ≠ . Beispiele 2.1.5. (1) Die ganzen Zahlen sind ein Integritätsring. (2) Eine Einheit kann nie ein Nullteiler sein. Denn aus ub =  mit u ∈ R ∗ folgt b = u− ub = . Insbesondere ist jeder Körper ein Integritätsring. (3) Jeder Teilring eines Integritätsrings ist wieder ein Integritätsring, wie zum Beispiel die √ Ringe Z[ d], die wir gerade betrachtet haben. (4) Der Ring Z/n ist kein Integritätsring, wenn n keine Primzahl ist. Modulo  gilt zum Beispiel  ⋅  =  (mod ), aber ,  ≠  (mod ). Deshalb sind  und  Nullteiler im Ring Z/. (5) Eine quadratische Matrix A ∈ Matn (K) mit Einträgen in einem Körper K ist genau dann ein Nullteiler, wenn ihr Rang kleiner als n ist. Denn aus AB =  folgt, dass die Spalten von B im Kern von A liegen und aus BA =  folgt, dass die Zeilen von B im Kern von AT liegen. Also folgt Rang(A) < n. Ist umgekehrt Rang(A) < n, dann gibt es Spaltenvektoren b, c ≠  in K n mit Ab =  und c t A = . Ist dann B die Matrix, in der alle Spalten gleich b sind und C die Matrix, in der alle Zeilen3 gleich c t sind, dann folgt AB = CA = . Elemente, die keine Nullteiler sind, darf man kürzen. Ist a ∈ R kein Nullteiler, dann gilt ∀x, y ∈ R (ax = ay ⇒ x = y). Denn ax = ay ist äquivalent zu a(x − y) =  und damit zu x − y = , wenn a kein Nullteiler ist. Entsprechend folgt aus xa = ya genauso x = y, wenn a kein Nullteiler ist. Definition. Es seien R und S zwei Ringe. Ein Homomorphismus (oder genauer ein Ringhomomorphismus) zwischen R und S ist eine Abbildung φ∶ R → S, die Addition und Multiplikation respektiert und Eins auf Eins abbildet. Das bedeutet, es gelten (1) φ(a + b) = φ(a) + φ(b) für alle a, b ∈ R; (2) φ(ab) = φ(a)φ(b) für alle a, b ∈ R; (3) φ() = . Jeder Homomorphismus erfüllt außerdem (4) φ(−a) = −φ(a) für alle a ∈ R; (5) φ(u − ) = φ(u)− für alle Einheiten u ∈ R ∗ ; insbesondere φ(R∗ ) ⊂ S ∗ ; (6) φ() = . B zu geben, die AB =  und BA =  gleichzeitig erfüllt. (Es ist nicht schwer, sich dafür ein Beispiel zu überlegen, schon für n = .) In allgemeinen nicht-kommutativen Ringen kann man sogar noch zwischen Rechtsnullteilern und Linksnullteilern unterscheiden, aber das sparen wir uns.

3Es braucht keine Matrix

2.1. GRUNDLAGEN

15

Denn aus (1) folgt φ() + φ() = φ( + ) = φ(), also φ() =  durch Subtraktion von φ() auf beiden Seiten. Wegen φ(−a) + φ(a) = φ(−a + a) = φ() =  folgt φ(−a) = −φ(a), wegen der Eindeutigkeit der additiven Inversen. Analog folgt (5) aus (2) und (3) wegen φ(a − )φ(a) = φ() =  für alle a ∈ R ∗ . Während (6) also aus (1) folgt, kann man (3) nicht aus (2) herleiten. Tatsächlich erfüllt die Nullabbildung, φ(a) =  für alle a ∈ R, offensichtlich (1) und (2). Sie ist aber kein Homomorphismus, es sei denn es gilt  =  in S, also wenn S der Nullring ist. Beispiele 2.1.6.

(1) Die komplexe Konjugation C → C, x = a + bi ↦ x = a − bi

erfüllt x + y = x + y und x y = x ⋅ y für alle x, y ∈ C. Für die Addition ist das klar, für die Multiplikation sollte man es nochmal nachrechnen, wenn man es nicht mehr weiß: (a + bi)(c + di) = ac − bd + (ad + bc)i = ac − bd − (ad + bc)i = (a − bi)(c − di) = (a + bi) ⋅ (c + di). Die komplexe Konjugation ist also ein Ringhomomorphismus C → C. Ihre Einschränkung auf die ganzen Gaußschen Zahlen R = Z[i] ist ein Homomorphismus R → R. (2) Für jeden Ring von Funktionen Abb(X, R) ist die Auswertung in einem Punkt ein Homomorphismus mit Werten in R: Für x ∈ X ist die Abbildung µx ∶ {

Abb(X, R) → R f ↦ f (x)

ein Homomorphismus. Sind φ∶ R → S und ψ∶ S → T zwei Homomorphismen, dann ist die Komposition ψ ○ φ∶ R → T wieder einer. Außerdem gibt es, wie in der linearen Algebra, die Teilmengen Kern(φ) = {a ∈ R ∣ φ(a) = }

und

Bild(φ) = {φ(a) ∣ a ∈ R},

genannt Kern und Bild von φ. Das Bild ist ein Teilring von S (der Kern dagegen nicht, da er  nicht enthält, es sei denn S ist der Nullring). Proposition 2.1.7. Genau dann ist φ∶ R → S injektiv, wenn Kern(φ) = {} gilt. Beweis. Für a, a ′ ∈ R gilt φ(a) = φ(a ′ ) genau dann, wenn φ(a − a′ ) = , also a − a ′ ∈ Kern(φ) gilt. Daraus folgt die Behauptung. ∎ Definition. Ein bijektiver Homomorphismus heißt ein Isomorphismus. Die Ringe R und S heißen isomorph, wenn es einen Isomorphismus zwischen ihnen gibt. ∼

Wir schreiben abkürzend auch φ∶ R Ð → S um auszudrücken, dass φ ein Isomorphismus zwischen den Ringen R und S ist, sowie R ≅ S, wenn R und S isomorph sind. Ein Isomorphismus benennt sozusagen nur die Elemente um, ohne dass sich an Addition und Multiplikation im Ring irgendetwas ändert. Insbesondere gilt das Folgende: Lemma 2.1.8. Es sei φ∶ R → S ein Isomorphismus. Dann ist die Umkehrabbildung φ− ∶ S → R wieder ein Homomorphismus.

16

2. RINGE

Beweis. Sind a, b ∈ S, so gilt φ− (a + b) = φ− (φ(φ− (a)) + φ(φ− (b))) = φ− (φ(φ− (a) + φ− (b))) = φ− (a) + φ− (b). Genauso zeigt man φ− (ab) = φ− (a)φ− (b). Außerdem gilt φ− () = .



2.2. Polynome Es sei R ein Ring. Ein Polynom mit Koeffizienten in R ist ein Ausdruck der Form a n x n + a n− x n− + ⋯ + a x + a mit a , . . . , a n ∈ R, wobei x eine Variable ist. Was allerdings ist überhaupt eine Variable? In der linearen Algebra gewöhnt man sich schnell daran, die Koeffizienten eines linearen Gleichungssystems hübsch ordentlich in eine Matrix zu setzen, damit man die Namen der Variablen nicht dauernd hinschreiben muss. Sehr bald redet man dann nur noch über Matrizen, Vektoren, Vektorräume, Basen usw. Die Variablen dagegen haben sich in Luft aufgelöst, abgesehen davon, dass man in den Matrizen jetzt lauter Nullen herumschleppen muss, damit man noch weiß, welcher Eintrag zu welcher ’Variablen’ gehört. Bei Polynomen geht man im Prinzip ganz ähnlich vor. Ein Polynom ist gegeben durch die Folge seiner Koeffizienten. Es sei also R (N ) ={(a k )k∈N ∣ es gilt a k =  für alle bis auf endlich viele k ∈ N } die Menge aller endlichen Folgen in R, mit Nullen aufgefüllt. Wir schreiben kurz (a k ) für eine solche Folge. Zwei Folgen kann man gliedweise addieren, also (a k ) + (b k ) = (a k + b k ). Multipliziert wird aber nicht gliedweise, sondern durch die sogenannte Konvolution. Das ist gerade das, was man von Polynomen gewohnt ist, nämlich k

(a k ) ⋅ (b k ) = (∑i= a i b k−i )k∈N . 

Die Menge R (N ) mit dieser Addition und Multiplikation ist der Polynomring. Weil man Polynome aber wie gewohnt schreiben will, führt man nun nachträglich die Variable ein: Wir schreiben x i = (a k ) mit a k = {

 

falls k = i , sonst.

also für die Folge mit einer  an der i-ten Stelle und  überall sonst. Ist nun (a k ) ∈ R N eine Folge mit a k =  für alle k ⩾ n, so gilt nach Definition der Multiplikation n

(a k )k∈N = ∑ a k x k k=

Außerdem gilt wie erwartet x i ⋅ x j = x i+ j

2.2. POLYNOME

17

für alle i, j ∈ N . Um das zu sehen, seien x i = (a k ), x j = (b k ) die entsprechenden , -Folgen. Dann ist ∑ki= a i b k−i genau dann gleich , wenn a i b j in der Summe vorkommt, ansonsten . Das ist genau dann der Fall, wenn k = i + j gilt, was x i x j = x i+ j zeigt. Das Produkt von zwei Polynomen ist also wie gewohnt m

n

m

n

(∑k= a k x k ) ⋅ (∑l= b l x l ) = ∑k= ∑l= a k b l x k+l . Man schreibt nun wie üblich R[x] für die Menge R (N ) mit der gerade definierten Addition und Multiplikation und nennt R[x] den Polynomring in einer Variablen x mit Koeffzienten in R. Es ist einfach (aber etwas langwierig) nachzuprüfen, dass R[x] alle Ringaxiome erfüllt. Die Null in R[x] ist natürlich das Nullpolynom, die Eins ist x  = (, , , . . . , ). Der Ring R[x] ist genau dann kommutativ, wenn R kommutativ ist. Es sei f = a + a x + ⋯ + a n x n ∈ R[x] ein Polynom. Wie gewohnt definiert f eine Polynomfunktion dadurch, dass man die Variable x durch Elemente aus R ersetzt, also f∶{

R → R . b ↦ f (b) = ∑ni= a i b i

Genauer gesagt ist die Abbildung, die einem Polynom in R[x] die zugehörige Polynomfunktion R → R zuordnet, ein Homomorphismus R[x] → Abb(R, R). Im allgemeinen muss man allerdings zwischen einem Polynom und der zugehörigen Polynomfunktion unterscheiden. Betrachte zum Beispiel die beiden Polynome f = x +

und

g = x + x + x + 

über dem Körper F mit zwei Elementen. Es gelten f () = g() =  und f () = g() =  über F . Da F nur aus  und  besteht, sind die beiden Polynomfunktionen f ∶ F → F und g∶ F → F also dieselben. Es sind aber trotzdem zwei verschiedene Polynome, denn per Definition sind zwei Polynome genau dann gleich, wenn die Folgen ihrer Koeffizienten gleich sind. Anders gesagt, der Homomorphismus F [x] → Abb(F , F ) ist nicht injektiv, weil Abb(F , F ) endlich ist, F [x] dagegen unendlich. Deshalb ist es überhaupt nötig, Polynome abstrakt ohne Bezug auf Polynomfunktionen zu definieren. Bemerkung 2.2.1. In einem Polynom sind nur endlich viele Koeffizienten ungleich . Wenn man auf diese Forderung verzichtet, erhält man den Ring R[[x]] der formalen Potenzreihen, der aus allen Ausdrücken ∞

∑ ak x

k

k=

besteht. Genau wie die Polynome sind das einfach Folgen von Ringelementen. An der Addition und Mulitiplikation ändert sich nichts. (Auch wenn unendlich viele Koeffizienten ungleich  sind, wird bei der Konvolution immer nur über endlich viele Indizes summiert.) Konvergenzfragen bleiben außen vor, denn in einem Ring kann man zunächst einmal nur endlich viele Elemente aufsummieren und keine Grenzwerte bilden. Im allgemeinen bestimmt eine formale Potenzreihe also gar keine Funktion. Trotzdem sind formale Potenzreihen für manche Fragen sehr nützlich.

Der Grad von f = a n x n + ⋯ + a x + a ist der größte Index j mit a j ≠  und wird mit deg( f ) bezeichnet. Der Grad des Nullpolynoms ist −∞. Der Koeffizient adeg( f ) heißt der Leitkoeffizient von f , bezeichnet mit LC( f ). Das Produkt LC( f ) ⋅ x deg( f ) heißt der Leitterm. Per Definition ist der Leitkoeffizient immer ungleich . Das Polynom f heißt normiert, wenn LC( f ) =  gilt.

18

2. RINGE

Wir fassen den Koeffizientenring R immer als Teilring R ⊂ R[x] auf, indem wir ihn mit den Polynomen vom Grad  (bzw.−∞ für die ) identifizieren. Proposition 2.2.2. Ist R ein nullteilerfreier Ring, dann ist auch R[x] nullteilerfrei, und es gelten deg( f g) = deg( f ) + deg(g)

und

deg( f + g) ⩽ max{deg( f ), deg(g)}.

Falls deg( f ) ≠ deg(g), so gilt rechts Gleichheit. n i i Beweis. Sei m = deg( f ) und n = deg(g), etwa f = ∑m i= a i x und g = ∑ i= b i x . Per Definition kommt in f + g kein Exponent größer als max{m, n} vor und in f g kein Exponent größer als m + n. Also gilt deg( f + g) ⩽ max{m, n} und deg( f g) ⩽ m + n. Wegen a m , b n ≠  ist auch a m b n ≠ , da R nullteilerfrei ist. Also gilt deg( f g) ⩾ m+n und damit deg( f g) = m+n. Ist außerdem etwa m > n, so gilt a m + b m = a m ≠ , also deg( f + g) ⩾ m und damit deg( f + g) = m; entsprechend, falls m < n. Wir sehen auch: Sind f , g ∈ R[x] mit f , g ≠ , so folgt deg( f ), deg(g) ⩾  und damit deg( f g) = deg( f ) deg(g) ⩾ , also f g ≠ . Also ist R[x] nullteilerfrei. ∎

Korollar 2.2.3. Für einen nullteilerfreien Ring R gilt R[x]∗ = R ∗ . Beweis. Natürlich ist jede Einheit in R auch eine Einheit in R[x]. Seien umgekehrt f g ∈ R[x] mit f g = . Dann folgt deg( f ) + deg(g) = , also deg( f ) = deg(g) =  und damit f , g ∈ R∗ . ∎ Die Werte, die man für die Variable in einem Polynom mit Koeffizienten in R einsetzen kann, müssen nicht unbedingt aus R stammen. Zum Beispiel kann man in ein Polynom mit rationalen Koeffizienten ja auch reelle oder komplexe Zahlen einsetzen. Formal kann man das so sagen: Proposition 2.2.4. Seien R und S Ringe, φ∶ R → S ein Homomorphismus und s ∈ S. Es gibt genau einen Homomorphismus φs ∶ R[x] → S, der φ fortsetzt und x durch s ersetzt, also mit φs (a) = φ(a) für alle a ∈ R und φs (x) = s. Beweis. Wir definieren φs durch n

n

φs (∑i= a i x i ) = ∑i= φ(a i )s i . Dass φs ein Homomorphismus ist, ergibt sich aus der Definition von Addition und Multiplikation in R[x] und der Tatsache, dass φ ein Homomorphismus ist. Explizit gilt n

n

n

n

n

φs (∑i= a i x i + ∑i= b i x i ) = φs (∑i= (a i + b i )x i ) = ∑i= φ(a i + b i )s i = ∑i= (φ(a i ) + φ(b i ))s i n

n

n

n

= ∑i= φ(a i )s i + ∑i= φ(b i )s i = φs (∑i= a i x i ) + φs (∑i= b i x i ) und entsprechend für die Multiplikation. Außerdem hat φs offensichtlich die behaupteten Eigenschaften. Um die Eindeutigkeit zu zeigen, sei ψ∶ R[x] → S irgendein Homomorphismus mit ψ(a) = φ(a) für a ∈ R und ψ(x) = s. Dann gilt n

n

n

n

ψ(∑i= a i x i ) = ∑i= ψ(a i )ψ(x)i = ∑i= φ(a i )s i = φs (∑i= a i x i ).



Das übliche Einsetzen entspricht dem Fall, dass R ein Teilring von S ist und φ∶ R → S die √ Inklusionsabbildung a ↦ a. Für zum Beispiel R = Q, S = R und s =  ist φs dann also die √ Auswertung f ↦ f ( ) für ein Polynom f ∈ Q[x].

2.2. POLYNOME

19

Bemerkung 2.2.5. In der Regel schreibt man für ein Polynom f ∈ R[x] nur f und nicht f (x). Formal können wir aber sagen, dass f (x) die Einsetzung von x selbst in f bezeichnet. Dazu setzen wir S = R[x] und s = x in Prop. 2.2.4. Es ist dann φs = idR[x] , also f (x) = f . Die Notation f (x) ist manchmal nützlich, wenn man hervorheben möchte, dass die Variable in f eben x heißt.

Genauso wie für ganze Zahlen hat man für Polynome eine Division mit Rest. Das funktioniert über jedem Ring, allerdings mit einer wesentlichen Einschränkung an den Leitkoeffizienten. Satz 2.2.6 (Polynomdivision). Es sei R ein Ring und seien f , g ∈ R[x]. Angenommen, der Leitkoeffizient von g ist eine Einheit in R. Dann gibt es eindeutige Polynome q, r ∈ R[x] mit f = gq + r

und

deg(r) < deg(g).

Beweis. Wir können annehmen, dass g normiert ist, also Leitkoeffizient  hat. Denn ist a ∈ R ∗ der Leitkoeffizient von g, dann können wir g durch a − g ersetzen und anschließend q mit a multiplizieren. Für die Existenz, wähle q ∈ R[x] derart, dass r = f − gq den kleinsten möglichen Grad hat. Sei m dieser Grad. Behaupte, dass m < deg(g) gelten muss. Denn andernfalls sei bx m der Leitterm von r, dann haben r und bx m−deg(g) g denselben Leitterm, weil g normiert ist. Also folgt deg( f − (q + bx m−deg(g) )g) < m, ein Widerspruch zur Minimalität von deg(r). Für die Eindeutigkeit, sei f = gq + r = gq′ + r ′ mit deg(r), deg(r ′ ) < deg(g). Dann folgt g(q − q′ ) = r ′ − r. Falls q − q′ ≠ , sei cx k der Leitterm von q − q′ und sei n = deg(g). Dann hat g(q − q′ ) den Leitterm cx k+n und es folgt deg(r − r ′ ) < deg(g) = n ⩽ k + n = deg(g(q − q′ )), ein Widerspruch. Also muss q = q′ und damit auch r = r ′ gelten.



Es gibt natürlich auch Polynome in mehreren Variablen. Aufgrund der Allgemeinheit der Definition, muss man dazu gar nichts Neues erfinden. Wir definieren einfach R[x, y] = R[x][y]. Ein Polynom in x, y ist also ein Polynom in y mit Koeffizienten in R[x] und hat damit die Form m

f = ∑i= f i y i ,

mit f i ∈ R[x].

Wegen der Ringgesetze kann man alles ausmultiplizieren und jedes solche Polynom in der Form f = ∑ ai j x i y j schreiben. Dabei läuft die Summe über eine endliche Menge von Indexpaaren (i, j), die man meistens nicht explizit angibt. Man kann auch über (i, j) ∈ N summieren, wobei dann eben a i j =  für alle bis auf endlich viele (i, j) gelten muss. Weil man beliebig umsortieren kann, sind die Ringe R[x][y] und R[y][x] isomorph und man unterscheidet nicht zwischen R[x, y] und R[y, x]. Es kommt also nicht auf die Reihenfolge der Variablen an. Allgemeiner ist der Polynomring in n Variablen x , . . . , x n induktiv definiert durch R[x , . . . , x n ] = R[x , . . . , x n− ][x n ]. Bis auf weiteres spielen Polynome in mehreren Variablen für uns aber keine große Rolle.

20

2. RINGE

2.3. Kommutative Ringe und Teilbarkeit Es sei R immer ein kommutativer Ring. Sind a, b ∈ R, dann sagen wir b teilt a oder b ist ein Teiler von a und schreiben b∣a, wenn es c ∈ R gibt derart, dass a = bc gilt. Entsprechend schreiben wir b ∤ a, wenn b kein Teiler von a ist. Proposition 2.3.1. Die Teilbarkeitsrelation hat die folgenden Eigenschaften. (1) Für alle a ∈ R gilt a∣a. (2) Jedes Element teilt , aber  teilt kein Element ungleich .4 (3) Die Teiler von  sind genau die Einheiten in R. Eine Einheit teilt jedes andere Element. (4) Aus a∣b und b∣c folgt a∣c. (Die Teilbarkeit ist also transitiv.) (5) Aus a∣b und c∣d folgt ac∣bd. (6) Aus a∣b und a∣c folgt a∣(b + c). (7) Ist c kein Nullteiler und gilt ac∣bc, so folgt a∣b. Beweis. (1)–(6): Übung. (7) Wegen ac∣bc gibt es d ∈ R mit bc = acd. Daraus folgt c(b − ad) = . Da c kein Nullteiler ist, folgt b = ad und damit a∣b. ∎ Definition. Sind a und b zwei Elemente, die sich gegenseitig teilen, also mit a∣b

und

b∣a,

dann heißen a und b assoziiert und wir schreiben a ∼ b. Proposition 2.3.2. In einem Integritätsring sind zwei Elemente a und b genau dann assoziiert, wenn es eine Einheit u mit a = bu gibt. Die Assoziiertheit ist eine Äquivalenzrelation. Beweis. Für die erste Aussage, seien a und b assoziiert. Dann gibt es also u, v ∈ R mit a = bu und b = av, und es folgt a = auv. Ist a = , dann auch b =  und die Behauptung ist klar. Andernfalls folgt durch Kürzen uv = , also sind u und v Einheiten. Ist umgekehrt u eine Einheit mit a = bu, dann gilt b = au− . Also sind a und b assoziiert. Für die zweite Aussage müssen wir die Eigenschaften einer Äquivalenzrelation überprüfen. Die Assozziiertheit ist ○ reflexiv, d.h. es gilt a ∼ a für alle a; denn es gilt a = a ⋅ . ○ symmetrisch, d.h. aus a ∼ b folgt b ∼ a; denn aus a = bu mit u ∈ R ∗ folgt b = au− . ○ transitiv, d.h. aus a ∼ b und b ∼ c folgt a ∼ c; denn ist a = bu und b = cv mit u, v ∈ R ∗ , so folgt a = cuv. ∎ Beispiel 2.3.3. Zwei ganze Zahlen a, b ∈ Z sind genau dann assoziiert, wenn a = ±b gilt. Zwei Polynome f , g ∈ R[x] mit Koeffizienten in einem Integritätsring R sind genau dann assoziert, wenn es eine Einheit u ∈ R ∗ gibt mit f = ug (denn nach Kor. 2.2.3 sind die Einheiten in R auch die einzigen Einheiten in R[x]). Insbesondere sind zwei Polynome über einem Körper genau dann assoziiert, wenn sie sich um einen konstanten Faktor ungleich  unterscheiden. Element ’teilt Null’, denn es gilt immer a = . Der Begriff ’Nullteiler’ ist aber reserviert für den Fall, dass ab =  gilt, obwohl b ungleich  ist.

4Jedes

2.3. KOMMUTATIVE RINGE UND TEILBARKEIT

21

Definition. Sei R ein Integritätsring und sei c ∈ R nicht Null und keine Einheit. Ist c = ab und sind a und b beide keine Einheiten, dann heißen a und b echte Teiler von c. Ein Element c heißt irreduzibel, wenn es nicht Null ist, keine Einheit ist und keine echten Teiler besitzt. Mit anderen Worten, c ∈ R ist genau dann irreduzibel, wenn folgendes gilt: c ∉ R ∗ ∧ c ≠  ∧ ∀a, b ∈ R(c = ab ⇒ (a ∈ R ∗ ∨ b ∈ R ∗ )) In R = Z sind die irreduziblen Elemente per Definition genau die Primzahlen und ihre Negativen. Im Polynomring ist die Sache schon komplizierter. Ist K ein Körper, dann ist jedes Polynom vom Grad  entweder Null oder eine Einheit, also nicht irreduzibel. Die Polynome vom Grad  sind offensichtlich irreduzibel. Denn aus deg( f ) =  und f = gh folgt deg(g) =  oder deg(h) = , also ist g oder h eine Einheit. Allgemeiner hängt die Irreduzibilität von Polynomen eng mit den Nullstellen zusammen — das diskutieren wir in §2.9. Jede ganze Zahl ist bekanntlich ein Produkt von Primzahlen — genauer gilt: Satz 2.3.4. Jede ganze Zahl n ∈ Z besitzt eine Darstellung n = upr  ⋯prkk , wobei p , . . . , p k ∈ N verschiedene Primzahlen sind, u ∈ Z∗ = {, −} und r , . . . , r k ∈ N. Dabei sind p , . . . , p k und r , . . . , r k bis auf Reihenfolge durch n eindeutig bestimmt. Wir wiederholen an dieser Stelle nicht den Beweis. Statt dessen beweisen wir bald eine allgemeinere Version für Ringe. Dazu brauchen wir einiges an Vorbereitung. Verwirrenderweise ist der Begriff prim in allgemeinen Ringen zunächst anders definiert: Definition. Ein Element p in einem Integritätsring R heißt prim, wenn p nicht Null und keine Einheit ist und folgendes gilt: Für alle a, b ∈ R ist p genau dann ein Teiler des Produkts ab, wenn p ein Teiler von a oder ein Teiler von b ist. Ein Element p ∈ R ist also prim, wenn gilt: p ∉ R ∗ ∧ p ≠  ∧ ∀a, b ∈ R(p∣ab ⇒ p∣a ∨ p∣a). Wie hängen Primalität und Irreduzibilität zusammen? Zunächst gilt ganz allgemein Folgendes. Proposition 2.3.5. Jedes Primelement in einem Integritätsring ist irreduzibel. Beweis. Es sei p ∈ R prim und es gelte p = ab. Da p sich selbst und damit ab teilt, ist p also ein Teiler von a oder von b. Es gelte etwa p∣a, also a = c p mit c ∈ R. Daraus folgt p = ab = c pb und damit cb = . Also ist b eine Einheit. Entsprechend folgt a ∈ R ∗ falls p∣b. Also ist p irreduzibel. ∎ In den ganzen Zahlen gilt auch die Umkehrung, was erklärt, warum dort die beiden Begriffe vermischt sind. In allgemeinen Ringen ist die Sache komplizierter. Das folgende Beispiel ist absolut typisch für das Problem. Beispiel 2.3.6. Betrachte den Teilring √ √ R = Z[ −] = {a + b − ∣ a, b ∈ Z} ⊂ C der komplexen Zahlen (siehe Beispiel 2.1.3). Wir zeigen, dass es in R irreduzible Elemente gibt, die nicht prim sind, nämlich zum Beispiel die Zahl . Betrachte dazu die Wirkung der komplexen

22

2. RINGE

√ √ √ √ Konjugation auf R: Für x = a + b − gilt x = a + b i = a − b i = a − b − und damit √ √ xx = (a + b −)(a − b −) = a  + b  . √ √ Behaupte, dass die Zahl  irreduzibel in R ist. Denn sind x = a + b − und y = c + d − mit √ √  = x y = (a + b −)(c + d −), dann folgt  =  ⋅  =  ⋅  = x yx y = xx y y = (a  + b  )(c  + d  ). Rechts stehen also zwei positive ganze Zahlen mit Produkt . Da gibt es nicht viele Möglichkeiten: (1) Entweder a  + b  = , dann folgt b =  und a = ±. Also ist x = ± eine Einheit in R; (2) oder a + b = , das geht aber gar nicht; (3) oder a + b = , dann b =  und a = ±. Dann ist c  + d  = ±, also y eine Einheit. Also ist  irreduzibel. Allerdings ist  nicht prim, denn es gilt √ √  ⋅  =  = ( + −)( − −). √ √ Wäre  prim, dann müsste  also ein Teiler von  + − oder von  −  sein. Beides ist nicht der √ √ √ Fall, denn (a + b −) = a + b − ≠  ± − für alle a, b ∈ Z.

Es lohnt sich, dieses Beispiel im Kopf zu behalten. Das Argument, das die Irreduzibilität von  zeigt, kann man in ähnlicher Form immer wieder gebrauchen. Vor allem aber suggeriert das Beispiel einen grundsätzlichen Zusammenhang zwischen Irreduzibilität, Primalität und Eindeu√ tigkeit von Faktorisierungen: Die Zahl  ist irreduzibel aber nicht prim in Z[ −]. Das hängt damit zusammen, dass die Zahl  zwei verschiedene Darstellungen √ √  =  ⋅  = ( + −)( − −) √ als Produkt von irreduziblen Elementen hat. (Dass  und  ± − auch irreduzibel sind, kann √ man analog zeigen.) Die eindeutige Faktorisierbarkeit aus Z geht also in Z[ −] verloren. Definition. Es sei R ein Integritätsring und a ∈ R ein Ringelement. Eine Zerlegung von a in irreduzible Faktoren ist eine Darstellung a = uc ⋯c k , wobei c , . . . , c k ∈ R irreduzibel sind, k ∈ N und u ∈ R ∗ . Eine Zerlegung in Primfaktoren ist eine solche Darstellung, in der die c , . . . , c k prim sind. Ein faktorieller Ring ist ein Integritätsring R mit folgenden Eigenschaften: (1) Jedes Element ungleich  besitzt eine Zerlegung in irreduzible Faktoren. (2) Solche Zerlegungen sind eindeutig. Das bedeutet, ist a ∈ R ungleich Null und sind a = uc ⋯c k = u ′ c′ ⋯c ′l zwei Zerlegungen in irreduzible Faktoren, dann gelten k = l und c i ∼ c ′i für i = , . . . , k nach einer geeigneten Umnummerierung.

2.3. KOMMUTATIVE RINGE UND TEILBARKEIT

23

Wenn in der Darstellung a = uc ⋯c k zwei irreduzible Faktoren c i und c j assoziiert sind, etwa c i ∼ c j , dann gibt es also eine Einheit v ∈ R ∗ mit c i = vc j . Man kann dann u durch uv ersetzen und c i c j durch c j . In dieser Weise kann man die Zerlegung von a also auch so schreiben wie für ganze Zahlen in Satz 2.3.4, in der Form a = ucr ⋯c kr k , wobei c i ≁ c j für i ≠ j gilt und r , . . . , r k ∈ N. Es ist aber nicht immer praktisch, das zu tun. Beispiele 2.3.7. (1) Die ganzen Zahlen sind faktoriell nach Satz 2.3.4. (2) Jede Einheit in einem Ring besitzt eine Zerlegung in irreduzible Faktoren (nämlich mit null Faktoren!) und diese Darstellung ist immer eindeutig bis auf Assoziiertheit. Insbesondere ist jeder Körper ein faktorieller Ring, denn jedes Element ungleich Null ist eine Einheit. √ (3) Der Ring Z[ −] ist nicht faktoriell, wie wir gerade gesehen haben. Lemma 2.3.8. Es sei R ein faktorieller Ring. Sei a ∈ R und a = upr  ⋯prkk eine Zerlegung in Primfaktoren mit c i ≁ c j für i ≠ . Genau dann ist b ∈ R ein Teiler von a, wenn b ∼ ps ⋯pskk mit  ⩽ s i ⩽ r i für i = , . . . , k. Beweis. Genau dann gilt b∣a, wenn es c ∈ R gibt mit a = bc. Die Behauptung folgt, in dem man Zerlegungen von b und c hintereinander schreibt und mit der Zerlegung von a vergleicht. Ausführlich geht das so: Es sei b = u ′ p′s  ⋯p′sl l . Falls b ein Teiler von a ist, dann gibt es c ∈ R tm und betrachte die Gleichheit gibt mit a = bc. Schreibe c = vqt ⋯q m tm . upr  ⋯prkk = u ′ v p′s  ⋯p′sl l qt ⋯q m

Die Eindeutigkeit von Zerlegungen in R impliziert l ⩽ k, und nach Umnummerieren gelten p′i ∼ p i und s i ⩽ r i für i = , . . . , l. Die Behauptung folgt, mit s l+ = ⋯ = s k = . Umgekehrt teilt jedes b von der angegebenen Form a. Denn ist b = v ps ⋯pskk mit  ⩽ s i ⩽ r i , dann folgt a = uv − pr  −s ⋯prkk −s k b.



Wir kommen nun zu einem allgemeinen Kriterium für die Faktorialität eines Integritätsrings. Definition. Eine unendliche Teilerkette in R ist eine Folge (a n )n∈N von Elementen, in der a n+ ein echter Teiler von a n ist, also mit a n+ ∣a n und a n+ ≁ a n , für alle n ∈ N. Satz 2.3.9. Für einen Integritätsring R sind die folgenden Aussagen äquivalent: (i) Der Ring R ist faktoriell, das heißt jedes Element ungleich  besitzt eine Zerlegung in irreduzible Faktoren, die eindeutig ist bis auf Reihenfolge und Assoziiertheit. (ii) Jedes Element ungleich  hat eine Zerlegung in Primfaktoren. (iii) Jedes irreduzible Element in R ist prim und R besitzt keine unendlichen Teilerketten. Beweis. Wir zeigen die Implikationen (i)⇒ (iii)⇒(ii)⇒ (i).

24

2. RINGE

(i)⇒(iii): Es sei a ≠  und sei a = up ⋯p k eine Zerlegung in irreduzible Faktoren. Nach Lemma 2.3.8 ist dann jeder Teiler von a zu einem Teilprodukt der p , . . . , p k assoziiert. Insbesondere kann es keine unendlichen Teilerketten geben. Sei weiter p ∈ R irreduzibel, und es gelte p∣ab, etwa ab = pc. Seien a = up ⋯p k ,

b = v p k+ ⋯p l ,

c = wq ⋯q m

Zerlegungen in irreduzible Faktoren. Dann haben wir zwei Zerlegungen des Produkts ab = uv p ⋯p l = w pq ⋯q m . Aufgrund der Eindeutigkeit der Zerlegung von ab in irreduzible Faktoren gibt es dann ein i mit p ∼ p i , also p∣a oder p∣b. Das zeigt, dass p prim ist. (iii)⇒(ii): Es sei U die Menge aller Elemente ungleich  in R, die eine Zerlegung in Primfaktoren besitzten. Wir müssen U = R ∖ {} zeigen. Angenommen es gäbe a ∈ R ∖ {} mit a ∉ U. Insbesondere kann a dann nicht prim sein, also nach Voraussetzung auch nicht irreduzibel. Es gibt also b , b , beides keine Einheiten, mit a = b b . Es folgt b ∉ U oder b ∉ U, denn andernfalls wäre auch a in U enthalten. Ist etwa b ∉ U, dann ist b wiederum nicht irreduzibel, wir finden also c , c ∈ R ∖ R ∗ mit b = c c . In dieser Weise finden wir induktiv eine unendliche Teilerkette in R, ein Widerspruch. (ii)⇒(i): Da jedes Primelement auch irreduzibel ist, müssen wir nur die Eindeutigkeit beweisen. Sei also a ∈ R ungleich  und seien a = up ⋯p k = u ′ p′ ⋯p′l . zwei Zerlegungen von a. Wir zeigen die Behauptung durch Induktion nach k. Für k =  ist sie richtig: Aus u = u ′ p′ ⋯p′l folgt auch l = , denn ein echtes Produkt p′ ⋯p′l mit l ⩾  kann keine Einheit sein. Sei also k ⩾ . Nach Voraussetzung ist p prim. Aus p ∣p′ ⋯p′l folgt deshalb p ∣p′i für ein i. Durch Umnummerieren können wir p ∣p′ erreichen. Weil p′ irreduzibel ist, impliziert das p ∼ p′ , etwa p = v p′ . Einsetzen und Teilen durch p′ ergeben uv p ⋯p k = u ′ p′ ⋯p′l . Nach Induktionsvoraussetzung folgt k −  = l −  und p i ∼ p′i für i ⩾  nach Umnummerieren. Da dies auch für i =  gilt, ist die Behauptung bewiesen. ∎ Satz 2.3.9 ist schön und gut, aber für sich allein bringt er noch nicht allzu viel, wenn man herausfinden will, ob ein gegebener Ring faktoriell ist. Darauf kommen wir bald zurück. Definition. Es sei R ein Integritätsring und seien a, b ∈ R. Ein größter gemeinsamer Teiler von a und b ist ein Element d ∈ R, das a und b teilt und von jedem gemeinsamen Teiler von a und b geteilt wird. In Zeichen: (1) d∣a und d∣b; (2) ∀d ′ ((d ′ ∣a ∧ d ′ ∣b) ⇒ d ′ ∣d). Analog heißt ein Element e ∈ R ein kleinstes gemeinsames Vielfaches von a und b, wenn es von a und b geteilt wird und jedes weitere Element mit dieser Eigenschaft teilt. In Zeichen (1) a∣e und b∣e; (2) ∀e ′ ((a∣e ′ ∧ b∣e ′ ) ⇒ e∣e ′ ).

2.3. KOMMUTATIVE RINGE UND TEILBARKEIT

25

Wenn ein größter gemeinsamer Teiler von a und b existiert, dann ist er eindeutig bis auf Assoziiertheit. Denn sind d und d beides größte gemeinsame Teiler von a und b, dann folgt aus der Definition d ∣d und d ∣d , also d ∼ d . Entsprechendes gilt für das kleinste gemeinsame Vielfache. Deshalb schreibt man ggT(a, b) für den größten gemeinsamen Teiler, obwohl dieser eben nur bis auf Assoziiertheit bestimmt ist, und entsprechend kgV(a, b) für das kleinste gemeinsame Vielfache. Wenn jeder gemeinsame Teiler von a und b eine Einheit ist und damit zu  assoziiert, dann schreiben wir also ggT(a, b) = . In diesem Fall heißen a und b teilerfremd (oder auch coprim). Der größte gemeinsame Teiler erfüllt die folgenden einfachen Regeln: (1) ggT(ac, bc) = ggT(a, b)c; (2) ggT(ggT(a, b), c) = ggT(a, ggT(b, c)); (3) ggT(a, b) = a genau dann, wenn a∣b; (4) ggT(a, ) = a. Ähnliche Regeln kann man für das kgV aufstellen. Man kann ggT und kgV auch für mehr als zwei Elemente definieren, entweder direkt oder induktiv durch ggT(a , . . . , a k ) = ggT(ggT(a , . . . , a k− ), a k ), wobei es nach (2) nicht auf die Reihenfolge ankommt; entsprechend kgV(a , . . . , a k ). Die Regeln für ggT und kgV sind einfach, aber über die Existenz sagen sie erst einmal nichts. Proposition 2.3.10. In einem faktoriellen Ring besitzen je zwei Elemente einen größten gemeinsamen Teiler und ein kleinstes gemeinsames Vielfaches. Gegeben zwei Elemente a = upr  ⋯prkk

und

b = v ps ⋯pskk ,

mit p , . . . , p k nicht-assoziierte Primelemente, r , . . . , r k , s , . . . , s k ⩾  und u, v ∈ R∗ , dann gelten min(r  ,s  )

ggT(a, b) = p

min(r k ,s k )

⋯p k

und

max(r  ,s  )

kgV(a, b) = p

max(r k ,s k )

⋯p k

.

(Dabei haben wir in den Zerlegungen jetzt auch den Exponenten  zugelassen, damit wir a und b mit denselben Primfaktoren hinschreiben können.) Beweis. Das folgt unmittelbar aus der Beschreibung der Teilbarkeit in Lemma 2.3.8.



Korollar 2.3.11. Sei R ein faktorieller Ring. Für a, b ∈ R gilt ggT(a, b) = 



kgV(a, b) = ab.



Proposition 2.3.12. Ein Integritätsring ist genau dann faktoriell, wenn je zwei Elemente einen größten gemeinsamen Teiler besitzen und es keine unendlichen Teilerketten gibt. Beweis. Sei R ein faktorieller Ring. Die Existenz des ggTs haben wir gerade bemerkt und die Nicht-Existenz von unendlichen Teilerketten ist Teil von Satz 2.3.9. Sei umgekehrt R ein Integritätsring mit diesen beiden Eigenschaften. Nach Satz 2.3.9 müssen wir zeigen, dass jedes irreduzible Element prim ist. Sei also p ∈ R irreduzibel und seien a, b ∈ R mit p∣ab. Nach Voraussetzung existiert d = ggT(pa, ab). Da p und a gemeinsame Teiler von pa und ab sind, gelten p∣d und a∣d. Es gibt also c ∈ R mit d = ca. Es folgt ca∣pa, nach Kürzen also c∣p. Weil p irreduzibel ist, muss c ∼  oder c ∼ p gelten. Falls c ∼ , so folgt d ∼ a und wegen p∣d also p∣a. Falls c ∼ p, so folgt d ∼ pa und d∣ab impliziert nach Kürzen p∣b. Also ist p prim. ∎

26

2. RINGE

2.4. Ideale Es sei immer R ein kommutativer Ring. Wir verallgemeinern die Teilbarkeit zum Begriff des Ideals. Das ist eine der wichtigsten Definitionen für die ganze Ringtheorie. Definition. Eine Teilmenge I von R heißt ein Ideal, wenn sie nicht leer ist und die folgenden beiden Eigenschaften besitzt: (1) Für alle a, b ∈ I gilt a + b ∈ I. (2) Für alle a ∈ I und r ∈ R gilt ra ∈ I. Die Definition unterscheidet sich also von der eines Teilrings, weil man Elemente des Ideals mit beliebigen anderen Ringelementen multiplizieren darf und wieder im Ideal landet. Jedes Ideal I ist eine additive Untergruppe von R. Denn für jedes a ∈ I gilt nach (2) auch −a = (−) ⋅ a ∈ I. Insbesondere gilt immer  ∈ I. Andererseits braucht I die  nicht zu enthalten (wenn doch folgt aus (2) bereits I = R), so dass Ideale in aller Regel keine Teilringe sind5. Die Definition sieht auf den ersten Blick etwas seltsam aus, aber tatsächlich kommen Ideale ständig vor. Beispiele 2.4.1. (1) In Z bilden die Vielfachen nZ = {na ∣ a ∈ Z} einer Zahl n ∈ Z, also die durch n teilbaren Zahlen, ein Ideal. Das stimmt in jedem kommutativen Ring: Für a ∈ R ist ⟨a⟩ = Ra = {ra ∣ r ∈ R} ein Ideal in R; die Eigenschaften (1) und (2) sieht man unmittelbar. Ein solches Ideal heißt ein Hauptideal. In Z ist jedes Ideal ein Hauptideal (was wir gleich beweisen). In jedem Ring gibt es die Hauptideale ⟨⟩ = {}, das Nullideal, und ⟨⟩ = R (denn es gilt a = a ⋅  ∈ ⟨⟩ für alle a ∈ R). Ein Element a ∈ R ist im Hauptideal ⟨b⟩ per Definition genau dann enthalten, wenn es ein c ∈ R gibt mit a = cb. Deshalb gilt a ∈ ⟨b⟩



⟨a⟩ ⊂ ⟨b⟩



b∣a.

Insbesondere gilt ⟨a⟩ = ⟨b⟩ genau dann, wenn a und b assoziiert sind, denn das heißt ja gerade a∣b und b∣a. Die Hauptideale in einem Ring beschreiben also genau die Teilbarkeit. (2) Ist φ∶ R → S ein Homomorphismus, dann ist der Kern Kern(φ) = {a ∈ R ∣ φ(a) = } von φ ein Ideal. Denn sind a, b ∈ R mit φ(a) = φ(b) = , dann ist auch φ(a + b) = φ(a) + φ(b) =  und außerdem gilt φ(ra) = φ(r)φ(a) =  für alle r ∈ R. Wir werden später sehen, dass umgekehrt auch jedes Ideal der Kern eines bestimmten Homomorphismus ist. (3) Sei R ein Ring von Funktionen, zum Beispiel R = C((, ), R) der Ring der stetig differenzierbaren Funktionen (, ) → R. Sei a ∈ (, ). Dann ist die Menge { f ∈ R ∣ f (a) = } 5Das ist wohl der Hauptgrund, warum viele Autoren auch Ringe (und damit Teilringe) ohne Eins zulassen.

2.4. IDEALE

27

ein Ideal in R. (Es ist ein Spezialfall von (2), denn die Auswertung von Funktionen im Punkt a definiert einen Homomorphismus R → R). Ideale von diesem Typ spielen in der algebraischen Geometrie (und der Differentialgeometrie) eine große Rolle. (4) In Z ist jede Untergruppe der additiven Gruppe (Z, +) bereits ein Ideal. Denn ist U ⊂ Z eine solche Untergruppe, dann gelten also a + b ∈ U und a − b ∈ U für alle a, b ∈ U, außerdem  ∈ U. Ist r ∈ N und a ∈ U, dann gilt ra = (a + ⋯ + a) (r Summanden), also ra ∈ U und damit auch −ra ∈ U. Es gilt also ra ∈ U für alle r ∈ Z und a ∈ U. Damit ist U ein Ideal. Dieses Argument stimmt aber wirklich nur in Z, nicht in anderen Ringen. Im Polynomring R[x] ist zum Beispiel die Menge {ax + b ∣ a, b ∈ R} aller Polynome vom Grad höchstens  eine additive Untergruppe. Sie ist auch abgeschlossen unter Multiplikation mit Elementen aus R, aber nicht mit Elementen aus R[x]. (Zum Beispiel darf man nicht mit x multiplizieren.) Sie ist deshalb kein Ideal von R[x]. (5) Man kann auch Ideale in nicht-kommutativen Ringen definieren. Allerdings muss man dann unterscheiden, ob man nur von links, nur von rechts oder von links und rechts mit beliebigen Ringelementen multiplizieren darf. Entsprechend gibt es Linksideale, Rechtsideale und beidseitige Ideale. Zum Beispiel bilden die  × -Matrizen der Form ∗  ( ) ∗  mit Koeffizienten in einem Ring R ein Linksideal, aber in aller Regel kein Rechtsideal. Bemerkung 2.4.2. Wie sind die Ideale zu ihrem etwas seltsamen Namen gekommen? Der Begriff stammt von Dedekind und bezieht sich, so weit ich weiß, auf die ’idealen Zahlen’ (bestimmte komplexe bzw. imaginäre Zahlen), die in den Arbeiten Kummers eine Rolle spielten und von Dedekind durch Hauptideale ersetzt wurden. Das war der Beginn der algebraischen Zahlentheorie.

Proposition 2.4.3. Ein Ideal I in R enthält genau dann eine Einheit, wenn I = R gilt. Beweis. Denn ist u ∈ I ∩ R ∗ und a ∈ R, so folgt a = a ⋅ (u − ⋅ u) ∈ I.



Proposition 2.4.4. Ein kommutativer Ring ist genau dann ein Körper, wenn ⟨⟩ und ⟨⟩ seine einzigen Ideale sind. Beweis. Ist K ein Körper, dann ist jedes Element a ∈ K entweder  oder eine Einheit. Also ist jedes Ideal außer ⟨⟩ bereits der ganze Körper, nach der vorangehenden Proposition. Sei umgekehrt R ein kommutativer Ring, der nur die Ideale ⟨⟩ und ⟨⟩ besitzt, und sei a ∈ R ∖ {}. Dann gilt ⟨a⟩ ≠ ⟨⟩, also ⟨a⟩ = ⟨⟩. Das bedeutet aber, dass es r ∈ R gibt mit  = ra. Also ist a eine Einheit. Es folgt R ∗ = R ∖ {}, was gerade bedeutet, dass R ein Körper ist. ∎ Proposition 2.4.5. Sei φ∶ R → S ein Ringhomomorphismus. (1) Ist J ein Ideal von S, dann ist φ− (J) ein Ideal von R. (2) Ist φ surjektiv und I ein Ideal von R, dann ist φ(I) ein Ideal von S. Beweis. (1) Sind a, b ∈ φ− (J), dann gilt φ(a), φ(b) ∈ J, also φ(a + b) = φ(a) + φ(b) ∈ J und damit a +b ∈ φ− (J). Ebenso φ(ra) = φ(r)φ(a) ∈ J, also ra ∈ φ− (J) für alle r ∈ R. (2) Für a, b ∈ I gilt φ(a) + φ(b) = φ(a + b), also ist φ(I) abgeschlossen unter Addition. Sei φ(a) ∈ φ(I), a ∈ R, und sei s ∈ S. Wähle r ∈ R mit φ(r) = s, dann folgt sφ(a) = φ(r)φ(a) = φ(ra) ∈ φ(I). ∎

28

2. RINGE

Das Bild eines Ideals unter einem Homomorphismus, der nicht surjektiv ist, ist dagegen in der Regel kein Ideal. Betrachte zum Beispiel Z als Teilmenge von Q. Das ist das Bild von Z unter der Inklusionsabbildung Z → Q, aber offensichtlich kein Ideal. Zu zwei Idealen I und J in R kann man die Idealsumme (oder einfach Summe) I + J = {a + b ∣ a ∈ I, b ∈ J} bilden. Man rechnet direkt nach, dass I + J wieder ein Ideal ist. Entsprechend bildet man die Summe I + ⋅ ⋅ ⋅ + I k von endlich vielen Idealen I , . . . , I k in R. Der Durchschnitt beliebig vieler Ideale ist wieder ein Ideal, denn es ist klar, dass die Eigenschaften (1) und (2) unter Durchschnitt erhalten bleiben. Daraus folgt, dass zu jeder Teilmenge eines Rings ein kleinstes Ideal existiert, dass die gegebene Teilmenge enthält: Definition. Es sei M eine Teilmenge von R. Der Durchschnitt aller Ideale von R, die M enthalten, ist wieder ein Ideal und heißt das von M erzeugte Ideal. Wie bei Hauptidealen verwenden wir dafür die Notation ⟨M⟩. Ist M = {a , . . . , a n } endlich, dann schreiben wir auch ⟨a , . . . , a n ⟩. Proposition 2.4.6. Ist M ⊂ R, dann ist das erzeugte Ideal gerade die Menge ⟨M⟩ = {r a + ⋯ + r n a n ∣ r , . . . , r n ∈ R, a , . . . , a n ∈ M, n ∈ N}. Beweis. Es sei I die Menge auf der rechten Seite. Wir zeigen zunächst, dass I ein Ideal ist. Seien r , . . . , r m , s , . . . , s n , t ∈ R und a , . . . , a m , b , . . . , b n ∈ M. Dann sind also ∑ r i a i und ∑ s i b i zwei Elemente von I und es gilt auch m

n

∑ ri ai + ∑ si bi ∈ I i=

i=

und

m

m

i=

i=

t ∑ r i a i = ∑(tr i )a i ∈ I.

Also ist I ein Ideal und per Definition ist klar, dass I die Menge M enthält, denn für a ∈ M gilt a =  ⋅ a ∈ I. Nach Definition von ⟨M⟩ folgt daraus ⟨M⟩ ⊂ I. Um die umgekehrte Inklusion zu beweisen, sei J irgendein Ideal von R mit M ⊂ J. Weil J ein Ideal ist, enthält es dann alle Produkte ra mit r ∈ R und a ∈ M sowie alle Summen von solchen Produkten. Mit anderen Worten, J enthält I. Also ist I in jedem Ideal enthalten, das M enthält und es folgt I ⊂ ⟨M⟩. ∎ Aus Prop. 2.4.6 folgt sofort ⟨M ∪ N⟩ = ⟨M⟩ + ⟨N⟩, insbesondere ⟨a , . . . , a k ⟩ = ⟨a ⟩ + ⋯ + ⟨a k ⟩ für a , . . . , a k ∈ R. Dagegen gilt zwar ⟨M ∩ N⟩ ⊂ ⟨M⟩ ∩ ⟨N⟩, aber im allgemeinen ist die rechte Seite echt größer als die linke. Im Unterschied zum Durchschnitt ist die Vereinigung von Idealen im allgemeinen kein Ideal. Allerdings ist die ’aufsteigende Vereinigung’ von Idealen wieder ein Ideal, was genau folgendes bedeutet: Lemma 2.4.7. Es sei R ein Ring und (I n )n∈N eine Folge von Idealen in R mit I n ⊂ I n+ für alle n ∈ N. Dann ist die Vereinigung ⋃n∈N I n wieder ein Ideal. Beweis. Sei I = ⋃n∈N I n und seien a, b ∈ I. Dann gibt es m.n ∈ N mit a ∈ I m , b ∈ I n . Ist k = max{m, n}, so gilt nach Voraussetzung I m ∪ I n ⊂ I k , also a, b ∈ I k und damit auch a + b ∈ I k ⊂ I. Außerdem gilt offenbar ra ∈ I für alle r ∈ R und a ∈ I. ∎

2.4. IDEALE

29

Schließlich kann man auch noch das Produkt von zwei (oder endlich vielen) Idealen definieren. Sind I und J Ideale in R, dann heißt das von den paarweisen Produkten erzeugte Ideal IJ = ⟨ab ∣ a ∈ I, b ∈ J⟩ das Idealprodukt (oder einfach Produkt) von I und J. Dabei bildet die Menge {ab ∣ a ∈ I, b ∈ J} aller paarweisen Produkte noch kein Ideal (Übung). Deshalb muss man das von dieser Menge erzeugte Ideal nehmen. Genauer gilt k

IJ = {∑i= a i b i ∣ a i ∈ I, b i ∈ J, k ∈ N}. Es gilt immer IJ ⊂ I ∩ J, wegen RJ ⊂ I und IR ⊂ J. Das Produkt von Hauptidealen ⟨a⟩⟨b⟩ ist einfach das Hauptideal ⟨ab⟩, wie man sofort nachrechnet. Insbesondere gilt ⟨a⟩⟨a⟩ = ⟨a ⟩. Das zeigt auch, dass das Produkt im allgemeinen kleiner ist als der Durchschnitt, denn in Z gilt zum Beispiel ⟨⟩⟨⟩ = ⟨⟩ ≠ ⟨⟩ = ⟨⟩ ∩ ⟨⟩. Wieder kann man entsprechend das Produkt I ⋯I k von endlich vielen Idealen I , . . . , I k bilden. Wir fassen kurz zusammen: Zu jeder Teilmenge M von R gibt es ein kleinstes Ideal, das M enthält, nämlich das erzeugte Ideal ⟨M⟩ = {r a + ⋯ + r n a n ∣ r , . . . , r n ∈ R, a , . . . , a n ∈ M, n ∈ N}. Zu endlich vielen Idealen I , . . . , I k in R kann man die folgenden neuen Ideale bilden: ○ den Durchschnitt I ∩ ⋯ ∩ I k (genauso für unendlich viele); ○ die Summe I + ⋯ + I k , bestehend aus allen Summen a + ⋅ ⋅ ⋅ + a k mit a j ∈ I j ; ○ das Produkt I ⋯I k , bestehend aus allen Summen von Produkten a ⋯a k , a j ∈ I j ;

Wir kommen nun zu einer wichtigen Eigenschaft, die sich durch Ideale ausdrücken lässt. Definition. Ein kommutativer Ring heißt ein Hauptidealring, wenn jedes seiner Ideale ein Hauptideal ist, also von einem Element erzeugt wird. Proposition 2.4.8. Der Ring Z der ganzen Zahlen ist ein Hauptidealring. Beweis. Es sei I ein Ideal von Z. Falls I = {}, dann ist I das Hauptideal ⟨⟩. Andernfalls enthält I eine Zahl a ≠  und wegen ±a ∈ I damit auch eine positive Zahl. Setze m = min{a ∈ I ∣ a > }. Behaupte, dass dann I = ⟨m⟩ gelten muss. Wegen m ∈ I gilt auch ⟨m⟩ ⊂ I. Ist umgekehrt a ∈ I, dann teilen wir a mit Rest durch m und schreiben also a = qm + r,

mit  ⩽ r < m.

Dann gilt r = a − qm ∈ I. Wegen der Minimalität von m folgt r =  und damit a = qm ∈ ⟨m⟩.



30

2. RINGE

Satz 2.4.9. In einem Hauptidealring R besitzen je zwei Elemente einen größten gemeinsamen Teiler und ein kleinstes gemeinsames Vielfaches. Genauer gelten für a, b ∈ R: ⟨a, b⟩ = ⟨ggT(a, b)⟩ und

⟨a⟩ ∩ ⟨b⟩ = ⟨kgV(a, b)⟩.

Insbesondere gibt es x, y ∈ R mit ggT(a, b) = xa + yb (eine sogenannte Bézout-Identität). Beweis. Seien a, b ∈ R. Weil R ein Hauptidealring ist, wird das Ideal ⟨a, b⟩ von einem Element d ∈ R erzeugt. Wegen a, b ∈ ⟨a, b⟩ = ⟨d⟩ gibt es dann Darstellungen a = rd und b = sd, also werden a und b von d geteilt. Wegen d ∈ ⟨a, b⟩ gibt es eine Darstellung d = xa + yb. Daraus folgt, dass jeder gemeinsame Teiler von a und b auch ein Teiler von d ist. Also ist d ein ggT. Für das kgV gehen wir analog vor: Weil R ein Hauptidealring ist, gibt es e ∈ R mit ⟨a⟩ ∩ ⟨b⟩ = ⟨e⟩. Wegen e ∈ ⟨a⟩ und e ∈ ⟨b⟩ gibt es Darstellungen e = ra und e = sb. Also ist e ein gemeinsames Vielfaches von a und b. Ist e ′ = r ′ a = s ′ b ein anderes gemeinsames Vielfaches, dann folgt e ′ ∈ ⟨a⟩ ∩ ⟨b⟩ = ⟨e⟩, so dass e ′ ein Vielfaches von e ist. ∎ Korollar 2.4.10. In einem Hauptidealring R sind zwei Elemente a und b genau dann teilerfremd, wenn es x, y ∈ R gibt mit xa + yb = . Beweis. Denn a und b sind genau dann teilerfremd, wenn ggT(a, b) =  gilt. Also folgt die Behauptung aus dem vorangehenden Satz. ∎ Sind I und I zwei Ideale in R, dann ist I ∩ I das größte Ideal, das in beiden enthalten ist und I + I das kleinste Ideal, das beide enthält. Das kann man in einem Diagramm darstellen, in dem die größeren Ideale oben stehen und Kanten die Inklusion bedeuten: I + I I

I I ∩ I

Die Menge aller Ideale in einem Ring bildet in dieser Weise einen (im allgemeinen unendlichen) Graphen, genauer gesagt einen sogenannten Verband. Im Hauptidealring Z gilt ⟨m⟩ + ⟨n⟩ = ⟨ggT(m, n)⟩ und ⟨m⟩ ∩ ⟨n⟩ = ⟨kgV(m, n)⟩. Das Diagramm spiegelt dann gerade die Teilbarkeit wider. Ein Ausschnitt sieht zum Beispiel so aus: Z ⟨⟩ ⟨⟩ ⟨⟩

⟨⟩ ⟨⟩

⟨⟩

⟨⟩ ⟨⟩

⟨⟩

Ganz oben, gleich unterhalb von Z, stehen die Ideale, die von Primzahlen erzeugt sind. Ganz (unendlich weit) unten steht das Nullideal ⟨⟩, das in jedem anderen Ideal enthalten ist. Satz 2.4.11. Jeder Hauptidealring ist faktoriell.

2.4. IDEALE

31

Beweis. Sei R ein Hauptidealring. Wir haben gerade gesehen, dass je zwei Elemente in R einen ggT haben. Um zu zeigen, dass R faktoriell ist, müssen wir nach Prop. 2.3.12 nur noch zeigen, dass es keine unendlichen Teilerketten gibt. Angenommen (a n )n∈N ist eine Folge von Elementen mit a i+ ∣a i . Dann erhalten wir also eine Kette von Hauptidealen ⟨a ⟩ ⊂ ⟨a ⟩ ⊂ ⟨a ⟩ ⊂ ⋯ Nach Lemma 2.4.7 ist nun I = ⋃n∈N ⟨a n ⟩ wieder ein Ideal. Da R ein Hauptidealring ist, gibt es b ∈ I mit I = ⟨b⟩. Andererseits gibt es dann einen Index n ∈ N mit b ∈ ⟨a n ⟩. Daraus folgt ⟨a m ⟩ = ⟨a n ⟩ und damit a m ∼ a n für alle m ⩾ n. Also bilden die a i keine unendliche Teilerkette. ∎ Weil die ganzen Zahlen einen Hauptidealring bilden, haben wir damit auf Umwegen auch einen neuen Beweis für die Existenz und Eindeutigkeit der Primfaktorzerlegung ganzer Zahlen (Satz 2.3.4) gegeben. Welche Hauptidealringe gibt es noch? Das Argument, das wir für Z benutzt haben, lässt sich folgendermaßen formalisieren. Definition. Es sei R ein Integritätsring. Eine euklidische Wertefunktion auf R ist eine Abbildung δ∶ R ∖ {} → N mit den folgenden Eigenschaften. (E1) Für alle a, b ∈ R ∖ {} gilt δ(ab) ⩾ δ(a). (E2) Für alle a, b ∈ R, b ≠ , gibt es q, r ∈ R mit a = bq + r

und

δ(r) < δ(b) oder r = .

Ein euklidischer Ring ist ein Integritätsring, für den eine euklidische Wertefunktion existiert. Für R = Z ist der Absolutbetrag δ(a) = ∣a∣ eine euklidische Wertefunktion. (E1) ist klar und (E2) ist gerade die übliche Division mit Rest. Aber die gibt es ja auch für den Polynomring. Proposition 2.4.12. Der Polynomring K[x] über einem Körper ist euklidisch. Beweis. Genauer ist die Gradabbildung deg∶ K[x] ∖ {} → N , f ↦ deg( f ) eine euklidische Wertefunktion. (E1) ist klar und (E2) ist gerade die Polynomdivision (Satz 2.2.6). Man beachte, dass der Leitkoeffizient eines Polynoms immer eine Einheit ist, weil K ein Körper ist. ∎ Wenn man in einem beliebigen euklidischen Ring zu zwei Elementen a und b die Darstellung in (E2) produziert, dann sagt man, dass a mit Rest r durch b geteilt wurde. Wie man diese Division mit Rest konkret durchführt und q und r findet, hängt vom jeweiligen Ring ab. Das Gute an euklidischen Ringen ist vor allem, dass sie Hauptidealringe sind, was man genauso wie für Z beweisen kann. Proposition 2.4.13. Jeder euklidische Ring ist ein Hauptidealring und damit faktoriell. Beweis. Es sei R ein euklidischer Ring mit Wertefunktion δ und sei I ein Ideal von R. Falls I = {}, dann ist I ein Hauptideal und wir sind fertig. Andernfalls wähle ein b ∈ I ∖ {} für das δ(b) den kleinsten möglichen Wert unter allen Elementen von I ∖ {} annimmt. Behaupte, dass I von b erzeugt wird. Sei dazu a ∈ I und teile a mit Rest durch b, d.h. schreibe a = bq + r mit δ(r) < δ(b) oder r = . Da a und b beide aus I sind, ist dann auch r = a − bq ∈ I. Wegen der Minimalität von δ(b) muss also r =  sein und es folgt a = bq ∈ ⟨b⟩. ∎

32

2. RINGE

Korollar 2.4.14. Für jeden Körper K ist K[x] ein Hauptidealring und damit faktoriell.



Man beachte, dass wir die Divison mit Rest zwar für Polynome über einem beliebigen Ring definiert haben, aber nur, wenn man durch Polynome mit invertierbarem Leitkoeffizient teilt. Das führt dazu, dass zum Beispiel der Polynomring K[x , . . . , x n ] = K[x , . . . , x n− ][x n ] in n ⩾  Variablen sowie der Polynomring Z[x] nicht euklidisch sind. Das sieht man daran, dass sie noch nicht einmal Hauptidealringe sind. Konkret sind die Ideale ⟨x , x ⟩ bzw. ⟨, x⟩ in K[x , . . . , x n ] bzw. in Z[x] keine Hauptideale. Allgemeiner gilt: Proposition 2.4.15. Der Polynomring R[x] über einem Integritätsring R ist genau dann ein Hauptidealring, wenn R ein Körper ist. Beweis. Die eine Richtung haben wir gerade bewiesen. Sei umgekehrt R[x] ein Hauptidealring. Wir zeigen, dass dann jedes Element ungleich  in R eine Einheit ist. Sei also a ∈ R, a ≠ , und betrachte das Ideal ⟨a, x⟩. Da R ein Hauptidealring ist, gibt es also f ∈ R[x] mit ⟨a, x⟩ = ⟨ f ⟩. Es folgt f ∣a und damit deg( f ) ⩽ deg(a) =  (wegen a ≠ ), also f ∈ R. Andererseits folgt auch f ∣x, und weil x irreduzibel ist, ist f deshalb eine Einheit in R[x]. Es gilt also ⟨a, x⟩ = ⟨ f ⟩ = R[x]. Insbesondere gibt es Polynome p, q ∈ R[x] mit pa + qx = . Einsetzen von x =  ergibt p() ⋅ a =  in R. Also ist a eine Einheit mit a − = p().



Die Polynomringe Z[x] und K[x , . . . , x n ] sind allerdings faktoriell, was wir später in §2.9 beweisen. Das zeigt, dass nicht jeder faktorielle Ring euklidisch sein muss. Es ist auch nicht jeder Hauptidealring euklidisch. Ein Beispiel für einen Hauptidealring, der nicht euklidisch ist, ist der √ +  Ring Z[  ]. Der Beweis würde uns aber zu weit in die Zahlentheorie führen. Schließlich kann man in euklidischen Ringen den euklidischen Algorithmus genauso wie in Z anwenden. Im Prinzip ist das aus der linearen Algebra bekannt und wir begnügen uns damit, den Satz noch einmal in der allgemeinen Form anzugeben. Satz 2.4.16 (Euklidischer Algorithmus). Es sei R ein euklidischer Ring mit Wertefunktion δ. Dann kann der größte gemeinsame Teiler von zwei Elementen a, b ∈ R ∖ {} folgendermaßen bestimmt werden: Falls δ(a) ⩾ δ(b), so setze d = a und r = b. Definiere nun rekursiv c k = d k− ,

d k = r k−

und r k als den Rest der Division ck = dk qk + rk

2.4. IDEALE

33

für alle k ⩾  so lange, bis r k =  gilt. Die Folge der Divisionen mit Rest sieht also so aus: a = bq + r b = r q + r r = r q + r ⋮ r k− = r k− q k− + r k− r k− = r k− q k + r k . ® =

Dann ist r k− (also der letzte von Null verschiedene Rest) der ggT von a und b. Beweis. Wir wissen schon, dass R faktoriell ist und der ggT von a und b damit existiert. Die Abbruchbedingung r k =  tritt immer ein, denn es gilt δ(b) > δ(r ) > δ(r ) > ⋯ ⩾  usw. Da dies eine Folge natürlicher Zahlen ist, kann sie nicht unendlich absteigen. Nach endlich vielen Schritten muss also in der Division mit Rest der Fall r k =  statt δ(r k ) < δ(r k− ) eintreten. Wegen r k =  gilt r k− = r k− q k (wobei wir formal r i =  für i <  setzen), also r k− ∣r k− . Rückeinsetzen zeigt r k− = r k− q k− + r k− = r k− q k q k− + r k− = r k− (q k q k− + ), also r k− ∣r k− . Induktiv zeigt man so r k− ∣r k−i für alle  ⩽ i ⩽ k, also schließlich r k− ∣r = b. Nun gilt a = bq + r und r k− teilt b und r , also auch a. Damit ist r k− ein gemeinsamer Teiler von a und b. Ist nun d irgendein gemeinsamer Teiler von a und b, dann auch von r = a − bq . Dann teilt d also auch r = b − r q . Induktiv folgt d∣r k− . Also ist r k− ein ggT von a und b. ∎ Beispiel 2.4.17. Wir bestimmen den größten gemeinsamen Teiler der Polynome f = x  + x  + x  + x + 

und

g = x − 

in Q[x]. Der euklidische Algorithmus gibt die Folge von Divisionen x  + x  + x  + x +  = (x  − )x + (x  + x  + x + )  x  −  = ((x  + x  + x + )(x − ) + (−x  − ))    x + x + x +  = (x  + )(x + ) + . Die Folge der Reste und Quotienten ist also   q = − x  − ,     r = x  + x  + x + , r = − x  − , r =    Der letzte von Null verschiedene Rest ist (bis auf Skalierung) der ggT, nämlich q = x,

  q = x − ,  

ggT( f , g) = x  + . Die Darstellung des ggT im Ideal ⟨ f , g⟩ finden wir durch Einsetzen und bekommen      − (x  + ) = r = g − r q = g − ( f − gq )q = −q f + ( + q q )g = −( x + ) f + ( x  − x + )g.     

34

2. RINGE

2.5. Kongruenzen Die Grundlagen der Modulo-Rechnung in Z sind aus der linearen Algebra bekannt (siehe [Scharlau, LA, §1.3, 1.5]). Wir wiederholen kurz das Wichtigste. Definition. Sei m ∈ Z. Zwei Zahlen a, b ∈ Z heißen kongruent modulo m, wenn a − b durch m teilbar ist. Dadurch ist eine Relation auf den ganzen Zahlen gegeben, die wir a ≡ b (mod m) schreiben. Insbesondere gilt a ≡  (mod m) genau dann, wenn m ein Teiler von a ist. Wir schreiben a ≢ b (mod m), wenn a und b nicht kongruent modulo m sind. Proposition 2.5.1. Die Kongruenz ist eine Äquivalenzrelation und hat zusätzlich die folgenden Eigenschaften, für alle a, a ′ , b, b′ , c, k ∈ Z. (1) Falls a ≡ a ′ , b ≡ b ′ (mod m), so a + b ≡ a′ + b ′ (mod m). (2) Falls a ≡ a ′ , b ≡ b ′ (mod m), so ab ≡ a ′ b ′ (mod m). (3) Sind c und m teilerfremd und gilt ca ≡ cb (mod m), so folgt a ≡ b (mod m). (4) Falls a ≡ b (mod km), dann auch a ≡ b (mod m). Beweis. Wir halten uns nicht lange mit dem Beweis auf, weil wir das alles bald allgemeiner zeigen, und beweisen nur (3): Es gelte ca ≡ cb (mod m). Weil c und m nach Voraussetzung teilerfremd sind, gibt es nach Kor. 2.4.10 x, y ∈ Z mit  = xc + ym. Es gilt also cx ≡  (mod m). Nach (2) folgen cax ≡ a (mod m) und cbx ≡ b (mod m). Aus ca ≡ cb (mod m) folgt andererseits cax ≡ cbx (mod m), also insgesamt a ≡ cax ≡ cbx ≡ b (mod m), wie behauptet. ∎ Die Voraussetzung in (3) ist offenbar notwendig, denn es gilt zum Beispiel  ≡  (mod ), aber  ≢  (mod ), denn  und  sind nicht teilerfremd. Als nächstes diskutieren wir lineare Kongruenzen in einer Variablen, beginnend mit dem Fall einer einzigen Gleichung. Proposition 2.5.2. Für a, m ∈ Z hat die Kongruenz ax ≡  (mod m) genau dann eine Lösung x ∈ Z, wenn a und m teilerfremd sind. Beweis. Denn nach Kor. 2.4.10 sind a und m genau dann teilerfremd, wenn es x, y ∈ Z mit xa + ym =  gibt, was gerade ax ≡  (mod m) bedeutet. ∎ Korollar 2.5.3. Sind a und m teilerfremde ganze Zahlen, dann hat die Kongruenz ax ≡ b (mod m) für jedes b ∈ Z eine Lösung x ∈ Z. Beweis. Denn wir können die Kongruenz ax ≡  (mod m) lösen und mit b multiplizieren.



Korollar 2.5.4. Ist p eine Primzahl, dann hat die Kongruenz ax ≡  (mod p) eine Lösung für jedes a ∈ Z, das nicht durch p teilbar ist, also mit a ≢  (mod p).



2.5. KONGRUENZEN

35

Für mehrere lineare Gleichungen gibt es den folgenden klassischen Satz. Satz 2.5.5 (Chinesischer Restsatz6). Sind m , . . . , mr ∈ Z paarweise teilerfremde Zahlen und a , . . . , ar ∈ Z beliebig, dann hat das System von Kongruenzen x ≡ a i (mod m i )

(i = , . . . , r)

eine Lösung x ∈ Z, die modulo m = m ⋯mr eindeutig bestimmt ist. Ist M i = m/m i und sind x , . . . , xr Lösungen der Gleichungen M i x i ≡ a i (mod m i ), dann ist x = ∑ri= M i x i eine solche Lösung.

Beweis. Nach Voraussetzung sind M i und m i teilerfremd. Deshalb haben die einzelnen Kongruenzen M i x i ≡ a i (mod m i ) Lösungen in x i nach Kor. 2.5.3. Setze x = ∑ri= M i x i wie angegeben. Da m für alle i ⩾  ein Teiler von M i ist, gilt dann x = M x + ∑ri= M i x i ≡ M x ≡ a (mod m ) und entsprechend x ≡ a i (mod m i ) für alle i = , . . . , r. Um die Eindeutigkeit zu zeigen, seien x, x ′ zwei Lösungen. Dann gilt m i ∣(x − x ′ ) für alle i, also m∣(x − x ′ ), weil die m i teilerfremd sind (Kor. 2.3.11), und damit x ≡ x ′ (mod m). ∎ Praktisch kann man die Kongruenzen M i x i ≡ a i (mod m i ) durch Division mit Rest lösen. Der Satz beinhaltet also einen Algorithmus zur Lösung von Systemen von Kongruenzen. Beispiel 2.5.6. Betrachte das System x ≡  (mod ),

x ≡  (mod ),

x ≡  (mod ).

Die Voraussetzung ist erfüllt, denn , ,  haben paarweise keine gemeinsamen Teiler. Wir erhalten m =  ⋅  ⋅  = , M = , M = , M =  und lösen die einzelnen Kongruenzen

etwa

x ≡  (mod )

x ≡  (mod )

x ≡  (mod ),

x = 

x = −

x = −.

Nach dem chinesischen Restsatz ist also  −  −  ⋅  = − eine Lösung. Eine positive Lösung ist damit − +  = . Da die Kongruenz modulo einer Zahl m eine Äquivalenzrelation ist, ist die Menge Z die Vereinigung der Äquivalenzklassen dieser Relation, die in diesem Fall Kongruenzklassen heißen. Das sind die Teilmengen ⟨m⟩ = {am ∣ a ∈ Z}  + ⟨m⟩ = { + am ∣ a ∈ Z} ⋮ (m − ) + ⟨m⟩ = {(m − ) + am ∣ a ∈ Z}. 6So

benannt, weil ein Spezialfall schon in den Schriften des chinesischen Mathematikers Sun Zi (vermutlich im 3. Jahrhundert) auftaucht. Unter den vielen Leistungen der antiken und mittelalterlichen chinesischen Mathematik ist das die einzige, die in die moderne Terminologie eingegangen ist.

36

2. RINGE

Es gilt also a + ⟨m⟩ = a ′ + ⟨m⟩ genau dann, wenn a ≡ a ′ (mod m) gilt. Wie bei jeder Äquivalenzrelation ist jedes Element von Z in genau einer Kongruenzklasse enthalten. Denn jede Zahl a ∈ Z hat einen eindeutigen Rest a = qm + r,  ⩽ r < m bei Division durch m, und es gilt dann a ∈ r + ⟨m⟩. Wir schreiben Z/m = {⟨m⟩,  + ⟨m⟩, ⋯, (m − ) + ⟨m⟩} für die Menge aller Kongruenzklassen modulo m. Die Elemente von Z/m sind also Teilmengen von Z. Die Kongruenzklassen kann man addieren und multiplizieren, was genau dem Rechnen modulo m entspricht. Dazu definiert man (a + ⟨m⟩) + (a ′ + ⟨m⟩) = (a + a ′ ) + ⟨m⟩ (a + ⟨m⟩)(a ′ + ⟨m⟩) = aa′ + ⟨m⟩. Man muss nun nachprüfen, dass diese Verknüpfung wohldefiniert ist und die Ringgesetze erfüllt. Das tun wir gleich in einem allgemeineren Kontext. Es wurde auch schon in der linearen Algebra gezeigt. Aus der Menge Z/m der Kongruenzklassen wird so ein kommutativer Ring mit Null  + ⟨m⟩ und Eins  + ⟨m⟩, der Ring der ganzen Zahlen modulo m. Proposition 2.5.7. Für m ∈ Z ist der Ring Z/m genau dann ein Integritätsring, wenn m oder −m eine Primzahl ist. In diesem Fall ist Z/m sogar ein Körper. Der Körper Z/p, p eine Primzahl, ist natürlich dasselbe, wie der Körper F p mit p Elementen. Beweis. Wenn m keine Primzahl ist, etwa m = ±kl mit k, l ⩾ , dann ist k, l ≢  (mod m), aber kl = m ≡  (mod m). Deshalb sind k + ⟨m⟩ und l + ⟨m⟩ Nullteiler im Ring Z/m, der damit nicht nullteilerfrei ist. Sei umgekehrt p eine Primzahl. Eine Kongruenzklasse a + ⟨m⟩ ist genau dann nicht die Null in Z/m, wenn a nicht durch p teilbar ist. In diesem Fall gibt es nach Kor. 2.5.4 eine Zahl x ∈ Z mit ax ≡  (mod p). Also gilt (a + ⟨p⟩)(x + ⟨p⟩) =  + ⟨p⟩ in Z/p. Damit ist jedes Element ungleich Null in Z/p eine Einheit und damit Z/p ein Körper. ∎ Satz 2.5.8 (Kleiner Satz von Fermat). Sei p eine Primzahl und a ∈ Z mit a ≢  (mod p). Dann gilt a p− ≡  (mod p). Beweis. Wir schreiben kurz x für x + ⟨p⟩ ∈ Z/p, x ∈ Z. Betrachte die Abbildung µa ∶ {

Z/p → Z/p . b ↦ ab

Das ist also die Multiplikation mit dem festen Element a in Z/p. Weil a nicht durch p teilbar ist, ist µ a injektiv. Denn ab = ab′ bedeutet ja gerade ab ≡ ab′ (mod p), also b ≡ b ′ (mod m) nach Prop. 2.5.1(3). Da Z/p endlich ist, ist µ a also bijektiv. Außerdem gilt µ a () = . Deshalb sind die p −  Kongruenzklassen a, a, . . . (p − )a in Z/p gerade alle von Null verschiedenen Elemente

2.6. FAKTORRINGE

37

, . . . , p − , nur in anderer Reihenfolge. In Z/p gilt deshalb die Gleichheit p−

p−

p−

b=

b=

b=

p− ∏ b = ∏ ab = a ∏ b.

Weil Z/p nullteilerfrei ist, können wir kürzen und erhalten a p− =  in Z/p.



Der Kleine Satz von Fermat ist eine präzisere Version von Kor. 2.5.4, weil er für die Kongruenz ax ≡  (mod p) die Lösung x = a p− angibt. Wenn man noch einmal mit a multipliziert bekommt man eine Version, die offensichtlich auch im Fall p∣a gilt. Korollar 2.5.9. Für jede Primzahl p und jede Zahl a ∈ Z gilt a p ≡ a (mod p).



2.6. Faktorringe Die Konstruktion des Rings der ganzen Zahlen modulo m übertragen wir jetzt in allgemeine Ringe. Es sei R ein kommutativer Ring und I ein Ideal in R. Wir definieren eine Relation a∼b

a−b ∈I



für a, b ∈ R. Lemma 2.6.1. Die Relation ∼ ist eine Äquivalenzrelation auf R. Die Äquivalenzklassen sind die Teilmengen a + I = {a + b ∣ b ∈ I} von R und heißen die Restklassen modulo I. Beweis. ○ ○ ○

Die Relation ∼ ist reflexiv, d.h. es gilt a ∼ a für alle a ∈ R; denn es gilt a − a =  ∈ I; symmetrisch, d.h. aus a ∼ b folgt b ∼ a; denn aus a − b ∈ I folgt auch b − a = −(a − b) ∈ I; transitiv, d.h. aus a ∼ b und b ∼ c folgt a ∼ c; denn ist a − b ∈ I und b − c in I, so auch a − c = (a − b) − (c − b) ∈ I. Die Behauptung über die Äquivalenzklassen sagt, dass folgende Äquivalenz für alle a, a ′ ∈ R gilt: a + I = a′ + I



a − a ′ ∈ I.

Sei zunächst a ′ =  und es gelte a + I = I. Wegen  ∈ I gibt es dann c ∈ I mit a +  = c, also a ∈ I. Ist umgekehrt a ∈ I, so gilt offenbar a + I ⊂ I und für c ∈ I gilt c = a + (c − a) ∈ a + I, also I ⊂ a + I. Sei nun a ′ beliebig. Aus a + I = a ′ + I folgt dann a ∈ a ′ + I, etwa a = a ′ + c mit c ∈ I, also a − a ′ = c ∈ I. Ist umgekehrt a − a ′ ∈ I, so folgt a + I = a′ + (a − a ′ ) + I = a′ + I. ∎ Wir schreiben R/I = {a + I ∣ a ∈ R} für die Menge aller Restklassen modulo I. Genau wie für die Kongruenzklassen gilt:

38

2. RINGE

Proposition 2.6.2. Es sei R ein kommutativer Ring, I ein Ideal in R. Mit den Verknüpfungen (a + I) + (b + I) = (a + b) + I (a + I)(b + I) = ab + I wird R/I zu einem kommutativen Ring mit Null  + I und Eins  + I, genannt der Faktorring von R modulo I oder auch Restklassenring. Außerdem ist die Restklassenabbildung ρ∶ {

R → R/I , a ↦ a+I

die einem Element seine Restklasse modulo I zuordnet, ein Homomorphismus.

Beweis. Der Beweis ist ganz einfach, wenn man sich klar gemacht hat, was zu zeigen ist. Zunächst müssen wir beweisen, dass die angegebene Verknüpfung wohldefiniert, das heißt vertreterunabhängig ist. Für die Multiplikation bedeutet das folgendes: Gegeben a, a′ , b, b ′ ∈ R mit a+I = a′ +I und b + I = b ′ + I, dann müssen wir ab + I = a′ b ′ + I zeigen. (Denn sonst wäre unsere Definition der Multiplikation überhaupt nicht sinnvoll!) Wegen a − a ′ ∈ I und b − b′ ∈ I gilt ab + I = ((a − a ′ ) + a ′ )((b − b ′ ) + b′ ) + I = a ′ b ′ + a ′ (b − b ′ ) + b′ (a − a′ ) + (a − a ′ )(b − b ′ ) +I = a ′ b ′ + I. ´¹¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹¸¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¶ ∈I

Hier haben wir also benutzt, dass I ein Ideal ist. Für die Addition müssen wir a + b + I = a′ + b ′ + I zeigen. Das ist noch einfacher: a + b + I = a ′ + b ′ + (a − a ′ + b − b ′ ) + I = a ′ + b ′ + I. Die Ringgesetze gelten nun in R/I, weil sie sich einfach von R übertragen. Zum Beispiel ist die Multiplikation offensichtlich assoziativ, denn für alle a, b, c ∈ R gilt ((a + I)(b + I))(c + I) = (ab + I)(c + I) = (ab)c + I = a(bc) + I = (a + I)(bc + I) = (a + I)((b + I)(c + I)). Hier haben wir die ganze Zeit nur die Definition der Multiplikation in R/I benutzt und dann beim dritten Gleichheitszeichen die Assoziativität in R. Die Beweise für die anderen Ringgesetze sehen ähnlich tautologisch aus. Auch dass die Restklassenabbildung ρ ein Homomorphismus ist, ist vollkommen klar: Es gilt ρ(a + b) = (a + b) + I = (a + I) + (b + I) = ρ(a) + ρ(b) einfach deshalb, weil die Addition in R/I gerade so definiert ist, ebenso die Multiplikation. ∎ Notation 2.6.3. Die Notation a + I für die Restklasse von a modulo I ist etwas sperrig, deshalb schreibt man oft nur a, wenn es nicht nötig ist, das Ideal I von anderen Idealen zu unterscheiden. Beispiele 2.6.4. (1) Für a, m ∈ Z ist a +⟨m⟩ = a + mZ die Kongruenzklasse von a modulo m und Z/⟨m⟩ = Z/mZ ist der Ring der ganzen Zahlen modulo m. Dafür verwenden wir weiterhin die vereinfachte Notation Z/m. (2) Sei K ein Körper und R = K[x, y] der Polynomring in zwei Variablen über K. Betrachte das Ideal I = ⟨x y − ⟩. Wir schreiben f für die Restklasse f + I ∈ R/I eines Polynoms f ∈ K[x, y].

2.6. FAKTORRINGE

39

Es gilt dann zum Beispiel x ⋅ y = xy =  in R/I, denn x y −  ∈ I. Also sind x und y Einheiten in R/I. Wir können im Moment sonst nicht allzu viel über den Ring R/I sagen. Solche Faktorringe von Polynomringen in mehreren Variablen spielen in der algebraischen Geometrie eine große Rolle. (3) Um den Beweis von Prop. 2.6.2 besser zu verstehen, kann es auch hilfreich sein, sich ein Nicht-Beispiel anzuschauen. Im Polynomring Q[x] betrachten wir die Menge U = {ax + b ∣ a, b ∈ Q} aller Polynome vom Grad höchstens . Das ist eine additive Untergruppe von Q[x], aber kein Ideal (siehe Beispiel 2.4.1). Die Relation a∼b



a−b ∈U

ist trotzdem eine Äquivalenzrelation (Beweis genauso wie in Lemma 2.6.1). Wir können also die Menge der Äquivalenzklassen Q[x]/U bilden. Die Multiplikation überträgt sich aber nicht von Q[x] auf Q[x]/U: Zum Beispiel gilt x  + x + U = x  + U (wegen x ∈ U), aber x  ⋅ x  + U = x  + U ≠ x  + x  + x  + U = (x  + x)(x  + x) + U . Durch die Regel ( f + U)(g + U) = f g + U ist also keine Multiplikation auf der Menge Q[x]/U definiert, denn sie ist nicht vertreterunabhängig. Korollar 2.6.5. Jedes Ideal in einem kommutativen Ring ist der Kern eines Homomorphismus. Beweis. Ist I ein Ideal in einem kommutativen Ring R und ρ∶ R → R/I, a ↦ a + I die Restklassenabbildung, dann gilt a + I =  + I genau dann, wenn a ∈ I. Also gilt Kern(ρ) = I. ∎ Es sei I ein Ideal in R und ρ∶ R → R/I die Restklassenabbildung. Ist J ein weiteres Ideal von R, dann schreiben wir J/I für ρ(J). Proposition 2.6.6. Sei I ein Ideal in R. Es gilt J/I = (J +I)/I für jedes Ideal J von R. Die Zuordnung J ↦ J/I ist eine Bijektion zwischen der Menge der Ideale von R, die I enthalten, und der Menge aller Ideale von R/I. Die Bijektion erhält Inklusionen, Durchschnitte, Summen und Produkte. Beweis. Wegen J ⊂ J + I gilt J/I ⊂ (J + I)/I. Andererseits gilt a + b + I = a + I für alle a ∈ J, b ∈ I, also (J + I)/I ⊂ J/I. Ist J ein Ideal mit I ⊂ J und ρ∶ R → R/I die Restklassenabbildung, dann gilt ρ− (J/I) = J. Denn a ∈ ρ − (J/I) bedeutet a + I ∈ J/I, das heißt es gibt b ∈ J mit a + I = b + I. Daraus folgt a − b ∈ I ⊂ J und damit a ∈ J. Umgekehrt gilt a + I ∈ J/I für alle a ∈ J, also J ⊂ ρ− (J/I). Für jedes Ideal ̃ J von R/I gilt andererseits I ⊂ ρ− (̃ J) (wegen  + I ∈ ̃ J) und ρ(ρ− (̃ J)) = ̃ J, einfach weil ρ − ̃ ̃ surjektiv ist. Also ist J ↦ ρ ( J) die Umkehrabbildung von J ↦ J/I und die Zuordnung damit bijektiv. Die zusätzliche Behauptung über Durchschnitte, Summen und Produkte ist klar. ∎

40

2. RINGE

Beispiel 2.6.7. Sei I = ⟨⟩ ⊂ Z. Nach Prop. 2.6.6 entsprechen die Ideale im Faktorring Z/ gerade den Idealen von Z, die ⟨⟩ enthalten. Da jedes Ideal von Z ein Hauptideal ist und ⟨m⟩ ⊂ ⟨n⟩ zu n∣m äquivalent ist, sind das nur die beiden Ideale ⟨⟩, ⟨⟩, sowie ⟨⟩ selbst und der ganze Ring Z. Mit der Kurznotation a = a + ⟨⟩ gibt es in Z/ also genau die vier Ideale ⟨⟩/⟨⟩ = ⟨⟩, ⟨⟩/⟨⟩ = ⟨⟩, ⟨⟩/⟨⟩ = ⟨⟩, Z/⟨⟩ = ⟨⟩. Wenn man die Menge der Ideale in einem Ring in einem Diagramm darstellt, wie auf Seite 30, dann besteht das entsprechende Diagramm für den Faktorring R/I nach Prop. 2.6.6 also gerade aus dem Teil, der ’oberhalb’ von I liegt. Der Rest geht in R/I verloren. Wenn R ein Integritätsring ist und I ein Ideal in R, wann ist dann R/I wieder ein Integritätsring? Für R = Z haben wir gesehen, dass Z/p genau dann nullteilerfrei ist, wenn p eine Primzahl ist und außerdem, dass Z/p dann sogar ein Körper ist. Das untersuchen wir jetzt allgemein. Gegeben a, b ∈ R, dann gilt (a + I)(b + I) =  + I = I in R/I genau dann, wenn ab ∈ I gilt. In R/I gibt es also genau dann Nullteiler, wenn es a, b ∈ R gibt mit ab ∈ I, aber a, b ∉ I. Definition. Ein Ideal P von R heißt prim oder ein Primideal, wenn P ≠ R gilt und ∀a, b ∈ R(ab ∈ P



(a ∈ P ∨ b ∈ P)).

Ein Ideal M von R heißt maximal, wenn M ≠ R gilt und es keine Ideale zwischen M und R gibt, das heißt wenn für jedes Ideal I gilt: M⊂I⊂R



I = M oder I = R.

Per Definition ist ein Element p ∈ R genau dann prim, wenn das Hauptideal ⟨p⟩ ein Primideal ist, denn es gilt ja a ∈ ⟨p⟩ genau dann, wenn a von p geteilt wird. Proposition 2.6.8. Sei I ein Ideal in einem kommutativen Ring R. (1) Genau dann ist R/I ein Integritätsring, wenn I ein Primideal ist. (2) Genau dann ist R/I ein Körper, wenn I ein maximales Ideal ist. Beweis. (1) haben wir gerade gesehen. (2) Nach Prop. 2.4.4 ist R/I genau dann ein Körper, wenn es in R/I keine Ideale außer dem Nullideal I/I und R/I gibt. Nach Prop. 2.6.6 ist das genau dann der Fall, wenn kein Ideal zwischen I und R liegt, also genau dann, wenn I maximal ist. ∎ Korollar 2.6.9. Jedes maximale Ideal ist ein Primideal. Beweis. Denn jeder Körper ist insbesondere ein Integritätsring.



Beispiele 2.6.10. (1) Prop. 2.5.7 folgt aus der gerade bewiesenen Aussage. Für m ∈ Z ist Z/m genau dann ein Integritätsring, wenn ⟨m⟩ ein Primideal ist. Das ist äquivalent dazu, dass ±m eine Primzahl ist. In diesem Fall ist das Ideal ⟨m⟩ auch maximal. Denn ⟨m⟩ ⊂ ⟨n⟩ bedeutet ja gerade n∣m. Wenn m also eine Primzahl ist, dann folgt n = ±m oder n = ±. Wenn m keine Primzahl ist, dann gilt ⟨m⟩ ⊊ ⟨n⟩ ⊊ Z für jeden echten Teiler n von m. (2) Es sei K ein Körper, R = K[x] und I = ⟨x⟩. Der Faktorring R/⟨x⟩ ist isomorph zu K. Denn für jedes Polynom ∑ni= a i x i ∈ R gilt n

n

n

∑i= a i x i + I = a + ∑i= a i x i + I = a + (∑i= a i x i− )x +I = a + I. ´¹¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹¸¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¶ ∈I

2.6. FAKTORRINGE

41

Deshalb ist die Abbildung ∑ni= a i x i ↦ a ein Isomorphismus R/I → K. Das Ideal I ist also maximal, was wir natürlich auch direkt hätten zeigen können. Allgemein spielen Faktorringe des Polynomrings in der Körpertheorie (nächstes Kapitel) eine große Rolle. Lemma 2.6.11. Für jedes irreduzible Polynom f ∈ K[x] ist der Faktorring K[x]/⟨ f ⟩ ein Körper. Beweis. Nach Prop. 2.6.8 ist K[x]/⟨ f ⟩ genau dann ein Körper, wenn ⟨ f ⟩ ein maximales Ideal ist. Aber K[x] ist ein Hauptidealring, deshalb wird jedes Ideal, das ⟨ f ⟩ enthält, von einem Teiler von f erzeugt. Da f keine echten Teiler besitzt, sind ⟨ f ⟩ und K[x] also die einzigen Ideale von K[x], die ⟨ f ⟩ enthalten. Das heißt, ⟨ f ⟩ ist maximal. ∎ Wir kommen nun zu einem einfachen aber wichtigen Prinzip, dem Homomorphiesatz. Satz 2.6.12 (Homomorphiesatz für Ringe). Es sei φ∶ R → S ein Homomorphismus zwischen kommutativen Ringen und I ein Ideal von R mit I ⊂ Kern(φ). Dann gibt es eine eindeutig bestimmte Abbildung φ∶ R/I → S mit φ(a) = φ(a + I). Die Abbildung φ ist ein Homomorphismus und genau dann injektiv, wenn I = Kern(φ) gilt. Ist ρ∶ R → R/I die Restklassenabbildung ρ(a) = a + I, dann bedeutet die definierende Eigenschaft φ(a + I) = φ(a) von φ also gerade φ = φ ○ ρ. Das drückt man oft bildlich durch ein kommutierendes Diagramm aus: Man zeichnet R ρ

φ

S

φ

R/I und sagt, dass das Diagramm kommutiert, um auszudrücken, dass φ = φ ○ ρ gilt. Beweis. Wenn so eine Abbildung φ existiert, dann ist sie eindeutig, denn die Gleichheit φ(a + I) = φ(a) legt φ ja bereits auf allen Elementen von R/I fest. Wir definieren φ also gerade durch φ(a + I) = φ(a), und müssen zeigen, dass diese Definition vertreterunabhängig ist. Denn sind a, a ′ ∈ R mit a + I = a′ + I in R/I, dann heißt das a − a ′ ∈ I ⊂ Kern(φ) und damit φ(a) = φ(a ′ + a − a ′ ) = φ(a ′ ) + φ(a − a ′ ) = φ(a ′ ). Die Identitäten φ(a+b) = φ(a)+φ(b), φ(ab) = φ(a)φ(b) und φ() =  implizieren unmittelbar die entsprechenden Identitäten für φ, nämlich φ((a + I)(b + I)) = φ(ab + I) = φ(ab) = φ(a)φ(b) = φ(a + I)φ(b + I) und genauso für die Addition. Der Zusatz über die Injektivität folgt daraus, dass φ genau dann injektiv ist, wenn Kern(φ) das Nullideal in R/I ist, also genau dann, wenn I = Kern(φ) gilt. ∎

42

2. RINGE

Korollar 2.6.13 (Isomorphiesatz). Jeder Homomorphismus φ∶ R → S zwischen kommutativen Ringen induziert einen Isomorphismus ∼

φ∶ R/ Kern(φ) Ð → Bild(φ). Beweis. Weil Kern(φ) ein Ideal ist, induziert φ nach dem Homomorphiesatz einen injektiven Homomorphismus φ∶ R/ Kern(φ) → S. Nach Definition von φ gilt dabei Bild(φ) = Bild(φ). ∎ Korollar 2.6.14. Sind I und J Ideale in R mit J ⊂ I, dann gilt R/I ≅ (R/J)/(I/J). Beweis. Es seien ρ J ∶ R → R/J und ρ̃∶ R/J → (R/J)/(I/J) die Restklassenabbildungen. Weil beide surjektiv sind, ist auch ihre Komposition ρ = ρ̃ ○ ρ J surjektiv. Der Kern von ρ besteht außerdem aus allen Elementen a ∈ R mit a+ J ∈ I/J, ist also gleich I. Nach dem Homomorphiesatz induziert ρ einen Isomorphismus von R/I auf sein Bild (R/J)/(I/J). ∎ Beispiele 2.6.15. (1) Gerade haben wir die Isomorphie K[x]/⟨x⟩ ≅ K gezeigt. Das hätten wir mit dem Isomorphiesatz ganz schnell erledigen können: Betrachte den Homomorphismus φ∶ K[x] → K, f ↦ f (). Er ist surjektiv und sein Kern ist das Ideal ⟨x⟩, denn dieses besteht aus allen Polynomen mit konstantem Term . Also ist φ∶ K[x]/⟨x⟩ → K ein Isomorphismus nach Kor. 2.6.13. (2) Wir wollen zeigen, dass durch ψ∶ {

Z/ → Z/ × Z/ a + ⟨⟩ ↦ (a + ⟨⟩, a + ⟨⟩)

ein Homomorphismus von Ringen gegeben ist. Wenn man einen Homomorphismus von einem Restklassenring in einen anderen Ring definiert, muss man sich immer vergewissern, dass die Abbildung auch wohldefiniert, also vertreterunabhängig, ist. Mit anderen Worten, sind a, b ∈ Z mit a+⟨⟩ = b+⟨⟩, dann müssen auch a+⟨⟩ = b+⟨⟩ und b+⟨⟩ = b+⟨⟩ gelten, sonst war unsere Definition eine Mogelpackung. Natürlich kann man das nun direkt überprüfen. Fast immer ist es aber eleganter und übersichtlicher, auf den Homomorphiesatz zurückzugreifen: Statt ψ direkt wie oben einzuführen, definieren wir als erstes φ∶ {

Z → Z/ × Z/ . a ↦ (a + ⟨⟩, a + ⟨⟩)

Als nächstes zeigen wir ⟨⟩ ⊂ Kern(φ). Das ist klar, denn es gilt ⟨⟩ ⊂ ⟨⟩ und ⟨⟩ ⊂ ⟨⟩. Jetzt wenden wir einfach den Homomorphiesatz an, der die Existenz von ψ = φ sicherstellt, ohne das wir noch etwas nachrechnen müssten. Aufbauend auf dieses Beispiel beweisen wir den folgenden Satz, der sich als weitgehende Verallgemeinerung des chinesischen Restsatzes (Satz 2.5.5) entpuppt. Satz 2.6.16 (Verallgemeinerter Chinesischer Restsatz). Es sei R ein kommutativer Ring, seien I , . . . , Ir Ideale von R mit I i + I j = R für alle i ≠ j

2.6. FAKTORRINGE

43

und setze J = I ∩ ⋯ ∩ Ir . Dann ist die Abbildung φ∶ {

R/J → R/I × ⋯ × R/Ir a + J ↦ (a + I , . . . , a + Ir )

ein Isomorphismus. Beweis. Zunächst bemerken wir, wie gerade im Beispiel, dass die Existenz der Abbildung φ eine Konsequenz des Homomorphiesatzes ist: Die Abbildung ψ∶ {

R → R/I × ⋯ × R/Ir a ↦ (a + I , . . . , a + Ir )

ist offensichtlich ein Ringhomomorphismus, zusammengesetzt aus den Restklassenhomomomorphismen R → R/I j . Ihr Kern besteht aus allen Elementen von R, deren Restklassen modulo I , . . . , Ir alle Null sind, also gerade aus dem Durchschnitt J = I ∩⋯∩Ir . Die Abbildung φ existiert also nach Satz 2.6.12 und ist injektiv. Wir müssen zeigen, dass sie auch surjektiv ist. Das zeigen wir durch Induktion nach r. Für r =  ist nichts zu zeigen und wir beginnen mit r = . Seien a , a ∈ R. Gesucht ist x ∈ R mit x + I j = a j + I j für j = , . Nach Voraussetzung gibt es b ∈ I und b ∈ I mit b + b = . Deshalb hat x = a b + a b die gewünschte Eigenschaft: x + I = a b + a b + I = a ( − b ) + a b + I = a + (a − a )b +I = a + I ´¹¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¸¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹¶ ∈I 

x + I = a b + a b + I = a b + a ( − b ) + I = a + (a − a )b +I = a + I . ´¹¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¸¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¶ ∈I 

Für den Induktionsschritt zeigen wir zunächst, dass I + (I ∩ ⋯ ∩ Ir ) = R

(∗)

gilt. Denn nach Voraussetzung gibt es a j ∈ I und b j ∈ I j mit a j + b j =  für j = , . . . , r. Also gilt  = (a + b )⋯(ar + br ) = a + b ⋯br , wobei a eine Summe ist, in der jeder Term mindestens einen Faktor a j enthält. Deshalb gilt a ∈ I und somit  ∈ I + I ⋯Ir ⊂ I + I ∩ ⋯ ∩ Ir , und die Gleichheit (∗) ist bewiesen. Sei nun r >  und seien a , . . . , ar ∈ R. Nach Induktionsvoraussetzung gibt es y ∈ R mit y + I j = a j + I j für j = , . . . , r. Nach (∗) und dem schon bewiesenen Fall r =  gibt es x ∈ R mit x + I = a + I

und

x + I ∩ ⋯ ∩ I r = y + I ∩ ⋯ ∩ I r .

Es folgt x + I j = a j + I j für alle j = , . . . , r, wie gewünscht.



Lemma 2.6.17. Sind I , . . . , Ir Ideale in R mit I i + I j = R für i ≠ j, dann gilt I ∩ ⋯ ∩ Ir = I ⋯Ir . Beweis. Die Inklusion I ⋯Ir ⊂ I ∩ ⋯ ∩ Ir gilt immer. Wir beweisen die umgekehrte Inklusion durch Induktion nach r, beginnend mit r = . Nach Voraussetzung gibt es b ∈ I , b ∈ I mit b + b = . Für a ∈ I ∩ I folgt deshalb a =  ⋅ a = b a + ab ∈ I I . Sei nun r > . Nach Induktionsvoraussetzung gilt I ∩ ⋯ ∩ Ir = I ⋯Ir . Nach (∗) im vorangehenden Beweis gibt es also b ∈ I und b ∈ I ⋯Ir mit b + b = . Ist a ∈ I ∩ ⋯ ∩ Ir , dann folgt somit a = b a + ab ∈ I ⋯Ir . ∎

44

2. RINGE

Korollar 2.6.18. Sind m , . . . , mr paarweise teilerfremde ganze Zahlen, dann ist die Abbildung a + ⟨m ⋯mr ⟩ ↦ (a + ⟨m ⟩, . . . , a + ⟨mr ⟩) ein Isomorphismus ∼

Z/(m ⋯mr ) Ð → (Z/m ) × ⋯ × (Z/mr ). Beweis. Nach dem vorangehenden Lemma gilt ⟨m ⟩ ∩ ⋯ ∩ ⟨mr ⟩ = ⟨m ⋯mr ⟩. Damit folgt die Behauptung aus Satz 2.6.16. ∎ Die Existenz und Eindeutigkeit der Lösung eines Systems von Kongruenzen im klassischen chinesischen Restsatz (Satz 2.5.5) folgt sofort aus diesem Korollar. Als weitere Anwendung untersuchen wir die Einheitengruppe von Z/m. Sie besteht aus den Kongruenzklassen a + ⟨m⟩, für die es ein x ∈ Z gibt mit (a + ⟨m⟩)(x + ⟨m⟩) =  + ⟨m⟩, also mit ax ≡  (mod m). Nach Prop. 2.5.2 ist das genau dann der Fall, wenn a und m teilerfremd sind. Die Funktion φ∶ {

N → N m ↦ ∣(Z/m)∗ ∣

heißt die Eulersche φ-Funktion. Der Wert φ(m) gibt also an, wieviele der Zahlen {, , . . . , m} teilerfremd zu m sind. Für kleine Werte von m kann man φ(m) leicht direkt ausrechnen: m         ⋯ φ(m)         ⋯ Proposition 2.6.19. Sind m, n ∈ Z zwei teilerfremde ganze Zahlen, dann gilt φ(mn) = φ(m)φ(n). Beweis. Für zwei Ringe R und S gilt (R×S)∗ = R ∗ ×S ∗ , wie man direkt sieht, und damit ∣(R×S)∗ ∣ = ∣R ∗ ∣ ⋅ ∣S ∗ ∣. Nach Kor. 2.6.18 gilt Z/(mn) ≅ Z/m × Z/n und die Behauptung folgt. ∎ Da jede natürliche Zahl n eine Primfaktorzerlegung n = pr  ⋯prkk besitzt und φ(n) = φ(pr  )⋯φ(prkk ) nach Prop. 2.6.19 gilt, reduziert sich das Problem der Berechnung von φ auf den Fall von Primzahlpotenzen. Das ist aber ganz einfach: Die Zahlen zwischen  und pr die nicht teilerfremd zu pr sind, sind gerade die Vielfachen von p, also die pr− Zahlen p, p, p, . . . , pr− p. Es gilt also  φ(pr ) = pr − pr− = pr ( − ). p Damit erhalten wir insgesamt die folgende Formel zur Berechnung von φ. Proposition 2.6.20. Für n = pr  ⋯prkk gilt k

φ(n) = n ∏( − i=

 ). pi



2.7. ANWENDUNG: DAS RSA-KRYPTOSYSTEM

45

2.7. Anwendung: Das RSA-Kryptosystem Wir beschreiben kurz eine moderne Anwendung in der Kryptographie, also in der Verschlüsselung von Nachrichten und Daten. Ich habe mich dabei vor allem an einem älteren Vorlesungsskript von Claus Scheiderer (Konstanz) orientiert (das heißt, daraus abgeschrieben). Kryptographie gab es schon im Altertum. Die einfachste Methode ist, jeden Buchstaben in einem Text nach einer geheimen Tabelle durch einen anderen Buchstaben zu ersetzen (manchmal als Caesar-Verschlüsselung bezeichnet). Diese Verschlüsselung ist in der Regel leicht durch Häufigkeitsanalyse zu knacken und schon lange sind viele bessere Methoden bekannt. Es galt aber immer als ausgemacht, dass der Code selbst unbedingt geheim gehalten werden muss. Das änderte sich vor knapp vierzig Jahren mit der Entwicklung der Public-Key-Kryptographie. Sie ist heute für die sichere Kommunikation im Internet unentbehrlich und wird ständig weiterentwickelt. Es gibt verschiedene Verfahren, aber das bekannteste ist das RSA-Verfahren, das im Jahr 1978 von R. Rivest, A. Shamir und L. Adleman entdeckt wurde und das wir jetzt beschreiben. In der Kryptographie-Literatur heißen Absender und Empfänger immer Alice und Bob7. Bob möchte also seine Nachricht an Alice mit dem RSA-Verfahren verschlüsseln. Zunächst sucht sich Alice zwei sehr große Primzahlen p ≠ q aus, etwa in der Größenordnung  — wie sie die findet, ist uns im Moment egal. Sie bildet das Produkt N = pq und berechnet φ(N) = (p − )(q − ) (siehe Prop. 2.6.20). Diese Zahl teilt sie niemandem mit, sie ist ihr privater Schlüssel. Außerdem wählt Alice eine natürliche Zahl e, die teilerfremd zu φ(N) ist. Das Zahlenpaar (N , e) ist Alices öffentlicher Schlüssel, den jeder erfahren darf. Bob erhält von Alice ihren öffentlichen Schlüssel und verwandelt seine Nachricht an sie zunächst in eine natürliche Zahl m im Intervall {, , . . . , N −}. Wenn man zum Beipsiel von einem Alphabet aus 128 Zeichen ausgeht (etwa die ASCII-Tabelle), dann kann man durch eine Zahl in diesem Intervall also bis zu ⌊N/⌋ Zeichen kodieren. Bob will m also an Alice schicken. Dazu berechnet er die Potenz m e modulo N, das heißt er findet x ∈ {, , . . . , N − } mit x ≡ m e (mod N). Das Potenzieren modulo N kann selbst für riesige Zahlen im Computer sehr schnell durchgeführt werden, indem man sukzessive quadriert und mit dem Euklidischen Algorithmus modulo N reduziert. Die Zahl x übermittelt Bob nun an Alice, ohne besondere Vorkehrungen. Jetzt muss Alice die Nachricht entschlüsseln, also m aus x rekonstruieren. Das geht so: Mit dem euklidischen Algorithmus berechnet sie eine Zahl d mit de ≡  (mod φ(N)), also ein Inverses von e + ⟨φ(N)⟩ im Ring Z/φ(N). Jetzt kommt der Clou: Es gilt m ≡ m de ≡ x d (mod N) 7Für eine Liste weiterer Charaktere siehe https://en.wikipedia.org/wiki/Alice_and_Bob

46

2. RINGE

nach dem folgenden Lemma. Alice kann also die Nachricht durch Potenzieren entschlüsseln. Lemma 2.7.1. Es seien p, q zwei verschiedene Primzahlen und N = pq. Ist r eine natürliche Zahl mit r ≡  (mod φ(N)), dann gilt m ≡ m r (mod N) für alle m ∈ Z. Beweis. Nach dem Chinesischen Restsatz (Kor. 2.6.18) gilt Z/N ≅ (Z/p) × (Z/q). In einem Produkt R × S von Ringen gilt nun (a, b)r = (a r , b r ). Deshalb genügt es für die Behauptung, m ≡ m r (mod p) und m ≡ m r (mod q) zu zeigen. Es gilt φ(N) = (p − )(q − ) nach Prop. 2.6.20, also (p − )∣(r − ). Somit gilt m r− ≡  (mod p) nach Satz 2.5.8, also m r ≡ m (mod p), und entsprechend für q.



(Die Aussage stimmt auch, wenn N das Produkt von mehr als zwei paarweise verschiedenen Primzahlen ist, mit dem gleichen Beweis.) Wie sieht es nun mit der Sicherheit dieses Verfahrens aus? Angenommen, Charlie liest mit und versucht, den Code zu knacken. Er verschafft sich zunächst Alices öffentlichen Schlüssel (N , e). Zur Entschlüsselung braucht er d mit de ≡  (mod φ(N)). Würde er φ(N) kennen, dann wäre das kein Problem: Er könnte einfach den euklidischen Algorithmus benutzen, genau wie Alice. Allerdings kennt Charlie φ(N) ja gerade nicht. Angenommen, Charlie hätte irgendeine schlaue Methode, die Zahl φ(N) zu finden. Dann kann er tatsächlich auch die Primfaktorzerlegung N = pq rekonstruieren, denn es gilt φ(N) = pq − (p + q) +  = N − (p + q) + , also p + q = N − φ(N) +  und außerdem (p − q) = (p + q) − pq = (p + q) − N = (N − φ(N) + ) − N . Charlie kann also aus φ(N) sofort p + q und p − q und damit auch p und q berechnen. Das Problem, φ(N) zu bestimmen, ist also genauso schwierig, wie das Problem, die Primfaktorzerlegung N = pq von N zu finden. Es gilt aber derzeit als unmöglich, diese Primfaktorzerlegung in akzeptabler Zeit zu finden, wenn p und q groß genug sind. Zwar werden Computer immer schneller und große Institutionen, wie Geheimdienste, haben Zugang zu enormer Rechenleistung. Aber das ist nur eine Frage davon, ob p und q groß genug gewählt sind.8 Die Sicherheit des Verfahrens beruht also darauf, dass die Abbildung Z/N → Z/N , x ↦ x e 8Zum Beispiel dauerte die Faktorisierung einer Zahl mit 232 Stellen (-bit RSA), abgeschlossen in 2009, auf meh-

reren hundert Computern gleichzeitig etwa zwei Jahre. Bei -bit RSA wächst der Rechenaufwand noch einmal etwa um den Faktor  und ist damit derzeit durch niemanden zu bewältigen.

2.8. BRÜCHE UND QUOTIENTENKÖRPER

47

eine sogenannte Falltürfunktion ist. Sie ist bijektiv und praktisch im Computer leicht zu berechnen, aber ihre Umkehrfunktion, der diskrete Logarithmus, ist ohne Kenntnis der Primfaktorzerlegung von N praktisch nicht berechenbar. Die Sicherheit des RSA-Verfahrens hängt also theoretisch an der Frage, ob es einen schnel” len“ Algorithmus zur Berechnung einer Primfaktorzerlegung auf einer Turing-Maschine (einem herkömmlichen Computer) gibt. Dies wird von Mathematikern und theoretischen Informatikern aus verschiedenen Gründen für extrem unwahrscheinlich gehalten. Bewiesen ist das allerdings nicht, so dass ein letzter Rest Ungewissheit bleibt.9 Für die Praxis spielt, neben vielen Fragen der Implementierung und zahlreichen Verfeinerungen, noch eine weitere grundlegende mathematische Tatsache eine Rolle. Es ist zwar sehr schwierig, eine große Zahl in ihre Primfaktoren zu zerlegen, aber deutlich leichter zu testen, ob eine gegebene Zahl prim ist. Das ist wichtig, weil man zur Erzeugung der Schlüssel große Primzahlen benötigt und viele Schlüssel zufällig erzeugen möchte. Besonders schnell sind sogenannte probabilistische Primzahltests. Die einfachste Version geht so: Gegeben eine Zahl n, deren Primalität getestet werden soll. Dann wählt man eine natürliche Zahl a < n (in der Regel eine kleine Primzahl) und testet, ob a n− ≡  (mod n) gilt. Ist das nicht der Fall, dann kann n nicht prim sein, nach dem Kleinen Satz von Fermat. Man weiß dann also sicher, dass n nicht prim ist, ohne eine Faktorisierung zu kennen. Indem man verschiedene Werte von a testet, kann man große Zahlen finden, die mit sehr hoher Wahrscheinlichkeit prim sind10. Eine verfeinerte Version dieser Vorgehensweise ist der häufig verwendete Miller-Rabin-Test.

2.8. Brüche und Quotientenkörper Die ganzen Zahlen sind ein Teilring der rationalen Zahlen, wobei die Brüche a/b ∈ Q als Paare ganzer Zahlen entstehen. Allerdings geben verschiedene Paare dieselbe rationale Zahl, wegen a a′ = ′ ⇔ ab′ = a ′ b. b b Durch die Gleichheit auf der rechten Seite wird auf der Menge der Paare Z×Z∖{} eine Äquivalenzrelation definiert. Bei der Konstruktion der rationalen Zahlen werden also Äquivalenzklassen gebildet. Diese Konstruktion kann man auf beliebige Integritätsringe übertragen. Es lohnt sich, das etwas allgemeiner aufzuziehen. Es sei dazu (M, ⋅) ein kommutatives Monoid mit multiplikativ geschriebener Verknüpfung und neutralem Element . Wir sagen, in M gelte die Kürzungsregel, wenn in M die Implikation ∀a, b, c ∈ M (ac = bc ⇒ a = b) gilt. Zu einem solchen kommutativen Monoid mit Kürzungsregel definieren wir die Relation (a, b) ∼ (a ′ , b ′ )



ab′ = a′ b

9Es gibt noch eine weitere für die Sicherheit relevante Frage beim RSA-Verfahren: Es wäre vorstellbar, dass man den

gesuchten Exponent d irgendwie finden kann, auch ohne φ(N) zu kennen. Auch hier scheint es nur empirische Befunde, keinen Beweis für die Sicherheit des Verfahrens zu geben, aber ganz klar ist mir dieser Punkt nicht. 10Wortwörtlich ist das natürlich Unsinn, denn eine einzelne Zahl ist entweder prim oder eben nicht. Man muss das verstehen als eine Aussage über die Häufigkeit von Zahlen, die den Test bestehen, aber trotzdem nicht prim sind, und damit über die Wahrscheinlichkeit, bei zufälliger Suche auf eine solche ungeeignete Zahl zu treffen.

48

2. RINGE

auf M × M und schreiben [a, b] für die Äquivalenzklasse von (a, b) und Q(M) = {[a, b] ∣ a, b ∈ M} für die Menge der Äquivalenzklassen. Wegen der Kürzungsregel gilt in Q(M) also zum Beispiel [ac, bc] = [a, b] für alle a, b, c ∈ M. Man sieht hier schon die Ähnlichkeit zwischen den vertrauten Brüchen ba ∈ Q und diesen abstrakten Äquivalenzklassen von Paaren. Lemma 2.8.1. Sei (M, ⋅) ein kommutatives Monoid mit Kürzungsregel und neutralem Element . Die Menge Q(M) wird mit der Verknüpfung [a, b][c, d] = [ac, bd] zu einer abelschen Gruppe mit neutralem Element [, ]. Die Abbildung β∶ {

M → Q(M) a ↦ [a, ]

ist injektiv und ein Homomomorphismus von Monoiden, das heißt, sie erfüllt β(ab) = β(a)β(b)

und

β() = [, ].

Beweis. Wir zeigen als erstes, dass die angegebene Relation wirklich eine Äquivalenzrelation ist. Symmetrie und Reflexivität sind klar. Für die Transitivität seien a, b, c, d, e, f ∈ M mit (a, b) ∼ (c, d) und (c, d) ∼ (e, f ). Dann gilt also ad = bc und c f = de. Durch Multiplikation beider Gleichungen folgt acd f = bcde und nach Kürzen von cd also a f = be und damit (a, b) ∼ (e, f ). Als nächstes zeigen wir, dass die Verknüpfung wohldefiniert ist. Es gelte [a, b] = [a ′ , b ′ ] und [c, d] = [c ′ , d ′ ], also ab′ = a ′ b und cd ′ = c ′ d. Es folgt acb′ d ′ = ab′ cd ′ = a ′ bc ′ d, also [ac, bd] = [a ′ c ′ , b ′ d ′ ]. Die Verknüpung ist damit wohldefiniert, offensichtlich kommutativ, und es gilt [a, b][, ] = [a, b]. Für die Assoziativität seien [a, b], [c, d], [e, f ] ∈ Q(M), dann gilt ([a, b][c, d])[e, f ] = [ac, bd][e, f ] = [ace, bd f ] = [a, b][ce, d f ] = = [a, b]([c, d][e, f ]). Schließlich gilt wegen der Kürzungsregel [a, b][b, a] = [ab, ab] = [, ]. Also gilt [b, a] = [a, b]− , was zeigt, dass Q(M) eine abelsche Gruppe ist. Die Abbildung β erfüllt wie behauptet β(ab) = [ab, ] = [a, ][b, ] = β(a)β(b) und β() = [, ]. Sie ist auch injektiv, denn β(a) = β(b) bedeutet gerade [a, ] = [b, ], also a = b. ∎ Wir nennen die abelsche Gruppe Q(M) die Quotientengruppe des Monoids M. Das einfachste Beispiel entsteht für M = N mit der Addition als Verknüpfung. Weil wir die Addition natürlich additiv schreiben, ist Q(N ) dann beschrieben durch [a, b] = [a′ , b′ ] ⇔ a + b ′ = a ′ + b

und

[a, b] + [c, d] = [a + c, b + d].

Die Gruppe Q(N ) kennen wir schon, es sind die ganzen Zahlen! Tatsächlich ist φ∶ D(N ) → Z, [a, b] ↦ a − b ein Isomorphismus von abelschen Gruppen: φ ist wohldefiniert, denn [a, b] = [a ′ , b ′ ] bedeutet ja a+b ′ = a ′ +b, also gerade a−b = a ′ −b ′ . Dasselbe Argument rückwärts zeigt die Injektivität von

2.8. BRÜCHE UND QUOTIENTENKÖRPER

49

φ. Außerdem gilt φ([a, b]+[c, d]) = φ[a+c, b+d] = a+c−b−d = a−b+c−d = φ[a, b]+φ[c, d]), also ist φ ein Gruppenhomomorphismus. Schließlich ist φ auch surjektiv, denn für a ∈ Z gilt φ[a, ] = a, falls a ⩾  und φ[, −a] = a, falls a < . Wir können nun die Konstruktion aus Lemma 2.8.1 auch genauso gut auf das Monoid (Z ∖ {}, ⋅) der ganzen Zahlen mit der Multiplikation anwenden (jetzt natürlich wieder multiplikativ geschrieben), und erhalten eine abelsche Gruppe Q(Z ∖ {}). Diese Gruppe ist isomorph zur Gruppe (Q∗ , ⋅) der rationalen Zahlen mit der Multiplikation unter dem Isomorphismus a φ∶ Q(Z ∖ {}) → Q∗ , [a, b] ↦ . b Der Beweis ist fast haargenau der gleiche wie für Q(N ) ≅ Z, man muss nur alle Plus- durch Malzeichen ersetzen. Das machen wir gleich allgemein für Integritätsringe. Wir halten aber die folgende sehr interessante Beobachtung über den Aufbau des Zahlsystems fest: Die ganzen Zahlen entstehen aus den natürlichen Zahlen formal durch die gleiche Konstruktion wie die rationalen Zahlen aus den ganzen Zahlen. Es sei nun R ein beliebiger Integritätsring. Weil R keine Nullteiler hat, gilt im multiplikativen Monoid (R ∖ {}, ⋅) dann die Kürzungsregel. Denn ab = ac impliziert a(b − c) =  und damit b = c, weil wir a =  ausgeschlossen haben. Wir können also Lemma 2.8.1 anwenden und R ∖{} in die abelsche Gruppe Q(R ∖ {}) einbetten. Wir schreiben Quot(R) für Q(R ∖ {}) und wie gewohnt ba für die Äquivalenzklasse [a, b] ∈ Quot(R), a, b ∈ R ∖ {}. Wir wollen nun eine Addition einführen. Zunächst fügen wir die Null hinzu, indem wir die Äquivalenzrelation mit der gleichen Definition auf R × R ∖ {} ausdehnen. Es gilt dann  c = ⇔  ⋅ d = bc ⇔ c =  b d und indem wir auch die Multiplikation fortsetzen gilt außerdem  c  ⋅ = b d  für alle b, d ∈ R ∖ {}, c ∈ R. Nun definieren wir die Addition wie erwartet durch a c ad + bc + = . b d bd Wir haben damit einen Körper von Brüchen konstruiert, der den gegebenen Integritätsring R enthält. Dass auch wirklich alles in Ordnung ist, müssen wir allerdings erst noch beweisen. Satz 2.8.2. Es sei R ein Integritätsring. Die Menge Quot(R) wird mit den beiden Verknüpfungen + und ⋅ zu einem Körper. Die Abbildung a β∶ R → Quot(R), a ↦  ist ein injektiver Ringhomomorphismus. Der Körper Quot(R) heißt der Quotientenkörper von R.

50

2. RINGE

Beweis. Natürlich müssen wir zeigen, dass die Addition wohldefiniert ist. Es sei also Quot(R), dann gilt also ab′ = a′ b und damit

a b

=

a′ b′



a ′ d + b ′ c a′ bd + bb ′ c ab′ d + bb ′ c ad + bc = = = . b′ d bb′ d bb ′ d bd Die Addition ist damit wohldefiniert. Insbesondere können wir, wenn wir ba + dc bilden müsad bc , sowie dc durch bd ersetzen. Für die sen, immer erst den Hauptnenner bilden und ba durch bd Assoziativität reicht es also, nur Summen mit dem gleichen Nenner zu betrachten. Damit gilt a b c a+b c a+b+c a b+c a b c ( + )+ = + = = + = + ( + ). d d d d d d d d d d d Offenbar gelten nun

 a a a −a  + = und + =  b b b b  a −a a für alle b ∈ Quot(R). Also ist b das additive Inverse von b und wir schreiben folgerichtig auch − ba . Die Injektivität der Abbildung β haben wir schon bewiesen (beachte β() =  ), ebenso die Multiplikativität. Außerdem gilt für alle a, b ∈ R die Gleichheit β(a + b) = Damit ist alles bewiesen.

a+b a b = + = β(a) + β(b).    ∎

Die Elemente des Quotientenkörpers nennen wir auch einfach Brüche. Wir können Brüche jetzt also für beliebige Integritätsringe bilden. Statt ba schreiben wir auch a/b, wenn es besser in eine Zeile passen soll. Die Injektion a ↦ a ist ein Isomorphismus von R mit dem Teilring { a ∣ a ∈ R} ⊂ Quot(R). Wie üblich unterscheidet man in aller Regel nicht zwischen a ∈ R und a  ∈ Quot(R), das heißt, man fasst R direkt als Teilring von Quot(R) auf. Beispiele 2.8.3. (1) Der Quotientenkörper von Z ist Q. (2) Sei K ein Körper. Der Quotientenkörper des Polynomrings K[x] heißt der rationale Funktionenkörper und wird mit K(x) bezeichnet. Seine Elemente sind Brüche gf von Polynomen f , g ∈ K[x], g ≠ , und heißen entsprechend rationale Funktionen. In mehreren Variablen bezeichnet K(x , . . . , x n ) den Quotientenkörper von K[x , . . . , x n ]. (3) Ist allgemeiner R ein Integritätsring und K = Quot(R), dann ist der Quotientenkörper des Polynomrings R[x] isomorph zu K(x). Zum Beispiel gilt Quot(Z[x]) ≅ Q(x). Bemerkung 2.8.4. Für nicht-kommutative Ringe gibt es kein direktes Analogon zur Konstruktion des Quotientenkörpers. Bereits die Notation ba ist nur geeignet, wenn ab − = b− a gilt. (Das ist der Grund, warum man zum Beispiel in aller Regel keine Brüche von Matrizen hinschreibt.)

Ist R ein faktorieller Ring, dann hat jedes Element eine eindeutige Zerlegung in Primfaktoren. In einem Bruch im Quotientenkörper Quot(R) kann man das natürlich für Zähler und Nenner machen. Sind also a = up ⋯p k und b = vq ⋯q l in ihre Primfaktoren zerlegt, dann gilt p ⋯p k a = uv − . b q ⋯q l

2.8. BRÜCHE UND QUOTIENTENKÖRPER

51

Gilt dabei p i ∼ q j , ohne Einschränkung etwa p = wq , w ∈ R ∗ , dann kürzen wir und es gilt p ⋯p k a = uv − w . b q ⋯q l Deshalb hat jedes Element von Quot(R) eine Darstellung ba in der a und b teilerfremd sind, denn gemeinsame Teiler von Zähler und Nenner können wir kürzen. Wir nennen eine solche Darstellung maximal gekürzt. Die maximal gekürzte Darstellung eines Bruchs ist eindeutig bis auf Einheiten in R, also bis auf Elemente aus R ∗ , die man zwischen Zähler und Nenner hin und herschieben kann, etwa −  = − . Man kann die Zerlegung von Zähler und Nenner in ihre Primfaktoren auch in eine Zeile schreiben. Jedes Element α ∈ Quot(R) hat also eine Darstellung α = upr  ⋯prkk mit r i ∈ Z, u ∈ R ∗ und p , . . . , p k ∈ R prim. Der Quotientenkörper eines Integritätsrings R ist nicht bloß irgendein Körper, der R enthält, sondern nach Konstruktion der kleinste solche Körper. Zum Beispiel ist Z ja auch in den Körpern R, C, C(x) usw. enthalten, aber nur Q ist der Quotientenkörper. Das ist im Kern die Bedeutung der folgenden abstrakten Aussage. Proposition 2.8.5. Es sei R ein Integritätsring, S ein beliebiger Ring und φ∶ R → S ein Ringhomomorphismus mit φ(R ∖ {}) ⊂ S ∗ . ̃∶ Quot(R) → S mit Dann gibt es einen eindeutig bestimmten Homomorphismus φ a ̃( ) = φ(a) φ 

für alle a ∈ R.

Ist β∶ R → Quot(R), a ↦ a , dann kann man die Aussage dieser Proposition auch genau wie beim Homomorphiesatz durch ein kommutierendes Diagramm ausdrücken, nämlich R β

φ

S

̃ φ

Quot(R) ̃ existiert, dann ist sie eindeutig. Denn für Beweis. Wenn die Abbildung φ −

a b

∈ Quot(R) gilt

−

a a  a  a b a b ̃( ) = φ ̃( ⋅ ) = φ ̃( )φ ̃( ) = φ ̃( )φ ̃(( ) ) = φ ̃( )φ ̃( ) = φ(a)φ(b)− . φ b  b  b     ̃ durch φ eindeutig festgelegt. Wir können also φ ̃ durch die Gleichheit Deshalb ist φ a ̃( ) = φ(a)φ(b)− φ b ̃ ein Homomorphismus mit den definieren (wegen φ(b) ∈ S ∗ ) und müssen dann zeigen, dass φ gewünschten Eigenschaften ist. Das prüft man durch direkte Rechnung nach. ∎

52

2. RINGE

2.9. Nullstellen von Polynomen und Irreduzibilität Das Interessanteste an Polynomen, jedenfalls für die Algebra, ist das Lösen von Polynomgleichungen. Sei stets R ein kommutativer Ring. Ist f ∈ R[x] ein Polynom über R, dann heißt jedes Element a ∈ R mit f (a) =  eine Nullstelle von f . Die Nullstellen hängen bekanntlich mit der Zerlegung von Polynomen in Faktoren zusammen, was wir jetzt systematisch untersuchen. Satz 2.9.1 (Vieta). Es sei f ∈ R[x] und a ∈ R. Dann gibt es q ∈ R[x] mit f = (x − a)q + f (a). Insbesondere gilt (x − a)∣ f genau dann, wenn f (a) =  gilt. Beweis. Wende Polynomdivision auf f und x − a an und schreibe f = (x − a)q + r mit deg(r) < deg(x − a). Also folgt deg(r) ⩽  und damit r ∈ R. Einsetzen von x = a zeigt dann r = f (a). Falls (x − a) ein Teiler von f ist, dann gibt es q ∈ R[x] mit f = (x − a)q und es folgt f (a) = . Die Umkehrung folgt aus der Darstellung f = (x − a)q + f (a). ∎ Korollar 2.9.2. Es sei R ein Integritätsring und f ∈ R[x]. Sind a , . . . , a k ∈ R verschiedene Nullstellen von f , dann gilt (x − a )⋯(x − a k )∣ f . Beweis. Für k =  haben wir das gerade bewiesen. Sei k > , dann gibt es nach Induktionsvoraussetzung ein g ∈ R[x] mit f = (x − a )⋯(x − a k )g. Es folgt  = f (a ) = (a − a )⋯(a − a k )g(a ). Da die a i alle verschieden sind und R ein Integritätsring ist, folgt g(a ) = . Es gibt also h ∈ R[x] mit g = (x − a )h und damit f = (x − a )⋯(x − a k )h. ∎ Korollar 2.9.3. Es sei R ein Integritätsring. (1) Ein Polynom vom Grad n über R hat höchstens n verschiedene Nullstellen in R. (2) Wenn zwei Polynome f und g vom Grad höchstens n über R an n +  Stellen in R übereinstimmen, dann sind sie gleich. Beweis. (1) ist klar nach dem vorangehenden Korollar. (2) Wenn f und g an n +  Stellen übereinstimmen, dann hat f − g mindestens n +  verschiedene Nullstellen. ∎ Korollar 2.9.4. Ist R ein unendlicher Integritätsring und sind f und g Polynome über R mit f (a) = g(a) für alle a ∈ R, dann gilt f = g. ∎ Mit anderen Worten, zwei Polynome über einem unendlichen Integritätsring (insbesondere über einem unendlichen Körper) sind durch die zugehörige Polynomfunktion eindeutig bestimmt. Über endlichen Körpern ist das nicht der Fall, wie wir in §2.2 gesehen haben. Als nächstes untersuchen wir die Irreduzibilität von Polynomen. Proposition 2.9.5. Es sei K ein Körper. Dann ist jedes Polynom vom Grad  in K[x] irreduzibel. Genau dann sind die Polynome vom Grad  in K[x] die einzigen irreduziblen Polynome, wenn jedes Polynom von positivem Grad über K eine Nullstelle in K hat.

2.9. NULLSTELLEN VON POLYNOMEN UND IRREDUZIBILITÄT

53

Beweis. Dass die Polynome vom Grad  irreduzibel sind, haben wir schon bemerkt: In jeder Zerlegung kann es nur einen Faktor von positivem Grad geben und die übrigen sind Einheiten. Angenommen es gibt keine weiteren irreduziblen Polynome in K[x]. Sei f ∈ K[x] mit deg( f ) > , dann zeigen wir durch Induktion nach deg( f ), dass f eine Nullstelle hat. Falls deg( f ) = , etwa f = ax + b mit a, b ∈ K, a ≠ , dann hat f die Nullstelle −b/a. Falls deg( f ) > , dann ist f nach Voraussetzung nicht irreduzibel. Es gibt also g, h ∈ K[x], beides keine Einheiten, mit f = gh. Dann haben g und h beide positiven Grad und es folgt deg(g), deg(h) < deg( f ). Nach Induktionsannahme haben g und h also Nullstellen und damit auch f . ∎ Wenn ein Körper K die Eigenschaft hat, dass jedes Polynom von positivem Grad eine Nullstelle hat, dann kann man also jedes Polynom mit Koeffizienten in K in Linearfaktoren zerlegen. Ein solcher Körper heißt algebraisch abgeschlossen. Der Körper der komplexen Zahlen ist algebraisch abgeschlossen, nach dem Fundamentalsatz der Algebra. (Der Name ist etwas irreführend, denn der Satz ist für die moderne Algebra eigentlich nicht von sonderlich großer Bedeutung.) Wir kommen später im Kapitel über Körpertheorie darauf zurück. Die Zerlegung von Polynomen über einem algebraisch abgeschlossenen Körper ist sehr einfach, da jedes Polynom in Linearfaktoren zerfällt. Über den rationalen Zahlen gibt es dagegen irreduzible Polynome von jedem Grad (folgt zum Beispiel in Kürze aus Satz 2.9.17) und es ist im allgemeinen alles andere als einfach, ein Polynom in irreduzible Faktoren zu zerlegen. Die erste Frage, die wir untersuchen, ist folgende: Gegeben ein Polynom mit Koeffizienten in Q, dann kann man Nenner bereinigen, also mit dem Hauptnenner aller Koeffizienten multiplizieren, und bekommt ein Polynom über Z mit denselben Nullstellen. Umgekehrt kann man natürlich jedes Polynom über Z auch als Polynom über Q auffassen. Wie hängen Irreduzibilität über Q und über Z zusammen? Die Antwort gibt das sogenannte Gaußsche Lemma. Es funktioniert auch im allgemeineren Kontext von faktoriellen Ringen. Definition. Es sei R ein faktorieller Ring. Ein Polynom f ∈ R[x] heißt primitiv, wenn seine Koeffizienten keinen gemeinsamen Teiler (außer Einheiten) haben. Beispiel 2.9.6. Das Polynom f = x  + x +  ist primitiv. Zwar haben je zwei der Koeffizienten , ,  einen gemeinsamen Teiler, aber es gibt keine Zahl ungleich ±, die alle drei teilt. (Die Koeffizienten sind also teilerfremd, wenn auch nicht paarweise teilerfremd). Lemma und Definition 2.9.7. Es sei R ein faktorieller Ring mit Quotientenkörper K und sei f ∈ K[x], f ≠ . Dann gibt es ein Element I( f ) ∈ K ∗ , genannt der Inhalt von f , derart, dass  ⋅f I( f ) ein primitives Polynom mit Koeffizienten in R ist. Der Inhalt hat folgende Eigenschaften. (1) Er ist eindeutig bis auf Assoziiertheit in R, das heißt, sind λ, λ′ ∈ K ∗ zwei Elemente mit λ f , λ′ f in R[x] und primitiv, dann gibt es u ∈ R∗ mit λ = uλ′ . (2) Für f = ∑ni= a i x i ∈ R[x] ist I( f ) der größte gemeinsame Teiler der Koeffizienten, also I( f ) = ggT{a i ∣ i = , . . . , n, a i ≠ } ∈ R. Insbesondere ist f genau dann primitiv, wenn I( f ) ∼  gilt.

54

2. RINGE

(3) Genau dann hat f Koeffizienten in R, wenn I( f ) in R liegt. Beweis. Es sei zunächst f = ∑ni= a i x i ∈ R[x]. Sei f bereits primitiv und λ ∈ K ∗ derart, dass auch λ f primitiv ist mit Koeffizienten in R, etwa λ = ba mit a und b teilerfremd. Dann gilt also (a i a)/b ∈ R für alle i. Weil a und b teilerfremd sind, folgt daraus b∣a i und da andererseits f primitiv ist, muss b eine Einheit sein. Es folgt also λ ∼ a ∈ R. Da a f wieder primitiv sein soll, muss auch a eine Einheit sein, also insgesamt λ ∈ R ∗ . Das zeigt die Eindeutigkeit in (1). Für die Existenz, sei zunächst weiter f ∈ R[x], aber nicht notwendig primitiv. Dann hat I( f ) = ggT{a i ∣ i = , . . . , n, a i ≠ } ∈ R offenbar die gewünschte Eigenschaft, also gilt (2). Ist f ∈ K[x] ∖ {} beliebig, dann wählen wir zunächst b ∈ R ∖ {} mit b f ∈ R[x] (zum Beispiel das Produkt aller Nenner in den Koeffizienten von f ) und setzen I( f ) = I(b f )/b ∈ K ∗ . Ist g = I( f )− f ∈ R[x], dann ist also f = I( f )g. Aus I( f ) ∈ R folgt also f ∈ R[x]. Die Umkehrung gilt nach (2). Damit ist auch (3) bewiesen. ∎ Satz 2.9.8 (Gaußsches Lemma). Der Inhalt des Produkts zweier Polynome ist das Produkt ihrer Inhalte. Insbesondere ist das Produkt zweier primitiver Polynome wieder primitiv.

Beweis. Wir zeigen zunächst die zweite Behauptung. Seien f = ∑ a i x i und g = ∑ b i x i primitive Polynome über R und sei p ∈ R ein Primelement. Dann müssen wir zeigen, dass p nicht alle Koeffizienten von f g teilen kann. Da f und g primitiv sind, teilt p nicht alle Koeffizienten von f und g. Sei ar der erste Koeffizient (mit dem kleinsten Index) von f mit p ∤ ar und und bs der erste Koeffizient von g mit p ∤ bs . Der Koeffizient von x r+s in f g ist dann cr+s = a br+s + a br+s− + ⋯ + ar bs + ⋯ + ar+s b . Nach Annahme ist hier jeder Term durch p teilbar außer ar bs . Also kann cr+s nicht durch p teilbar sein, was zeigt, dass f g primitiv ist. Seien nun f , g ∈ K[x] ∖ {} beliebig, dann sind f = I( f )− f und g = I(g)− g primitiv. Also ist f g = I( f )I(g) f g und da f g primitiv ist, folgt, dass I( f )I(g) der Inhalt von f g ist. ∎ Das Gaußsche Lemma hat eine Reihe von nützlichen Folgerungen, die manchmal selbst unter dem Namen Gaußsches Lemma laufen. Korollar 2.9.9. Es sei R ein faktorieller Ring mit Quotientenkörper K. (1) Ist f ∈ R[x] primitiv und g ∈ K[x] mit f g ∈ R[x], dann folgt g ∈ R[x]. (2) Sei h ∈ R[x]. Gibt es f , g ∈ K[x] mit h = f g und deg(g), deg(h) > , dann gibt es solche Polynome auch in R[x]. Beweis. (1) Nach dem Gaußschen Lemma gilt I( f g) = I( f )I(g) = I(g), bis auf Assoziiertheit in R. Aus f g ∈ R[x] folgt I( f g) ∈ R und damit I(g) ∈ R, also auch g ∈ R[x]. (2) Setze f = I( f )− f , g = I( f )g. Dann ist f primitiv und es gilt h = f g . Aus (1) folgt deshalb g ∈ R[x] und die Behauptung ist bewiesen. ∎

2.9. NULLSTELLEN VON POLYNOMEN UND IRREDUZIBILITÄT

55

Bemerkung 2.9.10. Kor. 2.9.9(2) sagt insbesondere, dass ein irreduzibles Polynom über R auch über K irreduzibel bleibt. Die Umkehrung ist nicht ganz richtig: Zum Beispiel ist das Polynom x irreduzibel über Q (denn  ist eine Einheit), aber über Z sind  und x zwei irreduzible Faktoren von x. Natürlich ist aber die Umkehrung von (2) richtig: Wenn ein Polynom über K keine Zerlegung in zwei Faktoren von positivem Grad erlaubt, dann erst recht nicht über R. Korollar 2.9.11. Es sei R ein faktorieller Ring, K = Quot(R) und f = a n x n + ⋯ + a ∈ R[x] mit n ⩾  und a n ≠ . Jede Nullstelle a ∈ K von f hat die Form λ = ba mit a, b ∈ R, a∣a

und

b∣a n .

Falls f normiert ist (also a n = ) dann hat f insbesondere keine Nullstellen in K ∖ R. Beweis. Sei ba ∈ K mit f ( ba ) = . Wir können ohne Einschränkung annehmen, dass a und b teilerfremd sind. Dann ist (x − ba ) ein Teiler von f in K[x], also auch bx − a, und dieses Polynom ist primitiv. Nach Kor. 2.9.9(1) gibt es g ∈ R[x] mit f = (bx − a)g. Ist g = ∑ b i x i , dann folgt also a n = bb n und a = ab und damit die Behauptung.



Korollar 2.9.12. Ist f ein normiertes Polynom mit Koeffizienten in Z, dann ist jede rationale Nullstelle von f ganzzahlig. ∎ Das folgende hatten wir auch schon als Übungsaufgabe. Korollar 2.9.13. Sei n ⩾  eine natürliche Zahl. Jede ganze Zahl d ∈ Z ist entweder eine n-te Potenz √ n in Z oder keine n-te Wurzel d ∈ C liegt in Q. Beweis. Wende das vorangehende Korollar auf f = x n − d an.



Satz 2.9.14 (Gauß). Der Polynomring R[x] über einem faktoriellen Ring R ist faktoriell. Wir beweisen Satz 2.9.14 zusammen mit der folgenden präziseren Aussage. Satz 2.9.15. Es sei R ein faktorieller Ring mit Quotientenkörper K. Die Primelemente im Polynomring R[x] sind genau die folgenden: (a) Die Primelemente aus R; (b) die primitiven Polynome von positivem Grad in R[x], die irreduzibel in K[x] sind. Beweis von 2.9.14 und 2.9.15. Wir zeigen zunächst, dass die Elemente vom Typ (a) und (b) in R[x] prim sind. Sei p ∈ R prim und sei R → R/⟨p⟩ die Restklassenabbildung a ↦ a. Betrachte dazu α∶ R[x] → R/⟨p⟩[x], f ↦ f . Dabei entsteht f aus f , indem man die Koeffizienten modulo p reduziert, d.h. aus f = ∑ a i x i wird f = ∑ a i x i . Die Abbildung α ist ein surjektiver Homomorphismus und ihr Kern ist genau das Hauptideal pR[x], denn dieses besteht gerade aus allen Polynomen, deren Koeffizienten alle durch p teilbar sind. Nach dem Homomorphiesatz induziert α deshalb einen Isomorphismus ∼

R[x]/pR[x] Ð → (R/⟨p⟩)[x].

56

2. RINGE

Nun ist R/⟨p⟩ nullteilerfrei, weil p prim ist. Also ist auch der Polynomring R/⟨p⟩[x] nullteilerfrei und damit auch R[x]/pR[x]. Nach Prop. 2.6.8 ist pR[x] ein Primideal und damit p prim. Für die Elemente vom Typ (b) gehen wir analog vor. Sei f ∈ R[x] ein primitives Polynom, das in K[x] irreduzibel ist. Der Polynomring K[x] ist faktoriell (Kor. 2.4.14) und deshalb ist f ∈ K[x] auch prim. Nach 2.6.8 ist deshalb der Faktorring K[x]/ f K[x] nullteilerfrei. Sei ρ∶ K[x] → K[x]/ f K[x] die Restklassenabbildung und betrachte ihre Einschränkung ρ∶ R[x] → K[x]/ f K[x], auf den Teilring R[x] ⊂ K[x]. Der Kern von ρ ist das Hauptideal f R[x], da f primitiv ist. Denn ρ(g) =  für g ∈ R[x] bedeutet f ∣g in K[x], also auch f ∣g in R[x] nach Kor. 2.9.9(1). Nach dem Homomorphiesatz induziert ρ einen Isomorphismus ∼

ρ∶ R[x]/ f R[x] Ð → Bild(ρ) ⊂ K[x]/ f K[x]. Also ist R[x]/ f R[x] isomorph zu einem Teilring eines nullteilerfreien Rings und damit selbst nullteilerfrei. Nach 2.6.8 ist f R[x] damit ein Primideal in R[x] und somit f prim. Damit ist gezeigt, dass die Elemente vom Typ (a) und (b) prim sind. Wir zeigen als nächstes, dass jedes Polynom f ∈ R[x], f ≠ , f ∉ R∗ , ein Produkt von solchen Elementen ist. Daraus folgt dann einerseits, dass es keine weiteren irreduziblen Elemente geben kann und andererseits nach Satz 2.3.9 auch, dass R[x] faktoriell ist. Falls f konstant ist, dann ist f ein Produkt von Elementen vom Typ (a), weil R faktoriell ist. Sei also deg( f ) ⩾  und zerlege f in K[x] in Primfaktoren f = f ⋯ f r . Setze g i = I( f i )− f i . Nach dem Gaußschen Lemma gilt dann f = I( f )⋯I( fr ) ⋅ g ⋯gr = I( f ) ⋅ g ⋯gr . Nun ist I( f ) ∈ R ein Produkt von Primelementen vom Typ (a) und jedes g i ein Primelement vom Typ (b). Damit ist alles bewiesen. ∎ Korollar 2.9.16. (1) Der Polynomring K[x , . . . , x n ] über einem Körper K ist faktoriell. (2) Der Polynomring Z[x , . . . , x n ] ist faktoriell. Beweis. Wegen R[x , . . . , x n ] = R[x , . . . , x n− ][x n ] folgt das für (1) und (2) jeweils durch Induktion aus Satz 2.9.14. ∎ Wir haben nun den Zusammenhang zwischen Irreduzibilität von Polynomen über einem faktoriellen Ring R und Irreduzibilität über seinem Quotientenkörper genau analysiert. Das hilft aber noch nicht viel, wenn man von einem konkret gegebenen Polynom wissen will, ob es irreduzibel ist. Selbst für R = Z gibt es dafür kein einfaches Kriterium. Die Frage, ob ein gegebenes Polynom f ∈ Z[x] irreduzibel ist, ist zwar entscheidbar, das heißt es gibt einen endlichen Algorithmus dafür. Ein Computer kann die Frage also immer entscheiden, genügend Zeit und Speicherplatz vorausgesetzt. Das ist allerdings eher von theoretischem Interesse. Zum Abschluss dieses Kapitels ein einfaches aber nützliches Kriterium für Irreduzibilität. Satz 2.9.17 (Eisenstein-Kriterium). Sei R ein faktorieller Ring mit Quotientenkörper K und sei f = a n x n + ⋯ + a x + a ∈ R[x].

2.9. NULLSTELLEN VON POLYNOMEN UND IRREDUZIBILITÄT

57

Falls es ein Primelement p ∈ R gibt mit (i) p ∤ a n , (ii) p∣a i für  ⩽ i < n, (iii) p ∤ a , dann ist f irreduzibel in K[x]. Beweis. Nach Kor. 2.9.9 genügt es zu zeigen, dass f in R[x] keine Teiler von positivem Grad hat. Sei also f = gh, g, h ∈ R[x], dann müssen wir zeigen, dass g oder h konstant ist. Sei g = ∑ b i x i und h = ∑ c i x i . Es gilt a = b c und wegen (ii) und (iii) teilt p genau einen der beiden Faktoren b und c , ohne Einschränkung etwa b . Da p kein Teiler von a n ist, kann p aber nicht alle Koeffizienten b i teilen. Sei k der kleinste Index mit p ∤ b k . Aus a k = b k c + b k− c + ⋯ + b c k folgt dann, dass p kein Teiler von a k ist, denn p teilt jeden Term auf der rechten Seite außer b k c . Nach Voraussetzung muss k = n = deg( f ) gelten, und damit ist h konstant. ∎ Beispiel 2.9.18. Für jede Primzahl p ist das Polynom x n − p irreduzibel in Q[x]. Allgemeiner ist x n ± a irreduzibel für jedes a ∈ Z, in dem mindestens ein Primfaktor einfach vorkommt. Sonst stimmt das natürlich nicht, denn x  −  = (x  − )(x  + ) ist zum Beispiel nicht irreduzibel. Ein Polynom, das dem Eisenstein-Kriterium genügt, wird Eisenstein-Polynom genannt. Es gibt aber wie gesagt kein allgemeines Kriterium für Irreduzibilität über Q. Es ist also nicht jedes irreduzible Polynom ein Eisenstein-Polynom.

Als Anwendung des Eisenstein-Kriteriums und zur Vorbereitung auf die Körpertheorie untersuchen wir zum Abschluss noch kurz die sogenannten Einheitswurzeln. Eine n-te Einheitswurzel in einem Körper K ist eine n-te Wurzel der , also eine Lösung der Gleichung xn =  über K. Da diese Gleichung Grad n hat, kann sie höchstens n Lösungen in K haben. Für K = Q oder K = R gibt es nur die beiden Einheitswurzeln − und  (für gerades n) bzw. nur  (für ungerades n). Über den komplexen Zahlen K = C gibt es dagegen für jedes n immer genau n verschiedene n-te Einheitswurzeln, die man am einfachsten in Polarkoordinaten hinschreibt. Nach der berühmten Euler-Identität gilt e αi = cos(α) + i sin(α) für jede reelle Zahl α. Diese komplexen Zahlen bilden also genau den Einheitskreis in der komplexen Zahlenebene (die komplexen Zahlen vom Betrag ), wobei α den Winkel gegen den Uhrzeigersinn angibt. Insbesondere gelten e πi = − und e πi = . Die Multiplikation e αi e βi = e (α+β)i entspricht der Addition der Winkel. Deshalb erhält man die komplexen n-ten Einheitswurzeln, indem man den Einheitskreis in n Segmente unterteilt.

58

2. RINGE

e

− =

πi

π i 

e

π 

e πi

e

π i 

e πi = 

e

π i 

Sechste Einheitswurzeln in der komplexen Ebene

Die n-ten komplexen Einheitswurzeln sind also gerade e

π i n

,e

⋅π i n

,e

⋅π i n

,...,e

(n−)π i n

,e

nπ i n

= .

Wir untersuchen nun das Polynom x n −  ∈ Q[x], dessen Nullstellen die n-ten Einheitswurzeln in C sind. Wir kennen seine Zerlegung in Linearfaktoren über C, nämlich n

x n −  = ∏(x − e

kπ i n

).

k=

Damit wissen wir aber noch nichts darüber, in welche irreduziblen Faktoren x n − über Q zerfällt. Wegen  ∈ Q können wir einen Linearfaktor sofort abspalten und erhalten x n −  = (x − )(x n− + x n− + ⋯ + x + ) in Q[x]. Der verbleibende Faktor ist das Produkt der Linearfaktoren (x − e kπi/n ) mit  < k < n. Wir werden diesen Faktor weiter untersuchen, als erstes nur im Fall, dass n eine Primzahl ist. Proposition 2.9.19. Für jede Primzahl p ist das Polynom x p− + ⋯ + x +  irreduzibel in Q[x]. p−

Beweis. Sei f = ∑i= x i . Wir verwenden einen Trick, um f zu einem Eisenstein-Polynom zu machen. Setze y = x − , dann folgt f =

x p −  (y + ) p −  p p = = y p− + ( )y p− + ⋯ + ( ) x − y  p−

nach der verallgemeinerten binomischen Formel. Der dabei auftretende Binomialkoeffizient p! p ( )= i i!(p − i)! ist für alle  < i < p durch p teilbar. Denn p teilt den Zähler p!, aber nicht den Nenner, da p ) = p, also nicht dort alle Faktoren kleiner als die Primzahl p sind. Der konstante Term ist ( p− durch p teilbar. Deshalb ist f irreduzibel als Polynom in y nach dem Eisenstein-Kriterium (Satz 2.9.17). Damit ist f auch irreduzibel in x, weil wir die Substitution durch x = y +  ja auch wieder rückgängig machen können. ∎

Algebra

Daniel Plaumann Technische Universität Dortmund Wintersemester 2016 Fassung vom 26. Juli 2017

. GRUPPEN

3.1. Grundlagen Eine Gruppe ist ein Monoid, in dem jedes Element ein Inverses besitzt. Wir wiederholen noch einmal die vollständige Definition aus der Einleitung. Definition. Eine Gruppe ist eine nicht-leere Menge G mit einer Verknüpfung G × G → G, (x, y) ↦ x ⋅ y, die die folgenden Eigenschaften besitzt. (A) Für alle g, h, k ∈ G gilt (gh)k = g(hk). (Assoziativität) (N) Es gibt ein Element  ∈ G mit g = g = g für alle g ∈ G. (Neutrales Element) − − − (I) Zu jedem g ∈ G gibt es ein g ∈ G mit g g = g g = . (Existenz von Inversen) Falls die Verknüpfung zusätzlich kommutativ ist, also (K) Für alle g, h ∈ G gilt gh = hg. erfüllt ist, dann heißt G eine abelsche Gruppe.

(Kommutativität)

Für das neutrale Element schreiben wir der Deutlichkeit halber manchmal auch G . In der Literatur findet sich auch häufig der Buchstabe e für das neutrale Element. Aus den Axiomen kann man eine Reihe von einfachen Folgerungen ziehen. Das Invertieren hat die Eigenschaften (gh)− = h − g −

und

(g − )− = g

für alle g, h ∈ G.

Das neutrale Element ist immer eindeutig, denn sind e, e ′ ∈ G zwei Elemente mit eg = ge = e ′ g = ge ′ = g für alle g ∈ G, dann folgt sofort e = e ′ e = e ′ . Genauso sind die Inversen eindeutig bestimmt, denn aus gh = hg = gh′ = h′ g =  folgt h = h = hgh ′ = h ′ = h′ . Allgemeiner sind lineare Gleichungen in Gruppen immer eindeutig lösbar. Das ist die folgende Aussage. Proposition 3.1.1. Es sei G eine nicht-leere Menge mit assoziativer Verknüpfung G × G → G, (g, h) ↦ gh. Genau dann ist G eine Gruppe, wenn die beiden Gleichungen gx = h

und

yg = h

für alle g, h ∈ G Lösungen x, y ∈ G besitzen. In diesem Fall sind die Lösungen eindeutig. Beweis. Übung.



Beispiele 3.1.2. (1) Gegeben einen Ring R, dann können wir die Multiplikation einfach vergessen und nur die additive Gruppe (R, +) betrachten. Insbesondere sind das die Gruppen (Z, +) und

(Z/n, +).

für n ∈ N. Diese Gruppen sind abelsch und wir kennen sie schon ganz gut. Außerdem gibt es die Einheitengruppe R ∗ , über deren Struktur wir aber bislang nicht viel wissen. 59

60

3. GRUPPEN

(2) Ist R ein Ring, dann bilden die invertierbaren n × n-Matrizen über R die Gruppe GLn (R) = {A ∈ Matn×n (R) ∣ ∃A− ∈ Matn×n (R)∶ AA− = A− A = I n }, die allgemeine lineare Gruppe über R. Aus der linearen Algebra vertraut ist der Fall, dass R ein Körper ist. Für die Zahlentheorie ist aber zum Beispiel auch die Gruppe GLn (Z) sehr interessant. Wenn R ein endlicher Ring ist, dann ist GLn (R) eine endliche Gruppe. Zum Beispiel besteht GL (F ) aus sechs Elementen:             GL (F ) = {( ),( ),( ),( ),( ),( )}.             Ist G eine endliche Gruppe, dann heißt die Anzahl ihrer Elemente ∣G∣ die Ordnung von G oder zur Verdeutlichung die Gruppenordnung. Die Multiplikation in einer endlichen Gruppe kann man im Prinzip vollständig in einer Tabelle darstellen, wie wir es auch schon für endliche Körper getan haben, einer Multiplikationstabelle. Zum Beispiel sind

(3.1.3)

⋅  a b c

  a b c

a a b c 

b b c  a

c c  a b

⋅  a b c

  a b c

a a  c b

b b c  a

c c b a 

die Multiplikationstabellen zweier Gruppen der Ordnung . Es ist so eine Art Sudoku. Man sieht, dass die  das neutrale Element ist. Die Existenz von Inversen sieht man daran, dass die  in jeder Zeile und jeder Spalte auftaucht. Wegen Prop. 3.1.1 ist außerdem klar, dass jede Zeile und jede Spalte jedes Element genau einmal enthalten muss. Leider gibt es aber auch noch die Assoziativität, und die sieht man der Tabelle nicht so einfach an. Wenn man das Assoziativgesetz in so einer Tabelle überprüfen möchte, bleibt einem im Allgemeinen nichts anderes übrig, als alle Dreier-Kombinationen durchzuprobieren, was einem schnell über den Kopf wächst. In der linken Gruppe gilt b = a und c = a  , sie besteht also aus den Elementen {, a, a  , a }. In der rechten Gruppe gelten dagegen c = ab und a  = b  = c  = . Diese Gruppe wird Kleinsche Vierergruppe genannt1. Beide Gruppen sind im Prinzip schon vorgekommen. Die erste ist isomorph zu (Z/, +) und die Kleinsche Vierergruppe zu (Z/ × Z/, +). Bis auf Isomorphie sind das alle Gruppen der Ordnung . (Über Isomorphismen von Gruppen reden wir gleich.) Definition 3.1.4. Sei G eine Gruppe. Eine Untergruppe (nicht Teilgruppe) von G ist eine nichtleere Teilmenge H von G mit den beiden Eigenschaften: (1) Für alle g, h ∈ H gilt gh ∈ H. (2) Für jedes h ∈ H gilt h− ∈ H. Jede Untergruppe H ⊂ G enthält die Eins. Denn nach Voraussetzung ist H nicht die leere Menge, enthält also irgendein Element h ∈ H. Aus (1) und (2) folgt dann  = hh − ∈ H. Man kann die Forderung H ≠ ∅ also auch durch  ∈ H ersetzen. Eine Untergruppe H heißt echte Untergruppe von G, wenn sie ungleich {} und ungleich G ist. 1Ich

weiß nicht, ob der berühmte Mathematiker Felix Klein die Benennung dieser banalen Gruppe nach seiner Person als Beleidigung empfand (und ob diese Benennung überhaupt zu seinen Lebzeiten erfolgt ist).

3.1. GRUNDLAGEN

61

Man kann (1) und (2) auch zusammenfassen: Genau dann ist eine nicht-leere Teilmenge H von G eine Untergruppe, wenn g, h ∈ H

() + ()

Ô⇒

gh− ∈ H

gilt. Denn wieder gilt  = xx − ∈ H für ein x ∈ H. Für jedes h ∈ H folgt dann h− = h − ∈ H, also gilt (2). Und für g, h ∈ H gilt gh = g(h − )− ∈ H, also gilt (1). Beispiele 3.1.5. Sei K ein Körper. In der Gruppe GLn (K) bilden die Matrizen SLn (K) = {A ∈ GLn (K) ∣ det(A) = } mit Determinante  eine Untergruppe, die spezielle lineare Gruppe. Das liegt daran, dass die Determininante multiplikativ ist: Für A, B ∈ GLn (K) gilt det(AB) = det(A) det(B). Sind also A, B ∈ SLn (K), dann folgt daraus A− ∈ SLn (K) und AB ∈ SLn (K). Außerdem liegt die Einheitsmatrix I n in SLn (K), was zeigt, dass SLn (K) eine Untergruppe ist. Es ist zum Beispiel SL (K) = {(

a b ) ∣ ad − bc = }. c d

Das Inverse einer Matrix in SL (K) ist −

a b d −b ( ) =( ) c d −c a Eine weitere Untergruppe von GLn (K) ist On (K) = {A ∈ GLn (K) ∣ AAT = I n }, die orthogonale Gruppe. Ihre Elemente erfüllen also AT = A− und heißen orthogonale Abbildungen, weil sie das Standard-Skalarprodukt auf K n erhalten. Jede orthogonale Matrix A ∈ On (K) hat wegen  = det(I n ) = det(AAT ) = det(A) die Determinante  oder −. Die orthogonalen  × -Matrizen haben die Form a b ( ) −b a

oder

(

a b ) b −a

mit a + b  = , a, b ∈ K.

je nach dem, ob die Determinante  oder − ist. Für K = R kann man den Einheitskreis, beschrieben durch a  + b  = , mit a = cos(φ), b = sin(φ), φ ∈ [, π) parametrisieren. Die Untergruppe SOn (K) = On (K) ∩ SLn (K) der orthogonalen Matrizen mit Determinante  heißt die spezielle orthogonale Gruppe. Definition 3.1.6. Seien G und H zwei Gruppen. Ein Homomorphismus (oder Gruppenhomomorphismus) zwischen G und H ist eine Abbildung φ∶ G → H mit φ(gh) = φ(g)φ(h) für alle g, h ∈ G. Jeder Homomorphismus φ∶ G → H erfüllt automatisch auch ○ φ(G ) = H ; ○ φ(g − ) = φ(g)− für alle g ∈ G.

62

3. GRUPPEN

Denn für alle g ∈ G gilt φ(g)φ(G ) = φ(gG ) = φ(g). Also folgt φ(G ) = φ(g)− φ(g) = H . Entsprechend gilt φ(g − )φ(g) = φ(g − g) = φ(G ) = H , also φ(g − ) = φ(g)− . Genau wie für Ringe gibt es die Untergruppen Kern(φ) = {g ∈ G ∣ φ(g) = H } ⊂ G

und

Bild(φ) = {φ(g) ∣ g ∈ G} ⊂ H

von G bzw. H, und es gilt: Proposition 3.1.7. Genau dann ist ein Homomorphismus φ∶ G → H injektiv, wenn Kern(φ) = {}. Beweis. Denn es gilt φ(g) = φ(h) für g, h ∈ G genau dann, wenn φ(gh− ) ∈ Kern(φ). Also enthält Kern(φ) genau dann ein Element ungleich , wenn es g ≠ h ∈ G gibt mit φ(g) = φ(h). ∎ Beispiele 3.1.8.

(1) Sei K ein Körper (oder ein kommutativer Ring). Die Determinante det∶ GLn (K) → K ∗

ist ein Homomorphismus, denn es gilt eben det(AB) = det(A) det(B) (sogar für alle n × nMatrizen, nicht nur die invertierbaren). Der Kern ist per Definition gerade SLn (K). (2) Sei G eine Gruppe. Die Invertierungsabbildung ι∶ G → G, g ↦ g − ist genau dann ein Homomorphismus, wenn G abelsch ist. Denn falls G abelsch ist, dann gilt ι(gh) = (gh)− = h − g − = g − h − = ι(g)ι(h) für alle g, h ∈ G. Ist umgekehrt ι ein Homomor− phismus, dann gilt gh = ((gh)− ) = (g − h− )− = hg für alle g, h ∈ G. Das Wichtigste an Gruppen ist im Großen und Ganzen, dass sie auf anderen mathematischen Objekten operieren. Ist zum Beispiel G = GLn (K) die Gruppe aller invertierbaren n×n-Matrizen mit Einträgen in einem Körper K, dann bekommt man für jede Matrix A ∈ G und jeden Vektor x ∈ K n einen neuen Vektor Ax ∈ K n . Das formalisiert man folgendermaßen: Definition 3.1.9. Es sei G eine Gruppe und X eine Menge. Eine Operation (genauer Gruppenoperation) von G auf X ist eine Abbildung µ∶ G × X → X, die also jedem x ∈ X und jedem g ∈ G ein Element µ(g, x) ∈ X zuordnet, derart, dass folgendes gilt: (O1) µ(gh, x) = µ(g, µ(h, x)) für alle g, h ∈ G und x ∈ X; (O2) µ(, x) = x für alle x ∈ X. Gegeben eine Gruppenoperation von G auf X, dann sagt man, G operiert auf X. Meistens unterschlagen wir µ und schreiben für g ∈ G und x ∈ X einfach g ⋅ x oder gx statt µ(g, x). Es muss dann aus dem Kontext und durch die Wahl der Buchstaben klar sein, was Elemente der Gruppe sind und was Elemente der Menge. Die beiden Regeln für Operationen lauten dann also: (O1) (gh)x = g(hx) für alle g, h ∈ G und x ∈ X; (O2) x = x; Aus (O1) und (O2) folgt sofort (O3) g − (gx) = x = g(g − x) für alle g ∈ G und x ∈ X. Beispiele 3.1.10. (1) Die Gruppe GLn (K) operiert wie schon bemerkt auf K n durch die übliche Matrix-Vektor-Multiplikation (A, x) ↦ Ax.

3.1. GRUNDLAGEN

63

(2) Zusammen mit einer Gruppe operiert auch jede Untergruppe. Zum Beispiel operiert die spezielle orthogonale Gruppe cos(φ) − sin(φ) ) ∣ φ ∈ [, π)} SO (R) = {( sin(φ) cos(φ) − sin(φ)  auf R , wobei die Operation (A, x) ↦ Ax mit A = ( cos(φ) sin(φ) cos(φ) ) der Rotation des Vektors x ∈ R um den Ursprung (gegen den Uhrzeigersinn) mit Drehwinkel φ entspricht. (3) Die Gruppe GLn (K) operiert auch auf der Menge Matn (K) aller Matrizen durch MatrixMultiplikation (A, X) ↦ AX. Interessanter ist eine andere Operation, durch Konjugation:

{

GLn (K) × Matn (K) → Matn (K) (A, X) ↦ AXA−

Die Regel (O2) ist klar und (O1) ist erfüllt wegen (AB)X(AB)− = (AB)X(B− A− ) = A(BXB− )A− . (4) Jede Gruppe G operiert auf sich selbst durch Linksmultiplikation, also durch {

G×G → G . (g, x) ↦ gx

Die Regel (O1) ist dabei gerade das Assoziativgesetz in G und (O2) einfach die Definition der . (5) Im Prinzip kann man statt von links auch genauso gut von rechts multiplizieren, also die Rechtsmultiplikation betrachten. Ist X = G (der Deutlichkeit halber), dann entspricht das also der Abbildung G × X → X, (g, x) ↦ x g. Leider ist das im Allgemeinen keine Operation. Denn (O1) entspräche der Gleichheit x(gh) = (xh)g. Damit das für alle g, h, x ∈ G gilt, muss G also abelsch sein. Um aus diesem Dilemma herauszukommen, gibt es zwei Möglichkeiten: Entweder man passt die Definition der Operation entsprechend an, das heißt man erlaubt statt (O1) auch das vertauschte Gesetz µ(gh, x) = µ(h, µ(g, x)). Oder man betrachtet statt dessen {

G×G → G . (g, x) ↦ x g −

Das ist wieder eine Operation, denn es gilt x(gh)− = (xh− )g − . Für die meisten Zwecke ist das genauso gut, wie die eigentliche Rechtsmultiplikation. (6) Genauso wie bei Matrizen kann man Links- und Rechtsmultiplikation zusammenbauen: Jede Gruppe G operiert auf sich selbst durch Konjugation, also durch {

G×G → G . (g, x) ↦ gx g −

Proposition 3.1.11. Es sei G eine Gruppe, die auf einer Menge X operiert. Durch x∼y



∃ g ∈ G∶ x = g y

ist eine Äquivalenzrelation auf X definiert. Die Äquivalenzklassen dieser Relation sind die Mengen G ⋅ x = {g ⋅ x ∣ g ∈ G},

x ∈ X.

Die Menge G ⋅ x heißt die Bahn (oder der Orbit) von x unter G.

64

3. GRUPPEN

Beweis. Die Relation ist reflexiv, denn es gilt x =  ⋅ x für alle x in X. Sie ist symmetrisch, denn x ∼ y bedeutet, dass es g ∈ G gibt mit x = g y. Es folgt y = g − g y = g − x, also y ∼ x. Für die Transitivität seien x, y, z ∈ X mit x ∼ y, y ∼ z, etwa x = g y, y = hz. Dann folgt x = ghz, also x ∼ z. Die Beschreibung der Äquivalenzklassen folgt unmittelbar aus der Definition. ∎ Beispiele 3.1.12. Betrachten wir die Bahnen in den vorigen Beispielen. (1) G = GLn (K) operiere auf X = K n in der üblichen Weise. Gegeben x, y ∈ K n mit x, y ≠ , dann gibt es immer eine Matrix A ∈ GLn (K) mit Ax = y. Für x =  gilt andererseits A =  für alle A ∈ GLn (K). Es gibt deshalb nur zwei Bahnen dieser Operation, nämlich GLn (K) ⋅ e = K n ∖ {} und

GLn (K) ⋅  = {}.

(2) Bei der Operation der Drehgruppe SO (R) auf R liegen zwei Vektoren x, y ∈ R genau dann in einer Bahn, wenn der eine durch eine Drehung um den Ursprung auf den anderen abgebildet werden kann. Das ist genau dann der Fall, wenn x und y gleich weit vom Ursprung entfernt sind, also wenn ∣∣x∣∣ = ∣∣y∣∣ gilt. Die Bahnen sind also konzentrische Kreise. Dieses Beispiel dürfte der Ursprung der Bezeichnung ’Bahn’ gewesen sein. Eine vollständige Liste aller Bahnen ist also SO ⋅ (a, ) = {x ∈ R ∣ ∣∣x∣∣ = a}, mit a ⩾ . Die Menge aller Bahnen (der Bahnenraum) steht also in Bijektion mit der Halbgeraden [, ∞). (3) Gegeben eine Matrix X ∈ Matn (K), dann heißt bekanntlich jede Matrix der Form AXA− mit A ∈ GLn (K) ähnlich zu X. Wie man in der linearen Algebra lernt, haben ähnliche Matrizen die gleichen Eigenwerte. Die Umkehrung stimmt allerdings nicht. Betrachten wir den Fall K = C. Jede Matrix besitzt eine Jordansche Normalform, und die ist eindeutig bis auf Reihenfolge der Jordan-Blöcke. Zwei Matrizen sind genau dann ähnlich, wenn sie die gleiche Jordansche Normalform haben. Übersetzt in die Gruppenoperation heißt das: Jede Bahn der Operation (A, X) ↦ AXA− von GLn (C) auf Matn (C) durch Konjugation enthält eine Jordan-Matrix. Umgekehrt liegen verschiedene Jordan-Matrizen in verschiedenen Bahnen (außer es sind nur die Blöcke vertauscht). Die Jordansche Normalform liefert also gerade eine Beschreibung aller Bahnen unter dieser Operation. (Für andere Körper als C stimmt das alles nur, wenn man voraussetzt, dass das charakteristische Polynom in Linearfaktoren zerfällt.) Betrachten wir dazu das Beispiel n = . Die möglichen Jordanschen Normalformen sind ⎛ a  ⎞ ⎜  b ⎟ , ⎜ ⎟ ⎝  c ⎠

⎛ a  ⎞ ⎜  a ⎟ , ⎜ ⎟ ⎝  b⎠

⎛a  ⎞ ⎜ a  ⎟ ⎜ ⎟ ⎝  a⎠

(für a, b, c ∈ C)

und jede dieser Matrizen entspricht genau einer Bahn, bis auf Vertauschung von Blöcken. (4) Unter der Operation einer Gruppe G auf sich selbst durch Linksmultiplikation gibt es nur eine einzige Bahn. Denn zu je zwei Elementen x, y ∈ G gibt es eindeutig g ∈ G mit y = gx (nämlich g = yx − ). Deshalb ist die ganze Menge G die einzige Bahn dieser Operation. Interessanter ist die Operation einer Untergruppe. Sei H eine Untergruppe von G und betrachte die Operation H×G → G { (h, g) ↦ hg

3.1. GRUNDLAGEN

65

von H auf G durch Linksmultiplikation. Die Bahnen dieser Operation sind die Mengen Hx = {hx ∣ h ∈ H} ⊂ G, x ∈ G, genannt die Linksnebenklassen von H in G. (5) Unabhängig von dem formalen Problem mit der Rechtsmultiplikation gibt es zu jeder Untergruppe H einer Gruppe G auch die Rechtsnebenklassen xH = {xh ∣ h ∈ H} von H in G. (6) Die Bahnen unter der Konjugation (g, x) ↦ gx g − heißen die Konjugationsklassen der Gruppe G. Zwei Gruppenelemente x, y ∈ G heißen konjugiert, wenn sie in derselben Konjugationsklasse liegen, wenn es also g ∈ G gibt mit y = gx g − . Die  bildet immer für sich allein eine Konjugationsklasse {}, denn es gilt gg − =  für alle g ∈ G, so dass die  zu keinem anderen Element konjugiert ist. Wenn die Gruppe G abelsch ist, dann gilt gx g − = g g − x = x für alle g, x ∈ G, so dass alle Konjugationsklassen einelementig sind. Wir untersuchen nun die Linksnebenklassen einer Untergruppe noch etwas weiter. Proposition 3.1.13. Sei G eine Gruppe und H eine Untergruppe. Dann gilt G = ⋃ Hx. x∈G

Die Linksnebenklassen sind paarweise disjunkt. Genauer gilt für x, y ∈ G: Hx ∩ Hy ≠ ∅



Hx = Hy



x y− ∈ H

Insbesondere gilt Hx = H genau dann, wenn x in H liegt. Beweis. Da die Linksnebenklassen Bahnen und damit nach Prop. 3.1.11 Äquivalenzklassen sind, ist klar, dass jedes Element von G in einer Linksnebenklasse liegt und dass verschiedene Linksnebenklassen disjunkt sind. Es bleibt also nur Hx = Hy ⇔ x y − ∈ H zu zeigen. Falls Hx = Hy für x, y ∈ G, dann gilt insbesondere x =  ⋅ x ∈ Hx ⊂ Hy. Es gibt also h ∈ H mit x = hy, woraus x y − = h ∈ H folgt. Sind umgekehrt x, y ∈ G mit x y− = h ∈ H und ist h′ x ∈ Hx, h ′ ∈ H, dann folgt h ′ x = h′ hy ∈ Hy, also Hx ⊂ Hy. Ist h ′′ y ∈ Hy, h ′′ ∈ H, dann folgt h ′′ y = h ′′ h − x ∈ Hx, also Hy ⊂ Hx. Damit ist alles bewiesen. ∎ Definition 3.1.14. Sei G eine Gruppe und H eine Untergruppe. Wir schreiben [G ∶ H] für die Anzahl der Linksnebenklassen von H in G. Falls H unendlich viele Linksnebenklassen hat, dann setzen wir [G ∶ H] = ∞. Die Zahl [G ∶ H] ∈ N ∪ {∞} heißt der Index von H in G. Proposition 3.1.15 (Satz von Lagrange). Sei G eine endliche Gruppe und H eine Untergruppe. Dann gilt ∣G∣ = ∣H∣ ⋅ [G ∶ H]. Inbesondere ist die Ordnung von H ein Teiler der Ordnung von G. Beweis. Für jedes x ∈ G ist die Abbildung Hx ↦ H, hx ↦ h eine Bijektion (mit Umkehrabbildung h ↦ hx). Deshalb haben alle Linksnebenklassen dieselbe Mächtigkeit ∣H∣. Andererseits ist

66

3. GRUPPEN

G nach Prop. 3.1.13 die disjunkte Vereinigung der Linksnebenklassen von H. Ist k = [G ∶ H], dann gibt es also x , . . . , x k ∈ G mit G = Hx ∪ ⋯ ∪ Hx k

und

Hx i ∩ Hx j = ∅ für i ≠ j.

Also hat G genau k ⋅ ∣H∣ Elemente.



Aus dem Satz von Lagrange folgt also zum Beispiel, dass eine Gruppe der Ordnung  nur Untergruppen der Ordnung , ,  und  haben kann. Das kann man häufig benutzen, um die Struktur einer Gruppe besser zu verstehen. Zum Beispiel folgt sofort, dass eine Gruppe von Primzahlordnung keine echten Untergruppen hat. Denn ist ∣G∣ = p prim, dann hat jede Untergruppe H entweder die Ordnung p, woraus H = G folgt, oder die Ordnung , was H = {} impliziert. Lemma 3.1.16. Die Abbildung Hx ↦ x − H ist eine Bijektion von der Menge der Linksnebenklassen auf die Menge der Rechtsnebenklassen von H in G. Beweis. Die Abbildung ist wohldefiniert. Denn sind x, y ∈ G mit Hx = Hy, dann bedeutet das x y − ∈ H. Daraus folgt y− H = x − x y − H = x − H. Entsprechend ist die Umkehrabbildung yH ↦ Hy− wohldefiniert. ∎ Wegen Lemma 3.1.16 hätten wir den Index [G ∶ H] also auch als die Anzahl der Rechtsnebenklassen definieren können und der Satz von Lagrange wäre genauso richtig. Das Lemma sagt allerdings nicht, dass Hx und x − H für jedes x ∈ G dieselbe Teilmenge von G sind.2 Sind G , . . . , G k Gruppen, dann ist wie üblich das kartesische Produkt G × ⋯ × G k = {(g , . . . , g k ) ∣ g i ∈ G i für i = , . . . , k} mit der komponentenweisen Verknüpfung ((g , . . . , g k )(h , . . . , h k )) ↦ (g h , . . . , g k h k ) wieder eine Gruppe. Diese Gruppe heißt das direkte Produkt von G , . . . , G k . Das direkte Produkt G × ⋯ × G k enthält die Gruppen G , . . . , G k in natürlicher Weise als Untergruppen, denn offensichtlich ist αi ∶ {

G i → G × ⋯ × G i × ⋯ × G k g ↦ (, . . . , g, . . . , )

für jedes i = , . . . , k ein Isomorphismus von G i auf das Bild von α i . Die Gruppe G × ⋯ × G k ist also in einfacher Weise aus bestimmten Untergruppen zusammengesetzt. Man kann sich fragen, wann man umgekehrt eine gegebene Gruppe in ein direktes Produkt von Untergruppen zerlegen kann. Eine erste Antwort gibt die folgende einfache Aussage. Proposition 3.1.17. Es sei G eine Gruppe und seien H , . . . , H k Untergruppen von G. Die folgenden Aussagen sind äquivalent: (1) Die Untergruppen H , . . . , H k kommutieren elementweise, das heißt es gilt h i h j = h j h i für alle h i ∈ H i , h j ∈ H j , i ≠ j, und jedes Element g ∈ G besitzt eine eindeutige Darstellung g = h ⋯h k , 2

mit h i ∈ H i .

manche meinen/ lechts und rinks/ kann man nicht velwechsern/ werch ein illtum“ (Ernst Jandl) ”

3.1. GRUNDLAGEN

67

(2) Die Abbildung φ∶ {

H × ⋯ × H k → G (h , . . . , h k ) ↦ h ⋯h k

ist ein Isomorphismus. Wenn diese äquivalenten Bedingungen erfüllt sind, sagt man verkürzend, die Gruppe G sei das direkte Produkt der Untergruppen H , . . . , H k und schreibt G = H × ⋯ × H k . Beweis. (2)⇒(1) ist klar, weil die angegebenen Eigenschaften offensichtlich in H × ⋯ × H k gelten und sich durch den Isomorphismus φ auf G übertragen. (1)⇒(2): Die Abbildung φ ist ein Homomorphismus, weil die Untergruppen H , . . . , H k elementweise kommutieren: φ((h , . . . , h k )(h′ , . . . , h ′k )) = φ(h h′ , . . . , h k h ′k ) = h h′ ⋯h k h ′k = h ⋯h k h′ ⋯h ′k = φ(h , . . . , h k )φ(h′ , . . . , h ′k ). Nach Voraussetzung ist φ surjektiv. Außerdem hat  ∈ G wegen  ∈ H i die Darstellung  = ⋯. Da diese eindeutig ist, ist (, . . . , ) das einzige Element in Kern(φ), so dass φ injektiv ist. ∎ Definition 3.1.18. Es sei G eine Gruppe und T ⊂ G eine Teilmenge. Die von T in G erzeugte Untergruppe ist der Durchschnitt aller Untergruppen von G, die T enthalten. Ist die von T erzeugte Untergruppe gleich G, dann sagt man, G werde von T erzeugt. Wie bei Idealen verwenden wir die Kurzschreibweise ⟨T⟩ für die von T erzeugte Untergruppe und schreiben ⟨g , . . . , g n ⟩ falls T = {g , . . . , g n } endlich ist. Proposition 3.1.19. Die von T ⊂ G erzeugte Untergruppe besteht aus der  und allen Produkten von Elementen aus T und ihren Inversen, also aus allen Elementen der Form gε ⋯g kε k mit k ∈ N , g , . . . , g k ∈ T und ε , . . . , ε k ∈ {, −}. Beweis. Sei H die von T erzeugte Untergruppe. Per Definition muss H alle Elemente der angegebenen Form gε ⋯g kε k enthalten. Andererseits bildet die Menge aller dieser Produkte (zusammen mit der , dem leeren Produkt) eine Untergruppe. ∎ Beispiele 3.1.20. (1) In der Kleinschen Vierergruppe G = {, a, b, c} gelten a  = b  = c  =  und ab = c, ac = b, bc = a. Deshalb wird G von je zwei Elementen G = ⟨a, b⟩ = ⟨a, c⟩ = ⟨b, c⟩ erzeugt. Dagegen erzeugt ein einzelnes Element immer nur eine Untergruppe, etwa ⟨a⟩ = {, a}. (2) Das Gaußsche Eliminationsverfahren der linearen Algebra liefert eine Menge von Erzeugern für die Gruppe GLn (K) über einem Körper K. Das wird im Weiteren keine Rolle spielen, wir wollen es aber als Beispiel für das Konzept der Erzeuger kurz ausführen. Jede invertierbare Matrix A ∈ GLn (K) kann durch elementare Zeilenumformungen auf obere Dreiecksgestalt gebracht werden kann, wobei die Diagonaleinträge alle gleich  sind, weil A vollen Rang hat. Die Zeilenumformungen entsprechen der Multiplikation mit bestimmten Matrizen von links (siehe dazu [Scharlau, LA, 2.6.11]). Von diesen Matrizen gibt es drei Typen, die Elementarmatrizen

68

3. GRUPPEN

genannt werden. Bezogen auf die ersten beiden Zeilen sind das zum Beispiel die Matrizen ⎞ ⎛ ⎟ ⎜λ  ⎟ ⎜ ⎟ ⎜ ⎟, ⎜  ⎟ ⎜ ⎜ ⋱ ⎟ ⎟ ⎜ ⎝ ⎠

⎞ ⎛λ ⎟ ⎜  ⎟ ⎜ ⎟ ⎜ ⎟, ⎜  ⎟ ⎜ ⎜ ⋱ ⎟ ⎟ ⎜ ⎝ ⎠

⎞ ⎛  ⎟ ⎜  ⎟ ⎜ ⎟ ⎜ ⎟, ⎜  ⎟ ⎜ ⎜ ⋱ ⎟ ⎟ ⎜ ⎝ ⎠

(λ ∈ K ∗ )

wobei die erste Matrix die erste Zeile multipliziert mit λ zur zweiten addiert, die zweite die erste Zeile mit λ multipliziert und die dritte die ersten beiden Zeilen vertauscht. Entsprechend geht das für andere Paare von Zeilen. Es gibt also Elementarmatrizen E , . . . , E k derart, dass E ⋯E k A eine obere Dreiecksmatrix mit Einsen auf der Diagonalen ist. Genauso kann man jetzt durch elementare Spaltenumformungen die Einträge oberhalb der Diagonalen loswerden. Das entspricht der Multiplikation mit Elementarmatrizen von rechts. Es gibt also weitere Elementarmatrizen F , . . . , Fl derart, dass schließlich E ⋯ E k AF ⋯Fl = I n die Einheitsmatrix ist. Es folgt A = E k− ⋯E− Fl− ⋯F− (und damit A− = F ⋯Fl E ⋯E k , was genau der üblichen Methode zur Berechnung des Inversen entspricht; vgl. [Scharlau, LA, 2.6.7]). Das Inverse einer Elementarmatrix ist eine Elementarmatrix (entsprechend der umgekehrten Zeilenbzw. Spaltenoperation). Der Satz über die Gaußsche Elimination (Zeilenstufenform) sagt also für invertierbare n × n-Matrizen gerade: Die Gruppe GLn (K) wird von Elementarmatrizen erzeugt.

3.2. Zyklische Gruppen Besonders einfach sind Gruppen, die von einem Element erzeugt werden. Solche Gruppen heißen zyklisch. Zum Beispiel ist Z mit der Addition eine zyklische Gruppe, erzeugt von  oder −, in additiver Schreibweise. In multiplikativer Schreibweise ist eine Gruppe G also zyklisch, wenn es ein Element g ∈ G gibt mit G = {g n ∣ n ∈ Z}. Jede zyklische Gruppe ist abelsch, denn es gilt g k g l = g k+l = g l g k für alle k, l. Wir können die zyklischen Gruppen leicht alle bestimmen. Es gibt zwei Fälle zu unterscheiden. (i) Alle Potenzen g k , k ∈ Z, sind verschieden. Das heißt gerade, dass die Abbildung {

Z → G k ↦ gk

ein Isomorphismus ist. In diesem Fall ist G also eine unendlich-zyklische Gruppe. (ii) Nicht alle Potenzen von g sind verschieden. Dann gibt es also l > k ∈ Z mit g l = g k und damit g l−k = . Es sei m ∈ N die kleinste natürliche Zahl mit g m = . Wir behaupten, dass G dann genau m Elemente enthält, nämlich G = {, g, g  , . . . , g m− }. Genauer gilt für r, s ∈ Z: gr = gs



r ≡ s (mod m).

3.2. ZYKLISCHE GRUPPEN

69

Denn falls r ≡ s (mod m), dann gibt es also k ∈ Z mit r = s + km und damit g r = g s+km = g s (g m )k = g s . Gilt umgekehrt g r = g s , dann teilen wir r − s durch m, also r − s = qm + t mit  ⩽ t < m. Es folgt  = g r−s = g qm+t = (g m )q g t = g t . Aufgrund der Minimalität von m folgt daraus t = , also r ≡ s (mod m). Insgesamt haben wir gezeigt, dass Z/m → G { n ↦ gn ein Isomorphismus ist. Die Gruppe G ist also zyklisch der Ordnung m. Um sie von der Gruppe Z/m in additiver Schreibweise zu unterscheiden, schreiben wir auch C m für eine zyklische Gruppe der Ordnung m mit multiplikativ geschriebener Verknüpfung.3 Proposition 3.2.1. Sei G = ⟨g⟩ eine endliche zyklische Gruppe der Ordnung n. Für k ∈ Z gilt G = ⟨g k ⟩ genau dann, wenn ggT(k, n) =  gilt. Beweis. Genau dann ist ⟨g k ⟩ = G, wenn g ∈ ⟨g k ⟩ gilt. Das ist genau dann der Fall, wenn es a ∈ Z gibt mit ak ≡  (mod n), also genau dann, wenn k und n teilerfremd sind. ∎ Ist G irgendeine Gruppe und g ∈ G ein Element, dann ist die von g erzeugte Untergruppe per Definition zyklisch. Die Ordnung dieser Untergruppe heißt die Ordnung von g. Die Ordnung ist also gerade die kleinste positive natürliche Zahl m mit g m = , oder ∞, falls keine solche Zahl existiert. Als Konsequenz aus dem Satz von Lagrange ergibt sich sofort: Proposition 3.2.2. Die Ordnung eines Elements einer endlichen Gruppe ist endlich und ein Teiler der Gruppenordnung. ∎ Korollar 3.2.3. Ist G eine endliche Gruppe der Ordnung n, dann gilt g n =  für alle g ∈ G. Beweis. Denn es gilt n = k ⋅ ord(g) für ein k ∈ N und damit g n = (g ord(g) )k = .



Proposition 3.2.4. Jede Gruppe, deren Ordnung eine Primzahl ist, ist zyklisch und wird von jedem Element ungleich  erzeugt. Beweis. Es sei p eine Primzahl und G eine Gruppe der Ordnung p. Sei g ∈ G ein Element, g ≠ , und sei H = {g n ∣ n ∈ Z} die von g erzeugte Untergruppe von G. Nach dem Satz von Lagrange ist die Ordnung ∣H∣ von H ein Teiler von p. Wegen g ∈ H gilt ∣H∣ >  und damit ∣H∣ = p. Es folgt G = H, so dass G zyklisch ist. ∎ Beispiel 3.2.5. Wir betrachten die Gruppe SO (R), deren Elemente die Drehmatrizen A(φ) = ( 3Bei

cos(φ) − sin(φ) ), φ ∈ R sin(φ) cos(φ)

den endlichen zyklischen Gruppen ist klar, woher der Begriff stammt, denn man kann sich die Elemente , g, . . . , g m− in einem geschlossenen Kreis angeordnet vorstellen, wie auf einer Uhr. Der Begriff unendlich” zyklische Gruppe“ erscheint aus dieser Perspektive eher wie ein Widerspruch in sich, ist aber so üblich.

70

3. GRUPPEN

sind. Die Periodizität ist so, dass A(φ) = id genau dann gilt, wenn φ = kπ für ein k ∈ Z. Fixiere φ ∈ [, π) und sei G die von A(φ) erzeugte Untergruppe von SO (R). Schreibe φ = απ mit α ∈ [, ). Falls α ∈ Q, etwa α = a/m mit a, m teilerfremd und m > a ⩾ , dann ist G zyklisch der Ordnung m, denn es gilt A(φ)n = A(nφ) und nφ = anπ/m ist genau dann ein Vielfaches von π, wenn m∣n gilt. Ist andererseits α ∉ Q, dann ist G unendlich zyklisch, da nφ aufgrund der Irrationalität von π niemals ein Vielfaches von π ist. (Man kann zeigen, dass G in diesem Fall dicht ist, dass also der topologische Abschluss von G gleich SO (R) ist.) Als nächstes bestimmen wir alle Untergruppen einer zyklischen Gruppe. Betrachten wir zunächst Z. Jede additive Untergruppe von Z ist ein Ideal in Z und damit von der Form nZ = {an ∣ a ∈ Z} für ein n ∈ Z (siehe Beispiel 2.4.1(4)). Unabhängig davon lässt sich die Aussage auch ganz genauso beweisen wie für Ideale (Prop. 2.4.8): Ist H ⊂ Z eine Untergruppe, H ≠ {}, dann wird H von der Zahl m = min{a ∈ H ∣ a > } erzeugt, wie man durch Teilen mit Rest sieht. Sei nun C m eine zyklische Gruppe der Ordnung m mit Erzeuger g. Ist l∣m ein Teiler, dann erzeugt g l eine Untergruppe der Ordnung k = l/k, nämlich H(l) = {, g l , g l , . . . , g (k−)l }. Ist umgekehrt H ⊂ C m eine Untergruppe, dann setze l = min{i ∈ N ∣ g i ∈ H}. Es gilt wieder g r ∈ H genau dann, wenn l∣r gilt. Wegen g m =  ∈ H folgt außerdem l∣m. Das zeigt H = H(l). Zusammengefasst haben wir folgendes bewiesen. Satz 3.2.6. Jede Untergruppe einer zyklischen Gruppe ist zyklisch. (i) Die Untergruppen der unendlich-zyklischen Gruppe Z sind von der Form nZ, n ∈ N . (ii) Die Untergruppen einer endlichen zyklischen Gruppe C m der Ordnung m sind zyklisch von einer Ordnung k mit k∣m. Genauer gibt es zu jedem l ∈ N mit m = kl genau eine Untergruppe der Ordnung k, erzeugt von allen l-ten Potenzen von Elementen in C m . ∎ Beispiel 3.2.7. Sei G ⊂ SO (R) eine zyklische Untergruppe erzeugt von einer Drehmatrix A(φ) wie oben. Dann ist jede Untergruppe von G wieder zyklisch. Man sogar eine stärkere Aussage beweisen. Obwohl SO (R) nicht endlich ist, ist jede endliche Untergruppe von SO (R) zyklisch. Denn ist G ⊂ SO (R) endlich der Ordnung n, dann gibt es Winkel α , . . . , α n ∈ (, ) ∩ Q mit G = {A() = id, A(α π), . . . , A(α n π)}. Ist α i = min{α , . . . α n }, dann kann man zeigen, dass G von φ(α i π) erzeugt wird (Übung!).

3.3. Symmetrische und alternierende Gruppen Es sei X eine Menge und sei Σ(X) = { f ∶ X → X ∣ f ist bijektiv}

3.3. SYMMETRISCHE UND ALTERNIERENDE GRUPPEN

71

die Menge aller Bijektionen von X auf sich. Dies ist eine Gruppe unter der Komposition ○, genannt die symmetrische Gruppe auf der Menge X. Die Eins in Σ(X) ist die Identität idX . Das Inverse einer Bijektion f ∶ X → X ist die Umkehrabbildung f − ∶ X → X. Die Gruppe Σ(X) kommt per Definition mit einer Operation Σ(X) × X → X gegeben durch ( f , x) ↦ f (x). (Man kann sich leicht überlegen, dass allgemein eine Operation einer Gruppe G auf einer Menge X gerade einem Gruppenhomomorphismus G → Σ(X) entspricht.) Besonders wichtig ist der Fall, dass die Menge X endlich ist. Wenn X aus n Elementen besteht, dann ist es für die Struktur der Gruppe Σ(X) egal, wie die Elemente der Menge X bezeichnet sind. Wir können also X = {, . . . , n} ⊂ N annehmen und schreiben in diesem Fall S n = Σ({, . . . , n}) für die symmetrische Gruppe auf n Symbolen. Ein Element σ ∈ S n ist bestimmt durch die Bilder (σ(), . . . , σ(n)). Das ist also eine Umordnung des geordneten Tupels (, , . . . , n), eine Permutation. Wir können jede Permutation σ übersichtlich in einer Matrix σ =(

   ⋯ n− n ) σ() σ() σ() ⋯ σ(n − ) σ(n)

darstellen. In S gilt also zum Beispiel                ( )○( )=( ).                Die Komposition wird dabei, wie bei Abbildungen üblich, von rechts von links gelesen. (Die Notation durch Matrizen ist rein formal, insbesondere hat die Verknüpfung ○ nichts mit dem Matrixprodukt zu tun, das für n >  auch gar nicht definiert ist.) Bemerkung 3.3.1. In S n bilden die Permutationen σ mit σ(n) = n eine Untergruppe. Es ist offensichtlich, dass diese Untergruppe zu S n− isomorph ist, denn jedes solches σ permutiert ja nur {, . . . , n − } und ist dadurch eindeutig bestimmt. Weil die Nummerierung natürlich keine Rolle spielt, sind allgemeiner die Untergruppen H i = {σ ∈ S n ∣ σ(i) = i} für i = , . . . , n alle zu S n− isomorph. Die Gruppe S n enthält also S n− , und damit induktiv auch S m für alle m < n, auf viele verschiedene Weisen als Untergruppe. Proposition 3.3.2. Die symmetrische Gruppe S n hat die Ordnung n!. Für n ⩾  ist sie nicht abelsch. Beweis. Ein Element σ ∈ S n ist eindeutig bestimmt durch die Bilder σ(), . . . , σ(n). Für σ() gibt es n Möglichkeiten. Weil σ bijektiv ist, bleiben für σ() dann noch n −  Möglichkeiten, für σ() noch n −  Möglichkeiten und so weiter. Das zeigt ∣S n ∣ = n!. Ist n = , dann gilt zum Beispiel (

                  )○( )=( )≠( )=( )○( ).                  

Also ist S nicht abelsch. Weil S in allen S n mit n ⩾  als Untergruppe vorkommt (siehe vorangehende Bemerkung), sind diese erst recht nicht abelsch. ∎

72

3. GRUPPEN

Neben der Matrix-Notation gibt es für Permutationen noch eine andere Notation, die häufig übersichtlicher ist, die Zykeldarstellung. Für fixiertes n und k ⩽ n schreiben wir σ = (a a ⋯a k ), wobei a , . . . , a k ∈ {, . . . , n} alle verschieden sind, für die Permutation σ ∈ S n mit σ(a ) = a , σ(a ) = a , . . . , σ(a k− ) = a k , σ(a k ) = a , und σ(i) = i für i ∉ {a , . . . , a k }. Jede solche Permutation heißt ein Zykel der Länge k oder kurz ein k-Zykel. Zum Beispiel gilt     (  ) = ( ).     Ein Zykel der Länge  ist einfach die Identität, also () = () = ⋯ = id. Zwei Zykel (a a ⋯a k ) und (b b ⋯b l ) der Länge k, l ⩾  entsprechen genau dann der gleichen Permutation, wenn sie gleich lang sind (k = l) und die Einträge zyklisch vertauscht sind. Es gilt also zum Beispiel (  ) = (  ). Das Inverse eines Zykels kann man natürlich leicht hinschreiben, denn man muss ja nur die Reihenfolge umkehren. Es gelten also zum Beispiel (a b c d)− = (d c b a)

und (a b)− = (b a) = (a b)

usw. Zwei Zykel heißen disjunkt, wenn kein Element von {, . . . , n} in beiden vorkommt. Proposition 3.3.3. Jede Permutation ist ein Produkt von paarweise disjunkten Zykeln. Beweis. Sei σ ∈ S n und fixiere x ∈ {, . . . , n}. Betrachte die Folge (σ r (x))r∈N = (x, σ(x), σ(σ(x)), . . . ) von Elementen in {, . . . , n}. Da es nur n verschiedene Elemente gibt, müssen irgendwann zwei Folgeglieder übereinstimmen. Es gibt also k, l ∈ N mit σ k (x) = σ l (x) mit etwa k > l. Es folgt σ k−l (x) = x. Setze m = min{k ∈ N ∣ σ k (x) = x}. Dann sind x, σ(x), . . . , σ m− (x) alle verschieden. Wir können deshalb σ = (xσ(x)⋯σ m− (x)) ○ τ schreiben, wobei τ ∈ S n eine Permutation ist, die die Elemente Y = {x, σ(x), . . . , σ m− (x)} ⊂ {, . . . , n} festlässt. Wenn τ die Identität ist, sind wir fertig. Ansonsten wiederholen wir das Argument für τ und x ∈ {, . . . , n} ∖ Y, so lange, bis die Menge {, . . . , n} ausgeschöpft ist. ∎ Beispiel 3.3.4. Es gilt (

      ) = (  )( ).      

(Dabei lassen wir das Verknüpfungszeichen ○ meistens weg.) In dieser Zerlegung kommt die  nicht vor, da die Permutation  fest lässt. Wir hätten rechts auch noch () dazu schreiben können, denn das ist ja per Definition die Identität.

3.3. SYMMETRISCHE UND ALTERNIERENDE GRUPPEN

73

In der Zerlegung einer Permutation in disjunkte Zykel ist die Reihenfolge beliebig, weil disjunkte Zykel offensichtlich kommutieren. Im übrigen ist die Zerlegung eindeutig. Wenn wir also σ ∈ S n in disjunkte Zykel zerlegen, dann kommen in dieser Zerlegung eine bestimmte Zahl von Zykeln verschiedener Länge vor, c Zykel der Länge , c Zykel der Länge  usw. Das Tupel (c , . . . , c n ) ∈ Nn− der Zykellängen nennen wir die Zykelstruktur von σ. Die Zykelstruktur hat dabei folgende Charakterisierung in der Gruppe S n . Proposition 3.3.5. In S n sind zwei Permutationen genau dann konjugiert, wenn beide dieselbe Zykelstruktur besitzen. Explizit bedeutet das: Zwei Permutation σ , σ ′ ∈ S n haben genau dann dieselbe Zykelstruktur, wenn es τ ∈ S n gibt mit σ ′ = τσ τ − . Beweis. Sei ζ = (a ⋯a k ) ein Zykel der Länge k und τ ∈ S n beliebig. Dann ist τζτ − = (τ(a )⋯τ(a k )) wieder ein Zykel der Länge k, wie man leicht nachprüft. Ist nun σ = ζ ⋯ζ k ein Produkt von disjunkten Zykeln ζ i und ist τ ∈ S n beliebig, dann gilt τσ τ − = (τζ τ − )(τζ τ − )⋯(τζ k τ − ). Dabei sind τζ τ − wieder disjunkte Zykel derselben Länge. Also haben σ und τσ τ − dieselbe Zykelstruktur. Sind umgekehrt ζ = (a ⋯a k ) und ζ ′ = (b ⋯b k ) Zykel derselben Länge, dann gilt ζ ′ = τζτ −

wobei

τ(a i ) = b i für i = , . . . , k.

Was τ auf Elementen tut, die weder in ζ noch in ζ ′ vorkommen, ist dabei egal. Sind also σ = ζ ⋯ζr und σ ′ = ζ′ ⋯ζr′ zwei Permutationen, wobei ζ i und ζ i′ für alle i = , . . . , r Zykel der gleichen Länge sind, dann finden wir insgesamt τ ∈ S n mit σ = τσ ′ τ − . ∎ Zykel der Länge  heißen Transpositionen. Sie vertauschen nur zwei Elemente und lassen alle anderen fest. Transpositionen sind selbstinvers, das heißt es gilt (a b)(a b) = id. Proposition 3.3.6. Die symmetrische Gruppe S n wird von den Transpositionen ( ), ( ), . . . , ( n) erzeugt. Beweis. Dafür genügt es nach Prop. 3.3.3, jeden Zykel als Produkt von solchen Tranpositionen zu schreiben. Zum Beispiel gilt (   ⋯ k) = ( k)⋯( )( ), wie man leicht nachprüft. Entsprechend ist der k-Zykel (a ⋯a k ) = (a a k )⋯(a a ) ein Produkt von Transpositionen. Man muss nur noch zeigen, dass jede Transposition ein Produkt von Transpositionen der Form ( a) ist. Das sieht man an der Gleichheit (a b) = ( a)( b)( a).



74

3. GRUPPEN

Diese Proposition sagt etwas sehr Handfestes, das man auch leicht mit farbigen Bauklötzchen ausprobieren könnte. Definition 3.3.7. Wir definieren das Signum sgn(σ) einer Permutation σ ∈ S n wie folgt: Ist σ ein k-Zykel, dann definieren wir sgn(σ) = (−)k+ . Ein Zykel ungerader Länge hat also das Signum + und Zykel gerader Länge das Signum −. Ist σ ein Produkt von disjunkten Zykeln σ = ζ ⋯ζr , dann setzen wir sgn(σ) = sgn(ζ )⋯sgn(ζr ). Mit anderen Worten, das Signum von σ ist , wenn σ eine gerade von Zahl von Zykeln gerader Länge enthält, sonst −. Wir nennen die Permutationen mit geradem bzw. ungeradem Signum kurz die geraden bzw. die ungeraden Permutationen. Proposition 3.3.8. Das Signum ist multiplikativ, das heißt für alle σ , τ ∈ S n gilt sgn(σ τ) = sgn(σ)sgn(τ). Beweis. Da wir jede Permutation nach Prop. 3.3.6 als Produkt von Transpositionen der Form ( i) schreiben können, genügt es, den Fall zu betrachten, dass σ eine solche Transposition ist, denn dann folgt die Behauptung durch Induktion nach der Anzahl der Transpositionen. Sei τ = ζ ⋯ζr eine Zerlegung von τ in disjunkte Zykel, wobei wir jedes Element i mit τ( j) = j in einen -Zykel ( j) = id schreiben, so dass alle Elemente von {, . . . , n} in der Zykel-Zerlegung vorkommen. Sei ferner σ = ( i). Es gibt zwei Fälle zu unterscheiden: (1) Die Elemente  und i kommen beide im gleichen Zykel ζ j vor. Dieser habe etwa die Form ζ j = ( a ⋯ a l− i a l+ ⋯ a m ). Dann folgt ( i)( a ⋯ a l− i a l+ ⋯ a m ) = (i a l+ ⋯ a m )( a ⋯ a l− ). Ist m gerade, dann sind die beiden Zykel rechts entweder beide gerade oder beide ungerade. Ist m ungerade, dann ist einer der beiden Zykel auf der rechten Seite gerade, der andere ungerade. In beiden Fällen ändert sich die Zahl der geraden Zykel genau um Eins. (2) Die Elemente  und i kommen in verschiedenen Zykeln vor, sagen wir in ζ j und ζ k . Diese haben dann etwa die Form ζ j = ( a ⋯ a l ) und ζ k = (a l+ ⋯ a m i). Es folgt ( i)(a l+ ⋯ a m i)( a ⋯ a l ) = ( a ⋯ a l i a l+ ⋯ a m ). Das ist genau der umgekehrte Fall zu (1) und das Signum ändert sich wieder.



Korollar 3.3.9. Die geraden Permutationen in S n bilden eine Untergruppe. Beweis. Denn die vorangehende Proposition sagt gerade, dass die Abbildung σ ↦ sgn(σ) ein Homomorphismus von S n in die multiplikative Gruppe {, −} ist. Per Definition bilden die geraden Permutationen genau den Kern dieses Homomomorphismus. ∎ Definition 3.3.10. Die Untergruppe aller geraden Permutationen in S n heißt die alternierende Gruppe und wird mit A n bezeichnet. Beispiel 3.3.11. Für n =  ist die Identität die einzige gerade Permutation in S = {id, ( )} und es gilt daher A = {id}. Für n =  gilt A = {id, (  ), (  )}.

3.3. SYMMETRISCHE UND ALTERNIERENDE GRUPPEN

75

Also ist A eine zyklische Gruppe der Ordnung . Proposition 3.3.12. Die alternierende Gruppe A n hat Index  in S n und damit die Ordnung n! . Beweis. Für jede ungerade Permutation τ ∈ S n sind A n und A n τ die einzigen beiden Linksnebenklassen von A n in S n . Denn ist σ ∈ S n irgendeine ungerade Permutation, dann ist σ τ − eine gerade Permutation und damit σ = σ τ − τ ∈ A n τ. Also gilt S n = A n ∪ A n τ und damit [S n ∶ A n ] = . Nach dem Satz von Lagrange folgt ∣A n ∣ = ∣S n ∣/ = n!/. ∎ Proposition 3.3.13. Die alternierende Gruppe A n , n ⩾ , wird von allen Dreizykeln (  ), (  ), . . . , (  n) erzeugt. Beweis. Jedes Element von A n ist ein Produkt von Transpositionen (Prop. 3.3.6). Weil das Signum multiplikativ ist, muss die Anzahl der Transpositionen dabei gerade sein. Die Gleichheiten (c d)(a b) = (c a d)(a b c)

und (a c)(a b) = (a b c)

zeigen deshalb bereits, dass A n von Dreizykeln erzeugt wird. Dass man mit den Dreizykeln der Form (  i) auskommt, sieht man an den Identitäten (a b c) = (  a)( b c)(  a)− ( b c) = (  b)(  c)(  b)− .



Beispiele 3.3.14. (1) Wir untersuchen im Detail die symmetrische Gruppe S . Sie hat die Ordnung ! =  ⋅  ⋅  = . Ihre Elemente sind S = {id, ( ), ( ), ( ), (  ), (  )}. Wie wir schon bemerkt haben, ist S nicht abelsch, denn es gilt ( )(  ) = ( ) ≠ ( ) = (  )( ). Jede echte Untergruppe H von S hat nach dem Satz von Lagrange die Ordnung  oder . Diese Untergruppen sind S {id, ( )}

{id, ( )}

{id, ( )}

A = {id, (  ), (  )}

{id} Es gibt also vier echte Untergruppen, drei der Ordnung  und eine der Ordnung . Folgende Überlegung zeigt, dass es keine weiteren Untergruppen gibt: Wir wissen schon nach Prop. 3.3.6, dass ( ) und ( ) zusammen die ganze Gruppe erzeugen. Sie sind also nicht beide in einer echten Untegruppe enthalten. Das entsprechende gilt für jede andere Wahl von zwei Transpositionen. Außerdem gilt ( )(  ) = ( ), so dass also auch ( ) und (  ) zusammen in keiner echten Untergruppe liegen können, entsprechend für andere Wahlen einer Transposition und eines Dreizykels.

76

3. GRUPPEN

(2) Die Gruppe A hat die Ordnung !/ =  und besteht aus den Elementen A = {id, ()(), ()(), ()(), (), (), (), (), (), (), (), ()} Es gibt in A keine Untergruppe der Ordnung  (Übung). Das zeigt, dass die Umkehrung des Satzes von Lagrange nicht gilt: Die Ordnung jeder Untergruppe teilt die Gruppenordnung. Aber nicht zu jedem Teiler der Gruppenordnung existiert eine Untergruppe dieser Ordnung. Zum Abschluss halten wir noch fest: Proposition 3.3.15 (Cayley). Jede endliche Gruppe ist isomorph zu einer Untergruppe einer endlichen symmetrischen Gruppe. Beweis. Sei G eine endliche Gruppe. Für jedes g ∈ G ist die Linksmultiplikation λ g ∶ G → G, x ↦ gx eine Bijektion. Wir bekommen also eine Abbildung ρ∶ {

G → Σ(G) . g ↦ λg

Dieses ρ ist ein Homomorphismus und außerdem injektiv, denn es gilt λ g () = g. Also ist G isomorph zur Untergruppe ρ(G) von Σ(G). Wenn G die Ordnung n hat, dann gibt es eine Bijektion G → {, . . . , n} und Σ(G) ist isomorph zu S n . ∎ Um alle endlichen Gruppen völlig zu verstehen, reicht es also, die symmetrischen Gruppen und ihre Untergruppen zu verstehen. Das klingt besser, als es ist. Praktisch ist nämlich der Nutzen dieser Tatsache begrenzt. Sie zeigt eher, dass S n eben eine sehr komplizierte Gruppe ist.

3.4. Diedergruppen Ein weiteres Beispiel für endliche Gruppen sind die Symmetriegruppen regelmäßiger Polygone, die Diedergruppen. Ein regelmäßiges n-Eck ist ein Polygon (also ein geschlossener Streckenzug) in der Ebene mit n gleichlangen Seiten und gleichen Winkeln. Die Ecken eines regelmäßiges n-Ecks liegen auf einem Kreis. Konkret kann man als Eckenmenge etwa die Punkte Vn = {(cos(kπ/n), sin(kπ/n)) ∣ k = , . . . , n − } auf dem Einheitskreis nehmen. (Ob man die Kanten und das Flächeninnere zur Menge mit dazu nimmt, ist für unsere Betrachtungen im Grunde egal und nur eine Frage der Anschauung.)

Regelmäßiges Fünf- und Sechseck mit Spiegelungsachsen

3.4. DIEDERGRUPPEN

77

Unter einer Symmetrie dieser Figur verstehen wir eine orthogonale Abbildung, die die Figur in sich abbildet. Die orthogonalen Abbildungen in der reellen Ebene sind Drehungen und Spiegelungen. Offenbar gibt es n Drehungen um den Ursprung (einschließlich der Identität), die das regelmäßige n-Eck in sich abbilden. Bei den Spiegelungen müssen wir dagegen unterscheiden, ob n gerade oder ungerade ist. Ist n ungerade, dann gibt es n Spiegelungsachsen durch je eine Ecke und den Ursprung. Ist n dagegen gerade, dann geht jede Spiegelungsachse durch zwei gegenüberliegende Ecken. Es gibt also nur n/ solche Achsen. Dafür gibt es auch noch die Spiegelungsachsen, die die Mittelpunkte gegenüberliegender Seiten verbinden. Das sind noch einmal n/ Spiegelungsachsen, so dass es insgesamt wieder n Spiegelungen gibt. Die Diedergruppe D n besteht aus all diesen Drehungen und Spiegelungen und hat die Ordnung n. Um die Struktur dieser Gruppe zu verstehen, sei a die kleinste Drehung, also um den Winkel π/n = ○ /n, und sei b eine Spiegelung an einer der Achsen. Die Elemente a und b erzeugen die Gruppe D n : Die Drehgruppe ist die von a erzeugte zyklische Untergruppe aller Drehungen R = {a, a  , . . . , a n− , a n = id}. Es gilt außerdem offensichtlich b = id. Etwas komplizierter ist es, sich die Gleichheit ba k = a −k b

(k = , . . . , n − )

zu überlegen. Sie sagt also geometrisch, dass eine Drehung gefolgt von einer Spiegelung das Gleiche ist, wie die Spiegelung gefolgt von der entgegengesetzten Drehung. Insbesondere ist D n für n ⩾  nicht abelsch, denn sonst müsste a k = a −k für alle k gelten, was nur für n ⩽  der Fall ist. Die Gleichung ba k = a −k b zeigt, dass D n aus den n Elementen D n = {id, a, . . . , a n− , b, ab, . . . , a n− b} besteht, also von a und b erzeugt wird. Denn ein Element der von a und b erzeugten Untergruppe ist ein Produkt der Elemente a, a − , b, b − . Aber a − = a n− , b− = b und wenn in einem Produkt irgendwo ba vorkommt, können wir es durch a n− b ersetzen. Außerdem ist es nicht schwer zu sehen, dass die angegebenen Elemente alle verschieden sind. Es sind nämlich {b, ab, . . . , a n− b} gerade die n verschiedenen Spiegelungen. Es gilt (ba k ) = ba k ba k = ba k a −k b = b  = id, was der Tatsache entspricht, dass eine Spiegelung selbstinvers ist. Die Spiegelungen bilden keine Untergruppe, da sie die Eins nicht enthalten. Außerdem ist das Produkt von zwei Spiegelungen a k ba l b = a k−l b  = a k−l eine Drehung. Die Spiegelungen sind also die Linksnebenklasse R ⋅ b der Drehgruppe R.

Bemerkung 3.4.1. Um zu beweisen, dass a und b die behaupteten Relationen erfüllen und D n erzeugen, kann man auch alles in Matrizen nachrechnen. Betrachte dazu die orthogonale Gruppe O (R) = {A ∈ Mat (R) ∣ AT A = I }.

78

3. GRUPPEN

Jede orthogonale  × -Matrix ist entweder eine Drehung cos(φ) − sin(φ) ) A(φ) = ( sin(φ) cos(φ) um den Winkel φ ∈ [, π) (gegen den Uhrzeigersinn) oder eine Spiegelung cos(φ) sin(φ) ) B(φ) = ( sin(φ) − cos(φ) an der Ursprungsgeraden mit Winkel φ. Die Diedergruppe D n besteht also aus den n Drehungen und n Spiegelungen A k = A(kπ/n),

und

B k = B(kπ/n), k = , . . . , n.

Setzen wir A = A und B = B n , dann kann man leicht nachrechnen, dass BAk = A−k B gilt, woraus alles Weitere folgt. Wir schauen uns die Diedergruppen für kleine n noch etwas genauer an. Beispiele 3.4.2. (1) (n = ) Das ist die Symmetriegruppe des regelmäßigen Dreiecks. Sie hat die sechs Elemente D = {id, a, a , b, ab, a b}. Weil die Operation von D auf dem regelmäßigen Dreieck jede Permutation der drei Ecken realisiert und umgekehrt jede solche Permutation eindeutig die zugehörige Drehung oder Spiegelung bestimmt, ist D tatsächlich isomorph zur symmetrischen Gruppe S . Ein Isomorphismus ist konkret durch a ↦ (  ), b ↦ () gegeben. (2) (n = ) Die Symmetriegruppe des regelmäßigen Rechtecks hat  Elemente, vier Drehungen und vier Spiegelungen. Wenn wir die Ecken im Uhrzeigersinn nummerieren, dann können wir die Operation von D auf dem Rechteck durch Permutationen beschreiben. 2

3

1

4 Die Drehung entspricht dem Vierzykel (   ), die Spiegelung an der horizontalen Achse ist ( ) und die Spiegelung an der ersten Diagonalen ( )( ). Also entspricht D der Untergruppe D ≅ {id, ( ), ( ), ( )( ), ( )( ), (   ), ( )( ), (   )} von S . Man muss einen Moment überlegen, wo hier die Drehungen sind und wo die Spiegelungen. Jedenfalls gibt es auch Elemente von S (nämlich  −  =  Stück), die nicht in dieser Untergruppe liegen, zum Beispiel die Transposition ( ). Man kann eben die Ecken  und  nicht durch Drehungen oder Spiegelungen bewegen und gleichzeitig die Ecken  und  fixieren.

3.5. NORMALTEILER UND FAKTORGRUPPEN

79

(3) (n ⩽ ) Es gibt auch die Gruppen D und D . Die D ist die Symmetriegruppe eines Ecks, also eines Intervalls. Allerdings soll man das Intervall immer noch als Figur in der Ebene verstehen, etwa mit den beiden Ecken (, ) und (−, ) und alle orthogonalen Abbildungen betrachten, die diese Figur in sich abbilden. Die Spiegelung an der senkrechten Achse, die (, ) und (−, ) vertauscht, ist nicht dieselbe Abbildung wie die -Grad-Drehung um den Ursprung, die die beiden Punkte ebenfalls vertauscht. Mit unserer üblichen Notation hat D deswegen weiterhin  Elemente, nämlich D = {id, a, b, ab} wobei a die Drehung ist und b die Spiegelung. Dann ist ab die Spiegelung an der waagerechten Achse, die die Punkte (, ) und (−, ) fixiert. Es haben also jeweils zwei der vier Elemente von D dieselbe Operation auf den Eckpunkten des Intervalls. Deshalb können wir D nicht als Untergruppe von S verstehen, während wir D n für n ⩾  als Untergruppe von S n schreiben können, wie wir gerade für n = ,  gesehen haben. Die Multiplikationstabelle von D ist ⋅ id a b ab id id a b ab a a id ab b . b b ab id a ab ab b a id Die Gruppe D ist isomorph zu C × C . Mit C = {, g} ist der Isomorphismus einfach durch ⎧ ⎪ C × C → D ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ (, ) ↦ id ⎪ ⎪ ⎪ ⎨ (g, ) ↦ a ⎪ ⎪ ⎪ ⎪ (, g) ↦ b ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎩ (g, g) ↦ ab gegeben. Das ist also gerade die Kleinsche Vierergruppe. Formal kann man sogar auch noch die Gruppe D bilden. Sie ist die Symmetriegruppe eines Einecks in der Ebene, also eines Punkts (nicht gerade der Ursprung). Ist der Punkt etwa (, ), dann ist die Spiegelung an der horizontalen Achsen die einzige orthogonale Abbildung, die den Punkt in sich abbildet. Deshalb ist D ≅ C eine zyklische Gruppe der Ordnung .

Bemerkung 3.4.3. Für die Indizierung bei den Diedergruppen gibt es zwei verschiedene Konventionen. Da die D n die Ordnung n hat, wird sie in manchen Büchern auch mit Dn bezeichnet, also nach der Anzahl der Elemente, nicht der Ecken, auf denen sie operiert. Es ist natürlich vollkommen egal, welcher Konvention man folgt, so lange im Zweifelsfall klar wird, was gemeint ist.

3.5. Normalteiler und Faktorgruppen Es sei φ∶ G → H ein Gruppenhomomorphismus. Der Kern Kern(φ) = {g ∈ G ∣ φ(g) = }

80

3. GRUPPEN

ist eine Untergruppe von G. Er hat aber noch eine zusätzlich Eigenschaft: Es gilt offenbar gx g − ∈ Kern(φ)

für alle g ∈ G und x ∈ Kern(φ).

Definition 3.5.1. Eine Untergruppe N einer Gruppe G heißt normal oder ein Normalteiler, wenn gx g − ∈ N für alle g ∈ G und alle x ∈ N gilt. In einer abelschen Gruppe sind alle Untergruppen normal. Immer normal in jeder Gruppe G sind die trivialen Untergruppen G und {}. Ist G eine Gruppe, dann schreibt man häufig abkürzend H ⩽ G um auszudrücken, dass H eine Untergruppe von G ist und N ⊲G für einen Normalteiler von G. Hier im Skript werden wir diese Abkürzungen aber nicht benutzen. Beispiele 3.5.2. (1) Die spezielle lineare Gruppe SLn (K) ist ein Normalteiler von GLn (K), denn sie ist der Kern des Homomorphismus GLn (K) → K ∗ , A ↦ det(A). (2) Die alternierende Gruppe A n ist ein Normalteiler von S n , denn sie ist der Kern des Homomorphismus S n → {±}, σ ↦ sgn(σ). (3) In der Diedergruppe D n sei a eine erzeugende Drehung und b eine Spiegelung. Dann ist die Drehgruppe ⟨a⟩ normal, denn es gilt ja ba k b − = ba k b = a −k für alle k ⩾ . (4) Ist G = G × ⋯ × G k ein direktes Produkt, dann sind die Untergruppen {} × ⋯ × G i × ⋯ × {} ≅ G i

(i = , . . . , k)

offenbar normal in G. Die Normalteiler spielen für Gruppen eine ähnliche Rolle wie die Ideale für Ringe. Lemma 3.5.3. Es sei G eine Gruppe und H eine Untergruppe. Genau dann ist H ein Normalteiler von G, wenn Hg = gH für alle g ∈ G gilt. Beweis. Sei H ein Normalteiler und seien h ∈ H und g ∈ G. Dann gilt ghg − ∈ H und damit gh = ghg − g ∈ Hg, also gH ⊂ Hg. Umgekehrt gilt auch g − hg ∈ H und damit hg = g g − hg ∈ gH, also Hg ⊂ gH. Also gilt Hg = gH. Sei umgekehrt diese Gleichheit gegeben und seien g ∈ G und x ∈ H. Dann gilt gx ∈ gH = Hg. Es gibt also h ∈ H mit gx = hg. Daraus folgt gx g − = hg g − = h ∈ H. Also ist H normal. ∎ Bei Normalteilern ist es also egal, ob man Links- oder Rechtsnebenklassen betrachtet und man kann einfach von Nebenklassen sprechen. Korollar 3.5.4. Jede Untergruppe vom Index  ist normal. Beweis. Denn [G ∶ H] =  impliziert gH = G ∖ H = Hg für alle g ∈ G ∖ H.



Daraus folgt zum Beispiel ein zweites Mal, dass die alternierende Gruppe in der symmetrischen Gruppe und die Drehgruppe in der Diedergruppe normal sind. Sind H und H zwei Untergruppen einer Gruppe G, dann kann man ihr Produkt H H = {h h ∣ h ∈ H , h ∈ H }

3.5. NORMALTEILER UND FAKTORGRUPPEN

81

bilden (auch Komplexprodukt genannt), also einfach die Menge aller paarweisen Produkte. Wegen  ∈ H und  ∈ H gilt H ∪H ⊂ H H . Im allgemeinen ist H H allerdings keine Untergruppe, es sei denn, eine der beiden Untergruppen ist normal. Lemma 3.5.5. Es sei G eine Gruppe, N ein Normalteiler und H eine Untergruppe von G. Dann gilt HN = N H und HN ist eine Untergruppe von G. Beweis. Nach dem vorigen Lemma gilt hN = N h für alle h ∈ H, was sofort HN = N H zeigt. Sind h, h ′ ∈ H und x, x ′ ∈ N, dann folgt außerdem N h− = h− N, es gibt also y ∈ N mit x ′ x − h − = h − y. Daraus folgt (h ′ x ′ )(hx)− = h′ x ′ x − h − = h ′ h − y ∈ HN. Also ist HN eine Untergruppe. ∎ Genau wie bei Ringen und Idealen kann man bei Gruppen und Normalteilern eine Gruppenstruktur auf der Menge der Nebenklassen einführen. Proposition 3.5.6. Es sei G eine Gruppe und N ein Normalteiler. Durch die Verknüpfung gN ⋅ hN = ghN wird die Menge G/N der Nebenklassen von N in G zu einer Gruppe mit neutralem Element N = N und Inversen (gN)− = g − N. Die Restklassenabbildung ρ∶ {

G → G/N g ↦ gN

ist ein surjektiver Homomorphismus. Die Gruppe G/N heißt die Faktorgruppe von G nach N. Beweis. Wir müssen die Wohldefiniertheit der Verknüpfung beweisen. Seien also g, g ′ , h, h ′ ∈ G mit gN = g ′ N und hN = h ′ N. Per Definition bedeutet das also g ′ g − ∈ N und h′ h − ∈ N. Wir müssen ghN = g ′ h′ N, also g ′ h′ (gh)− ∈ N beweisen. Dies folgt, weil N ein Normalteiler ist, aus g ′ h′ (gh)− = g ′ h ′ h− g − = g ′ g − g h ′ h− g − ∈ N . ± ± ∈N ∈N ´¹¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¸¹¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¶ ∈N

Die Assoziativität ist klar, ebenso N ⋅ gN = gN ⋅ N = gN sowie gN ⋅ g − N = g − N ⋅ gN = N. Also ist G/N eine Gruppe, wie behauptet. Außerdem ist ρ per Definition surjektiv und es gilt ρ(gh) = ghN = gN ⋅ hN = ρ(g)ρ(h).



Wieder hat man eine Korrespondenz zwischen Untergruppen, die N enthalten, und Untergruppen von G/N. Ist ρ∶ G → G/N die Restklassenabbildung und H eine Untergruppe von G, dann ist ρ(H) eine Untergruppe von G/N. Offenbar gilt ρ(H) = ρ(HN) wegen N = Kern(ρ). Deshalb schreiben wir HN/N für die Untergruppe ρ(H).

82

3. GRUPPEN

Proposition 3.5.7. Es sei G eine Gruppe und N ein Normalteiler von G. Dann ist H ↦ HN/N eine Bijektion zwischen der Menge der Untergruppen von G, die N enthalten, und der Menge der Untergruppen von G/N. Die Bijektion erhält Inklusionen, Durchschnitte und Normalität. Beweis. Sei H eine Untergruppe von G. Es gilt ρ− (ρ(H)) = HN. Falls N ⊂ H, dann HN = H ̃ eine Untergruppe von G/N, dann ist ρ− (H) ̃ eine und damit ρ − (ρ(H)) = H. Ist umgekehrt H ̃ Außerdem gilt ρ(ρ− (H)) ̃ = Untergruppe von G. Sie enthält N wegen N = ρ− ({N}) und N ∈ H. ̃ weil ρ surjektiv ist. Die zusätzlichen Aussagen prüft man leicht nach. H, ∎ Satz 3.5.8 (Homomorphiesatz). Es sei φ∶ G → H ein Homomorphismus und N ein Normalteiler von G mit N ⊂ Kern(φ). Dann gibt es einen eindeutig bestimmten Homomorphismus φ∶ G/N → H mit φ(gN) = φ(g) für alle g ∈ G. Genau dann ist φ injektiv, wenn Kern(φ) = N gilt. Das können wir wieder durch ein kommutierendes Diagramm ausdrücken. G ρ

φ

H

φ

G/N Beweis. Der Beweis geht völlig analog zum Homomorphiesatz für Ringe (Satz 2.6.12). Die Abbildung φ ist durch die Eigenschaft φ(gN) = φ(g) für alle g ∈ G bereits eindeutig festgelegt, sofern sie existiert. Wir müssen die Wohldefiniertheit zeigen. Seien also g, g ′ ∈ G mit gN = g ′ N, also mit g ′ g − ∈ N. Dann folgt φ(g ′ ) = φ(g ′ g − g) = φ(g ′ g − )φ(g) = φ(g) wegen N ⊂ Kern(φ). Es ist klar, dass φ ein Homomorphismus ist. Außerdem ist φ genau dann injektiv, wenn Kern(φ) = {N} gilt, was offenbar zu Kern(φ) = N äquivalent ist. ∎ Korollar 3.5.9 (Isomorphiesatz). Es sei φ∶ G → H ein Homomorphismus. Dann induziert φ einen Isomorphismus ∼ G/ Kern(φ) Ð → Bild(φ). Beweis. Das folgt unmittelbar aus dem Homomorphiesatz mit N = Kern(φ).



Korollar 3.5.10. Es sei G eine Gruppe und seien H und N zwei Normalteiler von G mit N ⊂ H. Dann gilt (G/N)/(H/N) ≅ G/H. Beweis. Übung.



Korollar 3.5.11 (Parallelogrammregel). Es sei G eine Gruppe, H eine Untergruppe und N ein Normalteiler von G. Dann ist H ∩ N ein Normalteiler von H und es gibt einen Isomorphismus H/(H ∩ N) ≅ HN/N . Die Parallelogrammregel hat ihren Namen daher, dass die beteiligten Untergruppen im Inklusionsdiagramm eine Raute oder ein Parallelogramm bilden.

3.5. NORMALTEILER UND FAKTORGRUPPEN

83

HN H

N H∩N

Beweis. Dass H ∩ N ein Normalteiler in H ist, folgt sofort aus der Definition. Sei ρ∶ G → G/N die Restklassenabbildung. Dann gilt ρ(H) = HN/N und der Kern der Einschränkung ρ∣H ist H ∩ N. Also folgt die Behauptung aus dem Isomorphiesatz. ∎ Proposition 3.5.12. Es seien G und G zwei Gruppen. Die Untergruppen G × {} = {(g , ) ∣ g ∈ G } und

{} × G = {(, g ) ∣ g ∈ G }

von G × G sind normal und es gelten (G × G )/({} × G ) ≅ G

und (G × G )/(G × {}) ≅ G .

Beweis. Sei π∶ G × G , (g , g ) ↦ g die Projektion auf den ersten Faktor. Die Abbildung π ist offensichtlich ein surjektiver Gruppenhomomorphismus und ihr Kern ist {} × G . Damit folgt die Behauptung aus dem Isomorphiesatz. ∎ Die Behauptung gilt entsprechend für mehr als zwei Faktoren. Proposition 3.5.13. Es sei G eine Gruppe und seien H und H zwei Untergruppen. Genau dann ist G das direkte Produkt von H und H , wenn die folgenden Bedingungen erfüllt sind: (1) H und H sind normal in G; (2) G = H H ; (3) H ∩ H = {}. Beweis. Falls G ≅ H ×H , dann sind (1)–(3) offenbar erfüllt. Für die Umkehrung müssen wir nach Prop. 3.1.17 zeigen, dass jedes Element von G eine eindeutige Darstellung g = h h mit h ∈ H , h ∈ H hat. Die Existenz ist klar nach (2). Falls h h = h′ h′ , so folgt h− h′ = h h′− ∈ H ∩ H , also h = h′ und h = h′ nach (3). Außerdem müssen wir zeigen, dass H und H elementweise kommutieren. Seien also h ∈ H und h ∈ H . Dann gilt h h h− h− ∈ H ∩ H wegen (1) und damit h h h− h− = , also h h = h h . ∎ Das verallgemeinert sich per Induktion auf mehr als zwei Faktoren. Proposition 3.5.14. Es sei G eine Gruppe und seien H , . . . , H k ⊂ G Untergruppen. Genau dann ist G das direkte Produkt von H , . . . , H k , wenn die folgenden Bedingungen erfüllt sind. (1) H , . . . , H k sind normal in G; (2) G = H ⋯H k ; (3) (H ⋯H i− ) ∩ H i = {} für alle i = , . . . , k; Beweis. Der Fall k =  ist Prop. 3.5.13. Sei also k ⩾  und setze G ′ = H ⋯H k− . Das ist eine Untergruppe von G, weil H , . . . , H k− normal sind. Die Voraussetzungen (1)–(3) übertragen sich auf die Untergruppen H , . . . , H k− von G ′ . Also ist G ′ das direkte Produkt von H , . . . , H k− nach

84

3. GRUPPEN

Induktionsvoraussetzung. Nun erfüllen G ′ und H k die Voraussetzungen von Prop. 3.5.13, so dass G das direkte Produkt von G ′ und H k ist. ∎ Zum Ende dieses Abschnitts diskutieren wir noch das Konzept einer einfachen Gruppe. Definition 3.5.15. Eine Gruppe G heißt einfach, wenn G ≠ {} gilt und G keine nicht-trivialen Normalteiler besitzt, also wenn {} und G die einzigen Normalteiler von G sind. Beispiele 3.5.16. (1) Eine abelsche Gruppe ist genau dann einfach, wenn sie endlich von Primzahlordnung ist. Denn da alle Untergruppen normal sind, ist eine abelsche Gruppe genau dann einfach, wenn sie überhaupt keine nicht-triviale Untergruppe besitzt. Sie muss dann zyklisch sein (denn sonst hätte sie ja zyklische Untergruppen) und zusätzlich endlich von Primzahlordnung, nach Satz 3.2.6. (2) Die symmetrische Gruppe S n für n ⩾  ist nicht einfach, denn A n ist ein nicht-trivialer Normalteiler. Ebenso ist die Diedergruppe D n nicht einfach, denn die Drehgruppe ist ein nichttrivialer Normalteiler. (3) Sei K ein Körper. Die Gruppe GLn (K) ist in aller Regel nicht einfach, denn SLn (K) ist ein nicht-trivialer Normalteiler. Die Untergruppe SLn (K), n ⩾ , ist aber schon beinahe einfach: Ihr Zentrum Z n = {ζI n ∣ ζ ∈ K, ζ n = } ist ein nicht-trivialer Normalteiler, wenn es in K nichttriviale n-te Einheitswurzeln gibt. Die Faktorgruppe PSLn (K) = SLn (K)/Z n ist dann schließlich einfach, außer wenn n =  ist und ∣K∣ = , . (Diese Gruppe hat eine Bedeutung in der projektiven Geometrie und wird projektive spezielle lineare Gruppe genannt.) Insbesondere ist SLn (R) für ungerades n >  eine einfache Gruppe. Das alles werden wir hier nicht beweisen. Wichtig für die Galois-Theorie wird später die Einfachheit der alternierenden Gruppe sein. Satz 3.5.17. Die alternierende Gruppe A n ist einfach für n ⩾ . Beweis. Es sei N ein Normalteiler von A n , N ≠ {id}. Dann müssen wir N = A n zeigen. Nach Prop. 3.3.13 reicht es dafür zu zeigen, dass N alle Dreizykel der Form (i), i ∈ {, . . . , n} enthält4. Zunächst zeigen wir, dass N überhaupt einen Dreizykel enthält. Wir sagen, eine Permutation σ ∈ S n bewegt ein Symbol i ∈ {, . . . , n}, wenn σ(i) ≠ i gilt, sonst fixiert sie das Symbol. Sei nun σ ∈ N, σ ≠ id. Keine Permutation bewegt nur ein Symbol. Ebenso kann σ nicht bloß zwei Symbole bewegen, denn sonst wäre es eine Transposition und damit ungerade. Wenn σ genau drei Symbole bewegt, haben wir einen Dreizykel gefunden. Andernfalls bewegt σ also mindestens vier Symbole. Dann unterscheiden wir zwei Fälle: (i) σ enthält einen Zykel der Länge mindestens , ohne Einschränkung σ = (  ⋯)⋯. Weil σ kein Vierzykel sein kann (denn der wäre ungerade), muss σ dann sogar mindestens fünf Symbole bewegen, ohne Einschränkung etwa , , , , . (ii) σ ist ein Produkt von disjunkten Transpositionen und damit ohne Einschränkung von der Form σ = ()()⋯. Setze τ = () und betrachte σ ′ = τσ τ − ∈ N. Die Zykelzerlegung von σ ′ sieht dann in den beiden Fällen jeweils wie folgt aus: 4Die Lehrbuch-Beweise basieren fast alle auf dieser Strategie, aber es gibt verschiedene Methoden, die gewünschten

Dreizykel zu produzieren. Wir folgen hier dem Buch von Cohn [Co].

3.5. NORMALTEILER UND FAKTORGRUPPEN

85

(i) σ ′ = (  )(  ⋯)(  )⋯ = (   ⋯)⋯ oder (ii) σ ′ = (  )( )( )(  )⋯ = ( )( )⋯. In beiden Fällen gilt σ ′ ≠ σ und deshalb ρ = σ ′ σ − ∈ N, ρ ≠ id. Wir behaupten, dass ρ weniger Symbole bewegt als σ. Denn ρ hat die Gestalt (i) ρ = (  ⋯)⋯(  ⋯)⋯ und fixiert damit  und jedes Symbol, das von σ fixiert wird. (ii) ρ = ( )( )⋯( )( )⋯ und fixiert jedes Symbol, das von σ fixiert wird, außer , und dafür zusätzlich  und . Wir haben also ein Element in N gefunden, das nicht die Identität ist und weniger Symbole bewegt als σ. Dieses Argument kann man wiederholen, so lange σ kein Dreizykel ist. Es muss also einen Dreizykel in N geben, ohne Einschränkung etwa (  ) und damit auch (  ) = (  )− ∈ N. Für jedes i >  gilt dann5 ( )( i)(  )(( )( i))− = ( )( i)(  )( )( i) = (  i) ∈ N . ∎

Damit ist der Satz bewiesen.

Beispiel 3.5.18. Die Gruppe A ist zyklisch der Ordnung  und damit ebenfalls einfach. Aber A ist tatsächlich nicht einfach: Die Untergruppe V = {id, ()(), ()(), ()()} ist ein echter Normalteiler in A , isomorph zur Kleinschen Vierergruppe (siehe Übungen). Bemerkung 3.5.19. Die einfachen Gruppen sind so etwas wie die Bausteine der Gruppentheorie. Denn ist N ⊂ G ein nicht-trivialer Normalteiler, dann kann man versuchen, die Gruppe G mithilfe der beiden Gruppen N und G/N zu beschreiben. (Ist G endlich, dann haben zum Beispiel beide kleinere Ordnung als G.) Vieles in der Gruppentheorie und ihren Anwendungen lässt sich in dieser Weise auf den Fall einfacher Gruppen reduzieren. Aus diesem Grund hat man sich etwa ab Mitte des zwanzigsten Jahrhunderts ernsthaft daran gemacht, die endlichen einfachen Gruppen alle zu bestimmen. Diese Klassifikation wurde zu Beginn der 1980er Jahre im Wesentlichen abgeschlossen. Das Resultat ist eine vollständige Liste aller endlichen einfachen Gruppen: (1) Zyklische Gruppen von Primzahlordnung. (2) Alternierende Gruppen A n für n ⩾ . (3) Endliche Gruppen vom Lie-Typ. Das sind verschiedene Typen von Matrix-Gruppen über endlichen Körpern (wie die oben genannte PSLn ), die in insgesamt  unendlichen Familien daher kommen. (4) Sporadische Gruppen. Dies sind genau 26 einzelne Ausnahmegruppen, nicht ganze Familien, wie in den vorangehenden Fällen. Die meisten dieser Gruppen sind ziemlich kompliziert. Die kleinste, die Mathieu-Gruppe M , hat die Ordnung 7920. Die größte wird Monster-Gruppe genannt und hat die Ordnung . N ein Normalteiler ist, enthält N alle zu (  ) konjugierten Elemente. In S n wissen wir schon, dass das alle Dreizykel sind (Prop. 3.3.5). Wir brauchen hier aber die gleiche Tatsache in A n . 5Weil

86

3. GRUPPEN

3.6. Operationen Wir gehen in diesem Abschnitt noch einmal weiter auf Gruppenoperationen ein. Es sei im folgenden immer G eine Gruppe, die auf einer Menge X operiert. Zu jedem x ∈ X können wir die Bahn Gx = {gx ∣ g ∈ G} betrachten (Prop. 3.1.11). Zu x ∈ X gehört außerdem auch die Menge G x = {g ∈ G ∣ gx = x} aller Elemente von G, die x fixieren. Die Menge G x ist eine Untergruppe von G (denn aus g, h ∈ G mit gx = hx = x folgt g − x = g − gx = x und (gh)x = x), genannt der Stabilisator von x in G. Beispiele 3.6.1. (1) Für die Operation von G = S n auf X = {, . . . , n} besteht der Stabilisator G n von n ∈ X aus allen Permutationen σ ∈ S n mit σ(n) = n. Wie wir schon bemerkt haben, ist G n in natürlicher Weise zu S n− isomorph. (2) Operiert die Gruppe G auf sich selbst durch Linksmultiplikation G×G ↦ G, (g, x) ↦ gx, dann ist der Stabilisator jedes Punkts x ∈ G gleich {}. (3) Operiert die Gruppe G auf sich selbst durch Konjugation G × G → G, (g, x) ↦ gx g − , dann besteht der Stabilisator von x ∈ G gerade aus allen Elementen g ∈ G mit gx g − = x, was zu gx = x g äquivalent ist. Das sind also gerade die Elemente von G, die mit x kommutieren. Proposition 3.6.2. Die Mächtigkeit der Bahn Gx von x ist gleich dem Index [G ∶ G x ] des Stabilisators, für jedes x ∈ X. Es gilt also ∣G∣ = ∣Gx∣ ⋅ ∣G x ∣. Beweis. Es sei G//G x die Menge der Rechtsnebenklassen von G x in G. Betrachte die Abbildung φ∶ G//G x → Gx, gG x ↦ gx. Das ist wohldefiniert, weil ghx = gx für alle h ∈ G x gilt, und per Definition surjektiv. Außerdem ist φ auch injektiv: Denn aus gx = g ′ x folgt g − g ′ x = x, also g − g ′ ∈ G x und damit gG x = g ′ G x . Weil [G ∶ G x ] die Anzahl der (Links- oder Rechts-)Nebenklassen von G x in G ist, ist die Behauptung bewiesen. Der Zusatz gilt nach dem Satz von Lagrange. ∎ Aufbauend darauf kann man auch die Anzahl der Bahnen einer Operation bestimmen. Diese Aussage wird in den Übungen bewiesen. Proposition 3.6.3. Es sei G eine endliche Gruppe, die auf einer endlichen Menge X operiert. Für jedes g ∈ G sei c g die Anzahl der Punkte in X, die von g fixiert werden, also die Mächtigkeit der Menge {x ∈ X ∣ gx = x}. Dann ist die Anzahl der Bahnen von G in X gegeben durch  ∑ cg . ∣G∣ g∈G



In Worten: Die Anzahl der Bahnen ist die durchschnittliche Zahl von fixierten Punkten. Eine Operation mit nur einer einzigen Bahn heißt transitiv. Zum Beispiel ist die Operation von S n auf {, . . . , n} transitiv. Allgemein ist der Bahnenraum die Menge X/G = {Gx ∣ x ∈ X} aller Bahnen von G, dessen Mächtigkeit durch Prop. 3.6.3 gegeben ist. Außerdem schreiben wir X G = {x ∈ X ∣ Gx = {x}}

3.6. OPERATIONEN

87

für die Menge aller Fixpunkte von G in x. Das sind also Punkte von X, die von jedem Gruppenelement fixiert werden. Korollar 3.6.4 (Bahnengleichung). Sei G eine Gruppe, die auf einer endlichen Menge X operiert. Sei n = ∣X/G∣ die Zahl der Bahnen und seien x , . . . , x n ∈ X mit X/G = {Gx , . . . , Gx n }. Dann gilt n

∣X∣ = ∑[G ∶ G x i ]. i=

Beweis. Die Menge X ist die disjunkte Vereinigung der Bahnen Gx , . . . , Gx n und es gilt ∣Gx i ∣ = [G ∶ G x i ] nach der vorangehenden Proposition. ∎ Besonders nützlich ist die Bahnengleichung im folgenden Fall. Definition 3.6.5. Es sei p eine Primzahl. Eine endliche Gruppe G heißt eine p-Gruppe, wenn ∣G∣ = pn für ein n ∈ N gilt. Lemma 3.6.6. Es sei G eine p-Gruppe, die auf einer endlichen Menge X operiert. Dann gilt ∣X G ∣ ≡ ∣X∣ (mod p). Beweis. Die Ordnung einer Bahn Gx ist [G ∶ G x ] und damit ein Teiler von ∣G∣, also eine Potenz von p. Sie ist also entweder , dann ist x ein Fixpunkt, oder durch p teilbar. Damit folgt die Behauptung aus der Bahnengleichung. ∎ Satz 3.6.7 (Cauchy). Es sei G eine endliche Gruppe und p ein Primteiler von ∣G∣. Dann gibt es in G ein Element der Ordnung p. Beweis. Der Beweis verwendet das vorangehende Lemma. Setze X = {(g , . . . , g p ) ∈ G p ∣ g ⋯g p = }. Die Menge X hat die Mächtigkeit ∣X∣ = ∣G∣ p− . Denn sind g , . . . , g p− ∈ G beliebig, dann gibt es genau ein g p ∈ G mit (g , . . . , g p ) ∈ X, nämlich g p = (g ⋯g p− )− . Also ist X in Bijektion zu G p− . Nun operiert die zyklische Gruppe C p der Ordnung p auf X durch zyklische Vertauschung, das heißt ein Erzeuger a ∈ C p operiert durch a ⋅ (g , . . . , g p ) = (g p , g , . . . , g p− ). Ein Fixpunkt dieser Operation muss dann lauter gleiche Einträge haben, hat also die Form (g, . . . , g) für ein g ∈ G mit g p = . Ein solcher Fixpunkt ist (, . . . , ). Jeder weitere Fixpunkt kommt von einem Element der Ordnung p. Nach Lemma 3.6.6 gilt nun ∣X C p ∣ ≡ ∣G p− ∣ ≡  (mod p). Also ist ∣X C p ∣ durch p teilbar. Wegen (, . . . , ) ∈ X C p gibt es also also mindestens p Fixpunkte.



Korollar 3.6.8. Sei p eine Primzahl. Eine endliche Gruppe G ≠ {} ist genau dann eine p-Gruppe, wenn die Ordnung jedes Elements von G eine Potenz von p ist. ∎ Als Anwendung des Satzes von Cauchy bestimmen wir alle Gruppen der Ordnung p. Satz 3.6.9. Sei p eine Primzahl und G eine Gruppe der Ordnung p. Entweder ist G zyklisch oder isomorph zur Diedergruppe D p .

88

3. GRUPPEN

Beweis. Für p =  wissen wir das schon aus den Übungen: Jede Gruppe der Ordnung  ist zyklisch oder die Kleinsche Vierergruppe D . Sei also p ⩾ . Nach dem Satz von Cauchy gibt es in G ein Element a der Ordnung p und ein Element b der Ordnung . Setze H = ⟨a⟩ und K = ⟨b⟩. Die Untergruppe H hat Index  und ist damit normal nach Kor. 3.5.4. Es gibt also j ∈ Z mit bab = a j , wobei wir b = b − wegen b  =  benutzt haben. Weil p ungerade ist, gilt außerdem H ∩ K = {} und damit G = {, a, . . . , a p− , b, ba, . . . , ba p− } = ⟨a, b⟩. Nun gilt a j = (bab) j = ba j b = b(bab)b = a. 

Es gilt also a j − =  und damit p∣( j − ). Weil p prim ist, folgt p∣( j − ) oder p∣( j + ). Wir unterscheiden diese beiden Fälle: (1) p∣( j − ). In diesem Fall gilt bab = a j = a, also ab = ba. Damit ist G abelsch und ab hat die Ordnung p (denn es gilt (ab) p = a p b = b ≠ , wegen  ∤ p). Also ist G zyklisch. (2) p∣( j + ). Dann gilt bab = a j = a − und damit ist G isomorph zu D p . ∎ 

Das Zentrum einer Gruppe kam schon in den Übungsaufgaben vor. Definition 3.6.10. Sei G eine Gruppe. Die Teilmenge Z(G) = {g ∈ G ∣ ∀h ∈ G∶ gh = hg} heißt das Zentrum von G. Das Zentrum ist eine normale Untergruppe von G (siehe Übungen). Die abelschen Gruppen sind per Definition genau die Gruppen G mit Z(G) = G. Am anderen Ende stehen Gruppen, deren Zentrum trivial oder sehr klein ist. Beispiele 3.6.11. (1) Aus der linearen Algebra ist bekannt, dass das Zentrum von GLn (K) über einem Körper K für n ⩾  nur aus den Diagonalmatrizen mit gleichen Einträgen besteht. (2) In den Übungen wurde Z(S n ) = {id} für n ⩾  gezeigt. Da das Zentrum ein Normalteiler ist, hat jede einfache nicht-abelsche Gruppe triviales Zentrum. Die Umkehrung stimmt natürlich nicht, da es außer dem Zentrum ja andere Normalteiler geben kann, wie zum Beispiel A n in S n . Wir untersuchen das Zentrum mithilfe von Gruppenoperationen. Dazu betrachten wir die Konjugation {

G×G → G (g, x) ↦ gx g −

als Operation von G auf sich selbst. Die Bahnen sind die Konjugationsklassen. Eine Konjugationsklasse C von G hat also die Form C = {gx g − ∣ g ∈ G} für ein x ∈ G. Aus der Bahnengleichung wird daher für endliche Gruppen die Klassengleichung ∣G∣ = ∣C ∣ + ⋯ + ∣Cr ∣

3.7. ENDLICH ERZEUGTE ABELSCHE GRUPPEN

89

wobei C , . . . , Cr sämtliche Konjugationsklassen von G sind. Die Ordnung ∣C i ∣ jeder Konjugationsklasse ist dabei ein Teiler von ∣G∣, nach Prop. 3.6.2. Außerdem bedeutet gx g − = x ja gerade gx = x g. Das Zentrum von G ist deshalb die Menge aller Fixpunkte und damit die Vereinigung aller einelementigen Konjugationsklassen. Man kann die Klassengleichung also auch als ∣G∣ = ∣Z(G)∣ + ∣C ∣ + ⋯ + ∣Cs ∣ schreiben, wobei C , . . . , Cs alle Konjugationsklassen von G mit ∣C i ∣ >  sind. Im Fall einer pGruppe können wir hier Lemma 3.6.6 anwenden und erhalten: Proposition 3.6.12. Es sei G eine endliche p-Gruppe. Dann gilt Z(G) ≠ {}. Beweis. Denn wegen  ∈ Z(G) gilt ∣Z(G)∣ >  und ∣Z(G)∣ ≡ ∣G∣ (mod p), also ∣Z(G)∣ ⩾ p.



Wir bekommen noch eine schöne Folgerung: Satz 3.6.13. Sei p eine Primzahl. Jede Gruppe der Ordnung p ist abelsch. Beweis. Sei G eine Gruppe mit ∣G∣ = p . Die Ordnung des Zentrums von G ist nach Lagrange , p oder p . Nach Prop. 3.6.12 gilt aber Z(G) ≠ {}, also ∣Z(G)∣ ≠ . Falls ∣Z(G)∣ = p, dann betrachte die Faktorgruppe G/Z(G). Sie hat die Ordnung p und ist deshalb zyklisch. Nach dem nachfolgenden Lemma muss G dann abelsch sein und es folgt ∣Z(G)∣ = p , ein Widerspruch. Also ist nur ∣Z(G)∣ = p möglich und damit G abelsch. ∎ Der Beweis hat das folgende Lemma benutzt, das in den Übungen bewiesen wurde. Lemma 3.6.14. Sei G eine Gruppe. Falls G/Z(G) zyklisch ist, dann ist G abelsch.



3.7. Endlich erzeugte abelsche Gruppen In diesem Abschnitt bestimmen wir die Struktur endlich erzeugter abelscher Gruppen. Ist A eine abelsche Gruppe mit Erzeugern a , . . . , a n ∈ A, dann ist jedes Element von A ein Produkt der a i und ihrer Inversen. Da die Gruppe abelsch ist, kann man in einem solchen Produkt die Potenzen desselben Erzeugers zusammenfassen. Jedes Element x ∈ A hat also eine Darstellung x = ar ⋯a nr n mit r , . . . , r n ∈ Z. Bei abelschen Gruppen schreibt man die Verknüpfung allerdings in der Regel additiv (mit neutralem Element ), es sei denn der Kontext erfordert eine andere Schreibweise. Wenn wir die Gruppe A mit Erzeugern a , . . . , a n additiv schreiben, dann hat also jedes Element x ∈ A eine Darstellung x = r a + ⋯ + r n a n mit r , . . . , r n ∈ Z. Wenn diese Darstellung für jedes x ∈ A eindeutig ist, dann entspricht das nach Prop. 3.1.17 einer Zerlegung von A in ein direktes Produkt der zyklischen Untergruppen ⟨a ⟩, . . . , ⟨a n ⟩. Bei additiv geschriebenen abelschen Gruppen A , . . . , A n schreibt man für das direkte Produkt A × ⋯ × A n , wie auch bei Vektorräumen, häufig A ⊕ ⋯ ⊕ A n

90

3. GRUPPEN

und nennt dies die direkte Summe6. Es gelten dann also (1) A = A + ⋯ + A n und (2) (A + ⋯ + A i− ) ∩ A i = {} für alle i = , . . . , n. Das Ziel ist im folgenden, eine endlich erzeugte abelsche Gruppe in möglichst eindeutiger Weise in eine direkte Summe von zyklischen Gruppen zu zerlegen. Als erstes beweisen wir ein paar allgemeine Hilfsaussagen. Lemma 3.7.1. (1) Eine abelsche Gruppe A ist genau dann endlich erzeugt, wenn es einen surjektiven Homomorphismus Zn → A für ein n ∈ N gibt. (2) Sei φ∶ A → B ein Homomorphismus abelscher Gruppen. Falls Kern(φ) und Bild(φ) beide endlich erzeugt sind, dann auch A. (3) Jede Untergruppe von Zn ist endlich erzeugt, und zwar von höchstens n Elementen. (4) Jede Untergruppe einer endlich erzeugten abelschen Gruppe ist endlich erzeugt. Beweis. (1) Sind a , . . . , a n Erzeuger von A, dann ist φ∶ Zn → A, (r , . . . , r n ) ↦ ∑ r i a i ein surjektiver Homomorphismus. Umgekehrt wird die abelsche Gruppe Zn von den Elementen e i = (, . . . , , , , . . . , ) (mit der  an der i-ten Stelle) erzeugt. Ist φ∶ Zn → A ein surjektiver Homomorphismus, dann wird A also von den Elementen φ(e ), . . . , φ(e n ) erzeugt. (2) Seien a , . . . , a m Erzeuger von Kern(φ) und b , . . . , b l Erzeuger von Bild(φ). Wähle nun c , . . . , c l ∈ A mit φ(c i ) = b i für i = , . . . , l. Für jedes a ∈ A gibt es dann eine Darstellung φ(a) = ∑ s i b i . Es folgt φ(a − ∑ s i c i ) = φ(a) − φ(a) = . Also gibt es eine Darstellung a − ∑ s i c i = ∑ r i a i und damit a = ∑ r i a i + ∑ s i c i . Insgesamt wird A also von a , . . . , a m und c , . . . , c l erzeugt. (3) Das beweisen wir mit Induktion nach n. Für n =  wissen wir das schon, denn jede Untergruppe von Z ist von der Form mZ = ⟨m⟩ für m ∈ N . Sei also n ⩾ . Sei A ⊂ Zn eine Untergruppe und sei U ⊂ Zn die Untergruppe U = {(, r , . . . , r n ) ∈ Zn ∣ r , . . . , r n ∈ Z} ≅ Zn− . Wir betrachten den Homomorphismus π∶ A → Z, (r , . . . , r n ) ↦ r . Sein Kern ist offenbar gerade A ∩ U und wird nach Induktionsannahme von höchstens n −  Elementen erzeugt. Das Bild von φ ist eine Untergruppe von Z und damit von einem Element erzeugt. Nach (2) (und dem Beweis) wird A deshalb von n Elementen erzeugt. (4) Sei A eine endlich erzeugte abelsche Gruppe mit surjektivem Homomorphismus φ∶ Zn → A. Sei B eine Untergruppe von A und B′ = φ− (A). Nach (3) ist B′ endlich erzeugt, etwa von b , . . . , b k ∈ Zn . Dann wird B = φ(φ− (B)) von φ(b ), . . . , φ(b k ) erzeugt. ∎ Als nächstes unterscheiden wir die Elemente endlicher Ordnung, also Elemente a ∈ A mit ra =  für ein r ⩾ , von den Elementen unendlicher Ordnung, also mit ra ≠  für alle r ⩾ . Proposition 3.7.2. In jeder abelschen Gruppe A ist die Menge aller Elemente endlicher Ordnung eine Untergruppe. Ist A endlich erzeugt, so ist diese Untergruppe endlich und enthält jede andere endliche Untergruppe von A. 6So

lange man nur endlich viele Summanden bzw. Faktoren hat, ist das wirklich bloß eine Frage der Notation. Bei unendlich vielen Faktoren sind in der direkten Summe, im Unterschied zum Produkt, in jedem Tupel immer nur endlich viele Einträge ungleich Null. In diesem Fall hat man also wirklich zwei verschiedene Begriffe.

3.7. ENDLICH ERZEUGTE ABELSCHE GRUPPEN

91

Beweis. Sei B die Menge aller Elemente endlicher Ordnung in A. Wegen  ∈ B ist B niemals leer. Sind a, b ∈ B mit ra =  und sb = , r, s ⩾ , dann folgt rs(a − b) = rsa − srb = , also a − b ∈ B. Ist A endlich erzeugt, dann auch B nach Lemma 3.7.1(4), etwa B = ⟨b , . . . , b k ⟩. Weil jedes b , . . . , b k endliche Ordnung hat, gibt es dann nur endlich viele verschiedene Elemente der Form ∑ s i b i , s i ∈ Z. Ist B′ eine weitere endliche Untergruppe von A, dann hat jedes Element von B′ endliche Ordnung und es folgt B′ ⊂ B. ∎ Definition 3.7.3. Sei A eine abelsche Gruppe. Die Untergruppe aller Elemente endlicher Ordnung heißt die Torsionsuntergruppe und wird mit Ator bezeichnet. Eine abelsche Gruppe heißt torsionsfrei, wenn Ator = {} gilt, also wenn  das einzige Element endlicher Ordnung in A ist. Satz 3.7.4. Eine endlich erzeugte abelsche Gruppe A ist genau dann torsionsfrei, wenn es n ∈ N und Erzeuger a , . . . , a n ∈ A gibt derart, dass jedes Element x ∈ A eine eindeutige Darstellung x = r a + ⋯ + r n a n mit r , . . . , r n ∈ Z besitzt. Beweis. Falls jedes Element in A eine eindeutige solche Darstellung hat, dann folgt aus der Eindeutigkeit der Darstellung für die , dass es kein Element endlicher Ordnung ungleich  geben kann. Sei umgekehrt Ator = {} und seien a , . . . , a m Erzeuger von A. Wir beweisen die Behauptung durch Induktion nach m. Falls m =  ist, dann ist A unendlich zyklisch und die Behauptung ist richtig. Sei also m ⩾ . Die Existenz der gewünschten Darstellung ist klar, weil die a , . . . , a m Erzeuger sind. Falls sie für jedes x ∈ A auch eindeutig ist, dann sind wir fertig. Andernfalls gibt es ein x ∈ A das zwei verschiedene Darstellungen hat. Die Differenz der beiden Darstellungen führt dann zu einer Gleichheit (∗)

s a + ⋯ + s m a m = 

mit s , . . . , s m ∈ Z nicht alle . Falls eines der s i gleich  oder − ist, ohne Einschränkung etwa s = ±, dann folgt a = ∓(s a + ⋯ + s m a m ). In diesem Fall wird A also bereits von a , . . . , a m erzeugt und die Behauptung folgt aus der Induktionsannahme. Andernfalls reduzieren wir auf diesen Fall, und zwar folgendermaßen: Falls s , . . . , s m einen gemeinsamen Teiler d ∈ N haben, etwa s i = ds′i , dann folgt zunächst d(s′ a + ⋯ + s′m a m ) = . Weil A nach Voraussetzung kein Element endlicher Ordnung ungleich  besitzt, folgt daraus bereits s′ a + ⋯ + s′m a m = . Wir können also ohne Einschränkung annehmen, dass s , . . . , s m in (∗) keinen gemeinsamen Teiler haben. Es kann nicht sein, dass nur eines der s , . . . , s m ungleich  ist, denn sonst gäbe es wieder ein Element endlicher Ordnung. Wegen Teilerfremdheit können sie auch nicht alle gleich sein. Wir können also ohne Einschränkung s , s ≠  und etwa ∣s ∣ > ∣s ∣ annehmen. Setze nun a′ = a + ka für k ∈ Z. Aus der Relation (∗) wird dann (s − ks )a + s a′ + s a + ⋯ + s m a m = .

92

3. GRUPPEN

Wegen a = a′ − ka sind a , a′ , . . . , a m wieder Erzeuger. Wir können nun k ∈ Z so wählen, dass  < ∣s − ks ∣ < ∣s ∣ gilt. (Denn wegen ∣s ∣ < ∣s ∣ hat jedenfalls k =  oder k = − diese Eigenschaft.) In dieser Weise haben wir eine neue Relation der Form (∗) produziert, in der a einen im Betrag kleineren Koeffizienten hat. Die Koeffizienten bleiben dabei teilerfremd. Wir können dieses Prozedere nun so lange wiederholen, bis ein Koeffizient  oder − ist. ∎ Korollar 3.7.5. Eine endlich erzeugte abelsche Gruppe A ist genau dann torsionsfrei, wenn A ≅ Zn für ein n ∈ N gilt. Beweis. Offensichtlich ist jede solche Gruppe torsionsfrei. Nach Satz 3.7.4 besitzt umgekehrt jede endlich erzeugte torsionsfreie abelsche Gruppe A Erzeuger a , . . . , a n und jedes x ∈ A eine eindeutige Darstellung x = r a + ⋯ + r n a n mit r , . . . , r n ∈ Z. Nach Prop. 3.1.17 folgt daraus, dass A die direkte Summe der zyklischen Untergruppen ⟨a ⟩, . . . , ⟨a n ⟩ ist. Weil A torsionsfrei ist, sind diese unendlich zyklisch, also isomorph zu Z. ∎ Beispiel 3.7.6. Eher ein Gegenbeispiel ist die Gruppe A = (Q, +). Sie ist offenbar torsionsfrei, aber nicht isomorph zu Zn . Denn für je zwei Elemente ba , dc ∈ Q ∖ {} gilt ac = bc ⋅

a c a c = ad ⋅ ∈ ⟨ ⟩ ∩ ⟨ ⟩ b d b d

während sich in Zn die zyklischen Untergruppen ⟨e ⟩ und ⟨e ⟩ nur in  = (, . . . , ) schneiden. Außerdem gibt es in (Q, +) zu jedem n ∈ N und jedem a ∈ Q ein Element x ∈ Q mit nx = a, nämlich eben x = na . (Man sagt, die Gruppe (Q, +) ist divisibel). In Z ⊕ ⋯ ⊕ Z ist das dagegen zum Beispiel für das Element a = (, , . . . , ) offensichtlich nicht der Fall. Die Schlussfolgerung ist, dass die abelsche Gruppe (Q, +) nicht endlich erzeugt sein kann. Diese Gruppe hat eine vollkommen andere Struktur als die endlich erzeugten abelschen Gruppen, die wir in diesem Abschnitt untersuchen. Proposition 3.7.7. Jede endlich erzeugte abelsche Gruppe ist die direkte Summe einer torsionsfreien und einer endlichen Untergruppe. Da wir schon wissen, dass Ator die maximale endliche Untergruppe von A ist, bedeutet diese Aussage genauer folgendes: Es gibt eine torsionsfreie Untergruppe F von A mit A = F ⊕ Ator also A = F + Ator und F ∩ Ator = {}. Beweis. Es sei A eine endlich erzeugte abelsche Gruppe mit Erzeugern a , . . . , a n und sei Ator die Untergruppe aller Elemente endlicher Ordnung. Betrachte die Faktorgruppe B = A/Ator mit Restklassenabbildung x ↦ x. Sie ist endlich erzeugt, nämlich von a , . . . , a n . Sie ist außerdem torsionsfrei: Denn na =  bedeutet na ∈ Ator . Dann gibt es aber per Definition m ∈ N mit mna = , also a ∈ Ator und a = . Nach Satz 3.7.4 gibt es b , . . . , b k ∈ A derart, dass jedes a ∈ A eine eindeutige Darstellung a = r b + ⋯ + r k b k besitzt. Insbesondere ist b i ≠  in B und deshalb b i ∉ Ator . Also ist die Untergruppe F = ⟨b , . . . , b k ⟩ torsionsfrei. Nun gilt A = F + Ator , denn

3.7. ENDLICH ERZEUGTE ABELSCHE GRUPPEN

93

gegeben a ∈ A, dann können wir a = r b + ⋯ + r k b k in B schreiben Es gibt also a t ∈ Ator mit a = r b + ⋯ + r k b k + a t ∈ F + Ator . Außerdem gilt F ∩ Ator = {}, da jedes Element ungleich  in F unendliche Ordnung hat.



Als nächstes bestimmen wir die Struktur der endlichen abelschen Gruppen genauer, angefangen bei den abelschen p-Gruppen. Nach der Definition aus dem letzten Abschnitt ist eine endliche abelsche Gruppe A eine p-Gruppe für eine Primzahl p, wenn sie die Ordnung pk für ein k ∈ N hat oder wenn, äquivalent, die Ordnung jedes Elements von A eine Potenz von p ist. Proposition 3.7.8. Sei p eine Primzahl und A eine abelsche Gruppe. Dann ist A p = {x ∈ A ∣ pr x =  für ein r ⩾ } eine Untergruppe von A, die jede p-Untergruppe von A enthält. Beweis. Aus pr x =  und ps y =  mit etwa r ⩾ s folgt pr (x − y) = . Aus x, y ∈ A p folgt also x − y ∈ A p . Außerdem gilt immer  ∈ A p , so dass A p eine Untergruppe ist. ∎ Proposition 3.7.9. Jede endliche abelsche Gruppe A ist eine direkte Summe von p-Gruppen, für verschiedene Primzahlen p. Genauer gilt: Sind p , . . . , p k alle Primteiler von ∣A|, dann gilt A = A p ⊕ ⋯ ⊕ A p k . Beweis. Es sei ∣A∣ = pt ⋯p tkk und setze q i = ∣A∣/p ti i . Dann sind q , . . . , q k teilerfremd (insgesamt, nicht paarweise). Es gibt also r , . . . , r k mit r q + ⋯ + r k q k = . Ist nun a ∈ A beliebig, dann setze a i = r i q i a. Wegen a = (r q + ⋯ + r k q k )a folgt a = a + ⋯ + a k . Außerdem gilt

pti i a i = p ti i q i r i a = ∣A∣r i a = 

und damit a i ∈ A p i . Es bleibt die Eindeutigkeit der Darstellung zu zeigen. Angenommen a = a′ + ⋯ + a ′k ist eine weitere Darstellung mit a′i ∈ A p i . Dann folgt a − a′ = a′ − a + ⋯ + a ′k − a k . Hier hat die linke Seite Ordnung ps für ein s ∈ N und die Ordnung der rechten Seite teilt (p . . . p k )t für ein t ∈ N . Aber diese beiden Zahlen sind teilerfremd. Es gibt also u, v ∈ Z mit ups + v(p ⋯p k )t = . Es folgt a − a′ = ups (a − a′ ) + v(p ⋯p k )t (a′ − a + ⋯ + a ′k − a k ) = , also a = a′ und entsprechend a i = a ′i für i = , . . . , k. Damit ist alles bewiesen.



Als letzter Schritt bleibt jetzt noch, die p-Gruppen in zyklische Gruppen zu zerlegen. Satz 3.7.10. Jede endliche abelsche p-Gruppe ist eine direkte Summe von zyklischen p-Gruppen. Diese Zerlegung ist eindeutig bis auf die Reihenfolge der Summanden.

94

3. GRUPPEN

Beweis. Es sei A eine endliche p-Gruppe. Falls A zyklisch ist, dann ist nichts zu zeigen. Andernfalls sei B = ⟨b⟩ eine zyklische Untergruppe von A von maximaler Ordnung pn . Wir zeigen, dass es eine Untergruppe C von A gibt mit A = B ⊕ C, also A = B + C und B ∩ C = {}. Wir können dann C weiter zerlegen, so dass die Behauptung durch Induktion nach ∣A∣ bewiesen ist. Sei dazu c ∈ A∖B und betrachte die Restklasse c +B von c in A/B. Weil auch A/B nach dem Satz von Lagrange eine p-Gruppe ist, hat c + B in A/B die Ordnung p k für ein k mit  < k ⩽ n. Es gibt also s ∈ Z mit p k c = sb. Es folgt  = pn c = spn−k b und damit pn ∣spn−k . Wegen k >  impliziert das p∣s, etwa s = ps′ . Setze c = p k− c − s′ b. Nach Wahl von k liegt c nicht in B und es gilt pc = . Daraus folgt B ∩ ⟨c⟩ = {}. Falls A = B + ⟨c⟩, dann sind wir fertig mit C = ⟨c⟩. Andernfalls betrachte A = A/⟨c⟩ mit Restklassenabbildung ρ∶ A → A/⟨c⟩ und B = ρ(B). Wegen B ∩ ⟨c⟩ = {} hat B dieselbe Ordnung wie B, ist also zyklisch von maximaler Ordnung in A. Wegen ∣A∣ < ∣A∣ gibt es, wiederum durch Induktion nach ∣A∣, eine Untergruppe C mit A = B ⊕ C. Sei C = ρ − (C). Dann gilt A = B + C und B ∩ C ⊂ Kern(ρ) = ⟨c⟩. Wegen B ∩ ⟨c⟩ = {}, folgt B ∩ C = {}, also A = B ⊕ C. Es bleibt die Eindeutigkeit der Zerlegung zu zeigen. Betrachte dazu die maximale Ordnung eines Elements in A, also m = min{r ∈ N ∣ ∀a ∈ A∶ pr a = }. Falls m = , dann hat jedes Element ungleich  in A die Ordnung p. Da jede zyklische Gruppe Z/p k Elemente der Ordnung p k enthält, kommt in der Zerlegung von A dann nur Z/p vor. Die Anzahl der Summanden ist dann durch die Ordnung von A eindeutig bestimmt. Sei nun m > , dann hat A eine Zerlegung der Form A = B ⊕ Z/pm ⊕ ⋯ ⊕ Z/pm ´¹¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¸ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¶ r Summanden

für ein r ⩾ , wobei B nur Elemente der Ordnung pk mit k < m enthält. Der Exponent r ist durch die Anzahl der Elemente mit Ordnung pm in A eindeutig bestimmt und nach Induktionsvoraussetzung ist die Zerlegung von B in zyklische Untergruppen eindeutig. ∎ Damit haben wir alle Bauteile zusammen für das Hauptergebnis dieses Abschnitts. Satz 3.7.11 (Basissatz für endlich erzeugte abelsche Gruppen). Jede endlich erzeugte abelsche Gruppe A ist eine direkte Summe von zyklischen Untergruppen A = B ⊕ ⋯ ⊕ B r wobei jedes B i entweder unendlich-zyklisch ist oder zyklisch von Primpotenzordnung. Diese Zerlegung ist eindeutig bis auf die Reihenfolge der Summanden.

Beweis. Nach Prop. 3.7.7 ist A die direkte Summe einer freien Gruppe und einer endlichen Gruppe, und diese Zerlegung ist eindeutig, weil die endliche Gruppe gerade alle Elemente endlicher

3.7. ENDLICH ERZEUGTE ABELSCHE GRUPPEN

95

Ordnung enthält. Die freie Gruppe ist nach Satz 3.7.4 isomorph zu Zr für ein eindeutig bestimmtes r ⩾ . Die endliche Gruppe ist nach Prop. 3.7.9 eine direkte Summe von p-Gruppen, und diese Zerlegung ist eindeutig, weil jeder Summand aus Elementen von unterschiedlicher Primpotenzordnung besteht. Schließlich ist jede p-Gruppe nach Satz 3.7.10 wiederum in eindeutiger Weise eine direkte Summe von zyklischen p-Gruppen, und diese haben Primpotenzordnung. ∎ Beispiel 3.7.12. Satz 3.7.11 klassifiziert insbesondere alle endlichen abelschen Gruppen. Betrachte zum Beispiel die abelschen Gruppen der Ordnung  =  ⋅ . Nach dem Basissatz gibt es bis auf Isomorphie genau zwei solche Gruppen, nämlich Z/ ⊕ Z/

und

Z/ ⊕ Z/ ⊕ Z/.

Dabei ist Z/ ⊕ Z/ isomorph zu Z/ nach dem chinesischen Restsatz (Kor. 2.6.18), sogar als Ring. Genauso gilt Z/ ⊕ Z/ ≅ Z/, so dass wir den zweiten Typ auch als Z/ ⊕ Z/ schreiben könnten. Die Zerlegung im Basissatz ist deshalb zwar die eindeutige Zerlegung in zyklische Gruppen von Primpotenzordnung, aber nicht die einzige Zerlegung in zyklische Untergruppen. Den chinesischen Restsatz für Gruppen halten wir an dieser Stelle noch einmal fest und bemerken, dass auch eine Umkehrung gilt. Proposition 3.7.13. Sind m, n ∈ Z teilerfremd, dann gilt Z/m ⊕ Z/n ≅ Z/(mn). Andernfalls ist Z/m ⊕ Z/n nicht zyklisch. Beweis. Wenn m und n teilerfremd sind, dann sind nach dem chinesischen Restsatz (Kor. 2.6.18) sogar die Ringe Z/m ×Z/n und Z/(mn) isomorph, erst recht also die abelschen Gruppen. Wenn m und n dagegen einen gemeinsamen Teiler k >  haben, dann gibt es in Z/m und Z/n jeweils ein Element der Ordnung k. Deshalb enthält Z/m⊕Z/n mehr als eine Untergruppe der Ordnung k und kann deshalb nicht zyklisch sein (Satz 3.2.6). ∎ Für endliche Gruppen erweist sich gelegentlich die folgende Variante des Basissatzes als nützlich. Korollar 3.7.14. Jede endliche abelsche Gruppe ist eine direkte Summe A = B ⊕ ⋯ ⊕ B r von zyklischen Untergruppen B i der Ordnung b i = ∣B i ∣ mit b i ∣b i+ für i = , . . . , r − . Beweis. Um das zu beweisen, muss man nur die zyklischen Untergruppen von Primpotenzordnung aus dem Basissatz neu gruppieren. Nach dem Basissatz ist A eine direkte Summe von zyklischen Gruppen, deren Ordnungen Potenzen von verschiedenen Primzahlen p , . . . , p k sind. Für jedes i = , . . . , k sei pri i die größte Potenz von p i derart, dass eine zyklische Gruppe der Ordnung pri i in der Zerlegung von A vorkommt. Dann gilt also A = B ⊕ ⋯ ⊕ B k ⊕ B mit B i ≅ Z/pri i . Nach dem chinesischen Restsatz (Prop. 3.7.13) ist B ⊕ ⋯ ⊕ B k dann zyklisch der Ordnung n = pr  ⋯prkk . Wenn wir B in dieser Weise weiter zerlegen, haben die übrigen Summanden nach Wahl von r , . . . , r k eine Ordnung, die n teilt. Die Behauptung ist bewiesen. ∎ Die Zahlen b , . . . , br sind durch die abelsche Gruppe A eindeutig bestimmt und werden auch als Elementarteiler der Gruppe bezeichnet.

96

3. GRUPPEN

3.8. Übersicht über die Gruppen kleiner Ordnung Sehr viel komplizierter als die Klassifikation aller endlichen abelschen Gruppen, ist die Klassifikation aller endlichen Gruppen überhaupt (siehe Bemerkungen über einfache Gruppen am Ende von §3.5). Für Gruppen ’kleiner’ Ordnung haben wir aber schon einiges an Werkzeugen. Sei p eine Primzahl, dann haben wir folgendes bereits bewiesen: ○ Jede Gruppe der Ordung p ist zyklisch (Prop. 3.2.4). ○ Jede Gruppe der Ordnung p ist abelsch (Satz 3.6.13). ○ Jede Gruppe der Ordnung p ist zyklisch oder die Diedergruppe D p (Satz 3.6.9). Wenn wir nun die Folge der natürlichen Zahlen durchgehen, dann ist  die erste Zahl, bei der keiner dieser Sätze greift. An Gruppen der Ordnung  kennen wir außer den abelschen Gruppen C , C × C , C nur die Diedergruppe D . Wir zeigen, dass es genau eine weitere Gruppe der Ordnung  gibt. Dazu betrachten wir wieder die Ordnungen von Elementen in einer solchen Gruppe. Die folgende Aussage wurde schon in den Übungen gezeigt. Proposition 3.8.1. Eine Gruppe, in der jedes Element höchstens Ordnung  hat, ist abelsch. Beweis. Es sei G eine Gruppe mit g  =  für alle g ∈ G. Dann gilt g = g − für alle g ∈ G und außerdem (gh) = ghgh =  und damit gh = h − g − = hg für alle g, h ∈ G. ∎ Sei nun G eine nicht-abelsche Gruppe der Ordnung . Elemente ungleich  in G haben dann die Ordnung  oder . Nach Prop. 3.8.1 muss es in G mindestens ein Element a der Ordnung  geben. Sei weiter b ∈ G, b ∉ ⟨a⟩. Dann gilt G = {, a, a , a  , b, ab, a  b, a  b}, denn diese Elemente sind alle verschieden. Insbesondere muss b  in dieser Liste vorkommen. Wegen b ∉ ⟨a⟩, kommen nur die ersten vier, also b  ∈ ⟨a⟩ in Frage. Aber b  = a oder b = a  würden implizieren, dass b die Ordnung  hat. Es muss also b  =  oder b  = a gelten. Wir unterscheiden diese beiden Fälle. (1) Es gilt b  = . Betrachte nun das Element ba. Es kann nicht in ⟨a⟩ liegen und ba = ab würde implizieren, dass G abelsch ist. Die Gleichheit ba = a  b ist ebenfalls nicht möglich, denn es würde ba  b = b  a = a und damit a  = ba  bba  b = ba  b =  folgen, ein Widerspruch. Es bleibt also nur noch ba = a b und damit bab = a = a − . Somit ist G die Diedergruppe D . (2) Es gilt b = a  . Dann hat b ebenfalls die Ordnung . Wir bestimmen wieder das Element ba. Da G nicht-abelsch ist, muss ba ≠ ab gelten. Falls ba = a  b, so folgt ba = b  und damit a = b  = a  , ein Widerspruch. Es muss also wieder ba = a b gelten. Das ist die neue Gruppe. Um zu beweisen, dass diese Gruppe tatsächlich existiert und um sie konkret zu beschreiben, identifizieren wir sie mit der Untergruppe von GL (C), die von den beiden Matrizen  i A=( ) i 

und

  B=( ) − 

erzeugt wird. Die Matrizen A und B haben die Ordnung  und erfüllen    i i   −i   BA = ( )( )=( )=( )( ) = A B. −  i   −i −i  − 

3.8. ÜBERSICHT ÜBER DIE GRUPPEN KLEINER ORDNUNG

97

Diese Gruppe heißt die Quaternionengruppe7 und wird mit Q bezeichnet. Damit haben wir die Gruppen der Ordnung  vollständig bestimmt: Proposition 3.8.2. Jede nicht-abelsche Gruppe der Ordnung  ist zur Diedergruppe D oder zur Quaternionengruppe Q isomorph. ∎ Die nächste Zahl, die Schwierigkeiten macht, ist . Hier kennen wir außer den abelschen Gruppen C × C ≅ C und C × C noch die Diedergruppe D und die alternierende Gruppe A . (Wir kennen auch noch S × C , aber diese Gruppe ist isomorph zu D .) Wieder zeigt sich, dass es genau eine weitere Gruppe gibt, was wir aber nicht beweisen. Generell gilt, dass das Klassifikationsproblem immer schwieriger wird, je mehr eine Zahl zusammengesetzt ist und besonders schwierig, wenn ein Primfaktor zu einer höheren Potenz auftritt. Es gibt zum Beispiel  Gruppen der Ordnung , von denen uns bisher nur  bekannt sind. Man weiß, dass es .. Gruppen der Ordnung  =  gibt und ... Gruppen der Ordnung  =  . Mithilfe von Computern kann man die Gruppen auch bis auf Isomorphie bestimmen. (Im Software-Paket GAP ist 1024 tatsächlich die kleinste Zahl, für die keine vollständige Liste aller Gruppen dieser Ordnung zur Verfügung steht.) Anscheinend ist  =  die kleinste Zahl, für die noch nicht einmal die Anzahl der Gruppen dieser Ordnung bekannt ist. Wir fassen unsere Erkenntnisse für kleine Ordnungen in einer Tabelle zusammen. Ordnung # Gruppen                                   ⋮ ⋮ 7Der

Gruppen {id} C C C , C ≅ D C C × C , S ≅ D C C , C × C , C , D , Q C , C C × C , D C C × C , C × C , D , A , ??? C C × C , D C × C (nicht bewiesen8) C , C × C , C × C , C × C , C , D , D × C , Q × C , ??? C ⋮

Name kommt daher, dass die Gruppe noch eine andere Realisierung hat, nämlich mithilfe des Schiefkörpers der Quaternionen. Die Quaternionen sind eine nicht-kommutative Verallgemeinerung der komplexen Zahlen und spielen in der Algebra, der Operatortheorie, aber auch in der Physik und der Elektrotechnik eine Rolle. 8Die Gruppen der Ordnung pq für zwei Primzahlen p < q sind nicht allzu schwer zu klassifizieren. Wenn p kein Teiler von q −  ist, dann gibt es nur die zyklische Gruppe C p × C q , ansonsten genau eine weitere Gruppe. Zum Beispiel gibt es genau zwei Gruppen der Ordnung . Satz 3.6.9 ist der Spezialfall p = .

Algebra

Daniel Plaumann Technische Universität Dortmund Wintersemester 2016 Fassung vom 26. Juli 2017

. KÖRPER

4.1. Grundlagen Ein Körper ist ein kommutativer Ring K mit  ≠ , in dem jedes Element ungleich Null ein multiplikatives Inverses besitzt. Mit anderen Worten, die Einheitengruppe K ∗ ist gerade K ∖{}. Im Gegensatz zur Ringtheorie sind die Teilbarkeit und die Idealtheorie, die uns das ganze vorige Kapitel hindurch beschäftigt haben, in einem Körper vollkommen uninteressant, denn jedes Element ungleich Null teilt jedes andere. Ein Körper K hat auch nur die beiden Ideale {} und K. Statt dessen geht es in der Körpertheorie vor allem um die Lösbarkeit von Polynomgleichungen. Es sei stets K ein Körper. Wir schreiben K für die Eins in K, wenn es darauf ankommt, sie von der natürlichen Zahl  zu unterscheiden. Die Charakteristik von K, geschrieben char(K), ist die kleinste natürliche Zahl n derart, dass n ⋅ K = K + ⋯ + K =  ´¹¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¸¹¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¶ n Summanden

in K gilt, falls eine solche Zahl existiert. Falls sie nicht existiert, definieren wir char(K) = . Proposition 4.1.1. Es sei K ein Körper mit char(K) > . (1) Die Charakteristik von K ist eine Primzahl. (2) Für a ∈ K ∗ und n ∈ N gilt na =  in K genau dann, wenn char(K) ein Teiler von n ist. Beweis. Sei p = char(K). Angenommen p = rs mit r, s ∈ N. Dann gilt rK ⋅ sK =  in K. Da K ein Körper und damit nullteilerfrei ist, ist einer der beiden Faktoren , etwa r ⋅ K = . Wegen der Minimalität von p folgt daraus r = p und s = , was (1) beweist. Für a ∈ K ∗ und n ∈ N gilt na = 



(n ⋅ K ) ⋅ a = 



n ⋅ K = ,

weil K nullteilerfrei ist. Ist n ∈ N mit n ⋅ K = , dann schreibe n = ap + r mit a ∈ N,  ⩽ r < p. Es folgt r ⋅ K = n ⋅ K − ap ⋅ K =  in K. Wegen r < p muss r =  sein, also p∣n. ∎ Bemerkung 4.1.2. Die Definition der Charakteristik ist grundsätzlich für jeden Ring sinnvoll. Prop. 4.1.1 ist für alle Integritätsringe richtig und die Charakteristik eines Integritätsrings stimmt mit der seines Quotientenkörpers überein. Am wichtigsten ist die Charakteristik aber für die Körpertheorie.

Beispiele 4.1.3. Der Körper Q hat die Charakteristik . Für jede Primzahl p ist F p = Z/p ein Körper der Charakteristik p. Ein Beispiel für einen unendlichen Körper der Charakteristik p ist der rationale Funktionenkörper F p (x). Ein Homomorphismus zwischen Körpern K → L ist dasselbe wie ein Ringhomomorphismus, denn wir haben gesehen, dass Homomorphismen von Ringen immer auch Inverse erhalten. Es gilt folgende einfache Aussage. 99

100

4. KÖRPER

Proposition 4.1.4. Jeder Homomorphismus zwischen zwei Körpern ist injektiv. Beweis. Es sei φ∶ K → L ein Homomorphismus. Der Kern von φ ist ein Ideal in K und, weil K ein Körper ist, damit {} oder K. Andererseits gilt φ() =  und damit  ∉ Kern(φ). Also muss Kern(φ) = {} gelten, mit anderen Worten, φ ist injektiv. ∎ Ein Teilkörper (oder Unterkörper) eines Körpers L ist ein Teilring K ⊂ L, der selbst ein Körper ist. Explizit bedeutet das: (1) Für alle a, b ∈ K sind auch a + b und a − b wieder in K; (2) für alle a, b ∈ K ∖ {} sind auch ab und ab− in K; (3) es gilt  ∈ K. Ist K ⊂ L ein Teilkörper, dann heißt L ein Erweiterungskörper (oder Oberkörper) von K und das Paar (L, K) eine Körpererweiterung von K. Ein Durchschnitt von Teilkörpern eines Körpers K ist offensichtlich wieder ein Teilkörper. Der Durchschnitt aller Teilkörper von K wird der Primkörper von K genannt. Proposition 4.1.5. Alle Teilkörper eines Körpers K haben dieselbe Charakteristik. Der Primkörper von K ist entweder isomorph zu Q, falls char(K) = , oder zu F p , falls char(K) = p. Beweis. Dass alle Teilkörper von K die Charakteristik von K haben, ist klar nach Definition, denn jeder Teilkörper enthält alle Vielfachen von K . Um den Primkörper zu bestimmen, betrachten wir den von K in K erzeugten Teilring. Das ist das Bild des Ringhomomorphismus φ∶ Z → K, n ↦ n ⋅ K . Wenn K die Charakteristik  hat, ̃∶ Q → K. Das Bild dann ist φ injektiv. Nach Prop. 2.8.5 setzt φ fort zu einem Homomorphismus φ von φ ist ein Teilkörper K von K, der isomorph zu Q ist. Da K nur die Vielfachen von K und ihre Inversen enthält, ist K der Primkörper. Gilt dagegen char(K) = p > , dann hat φ den Kern ⟨p⟩ und das Bild von φ ist isomorph zu Z/p ≅ F p nach dem Isomorphiesatz. ∎ Proposition 4.1.6. Ist K ein Körper der Charakteristik p > , dann gilt (a + b) p = a p + b p für alle a, b ∈ K. Beweis. Nach der binomischen Formel gilt p p (a + b) p = ∑ ( )a i b p−i . i= i p! Der Binomialkoeffizient ( pi) = i!(p−i)! ist für alle  < i < p durch p teilbar (siehe auch Beweis von Prop. 2.9.19). Da K die Charakteristik p hat, sind diese Binomialkoeffzienten also alle  in K. Für i =  und i = p ist der Binomialkoeffizient dagegen gleich , woraus die Behauptung folgt. ∎

Prop. 4.1.6 sagt mit anderen Worten, dass die Abbildung K → K, a ↦ a p in einem Körper der Charakteristik p >  ein Homomorphismus ist, genannt der Frobenius-Homomorphismus.

4.2. ALGEBRAISCHE KÖRPERERWEITERUNGEN

101

4.2. Algebraische Körpererweiterungen Ist K ⊂ L eine Körpererweiterung, dann können wir L als K-Vektorraum auffassen. Die Skalarmultiplikation α ⋅ v, für α ∈ K und v ∈ L, ist dabei die Multiplikation in L. Die Dimension [L ∶ K] = dimK (L) von L als K-Vektorraum heißt der Grad der Körpererweiterung. Der Grad ist eine natürliche Zahl oder unendlich1. Eine Körpererweiterung heißt endlich, wenn ihr Grad endlich ist, sonst unendlich. (Das hat nichts damit zu tun, ob die beteiligten Körper endlich sind.) Zum Beispiel ist {, i} eine R-Basis von C, denn jede komplexe Zahl besitzt eine eindeutige Darstellung a + bi mit a, b ∈ R. Also gilt [C ∶ R] = . Der Grad [R ∶ Q] ist dagegen unendlich2, ebenso dann natürlich [C ∶ Q]. Diese klassischen Körpererweiterungen von Q sind also ziemlich unüberschaubar, weshalb es für die Algebra besser ist, sie in kleinere Teile zu zerlegen. Sind K ⊂ F ⊂ L Körpererweiterungen, dann heißt F ein Zwischenkörper der Erweiterung K ⊂ L. Die Grade multiplizieren sich dabei, das heißt es gilt die folgende Aussage. Proposition 4.2.1. Sind K ⊂ F ⊂ L Körpererweiterungen, dann gilt [L ∶ F][F ∶ K] = [L ∶ K]. Beweis. Falls [L ∶ F] oder [F ∶ K] unendlich ist, dann sind beide Seiten unendlich. Wir können also annehmen, dass m = [L ∶ F] und n = [F ∶ K] endlich sind. Fixiere eine F-Basis α , . . . , α m von L und eine K-Basis β , . . . , β n von F. Wir behaupten, dass die paarweisen Produkte (α i β j )i=,...,m,

j=,...,n

eine K-Basis von L bilden. Da diese Basis die Länge mn hat, impliziert das die Behauptung. Dass die Produkte α i β j den K-Vektorraum L aufspannen, sieht man durch Ausmultiplizieren: n Jedes c ∈ L hat eine Darstellung c = ∑m i= a i α i und jedes a i eine Darstellung a i = ∑ j= b i j β j . n Also ist c = ∑m i= ∑ j= b i j α i β j . Die Familie ist auch linear unabhängig. Denn gegeben a i j ∈ K mit n ∑ a i j α i β j = , dann folgt aus der linearen Unabhängigkeit der α i über F zunächst ∑ j= a i j β j =  für i = , . . . , m und aus der linearen Unabhängigkeit der β j über K dann α i j =  für alle i, j. ∎ Definition 4.2.2. Es sei K ⊂ L eine Körpererweiterung. Ein Element α ∈ L heißt algebraisch über K, wenn es ein Polynom f ∈ K[x], f ≠ , mit f (α) =  gibt. Falls α nicht algebraisch über K ist, dann heißt α transzendent über K. Die Körpererweiterung K ⊂ L heißt algebraisch, wenn jedes Element von L algebraisch über K ist. Beispiele 4.2.3. (1) Jedes Element a ∈ K ist algebraisch über K, denn es ist die Nullstelle des √ Polynoms x − a ∈ K[x]. Jede n-te Wurzel n a ∈ C einer Zahl a ∈ Q ist algebraisch über Q, denn sie ist eine Nullstelle des Polynoms x n − a ∈ Q[x]. (2) In der Erweiterung K ⊂ K(x) von K durch den rationalen Funktionenkörper ist das Element x transzendent, denn für ein Polynom in K[x] bedeutet f (x) =  ja per Definition, dass 1Wir unterscheiden hier nicht zwischen unendlichen Kardinalitäten, also abzählbar oder überabzählbar, etc. 2Für einen direkten Beweis genügt es zu wissen, dass R überabzählbar ist, während jeder endlich-dimensionale

(sogar jeder abzählbar-dimensionale) Q-Vektorraum abzählbar ist.

102

4. KÖRPER

f das Nullpolynom ist. Es ist leicht zu sehen, dass allgemeiner alle Elemente von K(x) ∖ K über K transzendent sind. Bemerkung 4.2.4. Es gibt haufenweise reelle Zahlen, die transzendent über Q sind (siehe Prop. 4.2.14), aber keine einfache Methode, einer reellen Zahl anzusehen, ob sie algebraisch oder transzendent ist. Zum Beispiel sind die reellen Zahlen e und π beide transzendent. Für e lässt sich das noch einigermaßen direkt beweisen (Hermite 1873). Für π ist es schon deutlich schwieriger (Lindemann 1882). Andererseits weiß man etwa von der Zahl e + π bis heute nicht, ob sie transzendent (oder überhaupt irrational) ist. Für die Algebra sind transzendente Körpererweiterungen vor allem für Funktionenkörper wie K(x) von Interesse. Die Transzendenz spezifischer reeller Zahlen ist dagegen weniger relevant.

Proposition 4.2.5. Jede endliche Körpererweiterung ist algebraisch. Beweis. Sei K ⊂ L eine endliche Körpererweiterung und sei α ∈ L. Da [L ∶ K] endlich ist, kann die unendliche Familie (α i )i∈N = (, α, α  , . . . ) in L nicht linear unabhängig über K sein. Per Definition (von linearer Abhängigkeit) heißt das, dass es eine endliche linear abhängige Teilfamilie gibt. Es gibt also n ∈ N und a , . . . , a n ∈ K, nicht alle , mit a n α n + ⋯ + a α + a = . Das heißt aber gerade, dass α eine Nullstelle des Polynoms ∑ni= a i x i ∈ K[x] ist.



Es sei K ⊂ L eine Körpererweiterung und seien α , . . . , α n ∈ L. Wir schreiben K[α , . . . , α n ] für den von α , . . . , α n über K erzeugten Teilring von L und K(α , . . . , α n ) für den von α , . . . , α n über K erzeugten Teilkörper von L. Dies ist jeweils der Durchschnitt aller Teilringe bzw. Teilkörper von L, die K und α , . . . , α n enthalten. Lemma 4.2.6. Sei K ⊂ L eine Körpererweiterung und seien α , . . . , α n ∈ L. Dann gilt K[α , . . . , α n ] = { f (α , . . . , α n ) ∣ f ∈ K[x , . . . , x n ]} und K(α . . . , α n ) ist der Quotientenkörper von K[α , . . . , α n ] innerhalb L, das heißt es gilt K(α , . . . , α n ) = {

f (α , . . . , α n ) ∣ f , g ∈ K[x , . . . , x n ], g(α , . . . , α n ) ≠ }. g(α , . . . , α n )

Der erzeugte Teilring besteht also aus allen Summen und Produkten von Elementen aus K und α , . . . , α n , und für den erzeugten Teilkörper muss man noch Brüche dazunehmen. Das haben wir nur der Bequemlichkeit halber als Auswertung von Polynomen hingeschrieben. Beweis. Die Mengen auf der rechten Seite bilden jeweils einen Teilring bzw. Teilkörper. Andererseits liegen ihre Elemente offensichtlich in jedem Teilring bzw. Teilkörper von L, der K und α , . . . , α n enthält. Daraus folgt die Behauptung. ∎ Beispiel 4.2.7. Betrachte die Körpererweiterung Q ⊂ C. Sei d ∈ Z eine ganze Zahl, die kein √ Quadrat in Z ist. Dann ist sie auch kein Quadrat in Q, nach Kor. 2.9.13. Sei α = d ∈ C eine

4.2. ALGEBRAISCHE KÖRPERERWEITERUNGEN

103

Quadratwurzel von d, dann gilt √ √ Q[ d] = {a + b d ∣ a, b ∈ Q}, √ denn Q[ d] muss all diese Elemente enthalten, und es gilt andererseits √ √ √ √ (a + b d) + (a ′ + b ′ d) = a + a ′ + (b + b′ ) d ∈ Q[ d] und √ √ √ √ (a + b d)(a′ + b′ d) = (aa ′ + dbb ′ + (ab′ + a ′ b) d ∈ Q[ d]. √ √ Tatsächlich ist Q[ d] schon ein Körper, denn für a + b d ≠  gilt auch √ √  a b √ =  d ∈ Q[ d]. − a + b d a − db  a  − db √ Dabei haben wir den Bruch einfach mit a − b d erweitert. Man beachte, dass a − db ≠  gilt, √ √ weil d kein Quadrat in Q ist. Es gilt also Q[ d] = Q( d). In diesem Beispiel sind der erzeugte Teilring und der erzeugte Teilkörper das Gleiche, weil √ sich alle Brüche wieder zu Ausdrücken in Q[ d] vereinfachen lassen. Das kennt man von den komplexen Zahlen, wo man das Inverse einer komplexen Zahl völlig analog ausrechnet. Das machen wir jetzt allgemein. Es sei K ⊂ L eine Körpererweiterung und sei α ∈ L algebraisch über K. Die Menge I = {h ∈ K[x] ∣ h(α) = } ist ein Ideal in K[x], und dass α algebraisch über K ist bedeutet genau, dass I nicht das Nullideal ist. Da K[x] ein Hauptidealring ist, gibt es f ∈ K[x] mit I = ⟨ f ⟩. Wir können f zusätzlich als normiert annehmen, dann ist f durch α eindeutig bestimmt und heißt das Minimalpolynom von α über K. Es ist irreduzibel, denn aus f = gh folgt f (α) = g(α)h(α) und damit g(α) =  oder h(α) = . Falls etwa g(α) = , so folgt g ∈ I und damit f ∣g, also f ∼ g und h ∈ K ∗ . Das Minimalpolynom teilt also jedes andere Polynom in K[x], das α als Nullstelle hat, und hat damit unter allen solchen Polynomen ungleich  den kleinsten Grad. Satz 4.2.8. Es sei K ⊂ L eine Körpererweiterung. Sei α ∈ L algebraisch über K und f ∈ K[x] sein Minimalpolynom. Die Körpererweiterung K ⊂ K(α) ist endlich vom Grad [K(α) ∶ K] = deg( f ), und außerdem gilt K(α) = K[α] ≅ K[x]/⟨ f ⟩.

Beweis. Betrachte den Homomorphismus φ∶ {

K[x] → L . f ↦ f (α)

Sein Bild ist gerade K[α] und sein Kern ist genau das Ideal {h ∈ K[x] ∣ h(α) = } = ⟨ f ⟩, das vom Minimalpolynom erzeugt wird. Nach dem Isomorphiesatz 2.6.13 gilt deshalb K[x]/⟨ f ⟩ ≅ K[α] und nach Lemma 2.6.11 ist K[α] damit ein Körper, da f irreduzibel ist. Es folgt K[α] = K(α).

104

4. KÖRPER

Schließlich müssen wir noch [K(α) ∶ K] = deg( f ) zeigen. Wegen K(α) = K[α] gilt [K(α) ∶ K] = dimK (K[α]). Diese Dimension können wir leicht ausrechnen: Sei n = deg( f ). Die Elemente , α, α  , . . . , α n− sind linear unabhängig über K. Denn eine lineare Abhängigkeit würde ein Polynom vom Grad höchstens n− liefern, das in α verschwindet (vgl. Beweis von Prop. 4.2.5), im Widerspruch zur Minimalität von f . Sei nun V = Lin(, α, . . . , α n− ) der aufgespannte lineai re Unterraum von K[α]. Wir müssen V = K[α] zeigen. Ist f = x n + ∑n− i= a i x , dann folgt aus f (α) =  die Gleichheit n− α n = − ∑i= a i α i ∈ V . i Per Induktion folgt auch α n+ j ∈ V für alle j ⩾ , denn ist α n+ j− = ∑n− i= b i α , dann folgt auch n−

α n+ j = α ⋅ α n+ j− = ∑ b i α i+ + b n− α n ∈ V . i=



Damit ist alles bewiesen. Korollar 4.2.9. Es sei K ⊂ L eine Körpererweiterung und sei α ∈ L. Dann sind äquivalent: (i) Das Element α ist algebraisch über K. (ii) Der Teilring K[α] von L ist ein Körper, das heißt es gilt K[α] = K(α). (iii) Die Körpererweiterung K ⊂ K(α) ist algebraisch. (iv) Der Grad [K(α) ∶ K] ist endlich.

Beweis. (i)⇒(ii) haben wir gerade schon bewiesen. (ii)⇒(i) Der Ring K[α] ist das Bild des Homomorphismus φ∶ K[x] → L, f ↦ f (α). Wenn K[α] ein Körper ist, dann muss Kern(φ) ein maximales Ideal von K[x] sein (Prop. 2.6.8). Also ist Kern(φ) nicht das Nullideal. Es gibt also ein Polynom f ∈ K[x], f ≠ , mit f (α) = . (iii)⇒(i) ist trivial. (i)⇒(iv) haben wir ebenfalls schon in Satz 4.2.8 bewiesen und (iv)⇒(iii) folgt aus Prop. 4.2.5. ∎ Beispiel 4.2.10. Es sei α ∈ C mit α  = , also eine Kubikwurzel von . Dann ist f = x  −  das Minimalpolynom von α und , α, α  ist eine Q-Basis von Q(α). Setze β = α  − . Das Element β ist dann ebenfalls algebraisch und wir möchten sein Minimalpolynom bestimmen. Dazu drücken wir die Potenzen von β in der Basis , α, α  aus β = α −  β = α  − α  +  = α − α  +  β = α  − α  + α  −  =  − α + α  −  = α  − α +  und sehen, dass , β, β  über Q linear unabhängig sind. Sie sind damit eine Basis von Q(α) und es folgt Q(α) = Q(β). Wegen [Q(α) ∶ Q] =  muss , β, β  , β dagegen linear abhängig sein. Um die Abhängigkeit zu finden, können wir das zugehörige lineare Gleichungssystem lösen, oder bloß scharf hinschauen: Es gilt β + β  + β −  = . Das Minimalpolynom von β ist also g = x  + x  + x − . (Das hätten wir auch direkt aus (β + ) = α  =  sehen können, aber hinterher ist man immer klüger.) Wir wissen, das g irreduzibel ist, denn sonst hätte das Minimalpolynom von β kleineren Grad und , β, β  wären linear abhängig. Tatsächlich ist g auch ein Eisenstein-Polynom. Aus Satz 4.2.8 bekommen wir noch eine ganze Reihe nützlicher Folgerungen.

4.2. ALGEBRAISCHE KÖRPERERWEITERUNGEN

105

Korollar 4.2.11. Sind α , . . . , α n ∈ L algebraisch über K, dann ist die Körpererweiterung K ⊂ K(α , . . . , α n ) endlich. Beweis. Nach Satz 4.2.8 ist jeder Schritt in der Kette K ⊂ K(α ) ⊂ K(α , α ) ⊂ ⋯ ⊂ K(α , . . . , α n ) endlich. Da sich die Grade multiplizieren, hat auch K(α , . . . , α n ) endlichen Grad über K.



Korollar 4.2.12. Es seien K ⊂ F ⊂ L Körpererweiterungen. Ist L algebraisch über F und F algebraisch über K, dann ist auch L algebraisch über K. Beweis. Es sei α ∈ L und sei f = ∑ni= a i x i das Minimalpolynom von α über F. Die Koeffizienten a , . . . , a n von f sind algebraisch über K. Deshalb ist auch F ′ = K(a , . . . , a n ) endlich über K, nach Kor. 4.2.11. Ebenso ist die Körpererweiterung F ′ ⊂ F ′ (α) algebraisch und damit endlich. Also ist F ′ (α) auch endlich über K und damit α algebraisch über K. ∎ Korollar 4.2.13. Es sei K ⊂ L eine Körpererweiterung. Dann ist F = {α ∈ L ∣ α ist algebraisch über K} ein Teilkörper von L. Mit anderen Worten, Summen, Produkte und Quotienten von algebraischen Elementen sind wieder algebraisch. Beweis. Seien α, β ∈ F. Die Körpererweiterung K ⊂ K(α, β) ist dann endlich, nach Korollar 4.2.11. Also ist jedes Element von K(α, β) algebraisch über K nach Prop. 4.2.5, insbesondere sind α ± β, αβ und α − algebraisch über K und liegen damit in F. ∎ Zum Beispiel bildet die Menge Ralg = {α ∈ R ∣ α ist algebraisch über Q} der reellen algebraischen Zahlen einen Teilkörper von R. Wir bemerken dazu: Proposition 4.2.14. Der Körper ist Ralg ist abzählbar. Beweis. Jede abzählbare Vereinigung abzählbarer Mengen ist wieder abzählbar. Deshalb ist der Polynomring Q[x] abzählbar. Da jedes Polynom nur endlich viele Nullstellen hat, ist auch die Menge aller möglichen Nullstellen von Polynomen in Q[x] abzählbar, und das ist gerade Ralg . ∎ Da R überabzählbar ist, sind also die ’meisten’ reellen Zahlen transzendent über Q. Bemerkung 4.2.15. Wir haben Satz 4.2.8 mit nicht viel mehr als etwas abstrakter Ringtheorie bewiesen und dann eine ganze Reihe Korollare mühelos daraus gefolgert. Insbesondere haben wir (1) gezeigt, dass das Inverse eines algebraischen Elements α ∈ L ⊃ K im Teilring K[α] liegt, ohne eine Formel für dieses Inverse (wie in Beispiel 4.2.7) auszurechnen. (2) gezeigt, dass Summen, Produkte und Quotienten von algebraischen Elementen algebraisch sind und die Transitivität von algebraischen Körpererweiterungen (Kor. 4.2.12) bewiesen, alles ohne die zugehörigen Polynome zu bestimmen. Es kann immer gute Gründe geben, auch alles explizit ausrechnen zu wollen. Die kurzen Beweise zeigen aber, wie mächtig und flexibel die abstrakte Algebra sein kann.

106

4. KÖRPER

4.3. Konstruktion von Körpererweiterungen Im vorigen Abschnitt haben wir vor allem Körpererweiterungen der Form K(α) betrachtet, wobei α aus einem bereits gegebenen Körper L ⊃ K stammt, zum Beispiel für K = Q und L = R oder L = C. Das ist nicht ganz zufriedenstellend. Zum Beispiel ist nicht klar, was etwa im Fall K = F p die Rolle von L übernehmen soll. Das Problem ist im Prinzip leicht zu lösen: Satz 4.3.1 (Kronecker). Zu jedem Polynom f ∈ K[x] mit deg( f ) ⩾  gibt es eine Körpererweiterung K ⊂ L vom Grad höchstens deg( f ), in der f eine Nullstelle hat.

Beweis. Wir können annehmen, dass f irreduzibel ist, andernfalls ersetzen wir f einfach durch einen seinen irreduziblen Faktoren. Nach Lemma 2.6.11 ist L = K[x]/⟨ f ⟩ ein Körper. Es sei α = x + ⟨ f ⟩ die Restklasse von x in L. Dann gilt f (α) = f (x) + ⟨ f ⟩ = f + ⟨ f ⟩ =  in L. ∎

Diese Idee geht auf Kronecker zurück und wirkt ein bißchen wie ein Zaubertrick. Gerade noch war x die Variable, im nächsten Moment wird es selbst zur Nullstelle. Man kommt sich ein wenig betrogen vor, denn natürlich leistet Satz 4.3.1 rein gar nichts, wenn es darum geht, eine Lösung einer Polynomgleichung in einem gegebenen Körper wie R oder C zu finden. Statt dessen erschafft er aus dem Nichts ein abstraktes Gebilde, eine Körpererweiterung, in der das gegebene Polynom dann aus trivialen Gründen eine Nullstelle besitzt. Darauf muss man erst mal kommen! Definition 4.3.2. Es sei f ∈ K[x] ein irreduzibles Polynom. Eine Körpererweiterung L ⊃ K heißt ein Nullstellenkörper von f , wenn es α ∈ L gibt mit f (α) =  und L = K(α). Wir verwenden die Bezeichung Nullstellenkörper nur für irreduzible Polynome. Nach dem Satz von Kronecker existiert zu jedem irreduziblen Polynom ein Nullstellenkörper. Beispiele 4.3.3. (1) Betrachte das Polynom f = x  + x +  ∈ F [x]. Es ist irreduzibel über F , denn es ist quadratisch und hat keine Nullstelle. Sei L = F [x]/⟨ f ⟩ ein Nullstellenkörper von f und schreibe α = x + ⟨ f ⟩ für die adjungierte Nullstelle. Nach Satz 4.2.8 gilt [L ∶ F ] = deg( f ) = , also hat L vier Elemente. Diese sind , , α, α  . Wir wissen, dass α  + α +  =  gilt und können daraus Addition und Multiplikation in L leicht vollständig bestimmen. +   α α    α α    α α α α α   α α α  

⋅   α α

  α α       α α  α α   α  α

Wir haben also einen Körper mit vier Elementen konstruiert. Dieser Körper ist nicht der Ring Z/, denn der hat ja Nullteiler. Mit endlichen Körpern befassen wir uns systematisch in §4.4.

4.3. KONSTRUKTION VON KÖRPERERWEITERUNGEN

107

(2) Es sei d ∈ Z und f = x  − d ∈ Q[x]. Im Nullstellenkörper L = K[x]/⟨ f ⟩ mit α = x + ⟨ f ⟩ gilt dann α  = d und , α ist eine Basis von L über Q. Es gelten (a + bα) + (a′ + b′ α) = a + a′ + (b + b ′ )α ∈ Q(α) und (a + bα)(a ′ + b ′ α) = (aa ′ + dbb′ + (ab′ + a′ b)α ∈ Q(α). √ Das ist natürlich genau das Gleiche, was wir für den Teilkörper Q( d) von C ausgerechnet hatten, nur dass der Körper L jetzt nicht als Teilkörper von C gegeben ist, sondern freischwebend √ √ existiert. Ist d ∈ C eine Quadratwurzel von d, dann ist die Abbildung α∶ L → C, α ↦ d √ ein Isomorphismus von L auf den Teilkörper Q( d). Allerdings hätten wir auch genauso gut √ √ α ↦ − d nehmen können und hätten einen Isomorphismus von L auf Q(− d). Die beiden Wurzeln sind in diesem Sinn nicht unterscheidbar. Das sagen wir gleich präzise (Prop. 4.3.4). (3) Sei jetzt d ∈ Z eine Zahl, die keine dritte Potenz ist, und sei f = x  − d. Im Körper L = Q[x]/⟨ f ⟩ hat d dann also eine Kubikwurzel α = x + ⟨ f ⟩. Im Polynomring L[x] gilt dann f = x  − d = (x − α)g,

mit g = x  + αx + α  .

Das Polynom g ist irreduzibel. Denn man braucht nach der quadratischen Lösungsformel √ √ −α ± −α  − ± − x= = ⋅α   eine Quadratwurzel von −, um g in Linearfaktoren zu zerlegen. Die gibt es in L aber nicht. √  In C hat d genau drei Kubikwurzeln, nämlich eine reelle Kubikwurzel d ∈ R und die beiden √ √ √ π i π i    komplexen Kubikwurzeln de  , de  . Die Abbildung α ↦ d liefert einen Isomorphismus √  mit dem Teilkörper Q( d) von R. Mit dieser Einbettung ist es am leichtesten zu sehen, dass g irreduzibel ist, denn in R gibt es keine Quadratwurzeln aus negativen Zahlen. Um Nullstellenkörper besser zu verstehen, brauchen wir die folgende Sprechweise: Es sei K ein Körper und seien L und L zwei Erweiterungskörper von K. Ein K-Homomorphismus von L nach L ist ein Homomorphismus φ∶ L → L von Körpern mit φ(a) = a für alle a ∈ K. Jeder K-Homomorphismus ist eine K-lineare Abbildung der K-Vektorräume L , L , denn es gilt φ(aξ) = φ(a)φ(ξ) = aφ(ξ) für alle a ∈ K und ξ ∈ L . Wir schreiben HomK (L , L ) = {φ∶ L → L ∣ φ ist ein K-Homomorphismus} für die Menge der K-Homomorphismen L → L . Ein K-Isomorphismus ist ein Isomorphismus von Erweiterungskörpern von K, der ein K-Homomorphismus ist. Die Körper L und L heißen K-isomorph, wenn ein solcher K-Isomorphismus zwischen ihnen existiert. Proposition 4.3.4. Es sei f ∈ K[x] ein irreduzibles Polynom und L = K(α) ein Nullstellenkörper von f mit f (α) = . Ist E ⊃ K eine beliebige Körpererweiterung, dann ist die Abbildung {

HomK (L, E) → {β ∈ E ∣ f (β) = } φ ↦ φ(α)

108

4. KÖRPER

eine Bijektion. Insbesondere sind je zwei Nullstellenkörper von f K-isomorph. Beweis. Für jedes φ ∈ HomK (L, E) gilt f (φ(α)) = φ( f (α)) = , weil φ K-linear ist. Also liegt φ(α) tatsächlich in der rechten Seite. Es sei F = K[x]/⟨ f ⟩ und γ = x + ⟨ f ⟩ der abstrakte Null∼ stellenkörper von f . Nach Satz 4.2.8 gibt es einen Isomorphismus L Ð → F mit α ↦ γ. Dieser ist auch ein K-Isomorphismus. Ebenso gibt es für jedes β ∈ E mit f (β) =  einen Isomorphismus ∼ F Ð → K(β) mit γ ↦ β. Durch Komposition bekommen wir also einen K-Homomorphismus ∼ φ∶ L Ð → K(β) ⊂ E mit φ(α) = β. Das zeigt, dass die Abbildung in der Behauptung surjektiv ist. Andererseits ist φ ∈ HomK (L, E) durch das Bild φ(α) eindeutig bestimmt, da L von α erzeugt wird. Also ist die angegebene Abbildung auch injektiv. Für den Zusatz sei L′ = K(β) mit f (β) =  ein weiterer Nullstellenkörper von f . Dann gibt es also einen K-Homomorphismus φ∶ L → L′ mit φ(α) = β. Weil L′ von β erzeugt wird, ist φ surjektiv und damit ein K-Isomorphismus. ∎ Satz 4.3.5. Zu jedem Polynom f ∈ K[x] mit deg( f ) ⩾  gibt es eine Körpererweiterung K ⊂ L vom Grad höchstens deg( f )! derart, dass f über L in Linearfaktoren zerfällt. Beweis. Durch Induktion nach n = deg( f ). Für n =  gilt die Behauptung mit L = K. Sei n > . Nach Satz 4.3.1 gibt es eine Körpererweiterung K ⊃ K mit [K ∶ K] ⩽ deg( f ) derart, dass f eine Nullstelle α ∈ K besitzt. In K [x] gibt es dann eine Faktorisierung f = (x − α )g mit g ∈ K [x] vom Grad höchstens n − . Nach Induktionsannahme gibt es eine Körpererweiterung L ⊃ K vom Grad höchstens (n − )! über der g in Linearfaktoren zerfällt. Also zerfällt auch f über L in Linearfaktoren und der Grad von L über K ist [L ∶ K] = [L ∶ K ][K ∶ K] ⩽ (n − )!n = n!. ∎ Definition 4.3.6. Es sei f ∈ K[x] mit deg( f ) ⩾ . Ein Erweiterungskörper L von K heißt ein Zerfällungskörper von f , wenn f über L in Linearfaktoren zerfällt und L über K von den Nullstellen von f erzeugt wird. Beispiel 4.3.7. In Beispiel 4.3.3(3) hat ein Zerfällungskörper von x  − d den Grad  = ! über Q. Denn um alle drei Kubikwurzeln von d zu bekommen muss man erst eine einzelne Kubikwurzel √ √  d adjungieren und dann eine Quadratwurzel −. Satz 4.3.8. Je zwei Zerfällungskörper eines Polynoms f ∈ K[x] sind K-isomorph. Insbesondere haben alle Zerfällungskörper den gleichen Grad, der höchstens deg( f )! ist. Wir beweisen tatsächlich die folgende etwas flexiblere Version dieser Aussage. Satz 4.3.9. Sei L ⊃ K ein Zerfällungskörper von f ∈ K [x] und L ⊃ K ein Zerfällungskörper von f ∈ K [x]. Angenommen es gibt einen Isomorphismus φ∶ K → K mit φ( f ) = f . Dann gibt es einen Isomorphismus ψ∶ L → L mit ψ∣K = φ. Dabei ist φ( f ) koeffizientenweise zu lesen, das heißt es gilt φ(∑ a i x i ) = ∑ φ(a i )x i . Satz 4.3.8 ist der Spezialfall K = K und φ = idK . Der Zusatz über den Grad ist klar nach Kor. 4.3.5. Beweis. Wir führen Induktion nach n = deg( f ) = deg( f ). Für n =  gilt L = K und L = K und die Behauptung ist trivial. Sei also n > . Sei g ein irreduzibler Faktor von f in K [x] und setze

4.3. KONSTRUKTION VON KÖRPERERWEITERUNGEN

109

g = φ(g ). Wähle Nullstellen α i ∈ L i von g i für i = , . Nach Satz 4.2.8 gibt es Isomorphismen K i [x]/⟨g i ⟩ ≅ K i (α i ) mit x ↦ α i (i = , ). ∼



Andererseits induziert der Isomorphismus φ∶ K [x] Ð → K [x] einen Isomorphismus K [x]/⟨g ⟩ Ð → K [x]/⟨g ⟩. Insgesamt bekommt man also einen Isomorphismus ∼

̃∶ K (α ) Ð φ → K (α )

̃(α ) = α und φ ̃∣K = φ. mit φ

Über K i (α i ) faktorisiert g i zu g i = (x − α i )h i mit einem Faktor h i ∈ K i (α i )[x] und L i ist nach Voraussetzung ein Zerfällungskörper von h i über K i (α i ). Dabei gilt ̃(g ) = φ ̃((x − α )h ) = (x − α )φ ̃(h ), (x − α )h = g = φ ̃(h ) = h . Wegen deg(h ) < deg(g ) ⩽ deg( f ) gibt es nach Induktionsvoraussetzung und damit φ ̃. Es folgt ψ∣K = φ und damit die Behauptung. ∎ einen Isomorphimus ψ∶ L → L mit ψ∣K (α ) = φ Zum Abschluss dieses Kapitels diskutieren wir noch die klassischen Lösungsformeln für Polynome vom Grad  und . Für quadratische Gleichungen braucht man bekanntlich immer nur eine einzige Wurzel, was der folgenden Aussage über Körpererweiterungen entspricht. Satz 4.3.10. Es sei K ein Körper der Charakteristik ≠ . Jede quadratische Körpererweiterung L √ von K ist K-isomorph zu einer Erweiterung der Form K( a) mit a ∈ K ∗ . Beweis. Es gelte [L ∶ K] =  und sei α ∈ L ∖ K. Dann ist K(α) also schon mindestens dimensional über K und damit L = K(α). Sei f = x  + a x + a ∈ K[x] das Minimalpolynom von α über K. Also ist α eine Lösung dieser quadratischen Gleichung. Nach der quadratischen Lösungsformel muss es in K also eine Quadratwurzel von a − a geben. Die finden wir durch quadratische Ergänzung. Es gilt a a  = α + a α + a = (α + ) + a −  .   



(An dieser Stelle haben wir char(K) ≠  verwendet.) Setze β = α + a , dann gilt  β  = (a − a ) ∈ K.  Wegen α ∉ K gilt auch β ∉ K und damit L = K(β), also folgt die Behauptung mit a = β .



Für kubische Gleichungen wird es schon komplizierter, wie das folgende Beispiel zeigt. Beispiel 4.3.11. Betrachte das irreduzible (Eisenstein-) Polynom f = x  − x +  ∈ Q[x]. Sei L = Q(α) ein Nullstellenkörper von f mit f (α) = . Das ist eine Körpererweiterung vom Grad  über Q. Man kann zeigen, dass f drei reelle Nullstellen α , α , α in R. hat. Nach Prop. 4.3.4 gibt es deshalb genau drei Einbettungen L → R, nämlich mit α ↦ α i für i = , , . Daran sieht man, √ dass es keine Zahl a ∈ Q mit L = Q(  a) geben kann. Denn das Polynom x  − a hat für a ≠  √ immer genau drei komplexe Nullstellen von denen nur eine reell ist. Also hat Q(  a) nur eine Einbettung nach R, im Unterschied zu L. Körpererweiterungen vom Grad  lassen sich also im allgemeinen nicht mehr durch Adjunktion einer dritten Wurzel beschreiben. Das ist im Kern der Grund, warum es deutlich schwieriger

110

4. KÖRPER

ist, kubische Gleichungen aufzulösen als quadratische. Eine kubische Gleichung hat die Form x  + ax  + bx + c =  mit a, b, c ∈ K. Wir setzen char(K) ≠ ,  voraus. Indem wir x durch x − a ersetzen, können wir erreichen, dass der quadratische Term verschwindet. Die Gleichung hat dann die Form x  + px + q =  mit p, q ∈ K. Wir folgen den Cardanischen Formeln aus dem 16. Jahrhundert und machen zunächst einen Ansatz x = u − v. Dann ist f (x) = u  − u v + uv  − v  + p(u − v) + q = (u  − v  + q) + (p − uv)(u − v). Jetzt versuchen wir u und v so zu finden, dass (1)

u − v  + q =  und

(2)

uv = p

gelten. Multiplikation von (1) mit u  gibt unter Verwendung von (2) die Gleichheit p = .  Das ist eine quadratische Gleichung in u  und hat damit die Lösung √ q q  p + . u = − +    u  + qu  −

Sei A der Ausdruck auf der rechten Seite (für eine fest gewählte Quadratwurzel). Wegen (1) ergibt sich für v die Bedingung √ q q  p v = + + .    Sei B der Ausdruck auf dieser rechten Seite, dann gilt p ,  wie man direkt nachrechnet. Also hat f (ξ) =  die Lösung √ √   ξ = A − B, AB =

wobei die beiden dritten Wurzeln so gewählt sein müssen, dass ihr Produkt p ist, was möglich p ist, wegen AB =  . In dieser Weise findet man insgesamt drei Nullstellen ξ , ξ und ξ von f .

4.4. Endliche Körper Aus den endlichen Primkörpern F p kann man weitere endliche Körper als endliche Erweiterungen konstruieren. In Beispiel 4.3.3(1) haben wir den Körper mit vier Elementen produziert. Das machen wir jetzt systematisch. Außer der vollständigen Klassifikation aller endlichen Körper werden wir auch viele der Argumente, die später für die Galois-Theorie eine Rolle spielen, in ihrer einfachsten Form sehen.

4.4. ENDLICHE KÖRPER

111

Sei K ein endlicher Körper. Der Primkörper von K (Prop. 4.1.5) muss dann ebenfalls endlich sein. Also ist die Charakteristik p = char(K) von K eine Primzahl, und der Primkörper von K ist der endliche Körper F p . Weil K endlich ist, ist der Grad der Körpererweiterung F p ⊂ K endlich. Ist n = [K ∶ F p ] = dimF p (K), dann hat K also genau pn Elemente. Setze q = ∣K∣ = pn . Die multiplikative Gruppe K ∗ = K ∖ {} hat dann q −  Elemente. Deshalb gilt a q− =  für alle a ∈ K ∗ (Kor. 3.2.3). Jedes Element von K ∗ ist also eine Einheitswurzel. Diese Beobachtung reicht aus, um alle endlichen Körper zu konstruieren. Ein Lemma zur Vorbereitung. Lemma 4.4.1. Es sei K ein Körper mit char(K) = p > . Für jedes n ∈ N ist n

E = {α ∈ K ∣ α p = α} ein Teilkörper von K. Beweis. Sei q = pn . Die Menge E ist nicht leer, denn sie enthält  und . Aus α q = α und β q = β folgen (α − β)q = α q − β q = α − β (Prop. 4.1.6), außerdem (αβ)q = α q β q = αβ und, falls β ≠ , (β − )q = (β q )− = β − . Also ist E ein Teilkörper. ∎ Satz 4.4.2. Für jede Primzahl p und jedes n ∈ N gibt es bis auf Isomorphie genau einen Körper mit q = pn Elementen, nämlich den Zerfällungskörper von x q − x über F p . Dies sind alle endlichen Körper. Beweis. Sei K ein Körper mit q = pn Elementen. Aus a q− =  für alle a ∈ K ∗ folgt a q = a für alle a ∈ K. Jedes a ∈ K ist also Nullstelle des Polynoms x q − x ∈ F p [x]. Da dieses Polynom vom Grad q in K höchstens q Nullstellen haben kann, sind die Elemente von K genau alle Nullstellen von x q − x. Es gilt also x q − x = ∏(x − a). a∈K

xq

Also ist K ein Zerfällungskörper von − x. Sei umgekehrt L ein Zerfällungskörper von x q − x, für q = pn . Wir zeigen, dass L genau q Elemente hat. Die formale Ableitung von x q − x ist qx q− −  = − ≠ . Wie in den Übungen bewiesen wurde (siehe Prop. 4.4.3) hat das Polynom x q − x deshalb keine mehrfachen Nullstellen und damit q verschiedene Nullstellen in L. Außerdem bilden die Nullstellen von x q − x nach Lemma 4.4.1 einen Teilkörper E von L. Da L andererseits als Zerfällungskörper von x q − x von diesen Nullstellen erzeugt wird, gilt L = E. Nach Satz 4.3.8 sind außerdem alle Zerfällungskörper von x q − x isomorph. Damit ist alles bewiesen. ∎ Die folgende Aussage wurde gerade verwendet und bereits in den Übungen bewiesen. Proposition 4.4.3. Es sei K ein Körper und f ∈ K[x]. Genau dann ist a ∈ K eine mehrfache Nullstelle von f , wenn a eine gemeinsame Nullstelle von f und seiner Ableitung f ′ ist. Die formale Ableitung ist dabei für f = ∑ni= a i x i durch f ′ = ∑ni= ia i x i− definiert und genügt den üblichen Regeln ( f + g)′ = f ′ + g ′ , ( f g)′ = f ′ g + f g ′ für f , g ∈ K[x] und a ′ =  für a ∈ K.

112

4. KÖRPER

Beweis. Schreibe f = (x − a) q + r mit q, r ∈ K[x] und deg(r) < , etwa r = bx + c mit b, c ∈ K. Es folgt f ′ = (x − a)q + (x − a) q′ + b. Aus (x − a) ∣ f folgt r =  und damit auch f ′ (a) = . Ist umgekehrt f (a) = f ′ (a) = , dann folgt b = f ′ (a) =  und damit c = r(a) = f (a) = , also r = . ∎ Der eindeutig bestimmte Körper mit q = pn Elementen wird mit Fq bezeichnet. Diese endlichen Körper, nicht nur die Primkörper, spielen in vielen Anwendungen eine Rolle, weil der Computer sie vollständig erfassen kann, was aufgrund von begrenztem Speicherplatz ja für keinen unendlichen Körper möglich ist. Ein wichtiges Anwendungsfeld ist die Codierungstheorie, die sich mit der Erkennung und Korrektur von Fehlern beim Übertragen von Nachrichten befasst (Stichwort: Reed-Solomon-Codes). Wir haben nicht die Zeit, darauf einzugehen. Wir wollen uns aber noch kurz damit beschäftigen, wie man in endlichen Körpern konkret rechnet. Beispiel 4.4.4. Der Körper F ist der Zerfällungskörper von x  − x über F . Weil F nur den Grad  über F hat, kann x  − x nicht irreduzibel in F [x] sein. Tatsächlich gilt x  − x = x(x − )(x + )(x  + )(x  + x − )(x  − x − ) und diese Faktoren sind irreduzibel. (Bei den quadratischen genügt es zu überprüfen, dass sie keine Nullstellen in F besitzen.) Der Körper F muss also bereits der Zerfällungskörper von jedem der quadratischen Faktoren sein. Ist zum Beispiel α eine Nullstelle von x  + , dann gilt x  +  = (x − α)(x + α), x  + x −  = (x − α − )(x + α − ), x  − x −  = (x − α + )(x + α + ). Es gilt also F = F (α). Wegen α  = − kann man F als eine Art komplexe Zahlen über F auffassen. Jedes Element von F hat eine Darstellung a+bα mit a, b ∈ F . Die Addition in F kann man mit so einer Darstellung natürlich sehr leicht ausführen. Für die Multiplikation muss man dagegen immer einen quadratischen Ausdruck vereinfachen, wie zum Beispiel (α + )(α + ) = α  + α +  = −. Mit dem, was wir über endliche abelsche Gruppen wissen, können wir die multiplikative Gruppe eines endlichen Körpers noch wesentlich genauer verstehen. Satz 4.4.5. Jede endliche Untergruppe der multiplikativen Gruppe eines Körpers ist zyklisch. Beweis. Es sei K ein Körper und G ⊂ (K ∗ , ⋅) eine endliche Untergruppe. Nach dem Basissatz für abelsche Gruppen in der Form von Kor. 3.7.14 ist G ein direktes Produkt von zyklischen Gruppen G ≅ C × ⋯ × C k , wobei die Ordnung n = ∣C ∣ die übrigen Ordnungen ∣C ∣, . . . , ∣C k ∣ teilt. Die Elemente von C sind allesamt n-te Einheitswurzeln in K. Wäre k > , dann gäbe es in G aber noch weitere Elemente der Ordnung n, ein Widerspruch. Also gilt k =  und G ist zyklisch. ∎ Beispiel 4.4.6. Die multiplikative Gruppe von F ist zyklisch der Ordnung . Sei α eine Nullstelle von x  +  ∈ F [x], wie in Beispiel 4.4.4. Das Element α ist kein Erzeuger der zyklischen Gruppe

4.5. NORMALE KÖRPERERWEITERUNGEN

113

F∗ der Ordnung , denn es gilt α  = . Allerdings ist α +  ein Erzeuger, denn es gilt i (α + )i

         α +  α α +   α +  α α + .

Jedes Element ungleich  in F ist also eine Potenz von ζ = α + . Mit dieser Darstellung wird die Multiplikation in F also sehr einfach. Im Ausgleich dafür ist die Addition wenig offensichtlich. Zum Beispiel gilt ζ  + ζ  = α + α +  = α +  = ζ. Schließlich können wir noch die Inklusionen zwischen endlichen Körpern untersuchen. Alle Körper F pn mit n ∈ N enthalten F p , aber welche Teilkörper gibt es noch? Proposition 4.4.7. Der Körper F pn enthält für jeden Teiler d von n genau einen Teilkörper der Ordnung pd , nämlich d E = {α ∈ F pn ∣ α p = α} und dies sind alle Teilkörper von F pn . Beweis. Die multiplikative Gruppe F pn ist nach Satz 4.4.5 zyklisch der Ordnung pn − . Sie besitzt für jeden Teiler von pn −  genau eine Untergruppe der entsprechenden Ordnung. Für d ∈ N ist (pd − )∣(pn − ) zu d∣n äquivalent (siehe Übungsblatt 4). Es kann also für jeden Teiler d∣n höchstens einen Teilkörper von F pn mit pd Elementen geben, und keine weiteren Teilkörper. Ist umgekehrt d ein Teiler von n, dann ist die zugehörige Untergruppe von F∗pn gerade die angegebene Menge E ohne die Null und nach Lemma 4.4.1 ist E ein Teilkörper. ∎ Korollar 4.4.8. Genau dann gibt es einen Homomorphismus F pm → F pn , wenn m∣n gilt.



Beweis. Denn da jeder solche Homomorphismus von Körpern eine Einbettung (also injektiv) ist, ist das Bild ein Teilkörper mit pm Elementen. ∎

4.5. Normale Körpererweiterungen Als Vorbereitung auf die Galois-Theorie vertiefen wir in diesem und im folgenden Abschnitt das Studium algebraischer Körpererweiterungen, in dem wir zwei wichtige Eigenschaften solcher Erweiterungen einführen. In §4.3 haben wir zu einem Polynom f mit Koeffizienten in einem Körper K eine Körpererweiterung K ⊂ L konstruiert derart, dass f in L[x] in Linearfaktoren zerfällt, den Zerfällungkörper von f über K. Wir gehen nun folgender Frage nach: Welche Polynome aus K[x] zerfallen außer f in L[x]? Dazu führen wir die folgende Terminologie ein. Definition 4.5.1. Eine Körpererweiterung K ⊂ L heißt normal, wenn sie algebraisch ist und jedes irreduzible Polynom f ∈ K[x], das in L eine Nullstelle besitzt, in L[x] in Linearfaktoren zerfällt. Proposition 4.5.2. Jede Erweiterung K ⊂ L von endlichen Körpern ist normal. Beweis. Es sei f ∈ K[x] ein irreduzibles Polynom vom Grad n, das in L eine Nullstelle α besitzt. Sei F ⊃ L ein Zerfällungskörper von f über L und seien α , . . . , α n ∈ F alle Nullstellen von f . Für

114

4. KÖRPER

jedes i = , . . . , n ist dann K(α i ) ⊂ F ein Teilkörper von F mit [K(α i ) ∶ K] = n, also mit ∣K∣n Elementen. Nach Prop. 4.5.2 kann F aber nur einen einzigen solchen Körper enthalten. Es folgt K(α n ) = ⋯ = K(α ) = L und damit die Behauptung. ∎ Beispiel 4.5.3. Bei unendlichen Körpern stimmt das nicht, wie wir bereits gesehen haben. Es sei d ∈ Q eine Zahl, die keine dritte Potenz ist und sei α ∈ C eine Kubikwurzel von d, also eine Nullstelle von f = x  − d. Wie wir in Beispiel 4.3.3(3) gesehen haben, zerfällt f in Q(α) noch nicht in Linearfaktoren. Also ist die Körpererweiterung Q ⊂ Q(α) nicht normal. √ Ein Zerfälllungskörper von f ist L = Q(α, −). Die Körpererweiterung Q ⊂ L hat Grad  über Q und ist normal, wie wir jetzt beweisen. Proposition 4.5.4. Eine endliche Körpererweiterung K ⊂ L ist genau dann normal, wenn sie ein Zerfällungskörper eines Polynoms in K[x] ist. Beweis. Sei K ⊂ L endlich und normal, etwa L = K(α , . . . α n ). Sei f i ∈ K[x] das Minimalpolynom von α i über K. Nach Voraussetzung zerfällt f i in L in Linearfaktoren. Also zerfällt auch f = f ⋯ f n . Da L über K durch Nullstellen von f erzeugt wird, ist L ein Zerfällungskörper von f . Es sei umgekehrt L ein Zerfällungskörper von f ∈ K[x] und seien α , . . . , α n die Nullstellen von f in L. Sei g ∈ K[x] ein irreduzibles Polynom, das in L eine Nullstelle β besitzt. Wir müssen zeigen, dass g in L[x] in Linearfaktoren zerfällt. Sei dazu F ⊃ L ein Zerfällungskörper von g, aufgefasst als Polynom in L[x] und sei β ′ in F eine Nullstelle von g. Wir zeigen, dass β ′ bereits in L liegt, was F = L und damit die Behauptung impliziert. Da g irreduzibel ist, gibt es nach ∼ Prop. 4.3.4 einen K-Isomorphismus der beiden Nullstellenkörper φ∶ K(β) Ð → K(β′ ). Nun ist L ein Zerfällungskörper von f über K und damit auch über K(β) und L(β ′ ) ist ein Zerfällungskörper von f über K(β ′ ). Nach Satz 4.3.9 gibt es einen Isomorphismus ψ∶ L → L(β ′ ) mit ψ∣K(β) = φ. Die Situation ist in folgendem kommutierenden Diagramm dargestellt. L

K(β)

ψ

φ

L(β ′ )

K(β ′ )

Für die Grade dieser Körpererweiterungen gilt deshalb [L ∶ K] = [L ∶ K(β)][K(β) ∶ K] = [L(β ′ ) ∶ K(β′ )][K(β′ ) ∶ K] = [L(β ′ ) ∶ K]. Wegen [L(β ′ ) ∶ K] = [L(β ′ ) ∶ L][L ∶ K] folgt [L(β ′ ) ∶ L] =  und damit L = L(β′ ), also β ′ ∈ L. Alles weitere, was wir über normale Erweiterungen wissen müssen, steckt im folgenden Satz. Satz 4.5.5. (1) Es seien K ⊂ L ⊂ N endliche Körpererweiterungen. Wenn N normal über K ist, dann auch über L. (2) Es sei K ⊂ L eine endliche Körpererweiterung. Dann gibt es eine endliche Körpererweiterung L ⊂ N derart, dass N über K normal ist.



4.6. SEPARABLE KÖRPERERWEITERUNGEN

115

(3) Unter allen Körpererweiterungen L ⊂ N wie in (2) gibt es eine kleinste L ⊂ N . Das heißt zu jeder Erweiterung L ⊂ N, die normal über K ist, gibt es einen LIsomorphismus von N auf einen Teilkörper von N. Insbesondere ist N bis aus LIsomorphie eindeutig bestimmt. Die in (3) konstruierte Körpererweiterung L ⊂ N heißt die normale Hülle von L über K. Beweis. (1) Es sei f ∈ L[x] ein irreduzibles Polynom und α ∈ N eine Nullstelle von f . Weil N auch über K endlich ist, ist α algebraisch über K und hat ein Minimalpolynom g ∈ K[x]. Dieses zerfällt über L in irreduzible normierte Faktoren g = g ⋯g k , g i ∈ L[x]. Wegen g(α) =  gibt es ein i mit g i (α) = . Weil es irreduzibel ist und g i (α) =  gilt, ist g i das Minimalpolynom von α über L, mit anderen Worten, es gilt g i = f . Nun zerfällt g nach Voraussetzung in Linearfaktoren in N[x]. Nach der Eindeutigkeit der Zerlegung in L[x] zerfällt auch f . (2) und (3) Sei L = K(α , . . . , α n ) und seien f , . . . , f n die zugehörigen Minimalpolynome. Sei N der Zerfällungskörper von f = f ⋯ f n über L. Weil f ∈ L[x] über N in Linearfaktoren zerfällt, enthält N einen Zerfällungskörper N ′ von f über K. Dieser Zerfällungskörper enthält die Nullstellen α, . . . , α n von f und damit auch L. Also ist auch N ′ ⊂ N ein Zerfällungskörper von f über L und es folgt N = N ′ . Damit ist N normal über K und (2) ist bewiesen. Sei nun L ⊂ N eine Körpererweiterung, die über K normal ist. Weil jedes der Polynome f , . . . , f n in L eine Nullstelle besitzt, zerfallen diese Polynome in N[x] in Linearfaktoren. Deshalb enthält N einen Zerfällungskörper von f über L. Dieser ist zu N ′ = N wie oben isomorph. ∎ Bemerkung 4.5.6. Satz 4.5.5 gibt auch einen alternativen Beweis dafür, dass jede Erweiterung K ⊂ L endlicher Körper normal ist (Prop. 4.5.2). Denn ist p = char(K), dann ist L nach Satz 4.4.2 der Zerfällungskörper eines Polynoms über dem Primkörper F p und damit normal über F p . Nach Satz 4.5.5(1) ist L damit auch normal über K.

4.6. Separable Körpererweiterungen Bei Körpern mit Primzahlcharakteristik kann es vorkommen, dass ein irreduzibles Polynom eine mehrfache Nullstelle hat, was in Charakteristik  nicht passieren kann. Eine algebraische Körpererweiterung, die eine solche mehrfache Nullstelle enthält, wird inseparabel genannt, sonst separabel. Das Phänomen spielt vor allem für die Zahlentheorie eine Rolle. Es zeigt sich, dass die separablen Erweiterungen in bestimmter Hinsicht sehr viel einfacher zu verstehen sind, so dass wir uns in den weiteren Abschnitten auf diese Erweiterungen konzentrieren werden. Wir beginnen mit einigen Überlegungen zu p-ten Wurzeln in Charakteristik p > . Definition 4.6.1. Ein Körper K heißt vollkommen, wenn er die Charakteristik  hat oder wenn char(K) = p prim ist und jedes Element in K eine p-te Wurzel besitzt. Ist K ein Körper von Primzahlcharakteristik p, dann ist die Abbildung K → K, a ↦ a p ein Homomorphismus (Prop. 4.1.6), der Frobenius-Homomorphismus. Sein Bild sind genau die Elemente mit p-ten Wurzeln in K. Da außerdem jeder Homomorphismus zwischen Körpern injektiv ist, gilt insbesondere folgendes.

116

4. KÖRPER

Proposition 4.6.2. In einem Körper K der Charakteristik p >  kann ein Element a ∈ K höchstens eine p-te Wurzel besitzen. ∎ Proposition 4.6.3. Jeder endliche Körper ist vollkommen. Beweis. Da der Frobenius-Homomorphismus injektiv ist, ist er in diesem Fall auch surjektiv. ∎ Beispiel 4.6.4. Ein Beispiel für einen nicht-vollkommenen Körper ist der rationale Funktionenkörper K(y) über einem Körper K von Primzahlcharakteristik p in einer Variablen y. Denn offenbar hat die Variable y in K(y) keine p-te Wurzel. Das Polynom x p − y ∈ K(y)[x] hat also im Körper K(y) keine Nullstelle. Wenn wir andererseits zu einer Körpererweiterung K(y) ⊂ L übergehen, in der α ∈ L eine Nullstelle von x p − y ist, dann ist α nach Prop. 4.6.2 die einzige p-te Wurzel von y und es gilt x p − y = (x − α) p . Damit sehen wir die Verbindung zu Polynomen mit mehrfachen Nullstellen. Definition 4.6.5. Ein Polynom f ∈ K[x] vom Grad n heißt separabel, wenn es in seinem Zerfällungskörper n verschiedene Nullstellen hat. Proposition 4.6.6. Ein irreduzibles Polynom f ist separabel, falls seine Ableitung f ′ nicht das Nullpolynom ist. Über einem Körper der Charakteristik  ist jedes irreduzible Polynom separabel. Beweis. Sei f ∈ K[x] irreduzibel mit f ′ ≠  und sei L ⊃ K ein Zerfällungskörper von f . Angenommen f hat eine mehrfache Nullstelle α ∈ L. Nach Prop. 4.4.3 gilt dann f ′ (α) = . Dann haben f und f ′ einen gemeinsamen Teiler in K[x], nämlich das Minimalpolynom von α über K. Da f irreduzibel ist, muss f ∣ f ′ gelten. Ist f ′ ≠ , dann ist das wegen deg( f ′ ) < deg( f ) unmöglich. Falls char(K) = , dann ist die Ableitung eines irreduziblen Polynoms niemals das Nullpolynom. ∎ Lemma 4.6.7. Sei K ein Körper der Charakteristik p > . Für f ∈ K[x] gilt f ′ =  genau dann, wenn f (x) = g(x p ) für ein g ∈ K[x] gilt. Beweis. Aus f (x) = g(x p ) folgt f ′ = , wie man direkt sieht. Sei umgekehrt f = ∑ni= a i x i ein Polynom mit f ′ = . Dann gilt also ia i =  für i = , . . . , n und damit a i =  für jedes i, das nicht durch p teilbar ist. Also hat f die Form f = a + a p x p + ap x p + ⋯ + asp x sp und damit f = g(x p ) für g = ∑si= a i p x i .



Definition 4.6.8. Es sei K ⊂ L eine algebraische Körpererweiterung. Ein Element α ∈ L heißt separabel über K, wenn sein Minimalpolynom über K separabel ist. Die Erweiterung K ⊂ L heißt separabel, wenn jedes Element von L separabel über K ist. Proposition 4.6.9. Ein Körper K ist genau dann vollkommen, wenn jede algebraische Körpererweiterung von K separabel ist. Beweis. Falls char(K) =  gilt, dann ist nichts zu zeigen. Sei also char(K) = p >  und sei f ∈ K[x] irreduzibel. Wenn f nicht separabel ist, dann folgt f ′ =  und damit f = g(x p ) für ein g ∈ K[x] nach Lemma 4.6.7, etwa f = a + a x p + a x p + ⋯ + as x sp .

4.6. SEPARABLE KÖRPERERWEITERUNGEN

117 p

Da K vollkommen ist, gibt es für jedes i = , . . . , s ein Element b i ∈ K mit b i = a i . Es folgt p

p

p

f = b + b x p + ⋯ + bs x sp = (b + b x + ⋯ + bs x s ) p , im Widerspruch zur Irreduzibilität von f . Also ist jedes irreduzible Polynom in K[x] separabel und damit auch jede algebraische Körpererweiterung von K. Sei umgekehrt K nicht vollkommen und sei a ∈ K ein Element, das keine p-te Wurzel in K besitzt. Sei β eine Nullstelle von x p − a in einem Zerfällungskörper L, dann folgt x p − a = (x − β) p . Jeder Teiler von x p − a in L[x] hat also die Form (x − β)k für ein k ∈ {, . . . , p}. Für k < p hat dieses Polynom aber niemals Koeffizienten in K, wegen β ∉ K. Deshalb ist x p − a in K[x] irreduzibel und damit K ⊂ L nicht separabel. ∎ Satz 4.6.10 (Satz vom primitiven Element). Jede endliche separable Körpererweiterung K ⊂ L wird von einem Element erzeugt, das heißt, es gibt α ∈ L mit L = K(α). Ein solches Element α wird ein primitives Element der Körpererweiterung K ⊂ L genannt. Beweis. Falls K ein endlicher Körper ist, dann ist auch L endlich und die multiplikative Gruppe L∗ nach Satz 4.4.5 zyklisch. Also gilt L = K(α) für jeden Erzeuger α von L∗ . Wir können also annehmen, dass K unendlich ist. Da die Erweiterung K ⊂ L endlich ist, wird L über K von endlich vielen Elementen α , . . . , α n erzeugt. Wir beweisen die Behauptung durch Induktion nach n. Für n =  ist nichts zu zeigen. Für den Induktionsschritt genügt es, den Fall n =  zu beweisen, denn ist n ⩾ , so folgt dann L = K(α , . . . , α n ) = K(α , . . . , α n )(a ) = K(β)(α ) = K(α , β) = K(γ) für geeignete β, γ ∈ L nach Induktionsvoraussetzung. Sei also n = , etwa L = K(α, β). Wir zeigen, dass es c ∈ K ∗ gibt derart, dass L = K(β − cα) gilt. Sei f das Minimalpolynom von α über K und g das von β. Sei außerdem F ⊃ L ein Zerfällungskörper von f g. Weil f separabel ist, hat f in L dann m = deg( f ) verschiedene Nullstellen α , . . . , α m mit etwa α = α und g hat n = deg(g) Nullstellen β , . . . , β n mit β = β. Sei c ∈ K ∗ und setze γ = β − cα. Dann ist α eine Nullstelle von f und auch von h = g(γ + cx) ∈ L[x]. Falls f und h in F keine weiteren gemeinsamen Nullstellen haben, dann ist also (x − α) der größte gemeinsame Teiler von f und h. Da beide Polynome in K(γ)[x] liegen, gilt das auch für ihren größten gemeinsamen Teiler. Es folgt α ∈ K(γ) und β = γ + cα ∈ K(γ), und wir sind fertig. Wir müssen c ≠  also so wählen, dass α , . . . , α m keine Nullstellen von h sind. Das ist immer möglich. Denn falls h(α i ) =  für ein i ⩾ , dann folgt aus h(α i ) = g(γ + cα i ) = g(β − cα + cα i ), dass β − cα + cα i = β j für ein j ∈ {, . . . , n} und damit c=

βj − β αi − α

gelten muss. Das sind für i = , . . . , m und j = , . . . , n nur endlich viele Werte von c. Weil K unendlich ist, gibt es also unendlich viele c ∈ K mit der gewünschten Eigenschaft. ∎ Bemerkung 4.6.11. Der Beweis liefert einiges, was über die Aussage hinausgeht. Erstens haben wir nicht gebraucht, dass jedes Element in L separabel über K ist. Damit eine Erweiterung K(α, β) ein primitives

118

4. KÖRPER

Element besitzt, genügt es, dass eines von α oder β separabel über K ist. Allgemein besitzt eine endliche Erweiterung K(α , . . . , α n ) ein primitives Element, solange nicht mehr als ein α i nicht separabel ist. Außerdem zeigt der Beweis, dass das Element β + cα in K(α, β) nur für endlich viele c ∈ K nicht primitiv ist. Insbesondere kann man c in einem unendlichen Körper K zufällig wählen (in einem geeignetem Sinn) und findet mit Wahrscheinlichkeit  ein primitives Element. Allgemeiner kann man zeigen: Genau dann besitzt die Körpererweiterung K ⊂ L ein primitives Element, wenn es nur endlich viele Zwischenkörper K ⊂ F ⊂ L gibt. Sind dann F , . . . , Fr alle echten Zwischenkörper, dann ist jedes Element in L ∖ (F ∪ ⋯ ∪ Fr ∪ K) primitiv. Die Zwischenkörper sind echte lineare Unterräume von L. Man muss also nur diese endlich vielen Unterräume vermeiden, um ein primitives Element zu finden.

√ √ √ √ Beispiel 4.6.12. Betrachte die reellen Quadratwurzeln ,  ∈ R. Sei L = Q( , ) und seien f = x  −  und g = x  −  die Minimalpolynome. Der Beweis des Satzes vom primitiven √ √ Element zeigt im Prinzip genau, für welche c ∈ Q das Element  + c  primitiv ist. Aber selbst in diesem einfachen Fall ist es schon etwas mühsam, diese Bedingung hinzuschreiben. √ √ √ Zum Beispiel ist  +  primitiv. Nach Beweis genügt es dafür zu zeigen, dass − , die zweite √ √ Nullstelle von f , keine Nullstelle von g(  +  − x) ist, was man leicht nachrechnen kann. √ √ Um das direkt zu sehen, kann man sich die Potenzen von γ =  +  anschauen und etwa √ √ γ =   +   berechnen, woraus

√ γ − γ =  √ √ √ √ und damit ,  ∈ Q(  + ) folgen.

und

√ γ − γ  = 

4.7. Automorphismen und Galois-Gruppen Die Galois-Theorie untersucht die Symmetrie der Lösungen von Polynomgleichungen. In der Lösungsformel für die quadratische Gleichung steckt diese Symmetrie in den beiden Vorzeichen vor der Wurzel. Im allgemeinen lässt sich das am besten durch Homomorphismen ausdrücken. Es seien E und F zwei Körper. Wir schreiben Hom(E, F) = {φ∶ E → F ∣ φ ist ein Homomorphismus} für die Menge aller Homomorphismen E → F. Wir können Hom(E, F) als Teilmenge der Menge Abb(E, F) aller Abbildungen E → F auffassen. Das ist ein F-Vektorraum, denn aus φ, φ′ ∈ Abb(E, F) und β, β ′ ∈ F entsteht die Abbildung (βφ + β ′ φ′ )∶ x ↦ βφ(x) + β′ φ′ (x). Allerdings ist die Teilmenge Hom(E, F) kein Untervektorraum von Abb(E, F), denn für φ ∈ Hom(E, F) gilt immer φ() = . Lemma 4.7.1 (Dedekind). Es seien E und F zwei Körper. Jede Menge von verschiedenen Homomorphismen E → F ist linear unabhängig über F. Beweis. Es sei {φ i }i∈I eine (beliebig indizierte) Familie von verschiedenen Homomorphismen E → F. Angenommen, sie sind linear abhängig. Dann gibt es (per Definition) eine endliche

4.7. AUTOMORPHISMEN UND GALOIS-GRUPPEN

119

linear abhängige Teilfamilie und wir wählen eine minimale solche. Seien etwa φ , . . . , φr linear abhängig, aber jede echte Teilfamilie linear unabhängig. Dann können wir etwa r

φ = ∑i= β i φ i mit β , . . . , βr ∈ F schreiben. Für x, y ∈ E gelten dann r

φ (x) = ∑i= β i φ i (x) r

φ (x y) = ∑i= β i φ i (x)φ i (y). Wenn wir die erste Zeile mit φ (y) multiplizieren und von der zweiten abziehen, dann folgt r

∑i= β i (φ i (y) − φ (y))φ i (x) = . Diese Identität gilt für alle x ∈ E und nach Voraussetzung sind φ , . . . , φr linear unabhängig. Es folgt also β i (φ i (y) − φ (y)) =  für i = , . . . , r. Wegen φ i ≠ φ folgt β = ⋯ = βr = , was wegen φ () =  ein Widerspruch ist. ∎ Es seien nun K ⊂ E, F zwei Körpererweiterungen. Ein K-Homomorphismus φ∶ E → F ist bekanntlich ein Homomorphismus von Körpern, der K-fixiert, also φ(a) = a

für alle a ∈ K

erfüllt. Genau dann ist ein Homomorphismus φ∶ E → F ein K-Homomorphismus, wenn er eine K-lineare Abbildung zwischen den K-Vektorräumen E und F ist (vgl. §4.3). Für die Menge aller K-Homomorphismen E → F schreiben wir HomK (E, F). Korollar 4.7.2. Sind E ⊃ K und F ⊃ K zwei Körpererweiterungen und ist [E ∶ K] = n < ∞, dann gibt es höchstens n verschiedene K-Homomorphismen E → F. Beweis. Es sei α , . . . , α n eine K-Basis von E und seien φ , . . . , φ n+ ∶ E → F Homomorphismen. Betrachte die Gleichungen n+

∑ φ i (α j )x i =  i=

( j = , . . . , n).

Das sind n lineare Gleichungen in n +  Variablen x , . . . , x n+ . Das Gleichungssystem ist deshalb unterbestimmt und hat eine nicht-triviale Lösung x i = β i (i = , . . . , n + ) in F. Weil α , . . . , α n eine K-Basis sind, hat jedes α ∈ E eine Darstellung α = ∑nj= a j α j mit a , . . . , a n ∈ K, und es folgt n+

n+ n

(∑i= β i φ i )(α) = ∑ ∑ a j β i φ i (α j ) = . i= j=

Also sind φ , . . . , φ n+ linear abhängig über F. Nach dem Lemma von Dedekind müssen unter den Homomorphismen φ , . . . , φ n+ deshalb zwei gleich sein. ∎ Wie wir wissen, ist jeder Homomorphismus von Körpern injektiv. Ist L ⊂ K eine endliche Körpererweiterung, dann ist jeder K-Homomorphismus L → L also eine injektive lineare Abbildung eines endlich-dimensionalen Vektorraums in sich und damit auch surjektiv, also bijektiv. Seine Umkehrabbildung ist wieder ein K-Homomorphismus. Ein solcher bijektiver KHomomorphismus wird K-Automorphismus von L genannt. Die K-Automorphismen von L

120

4. KÖRPER

bilden unter Komposition eine Gruppe, die nach Kor. 4.7.2 aus höchstens [L ∶ K] Elementen besteht. Das Studium dieser Gruppe ist die Galois-Theorie. Beispiel 4.7.3. Betrachte die Körpererweiterung R ⊂ C. Hier gilt [C ∶ R] = . Nach Kor. 4.7.2 hat C deshalb höchstens zwei R-Automorphismen. Einer ist die Identität und der andere ist die komplexe Konjugation a + bi ↦ a − bi. Proposition 4.7.4. Sei K ⊂ K(α) eine algebraische Körpererweiterung und f ∈ K[x] das Minimalpolynom von α. Für jeden K-Automorphismus σ von K(α) gilt dann f (σ(α)) = , und zu jeder Nullstelle β von f in K(α) gibt es genau einen K-Automorphismus σ mit σ(α) = β. Beweis. Das folgt direkt aus Prop. 4.3.4. Wir wiederholen aber noch einmal den Teil des Arguments, den man direkt sehen kann: Ist n = deg( f ) = [K(α) ∶ K], dann hat jedes Element i x ∈ K(α) eine Darstellung x = ∑n− i= a i α mit a  , . . . , a n− ∈ K. Für jeden K-Automorphismus σ von K(α) gilt deshalb n−

n−

σ(∑i= a i α i ) = ∑ a i σ(α)i . i=

Also ist σ durch σ(α) eindeutig bestimmt. Wegen f ∈ K[x], etwa f = ∑ni= c i x i , gilt außerdem n

n

i=

i=

f (σ(α)) = ∑ c i σ(α)i = σ(∑ c i α i ) = σ( f (α)) = σ() = . Für die Existenz von σ mit σ(α) = β zu einer beliebigen Nullstelle β von f siehe Prop. 4.3.4. ∎ Definition 4.7.5. Eine Körpererweiterung heißt galoissch oder eine Galois-Erweiterung, wenn sie normal und separabel ist. Die Gruppe der K-Automorphismen einer Galois-Erweiterung K ⊂ L heißt die Galois-Gruppe von L über K und wird mit Gal(L/K) bezeichnet. Satz 4.7.6. Es sei K ⊂ L eine endliche Galois-Erweiterung. Dann hat die Galois-Gruppe Gal(L/K) genau [L ∶ K] Elemente. Beweis. Da L über K endlich und separabel ist, besitzt L ein primitives Element. Sei also L = K(α) und sei f ∈ K[x] das Minimalpolynom von α über K vom Grad n = [L ∶ K]. Weil L normal und separabel ist, hat f also n verschiedene Nullstellen α = α , . . . , α n ∈ L. Nach Prop. 4.3.4 sind die K-Automorphismen L → L also gerade durch die n Zuordnungen α ↦ α , . . . , α ↦ α n von α auf eine andere Nullstelle von f gegeben.



Beispiele 4.7.7. (1) Ist K ein Körper mit Charakteristik char(K) ≠  und K ⊂ L eine quadra√ tische Körpererweiterung, dann gibt es nach Satz 4.3.10 ein Element d ∈ K mit L = K( d). Der einzige K-Automorphismus von L außer der Identität ist deshalb √ √ a + b d ↦ a − b d. Die Galois-Gruppe Gal(L/K) ist also zyklisch der Ordnung . Ist dagegen char(K) = , dann √ √ hat x  − a in L eine doppelte Nullstelle a = − a und es gibt gar keinen nicht-trivialen KAutomorphismus von L. Das liegt daran, dass die Körpererweiterung nicht separabel ist.

4.7. AUTOMORPHISMEN UND GALOIS-GRUPPEN

121

(2) Im Grad  betrachten wir wieder das irreduzible kubische Polynom f = x −  über Q. Ist α eine komplexe Nullstelle von f , dann faktorisiert f in Q(α) zu f = (x − α)(x  + αx + α  ). Die Nullstellen des quadratischen Faktors sind ωα, ω α,

√ − + − mit ω = . 

√ (Beachte ω = (− − −)/ und ω = .) Der Zerfällungskörper von f ist deshalb L = Q(α, ω) = √ Q(α, −) und hat Grad  über Q. Wenn wir dem Beweis von Satz 4.7.6 folgen, können wir ein primitives Element γ ∈ L suchen (zum Beispiel tut es γ = α + ω — siehe Übungen) und dann bemerken, dass ein Automorphismus σ ∈ Gal(L/Q) eindeutig durch σ(γ) bestimmt ist, was jede der sechs Nullstellen des Minimalpolynoms von γ sein kann. Das sagt uns aber noch nicht, wie die Galois-Gruppe auf den Nullstellen von f operiert. Die drei Nullstellen von f in L sind α, ωα, ω α. Die Galois-Gruppe permutiert diese drei Nullstellen und ist deshalb isomorph zu einer Untergruppe von S . Weil sie die Ordnung  hat, folgt Gal(L/Q) ≅ S . Die Galois-Gruppe realisiert also jede mögliche Permutation der Nullstellen von f . Explizit ist die Transposition τ ∈ Gal(L/Q), die α mit ωα vertauscht und ω α fixiert, gegeben durch τ(α) = ωα, τ(ω) = ω , denn es folgen dann τ(ωα) = τ(ω)τ(α) = ω ωα = α

und

τ(ω α) = τ(ω) τ(α) = ω α = ω α.

Der Dreizykel, der die drei Nullstellen zyklisch vertauscht, ist dagegen durch σ(α) = ωα, σ(ω) = ω gegeben, denn es gelten σ(ωα) = σ(ω)σ(α) = ω α

und

σ(ω α) = σ(ω) σ(α) = ω α = α.

(3) Der Zerfällungskörper eines irreduziblen Polynoms vom Grad  über Q hat allerdings nicht immer den Grad . Betrachte ein kubisches Polynom der Form x  + bx + c mit b, c ∈ Q. Ist α ∈ C eine komplexe Nullstelle, dann faktorisiert f über Q(α) zu f = (x − α)(x  + αx + α  + b) Die Nullstellen des quadratischen Faktors sind √ −α ± −α  − b . 

122

4. KÖRPER

Für die meisten Wahlen von b und c ist α ∉ Q und die Diskriminante −α  − b kein Quadrat in Q(α). Man braucht dann also noch eine Quadratwurzel, um zum Zerfällungskörper zu gelangen, der damit Grad  hat, wie im vorigen Beispiel. Es gibt aber auch Ausnahmen. Für etwa b = − und c =  ist f = x  − x +  irreduzibel über Q und die Diskriminante −α  +  trotzdem ein Quadrat in Q(α), nämlich −α  +  = (α  + α − ) , wie man direkt nachrechnet. Durch Einsetzen erhält man drei Nullstellen von f in Q(α), nämlich α, α  − , −α  − α + . Also ist Q(α) der Zerfällungskörper von f über Q, der damit den Grad  hat.3 Die Galois-Gruppe hat also ebenfalls  Elemente. Sie ist zyklisch der Ordnung  und vertauscht die drei Nullstellen von f zyklisch mit einander. Im Unterschied zum vorigen Beispiel ist hier also nicht jede Permutation der Nullstellen möglich. Die Galois-Gruppe Gal(L/K) einer Galois-Erweiterung K ⊂ L operiert auf L, das heißt Gal(L/K) × L → L, (σ , α) ↦ σ(α) ist eine Gruppenoperation. Wir schauen uns zunächst ihre Bahnen an. Definition 4.7.8. Sei K ⊂ L eine Galois-Erweiterung. Zwei Elemente α, β in L heißen konjugiert über K (oder genauer Galois-konjugiert über K), wenn es σ ∈ Gal(L/K) gibt mit σ(α) = β. Zwei Elemente sind also genau dann konjugiert über K, wenn sie in der derselben Bahn unter der Operation der Galois-Gruppe liegen. Lemma 4.7.9. Es sei K ⊂ L eine endliche Galois-Erweiterung und K ⊂ F ⊂ L ein Zwischenkörper. Jeder K-Automorphismus σ∶ F → F setzt auf L fort, das heißt, es gibt τ ∈ Gal(L/K) mit τ∣F = σ. Beweis. Weil L normal über K ist, ist L nach Prop. 4.5.4 der Zerfällungskörper eines Polynoms f ∈ K[x]. Dann ist L auch ein Zerfällungskörper von f über F und es gilt σ( f ) = f . Damit folgt die Behauptung aus Satz 4.3.9. ∎ Proposition 4.7.10. Sei K ⊂ L eine endliche Galois-Erweiterung. Zwei Elemente α, β ∈ L sind genau dann konjugiert über K, wenn sie dasselbe Minimalpolynom über K haben. Beweis. Seien α, β ∈ L und sei f das Minimalpolynom von α über K. Falls σ(α) = β für ein σ ∈ Gal(L/K), dann gilt f (β) = f (σ(α)) = σ( f (α)) = . Also ist f dann auch das Minimalpolynom von β. Seien umgekehrt α, β ∈ L Nullstellen desselben irreduziblen Polynoms ∼ f ∈ K[x]. Nach Prop. 4.3.4 gibt es einen Isomorphismus der Nullstellenkörper φ∶ K(α) Ð → K(β) mit φ(α) = β. Weil L normal über K ist, zerfällt f in L[x] in Linearfaktoren. Das heißt, L enthält einen Zerfällungskörper F = K(α , . . . , α n ) von f mit α, β ∈ {α , . . . , α n }. Dann ist F ein Zerfällungskörper von f über K(α) und über K(β). Nach Satz 4.3.9 gibt es deshalb einen Automorphismus ψ∶ F → F mit ψ∣K(α) = φ, insbesondere mit ψ(α) = β. Nach dem vorangehenden Lemma setzt ψ weiter fort zu einem Automorphismus σ∶ L → L, der σ(α) = ψ(α) = β erfüllt. ∎ den Übungen wurde gezeigt, dass f dann notwendig reelle Nullstellen haben muss, was man hier auch direkt sieht: Ist α reell, dann auch die beiden anderen Nullstellen. Da es für das ganze Argument egal ist, mit welcher Nullstelle α man anfängt und f immer mindestens eine reelle Nullstelle besitzt, folgt die Behauptung. 3In

4.8. DER HAUPTSATZ DER GALOIS-THEORIE

123

Korollar 4.7.11. Sei K ⊂ L eine Galois-Erweiterung und sei f ∈ K[x] irreduzibel. Dann operiert Gal(L/K) transitiv auf den Nullstellen von f in L. Das heißt, sind α, β ∈ L mit f (α) = f (β) = , dann gibt es σ ∈ Gal(L/K) mit σ(α) = β. Beweis. Das ist nur eine Umformulierung.



Korollar 4.7.12. Es sei K ⊂ L eine endliche Galois-Erweiterung. Dann ist K genau die Menge der Fixpunkte von Gal(L/K). Das heißt, für α ∈ L gilt σ(α) = α für alle σ ∈ Gal(L/K) genau dann, wenn α ∈ K gilt. Beweis. Per Definition gilt σ(α) = α für alle α ∈ K und σ ∈ Gal(L/K). Ist umgekehrt α ∈ L ∖ K und ist f das Minimalpolynom von α über K, dann gilt deg( f ) ⩾ . Weil f separabel ist, hat f dann eine weitere Nullstelle β. Nach dem Lemma gibt es σ ∈ Gal(L/K) mit σ(α) = β ≠ α. ∎ Bei endlichen Körpern ist die Lage mal wieder sehr übersichtlich. Proposition 4.7.13. Jede Erweiterung K ⊂ L endlicher Körper ist galoissch mit zyklischer GaloisGruppe der Ordnung [L ∶ K]. Beweis. Wir haben schon bewiesen, dass jede solche Erweiterung normal (Prop. 4.5.2) und separabel (Prop. 4.6.3 und Prop. 4.6.9) ist. Die Erweiterung ist also galoissch und es gilt ∣ Gal(L/K)∣ = [L ∶ K]. Es sei p = char(K), ∣K∣ = pm und n = [L ∶ K], also ∣L∣ = pmn . Betrachte den FrobeniusHomomorphismus τ∶ L → L, α ↦ α p mit p = char(K). Aus der Beschreibung aller Zwischenkörper der Erweiterung F p ⊂ L (Prop. 4.4.7) wissen wir dann, dass K = {α ∈ L ∣ τ m (α) = α m = α} gilt. Insbesondere ist σ = τ m dann ein K-Automorphismus von L, also σ ∈ Gal(L/K). Für k ⩽ n ist außerdem {α ∈ L ∣ σ k (α) = α km = α} ein Teilkörper mit p km Elementen. Für k < n ist dieser Teilkörper also echt in L enthalten. Dies zeigt, dass σ die Ordnung n hat. Also wird die Gruppe Gal(L/K) der Ordnung n von σ erzeugt. ∎

4.8. Der Hauptsatz der Galois-Theorie Der Hauptsatz der Galois-Theorie besagt, dass die Zwischenkörper einer Galois-Erweiterung den Untergruppen der Galois-Gruppe entsprechen. Wir beginnen mit der folgenden Version. Satz 4.8.1. Es seien K ⊂ F ⊂ L Körpererweiterungen und sei L galoissch über K. Dann ist F ○ = {σ ∈ Gal(L/K) ∣ σ(α) = α für alle α ∈ F} eine Untergruppe von Gal(L/K). (1) L ist galoissch über F mit Galois-Gruppe Gal(L/F) = F ○ . (2) Genau dann ist F galoissch über K, wenn F ○ normal ist. Beweis. Dass F ○ eine Untergruppe ist, prüft man direkt nach, oder man bemerkt, dass F ○ der Durchschnitt aller Stabilisatoren von Elementen von F ist. Um zu zeigen, dass F ⊂ L eine GaloisErweiterung ist, müssen wir Normalität und Separabilität zeigen. Normalität gilt nach Satz 4.5.5(1). Separabilität ist gegeben, weil das Minimalpolynom von α ∈ L über f ein Teiler des Minimalpolynoms von α über K ist und damit separabel. Also ist L galoissch über F und F ○ ist per Definition die Galois-Gruppe dieser Erweiterung. Damit ist (1) bewiesen.

124

4. KÖRPER

Es ist klar, dass F separabel über K ist. Angenommen F ist auch normal. Sei σ ∈ F ○ und τ ∈ Gal(L/K), dann müssen wir τσ τ − ∈ F ○ zeigen. Sei α ∈ F und sei f das Minimalpolynom von α über K. Dann ist τ − (α) eine Nullstelle von f und liegt damit in F, weil F normal über K ist. Es folgt σ(τ − (α)) = τ − (α) und damit (τσ τ − )(α) = α, also τσ τ − ∈ F ○ . Sei umgekehrt F nicht normal über K. Dann gibt es ein irreduzibles Polynom f ∈ K[x], das in F eine Nullstelle α hat, aber in F[x] nicht zerfällt. Sei β ∈ L ∖ F eine weitere Nullstelle von f . Nach Kor. 4.7.12 gibt es dann ein Element σ ∈ Gal(L/F) = F ○ mit σ(β) ≠ β. Ebenso gibt es τ ∈ Gal(L/K) mit τ(β) = α nach Kor. 4.7.11. Es folgt (τσ τ − )(α) = τ(σ(β)) ≠ τ(β) = α. Wegen α ∈ F bedeutet das τσ τ − ∉ F ○ . Also ist F ○ nicht normal in Gal(L/K). ∎ √ √ Beispiel 4.8.2. Bemühen wir unser Lieblingsbeispiel, den Zerfällungskörper L = Q(  , −) von x  −  über Q. Die Galois-Gruppe Gal(L/Q) ist isomorph zu S , wie wir in Beispiel 4.7.7(2) √ √ nachgerechnet haben. Wir setzen α =   und ω = (− + −)/. Dann permutiert Gal(L/Q) gerade die drei Nullstellen α, ωα, ω α von x  − . Ein Element σ ∈ Gal(L/Q) der Ordnung  (also ein Dreizykel) in Gal(L/Q) ist gegeben durch σ(α) = ωα, σ(ω) = ω und ein Element τ der Ordnung  (Transposition) durch τ(α) = ωα, τ(ω) = ω . Betrachte den Teilkörper F = Q(α) von L. Die Transposition in Gal(L/Q), die α fixiert, ist τσ (denn es gilt τ(σ(α)) = τ(ω)τ(α) = ω α = α). Also ist die zu F gehörende Untergruppe gerade F ○ = ⟨τσ⟩. Diese Untergruppe ist nicht normal (explizit gilt zum Beispiel σ(τσ)σ − = σ τ ∉ ⟨τσ⟩). Das entspricht der Tatsache, dass F nicht normal über Q ist, weil das irreduzible Polynom x  −  in F eine Nullstelle hat, ohne zu zerfallen. √ Zu F = Q(ω) = Q( −) gehört dagegen die Untergruppe F ○ = ⟨σ⟩. Diese ist normal, denn sie hat Index  in Gal(L/Q) (und entspricht A ). In der Tat ist F ⊃ Q (wie jede quadratische Körpererweiterung) normal, denn F ist der Zerfällungskörper von x  + . So wie wir jedem Zwischenkörper K ⊂ F ⊂ L einer Galois-Erweiterung die Untergruppe F ○ = {σ ∈ Gal(L/K) ∣ σ(α) = α für alle α ∈ F} zugeordnet haben, so können wir umgekehrt jeder Untergruppe H von Gal(L/K) einen Zwischenkörper zuordnen, nämlich H ○ = {α ∈ L ∣ σ(α) = α für alle σ ∈ H}. Man sieht sofort, dass H ○ ein Körper ist und dass K ⊂ H ○ ⊂ L gilt. Der Hauptsatz der GaloisTheorie beschreibt exakt den Zusammenhang zwischen beiden Operationen.

4.8. DER HAUPTSATZ DER GALOIS-THEORIE

125

Satz 4.8.3 (Hauptsatz der Galois-Theorie). Es sei K ⊂ L eine endliche Galois-Erweiterung mit Galois-Gruppe G = Gal(K/L). Die Zuordnungen F ↦ F○

und

H ↦ H○

sind zueinander inverse Bijektionen zwischen der Menge aller Zwischenkörper von K ⊂ L und der Menge aller Untergruppen von G. Es gelten also F ○○ = F

und

H ○○ = H

für alle Untergruppen H von G und alle Zwischenkörper F von K ⊂ L. Sind F und F zwei Zwischenkörper von K ⊂ L, dann gelten: (1) F ⊂ F genau dann, wenn F○ ⊃ F○ . (2) Falls F ⊂ F , dann folgt [F ∶ F ] = [F○ ∶ F○ ]. (3) F ⊂ F ist genau dann galoisch, wenn F○ normal in F○ ist. In diesem Fall gilt Gal(F /F ) ≅ F○ /F○ . Beweis. Die Inklusion F ⊂ F ○○ ist trivial. Ist umgekehrt α ∈ L ∖ F, dann gibt es nach Kor. 4.7.12 einen Automorphismus σ ∈ Gal(L/F) = F ○ mit σ(α) ≠ α, also α ∉ F ○○ . Ebenso ist die Inklusion H ⊂ H ○○ klar nach Definition. Nach Satz 4.8.1 ist H ○ ⊂ L eine GaloisErweiterung mit Galois-Gruppe H ○○ . Es gilt deshalb [L ∶ F ○ ] = ∣H ○○ ∣. Außerdem gibt es nach dem Satz von primitiven Element ein α ∈ L mit L = H ○ (α). Sei f ∈ H ○ [x] das Minimalpolynom von α und betrachte das Polynom g = ∏ (x − σ(α)). σ∈H

Die Koeffizienten von g sind Fixpunkte der Operation von H und liegen deshalb in H ○ . Wegen g(α) =  folgt f ∣g und damit ∣H ○○ ∣ = [L ∶ H ○ ] = deg( f ) ⩽ deg(g) = ∣H∣. Wegen H ⊂ H ○○ folgt daraus die Gleichheit. Es bleiben die zusätzlichen Behauptungen: (1) Aus F ⊂ F folgt sofort F○ ⊂ F○ . Umgekehrt folgt aus F ○ ⊂ F○ nun F = F○○ ⊂ F○○ = F . (2) Wir wissen, dass F ⊂ L und F ⊂ L Galois-Erweiterungen mit Galois-Gruppe F○ bzw. F○ sind. Wegen Multiplikativität der Körpergerade und dem Satz von Lagrange folgen ∣F○ ∣ = [L ∶ F ] = [L ∶ F ][F ∶ F ] und ∣F○ ∣ = ∣F○ ∣[F○ ∶ F○ ] = [L ∶ F ][F○ ∶ F○ ], also [F ∶ F ] = [F○ ∶ F○ ] durch Kürzen. (3) Die erste Aussage folgt direkt aus Satz 4.8.1(2). Betrachte die Einschränkungsabbildung ρ∶ F○ = Gal(L/F ) → Gal(F /F ), σ ↦ σ∣F . Das ist wohldefiniert, weil F normal über F ist und deshalb σ(F ) ⊂ F für σ ∈ Gal(L/F ) gilt. Es ist klar, dass ρ ein Homomorphismus ist. Der Kern von ρ ist per Definition gerade F○ . Nach Lemma 4.7.9 ist ρ außerdem surjektiv. Die Behauptung folgt aus dem Isomorphiesatz. ∎

126

4. KÖRPER

Korollar 4.8.4. Eine endliche Galois-Erweiterung hat nur endlich viele Zwischenkörper. Beweis. Denn die Galois-Gruppe ist endlich und hat deshalb endlich viele Untergruppen.



Bemerkung 4.8.5. Nur an einer Stelle im Beweis des Hauptsatzes wurde die Endlichkeit der Erweiterung benutzt, nämlich um die Gleichheit H ○○ = H zu beweisen. Für unendliche Galois-Erweiterungen gilt der Hauptsatz ganz ähnlich, aber man muss diejenigen Untergruppen H identifizieren, die H ○○ = H erfüllen.

√ √ Beispiele 4.8.6. (1) In unserem Lieblingsbeispiel L = Q(  , −) = Q(α, ω) mit GaloisGruppe S erzeugt vom Dreizykel σ und der Transposition τ mit σ(α) = ωα, σ(ω) = ω

und

τ(α) = ωα, τ(ω) = ω

können wir nun leicht alle echten Zwischenkörper bestimmen. Sie entsprechen den echten Untergruppen von S . Diese sind gerade A ≅ ⟨σ⟩ und die zweielementigen Untergruppen ⟨τ⟩, ⟨τσ⟩, ⟨τσ  ⟩. Die zugehörigen Fixkörper sind ⟨σ⟩○ = Q(ω),

⟨τ⟩○ = Q(ω α),

⟨τσ⟩○ = Q(α),

⟨τσ  ⟩○ = Q(ωα).

Der Hauptsatz der Galois-Theorie sagt uns nun unter anderem, dass das wirklich alle echten Zwischenkörper der Erweiterung Q ⊂ L sind, was man selbst hier nicht sofort direkt sieht. Außerdem ist die Erweiterung Q ⊂ Q(ω) = ⟨σ⟩○ normal vom Grad , so dass ihre GaloisGruppe zyklisch der Ordnung  ist. Nach dem Hauptsatz erhalten wir diese Galois-Gruppe als Faktorgruppe Gal(L/Q)/⟨σ⟩, erzeugt von der Nebenklasse τ⟨σ⟩. (2) Ist K ⊂ L eine Erweiterung endlicher Körper, dann ist die Galois-Gruppe Gal(L/K) zyklisch nach Prop. 4.7.13. Sie enthält also zu jedem Teiler der Gruppenordnung genau eine zyklische Untergruppe (erzeugt von einer entsprechenden Potenz des Frobenius-Homomorphismus). Die sich aus dem Hauptsatz der Galois-Theorie ergebende Liste aller Zwischenkörper entspricht damit genau der in Prop. 4.4.7.

4.9. Auflösen von Gleichungen durch Wurzelziehen In diesem letzten Abschnitt schauen wir uns eine klassische Anwendung der Galois-Theorie an, das Auflösen von Polynomgleichungen durch Wurzelziehen. Eine Wurzel zu ziehen ist ja nichts anderes, als einen bestimmten Typ von Polynomgleichung in einem Körper K zu lösen, nämlich eine Gleichung der Form x n − a für a ∈ K. Die Frage ist, ob und wie sich das Lösen allgemeiner Gleichungen auf das Wurzelziehen alleine zurückführen lässt. Für quadratische Gleichungen drückt die klassische Lösungsformal genau das aus: Sie schreibt die beiden Lösungen mithilfe einer Quadratwurzel hin. Wie man die Wurzel dann etwa numerisch ausrechnet, ist eine ganz andere Frage. In der Regel ist man damit zufrieden, die Wurzeln einfach stehen zu lassen. Entsprechend, wenn auch komplizierter, ist das bei den Cardanoschen Formeln im Grad  (wo wir allerdings zwei Kubikwurzeln gebraucht haben) und auch bei den Formeln im Grad  (die wir nicht betrachtet haben). Mithilfe der Galois-Theorie kann man genau analysieren, welche Körpererweiterungen durch Adjunktion von Wurzeln entstehen und damit auch, welche Gleichungen sich in dieser Weise lösen lassen.

4.9. AUFLÖSEN VON GLEICHUNGEN DURCH WURZELZIEHEN

127

Wir beschränken uns auf die Charakteristik  und beginnen mit den Einheitswurzeln in C, die wir schon in §2.9 untersucht haben. Für n ∈ N sind die n-ten Einheitswurzeln die komplexen Lösungen der Gleichung x n − . Explizit sind das die komplexen Zahlen , ω, ω , . . . , ω n− ,

mit ω = e

π i n

Sie bilden die Ecken eines regulären n-Ecks auf dem komplexen Einheitskreis. Die n-ten Einheitswurzeln bilden eine zyklische Untergruppe von C∗ der Ordnung n, erzeugt von ω. Definition 4.9.1. Eine primitive n-te Einheitswurzel ist eine n-te Einheitswurzel, die keine k-te Einheitswurzel für irgendein k < n ist. Mit anderen Worten, eine primitive n-te Einheitswurzel ist ein Element der Ordnung n in C∗ und damit ein Erzeuger der Gruppe aller Einheitswurzeln. Eine primitive n-te Einheitswurzel ist π i ω = e n , und die übrigen primitiven n-ten Einheitswurzeln sind gerade von der Form ω k mit  ⩽ k ⩽ n −  und ggT(k, n) = . Diese Exponenten k, die teilerfremd zu n sind, identifizieren sich mit der (multiplikativen) Einheitengruppe (Z/n)∗ des Rings Z/n. Ist n = p eine Primzahl, dann sind alle p-ten Einheitswurzeln außer  primitiv. Definition 4.9.2. Das normierte Polynom Φn (mit ω = e

π i n

∏ (x − ω k )

k∈(Z/n)∗

) heißt das n-te Kreisteilungspolynom.

Die Nullstellen des Kreisteilungspolynoms sind also gerade die primitiven n-ten Einheitswurzeln. Ist n = p eine Primzahl, dann ist xp −  = x p− + ⋯ + x + . x − In Prop. 2.9.19 haben wir bereits gezeigt, dass dieses Polynom irreduzibel über Q ist. Das gilt auch für die übrigen Kreisteilungspolynome. Man kann sie rekursiv berechnen und noch allerhand beweisen. Wir beschränken uns aber aus Zeitgründen auf das Wichtigste. Φp =

Satz 4.9.3. Das Kreisteilungspolynom Φ n hat Koeffizienten in Z und ist irreduzibel in Q[x]. Beweis. Sei K der Zerfällungskörper von x n −  über Q. Für jedes σ ∈ Gal(K/Q) und jede primitive n-te Einheitswurzel ω ∈ K ist dann σ(ω) wieder eine primitive n-te Einheitswurzel. Daraus folgt, dass die Koeffizienten von Φ n Fixpunkte von Gal(K/Q) sind und damit in Q liegen. Weil Φ n also ein normierter Faktor von x n −  in Q[x] ist, sind seine Koeffizienten nach dem Gaußschen Lemma (Kor. 2.9.9) ganzzahlig. Angenommen Φ n wäre reduzibel, dann gilt Φ n = f g mit f , g ∈ Q[x] normiert und nicht konstant, mit etwa f irreduzibel. Wiederum nach dem Gaußschen Lemma haben auch f und g ganzzahlige Koeffizienten. Sei ξ eine Nullstelle von f , also eine primitive n-te Einheitswurzel. Da nicht alle primitiven n-ten Einheitswurzeln Nullstellen von f sind, sondern manche stattdessen von g, gibt es r >  mit ggT(r, n) =  und g(ξ r ) = . Wähle das kleinste solche r und sei p ein Primteiler von r. Setze ω = ξ r/p , dann ist ω eine primitive n-te Einheitswurzel mit f (ω) =  (nach Wahl von r) und g(ω p ) = . Also ist ω eine gemeinsame Nullstelle von f und g(x p ). Da

128

4. KÖRPER

f irreduzibel ist, gibt es also h ∈ Z[x] mit g(x p ) = f (x)h(x). Weil diese Polynome ganzzahlige Koeffizienten haben, können wir die Gleichheit auch modulo p im Körper F p lesen, indem wir alle Koeffizienten modulo p nehmen. Es gilt dann f (x)h(x) = g(x p ) = g(x) p in F p [x]. Also haben f und g einen gemeinsamen Teiler in F p [x], so dass Φn = f g inseparabel über F p ist. Dasselbe gilt dann auch für x n − , denn es wird von Φn geteilt. Die Ableitung nx n− von x n − ist aber nicht das Nullpolynom über F p , weil p kein Teiler von n ist. Dieser Widerspruch zeigt die Behauptung. ∎ Satz 4.9.4. Sei K der Zerfällungskörper von x n −  über Q. Dann gilt Gal(K/Q) ≅ (Z/n)∗ . Dabei ist (Z/n)∗ wie üblich die multiplikative Einheitengruppe des Rings Z/n. Beweis. Sei ω ∈ K eine primitive n-te Einheitswurzel. Ist σ ∈ Gal(K/Q) ein Q-Automorphismus, dann ist σ(ω) wieder eine primitive n-te Einheitswurzel. Jedes σ ∈ Gal(K/Q) ist also eindeutig bestimmt durch eine Zuordnung ω ↦ ω i(σ) mit i(σ) ∈ (Z/n)∗ . Die Abbildung

φ∶ Gal(K/Q) → (Z/n)∗ , σ ↦ i(σ)

ist ein Homomorphismus, wie man leicht nachprüft. Weil σ durch i(σ) eindeutig bestimmt ist, ist φ injektiv. Außerdem sind alle primitiven Einheitswurzeln konjugiert über Q (Prop. 4.7.10), denn sie haben alle das gleiche Minimalpolynom Φ n . Mit anderen Worten, φ ist auch surjektiv. ∎ Ist K ein Körper, der eine primitive n-te Einheitswurzel ω enthält, dann vereinfacht sich die Beschreibung anderer n-ter Wurzeln beträchtlich. Denn ist α n = a für α, a ∈ K, dann sind α, ωα, ω α, . . . , ω n− α allesamt n-te Wurzeln von a und alle verschieden. Da a nicht mehr als n verschiedene n-te Wurzeln haben kann, sind das also alle n-ten Wurzeln. (Diesen Trick haben wir schon ausgiebig bei den Kubikwurzeln benutzt.) Definition 4.9.5. Wir sagen, eine Körpererweiterung K ⊂ L entsteht durch Adjunktion einer Wurzel, wenn es α ∈ L und n ∈ N gibt mit L = K(α) und α n ∈ K. In diesem Fall ist L also ein Nullstellenkörper eines Polynoms der Form x n − a für a ∈ K. Proposition 4.9.6. Es sei K ein Körper, der eine primitive n-te Einheitswurzel enthält. Eine GaloisErweiterung L ⊃ K vom Grad n entsteht genau dann durch Adjunktion einer Wurzel, wenn ihre Galois-Gruppe zyklisch ist. Beweis. Es sei ω ∈ K eine primitive n-te Einheitswurzel. Ist L = K(α) mit α n = n ∈ K, dann hat x n − a die n Nullstellen α, ωα, . . . , ω n− α

4.9. AUFLÖSEN VON GLEICHUNGEN DURCH WURZELZIEHEN

129

in L. Jeder K-Automorphismus von L ist dann bestimmt durch eine Zuordnung α ↦ αω i(σ) mit i(σ) ∈ {, . . . , n − }. Wie gerade eben bei den Einheitswurzeln, überzeugt man sich, dass Gal(L/K) → Z/n, σ ↦ i(σ) ein Homomorphismus ist (diesmal allerdings hinten additiv). Er ist injektiv, weil L von α erzeugt wird und damit auch surjektiv, weil beide Gruppen die Ordnung n haben. Ist umgekehrt Gal(L/K) zyklisch vom Grad n und σ ∈ Gal(L/K) ein Erzeuger, dann bilden wir zu α ∈ L die Lagrange-Resolvente σ n− (α) σ(α) σ  (α) + + ⋯ + ∈ L. λ ω,α = α + ω ω ω n− Nach dem Lemma von Dedekind (4.7.1) ist λ ω,α ≠  für ein α ∈ L. Außerdem gilt offenbar σ(λ ω,α ) = ω ⋅ λ ω,α . Es folgt σ((λ ω,α )n ) = (σ(λ ω,α ))n = (λ ω,α )n und damit (λ ω,α )n ∈ K, etwa λ nω,α = a. Außerdem hat λ ω,α in L die n verschiedenen Galois-Konjugierten λ ω,α , ωλ ω,α , . . . , ω n− λ ω,α . Deshalb ist x n − a das Minimalpolynom von λ ω,α über K und es folgt L = K(λ ω,α ). ∎ Definition 4.9.7. Eine endliche Körpererweiterung K ⊂ L heißt eine Radikalerweiterung, wenn es eine endliche Kette K = K ⊂ K ⊂ ⋯ ⊂ K r von Körpererweiterungen gibt mit L ⊂ Kr und derart, dass K i aus K i− durch Adjunktion einer Wurzel entsteht (für i = , . . . , r). Die Frage nach der Auflösbarkeit von Gleichungen durch Wurzelziehen formulieren wir nun so um: Wann ist der Zerfällungskörper eines Polynoms f eine Radikalerweiterung? Wir geben zunächst eine Idee davon, wie das gehen könnte: Wenn der Zerfällungskörper L eines Polynoms f eine Radikalerweiterung ist, dann betrachten wir den zugehörigen Turm K = K ⊂ K ⊂ ⋯ ⊂ K r von Körpererweiterungen mit L ⊂ Kr . Wenn das alles Galois-Erweiterungen sind, dann können wir mit dem Hauptsatz der Galois-Theorie zu einer entsprechenden Kette {id} = Gal(Kr /Kr ) ⊂ Gal(Kr /Kr− ) ⊂ ⋯ ⊂ Gal(Kr /K) von Untergruppen der Galois-Gruppe übergehen. Prop. 4.9.6 sagt uns dann, dass hier alle Faktorgruppen benachbarter Terme zyklisch sind, sofern es in K eine geeignete primitive Einheitswurzel gibt. Die Galois-Gruppe hat dann einen sehr speziellen Aufbau. Um diese Idee umzusetzen, ist einiges zu tun. Wir beginnen mit der entsprechenden gruppentheoretischen Eigenschaft. Definition 4.9.8. Eine endliche Gruppe G heißt auflösbar, wenn es eine endliche Kette {} = H ⊂ H ⊂ ⋯ ⊂ Hr = G von Untergruppen mit folgenden Eigenschaften gibt: (1) H i− ⊂ H i ist ein Normalteiler (für i = , . . . , r);

130

4. KÖRPER

(2) Die Faktorgruppe H i /H i− ist zyklisch (für i = , . . . , r). Eine solche Folge von Normalteilern nennen wir dann eine Auflösung von G. Diese Eigenschaft kann man nun mit Methoden der Gruppentheorie genauer untersuchen, zum Beispiel, um Kriterien zu entwickeln, wie man einer Gruppe ihre Auflösbarkeit ansieht. Wir interessieren uns jetzt aber nur in aller Kürze für die Anwendung auf das Auflösen von Gleichungen und beschränken uns auf das Notwendigste. Proposition 4.9.9. Jede endliche abelsche Gruppe ist auflösbar. Beweis. Sei G eine endliche abelsche Gruppe. Nach dem Basissatz (Satz 3.7.11) hat G eine Zerlegung in ein direktes Produkt von zyklischen Untergruppen von Primpotenzordnung. Wir greifen einen Faktor in einer solchen Zerlegung heraus und schreiben G = C × H, wobei C zyklisch von Primpotenzordnung ist und ∣H∣ < ∣G∣. Die Untergruppe H von G ist dann normal und erfüllt G/H ≅ C. Die Behauptung folgt nun durch Induktion nach ∣G∣. ∎ Beispiele 4.9.10.

(1) Die Gruppe S ist auflösbar, wie man sofort an der Kette {id} ⊂ A ⊂ S

sieht: S /A ist zyklisch der Ordnung  und A /{} ≅ A ist zyklisch der Ordnung . (2) Auch S ist auflösbar. Denn A enthält eine normale Untergruppe V , die zur kleinschen Vierergruppe isomorph ist. (Das wurde in den Übungen gezeigt.) Diese wiederum enthält eine zyklische Untergruppe C der Ordnung . Die Kette {id} ⊂ C ⊂ V ⊂ A ⊂ S zeigt dann die Auflösbarkeit von S . Die Faktorgruppen sind alle zyklisch der Ordnung  oder . Lemma 4.9.11. Jede Untergruppe einer auflösbaren Gruppe ist auflösbar. Beweis. Sei G eine auflösbare Gruppe und {} = H ⊂ H ⊂ ⋯ ⊂ Hr = G eine Auflösung von G. Sei K ⊂ G eine Untergruppe und betrachte die mit K geschnittene Folge {} = (H ∩ K) ⊂ (H ∩ K) ⊂ ⋯ ⊂ (Hr ∩ K) = K. Dann ist H i− ∩ K normal in H i ∩ K und nach Kor. 3.5.11 gilt (H i ∩ K)/(H i− ∩ K) ≅ (H i ∩ K)H i− /H i− . Nun ist (H i ∩ K)H i− /H i− eine Untergruppe der zyklischen Gruppe H i /H i− , also zyklisch.



Korollar 4.9.12. Für n ⩾  sind die Gruppen S n und A n nicht auflösbar. Beweis. In Satz 3.5.17 haben wir bewiesen, dass die alternierende Gruppe A n für n ⩾  einfach ist, also überhaupt keinen nicht-trivialen Normalteiler besitzt. Da sie selbst nicht zyklisch ist, kann sie damit auch nicht auflösbar sein. Nach dem Lemma ist auch S n nicht auflösbar, weil es A n als Untergruppe enthält. ∎

4.9. AUFLÖSEN VON GLEICHUNGEN DURCH WURZELZIEHEN

131

Wir beenden den Einschub über auflösbare Gruppen und kommen zur Galois-Theorie zurück. Definition 4.9.13. Es sei f ∈ K[x] ein separables Polynom. Die Galois-Gruppe von f ist die Galois-Gruppe eines Zerfällungskörpers von F über K und wird mit Gal( f /K) bezeichnet. Satz 4.9.14. Es sei f ein separables Polynom über K und K ⊂ E eine Körpererweiterung. Dann ist Gal( f /E) isomorph zu einer Untegruppe von Gal( f /K). Genauer gilt: Ist F ein Zerfällungskörper von f über E und L ⊂ F einer über K, dann gilt Gal(F/E) ≅ {σ ∈ Gal(L/K) ∣ σ∣E∩L = idE∩L } ⊂ Gal(L/K). Beweis. Hier ist ein Diagramm mit den beteiligten Körpern. F E

L E∩L K

Zunächst überzeugt man sich, dass E ⊂ F (als Zwischenkörper des Zerfällungskörpers K ⊂ F) und K ⊂ L (als Zerfällungskörper) galoissch sind. Es seien α , . . . , α n die Nullstellen von f in F, also F = E(α , . . . , α n ) und L = K(α , . . . , α n ). Sei σ ∈ Gal(F/E). Weil σ auf den Nullstellen α , . . . , α n operiert, gilt σ(L) = L und σE∩L = idE∩L . Wegen K ⊂ E ∩ L ist die Einschränkung σ∣L also ein K-Automorphismus von L. Also ist die Einschränkungsabbildung {

Gal(F/E) → Gal(L/K) σ ↦ σ∣L

ein wohldefinierter Homomorphismus. Sie ist surjektiv nach Lemma 4.7.9. Sie ist auch injektiv, denn ist σ∣L = idL , dann fixiert σ also α , . . . , α n und ist damit auch die Identität auf F. ∎ Lemma 4.9.15. Es sei K ein Körper der Charakteristik  und p eine Primzahl. Falls ein Element a ∈ K keine p-te Wurzel besitzt, dann ist das Polynom x p − a irreduzibel in K[x]. Beweis. Angenommen x p − a hat eine nicht-trivale Faktorisierung xp − a = f g in K[x], wobei f , g normiert sind vom Grad r bzw. s, mit p = r + s. Über dem Zerfällungskörper von x p −  über K zerfällt x p − a in die Linearfaktoren (x − ω i α), wobei ω eine primitive p-te Einheitswurzel ist und α p = a. (Um zu sehen, dass der Zerfällungskörper eine primitive p-te Einheitswurzel enthält, seien α ≠ β zwei Nullstellen von x p − a. Dann ist α/β eine primitive p-te Einheitswurzel.) Also sind f und g Produkte dieser Linearfaktoren. Insbesondere ist der konstante Term von f ein Produkt von r Nullstellen und hat damit bis auf Vorzeichen die Form p b = α r ω mit ω = . Es folgt b p = α pr = a r . Wegen r < p gibt es eine Bézout-Identität ru + pv =  mit u, v ∈ Z. Es folgt a = a ru a pv = b pu a pv = (av b u ) p . Also hat a eine p-te Wurzel in K.



132

4. KÖRPER

Definition 4.9.16. Es sei f ∈ K[x] ein Polynom. Wir sagen, f ist durch Wurzelziehen auflösbar, wenn der Zerfällungskörper von f eine Radikalerweiterung ist. Hier ist nun das Hauptergebnis, dass das Auflösen durch Wurzelziehen mit dem Auflösen der Galois-Gruppe in Verbindung bringt. Satz 4.9.17 (Galois). Es sei K ein Körper der Charakteristik  und sei f ∈ K[x] ein separables Polynom. Genau dann ist f über K durch Wurzelziehen auflösbar, wenn seine Galois-Gruppe über K auflösbar ist. Beweis. Angenommen die Galois-Gruppe Gal( f /K) ist auflösbar der Ordnung n. Sei K = K(ω) ⊃ K die Adjunktion einer primitiven n-ten Einheitswurzel ω. Nach Satz 4.9.14 ist Gal( f /K ) eine Untergruppe von Gal( f /K) und damit wieder auflösbar. Sei nun L ein Zerfällungskörper von f über K . Zu einer Auflösung der Galois-Gruppe Gal(L/K ) = Gal( f /K ) korrespondiert nach dem Hauptsatz der Galois-Theorie dann ein Turm von Zwischenkörpern K ⊂ K ⊂ ⋯ ⊂ Kr = L, wobei jeder Schritt eine Galois-Erweiterung mit zyklischer Galois-Gruppe ist und deshalb nach Prop. 4.9.6 durch Adjunktion einer Wurzel entsteht. Also ist L ⊃ K ⊃ K eine Radikalerweiterung. Sei umgekehrt f durch Wurzelziehen auflösbar und sei K = K ⊂ K ⊂ ⋯ ⊂ K r

()

eine Radikalerweiterung, wobei f über Kr zerfällt. Wir möchten daraus einen neuen Turm K = L ⊂ ⋯ ⊂ L s = L

()

mit den folgenden verbesserten Eigenschaften bauen: (i) L ist galoissch über K. (ii) L i ist galoissch über L i− für jedes i = , . . . , s, mit zyklischer Galois-Gruppe. (iii) f zerfällt über L. Wenn diese Eigenschaften erfüllt sind, sind wir fertig: Weil (i) erfüllt ist, können wir den Hauptsatz der Galoistheorie auf (2) anwenden und bekommen eine Kette {id} = Gal(L/Ls ) ⊂ Gal(L/Ls− ) ⊂ ⋯ ⊂ Gal(L/L ) ⊂ Gal(L/K) von Galois-Gruppen; wegen (ii) ist Gal(L/L i ) ⊂ Gal(L/L i− ) normal und die Faktorgruppen Gal(L/L i− )/ Gal(L/L i ) ≅ Gal(L i /L i− ) sind zyklisch, für i = , . . . , s. Also ist Gal(L/K) auflösbar. Wegen (iii) ist die Galois-Gruppe von f eine Untergruppe dieser Gruppe und damit ebenfalls auflösbar. Um (2) zu produzieren, schreibe zunächst K i = K i− (α) mit α m ∈ K i− . Ist p ein Primteiler von m, dann können wir β = α m/p mit β p ∈ K i− adjungieren, also den Zwischenkörper K i− ⊂ K i− (β) ⊂ K i einfügen. Induktiv bekommen wir so einen Turm von Körpererweiterungen, in dem nur Wurzeln von Primzahlgrad adjungiert werden. Wir können also ohne Einschränkung annehmen, dass in (1) alle Grade [K i ∶ K i− ] prim sind, für i = , . . . , s. Sei n = [Ks ∶ K] und sei ω eine primitive n-te Einheitswurzel. Dann betrachten wir den Turm K ⊂ F ⊂ ⋯ ⊂ Fs

mit Fi = K i (ω).

4.9. AUFLÖSEN VON GLEICHUNGEN DURCH WURZELZIEHEN

133

Nach Prop. 4.9.15 ist hier jeder Schritt Fi ⊂ Fi+ entweder trivial oder wieder eine Radikalerweiterung von Primzahlgrad. Nun ist K ⊂ F galoissch, denn es ist der Zerfällungskörper von x n −  über K. Die Galois-Gruppe Gal(x n − /K) ist eine Untergruppe von (Z/n)∗ nach Satz 4.9.4 und damit auflösbar. Es gibt also (nach der anderen Beweisrichtung) einen Turm K = L ⊂ ⋯L k = F von Radikalerweiterungen mit zyklischer Galois-Gruppe. Im nächsten Schritt ist F = F (α) mit α n = a ∈ F . Weil F eine primitive n-te Einheitswurzel enthält, ist F der Zerfällungskörper von x n − a über F . Wir betrachten die Polynome h σ = x p − σ(a) für σ ∈ Gal(F /K). Sei E der Zerfällungskörper aller h σ , also von h = ∏σ∈Gal(Fi /K) h σ ∈ K[x]. Wir erhalten einen Turm F ⊂ L k+ ⊂ ⋯ ⊂ L m = E, wo jeder Schritt der Zerfällungskörper von einem der h σ ist. Die Galois-Gruppe Gal(L i /L i− ) ist deshalb zyklisch nach Prop. 4.9.6. Außerdem ist L m galoissch über K. Ist nun F = F (β), dann ersetzen wir F durch L m (β) und wiederholen das Argument mit dieser Erweiterung. Insgesamt liefert das den gewünschten Turm der Form (2). ∎ Korollar 4.9.18. Ist f ∈ Q[x] ein Polynom vom Grad n ⩾  mit Galois-Gruppe S n , dann ist f nicht durch Wurzelziehen auflösbar. ∎ Bemerkungen 4.9.19. (1) Es bleibt die Frage, warum es für jedes n ⩾  ein solches Polynom gibt. Das haben wir nicht bewiesen, es ist aber zumindest plausibel: Der Zerfällungskörper L eines Polynoms f vom Grad n hat immer höchstens den Grad n! und seine Galois-Gruppe ist eine Untergruppe von S n . Falls [L ∶ Q] = n! gilt, dann folgt also Gal(L/Q) = S n . Bei der Konstruktion des Zerfällungskörpers in Satz 4.3.5 haben wir zunächst eine Nullstelle α von f an Q adjungiert und so eine Erweiterung Q ⊂ Q(α) vom Grad n bekommen. Nun schreiben wir f = (x − α)g mit g ∈ Q(α)[x] und fahren mit g fort. Falls g irreduzibel ist, hat der nächste Schritt den Grad n − . Also hat [L ∶ Q] genau dann den maximalen Grad n!, wenn die verbleibenden Faktoren von f in jedem Schritt irreduzibel bleiben. Das ist in der Regel“ der Fall, es sei denn, das Polynom f ” hat besondere Eigenschaften. Für Kubiken haben wir das etwa in Beispiel 4.7.7 analysiert. (2) Man kann sich auch fragen, inwieweit wir die ursprüngliche Frage nach der Existenz von allgemeinen Lösungsformeln“ nun wirklich beantwortet haben. In einer solchen allgemeinen ” Lösungsformel stehen ja die Koeffizienten des Polynoms als Variablen. Das ist eine etwas andere (im Grunde einfachere) Situation, als die, die wir hier betrachtet haben. Darauf kommen wir im zweiten Teil der Vorlesung noch einmal zurück.