Mathematische Werke: Zweiter Band Zahlentheorie Algebra und Geometrie [1. Aufl.] 978-3-0348-4085-9;978-3-0348-4160-3

536 87 63MB

German Pages XV, 755 [765] Year 1963

Report DMCA / Copyright

DOWNLOAD FILE

Polecaj historie

Mathematische Werke: Zweiter Band Zahlentheorie Algebra und Geometrie [1. Aufl.]
 978-3-0348-4085-9;978-3-0348-4160-3

Table of contents :
Front Matter ....Pages III-XV
Front Matter ....Pages xv-xv
Über Relationen zwischen Klassenanzahlen binärer quadratischer Formen von negativer Determinante (Adolf Hurwitz)....Pages 1-4
Sur la décomposition des nombres en cinq carrés (Adolf Hurwitz)....Pages 5-7
Über Relationen zwischen Klassenanzahlen binärer quadratischer Formen von negativer Determinante (Adolf Hurwitz)....Pages 8-50
Über die Klassenzahlrelationen und Modularkorrespondenzen primzahliger Stufe (Adolf Hurwitz)....Pages 51-67
Über die Anzahl der Klassen quadratischer Formen von negativer Determinante (Adolf Hurwitz)....Pages 68-71
Über die Entwicklung komplexer Grössen in Kettenbrüche (Adolf Hurwitz)....Pages 72-83
Über eine besondere Art der Kettenbruch-Entwicklung reeller Grössen (Adolf Hurwitz)....Pages 84-115
Über die diophantischen Gleichungen vom Geschlecht Null (D. Hilbert, A. Hurwitz)....Pages 116-121
Über die angenäherte Darstellung der Irrationalzahlen durch rationale Brüche (Adolf Hurwitz)....Pages 122-128
Über die Kettenbruch-Entwicklung der Zahl e (Adolf Hurwitz)....Pages 129-133
Beweis der Transzendenz der Zahl e (Adolf Hurwitz)....Pages 134-135
Über die angenäherte Darstellung der Zahlen durch rationale Brüche (Adolf Hurwitz)....Pages 136-156
Über die Reduktion der binären quadratischen Formen (Adolf Hurwitz)....Pages 157-190
Über die Theorie der Ideale (Adolf Hurwitz)....Pages 191-197
Über einen Fundamentalsatz der arithmetischen Theorie der algebraischen Grössen (Adolf Hurwitz)....Pages 198-207
Über die Anzahl der Klassen binärer quadratischer Formen von negativer Determinante (Adolf Hurwitz)....Pages 208-235
Zur Theorie der algebraischen Zahlen (Adolf Hurwitz)....Pages 236-243
Die unimodularen Substitutionen in einem algebraischen Zahlenkörper (Adolf Hurwitz)....Pages 244-268
Über die Reduktion der binären quadratischen Formen (Adolf Hurwitz)....Pages 269-275
Über die Kettenbrüche, deren Teilnenner arithmetische Reihen bilden (Adolf Hurwitz)....Pages 276-302
Über die Zahlentheorie der Quaternionen (Adolf Hurwitz)....Pages 303-330
Über lineare Formen mit ganzzahligen Variabeln (Adolf Hurwitz)....Pages 331-337
Über die Entwicklungskoeffizienten der lemniskatischen Funktionen (Adolf Hurwitz)....Pages 338-341
Über die Entwicklungskoeffizienten der lemniskatischen Funktionen (Adolf Hurwitz)....Pages 342-373
Über höhere Kongruenzen (Adolf Hurwitz)....Pages 374-384
Über eine Darstellung der Klassenzahl binärer quadratischer Formen durch unendliche Reihen (Adolf Hurwitz)....Pages 385-409
Über eine Aufgabe der unbestimmten Analysis (Adolf Hurwitz)....Pages 410-421
Über die Darstellung der ganzen Zahlen als Summen von nten Potenzen ganzer Zahlen (Adolf Hurwitz)....Pages 422-426
Über die diophantische Gleichung x3y + y3z + z3x = 0 (Adolf Hurwitz)....Pages 427-429
Über die Kongruenz axe + bye + cze ≡ 0 (mod. p) (Adolf Hurwitz)....Pages 430-445
Über ternäre diophantische Gleichungen dritten Grades (Adolf Hurwitz)....Pages 446-468
Zu Grassmanns Note: „Lösung der Gleichung x3 + y3 + z3 + u3 = 0 in ganzen Zahlen“ (Adolf Hurwitz)....Pages 469-470
Der Euklidische Divisionssatz in einem endlichen algebraischen Zahlkörper (Adolf Hurwitz)....Pages 471-474
Über die Anzahl der Klassen positiver ternärer quadratischer Formen von gegebener Determinante (Adolf Hurwitz)....Pages 475-502
Front Matter ....Pages 503-503
Über den Vergleich des arithmetischen und des geometrischen Mittels (Adolf Hurwitz)....Pages 505-507
Zur Invariantentheorie (Adolf Hurwitz)....Pages 508-532
Über die Bedingungen, unter welchen eine Gleichung nur Wurzeln mit negativen reellen Teilen besitzt (Adolf Hurwitz)....Pages 533-545
Über die Erzeugung der Invarianten durch Integration (Adolf Hurwitz)....Pages 546-564
Über die Komposition der quadratischen Formen von beliebig vielen Variablen (Adolf Hurwitz)....Pages 565-571
Über Abel’s Verallgemeinerung der binomischen Formel (Adolf Hurwitz)....Pages 572-576
Über den Satz von Budan-Fourier (Adolf Hurwitz)....Pages 577-585
Über definite Polynome (Adolf Hurwitz)....Pages 586-590
Über die Trägheitsformen eines algebraischen Moduls (Adolf Hurwitz)....Pages 591-626
Über einen Satz des Herrn Kakeya (Adolf Hurwitz)....Pages 627-631
Über die algebraische Darstellung der Normgebilde (Adolf Hurwitz)....Pages 632-640
Über die Komposition der quadratischen Formen (Adolf Hurwitz)....Pages 641-666
Front Matter ....Pages 667-667
Über den Chasles’schen Satz αµ + βν (Gemeinsam mit H. Schubert) (Adolf Hurwitz)....Pages 669-678
Über unendlich-vieldeutige geometrische Aufgaben, insbesondere über die Schliessungsprobleme (Adolf Hurwitz)....Pages 679-686
Über die Anwendung der elliptischen Funktionen auf Probleme der Geometrie (Adolf Hurwitz)....Pages 687-698
Beweis eines Satzes aus der Theorie der Raumkurven III. Ordnung (Adolf Hurwitz)....Pages 699-701
Über Tangentenkonstruktionen (Adolf Hurwitz)....Pages 702-705
Einige allgemeine Sätze über Raumkurven (Adolf Hurwitz)....Pages 706-712
Über eine besondere Raumkurve 3. Ordnung (Adolf Hurwitz)....Pages 713-721
Über die Schröter’sche Konstruktion der ebenen Kurven dritter Ordnung (Adolf Hurwitz)....Pages 722-728
Back Matter ....Pages 729-755

Citation preview

ADOLF HURWITZ MATHEMATISCHE WERKE BAND2

Mathematisdte Werke von

ADOLF HURWITZ

Herausgegeben von der Abteilung für Mathematik und Physik der Eidgenössisdten Tedtnisdten Hodtsdtule in Züridt

Zweiter Band

ZAHLENTHEORIE ALGEBRA UND GEOMETRIE Mit 11 Figuren im Text

Springer Basel AG 1963

© Springer Base1 AG Urspriinglich erschienen bei Birkhăuser Base1 1963. Softcover reprint of the hardcover 1st edition 1963 ISBN 978-3-0348-4085-9 ISBN 978-3-0348-4160-3 (eBook) DOI 10.1007/978-3-0348-4160-3 Unveriinderter Nachdruck der 1. Auflage

Inhaltsverzeichnis des II. Bandes. Seite

Vornort . . . . . . . . . . . . . . . . . . . . . . . . . XIII

Zahlentheorie. XLIV. Über Relationen zwischen Klassenanzahlen binärer qua-

dratischer Formen von negativer Determinante

. . . .

1

(Berichte der k. sächsischen Gesellschaft der Wissenschaften zu Leipzig, mathematisch-physische Klasse, Bd. 36, 1884, S. 193-197.)

XL V. Sur la decomposition des nombres en cinq carres. . .

-5

(Comptes rendus des seances de l'Academie des Sciences, Paris, vol. 98, 1884, p. 504-507.) (Extrait d'une lettre adressee a M. Hermite.)

XL VI. Über Relationen zwischen Klassenanzahlen binärer qua-

dratischer Formen von negativer Determinante . . . .

8

(Mathematische Annalen, Bd. 25, 1885, S. 157-196.)

XL VII. Über die Klassenzahlrelationen und Modularkorrespon-

denzen primzahliger Stufe . . . . . . . . . . . . . .

51

(Berichte der k. sächsischen Gesellschaft der Wissenschaften zu Leipzig, mathematisch-physische Klasse, Bd. 37, 1885, S. 222-240.)

XLVIII. Über die Anzahl der Klassen quadratischer Formen von

negativer Determinante . . . . . . . . . . . . . . .

68

(Journal für die reine und augewandte Mathematik, Bd. 99, 1886, s. 165-168.) (Auszug aus einem an Herrn Kronecker gerichteten Briefe.)

XLIX. Über die Entwicklung komplexer Grössen in Kettenbrüche

72

(Acta Mathematica, Bd. 11, 1887-1888, S. 187-200.)

L.

Über eine besondere Art der Kettenbruch-Entwicklung reeller Grössen . . . . . . . . . . . . . . . . . . .

84

(Acta Ma.thematica., Bd. 12, 1889, S. 367-405.)

LI.

Über die diophantischen Gleichungen vom Geschlecht Null (gemeinsam mit D. Hilbert) . . . . . . . . . . . (Acta Ma.thematica., Bd. 14, 1890-1891, S. 217-224.)

116

VIII

LII. Über die angenäherte Darstellung der Irrationalzahlen

durch rationale Brüche . . . . . . . . . . . .

Seite

122

(Mathematische Annalen, Bd. 39, 1891, S. 279-284.)

LIII. Über die Kettenbruchentwicklung der Zahle . .

129

(Schriften der physikalisch-ökonomischen Gesellschaft zu Königsberg in Pr., 32. Jahrgang, 1891, Sitzungsberichte, S. 59-62.)

LIV. Beweis der Transzendenz der Zahl e . . . . . . . . .

134

(Nachrichten von der k. Gesellschaft der Wissenschaften zu Göttingen, 1893, S. 153-155; wiederabgedruckt Mathematische Annalen, Bd. 43, 1893, s. 220-221.)

LV. Über die angenäherte Darstellung der Zahlen durch ratio-

nale Brüche . . . . . . . . . . . . . . . . . . . .

136

(Mathematische Annalen, Bd. 44, 1894, S. 417-436.)

LVI. Über die Reduktion der binären quadratischen Formen

157

(Mathematische Annalen, Bd. 45, 1894, S. 85-117.)

LVII. Über die Theorie der Ideale . . . . . . . . . . . . .

191

(Nachrichten von der k. Gesellschaft der Wissenschaften zu Göttingen, Mathematisch-physikalische Klasse, 1894, S. 291-298.)

LVIII. Über einen Fundamentalsatz der arithmetischen Theorie

der algebraischen Grössen . . . . . . . . . . . . . .

198

(Nachrichten von der k. Gesellschaft der Wissenschaften zu Göttingen, Mathematisch-physikalische Klasse, 1895, S. 230-240.)

LIX. Über dieAnzahl der Klassen binärer quadratischer Formen

von negativer Determinante . . . . : . . . . . . . .

208

(Acta Mathematica, Bd. 19, 1895, S. 351-384, mit einem Zusatz in den Acta Mathematica, Bd. 20, 1897, S. 312, Fussnote.)

LX. Zur Theorie der algebraischen Zahlen. . . . . . . . .

236

(Nachrichten von der k. Gesellschaft der Wissenschaften zu Göttingen, Mathematisch-physikalische Klasse, 1895, S. 324-331.)

LXI. Die unimodularen Substitutionen in einem algebraischen

Zahlenkörper . . . . . . . . . . . . . . . . . . . .

244

(Nachrichten von der k. Gesellschaft der Wissenschaften zu Göttingen, Mathematisch-physikalische Klasse, 1895, S. 332-356.)

LXII. Über die Reduktion der binären quadratischen Formen

269

(Bericht des Mathematiker-Kongresses zu Chicago, 1896, S. 125-132.)

LXIII. Über die Kettenbrüche, deren Teilnenner arithmetische

Reihen bilden . . . . . . . . . . . . . . . . . .

276

(Vierteljahrsschrift der Naturforschenden Gesellschaft in Zürich, Jahrg. XLI, 1896, Jubelband II, S. 34-64.)

LXIV. Über die Zahlentheorie der Quaternionen . . . . . . (Nachrichten von der k. Gesellschaft der Wissenschaften zu Göttingen, Mathematisch-physikalische Klasse, 1896, S. 313-340.)

303

IX

LXV. Über lineare Formen mit ganzzahligen Variabeln

. .

Seite

331

(Nachrichten von der k. Gesellschaft der Wissenschaften zu Göttingen, Mathematisch-.physikalische Klasse, 1897, S. 139-145.)

LXVI. Über die Entwicklungskoeffizienten der lemniskatischen

Funktionen . . . . . . . . . . . . . . . . . . . .

338

(Nachrichten von der k. Gesellschaft der Wissenschaften zu Göttingen, Mathematisch-physikalische Klasse, 1897, S. 273-276.)

LXVII. Über die Entwicklungskoeffizienten der lemniskatischen

Funktionen . . . . . . . . . . . . . . . . . .

342

(Mathematische Annalen, Bd. 51, 1899, S. 196-226.)

LXVIII. Über höhere Kongruenzen . . . . . . . . . . .

374

(Archiv der Mathematik und Physik, III. Reihe, Bd. 5, 1903, s. 17-27.)

LXIX. Über eine Darstellung der Klassenzahl binärer quadrati-

scher Formen durch unendliche Reihen • . . . . . .

385

(Journal für die reine und angewa.ndte Mathematik, Bd. 129, 1905, s. 187-213.)

LXX. Über eine Aufgabe der unbestimmten Analysis

. . .

410

(Archiv der Mathematik und Physik, III. Reihe, Bd.ll, 1907, s. 185-196.)

LXXI. Über die Darstellung der ganzen Zahlen als Summen von

n-ten Potenzen ganzer Zahlen. . . . . . . . . . . .

422

(Mathematische Annalen, Bd. 65, 1908, S. 424-427.)

LXXII. Über die diophantische Gleichung x 3 y

+ y 3 z + z3 x = 0

427

(Mathematische Annalen, Bd. 65, 1908, S. 428--430.)

LXXIII. Über die Kongruenz ax•

+ by• + cz•- 0 (mod. p)

430

(Journal für die reine und angewa.ndte Mathematik, Bd. 136, 1909, s. 272-292.)

LXXIV. Über ternäre diophantische Gleichungen dritten Grades

446

(Vierteljahrsschrift der Naturforschenden Gesellschaft in Zürich, Jahrgang 62, 1917, S. 207-229.)

LXXV. Zu Grassmanns Note: "Lösung der Gleichung

xs

+ y3 + z3 + u 3 = 0 in

ganzen Zahlen" . . .

469

(Jahresbericht der Deutschen Mathematiker-Vereinigung, Bd. 27, 1918, s. 55-56.) (Aus einem an Herrn F. Engel gerichteten Brief.)

LXXVI. Der Euklidische Divisionssatz in einem endlichen alge-

braischen Zahlkörper . . . . . . . . . . . . . . (Mathematische Zeitschrift, Bd. 3, 1919, S. 123-126.)

471

X

LXXVII. Über die Anzahl der Klassen positiver ternärer qua-

dratischer Formen von gegebener Determinante

Seite

475

(Mathematische Annalen, Bd. 88, 1923, S. 26-52.) (Aus dem Nachlass.)

Algebra. LXXVIII. Über den Vergleich des arithmetischen und des geo-

metrischen Mittels. . . . . . . . . . . . . . . .

505

LXXIX. Zur Invariantentheorie . . . . . . . . . . . . . .

508

(Journal für die reine und augewandte 1\fathematik, Bd. 108, 1891, s. 266-268.) (Mathematische Annalen, Bd. 45, 1894, S. 381-404.)

LXXX. Über die Bedingungen, unter welchen eine Gleichung

nur Wurzeln mit negativen reellen Teilen besitzt .

533

(Mathematische Annalen, Bd. 46, 1895, S. 273--284.)

LXXXI. Über die Erzeugung der Invarianten durch Inte-

gration. . . . . . . . . . . . . . . . . . . . .

546

(Nachrichten von der k. Gesellschaft der Wissenschaften zu Göttingen, Mathematisch-physikalische Klasse, 1897, S. 71-90.)

LXXXII. Über die Komposition der quadratischen Formen von

beliebig vielen Variabeln . . . . • . . . . . . . .

565

(Nachrichten von der k. Gesellschaft der Wissenschaften zu Göttingen, Mathematisch-physikalische Klasse, 1898, S. 309-316.)

LXXXIII. Über Abel's Verallgemeinerung der binomischen

Formel. . . . . . . . . . . . . . . . . .

572

(Acta Mathematica, Bd. 26, 1902, S. 199-203.)

LXXXIV. Über den Satz von Budan-Fourier . . . . .

577

(Mathematische Annalen, Bd. 71, 1911, S. 584-591.)

LXXXV. Über definite Polynome . . . . . . . . . . .

586

(Mathematische Annalen, Bd. 73, 1912, S. 173--176.)

LXXXVI. Über die Trägheitsformen eines algebraischen Moduls

591

. . . . . . .

62'i"

(Annali di Matematica pura ed applica, serie Ill, t. 20, 1913, p. 113-151.)

LXXXVII. Über einen Satz des Herrn Kakeya

(The Töhoku Mathematical Journal, VoL 4, 1913, p. 89-93.)

LXXXVIII. Über die algebraische Darstellung der Normgebilde.

632

(Mathematische Annalen, Bd. 74, 1919, S. 313--320.)

LXXXIX. Über die Komposition der quadratischen Formen (Mathematische Annalen, Bd. 88, 1923, S. 1--25.) (Aus dem Nachlass.)

641

XI

Geometrie.

+ ßv (Gemeinsam mit H. Schubert) . . . . . . . . . . . . . . . . . . . .

Seite

XC. Über den Chasles'schen Satz ocp,

669

(Nachrichten von der k. Gesellschaft der Wissenschaften zu Göttingen, 1876, s. 503-517.)

XCI. Über unendlich-vieldeutige geometrische Aufgaben, ms-

besondere über die Schliessungsprobleme . . . . .

679

(Mathematische Annalen, Bd. 15, 1878, S. 8-15.)

XCII. Über die Anwendung der elliptischen Funktionen auf

Probleme der Geometrie . . . . . . . . . . . . .

687

(Mathematische Annalen, Bd. 19, 1882, S. 56--66.)

XCIII. Beweis eines Satzes aus der Theorie der Raumkurven

III. Ordnung . . . . . . . . . . . . . . . . .

699

(Mathematische Annalen, Bd. 20, 1882, S. 135-137.)

XCIV. Über Tangentenkonstruktionen. . . . . . . . .

702

XCV. Einige allgemeine Sätze über Raumkurven . . .

706

(Mathematische Annalen, Bd. 22, 1883, S. 230-233.)

(Mathematische Annalen, Bd. 25, 1885, S. 287-292, mit einem Zusatz in den Mathematischen Annalen, Bd. 25, 1885, S. 287.)

XCVI. Über eine besondere Raumkurve III. Ordnung . . . .

713

(Mathematische Annalen, Bd. 30, 1887, S. 291-298.)

XCVII. Über die Schröter'sche Konstruktion der ebenen Kurven

dritter Ordnung. . . . . . . . . . . . . . . . . . .

722

(Journal für die reine und angewandte Mathematik, Bd. 107, 1891, s. 141-147.) (Aus einem an Herrn H. Schröter gerichteten Briefe.)

Anhang. I.

Sur les points critiques des fonctions inverses des fonctions entieres. . . . . . . . . . . . . . . . . . . .

731

(Comptes rendus des seances de l'Acad~mie des Sciences, Paris, vol. 158, 1914, p. 1007-1008.)

II. Verallgemeinerung des Pohlke'schen Satzes. . . . . . .

732

(Verhandlungen der Schweizerj.schen Naturforschenden Gesellschaft, 1918, s. 127.) (Aus einem Briefe an Herrn Louis Kollros.)

III. Über Beziehungen zwischen den Primidealen eines algebra-

ischen Körpers und den Substitutionen seiner Gruppe (Mathematische Zeitschrift, Bd. 25, 1926, S. 661-665.) (Aus dem Nachlass.)

733

XII

Bemerkungen zur vorstehenden Arbeit von Fritz Gassmann

Seite

737

(Mathematische Zeitschrift, Bd. 25, 1926, S. 666-668.)

IV. Aufgaben .

740

V. Lösungen .

742

VI. Über den handschriftlichen Nachlass

752

VII. Verzeichnis der Dissertationen . . .

754

Vorwort. Der vorliegende zweite Band der Hurwitz'schen Werke bringt, entsprechend den Anweisungen im Nachlass des Verfassers, die Abhandlungen über Zahlentheorie, Algebra und Geometrie. Zwei nach dem Tode von Hurwitz erschienene Abhandlungen, eine zahlentheoretische und eine algebraische, wurden in die betreffenden Fachgruppen eingereiht. Eine dritte nach dem Tode von Hurwitz abgedruckte Arbeit, von mehr skizzenhaftem Charakter, wurde in den Anhang aufgenommen. Weiter sind in dem Anhang zusammengestellt: Zwei kurze, zu Lebzeiten von Hurwitz erschienene Noten, die er nicht in das Verzeichnis seiner Arbeiten aufnahm, die von Hurwitz publizierten Aufgaben und Lösungen, die Titel der auf seine Anregungen zurückgehenden Dissertationen, und einige Angaben über seine nachgelassenen Manuskripte, insbesondere über seine Tagebücher. Die zu einer würdigen Bearbeitung der Hurwitz'schen Tagebücher notwendigen Mittel standen uns nicht zu Gebote, aber wir wollen mindestens nicht die Gelegenheit versäumen, auf deren reichen und mannigfaltigen Inhalt auch an dieser Stelle hinZUWeiSen.

Es konnten nicht in diese Werke aufgenommen werden die selbständig in Buchform erschienenen Vorlesungen von Hurwitz: diejenigen über die Zahlentheorie der Quaternionen, von ihm selbst herausgegeben, und diejenigen über Allgemeine Funktionentheorie und elliptische Funktionen, herausgegeben von R. Courant. Zu den am ersten Band beteiligten Mitarbeitern sind drei weitere hinzugetreten, um den Druck der Abhandlungen des vorliegenden zweiten Bandes zu überwachen, Max Gut, Heinz Hopf und Louis Kollros,

XIV

alle drei in Zürich. Sämtliche Korrekturbogen dieses Bandes wurden durch Herrn Dr. Reinwald Jungen, Assistent am Mathematischen Seminar der Eidgenössischen Technischen Hochschule, einer Durchsicht unterzogen. Im Auftrag der Abteilung für Mathematik und Physik der Eidgenössischen Technischen HochE>chule in Zürich

Georg P6lya. Zürich, den 24. Januar 1933.

ZAHLENTHEORIE

XLIV.

Über Relationen zwischen Klassenanzahlen binärer quadratischer Formen von negativer Determinante. (Berichte der k. sächsischen Gesellschaft der Wissenschaften zu Leipzig, mathematisch-physische Klasse, Bd. 36, 1884, S. 193-197.)

In einer Note, welche in den Göttinger Nachrichten vom 21. November 1883 veröffentlicht ist, habe ich gezeigt, wie die von Herrn Klein sogenannten Modularkorrespondenzen mit Hilfe der &-Funktionen mehrerer Veränderlichen analytisch dargestellt werden könnent). Seither habe ich mein Augenmerk namentlich auf die Verwendung dieser Entwicklungen zur Aufstellung von Klassenzahlrelationen gerichtet. Ein Teil meiner diesbezüglichen Untersuchungen bildet den Inhalt einer in den Mathematischen Annalen (Bd. 25) demnächst erscheinenden Abhandlung 2), in welcher ausser allgemeinen Ansätzen insbesondere die Ableitung der Klassenzahlrelationen der 7. Stufe ent· halten ist. Im Nachstehenden erlaube ich mir nun die Endresultate mitzuteilen, zu welchen mich die analogen Untersuchungen für die 11. Stufe geführt haben; die Beweise der betr. Formeln hoffe ich demnächst andern Orts ausführlich darlegen zu können. Wie bei den Klassenzahlrelationen 7. Stufe ausser Teilersummen eine höhere zahlentheoretische Funktion 1p (n) auftritt, so kommen in den Relationen der 11. Stufe drei höhere zahlentheoretische Funktionen vor, welche ich mit 'Pt (n), 1p2 (n), 1p3 (n) bezeichne. Diese Funktionen sollen hier nur für durch 11 nicht teilbare Werte von n definiert werden; überhaupt möge der Buchstabe n im Folgenden stets eine zu 11 teilerfremde positive Zahl bedeuten. Die Funktion 'Pt(n) hat die Bedeutung: 1

'Pt (n) = 2 Ex, 1 ) Zur Theorie der Modulargleichungen, Nachrichten von der k. Gesellschaft der Wissenschaften zu Göttingen (1883), S. 350-363 [diese Werke, Bd. I, 8.138-146]. Die zitierte Arbeit beschäftigt sich allerdings nur mit speziellen Modularkorrespondenzen; jedoch lassen sich, wie leicht zu erkennen, die dort angestellten Betrachtungen auf beliebige Modularkorrespondenzen übertragen. 2 ) Über Relationen zwischen Klassenanzahlen binärer quadratischer Formen von negativer Determinante, Mathem. Annalen, Bd. 25 (1885), S. 157-196 [diese Werke, Bd. II, S. 8-50].

2

Zahlentheorie.

die Summe erstreckt über alle diejenigen Lösungen der Gleichung

4n = x 2 + 11 y 2 durch positive oder negative ganze Zahlen x, y, in welchen x quadratischer Nichtrest von 11 ist. Hiernach wird z..B. tp1 (1) = 1 , tp1 (3) = -1 usw., und allgemein tp1 (n)

= 0,

wenn n quadratischer Nichtrest von 11 ist. Zur Definition der Funktionen tp2 (n), tp3 (n), betrachte ich die Gleichung 4 n = x 2 + 11 y 2 + z2 + 11 u2. Es bezeichne Z (n) die Zahl der Lösungen dieser Gleichung in positiven oder negativen ganzen Zahlen x, y, z, u, wobei jedoch nur solche Lösungen gezählt werden sollen, in welchen x + y eine gerade Zahl ist. Unter diesen Z (n) Lösungen wähle man ferner diejenigen aus, in welchen eine der Zahlen x, z, x- z, x + z durch 11 teilbar ist; die Anzahl dieser ausgewählten Lösungen sei Z 0 (n). Alsdann hat man die folgenden Definitionsgleichungen: ( ) _

5Z(n)-12 (n)

2

(n)

2(

2(

+ 21p (n). 3

n) - 1p3 ( n) .

n) - 1p3 ( n) .

Zahlentheorie.

4

il. Formeln, in welchen n irgend einen quadratischen Rest von 11 bedeutet. 11· ~ [H(4n- "2) -H ( 4 ~;"•)] 4n = 2 ~(n) + '1'1 (n) -2'f'3 (n). 5 · ~ [H(4n-"2) + 11· H ( 4 "1; "1 )] 4n = ~(n)-'1'2 (n)-10U".

5·~H(4n-"2) = ~(n)-'1'2 (n)-5U5 "-5U9 n· 5n

5·~H(4n-"2) = ~(n)-'1'2 (n)-5U3 "-5U4 n· 9n

6 · ~ H(4n- "~ = ~(n) + '1'1 {n) + '1'2 (n)-'1'3 (n). n

6 · ~ H(4n-"2) = ~(n) -'1'1 (n) + '1'2 (n)-'1'3 (n). Sn

6 · ~ H(4n- " 2) = ~(n)-'1'1 (n)+'l'2 (n) +2'1'3 (n). 0

Die beiden von Herrn Gierster abgeleiteten und die weitem fünf von demselben vermuteten Formeln1) stehen im Einklang mit den vorstehenden Resultaten. Die Elimination der Funktionen 'f'2 {n) und 'l'a(n) liefert nämlich eine Reihe von Formeln, welche nur noch die Funktion 'Pt (n) enthalten; unter diesen finden sich insbesondere auch die Gierster'schen Formeln, wie das von vomherein zu .erwarten stand. Königsberg i. Pr., den 4. Dezember 1884. 1 ) J. Gierster, Über Relationen zwischen Klassenanzahlen binärer quadratischer Formen von negativer Determinante (Zweite Abhandlung), Mathem. Annalen, Bd. 22 (1883), s. 203-206.

XLV.

Sur Ia decomposition des nombres en cinq carres. (Comptes rendus des seances de l'Academie des Sciences, Paris, vol. 98, 1884, p. 504-507.) (Extrait d'une lettre adressee a M. Hermite.)

M. Stieltjes vous a communique, dans une lettre inseree aux Comptes rendus du 31 decembre 1883 1), des resultats interessants qui se rattachent a la decomposition d'un nombre entier en cinq carres. A la fin de sa lettre, M. Stiel tj es indique une proposition qu'il a trouvee par voie d'induction, a savoir

F(p 2) = 10(p 3 -p + 1), F(p 4) = 10[p(p 2 -1)(p 3 + 1)

+ 1],

ou l' on designe par F (n) le nombre des solutions de I' equation

n

= x2 + y2 + z2 + t2 + uz

et par p un nombre premier impair. Or, j'ai trouve que l'on peut enoncer ce theoreme plus general: Le nombre des decompositions du carre d'un entier quelconque m en c~nq carres s' exprime par F(m2) = 10 23k+3_1 P3a+3_P3a+l + p-1 q3f1+3_q3fl+l+ q-1 23 -1

p 3 -1

q3 -1

... ;

on suppose

2' p' q' ... etant des nombres premiers differents. Pour le demontrer, posons m = 2kn et representons, comme le fait M. Stieltjes, par q;(oc) la somme des diviseurs impairs du nombre entier oc. 1 ) Stieltjes: Sur le nombre de decompositions d'un entier en cinq carres, Comptes rendus des seances de 1'Academie des Sciences, Paris, vol. 97 (1883), p. 1545 a 1547 [Oeuvres, t. I., p. 329-331].

Zahlentheorie.

6

On aura, d'apres les formules de M. Stieltjes,

(1)

=10

23k+3_1 3

~

2 -1

' " cp(m.m),

Ia somme portant sur tous les nombres m,m, ' " positifs et 1mpmrs, satisfaisant a Ia condition m' + m" = 2n.

Or, on verifie saus difficulte Ia relation suivante:

m' et m" etant deux entiers quelconques, y' b' e' ... etant Ies nombres premiers impairs [[differents]l qui divisent a Ia fois m' et m". Les sommes portent respectivement sur tous les nombres y, b, e, ... , sur toutes les combinaisons de ces nombres pris [[ deux a deux]] trois a trois, et ainsi de suite. En s'aidant de cette relation, on trouve

~ cp (m'. m") = ~ cp (m~) cp (m;) - ~ p ~ cp (m~) cp (m;) mJ.,ml m~,m; (3) + ~ pq~ cp(m~q)cp(m;q)- · · ·, m~q;m';,q

le signe ~ portant sur tous les nombres m~,

m:,,m;;

qui satisfont

a Ia

m; positifs et impairs

relation I

II

m"+m"

=

f'l,

26 .

Maintenant faisons usage de Ia formule connue cp(1)cp(2n-1)

+ cp(3)cp(2n-3) + cp(5)cp(2n-5) + ··· + cp(2n-1)cp(1) = Ca(n),

ou C3 (n) represente Ia somme des cubes des diviseurs du nombre impair n. A I' aide de cette formule, I' equation (3) se transforme en celle-ci:

Decomposition des nombres en cinq carres.

~ cp(m'. m") = =

C3 (n)- ~ PCa(;)

7

+ ~ pqCa (;q)- .. ·

[Ca(Pa) -pCa(Pa-l)][Ca(qß) -qCa(qß-l)] · · · p3a+3_p3a+l+p-1

q3ß+3_q3ß+l+q-1

p3-1

q3-1

En substituant cette valeur de ~ cp(m'. m") dans l'equation (1), on obtient l'expression de F(m 2) qu'il s'agissait de demontrer. Remarquons que l'on peut evaluer directement les sommes A = cp(m 2) + 2cp(m 2 -4) + 2cp(m 2 -16) +. · ·, B= cp(m 2 -1) + cp(m 2 -9) + cp(m 2 -25) + · · ·

dont se compose F(m 2)=16(A+2B)+8(-1)m(A-2B), a l'aide de la relation (2) et des formules generales de M. Liouville 1). C'est ainsi que l'on trouve verifiees les formules deM. Stieltjes dans le cas special d'un nombre carre. Enfin, j'observe que ces formules memes se tirent en partie des resultats que M. Liouville a obtenus a la fin du septieme article >, Journal de mathematiques pures et appliquees, 2me serie, t. 4 (1859), p. 1-8. 1 ) Sur quelques formules generales qui peuvent etre utiles dans la theorie des nombres, Journalde mathematiques pures et appliquees, 2me serie, t. 3-10 (1858-1865).

XLVI.

Über Relationen zwischen Klassenanzahlen binärer quadratischer Formen von negativer Determinante. (Mathematische Annalen, Bd. 25, 1885, S. 157-196.)

Die beiden Abhandlungen, welche ich hier veröffentliche, stehen in engstem Zusammenhange mit den unter gleichem Titel erschienenen Arbeiten des Herrn Gierster1 ). Für die in diesen Arbeiten niedergelegten Untersuchungen war einerEeits der Gedankengang massgebend, welchen Herr Kronecker 2) zur Herleitung seiner Klassenzahlrelationen auf die Modulargleichungen der elliptischen Funktionen zuerst anwandte; andererseits basieren jene Untersuchungen auf der von Herrn Klein 3) entwickelten Theorie der Modulfunktionen. Indem nämlich gernäss dieser Theorie die Modulargleichungen der elliptischen Funktionen nur Glieder einer unendlichen Reihe ähnlicher Gleichungen sind, erhebt sich die Frage, ob nicht auch aus jeder dieser Gleichungen in ähnlicher Weise wie aus den Modulargleichungen der elliptischen Funktionen Klassenzahlrelationen gewonnen werden können - und es ist diese von Herrn Klein angeregte Frage, welche Herr Gierster in den genannten Arbeiten mit Erfolg in Angriff genommen hat. Was jene Gleichungen angeht, so entspringen dieselben aus der Transformation derjenigen algebraischen Moduln, welche nach Herrn Klein als Kongruenzmoduln zu bezeichnen sind und denen als solchen eine bestimmte "Stufe" q und (wie jedem algebraischen Modul) ein bestimmtes Geschlecht p zugehört 4). Für den Fall nun, dass das Geschlecht p > 0 ist, stellte sich bei dem Versuche die betreffenden 1 ) Mathem. Annalen, Bd. 21 (1883), S. 1-50 und Bd. 22 (1883), S. 190-210. Die Abhandlungen sollen im Folgenden mit I. und II. zitiert werden. 2 ) Über die Anzahl der verschiedenen Klassen quadratischer Formen von negativer Determinante, Crelles Journal, Bd. 57 (1860), S. 248-255 [Werke, Bd. IV, S. 185-195]. 3 ) Zur Theorie der elliptischen Modulfunktionen, Sitzungsber. der Münchener Akademie, Bd. 10 (1880), S. 89-100 oder Mathem. Annalen, Bd. 17 (1880), S. 62-70 [Ges. Abhandlungen, Bd. III, S. 169-178]. 4 ) Vgl. Klein, a. a. 0.

Über Relationen zwischen Klassenanzahlen.

9

Klassenzahlrelationen aufzustellen eine Schwierigkeit ein, welche in dem bisherigen Mangel einer ausreichenden analytischen Darstellung der zugehörigen Transformationsgleichungen ihren Grund hat1). Dieses ist der Punkt, an welchem meine Untersuchungen einsetzen. Freilich ist mir die vollständige Durchführung der zum Ziele führenden Betrachtungen nur in einigen wenigen Fällen 2) gelungen; doch hoffe ich, da der im allgemeinen Falle einzuschlagende Weg klar vorgezeichnet ist, auch diesen in Bälde erledigen zu können. Dem vorliegenden in der zweiten Abhandlung enthaltenen Teile meiner Untersuchungen habe ich eine erneute Herleitung der Klassenzahlrelation erster Stufe in der ersten Abhandlung vorausgeschickt. Es erschien mir dieses für das Verständnis der zweiten Abhandlung wünschenswert, da der allgemeine Gedankengang bei dem einfachsten Falle, welchen die Klassenzahlrelation erster Stufe darbietet, am klarsten hervortritt. Dabei glaube ich die Herleitung dieser Relation in nicht unwesentlichen Punkten vereinfacht zu haben. Die zweite Abhandlung zerfällt in zwei Abschnitte, von welchen der erste die allgemeinen Hilfsmittel für die Aufstellung der Klassenzahlrelationen entwickelt, wobei nur in dem letzten Teile des Abschnittes die Stufe als eine Primzahl vorausgesetzt wird. Diesen letzten Teil hätte ich wesentlich abkürzen können, wenn ich die "linke Seite G der. Klassenzahlrelation", wie sie Herr Gierster abgeleitet hat (I. S. 29ff.), als bekannt hätte voraussetzen wollen. Hierdurch würde aber, da die Zahl G bei mir eine neue Bedeutung erhält, die Klarheit erheblich gelitten haben; überdies glaube ich auch hier die betreffenden Entwicklungen zum Teil in wesentlich vereinfachter Form zu geben. Der zweite Abschnitt enthält die vollständige Durchführung des Falles der 7ten Stufe. Was die hier erhaltenen Endresultate anlangt, so sind dieselben, bis auf eine einzige Formel, von Herrn Gierster auf anderem Wege bewiesen worden. Aber auch diese letzte Formel hat schon Herr Gierster als vermutungsweise bestehend aufgestellt (II. S. 203). 1 ) Siehe Gierster: Über Relationen zwischen Klassenanzahlen binärer quadratischer Formen von negativer Determinante (Zweite Note), Sitzungsber. der Münchener Akademie, Bd. 10 (1880), S. 147-163 oder Mathem. Annalen, Bd. 17 (1880), S. 74-84. 2 ) Dazu gehört namentlich auch der in meiner Note: Zur Theorie der Modulargleichungen, Göttinger Nachrichten, 1883, S. 350-363 [diese Werke, Bd. I, S. 138-146], behandelte Fall. Derselbe liefert einen neuen Beweis für diejenigen Klassenzahl-Relationen, welche Herr Kronecker aus anderen Betrachtungen hergeleitet hat: Über quadratische Formen von negativer Determinante, Monatsber. der Berliner Akademie, 1875, S. 223-236 [Werke, Bd. IV, S. 245-259].

10

Zahlentheorie.

Die Grundlagen der im Folgenden anzustellenden Untersuchungen können wohl grösstenteils als bekannt vorausgesetzt werden. Nur der Wunsch nach Vollständigkeit veranlasst mich, dieselben in den ersten Paragraphen der ersten Abhandlung kurz zusammenzustellen1).

I. Abhandlung.

Die Klassenzahlrelation der ersten Stufe. §1.

Die Äquivalenz der Grössen. Man bezeichnet zwei Grössen w 1 und w als äquivalent, wenn die Gleichung w1 = ~ro+~ =S(w) yw+6

durch vier ganze Zahlen «., ß, y, (), welche der Bedingung rt,{)-ßy=l

genügen, befriedigt werden kann. Man sagt dann auch, dass w 1 aus w durch die Substitution oder Transformation

hervorgehe. Aus dieser Festsetzung ergibt sich leicht, dass die mit i multiplizierten Teile zweier äquivalenten Grössen dasselbe Vorzeichen besitzen. In Rücksicht hierauf beschränke man die Betrachtung auf Grössen w mit positiv-imaginärem Bestandteile. Man konstruiere nun in der (positiven) Halbebene, deren Punkte die Werte der komplexen Grösse w = x + i y (y > 0) geometrisch darstellen, die Geraden 1

1

x= 2 und x=-2 und den Kreis

x2+ y2 = 1. 1) Siehe Dedekind: Schreiben an Herrn Borchardt über die Theorie der elliptischen Modulfunktionen, Crelles Journal, Bd. 83 (1877), S. 265-292 [Ges. Werke, Bd. I, S. 174-201] und Klein: Über die Transformation der elliptischen Funktionen und die Auflösung der Gleichungen fünften Grades, Ma.them. Annalen, Bd. 14 (1879), S. 111-172 [Ges. Abhandlungen, Bd. III, S. 13-75]. Eine ausführliche Darstellung findet ma.n in meiner Abhandlung: Grundlagen einer independenten Theorie der elliptischen Modulfunktionen und Theorie der Multiplikatorgleichungen erster Stufe, Ma.them. Annalen, Bd. 18 (1881), S. 528-592 [diese Werke, Bd. I, S. 1-66].

11

Über Relationen zwischen Klassenanzahlen.

Diese Linien begrenzen em krummliniges Dreieck mit den Ecken W=iOO, W=(!, W=1+(!

((!=e2in) 3 ,

welches als Fundamentaldreieck bezeichnet werde. Von der Begrenzung dieses Dreiecks soll nur die auf Seiten der negativen X-Axe liegende Hälfte zu dem Dreieck gerechnet werden. Dann hat man folgendes Theorem: "Es gibt zu jeder willkürlich gewählten Grösse w eine und nur eine äquivalente Grösse, welche geometrisch durch einen Punkt des Fundamentaldr·eiecks dargestellt wird.'' Indem man die Bezeichnung der Äquivalenz zweier Grössen auf die diese Grössen darstellenden Punkte überträgt, kann man auch sagen, dass die Punkte des Fundamentaldreiecks ein vollständiges System inäquivalenter Punkte bilden. Dieser Charakter wird dem Punktsysteme nicht verloren gehen, falls jeder Punkt durch irgend einen äquivalenten ersetzt wird. Ersetzt man insbesondere jeden Punkt w des Fundamentaldreiecks durch den Punkt S ( w) =

~:! ~

, so ent-

steht ein neues vollständiges System inäquivalenter Punkte, welches aus allen Punkten eines neuen Dreiecks gebildet wird. Letzteres wird von Kreis- oder Geradenstücken, welche auf der X-Axe senkrecht stehen, begrenzt und möge seiner Entstehung entsprechend als "Dreieck S(w)" bezeichnet werden. Die Dreiecke S ( w) überdecken in ihrer Gesamtheit die positive Halbebene einfach und lückenlos, indem sich um jeden zu e äquivalenten Punkt 6 Dreiecke lagern, während sich in jedem zu i oo äquivalenten, also in jedem einen rationalen Wert darstellenden Punkte, unendlich viele Dreiecke aneinander legen. Aus den bisher gemachten Angaben ergibt sich noch leicht die vollständige Auflösung der Gleichung w = S ( w) , wo w eine Stelle im Innern der positiven Halbebene bezeichnet. Wird w zunächst auf das Fundamentaldreieck eingeschränkt, so lässt diese Gleichung nur folgende Auflösungen zu:

w=

e;

w=e; Daraus folgt, dass die allgemeinen Auflösungen der Gleichung diese sind:

12

Zahlentheorie.

w = U(i); s = US1 u-1 ,

w= U(e); S = US2 U-t,

w = U(e); s = us~u- 1 •

n,

Hierbei bedeutet U irgend eine Substitution, und es ist durchgehends von der selbstverständlichen Lösung S =

(~

also ro= w, abgesehen.

§ 2. Es sei

Quadratische Formen. Pu 2 + Quv + Rv 2

eine positive quadratische Form, so dass -P und -R sowie die Determinante der Form negative ganzzahlige Werte besitzen. Diejenige Wurzel der Gleichung

Pu 2 +Qu+ R = 0, welche einen positiv-imaginären Bestandteil hat, werde als die erste Wurzel der Form bezeichnet. Dann lässt sich die notwendige und hinreichende Bedingung der Äquivalenz zweier positiven Formen derselben Determinante dahin aussprechen, dass die ersten Wurzeln der Formen äquivalente Grössen im Sinne des § 1 sein müssen. Nennt man ferner eine positive Form reduziert, falls ihre erste Wurzel dem Fundamentaldreieck angehört, so ergibt sich aus § 1 sofort der Satz: "Jede Form ist einer und nur einer reduzierten Form äquivalent". Man bemerke, dass die Formen, deren erste Wurzel w = i, bzw. w = (! ist, lauten: {P, 0, P) bzw. {P, P, P), wo P eine beliebige positive Zahl bedeutet. § 3.

Modulfunktionen. Die Funktion F(ro) heisst eine Modulfunktion (im engeren Sinne), wenn sie eindeutig von dem Argumente w abhängt und die in der Gleichung F(ro) =F(S(w)) ausgesprochene Eigenschaft besitzt.

Über Relationen zwischen Klassenanzahlen.

13

Die Betrachtung des über die Begrenzung des Fundamentaldreiecks zu erstreckenden Integrals

2 ~ij dlogF(w) ergibt in bekannter Weise die Relation N=U,

wo die Zahlen N und U angeben, wie oft F(w) im ganzen von der ersten Ordnung unendlich klein bzw. unendlich gross wird, falls w das Fundamentaldreieck beschreibt. Dabei sind an den Stellen w=ioo,

(!, ~

bezüglich die Grössen

q2, (w-e)3,(w-i)2, (q=ei"w) an jeder andern Stelle w = w0 des Fundamentaldreiecks die Grösse w- w0 als unendlich klein von der ersten Ordnung anzusehen. Die einfachste hierhergehörige Funktion wird durch die Gleichung

J(w) =

1 ( -+20 12 (w) = ll' &[fr(w) -ir(Ri(w)) -er], wobei im Falle, dass n ein Quadrat und

0 ) (mod. q) (ab)_ c d = (-Vn o yn ist, der zu w relativ äquivalente Repräsentant auszulassen ist, so reproduziert sich q> (w) bis auf einen Exponentialfaktor, sei es dass w Siehe § 4 der ersten Abhandlung. Klein, Sitzungsberichte der Münchener Akademie, Bd. 10 (1880), S. 96 oder Mathem. Annalen, Bd. 17 (1880), S. 67 [Ges. Abhandlungen, Bd. III, S. 174]. 1) 2)

26

Zahlentheorie.

durch T (w) oder das Repräsentantensystem R 1 ( w) , R 2 ( w), • . • durch irgend ein anderes zu demselben Schema

(~ ~)

(mod. q) gehörendes

ersetzt werde. Von dieser Eigenschaft der Funktion if> ( w) wird bei der Abzählung ihrer Nullstellen beständiger Gebrauch gemacht.

§ G.

Zahl der Nullstellen von if> ( w). Es soll untersucht werden, wie oft if>(w) verschwindet, wenn w das Fundamentalpolygon beschreibt. Dabei soll jedoch von denjenigen Nullstellen, welche von der Wahl der Grössen wl> w2 , ••• , w2 P_ 2 abhängen, abgesehen werden. Ausserdem seien die (auf der Axe der reellen Zahlen liegenden) Ecken des Fundamentalpolygons vorläufig ausgeschlossen. Für eine Nullstelle w = w0 von if> (w) wird w notwendig einem Repräsentanten R;(w) relativ äquivalent, so dass derselben eine Gleichung der Form (1)

::::~ :: ,

w0 =

(::

~:) =(: ~)

(mod. q)

entspricht. Umgekehrt kann einer solchen Gleichung eine bestimmte (nach § 3 einfach zu zählende) Nullstelle von if> (w) zugewiesen werden; nämlich diejenige, welche dem zu ;:: ~ ;: äquivalenten Repräsentanten entspricht. Alsdann wird zu zwei verschiedenen Gleichungen w 0 -

+ b' c'w 0 + d' '

a'w

--,--..::.0....:___,,..,..

_ a" w 0

+ b"

Wo - c" wo + d"

nur dann dieselbe Nullstelle gehören, wenn (unabhängig von w) a'w c'w

+ b' + d'

a"w

+ b"

und c"w + d" relativ äquivalent sind. Dann würde

sein. Diese Gleichung ist aber unmöglich. Denn es müsste 1) T = US 1 U-1 oder US2 u-t oder US2 U- 1 2

also, da T

=(~ ~) (mod. q)

ist, auch

----1) § 1 der ersten Abhandlung.

'

Über Relationen zwischen Klassenanzahlen.

sl

oder 82 oder

n

s~ =(~

(mod. q)'

sein, was nicht der Fall ist. Falls n ein Quadrat ist, und

( ac ab)=

(von~~-) vn

27

(mod. q),

wären noch diejenigen Gleichungen (1) auszuschliessen, für welche · d a b er, · h ungen sm · t . So1ch e Gl mc ·· · lent 1s + d'b' m1"t w re1a t"IV aqmva + da sie auf w 0 = T(w 0) führen, gar nicht vorhanden. Es folgt daher: "Sieht man ab von den für rationale Werte von w eventuell stattfindenden und den von w1 , w2 , ••• , w2 P_ 2 abhängigen Nullstellen, so verschwindet cJ> ( w) im Fundamentalpolygon gerade so oft, als Gleichungen w a' c'w

+ b' a'w --:---c;-;w - --;--=-0 o- c'w0 +d'

(1)

angesetzt werden können, wo w0 eine Stelle des Fundamentalpolygons bezeichnet und a', b', c', d' ganze Zahlen bedeuten, welche den Bedingungen b') c' d' a'd' - b' c, = n, (a'

=(ac db)

(mo d . q)

unterworfen sind."

§ 6.

Fortsetzung. Die Zahl der möglichen Ansätze (1) ist nun durch eine Summe von Klassenzahlen ausdrückbar1). Man denke sich alle positiven quadratischen Formen der negativen 2 , wo " alle positiven und negativen ZahlDeterminanten -4n werte erhält, die absolut genommen kleiner als 2 yn sind, .diese Formen in Klassen verteilt und aus jeder Klasse ein Individuum (P, Q, R) nach Willkür ausgewählt. Dann kann man zu jeder Form (P, Q, R) ein vollständiges System (mod. q) inkongruenter Substitutionen (8) bestimmen, so dass die Ansätze

+"

w o-

-Q+>
(n)-24Uv-n-3tp(n),

= 44>(n) -12 U v'n

+ 2tp(n),

2vn

2 · ~ H (4n-'---- x2)

=

4>(n)

+ tp(n),

0

3·~H(4n-x2)

= 3 · P(n)- 4>(n)

2·~H(4n-x 2)

=

vn

4vn

4>(n) -tp(n).

+ 6 Uv-n'

50

Zahlentheorie.

Bei Aufstellung der vierten Relation ist die Gleichung

2 (U.y;; + U2 .y;; + U4 .y;;) = cf>(n) -lJI(n) zu Hilfe genommen. Ein Vergleich der obigen mit den Gierster'schen Formeln ergibt vollständige Übereinstimmung, wenn man erstens die Gleichung VJ(n)

= --12 1](n)

beachtet und zweitens in Rücksicht zieht, dass die von mir gebrauchten Summen immer doppelt so gross sind wie die entsprechenden von Herrn Gierster eingeführten. Königsberg i. Pr., Ende Juli 1884.

XLVII.

Über die Klassenzahlrelationen und Modularkorrespondenzen primzahliger Stufe. (Berichte der k. sächsischen Gesellschaft der Wissenschaften zu Leipzig, mathematischphysische Klasse, Bd. 37, 1885, S. 222-240.)

Bei meinen Untersuchungen über die Klassenzahlrelationen der ~n und llten Stufe 1) hat sich herausgestellt, dass die auf der rechten Seite dieser Relationen ausser Teilersummen noch auftretenden zahlentheoretischen Funktionen nichts anderes sind, als die Entwicklungskoeffizienten der überall endlichen Integrale der betreffenden Stufe. Dasselbe gilt, wie man sich leicht überzeugt, für die 6te und ste Stufe 2), und man kann, wenn man will, gleiches auch für die ersten fünf Stufen vom Geschlechte Null behaupten, wo es dann so viel heisst, dass zu den Teilersummen keine weiteren zahlentheoretischen Funktionen hinzutreten. Haben wir es hier mit einem allgemeinen, d. h. für alle Stufen gültigen Gesetze zu tun? Das ist die Frage, deren Entscheidung das nächste Ziel meiner weiteren Untersuchungen bildete. Es zeigte sich, dass die Entscheidung im bejahenden Sinne zu treffen ist, und ich möchte das hiermit bezeichnete Resultat in den nachfolgenden Zeilen begründen und näher präzisieren. Dabei beschränke icl'l mich jedoch auf den Fall primzahliger Stufen; man wird leicht erkennen, dass dieselben Betrachtungen mutatis mutandis auch für beliebige Stufen gelten. Da sich die Herstellung der Klassenzahlrelationen auf die Untersuchung der Modularkorrespondenzen stützt, so wird gleichzeitig im folgenden eine Theorie dieser Korrespondenzen angebahnt: die Dar1 ) Siehe: Über Relationen zwischen Klassenanzahlen binärer quadratischer Formen von negativer Determinante, Mathem . .Annalen, Bd. 25 (1885), S. 157-196 [diese Werke, Bd. II, S. 8-50] [[Die hier angegebenen Seitenzahlen beziehen sich auf den Wiederabdruck im vorliegenden Bande]] und die unter dem gleichen Titel erschienene Note in den Leipziger Berichten, Bd. 36 (1884), S. 193-197 [diese Werke, Bd. Il, 8.1-4]. 2 ) Wegen der 8. Stufe vgl. die Note: Zur Theorie der Modulargleichungen, Göttinger Nachrichten, 1883, S. 350-363 [diese Werke, Bd. I, S. 138-146].

52

Zahlentheorie.

stellung der Modularkorrespondenzen, wie sie sich im Laufe unserer Untersuchung ergibt, wird die Grundlage für diese Theorie bilden müssen 1). Übrigens habe ich in dieser Note nur solche Dinge zur Sprache gebracht, welche zur Erreichung des oben bezeichneten Zieles notwendig berührt werden mussten. Eine eingehendere Darstellung, bei welcher dann auch alle Entwicklungen von einem höheren Gesichtspunkte aus beleuchtet werden sollen, denke ich demnächst zu veröffentlichen. § 1.

Die überall endlichen Integrale der

qten

Stufe 2).

Die überall endlichen Integrale der qten Stufe, wo q eine ungerade Primzahl bezeichnet, lassen sich als diejenigen eindeutigen überall endlichen Funktionen J(w) eines Argumentes w definieren, welche der Funktionalgleichung

J (;:: ~)

=

J(w)

!

+ const.

genügen; dabei bedeutet ;: ~ eine der Identität (mod. q) kongruente ganzzahlige Substitution der Determinante 1. Diese Funktionen kann man aus irgend p=

(q

+ 2) (q-3){ q-5) 24

derselben, zwischen denen keine lineare Abhängigkeit stattfindet, zusammensetzen. Wir legen nun unseren Untersuchungen ein spezielles System von solchen p unabhängigen Integralen zugrunde, die wir am zweckmässigsten in folgender Weise bezeichnen:

J 1 (wJO), J 2 (wJO), J 1 (wJa), J 2 (wJa), J 1 (wJb), J 2 (wJb),

J.t(wJO), J"'(w I a), J.(wJb).

Hier soll a ein vollständiges System quadratischer Reste, b ein vollständiges System quadratischer Nichtreste (mod. q) durchlaufen, so dass also in dem vorstehenden Schema 1 ) Man sehe die vorbenannte Note, sowie namentlich die von Herrn Klein gegebene Darstellung der auf die Modularkorrespondenzen der 8ten Stufe bezüglichen Untersuchungen des Herrn Fiedler, Leipziger Berichte, Bd. 37 (1885), S. 86 ff. [Ges. Abhandlungen, Bd. III, S. 269 ff.]. 2 ) Zum besseren Verständnis dieses Paragraphen ziehe man die a. a. 0. S. 19-23 gegebenen Entwicklungen zu Rate.

Klassenzahlrelationen und Modularkorrespondenzen.

A + (ft

53

q-1 + v) • -2-

Integrale enthalten sind 1). Diese Integrale besitzen nun die nachstehenden besonderen Eigenschaften. Es ist erstens: 2inr

(1)

J"(S(w)

Ir)= e-q-. J,.(wlr) + const.,

wenn S ( w) eine der Kongruenz S(w)

=w + 1 (mod. q)

genügende Substitution bezeichnet. Ferner hat man:

(2)

J"(U(w)

Ir)= J"(w Iar) + const.,

wenn die Substitution U(w) die Kongruenz U(w)

=aw (mod. q)

erfüllt. Dabei bezeichnet der Buchstabe r in der Gleichung (1) eine beliebige, in der Gleichung (2) eine nicht durch q teilbare Zahl, a bedeutet irgendeinen quadratischen Rest von q, und es ist

=

J"(wlr)

= J"(wlr')

zu setzen, falls r r' (mod. q) ist. Infolge einer dritten Eigenschaft unserer später auf die Untersuchung der Integrale schränken. Es ist nämlich stets möglich, aus ein anderes J (w) zusammenzusetzen, welches

Integrale dürfen wir uns J(wla) und J(wlb) beden letzteren Integralen der Gleichung

)+ .. ,_LJ(--1-)=J(wiO) )+J('-_1 (3) J(--!.)+J(--1 1 w+q-1 , w+2 w+1 w genügt, wo J ( w I0) irgend eines der Integrale J 1 (w I0) , J 2 ( w I0) , ... , J;. (w I0) bezeichnet. Betrachten wir endlich die Entwicklungen der Integrale J(w Ia) und J (w \ b) nach Potenzen der Grösse h = e2i:rw! Wir können dieselben jedenfalls in folgender Gestalt annehmen: 1)

Was die Zahlen Ä, p,, v angeht, so ist selbstverständlich Ä + (p, + v) · q~l als

Gesamtzahl der Integrale gleich p. Es ergibt sich auch ohne Schwierigkeit Ä = (q- 5~~q- 7 ) und also p, + v = (q-li~q- 5 ). Dagegen muss die Einzelbestimmung der Zahlen p, und v einer späteren Untersuchung vorbehalten bleiben. [[Wenn q 1 (mod. 4) ist, ist p, = v. Dies folgt aus einem Satze meiner Arbeit: .. Uber diejenigen algebraischen Gebilde, welche eindeutige Transformationen in sich zulassen, Göttinger Nachr., 1887, S. 99 oder Mathem. Annalen, Bd. 32 (1888), S. 301 [diese Werke, Bd. I, S. 252]. - Zusatz nach Handexemplar Hurwitz.]]

=

Zahlentheorie.

54

,J,(wla)~ ~"';:'>h'"i,

I

(4)

J, (w I

b) ~

m

~'P2(m)hq J 2 (w Ia) -_ ~----;;' ... ,

J: ,,~m) h'"i,

m""a

wo das Zeichen ~ andeutet, dass der Summationsbuchstabe m alle m""r

(mod. q) zu r kongruenten positiven Zahlen durchlaufen soll. Durch diese Ansätze sind im ganzen (p, + v) zahlentheoretische Funktionen definiert; nämlich erstens p, Funktionen "P1 (m) ,

1p2(m)

, ... ,

1p,. ( m)

,

bei welchen das Argument m irgendein positiver quadratischer Rest von q, und zweitens v Funktionen X1(m),

X2(m), ... ,

X.(m),

bei welchen das Argument m irgendein positiver quadratischer Nichtrest von q sein kann. Es ist nun eine letzte hier in Betracht kommende Eigenschaft unserer Integrale, dass die Funktionen "P und x fiir jeden Wert des Argumentes m ganzzahlige reelle Werte besitzen1 ). § 2.

Transformation

nter

Ordnung der überall endliehen Integrale

qter

Stufe.

Es bedeute nun n eine positive zu q teilerfremde Zahl und es mögen ein zum Schema

Rl (w) ' (

R2 ( w) ' ...

~ ~)

(mod. q)

gehöriges Repräsentantensystem der Transformation bilden2), so dass R1 (w) R 2 (w) =nw (mod. q)

=

nter

Ordnung

=···

ist. Dann wird gleichzeitig mit J (w) auch die Summe 3)

2J J(Ri(w)) !Zi(n)

1

Es gibt, beiläufig bemerkt, noch unzählig viele S.y·steme von p unabhängigen Integralen, welche die angegebenen Eigenschaften besitzen. 2) A. a. 0. S. 25. 3 ) Die Anzahl IP(n) der Repräsentanten R1 (w), R 2 (w), · · · ist bekanntlich gleich der Summe der Divisoren der Zahl n. 1)

Klassenzahlrelationen und Modularkorrespondenzen.

55

ein überall endliches Integral der qren Stufe vorstellen. Wenden wir diese Bemerkung auf die Integrale des § 1 an, so erhalten wir, unter Berücksichtigung der besonderen Eigenschaften (1) und (2) dieser Integrale, die folgenden Relationen: P.

!li(n)

:J} Jh(RJw) Ia) = ~

d,:(n) ·Ja (w Ina)

+ const.,

1

1 !IJ~)

V

:J} Jk(Ri(w) Ib) = ~ d~(n) · Jß(w Inb) + const., 1

1

wenn n quadratischer Rest von q ist; dagegen v

!li(n)

:J} Jh(Ri(w) Ia) = ~ e~(n) · Jß(w Ina) + const., 1

1

P.

!!i(n)

:J} Jk(Ri(w)lb)= ~

f~(n)·Ja(wlnb)

+ const.,

1

1

wenn n quadratischer Nichtrest von q ist. Dabei sind dem Buchstaben h sukzessive die Werte 1, 2, 3, ... p,, dem Buchstaben k sukzessive die Werte 1, 2, 3, ... v beizulegen und es bedeuten

J.: (n) ,

d~ (n) ,

f~ (n)

~ (n) ,

Zahlenfaktoren, welche ausser von ihren Indices nur noch von n abhängen. Zur Bestimmung dieser Faktoren tragen wir in die obigen Relationen die Entwicklungen [(4) in § 1] der Integrale nach Potenzen von h ein. Der Vergleich der hierbei auf beiden Seiten auftretenden Koeffizienten von h q ergibt die Gleichungen: Jl.'

[(;)

=

+1, (~) = +1],

(n) xß (m), [(;)

=

+1, (;) =

~ ÖVJh (:~) = ~ ~(n)VJa(m), 1

~ öXk ( :~ ) =

.$ d~

-1 J ,

~ÖVJh(:~)= ~~(n)xß(m), [(;)= -1, (;)= -1], 1

Jl.

~ öxk ( :~) = ~ f!(n) VJa(m), [(;) = -1, (;) = + 1], 1

wobei die Summen auf der linken Seite über alle gemeinsamen Divisoren

Zahlentheorie.

56

von n und m zu erstrecken sind. Die Zahlen n und m sind nur den bei jeder Gleichung mit Hilfe des Legendre'schen Zeichens angedeuteten Bedingungen zu unterwerfen. Jetzt bemerke man, dass n und m in den linker Hand auftretenden Summen symmetrisch vorkommen; es folgt daraus, dass notwendig , ... n v positive quadratische Nichtreste von q bezeichnen, welche nur der Bedingung unterworfen sind, dass die Determinante von Null verschieden ist. Ferner bedeute n irg.endeinen positiven quadratischen Nichtrest von q, und es seien Ri ( w) , R{ (w) , ... Ri ( w) untereinander (mod. q) kongruente, übrigens beliebige Repräsentanten der Transformation nter, nter, ... nter Ordnung. Dann besteht für jedes überall endliche Integral J (w) qer Stufe die Relation: (n(l))

, n< 2>, ... n lassen sich auf unzählig viele Weisen der Bedingung I Xp(nfl') I~ 0 gernäss wählen.

Klassenzahlrelationen und Modularkorrespondenzen.

61

§ 5.

Die Modularkorrespondenzen der qten Stufe. Nunmehr sollen, wie a. a. 0. S. 23, mit j 1 (w),j2 (w), ... jp(w)

p Normalintegrale der qten Stufe und mit O.[up ~2 , ••• up] oder kürzer 0.[u,] die zugehörige 0.- Funktion bezeichnet werden; ferner mögen c1 , c2 , ••• cP die a. a. 0. S. 23 angegebene Bedeutung haben. Zur Abkürzung setzen wir weiter:

IJ O.[j,(w') -j,(Ri(w))- c,] (l>(n)

C/Jn(w', w) =

1

und

lPn(w',w) Fnw,w=""(' ( ' ) )·ro.(' Y'n Wo, ro

.,yn w 'Wo )'

wo w~, w0 willkürliche aber feste Werte bedeuten. Schliesslich se1:

f ( , ) = {[Fn(w', w)]D. [Fn, (w', w)]D 1•... [Fn)w', w)]D 1P, oder [Fn(w', w)]E·.[Fnm(w', w)]Em• ... [Fn, ... n', welche mir der Bedingung genügen müssen, dass die Determinanten E = I xß(nß') I und E' =I xß(n'ß') I relative Primzahlen sind.

§ 6.

Die Klassenzahlrelationen der qten Stufe. Es mögen nun vier ganze Zahlen rx, ß, y, tJ, welche nur der Einschränkung unterworfen sind, dass rxiJ-ßy= no

quadratischer Rest von q sei, fest angenommen werden. Wir können dann für jeden Transformationsgrad n, welcher quadratischer Rest von q ist, ein Repräsentantensystem Ri (w) durch die Kongruenz

R,(ro)=~:!~ (mod.q) unzweideutig definieren. Die Glieder der auf diese Weise für die verschiedenen Transformationsgrade definierten Repräsentantensysteme werden sämtlich untereinander (mod. q) kongruent sein, und es dürfen daher - was jetzt geschehen soll - diese Repräsentanten bei der Bildung der Funktion fn(w', w) verwendet werden. Wir betrachten nun die Funktion fn*(w, w),

Klassenzahlrelationen und Modularkorrespondenzen.

welche aus fn(w', w) durch die Substitution w'

=

63

w entsteht. Dabei

ist jedoch im Falle, dass n ein Quadrat und ~:! ~ = w (mod. q) ist, der zu w äquivalente Repräsentant im Zähler von Fn(w', w) auszuscheiden, bevor w' = w gesetzt wird. Dieses soll der an fn gesetzte Stern andeuten. Abgesehen von diesem Falle, ist fn * (w, w) offenbar eine algebraische Funktion der Stelle w auf der Riemann'schen Fläche qter Stufe, während in jenem Ausnahmefalle die Funktion fn * (w, w) sich bis auf einen von w unabhängigen Faktor reproduziert, wenn die Stelle w einen geschlossenen Weg auf der Riemann'schen Fläche beschreibt. Jedenfalls wird daher fn * (w, w), auf der durch zweckmässige Querschnitte in eine einfach zusammenhängende verwandelten Fläche, ebenso oft Null wie unendlich werden. Nun werde die a. a. 0. S. 34 mit a bezeichnete Zahl der Nullstellen von I/' {}[jr(w)- jr(Ri(w))- Cr], da sie von n abhängig ist, hier der Deutlichkeit halber mit a(n) bezeichnet. Dann findet sich die Gesamtordnung der Null- und Unendlichkeitsstellen von fn * (w, w) gleich D(a(n) -2 ifJ(n) -17)

+ Dl

1(

a(n1) -2 if>(n1)) + ··· + DlP.( a(n) -2 if>(n))

und dieser Ausdruck muss, wie soeben bemerkt, gleich Null sein. Dabei haben wir r; nur dann von Null verschieden, und zwar gleich 2 (p -1) zu nehmen, wenn der durch den Stern angedeutete Fall vorliegt. In der so gewonnenen Gleichung a(n)- 2 ifJ(n) -r; = - l1 ( a(n1) -2 ifJ(n 1) ) - • • • -lP.( a(nP.)- 2 ifJ(np.))

ist die rechte Seite eine homogene lineare Funktion von '1'1 (n), 1p2 (n), ... 'IJip.(n) mit von n unabhängigen Koeffizienten, also etwa a(n) -2 ifJ(n)- r;

= h1 1p1 (n) + h2 1p2 (n) + ··· + hP. 1Jip.(n).

In dieser Formel sind nun die sämtlichen Klassenzahlrelationen für quadratische Reste n enthalten. Wollen wir diese Relationen explizite angeben, so müssen wir für die verschiedenen Wertsysteme IX, ß, y, ~ die Ausdrücke von a(n) der a. a. 0. S. 35 aufgestellten Tabelle entnehmen, wobei die dort mit a, b, c, d bezeichneten Zahlen bezüglich gleich (!IX, eß, er, e~ zu setzen sind, unter e eine die Kongruenz

befriedigende Zahl verstanden. Die verschiedenen Systeme sind zunächst nach der durch die Kongruenz

IX,

ß, y, ~

Zahlentheorie.

64

(oc + x.(n),

(q-1)~H(4n-x2)

s,n = 2r/J(n) +

kis·>x

1

(n) + k~·>x2 (n) + · · · + k~s·>x.(n)

- (q -1) · Ufv' Iqn_ 1 j zufolge, mit ·.n über alle Grenzen, und es ist, wegen (8),

1_1 I ~1_!1.!!_1-1-1 [>1-k, E)n-1

qn-1

also der absolute Betrag von

Xn+l

en beständig kleiner als 1 ~k, I.

( S) ist das System der komplexen ganzen Zahlen m

Es sei x = u

+ iv

+ ni.

eine beliebige komplexe Grösse. Ich setze x = a + (u' + iv'),

wo die komplexe ganze Zahl a so bestimmt werden soll, dass -

~ ~ u' < ~ und - ~ ~ v' < -}

wird. Auf diese Weise wird jeder komplexen Grösse x eine bestimmte komplexe ganze Zahl a zugeordnet. Bildet man nun, von irgendeiner Grösse x 0 ausgehend, die Gleichungskette

(16)

x0 = a0

1 + -, x1

x 1 = a1

1... , + -, x2

xn = a,.

1 ... , + ---, Xn+1

wobei allgemein an diejenige komplexe ganze Zahl bezeichnet, welche der Grösse Xn zugeordnet ist, so ist zunächst

77

Über die Entwicklung komplexer Grössen in Kettenbrüche.

I~J ~

(17)

ff·

(n=1,2,3, ... )

Der Beweis der Ungleichung Iqn I> Iqn-ll ist nicht ganz einfach; er erfordert eine genauere Untersuchung der Zahlenreihe a 1 , a 2 ,. • • • Behufs dieser Untersuchung zerlege ich die Zahlenebene durch die Geraden 1

3

1

5

3

5

U=±2, ±2, ±2, ... ; V=±2, ±2, ±2•··· in unendlich viele Quadrate. Dann wird jeder Grösse u + iv diejenige komplexe ganze Zahl zugeordnet sein, welche den Mittelpunkt des die

Fig. 1.

Grösse u + iv enthaltenden Quadrates bildet, wobei von den Rändern des einzelnen Quadrates nur diejenigen zu dem Quadrate rechnen, welche man vom Mittelpunkte aus nach der Richtung der abnehmenden u bzw. v erblickt. Da x0 -a0 in dem Quadrate mit dem Mittelpunkte 0 1dem Raume R angehören, welcher ausserliegt, so wird x1 = -xu-ao halb der Kreise (1), (i), (-1), (-i) liegt 1). Hier habe ich, wie in der Folge stets, mit (a) denjenigen Kreis bezeichnet, welcher den Radius 1 und den Punkt a zum Mittelpunkt hat. Wie x1 werden auch x2 , x3 , ••• in den Raum R fallen, und daher können die Zahlen a 1 , a 2 , a3 , ••• keinen der 4 Werte + 1 , + i, -1 , - i annehmen. Aber die Zahlenreihe au a 2 , a3 , ••• unterliegt ferner noch gewissen Beschränkungen, welche sich auf die Aufeinanderfolge der Zahlen beziehen. Sei beispielsweise 1)

Die Begrenzung von R ist in Figur 1 scharf gezeichnet.

Zahlentheorie.

78

Dann muss x" sowohl dem Raume R als auch dem Quadrate mit dem 1 nicht in Mittelpunkte 2 + i angehören. Folglich kann x"+l = x,.-a,. denjenigen Raum eintreten, welcher aus R von dem • Kreise (-1 + i) ausgeschnitten wird. Daher ist die Folge a" = 2 + i, an+ 1 = -1 + i unmöglich. Man erkennt sofort, dass solche Beschränkungen in der Aufeinanderfolge der Zahlen a immer und nur dann bei der Zahl a" beginnen werden, wenn das Quadrat mit dem Mittelpunkte a" von der Begrenzung des Raumes R durchschnitten wird. Für den vorliegenden Zweck genügt es, von den Zahlfolgen a", an+ 1 , ••• die folgenden als unmöglich zu konstatieren, was an der Hand von Fig. 1 ohne Schwierigkeit geschieht.

Tabelle unmöglicher Zahlfolgen.

I

an

I

an+1

an+2

an+3

I. -2, 2i, -1+i, -2+i, -1+2i 1+i I I. 2, 2i, 1+i -2+2i III. -2+2i 2+i, 1+2i 1+i IV. -2, 2i, -1+i 2+2i V. -2+i,-1+2i 2+2i -2+2i 1+i Wenn ferner a" = 2 + i oder 1 + 2 i ist, und die folgenden Zahlen

an+P an+ 2 , •• • , an+ 2k_ 1 haben abwechselnd die Werte -2 + 2i und 2 + 2i, so kann an+ 2 k nicht gleich 1 + i sein; ebenso wenn an= -2 + i oder -1 2i ist und die folgenden Zahlen an+ 1 , an+ 2 , ••• , an+2k haben abwechselnd die Werte 2 + 2i und -2 + ~i, so kann a"+ 2 k+ 1 nicht

+

gleich 1 + i sein. Die einfachsten Fälle hierfür sind in der Tabelle unter III. und V. aufgenommen. Dies vorausgeschickt, gehe ich nun zum Beweise der Ungleichung Iqn I> Iqn- 1 1 über. Ich setze

(18)

k = __!h_. n

qn-1'

dann ist, der Gleichung qn = an q"_ 1 + qn_ 2 zufolge:

(19) und es ist zu beweisen, dass beständig (20)

ist, oder dass der Punkt k" beständig ausserhalb des Kreises (0) liegt.

Über die Entwicklung komplexer Grössen in Kettenbrüche.

79

Dies trifft nun für k1 offenbar zu; ich will annehmen, dass k1 , k2 , ...., kn-l der Ungleichung (20) genügen, dagegen kn nicht mehr und werde zeigen, dass diese Annahme auf einen Widerspruch führt. Da kn = an + -,}-n-1 im Innern des Kreises (an) liegt, so muss an einen der Werte 1 + i, 1 - i, -1 + i, -1 - i besitzen; denn in allen anderen Fällen würde kn ausserhalb des Kreises (0) fallen, also der absolute Betrag von kn grösser als 1 sein. Ich betrachte nun nur den Fall an = 1 + i, da die drei übrigen Fälle eine ganz analoge Behandlung gestatten.

Da a., + ,}- im Innern der beiden Kreise (0)' und (1 + i) liegt n-1 (den Rand des ersteren Kreises eingeschlossen, was duroh das an (0) gesetzte Komma angedeutet werde), so fällt-,}-- in das Innere d'er Kreise n-1

(0) und (-1-i)' 1); folglich kr._ 1 = an_ 1 + k 1- in das Äussere des n-2 Kreises (0) und in das Innere von (-1 + i)'. Daher kann an_ 1 nur einen der Werte -2., -2 + i, -1 + 2i, 2i, -1 + i, -2 + 2i besitzen; denn in allen übrigen Fällen wird der Kreis (an_ 1), welcher an_ 1 +-,}-n-2 in sich aufnimmt, nicht in das Innere des Kreises (-1 + i)' eintreten. Von jenen Werten ist aber, der aufgestellten Tabelle zufolge, nur der letzte zulässig. Es muss also an_ 1 = -2 + 2i sein. Da nun an_ 1 +-!-n-2 im Innern der beiden Kreise (- 2 + 2 i) und (-1 + i)' 1 ) liegt, so folgt weiter, dass kn_ 2 = an_ 2 +-,}-- ausserhalb des Kreises (0) und im n-3 Innern des Kreises (1 + i)' liegt, und hieraus, wieder mit Rücksicht auf die Tabelle, an_ 2 = 2 + 2 i. So fortfahrend erkennt man, dass die Zahlen an, an_ 1 , ••• die Werte haben müssen: an=1+i,

an_ 1

=-2+2i,

an-a = - 2 + 2 i,

an_ 2 =2+2i,

an_ 4 = 2 + 2 i, ....

Bildet man aber mit diesen Zahlen die Grössen k1 , k2 , k3 , ••• , kn_ 1 , so zeigt sich, dass sie sämtlich in den unendlichen, von den Kreisen (1 + i), (1- i), (-1 + i), (- 1 - i) begrenzten Raum fallen. Daher wird Ikn I > 1 sein, was der Annahme widerstreitet. In ganz entsprechender Weise ergibt sich ein Widerspruch, wenn man voraussetzt, an habe einen der Werte 1--i, -1 + i, -1-i. Hiermit ist ausser Zweifel gesetzt, dass Ikn I beständig grösser als 1, also stets

1)

Die betreffenden Gebiete sind in der Figur 1 schraffiert.

80

Zahlentheorie.

ist. Auf Grund der vorausgeschickten allgemeinen Entwicklungen kann man nunmehr offenbar den folgenden Satz aussprechen: Man entwickle eine beliebige komplexe Grösse x0 in einen Kettenbruch, indem man Xo

=

ao

1 + -' ~

xl

=

1 + -'

al

~

x2

=

a2

1 + -' ... ~

setzt, wo die ganze komplexe Zahl an immer so bestimmt ist, dass sowohl der reelle Bestandteil, wie auch der Faktor von i in der Differenz Xn- an

zwischen - ; und + ; liegt. Dann wird dieser Kettenbruch 1. stets gegen den Wert x0 konvergieren, 2. immer und nur dann abbrechen, wenn x0 eine komplexe rationale Zahl ist, und 3. stets periodisch werden, wenn x0 einer Gleichung zweiten Grades mit ganzzahligen komplexen Koeffizienten genügt, ohne W u1·zel einer eben solchen Gleichung ersten Grades zu sein. Ich brauche kaum besonders hervorzuheben, dass auf diesen Satz die Theorie der quadratischen Formen im Gebiete der komplexen ganzen Zahlen gegründet werden kann, dass insbesondere aus ihm ohne weiteres die Lösung der P e 11 'sehen Gleichung

t 2 -Du 2 = 1 folgt, unter D eine gegebene nichtquadratische, unter t und u zu bestimmende komplexe ganze Zahlen verstanden 1). Ausser der hier betrachteten gibt es übrigens noch andere Kettenbruchentwicklungen im Gebiete der komplexen ganzen Zahlen m + n i, für welche der obige Satz ebenfalls gilt, worauf ich indessen an dieser Stelle nicht eingehen will.

II. (S) ist das System der komplexen ganzen Zahlen m

(e=

-1

+ ne

~v=s).2)

Ich verbinde den Punkt 0 mit den umliegenden Punkten 1, 1 + e, und errichte in den Mitten der Verbindungs-

e, -1, -1 - e, - e

1) Vgl. die Andeutung in Dirichlets's Abhandlung: Recherehes sur les formes quadratiques a coefficients et a indeterminees complexes, Grelles Journal, Bd. 24 (1842), S. 336 [Werke, Bd. I, S. 582]. 2 ) Der Euklidische Algorithmus für die Zahlen m ne, welchen Herr Bachmann in seinem Buche "Die Lehre von der Kreisteilung und ilire Beziehungen zur Zahlentheorie", Leipzig 1872, S. 189, benutzt, ergibt eine andere Kettenbruchentwicklung wie die, welche ich im Texte definiere. Die erstere Entwicklung legt eine Einteilung der Ebene in Rechtecke zu Grunde, deren Mittelpunkte die ganzen Zahlen m + ne sind, deren Seiten den Axen der reellen bzw. rein imaginären Zahlen parallel laufen und bzw. die Längen 1 und _!_y3 besitzen.

+

2

Über die Entwicklung komplexer Grössen in Kettenbrüche.

81

Iinien die Lothe. Diese bilden ein reguläres Sechseck mit dem Mittelpunkte 0 (vgl. Fig. 2). Von den Randpunkten rechne ich nur die links von der Achse der rein imaginären Zahlen liegenden zu dem Sechseck. Wird in entsprechender Weise um jeden Punkt m + n Q ein solches Sechseck konstruiert, so überdeckt die Gesamtheit der letzteren die komplexe Zahlenebene einfach und lückenlos. Einer beliebigen komplexen Grösse x ordne ich nun diejenige ganze Zahl m + n e zu, welche

Fig. 2.

den Mittelpunkt des die Grösse x aufnehmenden Sechsecks bildet. Um eine beliebige Grösse x0 in einen Kettenbruch zu entwickeln setze ich 1

(21)

Xz=a2+-, ... , Xs

wobei allgemein a,. die der Grösse x,. zugeordnete Zahl bezeichnet. Da - 1-

in das um den Nullpunkt abgegrenzte Sechseck fällt, so gilt die Ungleichung x,.

(22)

(n

Um zu beweisen, dass der absolute Betrag von k,. = .

.

als 1, bemerke wh zunachst, dass x,. = Kreise {1), (1 1)

+ e), (e), (-

1

x,._1-an-1

..!!!!_ . qn-1

= 1,2,3, . . . )

stets grösser il;t

m den ausserhalb der

1), (- 1- e), (-e) liegenden Raum R fälltl).

Die Begrenzung von Rist in Fig. 2 scharf gezeichnet. 6

82

Hieraus

Zahlentheorie.

folgt, dass die

Zahlen a 1 , a2 , a 3 , ••• keinen der Werte 0, 1 , 1 + e, e, -1 , -1 - (!, - e annehmen können. Die Begrenzung des Raumes R durchsetzt, wie aus der Figur 2 ersichtlich ist, zwölf Sechsecke. Daher gibt es wieder bestimmte Reihenfolgen der Zahlen a,., a,.+v a,.+ 2 , ••• , welche in der Gleichungskette (21) nicht vorkommen können. Für den vorliegenden Zweck genügt es zu bemerken, dass die Zahl a,.+ 1 nicht den Wert 2 + (! erhalten kann, wenn a,. einen der Werte -2, e-1 , 21! besitzt. Angenommen nun in der Reihe der Grössen 1

(23)

k,.= a,.+k' . .. , n-1

(wo k0 = oo, k1 = a 1) sei k,. die erste deren absoluter Betrag nicht

grösser ist als 1. Da a,. + k~1 im Innern des Kreises (a,.) liegt, so kann a,. nur einen der Werte

2+e,1+2e,e-1,-2-e,-1-2e,-e+1 haben. Ich knüpfe die weitere Betrachtung an die Annahme

da die übrigen fünf Fälle auf ganz entsprechende Art erledigt werden können. Ist a,. = 2 + e, so liegt k,. im Innern der Kreise (0)' und (2 + e), wobei wieder das Komma bedeutet, dass der Rand des betreffenden Kreises mitzurechnen ist. Daher liegt ~1 = k,.- a,. im Innern der Kreise (0) und (-2- e)', folglich k,._ 1 ausserhalb des Kreises (0) und im Innern oder auf dem Rande desjenigen Kreises, welcher über der Strecke -1 ... e als Durchmesser beschrieben ist. Da nun kn-1

=

1

an-1

+k

fl--2

im Innern von (a,._ 1 ) liegt, so muss a,._ 1 einen der Werte -2, e-1, 2e besitzen. Dies ist aber unmöglich, da dann die auf a.. _ 1 folgende Zahl a,. nicht gleich 2 + e sein könnte. Da somit die Annahme Ik,. I = I~ q,._1 sei ~ 1 auf einen Widerspruch führt, so gilt die Ungleichung

I

(24) für jeden Wert von n. Aus (22) und (24) folgen nun mit Hilfe der oben bewiesenen allgemeinen Sätze wieder die fundamentalen Eigenschaften der hier betrachteten Kettenbruchentwicklung:

Über die Entwicklung komplexer Grössen in Kettenbrüche.

83

Die Entwicklung einer komplexen Grösse ergibt stets einen konvergenten Kettenbruch, welcher dann und nur dann abbricht, wenn die entwickelte Grösse der Quotient zweier ganzen Zahlen m + n e ist, und welcher periodisch wird, wenn die entwickelte Grösse einer irreduktibeln quadratischen Gleichung genügt, deren Koeffizienten komplexe ganze Zahlen der Form m + ne sind. Dieser Satz kann wiederum als Fundament dienen für die Theorie der quadratischen Formen im Gebiete der komplexen ganzen Zahlen, welche aus dritten Einheitswurzeln zusammengesetzt sind.

Königsberg i. Pr. den 29. November 1887.

L.

Über eine besondere Art der Kettenbruch-Entwicklung reeller Grössen. (Acta Mathematica, Bd. 12, 1889, S. 367-405.)

Bezeichnet x 0 irgendeine reelle Grösse und setzt man (1)

wo die ganze Zahl

an

immer so bestimmt ist, dass die Differenz

-!

zwischen die Grenzen und Kettenbruch-Entwicklung

+!

Xn- an

fällt, so erhält man für x0 die

(2)

In der vorliegenden Arbeit habe ich diese Art von KettenbruchEntwicklung in eingehender Weise untersucht. Ich hatte diese Untersuchung schon abgeschlossen, als ich auf eine in den Göttinger Nachrichten aus dem Jahre 1873 erschienene Note von Herrn Minnigerode1) aufmerksam wurde. Herr Minnigerode zeigt, dass die Entwickiung (2) immer periodisch wird, wenn x 0 einer ganzzahligen quadratischen Gleichung genügt, sowie dass diese periodische Entwicklung zur vollständigen Auflösung der Pell'schen Gleichung dienen kann. Diese Resultate ergeben sich auch im Verlaufe der vorliegenden Untersuchung; sie bezeichnen indessen hier nur einzelne Glieder in der Kette von Sätzen, deren Gesamtheit die Theorie jener Kettenbruch-Entwicklung ausmacht. Dass die Entwicklung (2) für quadratische Irrationalitäten periodisch wird, folgt übrigens auch unmittelbar aus den Sätzen, welche ich im llten Bande der Acta Mathematica über die Entwicklung komplexer Grössen in Kettenbrüche bewiesen habe 2). 1) Über eine neue Methode, die Pell'sche Gleichung aufzulösen, Göttinger Nachrichten, 1873, S. 619-652. 2 ) Über die Entwicklung komplexer Grössen in Kettenbrüche, Acta Mathematica, Bd. 11 (1887/88), S. 187-200 [diese Werke, Bd. Il, S. 72-83].

Über eine besondere Art der Kettenbruch-Entwicklung reeller Grössen.

85

Bei jeder besonderen Art von Kettenbruch-Entwicklung ist das Gesetz, nach welchem die Näherungsbrüche fortschreiten, von fundamentaler Bedeutung. Es handelt sich namentlich darum, zu untersuchen, ob und in welcher Weise die Nenner der Näherungsbrüche wachsen, sowie festzustellen, wie stark die entwickelte Grösse durch die Näherungsbrüche angenähert wird. Es ist nun merkwürdig, dass diese Untersuchung mit Notwendigkeit darauf führt, neben der ursprünglichen noch eine zweite Art von Kettenbruch-Entwicklung in Betracht zu ziehen. Dieser Umstand ist bislang wohl deshalb nirgends hervorgehoben worden, weil in den bisher ausführlich untersuchten Fällen die zweite Entwicklungs-Art mit der ursprünglichen identisch ist. In dem vorliegenden Falle werden dagegen, wie man sehen wird, beide Arten gänzlich voneinander verschieden.

§1.

Bezeichnungen. Im folgenden werde ich die Kettenbruch-Entwicklung einer Grösse x 0 , welche aus den Gleichungen (3)

hervorgeht, abkürzend durch (4) bezeichnen. Den

nten

Näherungsbruch dieser Entwicklung nenne ich

(5)

und denke mir den Zähler und Nenner dieses Bruches durch die bekannten Rekursionsformeln

(6) mit Hilfe der Anfangswerte

p_ 2 =0, p_ 1 =1; q_ 1 =0, %=1 berechnet. Zwischen den eingeführten Grössen bestehen die Identitäten: (7) (8)

86

Zahlentheorie.

Ich bemerke ferner, dass ich die reellen Zahlen (und nur von solchen wird in der Folge die Rede sein) in der üblichenWeise durch die Punkte einer unbegrenzten Geraden repräsentiere. Diese Gerade betrachte ich als in sich geschlossen, entsprechend dem Umstande, dass die beiden Werte + oo und - oo als nicht verschieden gelten sollen. Durchläuft ein Punkt die Gerade von - oo bis + oo, so bewegt er sich in derjenigen Richtung, welche ich als die "positive" bezeichnen will. Die Gesamtheit der Werte, die ein Punkt nach und nach repräsentiert, welcher sich in positivem Sinne von a bis b bewegt, bilden das Intervall a ... b. Soll die obere oder untere Grenze eines Intervalles nicht zu demselben gerechnet werden, so deute ich dieses dadurch an, dass ich die betreffende Grenze in Klammern setze. Hiernach wird z. B. eine Grösse ~ in das Intervall - ~ · · · ( ~) fallen, wenn - ~ ~ ~ < {und in das Intervall 2 ... (- 2), wenn entweder ~ ~ 2 oder ~ < - 2 ist. Um auszudrücken, dass eine Grösse ~ in ein bestimmtes Intervall a ... b fällt, werde ich mich bisweilen der symbolischen Gleichung (9)

~=a

... b

bedienen. Ich stelle hier einige Regeln zusammen, nach welchen man mit solchen symbolischen Gleichungen rechnen kann. Mit der Gleichung (9) bestehen immer gleichzeitig die folgenden Gleichungen: (10)

~+k=a+k

... b+k,

wo k positiv oder negativ sein kann. (11)

k~

= ka ... kb,

wenn k positiv ist. (12)

-~

=

-b ... -a.

(13) Allgemein besteht der Satz: Bezeichnen ot, ß, y, ö irgendwelche Grössen, so folgt aus (9) die Gleichung oder die Gleichung rx~+ß

Y~+t5

a.b+ß

rxa+ß

= yb+t5'"' ya+t5'

je nachdem otÖ- ßy positiv oder negativ ist.

Über eine besondere Art der Kettenbruch-Entwicklung reeller Grössen.

87

Ferner ist es gestattet, aus den beiden Gleichungen

{; = a ... b ;' = a' ... b'

(14) die Folgerung

(15) zu ziehen: 1) wenn a b, a' < b', a + a' > b + b' ist. Falls in einer der Gleichungen (9) und (14) die eine oder andere Grenze mit einer Klammer versehen ist, so muss auch in jeder abgeleiteten Gleichung die entsprechende Grenze in Klammern gesetzt werden.

§ 2.

Die Teilnenner der Kettenbruch-Entwicklung. Die Kettenbruch-Entwicklung, welche ich untersuchen will, entsteht für eine beliebige Grösse x 0 , wenn man die Gleichungskette (3)

-3

3

Fig. 3.

nach folgender Massgabe bildet. Man markiere auf der Geraden, deren Punkte die reellen Zahlen repräsentieren, die Punkte ± ~. ± ~. ±~, ... und teile dadurch die ganze unendliche Gerade in unendlich viele Intervalle 1)

a-~···(a+ ~).(a=-oo .. -+oo). Dann soll in der Gleichungskette (3) für an immer diejenige ganze Zahl genommen werden, welche in demselben Intervalle wie Xn liegt. Diese Zahlen a11 a 2 , a3 , ••• , welche die Teilnenner der Kettenbruch-Entwicklung bilden, unterliegen gewissen allgemeinen Gesetzen, welche ich zunächst aufstellen will. Aus der Gleichung 1 ) Siehe Fig. 3. Um die Anschaulichkeit der Figur zu erhöhen, ist über jedes der in Betracht kommenden Intervalle ein nach oben gerichteter Halbkreis beschrieben. Die in der Figur ebenfalls gezeichneten, nach unten gerichteten Halbkreise sollen in gleicher Weise eine später zu betrachtende Intervall-Einteilung anschaulich machen.

Zahlentheorie.

88

(i=0,1,2, ... )

folgt

Daher können die Teilnenner a1 , a 2 , a3 , ••• , nur Zahlen aus der Reihe

±2, ±3, ±4, ... sein. Wenn ferner einer dieser Teilnenner, etwa ai, den Wert 2 erhält, so ist xi

= 2 · · · ( 2 + ~ ),

also xi - ai = 0 · · · ( ~ ) ,

und

Es kann daher, wenn ai = 2 ist, der folgende Teilnenner ai+ 1 nur der Reihe -2, -3, ... entnommen sein. Ebenso ergibt sich: wenn ai = -2 ist, so ist der auf ai folgende Teilnenner ai+ 1 notwendig eine Zahl der Reihe

+2, +3, .... Hiermit sind nun alle Gesetze, welche für die Teilnenner gelten, erschöpft, wie aus folgendem Satze hervorgeht: Es se~ (16) x0 = (b0 , b1 , b2 , ••• , bn, Yn+l), wo b0 , b1 , b2 , • •• , bn ganze Zahlen, Yn+l eine reelle Grösse bezeichnen. Dann stellt die Gleichung (16) die hier betrachtete Kettenbruch-Entwicklung der Grösse x0 vor, wenn folgende Bedingungen erfüllt sind: 1) Die Zahlen bl> b2 , ••• , bn sind absolut genommen grösser als 1. 2) Ist eine der Zahlen b1 , b2 , ••• , etwa bi, gleich 2 bzw. gleich - 2, so ist die folgende bi+ 1 eine negative bzw. positive Zahl.

3) Die Grössen Yn+l und bn- - 1- gehören dem Intervalle 2 · . · (-2) an. Yn-tl Der Beweis dieses Sat?Je~ lässt sich leicht durch den Schluss von n - 1 auf n führen. Man setze nämlich (17)

1

Yn= bn--y-' n-tl

Über eine besondere Art der Kettenbruch-Entwicklung reeller Grössen.

89

so wird (18) Nun gehören aber Yn und bn_ 1 - : dem Intervalle 2 ... (-2) an. Für Yn ist dieses Voraussetzung, wäh;end es für bn_ 1 - :n ohne weiteres einleuchtet, falls bn_ 1 eine Zahl der Reihe + 3, - 3, + 4, -4, ... ist. Wenn aber bn_ 1 gleich 2 oder -2 sein sollte, so wird b.. nach Voraussetzung eine negative bzw. positive Zahl, folglich nach (17) y.. negativ bzw. positiv. Daher liegt auch in diesen Fällen bn_ 1 - : .. in dem Intervalle 2 ... (-2). Der Kettenbruch (18) befriedigt nun alle Bedingungen unseres Satzes; nehmen wir also den Satz als richtig an für den Fall, dass die Anzahl der Zahlen b1 , b2 ,. • • gleich n -1 ist, so folgt, dass die Gleichung (18) die hier betrachtete Entwicklung der Grösse x 0 darstellt. Verbinden wir hiermit die Gleichung (17), so zeigt sich, dass auch der Kettenbruch (16), welcher n Zahlen b1 , b2 , ••• enthält, die behauptete Eigenschaft besitzt. Nun gilt aber der zu beweisende Satz offenbar, wenn n = 1 ist, und folglich gilt er für jeden Wert von n. Aus diesem Satze ergeben sich durch Spezialisierung die folgenden weiteren Sätze: "Der Kettenbruch k = (b0 , b1 , b2 , ••• , b..) stellt die hier betrachtete Entwicklung der rationalen Zahl k vor, wenn die Zahlen b1 , b2 , ••• , b.. die Bedingungen 1) und 2) des vorigen Satzes befriedigen und bn von - 2 verschieden ist." Ferner: Der nte Näherungsbruch der Entwicklung

(19) besitzt selber die Entwicklung

(20) oder die Entwicklung

(21) je nachdem a.. von - 2 verschieden oder gleich - 2 ist.

Endlich folgt aus der Entwicklung die andere

Zahlentheorie.

90

mit einziger Ausnahme des Falles, wo xn+ 1 = 2 ist. In diesem Falle lautet die Entwicklung von - x0 :

§ 3.

Die Nenner der Näherungsbrüche. Ich betrachte nun die Nenner (22) der Näherungsbrüche, welche zu der Entwicklung einer beliebigen Grösse

(23) gehören. Aus der Gleichung

(24) folgt wo Iqn I, Ian qn- 1 1... , wie üblich, die absoluten Beträge von qn, an qn_ 1 , ••• bedeuten. Wenn nun Iqn- 1 1>I qn- 2 so wird auch, der vorhergehenden Gleichung zufolge, I qn I > I qn_ 1 I sein. Da aber offenbar I q1 I > I %I , so folgt nach und nach I q2 I > I q1 I, I q3 I > I q2 I, . . . und allgemein I qn I > I qn-l I· Es liegt also der Quotient 1,

(25)

0 = qn-1 n

qn

beständig zwischen -1 und + 1. Man denke sich nun für x0 alle möglichen reellen Grössen genommen, und für jeden einzelnen Wert von :t0 die Reihe der Quotienten 0 1 , 0 2 , 0 3 , . . . gebildet. Alle diese Quotienten werden durch Punkte des Intervalls -1 · · · + 1 repräsentiert, und man erhält also in diesem Intervalle, den unendlich vielen Werten von On entsprechend, unendlich viele Punkte. Es ist nun eine für unsere Theorie fundamentale Frage, welches die untere und welches die obere Grenze dieser unendlichen Menge von Punkten ist. Bezeichnen wir den reziproken Wert von On mit Q - qn (26) n--q-' n-1

Über eine besondere Art der Kettenbruch-Entwicklung reeller Grössen.

91

so finden wir, vermöge der Gleichung (24),

(27)

1

1

1

Ql = al' Q2 = a2- Ql' Qa = aa- Q2' ••• ' Q,. = a,.- Q,._l' ... '

woraus für Q,. die Kettenbruch-Entwicklung

(28) folgt. Betrachten wir nun zunächst nur solche Werte von x0 , für welche keiner der Teilnenner a 1 , a2 , • • • gleich 2 oder - 2 wird. Es ist dann

Q1 = a 1 = 3 . · . - 3, Q2

1

1

1

= a2- Ql = 3 -3 ... - 3- -3' 1

1

1

Q2

3--

-3--

Qa= aa--= 3---1 .. ·-3-

1 '

-3

3

u. s. L Die Zahlen 3, (3, 3), (3, 3, 3) , . . . bilden nun eme Reihe beständig abnehmender Grössen, deren untere Grenze der unendliche Kettenbruch (3' 3' 3' 3' ... ) ist. Bezeichnen wir mit

= 0' 382 •.• r = s-v's 2

(29)

die kleinere Wurzel der Gleichung r+_!_=3 r

'

der Wert des unendlichen Kettenbruchs. Die untere und obere so ist _!_ r bzw. + _!_, und folglich Grenze der betrachteten Werte Q,. sind also _ _!_ r r 1 die Grenzen von 0,. = Q,. bzw. -r und + r. Betrachten wir nun auch den Fall, wo in der Entwicklung von x0 die Werte 2 und -2 als Teilnenner auftreten. Ist a,.+I der erste Teilnenner, welcher gleich 2 oder -2 ist, so wird 1

Q,.+l = a,.+l- Q,.

also a fortiori und

Q,.+I =

{

2-r···2+r · · · -2 + r,

= oder - 2 - r

+2-

r ··· - 2

+r

92

da

Zahlentheorie. 2~r

= 1 - r ist. Die in diesem Falle stattfindenden Grenzen

+ r und 1 - r erweisen sich nun als die allgemein richtigen, w1e aus dem folgenden Satze hervorgeht: Entwickelt man irgendeine Grösse x 0 tn den Kettenbruch

-1

und bezeichnet On den reziproken Wert von

so liegt On stets zw·ischen - r und 1 - r, wenn an von - 2 verschieden ist, und zwischen -1 r und r, wenn an von 2 verschieden ist. Da nach den Gleichungen (27)

+

Qn+t

= an+t -On

ist, da ferner für einen positiven Wert von an+l der Teilnenner an nicht ·gleich 2, für einen negativen Wert von an +I nicht gleich -2 sein kann. so lässt sich unser Satz auch so aussprechen: Der Wert von Qn+l = (an+l• an, ... ' al)

+ +

liegt im Intervalle an+l -r· · · an+l 1-r, wenn an+l positiv ist, und im Intervalle a'n+l -1 r · · · an+l r, wenn an+l negativ ist. Nehmen wir an, unser Satz gelte für den Index n -1, so folgt aus der zweiten Form des Satzes

+

Qn

und Qn

=

an- r ... an

+1-

r'

für

an

=

2' 3' ... '

= an - 1 + r ... an + r' für an = - 2' - 3' ....

Die verschiedenen Intervalle für an = 2, 3, ... reihen sich aneinander, ebenso die Intervalle für an = -2, -3, . . . . Indem man dieses beachtet, erkennt man, dass Qn

= 3 - r · • · - 2 + r,

wenn an von 2 verschieden ist, und Qn = 2 - r · · · - 3

+ r,

wenn an von - 2 verschieden ist. Im ersten Falle ergibt sich

On =

1 Qn

= -1 + r ... r,

Über eine besondere Art der Kettenbruch-Entwicklung reeller Grössen.

im zweiten Falle

93

1

On=Qn =-r ... 1-r. Unser Satz gilt daher für den Index n, wenn er für den Index n-1 als gültig vorausgesetzt wird. Nun ist der Satz aber für n = 1, wo Q1 = a 1 ist, offenbar richtig, und also gilt er allgemein für jeden Wert von n. Da Qn = ..!1!!.. in allen Fällen dem Intervalle 2 - r • · · - 2 + r qn-l Vangehört, also dem absoluten Betrage nach grösser als 2- r = 1 +2 5 ist, so ergibt sich das Korollar: "Die absoluten Beträge der Nenner q0 , q1 , q2 ,. • • der Näherungsbrüche wachsen stärker als die Glieder einer geometrischen Reihe mit 1+V5 .. dem E xponen t en 2- . § 4.

Die Kettenbruchentwicklung zweiter Art. Der im vorigen Paragraphen bewiesene Satz führt dazu, neben der bisher betrachteten Art von Kettenbruch-Entwicklung noch eine zweite einzuführen. Man teile nämlich die unendliche Gerade durch die Punkte 1 )

±

(1 - r),

±

(2 - r),

±

(3 - r), .. .

m die Intervalle ... , (-3

+ r) ... -2 + r, (-2 + r) ... -1 + r, (-1 + r) .. · (1--r), 1-r ... (2-1·), 2-r ... (3-r), ....

Ist nun x0 eine beliebige Grösse, so bilde man die GleichU:ngskette 1

Xo = a0 - - ,

(30)

Xt

X1

=

1

a1 - - , Xz

••• ,

1

Xn =an---, ... , Xn+l

wo allgemein an diejenige ganze Zahl bezeichnet, welche in demselben Intervalle wie Xn liegt. Um die hierdurch definierte neue Art der Kettenbruch-Entwicklung von der früheren bequem unterscheiden zu können, will ich sie als die zweite Art, dagegen die frühere als die erste Art bezeichnen. Der Satz des letzten Paragraphen lässt sich dann offenbar so aussprechen: Entwickelt man eine Grösse x0 in einen Kettenbruch erster Art (31) 1)

Siehe Fig. 3.

94

Zahlentheorie.

und bezeichnen qn_ 1 , qn die Nenner zweier aufeinander folgendet· Näherungsbrüche dieses Kettenbruches, so ist vermöge der Gleichung

(32) der Bruch ~ in einen Kettenbruch zweiter Art entwickelt. q,._l

Die beiden Arten von Kettenbruch-Entwicklungen stehen in einem Verhältnis der Reziprozität zueinander. Dieses spricht sich darin aus, dass der vorstehende Satz im wesentlichen richtig bleibt, wenn man die Worte "erster Art" und "zweiter Art" miteinander vertauscht. In der Tat: die in der Gleichungskette (30) auftretenden Grössen befriedigen die Bedingung 1

xi-ai = - - x = (-1 + r) · ·· (1-r), i+l

also

(i=0,1, 2, ... )

Folglich sind die Zahlen

ai+ 1 ( i

= 0, 1 , 2, ... ) sämtlich der Reihe

+2, -2, +3, -3, .. . entnommen. Ist ferner an-l positiv, so ist 1

xn- 1 -an- 1 = - = -r ... (1-r) ' Xn

also

Xn=3-r .. ·(-2+r), folglich kann an nicht gleich 2 werden. Ebenso ergibt sich, dass auf eine negative Zahl an-l nicht der Wert an= -2 folgen kann. Im Hinblick auf § 2 ergibt sich hieraus, dass der Kettenbruch (32) von der ersten Art ist, wenn (31) die Entwicklung zweiter Art von x0 vorstellt. Nur der Fall, in welchem a 1 = -2 ist, bildet eine Ausnahme; in diesem Falle wird nämlich die Entwicklung erster Art von~ nicht q,._l durch (32), sondern durch die Gleichung

gegeben sein. Diese Überlegungen lassen sich auch in folgenden Satz zusammenfassen, welcher dem Satze des vorigen Paragraphen an die Seite zu stellen ist: Wenn x0 = (a 0 , a1 , a 2 , ••• , an, ... ) ein Kettenbruch zweiter Art ist, so liegt

Über eine besondere Art der Kettenbruch-Entwicklung reeller Gröesen.

95

1) im Intervalle a., - 2 · · · a., + 2 , wenn a., von 2 und - 2 verschieden ist, 2) im Intervalle a., · . · a., + ~ , wenn a., = 2 ist, 3) im Intervalle a., - ~ · · · a,., wenn a., = -2 ist. 1

1

Dabei können die Intervallgrenzen a.,- ~ , a., + ~ nur für n = 2, die Grenze a., nur für n = 1 erreicht werden. Zur Beurteilung, ob ein vorgelegter Kettenbruch ein solcher von der zweiten Art ist, kann folgender Satz dienen, welchen wir indessen in der Folge nicht verwenden werden und deshalb nur beiläufig anführen: "Es sei Xo = (bo, bl, b2, ... ' b.,, Yn+l)'

wo b0 , b1 , ·••• , b" ganze Zahlen, Yn+l eine reelle Grösse bezeichnen. Dann stellt diese Gleichung stets die Kettenbruch-Entwicklung zweiter Art von x0 vor, wenn folgende Bedingungen erfüllt sind: 1) Die Zahlen b1 , b2 , ••• , b" sind absolut genommen grösser als 1. 2) Wenn eine der Zahlen b0 , b1 , b2 , ••• , etwa bi, positiv bzw. negativ ist, so ist die folgende bi+ 1 von 2 bzw. -2 verschieden. 3) Die Grösse Yn+l liegt im Intervalle (3 -r). ·. (-2 + r), wenn b" > 0 und im Intervalle (2-r) · · · (-3 + r), wenn b., < 0 ist." § 5.

Konvergenz der betrachteten Kettenbrüche. Der Grad der Konvergenz eines Kettenbruches (33)

x0 = (a0 , a10 ••• , a", .. . )

wird durch die Grösse der Differenz x0 - Pn gemessen. Nach den Gleiq" chungen (7) und (8) ist

(34) wobei wieder

Q" = ..'!!!. q,._l gesetzt ist. Aus den Gleichungen (27) folgt

(35)

Zahlentheorie.

96

Wenn nun der Kettenbruch (33) von der ersten Art ist, so unterscheiden wir folgende Fälle: 1) Die Zahl an+l ist von ± 2 verschieden. Nach § 3 haben wir dann Qn+l = (3- r) · · · (-3 + r). Ferner ist also, durch Addition,

···(-_!2 + r) • x __!__ = (_!-r) 2 n+l

Qn

2) Es ist an+l = 2. Alsdann kommt: Qn+l

= (2 -r)

• · · (3 -r),

xn+l- an+ 1 = 0 ... ( ~) '

also xn+l-

~n

(2-r)···G

=

-r).

3) Es ist an+l = -2; in diesem Falle hat man Qn+l =

(-3 + r) · · · (-2 + r), 1

xn+l -an+l = - 2 ... (0),

und also

Xn+l-~n =(-~ +r)···(--2+1·). Wie man sieht, liegt xn+l - ~n in allen Fällen 1m Intervalle (2 -r) · · · (-2 + 1') und ist also absolut genommen grösser als 2 -r. Zu demselben Resultate gelangt man, wenn der Kettenbruch (33) von der zweiten Art ist. Denn, wenn an+l einen positiven Wert hat, so ist nach dem letzten Satze des § 4 ferner ist

Qn+l = xn+l-an+l

also 1 Xn+l- Qn

(2) .. •

00 ;

= - r ... (1-r)' = (2 -

r) ...

oo.

Wenn zweitens an+l emen negativen Wert hat, so ist Qn+l = -00 .. • (-2), r) ... r, xn+l-an+l = (-1

+

Über eine besondere Art der Kettenbruch-Entwicklung reeller Grössen.

97

also 1

X 11 + 1 --Q

"

=-00···(-2+r).

J.

In beiden Fällen ist also xn+1absolut genommen grösser als 2- r. Aus den vorstehenden Betrachtungen ergibt sich unmittelbar der Satz: Entwickelt man die Grösse x 0 in einen Kettenbruch erster oder zweiter Art: und setzt man

(36)

(n= 1,2, ... )

e.. sämtlich dem absoluten Betrage nach kleiner als 1. Hieraus folgt beiläufig, dass die beiden Entwicklungen einer jeden Grösse x 0 konvergent sind, und dass beide abbrechen, wenn x 0 eine rationale Zahl ist. so sind die Grössen

§ 6.

Äquivalente Grössen. Zwei Grössen x und x' heissen äquivalent, wenn eine Gleichung der Form ,

(37) stattfindet, wo

(38)

rxx-{J

X=--

yx-o

ot,

ß, y, CJ ganze Zahlen bezeichnen, welche der Bedingung ßy-otCJ = 1

genügen. Entwickelt man zwei Grössen x und x' nach irgendeinem Gesetze in die Kettenbrüche (39) wo die Teilnenner a0 , ••• , a."' a~, ... , a~ ganzzahlige Werte haben, so sind x und x' äquivalent, wenn für irgendeinen Wert von n und irgendeinen Wert von m (40) wird. Ich will nun untersuchen, ob umgekehrt aus der Äquivalenz zweier Grössen x und x' die Gleichung (40) gefolgert werden kann, wenn die Entwicklungen (39) beide von der ersten Art sind. Da der 7

Zahlentheorie.

98

Fall, wo x und x' rational sind, sich unmittelbar in bejahendem Sinne erledigt, so setze ich voraus, dass x und x' bei dieser Untersuchung irrationale Werte besitzen. Zwischen den irrationalen Grössen x und x' bestehe also die Gleichung (37). Wir entwickeln x in den Kettenbruch erster Art (41)

dessen Einrichtung die Gleichung X

(42)

=

Pn Xn+l- Pn-1 qn Xn+l- qn-1

ergibt. Durch Elimination von x zwischen (37) und (42) kommt: (43) .

X'

=

p Xn+l- p' q Xn+l- q' '

wobei zur Abkürzung (44)

{

p = 1Xpn-ßqn, q=ypn-t}qn,

p' q'

= =

IXPn-1- ß qn-1' YPn-1- t}qn-1

gesetzt ist. Ich entwickle nun 1!_ in einen Kettenbruch erster Art q (45) Wenn sich hierbei b, = 2 ergibt, so will ich für diese Entwicklung eventuell die andere

: = (b0 , b1 ,

••• ,

b,_ 1 -l, - 2)

substituieren, und zwar dann, wenn in der Entwicklung von (46) die Zahl an+I positiv ist. Diese Möglichkeit denke ich in die Gleichung (45) aufgenommen, so dass in derselben b, sowohl gleich 2 als gleich - 2 werden kann. Ferner ersetze ich eventuell IX, ß, y, l5 durch -IX, - ß, - y, - 15, wodurch zugleich nach (44) - p und - q an die Stelle von p und q treten, und zwar nach der Massgabe, dass der letzte Näherungsbruch des Kettenbruches (45) den Zähler + p und den Nenner + q erhalten soll. Dies vorausgeschickt, sei nun (47).

der vorletzte Näherungsbruch des Kettenbruches (45), so ist

p" q - q" p

=

1.

Über eine besondere Art der Kettenbruch-Entwicklung reeller Grössen.

99

Da nun aus den Gleichungen (44) auch

folgt, so muss sem

q" = q'

(48)

+ tq,

p"

=

p'

+ tp,

wo t eine ganze Zahl bedeutet. Diese ganze Zahl kann aber von einem bestimmten n ab nur einen der Werte 0, 1,-1 haben. Um dieses zu beweisen, bemerke ich, dass

ferner der Gleichung (36) zufolge

qnPn = q!x-- !9n(1--r), und daher endlich

ist. Der mit en bezeichnete Bruch wird offenbar mit wachsenden Werten Sei von n unendlich klein und besitzt das Vorzeichen von ~. yx-u

nun erstens an+l positiv. Dann sind an und br von 2 verschieden. Daher bestehen in Hinblick auf den Satz des § 3 die Gleichungen: q"

-=(-1+r) .. ·(r), q _!(_ = _qn-1 -en = (-r-·en) ... (1-r-en), q qn

und folglich

q"

q'

t= q -q = (-1-·en) · · · (1-en)• Wenn zweitens an+l negativ ist, so sind an und br von -2 verschieden. Daher ist:

-q"q = (-r) ··· (1-r),

- qq' = -

q

~=1 - 8n

= (-1 + 1'- Bn) "



(r- Bn),

und folglich q"

q'

t = q-q = (-1-en) • · • (1-en). Die ganze Zahl t liegt also stets zwischen -1 - en und 1- en. Wenn

100

Zahlentheorie.

daher ~ und also auch En positiv ist, so kann t nur gleich 0 oder yx-u -1 sein, wenn dagegen ~ negativ ist, so hat t einen der Werte yx- u 0 und 1. Aus den Gleichungen (43) und (48) folgt nun (50)

1 -

X -

p( Xn+l + t)- p" q ( Xn+l + t) _ q" -

(b

0'

b

1' • • •'

b

r' Xn+ 1

+ t) '

wobei nach (46)

ist. Tragen wu den Wert von xn+ 1 + t aus (51) in (50) ein, so erhalten wir (52) während die Entwicklung erster Art von x lautet: (53) Die Gleichung (52) wird aber ebenfalls die Entwicklung erster Art von x' darstellen, wenn nicht einer von folgenden vier Fällen eintritt: 1) 3)

an+l an+l

= 2,

t = -1 ;

= -2, t =

2) 4)

1;

an+l an+l

= 3'

= -3,

an+2 an+ 2

> 0' t = -1 ; < 0, t = 1.

Sei nun ~ positiv. Dann sind nur die beiden ersten Fälle möglich, yx-u weil t nicht gleich 1 sein kann. Da nun auf an+1 = 2 ein negativer Teilnenner an+2, welcher also jedenfalls von 2 und 3 verschieden ist, folgen wird, so dürfen wir den Fall 1) ausschliessen. Aber auch der Fall 2) kann ausgeschlossen werden, wenn wir annehmen, dass nicht von einem bestimmten Werte von n ab beständig an = 3 ist. Ebenso negativ ist, dass die Fälle 3) und 4), welche dann ergibt sich, falls~ yx-u die einzig möglichen sind, ausgeschlossen werden können, wenn wir annehmen, dass nicht von einem bestimmten Werte von n ab beständig an= -3 ist. Unter diesen Voraussetzungen wird also (52) die Entwicklung erster Art von x' darstellen, sobald n eine gewisse Grenze übersteigt. Da nun ferner die Elitnination von xn+ 2 zwischen den beiden Gleichungen (52), (53) zu der ursprünglichen Gleichung x' = a:yx-u x- ~ zurückführen muss, so können wir folgenden Satz aussprechen: Zwischen den beiden Grössen x und x' bestehe die Gleichung (54)

,

a:x-ß yx- 6'

X=--

Über eine besondere Art der Kettenbruch-Entwicklung reeller Grössen.

101

so dass x und x' äquivalent sind. Es seien ferner

(55) die Kettenbruch-Entwicklungen erster Art jener Grössen, und es werde vorausgesetzt, dass die Teilnenner a0 , a 1 ,. • • nicht von einem bestimmten ab bis ins Unendliche beständig gleich 3 oder beständig gleich -3 sind. Dann kann man n und m stets so wählen, dass xn+I = x~+I ist, und dass die Gleichung (54) durch Elimination von xn+I zwischen den beiden Gleichungen (55) entsteht. Wenn die in diesem Satze gemachte Voraussetzung über die Teilnenner an nicht zutrifft, so ist x entweder zu r = (0, -3, -3, ... ) oder zu -r = (0, 3, 3, ... ) äquivale.ut. Diese beiden Zahlen sind auch einander äquivalent, wie aus der Gleichung

_,.=

-r+l r-2

ersichtlich ist. Ist umgekehrt x zu r äquivalent, so sind die Teilnenner an von einem bestimmten ab beständig gleich 3 oder -3. Denn andernfalls könnten wir unseren Satz auf x und x' = r anwenden und würden zu dem Widerspruch gelangen, dass in der Entwicklung von r die Teilnenner nicht beständig gleich 3 sein könnten. Hieraus geht nun folgendes hervor: Die über die Teilnenner an im vorigen Satze eingeführte Voraussetzung ist gleichbedeutend damit, dass x nicht zu r =

s-;s

äquivalent sein soll.

Die zu r äquivalenten Grössen zerfallen in zwei Klassen. Die Grössen der einen Klasse haben eine Entwicklung erster Art, bei welcher schliesslich die Teilnenner von einem bestimmten ab beständig gleich -3 sind, während bei der zweiten Klasse die Teilnenner schliesslich beständig gleich 3 werden. Im folgenden wird sich ein Kriterium dafür ergeben, ob eine zu r äquivalente Grösse in die eine oder die andere Klasse gehört. Ich bemerke noch, dass die in diesem Paragraphen bewiesenen Sätze wörtlich richtig bleiben, wenn an Stelle der Kettenbruch-Entwicklung erster Art überall die zweite Art gesetzt wird.

+

§ 7.

Zahlenpaare. Es seien x0 und y0 zwei voneinander verschiedene irrationale Grössen. Man setze nun

102

Zahlentheorie.

f Xo =

(56)

l

ao-

Yo = ao-

~1

'

~1'

wo die ganze Zahl a0 so bestimmt ist, dass x 0 - a0 zwischen - ~· und + ; liegt. Das auf diese Weise erhaltene Zahlenpaar {x1 , y 1) nenne ich dem Paare {x0 , y0) nach rechts benachbart!). Umgekehrt heisse {x0 , y0) dem Paare (x1 , y 1) nach links benachbart. Die Grössen (x 1 , y1) sind offenbar wieder irrational und voneinander verschieden; sie sind ferner in eindeutiger Weise durch x0 , y0 bestimmt. Ich führe nun noch einen neuen Begriff, den des reduzierten Zahlenpaares ein. Es werde nämlich

.(-3+r,-rl

1'= ....

!1=-l+r

Fig. 4.

jedes Zahlenpaar {x, y) durch den Punkt einer Ebene mit den rechtwinkligen Koordinaten x, y dargestellt. In dieser Ebene grenze ich durch die Geraden x = 2, x = -2, y = r, y = -r, y = -1

(r = 3-;s)

+ r,

y = 1-r,

zwei unendliche Streifen ab, welche ich als im Unendlichen zusammenhängend und also als ein einziges Gebiet R bildend ansehe. In Figur 4 ist das Gebiet R durch Schraffierung kenntlich gemacht. Ein Zahlenpaar (x, y), welches durch einen Punkt des Gebietes R repräsentiert wird, heisse "reduziert". Dabei bemerke ich, dass von der Begrenzung des Gebietes R einzig und allein die beiden Punkte x=3-r,

y=r nnd

x=-S+r,

y=-r

zu dem Gebiete gerechnet werden sollen. 1 ) Die Bezeichnung lehnt sich an eine in der Theorie der quadratischen Formen iihliche an.

Über eine besondere Art der Kettenbruch-Entwicklung reeller Grössen.

103

Ich bilde nun, von irgendeinem Paare (x0 , y0) ausgehend, die Reihe von Paaren: (57)

(xo, Yo), (xl, Y1), (x2, Y2), · · ., (x"+l, Yn+1), · · .,

von denen jedes dem vorhergehenden nach rechts benachbart ist, und will untersuchen, wann in der Reihe (57) ein reduziertes Paar vorkommt. Zu dem Ende bemerke ich, dass nach der Bildungsweise des rechten Nachbars die Gleichungen bestehen:

=

{ Xo (ao, al, ... , a", xn+1), Yo- (ao, all. · ., a", Yn+l),

(58)

von welchen die erste die Kettenbruch-Entwicklung erster Art der Grösse x0 darstellt. Aus der zweiten dieser Gleichungen folgt:

y _ 0 -

Pn Yn+l - Pn-1 qnYn+l- qn-1 '

und hieraus durch Auflösung nach Yn+l:

Y

n+l

=

qn-1Yo-Pn-1 q,.yo-Pn

=

qn-1_ 1 q,. q,.(q,.yo-Pn)'

oder, m Rücksicht auf (36):

(59) wo e,. mit wachsenden Werten von n unendlich klein wird und das Vorzeichen von y0 - x0 besitzt. Es sind nun einige Fälle zu unterscheiden: I) Es sei y0 - x0 > 0 und die Kettenbruch-Entwicklung erster Art von x0 endige nicht mit der Periode (- 3, -3, ... ) . Dann ist e,. positiv und wir können n beliebig gross und so wählen, dass a,. weder gleich -2 noch gleich -3 wird. Für diesen Wert von n ist dann entweder xn+l

=

2 ... oo,

also

an+l = 2, 3, ... ,

a" = 3, ±4, ... ,

oder xn+l = -oo ·· · -2,

also

a,.+l = -2, -3, ... ,

a,. = 2, 3,

± 4, ....

Im ersten Falle ist nach § 3 : .!1!!_ = qn-1

3- r · · · -4 + r,

folglich

1 Y•+l = - 4-r

-B.,· .. r-en.

Im zweiten Falle kommt: .!1!!_ = qn-1

2 - r · . · -4 + r,

folglich

yn+l = - 4-r - 1- -B" • · • 1 - r -- e11 .

104

Zahlentheorie.

Nun bildet (xn+l' Yn+l) ein reduziertes Paar, wenn n so gross gewählt wird, dass die für Yn+l gefundenen Intervalle ganz in den Intervallen - 1 + r · · . r resp. - r . · · 1 - r enthalten sind. Dieses ist aber offenbar möglich. II) Es sei y 0 - x 0 < 0 und die Kettenbruch-Entwicklung erster Art von x0 endige nicht mit der Periode (3, 3, ... ) . Da dieser Fall sofort auf den vorigen zurückgeführt werden kann, indem man statt der Reihe (57) die andere (-xo, -yo), (-x1, -y1), · · ., (-xn+l• -yn+l), · · ·

betrachtet, so ergibt sich auch für diesen Fall das Resultat, dass in der Reihe (57) stets reduzierte Paare vorkommen. Man hat hierbei zu beachten, dass das Paar (x, y) reduziert ist, wenn (- x,- y) ein reduziertes Paar bilden, dass ferner (x, y), (x', y') benachbarte Paare sind, wenn dies für (- x, - y), (- x', - y') gilt. III) Es bleiben noch die Fälle zu untersuchen, in welchen y0 -x0 >0 und die Entwicklung von x 0 mit der Periode (-3, -3, ... ) endigt, resp. Yo- x0 < 0 und die Entwicklung von x 0 mit der Periode (3, 3, ... ) endigt. Ich betrachte zuerst den speziellen Fall, wo x 0 = (3, 3, ... ) = 3 -r ist; lasse es dagegen unbestimmt, ob y0 - x0 positiv oder negativ ist. Aus den :B~ormeln des § 1 geht hervor, dass für den Kettenbruch

x0 = (3, 3, 3, ... ) = 3- r

(60) die Gleichungen (61)

Pn-1 = qn,

qn = 3 qn-1- qn-2•

(% = 1, q1 = 3 etc.)

SOWie

(62)

ln=O, 1,2, ... )

gelten. Nun ist

und den Gleichungen (61) zufolge: qn- rqn+l = qn- r(3qn- qn-1) = r(qn-1- rqn) . rn(qo- rq1) = -rn+2.

Daher ergibt sich (63)

-rn+l

Yn+1 -r = -qn ·

Yo-r Yo-.E.E.. qn

Aus dieser Gleichung schliessen wir zunächst, weil r < 1 ist, dass Yn+I - r mit wachsenden Werten von n unendlich klein wird. Da

Über eine besondere Art der Kettenbruch-Entwicklung reeller Grössen.

nun ferner lim Pn qn

=

x0

=

105

3- r ist, so wird von einem bestimmten

Werte von n ab Yn+l -r positiv, wenn y0

= (r) · · · (3 - r),

dagegen negativ oder Null, wenn y0

= (3 - r) · · · r.

Nur im letzteren Falle wird (xn+l• Yn+r) von einem gewissen Werte von n ab reduziert sein. Im ersteren Falle dagegen wird sich der Punkt (xn+P Yn+l) mit wachsenden Werten von n freilich immer mehr dem Punkte (3- r, r) annähern, ohne ihn jedoch zu en-eichen oder in das Gebiet R einzutreten. Wenn nun x0 nicht gleich 3-r ist, aber eine Entwicklung besitzt, welche mit der Periode (3, 3, ... ) endigt, so wird in der Reihe (57) für einen gewissen Wert von m doch xm+ 1 = 3 - r sein. Dann ist X _ 0 -

Pm Xm+I- Pm-1 qmXm+l-qm-1'

_ PmYm+l- Pm-1 YoqmYm+1- qm-1 '

und die Reihe (57) setzt sich von dem Paare (xm+l, Ym+l) gerade so fort, als wenn man von diesem Paare ausgehen würde. Nun ist aber die Gleichung Ym+I = (r) · · · (3 - r) dann und nur dann erfüllt, wenn

oder also, wenn ist, wo x~ die zu x0 konjugierte algebraische Zahl bedeutet. Es ergibt sich daher der folgende Satz: Endigt die Kettenbruch-Entwicklung erster Art von x0 mit der Pe1·iode (3, 3, ... ) , so sind die in der Reihe

(xo, Yo), (xr, Yr), (xz, Yz), · · · auftretenden Paare (xn, Yn) von einem bestimmten Werte von n ab sämtlich reduziert oder sämtlich nicht reduziert, je nachdem oder

Yo = (xo) ... x~,

106

Zahlentheorie.

ist. Dabei bedeutet x~ die zweite Wurzel der ganzzahligen quadratischen Gleichung, welcher x 0 genügt. Wir können diesem Satze noch die Bemerkung hinzufügen, dass notwendig x0 > x~ ist. Denn nach der unter I) angestellten Untersuchung müssen die Werte von y0 , welche grösser als x 0 sind, sich sämtlich in dem Intervalle (x0) • • · x~ befinden, was nur in dem Falle x0 > x~ möglich ist. Wenn von einem bestimmten Werte von n ab die Teilnenner an in der Entwicklung von x0 sämtlich gleich -3 sind, so leiten wir aus der Reihe

die andere ab, auf welche offenbar der vorhergehende Satz Anwendung findet. Da nun aus der Gleichung die andere Yo

= Xo • • • x~

und umgekehrt die erstere aus der letzteren folgt, so ergibt sich ohne weiteres: Endigt die Kettenbruch-Entwicklung erster Art von x 0 mit der Periode (- 3, - 3, ... ) , so sind die in der Reihe

auftretenden Paare (xn, Yn) von einem bestimmten Werte von n ab sämtlich red1~ziert oder sämtlich nicht reduziert, je nachdem

oder

ist. Dabei bedeutet x~ die zweite Wurzel der ganzzahligen quadratischen Gleichung, welcher x0 genügt. Zugleich ist notwendig x0 < x~, da nach der dem vorigen Satze hinzugefügten Bemerkung - x0 > - x~ sein muss. Beiläufig folgt hieraus ein Kriterium dafür, ob eine zur äquivalente Zahl x0 eine Kettenbruch-Entwicklung liefert, welche mit der Periode (3, 3, ... ) oder mit der Periode (-3, -3, ... ) endigt. Im ersteren Falle muss nämlich x 0 - x~ > 0, im letzteren Falle x 0 - x~ < 0 sein.

Über eine besondere Art der Kettenbruch-Eiltwicklung reeller Grössen.

Setzen w1r x0 =

rxr-ß Y 1 _ 15 ,

.

107

,

so 1st x0

so dass unser Kriterium sich in folgender Weise aussprechen lässt: Die zu " äquivalente Grösse rxr- ß yr- (j

hat eine Entwicklung erster Art, welche mit der Periode (-3, -3, ... ) oder (3, 3, ... )

endigt, je nachdem eine positive oder eine negative Zahl ist. Kehren wir nun zu der Betrachtung der Reihe (57) zurück, so bleibt nur noch folgendes zu bemerken. Wenn die Entwicklung erster Art von x0 weder mit der Periode (3, 3, ... ) noch mit der Periode (-3, -3, ... ) endigt, oder, was dasselbe besagt, wenn x0 nicht zu r äquivalent ist, so finden die unter I) und II) angestellten Betrachtungen Anwendung. Es gilt daher der Satz: · ht der zahl r = a-vs · lent, so stn· d. d'te . Grösse x0 ntc I st dte äqttwa 2 in der Reihe (xo, Yo), (xl, Y1), (x2, Y2), • · ·

auftretenden Paare (xn, Yn) von einem bestimmten Werte von n ab .'lämtlich reduziert. § 8.

Reihen reduzierter Zahlenpaare. Wenn das Paar (x0 , y 0) reduziert ist, so ist sein rechter Nachbar (x1 , y1) ebenfalls reduziert. Denn sei in den Gleichungen 1

(64)

JXo= ao-xl 1 \ Yo= ao--Yt-

(x0 , y0) em reduziertes Paar. Dann sind nur folgende Fälle möglich:

108

Zahlentheorie.

1) x0 = 3 - r, y0 = r, folglich x1 = 3- r, y 1 = r; 2) x0 = -3

+ r, y

0

= -r, folglich x1 = -3

+ r, y

1

= -r;

3) x0 = 2 · · · oo , x1 = 2 · · · oo , folglich 1 a0 = 3, 4 , ... , y0 = (-1 + r) · · · (r) und y 1 = - - = (0) .. · (r); lloYo

4) x0 = - oo · · · - 2, x1 = 2 · · · oo, folglich a0 =

-2,-3, ... , y 0 = (-r) ... (1-r} und y 1 = -1- = (-1 + r) ... (0); llo- Yo

5) x0

=

2 · · · oo, x1 = - oo · · · - 2, folglich 1

a0 =2,3, ... , y0 = (-1 +r)···(r) und y 1 =--=(0) .. ·(1-r}; ao- Yo

6)

x0 = - oo · · · -2, x1

= -

oo · · · - 2, folglich

a0 = -3, -4, ... , y 0 = (-r) .. · (1-r) und y1 = -1- = (-r) · · · (0).

ao- Yo

In allen Fällen ist also (x1 , y1) wieder ein reduziertes Paar. Hieraus folgt, dass die im letzten Paragraphen betrachteten Reihen (xo, Yo), (xl, Yt}, (xs, Ys}, · • · lauter reduzierte Paare enthalten, wenn das Ausgangspaar (x0 , y0 } ein reduziertes ist und allgemeiner, dass in der Reihe die Paare (x.,, y.,), (x.,+l, y.,+l), ... bis ins Unendliche reduziert sind, falls (x.,, y.,) ein reduziertes Paar ist. Wenn man die zweite Gleichung (64} in die Form setzt 1

Yt =

1

ao- (;.),

und annimmt (x0 , y 0} und also auch (x1 , y1} sei reduziert, so erkennt man, dass a0 die erste Zahl ist, welche bei der Entwicklung von _!__ in Y1 einen Kettenbruch zweiter Art auftritt. Daher ist das Paar (x0 , y0} vollständig bestimmt, wenn (x1 , y1} gegeben ist, oder in Worten: Jedes reduzierte Paar besitzt einen vollständig bestimmten linken Nachbarn, welcher ebenfalls ein reduziertes Paar ist. Die Ergebnisse dieser Betrachtungen können wir folgendermassen aussprechen: Jedes reduzierte Paar ist Glied einer unbegren~t nach rechts und nach links fortsetzbaren Reihe von reduzierten Paaren, von welchen jedes dem vorhergehenden nach rechts benachbart ist. Die ganze Reihe von Paaren lässt sich in eindeutiger Weise aus irgend einem Paare der Reihe erzeugen, und wenn

Über eine besondere Art der Kettenbruch-Entwicklung reeller Grössen.

{65)

109

(xo, Yo), (xl, Y1), (x2, Y2), · · ·, (xn+l• Yn+l), • • •

aufeinander folgende Glieder der Reihe sind, so stellen die Gleichungen

Xo= (ao, all .. . , an, xn+l)

1_1_ =(an, an-1' ... ' ao, _..!:__)

(66)

Yo

Yn+l

die Kettenbruch-Entwicklungen erster bzw. zweiter Art von x 0 bzw. - 1-

YnH

dar.

§ 9.

Quadratische Formen. Bezeichnet

(67)

au 2

+ 2buv + cv 2

eme quadratische Form der positiven Determinante D=b 2 -ac,

{68) so nenne ich die Wurzeln

(69)

-b-vl5

Xo=--c--

der Gleichung a

Yo=

-b+vD c

+ 2bx + cx = 0 2

VD

den positiven Wert die erste bzw. zweite Wurzel der Form, wobei der Quadratwurzel bedeutet. Zwei Formen sind bekanntlich dann und nur dann äquivalent, wenn sie dieselbe Determinante besitzen und wenn zugleich ihre ersten Wurzeln äquivalente Grössen sind. Die in den vorhergehenden Paragraphen aufgestellten Begriffe übertragen sich sofort auf quadratische Formen; nämlich: eine quadratische Form heisst "reduziert", wenn ihre Wurzeln {x0 , y0) ein reduziertes Paar bilden, und: zwei Formen derselben Determinante heissen "benachbart", wenn ihre Wurzelpaare benachbart sind. Solche benachbarte Formen sind offenbar äquivalent. Es seien nun a, b, c ganze Zahlen und D = b2 - ac kein vollständiges Quadrat. Bilden wir dann von dem Paare {x0 , y0) ausgehend die Reihe der benachbarten Paare: (xo, Yo), (xl, Y1), · · ., (xn+l• Yn+l), · · ., so wird (xn+I• Yn+I) von einem bestimmten n ab reduziert sein. Dies gilt nach den Sätzen des § 7 allgemein, selbst in dem Falle wo Xo zu r

Zahlentheorie.

110

äquivalent ist, weil dann y 0 die zweite Wurzel der ganzzahligen quadratischen Gleichung ist, welcher x 0 genügt. Es folgt also: Jede quadratische Form (67) ist einer reduzierten äquivalent. Entwickelt man nämlich die erste Wurzel der Form in einen Kettenbruch erster Art so wird von einem bestimmten Werte von n ab die Grösse xn+l stets erste Wurzel einer reduzierten Form sein, und die Form (67) wird durch die Substitution V= PnV'- Pn-1 u' in diese reduzierte Form übergehen. Betrachten wir nun die reduzierten Formen einer gegebenen Determinante D, so zeigt sich zunächst, dass nur eine endliche Anzahl solcher Formen existiert. Nach der Definition hat man nämlich für die Wurzeln x0 , y0 einer reduzierten Form entweder

x 0 = 2 · · · oo } oder x 0 = - oo · · · - 2} , Yo = -1 + r · · · r Yo = - r · · · 1 - r und hieraus -2vD

--- =

c

2v:O

1

x0 - Yo

=

2- r···- 2

+ r,

1

-=---=2-r···-2+r. a Xu Yo Daher liegen die ganzen Zahlen a und c in dem Intervall

+ 2 VD(1-r), ± yD + ac nur eine

-2 yD(1-r) · · ·

und können also, ebenso wie b = endliche Anzahl von Werten besitzen. Hieraus folgt unmittelbar, dass es nur endlich viele reduzierte Formen der Determinante D gibt. Bilden wir von dem Wurzelpaar (x0 , y0) einer reduzierten Form f ausgehend die Reihe der nach rechts benachbarten Paare

so ist jedes Glie'l:l. dieser Reihe Wurzelpaar einer reduzierten zu f äquivalenten Form. Da nun die Anzahl dieser Formen endlich und die Reihe nach rechts wie nach links eindeutig fortsetzbar ist, so ergibt sich: Die reduzierten Formen der Determinante D gruppieren sich in "Perioden" .unter einander äquivalenter. Ferner folgt aus dem Satze des letzten Paragraphen:

Über eine besondere .Art der Kettenbruch-Entwicklung reeller Grössen.

111

Bezeichnet x0 die erste Wurzel einer reduzierten Form, so ist die Entwicklung erster Art von x 0 rein periodisch, also von dm· Gestalt

und der reziproke Wert der zweiten Wurzel ist vermöge der Gleichung 1 y;; =(an, an-1• ... ' ao, an, an-1• ... ' ao, .. . )

in einen Kettenbruch zweiter Art entwickelt. Verbinden wir mit diesem Resultate den in diesem Paragraphen an erster Stelle hervorgehobenen Satz, so folgt: Die Kettenbruch-Entwicklung erster Art einer quadratischen Irrationalität ist stets periodisch. Dieselbe wird nach dem vorigen Satze rein periodisch, wenn die Irrationalität erste Wurzel einer reduzierten Form ist. Man bemerkt leicht, dass dieses auch der einzige Fall ist, in welchem dieser Umstand eintritt. Nach den Ergebnissen des § 6 gehen die Kettenbruch-Entwicklungen erster Art zweier äquivalenter Grössen stets durch Abänderung einer endlichen Anzahl von Teilnennern auseinander hervor. Eine Ausnahme erleidet dieser Satz nur dann, wenn die beiden Grössen zu r äquivalent sind und die Entwicklung der einen mit der Periode (3, 3, ... ), die Entwicklung der andern mit der Periode (-3, -3, ... ). Lassen wir daher stets diejenigen Formenperioden bei Seite, welche von Formen mit den Wurzeln x 0 = -3 + r, y0 = -r gebildet werden, so besteht der Satz: Zwei reduzierte Formen der Determinante D sind äquivalent oder nicht, je nachdem sie derselben oder verschiedenen Formenperioden angehören. Die Auflösung der Pell'schen Gleichung kommt bekanntlich darauf zurück, alle Substitutionen einer reduzierten Form in sich zu finden. Oder, was dasselbe ist, alle Äquivalenzgleichungen

(70) aufzustellen, wenn x0 die erste Wurzel einer reduzierten Form bezeichnet. Entwickelt man nun x 0 in einen Kettenbruch erster Art, und betrachtet die hierbei auftretenden Gleichungen

so sind dieselben sämtlich von der Form (70). Man erhält aber auf diese Weise auch alle überhaupt existierenden Gleichungen (70). Falls x 0 nicht zu r äquivalent ist, folgt dieses aus dem ersten Satze des § 6. Wenn aber x0 zu r äquivalent und folglich gleich 3 - r oder gleich

112

Zahlentheorie.

-3 + r ist, so muss man den Nachweis direkt führen, was keine Schwierigkeit hat und deshalb Kürze halber hier unterbleiben mag. Bekanntlich entstehen die Gleichungen (71) sämtlich durch Iteration der ersten Gleichung welche die kleinste Lösung der Pell'schen Gleichung ergibt. Durch die Sätze dieses Paragraphen ist, wie man sieht, die Theorie der quadratischen Formen von positiver Determinante in ähnlicher Weise auf die hier betrachtete Kettenbruch-Entwicklung erster Art gegründet, wie man dieselbe sonst auf die gewöhnliche nach grössten Ganzen fortschreitende Kettenbruch-Entwicklung zu gründen pflegt. Es ist noch zu bemerken, dass die erhaltenen Resultate sich nur unerheblich modifizieren, wenn man überall die Worte "erster Art" und "zweiter Art" miteinander vertauscht.

§ 10.

Entwicklungen für die Quadratwurzel aus einer ganzen Zahl. Es bezeichne D eine positive ganze Zahl, welche kein vollständiges Quadrat ist, und es smen

jVD =

(72)

(ao, al, ... )

) VD = (b0 , b1 ,

••• )

die Kettenbruch-Entwicklungen erster und zweiter Art von werden die Zahlen a0 , b0 durch die Gleichungen ~

;-

1

yD. Dann

1

·v D = ao-2· .. ao+ 2'

(73)

VD = b0 - r · · · b0 - r + 1

bestimmt sein. Daraus folgt sofort, dass die Paare (74)

Xo=

VD+bo\

Yo=-VD+boJ' reduziert sind. Daher sind die Kettenbruch-Entwicklungen erster Art von x 0 und x'0 rein periodisch; also etwa (75) x0

= VD + b0 = (a0 + b0 , a1 , a 2 , ••• , an, a0 + b0 , a1 , a2 , ••• , a,., ... ),

aus welcher Entwicklung unmittelbar die andere

113

Über eine besondere Art der Kettenbruch-Entwicklung reeller Grössen.

(76) hervorgeht. Nun entsteht die Entwicklung zweiter Art von.!,= yD + a0 Yo aus der Entwicklung erster Art von x~ durch Umkehrung der Periode. Also ist (77)

VD + a0 =

(a0 + b0 , a,., an-l, . .. , a 1 , a0 + b0 , an, . .. , a1 , •.. )

die Entwicklung zweiter Art von VD + a0 • Die Gleichungen (75) und (77) ergeben den Satz: Die Quadratwurzel aus einer ganzen Zahl D besitzt Kettenbruch-Entwicklungen erster und zweiter Art von der Gestalt: (78)

JVD = (a0 , a1 , ••• , an, a0 + b0 , a1 , ••• , an , a0 + b0 , ••• )

1VD

= (b0 , an, ... ,

a1 , a 0

+ b0 , an, ... , a 1 , a 0 + b0 , ••• ) •

Die Periode beginnt also (wie in der gewöhnlichen Theorie) bei beiden Entwicklungen sogleich nach dem ersten Teilnenner. Sie schliesst bei beiden ab mit der Summe a 0 b0 der Anfangsglieder der Entwicklungen. Durch Umkehrung der übrigen Glieder der Periode geht die eine Entwicklung in die andere über. Aus den Gleichungen (73) geht hervor, dass entweder a 0 = b0 oder

+

a0 = b0 + 1 ist. Denn in das Intervall a0 - ~

•• •

a 0 -f-. ~ greifen nur

die beiden Intervalle a0 - r · · · a0 - r + 1 und a0 - 1 - r · · · a0 - r hinein; jedes andere Intervall b0 - r · · · b0 - r + 1 hat keinen Punkt mit a0 - ~ • •• a 0 + ~ gemein (vgl. Fig. 3). Unterscheidet man die beiden Fälle, so erhält man den Satz: Bestimmt man die ganze Zahl

a 0 - ~ • • • a0 + .. als a0 grosser

a0

so,

dass

VD

zwischen

~ liegt!_ so sind zwei Fälle möglich: entweder s-v' 5 2

. . kl e1,ner als a0 oder ·v1D tst A

'fD ist

s-v' 5 2

• Im

ersteren Falle sind die Zahlen a 0 , b0 , mit welchen die Entwicklungen (78) beginnen, einander gleich. Im letzteren Falle ist dagegen a0 = b0 + 1. Nur im ersten Falle haben also die Entwicklungen (78) dieselbe Eigenschaft, wie die gewöhnlich betrachtete Entwicklung, dass nämlich das Schlussglied der Periode das doppelte von dem Anfangsgliede der Entwicklung ist. Freilich scheint dieser erste Fall weit häufiger einzutreten als der zweite Fall. Der erste Wert von D in der Reihe D = 2, 3, 5 .... , für welchen der zweite Fall eintritt, ist der Wert D = 13. Man findet nämlich für die Entwicklungen erster und zweiter

Art von

vJ3 .bezüglich:

8

Zahlentheorie.

114

(79) IlVi3- = (4;

3,

2, -7, -3, -2, 7;

y13={3;-2,-3,-7,

Wenn a0

2,

2, -7, -3, -2, 1; ... )

3,

3,7;-2,-3,-7,

2,

3,7; ... ).

= b0 ist, so kann man aus der Gleichung yD -a0 = (0, a 1 ,

••. )

= (0, an,

... )

schliessen, dass entweder a 1 = an oder a 1 = an + 1 ist. Im Falle, dass a1=an ist, folgert man weiter, dass entweder a 2= an_ 1 oder a 2= an_ 1+1 ist, usf. Hiernach kann unter Umständen die Reihe a 1 , ••• , an symmetrisch, d. h. mit der Reihe an, ... , a 1 identisch sein. Dies wird stets dann stattfinden, wenn die Entwicklung erster Art von yD mit der Entwicklung zweiter Art zusammenfällt. Betrachten wir nun einen mit -yD äquivalent ist. Dann solchen Wert von D, für welchen ist auch + b0 mit - v' D- b0 äquivalent und es treten folglich diese beiden Zahlen in ein und derselben Formenperiode auf. Wir haben daher, wenn wir Gleichförmigkeit halber an+l für a0 + b0 schreiben, folgende Entwicklungen erster Art:

v'J5

v'J5

v'D + bo= (an+1• a1, a2, ... ' an, an+1' alt a2, ... ' an, ... )

-V D -

bo = ( a,' a,+ 1'

.•• '

ar+n' a,' a,+ 1'

••• '

ar+n' ... ) '

wo r :S: n angenommen werden darf und die Indices von a, welche grösser als n + 1 werden, (mod. n + 1) zu reduzieren sind. Aus den vorstehenden Gleichungen folgt: also auch

v'J5 + b

0

- v'J5- b

0

=

(an+l' a 1 ,

= (-an+l,

••• ,

-a1 ,

und folglich durch Elimination von (80)

v'J5 + b0 =

a,_ 1 , - yD- b0),

••• ,

-a,_ 1 , yD

+ b0)

v'J5- b

0 :

(an+l, a 1, ... , a,_ 1, -an+l, -~, ... , -a,_1 , yD

+ b0).

Daher ~üssen die 2r Zahlen an+l• a 1 , ••• , a,_ 1 ,-an+l•-a1, .. . ,-a,_1 eine Periode an+1, ... , an oder eine Zusammenfassung mehrerer solcher Perioden bilden. Da aber r ;:;;;; n vorausgesetzt wurde, so ist nur der erste Fall möglich. Setzen wir an+ 1 = -a,, so folgt aus (80):

v'J5 + b

0

=

(-a,, a 1 ,

••• ,

a,_ 1 , a,, -a1 , -a2 ,

••• ,

-a,_1 ; -a,, ~ •... ),

wo die vor dem Semikolon stehenden Glieder die Periode bilden. Gehen wir endlich von yD + b0 zu yD selber zurück, so erhalten wir den Satz:

Über eine besondere Art der Kettenbruch-Entwicklung reeller Grössen.

115

VD äquivalent ist, VD die Gestalt:

VD

zu dem Werte von Wenn der Wert von so besitzt die Kettenbruch-Entwicklung erster Art von

(81)

VD =

(a 0 ; au a 2 ,

••• ,

an -a1 , -a2 ,

••• ,

-ar; a 1 , a 2 ,

••• ) ,

wo die zwischen die beiden Semikolon gesetzten Glieder

die Periode bilden.

Die Voraussetzung dieses Satzes lässt sich noch umformen. Wenn nämlich VD zu - VD äquivalent ist, so besteht eine Gleichung der Form (82)

r~.VD-ß - VD- yVD-6'

Wegen der Irrationalität von

yD

IX= !5,

und also befriedigen, da die Gleichung

IX Cl-

(ßy-IXI5 = 1).

folgt aus dieser Gleichung

ß = yD,

ßy = -1 ist, die Zahlen x =IX, y = y

x 2 -Dy 2 = -1.

(83)

Umgekehrt leitet man aus einer Lösung x =IX, y = y dieser Gleichung sofort eine Relation der Gestalt (82) ab. Daher können wir sagen:

Die Voraussetzung des vorigen Satzes lässt sich durch die andere ersetzen, dass die Gleichung x2-Dy2=-1

eine Auflösung in ganzen Zahlen besitzt.

Wenn die Kettenbruch-Entwi cklung erster Art von (81) hat, so liefert die Entwicklung der Gleichung

- VD + a0 + a, =

(a,, - a1 , ••.

, -

a,_ 1 ,

VD die Gestalt

VD- a0 -

a,),

eine Relation der Form (82) und damit eine Auflösung der Gleichung (83). Es ist leicht zu zeigen, dass aus dieser einen Auflösung alle übrigen abgeleitet werden können, ähnlich wie dies für die Kettenbruch-Entwicklung von VD, welche nach grössten Ganzen fortschreitet, geschieht. Königsberg i. Pr., 15. Dezember 1888.

LI.

Über die diophantischen Gleichungen vom Geschlecht Null. Von D. Hilbert und A. Hurwitz. (Acta Mathematica, Bd. 14, 1890-1891, S. 217-224.)

Die vorliegende Mitteilung behandelt di& Aufgabe, alle ganzzahligen Lösungen der Gleichung (1)

zu finden, unter der Voraussetzung, dass f (x1 , x 2 , x3 ) eine ganze ganzzahlige homogene Funktion vom nten Grade in den Variabeln x1 , x2 , x3 bedeutet, und die durch jene Gleichung definierte ebene Kurve das Geschlecht Null besitzt. Die Frage nach allen denjenigen Punkten der Kurve (1), deren Koordinaten rationale Zahlen sind, bezeichnet offenbar im wesentlichen die gleiche Aufgabe. Zur Lösung der Aufgabe stützen wir uns auf die Abhandlung von M. N oether: Rationale Ausführung der Operationen in der Theorie der algebraischen Funktionen 1). Den dort entwickelten Resultaten zufolge können wir zunächst, falls die Gleichung (1) vorgelegt ist, durch eine endliche Zahl von rationalen Operationen entscheiden, ob die Voraussetzung, dass das Geschlecht der Gleichung Null ist, zutrifft. Sodann ist es ebenfalls durch rationale Operationen möglich, n -1 linear unabhängige ternäre ganzzahlige Formen cp1 , cp2 , ••• , q;n-l von der (n-2)ten Ordnung anzugeben derart, dass für beliebige Parameter A,_, ~, ••• , A.n-l die Kurve (1) von der Kurve (2) in n - 2 mit den Parametern A.1, ~, ••• , A.n-l veränderlichen Punkten geschnitten wird. Die Gleichung (2) stellt die zu der Kurve (1) adjungierten Kurven (n- 2)ter Ordnung dar. 1)

Mathem. Aunalen, Bd. 23 (1884), S. 311-358.

Über die diophantischen Gleichungen vom Geschlecht Null.

Es

(3)

Sei

117

nun zur Abkürzung

1=

if>l = Au fP1 (/>2 A21 fP1 if>a = Aa1 fP1

+ A12 fP2 + ·· · + Al, n-1 fPn-1 • + A22fP2 + •· · + A2,n-l fPn-1• + Aa2fP2 + ··· + Aa,n-1 fPn-1•

wobei Au, A12 , ... , Aa,n-l unbestimmte Parameter bedeuten. Transformieren wir sodann die Gleichung (1) vermöge der Formeln

(4) so erhalten wir eine Gleichung

(5) deren linke Seite eine ganzzahlige Form von y1 , y 2 , y 3 und den Parametern Au, A12 , ... , As,n- 1 ist. Ferner ergibt die Ausführung der Transformation Formeln der Gestalt (6)

wo lJ'1 , lJ'2 , lJ'3 ebenfalls ganzzahlige Formen von y 1 , y 2 , y3 und den Parametern Au, A12 , ..• , A3,n-l sind. vVir setzen diese Formen ohne einen allen gemeinsamen Teiler voraus. Die Form g (y 1 , y 2 , y3 ) ist notwendig irreduzibel und homogen von der (n-2)ten Ordnung in den Variabeln y1 , y2 , y3 , eine Tatsache, welche unmittelbar aus den bekannten Sätzen über die rationalen eindeutig umkehrbaren Transformationen der algebraischen Kurven folgt. Wir erteilen jetzt den Parametern Au, A12 , •.. , Aa, n- 1 solche ganzzahligen Werte, dass die Form g (y1 , y2 , y3 ) irreduzibel bleibt. ~ies ist stets möglich, da diejenigen Werte von Au, A12 , ••• , A3 n- 1 , für welche g (y1, y 2 , y 3) reduzibel wird, gewissen algebraischen Gleichungen genügen müssen. Vermöge der Formeln (4) und (6) entspricht nunmehr jedem Punkte der Kurve (1), dessen Koordinaten rationale Zahlen sind, ein ebensolcher Punkt der Kurve (5) und umgekehrt. Daher ist unsere ursprüngliche Aufgabe auf die Behandlung der Gleichung g (y1 , y2 , y3 ) = 0 zurückgeführt, welche ebenfalls ganzzahlig und vom Geschlechte Null ist, dagegen einen um zwei Einheiten geringeren Grad als f(x 1 , x 2 , x3) = 0 besitzt. Da die Fortsetzung dieses Verfahrens so lange möglich ist, als der Grad der Gleichung grösser ist als drei, so gelangen wir schliesslich zu einer Gleichung dritten oder zweiten Grades, je nachdem der Grad n der ursprünglichen Gleichung eine ungerade oder eine gerade Zahl ist. Eine Gleichung dritten Grades können wir aber sofort auf eine Gleichung ersten Grades reduzieren. Denn eine solche Gleichung stellt eine Kurve dritter Ordnung mit einem Doppel- oder Rückkehr-Punkte

118

Zahlentheorie.

vor, dessen Koordinaten notwendig rationale Zahlen sind, und diese Kurve kann stets vermöge einer rationalen eindeutig umkehrbaren Transformation in eine gerade Linie übergeführt werden. Je nachdem also die Ordnung der vorgelegten Gleichung eine ungerade oder eine gerade Zahl ist, erhalten wir schliesslich eine Gleichung ersten oder zweiten Grades. Wir behandeln diese beiden Fälle gesondert. Im ersteren Falle sei

(7) die erhaltene lineare Gleichung. Es lassen sich dann offenbar drei ganzzahlige lineare Formen w1 , w2 , w3 der homogenen Parameter f1 , f 2 von der Art angeben, dass die Proportion (8)

alle rationalen Lösungen der linearen Gleichung (7) liefert, wenn Wir für die Parameter t1 , t 2 alle möglichen ganzen Zahlen einsetzen. Indem wir nun durch sukzessive Anwendung der vorhin ausgeführten Transformationen zu der ursprünglich vorgelegten Gleichung (1) zurückgehen, ergibt sich eine Proportion von der Gestalt (9)

wo 12 1 , 12 2 , 12s ganzzahlige Formen nter Ordnung der homogenen Variabeln ft, t2 bedeuten. Nach eventuellem Ausschluss einer endlichen Anzahl von Lösungen, welche wir als singuläre Lösungen bezeichnen und auf welche wir sogleich zurückkommen werden, findet man aus der Proportion (9) alle übrigen, nicht-singulären rationalen Lösungen der Gleichung (1), wenn man den Parametern ft, t2 alle möglichen ganzzahligen Werte erteilt. Es ist daher offenbar, dass wir alle nichtsingulären ganzzahligen eigentlichen Lösungen xt, x2 , x3 unserer Gleichung (1) erhalten, wenn wir in 12t, 122 , 12s die Parameter tt, t 2 alle möglichen Paare relativer Primzahlen annehmen lassen, und immer den grössten allen drei Zahlen gemeinsamen Teiler unterdrücken. Um jedoch zu bestimmten Formeln für diese eigentlichen Lösungen zu gelangen, bilden wir die Resultante der beiden Formen

wo At, A2 , A3 , flt, fl 2 , fla unbestimmte Parameter bedeuten. Diese Resultante ist eine ganze ganzzahlige Funktion der Parameter At, A. 2 , A.3 , flt, fl 2 , fl 3 , welche nicht identisch verschwinden kann, da die Formen 121 , 122 , ea keinen gemeinsamen Teiler besitzen. Es sei R die grösste

Über die diophantischen Gleichungen vom Geschlecht Null.

119

positive ganze Zahl, welche in sämtlichen Koeffizienten jener Funktion aufgeht. Bedeutet dann t1 , t2 irgendein Paar relativer Primzahlen, so ist leicht einzusehen, dass jede in den drei Zahlen !?t (tl ' t2) '

e2 (tl ' t2) ' ea (tl ' t2)

aufgehende Zahl ein Teiler von R sein muss. Lassen wir daher die beiden Parameter t1 und t2 unabhängig voneinander ein vollständiges Restsystem nach dem Modul R durchlaufen, so gelangen wir durch eine einfache Schlussweise zu folgendem Resultat: Es lässt sich ein endliches System von Formeln:

I

= ot 1 ('r l , T 2) ,

X2

X1 = ß1 (-r:l, T2) •

X2

X1

(10)

. .

. . . .

Xt

Xl (Tu T2)'

=

=

=

ot2('t'1, 1:'2) •

Xa

ß2(-r1, T2) •

Xs

=

ota(r:l, 1:'2);

= ßa(l't, T2);

aufstellen, welches alle nicht-singulären ganzzahligen eigentlichen Lösungen der Gleichung (1) liefert, wenn man den Parametern 1:'1 , r: 2 alle möglichen ganzzahligen Werte beilegt. Dabei bedeuten ot1 , ot 2 , ot3 , ••• , x1 , x2 , x3 ganze, ganzzahlige, nicht homogene Funktionen der Parameter 't'u 1:'2 • Die bisherigen Entwicklungen beruhten wesentlich auf dem Umstande, dass die benutzten Transformationen eindeutig umkehrbar sind. Da diese Eindeutigkeit jedoch in den singulären Punkten der Kurve (1) eine Ausnahme erfährt, so bedürfen diese Punkte noch einer besonderen Untersuchung. Die singulären Punkte entsprechen den gemeinsamen Lösungen der drei Gleichungen (11) und es kann daher stets durch eine endliche Anzahl rationaler Operationen entschieden werden, ob unter ihnen solche vorhanden sind, deren Koordinaten rationale Werte besitzen. Die so gefundenen "singulären" Lösungen der diophantischen Gleichung (1) werden nicht notwendig auch durch die Formeln (10) erhalten, wie sich leicht durch Beispiele zeigen lässt. Wenn zweitens der Grad n der vorgelegten Gleichung eine gerade Zahl ist, so werden wir, wie oben gezeigt worden ist, auf eine quadratische Gleichung (12)

geführt. Wir können dann diese Gleichung stets durch eine lineare Transformation mit rationalen Zahlenkoeffizienten in die Gestalt

120

(13)

Zahlentheorie.

a(ui

+ a2 u~ + a ui = 3

0

bringen, wo a 1 , a 2 , a3 sämtlich ohne einen quadratischen Teiler und paarweise relative Primzahlen sind. Bekanntlich besitzt diese Gleichung (13) ganzzahlige Lösungen dann und nur dann, wenn a 1 , a 2 , a3 nicht alle dasselbe Vorzeichen haben, und die Zahlen - a2 a 3 , - a3 a 1 , - a1 a2 beziehungsweise quadratische Reste der Zahlen a 1 , a 2 , a3 sind 1). Wenn diese Bedingungen erfüllt sind, so gibt es auf dem durch die Gleichung (13) definierten Kegelschnitte Punkte, deren Koordinaten rational sind, und wir können daher durch eine rationale eindeutig umkehrbare 'fransformation den Kegelschnitt in eine Gerade, oder, was dasselbe ist, die Gleichung (13) in eine lineare Gleichung überführen. An die letztere knüpfen sich sodann dieselben Betrachtungen, welche wir oben im Anschluss an die Gleichung (7) entwickelten. Es wird also auch in dem jetzt betrachteten Falle unsere diophantische Gleichung (1) eine unendliche Zahl von Lösungen besitzen, welche durch ein System von Formeln der Gestalt (10) gefunden werden, und zu welchen sich eventuell eine endliehe Zahl von singulären Lösungen gesellt. Sind jedoch die genannten Bedingungen nicht erfüllt, so besitzt der 'Kegelschnitt (13) keinen Punkt, dessen Koordinaten rationale Zahlen sind. Folglich gibt es dann auch auf der Kurve (1) keinen solchen Punkt, es sei denn, dass von den singulären Punkten dieser Kurve einer oder mehrere rationale Koordinaten besitzen. Unsere Gleichung (1) hat also jetzt entweder eine endliche 7.ahl von (singulären) Lösungen oder überhaupt keine Lösung, je nachdem die Gleichungen

~=0

oxl

~=0

'OX2

~=0

'OXa

gemeinsame rationale Lösungen zulassen oder nicht. Dass von diesen beiden Möglichkeiten auch die erstere eintreten kann, dass also ein singulärer Punkt der Kurve (1) rationale Koordinaten besitzen kann, ohne dass ein weiterer Punkt mit rationalen Koordinaten auf der Kurve liegt, zeigt folgendes Beispiel. Es seien cp, '1jJ1 , '1jJ 2 , 'lfJa vier ganzzahlige quadratische Formen, ferner l eine ganzzahlige lineare Form der Variabeln u 1 , u 2 , u 3 • Diese Formen mögen so gewählt werden, dass der durch die Gleichung (14) cp = 0 definierte Kegelschnitt keinen Punkt mit rationalen Koordinaten besitzt, dass ferner die Kegelschnitte 1 ) Legendre: Theorie des nombres, 3me ed., Paris 1830, t. 1., §§ III, IV. (Deutsch von H.Maser, Leipzig 1886.) Vgl. auch Lejeune Dirichlet: Vorlesungen über Zahlentheorie, herausgegeben von R. Dedekind, 3. Aufl. Braunschweig 1879, § 157 des X. Supplementes.

Über die diophantischen Gleichungen vom Geschlecht Null.

(15)

'fJJ1

=0,

1p2

121

=0

durch die beiden Schnittpunkte von rp = 0 mit der Geraden l = 0 hindurchgehen, ohne mit rp = 0 zu demselben Büschel zu gehören, und dass endlich der Kegelschnitt (16) "Pa= 0 die genannten beiden Schnittpunkte nicht enthält. Offenbar können die Formen auf unendlich viele Weisen diesen Bedingungen gernäss angenommen werden. Transformieren wir nun die Gleichung (14) vermöge der Formeln x1:x2:Xa="P1:"P2:"Pa• (17) so erhalten wir eine ganzzahlige Gleichung

(18) welche eine Kurve vierter Ordnung vom Geschlechte Null darstellt. Den Schnittpunkten der Geraden l = 0 mit dem Kegelschnitt rp=O entspricht ein Doppelpunkt dieser Kurve vierter Ordnung, dessen Koordinaten die rationalen Werte besitzen. Dagegen kann sich unter den nicht-singulären Punkten der Kurve (18) keiner mit rationalen Koordinaten finden, weil einem solchen auf dem Kegelschnitt (14) ein Punkt mit ebenfalls rationalen Koordinaten entsprechen würde. Durch zweckmässige Wahl der Form "Pa kann man, wie wir noch bemerken wollen, nach Belieben erreichen, dass entweder nur einer oder dass jeder der singulären Punkte der Kurve (18) rationale Koordinaten erhält. Durch die vorstehende Darlegung findet die diophantische Gleichung f(xv x 2 , x3)

=

0

von beliebigem Grade und vom Geschlechte Null ihre vollkommene Erledigung. Wie sich dabei gezeigt hat, besitzt eine solche Gleichung entweder keine Lösung, oder sie besitzt eine endliche Zahl von Lösungen, welche dann stets die gemeinsamen ganzzahligen Lösungen der Gleichungen (11) sind, oder endlich sie besitzt eine unendliche Zahl von Lösungen, welche abgesehen von eventuellen gemeinsamen. ganzzahligen Lösungen de1· Gleichungen (11) durch ein System von Formeln der Gestalt (1 0) gefunden werden. Wenn der Grad der Gleichung eine ungerade Zahl ist, so tritt stets der letzte Fall ein. Eine diophantische Gleichung von ungeradem Grade und vom Geschlechte Null besitzt also stets unendlich viele Lösungen. Königsberg i. Pr., den 14. März 1889.

LU.

Über die angenäherte Darstellung der Irrationalzahlen durch rationale Brüche. (Mathematische Annalen, Bd. 39, 1891, S. 279-284.)

Man kann bekanntlich jede Irrationalzahl Reihe von rationalen Brüchen xl

(1)

Xz

IX

durch eine unbegrenzte

Xa

1h' 1h' y;•

derart annähern, dass, abgesehen vom Vorzeichen, (2)

IX-3!._

Yn

< ___!_ Yh

(n

= 1, 2, 3, ... )

ist. Dieser Satz ergibt sich unmittelbar aus der Lehre von den Kettenbrüchen; er lässt sich aber auch durch andere sehr verallgemeinerungsfähige Methoden beweisen. Ich erinnere insbesondere an die Methode von Hermi te 1), welche insofern bemerkenswert ist, als sie ein weitergehendes Resultat liefert. Die Methode von Hermi te ergibt nämlich zu jeder Irrationalzahl IX eine Reihe (1) von rationalen Brüchen, für welche anstelle der Ungleichung (2) die folgende tritt: (3)

IX-

3!._

Yn

k:

rn = (1, 1, 1, .. ·)

+ (0, 1, 1, .. ·,

f-tk-1> • .. ,

ft2).

Für den Grenzwert von rn findet man limrn =

n=oo

v5,

und zwar liegen die Werte von rn abwechselnd über und unter V5, so dass es unzählig viele Indices n gibt, für welche r n > y'5 wird. Wir sehen also, dass die Ungleichung (9) in jedem Falle für unendlich viele Indices n erfüllt ist. Hieraus geht, wie wir schon oben bemerkt haben, die Richtigkeit des Satzes I. unmittelbar hervor. ZU1ll Beweise des Satzes II. betrachten wir diejenigen Zahlen, deren Kettenbruchentwicklung mit der Periode (1, 1, 1, ... ) endigt. Wir wollen zeigen, dass jede solche Zahl IX die in unserem Satze behauptete Eigenschaft besitzt. Diese Eigenschaft lässt sich aber offenbar so aussprechen: Es gibt entweder überhaupt keinen oder doch nur eine endliche Anzahl von rationalen Brüchen _'!__, . y welche der Bedingung (11)

X

1

y

J.y2

IX--

-v

-A 2VD-m

ist. Daher folgt: Ist m < 2 V D und sind beide Zahlen A und 0 negativ, so wird jede Lösung u, v der Gleichung (10), für die v die durch (19) gegebene Grenze überschreitet, durch die Näherungsbrüche der Wurzeln x 1 und x 2 geliefert. Als ein besonderer Fall verdient der Satz Erwähnung: "Die Lösungen der Gleichung

u 2 -Dv 2 = m, wo m absolut genommen kleiner als 2 V D ist, in positiven relativen Primzahlen u, v werden durch die Näherungsbrüche von V D geliefert." Die hier entwickelten Sätze sind die Analoga zu bekannten Sätzen aus der Theorie der Kettenbrüche 1). Während aber in den letzteren ist, ist sie in unseren Sätzen die obere Grenze für m die Zahl

vD

1)

Vgl. z. B. Serret, Cours d'algebre superieure, 4me ed., Paris 1877, Bd. I, S. SOff.

.Annäherung von Zahlen durch rationale Brüche.

147

Sätzen gleich 2VD, und hierin liegt der Vorzug, den bei dieser Untersuchung unsere Theorie der Näherungsbrüche gegenüber den Kettenbrüchen besitzt. § 5.

Weitere Untersuchung der Näherungsbrüche einer Grösse x. Wir wollen die Paare von Näherungsbrüchen einer Grösse x der Reihe nach mit (20) bezeichnen. Jedes Paar wird mit dem Vorstehenden einen Bruch gemeinsam haben. Denn allgemein besteht das auf ~().)

=

.!__

'Yl(.l)

U'

'I

=

!._ V

folgende Paar aus einem der beiden Brüche ~ kleiner oder grösser als x1 ist, je nachdem c entsprechen, so hat man nach dem Bildungsgesetz der Reihe der Näherungsbrüche mr+ns

C= mu+nv' wo m, n positive ganze Zahlen bedeuten. Die Elimination dieser Zahlen m, n ergibt eine Gleichung der Form ,.

rx?:+ß

."l=rc+o

(oc6- ßy

=

1),

und da x die Grenze der Zahlen C und x1 die Grenze der Zahlen C1 ist, so folgt rxx+ß

1 -rx+o'

X -

---:--'~

d. h. x und x1 sind äquivalent. Wir können also den Satz aussprechen: Die notwendige und hinreichende Bedingung für die Äquivalenz zweier Grössen x und x 1 ist die, das.r; ihre Charakteristiken sich nur in einer endlichen Anzahl von Anfangsgliedern unterscheiden. Sind x und x1 uneigentlich äquivalent, d. h. besteht zwischen x und x1 eine Relation der Gestalt rxx+ß Xl= yx+b'

wo oc, ß, y, 6 irgend VIer ganze Zahlen der Determinante oc6-ßy=-1

bezeichnen, so sind - x und x1 eigentlich äquivalent. Berücksichtigt man nun, dass die Näherungsbrüche und die Charakteristik von - x aus denen von x erhalten werden, indem man jeden Bruch resp. jedes Vorzeichen mit dem Faktor - 1 multipliziert, so erkennt man, dass für die uneigentliche Äquivalenz analoge Sätze gelten, wie für die eigentliche. Diese Sätze liest man unmittelbar aus den oben bewiesenen ab, so dass wir auf eine ausdrückliche Formulierung derselben verzichten können.

§ 8.

Verallgemeinerungen. Die vorstehende Theorie der angenäherten Darstellung der Zahlen durch rationale Brüche, lässt sich nach mehreren Richtungen ver-

Annäherung von Zahlen durch rationale Brüche.

155

allgemeinem, wie ich hier zum Schluss kurz andeuten will, indem ich mir vorbehalte, in einigen Arbeiten darauf zurückzukommen, die sich an die vorliegende anschliessen sollen. Die eine Verallgemeinerung bezieht sich darauf, dass man anstelle der (reellen) rationalen Zahlen die komplexen rationalen Zahlen der Form :!!~ (wo a, b, c, d reelle ganze Zahlen bedeuten) in Betracht zieht. An die Stelle der Fundamentalaufgabe tritt hier die Aufgabe, unter den komplexen rationalen Zahlen, deren Zähler und Nenner absolut genommen eine gegebene positive ganze Zahl nicht überschreiten, diejenige zu bestimmen, welche einer gegebenen komplexen Grösse x am nächsten kommt. -Noch allgemeiner kann man die Annäherung der Grössen durch Zahlen untersuchen, die in irgendeinem endlichen Körper rational sind. Eine andere Verallgemeinerung besteht darin, dass man nicht eine Grösse x, sondern zwei Grössen x und y betrachtet, die durch rationale Zahlen simultan angenähert werden sollen. Des bequemeren Ausdrucks wegen deute ich x und y als rechtwinklige Koordinaten, so dass das Grössenpaar x, y durch einen Punkt in einer Ebene dargestellt wird. In dieser Ebene betrachte man diejenigen Punkte, deren beide Koordinaten rationale Zahlen sind. Die Koordinaten eines solchen _!_ bringen, wo u, v, w ganze Punktes lassen sich stets auf die Form ~-, w w Zahlen ohne einen allen gemeinsamen Teiler sind. Diese Zahlen nenne ich die natürlichen (homogenen) Koordinaten des betreffenden Punktes. Die natürlichen Koordinaten u, v, w eines Punktes (mit rationalen Koordinaten) sind offenbar bis auf den Faktor -1, mit dem man alle drei Koordinaten noch multiplizieren kann, vollkommen bestimmt. Zieht man nun das System aller Punkte in Betracht, deren natürliche Koordinaten absolut genommen die positive ganze Zahl n nicht übertreffen, so lässt sich zeigen, dass diese Punkte angesehen werden können als die Ecken eines gewissen Dreiecksnetzes von der Eigenschaft, dass erstens die Ebene von dem Netze einfach bedeckt wird, dass zweitens die Determinante aus den natürlichen Koordinaten der Ecken jedes Dreiecks des Netzes den Wert ± 1 besitzt und dass drittens das zur Zahl n + 1 gehörige Netz aus dem zur Zahl n gehörigen vermöge Teilung einzelner Dreiecke durch geeignete Ecktransversalen entsteht. Das zur Zahl n gehötige Netz nenne ich das n 16 Farey'sche Netz. Mit Hilfe dieser Farey'schen Netze lässt sich nun ein Zahlenpaar

(x, y) durch rationale Zahlen (~, :) in folgender Weise annähern. Man sucht dasjenige Dreieck des nten Netzes auf, in welchem der Punkt (x, y) liegt und notiert die Koordinaten

156

Zahlentheorie.

der drei Ecken dieses Dreiecks. Indem man der Zahl n nach und nach alle ganzzahligen Werte 1, 2, 3,. . . beilegt, erhält man eine unendliehe Reihe solcher Tripel von Zahlenpaaren. Die Zahlenpaare selber haben das Paar (x, y) zur Grenze, da die Dreiecke, in welchen der Punkt (x, y) liegt, mit wachsendem nimmer kleiner und kleiner werden. Ebenso wie es zweckmässig ist, bei der Aufgabe, eine Grösse durch rationale Zahlen anzunähern, die Farey'sche Reihe an die Stelle der Kettenbrüche zu setzen, so ist es angebracht, bei der entsprechenden Aufgabe, zwei Grössen x und y simultan anzunähern, die soeben skizzierte, auf die Farey'schen Netze gegründete Methode anstelle des Jacobi'schen Kettenbruch-Algorithmus zugrunde zu legen. Es leuchtet unmittelbar ein, dass man auf ähnliche Weise die simultane Annäherung von drei oder mehr Grössen durch rationale Brüche mit demselben Nenner begründen kann. Zürich, 29. November 1893.

LVI.

Über die Reduktion der binären quadratischen Formen. (Mathematische Annalen, Bd. 45, 1894, S. 85-117.)

§1. Die Farey'schen Polygone.

Bezeichnen x, y, z homogene Dreieckskoordinaten, so durchläuft der Punkt X:

y: Z = 1:- A: A2

einen Kegelschnitt K, wenn A. die reellen Zahlen von - oo bis + oo annimmt. Jedem besonderen Werte A.0 von A. entspricht ein bestimmter Punkt dieses Kegelschnittes, und wir wollen diesen Punkt kurz als den "Punkt A.0 " bezeichnen. Der Einfachheit halber möge die Koordinatenbestimmung so getroffen werden, dass der Kegelschnitt K ein Kreis ist und dass die Punkte 0, 1, oo mit den Ecken eines dem Kreise K einbeschriebenen regulären Dreiecks zusammenfallen. (Vgl. Fig. 5.) Wir werden nun in diesem Paragraphen eine Reihe von Definitionen und Sätzen aufstellen, Fig. 5. die sich auf diejenigen Punkte des Kreises K beziehen, welche rationalen Werten von A. entsprechen. Definition 1. Die Verbindungslinie zweier Punkte !__ und !__, wo U

V

r, u, s, v ganze Zahlen bezeichnen, soll eine "Elementarsehne" des Kreis es K heissen, wenn rv- su = ± 1 ist.

Hiernach werden beispielsweise, da 0 = ~ , 1 = Sehnen

! , oo = ~ ist, die

158

Zahlentheorie.

Ol,loo,ooO Elementarsehnen sem. Definition 2. Ein dem Kreis K einbeschriebenes Dreieck soll ein "Elementardreieck" heissen, wenn jede Seite des Dreiecks eine Elementarsehne ist. Beispielsweise wird das Dreieck 0 1 oo ein Elementardreieck sein. Im Anschluss an diese Definition beweisen wir den Satz 1. Jede Elementarsehne ist Seite von zwei Elementardreiecken, die auf verschiedenen Seiten der Sehne liegen. Es sei a eine Elementarsehne,

_!___ U

und ~seien ihre Endpunkte, so ist V

±1.

rv- su = e =

Soll nun 1!_ der dritte Endpunkt eines Elementardreiecks sein, dessen q beide andern Eckpunkte _!___ und ~ sind, so muss U

V

pv - qs = e1 = ± 1,

±1

p~t-qr=e 2 =

sem. Hieraus folgt, durch Auflösung nach p und q,

also entweder

1!_ q

ep

=

eq

= e1 u - e2 v,

= ur ++ 8v oder

1!_ q

e1 r - e2 s,

=

Jeder dieser beiden Brüche

r- 8 •

u-v

liefert in Verbindung mit den Brüchen

_!___ U

und ~ auch tatsächlich ein V

Elementardreieck. Da ferner die Punkte _!___ u und ~ durch die Punkte r ++ 8 und r - 8 harv

u

v

u-v

monisch getrennt werden, so liegen die beiden über der Sehne a möglichen Elementardrei;:! f'-------___::;~: ecke zu verschiedenen Seiten der Sehne a. Damit ist der Satz 1 vollständig bewiesen. Beiläufig sei noch bemerkt, dass man jedes der beiden über der Sehne a möglichen EleFig. 6. mentardreiecke aus dem anderen durch eine einfache geometrische Konstruktion ableiten kann, da die Verbindungslinie der Punkte Ur ++ 8V und U r- 8 durch den Pol der Sehne a geht. - V (Vgl. Fig. 6.) Es soll sich nun darum handeln, ein anschauliches Bild von der Gesamtheit aller Elementardreiecke zu gewinnen. Zu dem Ende stellen wir zunächst folgende neue Definition auf:

Über die Reduktion der binären quadratischen Formen.

159

Definition 3. Man betrachte alle rationalen Zahlen _!___,deren Zähler u und Nenner absolut genommen die positive ganze Zahl n nicht über· schreiten. Die entsprechenden Punkte _!___ des Kreises K bilden die Ecken u eines dem Kreise einbeschriebenen konvexen Polygones P .. , welches das nte Farey' sehe Polygon genannt werden soll. So ist das erste Farey'sche Polygon P 1 das Viereck oo, -1, 0, 1;

das zweite Farey'sche Polygon P 2 das Achteck oo, -2, -1, - ; , 0, ; , 1, 2; usw. (V gl. Fig. 7, in welcher die Seiten des Polygones P 2

stark ausgezogen sind.) --=--2--=,...__ Wir ergänzen diese Definition noch dadurch, dass wir als "nulltes" Farey'sches Polygon P 0 das von den Punkten oo, 0 gebildete Zweieck einführen. Es gilt dann allgemein der 2 Satz 2. Die Parameter der aufeinanderfolgenden Ecken des nten Farey'sehen Polygones P.. bilden die nte Farey'sche Reihe 1). Aus den Eigenschaften der Farey'Fig. 7. sehen Reihen geht nun hervor: Satz 3. Jede Seite eines Farey'schen Polygones ist eine Elementarsehne und umgekehrt: jede Elementarsehne ist Seite eines Farey' sehen Polygones. Den zweiten Teil dieses Satzes können wir noch näher präzisieren. Nämlich: Satz 4. Wenn in der Reihe P 0 , P 1 , P 2 , ••• das Polygon P., das erste ist, unter dessen Ecken sich beide Endpunkte der Elementarsehne a finden, so ist a eine Seite des Polygones P.,. Hieran knüpfen wir den Beweis des folgenden Satzes: Satz 5. Das nte Farey' sehe Polygon (n > 0) setzt sich gerade a~ts denjenigen Elementardreiecken zusammen, deren Eckpunkte sich unter den Ecken des nten Farey'schen Polygones befinden. Oder anders ausgedrückt: Die Elementardreiecke, die sich aus den Ecken des nten Farey'schen Polygones bilden lassen, bedecken dieses Polygon einfach und lückenlos. Für den Fall n = 1 ist dieser Satz offenbar richtig, da das Polygon P 1 sich aus den beiden über der Sehne oo 0 möglichen Elementar1 ) Vgl. die Abhandlung des Verfassers: Über die angenäherte Darstellung der Zahlen durch rationale Brüche, Mathem. Annalen, Bd. 44 (1894), S. 417-436 [diese Werke, Bd. II, S. 136-156].

160

Zahlentheorie.

dreiecken oo , 0, 1 ; oo , 0, - 1 zusammensetzt. Wir brauchen also nur zu zeigen, dass der Satz für das Polygon P.,+l gilt, wenn wir seine Gültigkeit für das Polygon P., als schon bewiesen vorausssetzen. Nun setzen sich die Elementardreiecke, welche aus den Ecken des (n + 1)sten Polygones gebildet werden können, zusammen 1) aus denjenigen, bei welchen nur Ecken des nten Polygones zur Verwendung kommen und diese bedecken nach Voraussetzung das nte Polygon einfach und lückenlos; 2) aus denjenigen, bei welchen auch Ecken des (n + 1)sten Polygones, die nicht schon Ecken des nten Polygones sind, zur Verwendung gelangen. Ist C eine solche Ecke, so liegt dieselbe zwischen zwei aufeinanderfolgenden Ecken A und B des nten Polygones, mit welchen zusammen sie ein Elementardreieck CA B bestimmt (Satz 3). Da nun, nach Satz 4, CA und C B die einzigen Elementarsehnen sind, deren einer Endpunkt mit C, deren anderer Endpunkt mit einer andern Ecke des (n + t)•ten Polygones zusammenfällt, so ist CA B das einzige [[neu hinzugekommene]] Elementardreieck, welches C zur einen Ecke hat. Die zweite Kategorie von Elementardreiecken besteht also aus Dreiecken, die sich auf gewiss~ Seiten (AB) des nten Polygones aufsetzen. Offenbar entsteht das (n + l)ste Polygon, indem wir diese Dreiecke zum nten Polygone hinzufügen, woraus der zu beweisende Satz hervorgeht. Aus dieser Betrachtung folgt zugleich der Satz 6. Ist in der Reihe der Farey'schen Polygone P 1 , P 2 ,. •• das Polygon P., das erste, unter dessen Ecken sich die drei Eckpunkte A , B, C irgend eines Elementardreiecks befinden, so sind diese Eckpttnkte A, B, C aufeinanderfolgende Ecken des Polygones P.,. Lassen wir die ganze Zahl n über alle Grenzen wachsen, so nähert sich das Polygon P., immer mehr dem Kreise K an. Aus dem Satz 5 ergibt sich daher der Satz 7. Die Gesamtheit aller Elementardreiecke überdeckt das Innere des Kreises K einfach und lückenlos. Die von der Gesamtheit aller Elementardreiecke gebildete Figur stimmt im wesentlichen mit derjenigen überein, die in den von Herrn Fricke herausgegebenen Vorlesungen Felix Klein 's über elliptische Modulfunktionen 1) mitgeteilt wird. Herr Klein hat diese Figur aus der der Theorie der Modulfunktionen zugrunde liegenden Figur abgeleitet. Umgekehrt kann man die letztere und ihre Eigenschaften aus der ersteren ableiten. 1 ) Leipzig 1890, Bd. I, S. 239. Vgl. auch die Bemerkungen am Schlusse der vorliegenden Arbeit.

Über die Reduktion der binären quadratischen Formen.

161

§ 2.

Geometrische Darstellung der binären quadratischen Formen. Wir ordnen nun der binären quadratischen Form

f

(1)

=(a, b, c) =ax2 + 2 bxy + cy2

denjenigen Punkt zu, dessen homogene Koordinaten a : b : c sind. Es entspricht dann jeder Form ein bestimmter Punkt. Umgekehrt entsprechen irgendeinem Punkte (a, b, c) die unendlich vielen Formen

(2) wo

e jeden· beliebigen

reellen Wert erhalten kann. Wenn die Determinante D der Form (a, b, c):

D

(3)

=

b2 - ac

verschwindet, so können wir Ä so bestimmen, dass a: b: c = 1:- Ä: Ä2

(4)

ist. Es entspricht also einer Form mit verschwindender Determinante ein Punkt Ä des Kreises K. Umgekehrt entsprechen nach (2) dem Punkte Ä des Kreises K die Formen

(5) Man zeigt ferner leicht, dass eine Form f durch einen Punkt im lnnern oder ausserhalb des Kreises K geometrisch dargestellt wird, je nachdem ihre Determinante D negativ oder positiv ist. Dies vorausgeschickt, betrachten wir eine beliebige lineare Trans-formation

(S) {x = cxx: + ßy> y=yx +!5y.

(6)

Durch dieselbe geht die Form (1) in die Form

(7)

fS

über, wo

(8) ist. Es (a, b, c) auf die mittelte

=f' =a' x'

2

+ 2 b' x' y' + c' y' 2

a' = acx 2 + 2 bcxy + cy 2, b' = acxß + b(cx!5 + ßy)+ cyb, c' = aß 2 + 2 bß!5 + cb 2

1

wird demnach ein bestimmter Gleichungen (8) Umformung der

durch die Transformation S jedem Punkte Punkt (a', b', c') zugeordnet, und ein Blick lehrt, dass die durch diese Zuordnung verEbene eine Kollineation ist. Wir wollen diese, 11

162

Zahlentheotie.

der Transformation S entsprechende Kollineation ebenfalls mit S bezeichnen. Bei der Kollineation S geht der Kreis K in sich über. In der Tat werden die Formen (5), welche dem Punkte A des Kreises K entsprechen, durch die Transformation S in die Formen

übergeführt. Dem Punkte A des Kreises K entspricht also vermöge der Kollineation S der Punkt A' des Kreises K, wo

A'=

(9)

lA =

!5..1.-fl -y.A.+ot' otÄ' + ß r·Ä' + fPn+2• • • •

erhalten hätten, die aus der Kette (28) durch eine Verschiebung aller Glieder hervorgeht. Wir werden nun die Kette (28') als nicht verschieden von der Kette (28) ansehen, also zwei Ketten als identisch betrachten, wenn die eine aus der anderen durch eine blosse Verschiebung der Glieder hervorgeht. Dann leuchtet ein, dass durch eine Form f die zugehörige Kette reduzierter Formen vollständig bestimmt ist. Wir beweisen nun den folgenden Satz, welcher die Theorie der Reduktion quadratischer Formen von positiver Determinante zum Abschluss bringt: Satz 20. Zwei Formen von positiver Determinante sind stets und nur dann äquivalent, wenn zu der ,einen Form dieselbe Kette reduzierter Formen gehört, wie zu der anderen Form.

176

Zahlentheorie.

Es sei f irgendeine Form positiver Determinante, die durch die Transformation S in die Form f' übergehe, so dass (29) fS = f' ist. Die zu der Form f' gehörigen Reihen von Elementarsehnen, Transformationen und reduzierten Formen mögen bezüglich mit

(30) (31) (32)

... •••

entsprechen c 2) , ••• , ( am,

dann bzw. die reduzierten

bm, cm)

=(a

0,

b0 , c0 ) •

welche den ersten Paaren entsprechen, bzw.

+ 2b1 + c1 , ••• ,

am-l

+ 2bm-l + cm-l•

Über die Reduktion der binären quadratischen Formen.

die Zahlen

f3 , welche den zweiten Paaren entsprechen, bzw.

(48)

a 1 - 2 b1

+ c1 ,

a 2 - 2 b2

+ C2, ••• ,

am - 2 bm

185

+ Cm.

Nun zeigt man aber leicht, dass die Zahlen (47) der Reihe nach dieselben Vorzeichen haben wie die Zahlen (48). In der Tat, die auf (a;, b;, ci) folgende Form (ai+ 1 , bi+ 1 , ci+l) ist durch die Gleichungen ai+ 1

a;, bi+ 1

=

=

ai

+ bi,

ci+ 1 = ai

+ 2bi + c,

oder durch die Gleichungen

+ 2 b, + c,, bi+l = b; + C;, ci+l = C; bestimmt, je nachdem a, + 2 b; + c, negativ oder positiv ist. Im ersten Falle ist aber ai+ 1 - 2 bi+ 1 + ci+ 1 = c,, also negativ, im zweiten Falle ist ai+ 1 - 2bi+ 1 + ci+ 1 = a;, also positiv, w. z. b. w. ai+ 1

=

a;

Die Charakteristiken von

Ä1

und

Ä2

haben daher die Gestalt

bzw. wobei

e _ _ e e0(2) -_ _ e m-V 1 -

m-2• • • •'

e

_ _ eO>

m-1-

0

ist. Indem wir der Einfachheit halber die Bezeichnung dahin abändern, . 'f/1 , 'f/ 2, ••• , (1) b h 'b . d assWir ans t ell e von e0(1) , e1(1), ••• , em_ 1 zw. sc re1 en, rndem wir ferner berücksichtigen, dass die Charakteristik von -Ä 2 aus der von Ä2 hervorgeht, wenn man in dieser alle Vorzeichen umkehrt, können wir den Satz aussprechen: Satz 24. Für eine Form (a, b, c), deren erster Koeffizient a positiv, deren letzter Koeffizient c negativ ist, haben die Charakteristiken der ersten (positiven) Wurzel und der negativ genommenen zweiten (negativen) Wurzel die Gestalt

"'m

bzw.

E'fJ'f/1

'f/2

• • • 'f/m'f/1 'f/2

E'fJ'fJm'f/m-1• • •

•••

"'m• • •

'f/1 'f/m'f/m-1• • • 'f/1 • • • •

Wir betrachten nun zweitens den Fall, wo gemeinsame Paare in den Reihen (36) und (37) auftreten. Dieser Fall tritt ein, wenn Ä1 und Ä2 dasselbe Vorzeichen haben, also die äusseren Koeffizienten a, c der Form beide positiv sind. Es sei wieder m die Anzahl der Glieder der Formenperiode. Da.nn haben die Charakteristiken von Ä1 und Ä2 die Gestalt bzw.

Zahlentheorie.

186

wo die beiden ersten durch Punkte angedeuteten Glieder in beiden Charakteristiken er; oder r;e sind, je nachdem Ä.1 und Ä. 2 positiv oder negativ sind. Nun zeigt man wieder leicht durch die Betrachtung der reduzierten Formen, die den Paaren :n;~>, •.. , :n;~1!m-l und :n;~>, ••• , :n~!m- 1 entsprechen, dass (2) -

En -

(1) (2) (1) (2) (1) (2) (1) -en+m-2• 8n + l - -en+m-3• • • ·' 8 n+m-2- -en ' 8 n+m-1- -en+m-1

ist. Indem wir von der Charakteristik von Ä. 2 wieder zu der von - Ä. 2 übergehen und zugleich für die in den Charakteristiken auftretenden Vorzeichen andere Bezeichnungen einführen, erhalten wir den Satz 25. Für eine Form (a, b, c), deren äussere Koeffizienten a und c positiv sind, haben die Charakteristiken der ersten Wurzel und der negativ genommenen zweiten Wurzel die Gestalt bzw. I

wo

I

I

I

eoel e2 ••• en

r; 'Y1m-117m-2 ••• 171

17m 17m-117m-2 •••

171

17m • •• '

e: = -e,. (u = 0, 1, 2, ... , n) ist.

Von der Charakteristik einer Grösse geht man leicht zu der Kettenbruchentwicklung derselben über. Und so enthalten insbesondere die Sätze 24 und 25 das bekannte Theorem, dass die natürlichen Kettenbruchentwicklungen der beiden Wurzeln einer ganzzahligen quadratischen Gleichung periodisch sind, und dass die Periode in der Entwicklung der einen Wurzel dieselben Zahlen jedoch in umgekehrter Reihenfolge enthält, wie die Periode in der Entwicklung der anderen Wurzel.

Es mögen hier noch einige Bemerkungen über die im vorstehenden entwickelte Theorie, über ihre Beziehungen zu älteren Untersuchungen und über ihre Verallgemeinerungen folgen. In letzter Instanz liegt unserer Theorie die Untersuchung der ganzzahligen Formen mit verschwindender Determinante zugrunde. Indem wir nämlich die Formen durch die Punkte einer Ebene repräsentierten, wurden die ganzzahligen Formen mit verschwindender Determinante durch diejenigen Punkte eines Kegelschnittes (des Kreises K) dargestellt, welche rationalen Parametern entsprechen, und die Betrachtung dieser Punkte, mit welcher unsere Untersuchung sogleich anhebt, bildet den Angelpunkt der Theorie. Bei der erwähnten geometrischen Repräsentation stellen sich die unimodularen ganzzahligen

Über die Reduktion der binären quadratischen Formen.

187

linearen Transformationen der quadratischen Formen als eine Gruppe von Kollineationen dar, der gegenüber jenes System von Punkten des Kegelschnitts mit rationalen Parametern invariant ist. Betrachtet man die Gerade, welche irgend zwei Punkte dieses Systemes, deren Paraseien, verbindet, so ist der absolute und _!__ V Wert der Determinante rv- su rücksichtlich unsere Gruppe von Kollineationen eine Invariante jener Geraden. Man gelangt so naturgemäss zu dem Begriff der Elementarsehnen: es sind das diejenigen Geraden, deren Invariante den kleinstmöglichen Wert 1 besitzt. Indem wir uns nun die Gesamtheit aller Elementarsehnen konstruieren, erhalten wir eine Figur, die uns die Gruppierung aller Punkte der Ebene gegenüber den Kollineationen der Gruppe übersehen lässt und uns damit die Mittel an die Hand gibt, die Theorie der Reduktion der quadratischen Formen zu begründen. Dabei ist besonders hervorzuheben, dass sich die wesentlichen Eigenschaften dieser Figur aus dem Begriff der Elementarsehne auf die leichteste und ungezwungenste Weise ergeben. Schon oben haben wir erwähnt, Jass die in Rede stehende "Elementarsehnenfigur" von Herrn Klein aus jener "Modulfigur" (wie wir sie kurz nennen wollen) abgeleitet worden ist, welche der Theorie der Modulfunktionen zugrunde liegt und die aus einem gewissen System von Kreisbogendreiecken besteht, welche die eine Hälfte der komplexen Zahlenebene einfach und lückenlos bedecken. In abstracto kann man die beiden Figuren geradezu als identisch ansehen, insofern sie verschiedene geometrische Einkleidungen derselben analytischen Ideenbildung sind 1). Der Gedanke nun, die Theorie der Reduktion binärer quadratischer Formen auf die Modulfigur zu gründen, wurde von Herrn Klein schon 1879 in einer Vorlesung, welcher der Verfasser damals als Studierender beiwohnte, ausführlich erörtert. Andererseits meter in reduzierter Form

!_ U

1 ) Die geometrische Einkleidung ist hier, wie in allen ähnlichen Fällen, einerseits an sich ganz unwesentlich (so wertvoll sie für die Ideenbildung und für die Abkürzung der Ausdrucksweise auch sein mag), andererseits ist sie natürlich auf die verschiedensten Weisen möglich. Für welche Art der Einkleidung man sich entscheiden will, wird man immer von Zweckmässigkeitsgründen abhängen lassen. So wird man in der Theorie der Modulfm1ktionen der Modulfigur den Vorzug geben, während in der Theorie der Reduktion der quadratischen Formen die Elementarsehnenfigur als die angemessenere erscheint. Vielleicht ist es übrigens zweckmässig, die letztere Figur auch denjenigen funktionentheoretischen Untersuchungen zugrunde zu legen, die sich auf die von

Dirichlet, Kronecker, Weber und anderen betrachteten Reihen der Gestalt 2:a~ a (und ähnliche) beziehen, wo sich die Summe auf die ersten Koeffizienten aller Formen einer Klasse positiver Formen erstreckt. Bemerkt sei übrigens noch, dass man, um volle Übereinstimmung zwischen beiden Figuren zu erzielen, die Elementarsehnenfigur durch Aufnahme aller Geraden ergänzen muss, deren Invariante gleich 2 ist.

188

Zahlentheorie.

war auch der Zusammenhang der Modulfigur mit der Theorie der Reduktion quadratischer Formen negativer Determinante in Herrn Dedekind 's Abhandlung über die Theorie der elliptischen Modulfunktionen (Orelle's Journal, Bd. 83, 1877, S. 265-292 [Ges. Werke, Bd. I, S.174-201]) klar hervorgetreten und Stephen Smith hatte in einer Arbeit "Sur les equations modulaires" (Atti della Accademia Reale di Lincei, Bd. I, 1877) die Figur für Formen positiver Determinante verwendet. In seiner Abhandlung "Grundlagen einer independenten Theorie der elliptischen Modulfunktionen und Theorie der Multiplikatorgleichungen erster Stufe" (Mathem. Annalen, Bd. 18, 1881, S. 528-592 [diese Werke, ·Bd. I, S.1-66]) hat der Verfasser sodann die wesentlichen Eigenschaften der Modulfigur auf direktem Wege bewiesen, wodurch auch für die Anwendung der Figur auf die Reduktion der quadratischen Formen eine feste Grundlage gegeben war. Ist die dort gegebene Darstellung an sich auch ausreichend, so leidet sie doch an dem Mangel, dass sie keine Ableitung der Figur gibt, sondern die wesentlichen Elemente der Figur wie etwas Gegebenes annimmt. In dieser Hinsicht hat jene Darstellung durch Herrn Fricke eine Ergänzung erfahren, und zwar auf Grund einer Idee, die derselbe auch in vielen analogen Fällen mit glücklichem Erfolge angewandt hat 1). Die Idee besteht darin, die Gruppe der ganzzahligen linearen Transformationen

x' =

lXX+

ß

yx+6

(cxCJ- ßy

=

1)

durch Hinzufügung der Transformation x' = -x zu erweitern. Dabei bedeuten x und x' komplexe Variable und die zu x konjugiert komplexe Grösse. In der erweiterten Gruppe gibt es nun gewisse Transformationen (Spiegelungen), welche ganze Linien (Gerade oder Kreise) Punkt für Punkt fest lassen und diese Linien geben unmittelbar die Begrenzungen der Gebiete ab, welche die Modulfigur bilden. Was nun die Stellung der vorliegenden Arbeit zu den soeben besprochenen Untersuchungen angeht, so ist erstens zu bemerken, dass wir eine Ableitung der Modulfigur und ihrer Eigenschaften gegeben haben, die auf einem durchaus neuen Prinzipe beruht. Sodann haben wir zweitens die Theorie der Reduktion der quadratischen Formen auf Grund der Figur nach der zahlentheoretischen Seite hin vollständig durchgeführt. Hierzu war die Verwendung der Theorie der Farey'schen Reihen unumgänglich. Wollte man auf die zahlentheoretische Durchführung verzichten und sich mit einer Skizzierung im allgemeinen

x

1 ) Vgl. Klein-Fricke, Elliptische Modulfunktionen, Leipzig 1890, Bd. I, S. 223ff.; Fricke: Über eine besondere Klasse diskontinuierlicher Gruppen reeller linearer Substitutionen, Mathem. Annalen, Bd. 38 (1891), S. 50-81 und 461-476. Man sehe auch die Abhandlungen von Bianchi: Sui gruppi di sostituzioni lineari, Mathcm. Annalen, Bd. 40 (1892), S. 332-412 und Bd. 42 (1893), S. 30-57.

Über die Reduktion der binären quadratischen Formen.

189

begnügen, so würde man mit weit geringeren Mitteln ausreichen, wie dies aus einer Note zu ersehen ist, die der Verfasser dem mathematischen Kongress in Chicago vorgelegt hat 1). Das Prinzip, welches wir in der vorliegenden Arbeit auf die binären quadratischen Formen mit reellen Koeffizienten angewandt haben, nämlich: die "ausgearteten" Formen zu untersuchen und von diesen den Rückschluss auf die allgemeinen Formen zu machen, lässt sich mit Erfolg auf Formen mit beliebig vielen Unbestimmten, sei es, dass man die Koeffizienten der Formen reell oder komplex annimmt, ausdehnen. Es möge genügen, dieses an einigen Beispielen näher darzulegen. Im Falle der binären Formen mit komplexen Koeffizienten (der Dirichlet'schen und Hermite'schen Formen) führt unser Prinzip zu folgender Betrachtung. Man denke sich die komplexen Zahlen in bekannter Weise durch die Punkte einer Kugel dargestellt. Die einzelne komplexe Zahl möge zur Abkürzung der "Parameter" des entsprechenden Kugelpunktes heissen und letzterer ebenso bezeichnet werden wie sein Parameter. Die unimodularen Transformationen

,

~=! ~ wo cx, ß, y, b komplexe ganze Zahlen sind, stellen dann eine Gruppe von Kollineationen des Raumes dar, welche die Kugel fest lassen und insbesondere das System der Punkte mit (komplex) rationalen Parametern in sich überführen. Es überträgt sich nun ohne weiteres der Begriff der Elementarsehne: eine Elementarsehne ist die Verbindungsgerade zweier Punkte !_, _s_ der Kugel, wo r, s, u, v komu V

plexe ganze Zahlen bezeichnen, die der Bedingung rv - su = s genügen, unter s eine Einheit, also einen der Werte ± 1, ± i verstanden. Man fasse nun die Gesamtheit der im Inneren der Kugel ausgespannten unendlich vielen Elementarsehnen ins Auge. Betrachtet man eine Gerade, welche die Kugel schneidet, so wird man untersuchen können, wie sich diese Gerade durch die Gesamtheit der Elementarsehnen hindurchzieht. Diese Untersuchung ergibt die Theorie der Reduktion der Dirichlet'schen Formen, welche wie leicht zu sehen durch die die Kugel treffenden Geraden dargestellt werden. Man erhält ferner die Theorie der Reduktion der definiten und indefiniten Hermite'schen Formen, indem man untersucht, wie sich ein im Innern der Kugel liegender Punkt bzw. eine die Kugel schneidende Ebene zu der Gesamtheit der Elementarsehnen verhält. Die hier in ihren Grundzügen skizzierte Theorie der Dirichlet'schen und Hermite'schen Formen steht zu der von Herrn Bianchi gegebenen 2) [Diese Werke, Bd. II, S. 269-275.] Geometrische Darstellung der Gruppen linearer Substitutionen mit ganzen komplexen Koeffizienten nebst Anwendungen auf die Zahlentheorie, Mathem. Annalen, Bd. 38 (1891), S. 313-333. 1)

2)

190

Zahlentheorie.

in derselben Beziehung, wie die in der vorliegenden Arbeit entwickelte Theorie der binären quadratischen Formen mit reellen Koeffizienten zu der älteren, oben besprochenen Theorie, die eich auf die Modulfigur stützt. Auch für die Dirichlet'schen und Hermite'schen Formen gewährt unsere Theorie den Vorteil, unmittelbar die zahlentheoretische Durchführung zu ermöglichen, wobei dann auch ihr Zusammenhang mit den Untersuchungen hervortreten wird, die der Verfasser über die Entwicklung komplexer Grössen in K~ttenbrüche angestellt hat. (Acta Mathematica Bd. 11, 1887-1888, S. 187-200 [diese Werke, Bd. II, S. 72-83].) Alles dies hofft der Verfasser in einer Abhandlung, die sich an die vorliegende anschliessen soll, ausführlich darlegen zu können. Es braucht kaum bemerkt zu werden, dass unser Prinzip auch auf andere neuerdings von den Herren Fricke und Bianchi untersuchten Gruppen und zugehörigen Formen (vgl. das obige Zitat) Anwendung findet. Wir betrachten zweitens die quadratischen Formen mit reellen Koeffizienten undnUnbestimmten u, v, w, .... Der Einfachheit halber sei n = 3. Deutet man dann die Koeffizienten der einzelnen Form als homogene Koordinaten, so werden die Formen durch die Punkte eines linearen Raumes von 5 Dimensionen dargestellt. In diesem Raume betrachte man insbesondere das Gebilde, welches den Formen entspricht, die sich auf ein volles Quadrat (xu yv zw) 2 reduzieren. Dieses Gebilde ist eine rationale zweistufige quadratische Mannigfaltigkeit, da die Koordinaten eines Punktes des Gebildes den Quadraten und Produkten der drei Veränderlichen x, y, z proportional sind. Der einzelne Punkt ist durch die Verhältnisse x : y : z festgelegt und das Gebilde vertritt die Rolle des Kegelschnittes K in der Theorie der binären Formen. Auf dem Gebilde hat man nun weiter diejenigen Punkte x : y : z ins Auge zu fassen, für welche x, y, z ganze Zahlen (ohne einen allen gemeinsamen Teiler) sind. Drei derartige Punkte x1 , y1 , z1 ; X 2 , y 2 , z2 ; x3 , y 3 , z3 , bestimmen eine Ebene (einen linearen Raum von zwm Dimensionen), welche eine "Elementarebene" heissen möge,

+

X1

Y1

Z1

wenn die Determinante x2 y2 z2 gleich Xa

Ya

Za

+

±1

ist.

Auf das Studium der Gesamtheit der Elementarebenen, die das Analogon der Elementarsehnen bilden, lässt sich dann die Theorie der ternären quadratischen Formen gründen, wie der Verfasser an einem anderen Orte zu zeigen gedenkt. Zürich, den 28. Januar 1894.

LVII.

Über die Theorie der Ideale. (Nachrichten von der k. Gesellschaft der Wissenschaften zu Göttingen, Mathematisch-physikalische Klasse, 1894, S. 291-298.)

Die Dedekind-Kronecker'sche Idealtheorie lässt sich mit Hilfe eines leicht zu beweisenden algebraischen Satzes wesentlich vereinfachen. Ich teile diesen Satz im folgenden unter Nr. I mit und gebe dann, daran anknüpfend, in kurzen Zügen die Grundlagen der Idealtheorie. Der Einfachheit halber beschränke ich meine Entwicklungen auf algebraische Zahlen, bemerke jedoch, dass sich dieselben leicht auch auf algebraische Funktionen ausdehnen lassen.

I. Der erwähnte algebraische Satz lautet: Wenn die Koeffizienten (Xo, • . . (X" ßo, . . . ßs der Funktionen

q;(x) "P(x)

= =

(XoXr + (Xlxr-l ßox" + ßlx•-l

+ ... +(X" + · · · + ß.

ganze algebraische Zahlen sind, wenn ferner die ganze algebraische Zahl w jeden der Koeffizienten y 0 , ••• Yr+s des Produktes

+ y1 xr+•-l + ··· + Yr+s (r + 1) (s + 1) Zahlen

f(x) = q;(x) 1p(x) = y 0 xr+• teilt, so ist auch jede der

(Xißk (i=0,1, ... r;k=0,1, ... s) durch w teilbar. Beim Beweise setze ich, wie das offenbar gestattet ist, (Xo und ßo von Null verschieden voraus. Es ist dann auch y 0 = (Xoßo von Null verschieden. Zur Abkürzung bezeichne ich ferner die Zahlen (Xoßt> (Xoß 2 , ••• (Xoßs der Reihe nach mit ~ 1 , ~ 2 , ••• ~. und mit ~ irgendeine dieser s Zahlen. Da nun

192

Zahlentheorie.

ein Faktor von f(x) ist, so stellt sich

± l_ Yo

als elementare symmetrische

Funktion von s Wurzeln der Gleichung f(x) = 0 dar. Daher genügt ~ emer Gleichung der Gestalt: Yo

(:Jm + q;l (:Jm-1+ q;2(:Jm-2+ ... + = O, Koeffizienten q;1, q; 2,... ganze ganzzahlige Funktionen lsten, (/Jm

deren

(/Jm

Grades von !!..., !!_,

2ten, ••• mten

y~

ergibt für

Yo

Yo

• • • Yr+s Yo

sind. Die Multiplikation mit

selber eine Gleichung der Gestalt

~

~m

+ "Pt~m-1 + 1f2 ~m-2 +

... +"Pm= 0,

deren Koeffizienten "Pt, 1p2, ... "Pm homogene ganze ganzzahlige Funktionen pten, 2ten, ••. mten Grades von y 0 , y 1 , . . . Yr+s sind. Diese Koeffizienten sind daher ganze algebraische Zahlen, die der Reihe nach durch w, w 2,

•••

i.w

wm teilbar sind. Folglich genügt

einer Gleichung

mit ganzzahligen Koeffizienten, nämlich der Gleichung

1 (~)m-1 - +-. -w +---.2 (~)m-2 -w + ... + wm = w

( w~)m Folglich ist

i.w

1p

1p

1p ~

w2

0.

eine ganze algebraische Zahl.

Nachdem nunmehr gezeigt ist, dass die Zahlen rxoßo, rxoßt, rxoß2,. · · rxoßs,

sämtlich durch w teilbar sind, folgt, dass das Produkt der Funktion q;(x)- rx0 xr

=

rx1 xr-l

+ ·· · + rxr

m die Funktion 1p(x) lauter durch w teilbare Koeffizienten besitzt. Hieraus schliesst man, dass rxtßo, rxtßt, rx1ß2,. · · rxtßs

sämtlich durch w teilbar sind usw. 1). I I.

Indem ich zu der Theorie der Ideale in einem algebraischen Zahlenkörper übergehe, stelle ich zunächst die notwendigen Definitionen zu1 ) Nachdem ich die vorliegende Arbeit bereits abgeschlossen hatte, fand ich in den Mitteilungen der Deutschen mathematischen Gesellschaft in Prag ( 1892, S. 1- 11) eine Abhandlung von Herrn R. Dedekind "Über einen arithmetischen Satz von Gauss" [Ges. Werke, Bd. li, S. 28-39], in welcher der Verfasser einen Satz beweist, der sich im wesentlichen mit dem obigen Satze deckt.

Über die Theorie der Ideale.

193

sammen und knüpfe an dieselben einige Bemerkungen. Sind IX0, IX1, ••• 1Xr ganze Zahlen des Körpers, so soll das Zeichen das System der Zahlen bedeuten, die in der Form 17o7.o

+ 1717.1 + ·•· + 17r1Xr

darstellbar sind, unter 170 , 171, .•• 17r beliebige ganze Zahlen des Körpers verstanden 1). Definition 1. Ein jedes derartige System heisst ein "Ideal"2). Definition 2. Wenn a und b Ideale bezeichnen, so bedeutet die Gleichung a = b, dass das Ideal a genau dieselben Zahlen umfasst, wie das Ideal b. Es leuchtet unmittelbar ein, dass das Ideal (1X 0 , IX1, ••• 1Xr) sich nicht ändert, wenn den Zahlen 7. 0 , IX1, ••• 1Xr eine in dem Ideale enthaltene Zahl hinzugesetzt wird. Es ändert sich offenbar auch nicht, wenn von zwei einander gleichen der Zahlen IX0 , IX1, ••• IXr die eine unterdrückt wird. Definition 3. Das Ideal (1X), welches aus allen durch IX teilbaren Zahlen des Körpers besteht, heisst ein "Hauptideal". Definition 4. Unter dem Produkte ab zweier Ideale

a = (1Xo, IX1, • • • 1Xr), b = (ßo, ßv · · · ß.). versteht man das Ideal (1Xoßo•• .. 'Xoßs, IX1ßo, .. • 1X1ß.,. • • 1Xrßo,. • • 1Xrßs)•

Das letztere besteht offenbar aus allen Zahlen, die in der Form a< 1>p+ IX< 2>p< 2> + ... + IX ••• cxr) = (cx0 , cx1 , ••• cxn a) nicht, wenn jede der Zahlen cx0 , cx1 , ••• cx,. durch eine ihr modulo a kongruente ersetzt wird. Hieraus schliesst man sofort: Eine positive ganze rationale Zahl a gehört nur einer endlichen Anzahl von Idealen an. cx und

III. An die Spitze der Theorie der Ideale stelle ich nun den Satz: Jedes Ideal a lässt sich durch Multiplikation mit einem geeignet gewählten Ideal b zu einem Hauptideale machen. Es sei a = (cx 0 , cx1 , ••• cxr)· Man bilde dann die Funktion

und bezeichne mit

das Produkt der zu ??(x) konjugierten Funktionen, so dass f(x)

= ??(X)tp(x)

= y 0 xr+s

+ · · · + Yr+s

die Norm von ??(x) ist. Die Koeffizienten y 0 , ••• Yr+s von f(x) sind gewöhnliche rationale ganze Zahlen, die Koeffizienten ß0 , ••• ß. von tp(x) sind ganze Zahlen des Körpers. Bezeichnet nun b das Ideal (ß0 , ß1 , ••• ß.), so ist leicht zu zeigen, dass ab das Hauptideal (a) ist, wo a den grössten gemeinsamen Teiler der Zahlen y 0 , ••• Yr+s bedeutet. In der Tat ist nach dem Satze von Nr. I jede Zahl des Ideales ab durch a teilbar. Da ferner die Zahl a darstellbar ist in der Form

wo t0 , tu ••. tr+s ganze rationale Zahlen bezeichnen, so ist jede durch a teilbare Zahl des Körpers auch eine Zahl des Ideales ab. Dieses umfasst also alle und nur die durch a teilbaren Zahlen, ist also nichts anderes wie das Hauptideal (a).

Über die Theorie der Ideale.

195

IV. Es bietet nun keine Schwierigkeit mehr, die Gesetze der Teilbarkeit im Gebiete der Ideale festzustellen. Sie sind in den folgenden Sätzen enthalten: 1. Aus der Gleichung a a 1 = a a 2 folgt notwendig a1 = a 2 • Man bestimme das Ideal b wie in Nr. III. Dann ist baa 1 = baa 2 oder (a) a1 = (a) a 2 • Aus der letzteren Gleichung schliesst man leicht, dass a 1 und a 2 die nämlichen Zahlen umfassen, d. h. a 1 = a 2 • 2. Für die Teilbarkeit des Ideales c durch das Ideal a ist notwendig und hinreichend, dass alle Zahlen von c auch dem Ideale a angehören. Ist c durch a teilbar, also c = aa 1 , so gehört offenbar jede Zahl von c auch dem Ideale a an. Umgekehrt: Gehören die Zahlen von c dem Ideale a an, so gehören die Zahlen von cb dem Hauptideale ab= (a) an. Folglich ist cb = (a)au wo a 1 dasjenige Ideal ist, welches aus allen durch a dividierten Zahlen von c b besteht. Die Gleichung cb = (a)a 1 = aa1 b zieht aber nach 1. c = aa 1 nach sich. 3. Aus aa 1 = (1) folgt a = a 1 = (1). Denn nach 2. ist das Hauptideal (1) nur durch sich selbst teilbar. 4. Jedes Ideal a hat nur eine endliche Zahl von Teilern. Sei wie oben ab = (a), so gehört die positive ganze rationale Zahl a jedem Ideale an, das in a aufgeht. Es gibt aber (nach Nr. II) nur eine endliche Anzahl von Idealen, denen a angehört. 5. Ist a = a 1 a 2 und a 2 nicht das Hauptideal (1), so hat das Ideal a1 eine geringere Anzahl von Teilern wie das Ideal a. Denn sind b1 , b2 , ••• bk die Teiler von a 1 , so hat das Ideal a sicher die Teiler Die letzten k Teiler sind untereinander verschieden und .müssten also, falls a nicht mehr Teiler als a 1 hätte, abgesehen von der Reihenfolge mit den ersten k Teilern übereinstimmen. Folglich wäre b1 a 2 • b2 a 2 ••• bk a 2 = b1 b2 ••• bk, folglich a~ = 1 , folglich a 2 = 1, entgegen der Voraussetzung. 6. Wenn das Primideal p in dem Produkte a1 a 2 aufgeht, so geht p entweder in , IX~1 >, ••• bezüglich 1Xl2>, IX~2 >, ••• ganze Zahlen eines algebraischen Zahlkörpers sind. Ferner seien ~X 1 , ~X 2 , ••• die Koeffizienten des Produktes T = r 1 T 2 • Dann gilt der Satz: Das Produkt aus den Idealen

a 1 = (al1>, a~1 >, ••• ) und a 2 = (ai2>, af>, ... ) ist gleich dem Ideale a

In der Tat, sei

1p

=

(al, a2, ... ).

das Produkt der zu T konjugierten Funktionen, 1p. Dann hat man

ß1 , ß2 ,. • • die Koeffizienten von T"P

= T1 fP2"P = ,

wo die Norm von T ist. Wenn nun a den grössten gemeinsamen Teiler der Koeffizienten von , die gewöhnliche rationale ganze Zahlen sind, bezeichnet, so schliesst man aus den soeben bewiesenen Sätzen sofort, dass ab= (a) und a1 a 2 b = (a) ist, wo b das Ideal (ß1 , ß2 , ••• ) bedeutet. Aus ab= a 1 a 2 b folgt aber a = a1 a 2 , was zu beweisen war. Auf Grund des letzten Satzes ist es leicht, die Sätze Kroneckers. über Formen mit ganzzahlig algebraischen Koeffizienten zu beweisen Zürich, den 27. September 1894.

LVIII.

Über einen Fundamentalsatz der arithmetischen Theorie der algebraischen Grössen. (Nachrichten von der k. Gesellschaft der Wissenschaften zu Göttingen, Mathematisch-physikalische Klasse, 1895, S. 230-240.)

In meiner in den Göttinger Nachrichten (1894, S. 291-·298) erschienenen Note "Über die Theorie der Ideale" 1) [diese Werke, Bd. II, S. 191-197] habe ich eine Begründung der Idealtheorie gegeben, die sich auf einen algebraischen Satz stützt, der wohl als ein Fundamentalsatz der arithmetischen Theorie der algebraischen Grössen bezeichnet werden darf. Etwas allgemeiner, als es in der erwähnten Note geschehen ist, lässt sich dieser Satz folgendermassen aussprechen: Satz I. Bedeuten fP und 1p ganze rationale Funktionen einer Veränderlichen und ist f = fP • 1p, so genügt das Produkt mts i·rgendeinem Koeffizienten von fP in irgendeinen Koeffizienten von 1p einer algebraischen Gleichung, in welcher der Koeffizient der höchsten Potenz der Unbekannten gleich 1 ist und die übrigen Koeffizienten ganze ganzzahlige Funletionen der Koeffizienten von f sind. Nach Abschluss meiner Note kam mir die in den Mitteilungen der Deutschen mathematischen Gesellschaft in Prag (1892, S. 1-11) veröffentlichte Abhandlung des Herrn Dedekind, "Über einen arithmetischen Satz von Gauss" [Ges. Werke, Bd. II, S. 28-39] zu Gesicht, in welcher der Verfasser den Satz I beweist. Dementsprechend glaubte ich, diesen Satz Herrn Dedekind zuschreiben zu müssen. Indessen habe ich inzwischen gefunden, dass Kronecker bereits 1883 den Satz I mit vollständigem Beweis in den Mitteilungen aus den Sitzungsberichten der königlich preussischen Akademie der Wissenschaften zu Berlin veröffentlicht hat2). Aus den einleitenden Worten 1 ) Auf die Kritik,. welche Herr Dedekind an meiner Arbeit in seiner Abhandlung "Über die Begründung der Idealtheorie", Göttinger Nachrichten, 1895, S. 106-113 [Ges. Werke, :Sd. li, S. 50-58], geübt hat, gehe ich nicht ein, in der Meinung, dass meine Arbeit keine Verteidigung verdient, wenn sie nicht für sich selbst spricht. 2 ) Zur Theorie der Formen höherer Stufen, Berliner Sitzungsber., 1883, S. 957-960 [Werke, Bd. li, S. 417--424]. Vgl. auch Molk: Sur une notion qui comprend celle de la divisibilite et sur la theorie generale de l'elimination, Acta Mathematica, Bd. 6 1-166. (1885),

s.

Ein Fundamentalsatz der arithmetischen Theorie der algebraischen Grössen.

199

dieser Veröffentlichung geht auch deutlich hervor, dass Kronecker die Bedeutung des Satzes für die Grundlegung seiner "arithmetischen Theorie der algebraischen Grössen" (Festschrift zu Herrn E. E. Kummers Doktor-Jubiläum, Berlin 1892, abgedruckt in Crelles Journal, Bd. 92, 1882, S. 1-122 [Werke, Bd. II, S. 237-387]) vollkommen erkannt hatte. Insbesondere dürfte es Kronecker wohl kaum entgangen sein, dass der Satz des § 14 seiner Festschrift unmittelbar aus dem Satze I hervorgeht. In Rücksicht auf eine Stelle in Herrn Dedekinds unter dem Texte erwähnten Abhandlung, möchte ich aber bei dieser Gelegenheit hervorheben, dass sich der von Kronecker in § 14 seiner Festschrift skizzierte Beweis sehr leicht vervollständigen lässt. Die von Kronecker mit Q(x, x', x", ... ) bezeichnete Form hat die Gestalt

Q=

IX

u+

IX 1

U'

+

IX 11

U"

+ ... '

wo IX, IX', IX",. • • algebraische Grössen des Bereiches ( das System der Quadrate und der Produkte von je zwei der Koeffizienten a, usf. Endlich will ich mit Herrn Mertens 1 ) jede ganze ganzzahlige homogene lineare Funktion von irgendwelchen Elementen kurz als eine "Vielfachsumme" dieser Elemente bezeichnen. Dann besagt der in Rede stehende Satz, dass erstens jedes Produkt a~x) bzw. V'~x), so folgt aus q;(x) =V'(x) (mod. m) nach Satz 4)

=q;(x)q; (x) =V'(x)q; (x) (mod. m) und hieraus nach Satz 2) q; (x) =V' (x) (mod. m). D. h. 1

1

1

1

1

Klassenanzahl binärer quadratischer Formen von negativer Determinante.

6) "Ist q;(x)

=

='lf'(x)

215

(mod. m) und q;(x) relativ prim zu m, so ist

auch q;~x) 1p~x) (mod. m)." Es seien jetzt q;(x), 'lf'(x), q;1(x), 'lf'1(x) irgend vier Potenzreihen mit rationalen Koeffizienten und { q;(x) IPt (x)

(9)

= 'lf'(X)

(mod. m) 'lf't (x) (mod. m),

=

dann gelten für die Kombination dieser Kongruenzen durch Addition, Subtraktion, Multiplikation und Division folgende Gesetze: 7) "Aus den Kongruenzen (9) darf man folgern a) die Kongruenzen q;(x) ± q;1 (x) 'lf'(x) ± 'lf'1 (x) (mod. m) ohne jede Einschränkung; b) die Kongruenz q;(x)q;1 (x) 'lf'(X)'If'1 (x) (mod. m), wenn q;(x) und q;1 (x) endlich sind modulo m; c) die Kongruenz : 1(. Es seien jetzt A. und Jt zwei ganze Zahlen des Körpers K. Wir bilden die absoluten Beträge der beiden Normen N ().) und N (Jt), welche Zahlen der Reihe 0, 1, 2, 3, ... sind. 1 ) Die Terminologie rührt von R. Dedekind her. (Vgl. Dirichlet, Vorlesungen über Zahlentheorie, 4. Auflage, Braunschweig 1894, S. 139.) 2 ) [Diese Werke, Bd. II, S. 241.] 3 ) Mathem. Annalen, Bd. 42 (1893), S. 33.

Die unimodularen Substitutionen in einem algebraischen Zahlenkörper.

255

Den kleineren, oder wenn beide gleich sein sollten, den gemeinsamen Wert dieser beiden absoluten Beträge wollen wir als "Rang· zahl" des Paares I., p, bezeichnen. Ist die Rangzahl des Paares }, , p, gleich Null, so ist eine der beiden Zahlen I., p, gleich Null. Dies vorausgeschickt, werden wir nun ein gewisses System von Substitutionen aufstellen von der Beschaffenheit, dass jedes Paar .?., p, von nicht verschwindender Rangzahl durch eine geeignete Substitution des Systemes in ein Paar von kleinerer Rangzahl übergeht. Zu dem Ende möge die Zahl m wie in N r. I der vorhergehenden Abhandlung1 ) bestimmt werden, so dass die Norm von r x- 'YJ absolut genommen kleiner als 1 ist, wenn x eine beliebige Zahl des Körpers, r eine geeignet gewählte Zahl der Reihe 1, 2, ... m und 'YJ eine geeignet gewählte ganze Zahl des Körpers bezeichnet. Die ganze Zahl - 'YJ ist nach dem Modul r einer bestimmten Zahl e aus einem vollständigen Restsystem (mod. r) kongruent, so dass

rx- 'YJ = r(x + q) + e gesetzt werden kann, unter q eine ganze Zahl des Körpers verstanden. Wir bilden nun für jeden Wert von r = 1, 2, ... m ein vollständiges Restsystem (mod. r) und mit jedem Individuum e des zu r gehörigen Restsystemes die Substitution 1: =

(r, e) s,

(1

'

wo s, a bis auf die Bedingung, dass ra-es nicht verschwinden soll, willkürlich zu wählende ganze Zahlen des Körpers bezeichnen. (Am einfachsten nehmen wir durchgehends s = 0, a = 1.) Die Anzahl der Substitutionen E beträgt M

= 1n + 2n + · · · + mn,

da jedem Wert von r genau rn Werte e entsprechen2). Ist nun I., p, ein Paar, für welches

JN(.I.)j ;;;;;jN(p,)j >O ist, so geht dasselbe durch die Substitution ( r, s, m das Paar

(.1.1, !l1) = (r(.l. über. Da nun 1)

e) (1,0,1q)

(1

+ p,q) + ep,, s(.l. + p,q) + ap,)

[Diese Werke, Bd. II, S. 237-238.]

2) [[n ist der Grad des Körpers J(, wie in der vorangehenden Abhandlung, diese Werke, Bd. li, S. 236-243. - Anm. von M. G.]]

256

Zahlentheorie.

N(;) =

N(r(~ + q) + e)

e)

ist, so kann man durch geeignete Wahl der Substitution E = (r' und der ganzen Zahl q erreichen, dass N ( ~) < 1 und also s' u

I

I

I N(I.J I < I N(,u) I wird. Wenn für das Paar 1., ,u nicht die Ungleichungen I N (I.) I ; ; ; I N (,u) I > 0 bestehen, so wird man, falls die Rangzahl des Paares nicht verschwindet, I N (,u) I > I N (I.) I > 0 haben. Es geht dann das Paar 1., ,u durch die Substitution

(~: ~1 ) in das Paar (-,u, 1.)

über, auf welches die vorstehende Betrachtung Anwendung findet. Berücksichtigt man noch, dass jede Substitution 2 n Substitutionen

±wi)

( 1, 0, 1

(~:

i)

aus den

(i=1,2, ... n)

zusammengesetzt werden kann, wo w1 , w2 , ••• wn eine Basis der ganzen Zahlen des Körpers K bilden, so erkennt man die Richtigkeit des folgenden Satzes : Es bezeichne S(l) generell eine Substitution derjenigen Gruppe G(l), welche durch die 2 n + 1 unimodularen Substitutionen

(0, -1) (1, wi) (1 ,-wi) 1' 0

'

0, 1 '

0, 1

(i = 1, 2, ... n)

erzeugt wird. Ferner bezeichne E generell eine der M Substitutionen

e).

( r, s' (]

Ist dann I., ,u ein Zahlenpaar von nicht verschwindender Rangzahl, so lassen sich E und s so bestimmen, dass die Norm der ersten Zahl 1.1 des Zahlenpaares absolut genommen kleiner ist als die Rangzahl des Paares ;. , ,u. Die Rangzahl des Paares (1.1 , ,u1) ist sicher kleiner als die Rangzahl des Paares (1., ,u). Denn die erstere ist entweder IN(/.1 ) I oder IN (,uJ 1, und zwar IN (,u1) I nur dann, wenn IN (,u1) I ~ IN (1.1) I·

Die unimodularen Substitutionen in einem algebraischen Zahlenkörper.

257

§ 5.

Die Gruppe G. Aus den h Idealklassen des Körpers K entnehmen wir jetzt je ein Ideal von möglichst kleiner Norm - etwa das Ideal (oc;, ß;) aus der iten Klasse - und bilden die h Substitutionen (i = 1, 2, ... h) wo die y;, ll; ganze Zahlen des Körpers K bezeichnen, die bis auf die Bedingung, dass oc; ll;- ß;y; von Null verschieden sein soll, willkürlich angenommen werden können. Der Hauptklasse der Ideale entsprechend wählen wir

Wir wollen nun zunächst einen Hilfssatz beweisen, der sich auf die h Substitutionen T 1 , T 2 , ••• Tk bezieht. Es sei

L (a,c, db) =

irgendeine Substitution von nicht verschwindender Determinante, deren Koeffizienten a, b, c, d ganze Zahlen des Körpers K sind. Das Ideal (a, b) ist dann einem der Ideale (oc1 , ß1) , • . • ( oc,., ß,.) - etwa dem Ideale (oc;, ß;) - äquivalent, so dass zwei ganze von Null verschiedene Zahlen cp, 'P des Körpers existieren, welche der Gleichung

genügen. Nehmen wir beiderseits die Normen, so ergibt sich, da (oc;, ß;) ein Ideal möglichst kleiner Norm aus der betreffenden Klasse ist,

Ferner ist nach dem Satze des § 1 cpa = 'P(Aoc; cpb = 'P(Boc; WO

+ Oß;), + Dß;),

W=(A,B) C,D

eine unimodulare Substitution im Körper K darstellt. 17

Zahlentheorie.

258

Sei jetzt A., p, ein beliebiges Zahlenpaar. Dann hat man oder wenn man setzt. Da nun

L(A., p) = (A.t, Pt), TiW(A., p) = (A.2, /l2)

ist, so gilt also der folgende Hilfssatz: Jeder beliebigen Substitution L von nicht verschwindender Determinante im Körper K lässt sich eine der Substitutionen T 1 , T 2 , • • • T,. - etwa Ti - und eine unimodulare Substitution W zuordnen, die mit L in folgender Beziehung stehen. Geht ein ganz beliebig gewähltes Zahlenpaar A., fl durch die Substitution L in das Paar (A.1 , p 1 ), durch die Substitution Ti W in das Paar A2 , p 2 über, so ist stets I N (A. 2) I : :;:; I N (A.1) I· Wir wenden diesen Hilfssatz auf jede der M Substitutionen

(!)

J: = (r' an. Die M unimodularen Substitutionen W, die den Subs,a stitutionen J: entsprechen, und ihre inversen W - l wollen wir zusammen mit den 2n + 1 erzeugenden Substitutionen der Gruppe G< 1> in irgendeiner Reihenfolge mit bezeichnen. Aus dem Satze des vorigen Paragraphen geht dann, in Rücksicht auf den Hilfssatz, unmittelbar der folgende neue Satz hervor: Es bezeichne s generell eine Substitution derjenigen Gruppe G, welche durch die unimodularen Substitutionen

erzeugt wird. Ferner bezeichne T generell eine der h den einzelnen Idealklassen entsprechenden Substitutionen

Ist dann A., fl ein Zahlenpaar von nicht verschwindender Rangzahl, so lassen sich T und S< 2> so bestimmen, dass die Norm der ersten Zahl A.1 des Zahlenpaares

Die unimodularen Substitutionen in einem algebraischen Zahlenkörper.

259

TS< 2>(Ä, p) = (Äl, PI) absolut genommen kleiner ist als die Rangzahl des Paares Ä, p. Die Rangzahl des Paares Ä.1 , p 1 ist sicher kleiner als die Rangzahl des Paares Ä, p.

§ 6.

Die Gruppe a. Es sei jetzt T irgendeine der Substitutionen T1 , T 2 , ••• Tk. Dieser Substitution T entspricht eine Gruppe (U) von unimodularen Substitutionen U, die durch die Forderung bestimmt sind, dass T- 1 U T eine ganzzahlige Substitution sein soll, oder, was dasselbe ist, dass die Gleichung UT= TV durch eine unimodulare ganzzahlige Substitution V zu befriedigen sein soll. Nach § 3 ist die Gruppe (U) eine Kongruenz-Untergruppe der Gruppe G und hat also nach § 2 in bezug auf G einen endlichen Index t, so dass die Gesamtgruppe G aus den Substitutionen I1U, I2U, ... ItU

besteht, wo U alle Substitutionen der Gruppe (U) durchlaufen muss und .E1 , .E2 , ••• It geeignet gewählte Substitutionen bezeichnen. Für die Substitution .E1 dürfen und wollen wir die identische Substitution

(~ ~)

wählen.

Wir bilden nun die k · t Substitutionen (i= 1, 2, ... k;j=1,2, ... t) wo 8 1 , 8 2 , ••• Sk, wie im vorigen Paragraphen, die erzeugenden Substitutionen der Gruppe G< 2> bezeichnen. Da S;.E; als ganzzahlige unimodulare Substitution in die Gestalt Ir U gebracht werden kann, so hat man Si .Ei T = Ir U T = Ir TVi,i' wo Vi,; eine unimodulare ganzzahlige Substitution bezeichnet. Wir bilden ferner die h · t Substitutionen

(i= 1,2, ... h; j = 1,2, ... t) und bezeichnen mit wi,j•

(i=1,2, ... h;f=1,2, ... t)

Zahlentheorie.

260

die ihnen nach dem Hilfssatz des vorigen Paragraphen bzw. zuzuordnenden unimodularen Substitutionen. Die auf diese Weise den h Substitutionen T = T 1 , T 2 , ••• Th entsprechenden Substitutionen Vi,i und Wi,i und ihre inversen Vi;} und Wf:} wollen wir in einer beliebigen Reihenfolge genommen mit VI, V2, ... VT> Wl, W2, ... Ws bzw. bezeichnen. Endlich möge mit G diejenige Gruppe bezeichnet werden, welche durch die Substitutionen erzeugt wird. Dann gilt zunächst der folgende Satz: Es seien T und T' irgend zwei Substitutionen der Reihe T 1 , T 2 , ••• T h; ferner s< 2> eine Substitution der Gruppe G< 2> und s eine solche der Gruppe G. Dann gibt es eine Substitution T" aus der Reihe T 1 , T 2, ... Th und eine Substitution Si3> der Gruppe G von folgender Eigenschaft: Bezeichnet A, p, ein beliebiges Zahlenpaar und ist T' S< 2> TS< 3>(A, p,) T" Si3>(A, p,)

= (Al, #1), = (A2, #2),

so ist der absolute Betrag der Norm von A2 nicht grösser als der absolute Betrag der Norm von A1 . Zum Beweise bemerken wir, dass s = Siz ... S;, Si,

ist, da die Gruppe G von S1 ,S2 , ••• Sk erzeugt wird. Nun hat man aber S.h T = S.1.1 E 1 T = E.11 TVk S.ta S. T = S. E.1t TVk = E.h. TVk Vk J

t1

1.2

1

2

1

also T' EilT Vkl .. . Vk, Vkß (A, p,) = ().1' p,l).

Wenn nun W die der Substitution T' E11 T zugeordnete Substitution der Reihe W1 , W2 , ••• Ws bezeichnet und T" eine bestimmte Substitution der Reihe T 1 , T 2 , ••• Th, so ist nach dem Hilfssatz des vorigen Paragraphen falls

Die unimodularen Substitutionen in einem algebraischen Zahlenkörper.

261

gesetzt wird. Hiermit ist unser Satz bewiesen, da

Wv kz · . . V k, V k, 8 = s 1 eine Substitution der Gruppe G ist. Hieran knüpfen wir nun weiter den folgenden Satz: Ist (A, p,) ein beliebig gegebenes Zahlenpaar, so lassen sich T und 3 ß< > so bestimmen, dass die Rangzahl des Paares TS(A, p,) = (Al, P.1) verschwindet, so dass also von den beiden Zahlen A1 , f-ll eine gleich Null ist. Wir bilden, um diesen Satz zu beweisen, die sämtlichen Zahlenpaare T S(A, f-t),

welche entstehen, wenn s alle Substitutionen der Gruppe G< 3> und T die Substitutionen T 1 , T 2 , ••• T 11 durchläuft. Unter diesen Zahlen· paaren wählen wir ein solches aus, welches eine möglichst kleine Rangzahl R besitzt, so dass die Rangzahl jedes anderen der betrachteten Zahlenpaare ~ R ist. Wir zeigen nun, dass notwendig R = 0 ist. Angenommen es sei R > 0, so lassen sich nach § 5 die Substitutionen T' und 8 so bestimmen, dass die Norm der ersten Zahl A2 des Paares T' s T s (A' f-l) = (A2' f-l2)

absolut genommen kleiner als R ist. Wie oben gezeigt, können wu also auch T" und Si3' so bestimmen, dass die Norm der ersten Zahl A3 des Paares T" Si3l(A, /-l) = (Aa, I-la) und folglich der Rang dieses Paares (A 3 , p, 3) kleiner als R ist. Dies widerstreitet aber dem Umstande, dass unter allen Paaren TS< 3>(A, f-t) das Paar (A 1 , p, 1) die kleinste Rangzahl besitzt. Folglich ist die Annahme, R sei grösser als Null, unzulässig; folglich ist R = 0. Wir zeigen jetzt, dass sich zu einem gegebenen Zahlenpaare A, f-l die Substitutionen T und s so bestimmen lassen, dass die erste Zahl A1 des Paares gleich Null ist. Nach dem, was soeben bewiesen wurde, können jedenfalls T und S so gewählt werden, dass die Rangzahl des Paares

T s (A' 1-l)

=

(Au I-li)

262

Zahlentheorie.

gleich Null ist, dass also eine der beiden Zahlen A1 , p 1 verschwindet. Wenn nun A1 von Null verschieden sein sollte, so ist p 1 = 0, und also die erste Zahl des Paares

G·. ~1 ) T8< >(A, fl) 3

gleich Null. Die Substitution

=

G: ~1 ),

(-,ul, Al)

welche der Gruppe G< 2> an-

gehört, bezeichnen wir einen Augenblick mit ß, die Substitution

(~: ~) =

T1 mit T'. Dann ist aber T' ß< 2> T s (A, p)

= (-p1, A1) = (0, A1).

Nach dem ersten Satze dieses Paragraphen lassen sich nun T" und wählen, dass T" Sl3>(A, p) = (A2, fl2)

Si3> so

wird, wo I N (A2) I ~ I N (- p 1 ) I = 0 und also A2 = 0 wird. Sobald also die erste Zahl des Paares Tß(A, p) nicht Null ist, wird dies doch für das Paar T" ßi3 >(A, p) der Fall sein, woraus die Richtigkeit der oben aufgestellten Behauptung erhellt.

§ 7.

Die Gruppe G. Die Zahlen A. und fl seien relative Primzahlen. Ist dann

Tß(S)(A, fl) =(Al, fll) = (0, fll) und setzen w1r ß(3)

(A' p)

=

(A.'' p')

Pt)

T- T - (oc;, ; - Y;, lJ; '

so folgt ,1,1

=

ot;A.'

i: .

+ p,p' = 0,

oder ;: = Da aber A.', p', ebenso wie A., fl, relative Primzahlen sind, so muss das Ideal (oc;, p,) ein Hauptideal sein. Folglich ist

T= T1 =

(~: ~)·

Es wird also

s(A, p)

=

(0, fll)

Die unimodularen Substitutionen in einem algebraischen Zahlenkörper.

263

und

(~: ~1 )s(A, p,) =

(-ttl, O),

wobei - p, 1 als gemeinsamer Teiler von A und p, notwendig eine Einheit e ist. Die Substitution

(O : _1) s

gehört ebenfalls der Gruppe G an 1 0 und es kann daher die letzte Gleichung, wenn wir mit dem Buchstaben 8 generell die Substitutionen der Gruppe G< 3> andeuten, auch so geschrieben werden: S(3)(A, p,) = (e, 0), In Worten heisst dieses: Sind A und p, relative Primzahlen, so gibt es eme Substitution s der Gruppe G< 3> von der Art, dass

s< 3>(A, p,)

=

(e, 0)

ist, unter e eine Einheit verstanden. Wir betrachten jetzt eine beliebige ganzzahlige unimodulare Substitution

s = (:·, ;) im Körper K. Dem letzten Satze zufolge können wir die Substitution

s -- ("'y(3), , p) Ö(3) der Gruppe G< 3> so bestimmen, dass

ss =

(e,0,-~) = (1,0, we) (e,0,-~), 1 e

we)

und folglich, da ( 1 ' 0, 1

e

der Gruppe G angehört, e, s = s ( 0,

0)!

wird, wo s wieder eine (von der in der vorletzten Gleichung so bezeichneten Substitution im allgemeinen verschiedene) Substitution der Gruppe G< 3> bezeichnet. Nach der Zusammensetzungsformel

e, -~) (e',0--~) = (ee',0 -~) (0 ,

S

'

/; 1

'

El:- 1

264

Zahlentheorie.

bilden die Substitutionen der Gestalt

für sich eme Gruppe, die sich aus den Substitutionen

El=

( Bl, 0, E~0) 'E2= (B0,2, 0) El2

, •••

,Ee=

0, E~0)

(Be'

erzeugen lässt, wo B1 , B2 , ••• Be ein System von Einheiten bilden, durch welche sich jede Einheit in der Gestalt

darstellen lässt, unter p, 1 , p, 2 , ••• fle nicht negative rationale ganze Zahlen verstanden. Aus alledem geht nun der Satz hervor, der das Ziel dieser Betrachtungen bildete: Die Gruppe G der ganzzahligen unimodularen Substitutionen in dem beliebigen algebraischen Zahlenkörper K besitzt eine endliche Basis. Alle diese Substitutionen lassen sich nämlich aus den folgenden: S1 , S 2 ,

•••

Sk; Vu V2 ,

•••

Vr; W1 , Wv ... W.; E 1 , E 2 ,

•••

E 11

zusammensetzen.

§ 8.

Die Gruppe der Einheits-Substitutionen. Der soeben bewiesene Satz lässt sich ohne jede Schwierigkeit auf diejenigen Substitutionen ( oc,

ß)

y, (J

übertragen, deren Koeffizienten ganze Zahlen des Körpers K sind, welche der Bedingung genügen, dass die Determinante ocb- ßy eine Einheit ist. Die Gesamtheit dieser Substitutionen bildet offenbar eine Gruppe G', welche die Gruppe G als Untergruppe enthält. Ist nun r:x.b-ßy=B, eine Einheit, so hat man

Die unimodularen Substitutionen in einem algebraischen Zahlenkörper.

265

woraus hervorgeht, dass sich jede Substitution der Gruppe G' zusammensetzen lässt aus einer Substitution der Gruppe G und einer Substitution der Gestalt

(~: ~)· Die Substitutionen dieser Gestalt lassen sich ihrerseits erzeugen durch die Substitutionen

0) (e 0) (ee, 0) (s0,1' 0,1 , ... 0,1' 1,

2,

wo s1 , s2 , ••• se, wie im vorhergehenden Paragraphen, Einheiten bedeuten, aus welchen sich alle Einheiten durch Multiplikation ableiten lassen. Nehmen wir also die letzteren e Substitutionen zu den Substitutionen SI, 82, ... sk; VI, V2, ... Vr; w1, w2, ... w.; El, E2, ... EI} hinzu, so erhalten wir ein System von Substitutionen, welche die Gruppe G' erzeugen. § 9.

Unimodulare Substitutionen bei mehreren Variabeln. Wir wollen schliesslich noch zeigen, dass die ganzzahligen, ummodularen Substitutionen lXI,

IX2, · · · IXk)

~': ß:' ': .:ß:

A.l ' A.2 ' • • • J.k

im Körper K bei beliebig vielen Variabeln sich zurückführen lassen auf die oben ausführlich behandelten binären Substitutionen. Es genügt, den Fall k = 3 zu betrachten, da der Fall, wo die Zahl k der Variabeln einen beliebigen Wert besitzt, sich ganz analog behandeln lässt. Wir betrachten also die ternären unimodularen Substitutionen x' = lXIX + 1X2Y + IXaZ,l Y:=ß1x+ß2Y+ßaz, S z =y1x+r2Y+raz, deren Koeffizienten ganze Zahlen des Körpers K sind 1). Diejenigen 1 ) Ähnlich, wie bei den binären Substitutionen, wollen wir die zwischen x, y, z und x', y', z' bestehenden Gleichungen auch kurz durch (x', y', z') = S(x, y, z) andeuten und die beiden Zahlentripel x, y, z und x', y', z' äquivalent nennen.

266

Zahlentheorie.

dieser Substitutionen, die sich nur auf die ersten beiden Variabeln x, y beziehen, für die also cx3 = ß3 = y 1 = y 2 = 0, y 3 = 1 ist, wollen wir generell mit S 12 bezeichnen; ebenso sollen durch S13 bzw. S 23 diejenigen Substitutionen angedeutet werden, die nur die Variabeln x, z bzw. y, z betreffen. Die durch die ternären Substitutionen S 12 , S13 , S 23 erzeugte Gruppe möge G' heissen, während die alle ternären Substitutionen S umfassende Gruppe mit G bezeichnet werde. Jedenfalls sind alle Substitutionen von G' auch in G enthalten. Wir können aber zeigen, dass auch das Umgekehrte gilt, dass also die beiden Gruppen G' und G zusammenfallen. Zu dem Ende beweisen wir zunächst den folgenden Satz: Sind A., fl, v drei ganze Zahlen des Körpers K, so lässt sich die Substitution S' der Gruppe G' so bestimmen, dass S' (A., fl, v) = (A. 1 , fl 1 , 0) wird. Ist A. = 0, so genügt es für S' die Substitution x' = z, y' = y, z' = - x zu nehmen, da dann S'(A., fl, 11) = (v, fl, -A.) = (v, fl, 0) wird. Ist aber A. nicht gleich Null, so bestimmen wir die ganze Zahl w des Körpers K so, dass das Ideal (A., ,u, v) gleich dem Ideale (A., fl + w v) ist, was nach dem Schlussparagraphen der vorhergehenden Abhandlung1) stets möglich ist. Wir haben dann, wenn zur Abkürzung P, = fl + wv gesetzt wird,

=

V

())1

A+

())2

p,'

wo w1, w2 ganze Zahlen des Körpers K bezeichnen. Wir bilden nun ferner die folgenden Substitutionen der Gruppe G S ' X = X , y = y + wz, Z = Z;

1

I

1

S 2'

S3 I

X'

X

I

I

f

= X,

=

X,

:

y ' = y, y' = y,

Z'

Z

f

= Z-

=

Z-

w1 X ; w 2 y.

Durch s~ geht A' fl' V über in A' fl + ())V' V oder Ä' p,' V. Das letztere Zahlentripel geht durch s~ über in A' Ii' V - (j)l A und dieses Zahlentripel wird endlich durch übergeführt in A' p,' V - (j)l A - ())2 p,' also in A., P, , 0 . Setzen wir daher

s;

S'- S'3 S'2 S'1•

so ist S'(A., fl, v) = (A., P,, 0). Nunmehr ist es leicht, den folgenden Satz zu beweisen, der die Verallgemeinerung des in § 1 bewiesenen Satzes ist: Sind die beiden Ideale (A., fl, v) und (A.', fl', v') einander gleich, so sind die beiden Zahlentripel A., fl, v und A.', fl' v' einander äquivalent, und zwar gibt es eine der Gruppe G' angehörende Substitution, welche das eine Zahlentripel in das andere überführt. 1)

[Diese Werke, Bd. II, S. 242.)

Die unimodularen Substitutionen in einem algebraischen Zahlenkörper.

267

In der Tat können wir, wie soeben gezeigt wurde, die Substitutionen S~ und S~ der Gruppe G' so bestimmen, dass S~(Ä, p, v)

= (Ä1 , flu 0),

S~(Ä', p', v')

=

(Ä~, fl~, 0)

wird. Da die beiden Ideale (Ä1 , p 1) und (Ä~, p~) einander gleich sind, so gibt es nach dem Satze des § 1 eine Substitution 8 12 , welche der Bedingung genügt. Daher hat man, wenn man zur Abkürzung setzt, S'(~, p,

v)

=

(Ä', p', v').

Die Substitution S' gehört zugleich der Gruppe G' an. Es sei nunmehr

eine beliebige ternäre ganzzahlige unimodulare Substitution im Körper K. Da das Ideal (~ 1 , ß1 , y 1 ) das Hauptideal (1) ist, so ist dasselbe mit dem Ideale (1, 0, 0) identisch, und es gibt daher nach dem vorigen Satze eine Substitution S' der Gruppe G', für die S' (~ 1 , ß1 , y 1) = (1, 0, 0) wird. Dann ist aber S' S

=

(0,1, ß;,~~. ß;~~) = (1,0, ß;,0, ß;0) (1,0, ~~. 00) (1,0, 1,0, ~~) 0 . 0, y 2 , y 3

1,

0, y 2 , y 3

0, 0, 1

0, 0, 1

Von den drei Substitutionen rechter Hand ist die erste eine Substitution 8 23 , die zweite eine Substitution 8 12 , die dritte eine Substitution 8 13 • Daher lautet die vorstehende Gleichung S' S

=

S~ oder S

=

(S')- 1 8~,

wo S~ eine Substitution der Gruppe G' bezeichnet. Also: Jede ganzzahlige unimodulare ternäre Substitution im Körper K gehört der Gruppe G' an. Da die Substitutionen 8 12 , 8 13 , 8 23 , welche die Gruppe G' erzeugen, im Grunde genommen binäre Substitutionen sind, so lehrt unser Satz, dass sich die ganzzahligen unimodularen ternären Substitutionen im Körper K aus eben solchen binären zusammensetzen lassen. Ver-

268

Zahlentheorie.

binden wir diese Tatsache mit der anderen, dass die Gruppe der binären Substitutionen eine endliche Basis besitzt, so erhalten wir den weiteren Satz: Die Gruppe der ganzzahligen unimodularen ternären Substitutionen im Körper K besitzt eine endliche Basis. Wie schon oben bemerkt wurde, lassen sich in ähnlicher Weise die analogen Sätze für die ganzzahligen unimodularen Substitutionen 1m Körper K bei beliebig vielen Variabeln beweisen. Zürich, 1m September 1895.

LXII.

Über die Reduktion der binären quadratischen Formen. (Bericht des Mathematiker-Kongresses zu Chicago, 1896, S. 125-132.)

Die Methode, durch welche ich in den folgenden Zeilen die Theorie der Reduktion der quadratischen Formen mit zwei Unbestimmten begründe, beruht auf dem Prinzip, die "ausgearteten" Formen, d. h. die Formen mit verschwindender Determinante zu untersuchen und von diesen einen Rückschluss auf die "allgemeinen" Formen, d. h. die Formen mit nicht verschwindender Determinante zu machen. Dieses Prinzip erweist sich von grosser Fruchtbarkeit: es führt nicht nur in dem hier betrachteten Falle der binären Formen mit reellen Koeffizienten mit grosser Leichtigkeit zum Ziele, sondern es ist auch auf Formen von beliebig vielen Unbestimmten anwendbar, sei es, dass die Koeffizienten reell oder komplex vorausgesetzt werden. Um den Kern der Untersuchung klar hervortreten zu lassen, und zugleich eine möglichst grosse Anschaulichkeit zu erzielen, kleide ich die anzustellenden Betrachtungen in eine spezielle geometrische Form. Es bietet keine Schwierigkeit, die geometrische Darstellung allgemeiner zu halten (indem man projektive Verallgemeinerung eintreten lässt) oder auch die geometrische Darstellung durch eine rein amilytische zu ersetzen. 1. Dreieck, K der einbeschriebene gleichseitiges Es sei ABC ein Kreis, welcher die Seiten des Dreiecks in den Punkten M, N, L berührt!). Durch diese Punkte wird die Kreisperipherie in drei gleiche Bogen MN, NL, LM zerlegt, die ich die "Teilbogen" nennen will. Ich wähle nun ON M als Koordinatendreieck und L als Einheitspunkt. Dann beschreibt der Punkt (1)

x:y:z=l:A:Ä 2 1) Siehe Figur 9.

270

Zahlentheorie.

den Kreis K, wenn der Parameter A alle reellen Zahlen durchläuft. Im Anschluss an diese Tatsache werde ich weiterhin jeden Punkt von K durch den entsprechenden Wert des Parameters bezeichnen, so dass z. B. die Punkte M, N, L die Bezeichnung oo, 0, 1 bzw. erhalten. Es bedeute ferner T diejenige Drehung der Ebene um den Mittelpunkt 0 des Kreises K, bei welcher der Punkt 0 in 1, 1 in oo, oo in 0 übergeht, T 2 diejenige Drehung, bei welcher 0 in oo, oo in 1, 1 in 0 übergeht. Bezeichnen dann A1 , A2 , A3 entsprechend gelegene Punkte auf den drei Teilbogen N L, LM, MN, so geht bei der Drehung T A1 in

c

L

Fig. 9.

A2 , A2 in A3 , A3 in A1 über. Da bei der Drehung T das Doppelverhältnis von vier Punkten des Kreises sich nicht ändert, so findet man leicht, dass (2)

A2

=

1 1-Ä ' 1

Aa

1

= 1 - T1

ist. - In der Folge werden nun insbesondere die Punkte mit rationalen Parametern eine wichtige Rolle spielen. Auf diese Punkte beziehen sich die nachstehenden Sätze und Definitionen. Eine Sehne s = pq des Kreises K heisse eine Elementarsehne, wenn p = }__, q = ~ rationale 01: 'Y Zahlen sind, für welche die Gleichung oc~- ßy = ± 1 gilt. Auf Grund der Gleichungen (2) beweist man leicht, dass eine Elementarsehne durch die Drehung T (und ebenso durch die Drehung T 2) wieder in eme Elementarsehne übergeht. Von hervorragender Wichtigkeit ist aber der folgende Satz: (I) Die Endpunkte p und q einer Elementarsehne s liegen stets auf demselben Teilbogen.

Über die Reduktion der binären quadratischen Formen.

271

Ich zeige, dass die Annahme, p und q lägen auf verschiedenen Teilbogen, auf einen Widerspruch führt. Wenn man diese Annahme macht, so sind eigentlich - den drei Kombinationen der Teilbogen zu je zweien entsprechend - drei Fälle zu unterscheiden. Man darf sich indessen auf den Fall beschränken, in welchem man p auf dem Bogen MN, also die Zahl p ~ 0, und q auf dem Bogen LM, also die Zahl q ~ 1, annimmt. Denn jeder der beiden anderen Fälle lässt sich durch eine der Drehungen T und T 2 auf jenen Fall zurückführen. Ist nun p ~ 0, q ;;;; 1, so folgt 1 ~ q- p ~ oo. Die einzige Kombination p = 0, q = 1, für welche q- p = 1 wird, ist aber auszuschliessen, weil für dieselbe p und q auf demselben Teilbogen, nämlich auf dem Bogen LN, liegen. Ebenso wenig kann q- p = oo, d. h. eine der beiden Zahlen p und q gleich oo sein, weil sonst p und q beide auf dem Bogen M L oder beide auf dem Bogen MN liegen würden. Folglich liegt q- p =

± -1-

Cl(y

zwischen 1 und oo , also

± IX y

zwischen 0 und 1. Dies ist

aber widersinnig, da IX und y ganze Zahlen sind. Ich werde nun ferner ein dem Kreise K einbeschriebenes Dreieck, dessen Seiten Elementarsehnen sind, ein "Elementardreieck" nennen. Nach dieser Definition ist beispielsweise das Dreieck 01 oo ein Elementardreieck. Jede Elementarsehne .~ = pq ist Seite von zwei Elementardreiecken. Denn sei p = ./!_, q= ~ und r = i_ irgend eme dritte rationale Cl( y e

Zahl. Bestimmt man dann x und y aus den Gleichungen

C= xß

+ y()}

B =XIX+

yy '

so erkennt man, dass p, q, r dann und nur dann ein Elementardreieck bilden, wenn x = ± 1, y = ± 1 wird. Die Sehne s ist also Seite der beiden Elementardreiecke ß+(j , un d p,q,r =ß-(j p,q,r=-+ --. Cl( y 0(-y I

Da die Punkte p, q durch die Punkte r, r' harmonisch getrennt werden, so kann man das Dreieck pqr' durch eine sehr einfache Konstruktion erhalten, wenn das Dreieck pqr gezeichnet vorliegt!). Überdies geht aus derselben Tatsache hervor, dass die beiden Elementardreiecke, welche sich über einer Elementarsehne s = p q konstruieren lassen, auf verschiedenen Seiten dieser Sehne s liegen. Nach dem Satze (I) befinden sich die Ecken eines von dem Dreieck 01 oo verschiedenen Elementardreiecks notwendig auf demselben 1)

Vergleiche Fig. 10.

272

Zahlentheorie.

Teilbogen. Daher kann das Dreieck 01 oo mit keinem anderen Elementardreieck ein Stück gemein haben. Es besteht also der Satz: (II) Kein Punkt, der im lnnern des Dreiecks 01 oo liegt, liegt zugleich im lnnern eines anderen Elementardreiecks.

2. Es möge nun jeder quadratischen Form (3)

f = au 2 + 2 buv + cv 2

derjenige Punkt zugeordnet werden, dessen Koordinaten (4)

x:y:z=a:b:c

-··-····--::;::;·.c-""'•\\ \ .... \,

Fig. 10.

sind. Einer Form f entspricht dann ein Punkt im Innern, auf der Peripherie oder ausserhalb des Kreises K, je nachdem

(5) ist. Umgekehrt entsprechen jedem Punkte a: b: c unendlich viele Formen f, nämlich die Formen

(6)

t = e (au 2 + 2 buv + cv 2)

wo e jeden reellen Wert erhalten kann. Um nun die Beziehung zwischen den Punkten der Ebene und den Formen f zu einer eindeutigen zu machen, werde ich zwei Formen, deren Koeffizienten zu einander proportional sind, als nicht verschieden ansehen. Man bemerke noch, dass dem Punkte Ä. des Kreises K die Form

Über die Reduktion der binären quadratischen Formen.

273

(7) f = e (u 2 + 2 A. uv + A. 2 v2) = e (u + A.v) 2 entspricht. Ich betrachte jetzt irgend eine ganzzahlige lineare Transformation (8)

u

= t' =

r.x.u' + ßv',} , + uv, .1: (S), yu I

r.x.c5- ßy

= 1.

Durch dieselbe geht die Form (6) über in

f' = e (a'u' 2 + 2 b'u'v' + c'v' 2 ),

(9) wo

a' = ar.x. 2 + 2 br.x.y + cy 2, ~ b' = ar.x.ß + b (r.x.c5 + ßy) + cyc5, c' = aß 2 + 2 bßc5 + cc5 2•

(10)

Der Transformation S entspricht also eine (durch die Formeln (10) definierte) Kollineation der Ebene, die ebenfalls mit S bezeichnet werde. Der Kreis K geht bei der Kollineation S in sich über. Denn dem Punkte A. des Kreises K entspricht die Form (7), welche bei der Transformation (8) in e

(a0' a1' a2• . . • a"-1'· x 1) -- P x1 + + p'" qxt

q

2n ist. Nunmehr entwickle man die Zahl r~-t rp- tq --=--=--=B

Bq

m einen regelmässigen Kettenbruch (5)

rp- tq --=--=Bq

=

(b O• b1• b2•

• ..

bk-1' )

wobei man die Entwicklung so einzurichten hat, dass k wird. Endlich bestimme man y1 derart, dass (6)

=h (mod. 2)

Über die Kettenbrüche, deren Teilnenner arithmetische Reihen bilden.

281

ist. Dann stellt die letztere Gleichung die regelmässige Entwicklung von y dar. Um dies zu beweisen, habe ich zu zeigen, dass y 1 > 1 ist. Zu dem Ende setze ich: {rp- tq = r 1 P, (7) sq = r 1 Q, unter r 1 den grössten positiven gemeinsamen Teiler von rp- tq und s q verstanden. Dann ist: Py1 + P'

(8)

Q'y- P'

y = Qyl + Q'' Yt = P-Qy.

Vermöge der Gleichungen (2), (4), (8) lässt sich y1 als lineare gebrochene Funktion mit ganzen Koeffizienten von x1 darstellen. Und zwar wird die aus diesen Koeffizienten gebildete Determinante gleich n sein. Denn y 1 geht aus y und ebenso x aus x1 durch eine lineare Transformation von der Determinante e = ± 1, ferner y aus x durch eine lineare Transformation von der Determinante rs = n hervor. Die Ausführung der Rechnung ergibt ein einfaches Resultat. Zunächst f6lgt aus (8) und (2)

Yt

=

Q'

-Q +

(-I)k-

Q(P-Qy) -

Q'

(-I)krf

-Q + rsq(p-q:.;)'

Sodann aus (4) (-I)"

p - q X = -q'--xl-,+:-'-q-;' •

Folglich

Yt

Q' = ---Q + nr'1q (qxl + q'),

oder schliesslich: (9) wo s1 und t1 aus den Gleichungen: (10) zu entnehmen sind. Nach dem, was oben bemerkt wurde, lässt sich der Faktor e so bestimmen, dass erl, etl, f!SI ganze Zahlen sind und f21'1. f!Sl = n ist. Aus der letzteren Gleichung folgt aber e2 = 1. Also sind s1 und t1

ganze Zahlen. Da~ und ~ zwischen 0 und 1liegen, so liegt t1 zwischen den Grenzen - r 1 und s1 •

282

Zahlentheorie.

Die Zahl r1 ist mindestens gleich 1, t1 und und da x1 > 2 n, so ergibt sich aus (9) Y1

81

sind höchstens gleich n,

> -2n-n -n = 1 ,

was zu zeigen war. Auf das Grössenpaar x 1 und y 1 findet nun genau dieselbe Betrachtung Anwendung, die wir soeben für das Grössenpaar x, y angestellt haben. Aus der bis zu einem gewissen Schlussglied x2 fortgesetzten regelmässigen Kettenbruchentwicklung von x 1 erhält man dadurch die bis zu einem gewissen Schlussglied y 2 reichende Entwicklung von y 1 • Auf x2 , y 2 ist wieder dieselbe Betrachtung anwendbar usw. Es leuchtet ein, dass man auf diese Weise nach und nach alle Teilnenner der regelmässigen Kettenbruchentwicklung von y findet. Diese Methode zur Herstellung der Entwicklung von y aus der als bekannt vorausgesetzten von x ist, wie schon oben bemerkt, stets anwendbar, wenn es Teilnenner von x gibt, die grösser als eine beliebig vorgeschriebene Zahl sind. Man wird aber bemerken, dass für einen bestimmten Wert von n die Methode schon dann brauchbar ist, wenn sich nur in der Reihe der Teilnenner von x, soweit man in derselben auch fortschreiten möge, immer noch solche finden, die 2 n - 1 überschreiten.

3. Wie in der vorigen Nummer und unter Beibehaltung der dort gebrauchten Bezeichnungen, sei aus der Kettenbruchentwicklung: (1)

die Entwicklung von: rx-t

(2)

y=-8-,

nämlich:

(3)

y = (bO•

b

b1•· •. k-1• Y1

Py1 + P' ) = Qyl+Q'

abgeleitet. Zwischen y1 und x 1 besteht dann die Gleichung:

(4) wo r1 als grösster positiver gemeinsamer Teiler von rp- tq und 8q, sodann 8 1 und t1 aus den Gleichungen (10) der vorigen Nummer zu bestimmen sind.

Über die Kettenbrüche, deren Teilnenner arithmetische Reihen bilden.

283

Ich betrachte jetzt eine Grösse x', von welcher ich voraussetze, dass ihre Kettenbruchentwicklung die Gestalt: (5)

x

,

=

(a0 + nc, a 1 , a2, ... ah_ 1,x1) = '

(p

+ ncq)xJ. + (p' + ncq') qx! + q'

besitze, dass also die Teilnenner vom zweiten bis zum hten für x und x' übereinstimmen, während die ersten Teilnenner sich um ein Multiplum nc von n unterscheiden. Überdies will ich annehmen, dass x~ > 2 n sei. Es hänge nun ferner y' gerade so von x' ab, wie y von x; es sei also: ,

(6)

rx'-t

y = -8 - .

Nach der vorigen Nummer ergibt sich die Kettenbruchentwicklung von y' auf folgende Weise. Man hat zuerst die Zahl: -r.. :.:(p'--'-+_n_c_"q"-)-_tcO...q aq

r p - tq ,Yq

=

+ rc 2

in einen Kettenbruch zu entwickeln. Nach (5) der vorigen Nummer erhält man offenbar: rp- tq aq

+r

2

c = (b0 + r 2c, b1 , b2 ,

•••

bk_ 1).

Hierauf hat man die Entwicklung von y':

(7)

'_ (b

Y-

2 b b ') _ (P+ r2cQ)y'1 + (P' + r2cQ') o+r c,b1, 2•··· k-t•Y1Qyi+Q' ·

Zwischen y~ und x~ besteht nun eine Gleichung der Gestalt: ,_r]x!-ti

YI-

a'

1



und zwar ist r~ als grösster positiver gemeinsamer Teiler von:

r (p gleich r1 , ferner

+ ncq)- tq = rp- tq + r 2c · 8q ' = --, n

81

rl

= -rln I

t1 =

I

= 81

un d

Q'

I

8 1 Q-r1

qq' =

und 8q

t1 •

Die Gleichung zwischen y~ und x~ lautet also: (8)

es hängt also y~ von x~ gerade so ab, wie y1 von x1 • Für das Folgende ist es wichtig zu bemerken, dass man aus den Gleichungen (1) bis (6) ohne weiteres auf die Gleichungen (7) und (8) schliessen kann.

284

Zahlentheorie.

4. Liegt ein Kettenbruch der Gestalt: (1)

(ao, a1, ... ai-1• 'P1(m), r2(m), ... 'Pk(m))

vor, so will ich a0 , a1 , . . . a;_ 1 , seine "irregulären", alle übrigen Teilnenner seine "regulären" Glieder nennen. Da der Kettenbruch: (a0, a1, ... a;_1, q; 1 (1), q; 2(m), ... 'Pk(m), q;1(m

+ 1))

mit (1) identisch ist, so kann man das erste reguläre Glied zu einem irregulären und durch wiederholte Anwendung desselben Vorgehens offenbar eine beliebige Anzahl von regulären Gliedern zu irregulären machen, derart, dass ein beliebiges reguläres Glied des Kettenbruches (1) zum ersten regulären Gliede wird. Man sieht ferner leicht ein, dass der Kettenbruch (1) auch in einer solchen Form dargestellt werden kann, in welcher anstelle von k irgend ein Multiplum von k getreten ist. Soll beispielsweise 3 k anstelle von k treten, so setze man "Pr(m)

= 'Pr(3m- 2), "Pr+k(m) = 'Pr(3m -1), "Pr+2k(m) = (r=1,2, ... k)

'Pr(3m)

und bilde den Kettenbruch (a0, a1, ... a;-v 1p1 (m), 1p2 (m), ... "Psk(m)).

Der letztere ist, wie man sich sofort überzeugt, mit dem Kettenbruch (1) identisch. Diese Bemerkungen gelten unabhängig davon, welcher Natur die Funktionen q;1 (m), q; 2 (m), ... 'Pk (m) und welcher Beschaffenheit die Teilnenner des Kettenbruches (1) sind. Nunmehr will ich aber insbesondere voraussetzen, dass (1) ein regelmässiger Kettenbruch ist und dass q;1 (m), q; 2 (m), ... 'Pk (m) ganze rationale Funktionen von m sind. Diese besitzen notwendig rationale Koeffizienten und lassen sich also auf die Form bringen: 'P1(m)

=

1

-f1(m), 'P2(m) ~

=

1

-f2(m), ... ,lf!k(m) ~

1

= -fk(m), ~

wo n 1 , n2, ... nk positive ganze Zahlen und f1 (m), f 2 (m), ... fk(m) ganze ganzzahlige Funktionen von m bezeichnen. Ist jetzt n eine beliebig gewählte positive Zahl, so bilden die regulären Glieder des Kettenbruches (1) (mod. n) betrachtet eine periodische Reihe; mit andern Worten, es ist für jeden Wert von m q;1 (m + N)

=q;1(m), q;2(m + N) =q; 2(m), ... , 'Pk(m + N) ='Pk(m) (mod.n),

unter N eine geeignet gewählte feste ganze Zahl verstanden.

Über die Kettenbrüche, deren Teilnenner arithmetische Reihen bilden.

285

In der Tat: bezeichnet v ein gemeinsames Multiplum von n 1 , n 2, ... nk und nimmt man N = n · v, so wird: f/Jr(m

+ nv)- fr(m)) + n r ! t;' (m) + .. · = n · -;-t;(m) r

+ N)- fPr(m) =

-1

nr

(fr(m

2 • : 2 •

eine durch n teilbare ganze Zahl, für r = 1,2, .. . k. Verbindet man diese Tatsache mit den obigen Bemerkungen, so erkennt man, dass sich der Kettenbruch (1) auf die Form bringen lässt: (2) derart, dass "Pl (1) ein beliebig gewähltes reguläres Glied des Kettenbruches (1) ist, und dass:

ist, dass also nach dem Modul n die regulären Glieder des Kettenbruches (2) die periodische Reihe:

bilden. Der Index h ist ein geeignet gewähltes Multiplum von k, z. B. h= N·k.

5. Wenn der regelmässige Kettenbruch für die Irrationalzahl x so beschaffen ist, dass seine Teilnenner von einem bestimmten. ab eine gewisse Zahl von ineinander geschachtelten arithmetischen Reihen bilden, wenn also x eine Entwicklung der Gestalt: (1)

besitzt, wo q; 1 , q; 2 , .•• f/Jk ganze Funktionen von m bezeichnen, so wird man vermuten, dass auch der regelmässige Kettenbruch für jede in der Form: cxx+ ß (2) Y = yx+ o enthaltene Grösse y eine gewisse Gesetzmässigkeit darbietet. Dabei sollen IX, ß, y, b ganze Zahlen von nicht verschwindender Determinante IX b - ß y = ± n bedeuten.

286

Zahlentheorie.

Die Beantwortung der hiermit gestellten Frage bildet das Hauptziel der vorliegenden Untersuchung. Der Fall n = 1 erledigt sich nach dem Satze von Lagrange sofort. Ebenso leicht lässt sich die Frage erledigen für den Fall, wo der Kettenbruch (1) die Ordnung 0 hat, wo sich also die Funktionen q;1 (m), ... f/Jk (m) sämtlich auf Konstante reduzieren. Dann ist (1) ein periodischer Kettenbruch und folglich x und also auch jede in der Form (2) enthaltene Grösse y eine quadratische Irrationalität. In diesem Falle wird also jedes y ebenfalls eine periodische Entwicklung besitzen, oder, nach der hier gewählten Terminologie, einen Kettenbruch der Gestalt (1) von der Ordnung 0 liefern. Ich werde hiernach bei der weiteren Untersuchung den Fall, wo der Kettenbruch für x von der Ordnung 0 ist, ausschliessen dürfen, so dass also unter den Funktionen q;,(m) mindestens eine vorhanden ist, deren Grad eine positive ganze Zahl ist. Dies hat zur Folge, dass unter den Teilnennern des Kettenbruches (1) solche vorkommen, die eine beliebig angenommene Zahl übersteigen. Die Aufgabe, den regelmässigen Kettenbruch für y zu untersuchen unter der Voraussetzung, dass x die Entwicklung (1) liefere, lässt sich zunächst auf eine einfachere zurückführen. Ich bringe zu dem Ende den Kettenbruch (1) auf die Form (2) der vorigen Nummer, und zwar so, dass sich die Funktion '1'1 (m) nicht auf eine Konstante reduziert und dass die Teilnenner:

welche der Funktion "1-'1 (m) und den übrigen etwa vorhandenen Funktionen "Pr (m), die sich nicht auf Konstante reduzieren, entspringen, sämtlich 2 n - 1 übersteigen. Die Grösse x ist jedenfalls äquivalent der Grösse: (3)

und daher jede in der Form (2) enthaltene Grösse y (nach Nr. 1) äquivalent emer m der Form: (4)

y*

=

rx*- t 8

,

(rs = n)

enthaltenen Grösse, wo r, s, t nicht negative Zahlen bezeichnen und t < s ist. Nach dem Satze von Lagrange hat jedes y eine gleichendende regelmässige Kettenbruchentwicklung wie das entsprechende y*. Es ist also nur noch zu untersuchen, nach welchem Gesetze die Teilnenner in der Entwicklung eines y* fortschreiten.

Über die Kettenbrüche, deren Teilnenner arithmetische Reihen bilden.

287

6. Indem ich die Bezeichnung ein wenig abändere, habe ich also folgende Aufgabe: Gegeben ist der regelmässige Kettenbruch: (1)

X=

(V'1 (m), 1p2 (m), ... 1p,.(m)).

Gesucht wird der Kettenbruch für: rx-t

y=-8- ,

(2)

(r·s=n),

wo r, s positive ganze Zahlen bedeuten und t zwischen 0 und s -1, also um so mehr zwischen - r und s liegt. Dabei sind die Werte derjenigen Funktionen V'r(m), die sich nicht auf Konstante reduzieren und zu denen insbesondere 1p1 (m) gehört, sämtlich grösser als 2 n -1. Ferner ist allgemein: (3)

V'r(m

+ 1) ='Pr(m)

(mod. n) (r = 1, 2, ... h).

Bei der Behandlung dieser Aufgabe ist es erforderlich, diejenigen Funktionen 1p, (m), die sich nicht auf Konstante reduzieren, von den übrigen zu unterscheiden. Ich will deshalb mit:

diejenigen Funktionen V'~ (m) bezeichnen, die sich nicht auf Konstante reduzieren, die übrigen werde ich der Reihe nach mit a~, a~, ... a~, a~, . . . bezeichnen, so dass sich also die Kettenbruchentwicklung (1) nun so darstellt: (1')

x = (/0 (m), a~, a~, ... f 1 (m), a~, a~, ... f 2 (m), ... f;.(m), a~, a7, ... ).

Die Funktion fo (m) ist mit 1p1 (m) identisch. Ferner ist zu bemerken, dass von den Gruppen der konstanten Teilnenner einzelne oder auch alle fortfallen können. & wird beispielsweise die erste Gruppe a~, a~, ... gar nicht auftreten, wenn 1p2 (m) sich nicht auf eine Konstante reduziert. Zunächst zerlege ich nun den Kettenbruch (1') in folgender Weise: x = (10 (1), a~, a~, ... x1) x1 = (/1 (1), a~, a~, ... x 2)

(4) X;.=

(1;.(1), a~, a7, ... x')

x' = (10 (2),

a~, a~, ... x;)

288

ZahlentheoriE'.

Es werden also allgemein die Gleichungen stattfinden:

X;.(iJ) =

+ 1) , a_.,' a_.," ... x 1))

(f_. (p

(iJ+

für p = 0, 1, 2, .... Nach den Betrachtungen der Nr. 2 ergibt sich nun der Reihe nach:

= (bo' b'o' b"o' · · · Y1 ) rlxl-tl ' " Y1 = - - = (bl, bt, bl, · · · Y2) 81

Y =

r (5)

rx-t 8

.. .. .. .. .. .. .. .. .. .. .. ..

y_.= ,

Y =

T,< X,l- t,< 8,
) Y;.-g;.p+ ·

Hiernach ist die regelmässige Kettenbruchentwicklung von y diese:

(9)

y

=

(g0(m), b~, b~, ... , g1(m), b~, b~, .. . g2(m), .. . g, (m), b~, b~, ... ),

also genau von derselben Gestalt, wie die Entwicklung von x. Beachtet man, dass die Funktion gr(m) nach (8) eine ganze Funktion des nämlichen Grades, wie die Funktion fr (m) ist, beachtet man ferner die am Schluss der vorigen Nummer gemachten Bemerkungen, so sieht man, dass nunmehr folgender Satz bewiesen ist: Wenn der regelmässige Kettenbruch für die Irrationalzahl x so beschaffen ist, dass seine Teilnenner von einem bestimmten ab eine arithmetische Reihe oder mehrere ineinander geschachtelte arithmetische Reihen bilden, so hat der regelmässige Kettenbruch für: ocx+ ß y= yx+b' 19

290

Zahlentheorie.

wo IX, ß, y, lJ irgend vier ganze Zahlen von nicht verschwindender Determinante IXIJ- ßy bezeichnen, stets dieselbe Beschaffenheit. Und zwar besitzt, abgesehen von Reihen der Ordnung 0, jede in der Entwicklung von y auftretende arithmetische Reihe dieselbe Ordnung wie eine derjenigen Reihen, die in der Entwicklung von x auftreten. Nach der oben eingeführten Bez(lichnungsweise besitzen also insbesondere die beiden Kettenbrüche für x und y dieselbe "Ordnung".

7. Besitzt die Irrationalzahl x eine regelmässige Kettenbruchentwicklung von der im vorigen Satze erwähnten Beschaffenheit und will man aus derselben die Entwicklung von: (1)

y=

rxx+ ß yx+t5

(1XIJ-ßy= ±n)

herleiten, so lässt sich das Verfahren der vorhergehenden Nummer nicht unmittelbar anwenden. Denn dieses setzt voraus, dass die Relation zwischen y und x die besondere Gestalt y = rx- t besitze und dass 8 überdies die im Beginn der Nr. 6 angegebenen Bedingungen für die Entwicklung von x erfüllt seien. Auf diesen Fall lässt sich aber der allgemeinste Fall zurückführen. Dies geschieht auf Grund der folgenden Betrachtung: Es sei (2)

ein regelmässiger Kettenbruch, über dessen Beschaffenheit ich zunächst keinerlei Voraussetzung mache. Ferner hänge y mit x durch die Gleichung (1) zusammen. Nun stelle man den regelmässigen Kettenbruch (3)

;:! :: = (b

0,

b1 , ... b;-1)

her, wobei j == i (mod. 2) oder j == i + 1 (mod. 2) sein soll, je nachdem IX lJ - ßy = + n oder = - n ist. Endlich bestimme man y1 so, dass die Gleichung (4)

besteht. Zunächst will ich nun untersuchen, in welchem Zusammenhange y1 und x1 stehen. Unter der offenbar zulässigen Annahme, dass yp + !Jq positiv sei, ist:

Über die Kettenbrüche, deren Teilnenner arithmetische Reihen bilden.

«p

(5)

+ ßq =

rP, yp

+ ~q =

291

rQ,

wo r den grössten positiYen gemeinsamen Teiler der Zahlen «P

r p + ~ q bezeichnet.

+ ßq,

Die Elimination von x und y aus den Gleichungen (1), (2) und (4) ergibt nach kurzer Rechnung (welche der in Nr. 2 ausgeführten ganz ähnlich ist) : (6)

wo s und t

gan~e

Zahlen, r · s = n und: yp' + {Jr/ Q' t = s · -Q- - r · -'--"1-=-P-+:---7~5q,_

(7)

ist. Der Faktor von r lässt sich auf die Form bringen q'+e yp'+l5q' yp+l5q = - q - ,

wo e=

±

'l'

q{yf+

15)

=

±

'l'

q(yz+6)± qz,"'-+ll'

unbegrenzt abnimmt, wenn die Anzahl i der 'l'eilnenner des Kettenbruches (2) (und folglich auch q) unbegrenzt zunimmt. Sobald daher die Zahl dieser Teilnenner eine gewisse Grenze überschreitet, wird t zwischen - r und s liegen. Zugleich wird dann, soiern x1 > 2 n ist, nach Gleichung (6) y1 > 1, und folglich (4) die regelmässige Entwicklung von y darstellen. Wenn nun insbesondere der Kettenbruch x die im Satze der vorigen Nummer näher bezeichnete Beschaffenheit hat, so leuchtet ein, dass man durch geeignete Wahl der Anfangs-Teilnenner ac,, ClJ., •• • a1_ 1 die in der Darstellung (2) auftreten, stets erreichen kann, dass auf die Grössen x1 und y1 = 'z1 - t das Verfahren der vorigen Nummer anwendbar wird. 8

8. Eine besonders interessante Anwendung gestatten die gefundenen Resultate auf die Basis e der natürlichen Logarithmen. Bezeichnet u eine unbeschränkt veränderliche Grösse, so besteht nach Lambert bekanntlich die Gleichung: (1)

4m-2) ( ) 2 6 10 ( e" -1 • u et.e+1 = 0 •-u•-u•-u--• ... = 0 •

Der hier auftretende Kettenbruch wird ein regelmässiger, dessen Teilnenner eine arithmetische Reihe erster Ordnung bilden, so oft u der

292

Zahlentheorie.

reziproke Wert oder das Doppelte des reziproken Wertes einer positiven ganzen Zahl ist. Da jede linear-gebrochene Funktion von ::~ ~ eine ebensolche Funktion von e'" ist, so folgt aus dem Satze der Nr. 6: Bezeichnet g eine positive ganze Zahl, bedeuten ferner IX, ß, y, 15 irgend vier ganze Zahlen von nicht verschwindender Determinante IXI5- ßy, so sind die regelmässigen Kettenbrüche für die Grössen: und so beschaffen, dass ihre Teilnenner von einem bestimmten ab eine arithmetische Reihe oder mehrere ineinander geschachtelte arithmetische Reihen oter und erster Ordnung bilden. Die Herstellung dieser Kettenbrüche aus dem Kettenbruch von Lambert geschieht nach der oben entwickelten Methode und möge für einige einfache Fälle durchgeführt werden. Es sei:

(2)

x

= :~~ =

(0, 2, 6, 10, ...)

=

(0, 4m-2),

und hieraus die Entwicklung von: (3)

Y --

x+1 = -x+1

e

abzuleiten. Nach Nr. 7 hat man zunächst zu setzen: (4)

_ (O 2 ) _ X1 ( - px1 + p'). ',xl -2:~:t+1 -q:~:t+q''

X-

sodann ist der Kettenbruch zu bilden: a.p + ßq YP+ CJq

=

1+ 2 -1+ 2

= 3 = (2 1) '

und y 1 aus der Gleichung:

(5)

y

=

(2

)

' 1' Yl =

3yl + 2 Yl 1

+

zu bestimmen. Die Elimination von x, y aus (3), (4), (5) liefert nun:

(6) und hier tritt jetzt das Verfahren von Nr. 6 in Kraft. Die Teilnenner von:

x1 = (6, 10, ... ) = (4m

+ 2)

Über die Kettenbrüche, deren Teilnenner arithmetische Reihen bilden.

293

bilden (mod. 2) eine periodische Reihe, bestehend aus dem einen Gliede 0. Den Gleichungen (4) von Nr. 6 entsprechend, ist also zu setzen: (7)

xl -- (6 ' xl') ' xl' -- (10 ' xl") ' ... ' xl(p) -- (f( fl (f(m)=4m+2).

+ 1) ' xl(p+l)) ' ...

Hieraus ergeben sich der Reihe nach die den Gleichungen (5) von Nr. 6 entsprechenden Gleichungen: (8)

Y1

= -x 1 2--

1

= (2 , 1, 1, Y1') ,

Y1'

=

x;-

1 -2-

= (4 ' 1' 1' Y1") '

· · ··

Da schon y~ mit x~ in demselben Zusammenhange steht, wie y1 mit x1 , so braucht man die Rechnung nicht weiter fortzusetzen. Allgemein wird, den Gleichungen (5') von Nr. 6 entsprechend,

Yi"'> = (g (fl + 1), 1, 1, y),

(9)

wo g(m) = b0

+r

2•

/(m):/( 1) = 2 + 12. 4 m+22 - 6 , also g(m)

(10)

= 2m

ist. Hiernach wird die regelmässige Entwicklung von y1 gleich (2m, 1, 1) und hieraus schliesslich in Rücksicht auf (5): (11)

y

= e = (2, 1, 2m, 1). 1)

In entsprechender Weise erhält man aus dem Kettenbruch: (12)

X=

e2 -1 e2 1

+

=(0,1,3,5, ... )=(0,2m-1)

die Entwicklung von : (13)

y

=

x+1 -x+l

= e2.

Man findet der Reihe nach:

(14) Hieraus: (15) 1 ) Die regelmässige Kettenbruchentwicklung der Zahl e ist, wie Herr Rudio in seiner interessanten Schrüt: Archimedes, Huygens, Lambert, Legendre. Vier Abhandlungen über die Kreismessung (mit einer Übersicht über die Geschichte des Problemes von der Quadratur des Zirkels), Leipzig 1892, bemerkt, schon von Euler im Jahre 1737 in der Abhandlung "De fractionibus continuis dissertatio" (Comment. Acad. Petrop. T. IX, p.l20) mitgeteilt worden.

294

Zahlentheorie.

Sodann, indem man x1 = (5, x2), x2 = {7, x3), x3 = (9, x~),

und allgemein: (16) xt> = (f0 (,u + 1), x~>), x~> = (11 (p + 1),x~">), x~"> = (f2(p + 1), x) setzt, wo:

f0 (m) = 6m -1, f1 (m) = 6m + 1, f2(m) == 6m + 3

ist, Yt =

i

= (2, 1, 1, Y2), Y2 =

:~:t;-1 = (3, Ya), Ya = 2xa = (18, y~), y~ =

1'....

Daher wird allgemein: (17)

wobei: go(m) = 2 +

/o(m);/o(1)

=3m -1, gl(m) = 3 +

g2 (m) = 18 + 4 ·

t.(m);/a( 1)

ft(m);ft(1)

=Sm,

=12m+ 6

gesetzt ist. Aus (14) und (17) ergibt sich nun: (18)

y = e2 = (7, Sm -1, 1, 1, 3m, 12m+ 6).

Einige weitere Beispiele für den Satz dieser Nummer entnehme ich meiner in der Einleitung erwähnten Notiz. Es ist: 1 -e+ 3-

(19)

= (1, 4, 5, 4m-3, 1, 1, 36m-16, 1, 1, 4m-2, 1, 1, 36m-4, 1, 1, 4m-1, 1, 5, 4m, 1)

1 -e+ 4-

= (0, 1, 13, 4m + 1, 16m+ 12)

2e 2 = (14,3m-2,3,1, Sm-2,48m-12, 13m-1,1,3,3m,48m+12).

9. Rechnet man zwei Irrationalzahlen in dieselbe Klasse, wenn die eine sich als lineare (ganze oder gebrochene) Funktion der anderen mit ganzzahligen Koeffizienten darstellen lässt, oder - was offenbar auf dasselbe hinauskommt - wenn zwischen den beiden Irrationalzahlen eine bilineare Relation mit ganzzahligen Koeffizienten stattfindet, so

Über die Kettenbrüche, deren Teilnenner arithmetische Reihen bilden.

295

kann man den Satz von Nr. 6 auch so aussprechen: Falls die regelmässige Kettenbruchentwicklung der Irrationalzahl x so beschaffen ist, dass die Teilnenner von einem bestimmten ab eine arithmetische Reihe oder mehrere ineinander geschachtelte arithmetische Reihen bilden, so findet das Gleiche für jede Irrationalzahl y statt, die in dieselbe Klasse wie x gehört. Zugleich sind die Ordnungen der arithmetischen Reihen bei beiden Irrationalzahlen die nämlichen. Ausgenommen ist die Ordnung 0, die bei der einen Entwicklung fehlen, bei der anderen auftreten kann. Es erhebt sich nun die Frage, unter welchen Bedingungen man umgekehrt daraus, dass zwei Irrationalzahlen x, y Kettenbruchentwicklungen von der genannten Beschaffenheit liefern, schliessen kann, dass die beiden Zahlen in dieselbe Klasse gehören. Diese Frage wird, wenigstens für eine Reihe von Fällen, durch einen Satz entschieden, den ich zunächst aussprechen und dann beweisen will. Der Satz lautet: Wenn die Teilnenner der unendlichen regelmässigen Kettenbrüche (1)

(2) schliesslich über alle Grenzen wachsen, wenn also lim ak = lim bk = oo k=

k=

ist, so kann nur dann zwischen x und y eine bilineare Relation mit ganzzahligen Koeffizienten bestehen, falls es möglich ist, die positiven ganzen Zahlen r und s und die Indices i und j so zu bestimmen, dass die Gleichungen

stattfinden. Sind diese Gleichungen erfüllt, so ist y eine ganzzahlige (gebrochene) lineare Funktion von x, deren Determinante ± r s ist. Um diesen Satz zu beweisen, nehme ich an, es Sei: ()

4

Y=

a.x+ß Y x + 82

..............

Setzt man nun in die erste Gleichung x1 = a; +_I_, so findet man: x2

d. h. es ist r 2 = s 1 , s 2 = r 1 , t 2 = 0. Ebenso folgt aus der zweiten Gleichung durch Substitution von x2 = ai+l +_I_, dass die dritte Xa Gleichung: lautet usw. Da das erste Tripel sich wiederholt, so muss auch notwendig t1 = 0 sein und die Gleichungen (9') gewinnen also schliesslich, wenn der Einfachheit halber noch r für r1 und s für s1 geschrieben wird, die Gestalt: r x1 (b ) ra; b Y1 = - 8- = i • Y2 • 8 = i • _ sx2 _ (b ) sai+l _ b i+t•Ys , - r - - i+l•

Y2--r-_

rx3

_

Ys- - 8- -

(b

)

ra;+ 2

i+2• Y4 , -

_

8 --

b

i+2•

Hiermit ist der erste TeiL des obigen Satzes bewiesen. Der zweite Teil ergibt sich auf die leichteste Weise. Ist nämlich:

so bestätigt man sofort, dass zwischen den Grössen: x1 Y1

= (ai' ai+ 1 , ••• ) = (bi, bi+t• · · .)

die Relation y1 =.!:... x 1 besteht. Da aber x = (a0 , a 1 , ••• ) äquivalent 8 zu x 1 und y = (b0 , b1 , ••. ) äquivalent zu y1 ist, so folgt aus y1 = .!:... x 1 eine Relation der Gestalt y

=

;:! ~. wo occ5- ßy = ±rs ist.

8

298

Zahlentheorie.

Der obige S&.tz lässt sich, wie ich nun zeigen will, noch auf eine andere, sehr bemerkenswerte Form bringen. Die Gleichungen (3) können stets und nur dann durch zwei positive ganze Zahlen r und s befriedigt werden, wenn a,ai+ 1 = b1bH 1, ai+ 1 ai+ 2 = b1+1bi+ 2 , ... in inf.

ist, wenn also die beiden Zahlenreihen: aoav ala2, a2as, .. . bo bv bl b2 ' b2 bs' .. .

nach Abtrennung der ersten i bzw. der ersten i Glieder identisch sind. Es folgt also : Wenn die Teilnenner der unendlichen regelmässigen Kettenbrüche (1}

(2)

x = (a0 , a1 , a 2 ,. •• ) y = (b 0 , b1 , b2 , ••• )

schliesslich über alle Grenzen wachsen, so wird stets und nur dann zwischen x und y eine bilineare Relation mit ganzzahligen Koeffizienten bestehen, falls die beiden Zahlenreihen:

(10) (11)

aoUt. a1a2, a2as,. · · b0 b1 , b1 b2 , b2 b3 , ••• ,

abgesehen von einer endlichen Anzahl von Anfangsgliedern, identisch sind. Sind die beiden Zahlenreihen (10) und {11}, nachdem man von der ersten die ersten i Glieder, von der zweiten die ersten i Glieder abgetrennt hat, tatsächlich identisch, so findet man dann die zwischen x und y bestehende bilineare Relation, indem man x1 und y 1 aus den Gleichungen:

x = (ao, al'' .. ai~l• xl}, Y = (bo, bl, • • .bi-1• Y1}, bixl = a,yl eliminiert. Dies geht unmittelbar aus der vorhergehenden Untersuchung hervor. Die oben aufgeworfene Frage, wann die Grössen x und y, deren regelmässige Kettenbruchentwicklungen von der Form:

(12}

x = ( a0 , Ut, ... ai_1, tp1(m}, tp2(m) ,... fJ?k(m))

(13)

y = (b 0 , b1 , ... b1_ 1 , "l'l(m), tp 2{m), ... tp1(m))

sind, in dieselbe Klasse gehören, d. h. wann zwischen ihnen eine bilineare Relation mit ganzzahligen Koeffizienten besteht, wird nun immer dann

Über die Kettenbrüche, deren Teilnenner arithmetische Reihen bilden.

299

durch den vorstehenden Satz entschieden, wenn unter den ganzen Funktionen cp(m) und V'(m) sich keine auf eine Konstante reduziert. Denn in diesem Falle wachsen die Teilnenner von x und y schliesslich über alle Grenzen. Wenn die Anzahl k der Funktionen rp (m), wie das nach den Bemerkungen von Nr. 4 gestattet ist, als eine gerade Zahl vorausgesetzt wird, so hat der Kettenbruch für y, falls zwischen x und y eine bilineare Relation mit ganzzahligen Koeffizienten stattfindet, bei geeigneter Bestimmung der Indices i und j die Gestalt

Hieraus ergibt sich leicht eine Beziehung zwischen den Anzahlen der arithmetischen Reihen, aus denen sich die Teilnenner von x und y zusammensetzen, wobei für einen Kettenbruch der Gestalt (12) unter der "Anzahl" der arithmetischen Reihen der Minimalwert zu verstehen ist, den die Zahl k der Funktionen rp (m) für den Kettenbruch annehmen kann. Ist die Anzahl der arithmetischen Reihen für einen der beiden Kettenbrüche eine ungerade Zahl, so ist sie für den andern notwendig = 1 ist, also das Doppelte dieser ungeraden Zahl, es sei denn, dass !_ 8 die arithmetischen Reihen für beide Kettenbrüche völlig identisch sind: Wenn also die Teilnenner für die Entwicklungen von x und y je eine ungerade Anzahl von arithmetischen Reihen bilden, die für die eine Entwicklung nicht völlig dieselben sind wie für die andere, so kann zwischen x und y keine bilineare Relation mit ganzzahligen Koeffizienten bestehen. Beispielsweise kann keine derartige Relation .

e-1

(

e2 -1

.

zwischen e+ 1 = 0, 4m-2) und e•+ 1 = (0, 2m -1) stattfinden, was übrigens auch aus der zweiten Form des Satzes dieser Nummer unmittel-

!,

bar erhellt. Die Zahlfln : ~ ~ und :: ~ und folglich auch die Zahlen e und e2, gehören daher nicht derselben Klasse an, woraus hervorgeht, dass e nicht Wurzel einer ganzzahligen Gleichung dritten Grades ist. Wenn auch die neueren von Hilbert, dem Verfasser, und Gordan gegebenen Beweise 1 ) für die Transzendenz der Zahl e sehr einfach sind und insbesondere der Gordan'sche Beweis nur ganz elementare Hilfsmittel beansprucht, so ist es vielleicht doch nicht ohne Interesse, dass man aus den Kettenbruchentwicklungen von e und e2 unmittelbar schliessen kann, dass e nicht Wurzel einer ganzzahligen Gleichung ersten, zweiten oder dritten Grades ist. 1 ) Mathem. Annalen, Bd. 43 (1893), S. 216-224 [Hurwitz auch: diese Werke, Bd. II, S. 134-135].

300

Zahlentheorie.

10. Wenn die Teilnenner des regelmässigen Kettenbruches für die Irrationalzahl x von einem bestimmten ab eine arithmetische Reihe oder mehrere ineinander geschachtelte arithmetische Reihen bilden, so besitzen auch gewisse andere Kettenbruchentwicklungen derselben Zahl ein ähnlich einfaches Bildungsgesetz. Ich will hier nur die Entwicklung nach "nächsten Ganzen", die wegen ihrer starken Konvergenz ein besonderes Interesse bietet, betrachten. Dabei muss ich mich aber, um nicht zu weitläufig zu werden, damit begnügen, die Methode anzugeben, nach welcher man das Bildungsgesetz der Entwicklung nach nächsten Ganz'en für die hier betrachteten Irrationalzahlen in jedem besonderen Falle bestimmen kann. Der Leser wird aus den beigefügten Beispielen das allgemeine Gesetz für diese Entwicklungen leicht abstrahieren. Bezeichnet zunächst x eine beliebige Zahl, so erhält ma.n ihre Entwicklung nach nächsten Ganzen aus der Gleichungskette:

(1) die nach der Massgabe zu bilden ist, dass allgemein (/..; die der Grösse nächstliegende ganze Zahl sein soll und in der Gleichung

X;= (/..;

X;

1± -xi+t

das obere oder untere Zeichen gelten soll, je nachdem (/..; kleiner oder grösser als X; ist. Der Kettenbruch für x, den man durch Elimination von x1 , x2 , ••• erhält, möge wieder durch die in Klammern geschlossene Reihe der Teilnenner bezeichnet werden, wobei jedoch, wenn in der Gleichung

X;= (/..;

1± -xi+l

das untere Zeichen gilt, der betreffende Teil-

nenner (/..; einen oberen Punkt erhalten soll. Durch die folgende Betrachtung erkennt man nun, dass man aus der regelmässigen Entwicklung der Zahl x:

(2) ihre Entwicklung nach nächsten Ganzen unmittelbar ableiten kann. Man bilde die Gleichungen:

(3)

x

=

a0

1 + I:• ~1 = 'iil

a1 + f : , 1

'ii2

... ,~k=

ak

1 + ~::-, .... "k+l

Ist a 1 ~ 2, so fällt offenbar die erste der Gleichungen (1) mit der

Gleichung x = a0 +

;

1

zusammen, und allgemeiner werden die Glei-

chungsketten (1) und (3) soweit koinzidieren, als unter den 'l'eilnennern

Über die Kettenbrüche, deren Teilnenner arithmetische Reihen bilden.

301

a 1 , a 2 , ••• die Zahl 1 nicht auftritt. Wenn aber ak der erste Teilnenner ist, welcher den Wert 1 hat, so erkennt man aus den Gleichungen: ~k-1 =

1

ak-1

1

+ T;' ~k = 1 + 7 '

wo Bequemlichkeit halber x' für ~H 1 geschrieben ist, dass an der Stelle in der Gleichungskette (1) die Gleichung: ~k-1 =

ak-1

+ 1-

x'

kten

1

+1

steht. Denn von den beiden Zahlen ak_ 1 und ak_ 1 + 1, zwischen welchen ~k-l liegt, ist ak_ 1 + 1 die nächstliegende. Wenn also in der Reihe a 1 , a 2 , ••• das erste Glied, welches den Wert 1 hat, ak ist, so darf man aus der Gleichung:

(4) schliessen, dass:

(5) em Teil der Entwicklung von x nach nächsten Ganzen ist. Wendet man diese Bemerkung wiederholt an, zunächst auf die regelmässige Entwicklung von x' + 1 = (ak+l + 1, ak+ 2 , ••• ) usw., so wird man nach und nach zu der Entwicklung von x nach nächsten Ganzen in ihrer ganzen Ausdehnung gelangen 1). Es sei beispielsweise aus der regelmässigen Entwicklung von X= y13: X=

(3, 1, 1, 1, 1, 6)

die Entwicklung dieser Zahl nach nächsten Ganzen abzuleiten. Man hat dann folgende Gleichungen zu bilden:

x = (3, 1, x'), x'

+1=

(2, 1, x"), x"

+1=

(2, 6, 1, x').

1 ) Eine eingehende Untersuchung der Kettenbruchentwicklung nach nächsten Ganzen hat der Verfasser in Bd. 12 der Acta Mathematica (1889) [diese Werke, Bd. II, S. 84-115] veröffentlicht. Mit Hilfe der oben angegebenen Transformation der regelmässigen Kettenbruchentwicklung in die nach nächsten Ganzen lassen sich manche Sätze, die für die erstere Entwicklung gelten, auf die letztere übertragen. Indessen dürfte es schwierig sein, auf diesem Wege die a.a.O. bewiesenen tiefer liegenden Sätze über die Entwicklung nach nächsten Ganzen, insbesondere den merkwürdigen Zusammenhang dieser Entwicklung mit einer nach ganz anderem Gesetze gebildeten zu entdecken.

302

Zahlentheorie.

Aus diesen findet man der Reihe nach:

.

.

.

+ 1), x' + 1 =

(3, x"

+ 1), x" + 1 =

so dass die Entwicklung von

Vi3

nach nächsten Ganzen lautet:

x

=

(4, x'

(2, 7, x'

+ 1),

Vi3 = (4, 3, 2, 7). Offenbar wird allgemein, wenn die regelmässige Entwicklung von x periodisch ist, wenn also x eine quadratische Irrationalität ist, auch die Entwicklung von x nach nächsten Ganzen eine periodische sein. (Vgl. Minnigerode, Über eine neue Methode, die Pell'sche Gleichung aufzulösen, Göttinger Nachrichten aus dem Jahre 1873.) Als weitere Beispiele betrachte ich die Entwicklungen der Zahlen e und e 2 • Transformiert man nach der obigen Methode die regelmässigen Kettenbrüche für diese Zahlen (vgl. Nr. 8) in die nach nächsten Ganzen fortschreitenden, so findet man:

e= e2 =

(3, 4, 2, (2m+ sr) (7, 3~, 2, 3m, 12m+ 6)'

zwei Gleichungen, welche die bemerkenswerte Tatsache enthalten, dass auch die Entwicklungen der Zahlen e und e2 nach nächsten Ganzen ein seh:~; einfaches Bildungsgesetz aufweisen. Zürich, den 9. Dezember 1895.

LXIV.

Über die Zahlentheorie der Quaternionen. (Nachrichten von der k. Gesellschaft der Wissenschaften zu Göttingen, Mathematisch·physikalische Klasse, 1896, S. 313-340.)

Ein Zahlenkörper nten Grades lässt sich bekanntlich auffassen als die Gesamtheit derjenigen Zahlen eines mit n unabhängigen Einheiten gebildeten Systemes komplexer Zahlen, welche rationale Komponenten besitzen, wobei in diesem Systeme die Produktbildung dem kommutativen Gesetze unterliegt!). Es ist nun eine naheliegende Frage, in wie weit sich die Begriffe und Methoden, welche der Theorie der Zahlenkörper zugrunde liegen, auf die Behandlung solcher Zahlensysteme anwenden lassen, in welchen die Produktbildung dem kommutativen Gesetze nicht unterworfen ist. Zur Orientierung über diese Frage habe ich mich mit der Zahlentheorie der Quaternionen, des ei;nfachsten derartigen Zahlensystemes, beschäftigt, und ich möchte mir erlauben, im folgenden die hauptsächlichsten Resultate meiner Untersuchung mitzuteilen. Zuvor bemerke ich, dass schon Herr Lipschitz in seiner interessanten Schrift "Untersuchungen über die Summen von Quadraten" (Bonn 1886) eine Zahlentheorie der Quaternionen entwickelt hat. Dieselbe unterscheidet sich aber in einigen wesentlichen Punkten von der meinigen. Abgesehen von den Fragestellungen liegt ein tiefgreifender Unterschied namentlich darin, dass Herr Lipschitz seinen Untersuchungen einen anderen Begriff des "ganzen" Quaternions zugrunde legt, wie ich. Indem ich diesen Begriff in geeigneter Weise festsetze, verschaffe ich dem Satze von der Existenz eines grössten gemeinsamen Teilers zweier ganzen Quaternionen ausnahmslose Gültigkeit, wodurch dann die Zahlentheorie der Quaternionen, soweit dies überhaupt möglich ist, eine ähnliche Einfachheit erhält, wie die elementare Zahlentheorie. 1 ) Vgl. R. Dedekind, Zur Theorie der aus n Haupteinheiten gebildeten komplexen Grössen, Göttinger Nachrichten, 1885, 8.141-159 [Ges. Werke, Bd. Il, S. 1-20].

304

Zahlentheorie.

§1.

Bezeichnungen. Die aus vier unabhängigen Einheiten 1, i 1 , i 2 , i 3 gebildeten komplexen Zahlen heissen "Quaternionen", wenn die Multiplikation m dem Systeme dieser Zahlen durch die Gleichungen (1)

~1~2

=

-~2~1

=

ii=i~=i~=-1, 13•

~2~3

=

-13~2

=

~1'

~31,1

=

-1,11'3

=

12

geregelt wird. Ist

(2) ein Quaternion, so sollen a0 , a1 , a 2 , a 3 die "Komponenten" desselben heissen. Das Quaternion a heisst "reell", wenn die Komponenten a1 , a 2 , a 3 Null sind. Unter dem "zu a konjugierten" Quaternion ist das Quaternion (3)

zu verstehen. Die "Norm" des Quaternions a ist durch die Gleichung definiert: (4)

N(a) = aa' = a~

+ ai + a~ + a~.

Diese Zahl verschwindet nur, wenn a = 0 ist. Wenn a von Null verschieden ist, so bedeute a- 1 das Quaternion

(5)

a

-1-

-

1 N(a)

I

a'

welches offenbar die Gleichungen

(6) befriedigt. Bedeuten a und b irgend zwei Quaternionen, so ergibt eme leichte Rechnung, dass

(7)

(ab)'= b' a'

ist, woraus dann weiter die fundamentale Gleichung

(8)

N(ab) = N(a)N(b)

folgt. - Da die Faktoren in einem Produkte nicht vertauschbar sind, so gibt es zwei im allgemeinen verschiedene Quotienten eines Quaternions a durch ein Quaternion b, welches letztere von Null verschieden vorausgesetzt wird. Diese Quotienten sind die Lösungen ab- 1 und b- 1 a der Gleichungen a = xb bzw. a = bx.

Über die Zahlentheorie der Quaternionen.

305

Im folgenden wird nur von solchen Gleichungen zwischen Quatermonen a, b, c, . .. l die Rede sein, welche die Gestalt

R1 ( a , b, c , . . . l)

(9)

=

R2 ( a, b, c , . . . l)

besitzen, wo R1 und R 2 durch ausschliessliche Anwendung der Addition, Subtraktion, Multiplikation und Division aus a, b, c, . .. l gebildet sind. Ich werde daher unter einer Gleichung zwischen Quaternionen schlechthin stets eine Gleichung der Form (9) verstehen. Dies vorausgeschickt, gehe ich dazu über, die Begriffe "Quaternionenkörper" und "Permutationen" eines solchen Körpers zu definieren. "Ein System von unendlich vielen Quaternionen heisst ein "Körper", wenn in dem Systeme die Operationen der Addition, Subtraktion, Multiplikation und Division (abgesehen von der Division durch 0) unbeschränkt ausführbar sind." "Ordnet man jedem Quaternion a eines Körpers nach einem bestimmten Gesetze ein Quaternion f (a) zu, so heisst die Substitut,ion ( a, f (a)) eine "Permutation" des Körpers, wenn durch die Anwendung dieser Substitution jede Gleichung zwischen Quaternionen des Körpers in eine richtige Gleichung übergeht." Die Substitution (a,f(a)) ist stets und nur dann eine Permutation, wenn die Quaternionen f(a) nicht sämtlich Null sind und wenn ferner die beiden Gleichungen

(10)

f(a

+ b) =

f(a)

+ f(b),

f(ab)

=

f(a)f(b)

bestehen, unter a, b zwei beliebige Quaternionen des Körpers verstanden1). Durchläuft a die Quaternionen des Körpers, so bildet die Gesamtheit der Quaternionen f(a) wiederum einen Körper. Neben den soeben definierten Permutationen hat man hier (wie überhaupt bei den Körpern in Zahlsystemen, die eine nicht-kommutative Multiplikation besitzen) noch eine andere Art von Substitutionen zu betrachten, die ich "Inversionen" nennen will. Bedeutet wieder a jedes Quaternion eines Körpers, so soll die Substitution (a, f(a)) eine Inversion des Körpers genannt werden, wenn die Quaternionen f(a) nicht sämtlich verschwinden und wenn ferner für je zwei Quaternionen a, b des Körpers die Gleichungen 1 ) Vgl. R. Dedekind: Vorlesungen über Zahlentheorie von P. G. Lejeune Dirichlet (4. Aufl., Braunschweig 1894), S. 456ff.

20

306

Zahlentheorie.

f(a

(10')

+ b)

= f(a)

+ f(b),

f(ab) = f(b) f(a)

gelten. Da die Substitution (a, a'), wo a' das zu a konjugierte Quaternion bedeutet, offenbar eine Inversion ist, so wird (a,f(a')) die allgemeinste Inversion vorstellen, wenn (a, f(a)) die allgemeinste Permutation ist. Das nächstliegende Beispiel eines Körpers wird von der Gesamtheit aller Quaternionen gebildet. Für diesen Körper Q hat man jedenfalls die folgenden Permutationen: 1) Es bedeute q ein von Null verschiedenes, übrigens beliebiges Quaternion. Ordnet man nun dem Quaternion a das Quaternion qaq- 1 zu, so ist hierdurch eine Permutation des Körpers Q definiert, wie aus den Gleichungen q(a

+ b)q-

1

= qaq- 1 + qbq-1, q(ab)q- 1 = qaq- 1 • qbq- 1

erhellt. 2) Es mögen ot, ß, y eine Permutation der Indices 1, 2, 3 bilden. Sodann bezeichne f(a) dasjenige Quaternion, welches aus a dadurch hervorgeht, dass man i 1, i 2, i 3 durch ± ia, ± iß, ± iY bzw. ersetzt, wobei die Vorzeichen der Bedingung ± ia · ± i ß • ± iY = -1 genügen sollen. Die Substitution ( a, f(a)) ist wiederum eine Permutation des Körpers Q. Denn jede Gleichung zwischen Quaternionen bleibt richtig, wenn man auf dieselbe die Substitution

(± ~1 ' ±~2 ' ±~3) ~a'

~ß'

1y

anwendet,

weil diese Substitution die Gleichungen (1) in sich überführt. Die Anzahl der zuletzt genannten Permutationen beträgt 24. Es wird sich weiter unten ergeben, dass die Permutation (a, qaq- 1) durch geeignete Wahl von q mit jeder dieser 24 Permutationen zum Zusammenfallen gebracht werden kann. Da jeder Quaternionenkörper ein Unterkörper von Q ist, so stellen die unter 1) und 2) genannten Zuordnungsgesetze auch für jeden beliebigen Körper Permutationen dar, was übrigens auch unmittelbar einleuchtet. § 2.

Der Körper R und seine Permutationen. Ein Quaternion a = a 0 + a1 i 1 + a 2 i 2 + a8 i8 möge "rational" heissen, wenn seine Komponenten a.0 , a1 , a 2 , a8 gewöhnliche rationale Zahlen sind. Die Gesamtheit aller rationalen Quaternionen bildet einen Körper R, auf welchen sich alle nun folgenden Betrachtungen

307

Ober die Zahlentheorie der Quaternionen.

beziehen 1). Zunächst beschäftige ich mich mit. der Aufgabe, alle Perrnutationen des Körpers R zu bestimmen. Es sei (a, f(a)) irgendeine Permutation von R. Vermöge derselben gehe i 1 , i 2 , i 3 bzw. über in j 1 , j 2 , j 3 • Dann wird ein beliebiges rationales Quaternion a = a0 + a1i 1 + a 2i 2 + a 3 i 3 in f(a) = a0 + a1j1 + a 2 j 2 + a3 j 3 übergehen. Ich behaupte nun, dass das Quaternion q sich so bestimmen lässt, dass j 1 = qi1q- 1, j2 = qi 2q-1, j3 = qi3 q- 1 und folglich f(a) = qaq-1 wird. Indem man die Permutation (a, f(a)) auf die Gleichungen (1) in § 1 anwendet, erkennt man zunächst, dass (1)

i1i2

=

-j2i1

=

-,·21"22 _' _ 3-1 1"21_ fs, i2is = -isi2 = iv

isi1 = -j1is

=

i2

sein muss. Nun sei b ein beliebiges von Null verschiedenes Quatermon und Dann ist q1i 1 = bi2 + j 1bi3, j1q1 = j1bi 3 + bi2, und folglich, falls q1 nicht Null ist, (3)

Falls aber q1 = 0 ist, hat man bi1 = j 1 b und dann wird also b für q1 gesetzt die vorstehende Gleichung befriedigen. Nachdem so die Existenz eines Quatarnions qv welches der Gleichung (3) genügt, nachgewiesen ist, setze ich (4)

Sei nun (5)

je nachdem k2 = i 2 ist oder nicht. Man hat dann

(6) 1 ) Allgemein bilden die Quaternionen, deren Komponenten irgendeinem algebraischen Zahlenkörper K angehören, einen Quaternionenkörper. Unter diesen ist der Körper R der einfachste. Ist K ein quadratischer Zahlenkörper, so steht die Theorie des entsprechenden Quaternionenkörpers in engem Zusammenhange mit den Untersuchungen, welche Herr Hermi te in der Abhandlung "Sur Ia theorie des formes quadratiques", Crelles Journal, Bd. 47 (1854), S. 313-342 und 343-368, veröffentlicht hat [Oeuvres, Bd.: I, S. 200-233 und 234-263].

308

Zahlentheorie.

Im ersten Falle, wo q2 = 1 zu nehmen ist, leuchtet dies unmittelbar ein. Im zweiten Falle aber folgen die Gleichungen (6) aus den Relationen q2i2 = - k2i1- ia, k2 i2 + 1 ' q2 i1 =

k2q2 = - ia- k2i1, k1 q2 = i1 q2 = (i1 k2 i1) i2

+1=

k2 i2

+ 1'

wobei von der Gleichung i 1k2i 1 = k1k2k1 = k3k1 = k2 Gebrauch gemacht wurde. Infolge der Gleichungen (6) wird nun

Kombiniert man hiermit die Gleichungen (4), so erkennt man, dass das Quaternion q = q1 q2 den Gleichungen (8)

genügt. Es gilt also der folgende Satz: "Die allgemeinste Permutation des Körpers R der rationalen Quaternionen entsteht, wenn man dem Quaternion a das Quaternion qaq- 1 zuordnet, unter q ein beliebig gewähltes von Null verschiedenes Quaternion verstanden.'' Hieran knüpft sich die Frage, unter welcher Bedingung zwei Quaternionen q und q1 zu derselben Permutation des Körpers R Anlass geben. Sei für einen Augenblick q- 1q1 = q2. Die Permutationen (a, qaq- 1) und (a, q1 aq1 1) sind dann offenbar nur identisch, falls (a, q2 aq:; 1) die identische Permutation ist. Aus den Gleichungen q2i 1 = i 1q2, q2i 2 = i 2q2 folgt aber, dass q2 ein reelles Quaternion r ist. Es ergibt sich also die folgende Antwort auf die aufgeworfene Frage: "Die beiden Permutationen (a, qaq- 1) und (a, q1aq1 1) des Körpers R sind stets und nur dann identisch, wenn q1 = rq ist, unter r eine reelle Zahl verstanden." Wenn q ein rationales Quaternion ist, so durchläuft qaq- 1 gleichzeitig mit a die Gesamtheit der rationalen Quaternionen und die Permutation (a, qaq- 1) führt also den Körper R in sich über. Wenn umgekehrt der Körper R durch die Permutation (a, qaq- 1) in sich übergeht, ·so hat man qi1 = j1 q, qi2 = j2 q, qi3 = j3 q, wo j 1, j 2, j 3 rationale Quaternionen bedeuten. Durch diese Gleichungen müssen nach dem vorhergehenden Satze die Komponenten von q bis auf einen reellen Faktor bestimmt sein und somit folgt: "Bezeichnet q ein beliebiges von Null verschiedenes rationales Quaternion, so stellt (a, qaq- 1 ) die allgemeinste Permutation vor, die den Körper R in sich überführt."

Über die Zahlentheorie der Quaternionen.

309

§ 3.

Die ganzen Quaternionen. Ein System von unendlich vielen Quaternionen heisse ein "Integritätsbereich", wenn in dem Systeme die Operationen der Addition, Subtraktion und Multiplikation unbeschränkt ausführbar sind. Lassen sich in dem Systeme überdies eine endliche Anzahl von Quaternionen q1 , q2 , ••• qn so auswählen, dass aus diesen durch ausschliessliche Anwendung von Addition und Subtraktion alle Quaternionen des Systemes hervorgehen, so heisse der Integritätsbereich "endlich". In der Folge werde ich unter "Integritätsbereich" schlechthin stets einen solchen verstehen, der endlich ist und nur rationale Quaternionen enthält. In bekannter Weise ergibt sich für einen solchen Integritätsbereich der Satz: In einem Integritätsbereich lassen sich in mannigfaltiger Weisen ~ 4 Quaternionen q1 , q2 , ••• qn so auswählen, dass jedes Quaternion q des Bereiches auf eine und nur eine Art in der Form

darstellbar ist, unter k1 , k2 , • • • kn rationale ganze Zahlen verstanden. Ein System von solchen Quaternionen g_1 , q2 , ••• qn heisst eine "Basis" des Bereiches. Von grundlegender Bedeutung für die Zahlentheorie der Quaternionen ist nun die Frage nach dem grössten Integritätsbereiche, welcher die Einheiten 1, i 1 , i 2 , i 3 enthält. Auf diese Frage gibt der folgende Satz die Antwort: Man verstehe unter e das Quaternion (1)

Dann bilden die Quaternionen (2)

wo k0 , k1 , k2 , k3 alle ganzen rationalen Zahlen durchlaufen sollen, etnen Integritätsbereich J mit der Basis (e, i 1 , i 2 , i 3 ) • Dieser ist der grösste I ntegritätsbereich, welcher die Einheiten 1, i 1 , i 2 , i 3 enthält. Die Quaternionen mit ganzen rationalen Komponenten bilden ebenfalls einen Integritätsbereich, welchen ich mit J 0 bezeichnen werde. Offenbar ist J 0 ganz in dem Bereiche J enthalten. Man überzeugt sich ohne Schwierigkeit, dass es ausser J und J 0 keinen weiteren Integritätsbereich gibt, welcher die Einheiten 1, i 1 , i 2 , i 3 enthält. Nach Analogie der Theorie der endlichen Zahlenkörper hat man in dem Be-

310

Zahlentheorie.

reiche J einfachere Teilbarkeitsgesetze zu erwarten, wie im Bereiche J 0 , was die weitere Untersuchung vollkommen bestätigt. Ich stelle deshalb die Definition des ganzen Quaternions folgendermassen: "Ein Quaternion heisst "ganz", wenn es dem Integritätsbereiche J angehört.'' Der allgemeine Ausdruck (2) eines ganzen Quaternions lässt sich offenbar auf die Form bringen (3)

wenn man

setzt. Hieraus schliesst man, dass die Gleichung (3) das allgemeinste ganze Quaternion g darstellt, wenn man unter g0 , g1 , g2 , g3 irgendwelche ganze Zahlen versteht, die entweder sämtlich gerade oder sämtlich ungerade sind. Die Norm des Quaternions g wird durch die Glei'Chung (4)

gegeben. Endlich ist zu bemerken, dass das durch (2) dargestellte Quaternion g dem Bereiche J 0 angehört oder nicht, je nachdem k0 gerade ist oder nicht. An den Begriff des ganzen Quaternions knüpfen sich nun unmittelbar die folgenden Definitionen: Das ganze Quaternion a heisst durch das ganze Quaternion b rechtsseitig (linksseitig) teilbar, wenn die Gleichung a = cb (a = bc) durch ein passend gewähltes ganzes Quaternion c befriedigt werden kann. Es soll dann auch b ein rechtsseitiger oder rechts stehender ( resp. linksseitiger oder links stehender) Divisor von a genannt werden. Hiernach ist das von Null verschiedene ganze Quaternion b ein rechtsseitiger (linksseitiger) Divisor von a, wenn ab- 1 (b- 1 a) ganz ist. Neben den genannten Bezeichnungen sollen auch die Redewendungen gebraucht werden: a sei durch b rechtsseitig (linksseitig) teilbar und b gehe rechtsseitig (linksseitig) in a auf. Soll das ganze Quaternion 8 in jedem anderen rechtsseitig aufgehen, so muss e- 1 ganz sein und 8 geht dann auch linksseitig in jedem ganzen Quaternion auf. Ein solches Quaternion 8 heisse eine "Einheit". Da, wie leicht zu sehen, N (8) = 88' = 1 die notwendige und hinreichende Bedingung

Über die Zahlentheorie der Quaternionen.

311

dafür ist, dass e eine Einheit ist, so erhält man alle Einheiten durch Auflösung der Gleichung N (g)

=

! (g~ + gi + g~ + g~) = 1.

Es gibt daher 24 Einheiten, nämlich (5)

§ 4.

Die Permutationen der ganzen Quaternionen. Eine Permutation des Körpers R, welche jedes ganze Quaternion in ein eben solches überführt, welche also den Bereich J in sich transformiert, soll eine "Permutation der ganzen Quaternionen" heissen. Solche Permutationen werden offenbar durch die Festsetzung definiert, dass dem Quaternion a das Quaternion (1)

f(a) = we- 1

zugeordnet sein soll, unter e eine Einheit verstanden. Aber auch das Zuordnungsgesetz (2)

f(a)

=

Ca c-t,

wo zur Abkürzung (3)

gesetzt worden ist, stellt eine Permutation der ganzen Quaternionen Yor, wie aus der Gleichung hervorgeht. Durch die Kombination von (1) und (2) entstehen die weiteren Permutationen (1')

f(a) = eCaC- 1 c-1,

und ich will nun zeigen, dass mit (1) und (1') sämtliche Permutationen der ganzen Quaternionen erschöpft sind. Zunächst folgt aus dem vorletzten Satze von § 2, dass (1) und (1') im ganzen 24 verschiedene Permutationen darstellen. Nun kann es aber nicht mehr als 24 Permutationen der ganzen Quaternionen geben. Denn durch jede solche Permutation müssen i 1 , i 2 , i 3 in drei ganze Quaternionen j 1 , j 2 , j 3 übergehen, welche den Gleichungen (1) von § 2 genügen und folglich mit ± io, ± iß, ± iY übereinstimmen, unter rx, ß, y eine Permutation von 1 , 2, 3 verstanden. Die Vorzeichen sind zugleich der Bedingung

312

Zahlentheorie.

± ia · ± i ß • ± ir = -1 unterworfen. Hieraus folgt, dass jede Permutation der ganzen Quaternionen mit einer der 24 in § 1 erwähnten Permutationen

(± ~ 1 ' ±~2 ' ±~3) ~a'

~ß'

~y

zusammenfällt.

Da zu jeder Einheit e die Einheit e1 so bestimmt werden kann, dass e?; = ?; e1 ist, so lassen sich die 12 Permutationen (1') auch in folgender Form darstellen: (1")

Auf Grund des vorstehenden Ergebnisses ist es nun leicht, die folgende Frage zu erledigen : Welche ganzen Quaternionen v haben die Eigenschaft, dass jedes ganze Quaternion a, welche~ linksseitig durch v teilbar ist, auch notwendig rechtsseitig durch v teilbar ist und umgekehrt? Hierzu ist erforderlich und hinreichend, dass jedes Quaternion vc auch in der Form c1 v darstellbar ist, dass also gleichzeitig mit c auch vcv- 1 ganz ist. Diese Bedingung lässt sich nun dahin aussprechen, dass (a, vav- 1 ) eine Permutation der ganzen Quaternionen sein muss. Folglich sind die Quaternionen v durch die Gleichungen (4)

v=re, v=ri;e

gegeben, in welchen ?; = 1 + i 1 ist, e eine beliebige Einheit, r eine beliebige reelle ganze Zahl bedeutet. Die charakteristische Eigenschaft der Quaternionen v kann auch dahin ausgesprochen werden, dass sie mit der Gesamtheit der ganzen Quaternionen vertauschbar sind. Bei der Aussage: ein ganzes Quaternion a sei durch ein Quaternion v teilbar, darf offenbar der Zusatz "rechtsseitig" oder "linksseitig" fortgelassen werden.

§ 5.

Der grösste gemeinsame Teiler zweier ganzer Quaternionen. Wenn g ein ganzes Quaternion und m eine positive ganze Zahl ist, so lässt sich das ganze Quaternion q so bestimmen, dass die Norm von g- qm kleiner als m 2 wird. Denn ist

so werden die Komponenten von g- qm, nämlich

313

Über die Zahlentheorie der Quaternionen. 1

1

2 (k 0 - m t0 ) , 2 (k 0

+ 2 k1 -

! (k

0

m (t0 + 2 t1)), 2 (k 0 1

+ 2k3 -

m(t0

+ 2 k2 -

m (t 0

+ 2 t2)),

+ 2t3)),

durch geeignete Verfügung über die ganzen Zahlen t0 , t1·, t2 , t3 bezüglich kleiner oder gleich

und daher die Norm von g- qm höchstens gleich 1 _L 1 (16'4

+ 41 + 4m 1) 2 < 2 m.

Aus dieser Bemerkung ergibt sich nun leicht der Satz: Bezeichnen a und b zwei ganze Quaternionen, von welchen das letztere nicht Null ist, so lassen sich die ganzen Quaternionen q, c und q1 , c1 so bestimmen, dass (1) (1')

a a

= =

qb + c, bq1 + cl

und zugleich N (c) < N (b), sowie N (c1) < N (b) wird. Um die Existenz der Quaternionen q, c einzusehen, hat man nur die obige Bemerkung auf den Fall anzuwenden, wo g =ab', m = bb' ist. Ebenso ergibt die Annahme g = b' a, m = b' b die Existenz der Quaternionen q1 , c1 • Auf diesen Satz lässt sich offenbar ein rechtsseitiger (1) und ein linksseitiger (1') Divisions-Algorithmus gründen, woraus dann weiter die Existenz eines rechtsseitigen und eines linksseitigen grössten gemeinsamen Teilers irgend zweier ganzen Quaternionen, die nicht beide Null sind, folgt. Indessen ziehe ich es vor, die Theorie der grössten gemeinsamen Teiler auf den Begriff des Quaternionen-Ideals zu stützen. Ein System nicht sämtlich verschwindender ganzen Quaternionen heisse ein rechtsseitiges (linksseitiges) Ideal, wenn mit a und b auch a + b, a--b und g a ( a g) dem Systeme angehören, unter g ein beliebiges ganzes Quaternion verstanden. Bezeichnet d irgendein von Null verschiedenes ganzes Quaternion und durchläuft g die Gesamtheit aller ganzen Quaternionen, so bildet das System (gd) ein rechtsseitiges, das System (dg) ein linksseitiges Ideal. Solche Ideale mögen rechtsseitige bzw. linksseitige "Hauptideale" heissen. Es gilt nun der Satz: "Jedes Quaternionen-Ideal ist ein Hauptideal." In der Tat: es sei a ein rechtsseitiges Ideal und d eines derjenigen nicht verschwindenden Quaternionen des Ideals, welche eine möglichst

314

Zahlentheorie.

kleine Norm haben. Ist nun a irgendein Quaternion des Ideals a, so gehört auch a- qd dem Ideale an, unter q ein beliebiges ganzes Quaternion verstanden. Dieses lässt sich aber so bestimmen, dass N(a-qd) < N(d) und folglich Null wird. Es ist also a = qd, w.z.b.w. Ebenso folgt die Richtigkeit unseres Satzes für linksseitige Ideale. Bezeichnen jetzt a und b irgend zwei ganze Quaternionen, die nicht beide Null sind, so bildet die Gesamtheit der Quaternionen ga + hb (bzw. ag + bh), wo g und h alle ganzen Quaternionen durchlaufen, ein rechtsseitiges (bzw. linksseitiges) Ideal. Aus dem vorhergehenden Satze folgt daher: "Je zwei ganze Quaternionen a und b, die nicht beide Null sind, haben einen gemeinsamen rechtsseitigen ~eiler d, welcher in der Form d = ga und

e~nen

+ hb

gemeinsamen linksseitigen Teiler d1 , welcher

~n

der Form

darstellbar ist." Hier bedeuten g, h, g1 , h1 ganze Quaternionen. Die Teiler d und d1 heissen der grösste gemeinsame rechtsseitige oder rechts stehende bzw. linksseitige oder links stehende Teiler von a und b. Da zwei Quaternionen nur dann dasselbe Hauptideal erzeugen, wenn sie sich um einen Einheitsfaktor unterscheiden, so ergibt sich: "Der Teiler d ist bis auf einen links stehenden, der Teiler d1 bis auf einen rechts stehenden Einheitsfaktor bestimmt." Jeder rechtsseitige (linksseitige) Divisor von d (d1) ist gemeinsamer rechtsseitiger (linksseitiger) Divisor von a und b und umgekehrt. Wenn d (d1 ) eine Einheit ist, so sollen a und b rechtsseitig (linksseitig) teilerfremd heissen. Sind a und b rechtsseitig teilerfremd, so lässt sich die Gleichung ga + hb = 1

durch ganze Quaternionen g, h befriedigen und umgekehrt. Entsprechendes gilt, wenn a und b linksseitig teilerfremd sind. Es leuchtet ein, dass N (a) und N (b) einen von 1 verschiedenen gemeinsamen Teiler besitzen, falls a und b einen rechtsseitigen oder linksseitigen gemeinsamen Divisor haben, der nicht eine Einheit ist. Dieser Satz lässt sich für den Fall umkehren, dass eines der beiden Quaternionen a und b zu den Quaternionen v gehört; mit anderen \V orten, es lässt sich folgendes beweisen: "Ein beliebiges Quaternion a und ein Quatern,ion v, welches mit der Gesamtheit der ganzen Quaternionen vertauschbar ist, sind stets gleich-

315

Über die Zahlentheorie der Quaternionen.

zeitig rechtsseitig und linksseitig teile-rfremd oder nicht. Und zwar tritt der erste oder der zweite Fall ein, je nachdem N (a) und N (v) teilerfremd sind oder nicht." Der Beweis dieses Satzes beruht darauf, dass jede der beiden Gleichungen ga + hv = 1 und ag + vh = 1 nur bestehen kann, wenn N (a) und N (v) teilerfremd sind. Ist z. B. v = r eine reelle ganze Zahl, so zieht die Gleichung ga + hr = 1, die andere N(g) · N(a) = N(1- hr) = 1 + N(h) · r 2 - (h

+ h')r

nach sich, aus welcher hervorgeht, dass N(a) und N(r) = r 2 keinen gemeinsamen Primfaktor haben können. Nach dem ersten Teil des vorstehenden Satzes darf bei der Aussage: die beiden Quaternionen a und v seien teilerfremd oder nicht, der Zusatz "rechtsseitig" oder "linksseitig" fortgelassen werden. § 6.

Gerade und ungerade Quaternionen. Primäre Quaternionen. Bezeichnet v irgendeines der Quaternionen r s, r Cs, die mit der Gesamtheit der ganzen Quaternionen vertauschbar sind, so soll die Kongruenz (1) a b (mod. v)

=

ausdrücken, dass die Differenz a - b der beiden ganzen Quaternionen a und b durch v teilbar ist. Solche Kongruenzen dürfen wie Gleichungen addiert und subtrahiert werden, und die beiden Seiten können mit demselben ganzen Quaternion sowohl linksseitig, wie rechtsseitig multipliziert werden. Auch besteht zugleich mit (1) stets die Kongruenz \ a = b' (mo d. v;,

(2)

I

-

wo a', b' wie gewöhnlich die zu a und b konjugierten Quaternionen bedeuten. In diesem Paragraphen betrachte ich nur Kongruenzen nach den Moduln v = C= 1 + i 1 , v = 2, v = 2 C. Da i 1 i 2 i 3 1 (mod. 1 + i 1), so ist jedes ganze Quaternion, wie aus (2) in § 3 hervorgeht, einem der Quaternionen 0, 1, (!, (! + 1 e2 (mod. 1 + i 1) kongruent. Es bilden also

= = =

=

0,1,(!,(! 2

ein vollständiges Restsystem nach dem Modul C= 1 ergeben sich die folgenden Sätze:

+ i.

Hieraus

316

Zahlentheorie.

"Ein Quaternion gehört stets und nur dann dem Bereiche J 0 an, d. h. es besitzt stets und nur dann ganzzahlige Komponenten, wenn es kongruent 0 oder 1 nach 1 + i 1 ist." Ein Quaternion, dessen Norm gerade ist, ist durch C= 1 + i 1 teilbar, und weiter: "Ist N (a) durch 2r, aber durch keine höhere Potenz von 2 teilbar, so hat man wo b eine ungerade Norm besitzt und also zu 1 + i 1 teilerfremd i.r. Vgl. Serret, Com:s d'algebre superieure (Bd. II, Nr. 329-:-330) und Hermite, a. a. 0., S. 343 [Oeuvres, Bd. I, S. 234).

319

Über die Zahlentheorie der Quaternionen.

zusammenziehen, wenn zur Abkürzung ~1

= 1 + ri 2 + si 3 ,

~2

= i 1 + si2 -ri 3 =

~1 i1

= i 1 ~~

gesetzt wird, und wie gewöhnlich ~~. ~~ die zu ~ 1 , ~2 bzw. konjugierten Quaternionen bezeichnen. Wenn jetzt neben (8) die Kongruenz

2q =oc~ 1 + ß~ 2 - yi 1 ~ 1 + = (q -1)! = -1 (mod. q) ist, 1 5.9 ... (q-2) ( d ) ea-3 = -2· 3.7 ... (q-4) mo · q oder (72)

4

- 1.5 ... (q-6) (

d )

ea-3 = 3.7 ... (q-4) mo . q ' 4

und die Kongruenz (71) lässt sich infolgedessen auch so schreiben: (73)

... (q-2) { d ) ... (q-4) mo .q ·

(2 n) _ (2n+3)(2n+7) 8 a-t=-(2n+1)(2n+5)

§ 10.

Die Partialbrucbzerlegung der Zahl E11• Aus den Kongruenzen (40) und (66) geht nun hervor, dass e

=(2 a)

4n p-l

(mod. p)

ist und dass folglich die Partialbruchzerlegung der ZahlE,. die Gestalt hat: (74)

Hier ist die Summe über diejenigen Primzahlen p von der Form + 1 auszudehnen, für welche p -1 ·ein Divisor von 4n ist, und für jede einzelne dieser Primzahlen p bedeutet a den reellen Teil ihres primären komplexen Primfaktors a + i b. Die Zahl a kann hiernach auch definiert werden als die Basis des ungeraden Quadrates bei der Zerlegung von p in die Summe zweier Quadrate: 4k

p=a2+bs, und zwar diese Basis mit solchem Vorzeichen genommen, dass die Kongruenz a b + 1 (mod. 4) besteht. Es erübrigt noch, den auf die Primzahl 2 bezüglichen Teil ;: der Partialbruchzerlegung von En zu bestimmen. Zu diesem Zwecke bediene ich mich der Rekursionsformel (9) .

=

Entwicklungskoeffizienten der lemniskatischen Funktionen.

365

Aus dieser Formel ergibt sich leicht, dass ;~ = ~ , oder was dasselbe besagt, dass (75)

=1 (mod. 2)

2En

ist. In der Tat: die Formel (9) lässt sich, je nachdem n gerade oder ungerade ist, in die Gestalt bringen: (2n-3)(16n 2 -1).(2En)

(76)

~3 ( ~ (4r--1) (4 n--4r-1) (4n)" (2E,) . (2 E. _,)+ (2 n-1)'(4n)",}(2Er•l

resp. (77)

n-1 2

(2n-3) (16n 2-1) (2En) = 3 · ~ (4r-1) (4n-4r-1) (4n)4r(2Er) (2En-r). r=l Hierbei ist, wie man leicht erkennt, der Faktor (4n) 2 n · ; in (76) eine ganze Zahl. Nimmt man nun an, die Kongruenz (75) sei schon für die Zahlen Ev E 2 , ••• , En-l als richtig nachgewiesen, so folgt aus (76) resp. (77) ..!!__1 2

2En

=~ (4n) 4r+~(4n) 2n= }[(1+1) 4n+ (1+ i)4n+(1-1)'n+(1-i)4n_8)] (mod. 2)

r=l

resp. n-1

-2-

2En

=~ (4n) 4r=~[(1+1) 4n+ (1+i) 4n+ (1-1) 4n+(1-i) 4n-8J (mod.2), r=l

oder

2En = 1 (mod. 2).

:o

die Kongruenz (75) erfüllt ist, so gilt sie allgemein. Da aber für E 1 = Hiermit ist nun das Hauptziel dieser Untersuchung erreicht: Die Partialbruchzerlegung der Zahl En lautet wie folgt: (78) Dabei bezeichnet Gn eine ganze Zahl und die Summe ist über diejenigen 1 zu erstrecken, für welche p - 1 Primzahlen p von der Form 4 k

+

366

Zahlentheorie.

ein Divisor von 4 n ist. Die dm einzelnen Primzahl p entsprechende Zahl a ist die Basis des ungeraden Quadrates in der Zerlegung p =·a2

+ b2,

und zwar mit solchem Vorzeichen genommen, dass a ist.

=b + 1 (mod. 4) § 11.

Die ganzzahligen Teile in der Partialbruchzerlegung der Zahlen E ... Vermöge der Gleichungen (76) und (77) gelingt es, den Rest der Zahl 2E.. nach dem Modul 16 zu bestimmen. Für die niedrigen Werte von n findet man nach dem Modul 16: 1

3

3'. 7

2E1 = 5 =-3, 2E2 = 5 =7, 2E3 = 5 _13 =7, 2E = 3 4 .72.11 = _ 1 2 E = 36 .7 2 .11 5.17

4

-

'

fj

5

=7

usw.

Durch Fortsetzung der Rechnung wird man auf die Vermutung geführt, dass vom Index n = 3 ab die Kongruenz

(79)

2E.. =Sn -1 (mod. 16)

=

besteht, dass also 2E.. 7 oder -1 (mod. 16), je nachdem nungerade oder gerade ist. Diese Vermutung bestätigt sich durch folgende Schlüsse. Aus den Gleichungen (76) und (77) folgen zunächst nach dem Modul 16 die Kongruenzen :

(2n~S)(2E") ~ (4n~ 1). 3 .r~-'(4n)., (2E,) (2E~,) + ! (4n) resp.

(2n~3)(2E") =(4n~ 1). 3

·l'i'

(4n).,(2E,) (2E._,)

und hieraus, durch Multiplikation mit 4n r=n-1

(4n

+ 1,

2•

l,

in beiden Fällen

+ 1)(2n- 3). (2E..) =- ~ ~ (4n) 4 ,.(2E,.)(2E.._,.). r=l

r•l

(2E

Entwicklungskoeffizienten der lemniskatischen Funktionen.

367

Sei nun n > 5 und überdies die Kongruenz (79) schon bewiesen für n=3,4, ... ,n-1. Dann folgtl) (4n + 1) (2n-3) (2En)

=-i[ 2.(4n) 4 (2E1)(2En_ 1)+2(4n)s(2E2)(2En_ 2)

+r~3(4n) 4,(2E,)(2En-r)]

=+i-[2. (4n) 4 • 3. (S(n-1) -1 )-2. (4n) 8 .7. (S(n-2) -1) 3

_ : J (4n) 4,(Sr-1) (Sn-Sr-1)]. Nach leichten Reduktionen und unter Benutzung der Kongruenz 2) (4n) 4, = (2n) 2, (mod.16) kommt: (4n + 1)(2n- 3)(2En)

= 3 [ (2n) 2 (Sn + 5) + (2n) 4 (Sn + 7) + (Sn-1) ·

~ rJ~(2n) 2r].

Berücksichtigt man nun, dass

so erkennt man, dass die vorhergehende Kongruenz (4n + 1) (2n-3) (2En) = 3[6. (2n) 2 + S(2n) 4 -(Sn-1)] = 2n(2n-1) + 2n(2n-1) (2n-2) (2n-3) +Sn+3 = 2n(2n-1) + 4n(n-1) +Sn+ 3 = Sn 2 + 2n + 3 liefert. Da Sn 2 =Sn (mod. 16), so ergibt sich schliesslich 10n+3 . 10n+3 2 En=(4n+l)·(2n-3)=-2n-3=Sn-1 (mod.16), 1 ) Die folgenden Kongruenzen beziehen sich sämtlich auf den Modul 16, sofern nicht ein anderer }!odul ausdrücklich angegeben ist. 2 ) Es ist

(4 n) = (2 ) 4r

und für jeden Wert von k

r-1

-,-,1-[4(n-k)-1J [4(n-k)-SJ

n ar ~J

k=O

(4k+l)(4k+3)

[4(n- k) -1][4(n- k)- 3]:(4k+ 1)(4k + 3)

'

=1· 3 (mod.16).

368

Zahlentheorie.

woraus nun die Gültigkeit der Kongruenz (79) für n ~ 3 folgt, da sie für n = 3, 4 und 5 feststeht. Die Kongruenz (79) gibt Aufschluss über das Verhalten der ganzzahligen Teile Gn der Partialbruchzerlegung (78) der Zahlen En in bezug auf den Modul 8. Setzt man, unter der Voraussetzung n > 2, die Partialbruchzerlegung von En in (79) ein, so ergibt sich zunächst 4n

Gn wo

_ =

"""' (2a)s>-1

4n -1-~

'P

(mod. 8).

Die hier auftretenden Primzahlen p sind von der Form 4 1, so lässt die Zahl Gn durch 4 dividiert den Rest 1 oder den Rest 3, je nachdem 4n + 1 Primzahl ist oder nicht. Dass die Zahlen Gn, abgesehen von G1 = 0, sämtlich ungerade sind, ist eine selbstverständliche Folge der vorstehenden Sätze.

§ 12.

Die Entwicklungskoeffizienten der Funktion -} q;2 ( u). Die Kongruenzen (62) und (67) bestehen unter der Voraussetzung, dass 2n < p resp. 2n < q ist. Diese Voraussetzung ist für n = 1 stets erfüllt. In diesem Falle ist überdies, wie schon oben bemerkt wurde, 42t> = 42f = 0 oder = 2ek_ 1 , je nachdem k gerade oder ungerade ist. Daher führt die 2

Annahme n = 1 zu folgendem Satze über die Entwicklungskoeffizienten der Funktion ~ q; 2 (u), welche durch die Gleichung (16), nämlich

definiert sind: Bezeichnet p e~ne Primzahl besteht die Kongruenz

= 1 (mod. 4) und ist p' = p~l, so

(81)

(n

=

0, 1, 2, ... )

durch welche die Reste der Zahlen en (mod. p) auf die der ersten p' + 1 unter ihnen zurückgeführt werden. Überdies ist nach (63) und (64) - 3.7.1l. .. (p-2)- 2 ( d ) eP, = 1.5.9 ... (p-4) = a mo . p .

Bezeichnet andererseits q eine Primzahl so ist nach (72) -

=3 (mod. 4) und ist q' =

1.5.9 ... (q-6) (

eil,= 3.7.1l. .. (q-4)

d ) mo · q

und die Zahlen eq'+l• e11.+ 2 , • •• sind sämtlich durch q teilbar.

q~a,

371

Entwicklungskoeffizienten der lemniskatischen Funktionen.

Diese Eigenschaften der Zahlen e,. lassen sich, vermöge der Gleichung (19), auf die Zahlen E,. übertragen. Beispielsweise ergibt sich so, dass der Zähler der Zahl

q!

1 ist. Indessen dürften diese Sätze den Faktor q besitzt, sobald n > nur ein untergeordnetes Interesse beanspruchen, da für die Zahlen E,. allgemeinere Kongruenzen zu gelten scheinen, welche jene Sätze in sich enthalten. Zur Berechnung der Zahlen e,. kann man sich einer Rekursionsformel bedienen, die sich folgendermassen ergibt. Die Funktion z = 1J? 2 (u) genügt der Differentialgleichung

(82)

aus welcher durch Differentiation

(83)

d2z = du 2

2-6z2

folgt. Setzt man hier

so ergibt sich durch Koeffizientenvergleichung (84) wobei die Summe über alle nicht negativen Zahlen r, 8 zu erstrecken ist, welche die Bedingung r + 8 = n befriedigen. Die Rekursionsformel (84) vereinfacht sich noch etwas, wenn man

(85)

(n

=

0, 1, 2, ... )

setzt. Man erhält dann offenbar für die Zahlen iJ,. die Gleichung

(86)

(n

=

0, 1, 2, ... )

aus welcher hervorgeht, dass diese Zahlen positive ganze Zahlen sind.

372

Zahlentheorie.

I. Tabelle der Zerfällungen p = a 2

+b

2,

p

a

b

2a

5 13 17 29 37 41

-1 3 1 -5 -1 5

2 2 4 2 6 4

2 6 2 -10 - 2 10

(a:: b + 1 (mod.4)).

-

II. Tabelle der Zahlen En = Gn + 21

+

4n

"""" (2a)j)-1 ~ P •

(Wegen des raschen Anwachsens der ganzzahligen Teile Gn sind diese nur bis n = 6 in der Tabelle angegeben.) 1

1 2 -2--5

3

-1 +-!_+~

Et=

10

E2 =

10

Es=

34 .7 10.13

E4 =

3 .7 .11 10.17

E5 =

36 .72.11 10

E6 =

3 .7 .11 .19 10.13

= 13265939 +

E7=

39.7 4 .112.19.23 10.29

G7

1 27 +----2 5

Es=

310 .7 4 .11 2 .19.23.223 10.17

Gs

+_!_+~ 2 5

Eg=

314.7 5 .11 3 .19. 23. 31 . 61 10.13.37

Gg

1 29 63 +---+2 5 13

2 -37

Eto=

31 3 .7 5 .11 3 • 192. 23. 31 . 2381 10.41

Gto

1 210 +2- + 5-

+10 41

Eu=

315.7 6 .11 4 .19 4 .23.31 10

Gu

1 2 11 +---2 5

Gt2

1 2 12 64 23 + 2 + 5 + 13+17

4

7

2

5+_1:_-~+~ 2

2

12-

~

39299 + _1_ 2

~

253 +

E _ 316.7 5.11 4.19 2.232.31.43.1162253 _ 10.13.17

-

5

_!_2 +

2

3

5

1

13 +

5

~

17

5

28

-2 + 5

62 + 13 10 -29 22 + 17

eo

1 el = -23.32 28 .33.7 e2 = e 3 = - 210 • 35 • 72. 11 216 . 36. 72 .11 . 41 e4 = e 5 = -2 19 .38 .74 .11 2.19 224 • 39 • 73. 11 2. 19 . 23 .113 e6 = e7 = -225 .3 11 .74 .11 2.19.23.223.257 232 .312 .75 .11 3.19.23.31.61.109 e8 = e9 = -235 .314 .75 .11 4 .192 .23.31 2 .2381 240 .315 .76.11 3 .194 .23.31.397.2113 e1o= e 11 = --2 42 .3 17 .76.11 4 .192.232.31.43.241.1162253

=

Reste nach dem l\fodul p:

1 -2 -1 2 1 -2 -1 2 1 -2 -1 2

1 6 -2 6 10 1 10 -5 6 -5 9 10 2 -2 2 -8 4 -4 4 1 8 -8

-4

1 1 15 12 -1 13 7 12 -10 24 25 10 15

1 2 25 1 9 1 14 25 18 -2 -4 24

1 10 4 23 0 -14 38 - 6 10 -4 10 18

p=5 p=13 p=17 p=29 p=37 p=41 (p' = 1) (p'= 3) (p'= 4) (p'= 7) (p'= 9) (p'=lO)

III. Tabelle der Zahlen e11 •

i

c;.)

~

c;.)

i"

~

""J

f. f

i

~

f

~

)

-

-

o0u

(: )'

o0u ( ;

:v (:) ' o

0

t> (

x, y, z

)

n

1

za

ox oy oz du' ou' ou ox oy oz

dV'dV'dV 25

386

Zahlentheorie.

besitzt den Gleichungen (2) zufolge den Wert 1. Daher ist

x, y, z (1')

J =

ox iJy oz ()U•(f;i• ou du dv. ox oy i)z

f f f (: ' ;) ·-!a G

()V' (}V ' ()V

Nun definiere man die Symbole dx dy, dy dz, dz dx durch die Gleichungen d(y,z) d(z,x) d(x,y) (4) dx d y= d(u,v)dudv,dydz= d(u,v)dudv,dzdx= d(u,v)dudv. Dann lässt sich die Gleichung (1') so schreiben: (5)

wobei

(6)

J

J

= jt(x, y, z)(xdydz + ydzdx + zdxdy), G

f(x, y,z) =

:s t(:,;)

eine Form - 3. Grades von x, y, z bezeichnet. Die Gestalt (5) des Integrales J enthält die bis auf die erwähnten Bedingungen willkürliche Funktion z von u und v. Sie kann als die homogene Gestalt des Doppelintegrales (1) bezeichnet werden. § 2.

Projektive Doppelintegrale. Die Betrachtung des vorigen Paragraphen führt naturgernäss zu dem Begrüf des projektiven Doppelintegrals, den ich in gegenwärtigem Paragraphen entwickeln will. Es seien x,y, z homogene Punktkoordinaten in einer Ebene. Jedem Tripel reeller Zahlen x, y, z, die nicht alle drei Null sind, entspricht also ein bestimmter Punkt der Ebene, während umgekehrt einem beliebig angenommenen Punkte der Ebene unendlich viele zueinander proportionale Tripel (x, y, z) als Koordinaten entsprechen. Wenn nun

{1)

l

=ocx + ßy + yz

eine Linearform, deren Koeffizienten oc, ß, 'Y nicht alle drei Null sind, bezeichnet, so kann man für jeden Punkt, der nicht auf der Geraden l = 0 liegt, die Koordinaten, und zwar auf eine Weise, so wählen, dass sie der Gleichung ocx + ßy + yz = 1

Über eine Darstellung der Klassenzahl binärer quadratischer Formen.

387

genügen. Die so gewählten Koordinaten mögen "normiert bezüglich der Linearform l" genannt und mit x 1 , y 1 , z1 bezeichnet werden. Bedeuten x, y, z Koordinaten eines Punktes P, der nicht auf der Geraden l = 0 liegt, so werden die bezüglich l normierten Koordinaten des Punktes P offenbar z zY x x(2) ~- cxx+ßy+yz' Yz- cxx+ßy+yz' ~- cxx+ßy+yz sem. Dies vorausgeschickt, sei F eine Fläche in der betrachteten Ebene. Man nehme drei Linearformen

willkürlich an bis auf die Bedingungen, dass die Gerade

l=O keinen Punkt mit der Fläche F (einschliesslich ihrer Begrenzung) gemein hat und dass die Determinante L1 =

(4)

a., ß, y a.t, ßt, Yt a.2, ßz, Y2

von Null verschieden sein soll. Sind dann u, v rechtwinklige Koordinaten in einer Hilfsebene E, so wird der Punkt (5) in der Ebene E eine zu der Fläche F kollineare Fläche G beschreiben, wenn der Punkt x: y: z alle Lagen in der Fläche F annimmt. Da der Nenner der Brüche (5) niemals verschwindet, liegt G ganz im Endlichen. Für die bezüglich der Linearform l normierten Koordinaten eines Punktes der Fläche F und die Koordinaten u, v des entsprechenden Punktes der Fläche G gelten nun die Gleichungen: (6)

I I

u = a.t x, V= a.2X1 1 = IX Xz

+ ßtYl + YtZz, + ß2Y1 + Y2Zz, + ßzYz + Y z,,

aus denen durch Auflösung nach x 1 , y 1 , z 1 etwa (7)

=

x 1 = a1 u + a2 v + a gJ, Y1 = bl U + b2 V + b =: 1p, z 1 = c1 u + c2 v + c = x

388

Zahlentheorie.

folgt. Hier sollen rp, 'f/J, x als Abkürzungen für die rechten Seiten der Gleichungen (7) dienen. Es möge jetzt f(x, y, z) eine Form -3. Grades sein, die aui der Fläche F eindeutig und stetig ist. Dann soll das Integral (8)

J

=II f(x, y, z)(xdydz + ydzdx + zdxdy) F

definiert werden durch die Gleichung

(9)

J =

JJf(x

x 1, y" z1 ih; 1 iJ Yz

1,

iJ Zz

y 1 , z 1) ""FU• ""FU•""FU du dv, iJ x1 iJy1 iJz1

G

dv'dv'dv wobei für x 1 , y" z1 die Ausdrücke rp, 'f/J, x resp. nach den Gleichungen (7) zu substituieren sind. Die Ausrechnung der hier auitretenden Determinante ergibt

so dass die Definitionsgleichung (9) einfacher so: (10)

J =

! Jjf(rp, ""' x)dudv G

geschrieben werden kann. Der Wert des aui diese Weise definierten Integrals (8) ist ein vollständig bestimmter, sobald die Linearformen (3) fixiert sind. Es soll nun untersucht werden, in welcher Weise der Wert von J von der Wahl der Linearformen (3) abhängt. Man setze an die Stelle der Linearformen (3) die Formen

Der diesen Formen entsprechende Wert von J - er heisse J' - entsteht folgendermassen: Der Punkt mit den rechtwinkligen Koordinaten (12)

u ,_ot1:c+ßiY+rtz .

ot':c + ß'y + y'z

,_oti:c+ß!Y+YsZ

'

'V -

ot'x +

--",--~~~~

ß'y + y'z

beschreibe das Gebiet G', wenn der Punkt x, y, z die Fläche F beschreibt.

Über eine Darstellung der Klassenzahl binärer quadratischer Formen.

389

Bezeichnen x1,, y1,, z1, die bezüglich der Linearform l' normierten Koordinaten, so ist

(13) und umgekehrt (14)

Der in Rede stehende Wert J' ist dann nach (10) (15)

J' =

~'

JJ

f(q/,

1p',

x')du' dv',

(G')

unter LI' die Determinante (16)

LI' =

oc'' {3'' y' oc~ ' {3~ ' y~ ' {3'2• Y2' oc2,

der Linearformen (11) verstanden. Nun lässt sich J' leicht auf das Gebiet G transformieren. Bezeichnet nämlich (u', v') einen Punkt des Gebietes G', so entspricht ihm ein bestimmter Punkt x, y, z der Fläche F und diesem ein bestimmter Punkt (u, v) des Gebietes G. Und zwar ist nach (12): u' =

(17) während x,,

cx;_ x, + ß; y,+yi z,

cx'x,+ f>'y,+ y'z,'

y,, z, mit u

v' = rxgx, + ß;y, + y;z, cx'x,+ ß'y,+y'z, '

und v durch die Formeln (7) also

(18) verbunden sind. Durch diese Gleichungen (17) und (18) sind u', v' als Funktionen von u, v dargestellt. Vermöge derselben führt man das Integral J' über in ein Integral mit den Variabeln u, v. Zunächst ergibt sich (vgl. (3) in § 1) (19)

d(u.',v') d(u,v) =

1 (cx'x,+ß'y,+y'z 1) 3

.d'

·-y=

(

)3·-y· .d'

cxx+ ßy+yz cx'x+ß'y+y'z

Das Vorzeichen dieser Funktionaldeterminante stimmt ersichtlich mit dem Vorzeichen überein, welches

(20)

.d'

cxx+ ßy+yz

7 · cx'x+ ß'y+y'z

390

Zahlentheorie.

für den Punkt x, y, z der Fläche F besitzt. Dieses Vorzeichen ist für alle Punkte der Fläche F dasselbe, weil die beiden Linearformen otx+ßy+yz,

ot

1

X

+ßy +Y Z 1

1

innerhalb F stets von Null verschieden bleiben. Nach (14) ist nun ferner 1

cp = Xl,=

Ot1

x X + ß'y + y'z

,

Ot1

x1 _ ocx+ßy+yz Xz+ ß1 Yz + Y1Zz- cp • Ot1 X + ß1Y + Y1 Z'

ocx+ßy+yz

'I'= Yl'= 1f• oc x+fl'y+y z' 1

,

X= z,,=

1

ocx+ ßy+yz ·

z· oc'z+fJ'y+y'z'

Berücksichtigt man, dass f (x, y, z) homogen vom Grade -3 ist, so erkennt man, dass vermöge der Substitutionen (17), (18) das Integral ,J' übergeht in Jl=e·! j jf(cp, 1f,z)dudv=e·J, G

unter e das Vorzeichen des Ausdruckes (20) in der Fläche F verstanden. Man gelangt demnach zu folgendem Ergebnis: Berechnet man den Wert des Integrals (8)

J = j j f(x, y, z)(xdydz

+ ydzdx + zdxdy)

(F)

einerseits unter Benutzung der drei Linearformen (3)

andererseits unter Benutzung dreier anderer Linearformen (11) l l~, 1

,

z;,

so sind die beiden berechneten Werte einander direkt oder entgegengesetzt gleich, je nachdem LI'

in der Fläche F beständig das positive oder beständig das negative Zeichen besitzt. Dabei bedeuten L1 und L1 1 die Determinanten der Formen l, Z1 , l2 bzw. l 1' l~. l;. Der absolute Wert von J ist demnach nur abhängig von der Form f(x, y, z) und der Fläche F. Da aber immerhin das Vorzeichen von J von der Wahl der Linearformen abhängt, so ist es für manche Betrach-

Über eine Darstellung der Klassenzahl binärer quadratischer Formen.

391

tungen wünschenswert, die Linearformen mit in die Bezeichnung von J aufzunehmen und etwa mit

J

(21)

=

Jjt(x, y, z)(xdydz + ydzdx + zdxdy)

(F)l,lhl,

denjenigen Wert des Integrals anzudeuten, welcher bei Benutzung der Linearformen l, l1 , l 2 entsteht. Die zur Berechnung des Integrals (21) dienenden Formeln stelle ich hier nochmals zusammen: Durch die Gleichungen (vgl. (5)) l l '

(22)

U=_!_

l l

V=-2_

wird die Fläche F auf die Fläche G der u-v- Ebene transformiert. Ersetzt man dann im Integranden von J

x, y, z durch diejenigen linearen Funktionen von u und v, die sich durch Auflösung der Gleichungen

I U

(23)

=

l1

=

!X1 X

V= l2 = !X2X 1 = l =!XX

+ ßt Y + Z, + ß2Y + Y2Z, + ßy + yz Y1

ergeben, so entsteht das auf die u-v-Ebene bezügliche Integral (24)

Jjt(x, y,z) [ x~~~: :~ + y~~~.:~ + z~~=:~n dud·v = ~~jt(x, y, z) dudv, G

G

welches nun den Wert des Integrals (21) vorstellt. Die Theorie der projektiven Doppelintegrale lässt sich leicht noch weiter entwickeln, auch auf den Fall von mehrfachen Integralen erweitern. Doch unterlasse ich das hier, da es für den speziellen hier verfolgten Zweck nicht notwendig ist. Zur Abkürzung werde in der Folge (25) x dy dz + y dz dx + z dx dy =dA gesetzt, so dass J

=

f f f (x, y, z)

dA

(F)

die allgemeine Gestalt des projektiven Integrals wird 1). 1 ) Für ein algebraisches Gebilde von beliebig vielen Dimensionen hat Herr Nöther die zugehörigen vielfachen Intew-ale in homogener Gestalt aufgestellt in seiner Abhandlung "Zur Theorie des eindeutigen Entsprechens algebraischer Gebilde von beliebig vielen Dimensionen", Mathematische Annalen, Bd. 2 (1870), S. 293-316 (Vgl. S. 303).

Zahlentheorie.

392

§ 3.

Berechnung einiger projektiver Doppelintegrale. Es möge nun das spezielle Doppelintegral dA J-jj (otx+ ßy+yz) -

(1)

3

F

berechnet werden, wobei

(2)

=~x + ßy + yz

l

eine beliebige Linearform bezeichnet, die jedoch für keinen Punkt der Fläche F verschwindet. Die Linearformen (3)

mögen so gewählt werden, dass ~.

(4)

L1

=

y

~~. ß1•Y1

=1

~2. ß2,y2

ist. Setzt man nun

U=1_

(5)

ß,

l '

V=~

l '

so geht die Fläche F in eine ihr kollineare Fläche G der u-v-Ebene über und es kommt nach (24) des vorigen Paragraphen (6)

J

=

JJdttdv G

als derjenige Wert des Integrals J, welcher den Linearformen l, l1, l2 entspricht. Dieser Wert ist also nichts anderes als der Flächeninhalt von G. Das Integral J stellt daher die projektive Verallgemeinerung des Flächeninhalts vor und kann passend als "Flächeninhalt von F bezüglich der Linearform l ~ x + ßy + y z" bezeichnet werden. Sind speziell x, y, z homogene rechtwinklige Koordinaten (sodass des einzelnen Punktes der Fläche F ~, z die rechtwinkligen Koordinaten z JL

=

=

sind) und nimmt man die Linearform l z, so wird der Wert von J identisch mit dem Flächeninhalt von F, wie man erkennt, wenn man in diesem Falle l1 x, l2 y wählt. Das Integral (1) möge nun insbesondere für den Fall ins Auge gefasst werden, wo F die Fläche des Kegelschnitts

=

=

Über eine Darstellung der Klassenzahl binärer quadratischer Formen.

393

ist. Die Linearformen (3) wählt man dann am zweckmässigsten so, dass identisch (8)

F(x, y, z)

=e(-Zi -l~ + xl

2)

wird, wo e' X Konstante bezeichnen. Nach (5) wird jetzt G die Fläche des Kreises und der Wert des Integrals J ist demnach

(9) Es erübrigt, den Wert von x zu bestimmen. Zu dem Zwecke differenziere man (8) nach x, y, z. Dadurch ergibt sich 1

oF

1

oF

+ xZ= e(-ylll-y2l2 + xyl). 2 Tx-= e(- 0, x > 0 nach (11) in § 3 auch e > 0 ist. Fällt nun die Integrationsfläche F mit der Fläche des Kegelschnittes (1) zusammen, so ist das Integral (6) über die Fläche des Kreises u 2 + v2 = x zu erstrecken. Durch Übergang zu Polarkoordinaten findet man nunmehr leicht: Der Wert des Integrales JP für die Fläche des Kegelschnittes (1) ist xP+l DJ. - 1 vorausgesetzt werden, widrigenfalls das betrachtete Integral nicht endlich sein würde. Im Falle f-t = 0 geht (8), wie es sein muss, in (15) § 3 über. Es werde nun weiter der Wert des Integrals J P ins Auge gefasst für den Fall, wo die Integrationsfläche F die Fläche des Dreiecks mit den Eckpunkten

=-f

Für p. stellt das Integral Jp, beiläufig bemerkt, den Cayley'schen Flächeninhalt von F, bezogen auf F(x, y, z) = 0 als Fundamentalkegelschnitt, vor. 1)

Über eine Darstellung der Klassenzahl binärer quadratischer Formen.

401

(9)

ist. Hier gelangt man zu. einem verhältnismässig einfachen Ergebnis, wenn, wie jetzt vorausgesetzt werden soll, p, eine nichtnegative ganze Zahl ist. Das Gebiet G, über welches jetzt das Integral (6) zu erstrecken ist, ist das Dreieck mit den Ecken

(10) wobei Ut, Vt nach den Gleichungen (5) aus den Koordinaten xi, des Punktes Pi zu berechnen sind. Es sei nun H(u,v)

Yt, Zt

eine ganze rationale Funktion von u und v, dann geht das über das Dreieck Q0 Q1 Q2 erstreckte Integral (11)

H= jjH(u,v)duav

durch die Substitution

J~t =

u0 lv = v0

(12)

+ t1 ( u1 + t (v

u 0) v0 )

1 -

1

+ t2 ( u 2 -- u0 ) , + t (v v 2

2 -

0)

über in

wo zur Abkürzung (14) gesetzt ist und das Integrationsgebiet für die neuen Variabeln t1 , t 2 durch das Dreieck mit den Ecken

gebildet wird. Nun ist ferner das über dieses Dreieck erstreckte Integral 1

1-t,

! ! t~t~,t~·dtl dt2 =! ti' dtl! (1- tl- t2) 1·t~dt2 0

0

1

1

=! ti' (1-tl)lo+l,·-f-ldtl! tl•(1- t)Z•dt' 0

wie man durcl). die Substitution t 2

0

=

(1 - t1) t erkennt. 26

402

Zahlentheorie.

Es wird daher (15) Entwickelt man den Integranden in (13) nach Potenzen von t0 , tv t2 , so kann man auf die einzelnen Glieder der Entwicklung die Formel (15) anwenden. Auf diese Weise erhält man zunächst den Satz: Der Wert des über das Dreieck mit den Ecken erstreckten Integrals entsteht, wenn man

/ JH(u, v) du dv

u 0 , v0 , 1

± u1 , v1 , 1 · H(t0 u0 + t1 u1 + t2 u 2 , t0 v0 + t1 v1 + t2 v2)

(16)

u 2 , v2 , 1

nach Potenzen von t0 , t1 , t 2 entwickelt und in jedem einzelnen Gliede dieser Entwicklung das Potenzprodukt

(17)

durch

ersetzt.

Das Vorzeichen in (16) ist so zu wählen, dass

±

u0 , v0 , 1 u 1 , v1 , 1 positiv

ausfällt. Hier kann man noch bemerken, dass der Funktion beliebige durch 1-t0 - t1 - t2 teilbare Glieder hinzugesetzt werden dürfen. Denn macht man in

die durch (17) vorgeschriebenen Ersetzungen, so erhält man identisch Null, wie man durch direkte Rechnung leicht bestätigt, wie aber auch daraus hervorgeht, dass das Integral

JJ(1- t

0 -

für t0

=

t1 - t2) if0 t~t~dt 1 dt2

1 - t1 - t2 verschwindet.

403

Über eine Darstellung der Kla.esenzahl binärer quadratischer Formen.

Für das Integral (6) tritt an die Stelle von H(u, v) die ,u-te Potenz von e(u-u2-v2) und die Berechnung dieses Integrals erfordert daher die Entwicklung der ,u-ten Potenz von

K =

e(u -

(to Uo + t1 u1 + t2 Uz) 2 - (to Vo + t1 v1 + f2 Vz) 2)'

an dessen Stelle aber auch die ,u-te Potenz von

K=

e( u(to + t1 + tz) 2- (toUo + t1 u1 + tzUz) 2- (toVo + t1 v1 + t2v2) 2)

gesetzt werden darf, weil dadurch nur Glieder hinzugenommen werden, die durch 1 - t0 - t1 - t2 teilbar sind, denn es ist K = K + eu(1- (t0 + t1 + t2) 2).

Zur Umformung von K bestimme man x, y, z aus den Gleichungen

ß y + y Z = fo + f1 + fz, ß1 y + y 1 z = t0 u0 + t1u1 + t2u 2 , oc 2 x + ß2 y + y 2 z = t0 v0 + t1 V1 + t2 v2 •

l =:IX X+

1 =oc1x + l1 l2

(18)

=

Nach (8) in § 3 wird dann

K=F(x,y,z).

(19)

Die Werte von x, y, z ergeben sich folgendermassen. Zur Abkürzung sei

(20) z= IXXo + ß Yo + rzo, l(l)= IXX1 + ßy1 + rzv l= IXXz + ßYz + rzz. Dann ist 1

Uo = z(oczXz+

V2=

ßzYz+r~.zz).

Daher sind die Auflösungen von (18) diese: Y = t0 1Yo(0)

+t

Y1

z

t0

1 1(1)

=

+ t Ys + t1 [0> + t 2 1(2) '

Zo 1(0)

zi

Zz 2 1(2) •

Zahlentheorie.

404

Der Determinantenfaktor in (16) drückt sich mit Hülfe von (21) in der Form aus:

±

(23)

Xo, Yo• Zo

1

X1, Y1• Z1

X2, Y2• Z2

Das Ergebnis der vorstehenden Betrachtung lässt sich in folgenden Satz zusammenfassen: Das Integral J P' erstreckt über die Fläche des Dreiecks mit den Ecken

setzt sich aus zwei Faktoren zusammen. Der eine Faktor ist der absolute Wert des Ausdrucks (23), wobei die Bedeutung von l, l(I), z< 2> aus (20) erhellt. Um den zweiten Faktor zu erhalten, mache man in der p,-ten Potenz von F(x,y,z) die Substitution (22), entwickle sodann nach Potenzen von t0 , t1 , t2 und ersetze schliesslich in dieser Entwicklung das einzelne Potenzprodukt t.•0 t11' t!•2 durch

Im Falle p.. = 0 kommt man auf den Wert (22) in § 3 zurück, der dort auf anderem Wege gefunden wurde. Die erhaltenen Resultate mögen nun auf den Fall des Kegelschnittes (24)

F(x, y, z)

=xz- y

2

= 0

spezialisiert werden, für welchen (25)

1

D = 4•

1

f/J(a., ß, y) = -:r(4a.y- ß2)

ist. Der Wert des Integrals J P für die Fläche dieses Kegelschnittes wird nach (8) (26)

2~ 1 (~L+1)' (4ccy-ß2)P+lv'4ccy-ß2

Für das Integral J P erstreckt über die Fläche eines Dreiecks bleibt der Faktor (23) unverändert. Dagegen spezialisiert sich der Ausdruck, dessen p,-te Potenz nach Potenzen von t0 , t1 , t2 zu entwickeln ist, wie folgt:

Über eine Darstellung der Klassenzahl binärer quadratischer Formen.

405

_tö( 2) ti( 2) t~( .2) K - z' XoZo- Yo + z(l>' X1 zl- Yt + z< 2>· X2Z2- Y2

(27)

+

t~~:~2) (x1z2 +

x2zl-2 YIY2) +

+

z s'

Die grösste unter diesen Zahlen ist

+ (n 2 + D) + 2 n = D + (n + 1) 2 • D+(n+l)'

1 .~ ~ ~ ~ r+s+2n ~ k=l

k1 =

=

C + lg (D

+ (n + 1) + e C + 2 lg n + e', 2)

wo e' mit unendlich wachsendem n verschwindet und C die Mascheronische Konstante bezeichnet. Ebenso ergibt sich D+(n-1)'

1 ~ ~ ~ ~ ~ r+s-2n k=l

und folglich (46)

VJ(n, D)

k1

=

C + 2lg n

+ e"

< 4 (0 + 2lg n + 'YJn),

wo 'YJn mit unendlich wachsendem n verschwindet. Sobald m > N vorausgesetzt wird, ist daher

eine Ungleichung, die über den Grad der Konvergenz der Entwicklung (42) einigen Aufschluss gibt.

LXX.

Über eine Aufgabe der unbestimmten Analysis. (Archiv der Mathematik und Physik, 111. Reihe, Bd. 11, 1907, S. 185-196.)

In den folgenden Zeilen will ich mich mit der nachstehenden Aufgabe beschäftigen: "Man soll alle Systeme von n positiven ganzen Zahlen x1 , x2 , ••• Xn bestimmen, deren Quadratsumme xi + x~ + · · · + x; ohne Rest durch ihr Produkt x1 x2 • • • Xn teilbar ist." Offenbar kommt diese Aufgabe auf die vollständige Lösung der diophantischen Gleichung (1)

in positiven ganzen Zahlen x, x1 , x2 , • • • Xn zurück. Den Fall n = 1 lasse ich als interesselos bei Seite. Ist n so lautet die Gleichung (1)

= 2,

woraus folgt. Daher muss x2 folgt aber x

+t=

V x -4 eine ganze Zahl t sein. Aus -4 = t oder (x + t) (x-t) = 4 2

2

x - t = 2, also

Die allgemeinste Lösung der gestellten Aufgabe wird demnach im Falle n = 2 durch ein System von zwei einander gleichen Zahlen x1 = x2 gebildet. Bei der weiteren Behandlung der Aufgabe werde ich nun n ~ 3 voraussetzen.

'Ober eine Aufgabe der unbestimmten Analysis.

411

Indem man die Gleichung (1) auf die Form x~

+ · ·· + x! =

x1(x x 2 • • • Xn - x 1)

bringt, erkennt man, dass eine positive ganze Zahl ist, welche der Gleichung oder

xl'2

+ x22 + ... + xn2 =

,

xxl x2 ... xn

genügt. Es gilt also der Satz 1. Bezeichnet eine Lösung der diophantischen Gleichung (1), so ist auch

f

=

(x, x~,

x2 , ••• xJ

eine Lösung derselben, falls x~ aus der Gleichung

(2) berechnet wird. Aus der Symmetrie der Gleichung (1) in den Unbekannten x1 , x1 , ••• Xn geht hervor, dass ebenso

gleichzeitig mit ~ Lösungen der Gleichung (1) sind, wenn x~, ... x~ aus den Gleichungen

bestimmt werden. Jede der Lösungen ~·. ~", ... ~ will ich als der Lösung~ "benachbart" oder auch als einen "Nachbarn" der Lösung ~ bezeichnen. Die Gleichung (2) zeigt unmittelbar, dass auch ~ der Lösung ~· benachbart ist, und Entsprechendes gilt von den Lösungen ~", ... ~. Wenn also von zwei Lösungen die erste zur zweiten benachbart ist, so ist

412

Zahlentheorie.

auch umgekehrt die zweite zur ersten benachbart. Bildet man, von emer Lösung ~ ausgehend, die Reihe von Lösungen

(3)

~,'YJ,l;,

••• w

in der Weise, dass jede ein Nachbar der unmittelbar vorhergehenden ist, also 'YJ ein Nachbar von ~, so dann ?; ein Nachbar von ?7 usf., so sollen die Lösungen 'YJ, ?; , • • • w aus der Lösung ~ "abgeleitet" heissen. Wenn die Lösung w aus der Lösung ~ abgeleitet werden kann, so ldmn auch umgekehrt ~ aus w abgeleitet werden. Denn in der Reihe (3) ist auch jede Lösung ein Nachbar der unmittelbar folgenden. Geht man von einer Lösung zu einer benachbarten über, so ändert sich der Wert der Unbekannten x nicht. Daraus folgt: Satz 2. Wenn zwei Lösungen auseinander abgeleitet werden können, so stimmen sie in dem Werte der Unbekannten x überein. Als "Höhe" einer Lösung ~ =

(x, x1 , x2 , ••• x,..)

der Gleichung (1) bezeichne ich nun die Summe

x1 +x2 +···+x.. und knüpfe hieran die folgende Definition: Eine Lösung der Gleichung (1) heisse eine "Grundlösung", wenn keine der n ihr benachbarten Lösungen eine kleinere Höhe besitzt wie sie. Die Bedeutung dieses Begriffes der Grundlösung beruht auf folgendem Satz 3. Jede Lösung der Gleichung (1) ist entweder eine Grundlösung odm· sie lässt sich aus einer Grundlösung ableiten. In der Tat, wenn die Lösung ~ nicht Grundlösung ist, so besitzt sie einen Nachbarn 'YJ von kleinerer Höhe. Wenn 'YJ ebenfalls nicht Grundlösung ist, so besitzt 'YJ einen Nachbarn ~ von kleinerer Höhe. So fortfahrend erhält man eine Reihe von Lösungen: ~' 'YJ' ?; ' ••• '

von denen jede ein Nachbar der unmittelbar vorhergehenden ist und deren Höhen eine abnehmende Reihe bilden. Da die Höhen positive ganze Zahlen sind, so muss die Reihe (4) notwendig abbrechen, d. h. man kommt bei Fortsetzung der Reihe (4) notwendig einmal zu einer Lösung w, ·die Grundlösung ist. Aus dieser Grundlösung w lässt sich dann die Lösung ~ ableiten. Dem Satze 3 zufolge genügt es zur vollständigen Auflösung der Gleichung (1), die Grundlösungen zu bestimmen. Ich werde nun zeigen,

413

Über eine Aufgabe der unbestimmten Analysis.

dass es nur eine endliche Zahl von Grundlösungen gibt, und zugleich die l\littel zu ihrer Herstellung angeben. Soll die der Lösung ~ = (x, XI, x 2 , ••• Xn) benachbarte Lösung ~' = ( x, x~, x 2 , ••• xn) keine kleinere Höhe haben, wie ~, so muss xi ~ xi', oder nach Gleichung (2) oder auch (5) sein. Eine entsprechende Überlegung lässt sich auf die übrigen benachbarten Lösungen von ~ anwenden. Demnach gilt der Satz 4. Die Lösung ~ = (x, XI, x 2 , ••• Xn)

ist dann und nur dann eine Grundlösung, wenn die n Ungleichungen

(i=1,2, ... n)

(6)

erfüllt sind. Die Symmetrie dieser Ungleichungen zeigt, dass eine Grundlösung durch eine beliebige Permutation von x 11 x 2 , ••• Xn wieder in eine Grundlösung übergeht. Es genügt deshalb, diejenigen Grundlösungen aufzusuchen, welche den Ungleichungen (7)

genügen. Für diese Grundlösungen sind übrigens die Ungleichungen (7) zusammen mit der einen Ungleichung (5) völlig charakteristisch, da die Ungleichungen (6) sämtlich zugleich mit den Ungleichungen (5) und (7) erfüllt sind. Ich bringe nun die Gleichung (1) auf die Form

aus welcher leicht (8)

hervorgeht, wobei (9)

PI =

x~

+ x~ + ·.. + x~ ~~ x2

x2

~2s···n

=

( xf

+ xj + ···+ x~) - xt x2 x2

x2 12···n

2

• XI

ist. Durch Vertauschung von x 1 mit xi entsteht bieraus

(10) und

xx1 x 2 ••• xn- 2 x~ = xi x2 x 3 ••• xn

Vx

2-

4pi

(i=1, 2, 3, ... n)

Zahlentheorie.

414

(i=1,2, ... n)

(11)

Nun möge ~

= (x, x1 , x2 , •••

Xn)

eine Grundlösung sein, welche den Ungleichungen (7) genügt. Wegen der Ungleichungen (6) sind dann die Quadratwurzeln, welche in den Gleichungen (10) auftreten, nicht negativ, und unter ihnen gilt, wegen der Ungleichungen (7), die Grössenfolge:

(12)

Vx 2 -4p1 ~ Vx 2 -4p 2 ~

• ••

~ Vx 2 -4Pn·

Durch Addition der Gleichungen (10) kommt

nxx 1x 2· · · xn-2(xi + x~ + · · · + x~) = X 1 X 2· · · xn( V x2 - 4p1 +V X 2 - 4p2 +···+V x 2 -4pn), und hieraus in Rücksicht auf die Gleichung (1)

(13)

vx 2-4p1 + Vx 2 -4p2 + ··· + Vx 2 -4pn = (n-2)x. Aus der Kombination von (12) und (13) folgt

nvx 2 -4p1 ~ (n-2)x, n 2 (x 2 -4p1) ~ (n-2) 2 x 2, (n-1)x 2 ~n 2 p 1 oder, nach Gleichung (9),

(14)

(n -1) x2 x~x~ ... x~ ~ n2 (x~ + x~ + . · · +x~). Nach den Ungleichungen (7) ist ferner

so dass aus (14) (15)

x~ + xi + . · · + x! ~ (n -1) x~,

xx3 ••• Xn

~

n

hervorgeht. Endlich ergibt die Ungleichung (5):

2 xi ~ x x1 x2 · · · xn = xi + x~ + · · · + x! oder (16)

2 x22< = Xa2+ . . . xl-

+ xn.2

Aus der Ungleichung (15) folgt, dass

X,Xa,•••Xn nur eme endliche Zahl von Wertsystemen annehmen können. Für das einzelne dieser Wertsysteme kann dann, nach Ungleichung (16),

(17)

Über eine Aufgabe der unbestimmten Analysis.

415

nur einen der Werte 0, 1, 2, · · · (x~ + ·· · + x;,) erhalten, so dass auch für x1 und x2 nur eine endliche Zahl von Werten zulässig sind. Denn einen gegebenen positiven Wert nimmt der Ausdruck (17) überhaupt nur für endlich viele Zahlenpaare x 1 , x2 an, den Wert Null aber nur dann, wenn x 1 und x 2 denselben, der Gleichung

2xi + x~

+ · · · + x;. =

xxix3 •• • xn

genügenden Wert haben, und dieser Gleichung genügt, wenn überhaupt, nur ein positiver ganzzahliger Wert x1 • Die Anzahl der Grundlösungen der Gleichung {1) ist also in der Tat endlich. Zu ihrer Bestimmung stehen, ausser der Gleichung {1), die Ungleichungen (7), (14), (15), (16) zur Verfügung. Diesen kann man noch eine weitere hinzufügen. Da nämlich V x 2 - 4p 1 reell ist, so muss 4 p 1 ~ x 2, oder nach Gleichung {9)

(18) sein. Aus den Grundlösungen lassen sich nach Satz 3 die sämtlichen Lösungen der Gleichung (1) ableiten. Dass hierbei aber auch keine der Grundlösungen entbehrt werden kann, geht aus dem folgenden Satze hervor: Satz 5. Keine der Grundlösungen kann aus einer andern abgeleitet werden. Dem Beweise schicke ich zwei Hilfssätze voraus. Hilf s s atz 1. Zwei Nachbarlösungen von gleicher Höhe sind identisch. Denn zwei Nachbarlösungen stimmen in der Unbekannten x und in n - 1 der Unbekannten x1 , x2 , ••• Xn überein. Daher müssen sie auch in der letzten Unbekannten übereinstimmen, wenn ihnen derselbe Wert der Höhe x1 + x2 + ··· + Xn zukommt. Hilfssatz 2. Eine Lösung ~ kann höchstens einen Nachbarn von kleinerer Höhe besitzen. Angenommen nämlich, es wären die Nachbarn ~ und ~ beide von kleinerer Höhe wie ~ = (x, x1 , x 2 ,. • • Xn) , so würde

2 x~ > x x1 x 2 • .. xn = xi + x~ + ··· + x;. 2 xi > x x1 x 2 • ; • xn = xi + x~ + ·· · + x;. sein, woraus durch Addition die widersinnige Ungleichung

2 (X~

+ xz) > 2 (xi + X~ + ·· · + x;.)

folgen würde. Um nun den Satz 5 zu beweisen, .zeige ich, dass die Annahme, eine Grundlösung w könne aus einer andern ~ abgeleitet werden, auf einen Widerspruch führt.

416

Zahlentheorie.

Aus dieser Annahme folgt, dass es eine Reihe von Lösungen der Gleichung (1) ;,1], ... a, ... 'l', •.• w gibt, von welchen jede Nachbar der vorhergehenden ist. Man darf nun voraussetzen, dass in dieser Reihe nicht ein und dieselbe Lösung mehr als einmal auftritt. Denn wäre etwa a = 't', so könnte man in der Reihe die auf a folgenden Glieder bis T inklusive unterdrücken. Zwei nebeneinander stehenden Gliedern der Reihe entsprechen dann nach Hilfssatz 1 verschiedene Höhen. In der Reihe möge nun der grösste HÖhenwert der Lösung a zukommen. Es fällt dann a nicht mit ; zusammen, da ; als Grundlösung geringere Höhe hat wie 17; aus entsprechendem Grunde fällt a auch nicht mit w zusammen. Folglich steht a in der Reihe zwischen zwei auderen voneinander verschiedenen Lösungen. Diese würden aber beide zu a benachbart und von kleinerer Höhe wie a sein, worin ein Widerspruch gegen den Hilfssatz 2 liegt. Aus diesem Hilfssatz folgt noch eine bemerkenswerte Tatsache. Bedeutet ; eine Lösung der Gleichung (1), die nicht Grundlösung ist, so kann man die Reihe von Lösungen

;,1],c, ...

w

nach Hilfssatz 2 nur auf eine Weise so bestimmen, dass jede Lösung ein Nachbar der vorhergehenden und zugleich von niedrigerer Höhe als die vorhergehende ist. Jede Lösung der Gleichung (1) kann also im wesentlichen nur auf eine Weise aus einer Grundlösung abgeleitet werden. Aus den Ungleichungen, welche für die den Bedingungen (7) genügenden Grundlösungen gelten, will ich nun einige Folgerungen ziehen. Die Ungleichung (15) lehrt, dass der Wert von x in keiner Grundlösung grösser als n sein kann. Hieraus folgt weiter, in Rücksicht auf die Sätze 2 und 3, dass es überhaupt keine Lösung der Gleichung (1) gibt, für welche x > n wäre. Das heisst, es gilt der Satz 6. Bedeutet a eine gegebene positive ganze Zahl, die grösser als n ist, so besitzt die diophantische Gleichung (19) keine Auflösung in positiven ganzen Zahlen x 1 , x 2 , • • • Xn. Nimmt man an, dass die ganzen (nicht notwendig positiven) Zahlen x1 , x2 , ••• Xn der Gleichung (19) genügen, so müssen dieselben offenbar sämtlich Null sein, wenn es eine unter ihnen ist. Falls dieselben aber sämtlich von Null verschieden wären, so würden ihre absoluten

Über eine Aufgabe der unbestimmten Analysis.

417

Beträge I x1 1, Ix2 1, ... I :t,.l ebenfalls der Gleichung (19) genügen. Aus dem Satze 6 folgt daher, dass die Gleichung (19), abgesehen von der trivialen Lösung x1 = x2 = · · · = x,. = 0, keine Auflösung in ganzen Zahlen x1 , x2 ,. • • x,. zulässt. Wenn in der Ungleichung (15) x=n vorausgesetzt wird, so kann sie nur bestehen, falls x3

= ··· =

x,.=1

ist. Dann folgt aber aus Ungleichung {14) (n-1)n2 x~~n2 (x~+n-2),

x~~1,

also x2 = 1 und sodann aus der Gleichung (1) schliesslich x1 = 1. Dem Wert x = n entspricht demnach die einzige Grundlösung x

= n, x1 = x2 = x3 = · · · = x,. = 1,

aus welcher also die sämtlichen Lösungen der Gleichung (1), für welche x = n ist, abgeleitet werden können. Es gilt mit anderen Worten der Satz 7. Die sämtlichen Lösungen der Gleichung

xi + x~ + · ·· + x; =

nx1 x 2 • • • x,.

in positiven ganzen Zahlen x1 , x2 , • • • x .. lassen sich aus der einen Lösung X1 =X2 =···=Xn=1 ableiten 1). Für die Werte von n, die 10 nicht überschreiten, habe ich diA Grundlösungen der Gleichung (1) berechnet. Dabei habe ich ausser den oben aufgestellten Ungleichungen noch einige weitere aus ihnen hervorgehende benutzt, die ich zunächst ableiten will. Dividiert man die Ungleichung (14) durch die Ungleichung x 2 6 1, so ergibt sich x;), x; (n -1) x~x; .. · x; ~ n2 (x~ oder x;). [(n -1) x;. · · x;- n2] x~ ~ n 2 (x; (20)

+ + . ·· +

+ ... +

Entweder ist nun

(a) 1 ) Die diophantische Gleichung xj + + = 3x1 x2 a:a behandelt A. Markoff in seiner Abhandlung: Sur les formes quadratiques binaires indefi.nies, Mathem. Annalen, Bd. 17 (1880), S. 379-399. Markoff beweist hier, dass die sämtlichen Lösungen der Gleichung aus der Lösung x1 = x 2 = x3 = 1 abgeleitet werden können, also den n = 3 entsprechenden speziellen Fall des Satzes 7.

x; x;

27

418

Zahlentheorie.

oder aber (b) Im letzteren Falle folgt aus (20), da x3

,;;;

x2 ist,

[(n -1) x~ · ·. x!- n2]x~ ~ n2 (x~ + Q), wo zur Abkürzung gesetzt ist. Da nun [(n-1)x~

... x!-n2] 2 = n 4 + (n-1)x~ ... x!·x~[(n-1)x~ ... x!-2n2]

ist, so schliesst man aus der letzten Ungleichung [ (n - 1) x~ ...

x!- n 2] 2 ~ n + (n 4

1) x; ... x! . n2 Q,

oder endlich

(21)

(n-1)x~· .. x! ~n2 + nyn2 + (n-1)x; ... x!(x;+ ... + x;).

Diese unter Voraussetzung (b) der abgeleitete Ungleichung gilt a fortiori, wenn (a) stattfindet. Sie gilt daher in jedem Falle. Die Ungleichung (21) gibt eine obere Grenze für die Werte, welche x3 annehmen kann, nachdem x4 , ••• x" bestimmt gewählt sind; sodann gibt die Ungleichung (20) eine obere Grenze für die zulässigen Werte von x2 , jedoch nur, wenn der Fall (b) vorliegt. Ist beispielsweise x4 = · · · = x" = 1, so ergibt die Ungleichung (21)

Die Aufstellung der Grundlösungen wird, ausser durch die Ungleichungen (20) und (21), auch noch durch die Tatsache erleichtert, dass von n = 5 ab in jeder Grundlösung mehrere der Zahlen x1 , x2 , ••• x" den Wert 1 besitzen. Es besteht nämlich der Satz 8. Wenn n ~ 5 ist und (x, x1 , x2 , ... Xn) eine den Bedingungen (7) genügende Grundlösung der Gleich,ung (1) bedeutet, so besitzen sicher die n - 2 - k letzten der Zahlen x 1 , x 2 , • • • Xn den Wert 1. Dabei bezeichnet k die durch die Ungleichungen 2k

~

n

< 2k+ 1

bestimmte ganze Zahl. In der Tat können nicht mehr als k der Zahlen x3 , ••• Xn grösser als 1 sein, weil sonst ihr Produkt mindestens gleich 2k+ 1 > n ausfallen würde, im Widerspruch mit der Ungleichung xx3 ••• Xn ~ n. Man überzeugt sich ferner leicht, dass von n = 5 ab n- 2- k > 0 ist.

419

Über eine Aufgabe der unbestimmten Analysis.

Ich stelle nun die den Bedingungen (7) genügenden Grundlösungen der Gleichung (1) bis n = 10 in der folgenden Tabelle zusammen:

Tabelle der Grundlösungen.

3{ 4{

51 6{

7

s{

3 1 4 1 5 4 1 6 3 7 5 3 2 1 8 1

9{ 96 10

10 6 4 2 1

1 3 1 2 1 2 4 1 2 1 2 3 2 3 1 4 1 2 1 3 2 3 4

1 3 1 2 1 1 3 1 2 1 1 2 2 2 1 2 1 1 1 1 2 2 4

1 3 1 2 1 1 3 1 1 1 1 1 2 2 1 2 1 1 1 1 1 2 3

1 2 1 1 1 1 1 1 1 1 1 2 1 2 1 1 1 1 1 1 1

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

1 1 1 1 1 1 1 1 1 1 1 1 1 1

1 1 1 1 1 1 1 1 1

1 1 1 1 1 1 1

1 1 1 l

1

An diese Tabelle knüpfe ich noch einige Bemerkungen. Nur in den Fällen n = 3 und n = 4 kommt es vor, dass die Zahlen x1 , x2 , • • • x,. einer Grundlösung einen allen gemeinsamen Teiler aufweisen. Man beweist nun in der Tat leicht den Satz 9. Wenn n > 4 ist, so gibt es keine Lösung der Gleichung (1), in welcher x 1 , x 2 , • • • x,. einen gemeinsamen Teiler besitzen. Angenommen nämlich, es wäre

xl so würde

= oyl, x2 = oy2•· .. x,. = oy,.,

0 ~ 2,

420

Zahlentheorie.

Yi

+ Y~ + · · · + Y! = on- 2X • Y1 Y2 · · · Yn

folgen. Nach Satz 6 müsste nun und, da

auch

2n- 2 ::;;; c)n- 2,

sein. Diese Ungleichung ist aber von n = 5 ab nicht erfüllt. Der Satz 9 lässt sich übrigens auch ohne Schwierigkeit aus dem Satze 8 ableiten. Die Tabelle der Grundlösungen zeigt ferner, dass die Unbekannte x nur einen Teil der Werte ~ n annehmen kann. Nach den Sätzen 2 und 3 folgt hieraus der Satz 10. Bezeichnet a eine positive ganze Zahl, so besitzt die diophantische Gleichung

(22)

xi

+ x~ + · ·· + x! =

a x1 x2

• • •

xn

Auflösungen in positiven ganzen Zahlen x1 , x 2 , • • • Xn nur für a = 1 und a=3, falls n=3 ist; nur für a=1 und a=4, falls n=4 ist,· nur für a = 1, a = 4 und a = 5, falls n = 5 ist; usf. Für einen unbestimmten Wert von n dürfte es schwierig sein, diejenigen Werte von a :;:;:;; n allgemein zu charakterisieren, für welche die Gleichung (22) Auflösungen in positiven ganzen Zahlen besitzt. Die im vorstehenden entwickelte Theorie der Gleichung (1) lässt sich noch in anderer Weise auffassen, wobei ihre Analogie mit der Zahlentheorie der quadratischen Formen hervortritt. Die binären quadratischen Formen von gegebener Determinante D sind eindeutig zugeordnet den Lösungen der diophantischen Gleichung

(23) Die Einteilung der Formen in Klassen kommt also auf eine Einteilung der Lösungen der Gleichung (23) in Klassen hinaus, wobei zwei Lösungen (x 1 , x 2 , x3) und (x~, x~, x~) dann in dieselbe Klasse gehören, wenn die eine aus der andern durch Gleichungen der Gestalt

(24)

l

+ 2 x1 (Xy + x3 y 2 + x1 (ocb + ßy) + x 3 yb 2 x2 ß + 2x1 ßb + x3 b2

x~ = x2 (X 2 x~ = x 2 (Xß

x~ =

abgeleitet werden kann, unter oc, ß, y, 1:5 ganze Zahlen der Determinante (Xb- ßy = 1 verstanden. In jeder Klasse von Lösungen gibt es eine "reduzierte", durch Ungleichungen charakterisierte Lösung. Die Anzahl dieser reduzierten Lösungen- und damit die Anzahl der Klassen-

Über eine .Aufgabe der unbestimmten ~ 0 nur diejenigen Klassen, in welchen keine Lösung vorkommt, für welche eine der Unbekannten x1 , x2 , ••• Xn den Wert Null besitzt, so ist die Anzahl dieser Klassen wieder endlich. Übrigens lässt sich im Falle eines negativen Wertes von D die Auflösung der Gleichung (25) auf die einer Gleichung der Form (1) zurückzuführen. In der Tat, ist etwa

D=-m, so entsprechen die Lösungen der Gleichung (25) offenbar einzeln denjenigen Lösungen der Gleichung

in welchen die Unbekannten xn+l, . .. xn+m den Wert 1 besitzen. Zürich, den 20. Dezember 1905.

LXXI.

Über die Darstellung der ganzen Zahlen als Summen von nten Potenzen ganzer Zahlen. (Mathematische Annalen, Bd. 65, 1908, S. 424-427.)

Die interessante Abhandlung von Herrn A. Fleck "Über die Darstellung ganzer Zahlen als Summen von sechsten Potenzen ganzer Zahlen 1)" gibt mir Veranlassung, einige Betrachtungen mitzuteilen, die ich vor längerer Zeit bei Gelegenheit der Lektüre von Herrn E. Maillet's Aufsatz: "Sur Ia decomposition d'un nombre entier en une somme de cubes d'entiers positifs" 2) anstellte. 1. Angenommen, es sei für einen bestimmten Exponenten n bekannt, dass sich jede positive Zahl als Summe von höchstens k nten Potenzen darstellen lässt, wo k eine feste Anzahl bezeichnet. Angenommen ferner, es bestehe eme m den Grössen a, b, c, d identische Gleichung von der Form r

p(a 2 + b2 + c2 + d2)n = ~ p 1 (11.ia + ß,b + y,c + ~ 1 d) 2n,

(1)

i=l

p, p1 , p2 , ••• , Pr positive ganze Zahlen, 11.1 , ß1 , y 1 , ~~, ••• , aber beliebige ganze Zahlen bedeuten. Dann folgt leicht, dass auch jede positive ganze Zahl als Summe von höchstens k' 2nten Potenzen darstellbar ist, unter k' wiederum eine feste Anzahl verstanden. In der Tat: jede ganze Zahl ist als Summe a 2 + b2 + c2 + d 2 von vier Quadraten ganzer Zahlen darstellbar. Daherwird nach Gleichung (1) das p-fache jeder nten Potenz als Summe von höchstens p 1 + p 2 + ··· +Pr 2nten Potenzen darstellbar sein. Da weiter nach Voraussetzung jede ganze Zahl eine Summe von höchstens k nten Potenzen ist, so lässt sich das p-fache jeder ganzen Zahl als Summe von höchstens k (p 1 + p 2 + ·.. +Pr) 2nten Potenzen darstellen. Und da jede beliebige ganze Zahl aus einem Vielfachen von p durch Addition von 0 oder 1 oder 2, . . . oder p - 1 wobei

11.r, ßn 'Yr, ~r

Mathem. Annalen, Bd. 64 (1907), S. 561-566. Association fran9aise pour l'avancement des sciences, t. 24 (1895), p. 242-247 (Congres de Bordeaux). 1)

1)

Darstellung ganzer Zahlen durch n•• Potenzen.

423

Einheiten entsteht, so ergibt sich schliesslich, dass jede beliebige ganze Zahl als Summe von höchstens

(2)

k' = k(pl + P2 + ... + p,.) + p -1

2nten Potenzen darstellbar ist. Eine Identität von der Gestalt (1) ist für den Fall n = 2 von Liouville, für den Fall n = 3 von Herrn Fleck 1) aufgestellt worden. Für einen beliebigen Wert von n die Existenz einer derartigen Identität nachzuweisen, scheint aber eine Aufgabe von erheblicher Schwierigkeit zu sein. Doch ist es mir wenigstens gelungen, den nächsten Fall n = 4 zu erledigen. In diesem Falle besteht die folgende Gleichung: (3) (4)

(12)

(48)

(8)

=6 ~ (2a) 8 +60 ~ (a±b) 8 + ~ (2a±b±c)8 +6 ~ (a±b±c±d)8 , a ... d

a ... d

a ... d

a ... d

wobei ich dieselbe Bezeichnungsweise angewendet habe, wie sie Herr Fleck benutzt. Da die entwickelte rechte Seite nur gerade Potenzen von a, b, c, d enthält und in diesen Grössen symmetrisch ist, so genügt es zur Verifikation der Gleichung (3), die Übereinstimmung der Koeffizienten von

auf der linken und rechten Seite festzustellen, das durch eine kurze Rechnung geschieht. Die in der Gleichung (1) mit p, p 1 , p 2 , ••• , Pr bezeichneten Koeffizienten haben in (3) folgende Werte: es ist p = 5040; von den übrigen Koeffizienten sind 4 gleich 6, ferner 12 gleich 60, weitere 48 gleich 1 und die übrigen 8 gleich 6. Nun hat Herr Landau 2) bewiesen, dass jede ganze Zahl als Summe von höchstens 38 Biquadraten darstellbar ist. Nach Gleichung (2) ergibt sich für die achten Potenzen demnach k'

=

38(4. 6 + 12. 60 + 48 + 8. 6) + 5039

=

36959,

d.h.: Jede positive ganze Zahl lässt sich als Summe von höchstens 36959 achten Potenzen ganzer Zahlen darstellen 3). A. a. 0. Über die Darstellung einer ganzen Zahl als Summe von Biquadraten, Rendiconti del Circolo Matematico di Palermo, t. XXIII (1907), S. 91-96. 3 ) Vgl. hierzu auch die Mitteilung von E. Maillet: Sur la decomposition d'un nombre en une somme de puissa.nces huitiemes d'entiers, Comptes Rendus, t.145 (1907), p. 1399-1400 (Zusatz bei der Korrektur.). 1)

2)

424

Zahlentheorie.

Es würde leicht sein, die Anzahl 36959 in diesem Satze auf einen kleineren Wert zu reduzieren; doch bietet diese Reduktion kein grösseres Interesse. 2. Bezüglich der Darstellung der positiven ganzen Zahlen durch eine Summe von nten Potenzen positiver ganzen Zahlen kann man leicht den folgenden Satz beweisen: "Es gibt unendlich viele positive ganze Zahlen, die nicht als Summe von n oder weniger nten Potenzen darstellbar sind."

Mit anderen Worten: Bezeichnet tp(k) die Anzahl der Lösungen der Gleichung (4)

X~

+ X~ + •· · + X~ =

k

in nicht negativen ganzen Zahlen Xv x 2 , ••• , x.,, so ist für unendlich viele Zahlen k tp(k) = 0. Bedeutet nämlich A die Anzahl derjenigen Systeme von n nicht negativen ganzen Zahlen x1 , x 2 , • •• , x.,, welche der Bedingung (5)

X~

+ X~ + ••· + X~

~ k

genügen, so ist nach bekannten Prinzipien 1)

~m ~ =

(6)

k-oo

J xl d

d x2 ... d x.,

(n)

= [r (1 +

r

! ) 2)'

wo das n-fache Integral über das Gebiet x1 ~ 0,

x 2 ~ 0, ... , xn ~ 0,

x~

+ x~ + · · · + x: ~ 1

auszudehnen ist. Anderseits ist (7)

A

=

tp(O)

+ tp(1) + tp(2) + · .. + 1p(k).

Würde nun von einer gewissen Grenze, etwa von k = N + 1 ab, die Anzahl 1p(k) stets grösser als Null, also mindestens gleich 1 sein, so wäre für k > N A

~

1p(O)

+ 1/'(1) + ... + 1p(N) + k- N

=

k

+ 0,

Dirichlet, Werke, Bd. I, S. 418. Ebenda, S. 389. Die Gleichung (6) betrachtet auch Ma.thews in der Note: On the representa.tion of integers as sums of powers, Messenger of Mathematics, (2) vol. 25 (1895), S. 69-71. Doch sind die Folgerungen, die Mathews aus der Gleichung (6) zieht, vollständig sinnlos. 1)

2)

Darstellung ganzer Zahlen durch n'• Potenzen.

425

wo C von k unabhängig ist. Hieraus würde folgen

~>1+!2 k k = und also durch Übergang zur Grenze k = oo : (8)

[r(1+ !)r~1.

Diese Ungleichung widerspricht aber der Tatsache, dass F(x) < 1 ist, wenn das Argument x zwischen 1 und 2 liegt. Demnach muss es, wie unser Satz behauptet, über jeder noch so grossen Grenze N solche Zahlen k geben, für die 1p(k) = 0 ist. Übrigens lässt sich dieser Satz, beiläufig bemerkt, auch ganz elementar, ohne Anwendung der Gleichung (6), durch eine direkte Abschätzung de:c Anzahl A beweisen. Im Falle n = 3 ist unser Satz insofern trivial, als er schon aus der einfachen Tatsache 1) folgt, dass die Summe dreier Kuben x~+x~+x~

durch 9 dividiert wohl die Reste 0, ± 1, ± 2, ± 3, niemals aber die Reste ± 4 lassen kann. Ähnlich ist es im Fallen= 4, worauf mich Herr Landau gelegentlich aufmerksam machte. Jedes Biquadrat ist 0 oder 1 (mod. 16) und die Summe xf + x~ + x~ + x! + .. · + x:

=

=

lässt daher durch 16 dividiert einen der Reste 0, 1, 2, ... r. Solange r < 15 ist, gibt es also sicher unendlich viele Zahlen, die nicht als Summe von r Biquadraten darstellbar sind. Die Gleichung (6) führt indessen, wenigstens im Falle n = 3, doch zu einem weiteren Resultat, nämlich zu folgendem Satze: Unter den Zahlen, die durch 9 dividiert einen der Reste 0, ± 1 , ± 2, ± 3 lassen, gibt es unendlich viele, die nicht als Summe von drei Kuben darstellbar sind. Wollte man das Gegenteil annehmen, so würde folgen, dass über eine gewisse Grenze hinaus { aller Zahlen als Summe von drei Kuben darstellbar sind. An Stelle der Ungleichung (8) würde sich nun ergeben

[r(1+ ~)r~ ~ =0,777···, 1 ) Jacobi, Über die Zusammensetzung der Zahlen aus ganzen positiven Kuben, Crelles Journal, Bd. 42 (1851), S. 44 [Werke, Bd. 6, S. 326].

426

Zahlentheorie.

eine Ungleichung, die nicht erfüllt ist, da man

findet. Die Annahme, dass alle über einer gewissen Grenze liegenden Zahlen von einer der Formen 16m + r (r = 0, 1, 2, 3, 4) sich als Summe von vier Biquadraten darstellen lassen, würde dagegen nicht im Widerspruch mit der Gleichung (6) stehen, da die Ungleichung tatsächlich erfüllt ist.

[r(1+ ~)J'~ls6

Zürich, 20. November 1907.

LXXII.

Über die diophantische Gleichung rg + g 3 z

+ z 3 X= 0.

(Mathematische .Annalen, Bd. 65, 1908, S. 428--430.)

In der Theorie der TransfQrmation siebenter Ordnung der elliptischen Funktionen spielt bekanntlich die Kurve vierter Ordnung (1)

welche 168 Kollineationen in sich besitzt, eine hervorragende Rolle 1). Liegen auf dieser Kurve Punkte, deren Koordinaten ganzen rationalen Zahlen proportional sind? Man sieht sofort, dass jedenfalls drei derartige Punkte, nämlich:

x: y: z

=

1 : 0: 0,

resp. 0: 1 : 0,

resp. 0: 0: 1,

welche die Ecken des Koordinatendreiecks bilden, vorhanden sind. Ich will nun zeigen, dass es keine weiteren solche Punkte gibt, dass also folgender Satz gilt: "Die Gleichung (1) besitzt keine Auflösung in ganzen, von Null verschiedenen Zahlen x, y, z." Man nehme an, es seien x, y, z drei von Null verschiedene ganze Zahlen, welche der Gleichung (1) genügen. Dann darf man diese Zahlen ohne einen allen dreien gemeinsamen Teiler (ausser 1) voraussetzen, da man einen solchen Teiler unterdrücken könnte, ohne dass die Zahlen aufhören würden, der Gleichung (1) zu genügen. Die positiv genommenen grössten gemeinsamen Teiler der Zahlen x, y, z, diese zu je zweien genommen, seien nun

(2)

(y,z) = u, (z, x) = v, (x, y) = w.

Da v und w relative Primzahlen sind (denn ein gemeinsamer Teiler von v und w würde in x, y, z aufgehen) und x sowohl durch v wie durch w 1 ) F. Klein, Über die Transformation siebenter Ordnung der elliptischen Funktionen, Mathem. .Annalen, Bd. 14 (1879), S. 428-471 [Ges• .Abhandlungen, Bd. III, s. 90-136].

428

Zahlentheorie.

teilbar ist, so ist x auch durch vw teilbar. Analoges gilt für y und z, so dass man (3)

x

= vwx', y = wuy', z = uvz',

setzen kann 1). Trägt man diese Ausdrücke von x, y, z in (1) em, so kommt nach Division mit uvw:

(4) Dieser Gleichung zufolge ist v 2 w 3 x' 3 y' durch u 2 teilbar. Da aber tt zu den drei Zahlen v, w, x' teilerfremd ist, so muss y' durch u 2 teilbar sein. Andererseits ist nach Gleichung (4) auch u 2 v3 z' 3 x' durch y' teilbar, und da y' zu den drei Zahlen v, z', x' teilerfremd ist, notwendig u 2 durch y' teilbar. Jede der beiden Zahlen u 2 und y' ist also durch die andere teilbar und folglich

y'

=

±

u2.

Ebenso ergibt sich: Die vorstehenden Werte von x', y', z' setze man in die Gleichung (4) ein und dividiere die entstehende Gleichung durch u 2 v 2 w 2 • Dadurch kommt: (5) ± u 7 ± v 7 ± w7 = 0. Wenn also die Gleichung (1) eine Auflösung in ganzen, von Null verschiedenen Zahlen besitzen würde, so hätte auch die Fermatsche Gleichung (5) eine solche Auflösung. Da die letztere Gleichung aber unlösbar ist, so ist es also auch die erstere, w. z. b. w. Die vorstehende Betrachtung lässt sich wörtlich auf die allgemeinere diophantische Gleichung

(6) übertragen, in welcher m, n zwei positive ganze Zahlen bezeichnen, die nicht beide gerade sind. Ohne die Allgemeinheit einzuschränken, darf man und überdies m und n teilerfremd voraussetzen. Behält man die durch die Gleichungen (2) und (3) eingeführten Bezeichnungen bei, so ergibt sich zunächst 1 ) Vgl. R. Dedekind, Über Zerlegungen von Zahlen durch ihre grössten gemeinsamen Teiler, Braunschweiger Festschrift 1897, S. 1-40 [Werke, Bd. 2, S. 103-147] und P. Bachmann, Niedere Zahlentheorie, Erster Teil, Leipzig 1902, S. 37.

429

Eine diophantische Gleichung.

(7)

vm-nwnl x'm y'n

+ wm-num y'm z'n + um-nvm z'm x'n =

0'

und hieraus folgert man x'n =

±

wm-n, y'n

= ±

um-n, z'n

= ±

vm-n.

Aus den letzteren Gleichungen schliesst man weiter (da die Exponenten n und m - n teilerfremd sind)

fx' = ± jw =

w'{'-n, w~

y'= ± u'{'-n, u = u~

z' = ± v'{'-n, V=

V~

Nunmehr geht die Gleichung (7) über in (8)

(± ul)m'-mn+n' + (± vl)m'-mn+n' + (± wl)m'-mn+n' =

0.

Aus einer Lösung der Gleichung (6) folgt daher eine Lösung der Gleichung (8). Aber auch umgekehrt: Befriedigen ± u 1 , ± v1 , ± w1 die Gleichung (8), so werden x = ± v~w'{', y =·± w~u'{', z = ± u~v'{' die Gleichung (6) befriedigen. Es gilt daher der Satz (in dessen Ausspruch die soeben mit ± u 1 , ± v1 , ± w1 bezeichneten Zahlen durch u, v, w bzw. ersetzt sind): Die diophantischen Gleichungen

+ ymzn + zmxn = 0 um'-mn+n' + vm'-mn+n' + wm'-mn+n' = xmyn

und

0

sind entweder beide in ganzen, nicht verschwindenden Zahlen lösbar oder beide nicht lösbar. Setzt man also den "grossen" Fermatschen Satz für den Exponenten m 2 - mn + n 2 als bewiesen voraus, so folgt daraus die Unlösbarkeit der Gleichung (6). Insbesondere würde die allgemeine Gültigkeit des Ferma tschen Satzes die Folgerung gestatten, dass die Gleichung (6) nur in dem trivialen Fall m = n = 1 Lösungen in ganzen, von Null verschiedenen Zahlen x, y, z zulässt.

Zürich, 20. November 1907.

LXXIII.

Über die Kongruenz

ar + bye +er= 0 (mod.p).

(Journal für die reine und angewandte Mathematik, Bd. 136, 1909, S. 272-292.)

Es liegt nahe, zu versuchen, den Beweis des "grossen" Ferroatseheu Satzes von der Unmöglichkeit der Gleichung

dadurch zu führen, dass man die Existenz von unendlich vielen Primzahlen p nachweist, für welche die Kongruenz x/

+ ye + ze =0

(mod. p)

nicht anders bestehen kann, als wenn eine der Zahlen x, y, z durch p teilbar ist. Herr Dicksou hat nun im Bande 135 (1909, S. 134-141) des Journals für die reine und augewandte Mathematik mit Hilfe der Theorie der Kreisteilung gezeigt, dass dieser Weg ungangbar ist, dass nämlich die erwähnte Kongruenz, sobald p eine gewisse Grenze überschritten hat, stets Lösungen zulässt, für welche keine der drei Zahlen x, y, z durch p teilbar ist. Ich will nun in den folgenden Zeilen den allgemeineren Satz beWeisen: Es seien a, b, c ganze von Null verschiedene Zahlen, e eine ungerade Primzahl. Dann besitzt die Kongruenz (1)

a:r/

+ by + CZ 6

6

=0

(mod. p)

für jede Primzahl p, die eine gewisse Grenze übersteigt, eine solche Lösung, für welche keine der drei Zahlen x, y, z durch p teilbar ist. Dabei werde ich den Beweis dieses Satzes mit ganz elementaren zahlentheoretischen Hilfsmitteln führen und z. B. von der Theorie der Kreisteilung keinen Gebrauch machen.

Ober die Kongruenz ax•

+ by• + cz• =0

(mod. p).

431

§1. Sehr einfach gestaltet sich die Diskussion der Kongruenz (1), wenn die Primzahl e kein Teiler von p - 1 , also zu p - 1 teilerfremd ist. Man kann dann nämlich die positiven ganzen Zahlen r und s so bestimmen, dass re = s(p -1) + 1 wird, worauf für jede ganze Zahl ~

~

die Kongruenz

=(c7)'

(mod. p)

+ bn + cC =0

(mod. p)

=

171+8(p-l)

gilt. Da nun die Kongruenz a~

offenbar durch ganze, durch p nicht teilbare Zahlen ~, 17, C befriedigt werden kann, so wird die Kongruenz (1) ebenfalls durch drei zu p teilerfremde Zahlen x, y, z, nämlich

x

=

~,.,

y

= n', z = ,,.

befriedigt werden können. Es bleibt demnach nur zu beweisen, dass unter denjenigen Primzahlen p, für welche p -1 = ef, (2) für die also p - 1 durch e teilbar ist, sich nur endlich viele befinden können, für welche die Kongruenz (1) nicht anders bestehen kann, als wenn wenigstens eine der Zahlen x, y, z durch p teilbar ist.

§ 2.

Bevor ich dieses beweise, will ich einige Bezeichnungen erklären, deren ich mich dabei bedienen werde. Bedeutet n eine ganze Zahl, die positiv, negativ oder Null sein darf, so setze ich tp(n) = 1 oder = 0, (3) je nachdem n durch p teilbar ist oder nicht. Diese zahlentheoretische Funktion tp(n) gestattet es, in sehr bequemer Weise die Anzahl der Lösungen von Kongruenzen nach dem Modul p auszudrücken. Beispielsweise wird die Anzahl der Lösungen der Kongruenz (1)

(4)

~ = ~ tp(ax• + by• + cz") z,v,z

Zahlentheorie.

432

sein, wobei die Summationsbuchstaben x, y, z je ein vollständiges System zu p teilerfremder Reste durchlaufen müssen. Dabei habe ich nur solche Lösungen gezählt, bei welchen die drei Zahlen x, y, z nicht durch p teilbar sind, und zwei Lösungen (x, y, z) und (x', y', z') dann und nur dann als nicht verschieden angesehen, wenn x' == x, y' == y, z' == z (mod. p) ist. Der zu beweisende Satz besagt nichts anderes, als dass (5) ~>O ist, falls die Primzahl p = ef + 1 eine gewisse Grenze überschritten hat. Aus der Bedeutung von q;(n) geht unmittelbar hervor, dass (6)

q;(kn)

= q;(n)

und q;(pn)

=

1

ist, unter n eine beliebige ganze Zahl, unter k eine durch p nicht teilbare ganze Zahl verstanden. Ich erweitere ferner den Begriff der Kongruenz der Zahlen auf Zahlsysteme. Zwei Systeme

(t 1 , t2 ,

•••

tr), (t~, t~, ... t;)

von je r ganzen Zahlen will ich nämlich nach der positiven ganzen Zahl m als Modul kongruent nennen, in Zeichen (7)

(mod. m),

wenn die r Kongruenzen (8) erfüllt sind. Die eine Kongruenz (7) bedeutet also nichts anderes als die r Kongruenzen (8). Von den Zahlsystemen (9)

' , ( t1

t2' ,

••• tr')

, ( t"1 , t2" ,

••• t,")

, . . . ( t1(s) , t(s) 2 ,

••• tr(s))

sage ich, dass sie ein vollständiges System inkongruenter Zahlsysteme (mod. m) bilden, wenn jedes beliebig gewählte Zahlsystem (t1 , t 2 , ••• tr) einem und nur einem der Zahlsysteme (9) nach dem Modul m kongruent ist, wenn also die Kongruenz

(t1• t2•

t+lwl + kn+2w2.

u 1)

+

An Stelle von

werde nun bzw. gesetzt k2 , k3 ,

•••

kn, -m (a1 w1 + b1 w2) , - m ( a 2 w1 + b2 w2) , 1

1

• ••

1

· - (an W 1

m

+ bn W 2) •

Über ternäre diophantische Gleichungen dritten Grades.

449

Dann nimmt die Gleichung (10) die Form an:

+ b1 w 2) + k2 (a2 w1 + b2 w 2) + + ... + kn(anwl + bnw2) + k.,+lmwl + kn+2 mw2]•

v = u 1 + ~ [k1 (a1 w 1

(11)

wo jetzt k1 , k 2 , ••• k.,+l, kn+ 2 unabhängig voneinander alle ganzen Zahlen zu durchlaufen haben. Hier kann man, ohne die Gesamtheit der Parameter v zu ändern, einerseits auf w1 , w2 eine unimodulare ganzzahlige Substitution S ausüben (was auf die Ersetzung von w1 , w2 durch ein anderes primitives Periodenpaar w~, w~ hinauskommt) und andererseits auf die Grössen a1 w1 mw 1

(12)

+ b1 w 2 , a 2 w 1 + b2 w2, ... anw1 + b.,w2 , = mw1 + 0. w2 , mw2 = 0. w1

+ mw2

eine unimodulare ganzzahlige Substitution T anwenden. Durch diese Operationen treten in dem Ausdruck (11) an die Stelle der Grössen (12) neue Grössen

(13) die dadurch charakterisiert sind, dass zwischen den Matrices

(14) M =

(aubl' ab2' . . . an,bn' m,0' m0),

die Relation (15)

2 , •••

SMT=M'

besteht. Nach bekannten Sätzen1) kann man nun Sund T so wählen, dass 1 , 0, 0, 0, ... 0) M' = O,e2 ,0,0, ... 0

(e

wird, wobei e1 und e2 - die "Elementarteiler" der Matrix M durch bestimmt sind, dass

da-

der grösste gemeinsame Teiler der Elemente von M und

der grösste gemeinsame Teiler der Determinanten zweiten Grades 1)

1898,

s.

Siehe z. B. P. Bachmann, Die Arithmetik der quadratischen Formen, Leipzig 288ff.

450

Zahlentheorie.

von M ist. Die Zahl e2 ist ein Divisor von m, die Zahl e1 ein Divisor von e2 • Durch Ausführung der Substitutionen S und T geht die Gleichung (11), wenn Einfachheit halber das neue Periodenpaar w~, w; wieder mit w1 , w 2 bezeichnet wird, über in oder (16) wo m1 ein Divisor von m, und m 2 ein Divisor von m1 ist. Man erhält offenbar schon sämtliche untereinander inkongruente Werte v, die in der Gestalt (16) enthalten sind, wenn man k1 ein Restsystem mod. m1 und k 2 ein solches mod. m 2 durchlaufen lässt. Da aber die Punkte v mit den n Punkten der vollständigen Punktgruppe (u 1 , u 2 , ••• un) übereinstimmen, ist

(17) Es sei jetzt umgekehrt u 1 irgendein bestimmter Parameterwert, ferner w1 , w2 ein primitives Perioden paar, und es seien m1 und m 2 zwei positive ganze Zahlen, von welchen die erste durch die zweite teilbar ist. Bildet man nun das System der Punkte (16), so wird dasselbe dann und nur dann eine vollständige Punktgruppe bilden, falls u 1 der Bedingung (18) genügt, wo A1 und A2 ganze Zahlen bedeuten. Dies ergibt sich sofort, wenn man zum Ausdruck bringt, dass die Verbindungsgerade irgend zweier der Punkte (16) die Kurve dritter Ordnung zum dritten Male ebenfalls in einem der Punkte (16) schneiden soll. Das Punktsystem (16) ändert sich nun nicht, wenn man u 1 ersetzt durch

(19) wobei r 1 und r 2 beliebig, aber fest zu wählende ganze Zahlen sind. Es tritt dann an die Stelle von (18) die Bedingung

(20) Die höchsten m ml bzw. m2 aufgehenden Potenzen von 3 Selen sa, bzw. 3'", so dass (21) wird, wobei

at1 ~ at 2

und m~ durch m~ teilbar ist, weil m2 in m1 auf-

Über ternäre diophantische Gleichungen dritten Grades.

451

geht. Da die Zahlen 0, m~, -m~ und ebenso 0, m~, -m~ ein Restsystem mod. 3 bilden, kann man über r 1 und r 2 so verfügen, dass Ä1

+ 3r1 = ± e 1 m~,

Ä2

+ 3r2 = ± e2 m~

wird, unter e1 , e2 je einen der Werte 0 und 1 verstanden. Die Gleichung (20) gibt dann

Das untere Vorzeichen darf hier unterdrückt werden, da man eventuell w1 durch - w1 resp. w2 durch - w2 ersetzen kann. Man erhält somit folgenden Satz 2. Der allgemeine Ausdruck der Systeme von Punkten, die eine vollständige Gruppe bilden, ist (22)

V=

EtWl

aa,+l

+ k2 ~ + aa.+l + k1 .!!2_ mll ml EaU:a

(k1 = 0, 1 , ... m1 - 1 ; k2 = 0, 1 , ... m2 - 1) . Dabei bedeuten m 1 und m 2 zwei positive ganze Zahlen, von denen die erste durch die zweite teilbar ist; sa, und 3"' sind die höchsten Potenzen von 3, die in m 1 bzw. m 2 aufgehen; e1 und e2 bezeichnen je einen der Werte 0 und 1 und w1 , w2 irgendein primitives Periodenpaar. Je nach den Werten von e1 und e2 liegen die folgenden vier Möglichkeiten vor: (22a) (22b) (22c) (22d) Hierzu ist noch folgendes zu bemerken. Vermehrt oder vermindert man die sämtlichen über die Kurve verteilten Parameter um dasselbe Periodendrittel, so erhält man eine neue Parameterverteilung, die sich von der früheren nur dadurch unterscheidet, dass derjenige Wendepunkt, dem der Parameter 0 entsprach, durch einen der andern Wendepunkte ersetzt worden ist. Wenn daher in (22 b) der Exponent ~X1 verschwindet, so kann man die betreffende Punktgruppe auch durch (22a) darstellen. Analoges gilt in den übrigen Fällen, so dass man in den Darstellungen (22b), (22c), (22d)

452

Zahlentheorie. cx.l ~

1,

cx.2 ~

1

voraussetzen darf. Ist die Anzahl n = m1 m2 der Punkte einer vollständigen Gruppe nicht durch 3 teilbar, so findet also immer die Darstellung (22a) statt und es gehört dann insbesondere der Wendepunkt v = 0 notwendig zu den Punkten der Gruppe.

3. Wenn die Kurve dritter Ordnung reell ist, so erhebt sich die :Frage nach der Konstitution derjenigen vollständigen Punktgruppen, die aus lauter reellen Punkten bestehen und die ich kurz als "reelle" Gruppen bezeichnen will. Man hat dabei zwei :Fälle zu unterscheiden. Erste·r Fall. Die Kurve ist einteilig. Die Parameterverteilung lässt sich dann so einrichten, dass den reellen Kurvenpunkten diejenigen Parameterwerte entsprechen, welche zu reellen Werten kongruent sind. Das primitive Periodenpaar kann so gewählt werden, dass die erste Periode reell ist (während die zweite Periode komplex ist). Bilden nun die Punkte (4) eine vollständige reelle Gruppe, so dürfen ihre Parameter u 1 , u 2 , ••• u,. reell vorausgesetzt werden und in den Gleichungen (7) fallen die Glieder in w2 fort, wenn dort w1 die reelle, w2 die komplexe Periode bedeutet. Ebenso können jetzt in der Gleichung (11) die Glieder in w2 unterdrückt werden, und da die Gesamtheit der Zahlen k1 a 1

+ k2 a 2 + ··· + k.. a.. + k.. +lm

übereinstimmt mit den sämtlichen Vielfachen des grössten gememsamen Teilers von a 1 , a 2 , • • • a,., m, so wird

(23)

v=u 1 +k-~ (k=0,1,2, ... m 1 -1) ml

der Ausdruck für die Punkte der vollständigen Gruppe. Der Parameter u 1 unterliegt wieder der Bedingung (18), in welcher Ä. 2 = 0 zu nehmen ist. Er kann durch ·

u= u 1 + r 1 - wl

ml

ersetzt werden, unter r 1 eine ganze Zahl verstanden, über die sich so verfügen lässt, dass

(24) wird, wo E1 und cx.1 dieselbe Bedeutung haben wie früher. Somit erhält man offenbar den

Über ternäre diophantische Gleichungen dritten Grades.

453

Satz 3. Der allgemeine Ausdruck der Systeme von Punkten einer einteiligen Kurve dritter Ordnung, die eine reelle vollständige Gruppe bilden, ist (25)

Dabei bedeutet m 1 eine positive ganze Zahl, 3 a, die höchste in m 1 aufgehende Potenz von 3, e1 einen der Werte 0 und 1 und ± w die reelle primitive Periode. Zweiter Fall. Die Kurve ist zweiteilig. Die Parameterverteilung kann und soll dann so getroffen werden, dass ein primitives Periodenpaar vorhanden ist, bestehend aus einer reellen Grösse w und einer rein imaginären Grösse w', und dass den Punkten des unpaaren Zuges diejenigen Parameter entsprechen, die reellen Werten kongruent sind, den Punkten des paaren Zuges aber diejenigen, die nach Subtraktion w' von 2 reellen Werten kongruent werden. Eine reelle Punktgruppe

kann nun entweder aus lauter Punkten des unpaaren Zuges bestehen. Dann findet dieselbe Analyse Platz wie im ersten Falle und eine derartige vollständige Gruppe wird also wieder durch die Gleichung (25) dargestellt. Oder aber die Punktgruppe besteht aus Punkten des paaren und des unpaaren Zuges. Dann bilden zunächst die Punkte des unpaaren Zuges, für sich betrachtet, eine vollständige Gruppe und diese Punkte lassen sich also durch (25) darstellen. Bezeichnet jetzt w'

Vo=-u+T•

wo u reell sm, irgendeinen Punkt des paaren Zuges, der zur vollständigen Gruppe gehört, so schneiden die Verbindungsgeraden von v0 mit den Punkten (25) des unpaaren Zuges die übrigen Punkte des paaren Zuges aus. Demnach sind

(26) die sämtlichen dem paaren Zuge angehörigen Punkte der Gruppe. Dabei ist notwendig der Tangentialpunkt von v0 , also der Punkt - 2v0 = 2u, ein Punkt des Systems (25), so dass

gesetzt werden kann, wo r eine ganze Zahl bedeutet. Bezeichnet nun ferner 211• die höchste Potenz von 2, die in m1 aufgeht, so lässt sich vorstehender Wert auf die Form bringen

454

Zahlentheorie.

(27) wo e einer der beiden Werte 0 und 1, und h eme ganze Zahl ist. Denn es ergibt sich

und dies wird entweder für e = 0 oder für e = 1 eine ganze Zahl. Setzt man nun für u den Wert (27) in (26) ein und beachtet, dass man statt h - k1 wieder k1 schreiben darf, so findet man für die Punkte des paaren Zuges den Ausdruck (k 1 = 0, 1 , 2, ... m 1 - 1) .

(28)

Man überzeugt sich nun weiter leicht, dass die 2m1 Punkte (25) und (28), wenn man e einen der beiden Werte 0 und 1 beilegt, wirklich eine vollständige Gruppe bilden. Demnach besteht der Satz 4;. Der allgemeine Ausdruck der Syäeme von Punkten einer zweiteiligen Kurve dritter Ordmmg, die eine reelle vollständige Gntppe bilden, ist entweder

(29) oder diese Gleichung in Verbindung mit e w

(30)

ew

w

w'

v=__!___+ 1 +-fJ+I+k 1 - + 2 , (k 1 =0,1, ... m 1 -1), aal 2 1 ml

je nachdem die Gruppe nur aus Punkten des unpaaren Zuges oder aus Punkten des unpaaren und des paaren Zuges besteht. Dabei bedeutet m 1 eine pos·itive ganze Zahl, 3a, und 2P• die höchsten Potenzen von 3 bzw. 2, die in m 1 aufgehen, e1 und e je einen der beiden Werte 0 und 1 , endlich w die reelle, w' die rein imaginäre Periode 1 ).

4. Es ist eine naheliegende Frage, ob die diophantische Gleichung dritten Grades (31) f(x,y,z)=O so gewählt werden kann, dass sie eine vorgeschriebene endliche Anzahl von Lösungen besitzt. Die vorstehenden Untersuchungen bieten einen 1)

Bezüglich der Sätze 3 und 4 vgl. Poincare, loc. cit. p. 173.

Über ternäre diophantische Gleichungen dritten Grades.

455

gewissen Anhalt für die Erledigung dieser Frage, insofern sie die möglichen Gruppierungen der den Lösungen entsprechenden rationalen Punkte der Kurve f (x, y, z) = 0 feststellen. Kommen alle diese Gruppierungen wirklich vor? Die Antwort hierauf allgemein zu geben, scheint sehr schwierig zu sein. Doch gelingt es, wie ich nunmehr näher ausführen will, in den niedrigsten Fällen die in Rede stehende Frage, und zwar im bejahenden Sinne, zu erledigen. Zunächst ist es leicht, solche Gleichungen (31) zu bilden, die überhaupt keine Lösung zulassen. Schon Euler 1) hat ein Beispiel hiefür gegeben, nämlich die Gleichung (32) xs + pys + p2zs = 0, wo p eine Primzahl bezeichnet. Der zugrunde liegende Körper ist natürlich der Körper der rationalen Zahlen. Würde die vorstehende Gleichung eine Lösung (x, y, z) besitzen, so müsste darin x durch p teilbar, also etwa x = p x' sein. Dann wäre p2x'3

+ ys + pzs =

0.

Folglich müsste auch y durch p teilbar sein. Indem man so weiter schliesst, erkennt man, dass jede der Zahlen x, y, z eine beliebig hohe Potenz von p als Faktor enthalten müsste. Daher folgt x = y = z = 0, d. h. die Gleichung (32) besitzt überhaupt keine Lösung. Ein vom algebraischen Standpunkte allgemeineres Beispiel bietet die Gleichung (33)

xs

+ 2y3 + 4z3 + 9tp(x, y, z) =

0,

in welcher tp (x, y, z) eine beliebig gewählte ganzzahlige Form dritten Grades bezeichnet. In der Tat, besässe die Gleichung (33) eine Lösung (x, y, z), wobei die Zahlen x, y, z ohne einen allen gemeinsamen Teiler vorausgesetzt werden, so würde um so mehr die Kongruenz

xs

+ 2y3 + 4z3 =0

(mod. 9)

eine solche Lösung besitzen. Diese Kongruenz besteht aber, wie man sich leicht überzeugt, nur dann, wen:o. die Zahlen x, y, z sämtlich durch 3 teilbar sind. Das Euler'sche Beispiel (32) lässt sich nach verschiedenen Richtungen verallgemeinern. So besitzt zum Beispiel die diophantische Gleichung (34) a1 x~ + a2 p x~ + a 3 p2 x; + · ·. + a11 p 11 - 1 x: = 0, in welcher a1 , a 2 , ••• a,. irgendwelche durch die Primzahl p nicht teilbare ganze Zahlen bedeuten, keine Auflösung. Noch allgemeiner hat 1)

Euler, Opera posthuma, t. I, p. 217.

456

Zahlentheorie.

diese Gleichung in einem beliebigen Zahlkörper keine Lösung, wenn für p ein Hauptprimideal des Körpers, für a1 , a 2 , ••• an durch p nicht teilbare ganze Zahlen des Körpers genommen werden.

5. Besitzt die Kurve dritter Ordnung (31) einen rationalen Wendepunkt, so wird auch die zugehörige Wendetangente, sowie der von der Wendetangente verschiedene geradlinige Bestandteil der ersten Polare des Wendepunktes rational sein. Indem man diese beiden Geraden und eine geeignet gewählte dritte rationale Gerade als Koordinatengeraden einführt, kann man die Gleichung (31) auf die Weierstrass'sche Normalform bringen: (35) wo g2 und g3 rationale Zahlen, d. h. Zahlen des zugrunde liegenden Zahlenkörpers, bedeuten. Diese Gleichung stellt also die allgemeinste Kurve dritter Ordnungmit einem rationalen Wendepunkt (x = 0, y = 1, z = 0) vor. Soll nun insbesondere die Gleichung (31) nur eine einzige Lösung besitzen, so muss der entsprechende rationale Punkt ein Wendepunkt sein und die Gleichung lässt sich also auf die Gestalt (35) bringen. Macht man die Gleichung (35) inhomogen, indem man z = 1 setzt und ändert die Bezeichnung in der Weise ab, dass man a für g2 , ferner b für g3 und 2 y für y schreibt, so erhält man den Satz 5. Die Gleichung (36) y 2 = x3 + a x + b

-!

!

stellt die allgemeinste Kurve dritter Ordnung mit einem einzigen rationalen Punkt (ihrem unendlich fernen Wendepunkt) vor, wenn die rationalen Zahlen a und b so gewählt werden, dass die Quadratwurzel

(37)

yx + ax + b 3

für jeden rationalen Wert von x irrational ist. Beispiele solcher Kurven, wobei der zugrunde liegende Körper der Körper der rationalen Zahlen ist, sind schon in der älteren Literatur vorhanden. So trägt zum Beispiel die Kurve 1)

(38) 1 ) Legendre, Theorie des nombres, 3me ed., Paris 1830, t. II, N° 333, 334 (S. 13 der deutschen Übersetzung, Leipzig 1886).

457

Über ternäre diophantische Gleichungen dritten Grades.

nur den einen rationalen Punkt x = sprechende Quadratwurzel (37) lautet

1,

y

= -1, z =

0.

Die ent-

vx3+2~' die also für jedes rationale x einen irrationale Wert besitzt. Diese x für x Wurzel lässt sich übrigens vermöge der Substitution von

i

auch durch y'3 (x 3 + 4) ersetzen. Allgemeinere Beispiele von diophantischen Gleichungen dritten Grades mit nur einer Lösung haben Pepin und Lucas 1) gegeben. Das Hauptergebnis, welches diese Autoren in den unten zitierten Arbeiten erhalten haben, möchte ich hier kurz auf neuem Wege begründen. Dabei bediene ich mich einer Methode, die ich seit vielen Jahren in meinen Vorlesungen verwende und die, wenn sie auch im Grunde genommen auf die "methode de descente" von Ferma t hinauskommt, doch vor dieser meist den Vorzug grösserer Kürze und Übersichtlichkeit besitzt. Die Methode besteht darin, dass ich unter der Annahme der Existenz von Lösungen einer diophantischen Gleichung eine solche Lösung betrachte, welcher eine gewisse Minimumseigenschaft zukommt, wie das aus dem nunmehr zu betrachtenden Beispiel näher erhellen wird. Im Körper der dritten Einheitswurzeln, in welchen sich die folgenden Betrachtungen bewegen, behalten bekanntlich die reellen Primzahlen p von der Form 3 k + 2 ihren Primzahlcharakter. Ferner hat, in bezug auf eine solche Primzahl als Modul, die Kongruenz

(39)

x3

=s

unters eine der Einheiten ±1, nur dann eine Lösung, wenn p'-1

(mod. p),

±e, ±e 2,(e= -I+:-=3)

-----s = s 2 sein und eine reelle Primzahl von einer der beiden Formen 9 h + 2 und 9 h + 5, oder das Quadrat einer solchen Primzahl, ferner e eine Einheit des Körpers bedeuten. Als Unbekannte werden die drei Zahlen x, y, z (ganze Zahlen des Kö1 pers) und die Einheit e betrachtet. Einer jeden Lösung der Gleichung ordne ich die Norm N(xyz) des Produktes xyz zu. Diese Norm ist eine nicht negative ganze Zahl und soll die "Höhe" der betreffenden Lösung heissen. Angenommen, es existieren Lösungen von nicht verschwindender Höhe. Dann sei (x, y, z, e) diejenige oder eine derjenigen unter ihnen von möglichst kleiner Höhe. Bezeichnet man nun die Zahlen

x

+ y, ex + e2y, e2x + eY

in irgendeiner Reihenfolge mit ct., ß, y, so ist

{41) und weiter, wenn zeichnet,

(42)

ct. (J

+ß+y=

0,

ct.ßy

+ eaz3 =

0,

den grössten gemeinsamen Teiler von ct., ß, y be-

~·~·~=-ea(;t

Die Faktoren der linken Seite sind hier zu Je zweien teilerfremd; denn da ihre Summe verschwindet, würde ein in zweien aufgehender Primfaktor auch im dritten aufgehen. Hieraus folgt, dass die Primfaktoren der rechten Seite sich auf die einzelnen Faktoren der linken Seite verteilen und also

(43) gesetzt werden kann, wobei e', e", e"' Einheiten bedeuten. ct. + ß + y = 0 ergibt sich (44)

x~

+ 1} y~ + e

1

az~

Wegen

= 0,

unter "' und e1 wieder Einheiten verstanden. Nach dem obigen Hilfssatz ist notwendig "' = ± 1, so dass (x1 , ± y1 , z1 , e1) eine Lösung von (40) vorstellt, deren Höhe N(x1 y1 z1) = N(~) ist. Da diese Höhe mindestens den Wert N (x y z) erreichen muss, folgt

(45)

N(~) ~N(xyz), 1 ~N(xyb),

Über ternäre diophantische Gleichungen dritten Grades.

459

was nur sein kann, wenn x, y, b Einheiten sind. Es würde also x3 = ± 1, y3 = ± 1 und folglich, da in (40) a > 2 vorausgesetzt wurde, z = 0 sein müssen, was der Ungleichung N(xyz) > 0 widerspricht. Demnach kann es keine Lösung der Gleichung (40) von nicht verschwindender Höhe geben. Ist aber die Höhe Null, so ist notwendig z=O,x3 =-y3 , und es sind also x=-1,y=1,e,e 2 ,z=O,e eme beliebige Einheit, die einzigen Lösungen, welche die Gleichung (40) zulässt. Insbesondere gilt also der Satz 6. Im Körper der rationalen Zahlen besitzt die Kurve

(46)

x3

+ y + az 3

3

=

0

nur den einen rationalen Punkt x = 1, y = - 1 , z = 0. Dabei bedeutet a > 2 eine Primzahl von der Form 9 h + 2 oder 9 h + 5 oder das Quadrat einer solchen Primzahl.

6. Im Falle a = 2 ist die vorstehende Betrachtung ein wenig zu modifizieren. Offenbar gibt es jetzt die Lösungen x3 = 1, y3 = 1, z3 = 1, e = - 1, welche sämtliche Lösungen von der Höhe 1 umfassen. Man betrachte also zunächst nur die Lösungen, deren Höhe N(xyz) > 1 ist. Bedeutet, unter der Voraussetzung, dass solche existieren, x, y, z, e eine unter ihnen von minimaler Höhe, so ergibt die aus ihr abgeleitete Lösung Xu ± y1 , z1 , e1 entweder wieder die Bedingung (45), oder es muss die Höhe N (x1 y1 z1) gleich 1 sein. Die weitere Diskussion führt dann zu dem Resultat, dass die Gleichung

im Körper der dritten Einheitswurzeln keine anderen Lösungen zulässt als die durch x3 = 1, y3 = -1, z = 0 oder x3 = 1, y3 = 1 , z3 = 1, e = -1 charakterisierten. Insbesondere folgt 1) Satz 7. Die Kurve dritter Ordnung

(47) besitzt im Körper der rationalen Zahlen nur zwei rationale Punkte x = 1 , y = -1, z = 0 und x = y = 1, z = -1. 1)

Vgl. Legendre, Theorie des nombres,

ame

ed., Paris 1830, t. II, Nr. 333.

460

Zahlentheorie.

Der eine dieser beiden Punkte ist Wendepunkt der Kurve, während der andere diesen Wendepunkt zum Tangentialpunkt hat.

7. Ich wende mich nun zu dem Falle von genau drei rationalen Punkten. Nach Satz 2 müssen diese entweder die vollständige Gruppe (48) oder die vollständige Gruppe

(49) bilden. Geometrisch bedeutet dieses, dass sie entweder mit drei in einer Geraden liegenden Wendepunkten zusammenfallen oder ein Dreieck ABC bilden müssen von der Eigenschaft, dass jede Ecke Tangentialpunkt der folgenden, also A von B, B von C und C von A ist. Satz 8. Im Körper der rationalen Zahlen wird der erste Fall realisiert durch die Fermat'sche Gleichung (50) der zweite Fall durch die Gleichung (51) In der Tat besitzt bekanntlich die Gleichung (50) nur die Lösungen (x, y, z) = (0, 1, -1), (1, 0, -1), (1, -1, 0),

die Gleichung (51) aber 1 ) nur die Lösungen (x, y, z) = (1, 0, 0), (0, 1, 0), (0, 0, 1).

Betrachtet man allgemein in irgendeinem Zahlkörper eine Kurve dritter Ordnung, auf welcher drei Punkte (48) rational sind, so lässt sich ihre Gleichung auf eine einfache Form bringen. Sind nämlich

(52)

z=O, x1 =0, x2 =0, x3 =0

die offenbar rationalen Gleichungen der die Punkte (48) tragenden Wendegeraden bzw. der in ihnen berührenden Wendetangenten, so kann die Gleichung der Kurve 1 ) Siehe meine Note: Über die diophantische Gleichung x 8 y + y 8 z + z3 x = 0, Mathem. Annalen, Bd. 65 (1908), S. 428-430 [diese Werke, Bd. II, S. 427-429].

Über ternäre diophantische Gleichungen dritten Grades.

461

geschrieben werden, wobei zwischen x1 , x 2 , x3 , z eine lineare homogene Relation mit Koeffizienten, die dem Zahlkörper angehören, besteht. Gehen die drei Wendetangenten durch einen Punkt, so sind x1 , x 2 , x3 voneinander abhängig, sonst nicht. Je nachdem der eine oder der andere Fall vorliegt, kann man durch zweckmässige Wahl des Koordinatensystems die Gleichung der Kurve auf eine der Formen az3 = xy(x

(53) (53')

+ y + z)

a(x

3

+ y), =

bxyz

bringen, unter a und b von Null verschiedene ganze Zahlen des Körpers verstanden. Der Fall a = 1 der Gleichung (53) führt, wie leicht zu sehen, im Körper der rationalen Zahlen auf die Ferma t'sche Gleichung zurück. ' Es sei jetzt vorausgesetzt, dass eine Kurve dritter Ordnung in irgendeinem Zahlkörper drei rationale Punkte (49) trägt. Dann wird ihre Gleichung bezogen auf das Dreieck ABC als Koordinatendreieck lauten: (54) ax 2 y + by 2 z + cz 2 x + oxyz = 0, wo a, b, c, i) ganze Zahlen des Körpers bezeichnen. Es ist sehr bemerkenswert, dass sich dieser Fall durch birationale Transformation 1) auf den, wo drei in gerader Linie liegende Wendepunkte rational sind, zurückführen lässt. Setzt man nämlich (55)

{

so geht (54) über in bz' 3

x : y : z = x' y' :·z' 2 : z' y', x': y': z' = xy: z 2 : zy,

+ x' y' (ax' + cy' + oz') =

0,

eine Gleichung, die auf eine der beiden Formen (53) und (53') zurückkommt.

8. Nach Satz 2 bietet eine vollständige Gruppe von vier Punkten zwei Möglichkeiten. Die Parameter einer solchen Gruppe lauten nämlich entweder

(56)

0 ~ 2--~ 3-~ '

4 '

4 '

4

1 ) Ein näheres Eingehen auf die birationalen Transformationen, die naturgernäss in der Theorie der diophantischen Gleichungen höheren Geschlechts eine wichtige Rolle spielen, muss ich mir hier versagen. Man vergleiche übrigens die oben zitierte Abhandlung von Poincare.

462

Zahlentheorie.

oder aber w

(57)

w'

w+ w'

0 ·2·2·-2-.

Die Punkte (56), die ich der Reihe nach mit P 0 , P 1, P 2, Pa bezeichnen will, haben folgende Konstellation: P 0 ist Wendepunkt, P 2 hat P 0 zum Tangentialpunkt, P 1 und Pa liegen mit P 0 in einer Geraden und haben P 2 als gemeinsamen Tangentialpunkt. Ich betrachte nun folgende Geraden, die sämtlich rationale Gleichungen besitzen, w·enn - wie ich jetzt voraussetzen will - die Punkte (56) rational sind:

y = 0, Z= 0, w = 0, X= 0, t = 0,

die die die die die

Gerade Gerade Gerade Gerade Gerade

Po Po Po P2 P2

P1 Pa, p2 P2, Po Po, Pl Pl, Pa Pa.

Jede Gerade ist hier durch ihre drei Schnittpunkte mit der Kurve charakterisiert. Die neun Schnittpunkte der Geraden w = 0, x = 0, t = 0 mit der Kurve werden auch durch z = 0 und die doppelt gedachte Gerade y = 0 ausgeschnitten. Daher hat die Gleichung der Kurve die Form (58)

y2z

+ ocwxt =

0,

unter oc eine rationale Zahl des Körpers verstanden. Die Geraden x = 0, y = 0, z = 0 bilden das Dreieck P 0 P 1 P 2 , welches als Koordinatendreieck gewählt werde. Dann kann

genommen werden, wo wieder ß und y rationale Zahlen des Körpers bezeichnen, die, ebenso wie oc, von Null verschieden sind. Indem man y x statt x und ßy statt y schreibt, erhält (58) die Gestalt (59)

ay 2 z

+ x(x + z) (y + z) =

0, (a rationale Zahl des Körpers).

Umgekehrt stellt (59) für jede Wahl der von Null verschiedenen Zahl a eine Kurve der betrachteten Art dar. Man hat also den Satz 9. Die allgemeinste Kurve dritter Ordnung mit vier rationalen Punkten (56) wird durch die Gleichung (60)

x(x

+ z) (y + z) + ay

2z

= 0

dargestellt, wo a eine von Null verschiedene Zahl des zugrunde gelegten Zahlkörpers bedeutet.

Über ternäre diophantische Gleichungen dritten Grades.

463

Wann wird die Kurve (60) ausser den Punkten (56), für welche offenbar entweder y = 0 oder z = 0 oder y + z = 0 wird, keinen weiteren rationalen Punkt tragen? Hierfür ist notwendig und hinreichend, dass die nach x genommene Diskriminante der Gleichung (60), d. h. LI = z(y

(61)

+ z) (z(y + z)- 4 ay

2)

nur für y z (y + z) = 0 das Quadrat einer rationalen Zahl des Körpers wird, Durch die Substitution Z = U - V, y = 2 V wird (62) und es gilt also der Satz 10. Die Kurve (60) wird dann und nur dann ausser den vier Punkten (56) keinen weiteren rationalen Punkt tragen, wenn die rationale Zahl a des Körpers der Bedingung genügt, dass

V (u 2 -v 2) (u 2 -

(1

+ 16a)v

2)

für zwei rationale Zahlen u, v stets irrational ist, ausser für v = 0 und für u = ± v. Im Körper der rationalen Zahlen tritt dies zum Beispiel ein, wenn a = - ~ genommen wird, da dann die Quadratwurzel gleich yu 4 -v4 wird 1). Ich wende mich nun zur Betrachtung derjenigen Kurven, die vier rationale Punkte der Konstellation (57) tragen. Seien P 0 , P 1 , P 2 , P 3 diese vier Punkte. Dann ist P0 Wendepunkt und P 1 , P 2 , P 3 sind die Punkte, deren Tangentialpunkte mit P 0 zusammenfallen. Wenn also der Reihe nach t = 0, w=O y = 0, X= 0, z = 0, die Gleichungen der Geraden

P 0 P 0 P0 , P 1 P 2 P 3 , P 0 P 1 P 1 , P0 P2 P2 , P0 P3 P3 sind, so wird y 2 x = ztw die Gleichung der Kurve. Die Geraden t = 0 und w = 0 gehen durch den Schnittpunkt von x = 0 und z = 0. Bei passender Bestimmung

-i

rührt von B. Levi her. Siehe loc. cit. Nota II, Das Beispiel der Kurve a = Doch ist mein Beweis dafür, p. 13. Ein anderes Beispiel liefert die Annahme a = dass (u 2 -v 2 )(u 2 + 3v2 ) für zwei ganze rationale Zahlen u, v niemals ein Quadrat wird, ausser für v = 0 oder u = ± v, ziemlich umständlich. 1)

-i·

464

Zahlentheorie.

der konstanten Faktoren; die in den Linearformen x, y, z, t, w willkürlich bleiben, wird daher t=x+az,,w=x+bz. So findet man als Satz 11. Die allgemeinste Kurve dritter Ordnung mit vier rationalen Punkten (57) wird durch die Gleichung

(63)

y2 x

=

z(x

+ az) (x + bz)

dargestellt, wo a und b von Null verschiedene Zahlen des zugrunde gelegten Zahlkörpers bedeuten. Man erkennt leicht, dass man diesen Satz ergänzen kann durch Satz 12. Soll die Kurve (63) ausser den vie1· Punkten (57) keinen weiteren rationalen Punkt tragen, so haben die Zahlen a und b der Bedingung zu genügen, dass

V x(x + a) (x + b) für keine rationale Zahl x des Körpers rational wird ausser für x = 0, - a,- b. Im Körper der rationalen Zahlen ist diese Bedingung zum Beispiel für a = 1, b = -1 erfülltl). Denn V x(x 2 -1) ist für keinen rationalen Wert von x, ausser für x. = 0, 1, - 1 rational, wie das wieder aus dem Fermat'schen Satze leicht folgt, nach welchem n 4 -v 4 niemals ein Quadrat wird ausser für v = 0 und u = ± v.

9. Es mögen hier zum Schluss noch einige Sätze über solche Kurven dritter Ordnung Platz finden, die unendlich viele rationale Punkte tragen. Dabei will ich der Kürze halber nur den Fall betrachten, wo die Kurve reell ist. Die Kurve besteht dann aus einem oder aus zwei Zügen. In meiner oben zitierten Arbeit über die Schröter'sche Konstruktion der Kurven dritter Ordnung habe ich nun bewiesen, dass die Punkte (3 k + 1)u (k = 0, ± 1, ± 2, ... ) , wenn u kein Periodenteil ist, den unpaaren Zug stets überall dicht überdecken und dass der eventuell vorhandene paare Zug entweder gar keinen dieser Punkte trägt, oder aber ebenfalls von jenen Punkten überall dicht erfüllt ist. Hieraus folgt der bemerkenswerte Satz 13. Trägt eine reelle Kurve dritter Ordnung unendlich viele rationale Punkte, so überdecken diese den unpaaren Zug der Kurve stets überall dicht, während der eventuell vorhandene paare Zug entweder 1)

Auch dieses Beispiel findet sich bei B. Levi, Nota II, p. 22.

Über ternäre diophantische Gleichungen dritten Grades.

465

ebenfalls von jenen Punkten überall dicht überdeckt ist oder gar keinen Punkt trägt 1). Es erhebt sich hier die Frage, ob die in dem Satze charakterisierten Fälle tatsächlich vorkommen. Hierüber gibt im Körper der rationalen Zahlen der folgende Satz bis zu einem gewissen Punkte Aufschluss: Satz 14. Die Kurve

{64)

ax3

+ by + cz + iJxyz = 3

3

0

trägt entweder keinen oder unendlich viele rationale Punkte. Dabei bezeichnen a, b, c, iJ ganze rationale Zahlen, welche den folgenden Bedingungen genügen: die Zahlen a, b, c sind von Null verschieden und zu je zweien teilerfremd, keine derselben ist durch das· Quadrat einer Primzahl te~lbar und höchstens eine unter ihnen ist eine Einheit, d. h. gleich ± 1. Bezeichnen x, y, z die Koordinaten eines rationalen Punktes der Kurve, so dürfen und sollen x, y, z als ganze Zahlen ohne einen allen gemeinsamen Teiler vorausgesetzt werden. Es sind dann auch x, y, z zu je zweien teilerfremd. Denn hätten zum Beispiel x und y den gemeinsamen Primfaktor p, so ginge p 2 in cz3 und folglich p auch in z auf. Ferner sind x, y, z von Null verschieden. Denn nach den über a, b, c gemachten Voraussetzungen sind diejenigen Punkte der Kurve, für welche eine der Koordinaten verschwindet {die Wendepunkte) sicher irrational. Angenommen nun die Kurve (64) trage rationale Punkte, und zwar in endlicher Anzahl. Als Höhe des einzelnen Punktes x, y, z bezeichne ich wieder den Wert von I x y z I, welcher nach dem Vorausgeschickten stets eine positive ganze Zahl ist. Ich betrachte nun denjenigen oder einen derjenigen Punkte, für welche die Höhe einen möglichst grossen Wert besitzt. Ist (x, y, z) dieser Punkt und (x' y' z') sein Tangentialpunkt, so ist dann sicher

I x' y' z' I ;;;;; I x y z I·

{65) Nun hat man weiter 2)

x': y': z' = x(by 3 - cz3): y(cz3 - ax3 ): z(ax3 - by3 )

(66)

und also, wenn 15 den grössten gemeinsamen Teiler der drei {sämtlich von Null verschiedenen) Zahlen rechter Hand bezeichnet, (67) Ohne Beweis auch von Poincare angegeben, loc. cit. p. 1'73. Resolution, en nombres entiers et sous la forme la plus generale, de l'equation cubique, homogene a trois inconnues, Nouvelles Annales, 3e serie, t. 5 (1886), p. 545--579. 1)

2) Vgl. z. B. Des boves,

30

466

Zahlentheorie.

Es ist aber ö zu x, y, z teilerfremd. Hätte nämlich ö zum Beispiel mit x einen gemeinsamen Primfaktor, so würde dieser, da er weder in y noch in z, wohl aber in den Zählern von y' und z' aufgeht, Teiler von c und b sein, während c und b nach Voraussetzung teilerfremd sind. Hieraus folgt nun, dass

(68) ganze Zahlen sind. Trägt man die Werte von x', y', z' aus (67) in (65) ein, so ergibt sich

1;17'1

also

~=±1,

;;:;1, 1]=±1, '=±1.

+ +

Dies ist aber unverträglich mit der Tatsache, dass ; 1J C= 0 ist. Demnach ist es unmöglich, dass die betrachtete Kurve rationale Punkte in endlicher Anzahl trägt, w. z. b. w. Beispielsweise hat die diophantische Gleichung x3 +2y 3 +3z3 =0

unendlich viele Lösungen, da sie die eine Lösung x = y = 1, z = -1 besitzt. Ich betrachte jetzt die Kurve (64) unter der Annahme, dass zwei der Zahlen a, b, c, etwa a und b, gleich 1, die dritte c aber von± 1 verschieden und nicht durch das Quadrat einer Primzahl teilbar sei. Die Kurve, deren Gleichung jetzt

xa + y3 + cz3 + iJxyz = 0

(69)

lautet, trägt offenbar den rationalen Punkt

x=1, y----:--1, z=O.

(70)

Dieser ist ein Wendepunkt und der einzige rationale Punkt von der Höhe I x y z I = 0. Angenommen, es gäbe ausserdem noch weitere rationale Punkte, aber nur in endlicher Anzahl. Dann sei (x, y, z) einer unter ihnen von maximaler Höhe. Sein Tangentialpunkt x': y': z' = x (y 3 - cz3): y(cz3 -

x 3): z(x3 -

y3)

muss dann die Höhe Null haben, also mit (70) zusammenfallen, da die gegenteilige Annahme, wie oben, auf emen Widerspruch führt. Somit ist notwendig z' = 0, d. h.

x=y=1 und, wegen (69), 2

+ cz + iJz = 0. 3

Über ternäre diophantische Gleichungen dritten Grades.

Daher muss z als Divisor von 2 einen der Werte und zugleich, je nachdem, (71)

2

± (c + o) = o,

1

±

(4 c

± 1, ± 2

467

besitzen

+ o) = o

sein. Die einzigen Fälle, in denen die Kurve (69) mehr als einen rationalen Punkt, jedoch nur endlich viele im ganzen, tragen kann, sind also die folgenden vier: (7 2)

{ x3 xa

+ y + cz3- (c ± 2) xyz = 0, + ya + cz3 - (4 c ± 1) xyz = 0, 3

wobei die Punkte x = 1, y = 1, z = ± 1 und x = 1, y = 1, z = ± 2 bzw. auf den Kurven von maximaler Höhe sind. Können dann noch ·weitere solche Punkte vorhanden sein? Dies ist leicht festzustellen, da man von vornherein weiss, dass die Höhe eines solchen Punktes nur 1 bzw. 2 sein kann. Die Diskussion ergibt sofort, dass in keinem Falle ein solcher Punkt existiert. Daher gilt der Satz 15. Die Kurve (73)

x3

+ y3 + cz3 + oxyz =

0

trägt entweder einen, oder zwei, oder unendlich viele rationale Punkte. Dabei bezeichnen c und o zwei ganze rationale Zahlen, von denen die erstere nicht durch das Quadrat einer Primzahl teilbar und von ± 1 verschieden ist. Der mittlere Fall, in welchem die Kurve genau zwei rationale Punkte trägt, kann nur eintreten, wenn die Gleichung (73) eine der vier Formen (72) besitzt. Endlich betrachte ich die Kurve

xs

(74)

+ ya + z + ox y z = 3

0,

welche die drei rationalen Punkte (1, -1, 0), (1, 0, -1), (0, 1, -1) trägt. Die ganze Zahl o soll nur der Einschränkung unterliegen, dass die Kurve (74) vom Geschlecht 1 ist, d. h. es soll o von- 3 verschieden sein. Die analogen Betrachtungen wie in den vorhergehenden Fällen lehren nun: soll die Kurve (74) ausser den drei genannten noch weitere rationale Punkte, im ganzen aber endlich viele solche Punkte tragen, so muss der Tangentialpunkt x': y': z'

= x(y3 -z3): y(z3 -

x 3 ): z(x3 - ys)

des rationalen Punktes (x, y, z) mit einem jener drei Punkte zusammenfallen, falls (x, y, z) von maximaler Höhe ist. Es müssen für diesen Punkt demnach zwei der drei Koordinaten einander gleich, zum Beispiel x = y = 1 sein. Für die dritte Koordinate z folgt dann aus (74) 2+z3 +oz=O,

468

Zahlentheorie.

also z = ± 1 oder ± 2 und 2 ± (1 + o) = 0 oder 1 Da o = - 3 ausgeschlossen bleibt, sind

o=

1 und

o=

± (4 + o) =

0.

-5

die einzigen in Betracht kommenden Werte von o. Es gilt also der Satz 16. Bezeichnet o eine von 1 , - 3 und - 5 verschiedene ganze Zahl, so trägt die Kurve x,3 + y 3 + z3 + oxyz = 0 drei rationale Punkte oder deren unendlich viele. Was die den Annahmen o = 1 und o = - 5 entsprechenden speziellen Kurven xs + ys + zs + xyz = 0, x3 + y3 + z3 - 5 xyz = 0

betrifft, so trägt jede von ihnen sechs sofort angehbare rationale Punkte. Würden auf einer dieser Kurven noch weitere rationale Punkte liegen, so müssten sogleich unendlich viele auf ihr vorhanden sein. Es ist mir aber nicht gelungen festzustellen, ob jene sechs Punkte die einzigen rationalen Punkte sind oder nicht. Betrachtet man die Gesamtheit aller rationalen Punkte auf einer Kurve dritter Ordnung, so liegt es nahe, nach "fundamentalen" unter ihnen zu fragen, d. h. nach solchen, aus denen alle übrigen durch die wiederholte Anwendung der fundamentalen Konstruktion abgeleitet werden können. Dass man endlich viele "fundamentale" angeben kann, wenn es überhaupt nur endlich viele rationale Punkte auf der Kurve gibt, ist selbstverständlich. Wenn aber die Anzahl der rationalen Punkte auf der Kurve unendlich ist, so spricht a priori nichts dafür, dass auch dann immer endlich viele fundamentale Punkte vorhanden sind. Bis also dieses nicht bewiesen ist, sind die auf diese Annahme gegründeten Bemerkungen von Poincare in seiner mehrfach zitierten Arbeit entsprechend zu modifizieren.

LXXV.

Zu Grassmanns Note: "Lösung der Gleichung x 3 + g 3 + z 3 + u3 = 0 in ganzen Zahlen". (Jahresbericht derDeutschen Mathematiker-Vereinigung, Bd.27, 1918, 8.55-56.) (Aus einem an F. Engel gerichteten Brief.)

In dieser ursprünglich in Grunerts Archiv, Bd. 49 (1868) erschienenen und im ersten Teil des zweiten Bandes S. 242-243 der gesammelten Werke wieder abgedruckten kleinen Arbeit bemerkt Grassmann, nachdem er die Gleichung x 3 + y 3 + z3 + u 3 = 0 (1) durch die Substitution

(2)

x = a + c,

y = a- c, z = - b + d, u = - b - d

auf die Form (3) gebracht hat: "Man überzeugt sich leicht, dass a und b, abgesehen von einem gemeinschaftlichen Faktor, Quadratzahlen sein müssen." Nun haben Sie bei der Herausgabe der Werke Grassmanns (Bd. II, S. 429) schon darauf hingewiesen, dass Grassmann nicht verrate, wie man sich so leicht davon überzeugen kann, und dass infolge dieser unbewiesenen Behauptung man nicht sicher sei, dass durch die Formeln, zu denen Grassmann gelangt, wirklich alle Lösungen der Gleichung (1) geliefert werden. In der Tat liegt die Sache so, dass Grassmanns Behauptung nicht richtig ist. Betrachtet man nämlich irgendeine Lösung der Gleichung (3) in rationalen Zahlen a, b, c, d und setzt (4)

~ ;----o b+dV-3 3 b-dV-3 -t>, r + s ·v ---'----===-=

a+cV-3

a-cV-3

=

~ ;----o 3 -t>, r-s ·v

so sind auch r und s rationale Zahlen, und es wird zufolge (4) und (3):

b = ar-3cs, d =er+ as, a = b(r 2

+ 3s 2).

470

Zahlentheorie.

Hieraus folgt durch Auflösung nach a, b, c, d :

(5)

a: b: c: d = 3 8 (r 2 + 3 82) : 3 8: r(r 2 + 3 82) -1 : (r 2 + 3 82) 2 - r

und durch Eintragung in (2) ergibt sich als allgemeinste Lösung der Gleichung (1) : ex= (r+38)(r2 +38 2)-1, eY = -(r-38)(r 2 + 38 2) + 1, (6) ez = - (r + 3 8) + (r2 + 3 82)2, eu = r- 3 8 - (r2 + 3 82) 2, wo e einen rationalen Faktor bedeutet. Diese Formeln, in welchen für r und 8 irgend zwei rationale Zahlen zu nehmen sind, hat auf ähnlichem Wege zuerst Euler (Opera omnia, Series prima II, pag. 442) aufgestellt. Sie sind seitdem von mehreren Mathematikern in nur unwesentlich verschiedenen Formen abgeleitet worden. Würde nun die Behauptung Grassmanns richtig sein, so müsste (vgl. drat r2 + gibt

(5)) : = r 2 + 3 8 2 für je zwei rationale Zahlen r und 8 ein Quasein, was man, etwa durch das Beispiel r = 1, 8 = 2, also 38 2 = 13, sofort widerlegen kann. Die Grassmann'sche Note also wirklich nur partikuläre Lösungen der Gleichung (1).

LXXVI.

Der Euklidische Divisionssatz in einem endlichen algebraischen Zahlkörper. (Mathematische Zeitschrift, Bd. 3, 1919, S. 123-126.)

In der elementaren Zahlentheorie pflegt man den Nachweis der Existenz des grössten gemeinsamen Teilers zweier ganzen Zahlen auf den Euklidischen Divisions-Algorithmus zu gründen, welcher auf dem einfachen Satze beruht, dass jede ganze Zahl a in die Gestalt

(1)

a

= qd + r

gesetzt werden kann, wobei d eine von Null verschiedene ganze Zahl bedeutet und von den beiden ganzen Zahlen q und r die letztere absolut kleiner als d ist. Diesen "Euklidischen Divisionssatz" kann man, indem man die Gleichung (1) auf die Form (1') bringt, auch so aussprechen: "Ist e eine rationale Zahl, so kann man die ganze Zahl q so wählen, dass die Differenz e- q absolut kleiner als 1 ausfällt." In meiner Arbeit "Zur Theorie der algebraischen Zahlen" 1) habe ich die Theorie der Ideale auf die folgende Verallgemeinerung dieses Satzes gestützt: Ist e eine Zahl des endlichen algebraischen Zahlkörpers K, so lassen sich die ganzen Zahlen q1 , q2 , ••• , qm desselben Körpers so bestimmen, dass unter den N armen der Zahlen

(2) mindestens eine absolut genommen kleiner als 1 ist. Dabei bedeutet m eine positive ganze rationale Zahl, die ausschliesslich vom Körper K abhängt. 1 ) Nachrichten von der kgl. Gesellschaft der Wissenschaften zu Göttingen 1895, S. 324-331 [diese Werke, Bd. II, S. 236-243]. Vgl. auch P. Bachmann, Allgemeine Arithmetik der Zahlenkörper, Leipzig 1905, S. 190-195.

472

Zahlentheorie.

Von der Zahl m darf und soll vorausgesetzt werden, dass sie nicht durch eine kleinere Zahl ersetzt werden kann. Dann ist m eine für den Körper K eindeutig bestimmte, charakteristische Zahl. A. a. 0. habe ich diesen Satz in wenigen Zeilen mit Hilfe des von Dirichlet so häufig verwendeten Schlusses bewiesen, demzufolge bei Verteilung von Objekten in eine Anzahl von Fächern, die kleiner ist als die Anzahl der Objekte, notwendig ein Fach vorhanden sein muss, in welches mehr als ein Objekt hineinkommt. Man kann den Satz aber auch auf Grund des bekannten Minkowski'schen Satzes über Linearformen mit ganzzahligen Variabeln beweisen 1). Dieser, freilich viel weniger elementare Beweis gibt über den Wert der Zahl m einigen Aufschluss und deshalb möchte ich ihn in den folgenden Zeilen kurz darlegen. Der Minkowski'sche Satz lässt sich so formulieren: Es seten

(3)

f11 = ahlx1 + a112 x 2 + · · · + a1111 X 11 (h = 1, 2, ... , n)

n > 1 lineare Formen von n Variablen mit reellen Koeffizienten, deren Determinante

(4)

I akk I= L1

von Null verschieden ist. Ferner seien k1 , k 2 , •• die der Bedingung (5) k1 k 2 •• • k .. = abs. L1

•,

k11 n positive Grössen,

genügen. Dann kann man den Variablen x 1 , x 2 , ••• , x.. solche nicht sämtlich verschwindende ganze rationale Werte beilegen, dass die zugehörigen Formenwerte die Bedingungen

(6) befriedigen. Es ist leicht, diesen Satz auf den Fall zu übertragen, wo die Formen (3) nicht sämtlich reell sind, sondern unter ihnen ein oder mehrere Paare konjugiert komplexer Formen vorkommen 2). Für diesen Fall lautet der Satz: 1 ) Es ist bemerkenswert, dass bei dem arithmetischen Beweise des Satzes von Minkowski, den ich in den Nachrichten von der kgl. Gesellschaft der Wissenschaften zu Göttingen 1897, S. 139-145 [diese Werke, Bd. II, S. 331-337] gegeben habe, ebenfalls der erwähnte Dirichlet'sche Schluss Verwendung findet. 2 ) Vgl. D. Hilbert, Die Theorie der algebraischen Zahlkörper, Jahresbericht der Deutschen Mathematiker-Vereinigung, Bd. 4, 1897, S. 210, Satz 42 [Ges. Abh., Bd. I, S. 99]. Siehe auch E. Landau, Abschätzungen von Charaktersummen, Einheiten und Klassenzahlen, Nachrichten von der kgl. Gesellschaft der Wissenschaften zu Göttingen 1918, S. 92, Anmerkung 31.

Divisionssatz in einem endlichen algebraischen Zahlkörper.

473

Es seten

(7) Linearformen der Variabeln Xv x 2 , ••• , x .. , und zwar {1 , { 2 , ••• , fr reelle Formen, während von den übrigen n- r = 2 s > 0 Formen je zwei nebeneinanderstehende, wie fr+l• fr+ 2 usw. bis fn_ 1 , f,. konjugiert komplex seien. Ferner mögen die positiven Konstanten kv k 2 , ••• , kr. kr+l = kr+ 2 , ... , kn- 1 = k.. der Bedingung

(8) genügen, unter L1 die von Null vm·schieden vorausgesetzte Determinante der Formen (7) verstanden. Dann kann man den Variabeln x 1 , x 2 , ••• , x,. solche nicht sämtlich verschwindende ganze rationale Werte beilegen, dass die zugehörigen Formenwerte die Bedingungen

(9) befriedigen.

Im Falle r = 0 kommen natürlich die Formen {1 , { 2 , ••• , fr, die Konstanten k1 , k2 , ••• , kr und die auf sie bezüglichen Ungleichungen (9) in Fortfall. Es sei nun K ein algebraischer Zahlkörper vom Grade n > 1, ferner e eine beliebige Zahl dieses Körpers und w1 , ro 2 , ••• , w,. eine Basis der ganzen Zahlen des Körpers. Ich betrachte dann die folgenden n + 1 Linearformen der Variabeln x, x1 , x2 , ••• , x,. :

f

=X,

{ 1 =(!X

wo

(11)

+ ro 1 x1 + w2 x 2 + ··· + w.. x.. ,

f2 = e' x + w~ x 1 + w~x2 + ·· · + w~x,.,

(10)

••• , f,. die zu ft konjugierten Linearformen sind. Die Determinante dieser n + 1 Formen hat den Wert

f2 ,

L1 =

VD,

unter D die Grundzahl des Körpers K verstanden. Nach dem Minkowski'schen Satze lassen sich die ganzzahligen rationalen, nicht sämtlich verschwindenden Werte x, x1 , x2 , ••• , x,. so wählen, dass (12)

ltl = lxl < vf.DT, 1111 ) m die Gleichung (5) liefert (i=1,2, ... ,r); (17) ferner ist IJ,O,O, ... ,O x x (18)

X1



X(r) 1 •

2 • • • ·'

x

2 ' • • ·'

r

x r

0'

(j'

0' ... ' 0

=

IJ',

o,o,o, ... ,IJ

weil ot1xi1>+ ~x~1 > + ·· · + ot,x~1 > = l1(xil), x~1 >, •.. , x~1 >) = IJ zufolge (15) ist u. s. f. Drücken wir vermöge (17) und (18} die Werte " und "t aus, so ergibt sich aus (12) : Das Volumen desjenigen von den r linearen V erbindungsräumen der Punkte

484

Zahlentheorie.

begrenzten Gebietes F, welches mit dem linearen Raum l

=c x + c x + · · · + 1

1

2

2

0

Cr Xr =

keinen Punkt gemein hat, dies Volumen bezüglich der Linearform l genommen, hat den Wert

(19)

J

J

dQ

= ± T =±

1 b (r-1)! • l(1)l(2)oool(r)

0

Die Bedeutung von {J und l(i) erhellt aus (16). Die Formeln (12) und (19) sind Verallgemeinerungen bekannter Formeln für das Volumen eines Simplex im gewöhnlichen (Euklidischen) Raume von (r - 1) Dimensionen. Ein weiteres projektives Integral, dessen Wert für unsere Zwecke zu berechnen ist, entsteht folgendermassen. Wir ordnen jeder quadratischen Form mit reellen Koeffizienten l.oon

f = f(u 1 , u 2 , . 0, un) = ~ ai,.uiu,.

(20)

o

i,"'

von n Variablen u 1 , u 2 , 00., Un denjenigen Punkt im projektiven Raume von n(n+ 1) 2

1

Dimensionen zu, dessen Koordinaten zu a 11 , a 22 , .o., ann• a 12 , ••• , a1n, ... , an-l,n proportional sind. Der betreffende Punkt möge der Kürze halber als "Punkt f" bezeichnet werden. Jeder Form f entspricht also ein bestimmter Punkt f, wobei aber dieser Punkt sich nicht ändert, wenn die Form f durch die Form ef ersetzt wird, untere eine beliebig gewählte nicht verschwindende reelle Konstante verstanden. Der betrachtete Raum heisse der Raum der quadratischen Formen und derjenige Teil dieses Raumes, dessen Punkte die positiven Formen repräsentieren, werde mit F bezeichnet. Die Punkte von F werden durch den Ansatz

(21)

f = P1(u1 + P12u2 + P1aUa + · · · + P1nun) 2

+ P2(u2 + P23U3 + · · · + P2nun) 2 + · · · + Pnu!

geliefert, wobei p 1, p 2, ... , Pn alle positiven Werte und p 12 , p 13 , ... , Pn-l,n alle reellen Werte durchlaufen müssen. Dabei liefern zwei Wertd systeme P1• P2• · · ., Pn' P12• P1a• · · ., Pn-1 n un Pv P2• · · ., Pn• P12• P1a• 1 n dann und nur dann dens~lb~n Punkt von F, wenn p~:p~:.:.:p:=p 1 :p 2 : ••• :pn und P~x=Pix (i
< n(n + 1)) ( i," (1 +Pf2+ ... +Pfn)n(1 + b22+ ... +bnnY'-n Ä.=r + - - 2 -

und darauf die Integration nach p 12 , (43)

D _

n-

r(n)F(A.-n) · F(A.)

•• • ,

2 (v-)n-1 r(.!':±.!_) n

F(n)

f

P1 n

2, ... ,n

n·dbi>< i, ..

-,(1""'+~b-22-'-:+-.-.-.+c--:bn-n-;-c)A.-:--n=-

(Ä.-n=r+ (n--;1)n). Diese Gleichung stellt nun eine Rekursionsformel für das zu berechnende Integral vor, da das Integral rechter Hand aus Dn dadurch entsteht, dass man n durch n - 1 ersetzt. Da nun

und

r(r+ n(n2-1)) D = ~--=-~-7(v';;)n-1r(n+2 1). Dn-1 n

r

(r+ (n~l)n)

ist, so kommt Dn=

n(n-1)

(~)-2- r(!) .r(:) .r(:) .. . r(n~1 )· r(r;~).

Unter Benutzung dieses Resultates kommt schliesslich nach leichter Rechnung

n(n-1)

(44)

0n=(~)-2-r(~)·r(:) ... r(nt1)· r(~).

1 ) Schlömilch, Compendium der höheren Analysis, 4. Aufl., Braunschweig 1895, Bd. 2, S. 277.

490

Zahlentheorie.

Nach dem Funktionaltheorem der F-Funktion ist der Wert von Cn ein rationales Multiplum einer Potenz von -yl;.

§ 3.

Die Reduktion der ternären positiven quadratischen Formen. Wir ordnen der ternären quadratischen Form

I= l(ul, U2, Us)

(1)

= an ui + a22 u~ + a33 ui + 2 a 12 u1u 2 + 2 a23 u2 u3 + 2 a31 u3u 1

denjenigen Punkt des fünfdimensionalen projektiven Raumes R zu, dessen Koordinaten

(2) sind. Der Punkt werde kurz als "Punkt I" bezeichnet, und F sei das Gebiet derjenigen Punkte I, die den positiven Formen I entsprechen. Wir bringei;J. die Form I auf die Gestalt

I= P23ui +

(3)

sodass

(4)

Ps1u~ + Ptzui + PIO(uz- ua) 2 + P20Cua- ut) 2

+ Pao(ul-uz) 2,

{PIO = -a23, P20 = -aal• Pao = -alz• P23 =an+ atz+ ala• Pa1 = azz + a23 + azl• P12 = a33 +aal+ asz

zu setzen ist. Ist I;J.un I eine positive Form, so heisst sie nach Selling "reduziert", wenn die Werte Pi,. sämtlich nicht-negativ sind. Um diese Definition geometrisch zu formulieren, bemerken wir, dass der Punkt I ein gewisses Gebiet beschreibt, wenn in dem Ansatz (3) die sechs Koeffizienten Pix unabhängig voneinander alle nicht-negativen Werte durchlaufen. Dies Gebiet entsteht folgendermassen: Wir betrachten die sechs Punkte, welche die Formen (5)

repräsentieren, und verbinden sie zu je fünfen durch lineare Räume. Diese sechs Verbindungsräume begrenzen dann das in Rede stehende Gebiet, welches in der Folge als Gebiet F 0 bezeichnet werde. Eine positive Form I ist demnach reduziert, wenn der Punkt f dem Gebiete F 0 angehört.

491

Klassenzahl positiver ternärer quadratischer Formen.

Wir betrachten jetzt ferner eine unimodulare ganzzahlige Substitution u 1 = s 11 u~ + s 12 u~ + s 13 u~, (6) (S) u2 = s21 ui + s22 u~ + s23 u;,

l

Ua

=

SalUl

+ S32U2 + SssUa,

1,2,3

a;,.

durch welche die Form f in die äquivalente Form f S = f' = ~ u~u: übergehen möge. i," Es mögen dann auch die beiden Punkte f und f S äquivalent heissen, und Kürze halber möge gesagt werden, der Punkt f = (ai,.) gehe vermöge der Substitution S in fS = f' = (a;,.) über. Da die Zuordnung von f' zu f durch die Gleichungen

(7)

(i' u = 1' 2' 3)

vermittelt wird, so bedeutet dieselbe eine Kollineation des Durchläuft der Punkt f das Gebiet F 0 , so durchläuft der Punkt fS ein Gebiet, welches mit F 0 S bezeichnet werde. steht aus den sechs den Formen (5) zugeordneten Punkten, Punkten

(8)

Raumes R 5 • zugeordnete Dieses entalso aus den

~~+~~+~~~ ~~+~~+~~~ (salul Sa2U2 SaaUs) 2, [(s21- Ssl) U1 (s22- Sa2) U2 (s2a- Saa) uaJ2, [(s31- sn)ul (ss2- s12)u2 (sss- sla)uaJ2, [(sn- S21) U1 Cs12- S22) U2 (sla- S2a) uaJ2,

+ + +

+

+

+ + +

genau so, wie das Gebiet F 0 aus den Punkten (5). Die Sellingsche Reduktionstheorie lässt sich nun, ihrem wesentlichen Inhalte nach, in den Satz zusammenfassen 1): Durchläuft S alle unimodularen ganzzahligen Substitutionen, so erhält man ihnen entsprechend unendlich viele Gebiete F 0 S, welche ~n ihrer Gesamtheit das Gebiet F einfach · und lückenlos überdecken. Dabei ist zu beachten, dass das Gebiet F 0 durch 24 Substitutionen S, nämlich durch diejenigen, welche die 6 Punkte (5) unter sich vertauschen, in sich übergeht. Infolgedessen entsteht jedes einzelne Gebiet F 0 S, wenn S alle Substitutionen (6) durchläuft, genau 24 mal, und in dem vorstehenden Satze sind natürlich nur die voneinander verschiedenen Gebiete F 0 S gemeint. 1 ) Vgl. A. Hurwitz: Über die Reduktion der binären quadratischen Formen, Math. Annalen, Bd. 45 (1894), S. 85-117 [diese Werke, Bd. II, 8.157-190]. Von der dort am Schluss angekündigten Abhandlung befinden sich einige Bruchstücke im Nachlass von H urwi t z unter dem Titel: Über die Reduktion der ternären quadratischen Formen. A.S.

492

Zahlentheorie.

§ 4.

Die Fundamentalformel. Wir betrachten jetzt ein projektives Integral (1)

J

J

= f (a1v a22 , aaa, a12, a2a, aal) d Q G

ausgedehnt über ein Gebiet G des Raumes R 5 , welches ganz in dem Gebiete F enthalten ist. Da wir die integrierte Funktion f(a 11 , • •• , aa1) festhalten wollen, können wir den Wert des Integrals kurz durch J (G) andeuten. Um diesen Wert auch dem Vorzeichen nach festzulegen, denken wir uns ihn gernäss Formel (10) in § 1 berechnet, wobei in dieser Formel natürlich x 11 x 2, ... , Xr durch a11 , a 22 , aaa• a12 , a 2a, aa1 zu ersetzen sind und die Linearformen l, l1 , l2 , ••• , l 5 der letzteren Variablen so gewählt werden, dass der Linearraum l = 0 mit dem Gebiete F und also auch mit G keinen Punkt gemein hat. Da nun nach dem vorigen Paragraphen die Gebiete F 0 S, wo S alle ganzzahligen Substitutionen der Determinante 1 durchläuft, gerade das Gebiet F 24 mal ausfüllen, so besteht die Fundamentalformel

(2)

~J(F0 S) = 24J(F). s

§ 5.

Darstellung der Klassenzahl. Wir spezialisieren zunächst die Fundamentalformel auf den Fall, wo f(au, a22• ... 'a31) = (1)

es . . )6 i,"

1

= (c11 a11 + c22 a22 + c33 a33 + 2c

1

c~,.a,,.

a

12 12

+ 2c23 a23 + 2c31 a31) 6

genommen wird, wobei die ci,. so zu wählen sind, dass (2)

q;(u1, u 2 , ua) = c11 ui + c22 u~ + c3aui + 2c12 u 1u 2 + 2c23 u 2 ua + 2c31 uau1

eine positive Form ist, deren Determinante mit

(3)

D

=

c11 c12 C13 C21 C22 C2a Ca1 Cs2 Csa

bezeichnet werde. Der Wert von J(G) stellt dann das Volumen von G

Klassenzahl positiver ternärer quadratischer Formen.

493

bezüglich der Linearform ~ci,.ai,. vor. Nach § 2, Formel (33) und (44) wird nun i,,. (4)

J (F)

C3

= 752 =

n2 1 240. D1



Ferner kommt nach (19) in § 2 (5)

J(FoS)

1 ö =5T·l(1)l(2) ... l(6)'

wobei die rechter Hand auftretenden Zeichen folgende Bedeutung haben. Die Eckpunkte des Gebietes F 0 S sind die sechs Punkte (8) in § 3, also die Punkte mit den Koordinaten

(6) Es ist nun naten, also

enthalten. Dann setzt sich das Integral in (11) aus solchen der Form (14) zusammen. Die Integrationen sind vermöge der Formel

497

Klassenzahl positiver ternärer quadratischer Formen.

f

00

1 F(p+1)F(q-p-1) atrP-1 r(q)

yPdy = y)q (a

+

0

leicht ausführbar, und es ergibt sich so für das Integral (14) der Wert 1

r("+r) · F(rx1

+ 1) · F(rx2 + 1) ... F(rx., + 1).

Demnach kommt für das Integral {5) {15)

J=

"""C

A r('le r) ~

+

a., a,, ... , ar

r:·

«t! «z! ... cz,.! l~r , lt'

wobei L1 durch {12) und die Koeffizienten Ca.,a,, ...,ar durch (13) bestimmt sind. Im Fallen= 3 findet sich nun für das Integral (1) aus {2) und {4):

_ ~c 3 (-y;77;)

J(F)-

F(a+1)r(a+f)r(a+2) 1 . Ds+a• F(Sa+6)

oder, nach leichter Umformung {16) wobei D die Determinante der ternären Form

:2 ci,.uiu,. 1,2,3

(17)

tp(u 1 , u 2 , u 3) =

i,"

bedeutet. Um für dasselbe Integral (1) den Wert von J(F0 S) zu berechnen, müssen wir beachten, dass F 0 S das Simplexgebiet mit den Punkten (8) 1,2,3

in § 3 als Ecken vorstellt, welches mit dem linearen Raume ~ci,.ai,. = 0 i,"

.

keinen Punkt gemein hat. Nach Formel {15) kommt demnach

J (F

.Q\

()'J J

=

r

A

(3 8

""" C

+ 6) ~

a,, a,, ... , a,

r:·

«] ! cxs! ••• ote! l6' l~·

,

wobei l 1 , l 2 , ••• , l 6 durch die Gleichungen (7) oder (9) in § 5 bestimmt sind, L1 nach (12) den Wert 1111~ .. l. besitzt und die Koeffizienten Ca,, a,, ..., ao folgendermassen entstehen. Wir setzen in ~1 a12 als '

aal a211 ass a31 ass ass a - y a, ... , a~~ bzw. die Koordinaten der Punkte (8) in § 3 bedeuten, und entwickeln dann nach Potenzen von Yu y 2 , ••• , y6 • Diese Entwicklung lautet dann

Nun wird Iai,. I die Determinante der Form

YI~ a~~uiu,.+ ... + Ya~ a~~u,u,. = YI(suul + s12u2 + slaus)2

+ Yz(S21ul +

S22u2+ s2aus) 2 + · · · + Ye((su-s21)ul + ... ) 2,

die rler Form

+ Ya(ul-u2) 2

Y1ui + Y2U~ + YsU~ + y,(u2-us) 2 + Ys(Ua-ui) 2

äquivalent ist. Daher ist an a12 als '

az1 azz azs = aal asz ass

~+~+~.

-~.

-~·

- Ys, Yz + y, + Ys• - y, · -ys, -y,, Ys+Y,+Ys

Die Entwicklung der letzteren Determinante, die mit tp (y1 , y 2, bezeichnet werde, liefert (18)

••• ,

y6 )

tp(yl, Y2• ... , Ys) = Y1YzYa + Y1Y2(y, + Ys) + YzYs(Ys + Ye) + YsY1 (Ys + y,) + (yl + Yz + Ya) · (y,ys + YsYs + YsY,) ·

Daher sind die Koeffizienten Ca" a,, ... , a, durch die Gleichung

["P(Yt• Yz, · · ., Ys)]' = ~ Ca.,a,, ... , a,Y~'Y2' · · · Y~'

(19)

bestimmt. Demnach kommt schliesslich

"""o

1 J(F0S)= (3s+5)! ..:::;";

(20)

~!

a.,a,, ... ,a, ~-~-~ ca,+l ca.+l ca.+l

~!

11

12

Sll

~!

(C2z+C33-202s)a,+l. (033+Cu-2Cn)a,+l • (Cn+C22-2012)a,+l.

Wir tragen nun die Werte (16) und (20) in die Fundamentalformel (2) § 4 ein. Das Resultat lässt sich dann übersichtlich folgendermassen formulieren: Es durchlaufe (21)

f/J

=aui + bu~ +

cu~ +

2a'u2 u3 + 2b'u3u 1 + 2c'u1 u2

=(a:a, bb:, c,) c

Klassenzahl

positive~;

ternärer quadratischer Formen.

499

die sämtlichen Formen einer Klasse positiver ternärer Formen der Determinante D. Zur Abkürzung1 ) werde ferner

(22)

gesetzt, unter at1 , at2 ,

• • •,

at8 nicht negative Zahlen verstanden. Dann ist:

(s+1)! (2s+1)! 21"

(23)



12n• D•+l

1

"/i

~ Ca h a ,, •••,a. "{at1 , at 2 , at3 , at4 , at5 , at8 } Ot1 ! at 2 ! ... at 8 ! = ~

wobei die Koeffizienten 0 a" a,, ..., a, positive ganze Zahlen bezeichnen, die durch die Gleichung (19) bestimmt sind. Die Zahl p bedeutet die Anzahl der unimodularen Substitutionen, die die einzelne Form (21) der Klasse in sich besitzt. Im Falle s = 0 reduziert sich die Gleichung (23) auf 12n• 1 = {0, 0, 0, 0, 0, 0} J5l"li

in Übereinstimmung mit (10) in § 5. Von den Summen (22) sind immer gewisse, verschiedenen Systemen at11 at 2 , ••• , at6 entsprechende, einander gleich, wie man folgendermassen erkennt. Wenn die Form tP die sämtlichen Formen einer Klasse durchläuft, so wird auch die Form f/J8 es tun, unter 8 irgendeine unimodulare ganzzahlige Substitution verstanden. Es ist nun, wenn 8

=

(

Ot, {J, " ) gesetzt wird, at', {J', y' " {J" , "" Ot,

fP8 = tP{atu1 + {Ju 2 + yu3 , at'u1 + {J'u2 + y'ua, at"Ut + {J"u2 + y"ua),

und es gehen daher, wenn tP durch f/J8 ersetzt wird, b = f/J( 0, 1, 0), a = f/J{l, 0, 0), a 1 =cP(0,1,-l)=b+c-2a', b1 =tP(-1,0,1),

c = fP{O, 0, 1), c1 =tP{1,-1,0)

über in:

a=

a1 =

b = q, (fJ, fJ', fJ") , ", fJ' - r', fJ" - r") , b1 = q, (r - Ot, ", - at', r" - at") ,

q, (Ot, at', at"), cP (fJ -

c= c= 1

q, (y' y'' y") '

cP (at- {J, at' - {J', at" - {J").

1) Die zweite Abkürzung ist von Burwitz nachträglich eingefügt worden.

A. S.

500

Zahlentheorie.

Sobald also das System I

IX,

IX '

IX"

ßl, ß" ß, yl, y" y, ß-y, ßl -y,I {J" - y " y -IX, y I - I XI' y" - I X " ßl IXII - {J" I X - ß, IX I '

abgesehen von der Reihenfolge der Horizontalreihen, mit dem System

± 1,

0, 0 0 0, ± 1, 0, 0, ± 1 0,±1,=t=1 =f1, 0,±1 ±1, =t=1, 0 übereinstimmt, werden daher a, b, c, ä1 , b1 , c1 eine Permutation von a, b, c, a 1 , b1 , c1 bilden. Es gibt nun 24 Substitutionen S von dieser Beschaffenheit, nämlich diejenigen, für welche die Kollineation

die Punkte (1, 0, 0), (0, 1, 0), (0, 0, 1), (0, 1, -1), (-1, 0, 1), (1,-1,0) untereinander vertauscht. Diese Punkte sind die sechs Durchschnittspunkte der Geraden

u1 = 0, u 2 = 0, u 3 = 0, u 1

+u +u 2

3

= 0,

und es gibt genau 24 Kollineationen, die diese vier Geraden auf alle möglichen Weisen vertauschen. Es genügt, diejenige Kollineation zu betrachten, welche u 1 = 0 mit u 4 = 0 vertauscht,

u 3 = 0, u 2 = 0 fest lässt,

ferner diejenige, welche

u 2 = 0 mit u 4 = 0 vertauscht, u 1 = 0, u 3 = 0 fest lässt, endlich diejenige, welche u3 = 0 mit u 4 = 0 vertauscht,

u 2 = 0, u 1 = 0 fest lässt.

Denn aus diesen drei Kollineationen lassen sich alle übrigen zusammensetzen.

Klassenzahl positiver ternärer quadratischer Formen.

501

Da ll>(u1 , u 2 , u 3) = au~ + bu~ + cui + (b + c-a1)u2 u 3 + (c + a-b 1)u3 u 1 + (a + b - c1) u 1 U 2 = - au 1 u4 - bu 2 u 4 - cu 3 u 4 -a1 u 2 u 3 -b 1 u3 u1 -c1 u 1 u 2 , wobei u 4

=

-(u1 + u 2 + u3) zu setzen ist, oder also u 4 durch u1

+u +u +u 2

3

4

= 0

bestimmt ist, so entsprechen jenen Kollineationen die Vertauschungen

Demnach wird z. B.

d.h. und ebenso

Im Falle s = 1, sind gernäss (19) und (18) die Koeffizienten Ca a a a a a sämtlich gleich Null, bis auf die Koeffizienten 0 111000 , 01101~·, ·: .''. :· di~ den einzelnen Gliedern von 1fJ (y 1 , y 2 , ••• , y6 ) entsprechen, welche den Wert 1 besitzen. Es kommen daher in der Summe (23) nur die Summen

[11 0] [11 0] [111] 000' 100' 010'"'" vor, von welchen den vorstehenden Gleichungen für diese Summen

[:~:~:~]entsprechend sich4 auf[~~~] und die übrigen 12 auf[~:~:~] reduzieren. Somit kommt für s = 1

wo a 1 , b1 , c1 zur Abkürzung für b + c- 2 a', c + a- 2 b', a + b- 2 c' stehen und die Summationen über die sämtlichen positiven ternären Formen der Determinante D au~

+ bu~ + cui + 2a'u2 u3 + · · ·,

502

Zahlentheorie.

die einer bestimmten, übrigens aber beliebig gewählten Formenklasse angehören, zu erstrecken sind. Durch Summierung über die Klassea ganzzahliger Formen der Determinante D, kommt

wo die Summation über alle positiven ganzzahligen Wertsysteme a, b, c, a1 , bv c1 auszudehnen ist, für welche

eine positive Form der Determinante D ist.

ALGEBRA

LXXVIII.

Ober den Vergleich des arithmetischen und des geometrischen Mittels. (Journal für die reine und angewandte Mathematik, Bd. 108, 1891, S. 266-268.)

In den folgenden Zeilen will ich einen neuen Beweis für den Satz geben, dass das arithmetische Mittel aus n positiven Grössen a 1 , a 2 , ••• an, abgesehen von dem Falle, wo diese Grössen sämtlich einander gleich sind, stets einen grösseren Wert besitzt als ihr geometrisches MitteJl). Dieser Beweis beruht auf dem Umstande, dass es gelingt, die Differenz zwischen beiden Mitteln als eine Summe darzustellen, deren einzelne Glieder ihrer Natur nach nicht negativ werden können. Um diese Darstellung zu erhalten, setze ich zunächst

wo x1 , x2 , ••• Xn reelle positive Grössen bedeuten. Dann stellt sich die Differenz zwischen den beiden Mitteln der Grössen a 1 , a 2 , • • an in der Form dar: (1)

Man verstehe nun unter dem Zeichen l:f(xl,

X2, • • • Xn)

die Summe der n! Grössen, welche aus f(x 1, x2 , ••• xn) durch alle möglichen Permutationen von x1 , x2 , ••• Xn hervorgehen. Hiernach ist z. B. und

l:x~= (n-l)!(x~+ x;+ ·· ·

1: x1 x2

••• Xn

= n! x1 x2 •••

+ x:)

Xn,

1 ) Eine ganze Reihe interessanter Sätze über die Grössenverhältnisse verschiedener Mittelwerte findet man in einer Notiz des Herrn Schlömilch: Über Mittelgrössen verschiedener Ordnungen, Zeitschrift für Mathematik und Physik, Bd. 3 (1858), s. 301-308.

506

Algebra.

so dass

(2) wird. Ferner besteht offenbar allgemein die Gleichung: (3)

wenn die Zahlen ot, ß, ... Ä. in irgend einer Reihenfolge mit den Zahlen 1 , 2, ... n übereinstimmen. Dies vorausgeschickt, betrachte man nun die folgenden n - 1 Formen:

(4) cp.. _ 1 = E(x1- x2) (x1 - x;J x3x4 ... x...

Durch Auflösung der Klammern rechter Hand findet man

ein Ausdruck, welcher sich zufolge (3) auf 2 Ex~- 2 E x~- 1 x2 reduziert. Formt man in ähnlicher Weise cp 2 , cp 3 , ••• Cfn-1 um, so ergibt sich:

Die Summe der rechten Seiten dieser Gleichungen ist

so dass also die Gleichung gilt:

(5) Andererseits lassen sich die Formen Cfv cp2 , Gestalt bringen:

I

cp1= E(x~- 2

(6)

'\"'(-n-3

•••

cp.. _1 offenbar in folgende

+ x~- 3 x2+ ··· + x1x;-3+ x;- 2) (x1-·x2)2, )2 + n-4 + + n-4 + n-3) (

~2 . ""'. ;.~;1. . ~1 . X2. ~... ~1 ~2 . . X2. Cfn-1 = L'(x1-x2)2x3x, ... x... •



X1.- ~2 . X3:

Vergleich des arithmetischen und des geometrischen Mittels.

507

Es erscheint daher die Form «p(x1 , x2 , ••• xn) vermöge der Gleichung (5) als eine Summe von lauter Formen, welche für positive Werte von Xv x2 , ••• Xn positiv sind und nur in dem Falle x1 = x 2 = · · · = Xn verschwinden. Aus dieser Darstellung der Form tp(x1 , x2 , ••• Xn) geht die Richtigkeit des eingangs genannten Satzes unmittelbar hervor. Wenn n eine gerade Zahl ist, so erkennt man leicht, dass «p(x1 , x2 , ••• xn) für alle reellen (positiven und negativen) Wertsysteme von x1 , x 2 , •• • Xn positiv ist. Man wird daher vermuten, dass in diesem Falle «p als eine Summe von lauter Quadraten darstellbar ist 1 ). In der Tat findet man auf folgende Weise eine solche Darstellung. Es sei n = 2m; dann ist, wie man ohne weiteres verifiziert, IP ( X1,

-

X2, • • •. x2m) -

1

( 2

2

2)

xm+2• • • • X2m + , a, ... a)

und K(a(l), a, ... a)

Invarianten des ersten bezüglich zweiten Formensystemes, so ist das Resultat, welches durch Anwendung der Operation K ( iJ

iJ a

'

iJ iJ a

iJ

(k+ 1)

' . . . iJ a ' a

(r))

' ... a

526

Algebra.

auf J (a(l>, a< 2>, .•. a) entsteht, wieder eine Invariante des ersten Formensystemes bezüglich der Transformationen (3)". Und hieraus folgt der entsprechende Satz für die "Invarianten schlechthin": "Sind J (a(l>, a< 2>, ••• a) und K (a(l>, a< 2>, ..• a) Invarianten des ersten bezüglich zweiten Formensystemes, so ist das Resultat, welches durch Anwendung der Operation K ( 0 : , ••• 0 :, a< 2>, •.. a) entsteht, wieder eine Invariante des ersten Formensystemes."

§ 11.

Erzeugung von Invarianten eines Formensystemes aus denen eines zweiten Formensystemes. Hermite hat unter dem Namen des Reziprozitätsgesetzes (loi de reciprocite) einen Satz aufgestellt, dem zufolge man durch ein bestimmtes Verfahren aus den Kovarianten mten Grades einer binären Form nter Ordnung die Kovarianten nten Grades einer binären Form mter Ordnung ableiten kann 1 ). Die von Hermi te selber, wie von späteren Autoren gegebene Darstellung dieses Verfahrens beruht wesentlich auf der Zerlegung der binären Formen in Linearfaktoren und ist somit einer Verallgemeinerung auf Formen von mehreren Variablen nicht fähig 2). Indessen ist gleichwohl dieses Verfahren nur ein spezieller Fall eines weit allgemeinem, welches gestattet, aus den Invarianten eines beliebigen Formensystemes Invarianten eines zweiten Formensystemes abzuleiten. Auf diese Weise erscheint der Hermite'sche Satz in einem neuen Lichte, welches den inneren Grund seines Bestehens klar hervortreten lässt. Es seien (1) präparierte Formen von beliebigen Viuiablensystemen.

Die Koeffi-

1 ) Hermite, Sur Ia theoriedes fonctions homogenes a deux indeterminees, Garnbridge and Dublin Mathematical .Journal, Bd. 8 (1854), S. 172-217 [Oeuvres, t. I, p. 296-396]. Vgl. auch Faa di Bruno, Einleitung in die T!J.eorie der binären Formen, Leipzig 1881, S. 262 und 297, ferner Gordan-Kerschensteiner, Vorlesungen, Bd. II, S. 97. Salmon-Fiedler, Algebra der linearen Transformationen, Leipzig 1877, S. 181, und Sylvester, Note on Mr Hermite's law of reciprocity, American Journal, Bd.1 (1878), s. 90-118. 2 ) Der vortrefflichen Monographie von Franz Meyer: "Bericht über den gegenwärtigen Stand der lnvariantentheorie" im Jahresbericht der Deutschen MathematikerVereinigung, Bd. 1 (1892), S. 79-292, entnehme ich, dass Deruyts eine Ausdehnung des Reziprozitätsgesetzes gegeben hat, die sich aber nur auf spezielle Formen bezieht, nämlich auf solche, die in lineare Faktoren zerlegbar sind.

527

Zur Invaria.ntentheorie.

zienten der Form f bezeichne ich mit (a), die Koeffizienten der Form g mit (b), ferner die konträre Form von f mit T. Ist nun weiter K{a,b) eine Invariante der Formenfund g, die in den Koeffizienten (a) den Grad r, in den Koeffizienten (b) den Grad s besitzt, so kann man

(2) setzen, wo A 11 A 2 , ••• All die präparierten Elementarterme rter Ordnung, gebildet aus den Koeffizienten (a), und L1 , L 2 , ••• Lll ganze homogene Funktionen sten Grades der Koeffizienten (b) bedeuten. Ich betrachte jetzt irgendeine Invariante (3)

der Formen

(4) Die Invariante J sei in den Koeffizienten (a) der Form f vom rten Grade, so dass P 1 , P 2 , ••• P(! Funktionen der Koeffizienten von f1 , f 2 , ••• f1c auf J bezeichnen. Durch die Anwendung der Operation entsteht, wie man sich sofort überzeugt, das Resultat

K(:a, b)

(5) Und nun ist nach dem Schlussatze des letzten Paragraphen 1) K eine Invariante des Formensystemes (1), oder, da K die Koeffizienten (a) der Form f nicht enthält, eine Invariante des Formensystemes (6)

Es gilt also folgender Satz: "Wenn Av A 2 , ••• All die präparierten Elementarterme rter Ordnung der Koeffizienten (a) einer präparierten Form f bezeichnen, wenn ferner K=

L1 A1 + L 2 A 2 + · · · + LllA 11

eine Simultaninvariante der zu f konträren Form 1und irgendeiner an~ern präparierten Form g, wenn endlich J = P1 A 1

+P

2A2

+ · · · + PllA

11

1) Der Satz ist anzuwenden auf die Formensysteme

f,

g, {, g,

ft, fz, · · • Ir• ft, l2• · · • Ir·

Dabei ist J als Invaria.nte der ersten und K(a, b) als Invariante des zweiten Formensystemes aufzufassen.

528

Algebra.

eine Invariante des Formensystemes

ist, unter wird stets e~ne

fi, f2 ,

•••

fk irgendwelche präparierte Formen verstanden, so

Invariante des Formensystemes

sein." Nach diesem Satze entspricht also, unter Zugrundelegung einer Invariante K der Formen T und g, die in den Koeffizienten dieser Formen vom rten bzw. sten Grade ist, jeder Invariante J des Formensystemes f, f1, f 2 , ••• fk vom rten Grad in den Koeffizienten von f in eindeutiger Weise eine Invariante K des Formensystemes g, f1 , f 2 , ••• fk vom sten Grade in den Koeffizienten von g. Da eine Invariante der Formen T und g auch eine Invariante der Formen f und g ist, wo g die konträre Form von g bezeichnet, so kann dieselbe Invariante K auch zur Erzeugung von Invarianten des Formensystemes f, fi, {2 , ••• fk aus Invarianten des Formensystemes g, { 1 , { 2 , ••• fk verwendet werden. Man hat dann nur K nach den Koeffizienten von g anzuordnen, also K in die Gestalt

zu setzen, wo B 1 , B 2 , ••• Ba die präparierten Elementarterme nung der Koeffizienten von g bedeuten. Wenn jetzt irgendeine Invariante des Formensystemes g, f1, {2 , sten Grade in den Koeffizienten von g), so wird stets

•••

ster

Ord-

fk ist (vom

eine Invariante des Formensystemes f, f1 , { 2 , ••• {k sein. Man kann hiernach vermöge der Invariante K zunächst aus einer Invariante des Formensystemes f, f1, f 2 , ••• fk eine solche des Formensystemes g, f1 , { 2 , ••• {k und sodann aus dieser wieder eine Invariante des ersten Formensystemes erzeugen. Die letztere wird in den Koeffizümten der Formen dieselben Gradzahlen besitzen, wie die Invariante, von der man ausging, braucht aber darum natürlich nicht mit dieser identisch zu sein.

529

Zur Invariantentheorie.

§ 12. Das Hermite'sche Reziprozitätsgesetz. Der Hermite'sche Satz, nach welchem man aus den Kovarianten Grades einer binären Form l(x1 , x2) nter Ordnung die Kovarianten nten Grades einer binären Form g(x1 , x 2) mter Ordnung erzeugen kann, stellt sich nun als ein spezieller Fall des soeben bewiesenen Satzes dar. Die Formen I und g setze ich in präparierter Gestalt voraus. Es seien nun u1 , u 2 die zu x1 , x2 kontragredienten Variablen und mten

II(ul, u2)

=

~1U1

+ ~2U2.

Dann sind die Invarianten der Formensysteme (1)

(2)

I (X1 , X2) , li (ul , U2) , g (X1, X2) , li (ul , u2) mit den Kovarianten der Form I bezüglich g,

die Kovarianten identisch geschrieben in den Variablen ~v ~ 2 • Nach dem Satze des vorigen Paragraphen gestattet demnach jede Simultaninvariante von T= f(u 1 , u 2) und g(x1 , x2), oder, was dasselbe ist, von (3) aus Kovarianten der Form f solche der Form g herzuleiten. Man wähle nun insbesondere für diese Simultaninvariante die Resultante R der Formen (3). Diese ist in den n + 1 Koeffizienten a der Form I vom mten Grade, in den m + 1 Koeffizienten b der Form g vom nten Grade. Die Anzahl der Elementarterme mten Grades aus n + 1 Grössen beträgt p,=

(n

+

m)! n!m!

und ist also, wegen der Symmetrie in n und m, zugleich die Anzahl der Elementarterme nten Grades aus m + 1 Grössen. Demnach hat die Resultante R die Gestalt

(4) wobei allgemein (5)

Li= ci1B 1

+ ci 2 B 2 + · · · + ci,.B".,

(i = 1, 2, ... p,)

ist. Hier bedeuten die Ai und Bi die präparierten Elementarterme der Koeffizienten a und b, während die C;k numerische Koeffizienten sind. Wenn nunmehr

(6)

34

530

Algebra.

eine Kovariant.e von f bezeichnet., die in den Koeffizienten a von f vom mten Grade ist., so dass 0 1 , 0 2 , ••• C,_. Formen von ; 1 , ; 2 bedeuten, so ist. nach dem Satze des vorigen Paragraphen (7)

eine Kovariant.e von g, die in den Koeffizienten dieser Form vom nten Grade ist. Auf diese Weise ist jeder Kovariante mten Grades der Form nter Ordnung f eindeutig eine Kovariante nten Grades der Form mter Ordnung g zugeordnet.. Es kommt hier aber noch ein wesentlicher Punkt. hinzu. Die Determinante I C;k I der in der Resultante auftretenden numerischen Koeffizienten ist. nämlich von Null verschieden 1). Infolgedessen kann die Kovariante K nur dann identisch verschwinden, wenn J identisch Null ist.. Hieraus schliesst. man weiter, dass linear unabhängigen Kovarianten J auch linear unabhängige Kovarianten K entsprechen. Und da jede Kovariante nten Grades von g in die Form (7) gebracht. und also als entsprechende einer Kovariant.e mten Grades von f aufgefasst. werden kann, so folgt. endlich, dass einem vollständigen Systeme linear unabhängiger Kovarianten mten Grades von f ein vollständiges System linear unabhängiger Kovariant.en nten Grades von g entspricht.Eine ähnliche Bemerkung lässt sich offenbar an den allgemeinen Satz des vorigen Paragraphen anknüpfen für den Fall, dass die Anzahlen der Elementarterme der a und b, die in der Invariante K(a, b) auftreten, gleich gross sind und dass diese Invariante, aufgefasst als bilineare Funktion jener Elementarterme, eine nicht verschwindende Determinante besitzt. Nach den Erörterungen des vorigen Paragraphen kann man die Resultante R auch dazu verwenden, aus einer Kovariante mten Grades von f eine zweite solche Kovariante abzuleiten. Um die hierbei in Betracht kommenden Formeln bequemer schreiben zu können, will ich festsetzen, dass die Indices i, k, h der Werte 1 , 2, ... t-t fähig sein und, wo sie als Summationsbuchstaben auftreten, alle diese Werte durchlaufen sollen. Die Resultante R stellt sich dann (nach (4) und (5)) dar in der Gestalt:

R

=

:2 ci,kAiBk. i,k

Aus der Kovariante

mten

Grades

1 ) Dieser Satz lässt sich leicht mit Hilfe der Faktorenzerlegung der Resultante beweisen. Es wäre indessen wünschenswert, einen anderen von dieser Zerlegung unabhängigen Beweis zu besitzen. (Einen solchen Beweis teilte mir inzwischen Herr Gordan mit. Herr Gordan wird denselben demnächst in den Mathematischen Annalen veröffentlichen. August 1894.) [[ Anschliessend an die Hurwitz'sche Arbeit erschienen Mathem. Annalen, Bd. 45 (1894), S. 405-409.1]

531

Zur Invariantentheorie.

der Form I geht nun dadurch, dass allgemein A; durch seinen Faktor in R ersetzt wird, die Kovariante nten Grades K

= ~ Cici,kBk i,k

der Form g hervor. Führt man hier wiederum an Stelle von Bk seinen Faktor in R ein, so entsteht aus K die Kovariante mten Grades

J'

= ~ Cici,kch,kAh i,k,h

der Form 1. Wenn also unter di,h die aus den Koeffizienten ci,k der Resultante abgeleiteten Zahlen

verstanden werden, so ist gleichzeitig mit J

auch

= ClAl + C2A2+ . ..

,T' = C~A 1 eme Kovariante gesetzt ist.

mten

+ CPAP

+ C~A 2 + · · · + C~A"' I, wo zur Abkürzung

Grades von

c: = d1 . C1 + d2 . C2 + ... + ap., .c t

,t

,t

t.

II

§ 13.

Verallgemeinerung des Hermite'sehen Reziprozitätsgesetzes. Indem man den Satz des Paragraphen 11 wiederholt zur Anwendung bringt, kann man aus den Invarianten irgendeines Formensystems Invarianten eines zweiten Formensystems ableiten, welches dadurch aus dem ersten entsteht, dass irgendwelche Formen desselben durch irgendwelche andere Formen ersetzt werden. Für den Fall der binären Formen erhält man auf diese Weise leicht die folgende Verallgemeinerung des Hermi te'schen Satzes. Es seien (1) 11, 12, ... 1" h1, h2, ... h., (2)

g1, g2, ... g" h1, h2, ... h.

532

Algebra.

zwei Systeme von präparierten Formen der binären Variablen x1 , x 2 , die sich in den ersten r Formen unterscheiden. Die Koeffizienten der Form I; mögen mit a, A~i>, ... bezeichnet, und (3)

A - ""'L Ri-..:::;,.; k' k k

wo die Summe sich auf alle Elementarterme A~> erstreckt, sei die Resultante von I;(- x2 , x1) und gt(x1 , x 2). Die Koeffizienten L~> sind dann homogene Funktionen niten Grades der Koeffizienten b. Wenn nun, nach den Koeffizienten der Formen ft, 12 , ••• Ir angeordnet, (4)

eine Invariante des Formensystemes (1) ist, welche in den Koeffizienten der Form lt den Grad m; besitzt, so wird (5) eine Invariante des Formensystemes (2) sein, welche in den Koeffizienten der Form g; den Grad n; besitzt. Durch diesen Satz wird jeder Invariante J des Formensystemes (1), von den Graden m1 , m2 , ••• mr in den Koeffizienten der Formen 11 , 12 , ••• Ir bzw., eine bestimmte Invariante K des Formensystemes (2) zugeordnet, von den Graden nv n 2 , ••• nr in den Koeffizienten der Formen, g1 , g2 , ••• gr bzw. Und zwar zeigt man wieder leicht, dass einem vollständigen System linear unabhängiger Invarianten J ein vollständiges System linear unabhängiger Invarianten K entspricht. Zürich, den 7. Juni 1894.

LXXX.

Über die Bedingungen, unter welchen eine Gleichung nur Wurzeln mit negativen reellen Teilen besitzt. (Mathematische Annalen, Bd. 46, 1895, S. 273-284.)

1.

Auf Veranlassung meines verehrten Kollegen, Herrn A. Stodola, beschäftigte ich mich vor einiger Zeit mit der Frage, wann eine Gleichung nten Grades mit reellen Koeffizienten

nur solche Wurzeln besitzt, deren reelle Bestandteile ·negativ sind. Wenn auch die Erledigung dieser Frage nach den Methoden von Sturm, Liouville, Cauchy und Hermite keine prinzipielle Schwierigkeit bietet, so erlaube ich mir doch das Resultat, zu welchem ich gelangt bin, hier mitzuteilen, weil dasselbe wegen seiner einfachen, für die Anwendungen brauchbaren Gestalt vielleicht einiges Interesse verdient 1 ). Die Herleitung des Resultates gibt mir zugleich Gelegenheit, die Methode von Hermit e- Ja c ob i in einer Form darzustellen, in welcher sie eine Verallgemeinerung nach verschiedenen Richtungen zulässt. Man darf sich, was hier geschehen soll, offenbar auf den Fall beschränken, wo der Koeffizient a0 positiv ist. Denn andernfalls kann man die linke Seite der Gleichung mit dem Faktor - 1 multiplizieren. Man bilde nun die Determinante 1 ) Herr Stodola benutzt mein Resultat in seiner Abha.ndlung über "die Regulierung von Turbinen", Schweiz. Bauzeitung, Bd. 23 (1894), Nr.17, S. 108-112, und Nr. 18, S. 115-117, deren Ergebnisse bei der Turbinenanlage des Badeortes Davos mit glänzendem Erfolge Anwendung gefunden haben. - Die obige Frage wird aucb, worauf mich Herr Stodola aufmerksam machte, in Thomson und Tait's Natural Philosophy (1879, vol. I, part I, p. 390) aufgeworfen und ihre Erledigung als wünschenswert bezeichnet.

534

Algebra.

(1)

L1.t

=

at, aa, as, ... a2.t-t ao, a2, a4, ... a2.t-2 0, a 1 , a 3 , ••• av.-s

. • . . . a.t nach der Massgabe, dass die Indices in der ersten Horizontalreihe immer um zwei Einheiten wachsen, in jeder Vertikalreihe immer um eine Einheit abnehmen. Dabei ist allgemein a,. = 0 zu setzen, wenn der Index " negativ oder grösser als n ist. Dies vorausgeschickt gilt der Satz: Die notwendige und hinreichende Bedingung dafür, dass die Gleichung (2)

in welcher der Koeffizient a0 positiv vorausgesetzt wird, nur Wurzeln mit negativen reellen Bestandteilen besitzt, ist die, dass die Werte der Determinanten (3)

sämtlich positiv sind. Zu diesem Satze ist noch folgendes zu bemerken. Die Determinante L1n ist, wie man leicht erkennt, indem man sie nach den Elementen der letzten Vertikalreihe entwickelt, gleich an . L1"_1 • Daher ist die Forderung, dass L1n-t und L1n positiv sein sollen, gleichbedeutend mit der anderen, dass L1"_ 1 und an positiv sein sollen. Der obige Satz bleibt also richtig, wenn an an Stelle von L1n gesetzt wird'. Eine andere Bemerkung ist diese: Betrachtet man die Reihe der Determinanten (4)

so verschwinden die Gliede!" dieser Reihe vom (n + l)sten ab identisch, d. h. für unbestimmt gedachte Werte von a0 , a 1 , ••• an. Denn die Elemente der letzten Vertikalreihe von L1.t sind für A. > n sämtlich Null. Die Bedingung des Satzes kann also auch dahin ausgesprochen werden, dass die nicht identisch verschwindenden Glieder der Reihe (4) sämtlich positiv sein müssen. Die Glieder dieser Reihe sind ausführlich geschrieben diese:

at,

Iat,

aal ao, a2 '

at, as, as ao, a2, a4 ' 0, at, aa

at, ao, 0, 0'

as, a2, at, ao,

as, ~ a4, as ' as, a;; a2, a,

... ,

Gleichungen, deren Wurzeln negative reelle Teile besitzen.

535

und man bildet hiernach ohne weiteres die Bedingungen für jeden speziellen Wert von 11. Beispielsweise lauten die Bedingungen für die Gleichung 4ten Grades (n = 4): ilJ., a 3 , 0 a0 , a2 , a 4 0, at, a 3

> 0,

Herr Stodola hat bemerkt, dass eine notwendige Bedingung dafür, dass die Gleichung (2) nur Wurzeln mit negativen reellen Bestandteilen besitzt, die ist, dass sämtliche Koeffizienten a0 , at, ... a,. positiv sind. In der Tat: wenn die reellen Bestandteile aller Wurzeln der Gleichung {2) negativ sind, so hat jeder reelle Linearfaktor der linken Seite der Gleichung die Form x + p und jeder reelle quadratische . F orm ( x + Pt)2 + p 2 2 = x 2 --r, p , x + p ", wo p, Pt, p 2 , p ,, p " F a kt or d1e positive Grössen bezeichnen. Da aber das Produkt von ganzen Funktionen mit positiven Koeffizienten ebenfalls positive Koeffizienten besitzt, so wird auch die linke Seite der Gleichung (2) nur positive Koeffizienten aufweisen.

2. Die ganze rationale Funktion f(x), deren Koeffizienten zunächst auch komplexe Werte besitzen können, möge der einen Bedingung unterworfen sein, dass sie für keinen rein imaginären Wert von x verschwindet. Bezeichnen dann N bzw. P die Anzahlen der Nullstellen von f(x), die negativen bzw. positiven reellen Teil besitzen, so ist

{5)

N+ P=n,

unter n den Grad von f(x) verstanden. Es se1 nun c eme beliebige (komplexe) Konstante und

{6)

cf(x) =

e. ei"'"',

so dass e den absoluten Betrag und ng; das Argument von cf(x) bezeichnet. Der Winkel g; ändert sich stetig mit dem Werte von x und nimmt insbesondere um

(7)

N-P=LJ

Einheiten ab, wenn x die rein imaginären Zahlen von + i oo bis - i oo durchläuft. Man erkennt dies unmittelbar, wenn man, unter Benutzung

536

Algebra.

der üblichen geometrischen Darstellung der komplexen Zahlen, die Änderung des Argumentes des einzelnen Linearfaktors von f(x) verfolgt. Nach (5) und (7) ist nun (8)

N=n+L1 2

'

P=~-2.1.

Die Bestimmung von LI wird jetzt in bekannter Weise auf die eines Ca u c h y 'sehen Index 1 ) zurückgeführt. Allgemein hat man unter dem Index einer Grösse R, die in jedem Punkte (liner in bestimmtem Sinne zu durchlaufenden Linie L einen bestimmten reellen Wert besitzt, die folgendermassen zu bildende Zahl zu verstehen. Man ordne jedem Punkte von L, in welchem R unendlich wird, die Zahl 0, oder + 1 oder - 1 zu, je nachdem R beim Überschreiten des Punktes das Zeichen nicht wechselt oder von negativen zu positiven oder von positiven zu negativen Werten übergeht. Der Index von R bezüglich der Linie L ist dann die Summe aller den Unendlichkeitspunkten von R zugeordneten Zahlen. Man setzt hierbei stillschweigend voraus, dass R nur in einer endlichen Zahl von Punkten unendlich werdend das Zeichen wechselt, und dass ~ in der Umgebung dieser Punkte stetig ist. Dies in Erinnerung gebracht, sei z eine reelle Veränderliche und (9)

cf(- iz) = U

+ iV,

wo U und V ganze Funktionen von z mit reellen Koeffizienten bezeichnen. Wird nun

uV

(10)

= R(z)

gesetzt, so hat man q;

= -:n:1 arctg R (z),

und aus dieser Gleichung folgt, dass LI übereinstimmt mit dem Index von R (z) bezüglich der im Sinne der wachsenden z zu durchlaufenden reellen z-Axe (die als eine im Unendlichen geschlossene Linie anzusehen ist). Im folgenden nehme ich an, dass R(z) für z = oo nicht unendlich wird, was offenbar gestattet ist, da man über die Konstante c willkürlich verfügen kann. 1 ) Cauchy, Calcul des indices des fonctions, .Journal de l'Ecole Polytechnique, t. 15 (1837), p. 176-229 [Oeuvres, 2me serie, t. I, p. 416--466]. Der Cauchy'sche Index ist als spezieller Fall in dem von Kronecker eingeführten Begriff der Charakteristik von Funktionensystemen enthalten. Vgl. Kronecker, Ober Systeme von Funktionen mehrerer Variablen, Monatshefte der Berliner Akademie der Wissenschaften, 1. Abhandlung (1869), S. 159-193, 2. Abhandlung (1869), S. 688-698 [Werke, Bd. I, 1. Abh. S. 177-212, 2. Abh. S. 213--226].

Gleichungen, deren Wurzeln negative reelle Teile besitzen.

537

3. Es sei jetzt R (z) irgendeine rationale Funktion von z mit reellen Koeffizienten, die für z = oo endlich bleibt. Der Index von R (z) (bezüglich der im Sinne der wachsenden z zu durchlaufenden Achse der reellen Zahlen) lässt sich bekanntlich durch das Sturm 'sehe Divisionsverfahren oder nach Hermi te durch Aufstellung einer quadratischen Form bestimmen, deren Signatur mit dem gesuchten Index übereinstimmt. Unter "Signatur" einer quadratischen Form mit reellen Koeffizienten verstehe ich dabei mit Herrn Frobenius 1)die Differenz zwischen der Zahl der positiven und der negativen Quadrate, die bei der Darstellung der Form durch ein Aggregat von möglichst wenigen Quadraten reeller Linearfunktionen auftreten. Man wird zu dieser Hermi te'schen Bestimmungsweise des Index von R(z) auf folgendem Wege geführt. Bezeichnet

.

(11)

eme ganze rationale Funktion von z, deren Koeffizienten als willkürliche Parameter angesehen werden, so stellt das Integral (12)

Fm= 2 ~~~R(z)[8(z)] 2 dz,

erstreckt durch eine alle Pole von R (z) einschliessende Kurve, eine quadratische Form der Parameter y0 , y 1 , ••• Ym-l dar, die als Koeffizient von 1_ in der Entwicklung von R(z)[8(z)] 2 nach aufsteigenden z Potenzen von _!_ leicht gebildet werden kann 2). · Andererseits ist das z Integral gleich der Summe der Residuen von R(z)[8(z)] 2 , die den Polen von R (z) entsprechen. Es sei z = a ein einfacher Pol von R (z) und

(13)

R (a

+ t) = -f + c1 + c2 t + · · ·,

dann ist das auf z

=a

bezügliche Residuum

c. [8(a)] 2• 1 ) Frobenius, Über das Trägheitsgesetz der quadratischen Formen, Sitzungs· berichte der Berliner Akademie, Bd. 35 (1894), S. 241-256 und S. 407-431. 2) An Stelle des Integrales (12) kann man mit gleichem Erfolge auch das Integral -2 1 .jR(z). ~: dz, erstreckt um die Stelle z = IX, betrachten, unter IX einen reellen nt z-a Wert verstanden, für welchen R(z) endlich bleibt. Für llieses Integral spielt z =IX dieselbe Rolle, wie z = oo für das Integral (12). Im Zusammenhange hiermit steht die unmittelbar einleuchtende Tatsache, dass der Index von R ( gleich ist dem Index von R(z), falls a, b, c, d reelle Konstanten bedeuten, deren Determinante ad- be positiv ist.

=::;)

538

Algebra.

Wenn a reell ist, so liefert der Pol z = a den Beitrag + 1 oder - 1 zu dem Index von R(z), je nachdem c positiv oder negativ ist. Wenn a imaginär ist und a den zu a konjugierten Pol bezeichnet, so ist die Summe der auf a und ä bezüglichen Residuen c[8(a)] 2

+ c[8(a)] 2 =

(P

+ iQ) 2 + (P- iQ)2 =

2 p2- 2 Q2,

wo P und Q reelle Linearfunktionen sind. Hieraus folgt - zunächst unter der Voraussetzung, dass R (z) nur einfache Pole besitzt - der Satz: Bezeichnet n die Zahl der Pole von R(z), so lässt sich die quadratische Form Fm als ein Aggregat von n Quadraten darstellen, wobei zugleich die Differenz zwischen der Zahl der positiven und der Zahl der negativen Quadrate gleich dem Index von R(z) ist. Dieser Satz gilt aber auch für den Fall, dass R (z) Pole von beliebiger

Multiplizität besitzt, wo dann unter n die Zahl der Pole, jeder mit seiner Multiplizität gezählt, zu verstehen ist 1). Es sei, um dies zu beweisen, z = a ein A.-facher Pol von R (z) und R(a

+ t) =!... + ~ + ... + tA

tA-1

cA-l

t

+ ... '

wo 8 0 {a),81 (a), ... lineare Formen der Parameter y0 ,Yv···Ym-I bezeichnen. Das z = a entsprechende Residuum lautet dann:

Je nachdem nun A. gerade oder ungerade ist, lässt sich dieses Residuum in die Gestalt (A.

= 2,u)

oder setzen, wo "Po• "Pt• ... lineare Funktionen der Parameter bedeuten. Ist a reell, so sind die Koeffizienten von 8 0 , 8 1 , •.• "Po, "Pt, ••• ebenfalls reell und das Residuum kann in die Form 1) Dass die auf die Sturm 'sehen Reihen bezüglichen Deduktionen mit den geeigneten Modifikationen au. r:fJ als Veränderliche ansehen. Dann stellen die Glei-

548

Algebra.

chungen (5) eine lineare Transformation des Raumes von n 2 Dimensionen vor, bei welcher das Gebilde R in sich übergeht. Und zwar ist diese Transformation ihrerseits eine orthogonale, weil die Gleichung

,.:::;,; ra2{J 1

""""

-

a,{J

,.:::;,; """"

ra2 {J

a,{J

besteht. Daraus geht hervor, dass das Inhalts-Element dR des Gebildes R bei der Transformation (5) invariant ist. Es sei nun eine Form der Veränderlichen x 1 , x2 , ••• Xn vorgelegt!). Die Koeffizienten dieser Form, welche als unabhängig veränderliche Grössen anzusehen sind, bezeichne ich in irgendeiner Reihenfolge mit 2) a 1 , a 2 , ••• aw die Form selbst mit

(6)

cJ>(a; x),

wo die Buchstaben a und x für die Variablensysteme a1 , a 2 , ••• am und x 1 , x2 , ••• Xn bzw. stehen. Diese kurze Bezeichnung eines Variablensystems durch einen einzigen Buchstaben werde ich in der Folge stets anwenden, wenn ein Missverständnis nicht zu befürchten ist. Vermöge der Substitution (1) werde jetzt

cJ>(a; x)

=

cJ>(a'; x').

Die durch den Buchstaben a' vertretenen Koeffizienten a~, a~, ... a~ der transformierten Form sind linear und homogen in den Koeffizienten a1 , a 2 , ••• am und ganze homogene Funktionen der Substitutionskoeffizienten rap· Ich wähle jetzt eine beliebige homogene ganze rationale Funktion F (a) der Koeffizienten von cJ> (a; x). Dieselbe geht durch die Substitution (1) über in die Funktion F (a'), welche ihrerseits eine homogene ganze rationale Funktion der Koeffizienten a und der Substitutionskoeffizienten rafJ ist. Die letzteren mögen, wie oben, als die Koordinaten eines Punktes des Gebildes R angesehen werden. Beschreibt dieser Punkt das Gebilde R, so stellt F(a') nach und nach alle Funktionen dar, in welche F(a) vermöge aller orthogonalen Transformationen übergeht. Das über das Gebilde R ausgedehnte Integral

J(a) = jF(a')dR

(7)

stellt nun

e~ne

orthogonale Invariante der Form cJ>(a; x) dar.

1 ) Der Einfachheit wegen betrachte ich hier und nachher bei der Gruppe aller unimodularen Substitutionen nur die Invarianten einer einzigen Form. Die zu beweisenden Sätze gelten indessen, wie man ohne weiteres erkennt, in entsprechender Weise auch für die Simultan-Invarianten eines beliebigen Formensystems. 2 ) Bekanntlich ist m = (a; x) vermöge irgendeiner orthogonalen Substitution hervorgeht, so kommt dieses auf das Gleiche hinaus, als wenn man auf die Integrationsparameter rafJ eine Transformation der Gestalt (5) anwendet. Bei einer solchen Transformation vertauschen sich aber die Elemente des Integrales nur untereinander, und das Integral selbst bleibt also ungeändert. Dass die Funktion F(a) so gewählt werden kann, dass das Integral (7) eine beliebig vorgeschriebene orthogonale Invariante liefert, mit anderen Worten, dass das Integral (7) die allgemeinste orthogonale Invariante darstellt, ergibt sich auf folgende Weise: Es bezeichne (8)

J

das über das Gebilde R ausgedehnte Integral dR, also den Gesamtinhalt des Gebildes. Ist nun i(a) eine beliebig vorgelegte orthogonale Invariante, so nehme man

F(a)

= ;1

i(a).

Das Integral (7) reduziert sich dann auf

J(a) = ;lji(a')dR= il~)jdR=i(a). Die vorstehenden Betrachtungen gestatten es, den Nachweis der Endlichkeit der orthogonalen Invarianten einer Form l/>(a; x) a.llgemein zu führen. Mit den bisherigen Methoden war dies nur in den niedrigsten Fällen, nämlich für binäre und ternäre Formen möglich 1). Nach dem ersten Fundamentaltheorem von Hilbert 2) gibt es unter den orthogonalen Invarianten der Form l/>(a; x) eine endliche Anzahl, etwa die Invarianten i 1 , i 2 , ••• ik, durch welche sich jede andere orthogonale Invariante i in der Gestalt (9)

darstellen lässt. Hier bedeuten F 1 , F 2 , ••• Fk Formen der Koeffizienten a, deren Grade kleiner vorausgesetzt werden können, als der Grad von i. Man ersetze jetzt in der Gleichung (9) die Koeffizienten a 1 durch die Koeffizienten a', multipliziere sodann mit M dR und in1 ) Vgl. die Ausführungen, die HerrHilbertin seiner Abhandlung gibt: Über die Theorie der algebraischen Formen, Mathem. Annalen, Bd. 36 (1890), S. 473-534, insbes. s. 531 ff. 2) A. a. 0. S. 474.

550

Algebra.

tegriere über das Gebilde R. Auf diese Weise ergibt sich die Gleichung

(10) wo die Faktoren J 1 , J 2 , ••• Jto soweit sie nicht konstant (das heisst von a1 , ••• am unabhängig) sind, orthogonale Invarianten vorstellen. Es lässt sich also jede orthogonale Invariante linear durch i 1 , i 2 , ••• ik ausdrücken mit Koeffizienten, die konstant oder orthogonale Invarianten niederen Grades sind. Indem man diese Tatsache wiederholt zur Anwendung bringt, erkennt man, dass sich jede orthogonale Invariante ganz und rational durch i 1 , i 2 , ••• ik darstellen lässt. Wie man sieht, vertritt hier die Integration über das Gebilde R also so zu sagen die Summation über alle Gleichungen, die aus (9) durch Anwendung aller orthogonalen Substitutionen hervorgehen, die Stelle der Differentiationsprozesse, deren sich Herr Hilbert bei seinen Endlichkeits beweisen bedient. Es leuchtet ein, dass dieses Summationsprinzip zum Nachweise der Endlichkeit der Invarianten, die zu irgendeiner algebraischen Gruppe gehören, ausreicht, sobald nur die in Betracht kommenden Integrale konvergieren und die der Grösse M entsprechende Zahl einen von Null verschiedenen Wert besitzt. Diese Bedingungen sind offenbar für jede in der orthogonalen Gruppe enthaltene [[kontinuierliche, geschlossene]] Untergruppe erfüllt. Die Darstellung (7) der orthogonalen Invarianten lässt sich so weit entwickeln, dass sie unmittelbar zur expliziten Herstellung dieser Invarianten brauchbar wird. Um dieses auszuführen, muss ich folgende allgemeine Bemerkung vorausschicken. Es mögen 2 , ••• er rechtwinklige Koordinaten in einem Raume von -r Dimensionen bezeichnen. In diesem Raume sei durch die Gleichungen

eu e

et = Pt (pp P2• · · ·Pa) ( e2 = P2(PP P2• ···Pa)

(11)

. . . . . . . .

er= Pr(PP P2• ···Pa) ein Gebilde von a Dimensionen definiert. Hier bedeuten Pt• p 2 , ••• Pr reelle Funktionen der reellen Parameter Pt• p 2 , ••• Pa· Wenn nun das Quadrat des Linienelements sich wie folgt darstellt: (12)

ds 2 =Mi+ de~ +

wenn ferner (13)

· · · + ae; = ~ B;.."dp;.dp", J.,p

(J., p = 1,2, ... a),

551

Über die Erzeugung der Invarianten durch Integration.

die positiv genommene Quadratwurzel aus der Diskriminante der quadratischen Form ~ B;."'dp;.dp 11 bedeutet, so ist L1 dp 1 dp2 . .. dpa

(14)

das Inhalts-Element des betrachteten Gebildes von a Dimensionen. Hiernach lässt sich das Element d R im Integral (7) ausdrücken, sobald eine analytische Darstellung des Gebildes R in der Form (11) vorliegt. Schon Euler 1) hat eine solche Da-rstellung gegeben, und es hat sich diese für den vorliegenden Zweck zunächst als brauchbarer erwiesen als die bekannten Cayley-Hermite'schen Formeln. Um nach Euler die allgemeinste orthogonale Substitution (1) zu bilden, hat man so zu verfahren: Man bezeichne mit IX einen der Indices 1 , 2, ... n - 1 und mit ß jeden von IX und IX + 1 verschiedenen Index der Reihe 1, 2, ... n; sodann bedeute

I

die orthogonale Substitution

xa = cos q; • x: xa+l = ---;sin q; • x:

(15)

Xp

Nun nehme man

=

+ sin q; • x:+l' + cos q; • x:+l'

Xp•

n(n- 1)

2

Winkel

(/Jo,l; (/Jo,2• (/)1,2; 11'o,3• (/)1,3• (/)2,3; · · · lf'o,n-1• (/J1,n-1• · · ·

(/Jn-2,n-1

an und bilde mit ihnen die orthogonalen Substitutionen

(16)

EI E2 E3

= En-1 (q;ol) • = En-2 ((/)12) En-1 (lf'o2) •

En-1

= El(q;n-2,n-1)E2(q;n-3,n-1) · · · En-1((/Jo,n-1).

= En-3(q;23)En-2(q;13)En-l(q;o3),

Dann stellt die aus diesen zusammengesetzte Substitution (17)

jede orthogonale Substitution (1) von der Determinante 1 und jede nur etn Mal vor, wenn die Winkel (/Jrs alle durch die Ungleichungen

(18)

0 ;;;;;

Cf!os

< 2 n,

0 ;;;;;

(/Jrs ;;;;;

n

(r

> 0)

1 ) Commentationes arithmeticae collectae, Petropoli 1849, t. I, p.427 [Opera omnia, series I, vol. VI, p. 287]. Vgl. auch Jacobi's gesammelte Werke, Bd. Ill, S. 601 und Kronecker: Über orthogonale Systeme, Berliner Sitzungsber., Bd. 27/28 (1890), insbes. Bd. 28, S. 1068 [Werke, Bd. III1, S. 369-459, insbes. S. 441].

552

Algebra.

bestimmten Wertsysteme erhalten. Die Koeffizienten rafJ der Substitution S sind offenbar ganze rationale Funktionen der Sinus und Kosinus der Winkel fPrs, und zwar des näheren ganze lineare Funktionen von cos fPrs und sin fPm wenn r, s ein beliebiges aber bestimmtes Indicespaar bezeichnen. Durch diese Eu I er' sehe Darstellung der orthogonalen Substitutionen erscheint das Gebilde R eindeutig umkehrbar auf das durch die Ungleichungen (18) definierte Parallelotop im Raume von n(n; 1> Dimensionen bezogen. Hieraus folgt beiläufig, dass das Gebilde R irreduzibel ist 1).

Um nun den Ausdruck für das Quadrat des Linienelementes des Gebildes R zu erhalten, führe ich zunächst die Differentiale (19) y

ein, zwischen welchen infolge der Gleichungen des Gebildes R die Relationen dRa{J = -dRßa bestehen. Aus den Gleichungen (19) folgt

= 2 [(dR12) 2 + (dR 13) 2 + · ·· + (dRn-I,n) 2].

ds 2 = ~ dr~p= ~ dR~fJ a,{J

a,{J

Die n(n; 1> Differentiale dR 12 , ••• dRn-I,n sind nun lineare homogene Funktionen der n(n; 1> Differentiale dcp,., und wenn D den absoluten Wert der Determinante dieser Funktionen bezeichnet, so ist offenbar n(n-1)

dR

= 2 -4 -D

II dcp,8 r, s

das Inhalts-Element des Gebildes R. Die Berechnung von D habe ich auf folgendem Wege ausgeführt. Setzt man so wird

S

=

E1E2 · · · En-2•

S = SEn_ 1 ,

und es stellen sich die Differentiale d RafJ in einfacher Weise durch die Koeffizienten der Substitutionen S und En_ 1 und durch die Diffe1) Einen andern, aber weniger einfachen Beweis für die Irreduzibilität von R hat Kronecker gegeben (Berl. Sitz., Bd. 28, S. 873; Werke, Bd. IIJ1, S. 415). Die Abbildung vonRauf das Parallelotop (18) gibt überdies Aufschluss über die Zusammenhangsverhältnisse des Gebildes im Sinne Ri e man n 's [[wenn die Singulari täten der Abbildung, in denen ein Winkel fPrs = 0 oder n wird (r > 0) und infolgedessen die Eindeutigkeit der Abbildung gestört ist, gehörig berücksichtigt werden. - Anm. von H. W.]]

553

Über die Erzeugung der Invarianten durch Integration.

rentiale d~eser Koeffizienten dar. Nun hängen die Koeffizienten von En_1 nur von den Parametern f!Jo,n- 1 , q;1,n_ 1 , •.• fPn-Z,n- 1 ab, die Koeffizienten von S ausschliesslich von den übrigen Parametern. Infolgedessen zerfällt die Determinante D in zwei Faktoren, von denen der eine nur von der Substitution En_1 a:bhängt und sich leicht berechnen lässt, während der andere gerade so von der allgemeinsten auf die n -1 Variablen x 2 , x3 , ••• Xn bezüglichen orthogonalen Substitution S abhängt, wie D selbst von S. Die Ausführung der Rechnung ergibt schliesslich das folgende einfache Resultat: Das Inhalts-Element dR des Gebildes R hat den Ausdruck: n(n-1)

dR = 2-4-JI(sin q;"ydq;,8 •

(20)

r, s

Das Produkt auf der rechten Seite erstreckt sich auf die Indicespaare:

n(n-l) 2

r, s = 0, 1 ; 0 ,2 ; 1 , 2 ; 0 , 3 ; 1 , 3 ; 2 , 3 ; . . . ; 0 , n - 1 ; 1 , n - 1 ; 2, n-1; ... ; n-2, n-1. Mit Benutzung der Gleichung

ergibt sich aus (20) zunächst für die oben mit M bezeichnete Konstante, also für den Gesamtinhalt des Gebildes R der Wert n(n+1) (n-1)(n+4) .:lf-44

2

(21)

M

oder

M -(22)

=

r(~)r(f)r(f) ... r(i)'

n• 1 -(2n'+n-4) .:lf4 24

wenn n gerade,

2!4!6! ..• (n-2)!' 1

M

=

2

4 (2n'+3n-5)

n'-1

- 4-

.:/f



(n1) -2-!

2!4!6!. .. (n-1)!

'

wenn n ungerade.

Denkt man sich die Koeffizienten rafJ der Substitution (1) durch die Kosinus und Sinus der n(n2-l) Winkel f!Jrs ausgedrückt, so geht die unter dem Integrale (7) auftretende Funktion F(a') über in eine ganze Funktion von a 1 , a2 , ••• am, deren Koeffizienten ganze rationale

554

Algebra.

Funktionen der erwähnten Kosinus und Sinus sind. Dementsprechend setze ich (23) F (a') = F (a ; cos fl!rs, sin fl!rs) • Der allgemeine Ausdruck (7) der orthogonalen Invarianten von wird dann

(24)

J (a)

= j F (a ; cos

fl!w

sin

fl!rs)

fi (sin rp,..t d

~ fl!os ~

2 n,

0

; x)

fl!w

wo die Integration auf die Wertsysteme der Integrationsvariablen zudehnen ist, welche die Ungleichungen

0

(/> ( a

fl!rs

aus-

(r

> 0)

~ fl!rs ~ n

befriedigen. n(n-1)

Den Zahlenfaktor 2-4habe ich, was offenbar gestattet ist, unterdrückt. Ordnet man die Funktion F(a; cos f!!rso sin f!!rs) nach den Potenzprodukten der cos f!!r•• sin f!!rs an und integriert sodann gliedweise, so erkennt man, dass das Integral (24) sich sofort ausführen lässt. Die bei der gliedweisen Integration auftretenden Integrale sind nämlich sämtlich Produkte von Integralen der Gestalt

=!

(25)

cp,q

=! b

n

(cos rp)P (sin rp)qdrp, Dp,q

0

(cos rp)P (sin rp)qd({',

0

und diese haben bekanntlich die Werte

(26)

Ich gehe nun zur Betrachtung der gewöhnlichen Invarianten einer Form if>(a; x) über, also zur Betrachtung derjenigen homogenen ganzen rationalen Funktionen der Koeffizienten a, die gegenüber allen unimodularen Substitutionen (27)

Xa=

~CafJX~ fJ

invariant sind. Werden die Koeffizienten cafJ als reell vorausgesetzt und als rechtwinklige Koordinaten in einem Raume von n 2 Dimensionen gedeutet, so wird die Gesamtheit aller Substitutionen (27) in diesem Raume durch das Gebilde

Über die Erzeugung der Invarianten durch Integration.

555

(28) repräsentiert. Wenn nun vermöge der Substitution (27) die Form 0

(6)

f(x)f' (x)

d

oder

>0

ist. Dagegen findet Annäherung an die Abszissenlinie statt, wenn (7) ist.

f(x)f' (x)

0, dagegen links f(x)f'(x) < 0 sein. Hieraus folgt bekanntlich das Rollesehe Theorem, welches besagt, dass zwischen zwei aufeinanderfolgenden Nullstellen von f(x) eine ungerade Anzahl von Nullstellen von f' (x) liegt. Man betrachte ferner ein Intervall a ... x 1 , für welches die Funktion f(x) nur am Endpunkt x1 verschwindet und für welches ausserdem f' (a) von Null verschieden ist. Dann wird die Anzahl der Nullstellen von f' (x) im Innern dieses Intervalles gerade oder ungerade sein, je nachdem f(a) f' (a) negativ oder positiv ist. Denn genügend nahe links von x1 hat f' (x) im ersten Falle das nämliche, im zweiten Falle aber entgegengesetztes Vorzeichen wie f' (a). Dieser Bemerkung zufolge lässt sich die Anzahl der Nullstellen von f' (x) im Innern des Intervalles a ... x 1 in der Form (8)

l+sgnff(a)f'(a)]

2

+2

fl

ausdrücken, unter fl eine nicht negative ganze Zahl verstanden. Das Zeichen sgn [r] bedeutet hier, wie stets in der Folge, in üblicher Weise den Wert+ 1, - 1 oder 0, je nachdem die als reell vorausgesetzte Zahl r positiv, negativ oder Null ist. Wenn für das Intervall x1 ••• b die Funktion f(x) nur im Anfangspunkte x1 verschwindet und f' (b) von Null verschieden ist, so findet man analog, dass die Anzahl der zwischen x1 und b liegenden Nullstellen von f' (x) 1-sgn[f(b)f'(b)] + 2 , (9) 2

fl

beträgt, unter ,_", wiederum eine nicht negative ganze Zahl verstanden. Nunmehr betrachte ich ein Intervall a . .. b, an dessen Grenzen f(x) und f' (x) von Null verschieden sind. Die in dem Intervalle befindlichen verschiedenen Nullstellen von f(x) seien nach aufsteigender Grösse geordnet (10) x 1 ,x2 , ••• ,Xr und m1 , m2 , ••• , m, ihre bezüglichen Multiplizitäten. Die Anzahl aller Nullstellen von f(x) in dem Intervalle beträgt dann (11)

N = m1 + m2 + · · · + m,.

Die Anzahl der Nullstellen von f' (x) in dem Intervalle zähle ich folgendermassen ab. Die Anzahl der zwischen a und x1 , bzw. zwischen

580

Algebra.

Xr und b liegenden Nullstellen wird durch (8) bzw. (9) ausgedrückt. Dazu kommen die zwischen je zwei aufeinanderfolgenden der Stellen (10) befindlichen Nullstellen, deren Anzahl nach dem Rolle'schen Theorem gleich r - 1 vermehrt um eine nicht negative gerade Zahl ist. Endlich ist noch zu berücksichtigen, dass in den Stellen (10)

(m1 -1)

+ (m2 -1) + · · · + (mr-1) =

N -r

Nullstellen von f' (x) liegen. Alles zusammengenommen findet sich für die Anzahl N' der Nullstellen von f' (x) im Intervalle a . .. b der Ausdruck , 2 N ' = N T, sgn[/(a)f'(a)]-sgn[/(b)f'(b)] (12) 2 I v, unter v eine nicht negative ganze Zahl verstanden. Die Gleichung (12) ist hier unter der Voraussetzung abgeleitet, dass f(x) im Innern des Intervalles a ... b mindestens eine Nullstelle aufweist. Da man sich aber sofort überzeugt, dass die Gleichung auch in dem Falle gültig bleibt, wo f(x) keine Nullstelle in dem Intervalle a . .. b besitzt (also N = 0 zu setzen ist), so darf man allgemein folgenden Satz aussprechen: Wenn f(x) und f' (x) an den Grenzen eines Intervalles a . .. b von Null verschieden sind, so besteht zwischen den Anzahlen N und N' der Nullstellen von f(x) und f' (x), die im Innern des Intervalles liegen, die Beziehung

(12)

N' = N , I

sgn (f(a)f'(a)]- sgn (f(b)f'(b)]

2

+2

V

'

wobei v eine nicht negative ganze Zahl bedeutet.

Die Gleichung (12) will ich zunächst in eine etwas andere Form bringen, indem ich zur Abkürzung w(x) = 1-sgn [~(x)f'(x)]

(13)

setze. Es ist dann nach (12)

(14)

N

=

N'

+ w(a) -w(b) -2v.

Die hierbei stattfindende beschränkende Voraussetzung, dass f(x) und f' (x) an den Grenzen des Intervalles a . .. b von Null verschieden sein müssen, lässt sich folgendermassen beseitigen. Wenn für einen bestimmten Wert von x die Funktion f(x) verschwindet, so wird für jeden genügend klein gewählten positiven Wert von h f(x + h)f'(x + h) > 0

581

Ober den Satz von Budan-Fourier.

und folglich w(x

+ h) =

0

sein. Ist dagegen f(x) von Null verschieden und ist dann weiter j(x) das erste Glied in der Reihe f' (x),

f" (x), f'" (x), ... ,

welches nicht Null ist, so zeigt die Entwicklung f(x

+ h)f'(x + h) =

f(x)j(x)

hk-1

(k-l)!

+ · · ·,

dass für jeden genügend klein gewählten positiven Wert von h das Vorzeichen von f(x + h)f' (x + h) übereinstimmt mit dem von f(x)fk>(x) und folglich w(x + h) = 1-sgn [~x)f(x)] ist. Da nun [sgn f(x)] 2 = 0 oder 1 ist, je nachdem f(x) verschwindet oder nicht, so kann man zusammenfassend sagen: Für jeden genügend kleinen positiven Wert von h gilt die Gleichung (15)

w(x

+ h) =

[sgn f(x)]21-sgn[~x)f(x)]'

wenn t(x) das erste nicht verschwindende Glied der Reihe (16) f' (x), f" (x), f"' (x), .•• bezeichnet. Es sei nun a •.. b ein beliebiges Intervall. Ich wähle dann die positive Grösse h so klein, dass erstens die Formel (15) für x =. a und x = b Gültigkeit besitzt und dass zweitens in den Bereichen a

(x) nicht Null, so wird der Gleichung (21) zufolge Wf(x) = 1 sein, wenn f(x) mit dem ersten nicht verschwindenden Gliede der Reihe

f' (x), f" (x), ... , f(x) im Bereiche a(a) von Null verschieden. Zwischen den Anzahlen N und N der Nullstellen von f(x) und f(x)

für jeden reellen Wert von x positiv. Ein Satz von demselben Charakter tritt in den an Herrn Hilberts Beweis des Waring'schen Theorems anknüpfenden Untersuchungen der Herren Hausdorff, Stridsberg und Remak 2) auf; nämlich der Satz: Wenn das reelle, nicht identisch verschwindende Polynom f(x) = c0 + c1 x + c2x2 + · · · +c2nx2n für jeden reellen Wert von x positiv oder Null ist, so ist das Polynom

(3)

f2(x)

=

f(x) +

1\

f"(x) + ;, f 4>(x) + · · · + ~~ f 2n>(x)

für jeden reellen Wert von x positiv. Die beiden Sätze ergeben sich unmittelbar aus den nachstehenden Darstellungen von f1 (x) und f2 (x) durch Integrale: oo

(4)

f1 (x) = Je-"f(x + u)du, f2 (x) = 0

+oo

2 ~/e -~ f(x + u)du. -oo

1 ) Mathem. Annalen, Bd. 33 (1889), S. 246-266 [diese Werke, Bd. I, S. 266-286, vgl. S. 279]. 2) Hausdorff, Zur Hilbert'schen Lösung des Waring'schen Problems, Mathem. Annalen, Bd. 67 (1909), S. 301-305. - Stridsberg, Sur la demonstration de M. Hilbert du tMoreme de Waring, Mathem. Annalen, Bd. 72 (1912), S. 145-152. - Remak, Bemerkung zu Herrn Stridsbergs Beweis des Waring'schen Theorems, Mathem. Annalen, Bd. 72 (1912), s. 153-156.

587

Über definite Polynome.

Da indessen die Sätze rein algebraischer Natur sind, so wird man fordern dürfen, dass auch ihre Beweise nur algebraische Hilfsmittel benutzen sollen. Für den zweiten Satz hat Herr Remak a. a. 0. dieser Forderung genügt. Seine Betrachtungen haben mich auf die in den folgenden Zeilen dargestellten sehr einfachen und übersichtlichen Beweise geführt. Die Polynome / 1 (x) und f2 (x) fasse ich in der Form

(5)

F(x) = a0 f(x) + ad'(x) + a2 f"(x) + · · · + a2 nf2 n>(x)

zusammen, wobei a0 , a11 a2 , Annahme (6) führt auf die Funktion

•••

Zahlenkoeffizienten bezeichnen. Die

a;

=

(i=0,1,2, ... )

1

f1 (x), die Annahme 1

(7)

·) a;=-(1

(i=0,1,2, ... )

2" !

auf die Funktion

f2(x),

( der Wert wobei hinzuzufügen ist, dass für -/.) 2" !

Null einzutreten hat, wenn ~ i keine ganze Zahl ist. Mit Herrn Remak bemerke ich zunächst, dass es genügt, den Fall zu betrachten, wo f(x) = (j12(x)' (8) d. h. f(x) das Quadrat eines reellen Polynoms (j)(X) ist. In der Tat lässt sich ein Polynom f(x), welches für jeden reellen Wert von x positiv oder Null ist, stets als Summe von Quadraten reeller Polynome darstellen, wie das aus der Zerlegung von f(x) in reelle Faktoren ersten und zweiten Grades unmittelbar hervorgeht. Nun ist die kte Ableitung von (j1 2{x) gleich k 0(j1(x)(j)(x) +k1(j)'(X)(j)(x) + k2(j)"{x) (j)(x) + · · + kk(j)(x) (j1(x),

((j1(x) = (j)(x)),

unter k0 , k 11 k2 , ••• die Binomialkoeffizienten zur Basis k verstanden. Daher kommt O,l, ... ,n k=2n F(x) = ~ ak ~ k,(j)(x) (j)(x) = ~ a,+a(r + s),(j)(x) (j)(•> (x). k=O

r,s

r+s=k

Demnach ist F(x) der Wert, welchen die quadratische Form O,l, ... ,n

(9)

€P = ~ a,+a(r + s),x,x, r,s

588

Algebra.

der Variablen x 0 , x 1 , x 2 , (10)

x 0 = q;(x),

••• ,

Xn für

x 1 = q;'(x),

x 2 = q;"(x), ... , xn = g;(x)

annimmt. Da nun q;(x) immer so gewählt werden kann, dass für einen bestimmten Wert von x, z. B. für x = 0, die aus (10) berechneten Werte x 0, x 11 x 2, •. . , Xn mit beliebig vorgeschriebenen Werten zusammenfallen, so gilt: Soll F(x) für jeden Wert von x und jede Wahl des Polynoms q;(x) positiv sein, so ist hierzu erforderlich und hinreichend, dass die Form f/J eine positive Form ist. Während nun Herr Remak (für den Fall, wo die Zahlen a0 , a1 , a2 , ••• durch die Annahme (7) bestimmt sind) durch die Berechnung der Hauptunterdeterminanten der Determinante der Form f/J den Nachweis erbringt, dass f/J eine positive Form ist, stelle ich diese Form direkt als Summe von Quadraten reeller linearer Formen dar. Sind erstens die Zahlen a0 , a1 , ••• sämtlich gleich 1, s'o benutze ich die bekannte Gleichung (11)

(r

+ s), = r s + r s + r s + ··· + rnsn 0 0

2 2

1 1

(r, s = 0, 1, 2, ... , n),

wobei jeder Binomialkoeffizient rk (bzw. sk) gleich Null zu setzen ist, wenn k > r (bzw. k > s) ist. Dieser Gleichung zufolge wird r,s

,,.

r,s

.

Sind zweitens die Zahlen a0 , au ... durch die Gleichungen (7) bestimmt, so gilt die Beziehung (12)

a,+s(r + s), =a,a8 + T!a,_ 1 a8 _

+ 21 a,_ ~

~

1

2 a8 _ 2

+ ·· · + n! a,_nas-n

(r,s=0,1,2, ... ,n), wobei ak gleich Null zu setzen ist, wenn k negativ ist. Unter Benutzung von (12) ergibt sich nun sofort

Was die Gleichung (12) angeht, so braucht sie nur für den Fall bewiesen zu werden, wo r + s gerade ist. Denn andernfalls verschwinden alle

Über definite Polynome.

Glieder dieser Gleichung. Ist aber r beiden Seiten der Identität (x

+ yy+s =

+ s gerade,

589

so entwickle man die r+s

(x2

+ y2 + 2xy)~

nach dem binomischen, bzw. polynomischen Lehrsatze und vergleiche die Koeffizienten von x•y•. Hierdurch kommt

wo die Summe über die nicht negativen Zahlen h, i, k, welche den Bedingungen 2h+k=r, 2i+k=s genügen, zu erstrecken ist. Es wird also """ 2k

ar+s(r + s), _..:::;.; k! · ('-:k)! k-0,1,2,...

1

2

1 (s-;;k)!' -

· h t· mc k eme d er Summe, für welc h e -r-k- oder -s-k . wobei die GI1eder 22 negative ganze Zahl ist, fortzulassen sind. Die letztere Gleichung ist aber offenbar mit der Gleichung (12) identisch Sollen irgend 2 n Zahlen (13) die Eigenschaft besitzen, dass das Polynom (5) immer dann beständig positiv ist, wenn das Polynom f(x) der Bedingung f(x) ~ 0 genügt, so ist hierfür nach dem Obigen erforderlich und hinreichend, dass die Form (9) eine positive Form ist. Es müssen also (vgl. Remak, a. a. 0.) die Hauptunterdeterminanten ao, al, a2 Ll 2 = a 1 , 2a2 , 3a3 , ••• (14) a2 , 3a3 , 6a4 der Determinante der Form C/J sämtlich positiv sein. Man erkennt hieraus leicht, dass die Zahlen a 1 , a 3 , a5 , • •• willkürlich wählbar sind, während sich für die übrigen Zahlen a0 , a 2 , a 4 , ••• aus den Bedingungen Ll 0 > 0, Ll 1 > 0, Ll 2 > 0, ... sukzessive untere Grenzen ergeben. Zahlensysteme, welche die hier betrachtete Eigenschaft besitzen, werden übrigens, wie man leicht erkennt, durch folgenden Ansatz erhalten. Man bezeichne mit

590

Algebra.

irgend 2n irgend 2n dann

+1

positive Grössen, mit

+1

reelle, untereinander verschiedene Grössen und setze (k = 0, 1, 2, ... , 2n).

(15)

Es ist auch nicht schwierig zu beweisen, dass durch diesen Ansatz das allgemeinste in Betracht kommende Zahlensystem (13) entsteht!). Zürich, 12. Juni 1912. 1 ) [[Bemerkung auf Grund der Eintragung in das Hurwitz'sche Tagebuch vom 13. Juni 1912, S. 51-54 des Heftes Nr. 77706/25 der Bibliothek der Eidg. Technischen Hochschule: Es sei m ganz, m > n. Man wähle die reellen Zahlen a.2n+1 , a 2n+2•···· a2m-l so, dass die quadratische Form (9) noch positiv definit bleibt, wenn man darin die Summationsgrenze n durch m -1 ersetzt, und bestimme die echtgebrochene rationale Funktion R(z) mit m Polen so, dass ihre Entwicklung nach fallenden Potenzen von z mit den Gliedern

a0

z

+ 1!a1 + 2!a2 z2

za

+~··

+ (2m-l)!a2m-1 z2m

beginnt. Dann hat der Index von R(z) den Wert m (vgl. diese Werke, Bd. II, S. 540-541), also hat R(z) m reelle einfache Pole r0 , rl' ... , 'm-l mit den positiven Residuen p0 , p1 , ... , Pm- 1 , und es ergibt sich durch Koeffizientenvergleichung für k = 0, 1, ... , 2m (15')

k!ak = Por8

+ p1rf + ... + Pm-1,~1'

Der Fall m = 2n + 1 wird im Text mit Rücksicht auf die auf S. 586 angegebene Literatur hervorgehoben. Wenn m;;;;;2n + 1, und die Zahlen ak rational sind, so kann man die Pk und die rk auch als rationale Zahlen wählen. Man ändere nämlich, von den vorangehend bestimmten p1:, rk ausgehend, die rk zu rationalen Zahlen und um so wenig ab, dass sich die zugehörigen Pk aus (15') für k = 0, 1, ... , m-1 noch als positive Werte bestimmen lassen. - Anm. von G. P.]]

LXXXVI.

Ober die Trägheitsformen eines algebraischen Moduls. (Annali die Ma.tematica.pura ed applica, serie III, t. 20, 1913, p.113-151.)

Die Untersuchungen von Herrn F. Mertens über die Resultante 1) legen es nahe, gewisse für einen algebraischen Modul charakteristische Formen zu betrachten, die man passend als "Trägheitsformen" des Moduls bezeichnen kann. Es ist der Zweck der vorliegenden Arbeit, einige einfache Eigenschaften dieser Formen abzuleiten. Der Definition der Trägheitsformen will ich zunächst einiges über die Bezeichnungen, deren ich mich bedienen werde, voraufschicken. Bedeuten (1) unabhängige Variable, ferner (2) nicht-negative ganze Zahlen, so versteht man bekanntlich unter dem "Grade" des Potenzproduktes (3)

X~' X~ • • •

x:n

die nicht-negative ganze Zahl (4) Die Potenzprodukte 1-tten Grades bezeichne ich, m eine beliebige, aber bestimmte Reihenfolge gebracht, mit (5)

> x X 1 und für den Fall von n -1 Variablen der Satz als bewiesen vorausgesetzt. Da, wenn gesetz.t wird,

m,.f,., ... ist, so folgt, wenn (69) gilt,

A (md1 t/>1 + msfs tPa + ··· + m,.f,. tP,.) + x1A1f1 + ··· + x1A,.f,. = 0 oder (Am1t/>1 + x1A1)f1 + (Am 2 tP2 + x1A 2)/2 +

· · · + (Am,.tP,. + x1A,.)f,. =

0,

also nach Satz 12:

AmitPi+ x1 Ai= Lilf1 + Li 2 / 2 +

· · · + Linfn

(i = 1, 2, ... , n),

wo Ltk Formen sind, die Ltk = - Lki (also Lu= 0) befriedigen. Es genügt, die Gleichung

A m1 t/>1

+ X1A1 =

L12f2

+ · · · +L1nfn

zu betrachten. Für x1 = 0 kommt (70)

wo der hinzugefügte Index 0 das Ersetzen von x1 durch 0 andeutet. Nun sind f20 , •• • , fno allgemeine Formen der Grade m2 , ••• , mn von den n-1 Variablen x2 ,x3 , ••• ,xn, und t/>10 entsteht a,us t/>1 =

ot. ot, ox.····•oxn

....... . iJfn ot,.

ox

1 ' · • .,

OXn

durch die Substitution x1 = 0; d. h. es ist t/>10 die Funktionaldeter39

610

Algebra.

minante der Formen f20 , ••• , fno· Die Gleichung (70) hat also die Gestalt der Gleichung (69), und folglich ist A = 0.] Bedeutet T irgendeine Trägheitsform erster Stufe des Moduls M, so wird T' = AT + Adt + · · · + Anfn eine Trägheitsform erster oder nullter Stufe sein, wenn Au A 2 , ••• , An Formen von den Graden r•-m1 -1, bzw. r-m 2 -1, .. . ,r-mn-1 und A irgendeine Form vom Grade Null bezeichnen. Die Trägheitsform T' heisse aus T "abgeleitet". Es besteht nun der folgende Satz, der die Theorie der Trägheitsformen erster Stufe des Moduls M zum Abschluss bringt. Satz 1 9. Jede Trägheitsform T erster Stufe des Moduls M lässt s,ich aus der Funktionaldeterminante J ableiten, d. h. es ist

(71) unter A, Au A2 , ••• , An passend gewählte Formen verstanden. Da nach dem Satze 15 die Form T, ebenso wie J, vom Grade r - 1 ist, so folgt, dass die Form A vom Grade Null, die Form A; vom Grade r - m; - 1 sein muss. Um den Beweis des Satzes 19 vorzubereiten, zeige ich zunächst: wenn der Satz für einen bestimmten Wert von n gültig ist, so gilt für den nämlichen Wert von n auch der folgende Satz: Satz 20. Es seien f1 , f2 , ••• , fn, fn+t allgemeineFormen der n Variablen x 1 , x 2 , ••• , Xn von den positiven Gradzahlen m 1 , m 2 , ••• , mn, mn+1 bzw.. Befriedigen dann die Formen A 1 , A 2 , ••• , An, An +I die identische Gleichung

(72) deren einzelne Glieder Ad1 , A 2 f 2 , tisch Null sind, den Grad

••• ,

An+dn+t• soweit sie nicht iden-

(73) besitzen, so lassen sich diese Formen in folgender Gestalt darstellen:

(74)

A; = m;LJi+ Lidt + L; 2 f2 + .. · + Li,n+dn+I (i=1,2, ... ,n+l).

Dabei bedeuten: L eine Form vom Grade 0, ferner die L;k Pormen, die den Gleichungen

(75)

L;k

=

genügen, endlich Jv J 2 ,

-Lki ••• ,

(i, k

=

1, 2, ... , n

+ 1)

Jn+1 die aus den Pormen fu f 2 ,

•• • ,

fn+t zu

Über die Trägheitsformen eines algebraischen Moduls.

611

bildenden Funktionaldeterminanten, so dass für unbestimmte Werte von ul, u2, ... , un+l

(76)

ist. Aus der identischen Gleichung (72) folgt, dass A 1 Grundeigenschaft bezüglich der Formen f2, .. . , fno fn+l hat; der Grad von A1 ist m 2 + ' · · + mn+l- n und folglich ist A 1 Trägheitsform erster oder nullter Stufe für den Modul (f2 , ••• , fn, fn+ 1). Nach dem als richtig angenommenen Satz 19 kann daher (77)

Al= mlLJl

+ Lnft + L12f2 + · · · + Llnfn + Ll,n+dn+l

gesetzt werden, wo L 11 = 0 und L, L12 , ... , L 1,n+1 Formen bedeuten. Die Gleichung (72) geht nun vermöge (77) über in

mtLJtft Up

+ (A2 + L12ft)f2 + · · · + (An+t + Lt,n+dt)fn+t =

0.

Ersetzt man weiter in der Gleichung (76) die Unbestimmten U2, .. . , Un+l durch mtft, m2f2, · · ., mn+dn+l

bzw., so verschwindet die Determinante, welche die linke Seite der Gleichung bildet, so dass also

m1J1f1

+ m2J2f2 + ·· · + mn+lJn+dn+l =

0

ist. Dies, mit der vorhergehenden Gleichung kombiniert, liefert

(A2 + L12f1-m2LJ2)f2 + ·· · + (An+l + L1,n+d1-mn+lLJn+l)fn+l == 0. Und hieraus folgt nun nach Satz 12: (78) Ai=-Ltdt+miLJi+Li2f2+Li3f3+···+Li,n+dn+t (i=2,3, · · ., n+1) · Setzt man endlich Ln = - L 1 i ( i = 2, 3, ... , n + 1) , so gehen die Gleichungen (77) und (78) in die zu beweisenden Gleichungen (74) über. Um jetzt den Satz 19 zu beweisen, bemerke ich zunächst, dass der Satz im Falle n = 1 richtig ist. Denn es wird dann etwa

wo C eine Form nullten Grades (also eine Funktion der Unbestimmten

612

Algebra.

allein) bezeichnet. Da T als Trägheitsform erster Stufe des Moduls (f1) vorausgesetzt wird, muss

x 1 T = Cx'{'' = Atf 1 = A 1 a11 x'{'',

d. i.

C = A 1 a11

sem. Somit kommt

eine Gleichung, welche die Gestalt der Gleichung (71) besitzt. Sei nun n > 1 und vorausgesetzt, dass der Satz 19 für den Fall von (n -1) Variablen schon als richtig erkannt sei. Bezeichnet dann T irgendeine Trägheitsform erster Stufe des Moduls M, so ist

(79) unter A1 , A2 ,

••• ,

A"n Formen von den bez. Graden r - ml' r -- m 2 ,

••• ,

r -- mn

verstanden. Für x1 = 0 entsteht aus (79) (80)

wo {10 , { 20 , ••• , fno allgemeine Formen der n -1 Variablen x 2 , ••• , Xn sind. Auf die vorstehende Gleichung kann jetzt der Satz 20 angewendet werden. Sei also für unbestimmte u1 , u 2 , ••• , Un

(81) un,

ofno

ofno

ofno

-i)- , -i)- , ••. ' -i)Xz

Xa

Xn

gesetzt. Dann wird (82)

AiO= miLfi+

Lilf10+ Li2f20+ · · · +

Linfno (i

wobei L und die L;k Formen der Variablen x 2 , welche den Gleichungen genügen. Nunmehr führe ich die Formen:

em.

=

••• , Xn

1, 2, · · ., n),

bezeichnen,

Über die Trägheitsformen eines algebraischen Moduls.

613

Die Differenzen A;0 - B; und folglich auch die Differenzen A;-B;=A;-AiO+ (A; 0 -B;) sind sämtlich durch x1 teilbar, also etwa A; - B; = x1 C;

(84)

(i = 1 , 2, ... , n).

Ferner folgt aus (83) (85)

Bd1

+ B2f2 + ·· · + Bnfn =

L(m1fd1

+ m2f2f2 + ··· +mnfnfn).

Diese Gleichung mit (79) kombiniert, ergibt in Rücksicht auf (84) : (86)

X 1 T=L(mdd1+m2f2f2+

· · · +mnfnfn)+x1(Cd1+C2f2+ · ·· +Cnfn)·

Der Faktor von L hängt nur von den Formen / 1 , und lässt sich nach (81) durch die Determinante

(87)

Of1o m1f1, ox2 ' ofzo m2f2, ox2 ' IP=

of1o ox3 ' o fzo ox3 '

ofno mnfn, ox2 olno ' ox3 '

... ' ... ,

f2 , ••• , fn ab

of1o OXn ~20

OXn

..

... ,

0lno oxn

darstellen. Die Form L selbst ist vom nullten Grade, also eine Funktion der Unbestimmten allein. Die Gleichung (86) wende ich insbesondere auf den Fall an, wo die Trägheitsform T mit der Funktionaldeterminante J zusammenfällt. Es sei etwa Durch Vergleich der höchsten Glieder bezüglich der Unbestimmten an' a22' ... ' ann ergibt sich L = 1, also (88) eme Gleichung, die übrigens auch direkt aus der Identität 0 tl

... ,

OXn

m2f2, ox2 '

... ,

OXn

0 t.

xlJ=

folgt.

011

m1f1, ox2 '

012

614

Algebra.

Aus (86) und (88) ergibt sich nun schliesslich x 1 (T- LJ) = x 1 [(C1 - LC1)f1 und hieraus T

=

LJ

+ (C

1 -

LC1)f1

+ · · · + (C,,- LC.. )f.. ]

+ · · · + (C.. -

LC.. )f.. ,

womit die Darstellbarkeit von T in der Gestalt (71) bewiesen ist. Die Aufgabe, sämtliche Trägheitsformen des Moduls M zu bestimmen, scheint sehr erhebliche Schwierigkeiten zu bieten. Dagegen gelingt es durch eine Reihe von einfachen Schlüssen, alle diejenigen Trägheitsformen herzustellen, die in den Koeffizienten jeder der Formen f1 , f2 , ••• , fn linear sind, zu welchen Trägheitsformen insbesondere die Funktionaldeterminante J gehört. In bezug auf die Abhängigkeit der Trägheitsformen von den Koeffizienten der Formen f1 , f2 , ••• , f.. beweist man leicht zunächst den folgenden Satz 21. Jede eigentliche Trägheitsform des Moduls

ist in jedem beliebigen Koeffizienten einer beliebigen der Formen f ~t f 2 , mindestens vom ersten Grade.

••• ,

f ..

Es sei a irgendeiner der Koeffizienten der Form f1 und X das Potenzprodukt, welches mit a multipliziert ist, so dass

ft

=

aX

+ f~

gesetzt werden kann, wo f~ den Inbegriff der von aX verschiedenen Glieder der Form ft bedeutet. Wenn nun T eine Trägheitsform des Moduls M ist, die vom Koeffizienten a nicht abhängt, so setze man in der Gleichung

X,_.T = Ad1 + A2 f2

+ · · · + A .. f..

an die Stelle von a überall - ~. Nach Multiplikation mit einer geeigneten Potenz von X kommt dann XNX,.. T

= A2f2 + ... + A.. f.. ,

unter A2 , ••• , A... wieder Formen verstanden. Aus dieser Gleichung folgt nun (mit Hilfe des Satzes 9), dass T notwendig auch Trägheitsform des Moduls (f2 , ••• , f..) ist. Nach Satz 11 ist folglich T eine uneigentliche Trägheitsform. Eigentliche Trägheitsformen sind hiernach bezüglich der Koeffizienten jeder der Formen f1 , f2 , ••• , f.. mindestens vom ersten Grade. Es gilt aber weiter der

Über die Trägheitsformen eines algebraischen Moduls.

615

Satz 22. Eine eigentliche Trägheitsform T des Moduls M, welche in den Koeffizienten der Form f; vom ersten Grade ist, besitzt eine Stufe, die den Grad mi von f i nicht übersteigt.

Angenommen die Stufe von T sei a

= mi + 1 + p

(p

~ 0).

Dann kann nach Satz 5 das Potenzprodukt X'IJ so gewählt werden, dass (89) von der Stufe mi

+ 1 ist.

Sind nun X~!· X~!

.... , X~~

die Potenzprodukte m~en Grades, so ist jede der Formen der Stufe 1 oder 0. Also hat man nach Satz 19

Xm;

T von

(oc = 1, 2, ... , k).

(90)

Da die Funktionaldeterminante J, ebenso wie T, vom ersten Grade in den Koeffizienten a< 1>, a, ••• , a der Form (91) ist, so sind die Formen A von diesen Koeffizienten unabhängig. Multipliziert man nun die Kongruenz (90) mit a und summiert sodann über oc, so kommt 0

=fiT= J •~ aA (mod. M). a

Nach Satz 18 ist folglich ~ aA

= 0,

a

und, weil die Formen A von den a unabhängig sind,

A=O (oc=1,2, ... ,k). Die Kongruenzen (90) gehen nun über in X~~T

= o (mod. M).

Es wäre also T höchstens von der Stufe m;. Demnach ist die Annahme, die Stufe a von '1' sei grösser als mi, unzulässig. Die Formen fi, f2 , ••• , fn seien nun nach aufsteigenden Gradzahlen geordnet, also so, dass (92)

616

Algebra.

ist. Eigentliche Trägheitsformen des Moduls M, die in den Koeffizienten jeder einzelnen der Formen fi linear sind, können dann nach dem vorhergehenden Satze nur bis zur Stufe m1 existieren. Über diese Trägheitsformen gibt der folgende Satz näheren Aufschluss: Satz 2 3. Es sei a eine positive ganze Zahl, welche n·icht grösser als m1 ist, also (93)

Dann gibt es

s = [a - 1 ; n]

(94) Trägheitsformen

ater

(u+ n- 2)! = --:--'--=-:-:----'::-:-:(u-1)! (n -1)!

Stufe

(95)

des Moduls M, die in den Koeffizienten jeder einzelnen der Formen fv / 2 , ••• , fn linear sind und überdies folgende Eigenschaften besitzen: Der Ausdruck in welchem A(l), A, .. . , A Formen nullten Grades, A1 , A2 , ••• , A., irgendu·elche Formen bedeuten, kann nicht anders verschwinden, als wenn (97)

A(l)=

A= ...

=

A(B)= 0

ist, und jede Trägheitsform a1er Stufe des Moduls M lässt sich in der Form (96) darstellen. Es sei (oc1 , oc2 , ••• , oc..) irgendeine der s Lösungen der Gleichung (98)

oc1

+ oc2 + ··· + oc,. = a-1

in nicht-negativen ganzen Zahlen oc1 , oc 2 , ••• , oc,.. Ferner bezeichne F irgendeine Form, deren Grad m ~ a ist. Jedes einzelne Glied der Form F ist dann mindestens durch eine der Potenzen (99)

xa,+l xan+l X a,+l 1 ' 2 , ••• , n

teilbar. Würde nämlich das betreffende Glied, für jedes i, die Variable X; höchstens zur Potenz oc; als Faktor enthalten, so würde der Grad des Gliedes höchstens oc1 + oc2 + · · · + oc,. = a - 1 sein, während doch F nach Voraussetzung mindestens vom Grade a ist. Demnach kann F in die Gesta.lt (lPO)

gesetzt werden, und zwar in eindeutiger Weise, wenn festgesetzt wird, dass x~,+l F 1 alle diejenigen Glieder von F umfassen soll, die den Faktor

617

Über die Trägheitsformen eines algebraischen Moduls.

haben, sodann x;;•+l F 2 von den übrigen Gliedern alle diejenigen, welche den Faktor x;;•+ 1 haben, usw. Diese Darstellungsweise wende ich nun auf die Formen fv / 2 , ••• , fn an, wodurch die bezüglich der Potenzen (99) linearen Gleichungen x~·+l

(101) fi

= X~'+lfil

+ x;;•+ 1 fi 2 + ··· + x~n+lfin

(i

=

1, 2, ... , n)

entstehen. Behufs bequemerer Bezeichnungsweise mögen die s Lösungen der Gleichung (98) ebenso numeriert werden, wie die Potenzprodukte (102)

X (l) a-1'

x übergeht. Die Anzahl der Formen Fi, welche f,. als Faktor haben; beträgt nach dem vorhergehenden Satze Sei nun

622

Algebra.

so sind die Koeffizienten qh> ganzzahlige lineare homogene Funktionen der Koeffizienten derjenigen Form, welche als Faktor in Fi auftritt. Jeder der Koeffizienten C~h> ist nämlich entweder Null oder mit einem der Koeffizienten der betreffenden Form fa identisch. Die aus den Koeffizienten qh> gebildete Determinante

(122)

T,.

=

c(l) Ci2>, .•. , c 1 1 ' c(l) c c 2 ' ..• ' 2 2' c(l) c c k ' k ' ... ' k

hat nun folgende Eigenschaften: 1) Werden die Koeffizienten der Formen dass

f1--

xm,

1 '

f2--

".m,

"'-2 ' · • ·'

f1 , f2 ,

••• ,

fn--

n

f,. so spezialisiert,

xmn

ivird, so nimmt T,. den Wert 1 an. Denn es wird dann C~il = 1 (i = 1, 2, ... , k), während alle übrigen Koeffizienten C~h> verschwinden. Da somit T,. für ein spezielles Wertsystem der Koeffizienten der Formen fv f2 , ••• , f,. nicht verschwindet, so ist T,. eine nicht identisch verschwindende Funktion jener Koeffizienten. 2) Die Determinante T,. ist eine ganze ganzzahlige Funktion der Koeffizienten der Formen f1 , f2 , ••• , f,., homogen in den Koeffizienten jeder einzelnen dieser Formen und insbesondere vom Grade

bezüglich der Koeffizienten de·r Form f,.. 3) Die Determinante T,. ist Trägheitsform des Moduls M=(fvf 2 , ••• ,f,.). Denn durch Auflösung der Gleichungen (121) nach einem beliebigen der Potenzprodukte Xr findet man, da die Formen Fi=-0 (mod. M) sind,

Wiederholt man die vorstehende Betrachtung, nachdem man die Reihenfolge der Formen fv f2 , ••• , f,. in der Weise abgeändert hat, dass an die letzte Stelle statt f,. eine andere Form fi tritt, so erhält man statt der Determinante T,. eine andere Determinante T;, welche in den Koeffizienten der Form fi homogen vom Grade

Pi=

1

m. · m1m2 · • • m,. •

ist, im übrigen aber dieselben oben erwähnten Eigenschaften besitzt wie T,..

Über die Trägheitsformen eines algebraischen Moduls.

623

Es sei jetzt T eine beliebige Trägheitsform des Moduls M. Zerlegt man T in seine irreduziblen Faktoren 1), so muss nach Satz 10 mindestens einer dieser Faktoren ebenfalls Trägheitsform sein. Es gibt daher auch irreduzible Trägheitsformen. Unter diesen sei R eine derjenigen, welche bezüglich eines beliebig gewählten Koeffizienten a der Form f1 den niedrigsten Grad besitzt und sei etwa (123)

R

=

ahS

+ · · .,

wo S von a unabhängig ist. Der Grad h von R bezüglich a ist nach Satz 21 mindestens 1. Ist nun T = ah'U + ...

eine beliebige Trägheitsform, so ist T durch R teilbar. Dies leuchtet sofort ein, wenn h' < h ist. Denn dann muss T identisch verschwinden, weil sonst ein irreduzibler Faktor von T, dessen Grad bezüglich a kleiner als h ist, Trägheitsform wäre. Sei also h' ~ h und die aufgestellte Behauptung für den Fall, dass T von niedrigerem als dem h'ten Grade bezüglich a ist, schon als richtig erkannt. Da nun ST-ah'-hUR =

T

den Grad h' in a nicht erreicht, so ist T durch R teilbar und also auch S T. Folglich muss ·R als irreduzible Funktion in S oder T aufgehen. Weil aber S von a unabhängig ist, kann S ni~ht durch R teilbar sein; folglich ist es T. Die Trägheitsform R ist bis auf einen numerischen Faktor bestimmt. Denn wenn R dieselbe Eigenschaft hat wie R, so sind R und R gegenseitig durch einander teilbar. Um R völlig zu bestimmen, bemerke ich, dass R einen nicht verschwindenden Wert erhält, wenn man die Formen f1 , f2 , ••• , f" zu xf•, x:•, ... , x:"' spezialisiert. Dann nimmt nämlich die Determinante T", welche R als Faktor enthält, den Wert 1 an. Der in R noch enthaltene numerische Faktor kann daher so bestimmt werden, dass für die erwähnte Spezialisation der Formen / 1 , / 2 , ••• , f.. wird. 1) Der Begriff der Irreduzibilität ist hier natürlich auf den zugrunde gelegten Bereich B zu beziehen (siehe oben S. 590). Übrigens ist es zweckmässig, · im Folgenden als Bereich B alle ganzen rationalen Funktionen einer beliebigen Anzahl von Unbestimmten, zu denen auch die Koeffizienten der Formen / 1 , / 1 , ••• , fn gehören, mit beliebigen numerischen Koeffizienten zu wählen. Der bei der. Bildung des Bereiches B benutzte Rationalitätsbereich besteht dann also aus der Gesamtheit aller (reellen und komplexen) Zahlen.

624

Algebra.

Die auf diese Weise eindeutig bestimmte Trägheitsform R heisse die "Resultante" der Formen f1 , / 2 , ••• , fn und möge nach Herrn Mertens Vorgang mit

(124) bezeichnet werden. Da T 1 , T 2 , ••• , T .. homogene Funktionen der Koeffizienten der Formen ft, / 2 , ••• , f.. sind, und jede dieser Funktionen den Faktor R besitzt, so ist auch R homogen in den Koeffizienten jeder einzelnen Form fi und zwar, als Teiler von T;, höchstens vom Grade

Es bleibt noch zu zeigen, dass R in den Koeffizienten von fi den Grad Pi erreicht. Dies gelingt leicht auf dem Wege der Induktion. Wenn nämlich zunächst den kleinsten Wert 1 besitzt, so sind ft, f 2 , ••• , f n lineare Formen, die Zahlen p; werden sämtlich 1 unddaR nach Satz 21 in den Koeffizienten der einzelnen Form /; mindestens vom Grade 1 ist, so ist in diesem Falle R wirklich vom Grade p; iu den Koeffizienten von f; (R ist übrigens in diesem Falle identisch mit der Determinante der Linearformen / 1 , / 2 , ••• , f .. , mit welcher die Determinanten T 1 , T 2 , ••• , T .. zusammenfallen). Sei nun p > 1 und für alle Fälle, in welchen das Produkt der Grade kleiner als p ist, schon als bewiesen vorausgesetzt, dass der Grad von R in den Koeffizienten einer jeden der Formen f11 f 2 , ••• , f n gleich dem Produkte der Grade der übrigen ist. Da p > 1 sein soll, ist unter den Formen f1 , f2 , ••• , f.. , deren Resultante R heisse, mindestens eine von höherem als dem ersten Grade. Es sei etwa m1 > 1 und

gesetzt, wo m~ und m~ positive ganze Zahlen bezeichnen. Unter f~ und f~ zwei allgemeine Formen von den Graden m~ bzw. m~ verstanden, setze ich in die Identität

an die Stelle der Koeffizienten von ft die Koeffizienten der Form

f~ · f~, wodurch

625

Über die Trägheitsformen eines algebraischen Moduls.

entsteht. Moduln

Diese Gleichung zeigt, dass R Trägheitsform der beiden

und folglich durch die Resultanten

(125)

R'=[f~, f2•···• fn], R"=[f~', f2•···• fn] X 1 , X 2 , ••• , Xn

X 1 , X 2 , ••• , Xn

teilbar ist. Da R' und R" zwei wesentlich verschiedene irreduzible Funktionen sind, weil R' die Koeffizienten von f~, R" aber die Koeffizienten von f~ enthält, so ist R auch durch das Produkt R' R" teilbar, also

R

(126)

=

R' R"Q.

Die Form Q kann nicht identisch verschwinden. Denn spezialisiert • d f'f" =Xm' 1nn m. m" 1' 1 ' +m"'=Xm man f'v f"1 , f2 , ••• , fn zu xm' 11 1 ',x1 ',x2 -, ••• ,xn, so wu und folglich R = 1, R' = 1, R" = 1, also auch Q = 1. Da nun weiter so sind die Grade von R' in den Koeffizienten der Formen f~, f2 , ••• , fn bzw. p'

p'

-,,-, m2 ml

und die Grade von

p' ... ,mn

R" in den Koeffizienten der Formen

f~, f2 ,

••• ,

fn bzw.

Die Grade von Rinden Koeffizienten der Formen f~,f~,f2 , ••• ,fn bzw. sind daher mindestens d. i.

wo, ww oben, ist. Die Grade derResultanteRbezüglich der Koeffizienten von fi, f2, ••• , fn sind nun die nämlichen, wie die Grade von R bezüglich der Koeffizienten von f~, f2 , •• • , fn· Also sind die betreffenden Grade für die Resultante R mindestens Pu p 20 ••• , Pn bzw. und da schon feststeht, dass 40

626

Algebra.

diese Grade auch höchstens die angegebenen Werte haben, so stellen sie die richtigen Gradzahlen vor. Zugleich ergibt sich nun, dass in der Gleichung (126) Q = 1 sein muss, dass also die Resultante (127) gleich dem Produkte der beiden Resultanten R' und R" ist. Die Determinanten T 1 , T 2 , •• • , Tn haben die Resultante R als grössten gemeinsamen Teiler. Denn bezeichnet RQ diesen grössten gemeinsamen Teiler, so ist Q von den Koeffizienten der Formen / 1 , / 2 , ••• , fn unabhängig, weil R in den Koeffizienten von /; denselben Grad Pi besitzt, wie die Determinante T;. Folglich ist Q ein numerischer Faktor. Als grösster gemeinsamer Teiler der ganzzahligen Funktionen T1 , T 2 , •• • , Tn besitzt R jedenfalls Koeffizienten, deren Verhältnisse rationale Zahlen sind. Der numerische Faktor x lässt sich daher so wählen, dass xR eine ganzzahlige primitive Funktion der Koeffizienten der Formen fu / 2 , ••• , fn wird. Setzt man dann so ist Hn eine ganzzahlige Funktion. Spezialisiert man fu f 2 , • •• , fn zu x'{'', X~', ... , x;:n bzw., so kommt Tn = 1 und da xR und Hn ganze Zahlen werden, so erhält man, wegen R = 1, xR = x =

±

1.

Demnach ist R selbst eine ganzzahlige Funktion der Koeffizienten der Formen fu / 2 , ••• , fn· Hiermit sind nun die sämtlichen fundamentalen Eigenschaften der Resultante abgeleitet.

LXXXVII.

Ober einen Satz des Herrn Kakeya. (The Töhoku Mathematical Journal, Vol. 4, 1913, p. 89-93.)

Im Verlaufe einer Korrespondenz mit Herrn E. Landau, die sich auf seine schönen neueren Untersuchungen über Potenzreihen 1 ) bezog, wurde ich auf den gleichen Satz geführt, den Herr S. Kakeya 2) im Töhoku Mathematical Journal, Bd. 2 veröffentlicht hat. Einer freundlichen Aufforderung des Herausgebers dieses Journals, Herrn T. Hayashi, folgend, erlaube ich mir den Weg, auf welchem ich zu Herrn Kakeyas Satz gelangte, hier darzulegen und einige Bemerkungen daran anzuknüpfen.

1. Es mögen die Koeffizienten der Funktion (1) reell und positiv sein. Befriedigen nun diese Koeffizienten die Bedingungen

(2) so hat die Gleichung f(x) = 0 keine Wurzel, deren absoluter Betrag kleiner als 1 ist. Bezeichnet nämlich x einen beliebigen komplexen Wert vom absoluten Betrage I x I = e < 1, so folgt aus der identischen Gleichung:

(3)

f(x)(1-x) = a0-(a0-a1) x-(a1-a2) x 2- · • • -(an_ 1-an)x"-anx"+l,

dass

If(x) (1-x) I ~ ao- (ao-a1) e-(a1-a2) e 2 d. i. lf(x) (1- x)

· · · - (an-1-an) en-an en+l,

I ~ f(e)(1- e) > 0

1) Vgl. Abschätzung der Koeffizientensumme einer Potenzreihe, Archiv der Mathematik und Physik, III. Reihe, Bd. 21 (1913), S. 42-50 und S. 250---255. 2) Vgl. On the Iimit!! of the rootl! of an algebraic equation with positive coefficientl!, The Töhoku ?tlathematical Journal, Bd. 2 (1912), S. 140-142.

628

Algebra.

ist. Folglich ist f(x) notwendig von Null verschieden, w. z. b. w. Macht man nur die Voraussetzung, dass f(x) reelle positive Koeffizienten hat, und bezeichnet man mit r den kleinsten, mit s den grössten unter den Quotienten ao al an-1 -,-, ... ,--, a1 a a 2

11

so kann man den vorstehenden Satz auf jede der beiden Funktionen

ao + ralx + r 2 a2x~ + ... + r"a.. xn, s"an + s"- 1 a,._ 1 x + s"- 2 a 2 r + · · · + a0 x"

f(rx) = x11 f(;) =

8 _

anwenden. Dadurch erhält man den Satz von Kakeya: Sind die Koeffizienten der Gleichung (4)

reell und positiv, so gilt für jede Wurzel x dieser Gleichung die Beziehung (5) r ~ I x I ~ s, wobei r den kleinsten und s den grössten unter den Quotienten (6) bezeichnet. 2. Es bietet sich hier die Frage dar, unter welchen Bedingungen in der Beziehung (5) ein Gleichheitszeichen stattfindet. Offenbar genügt es, die folgende speziellere Frage zu erledigen: "Wann besitzt die Gleichung (4) unter der Voraussetzung, dass die Bedingungen (2) erfüllt sind, eine Wurzel vom absoluten Betrage 1?" Bezeichne x eine solche Wurzel. Dann ist nach (3): (7)

a0 = (a 0 - a1) x

+ (a1 -

a 2) x 2 +

··· +

(a11 _ 1 -a11)

X11

+a

11

X11+1.

Nun gilt aber der folgende, leicht zu beweisende Satz: "Sind c1 , c2 , ••• , ck irgendwelche komplexe Zahlen, so ist dann und nur dann, wenn die Zahlen c1 , c2, ... ,ck auf die Form C1 = .Ä.pl,

c2

= Äp2, • .. , .ck = .Ä.pk

gebracht werden können, unter .Ä. eine von Null verschiedene reelle oder komplexe Zahl, unter p 1 , p 2 , ••• , Pk nicht negative reelle Zahlen verstanden." Nach (7) ist nun

I (a0 -

a1)x

+

(~- a2)x 2

+ · · · + a ;X"+ll = 11

a0

629

Über einen Satz des Herrn Ka.keya.

und andererseits, da x den absoluten Betrag 1 hat, auch

!(a0-a1) xl + !(a1 -a2) x 2 !+···+lanxn+ 1 i= (a0 -a1 )+(a1-a2 )+···+an=a0 • Daher muss also (8)

(a0-a1) x=Äp 1 , (a1-a2) x 2=Äp 2, •.• (an_ 1-an) xn=Äpn, anxn+ 1=ÄPn+l

sem. Die Kombination dieser Gleichungen mit (7) ergibt

ao = Ä(pl

+ P2 + ··· + Pn+t),

woraus folgt, dass Ä eine reelle positive Zahl ist. Die Gleichung an xn+l = Äp n+l zeigt nun weiter, dass auch xn+ 1 eine reelle positive Zahl und folglich, da x vom absoluten Betrage 1 ist, xn+l = 1 sein muss. Die niedrigste Potenz von x, welche den Wert 1 besitzt, sei nun xm ; dann sind offenbar sämtliche Potenzen von dieser Eigenschaft. Daher ist n faches von m, also etwa n + 1 = m (m' + 1). Ferner ist jedenfalls m > 1, weil x Gleichung (4) ist. Die Gleichung

(ak-I- ak) xk zeigt jetzt, dass

=

=

+ 1 ein Viel-

1 sicher nicht Wurzel der

Äpk

sein muss, wenn k kein Vielfaches von m ist, weil andernfalls ;ik eine positive reelle Zahl, also gleich 1, wäre. Somit ergibt sich: Sind umgekehrt diese Bedingungen (9) erfüllt, so besitzt auch die Gleichung (4) eine Wurzel vom absoluten Betrage 1. Denn die linke Seite f(x) dieser Gleichung lässt sich dann in. der Form

f(x) = (a0 + amxm + · · · + amm'xmm')(1

+ x + x2 + ... + xm- 1)

schreiben und verschwindet also für jede von 1 verschiedene mte Einheitswurzel. Die Antwort auf die oben aufgeworfene Frage lautet demnach: Die Gleichung

ao +~X+ a2X 2 + · · •+ anxn =

Ü

630

Algebra..

mit reellen positiven Koeffizienten, welche den Bedingungen a0

~a1 ~a2 ~ . . . ~a..

genügen, besitzt stets und nur dann eine Wurzel vom absoluten Betrage 1, wenn die Koeffizienten sich in Gruppen von je m > 1 aufeinanderfolgenden und untereinander gleichen einteilen lassen, so dass also

3. Herr Hayashi hat im Töhoku Mathematical Journal, Bd. 2 (1912), S. 215 den folgenden Satz aufgestellt: Die absoluten Beträge aller komplexen Wurzeln der Gleichung (10)

a0

+ a1 x + a2 x2 + · · · + a

11 _

1

x"- 1 - a,.x"

=

0,

in welcher a0 , a 1 , .•. , a11 _ 1 und a,. reelle positive Werte haben, sind kleiner als der grösste der Quotienten

(11)

Dieser Satz lässt sich aus dem Satze von Kakeya auf die folgende Weise ableiten und dabei noch ein wenig erweitern. Die Gleichung (10) besitzt eine einzige reelle positive Wurzel, welche mit _!._ bezeichnet werde, so dass die linke Seite der Gleichung p den Faktor (1- px) hat. Nach Beseitigung dieses Faktors geht die Gleichung über in (12)

a0

+ (a0 p + a1) x + (a0 p 2 + a1p + a 2) x 2 + · · · + (aopn-1 + a1pn-2 + ... + a,._1)xn-1 =

0.

Dem Satze von Kakeya zufolge sind daher die absoluten Beträge der übrigen (n -1) Wurzeln der Gleichung (10) nicht grösser als der grösste der Quotienten ao aop+a1 aop1 +a1p+a2 (13) a0p+ a1 ' a0 p 1 + a1p+ a2

'

a0 p 3 + a1 p 2 + a2p+ a3 ' ' '

••

Bedeutet aber S den grössten unter den Quotienten (11), so ist

s- aopk-1 + a1pk-l + ... + ak-1 _ -

aopk + a1pk-1 + ... + ak sa.0 pk+ (sa 1 -a0)pk-1 + · .. + (sak-ak_1) aopk + a1pk-l + ... + ak

> 0.

1) Hiernach ist der Ausspruch des ersten Theorems in Herrn Ka.keya's Note: On the zero points of a power series with positive coefficients, The Töhoku Mathema.tical Journal, Bd. 3 (1913), S. 23-24, zu modifizieren. Desgleichen der Satz in Herrn Hayashi's Note: On the roots of an algebra.ic equation, dasselbe Journal, Bd. 3 (1913), S. 112.

Über einen Satz des Herrn Kakeya.

631

Die Quotienten (13) sind also sämtlich kleiner als s und daher auch die absoluten Beträge aller, von der positiven reellen verschiedenen Wurzeln der Gleichung (10). 4. Der Satz von Kakeya gibt eine hinreichende Bedingung dafür, dass die Wurzeln einer algebraischen Gleichung mit reellen Koeffizienten (14) sämtlich ausserhalb des Kreises

I x I= r

(15)

liegen. Es ist aber, auf Grund der Resultate meiner Arbeit!) "Über die Bedingungen, unter welchen eine Gleichung nur Wurzeln mit negativen reellen Teilen besitzt", leicht, die notwendigen und hinreichenden Bedingungen hierfür aufzustellen. Das Äussere des Kreises (15) wird nämlich durch die Substitution x

= r.

1-z 1-1--z

auf die Halbebene der Variablen z abgebildet, in welcher der reelle Teil von z negativ ist. Daher wird die Gleichung (14) dann und nur dann ausschliesslich Wurzeln ausserhalb des Kreises I x I = r besitzen, wenn die Wurzeln der Gleichung

(16) a 0 (1 +z)" + ra 1 (1 + z)"- 1 (1-z) + r 2 a 2 (1 + z)"- 2 (1-z? + ... + r"a,.(1-z)" = 0 sämtlich negative reelle Teile haben. Es genügt daher, die in der erwähnten Arbeit aufgestellten Sätze auf die Gleichung (16) anzuwenden, um die notwendigen und hinreichenden Bedingungen dafür zu erhalten, dass die absoluten Beträge der Wurzeln der Gleichung (14) sämtlich grösser als r sind. Zürich, 31. Juli 1913. 1 ) Mathem. Annalen, Bd. 46 (1895), S. 273-284 [diese Werke, Bd. II, S. 531543]. Vgl. auch L. Orlando, Sul problema di Hurwitz relativo alle parti reali delle radici di un' equazione algebrica, Mathem. Annalen. Bd. 71 (1912), S. 233-245.

LXXXVIII.

Über die algebraische Darstellung der Normgebilde. (Mathematische Annalen, Bd. 79, 1919, S. 313-320.)

In der Abhandlung "Über die Theorie der algebraischen Formen" 1) betrachtet Herr Hilbert als Beispiel für einige seiner grundlegenden algebraischen Sätze unter anderem die durch die Gleichungen (1)

definierte Raumkurve dritter Ordnung, wobei x 0 , x1 , x2 , x3 die homogenen Raumkoordinaten und ; 1 , ; 2 zwei veränderliche Parameter bezeichnen. Wie HerrHilb ert zeigt, wird diese Kurve durch die quadratischen Gleichungen (2)

~ 1 =x0 x2 -xi=O, ~2 =x0 x3 -x 1 x2 =0, ~3 =x 1 x3 -x~=Ü

in dem Sinne vollständig dargestellt, dass die Gleichung jeder die Kurve enthaltenden Fläche in der Gestalt (3)

geschrieben werden kann, unter A 1 , A 2 , A3 Formen von x0 , x1 , x 2 , x3 verstanden. Oder in anderer Ausdrucksweise: "Die Formen F(x0 , x1 , x2 , x3), welche durch die Substitution (1) in identisch verschwindende Formen der Parameter ; 1 , ; 2 übergehen, bilden den durch die Unterdeterminanten zweiten Grades der Matrix

xl, x21 xl, x2, Xa

Xo,

' definierten Modul." In den folgenden Zeilen will ich den entsprechenden Satz für das allgemeinste Normgebilde beweisen. Zunächst habe ich auseinanderzusetzen, was ich unter einem "Normgebilde" verstehe. 1)

Mathem. Annalen, Bd. 36 (1890), S. 473-534.

Über die algebraische Darstellung der Normgebilde.

633

Es seien ~ 1 , ~ 2 , ••• , ~r Parameter, deren Anzahl r grösser als 1 ist. Ich betrachte die Potenzprodukte

(4) dieser Parameter von einem bestimmten Grade

n=

(5)

0(1

+ otz + . . . +

Dtr '

wobei auch der Grad n grösser als 1 vorausgesetzt werden soll. Die Anzahl dieser Potenzprodukte bezeichne ich mit k; sie wird bekanntlich durch den Binomialkoeffizienten k

(6)

= (n+ r-1) = (n+ r-1)! r-1

n!(r-1)!

ausgedrückt: Setzt man nun die k homogenen Koordinaten eines Punktes im Raume von (k -1) Dimensionen proportional den in irgendeine Reihenfolge gebrachten Potenzprodukten (4) der Parameter ~ 1 , ~2 , ••• , ~" so wird durch diesen Ansatz ein algebraisches Gebilde von r -1 Dimensionen in dem betrachteten Raume von k - 1 Dimensionen definiert, welches ich als Normgebilde bezeichnen will. Im Falle r = 2 ist also das Normgebilde nichts anderes, als die durch die Gleichungen X

_ tn 0 - s-1,

X

_ tn-lt 1 - s-1 s-2,

X

_ tn-2t2 X _ tn 2 - "I s-2, · · ., n - s-2

definierte, gewöhnlich als "Normkurve" bezeichnete Kurve- nter Ordnung im Raume von n Dimensionen, die im Falle n = 3 mit der Kurve dritter Ordnung (1) zusammenfällt!). Eine zweckmässige Bezeichnung für die Koordinaten des Normgebildes bietet sich sozusagen von selbst dar. Diejenige Koordinate nämlich, welche dem Potenzprodukt (4) proportional gesetzt wird, wird man passend dadurch bezeichnen, dass man das betreffende Potenzprodukt in eckige Klammern einschliesst, also mit (7)

oder auch, noch kürzer, dadurch, dass man die Exponenten des Potenzproduktes in Klammern setzt, also mit (8)

Die k Gleichungen, welche das Normgebilde von r -1 Dimensionen 1 ) Vgl. W. Fr. Meyer in der Enzyklopädie der mathematischen Wissenschaften, Bd. Il, S. 392, Anmerkung 383a).

634

Algebra.

im Raume von k - 1 Dimensionen definieren, lauten dann also einfach

(9)

[

N

N

N

J_ ta, ta, • • • tar -~1~2 ~r'

""1•""2•••••""r

wobei rx 11 rx 2 , ••• , rxr alle Systeme von r nicht negativen ganzen Zahlen anzunehmen haben, welche der Gleichung rx1 + rx2 + · · · + rxr = n genügen. Ich werde jetzt den hauptsächlichsten in dieser kleinen Arbeit zu beweisenden Satz formulieren. Es mögen die Potenzprodukte des Grades n - 1 der Parameter bedeuten. Dann wird jedes Element der Matrix

~ 1 , ~ 2 , ••• , ~r

[~1 n1J, [~1 n2J, · · ·, [~1nt] [~2n1J, [~2n2J, · · ·, [~2nt]

(10)

mit einer der k Variablen (7) zusammenfallen, weil jedes der Produkte ~inh ein Potenzprodukt nten Grades der Parameter ~ 1 , ~ 2 , ••• , ~r vorstellt. Die Determinanten zweiten Grades dieser Matrix sind also quadratische Formen der k Variablen (7), welche Formen ich in irgendeiner Reihenfolge mit (11)

bezeichnen will. Diese Formen haben die Eigenschaft, identisch zu verschwinden, wenn man jede der k Variablen durch das ihr entsprechende Potenzprodukt der Parameter ~1 , ~2 , ••• , ~r ersetzt, oder, wie ich kurz sagen will, wenn man die Substitution (9) ausführt. Denn es geht z. B. die Form (12)

dabei über in die identisch verschwindende Determinante

I~1n1, $2n1,

~1n21 ~2n2

·

Die quadratischen Flächen

(13)

(/)1

= 0'

(/)2

= 0' ... '

(/)I'

gehen also sämtlich durch das Normgebilde.

= 0

Über die algebraische Darstellung der ~ormgebilde.

635

Der zu beweisende Satz besagt nun, dass die Gleichungen (13) das Normgebilde "vollständig" darstellen. Es gilt mit anderen Worten der Hauptsatz: Diejenigen Formen F der k Variablen (8), welche identisch verschwinden, wenn man in ihnen die Substitution (9) ausführt, bilden den Modul

(14) Den Beweis gründe ich auf die Herstellung eines Restsystems mten Grades des Moduls M. Hierunter ist folgendes zu verstehen. Es bedeute zunächst M einen ganz beliebigen Modul, bestehend aus Formen von irgendeiner Anzahl k von Variablen x1 , x2 , ••• , xk. Unter den Potenzprodukten mten Grades dieser Variablen, wobei m eine positive ganze Zahl bezeichnet, lassen sich dann immer solche, etwa

(15) derart auswählen, dass jedes beliebige Potenzprodukt mten Grades P einer Kongruenz (mod. M)

(16)

genügt, unter c1 , c2 , ••• , eh Konstante verstanden. Denn sicher werden z. B. alle überhaupt existierenden Potenzprodukte mten Grades ein solches System (15) bilden. Wenn nun das System (15) so gewählt ist, dass die Anzahl h seiner Glieder möglichst klein ist, so heisst dasselbe ein "Restsystem mten Grades" des Moduls M. Ein solches Restsystem ist offenbar dadurch charakterisiert, dass seine h Glieder mod. M linear unabhängig sind, während sie mit jedem weiteren Potenzprodukte mten Grades zusammen ein abhängiges System bilden. Dabei ist noch zu bemerken, dass in dem speziellen Falle, wo jedes Potenzprodukt mten 0 (mod. M) sein sollte, h = 0 zu setzen ist. Das Restsystem Grades enthält dann überhaupt kein Glied, es ist ein "leeres" System. Die Anzahl h ist nur vom Modul M und von m abhängig und die Funktion h = x(m) ist mit der Hil bert'schen charakteristischen Funktion des Moduls identisch 1). Ich wende mich nun zur Betrachtung des speziellen Moduls (14). Es se1

=

ein Potenzprodukt mten Grades der Variablen (8), so dass also auf der 1 ) Hilbert; a. a. 0. S. 509. Die charakteristische Funktion heisst "Hilbert'sche Funktion" des Moduls M nach E. Lasker. Vgl. dessen inhaltsreiche Abhandlung "Zur Theorie der Moduln und Ideale", Mathem. Annalen, Bd. 60 (1905), S. 20-116.

636

Algebra.

rechten Seite von '(17) m der Variablen zu einem Produkte vereinigt sind. Im Falle m = 1 fällt P mit einer einzelnen der Variablen (8) zusammen; im Falle m > 1 brauchen natürlich die m Variablen, die die Faktoren von P bilden, nicht alle voneinander verschieden zu sein. Durch die Substitution (9) geht P über in

{18) also m em Potenzprodukt vom Grade

der Parameter E1 , E2 , ••• , Er· Das Potenzprodukt II heisse das dem Potenzprodukt P "entsprechende". Zunächst beweise ich jetzt den Hilfssatz: Man kann das Potenzprodukt P mten Grades der Variablen (8) so wählen, dass das ·ihm entsprechende Potenzprodukt II der Parameter E1 , E2 , ••• , Er mit einem beliebig vorgeschriebenen (20) vom Grade

(21)

Jl1

+ Jl2 + · · · + Jlr =

m·n

zusammenfällt. Der Beweis geschieht auf induktivem Wege. Im Falle m = 1 ist klar, dass der Hilfssatz richtig ist. Denn dann genügt es offenbar, P = [Jl 1, Jl 2, ••• , Jlr] zu wählen. Ist aber m > 1, so erhellt die Richtigkeit des Satzes, unter der Voraussetzung, dass er für den Fall, wo m - 1 an die Stelle von m tritt, schon bewiesen sei, durch folgende Überlegungen. Es sei das Potenzprodukt (20) vorgesch~ben, und in der Reihe

+···+

+ Jl2 , Jl1 + Jl2 + Jla, • • • , Jl1 + Jl2 Jlt + Jl 2 + · · · + Jlh das erste Glied, welches Jl1 ' Jl1

sei die durch die Gleichung

n = Jl1

+ Jl2 + · · · + Jlh -

~

Jlr = m · n

n ist. Dann wird

v

definierte Zahl v nicht negativ sein, während Jl'll - v positiv ist, weil andernfalls schon Jlt + Jl 2 + ··· + Jlh-l = n- (Jl",- v) ~ n wäre. Man kann daher II in der Form schreiben

wo II ein Potenzprodukt vom Grade (m - 1) n bezeichnet.

Über die algebraische Darstellung der Normgebilde.

637

Wenn nun Pein Potenzprodukt (m-l)ten Grades der Variablen (8) ist, dem das Potenzprodukt l1 der Parameter ~ 1 , ~2 , ••• , ; entspricht, so wird offenbar dem Potenzprodukt mten Grades

p

=

[,ul, .U2• ... , .U11- v, 0, 0, ... , 0]. p

das Potenzprodukt II entsprechen. Der Hilfssatz gilt somit allgemein. Ich wähle nun die Potenzprodukte mten Grades

(22) der Variablen (8) so, dass die ihnen bezüglich entsprechenden Potenzprodukte

(23) der Parameter ~ 1 , ~ 2 , ... , ~r gerade die sämtlichen verschiedenen Potenzprodukte vom Grade mn dieser Parameter ausmachen, was nach dem eben bewiesenen Hilfssatze möglich ist. Die Anzahl h wird den Wert h=(mn+r-1)

(24)

r-1

besitzen. Nun gilt der folgende Satz I: Die Potenzprodukte (22) bilden ein Restsystem mten Grades für den Modul (14). Dass diese Potenzprodukte mod. M linear unabhängig sind, ergibt sich leicht. Denn da die Formen des Moduls M durch die Substitution (9) identisch verschwinden, so folgt aus der Kongruenz c1 P 1

+ c2 P 2 + · · · + c"P" =0

(mod. M)

durch Ausführung der Substitution (9) und daher

c1Il1

+ c2II2 + · · · + c"II" =

0

weil die untereinander verschiedenen Potenzprodukte JI1 , II2 , ••• , II11 der Parameter ~ 1 , ~ 2 , ••• , ~r linear unabhängig sind. Es bleibt zu zeigen, dass jedes Potenzprodukt mten Grades P mit den Potenzprodukten (22) zusammen mod. M ein abhängiges System bildet. Dies ergibt sich aber unmittelbar aus dem nunmehr zu beweisenden Satz II: Zwei Potenzprodukte P und P' der Variablen (8) sind mod. M kongruent, wenn die .ihnen entsprechenden Potenzprodukte II und II' zusammenfallen.

638

Algebra.

Denn nach diesem Satze wird jedes beliebig gewählte Potenzprodukt P, dessen entsprechendes Potenzprodukt II = Ili sei, einem der Potenzprodukte (22), nämlich dem Pi, nach dem Modul M kongruent sein. Der Beweis des Satzes II erfolgt nun wieder durch Induktion. Im Falle m = 1 ist der Satz offenbar richtig. Denn dann ist etwa P =

P = [ IX1' IX2' •.. ' IX,] '

I

[

I

I]

I

IX1, IX2, ... ' IX, '

und wenn nun die entsprechenden Potenzprodukte

II = ~N~· ... ~;·, Il

1

= ~~·' ;~·' ... ~;r'

zusammenfallen, so ist IX1

1

I

I

= IX1• IX2 = IX2 • · · ·' IX, = IX,,

=

so dass P mit P identisch wird, also umsomehr P P (mod. M) ist. Sei nun m > 1 , und es werde vorausgesetzt, dass die Richtigkeit des Satzes II für den Fall, wo m -1 an die Stelle von m tritt, schon bewiesen sei. Von den beiden Potenzprodukten mten Grades 1

(25)

{ P = [IX1' IX2' · · ·' IX,] [ßl' ß2' · · ·' ß,] P = [IX~, IX~, ... , IX~] [ß~, ß~, · · · , ß;] 1

1

· · · [/.1' ;.2 • · · ·' !.,] • · · · [;.~, ;.~' · · · ' t.;]

wird also jetzt angenommen, dass die ihnen entsprechenden Potenzprodukte ••• 1 e• • 1 ~ß, II = ~a, r• 2 •.• er r 2 •.. ~Pr r 2 ••. ~ar 1 ~a, ~J.,' • •• er' ~a,' • .• ~ar'. ;Pt' ~ß,' . .• ~ßr' . •. IJI = ~a,' r 12 r 12 r 12

e•

e• e•'

zusammenfallen, d. h. dass

(26) IXi + ßi + • · · + /.i = IX~ + ß~ + • · • + /.~ sei. Ersetzt man in P das Produkt

(für i = 1, 2, ... , r)

(27) durch (28) [ IX1, ... , IXh + 1, ... , IXk- 1, ... , 1Xr] [ß1, ... , ßh- 1, ... , ßk + 1, ... , ß,], unter h und k zwei verschiedene Indices der Reihe 1, 2, ... , r verstanden, so geht hierdurch P in ein neues zu P (mod. M) kongruentes Produkt (29) Q = [1X1, ... , 1Xh+1, ... , IXk-1, ... , 1Xr][ß1, ... , ßh-1, .. [/.1, ;.2, ... '!.,]

... , ßk+1, ... , ß,] · ·

Über die algebraische Darstellung der Normgebilde.

639

über. Denn die Differenz von (27) und (28) ist eine Determinante der Matrix (10) und gehört also dem Modul M an. Hierbei ist indessen cxk > 0 und P 11 > 0 vorauszusetzen, weil die in (28) auftretenden Zahlen cxk -1 und P 11 -1 nicht negativ sein müssen. Es seien nun die beiden ersten Faktoren von P und P' etwa an der hten Stelle verschieden, d. h. es sei in der Reihe

cx1 - cx1 , cx2 - oc 2 , I

(30)

I

••• ,

cx,.- cx11 , I

••• ,

cx,- oc, I

das Glied oc~ - oc11 (h < r) das erste, welches nicht verschwindet, und zwar möge sein, was angenommen werden darf, weil man anderfalls P und P' m dieser ganzen Betrachtung miteinander vertauschen könnte. Einerseits folgt nun aus oc1 = oc~, oc 2 = oc~, ... , oc11 _ 1 = oc~_ 1 und dass

(31)

n

= oc~ + oc~ + • • • +oc; = oc1 + oc2 + • • • + oc,,

Ot~ + Ot~+l + • • • + oc;

= oc11 + oc11 +1 + • • • + oc,

ist; andererseits ist nach (26) (32)

Aus den letzten beiden Gleichungen geht aber hervor, dass weder die sämtlichEm Zahlen oc11 +1, ••• , oc11 , noch die sämtlichen Zahlen P11 , ••• , Ä11 verschwinden können, weil solches oc~ ~ cx11 nach sich ziehen würde. Da die Faktoren von P noch beliebig angeordnet werden können, darf man annehmen, es sei P11 > 0. Ferner sei etwa ock > 0, wo k > h ist. Lässt man nun an Stelle von P das kongruente Potenzprodukt Q (vgl. (29)) treten, so tritt an die Stelle der Reihe (30) die neue Reihe Ot~- ot1 = 0' ()(~- Ot2 = 0' ... ' ()(~- cx,. -1' ....

Ist hier die Zahl oc~-oc11 -1 noch positiv, so kann man das Verfahren wiederholen und so lange fortsetzen, bis an die Stelle von P ein kongruentes Potenzprodukt getreten ist, dessen erster Faktor bis zur hten Stelle inklusive mit dem ersten Faktor von P' übereinstimmt. Es ist klar, dass man durch genügende Wiederholung dieses Verfahrens dahin gelangt, P und P' durch zwei ihnen bzw. kongruente Potenzprodukte von der Gestalt Q = liiv liz, ... , Ci,]P, Q'= [iiv «s, · · ., iX,]P'

Algebra.

640

zu ersetzen, die im ersten Faktor vollig übereinstimmen. Da nun P und P' vom (m -1)ten Grade sind, so kann auf diese Produkte der zu beweisende Satz angewandt werden. Es ist somit P = P', folglich auch Q Q' und schliesslich

=

=

P' (mod. M), P was zu zeigen war. Aus dem nunmehr bewiesenen Satz I folgt jetzt der auf Seite 635 ausgesprochene Hauptsatz unmittelbar. Für jede beliebige Form F der Variablen (8) vom mten Grade gilt nämlich eine Kongruenz der Gestalt F

(33)

=c P 1

1

+ c2 Pa + · · · + c~oP11

(mod. M),

d. h. eine Gleichung der Form F = c1 P 1

+ c2 P 2 + · · · + c11P11 + A 1 f/J1 + · · · + A~< f/J~'.

M~cht man hierin die Substitution (9) und setzt man überdies voraus, dass hierbei F identisch verscliwindet, so kommt

0 = c1 Il1

folglich c1 = c2 = · · · =

C~o

F

+ c2 Il2 + · · · + c11 Il11,

= 0 und nach (33)

=0

(mod. M),

womit der Hauptsatz bewiesen ist. Aus Formel (24) folgt beiläufig noch das Resultat: "Die Hilbert'sche Funktion des Moduls M des Normgebildes wird durch den Binomialkoeffizienten

x(m) dargestellt. Zürich, September 1918.

=

(mn+r-1) r-1

LXXXIX.

Ober die Komposition der quadratischen Formen1). (Mathematische Annalen, Bd. 88, 1923, S. 1-25.) [[Nach dem Tode von A. Hurwitz veröffentlicht.]]

In den Nachrichten der k. Gesellschaft der Wissenschaften zu Göttingen vom Jahre 1898, S. 309-316 [diese Werke, Bd. II, S. 365 -571] habe ich die folgende Aufgabe behandelt: Es seien (jJ, tp, x gegebene quadratische Formen von je n Variablen. Die Determinanten der drei Formen seien von Null verschieden. Man soll nun die Gleichung (1)

(jJ(X1, X2, · · ., x..) · tp(Yl• Y2• · · ., y..)

=

x(zl, Z2, · · ., z..)

auf die allgemeinste Weise dadurch befriedigen, dass man z1 , z2 , durch geeignete bilineare Formen der beiden Variablensysteme

••• ,

z..

xl' x2' ... ' x.. und Yl' Y2' ... ' Yn ersetzt. Mit anderen Worten: Es sollen alle Systeme von n 3 Konstanten

c a{J

(oc,ß,i=1,2, ... ,n)

bestimmt werden von der Eigenschaft, dass die Gleichung (1) durch die Substitution (i=1,2, ... ,n) in eine Identität, d.h. eine für alle Werte der 2n Variablen x 10 x2 , Y1, Y2, .•. , Yn gültige Gleichung übergeht.

••• ,

x .. ,

1) Die vorliegende Arbeit fand sich unter den nachgelassenen Manuskripten von A. Hurwitz und ist hier, abgesehen von der Korrektur einiger unbedeutender Schreibfehler, ungeändert abgedruckt. Die genaue Prüfung der Arbeit verdanken wir Herrn L. E. Dickson in Chica.go, ebenso wie einige Bemerkungen, die hier in deutscher ÜberDie Redaktion der Mathem. Annalen. setzung als Fussnoten abgedruckt sind. 41

642

Algebra.

Da die quadratischen Formen durch lineare Transformation auf Summen von Quadraten gebracht werden können, kommt diese Aufgabe sofort auf die folgende zurück: Man soll die Gleichung (2)

(xi + x~ + · · · + x!) (yi + y~ + · · · + y~) · zi + z~ + · · · + z~

auf die allgemeinste Weise dadurch befriedigen, dass man z1 , z2 , durch geeignete bilineare Formen der beiden Variablensysteme

••• ,

z,.

xl' Xz' ... ' x,. und Yt Yz' ... ' y,. ersetzt. Spezielle Lösungen dieser Aufgabe bilden die bekannten Gleichungen:

(xi + x~) (yi + Y~) = (xtYt + XzYz) 2 + (XtYz- XzYt) 2 (xi +X~+ X~+ x;) (yi + Y~ + y; + y;) = (X1Y1 + XzYz + XsYs + X4Y4) 2 + (x1Y2- XzYt + XsY4- X4Ys) 2 + (XtYs- XzY4- XsYt + X4Yz) 2 + (XtY4 + XzYs- XaYz- X4Yt) 2 und eine analoge Gleichung, welche das Produkt aus den Summen der Quadrate von je acht Variablen als Summe von acht Quadraten bilinearer Formen jener Variablen darstellt. A. a. 0. habe ich bewiesen, dass die Gleichung (2) - abgesehen von dem trivialen Falle n = 1 - nur in den Fällen

n=2,4,8 befriedigt werden kann. Ich fügte ohne Beweis hinzu, dass in diesen Fällen ausser den soeben erwähnten speziellen Lösungen im wesentlichen keine weiteren existieren 1). Neuerdings habe ich nun gefunden, dass sich die Gleichung (2) auf noch einfacherem und zugleich weiterführendem Wege behandeln lässt. Diesen Weg will ich im folgenden darlegen und dabei sogleich von der nachstehenden allgemeinen Aufgabe ausgehen : Man soll auf die allgemeinste Weise z1 , z2 , ••• , z,. als bilineare Formen der beiden Variablensysteme

X1, Xz, · · · , Xfl und Yt' Yz' · · ·, Yn so bestimmen, dass die identische Gleichung 1 ) Einen Beweis hierfür, der sich im Ideengang meiner Arbeit aus dem Jahre 1898 anschliesst, hat Herr E. Ro bert in seiner demnächst erscheinenden Dissertation ausgearbeitet. (E. Ro bert, Composition des formes quadratiques de quatre et de huit variables independantes, Zürich 1912.)

643

Komposition quadratischer Formen.

(3) (x~ + x~ + · · · + x;) (yi + y~ + · · · + y~) = zi + z~ + · · · + z! besteht. Dabei bezeichnen n und p zwei gegebene positive ganze Zahlen. Man bemerkt leicht, dass unsere Aufgabe sicher nur dann Lösungen zulassen kann, wenn n ~p ist. Denn setzt man y1 =1, y 2 =y3 =···~Yn=0, so folgt aus (3) 2

x1

+ x2 + · · · + xP2 = z-2 + z-2 + · · · + z;, -9

2

1

2

wo zl' z2' ... ' Zn lineare Formen von xl' x2' ... ' Xp bedeuten. Da aber xi + x~ + · · · + sich nicht als quadratische Form von weniger als p linearen Verbindungen der Variablen x10 x 2, ... , x 11 darstellen lässt (weil die Determinante der Form x~ + x~ + · · · + x; den von Null verschiedenen Wert 1 besitzt), so muss n mindestens gleich p sein. Den trivialen Fall p = 1 lasse ich beiseite und setze also

x;

(4) voraus. I. Zunächst will ich einige Bezeichnungen und Sätze aus der Lehre von den Matrizen zusammenstellen, deren ich mich weiterhin bedienen werde. Eine Matrix ist bekanntlich ein System von n · m Zahlen, die in ein rechteckiges Schema von n Horizontal- und m Vertikalreihen angeordnet sind. Ist (1)

A=

all, ai2• • • ·' alm f a2I• a22• • • ., a2m

la~1·, ~n~:. :.·, ~n~

d

o er

(

)

aik

(i=1,2, ... ,n; k=l,2, ... ,m) eine solche Matrix, so nenne ich n ihre Horizontal-, m ihre Vertikalordnung. Die Zahlen aik heissen die Elemente der Matrix A. Im Falle n = m ist A eine quadratische Matrix und n heisst ihre Ordnung schlechthin. Es versteht sich danach von selbst, dass, wenn von einer Matrix von der Ordnung n die Rede ist, eine quadratische Matrix von n Horizontal- und n Vertikalreihen gemeint ist. Sind alle Elemente einer Matrix gleich Null, so wird die Matrix selbst mit 0 bezeichnet. Es muss dann aber, falls solches nicht aus dem Zusammenhang von selbst hervorgeht, hinzugefügt werden, wie gross die Anzahl n der Horizontal- und die Anzahl m der Vertikalreihen der Matrix ist.

644

Algebra.

Eine quadratische Matrix von der Ordnung n, deren Diagonalelemente aii sämtlich den nämlichen. Wert a besitzen, während alle übrigen Elemente Null sind, bezeichne ich mit

a". Der Index n darf fortgelassen werden, wenn kein Zweifel über die Ordnung der "Matrix a" bestehen kann. In der Theorie der Matrizen betrachtet man bekanntlich folgende Operationen: 1. Multiplikation einer Matrix A mit einer Zahl a. Bezeichnet A die Matrix (1), so versteht man unter aA die Matrix

= 1 , 2 , ... , n;

(i

a · A = ( a aik)

k

= 1 , 2, ... , m) .

Statt (-1) · A wird kürzer - A geschrieben. 2. Addition der Matrizen. Bezeichnet A die Matrix (1) und B die Matrix

(2) so versteht

B man~

=

(b,k)

falls

n' ist, unter A

(3)

= 1 , 2, ... , n';

(i

k

= 1 , 2, ... , m') ,

k

= 1, 2, ... , m).

= n, m' = m

+ B die Matrix A + B = (au + bik)

(i

= 1, 2, ... , n;

Addieren lassen sich hiernach nur Matrizen mit den nämlichen Ordnungen. Die Subtraktion kann durch die Festsetzung

A-B=A

+ (-B)

definiert werden. 3. Multiplikation der Matrizen. Falls die Matrix B ebenso viele Horizontalreihen hat wie A Vertikalreihen, falls also n' = m ist, versteht man unter dem Produkte AB der beiden Matrizen die Matrix (4)

AB= (cik) (i

= 1, 2, ... , n;

k

= 1, 2, ... , m'),

deren Elemente durch die Gleichung (5)

bestimmt sind. An die hierdurch gegebene Definition der Multiplikation der Matrizen knüpft sich folgende Betrachtung. Man ordne der Matrix A zu die lineare Substitution

Komposition quadratischer Formen.

645

(6) wobei x1 , x2 , ••• , Xn. y1 , y 2 , ••• , Ym Variable bedeuten. Wenn nun aus diesen Variablen die Matrizen (7)

mit den Ordnungen n, 1 bez. m, 1 gebildet werden, so sind die Gleichungen (6) gleichbedeutend mit der einen Gleichung

(8)

X=

Ay.

In entsprechender Weise kann die der Matrix B entsprechende lineare Substitution durch die Gleichung

(9)

y= Bz

dargestellt werden, wo z die aus m' Variablen z1 , z2 , Matrix

••• ,

zm' gebildete

(10)

bedeutet. Die Gleichungen (5) besagen nun, dass durch Elimination der Variablen y1 , y 2 , ••• , Ym aus den Gleichungen (8) und (9) (11)

x

=

(AB)z,

also die zur Produktmatrix AB gehörende Substitution folgt. Bezeichnet C eine Matrix, deren Horizontalordnung gleich ist der Vertikalordnung von B, und ist (12)

z = Ct

die (8) und (9) analoge Darstellung der zu der Matrix C gehörenden Substitution, so ergibt die Elimination der Variablen y und z aus (8), (9) und (12) sofort X= (AB)Ct = A(BC)t und daher

(13)

(AB)C

=

A(BC).

D.h. die Multiplikation der Matrizen unterliegt dem assoziativen Gesetzes.

Algebra.

646

Dass für die Addition und Multiplikation der Matrizen das distributive Gesetz gilt, dass also (A

+ C)(B + D) =AB+ AD +OB+ CD

ist, folgt sofort aus der Tatsache, dass die Elemente der Produktmatrix nach (5) linear und homogen in den Elementen der Faktorenmatrizen sind. 4. Übergang von einer Matrix zu ihrer konjugierten. Vertauscht man in einer Matrix A die Horizontal- mit den Vertikalreihen, so entsteht eine neue Matrix, welche die konjugierte von A heisst und durch Anhängung eines Akzentes, also mit A', bezeichnet wird. Es ist demnach

an '

a21 ' • • • '

anl

A' = [ ~1~•. a~2: ~ . ." '. a~2.

(14)

alm• a2m• ... ' an, m

oder (15)

A'

= (a;k) (a;k = aw i = 1, 2, ... , m; k = 1, 2, ... , n).

Man überzeugt sich leicht, dass folgende Gesetze gelten:

(16)

(aA)' = aA', (A

+ B)' =

A'

+ B',

(AB)'= B' A'.

Für manche Untersuchungen ist es sehr bequem, eine Darstellung der Matrizen zu verwenden, bei welcher die Elemente selbst Matrizen sind. Die einfachsten Fälle einer solchen Darstellung finden sich schon in der grundlegenden Abhandlung von Laguerre 1). Allgemein ist sie im Anschluss an eine von mir gehaltene Vorlesung von Herrn H. Kreis in seiner Dissertation 2) dargelegt worden. Betrachtet man zwei Matrizen mit derselben Horizontalordnung n und den Vertikalordnungen m und m' A

=~an,

alml

a12, • • ., .......... ' an2• ... ' anm

anl'

so entsteht dadurch, dass man B neben A stellt, die Matrix

von der Horizontalordnung n und der Vertikalordnung m

+ m'.

Allge-

1 ) Sur le calcul des systemes lineaires, Journal de l'Ecole polyteclmique, 4~ cahier (1867), p. 215-264 [Oeuvres, vol. I, p. 221-267]. 2 ) H. Kreis, Contribution a Ia theoriedes systemes lineaires, Zürich 1906.

Komposition quadratischer Formen.

647

meiner erhält man aus beliebig vielen Matrizen A ,B, ... , L von der nämlichen Horizontalordnung n und den bez. Vertikalordnungen m, m', ... , m durch Nebeneinanderstellen die Matrix (A, B, ... , L) von der Horizontalordnung n und der Vertikalordnung m + m' + ·· ·+ m. In entsprechenderWeise kann man Matrizen mit derselben Vertikalordnung m und den bez. Horizontalordnungen n, n', ... , n untereinanderstellen und dadurch eine neue Matrix mit der Vertikalordnung m und der Horizontalordnung n + n' + · · · + n bilden. Liegen nun r · s Matrizen Ai,k (i=1,2, ... ,r;k=1,2, ... ,s) vor, so beschaffen, dass die Matrizen mit demselben ersten Index i dieselbe Horizontalordnung n; und die Matrizen mit demselben zweiten Index k dieselbe Vertikalordnung mk besitzen, so erhält man durch Nebeneinanderstellen die r Matrizen

(i=1,2, ... ,r). Stellt man weiter diese r Matrizen untereinander, so entsteht eine Matrix, welche durch Au, A12· ··.,Als)

(17)

A=

(

·:

~~1~ ~2~·--: ~2~

Arl' Ar2' · · ., ATI (i=1,2, ... ,r; k=1,2, ... ,s) bezeichnet werde. Diese Matrix A hat die Horizontalordnung n 1 + n 2 + · · · + nr und die Vertikalordnung m1 + m 2 + · · · + m •• Die ursprüngliche Darstellung (1) der Matrizen, bei welcher die Elemente a;" Zahlen sind, ist ein spezieller Fall der Darstellung (17). Wenn nämlich die Matrizen A;k sämtlich die Horizontalordnung 1 und die Vertikalordnung 1 besitzen, so sind diese Matrizen nichts anderes als Zahlen. Der Hauptsatz, welcher sich an die verallgemeinerte Darstellung (17) der Matrizen anknüpft, ist dieser: Es sei

(18)

eine Matrix, deren Element B;k eine Matrix von der Horizontalordnung m; und der Vertikalordnung lk ist. Dann ist

648

Algebra..

(19)

AB

wobei die Matrix (20)

Oilc

0,"

on, 012· ••. , ol!) ( = ~~v. ~22: ~2~ : ·. ·:

,

o,1 , or2, .. ., o,t

durch die Gleichung

= AnBlk + Ai2B2lc + ... + AiBB," (i=1,2, ... ,r; k=1,2, ... ,t)

gegeben ist. Mit anderen Worten: die Multiplikation der Matrizen (17) und (18) vollzieht sich gerade so, als ob die Elemente Atk und Bik Zahlen wären. Der Beweis für diese Tatsache wird am einfachsten so geführt: Es seien

x, • • • , x,

y(1)'

y(2)' • • • ' y(B)'

z ' z' • • • ' z Matrizen von der Art der Matrizen (7). Und zwar sei die Matrix x mit ni Variablen, die Matrix y mit mi Variablen, die Matrix z mit li Variablen gebildet. Dann lässt sich die der Matrix A entsprechende lineare Substitution durch die Gleichungen (21)

- A ilY x

+ A i2Y + · . · + A iBY

(.~- 1 • 2 , ... ,r)

+ Bi 2z+ · · · + Biez

(i = 1, 2, ... , s)

darstellen, welche die in den Matrizen x enthaltenen n 1 + n 2 + ··· + n, Variablen als lineare homogene Funktionen der in den Matrizen y enthaltenen m1 + m2 + · · · + m, Variablen ausdrücken. In entsprechender Weise wird die zur Matrix B gehörende lineare Substitution durch die Gleichungen (22)

y = Buz(l>

dargestellt. Ersetzt man nun in den Gleichungen (21) die Matrizen y + ••• + 0 uz 2

(t)

1 2 , ••• ,r, ).

(. ~-,

wobei Oik durch (20) gegeben ist. Da nun das Gleichungssystem (23) die der Matrix AB entsprechende lineare Substitution darstellt, so ist hiermit der Beweis des obigen Satzes erbracht. Falls unter den Elementen der Matrix (17) Nullmatrizen vor~ kommen, so werden diese zur Vereinfachung der Notierung fortgelassen. So bedeutet z. B.

(24)

11

D~ ( D

D.,_ .. D" )

Komposition quadratischer Formen.

649

eine Matrix, für welche alle ausserhalb der Diagonale stehenden Elemente Nullmatrizen sind. Die Bildung des Produktes DA vollzieht sich nach dem obigen dadurch, dass die Horizontalreihen von A der Reihe nach linksseitig mit D 11 , D 22 , ••• , D,, multipliziert werden, d. h. es ist (25)

Analoges gilt für die rechtsseitige Multiplikation einer beliebigen Matrix mit einer solchen "Diagonalmatrix" D. Schliesslich ist noch zu bemerken, dass die konjugierte der Matrix (17) offenbt').r durch (26)

vorgestellt wird, wobei allgemein A;k die konjugierte der Matrix Aik bezeichnet. Die Horizontalreihen der als Zahlenmatrix (d. h. in der ursprünglichen Gestalt (1)) geschriebenen Matrix (17) stimmen nämlich mit den Vertikalreihen der als Zahlenmatrix geschriebenen Matrix (26) überein.

II. Die bilinearen Formen a1 , a2 , ••• , handelt, setze ich in die Form

a.. , um deren Bestimmung es sich

(1)

wobei die Koeffizienten a1t lineare homogene Funktionen der Variablen x1 , x 2 , ••• , x» bedeuten. Damit nun die identische Gleichung (2)

ai+ ~+ ... + a~= (xi+ :4+ ... + x!)(Yi+ y~+ ... + ~)

bestehe 1), ist erforderlich und hinreichend, dass 1) [Einige dem Manuskript nachtriglich zugefügte Formeln von H urwi tz besagen folgendes: für das Bestehen der Identität

3i

+ .. · + 3~ =

(xj

+ .. · + x~)(yf + .. · + y~) + ··· + ai~Ya

3; = ailYl

haben wir die Bedingungen (3), worin jetzt i, k = 1, 2, ... , q. Die Bedingungen sill:d'

650

(3)

Algebra. alilltk

+ ~ia2k + · · · + aniank =

x~ + xi +

· · · + x;

oder = 0

sei, je nachdem i = k oder i :j: k ist. Die Gleichungen (3) besagen aber nichts anderes, als dass die Matrix

l

au, llt2• · · ., alnl

(4)

~21.' ~2~• •• : ·: ~2.n

A=

anl' an2• ••• ' ann

der Bedingung (5)

A' A = (x~

+

xi

+ · · · + x!)

genügen muss. Die rechte Seite der Gleichung (5) bedeutet dabei diejenige Matrix n-ter Ordnung, deren Diagonalelemente sämtlich gleich ~ + xi + · · · + sind, während alle übrigen Elemente verschwinden. Da die Elemente der Matrix A lineare homogene Funktionen der Variablen x1 , x 2 , ••• , x 21 sind, so lässt sich .A. auf die Form

x;

(6)

bringen, wobei A1 , A2 , ••• , A, Matrizen mit konstanten Elementen bezeichnen. Hierdurch geht (5) über in (7)

(x1 A~

+ x2 A~ + · · · + xPA~)(x1 A 1 + x2 A 2 + · · · + xPAP) =

+ xi + · · · + x;).

(x~

Führt man die Multiplikation aus, so erkennt man, dass unsere Aufgabe auf die folgende zurückkommt: Man soll alle Systeme von p Matrizen n-ter Ordnung

(8) bestimmen, welche den Gleichungen {9)

A~A 11 = 1,

A~AJ:

+ A~A 11 = 0

(h, k = 1, 2, ... , p; h :j: k)

genügen. Setzt man nun, unter i die imaginäre Einheit verstanden, (10)

A1

=

iAPB1 , A 2

=

iAPB2 ,

•• • ,

Ap-t

=

iAPBP_1 ,

gesetzt, äquivalent mit (5), worin jetzt die rechte Seite als eine Matrix q-ter Ordnung aufzufassen ist. Daraus ergibt sich (9), worin die A 1" ebenso wie A, als Matrizen von Horizontalordnung n und Vertikalordnung q aufzufassen sind. (Aber die Überlegung von (10) an gilt nur für den Fall q = n.) L. E. D.]

Komposition quadratischer Formen.

651

so gehen die Bedingungsgleichungen (9) nach leichten Umformungen in folgende über:

(11) A~AP = 1, B~Bh = -1, B~ + Bh = 0, B~Bk + B~Bh = 0 (h' k = 1' 2' ... ' p- 1; h :j: k). Die auf die Matrizen B bezüglichen Gleichungen lassen sich durch folgende ersetzen:

(12)

B~ =-BA>

B~ =

+ 1,

BhBk = -BkBh.

Wenn umgekehrt B 1 , B2 , ••• , B"_1 den Bedingungen (12) genügen, und A" der Bedingung A~AP = 1, welche aussagt, dass A" eine orthogonale Matrix sein soll, so werden die Matrizen (10) die Bedingungen (9) befriedigen. Es genügt demnach, folgende Aufgabe zu lösen: Man soll alle Systeme von p -1 Matrizen n-ter Ordnung

(13) bestimmen, welche schiefsymmetrisch sind (d.h. den Bedingungen B~ = -Bh genügen) und überdies die Gleichungen

(14)

Bi=1,

BhBk=-BkBh

(h,k=1,2, ... ,p-l;h=!=k)

befriedigen.

III. Zunächst sehe ich von den Bedingungen B~ = -Bh ab und betrachte also die Systeme

(1) von p -1 Matrizen nter Ordnung, welche den Gleichungen (14) der vorigen Nummer genügen. Bezeichnet T irgendeine Matrix nter Ordnung von nicht verschwindender Determinante, so wird gleichzeitig mit 1: auch das zu 1: "ähnliche" System

den Gleichungen II, (14) genügen. Zwei Lösungen dieser Gleichungen, wie 1: und T .ET- 1, die einander ähnlich sind, sollen als nicht wesentlich verschieden angesehen odar auch als "äquivalent" bezeichnet werden. Demnach kann man in einem Lösungssystem (1) an die Stelle einer der Matrizen Bh irgendeine ihr ähnliche treten lassen, d. h. sie durch eine beliebige Matrix T transformieren. Denn wenn nur die übrigen

652

Algebra.

Matrizen durch dieselbe Matrix T transformiert werden, bleibt das Lösungssystem nach der getroffenen Festsetzung wesentlich ungeändert. Die Matrix B1 ist nun, da sie der Gleichung Bi = 1 genügt, bekanntlich ähnlich einer Diagonal-Matrix, deren Diagonalglieder emen der Werte + 1 und -1 besitzen, .also einer Matrix der Gestalt

Da aber B 2 B 1 B2 1 = -B1 , also B 1 ähnlich zu - B 1 ist, so geht das System der charakteristischen Wurzeln von B 1 durch Vorzeichenänderung aller Wurzeln in sich über. Daher muss r = n- r, d. h. n = 2 r eine gerade Zahl sein und man darf. also in dem System (1)

{3) voraussetzen, wobei die Elemente von B 1 Matrizen von der Ordnung

r = ~ bedeuten. Sei nun {4) irgendeine Matrix

B = nter

(:!)

Ordnung, unter a, b, c, d Matrizen der Ordnung

; verstanden. Es ist dann

B1 B

= (-~: -~), BB1 = (~: =~)·

Hieraus ersieht man: Die allgemeinste Lösung B der Gleichung

{5) lautet (6)

und die allgemeinste Lösung B der Gleichung (7) lautet (8)

Für die letztere Matrix ergibt sich

653

Komposition quadratischer Formen.

Soll daher die Matrix (8) der Bedingung B 2 = 1 genügen, so hat sie die Gestalt (8')

Insbesondere werden also die Matrizen B2 , B3 , Gestalt besitzen. Ist nun etwa

••• ,

Bfl_1 diese

so geht B 2 durch Transformation mit

T=

(\j

m

T B 2 T- 1

= (1 1)

über, während die Matrix (3) durch Transformation mit Tin sich übergeht. Demnach darf man in dem Systeme E

(9) voraussetzen, während

(h=3,4, ... ,p-1) ist. Die Gleichung ergibt

b;;1 = - b",

oder

bi = -1.

Setzt man b" =iCh, so kommt

(10)

(h=3,4, ... ,p-1)

und (11)

(h :f k)'

welch' letztere Gleichungen aus Bh Bk = -Bk Bh folgen. Es gilt also der Satz: Betrachtet man ähnliche Systeme als nicht wesentlich verschieden, so lautet das allgemeinste System

(12)

Algebra.

654

von p-1 Matrizen nter Ordnung, welche den Gleichungen II, (14) genügen:

(13) wobei (14) das allgemeinste System von p- 3 Matrizen der Ordnung ; bedeutet, welche den Gleichungen

genügen. Diese Gleichungen besitzen dieselbe Gestalt, wie die Gleichungen II, (14). Daher lässt sich der vorstehende Satz wiederum auf das System 1:1 anwenden. Dadurch wird die Bestimmung von 1:1 zurückgeführt auf die Bestimmung des allgemeinsten Systemes (16)

von p-5 Matrizen der Ordnung :, welche den Gleichungen

genügen. So fortfahrend gelangt man schliesslich zu einem Systeme (18) wenn p -1

=

2r gerade ist, resp. zu einem Systeme

(19) wenn p - 1 = 2 r + 1 ungerade ist. In dem Systeme (18) bedeuten L2,_1 , L2, Matrizen der Ordnung 2":-1 , welch~;) den Gleichungen L~r-1

= 1'

L~,

= 1'

L2r-I L2, = - L2,L2r-1

genügen. Nach der obigen Analyse ist demnach das System 1:,_1 nicht wesentlich verschieden von dem Systeme (20) wobei die Elemente der Matrizen (20) Matrizen von der Ordnung ; sind.

Komposition quadratischer Formen.

655

In dem Systeme (19) bedeutet L 2,+1 eine Matrix der Ordnung ; , welche der Gleichung genügt. Das System 1:, ist demnach nicht wesentlich verschieden von dem aus einer Matrix der Gestalt

(21)

_ L 2r+l-

(la -1 11)

bestehenden Systeme, unter oc, ß zwei nicht negative ganze Zahlen von der Summe

oc+ß=;

verstanden. Es ist nun noch folgendes zu bemerken. Nach dem obigen Satze entspricht dem Systeme };I vermöge der Gleichungen (13) ein bestimmtes System 1:. Ersetzt man nun das System J:I durch das nicht wesentlich verschiedene EI= T EI T-I= (T03 T-I, ... , TOP-I T-I), so tritt an die Stelle des Systems 1: das aus den Matrizen iTChT-1) ( B B-iTChT-l 2> Bh = 2= BI= BI,

(h

=

3' 4' ... ' p -1)

bestehende System E. Es ist aber Bh = UBhU-I

wenn U die Matrix

(h = 1 ' 2' ... ' p - 1)'

bedeutet. Das System E ist also nicht wesentlich verschieden von dem System 1:. Berücksichtigt man diese Tatsache, so erkennt man, dass folgender Satz gilt, welcher die vorhergehenden Überlegungen resumiert: Es sei die Aufgabe vorgelegt, ein System 1: von p -1 Matrizen nter Ordnung (22) zu bestimmen, welche den Gleichungen

genügen. Man hat dann die beiden Fälle zu unterscheiden. 1. Fall : p - 1 = 2 r ist eine gerade Zahl.

656

Algebra.

In diesem Falle besitzt die Aufgabe dann und nur dann Auflösungen, wenn n durch 2" teilbar ist. Ist diese Bedingung erfüllt, so erhält man eine Auflösung auf folgende Weise. Bezeichnet

(24)

(2k

irgendein System von p -1- 2k Matrizen der Ordnung man unter Ek-l das von den Matrizen der Ordnung 2 ;:_1

+ 1 < p)

;k, so verstehe

(25)

gebildete System (wobei die Elemente dieser Matrizen selbst Matrizen von

;k

sind). der Ordnung Man bilde nun zunächst das System 1:,._1 bestehend aus den beiden Matrizen der Ordnung 2 ":-1

wobei die Elemente dieser Matrizen selbst Matrizen von der Ordnung ; sind. Von 1:,._1 ausgehend, steige man sukzessive auf zu den Systmen E,._ 2 , E,._3 , ••• , E 0 • Das System E 0 stellt dann eine Auflösung unserer Aufgabe vor. Jede andere Auflösung E ist dieser Auflösung E 0 ähnlich. 2. Fall: p -1 = 2r 1 ist eine ungerade Zahl. In diesem Falle besitzt die Aufgabe dann und nur dann Auflösungen, wenn n durch 2" teilbar ist. Ist diese Bedingung erfüllt, so erhält man

+

eine Auflösung auf folgende Weise. Man zerlege ;,. in zwei nicht negative Summanden oc,

ß:

n

w=rx+ß und bezeichne mit E.. das aus der einen Matrix von der Ordnung ;,.

bestehende System 1). Von E,. ausgehend, steige man (genau nach der im ersten Fall gegebenen Vorschrift) sukzessive auf zu den Systemen E .. _1 , 1 ) Im Falle fJ = 0 ist die obige Matrix durch die Matiix 1 von der Ordnung ;, zu ersetzen: im Falle IX= 0 durch die Matrix -1.

Komposition quadratischer Formen.

657

1:,_2 , ••• , 1:0 • Das System 1:0 stellt dann eine Auflösung unserer Aufgabe vor. Da die Zerlegung von ;, in zwei nicht negative Summanden auf ; + 1 Weisen möglich ist, so ergeben sich ebenso viele Auflösungen der Aufgabe. Jede andere Auflösung ist einer (und, wie sich zeigen lässt, auch nur einer) dieser ;r + 1 speziellen Auflösungen ähnlich. Im Falle der Lösbarkeit der betrachteten Aufgabe hat man entweder

+ 1,

n = 2'm,

p=2r+2,

n=2'm.

p = 2r

oder

Soll nun insbesondere p = n sein, so muss der letztere Fall stattfinden, wenn von der trivialen Möglichkeit r = 0, also p = n = 1 abgesehen wird. Dann muss also p= n

=

2r

+2=

2rm

sein. Sobald r > 3, is! nun 2r + 2 < 2' und es sind daher nur die Fälle r = 0, 1, 3 möglich, wobei dann bzw. p=n=2,4,8,

n 2, 2,1 = -w=

m

wird. Der obige Satz ergibt daher folgendes spezielle Resultat: Die Gleichungen (26)

B~=1,

(h,k=1,2, ... ,n-1; h=!=k)

B,.Bk=-BkBA

sind in Matrizen n 16' Ordnung (n n

= 2,

> 1)

nur lösbar in den drei Fällen

n = 4,

n

= 8.

Im Falle n = 2 handelt es sich um die eme Gleichung

Bi= 1 und jede Lösung ist einer der folgenden drei Lösungen ähnlich (27)

B1 = 1, B1 = -1,

(28)

B1 = (1 _ 1).

Im Falle n = 4 hat man die Gleichungen

(29)

{

Bi= B~= Bi= 1, B 1 B 2 = -B2 B 1 , B 1 B 3 = -B3 B 1 , B2Bs = -BaB2,

deren allgemeinste Lösung ähnlich ist einer der drei speziellen Lösungen

(30) unter B eine der drei Matrizen zweiter Ordnung (28) verstanden. 42

658

Algebra.

Im Falle n = 8 endlich, ist jede Lösung der Gleichungen (26) ähnlich einer der beiden folgenden. Man bilde zunächst die drei Matrizen zweiter Ordnung

Nl=e_ 1), N2=(11), Na=e(_/).

(31)

unter e einen der beiden Werte Matrizen vierter Ordnung (32)

Ml =

c2 -1J'

+ 1, -

1 verstanden; so dann die fünf

M2 = k12), MH2 =

(-iNkiNk)

(k = 1' 2, 3)

und endlich die sieben Matrizen achter Ordnung

Diese sieben Matrizen stellen nun sowohl für e = + 1 als auch für e = -1 eine Lösung der Gleichungen (26) im Falle n = 8 vor und jede andere Lösung ist einer dieser beiden durch (33) definierten Lösungen ähnlich.

IV. Man hat nun die Aufgabe, unter den Lösungen der Gleichungen

diejenigen auszusuchen, die aus schiefsymmetrischen Matrizen nung gebildet werden, für welche also

nter

Ord-

(h=1,2, ... ,p-1) ist. Nach der vorigen Nummer haben wir die Systeme (p -1 = 2 r) (p -1 = 2 r + 1)

(2) von rechts nach links zu bilden, ausgehend von

e_

E,-1 = [

1), (11)]

bez.

E,

=

(Ordnung der Elemente ;, )

e_

111)

Jede Lösung von (1) ist dann E 0 ähnlich. Wenn

( e
, 0~0 >, ..• , 3~> einer ande1'en beliebigen orthogonalen Transformation unte1'Wi1'ft.

=

=

Hierzu ist noch folgendes zu bemerken: Besteht die Identität (30) für bestimmte bilineare Formen 01 , 02 , ... , Ön der Variablensysteme Xv x 2 , ••• , X 11 und y1, y 2 , ••• , Yn und ebenso die Identität (31)

(xi +X~+ ... + x!) (ni + 1]~ + ... + n!) = Ci+ c~ + ... + C!

für bestimmte bilineare Formen Cv C2 , ••• , Cm der Variablensysteme Xv x2 , ••• , X 11 und 1] 1 , t7 2 , ••• , tlm, so ergibt die Addition von (30) und (31) (32 )

(xi + x~ + · · · + x!)(Yi + Y~ + · ·· + Y! + ni + n~ + ·· · + n!) = öi + 3~ + · · · + ö! + Ci + C~ + · · · + C! ·

Hier können öv 32 , ••• , Ön• C1 , C2 , ••• , Cm als bilineare Funktionen der beiden Variablensysteme Xv x2, ••• , X11 und y1, y2 , ••• , Ym tlv tJz, ... , 17m angesehen werden. Die Gleichung (32) stellt somit eine Lösung unseres Problems für den Fall zweier Variablensysteme von p und n + m Variablen vor. Eine derartige Lösung möge "reduzibel" und aus den beiden Lösungen (30) und (31) zusammengesetzt oder in diese beiden Lösungen zerfallend heissen. Da nun im Falle p = 21' + 1, wenn überhaupt nur eine Lösung existiert, falls solche, die durch orthogonale Transformation der y1, ... , Yn und 01 , 02 , ... , On auseinander entstehen, als nicht verschieden gelten, so erhält man alle Lösungen aus den den folgenden Fällen entsprechenden: p = 21' p = 21'

+ 1, + 1,

n = 2r, n = 2r+ 1,

=

wenn r 0 oder 3 (mod. 4), wenn 1' = 1 oder 2 (mod. 4), p=3, 5, 7, 9, 11, 13, 15, 17, n = 4, 8, 8, 16, 64, 128, 128, 256, ....

Komposition quadratischer Formen.

Ich betrachte nun den Fall .2) p- 1 = 2 r E _

r-

(la -1ß)

665

+ 1.

Es ist dann

Das System der Matrizen (13) schliesst mit U,, und zwar ist U, bestimmt durch die Bedingungen wenn

r = o (mod. 4).

u,Ca_ 1ß)=·Ca-lß)u,, u;=-u,,

wenn

r =1

und ß beliebig, der Bedingung

ß = 2;. gernäss und

Es ist daher 2b) Daher

u; = u,,

u, Ca _1ß) =-Ca _1ß)u,,

2a)

IX

IX=

ß = 2 ";'+1 und U, = (B'B).

IX+

(mod.4).

mit A: = -Aa, A~ =-Aß. Da U, nicht verschwindende Determinante haben muss, hat man notwendig IX+ ß = ; gerade, also n durch 2'+1 teilbar. Ja es müssen IX und ß gerade sein, weil Aa, Aß schief und von nicht verschwindender Determinante.

U, = (AaAß)

u, Ca _1ß) =-Ca _1 ß) u,, u; =

2c) Daher

Daher

U

r

IX

wenn r = 2 (mod. 4).

u; = u,,

wenn r = 3 (mod. 4).

ß = 2";'+1 und U, = (-Bß,a Ba,ß).

IX=

2d)

u,,

-

(la -lß)-(la - -1ß )u''

und ß nur der Bedingung

IX +

ß=

;,

unterworfen und

mit A:= Aa, A~= Aß. In den Fällen 2a) und 2c) gibt es, wie eine der obigen auf p . 2r + 1 bezügliche Betrachtung analoge Überlegung zeigt, nur eine Lösung unseres Problems, wenn orthogonale Transformationen der Variablen Y1 , y 2 , ••• , Yn und der 31 , 32 , ••• , 3n als unwesentlich angesehen werden. Alle irreduziblen Lösungen entsprechen also jetzt den Fällen

U,= (AaAß)

= 2r + 2, n = 2r+ 1

= =

(r 0 (4)), 2r + 2, n = 2r+l (r 2 (4)), = 2, 6, 10, 14, 18, ... ' n = 2, 8, 32, 128, 512, p p p

=

In den Fällen 2b) und 2d) entspricht jeder Wahl der Zahlen IX, ß, die der Gleichung IX + ß = ;, (IX = 0 (2), wenn r = 1 (4)) resp. IX+ ß = -;,- (r = 3 (4)) genügen, eine Lösung des Problems, wenn wieder

666

Algebra.

orthogonale Transformationen der y1 , y 2 , •• • , Yn und ou 32 , ••• , On unwesentlich erachtet werden. Wenn man nun die auf S. 664 oben geschilderte Zusammensetzung zweier Lösungen

(xi + X~ + ' ' • + x;) (yi + ' ' ' + y;) = oi + ' ' ' + 0;.' (xi + x~ + · · · + x!) (rJi + · · · + rJ!) = Ci+···+ C! zu der neuen Lösung

(xi + · · · + x!) (yi + · · · + y';. + rJi + · · · + rJ!) = oi + · · · + o; + Ci + · · · + C! vornimmt, so ergibt die Untersuchung der diesen Lösungen entsprechenden Systeme B 1 , B 2 , ••• , BP_ 1 , dass wieder nur folgende irreduziblen Lösungen existieren: p = 2r p = 2r

also

+ 2, + 2,

r=l 3

5

n = 2' n = 2r+1 7

9

(r=3(4)), (r=1(4)),

= 4, 8, 12, 16, 20, ... , n = 4, 8, 64, 128, 1024, ... .

p

GEOMETRIE

XC.

Ober den Chasles'schen Satz (Gemeinsam mit H. Schubert.)

a.p,

+ ßv.

(Nachrichten von der k. Gesellschaft der Wissenschaften zu Göttingen, 1876, 8.503-517.)

In den Comptes rendus vom 4. September dieses Jahres befindet sich eine von Herrn Halphen 1) verfasste Note, betitelt: "Sur les caracteristiques des systemes de coniques". In dieser Note werden Zweifel ausgesprochen gegen die allgemeine Gültigkeit des bekannten Chas I es' sehen Satzes, dass die Anzahl derjenigen Kegelschnitte eines einstufigen Kegelschnitt-Systems (p,, v), welche eine neu hinzutretende Bedingung z erfüllen, immer in der Form a.p,

+ ßv

ausdrückbar ist, wo die Charakteristiken fl und v angeben, wieviel Kegelschnitte des Systems durch einen gegebenen Punkt gehen, resp. eine gegebene Gerade berühren, a. und ß aber Koeffizienten sind, deren Werte nur von der Bedingung z abhängen. Zwar hat Herr Halphen in dieser Note nur durch einige Beispiele darzutun versucht, dass in gewissen Fällen der Chasles'sche Satz unrichtig sei, aber noch nicht seine Beweisgründe gegen den Satz publiziert, was voraussichtlich bald geschehen wird. Trotzdem scheint schon der begonnene Angriff gegen den vielbenutzten, von Cle bsch 2) in den Mathem. Annalen, Bd. 6, S. 1, von Lindemann in seinen "Vorl. v. Clebsch", S.398, algebraisch bewiesenen Satz die Aufmerksamkeit vieler Mathematiker auf sich zu ziehen. Unter diesen Umständen wollen wir, noch immer von der Allgemeingültigkeit des richtig verstandenen Satzes überzeugt, nicht länger zögern, unsern geometrischen Beweis desselben zu veröffentlichen. Die Methode, welche bei diesem Beweise befolgt ist, stimmt mit derjenigen überein, welche in §26 von Schuberts "Beiträgen zur abzählen1) 2)

Vgl. Comptes rendus, t. 83 (1876), p. 537-539 [Oeuvres, t. I, p. 543-545]. Zur Theorie der Charakteristiken,. Mathem . .Ann:alen, Bd. 6 (1873), S. 1-15.

670

Geometrie.

den Geometrie" (Math. Annalen, Bd. 10, 1876, S. 1-116) angewandt ist, um aus den Korrespondenzformeln die Produktensätze für Punkte, Strahlen und Ebenen abzulesen, das heisst die Sätze, welche die Zahl der gemeinsamen Elemente zweier Punkt-, Strahlen- und Ebenen-Örter durch die Gradzahlen dieser Örter ausdrücken. Dort ist z. B. die Zahl der Schnittpunkte zweier Plankurven derselben Ebene als die Zahl derjenigen Punkte der Ebene bestimmt, in denen zwei Punkte der beiden Kurven derartig unendlich nahe liegen, dass als ihr Verbindungsstrahl jeder Strahl durch die Koinzidenzstelle aufgefasst werden kann, mit andern Worten, dass ihr Verbindungsstrahl durch einen willkürlich gewählten Punkt der Ebene gehen kann. Die Übertragung dieser Methode von Punkt auf Kegelschnitt ergibt folgendes. Man denke sich in der Ebene ein beliebiges einstufiges System 1:1 von Kegelschnitten mit den Charakteristiken f-l und v, dazu eine beliebige einfache Bedingung Z 1 • Die letztere wird durch oo 4 Kegelschnitte erfüllt. Das von ihnen gebildete vierstufige System 1:4 habe die Charakteristiken t-t' 4, t-t' 3v', t-t' 2 v' 2, t-t' v' 3, v' 4 , wo t-t'av'b 1) die Zahl derjenigen Kegelschnitte dieses Systems 1:4 bedeutet, welche durch a Punkte gehen und b Strahlen berühren. Die Frage nach der Zahl derjenigen Kegelschnitte in 1:1 , welche die Bedingung Z 1 erfüllen, ist nun gleichbedeutend mit der Frage nach der Zahl der den beiden Systemen 1:1 und 1:4 gemeinsamen Kegelschnitte. Gelingt es also, diese letztere Zahl in der Form r:t.t-t + ßv darzustellen, wo oc und ß Funktionen der 5 oben aufgezählten Charakteristiken von 1:4 sind, so ist damit der Chasles'sche Satz bewiesen, da ja IX und ß dann nur von Z 1 abhängen. Bei Übertragung der oben erwähnten Methode auf Kegelschnitte handelt es sich also darum, die Zahl x der den beiden Systemen 1:1 und 1:4 gemeinsamen Kegelschnitte vermittelst des Korrespondenzprinzips als die Zahl derjenigen Kegelschnitte Q zu bestimmen, in denen zwei Kegelschnitte der beiden Systeme derartig unendlich nahe liegen, dass diese beiden unendlich nahen Kegelschnitte einem ganz willkürlich gewählten durch Q gelegten Kegelschnittbüschel angehören, oder, was dasselbe ist, dass ihre 4 Schnittpunkte auf einem beliebig gewählten, Kegelschnitte K liegen. Eine solche Bestimmung der Zahl x hat zugleich vor den bekannten algebraischen Bestimmungen den wichtigen Vorzug, dass dadurch die Koeffizienten IX und ß direkt als Funktionen der 5 Charakteristiken von 1:4 gewonnen werden, und nicht erst a posteriori oder, so 1 ) Für diese Bezeichnung vergleiche man Schuberts Abh. "Moduln vielfacher Bedingungen bei Flächen Il. Ordnung", Mathem. Annalen, Bd. 10 (1876), S. 318-364. Eine Verwechslung der symbolischen Potenzen und Produkte mit wirklichen ist nicht gut möglich. Doch haben wir zur Unterscheidung der wirklichen Multiplikationen meist einen Punkt als Multiplikationszeichen gesetzt, bei symbolischen aber nicht.

Über den Chasles'schen Satz a.p.

+

ßv.

671

zu sagen, experimentell bestimmt zu werden brauchen (vgl. Lindemann in seinen "Vorl. v. Clebsch", S. 403, Anmerk.). Ausserdem zeigt eine solche Bestimmung der Zahl x für Kegelschnitte am deutlichsten die Analogie zu dem Fundamentalsatze von der Zahl der Schnittpunkte zweier Kurven. Die voranstehende, von Schuber t herrührende Überlegung führte Hurwitz zu dem unten mitgeteilten Beweise des Satzes a.p, + ßv. Mit Rücksicht auf diesen Beweis und auf unsere am Schluss folgenden Bemerkungen über den Sinn des Satzes erinnern wir zunächst an einige ganz bekannte Dinge. Der Kegelschnitt in fester Ebene hat die Konstantenzahl 5 und besitzt zwei Ausartungen e und ~ mit der Konstantenzahl 4. Bei e bilden die Tangenten zwei Strahlbüschel, die Punkte zwei zusammenfallende Gerade, welche die Scheitel (sommets) der beiden Tangentenbüschel verbinden. ~ entspricht dem e dualistisch. Nun kann jede dieser Ausartungen noch einmal weiter ausarten, e dadurch, dass seine beiden Scheitel zusammenfallen, ~ dadurch, dass seine beiden Geraden zusammenfallen. In beiden Fällen kommt man auf dieselbe Ausartung 'YJ mit der Konstantenzahl 3. Das eingeführte Symbol e, resp. ~, resp. 'YJ soll nun zugleich die Zahl derjenigen Kegelschnitte eines zugrunde gelegten einstufigen Systems bedeuten, welche die Definition von e, resp. ~, resp. 'YJ erfüllen. Natürlich genügt jeder der spezielleren Kegelschnitte e, ~, 'YJ der Definition des Kegelschnitts überhaupt, und 'YJ erfüllt sowohl die Definition von ~wie auch die Definition von e. Wenn also von einer Anzahl a. von Kegelschnitten die Rede ist, welche gewisse Bedingungen erfüllen, und diese Bedingungen derartig definiert sind, dass ihnen auch Kegelschnitte ~ resp. e resp. 'YJ genügen, so ist es selbstverständlich, dass die Zahl a. dieselben mit zu umfassen hat. Ebenso ist bei der Zahl ~ der Kegelschnitte ~ oder bei der Zahl e der Kegelschnitte e jedes etwa vorhandene 'YJ hinreichend oft mitzuzählen. Dieses vorausgeschickt, erinnern wir an die bekannten, aus dem Chasles'schen Korrespondenzprinzipe folgenden Formeln, welche die Zahl aller in einem einstufigen Systeme 1:1 von Kegelschnitten vorhandenen Ausartungen ~ resp. e durch die Charakteristiken p, und v dieses Systems ausdrücken, nämlich: 2p,-v=e, 2v-p,=~.

Da die Konstantenzahl der Ausartung 17 um 2 kleiner ist, als die des allgemeinen Kegelschnitts, so wird im allgemeinen erst in einem zweistufigen Systeme eine Anzahl von Ausartungen 'YJ vorhanden sein.

672

Geometrie.

Diese Zahl finden wir wieder durch das Korrespondenzprinzip entweder aus den oo 1 Kegelschnitten r5 dieses Systems oder aus semen oo 1 Kegelschnitten s. Man erhält in beiden Fällen: 'Y}

=

(2 p - v)(2 v- p)

= 5 · p v- 2 . v2 -

2. p2.

Der Beweis selbst. Gegeben ist in derselben Ebene ein einstufiges System von Kegelschnitten E 1 mit den Charakteristiken p, v, und ein vierstufiges System von Kegelschnitten E 4, mit den Charakteristiken p' 4, p' 3v', p' 2v' 2, p.' v's, v' 4 ferner ein beliebig gewählter Kegelschnitt K. Wir suchen, vermöge des Korrespondenzprinzips, auf einer beliebigen Geraden g die Zahl derjenigen Punkte zu bestimmen, durch welche zugleich ein Kegelschnitt aus E 1 und einer aus E 4 derartig gelegt werden kann, dass die 4 Schnittpunkte dieser beiden Kegelschnitte alle auf K liegen. Durch einen beliebigen Punkt A auf g gehen p Kegelschnitte von E 1 , von denen jeder K in 4 Punkten 0, D, E, F schneidet. Durch 4 solche Schnittpunkte gehen p' 4 Kegelschnitte von E 4 , von denen jeder g in zwei Punkten B schneidet. Also entsprechen dem Punkte A 2p. p'4

Punkte B. Es fragt sich nun, wieviel Punkte A umgekehrt einem Punkte B entsprechen. Um diese Zahl anzugeben, brauchen wir die Zahl v derjenigen E 4 angehörigen Kegelschnitte, deren jeder durch einen gegebenen Punkt geht, und K so in 4 Punkten schneidet, dass durch diese 4 Punkte ein E 1 angehöriger Kegelschnitt möglich wird. Diese Zahl v haben wir auf verschiedenen Wegen bestimmt. Man erhält sie am schnellsten durch das Prinzip der speziellen Lage (Schuberts "Beitr. z. abz. Geom. § 7), indem man den gegebenen Punkt auf K legt. Dann gehen durch diesen Punkt p Kegelschnitte aus E 1 , von denen jeder K in noch drei andern Punkten schneidet. Durch diese 4 Schnittpunkte gehen p' 4 Kegelschnitte aus E 4. Also existieren in E 4 V=

p • p'4

Kegelschnitte, welche durch einen gegebenen Punkt gehen, und K in 4 Punkten so schneiden, dass durch die 4 Punkte ein E 1 angehöriger Kegelschnitt gehen kann. Man erhält diese Zahl v auch, indem man durch Punkt-Korrespondenzen, die auf K selbst liegen, zu bestimmen sucht, wieviel Punkt-Quadrupel auf K liegen, die zugleich einem Kegelschnitt in E 1 und einem Kegelschnitt in 1:3 angehören, wo E 3 das dreistufige Kegelschnitt-System sein soll, welches man erhält, wenn man der definierenden Bedingung von E 4 noch die Bedingung, durch einen

Über den Chasles'schen Satz a.p

+ flv.

673

gegebenen Punkt zu gehen, hinzugesellt. Durch {linen Punkt B auf g gehen also 11. p' 4 Kegelschnitte, die Kin 4 Punkten so schneiden, dass durch die 4 Punkte ein 1:1 angehöriger Kegelschnitt möglich wird. Ein solcher 1:1 angehöriger Kegelschnitt schneidet dann g in 2 Punkten A. Also entsprechen einem Punkte B auch 2p· p'4

Punkte A. Es gibt daher nach dem gewöhnlichen Korrespondenzprinzipe auf g 4 f1 • p'4 Punkte (AB), deren jeder zwei Punkte A und B vereinigt. Solche Koinzidenzstellen (A B) werden nun verursacht: 1) durch K vermöge seiner beiden Schnittpunkte mit g, 2) durch jeden der x den beiden Systemen gemeinsamen Kegelschnitte vermöge seiner beiden Schnittpunkte mit g, 3) durch jeden Kegelschnitt e in 1:1 , der seine Punkte auf zwei zusammenfallenden Geraden hat. Jeder der beiden Schnittpunkte von g und K ist 11. p' 4 mal eine Koinzidenz (AB), weil durch ihn 11 Kegelschnitte von 1:1 gehen, und p' 4 Kegelschnitte von 1:4 gehen, welche mit einem dieser 11 Kegelschnitte dieselben Schnittpunkte auf K haben. Ferner ist jeder Schnittpunkt von g mit einem der gesuchten x den beiden Systemen gemeinsamen Kegelschnitten einmal eine Koinzidenz (AB) (vgl. oben die Erörterung der befolgten Methode). Es ist ersichtlich, dass die eben erwähnten Koinzidenzen (AB) die einzigen sind, welche durch nicht ausgeartete Kegelschnitte in 1:1 erzeugt werden können. Wohl aber kann eine dritte Sorte von Koinzidenzen entstehen durch die e=2p-v in 1:1 . vorhandenen Ausartungen e, deren jede ihre Punkte auf zwei zusammenfallenden Geraden besitzt. Wir betrachten daher jetzt eine solche 1:1 angehörige Ausartung e. Sie schneide g in den beiden zusammenfallenden Punkten P, und K in den 4 Punkten C, D, E, F, von denen zweimal zwei unendlich nahe liegen. Es möge C und D im Punkte (CD), ferner E und F im Punkte (EF) unendlich nahe liegen. Es gibt nun bekanntlich 1) in einem zweistufigen Systeme von Kegelschnitten mit den Charakteristiken p' 2 , p'v', v' 2 :

21 • f1 ' V ' 1 ) Diese Zahl ist wohl schon von Chasles in seinen ersten .Arbeiten über Charakteristiken (Comptes rendus) benutzt. Vgl. auch Schubertin den Mathem. Annalen, Bd.lO (1876), S. 341, Nr. 3.

43

674

Geometrie.

Kegelschnitte, welche eine gegebene Gerade in einem gegebenen Punkte berühren, also in dem vierstufigen Systeme 1:4 : 1 4. ft

1

2

V

1

2

Kegelschnitte, welche die genannte Bedingung zweimal erfüllen. Es existieren daher in 1:4

! p.' v' 2

2

Kegelschnitte, welche die Verbindungs-

gerade der unendlich nahen Punkte C und D im Punkte (0 D) berühren, und zugleich die Verbindungsgerade EF im Punkte (EF) berühren. Jeder dieser Kegelschnitte schneidet g in Punkten, welche von P verschieden sind. Nun gehen aber durch 4 Punkte immer p.' 4 Kegelschnitte von 1:4 , also auch durch die 4 Punkte 0, D, E, F. Folglich bleiben ft

1

4

12 12 1 -4•ft V

Kegelschnitte übrig, von denen jeder zwar die 4 Punkte 0, D, E, F enthält, aber nicht dabei in (0 D) oder in ( E F) berührt. Ein Kegelschnitt aber, welcher zwei Paare von unendlich nahen Punkten enthält, ohne in jedem Paare zu berühren, muss ein ausgearteter Kegelschnitt sein, welcher seine Punkte auf zwei zusammenfallenden Geraden hat. Daher muss jeder von diesen p.'4 _ ! p.'2v'2

dem 1:4 angehörigen Kegelschnitten mit dem betrachteten e im Ort der Punkte zusammenfallen, also g in den beiden zusammenfallenden Punkten P treffen. Hieraus folgt, dass im Punkte P (p.' 4

-! p.' v' 2

2)

Koinzidenzen (AB) vorhanden sind. Nun besitzt 1:1 2p.- v Ausartungen e. Deshalb gibt es auf g : (2p.- v). 2. (p.'4_! p.'2v'2)

Koinzidenzen (AB), welche von der oben angedeuteten dritten Sorte sind. So erhält man schliesslich die Gleichung: 4 · p. · p.' 4 = 2p. · p.' 4 + 2 · x'

+ (2p.- v). 2. (p.' 4 - ! p.' 2v' 2),

woraus sich die gesuchte Zahl x der den beiden Systemen gemeinsamen Kegelschnitte ergibt, nämlich: x = p..

(! p.'2v'2_ p.'4) + v. (p.'4_!. p.'2v'2)

=«·p.+ß·v,

Über den Chasles'schen Satz a.p

+

ßv.

675

wo oc und ß nur von den Charakteristiken des E,, also von der zu 1:1 hinzutretenden beliebigen einfachen Bedingung Z1 abhängen. Wir erinnern noch an die allgemeinen, von Schubert in den Math. Annalen, Bd.l 0 (1876), S. 355-360 gemachten Bemerkungen, nach welchen zwischen den 5 Charakteristiken eines ebenen E, von Kegelschnitten 3 Relationen bestehen, welche man auch durch ein allgemeines Eliminationsverfahren ableiten kann. Diese Relationen hat auch Lindemann in seinen "Vorles. v. Clebsch", S. 403, in der Anmerkung. Wegen dieser Relationen kann oc und ß auf mannigfache Weise durch die 5 Charakteristiken des E, ausgedrückt werden. Eine der Relationen erhält man dadurch, dass man die obige Formel für x dualistisch umformt, und sie mit der umgeformten vergleicht. Dadurch bekommt man: - 4 ( 14 f-l '2 V '2 ----sf-l

+ V'4),

welche Gleichung mit der von Lindemann in jener Anmerkung zuletzt angegebenen übereinstimmt.

Es liegt nahe, in ähnlicher Weise die Zahl der gemeinsamen Kegelschnitte eines zweistufigen und eines dreistufigen Systems durch die Charakteristiken der beiden Systeme auszudrücken. Herr Lindemann leitet in seinen "Vorl. v. Clebsch" (S.405) diese Zahl aus dem Chaslesschen Satze für einstufige Systeme ab, bestimmt aber die Funktionen der Charakteristiken des dreistufigen Systems a posteriori. Dabei macht Herr Lindemann, wie hier beiläufig erwähnt werden mag, das von Schubert zuerst bemerkte Versehen,dass er den Chasles'schen Satz für ein einstufiges System auf eine Bedingung anwendet, welche von der das einstufige System definierenden zusammengesetzten vierfachen Bedingung indirekt abhängt, was jener Satz nicht erlaubt. Bei der Übertragung des oben gelieferten Beweises von Kegelschnitten auf Flächen zweiter Ordnung haben wir die Zahl der einem einstufigen und einem achtstufigen Systeme von Flächen gemeinsamen Flächen durch die Charakteristiken der beiden Systeme f-l, v, (! und ll' 8, ll' 7 v', f1' 7 e', f1' 6 v' 2, ••• auszudrücken, statt des Kegelschnitts K eine Fläche zweiter Ordnung zu setzen, und statt der Schnittpunkt- Quadrupel Raumkurven vierter Ordnung zu setzen. Wir erhalten dann, wenn die Zahl der gemeinsamen Flächen wieder x genannt wird: 4f-t• f1' 8 =2f-t· f1' 8

+ 2 • x + 2 · (2p,- v). ! f-l' 3 v' 4 (2f-l'- v') + 2 . (2 v- fl- e) .

11o ll's e' (2 v' - ll' - e')'

676

Geometrie.

wo die in den Klammern stehenden Ausdrücke durch diejenigen beiden Ausartungen der Fläche zweiter Ordnung veranlasst sind, auf denen der Punktort zerfallen ist. Es ergibt sich: 1 '7 (! ' -t-5ft ' 1 '6 'J! ' (!-10ft ' 1 6' (! '2 -2ft 1 '4 'J! '4 X=ft [ ft '8 -10ft

+ 4ft 1 '3

'J!

'5]

1 '7 e ' - 2 ft '6 v' e '+ 1 ft '6 e '2 -sft 1 '3 v ,.5 + 4ft 1 '4 v'4] + v· [r;ft 5 5 1 '6 ve-wft ' ' 1 '6 e'2] [ 1 '7 e' + r;ft + e·-toft = OCft + ßv + Yf!·

Mlt Rücksicht auf die Beispiele, welche Herr Halphen in seiner Note gegen die Richtigkeit des Chasles'schen Satzes anführt, fügen wir unserer Mitteilung noch einige Bemerkungen hinzu. Es ist schon oben ausführlich hervorgehoben, dass bei der Zahl OCft + ßv auch jeder ausgeartete Kegelschnitt mitzuzählen ist, sobald er sowohl dem einstufigen Systeme angehört, wie auch die hinzugefügte Bedingung zu erfüllen vermag. Ist nun dieses einstufige System durch die vierfache Bedingung definiert, dass der Verbindungsstrahl zweier im Punkte (PQ) unendlich nahen Punkte P und Q in (PQ) berührt wird, und zugleich der Verbindungsstrahl zweier anderer unendlich nahen Punkte R und S im Punkte (RS) berührt wird, so enthält dieses einstufige System auch denjenigen in einen Kegelschnitt e ausgearteten Kegelschnitt, welcher die beiden Punkte (PQ) und (RS) zu Scheiteln hat. Wir fügen jetzt mit Halphen die einfache Bedingung Z1 hinzu, aus einem gegebenen Strahle eine Strecke so auszuschneiden, dass dieselbe ein gegebenes Verhältnis hat zu dem Sinus des Winkels, der durch die beiden von einem gegebenen Punkte ausgehenden Tangenten gebildet wird. Dann vermag jener ausgeartete Kegelschnitt e diese Bedingung nicht zu erfüllen. Folglich ist er bei der Zahl der Kegelschnitte, welche Z1 erfüllen, nicht mitzuzählen, solange die Definition von Z 1 dieselbe bleibt. Liegen nun zweitens die Punkte (PQ) und (RS) im Punkte (PQ RS) unendlich nahe, so ist der ausgeartete Kegelschnitt r;, welcher seinen Scheitel im Punkte (PQ RS), und seine Gerade in dem Verbindungsstrahle PQ RS hat, unter den Kegelschnitten des Systems. Zugleich erfüllt er aber auch die Bedingung Z 1 . Folglich ist er bei der Zahl OCft ßv mitzuzählen. Man könnte nun das V erlangen stellen, dass ausgeartete Kegelschnitte nie mitgezählt werden sollen, selbst dann nicht, wenn sie die hinzugefügte Bedingung erfüllen. Ein solches Verlangen halten wir aber für ebenso ungerechtfertigt und unzweckmässig, wie etwa das Verlangen, dass bei einer gesuchten Zahl von gleichschenkligen Dreiecken vieHeicht

+

Über den Chasles'schen Satz a.p.

+ ßv.

677

vorhandene gleichseitige nicht mitgerechnet werden sollen. Dies ist aber nicht etwa so zu verstehen, als wenn wir nicht das ausscheiden wollten, was Chasles und andere Autoren bei der Anwendung des Korrespondenzprinzips solutions etrangeres genannt haben. Wenn man, um ein sehr einfaches Beispiel zu wählen, einem einstufigen KegelschnittSysteme die Bedingung y stellt, auf einer gegebenen Geraden zwei unendlich nahe Punkte zu besitzen, so ist nach dem Korrespondenzprinzip die Zahl der diese Bedingung erfüllenden Kegelschnitte des Systems gleich Zu dieser Zahl gehören die e Kegelschnitte des Systems, welche in Kegelschnitte e ausgeartet sind, ebensogut wie die v die gegebene Gerade berührenden Kegelschnitte. Wenn man aber die Absicht hat, nicht die Zahl der y erfüllenden Kegelschnitte, sondern nur die Zahl der die Gerade berührenden Kegelschnitte zu bestimmen, so wird man in bezug auf diese Absicht die e ausgearteten Kegelschnitte solutions etrangeres nennen können. Wenn man dann aber die Ausartungen nicht mitrechnet, so ist es doch wohl nicht, weil man sie nicht für Kegelschnitte hält, sondern, weil man überhaupt die Bedingung ganz geändert hat, indem man nicht mehr sagt "mit einer Geraden zwei unendlich nahe Punkte gemein haben", sondern " die Gerade berühren". Versteht man aber trotzdem den Satz a.p + ßv so, dass diese Zahl nie .;\usartungen mitzählen soll, selbst, wenn sie die gestellte Bedingung erfüllen, so kann der Satz natürlich nur dann richtig bleiben, wenn die Zahl der nicht mitzuzählenden Ausartungen sich durch p und v ausdrücken lässt. Dann hat man diese Zahl von a. p + ßv zu subtrahieren. Nun lässt sich die Gesamtzahl c5 aller Ausartungen c5 und die Gesamtzahl e aller Ausartungen e durch p und v ausdrücken, nämlich e=2p-v, c5=2v-p.

Daraus folgt, dass der anders verstandene Satz noch richtig ist, . wenn die gestellte Bedingung durch jede der Ausartungen c5 oder jede der Ausartungen e erfüllt wird. Wird aber die Bedingung nicht von allen c5 oder allen e erfüllt, z. B. etwa nur von denjenigen unter ihnen, welche vielleicht noch in Ausartungen 'fJ weiter ausgeartet sind, so braucht der anders verstandene Satz nicht richtig zu sein, weil man im allgemeinen die zu subtrahierende Zahl, hier also 'fJ, nicht durch p und v ausdrücken kann. Gestützt auf unsern obigen Beweis und die eben gemachten Bemerkungen möchten wir unsere Meinung wie folgt aussprechen:

678

Geometrie.

Wenn man den Chasles'schen Satz ocp, + ßv so versteht, dass die Zahl oc p, + ßY ausgeartete Kegelschnitte nicht umfassen soll, indem man sich etwa diese Beschränkung in die gestellte Bedingung hineingefügt denkt, so braucht der Satz dann nicht richtig zu sein, wenn die gestellte Bedingung nicht von allen Ausartungen 15 oder allen e erfüllt wird, z. B. nur von den Ausartungen r} erfüllt wird. Wenn man aber den Chasles'schen Satz so versteht, wie wir ihn bisher immer verstanden haben, dass nämlich ocp, + ßv auch dieienigen Kegelschnitte mitzuumfassen hat, welche die gestellte, von jen·er Beschränkttng freie Bedingung erfüllen, so glauben wir noch immer an seine Richtigkeit. .

XCI.

Ober unendlich-vieldeutige geometrische Aufgaben, insbesondere über die Schliessungsprobleme. (Mathematische Annalen, Bd. 15, 1878, S. 8-15.)

Es gibt in der Geometrie eine grosse Anzahl von Sätzen, die aussagen, dass ein gewisses Ereignis unendlich oft statt hat, sobald es nur einmal oder endlich oft eintritt. Schon die äussere Form dieser Sätze weist auf den Zusammenhang hin, in welchem dieselben mit jenem Fundamentalsatze der Algebra stehen, dass eine Gleichung mit einer Unbekannten, die mehr Wurzeln hat als ihr Grad angibt, unzählig viele Wurzeln besitzt, indem s1e durch jeden Wert der Unbekannten befriedigt wird. In der Tat zieht man aus diesem Satze sofort die Folgerung: Kann man bei einer, im allgemeinen n-deutigen Aufgabe, deren Lösungen durch die Wurzeln einer Gleichung nten Grades bestimmt werden können, im speziellen Falle mehr als n Lösungen nachweisen, so hat sie in diesem Falle unzählig viele Lösungen1). Für die von uns zu gebenden Anwendungen dieses Kriteriums auf geometrische Aufgaben ist es zweckmässig, dasselbe in folgende speziellere Fassung zu bringen: "Findet zwischen den Elementen einer einstufigen rationalen Mannigfaltigkeit, z. B. den Punkten einer rationalen Kurve, eine (algebraische) Korrespondenz (m, n) statt - eine Korrespondenz, vermöge welcher jedem Elemente P n Elemente P' und einem Elemente P' m Elemente P entsprechen - und lassen sich bei dieser Korrespondenz mehr als (m + n) Koinzidenzen aufweisen, d. h. Elemente, in denen zwei einander entsprechende Elemente zusammenfallen, so hat die Korrespondenz unendlich viele solcher Elemente, und zwar ist jedes Element Koinzidenzelement." Zu letzterem Schlusse, dass jedes Element Koinzidenzelement ist, berechtigt uns der Umstand, dass die Gleichung, welche die Koinzi1 ) Vgl. den als Prinzip von der Erhaltung der Anzahl bezeichneten Satz in Schubert's Beiträgen zurabzählenden Geometrie, Mathem. Annalen Bd.10 (1876), 8.1-116.

680

Geometrie.

denzen der betreffenden Korrespondenz bestimmt, unter der gemachten Voraussetzung, durch jeden Wert der Unbekannten befriedigt wird. Ist die Korrespondenz (m,. n), welche mehr als (m + n) Koinzidenzen hat, eine symmetrische (wie z. B. sämtliche weiter unten zu betrachtende Korrespondenzen), so bemerkt man leicht, dass dann jedes Element mit mindestens zwei der ihm entsprechenden Elemente zusammenfällt. Wir wenden nun den soeben aufgestellten Satz auf die Schliessungsprobleme an, und werden sehen, dass sich die bei letzteren auftretenden merkwürdigen Sätze mit grosser Leichtigkeit dabei ergeben. I. Es mögen zwei Kreise M 1 und M 2 gegeben sein, und es liege, der leichteren Anschauung wegen, M 1 in M 2 • Es gibt nun unendlich viele Kreise, welche, im Zwischenraum von M 1 und M 2 liegend, diese Kreise berühren. Nehmen wir einen derselben - er möge M 1 in P 1 berühren -und konstruieren wir, von ihm als erstem ausgehend, eine Reihe von Kreisen, von denen jeder den vorhergehenden und die beiden festen Kreise M 1 und M 2 berührt! Der (n + l)ste Kreis der Reihe berühre M 1 in Pn+l; soll derselbe mit dem Ausgangskreis zusammenfallen, so muss P 1 mit Pn+l koinzidieren. Pn+l lassen wir daher dem Punkte P 1 entsprechen. Alsdann haben wir auf M 1 eine symmetrische (2, 2) Korrespondenz. (Es ist hier nötig zu wissen, dass die Berührungspunkte von M 1 mit den beiden, einen Kreis der konstruierten Reihe auf der einen und der andern Seite berührenden Kreisen, die ausserdem auch M 1 und M 2 berühren, durch eine quadratische Gleichung gefunden werden, um streng schliessen zu können, dass unsere Korrespondenz wirklich eine algebraische (2, 2) Korrespondenz ist.) Im allgemeinen gibt es also 4 Koinzidenzstellen. Diese brauchen wir für unseren Zweck gar nicht aufzusuchen; wir können so fortfahren: Schliesst sich eine solche Reihe von Kreisen dadurch, dass der nte Kreis den ersten Ausgangskreis wieder berührt, so hat unsere Korrespondenz 2 n Koinzidenzpunkte, indem der Berührungspunkt eines jeden Kreises der Reihe mit M 1 ein zweifacher Koinzidenzpunkt ist. Sobald daher 2n > 4 oder n > 2 ist, muss nach unserm Satze jeder Punkt des Kreises M 1 ein (zweifacher) Koinzidenzpunkt sein. Es ist klar, dass es für obige Deduktion unwesentlich i

est une fonction entiere symetrique de oc1 , oc 2, ••• , ocJ>, qui s'annule pour oci = 0, ock = 0. Par consequent

D = oc1 iXJl• • • ocp

[1 + c(_!_IX1 + __!_IX2 + .. · + __!_)], IXJ>

c designant un facteur numerique. Su bstituant __!_, __!_, ... , __!_ au lieu IX1 IX2 IXJ> de oc1 , oc 2, ••• , oc 11 et multipliant par oc1 , oc2, ••• , ocJ>, on obtient oc1

E

=

+ 1, IX2,

oc,,

IX!>

IX2

••• ,

+ 11, • .. ' oc 11 ,

••• , oc 21

oc1 OC2

+1

= 1 + c(oc1 + oc2 + · · · + ocJ>).

745

Lösungen.

Le facteur c est egal a 1, parce que le determinant E se reduit a oc1 + 1 si l'ort fait oc 2 = oc3 = · · · = ocP = 0. a la place de ocl, OCz, .•. , OC:p, ot2J ' ..• ' {J OC:p !XtJ ' - { { En ecrivant -t-OCt P-ocP ~-~ • et en multipliant par le produit (ß1-oc1)(ß2-oc2)(ß3-oc3) • • • (ßp-ocp), la derniere equation donne

F=

ß1, ocl, oc1, · · ., ocl oc2, ß2, oc2, · · ., OCz

Le determinant propose par M. Gillet est un cas special du determinant F.

485. (T. II, 1895, p. 25-26.) Soit f(x) Ia fonct.ion periodique E(x) _ ;t

+ _!_ = 2

n=oo

"""sin2nnx ' nn

~

n=1

M. Hermite a demontre Ia formule (Acta Mathematica, t. 5, 1884-1885, p. 315 [Oeuvres, t. IV, p. 155]) •=n-1

:2t(x •=0

+ :) =

f(nx).

a Ia demande de M. Frobenius, a generaliser ce resultat, nous a cette conclusion que les quantites f ( x + :) (v = 0, 1, ... , n - 1)

En cherchant, sommes arrives

sont racines d'une equation a.lgebrique dont les coefficients dependent rationnellement de •=n-1

f(nx). On demande de former cette equation en calculant les sommes : 2 •=0

r( X+ :) =hr

des puissances semblables des racines, r etant un exposant entier et poeitif. On a, par exemple, n 1 -1

nhs = f 2 (nx) + ~· n2h, = f3(nx) n3 h4 =

f 4 (nx)

+ -:n•-1 4- t (nx), (n•-1)(3n1-7) - f 2 (nx) + -'--~-:::----'+ -:n 2-1 240 1

Anhang.

746

Si l'on veut que ces formules subsistent lorsque l'un des arguments x + _!_ est nul n ou egal ä. un nombre entier, on devra remplacer /(0), dans les deux membres, soit par

+

!'

soit par

-!.

Je serais desireux d'avoir l'indication d'une methode qui amenat a.

ces resultats par une voie probablement differente de celle qui m'a permis de les obtenir. J. FRANEL (Zurich).

(T. li, 1895, p. 383-384.)

Posons, pour abreger, 1-2x = tp(x) et designons par z une variable, par n un nombre entier positif quelconque. Nous avons l'identite, facile & verifier, (1) z

_

k=ao """"

_ En observant que e+•-e . - ..::;"; (-1) k (22k-l -1)Bk( 2zlk k)!' B 0 --1,

1

1

1



,k=O

B1 = 6' B2 = 30, B3 = 42, ... etant les nombres de Bernoulh, nous obtenons 1 en•- e-n•

n

e"-

zB

z'

z&

e-• = 1 + 1f't (n). 3! + 1JI2(n) 5T + 1Jia(n) 7T + ... '

1Jik(n) designant une fonction entiere de n 2, savoir 1Jik(n)

(2)

1

=

n2 k - (2k + 1) 2 2(21 -1) B 1 n2 k- 2 + (2k + 1)4 2(23 -1) B2 n2 k-4 - (2k + 1) 6 2(25 -1) B 3 n2 k-6 + ....

Maintenant developpons les deux membres de l'identite (1) suivant les puissances de z, et egalons les coefficients de z2 ; nous trouvons

nr-l{[tp(x)Y+ [tp(x+ (3)

!)r+ ... + [tp(x+ n;1)n

=[tp(nx)Y+ ~ (r) 21JI1 (n)[tp(nx)Y- 2 +

! (r)41JI2(n)[tp(nx)]r-4+. ·...

C'est l'equation generale demandee par M. Franel. En effet, la fonction lfl (x) etant definie par les equations

tp1 (x + 1) = tp1 (x) et tp1 (x) = tp(x) pour 0 < x < 1, l'equation (3) subsiste, si l'on remplace tp(x) par. tp1 (x), comme au lieu de x. La fonction f(x) de on le voit aisement en ecrivant ~ n M. Franel est egale a ~ tp1 (x). Pour n = 1, 2, 3, l'equation (3) donne bien les formules mentionnees par M. Franel.

Lösungen.

747

801. (T. III, 1896, p. 80.)

Dans sa. preface de la. Theorie des nombres (p. XII), Ed. Luca.s annonce qu'il possMe une methode permettant de reconnaitre dans certains cas si des nombres de 20 ou 30 chiffres sont ou non premiers. 11 enonce en meme temps cette proposition: Pour que le nombre 2 211 + 1 soit premier, il fa.ut et il auffit qu'il divise le nombre 322'1

+1

Quelqu'un peut-il me dire si cette methode de Lucas a ete publiee, ou en quoi elle consiste? Quand au theoreme cite, il ne me semble pas exact tel qu'il est enonce. Comment devrait-il etre ? E.-B. ESCOTT (Chicago).

(T. III, 1896, p. 214.)

L'expression exacte du theoreme de Lucas est la suivante: Pour que le nombre p = 2• + 1 soit un nombre premier, il faut et il suffit qu'il divise 32.-1 + 1. On suppose que l'exposant v est une puissance de 2. Voici une demonstration du theoreme: 1° Supposons que p = 2• + 1 soit premier. Comme p = 1 (mod.4), on a

(!) = (:) = (!) = -1;

par consequent 3"!1 = -1 (mod.p), de sorte que 32 ,...1 + 1 est divisible parp; 2° Supposons que 32•-l + 1 soit divisible par p = 2• + 1. Nous aurons :IJ-1

3-z = -1 (mod.p), d'ou l'on conclut aiserneut que p -1 est le plus petit exposant b pour lequel on a 3"=1 (mod. p). Ainsi, d'apres le theoreme de Fermat generalise, p-1 est diviseur de q;(p). Et, comme q;(p)~p-1, on a q;(p)=p-1, d'ou resulte que p est premier. D'une maniere semblable, on demontre plusieurs theoremes analogues. Je me contente de remarquer que la seconde partie du theor{mie de Lucas est un cas special du theoreme suivant, qui decoule immediaterneut de la theorie de la division du cercle. "Designons par Fn(x) le facteur irreductible de degre q;(n) de xn-1. S'il existe un nombre entier q satisfaisant a la condition que F f>-l (q) soit divisible par p, le nombre p est premier." Pour p = 2• + 1, on a Fp-t (x) = x2v-1 + 1.

748

.Anhang.

1459. (T. VI, 1899, p. 32.) Dans l'Introduction des Recreations mathematiques de E. Lucas, on lit que M. S. Roberts a. demontre que le produit de deux sommes de 2n ca.rres n'est pa.s une somme de 2ß ca.rres pour n > 3. Ou se trouve cette demonstra.tion? G. FONTENE. (T. VII, 1900, p. 21.)

Aux citations contenues dans le numero de septerobre 1899, je me permets d'ajouter que je me suis occupe, dans une note publiee en 1898 (Nachrichten von der k. Gesellschaft der Wissenschaften zu Göttingen, Math.-phys. Klasse, S. 309-316) [ces Oeuvres, vol. II, p. 565-571] du problerne suivant: «Determiner n fonctions bilineaires z1 , z2 , ••• , Zn des 2 n variables xl, x2, ... , Xn, Yu Y2• ... , Yn satisfaisant identiquement a l'equation

(xi + ~ +· · · + x!) (yi + · · · + Y!) = (zi + ~ + · · · + z!) . » J'ai demontre que le problerne n'a de solutions que dans les cas n = 2,4,8 et j'ai determine toutes les solutions du problerne dans ces cas. Les recherches anteneures relativesau meme problerne (Roberts, Cayley, etc.) me sembleut insuffisantes. 2993. (T. XIII, 1906, p. 5.) M. K Lucas dit da.ns sa. Theorie des nombres (p. 126): «Le produit d'une somme de qua.tre carres pa.r une somme de quatre carres est une somme de quatre carres~. puis que «Brioschi a donne une formule semblable pour la somme de huit carres». Mais M. Samuel Ro berts a demontre qu'il n'existait pa.s de formules analogues pour la somme de seize carres au plus (The Quarterly Journal, 1879 et 1880); tandis que M. Le besgue, dans son Introduction 8. la theorie des nombres (p. 65) dit.: «La proposition s'etend au produit de la somme de 2"' ca.rres par celle de 2m ca.rres qui est aussi formoo de 2m carres comme l'a montre Angelo Genoechi» (Aunali di Matematica., t. 3, No. 4). M. Escott, en reponse 8. la question 2846 (vol. 11, 1904, p. 262), au Cahier d'aout 1905 (p. 182), attribue Ia generalisa.tion de cette proposition ä. Cayley. Qui a raison ? PLAKHOVO (Tambow, Russie). (T. XIII, 1906, p. 128.)

Dans un article intitule: Über die Komposition der quadratischen Formen von beliebig vielen Variabeln (Nachrichten der k. Gesellschaft

749

Lösungen.

der Wissenschaften zu Göttingen, 1898, p. 309-316) [ces Oeuvres, vol. II, p. 565-571] j'ai demontre que le produit de deux sommes de n carres (a1 + ~ + ···+ x;)(lft + y~ + ···+ y!) ne peut etre la somme de n carres dont les bases sont des formes bilineaires des variables x1 , x2 , ••• , Xn, y 11 •• • , y., que dans les cas n = 2, 4, 8. Les demonstrations de Ro berts et Cayley ainsi que les formules de Genocchi sont erronees.

3011.

r r

(T. XIII, 1906, p. 34.) Vers quelle forme tend la courbe (:

+ (~

= 1 lorsque n t.end vers l'infini? E. N. BAR.ISIEN.

r rt

(T. XIII, 1906, p. 169.)

= 1 tend vers les cötes X = a, y = b du La courbe (: + ( y = b lorsque n tend vers l'infini positif 0, = y a, = x 0, reetangle x = et les prolongements de ces cötes lorsque n tend vers l'infini negatif. Cela decoule immediaterneut des equations

3019. (T. XIII, 1906, p. 36.) Lorsqu'on donne cinq points dans un plan, l'on sait que, si l'on prend un sixieme point sur la conique determinee par lesdits cinq les points, trois couples de cötes opposes de l'hexagone ainsi obtenu se coupent en trois points a:, ß, y situes en ligne droite, c'estA-dire de maniere que l'aire du triangle a:, ß, y est egale A zero. Or, je me demande, etant donnes cinq points dans un plan, comment on devra prendre sur le plan un sixieme point afin que l'aire LI a:ßy soit plus grande, egale ou plus petite qu'une quantite donnre? J'ai reerschiedenen Inhalts. - Verschiedene Orte, 1879---1919. Es enthalten wohl auch die Vorlesungen von Hurwitz, seine Aufgabensammlungen usw. interessantes Material, jedoch den wertvollsten Teil der Manuskripte bilden zweifelsohne die Tagebücher. Sie umfassen 31 Hefte, welche die Bibliotheknummern 77706/1-31 tragen; der dazu gehörige Registerband hat die Nummer 77706/33. Der Inhalt dieser Tagebücher ist sehr mannigfaltig. Sie zeigen die zur Veröffentlichung gelangten Untersuchungen von Hurwitz in verschiedenen Entwicklungsstadien, und daneben zahlreiche andere, zum Teil sehr ausgedehnte Untersuchungen, die vor Erreichen eines Endzieles abgebrochen werden mussten oder aus sonstigen Gründen nicht zur Veröffentlichung gelangten. Neben schwierigeren und längeren Untersuchungen finden sich auch kürzere Bemerkungen, Übungen, Aufgaben, dann Fragestellungen, Themata für Doktor- und Diplomarbeiten, Kopien von Briefen, Aufzeichnungen über mathematische Gespräche, Literaturauszüge usw. Einige Hefte, die hier der Kürze halber den Tagebüchern beigezählt wurden, sind ganz Literaturauszügen gewidmet, die zu sorgfältigen, ausführlichen, tiefeindringenden Analysen aUBgearbeitet sind, von welchen die Beiträge von Hurwitz an das Jahrbuch über die Fortschritte der Mathematik nur eine angenäherte Vorstellung geben können. Weniger als der Inhalt variiert die Form der Tagebücher. Fast alles ist sauber und verständlich geschrieben, das meiste ist in übersichtlicher Weise angeordnet, und manches ist formvollendet, abgerundet formuliert. Es gibt auch einige hastig hingeworfene Seiten oder Seiten nur mit Rechnungen, ohne verbindenden Text, aber solche weniger vollkommen abgefasste Teile sind verhältnismässig selten. Zwei Stichproben aus den Tagebüchern liegen dem Leser in dem gegenwärtigen II. Band der Werke vor: Eine druckreife (und von Hurwitz für den Druck bestimmte) Stelle auf S. 609, und der summarische Auszug aus einigen weniger vollkommen abgefassten und wohl auch weniger wichtigen Seiten auf S. 590. Als eine weitere Stichprobe sei hier die folgende kurze, charakteristische Stelle abgedruckt [aus dem letzten Tagebuch, begonnen Mai 1918, S. 72, unter dem Datum 6. Dezember 1918]:

Funktionentheoretische Frage. Warum ist es nicht möglich, dass eine Potenzreihe P(x) = a0 + a1 x + a 2 x 2 + ihre abgeleitete Reihe P'(x) = a 1 + 2 a2 x + · · · zur Fortsetzung besitzt, wobei natürlich diese Fortsetzung eine indirekte wäre?

Über den handschriftlichen Nachlass.

753

Von denjenigen Gegenständen, auf welche die Tagebücher lange Jahre hindurch immer wieder und wieder zurückkommen, sei hier als Beispiel nur die Riemann'sche C-Funktion hervorgehoben; in den veröffentlichten Arbeiten von Burwitz wird dieser Gegenstand wohl nicht einmal erwähnt. Schon früh hat H urwi t z den Weg zur Riem ann. sehen Vermutung versucht, den einige Jahre später auch J ensen, ebenfalls ergebnislos versucht hat: Er untersucht die von Riemann gegebene Darstellung der ~-Funktion durch ein trigonometrisches Integral, er findet einige Eigenschaften der darin auftretenden Funktion, der "Fourier'schen Transformierten" von ~ (t), insbesondere dass sie eine stets positive, gerade Funktion ist. [Vgl. Tagebuch vom 23. Februar 1899 bis Ende 1900, S. 112-115: "Darstellung der Riemann'schen Funktion ~(t)", und G. P6lya, Über die algebraisch-funktionentheoretischen Untersuchungen von J. L. W. V. Jensen, Det Kgl. Danske Videnskabernes Selskab, Matema.tisk-fysiske Meddelelser, Bd. 7 (1927) Nr.17, insbesondere Fussnote10 ) auf S.11.] Er versucht nun wiederholt, diese Darstellung umzuformen, anzunähern, darauf allgemeine Kriterien über Wurzelrealität anzuwenden usw. [Eine charakteristische Berührungsstelle mit Jensen enthält das Tagebuch vom 1. Februar 1906 bis 8. Dezember 1906, S. 27-28, unter dem Datum 17. Februar 1906.] Das Ziel war jedoch unerreichbar. Nun war Burwitz von demjenigen Mathema.tikertypus, der bei ernstlicher Einsetzung seiner Kräfte immer etwas erreicht, wenn nicht das ursprünglich ins Auge gefasste Ziel, so doch etwas Interessantes auf den Seitenwegen. Zwei Nebenresultate seiner Bemühungen um die C-Funktion sind durch mündliche Mitteilungen in die mathematische Öffentlichkeit gelangt: Das eine ist eine schöne Fragestellung über ganze transzendente Funktionen mit nur reellen Nullstellen, welche, von 0. Toeplitz in verschärfter Form an J. Grommer weiter vermittelt, durch diesen im Rahmen einer tiefgehenden Untersuchung gelöst wurde. [Vgl. das Tagebuch vom 1. Februar 1906 bis 8. Dezember 1906, S. 29-37, und J. Grommer, Ganze transzendente Funktionen mit lauter reellen Nullstellen, Journal für die reine und angewandte Mathematik, Bd. 144 (1914), S. 114-165, insbesondere die Fussnote auf S.115.] Das andere Nebenresultat ist wohl weniger wichtig: Es ist ein hübscher Satz über trigonometrische Integrale mit nur reellen Nullstellen. [Vgl. Tagebuch vom 23. Februar bis Ende 1900, S. 115, und G. P6lya, Über die Nullstellen gewisser ganzer Funktionen, Mathematische Zeitschrift, Bd. 2 (1918), S. 352-383, insbesondere S. 368---371.] Wohl wird noch in den Tagebüchern manches hübsche Einzelresultat, mancher entwicklungsfähige Anregungskeim zu finden sein. Es mag hier erwähnt werden, dass zwei neuerdings der Eidgenössischen Technischen Hochschule eingereichte Dissertationen Anregungen verfolgen, die von unveröffentlichten, den Tagebüchern entnommenen Sätzen von Burwitz ausgegangen sind. [Vgl. das Tagebuch vom 23. Februar 1899 bis Ende 1900, S. 170, und A. Stoll, Über den Kappenkörper eines konvexen Körpers, Commentarii mathematici helvetici, Bd. 2 (1930), S. 35-68, insbesondere S. 36 und S. 44; ferner das Tagebuch vom 20. März 1898 bis 23. Februar 1899, S.139-143, das Tagebuch vom 1. Mai 1914 bis 15. Februar 1915, S. 21-23, und R. Jungen, Sur les series de Taylor n'ayant que des singularites algebrico-loga.rithmiques sur leur cercle de convergence, dieselben Commentarii, Bd. 3 (1931) S. 266-306, insbesondere S. 299.] Für diejenigen, die Burwitz noch persönlich kannten, sind die vielen vergilbten, sauber und sorgfältig geschriebenen Seiten seiner Tagebücher ein menschlich bewegendes Abbild seiner Persönlichkeit, seiner unermüdlichen, von Liebe und Pflichttreue getragenen stillen Gelehrtenarbeit, seines tiefen Bedürfnisses nach Wahrheit und Klarheit. G.P.

VII.

Verzeichnis. der der Eidgenössischen Technischen Hochschule und der Universität Zürich eingereichten, von Adolf Hurwitz begutachteten Dissertationen 1 ). Gottfried Schlumberger, Über n-dimensionale lineare und quadratische Kugelsysteme, 1896. Ernst Amberg, Über den Körper, dessen Zahlen sich rational aus zwei Quadratwurzeln zusammensetzen, 1897. Kar! Matter, Die den Bernoulli'schen Zahlen analogen Zahlen im Körper der dritten Einheitswurzel, 1900. Otto Bohler, Über die Picard'schen Gruppen aus dem Zahlkörper der dritten und der vierten Einheitswurzel, 1905. Adolf Hess, Stetige Abbildung einer Linie auf ein Quadrat, 1905. L. Gustave du Pasquier, Zahlentheorie der Tettarionen, 1906. Alfred Kienast, Über die Darstellung der analytischen Funktionen durch Reihen, die nach Potenzen eines Polynoms fortschreiten und Polynome eines niedereren Grades zu Koeffizienten haben, 1906. Henri Kreis, Contribution

a Ia theorie des systemes lim)aires, 1906.

Ernst Meissner, Über die zahlentheoretischen Formeln Liouville's, 1907. Samuel Dumas, Sur le developpement des fonctions elliptiques en fractions continues, 1908. Eugene Chatelin, Relations entre les nombres de classes dans les differents ordres de formes binaires quadratiques d'un deternlinant donne, 1908. Eugene Robert, Composition des formes quadratiques de quatre et de huit variables independantes, 1912. Emile Marchand, Sur les theoremes de Sylvester et Ia regle de Newton, dans Ia theorie des equations algebriques a coefficients reels, 1913. Jakob Klotz, Anzahl der Lösungen einer quadratischen Congruenz in einem beliebigen endlichen algebraischen Zahlkörper, 1913. 1 ) Von Adolf Hurwitz angeregt wurde ferner die folgende, der Universität Lausanne eingereichte Dissertation: Charlotte W edell, Application de Ia theorie des fonctions elliptiques a Ia Solution du problerne de Malfatti, 1897.

Verzeichnis der Dissertationen.

755

Fernand Levy, Sur la determination par les fonctions elliptiques du nombre des classes de formes quadratiques binaires de determinant negatü donne, 1914. Charles Vuille, Sur les zeros des polynömes hypergeometriques et des polynömes de Stieltjes, 1916. Otto Pfenninger, Über die arithmetische Begründung der Klassenzahlrelationen, 1917. Heinrich Frick, Über den Zusammenhang der Perioden quadratischer Formen positiver Determinante mit der Zerlegung einer Zahl in die Summe zweier Quadrate, 1918. Adolf Widmer, Über die Anzahl der Lösungen gewisser Kongruenzen nach einem Primzahlmodul, 1919. Henri Lauer, Sur la reduction des formes positives d'Hermite, 1919. Rudolf Hiltbrunner, Über Invarianten von Punktsystemen, 1919.