Introduction à la théorie analytique et probabiliste des nombres [4 ed.] 9782701185033

Introduction à la théorie analytique et probabiliste des nombresSolide initiation aux méthodes analytiques et probabilis

189 82 4MB

French Pages 592 [594] Year 2015

Report DMCA / Copyright

DOWNLOAD FILE

Polecaj historie

Introduction à la théorie analytique et probabiliste des nombres [4 ed.]
 9782701185033

Table of contents :
Table des matières
Avant-propos
Notations
TOME I : MÉTHODES ÉLEMENTAIRES
Chapitre 0. QUELQUES OUTILS D’ANALYSE REELLE
0.1 La sommation d’Abel
0.2 La formule sommatoire d’Euler–Maclaurin
Exercices
Chapitre 1. LES NOMBRES PREMIERS
1.1 Introduction
1.2 Les estimations de Tchébychev
1.3 Valuation p-adique de n!
1.4 Le premier théorème de Mertens
1.5 Deux nouvelles formules asymptotiques
1.6 La formule de Mertens
1.7 Un autre théorème de Tchébychev
Notes
Exercices
Chapitre 2. FONCTIONS ARITHMÉTIQUES
2.1 Définitions
2.2 Exemples
2.3 Séries de Dirichlet formelles
2.4 L’anneau des fonctions arithmétiques
2.5 Les formules d’inversion de Möbius
2.6 La fonction de von Mangoldt
2.7 La fonction indicatrice d’Euler
Notes
Exercices
Chapitre 3. ORDRES MOYENS
3.1 Introduction
3.2 Le problème de Dirichlet et le principe de l’hyperbole
3.3 La fonction somme des diviseurs
3.4 La fonction indicatrice d’Euler
3.5 Les fonctions ω et Ω
3.6 Fonction de Möbius et fonctions de Tchébychev
3.7 Entiers sans facteur carre
3.8 Moyenne d’une fonction multiplicative a valeurs dans [0,1]
Notes
Exercices
Chapitre 4. MÉTHODES DE CRIBLE
4.1 Le crible d’Eratosthène
4.2 Le crible combinatoire de Brun
4.3 Application aux nombres premiers jumeaux
4.4 Le grand crible—forme analytique
4.5 Le grand crible—forme arithmétique
4.6 Applications du grand crible
4.7 Le crible de Selberg
4.8 Sommes de deux carres dans un intervalle
Notes
Exercices
Chapitre 5. ORDRES EXTRÉMAUX
5.1 Introduction et définitions
5.2 La fonction τ(n)
5.3 Les fonctions ω(n) et Ω(n)
5.4 La fonction d’Euler φ(n)
5.5 Les fonctions σ_κ(n), κ > 0
Notes
Exercices
Chapitre 6. LA MÉTHODE DE VAN DER CORPUT
6.1 Introduction et rappels
6.2 Intégrales trigonométriques
6.3 Sommes trigonométriques
6.4 Application au théorème de Voronoï
6.5 Équirépartition modulo 1
Notes
Exercices
Chapitre 7. APPROXIMATION DIOPHANTIENNE
7.1 De Dirichlet a Roth
7.2 Meilleures approximations, fractions continues
7.3 Propriétés du développement en fraction continue
7.4 Développement en fraction continue des irrationnels quadratiques
Notes
Exercices
TOME II : MÉTHODES D’ANALYSE COMPLEXE
Chapitre 0. LA FONCTION GAMMA D’EULER
0.1 Définitions
0.2 Formule du produit de Weierstrass
0.3 Fonction Bêta
0.4 Formule de Stirling complexe
0.5 La formule de Hankel
Exercices
Chapitre 1. FONCTIONS GÉNERATRICES : SÉRIES DE DIRICHLET
1.1 Séries de Dirichlet convergentes
1.2 Séries de Dirichlet des fonctions multiplicatives
1.3 Propriétés analytiques fondamentales des séries de Dirichlet
1.4 Abscisse de convergence et valeur moyenne
1.5 Une application arithmétique : le noyau d’un entier
1.6 Ordre de grandeur dans les bandes verticales
Notes
Exercices
Chapitre 2. FORMULES DE SOMMATION
2.1 Formules de Perron
2.2 Applications : deux théorèmes de convergence
2.3 Formule de la valeur moyenne
Notes
Exercices
Chapitre 3. LA FONCTION ZÊTA DE RIEMANN
3.1 Introduction
3.2 Prolongement analytique
3.3 Équation fonctionnelle
3.4 Approximations et majorations dans la bande critique
3.5 Première localisation des zéros
3.6 Lemmes d’analyse complexe
3.7 Répartition globale des zéros
3.8 Développement en produit de Hadamard
3.9 Régions sans zéros
3.10 Majorations de ζ'/ζ , 1/ζ et log ζ
Notes
Exercices
Chapitre 4. LE THÉORÈME DES NOMBRES PREMIERS ET L’HYPOTHÈSE DE RIEMANN
4.1 Le théorème des nombres premiers
4.2 Hypothèses minimales
4.3 L’hypothèse de Riemann
4.4 Formule explicite pour ψ(x)
Notes
Exercices
Chapitre 5. LA MÉTHODE DE SELBERG–DELANGE
5.1 Puissances complexes de ζ(s)
5.2 Le résultat principal
5.3 Démonstration du Théorème 5.2
5.4 Une variante du théorème principal
Notes
Exercices
Chapitre 6. DEUX APPLICATIONS ARITHMÉTIQUES
6.1 Entiers ayant k facteurs premiers
6.2 Répartition des diviseurs en moyenne : loi de l'arcsinus
Notes
Exercices
Chapitre 7. THÉORÈMES TAUBÉRIENS
7.1 Introduction. Dualité théorèmes abéliens/taubériens
7.2 Le théorème de Tauber
7.3 Les théorèmes de Hardy–Littlewood et Karamata
7.4 Le terme d’erreur dans le théorème de Karamata
7.5 Le théorème d’Ikehara
7.6 L’inégalité de Berry–Esseen
7.7 L’holomorphie comme condition taubérienne
7.8 Théorèmes taubériens arithmétiques
Notes
Exercices
Chapitre 8. NOMBRES PREMIERS EN PROGRESSIONS ARITHMÉTIQUES
8.1 Introduction. Caractères de Dirichlet
8.2 Séries L. Le théorème de la progression arithmétique
8.3 Minoration de |L(s,χ)| pour σ ≥ 1. Preuve du Théorème 8.16
8.4 L’équation fonctionnelle des fonctions L(s,χ)
8.5 Formule du produit de Hadamard et régions sans zéro
8.6 Formules explicites pour ψ(x;χ)
8.7 Le théorème des nombres premiers en progressions arithmétiques
Notes
Exercices
TOME III : MÉTHODES PROBABILISTES
Chapitre 1. DENSITÉS
1.1 Définitions. Densité naturelle
1.2 La densité logarithmique
1.3 La densité analytique
1.4 La théorie probabiliste des nombres
Notes
Exercices
Chapitre 2. LOI DE RÉPARTITION D’UNE FONCTION ARITHMÉTIQUE
2.1 Définition—fonctions de répartition
2.2 Fonctions caractéristiques
Notes
Exercices
Chapitre 3. ORDRE NORMAL
3.1 Définition
3.2 L’inégalité de Turán–Kubilius
3.3 Forme duale de l’inégalité de Turán–Kubilius
3.4 Le théorème de Hardy–Ramanujan et autres applications
3.5 Majorations effectives de sommes de fonctions multiplicatives
3.6 Structure normale de la suite des facteurs premiers d’un entier
Notes
Exercices
Chapitre 4. FONCTIONS ADDITIVES ET MULTIPLICATIVES
4.1 Le théorème d’Erdős–Wintner
4.2 Le théorème de Delange
4.3 Le théorème de Halász
4.4 Le théorème d’Erdős–Kac
Notes
Exercices
Chapitre 5. ENTIERS FRIABLES. LA MÉTHODE DU COL
5.1 Introduction. La méthode de Rankin
5.2 La méthode géométrique
5.3 Équations fonctionnelles
5.4 La fonction de Dickman
5.5 Approximations de Ψ(x,y) par la méthode du col
5.6 La fonction de Jacobsthal et le théorème de Rankin
Notes
Exercices
Chapitre 6. ENTIERS SANS PETIT FACTEUR PREMIER
6.1 Introduction
6.2 Équations fonctionnelles
6.3 La fonction de Buchstab
6.4 Approximations de Φ(x,y) par la méthode du col
6.5 Le modèle de Kubilius
Notes
Exercices
Index

Citation preview

ÉCHELLES Collection

Introduction à la théorie analytique et probabiliste des nombres 4e édition mise à jour

ÉCHELLES Collection

Introduction à la théorie analytique et probabiliste des nombres 4e édition mise à jour Gérald

Tenenbaum

8, rue Férou 75278 Paris cedex 06 www.editions-belin.com

La collection « Échelles » Privilégiant les savoirs les plus actuels, la collection « Échelles » propose des ouvrages scientifiques rédigés par des auteurs qui font autorité dans leur domaine. Par la présentation simple de questions réputées complexes, elle exprime une certaine idée de l’enseignement des sciences, en relation étroite avec le monde de la recherche et de ses applications. La collection « Échelles » s’adresse à l’étudiant en master 1 et 2, au doctorant comme au chercheur ou à l’ingénieur. Elle est dirigée par Michel Laguës (École supérieure de physique et chimie industrielles-ESPCI) et Annick Lesne (CNRS et Institut des hautes études scientifiques-IHÉS).

Dans la même collection Morphogenèse, L’origine des formes, Annick Lesne, Paul Bourgine (sous la direction de), 2006. Liquides, Solutions, dispersions, émulsions, gels, Bernard Cabane et Sylvie Hénon, 2003, 2e édition revue et augmentée, 2007. Les nanosciences, 3. Nanobiotechnologies et nanobiologie, Catherine Brechignac, Philippe Houdy, Marcel Lahmani (sous la direction de), 2007. Polymères, La matière plastique, Jean-Pierre Cohen-Addad, 2007. Physique statistique, Chaos et approches multiéchelles, Patrizia Castiglione, Massimo Falcioni, Annick Lesne, Angelo Vulpiani, 2008. Architectures de la matière molle, Des films de savons aux membranes biologiques, Jean Charvolin, 2008. Invariances d’échelle, Des changements d’états à la turbulence, Annick Lesne, Michel Laguës, 2003, 2e édition revue et augmentée, 2008. Mécanique des matériaux polymères, Jean-Louis Halary, Francoise Lauprêtre, Lucien Monnerie, 2008. Les nanosciences, 1. Nanotechnologies et nanophysique, Catherine Brechignac, Philippe Houdy, Marcel Lahmani (sous la direction de), 2004, 3e édition revue et augmentée, 2009. Les mousses, Structure et dynamique, Isbelle Cantat, Sylvie Cohen-Addad, Florence Elias, François Graner, Reinhard Höler, Olivier Pitois, Florence Rouyer, Arnaud Saint-Jalmes, 2010. Les nanosciences, 4. Nanotoxicologie et nanoéthique, Catherine Brechignac, Philippe Houdy, Marcel Lahmani (sous la direction de), 2010. Les nanosciences, 2. Nanomatériaux et nanochimie, Catherine Brechignac, Philippe Houdy, Marcel Lahmani (sous la direction de), 2006, 2e édition revue et augmentée, 2012. Cosmologie primordiale, Jean-Philippe Uzan, Patrick Peter, 2005, 2e édition revue et augmentée, 2012. Eléments d’analyse avancée, 1. Espaces de Hardy, Nikolai Nikolski, 2012. Théorie élémentaire des feuilletages holomorphes singuliers, Felipe Cano Torres, Dominique Cerveau, Julie Déserti, 2013. Acoustique des instruments de musique, 2008, 2e édition revue et augmentée, 2013. Science culinaire, Matière, procédés, dégustation, Christophe Lavelle (sous la direction de), 2013. Théorie de la relativité, Jean-Philippe Uzan, Nathalie Deruelle, 2014. Nanosciences et nanotechnologies, Evolution ou révolution ?, Jean-Michel Lourtioz, Marcel Lahmani, Claire Dupas-Haeberlin, Patrice Hesto (sous la direction de), 2014. Théorie analytique et probabiliste des nombres, 307 exercices corrigés, Gérald Tenenbaum, Jie Wu, 2014. Couverture: Euclide dessinant sur une ardoise, détail de Raphaël, L’École d’Athènes, 1508-11, Musée du Vatican, Rome. © akg-image/Erich Lessing. Schémas : Orou Mama Le code de la propriété intellectuelle n’autorise que « les copies ou reproductions strictement réservées à l’usage privé du copiste et non destinées à une utilisation collective » [article L. 122-5] ; il autorise également les courtes citations effectuées dans un but d’exemple ou d’illustration. En revanche « toute représentation ou reproduction intégrale ou partielle, sans le consentement de l’auteur ou de ses ayants droit ou ayants cause, est illicite » [article L. 122-4]. La loi 95-4 du 3 janvier 1994 a confié au C.F.C. (Centre français de l’exploitation du droit de copie, 20, rue des Grands-Augustins, 75006 Paris), l’exclusivité de la gestion du droit de reprographie. Toute photocopie d’œuvres protégées, exécutée sans son accord préalable, constitue une contrefaçon sanctionnée par les articles 425 et suivants du Code pénal.

© Éditions Belin, 2015

ISBN 978-2-70-118503-3

À Catherine Jablon, pour la douceur du jour, ce bouquet de symboles dont ta conversation éclaire les secrets.

TABLE

DES MATIÈRES

Avant-propos

12

Notations

14

T OME I : M ÉTHODES

ÉLÉMENTAIRES

17

Chapitre 0 Q UELQUES OUTILS D ’ ANALYSE RÉELLE . . . . . . . . . . . . . . . . . . . . . . . . . 0.1 La sommation d’Abel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0.2 La formule sommatoire d’Euler–Maclaurin . . . . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

19 19 21 24

Chapitre 1 L ES NOMBRES PREMIERS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Les estimations de Tchébychev . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Valuation p-adique de n! . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4 Le premier théorème de Mertens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.5 Deux nouvelles formules asymptotiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.6 La formule de Mertens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.7 Un autre théorème de Tchébychev. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Notes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

27 27 28 31 31 33 34 36 37 38

Chapitre 2 F ONCTIONS ARITHMÉTIQUES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 2.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 2.2 Exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 2.3 Séries de Dirichlet formelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 2.4 L’anneau des fonctions arithmétiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 2.5 Les formules d’inversion de Möbius . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 2.6 La fonction de von Mangoldt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 2.7 La fonction indicatrice d’Euler. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 Notes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 Chapitre 3 O RDRES MOYENS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 3.2 Le problème de Dirichlet et le principe de l’hyperbole . . . . . . . . . . . . . . . 58 3.3 La fonction somme des diviseurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 3.4 La fonction indicatrice d’Euler. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

TABLE DES MATIÈRES

3.5 Les fonctions ω et  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.6 Fonction de Möbius et fonctions de Tchébychev . . . . . . . . . . . . . . . . . . . . . 3.7 Entiers sans facteur carré . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.8 Moyenne d’une fonction multiplicative à valeurs dans [0,1] . . . . . . . . . . Notes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

7

62 63 66 67 70 72

DE CRIBLE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

78

Le crible d’Ératosthène . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Le crible combinatoire de Brun . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Application aux nombres premiers jumeaux . . . . . . . . . . . . . . . . . . . . . . . . . Le grand crible — forme analytique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Le grand crible — forme arithmétique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Applications du grand crible . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Le crible de Selberg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2 Fonctions arithmétiques de plusieurs variables . . . . . . . . . . . . . . . . . 7.3 Convolution généralisée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.4 Formes quadratiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.5 Le crible à puissances de Johnsen–Selberg . . . . . . . . . . . . . . . . . . . . . 4.8 Sommes de deux carrés dans un intervalle . . . . . . . . . . . . . . . . . . . . . . . . . . . Notes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

78 79 82 83 89 92 94 94 95 96 99 101 105 109 114

Chapitre 5 O RDRES EXTRÉMAUX . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1 Introduction et définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2 La fonction τ (n) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3 Les fonctions ω(n) et (n) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.4 La fonction d’Euler ϕ (n) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.5 Les fonctions σκ (n), κ > 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Notes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

119 119 120 122 122 123 126 127

Chapitre 6 L A MÉTHODE DE VAN DER C ORPUT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.1 Introduction et rappels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2 Intégrales trigonométriques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3 Sommes trigonométriques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4 Application au théorème de Voronoï . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

130 130 131 132 138

6.5 Équirépartition modulo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1 Définition, discrépance, critère de Weyl . . . . . . . . . . . . . . . . . . . . . . . . 5.2 L’inégalité d’Erdos–Turán. ˝ ...................................... Notes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

140 140 142 144 147

Chapitre 4 M ÉTHODES 4.1 4.2 4.3 4.4 4.5 4.6 4.7

8

TABLE DES MATIÈRES

Chapitre 7 A PPROXIMATION DIOPHANTIENNE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.1 De Dirichlet à Roth . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2 Meilleures approximations, fractions continues . . . . . . . . . . . . . . . . . . . . . . 7.3 Propriétés du développement en fraction continue . . . . . . . . . . . . . . . . . . . 7.4 Développement en fraction continue des irrationnels quadratiques . . Notes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

152 152 154 159 162 165 166

T OME II : M ÉTHODES

173

D ’ ANALYSE COMPLEXE

Chapitre 0 L A FONCTION G AMMA D ’E ULER . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0.2 Formule du produit de Weierstrass . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0.3 Fonction Bêta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0.4 Formule de Stirling complexe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0.5 La formule de Hankel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

175 175 177 178 180 184 186

Chapitre 1 F ONCTIONS GÉNÉRATRICES : SÉRIES DE D IRICHLET . . . . . . . . . . . . 1.1 Séries de Dirichlet convergentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Séries de Dirichlet des fonctions multiplicatives . . . . . . . . . . . . . . . . . . . . . 1.3 Propriétés analytiques fondamentales des séries de Dirichlet . . . . . . . . 1.4 Abscisse de convergence et valeur moyenne . . . . . . . . . . . . . . . . . . . . . . . . . 1.5 Une application arithmétique : le noyau d’un entier . . . . . . . . . . . . . . . . . 1.6 Ordre de grandeur dans les bandes verticales . . . . . . . . . . . . . . . . . . . . . . . . Notes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

190 190 191 192 198 200 202 206 213

Chapitre 2 F ORMULES DE SOMMATION . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1 Formules de Perron . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Applications : deux théorèmes de convergence . . . . . . . . . . . . . . . . . . . . . . 2.3 Formule de la valeur moyenne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Notes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

218 218 224 225 227 228

Chapitre 3 L A FONCTION ZÊTA DE R IEMANN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Prolongement analytique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3 Équation fonctionnelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4 Approximations et majorations dans la bande critique . . . . . . . . . . . . . . . 3.5 Première localisation des zéros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.6 Lemmes d’analyse complexe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.7 Répartition globale des zéros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.8 Développement en produit de Hadamard . . . . . . . . . . . . . . . . . . . . . . . . . . . .

230 230 231 233 234 237 238 241 243

TABLE DES MATIÈRES

9

3.9 Régions sans zéros. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.10 Majorations de ζ ′ /ζ , 1/ζ et log ζ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Notes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

245 246 249 252

Chapitre 4 L E THÉORÈME DES NOMBRES PREMIERS ET L’ HYPOTHÈSE DE R IEMANN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1 Le théorème des nombres premiers. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Hypothèses minimales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3 L’hypothèse de Riemann. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4 Formule explicite pour ψ (x) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Notes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

259 259 260 262 265 269 272

Chapitre 5 L A MÉTHODE DE S ELBERG –D ELANGE . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1 Puissances complexes de ζ (s) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2 Le résultat principal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3 Démonstration du Théorème 5.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.4 Une variante du théorème principal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Notes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

274 274 277 279 282 286 288

Chapitre 6 D EUX APPLICATIONS ARITHMÉTIQUES . . . . . . . . . . . . . . . . . . . . . . . . . . 6.1 Entiers ayant k facteurs premiers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2 Répartition des diviseurs en moyenne : loi de l’arcsinus . . . . . . . . . . . . . Notes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

294 294 300 305 308

Chapitre 7 T HÉORÈMES TAUBÉRIENS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.1 Introduction. Dualité théorèmes abéliens/taubériens . . . . . . . . . . . . . . . . . 7.2 Le théorème de Tauber . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.3 Les théorèmes de Hardy–Littlewood et Karamata . . . . . . . . . . . . . . . . . . . . 7.4 Le terme d’erreur dans le théorème de Karamata . . . . . . . . . . . . . . . . . . . . 7.5 Le théorème d’Ikehara . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.6 L’inégalité de Berry–Esseen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.7 L’holomorphie comme condition taubérienne . . . . . . . . . . . . . . . . . . . . . . . . 7.8 Théorèmes taubériens arithmétiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Notes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

311 311 313 315 320 326 332 333 337 340 345

Chapitre 8 N OMBRES PREMIERS EN PROGRESSIONS ARITHMÉTIQUES . . . . . . 8.1 Introduction. Caractères de Dirichlet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Caractères primitifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Sommes de Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4 Bornes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

349 349 349 354 355 356

10

TABLE DES MATIÈRES

8.2 Séries L. Le théorème de la progression arithmétique . . . . . . . . . . . . . . . 2.1 Séries L et progressions arithmétiques de nombres premiers . . . 2.2 Sur les nombres L(1, χ ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3 Le théorème de Siegel–Walfisz. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.3 Minoration de |L(s, χ )| pour σ  1. Preuve du Théorème 8.16 . . . . . . . 8.4 L’équation fonctionnelle des fonctions L(s, χ ) . . . . . . . . . . . . . . . . . . . . . . . 8.5 Formule du produit de Hadamard et régions sans zéro . . . . . . . . . . . . . . . 8.6 Formules explicites pour ψ (x; χ ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.7 Le théorème des nombres premiers en progressions arithmétiques . . Notes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . T OME III : M ÉTHODES

PROBABILISTES

358 358 361 363 365 371 373 378 383 388 391 397

Chapitre 1 D ENSITÉS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1 Définitions. Densité naturelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 La densité logarithmique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 La densité analytique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4 La théorie probabiliste des nombres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Notes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

399 399 402 403 404 406 407

Chapitre 2 L OI DE RÉPARTITION D ’ UNE FONCTION ARITHMÉTIQUE . . . . . . . . 2.1 Définition — fonctions de répartition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Fonctions caractéristiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Notes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

411 411 415 418 424

Chapitre 3 O RDRE NORMAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 L’inégalité de Turán–Kubilius . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3 Forme duale de l’inégalité de Turán–Kubilius . . . . . . . . . . . . . . . . . . . . . . . . 3.4 Le théorème de Hardy–Ramanujan et autres applications . . . . . . . . . . . . 3.5 Majorations effectives de sommes de fonctions multiplicatives . . . . . . . 3.6 Structure normale de la suite des facteurs premiers d’un entier . . . . . . Notes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

427 427 428 433 434 437 440 442 447

Chapitre 4 F ONCTIONS ADDITIVES ET MULTIPLICATIVES . . . . . . . . . . . . . . . . . . . 4.1 Le théorème d’Erdos–Wintner ˝ ....................................... 4.2 Le théorème de Delange . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3 Le théorème de Halász . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1 Énoncés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Lemmes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3 Preuve du Théorème 4.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4 Applications . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

453 453 458 462 462 465 467 471

TABLE DES MATIÈRES

11

4.4 Le théorème d’Erdos–Kac. ˝ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 476 Notes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 479 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 483 Chapitre 5 E NTIERS FRIABLES . L A MÉTHODE DU COL . . . . . . . . . . . . . . . . . . . . . . 5.1 Introduction. La méthode de Rankin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2 La méthode géométrique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3 Équations fonctionnelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.4 La fonction de Dickman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.5 Approximations de (x, y) par la méthode du col . . . . . . . . . . . . . . . . . . . . 5.6 La fonction de Jacobsthal et le théorème de Rankin . . . . . . . . . . . . . . . . . Notes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

488 488 493 494 499 505 514 518 526

Chapitre 6 E NTIERS SANS PETIT FACTEUR PREMIER . . . . . . . . . . . . . . . . . . . . . . . . 6.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2 Équations fonctionnelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3 La fonction de Buchstab . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4 Approximations de (x, y) par la méthode du col . . . . . . . . . . . . . . . . . . . . 6.5 Le modèle de Kubilius . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Notes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

530 530 533 537 541 550 554 559

Index . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 584

AVANT- PROPOS

Issu d’enseignements de troisième cycle donnés à Bordeaux, Paris et Nancy, ce livre (dont une version anglaise est disponible aux presses de l’American Mathematical Society) est une version révisée, mise à jour et augmentée de la troisième édition parue en 2008 aux éditions Belin. Il a été écrit dans l’intention de fournir aux jeunes chercheurs un exposé autonome d’initiation aux méthodes analytiques de l’arithmétique et, à leurs aînés, un texte de référence pour certaines questions fondamentales. Rendre compte des récentes avancées dans une cohérence méthodologique, tout en fournissant des connaissances de base ou des compléments utiles aux étudiants des seconds cycles universitaires, notamment ceux qui préparent l’agrégation, est un pari ambitieux. Les choix inhérents à la réalisation d’un tel programme ont été largement soumis à des considérations esthétiques — sans omettre les impératifs catégoriques de l’ignorance. La double motivation évoquée plus haut a conduit à un usage particulier de la traditionnelle subdivision du traité en texte/notes/exercices. Ainsi, le texte de base, s’il ne contient en règle générale que des assertions démontrées en détail, peut aussi commenter des compléments bibliographiques utiles à la mise en perspective d’une première lecture. À l’inverse, les notes font souvent une place non négligeable aux énoncés, voire aux démonstrations, de théorèmes connexes qu’une première approche peut omettre. Les exercices remplissent parallèlement une double fonction. Si certains sont dévolus, classiquement, à faciliter la maîtrise des concepts précédemment introduits, d’autres conduisent à de véritables résultats de recherche, parfois nouveaux, notamment dans le tome III. Afin de favoriser la résolution, les énoncés évitent le plus souvent les questions ouvertes, les résultats visés sont le plus souvent explicités, et les étapes essentielles dégagées. Cette partie de l’ouvrage peut donc servir, même sans fournir l’effort de la résolution ou consulter la solution, de réservoir informel de références. Le fascicule de solutions complètes, rédigé en collaboration avec mon collègue Jie Wu, contient également quelques extensions et généralisations des résultats. La rédaction a été guidée par le souci constant de privilégier les méthodes sur les résultats — une option spécifiquement heuristique. Cela a induit un découpage quelque peu artificiel du livre en trois tomes, dévolus respectivement aux méthodes élémentaires, d’analyse complexe et probabiliste. On aura beau jeu de critiquer cette taxinomie : en quoi la méthode de van der Corput, reposant sur la formule sommatoire de Poisson, estelle plus élémentaire que celle de Selberg–Delange, qui fait usage d’intégration complexe ? Pourquoi qualifier de « probabiliste » la méthode du col, dont l’étape liminaire consiste à écrire une intégrale de Laplace inverse ? etc. Les exemples d’incohérence relatifs à tel ou tel critère pourraient être multipliés, et il est patent que les choix effectués reposent sur

INTRODUCTION À LA THÉORIE ANALYTIQUE ET PROBABILISTE DES NOMBRES

13

des partis pris contestables. Pour autant, la « définition » adoptée de l’élémentarité repose sur l’exclusivité de l’emploi de la variable réelle ; et l’option d’une vision « probabiliste » de la méthode du col est étayée autant par référence à son emploi constant en théorie des probabilités qu’en regard de son utilisation arithmétique spécifique, pour la résolution de problèmes de théorie probabiliste des nombres... Autant dire que la classification opérée dans ce volume est tout sauf un choix bourbachique. Son ambition se limite au simple souhait qu’elle puisse éclairer un moment le chemin du néophyte. Sans prétendre à une complète originalité, le texte témoigne d’une volonté de sortir des voies trop fréquentées. Lorsque cela a semblé nécessaire, la présentation des résultats classiques a été revisitée : soit en empruntant des approches nouvelles (comme la méthode de Nair pour les estimations de Tchébychev), soit en introduisant, ici et là, des simplifications opératoires, invisibles à la lecture de la table des matières, mais dont un lecteur actif pourra tirer profit. Certains développements sont cependant inédits. Il s’agit, pour l’essentiel : d’une présentation du crible de Selberg sous une forme générale peu connue (§ I.4.7) ; d’une version uniforme des estimations issues de la méthode de Selberg–Delange (Chapitre II.5) ; de la version avec terme résiduel explicite du théorème d’Ikehara–Ingham–Delange (§ II.7.5) ; d’une présentation synthétique du modèle de Kubilius (§ III.6.5) ; de l’étude de la fonction de crible (x,y) par la méthode du col (Chapitre III.6). La forme effective du théorème d’Ikehara s’est révélée en étroite corrélation avec l’inégalité de Berry–Esseen — en fait, une véritable identité conceptuelle qui ne semble pas avoir été précédemment remarquée. Par ailleurs, un légitime souci de complémentarité relative à la littérature existante (notamment le beau livre d’Elliott), a pesé sur certaines options, comme le choix de la méthode de démonstration des théorèmes d’Erdos– ˝ Wintner, Erdos–Kac, ˝ ou Halász — cf. Chapitre III.4. Ce dernier résultat correspond à un développement de l’approche de Montgomery, dans une direction qu’il avait indiquée. Comme dans le cas de la répartition du noyau d’un entier (Notes du § II.1.5) ou de l’inégalité de Turán–Kubilius et de sa généralisation friable, l’influence de résultats récents a parfois induit une modification substantielle de la présentation. De nouvelles démonstrations d’énoncés classiques sont également proposées, comme pour le théorème de Tauber (§ II.7.2) ou celui de Halász (§ III.4.3). Outre l’insertion, dans les exercices, d’énoncés d’application directe et de problèmes de synthèse, les éléments destinés aux étudiants et aux futurs agrégés portent essentiellement sur des compléments concernant la formule d’Euler-Maclaurin (exercices du Chapitre I.0), une présentation élémentaire du symbole de Legendre et de la théorie des résidus quadratiques (exercices du Chapitre I.1), une introduction à la théorie de l’équirépartition modulo 1 (§ I.6.5), une première approche de l’approximation diophantienne et un exposé synthétique des fractions continues (Chapitre I.7), ainsi qu’un vade mecum de la théorie de la fonction Gamma d’Euler — Chapitre II.0. Cette quatrième édition, comme les précédentes premières, doit beaucoup à tous ceux, collègues et amis, qui m’ont aidé à clarifier et assainir le manuscrit, parmi lesquels Joseph Basquin, Régis de la Bretèche, Farrell Brumley, Cécile Dartyge, Kevin Ford, Bruno Martin, Michel Mendès France, Aziz Raouj, Jean-Luc Rémy, Olivier Robert, Anne de Roton, Patrick Sargos, et Jie Wu. Nancy, juillet 2015,

G.T.

N OTATIONS

Les notations et conventions suivantes sont utilisées librement dans le texte. Sauf cas particulier signalé explicitement ou résultant du contexte, la lettre p, avec ou sans indice, désigne un nombre premier. Nous notons P l’ensemble de tous les nombres premiers.

a|b signifie : a divise b ; pν a signifie : pν |a et pν +1 ∤ a ; a|b∞ signifie : p|a ⇒ p|b. Nous notons également [a,b] := ppcm(a,b), et (a,b) := pgcd(a,b). −

+

P (n) (resp. P (n)) désigne le plus grand (resp. le plus petit) facteur premier de l’entier n > 1. Par convention P + (1) = 1, P − (1) = +∞. Les parties entière inférieure, entière supérieure, et fractionnaire du nombre réel x sont notées respectivement ⌊x⌋, ⌈x⌉ et x . Nous posons

x := min |x − n|, x+ := max(x,0) (x ∈ R) n∈Z

et notons

e(x) := e2π ix

(x ∈ R),

ln+ x := max{0, ln x} (x > 0).

Nous désignons par lnk la k -ième itérée de la fonction logarithme. La notation log est réservée au logarithme complexe, pris, sauf mention contraire, en détermination principale. Lorsque la lettre s désigne un nombre complexe, nous définissons implicitement les nombres réels σ et τ par la relation s = σ + iτ . Nous utilisons indifféremment la notation de Landau f = O(g) et celle de Vinogradov f ≪ g pour signifier que |f |  C|g| pour une constante positive convenable C , qui peut être absolue ou dépendre de certains paramètres — auquel cas la dépendance pourra être indiquée en indice. De plus, nous écrivons f ≍ g pour dénoter que f ≪ g et g ≪ f ont simultanément lieu. Nous attirons l’attention du lecteur sur le fait que nous avons étendu l’usage commun de ces notations au cas de quantités à valeurs complexes. Nous désignons le cardinal d’un ensemble fini A soit par card A, soit par |A|.

INTRODUCTION À LA THÉORIE ANALYTIQUE ET PROBABILISTE DES NOMBRES

15

Nous indiquons ci-dessous les numéros de page correspondant à certaines notations introduites dans le corps du texte.

br (x), Br , Br (x) δA σa , σc e(x) δ(n) σk (n) dA ζ (s) τ (n) j(n) ζ (s,y) τ (n,ϑ) k(n) λ(n) ϕ(n) N (T ) (n) (x,y)

21 426 208 88 45 44 425 34 44 48 517 254 79 80 44 258 44 85

N (x,y) μ(n) χ(n), χ0 (n) pj (n) νN ψ(x) pp ξ (s) ψ(x; a,q) S(A,P,y) π(x) (x,y) vp (n) π(x; a,q) ω(n), (n) 1(n) ̺(u) ±

214 44 375 469 425 50 431 258 381 84, 108 27 517 31 98 44 47 524 127

T OME I

M ÉTHODES ÉLÉMENTAIRES

C HAPITRE

I.0 Q UELQUES OUTILS D ’ ANALYSE RÉELLE

0.1. La sommation d’Abel

On appelle classiquement sommation, ou transformation, d’Abel le procédé consistant à transformer une somme finie de produits de deux termes en faisant apparaître les sommes partielles de l’un d’entre eux. ∞ Théorème 0.1 (Transformation d’Abel). Soient {an }∞ n=0 , {bn }n=0 des suites ∗ complexes. Pour tous entiers N ∈ Z, M ∈ N , on a   (0.1) an bn = AN +M bN +M+1 + An (bn − bn+1 ), N x n>x

où N est le plus petit entier > x. Cela établit l’estimation requise.

⊓ ⊔

Théorème 1.10. Il existe une constante c1 telle que l’on ait pour x  2

1  1 = ln2 x + c1 + O . p ln x px

De plus, la constante impliquée par le symbole de Landau peut être choisie  2(1 + ln 4) < 5. Remarque. Le Théorème 1.12 ci-après permet d’obtenir facilement une approximation numérique de c1 . On a c1 = γ − c0 ≈ 0,261497. Démonstration. D’après le premier théorème de Mertens, on a pour t  2  ln p − ln t = O(1). R(t) := p pt

34

I.1. LES NOMBRES PREMIERS

Or, on a

 x  1  x 1  ln p   x dt dR(t) = = d + p ln t p t ln t 2− 2− ln t 2 pt px  x R(t) R(x) R(2−) − dt, + = ln2 x − ln2 2 + ln x ln 2 t(ln t)2 2 où nous avons traité l’intégrale impliquant R(t) par sommation d’Abel. Soit R := supt2− |R(t)|. On a    ∞  R(x)  R(t)    2R < 2(1 + ln 4) − dt  ln x  ln x 2 t(ln t) ln x x

grâce à la majoration du Théorème 1.8. On en déduit la formule annoncée avec  ∞ R(t) c1 = − ln2 2 + 1 + dt. t(ln t)2 2

⊓ ⊔

Théorème 1.11. Les constantes c0 et c1 ayant les valeurs introduites aux Théorèmes 1.9 et 1.10, on a pour x  2

1   1  e−(c0 +c1 )  = 1− 1+O . p ln x ln x px

C’est un corollaire immédiat des Théorèmes 1.9 et 1.10.

1.6. La formule de Mertens Le second théorème de Mertens, célèbre sous le nom de « formule de Mertens » permet d’expliciter la constante apparaissant au Théorème 1.11. Théorème 1.12 (Formule de Mertens). Avec les notations du § 1.5, on a c0 + c1 = γ , où γ désigne la constante d’Euler. Ainsi

1   1  e −γ  = (x  2). 1− 1+O p ln x ln x px

Démonstration. Posons, pour σ > 1, ζ (σ ) :=

 1 . nσ

n1

En comparant la somme à une intégrale, on voit facilement que ζ (1 + σ ) =

1 + O(1) σ

(σ > 0).

De plus, on a



nx

1

n 1 +σ





px

1−

1 −1

p 1 +σ

 ζ (1 + σ )

1.6. LA FORMULE DE MERTENS

35

 car le produit sur p est égal à la somme n1 εn /n1+σ où εn vaut 1 si tous les facteurs premiers de n sont  x et vaut 0 sinon. En faisant tendre x vers l’infini, on obtient la célèbre formule d’Euler  1 −1 ζ (1 + σ ) = . 1 − 1 +σ p p Maintenant, considérons la fonction    1  1 1 ln − 1 +σ . f (σ ) = ln ζ (1 + σ ) − = p 1 +σ 1 − p −1 −σ p p p Comme le terme général est positif et majoré par 1/p(p − 1), la série f (σ ) est uniformément convergente pour σ  0 ; en particulier, sa somme est continue en 0, soit

lim f (σ ) = f (0) = c0 .

σ →0

Nous allons transformer les deux termes de la somme f (σ ). D’une part, 

 1 + O(σ ) ln ζ (1 + σ ) = ln 1/σ + O(1) = ln 1/σ + O(σ ) = ln 1 − e−σ

=



e−σ n n−1 + O(σ ) =

n1





e−σ t dH(t) + O(σ )

0

où nous avons posé

H(t) :=

 1 . n

1nt

Une intégration par parties dans l’intégrale de Stieltjes implique donc  ∞ ln ζ (1 + σ ) = σ e−σ t H(t) dt + O(σ ). 1



D’autre part, notant P (u) := pu 1/p, on peut écrire  ∞  ∞  ∞  1 P (u) dP (u) = = σ du = σ e−σ t P (et ) dt. 1 +σ σ 1 +σ p u u 1 0 1 p On obtient donc ainsi

f (σ ) = σ



0



 e−σ t H(t) − P (et ) dt + O(σ ).

Or, nous avons vu au Théorème 0.8 que l’on a

H(t) = ln t + γ + O(1/t)

(t  1),

et il découle du Théorème 1.10 que

P (et ) = ln t + c1 + O(1/t)

(t  1).

36

I.1. LES NOMBRES PREMIERS

Il suit, pour 0 < σ  12 ,  ∞

1  e−σ t dt + O(σ ) f (σ ) = σ γ − c1 + O t+1 0  ∞

 dt  = γ − c1 + O σ + σ = γ − c1 + O σ ln(1/σ ) e −σ t t + 1 0

et finalement c0 = f (0) = γ − c1 , ce qui achève la démonstration.

⊓ ⊔

1.7. Un autre théorème de Tchébychev Tchébychev a montré que si l’on a π (x) ∼ cx/ ln x, alors la constante c est nécessairement égale à 1. Théorème 1.13. On a

lim inf x→∞

π (x) π (x)  1  lim sup · x/ ln x x→∞ x/ ln x

Démonstration. Les deux inégalités se traitant de manière analogue, bornons nous à établir celle de gauche. Soit

 := lim inf x→∞

π (x) · x/ ln x

Pour chaque ε > 0, il existe un x0 = x0 (ε)  2 tel que l’on ait π (t)  ( − ε)

t , ln t

(t  x0 (ε)).

Cela implique pour x > x0  x  1  x dπ (t) π (t) π (x) π (x0 )  = − + dt 2 p t x x 0 x0 t x0 px  x dt  ( − ε) ln2 x + Oε (1).  −1 + ( − ε) t x0 ln t Par le Théorème 1.10, il s’ensuit que  − ε  1 et donc   1 puisque ε peut être choisi arbitrairement petit. ⊓ ⊔

N OTES

§ 1.2. La preuve donnée ici du Théorème 1.4 a été trouvée indépendamment par Erdos ˝ et Kalmár en 1939. Le théorème des nombres premiers implique  p  e(1+ε)n (n  n0 (ε)) pn

pour tout ε > 0. Il est cependant utile de disposer de majorations uniformes, comme celles du Théorème 1.4, valables sans restriction sur n. Dans cet esprit Hanson a montré en 1972 que l’on a  p  dn < 3n (n  1). pn

Pour des encadrements numériques de π (x) et des fonctions de Tchébychev (cf. § 3.6) voir Rosser & Schoenfeld (1962, 1975) et Schoenfeld (1976). On a par exemple 1  3  x x < π (x) < (x  52). 1+ 1+ ln x 2 ln x ln x 2 ln x

L’idée exploitée par Nair (1982a) pour la preuve du Théorème 1.5 n’est pas nouvelle : voir Gelfond (1946). Gorshkov (1956) a montré que le théorème des nombres premiers ne peut être obtenu par cette méthode avec des polynômes d’une variable et a donné des estimations numériques des meilleurs résultats que l’on peut atteindre de cette façon. Ces estimations ont été précisées par Aparicio Bernardo (1981). La généralisation donnée par Nair (1982b) est intrinsèquement nouvelle. Elle fournit des encadrements numériques très précis et, en principe, elle est susceptible de conduire au théorème des nombres premiers. Pour des démonstrations plus classiques d’encadrements de π (n) du type « Tchébychev », voir les Exercices 16 à 20.

E XERCICES

10. Établir par récurrence que tout entier > 1 peut s’écrire comme produit de nombres premiers. 11. (a) Soit I un idéal de Z (i.e. un sous-groupe additif stable pour la multiplication par un élément de Z). Montrer que l’on a I = kZ, où k est le plus petit élément positif de I . (b) Soient m,n ∈ Z. Montrer que mZ + nZ est un idéal de Z. (c) Soit d = (m,n) le plus grand diviseur positif commun à m et n. Montrer le théorème de Bachet (1624), plus connu sous l’appellation fautive de théorème de Bézout : mZ + nZ = dZ. 12. Premier théorème d’Euclide. Soient a,b ∈ Z et p un nombre premier. On suppose que p | ab et p ∤ a. Montrer en utilisant le théorème de Bachet qu’il existe u,v ∈ Z tels que up + va = 1. En déduire que p | b. 13. Établir par récurrence, en utilisant le premier théorème d’Euclide, le théorème fondamental de l’arithmétique : à l’ordre des facteurs près, la décomposition de chaque entier > 1 en produit de nombres premiers est unique. 14. Soit pn le n-ième nombre premier, et dn : = pn+1 − pn . En admettant le théorème des nombres premiers sous sa forme minimale π (x) ∼ x/ ln x (x → ∞), montrer les assertions suivantes. (a) pn ∼ n ln n (n → ∞).  (b) dn / ln n ∼ x (x → ∞). 1 0 il existe une suite d’entiers A = {n1 ,n2 , . . .}, croissante au sens large, telle que pnj ∼ α j (j → ∞). (e) L’ensemble des nombres rationnels de la forme p′ /p, où p et p′ sont premiers, est dense dans [0, + ∞[. 15. Montrer que le théorème des nombres premiers sous la forme forte π ln x + O(x/(ln x)2 ) (x  2) implique la convergence de la série (x) = x/1+i 1 /p . p∈P

EXERCICES

39

16. Soit {an }∞ n=1 une suite de nombres  0. On suppose que  B(x) := an ⌊x/n⌋ = x ln x + Cx + o(x). nx

Montrer le théorème taubérien de Shapiro  (1950) : il existe deux constantes positives α et β telles que : α x  A(x) := nx an  β x (x > x0 ). Préciser les valeurs numériques obtenues pour α et β. Examiner le cas où l’on suppose seulement B(x) = x ln x + O(x). [Indication : on pourra considérer A(x) − A(x/2) et utiliser les propriétés de la fonction u → ⌊u⌋ − 2 ⌊u/2⌋.]

17. Fonction de von Mangoldt. On pose (n) : = ln p, si n = pν , (n) : = 0 si n n’est pas puissance d’un nombre premier. Montrer que  (a)  (d) = ln n, d|n  (x  2). (b) dx (d) ⌊x/d⌋ = x ln x − x + O(ln x)  18. Déduire des deux exercices précédents que la fonction ψ (x) : = nx (n) satisfait α x  ψ (x)  β x

(x > x0 )

pour deux constantes positives α et β que l’on précisera. 19. Déduire de l’Exercice 18 l’existence de deux constantes positives a et b, que l’on déterminera, telles que : ax/ ln x  π (x)  bx/ ln x (x  2).(2) 20. Estimations de Tchébychev. Soit M > 1 et h une fonction arithmétique telle que M (i) h(1) = 1, m=1 h(m)/m = 0. M (ii) χ (x) := m=1 h(m) ⌊x/m⌋ ∈ [0,1] (x ∈ R).

Montrer que, dans les hypothèses de l’Exercice 16, on a, pour x assez grand, 

a (H − ε)x < A(x) < H + ε x, a−1 M où l’on a posé H := − m=1 h(m) ln m/m et où a est défini comme le plus grand entier tel que χ (x) = 1 pour 1  x < a. À quel choix de h le théorème taubérien de Shapiro correspond-t-il ? Montrer que le choix

M = 6, h(1) = h(6) = 1, h(2) = −1, h(3) = −2, h(4) = h(5) = 0 conduit à une preuve du postulat de Bertrand. Retrouver les estimations de Tchébychev pour ψ (x) avec son choix original

M = 30, h(1) = h(30) = 1, h(2) = h(3) = h(5) = −1,

h(m) = 0 (m = 4 ou 6  m  29).

21. Déduire du postulat de Bertrand qu’il existe une infinité de nombres premiers dont le premier chiffre en base 10 est 1.

2

Pour un raffinement du théorème taubérien de Shapiro conduisant à une preuve élémentaire du théorème des nombres premiers, voir Smith (1980).

40

I.1. LES NOMBRES PREMIERS

22. Montrer que  l’on peut déduire simplement du postulat de Bertrand que le nombre Hn = 1mn 1/m n’est entier pour aucun entier n > 1. Donner une autre démonstration de ce résultat en considérant les puissances de 2. 23. On conserve les notations des Exercices 17 et 18. (a) Montrer que nx (ln n)/n = 12 (ln x)2 + O(1) (x  1). (b) Montrer que  (n)  x ψ (t) ψ (x) = (x  1). dt + 2 n t x 1 nx

(c) À partir de cette question, on admet le théorème des nombres premiers sous la forme forte  (x  1). (1.1) ψ (x) = x + O x/(ln 2x)2 Montrer l’existence d’une constante A telle que  (n) = ln x + A + o(1) (1.2) n nx

(x → ∞).

(d) En utilisant l’identité établie à l’Exercice 17(a), montrer que  ln n = (ln x)2 + 2(A + γ ) ln x + o(ln x) (x → ∞). 2 n nx

En déduire que A = −γ . 24. Montrer que la relation (1.2) implique le théorème des nombres premiers. 25. Montrer que le théorème des nombres premiers sous la forme forte (1.1) implique la relation asymptotique  ln p = ln x − γ + o(1), (1.3) p−1 px

où la lettre p désigne génériquement un nombre premier. Réciproquement, montrer que la relation (1.3) implique le théorème des nombres premiers. 26. Montrer que le théorème des nombres premiers sous la forme (1.1) implique la formule  ∞ t − ψ (t) dt = 1 + γ . t2 1 On pourra utiliser la relation établie à l’Exercice 23(a). Étudier la réciproque en

x(1±ε) ψ (t) dt/t2 . introduisant, pour 0 < ε < 1, les quantités x

27. Est-il vrai que tout entier naturel non nul peut être transformé en un nombre premier en changeant seulement un chiffre de son écriture décimale ?  28. Montrer que limx→∞ √x n. Peut-on encore préciser cet énoncé ?

EXERCICES

41

29. Les lettres p et q désignant des nombres premiers, montrer, en employant le second théorème de Mertens qu’il existe une constante a telle que  1 = (ln2 x + a)2 + o(1) + O(S), pq pqx

où l’on a posé S :=

 1 ln x  ln . Montrer que S est borné en tant que p ln(x/p)

px/2

fonction de x. Généraliser le résultat obtenu en une formule asymptotique pour la quantité  1 p1 ···pk x

p1 · · · pk

lorsque l’entier k est fixé et x → ∞. 30. Est-il possible que les nombres p, 8p − 1 et 8p + 1 soient simultanément premiers ? On pourra réduire le problème modulo m pour une valeur bien choisie de m. 31. Nombres premiers de Mersenne. Montrer que si 2k − 1 est premier alors k est premier. 32. Montrer qu’il existe une infinité de nombres premiers de la forme 4n + 3. On pourra considérer le nombre N = 4·n! − 1.

33. Déterminer les nombres premiers p tels que p2 + 2 soit également un nombre premier. 34. Montrer qu’un produit de nombres de la forme 4k + 1 est encore de cette même forme. En déduire qu’il existe une infinité de nombres premiers de la forme 4m − 1. On pourra considérer le nombre n = 4p1 · · · pr − 1 où les pj sont les r plus petits nombres premiers de la forme 4m − 1. 35. Montrer qu’il existe une infinité de nombres premiers de la forme 6m − 1. On pourra considérer le nombre n = (p1 · · · pr )2 + 4 où les pj sont les r plus petits nombres premiers de la forme considérée. 36. Soit k ∈ N∗ . Trouver un entier N qui soit suivi de k entiers composés. 37. Résidus quadratiques. Soit p un nombre premier impair. On désigne par Qp l’ensemble des résidus quadratiques de (Z/pZ)∗ , autrement dit l’ensemble des éléments a de (Z/pZ)∗ tels que l’équation x2 ≡ a (mod p) possède au moins une solution. (a) Montrer que, si g est un générateur de (Z/pZ)∗ , alors Qp coïncide avec l’ensemble des puissances paires de g . En déduire la valeur de |Qp |. (b) Dans cette question, on se propose de retrouver le résultat précédent sans utiliser la structure cyclique de (Z/pZ)∗ . (i) Montrer que l’équation x2 = a possède 0 ou 2 solutions dans (Z/pZ)∗ . (ii) Conclure.

42

I.1. LES NOMBRES PREMIERS

38. Symbole de Legendre. On conserve les hypothèses et notations de l’Exercice 37. Pour a ∈ Z/pZ, on pose ⎧ si a ∈ Qp , ⎨1

a si a ≡ 0 (mod p), := 0 ⎩ p −1 si a ∈ / Qp .

(a) Montrer que Qp est le noyau de l’homomorphisme multiplicatif x → x(p−1)/2 de (Z/pZ)∗ dans lui-même. (b) En déduire que (a|p) ≡ a(p−1)/2 (mod p) pour tout a de Z/pZ. (c) À quelle condition (−1) est-il résidu quadratique modulo p ? (d) Soient p1 , . . . ,pk les k plus petits nombres premiers de la forme 4m + 1. En considérant le nombre N = (p1 · · · pk )2 + 1, montrer qu’il existe un nombre premier pk+1 distinct des précédents et de cette même forme. En déduire l’infinitude de l’ensemble des nombres premiers de la forme 4m + 1. 39. Soit p un nombre premier impair et m, n des entiers. On étend la définition du symbole de Legendre  en posant (n|p) = (a|p) lorsque n ∈ Z, n ≡ a (mod p). (a) Calculer Sn := 0j

1).

46

I.2. FONCTIONS ARITHMÉTIQUES

2.4. L’anneau des fonctions arithmétiques La correspondance entre fonctions arithmétiques et séries de Dirichlet formelles induit sur l’ensemble des fonctions arithmétiques une addition (+) et un produit (∗) dont les propriétés fondamentales sont respectivement

D(f + g; s) = D(f ; s) + D(g; s) D(f ∗ g; s) = D(f ; s) D(g; s).

On a donc (f + g)(n) = f (n) + g(n), et (f ∗ g)(n) = h(n) où h est définie par (2.5). Le produit ∗ est appelé convolution de Dirichlet. Ces opérations confèrent à l’ensemble A des fonctions arithmétiques une structure d’anneau commutatif unitaire isomorphe à celui des séries de Dirichlet formelles. Cashwell & Everett (1959) ont montré que cet anneau est factoriel c’est-à-dire intègre et tel que son quotient par le groupe des éléments inversibles satisfait au théorème fondamental de l’arithmétique. Une condition nécessaire et suffisante pour que f ∈ A soit inversible est que f (1) = 0. Sous cette hypothèse, en effet, la famille d’équations  f (n/d)g(d) = δ (n) (n  1) (2.6) d|n

permet de calculer g(n) par récurrence : on a ⎧ −1 ⎪ ⎨ g(1) = f (1)  (2.7) f (n/d)g(d) g(n) = −f (1)−1 ⎪ ⎩

(n > 1).

d|n, d 1). f (1) = 1, f (n) = pν n

Théorème 2.6. L’ensemble M des fonctions arithmétiques multiplicatives est un sous-groupe du groupe G des éléments inversibles de A. Démonstration. Si f et g sont dans M, le calcul formel fournit immédiatement la relation  f (pν )   h(pν )    g(pν )    = 1+ 1+ D(f ; s)D(g; s) = 1+ pν s pν s pν s p p ν 1

ν 1

ν 1

ν

où h(p ) est défini par la relation (2.9)

h(pν ) =



f (pj )g(pν −j ).

0jν

Comme on a par définition D(f ; s)D(g; s) = D(f ∗ g; s), il s’ensuit que f ∗ g coïncide avec la fonction multiplicative déterminée par (2.9) sur les puissances des nombres premiers. Il reste à vérifier que l’inverse f# de toute fonction f ∈ M est encore dans M. La relation (2.6) appliquée avec g = f#, n = 1 puis n = pν implique immédiatement que f#(1) = 1 et que

  f (pν )    f#(pν )  =1 1+ 1 + pν s pν s ν 1

ν 1

pour tout nombre premier p. Donc   f#(pν )  = 1 = D(f ; s)D(f#; s) D(f ; s) 1+ νs p p ν 1

et la relation (2.8) est bien satisfaite pour f#. D’après le Théorème 2.5, cela implique f# ∈ M. ⊓ ⊔ Soit 1 la fonction arithmétique définie par

(2.10)

1(n) = 1

(n  1).

Alors 1 est trivialement multiplicative et l’on a pour chaque n  1   τ (n) = 1(d)1(n/d), 1= d|n

d|n

d’où (2.11)

τ = 1 ∗ 1.

Cela fournit, par le Théorème 2.6, une nouvelle preuve de la multiplicativité de la fonction τ .

48

I.2. FONCTIONS ARITHMÉTIQUES

Désignons par j la fonction identité, soit

j(n) = n

(2.12)

(n  1).

On a clairement σ =1∗j

(2.13)

et par conséquent : Théorème 2.7. La fonction « somme des diviseurs » σ (n) est multiplicative. Il en va bien entendu de même des fonctions  dk = (1 ∗ j k )(n) σk (n) = d|n

pour toute valeur, réelle ou complexe, du paramètre k .

2.5. Les formules d’inversion de Möbius Pour chaque nombre premier p et chaque entier ν  0, on a   ν  1 si ν = 0 j ν = δ (pν ). μ(p ) = (1 ∗ μ)(p ) = 0 si ν  1 j=0

Comme 1 ∗ μ et δ sont multiplicatives, ces deux fonctions sont donc égales. Théorème 2.8. La fonction de Möbius est l’inverse de convolution de la fonction 1. En d’autres termes, on a 1∗μ=δ

(2.14)

ou encore (2.15)

 d|n

μ(d) =



1 0

(n=1) (n>1).

Pour triviale qu’elle paraisse, la formule (2.15) est cependant riche d’applications. En particulier, elle est le point de départ de la théorie du crible combinatoire — cf. §§ I.4.2–I.4.3. Avant d’utiliser concrètement (2.15), remarquons que nous aurions pu calculer effectivement l’inverse de convolution de μ par le procédé décrit au cours de la démonstration du Théorème 2.6. D’une manière générale, l’inverse f# d’une fonction multiplicative f est la fonction multiplicative déterminée sur les puissances de nombres premiers par l’identité formelle 

   (2.16) 1+ f (pν )ξ ν = 1. f#(pν )ξ ν 1 + ν 1

ν 1

Cette remarque peut s’avérer très utile en pratique lorsqu’on a besoin de majora# ν )|. On applique (2.16) pour ξ complexe dans un disque de convertions pour |f(p gence commun aux deux séries et on obtient la borne souhaitée par la formule intégrale de Cauchy.

2.6. LA FONCTION DE VON MANGOLDT

49

Théorème 2.9 (Première formule d’inversion de Möbius). Soient f et g des fonctions arithmétiques. Les deux propriétés suivantes sont équivalentes  f (d) (n  1) (i) g(n) = d|n

(ii)

f (n) =



g(d) μ(n/d)

(n  1).

d|n

Démonstration. La condition (i) équivaut à g = f ∗ 1, la condition (ii) à f = g ∗ μ. Le résultat découle donc de (2.14). ⊓ ⊔ Voyons maintenant une généralisation aux fonctions de variable réelle. Théorème 2.10 (Seconde formule d’inversion de Möbius). Soient F et G des fonctions définies sur [1, + ∞[. Les deux conditions suivantes sont équivalentes  (i) F (x) = G(x/n) (x  1) nx

(ii)

G(x) =



μ(n)F (x/n)

(x  1).

nx

Démonstration. Établissons par exemple l’implication (i) ⇒ (ii). La réciproque est analogue. Pour x  1, on a      G(x/mn) = G(x/k) μ(m). μ(n)F (x/n) = μ(n) nx

nx

mx/n

kx

mn=k

D’après (2.15), la somme intérieure vaut δ (k). Cela implique bien (ii).

⊓ ⊔

En appliquant le Théorème 2.10 au cas de G(x) ≡ 1, on obtient  (2.17) μ(n) ⌊x/n⌋ = 1 (x  1). nx

Cela suggère que (2.18)

lim

x→∞

 μ(n) = 0. n

nx

Nous verrons au paragraphe 3.6 que (2.18) équivaut au théorème des nombres premiers.

2.6. La fonction de von Mangoldt On appelle fonction de von Mangoldt, et on note traditionnellement , la fonction arithmétique (2.19)

 := μ ∗ ln .

50

I.2. FONCTIONS ARITHMÉTIQUES

Pour chaque n  1, on peut donc écrire    (n) = μ(d) ln d μ(d) ln d = − μ(d) ln(n/d) = δ (n) ln n − d|n

d|n

d|n

c’est-à-dire  = −μ ln ∗1.

(2.20)

De plus, il découle de (2.20) que l’on a, pour tous m,n tels que (m,n) = 1,    (mn) = − μ(t){ln d + ln t} μ(d) μ(dt) ln(dt) = − d|m

d|m t|n

=



t|n

μ(d){−δ (n) ln d + (n)} = δ (n)(m) + δ (m)(n).

d|m

Ainsi (n) est nul si n n’est pas une puissance d’un nombre premier. Par (2.20), il suit  ln p (n = pν , ν  1) (2.21) (n) = 0 (n = pν ). Les fonctions sommatoires de Tchébychev  ψ (x) := (2.22) (n), nx

ϑ (x) :=

(2.23)



ln p,

px

sont importantes dans la théorie analytique des nombres premiers. On a (2.24)

ψ (x) = ln (ppcm{n : n  x})  ⌊x⌋ ln 2

(2.25)

ϑ (x)  x ln 4

(x  7)

(x  2)

où les inégalités découlent respectivement des Théorèmes 1.5 et 1.4. On déduit immédiatement de (2.21)  (2.26) ψ (x) = ϑ (x1/k ) (x  1). k1

Pour chaque x, la sommation en k est finie : le terme général est nul dès que 2k > x. Théorème 2.11. Pour x  2, on a (2.27)

(2.28)

√ ψ (x) = ϑ (x) + O( x), π (x) =

x  ϑ (x) +O . ln x (ln x)2

2.7. LA FONCTION INDICATRICE D’EULER

51

Démonstration. La formule (2.27) découle immédiatement de (2.25) et (2.26). Pour établir (2.28), on évalue ϑ (x) par sommation d’Abel :  x  x π (t) dt. ϑ (x) = ln t dπ (t) = π (x) ln x − t 1 1 D’après l’estimation supérieure de Tchébychev (Théorème 1.3), l’intégrale est O(x/ ln x), d’où la formule annoncée. ⊓ ⊔ Corollaire 2.12. Soient α, β des constantes telles que 0 < α < ln 2, β > ln 4. Pour x assez grand, on a α x  ϑ (x)  ψ (x)  β x.

(2.29)

Cela découle immédiatement des Théorèmes 2.11 et 1.3.

2.7. La fonction indicatrice d’Euler Nous avons défini, pour chaque n  1, la quantité ϕ (n) égale au nombre de résidus inversibles modulo n. Nous pouvons donc écrire   ϕ (n) = δ (m,n) , 1mn

d’où en appliquant (2.14)    μ(d) μ(d) = ϕ (n) = mn d|(m,n)

d|n



mn m≡0(mod d)

1=

 d|n

μ(d)

n · d

Cette relation équivaut à ϕ = μ ∗ j.

(2.30)

En particulier, on a pour chaque p premier

1 . ϕ (pν ) = μ(1)pν + μ(p)pν −1 = pν 1 − p

Nous avons donc démontré le théorème suivant.

Théorème 2.13. La fonction indicatrice d’Euler ϕ est multiplicative. Pour chaque entier n  1, on a  1 (2.31) ϕ (n) = n 1− . p p|n

Une autre preuve de ce résultat consiste à remarquer que chaque rationnel h/n s’écrit de manière unique sous la forme h/n = a/d, avec d|n,(a,d) = 1. Pour toute fonction de variable réelle F on a donc    F (a/d). (2.32) F (h/n) = 1hn

d|n 1ad (a,d)=1

52

I.2. FONCTIONS ARITHMÉTIQUES

En appliquant cette identité au cas de F (x) ≡ 1, il suit  ϕ (d). (2.33) n= d|n

En d’autres termes : j = 1 ∗ ϕ ; le résultat souhaité découle donc de (2.14). Le principe d’inclusion–exclusion (cf. Notes) fournit aisément une troisième démonstration du Théorème 2.13.

N OTES

§ 2.4. Pour d’autres propriétés de l’anneau des fonctions arithmétiques, voir Shapiro (1972). § 2.5. Principe d’inclusion–exclusion. Une version purement combinatoire de la formule d’inversion de Möbius sous sa forme basique 1 ∗ μ = δ est connue sous le nom de principe d’inclusion–exclusion. On peut l’énoncer ainsi : Soit A un ensemble fini de cardinal N , et P = {(1), . . . ,(k)} un ensemble de propriétés numérotées. Pour chaque sous-ensemble I de P, on désigne par A(I) le nombre des éléments de A qui satisfont au moins à toutes les propriétés de I . Notant S(A,P) le nombre des éléments de A qui ne satisfont à aucune propriété de P, on a

S(A,P) = N +

(2.34)

k 

(−1)s

s=1



A(I).

I⊆P cardI=s

Il est facile de prouver directement l’identité (2.34) en introduisant, pour chaque élément a de A, le nombre exact m(a), 0  m(a)  k , de propriétés satisfaites par a. On peut aussi raisonner indirectement de la façon suivante. Soient 2 = p1 < p2 < · · · < pk les k plus petits nombres premiers, posons  P = pj 1jk

et associons à chaque a de A le nombre entier F (a) = « a ∈ (j) » signifie que a satisfait (j). Alors on a      μ(d) μ(d) = S(A,P) = δ F (a) = a∈A

Si d =



a∈A d|F (a)

d|P

!

a∈(j)

pj où l’écriture



a∈A F (a)≡0 (mod d)

pj , on a

(j)∈I

μ(d) = (−1)card I ,

et



a∈A F (a)≡0 (mod d)

On en déduit bien (2.34).

1 = A(I).

1.

E XERCICES

41. Soit ζ (s) la fonction zêta de Riemann, que nous identifierons à la série de Dirichlet formelle associée à la fonction arithmétique 1(n) = 1 (n  1). Exprimer à l’aide de ζ (s) les séries de Dirichlet associées aux fonctions arithmétiques suivantes : μ(n), μ(n)2 , ϕ (n), σ (n), τ (n), 2ω(n) , (n). De quelles relations de convolution les identités obtenues sont-elles les images ? 42. Montrer que pour tout n  1, on a 2ω(n)  τ (n)  2(n) . 43. Montrer que pour tout n > 1, on a 6n2 /π 2 < σ (n)ϕ (n) < n2 . 44. Montrer que chaque entier n  1 peut se décomposer de manière unique sous la forme n = qm2 , où q est sans facteur carré. On note Q(x) le nombre des entiers q sans facteur carré qui n’excèdent pas x. Établir les formules  √ Q(x/m2 ) (x  1), (c) Q(x) = 6x/π 2 + O( x) (x  1). (a) ⌊x⌋ = √ m x

(b) Q(x) =



√ d x

  μ(d) x/d2

(x  1),

Généraliser cette étude aux nombres « k -libres », i.e. tels que p|n ⇒ pk ∤ n. 45. Sommes de Ramanujan. On définit les sommes de Ramanujan cn (m) par  e(hm/n) (m,n  1) cn (m) := 1hn, (h,n)=1

2π iu

où l’on a posé e(u) :=  e (u ∈ R). Montrer que, pour tous m  1, n  1, on a μ(n/d)d cn (m) = (a) d|(m,n)

(b) cn (m) = μ(t)ϕ (n)/ϕ (t), avec t := n/(m,n). En déduire que  e(h/n) (n  1). μ(n) = 1hn (h,n)=1

Montrer que, pour chaque entier m fixé, cn (m) est une fonction multiplicative de n. Pouvez-vous donner une preuve directe de ce résultat ?

EXERCICES

55

46. Soit f une fonction définie sur R+ et telle que  |f (mx)|τ (m) < ∞. m1

On pose g(x) =



m1

f (mx). Alors on a f (x) =



n1

μ(n)g(nx). Réciproque ?

47. On définit une fonction arithmétique R(n) par

R(n) := card{(d,d′ ) : d  1, d′  1, n = [d,d′ ]}. (a) Montrer que  R(n) est une fonction multiplicative de n. (b) Calculer d|n R(d) et en déduire une nouvelle preuve de (a).  ′ −s (c) Montrer que la série de Dirichlet formelle F (s) := peut d,d′ 1 [d,d ] (s) . s’exprimer simplement en fonction de ζ  (d) Étudier la généralisation d1 ,...,dk 1 [d1 , . . . ,dk ]−s .

48. Soit f une fonction arithmétique à valeurs réelles. On suppose qu’il existe deux nombres premiers p et q tels que f (pq)2 < 4f (p2 )f (q 2 ). Montrer que f est soit inversible soit un élément premier dans l’anneau Ar des fonctions arithmétiques réelles. 49. Soit f une fonction arithmétique à valeurs complexes telle que f (1) = 0. (a) Montrer que si f = u ∗ v , avec u et v non inversibles, alors pour tout couple de nombres premiers (p,q) les solutions de l’équation

z 2 − f (pq)z + f (p2 )f (q 2 ) = 0 sont u(p)v(q) et u(q)v(p). (b) On désigne par gi (p,q) (i = 1,2) les deux nombres complexes de la forme  gi (p,q) = f (pq) ± f (pq)2 − 4f (p2 )f (q 2 )

lorsqu’on a choisi une détermination de la racine carrée complexe. Montrer que, s’il existe quatre nombres premiers p,q ,r,s tels que les 16 déterminants de la forme    gi (p,q) gk (q ,s)    (i,j ,k , = 1,2)    gj (p,r) g (r,s) 

soient tous non nuls, alors f est un élément premier de A.

50. Sur les fonctions multiplicatives monotones. Soit f une fonction arithmétique réelle, multiplicative  large. Pour tous entiers  et croissante au sens a  3, t  1, posons Rt := 0jt aj , St := at − 0jy



mx/y

f (m) G(x/m) − G(y) .

Cela implique immédiatement le résultat annoncé, en développant le dernier terme. ⊓ ⊔ Ce résultat nous permet de préciser le comportement moyen de τ (n). Théorème 3.2. On a pour x infini  √ (3.3) τ (n) = x(ln x + 2γ − 1) + O( x) nx

où γ désigne la constante d’Euler. Démonstration. Appliquons (3.2) avec f = g = 1,F (x) = G(x) = ⌊x⌋ , et y = Il vient    1 √ √ 2 −x+O x . x = 2 x ⌊x/m⌋ − τ (n) = 2 (3.4) m √ √ nx

m x

m x

D’après le Théorème 0.8, la somme en m vaut bien (3.3).

√ x.

1 2

 √ ln x + γ + O 1/ x . Cela établit ⊓ ⊔

Le nom de principe de l’hyperbole provient de l’interprétation géométrique suivante du problème de Dirichlet.

3.2. LE PROBLÈME DE DIRICHLET ET LE PRINCIPE DE L’HYPERBOLE

59

v

uv = x

0

u

L’hyperbole équilatère et le réseau des points entiers.

Considérons, dans le plan des u et des v , l’hyperbole équilatère uv = x. Chaque point à coordonnées entières (a,b) situé entre la courbe et les axes de coordonnées (exclus) correspond à une décomposition de l’entier n = ab  x en produit de deux facteurs. Ainsi le membre de gauche de (3.3) est exactement égal au nombre de points à coordonnées entières situés sous la courbe. La manipulation effectuée dans la décomposition du Théorème 3.2 consiste simplement à utiliser la symétrie de la figure : la quantité cherchée est égale aux nombres de points situés dans le & √ '2 carré 1, x augmenté du double du nombre de points appartenant à la zone hachurée. Posons (x) :=



nx

τ (n) − x(ln x + 2γ − 1).

√ Nous avons vu que (x) = O( x). Voronoï a démontré en 1903 que (x) ≪ x1/3 ln x et Hardy et Landau ont prouvé indépendamment en 1915 que (x) n’est pas o(x1/4 ). Soit α l’infimum des exposants ξ tels que (x) ≪ xξ . La valeur exacte de α n’est toujours pas connue. On conjecture généralement que α = 1/4 ; la meilleure majoration dont on dispose aujourd’hui est celle de Huxley (2003) α  131/416 ≈ 0,314904, améliorant notamment l’estimation Iwaniec & Mozzochi (1988) α  7/22. Nous montrerons au Chap. I.6 comment on peut appliquer la méthode de van der Corput (1922) pour établir simplement le résultat de Voronoï.

60

I.3. ORDRES MOYENS

3.3. La fonction somme des diviseurs Le théorème suivant établit que l’ordre moyen de la fonction  d σ (n) = d|n

est 61 π 2 n. On a en fait un résultat plus précis. Théorème 3.3. On a pour x infini  (3.5) σ (n) =

1 2 2 12 π x

+ O(x ln x).

nx

Démonstration. Le principe employé ici, et que nous retrouverons d’ailleurs dans plusieurs autres situations de ce chapitre, est très simple : nous écrivons la fonction considérée sous forme d’une somme portant sur les diviseurs de n et nous intervertissons les sommations. On a 

 1   $ x % $ x %  x2  + 1 = 12 σ (n) = m = 12 + O x . d d d2 d nx

mdx

dx

dx

dx

Le résultat annoncé en découle, au vu de la formule classique  1 π2 . = (3.6) d2 6 d1

⊓ ⊔

Nous proposons à l’Exercice 52 deux démonstrations de (3.6). Le meilleur terme reste actuellement connu pour la formule asymptotique (3.5) est O x(ln x)2/3 . Il est dû à Walfisz (1963), p. 99.

3.4. La fonction indicatrice d’Euler

En adoptant comme point de départ la formule de convolution  (3.7) ϕ (n) = μ(d)m, md=n

la méthode du Théorème 3.3 s’applique sans changement. Théorème 3.4. On a pour x infini  3 (3.8) ϕ (n) = 2 x2 + O(x ln x). π nx

Démonstration. Par (3.7), la somme à évaluer vaut     $x% $x%    μ(d)  1 + 1 = 21 x2 + O x . μ(d) m = 12 μ(d) 2 d d d d dx

mx/d

dx

dx

dx

Comme la fonction de Möbius est l’inverse de convolution de 1, on a formellement

 μ(d)   1  = 1. d2 d2 d1

d1

3.4. LA FONCTION INDICATRICE D’EULER

61

Chacune de ces deux séries étant absolument convergente, cette égalité est en fait valide au sens usuel et il découle de (3.6) que l’on a  μ(d) 6 = 2. (3.9) d2 π d1

Cela implique bien la formule annoncée. Le meilleur terme reste actuellement connu pour (3.8) est 

O x(ln x)2/3 (ln2 x)4/3

⊓ ⊔

— cf. Walfisz (1963), p. 144. Pour chaque entier N  1, on appelle suite de Farey d’ordre N , et l’on note FN , la suite ordonnée des fractions rationnelles irréductibles de dénominateur n’excédant pas N . On a ainsi F1 = 01 , 11 , F2 = 01 , 21 , 11 , F3 = 10 , 31 , 21 , 23 , 11 , etc.

Il est immédiat à partir de la définition de ϕ (n) que l’on a  F (N ) := card FN = 1 + ϕ (n). nN

Ainsi, il découle du Théorème 3.4 que 3 2 N (N → ∞). π2 On peut interpréter cette évaluation de la manière suivante : à une unité près, F (N ) est égal au nombre des fractions rationnelles m/n,1  m  n  N , qui sont irréductibles ; comme il y a 12 N (N + 1) couples {m,n}, il s’ensuit que la probabilité pour qu’une fraction rationnelle de ]0,1], et dont le dénominateur n’excède pas N , soit irréductible tend vers 6/π 2 lorsque N tend vers l’infini. On peut généraliser cette assertion de la manière suivante.

F (N ) ∼

Théorème 3.5. Désignons par G(x,y) le nombre des couples d’entiers {m,n} tels que 1  m  x, 1  n  y , (m,n) = 1. Alors G(x,y) ∼ (6/π 2 )xy lorsque x et y tendent vers l’infini. Plus précisément, en posant z := min(x,y), nous avons  6

ln z  (x,y  2). G(x,y) = xy + O π2 z Démonstration. On a d’après (2.14) $x% $y %    G(x,y) = δ (m,n) = μ(d) d d mx, ny dz 

 μ(d) 1 = xy + O (x + y) 2 d d dz dz   6

1 1 1 + + ln z = xy + O . π2 z x y

⊓ ⊔

62

I.3. ORDRES MOYENS

3.5. Les fonctions ω et 

Théorème 3.6. On a, pour x infini,

x   (3.10) ω(n) = x ln2 x + c1 x + O ln x nx

où c1 ≈ 0,261497 est la constante apparaissant au Théorème 1.10. Démonstration. On a     1= ⌊x/p⌋ = x 1/p + O(π (x)). ω(n) = nx

px

nx p|n

px

La formule (3.10) découle donc du Théorème 1.10 et de l’estimation supérieure de Tchébychev (Théorème 1.3). ⊓ ⊔ Le cas de la fonction (n) =



pν n ν

est semblable, mais un peu plus délicat.

Théorème 3.7. On a, pour x infini,

x   (3.11) (n) = x ln2 x + c2 x + O ln x nx

avec

c2 = c1 +

(3.12)

 p

Démonstration. On a

A(x) :=



1 ≈ 1,034653. p(p − 1)

{(n) − ω(n)} =

nx

 p

ν 2

⌊x/pν ⌋ .

Il s’ensuit, d’une part

A(x)  x

  1 1 = x , ν p p(p − 1) p p ν 2

et d’autre part

A(x) 





√ p x 2ν ln x/ ln p

=x

 p

x



  −1 =

√ 1 + O( x), p(p − 1)

√ p x

ln x  x +O p(p − 1) ln p

d’après le Théorème 1.3. On a donc

√ A(x) = x(c2 − c1 ) + O( x) et la formule (3.11) découle immédiatement de (3.10).

⊓ ⊔

3.6. FONCTION DE MÖBIUS ET FONCTIONS DE TCHÉBYCHEV

63

3.6. Valeur moyenne de la fonction de Möbius et fonctions sommatoires de Tchébychev Nous avons vu au § 2.6 que la fonction de von Mangoldt  = μ ∗ ln est fortement liée à la fonction indicatrice des nombres premiers et possède une fonction sommatoire  ψ (x) = (n) nx

satisfaisant à ψ (x) ∼ π (x) ln x

(x → ∞).

Il est donc naturel de se demander si la valeur moyenne de μ(n) possède une interprétation simple dans le cadre de l’étude asymptotique des fonctions de Tchébychev π (x), ϑ (x), ψ (x). Le théorème suivant, dû à Landau (1909), répond complètement à cette question. Théorème 3.8. Les assertions suivantes sont élémentairement équivalentes : (i) (ii) (iii)

ψ (x) ∼ x

(x → ∞),



M (x) := nx μ(n) = o(x)  n1 μ(n)/n = 0.

(x → ∞),

Remarque. L’assertion (iii) signifie bien entendu que la série figurant au membre de gauche converge et est de somme nulle. Démonstration. L’implication (iii) ⇒ (ii) résulte d’une simple sommation d’Abel. Si nous supposons, en effet, que  μ(n)/n = o(1) (x → ∞), m(x) := nx

il suit

M (x) =



x

1−

t dm(t) = xm(x) −



x

m(t) dt = o(x).

1

Pour prouver l’implication réciproque (ii) ⇒ (i), nous établissons d’abord une identité de convolution pour la fonction  − 1, dont nous devons montrer qu’elle possède une fonction sommatoire o(x). On a  − 1 = (ln −τ ) ∗ μ = (ln −τ + 2γ 1) ∗ μ − 2γ δ = f ∗ μ − 2γ δ, disons, où la fonction f satisfait à (3.13)

F (x) :=



√ f (n) = O( x),

nx

d’après le Théorème 3.2 et l’évaluation du Corollaire 0.5 pour



nx ln n.

64

I.3. ORDRES MOYENS

Nous allons montrer que

H(x) :=

(3.14)



nx

f ∗ μ(n) = o(x)

en utilisant (3.13) et en faisant appel au principe de l’hyperbole. Pour chaque y > 2 fixé, on peut écrire grâce au Théorème 3.1   μ(n)F (x/n) + f (m)M (x/m) − F (y)M (x/y). H(x) = my

nx/y

Sous l’hypothèse (ii), il suit donc   H(x)  1 1   x  1  x   ≪√ · lim sup    lim sup  ≪ lim sup F x n n y x→∞ x x→∞ x x→∞ nx/y

nx/y

Comme y est arbitrairement grand, cela implique bien (3.14).

Il reste à établir l’implication (i) ⇒ (iii). Remarquons d’abord que la relation de convolution μ ∗ 1 = δ fournit par sommation  μ(n) ⌊x/n⌋ = xm(x) + O(x) 1= nx

d’où

m(x) = O(1).

(3.15)

La même relation implique encore  μ(m) = δ (n) md md=n

d’où

 μ(m)  1 =1 m d

mx

(x  1).

dx/m

En évaluant la somme intérieure par le Théorème 0.8, il vient

m   μ(m)  x  = m(x)(ln x + γ ) − G(x) + O(1), ln +γ +O 1= m m x mx

où l’on a posé

G(x) :=

 μ(m) ln m · m

mx

Il nous suffit donc d’établir que l’on a (3.16)

G(x) = o(ln x)

(x → ∞).

À cette fin, nous utilisons la relation de convolution (2.20) : μ ln = − ∗ μ = (1 − ) ∗ μ − δ.

3.6. FONCTION DE MÖBIUS ET FONCTIONS DE TCHÉBYCHEV

65

Il suffit de considérer le cas x ∈ / N. Nous pouvons alors écrire  x+   1 − (j)  μ(k) m(x/t) − 1 = −1 + dR(t) G(x) = j k t 1− jkx

où l’on a posé

R(t) := ⌊t⌋ − ψ (t)

(t  1),

de sorte que, par hypothèse,

(t → ∞).

R(t) = o(t)

Par sommation d’Abel, il suit  x  x+ G(x) = −1 + t−2 m(x/t)R(t) dt − t−1 R(t) dm(x/t) 1 1−  x  x = O(1) + o(1/t) dt − o(1)| dm(x/t)|. 1−

1

La première intégrale est o(ln x). Au vu de l’inégalité entre mesures de Stieltjes   1/n , | dm(y)|  d ny

on constate qu’il en va de même de la seconde, d’où (3.16) et finalement (iii).

⊓ ⊔

Corollaire 3.9. Les assertions suivantes sont élémentairement équivalentes à celles du Théorème 3.8 : (iv) (v) (vi)

π (x) ∼ x/ ln x

ϑ (x) ∼ x  (n)/n = ln x − γ + o(1) nx

(x → ∞),

(x → ∞),

(x → ∞).

Démonstration. Les cas de (iv) et (v) découlent immédiatement du Théorème 2.11. L’implication (vi) ⇒ (i) est prouvée par une simple sommation d’Abel, dont nous laissons les détails au lecteur. Pour la réciproque, on utilise à nouveau la fonction f = ln −τ + 2γ 1 introduite dans la preuve du Théorème 3.8. Nous avons  f (k) μ(d)  (n) − 1 = − 2γ n k d kdx nx (3.17)

x  μ(d) x   f (k) x  E m + − E(y) m − 2γ = d d k k y dx/y

avec

E(z) :=



ky

√ f (k)/k = C + O(1/ z)

(z  1).

kz

Cette dernière relation découle, pour une constante convenable C , par sommation d’Abel de l’estimation (3.13). En faisant tendre x puis y vers l’infini, nous obtenons comme précédemment, grâce à (iii), que (3.17) vaut −2γ +o(1), d’où la conclusion souhaitée. ⊓ ⊔

66

I.3. ORDRES MOYENS

3.7. Entiers sans facteur carré Lorsqu’une fonction arithmétique est à valeurs 0 ou 1, on peut la considérer comme la fonction indicatrice d’une suite d’entiers A. L’étude de l’ordre moyen se confond alors avec celui de la fonction de comptage   A(x) := A ∩ [1,x].

La fonction multiplicative n → μ(n)2 fournit un bon exemple de cette situation. Sa fonction sommatoire  Q(x) := μ(n)2 nx

est égale au nombre des entiers sans facteur carré n’excédant pas x. Théorème 3.10. On a, pour x infini,

Q(x) =

(3.18)

√ 6 x + O( x). 2 π

Démonstration. Comme dans le cas de τ (n), σ (n) ou ϕ (n), nous cherchons à écrire μ(n)2 sous forme d’un produit de convolution. Pour cela, décomposons chaque entier n en un produit canonique

n = qm2 , μ(q)2 = 1.

(3.19)

Cette décomposition est unique : en fait, q est égal au produit des facteurs premiers de n dont l’exposant est impair. On a alors  (3.20) μ(n)2 = δ (m) = μ(d). d|m

En remarquant que d | m équivaut à d2 | n, il suit $x%

 1    √  6 Q(x) = μ(d) = μ(d) 2 = 2 x + O x x , + 2 d π √ √ d 2 nx d |n

d x

d> x

d’après (3.9). Cela implique bien (3.18).

⊓ ⊔

Remarque. Nous aurions pu adopter√le raisonnement légèrement différent suivant. Désignons, pour chaque m  x, par Am l’ensemble des entiers n  x satisfaisant (3.19). Alors {n : n  x} est la réunion disjointe des Am , et l’on a

|Am | = Q(x/m2 ),

d’où





m x

Q(x/m2 ) = ⌊x⌋

(x  1).

Posons x = y 2 , et appliquons la seconde   formule d’inversion de Möbius (Théorème 2.10) aux fonctions F (y) = y 2 et G(y) = Q(y 2 ). Il suit comme précédemment    (x  1). Q(x) = μ(d) x/d2 √ d x

3.8. MOYENNE D’UNE FONCTION MULTIPLICATIVE À VALEURS DANS [0,1]

67

Le résultat suivant montre que le théorème des nombres premiers permet d’améliorer le terme d’erreur de (3.18). Théorème 3.11. Sous l’hypothèse

M (x) =

(3.21)



μ(n) = o(x),

nx

on a

Q(x) =

(3.22)

√ 6 x + o( x) 2 π

(x → ∞).

Démonstration. La relation (3.20) peut encore s’écrire μ2 = λ ∗ 1 où λ est la fonction arithmétique définie par  μ(d) si n = d2 , λ(n) = 0 si n n’est pas un carré. Par le principe de l’hyperbole, il vient, pour 1  y  x,   $ x %   x   x − ⌊y⌋ M Q(x) = M μ(d) 2 + d m y √ my d

=

x/y



d



x/y

  √ x μ(d) 2 + O(1) + oy x d

   ∞ √ dM (t) 6x x + oy x · + O = 2 −x √ 2 π t y x/y

Or on a pour tout z  1  ∞  ∞

1

1  ∞ 1  M (t) dM (t) M (z) + = − + 2 dt = o o 2 dt = o . 2 2 3 t z t z t z z z z

On peut donc écrire

6x Q(x) = 2 + O π de sorte que, pour chaque y  1 fixé,

  √ x + oy ( x), y

√ √ lim sup |Q(x) − 6x/π 2 |/ x ≪ 1/ y . x→∞

Cela implique bien la conclusion (3.22), en faisant tendre y vers l’infini.

⊓ ⊔

3.8. Moyenne d’une fonction multiplicative à valeurs dans [0,1] Le Théorème 3.10 énonce que l’ordre moyen de la fonction μ(n)2 est la constante    6 1 − 1/p2 = (1 − 1/p) 1 + μ(p)2 /p . = 2 π p p

68

I.3. ORDRES MOYENS

On dit que μ(n)2 possède une valeur moyenne, égale à 6/π 2 . Il est facile de construire des fonctions arithmétiques, même à valeurs dans [0,1], ne possédant pas de valeur moyenne. Si l’on pose par exemple  1 si 22k < n  22k+1 (k = 0,1, . . .), f (n) = 0 si 22k+1 < n  22k+2 (k = 0,1, . . .), on constate que

lim inf x−1 x→∞



f (n) = 31 ,

nx

lim sup x−1 x→∞



f (n) = 32 .

nx

Le théorème suivant règle la question dans le cas des fonctions multiplicatives. Théorème 3.12. Soit f une fonction arithmétique multiplicative à valeurs dans [0,1]. On pose  1   f (pν ) M (f ) := 1− p pν p ν 0

où le produit infini est considéré comme valant 0 lorsqu’il est divergent. Alors on a  (3.23) f (n) = x{M (f ) + o(1)} (x → ∞). nx

Démonstration. Pour chaque y > 2, on introduit les fonctions auxiliaires complètement multiplicatives αy et βy définies par   1 si p  y , 0 si p  y , βy (p) = αy (p) = 0 si p > y , 1 si p > y . Il est facile de vérifier que pour toute fonction multiplicative f on a

f = f αy ∗ f βy . Lorsque f est à valeurs dans [0,1], cela implique

f  fy := f αy ∗ βy . On a de plus βy = 1 ∗ hy où hy := βy ∗ μ est définie par  si p  y et ν = 1, −1 ν hy (p ) = 0 si p > y ou ν  2. ! En particulier hy (n) = 0 dès que n > N (y) := py p. Cela implique, lorsque x tend vers l’infini, $x%   hy (m) 1 1  1 = → βy (n) = hy (m) 1− . x x m m p nx

m1

mN (y)

py

Ainsi, pour chaque y fixé, βy possède une valeur moyenne, égale à M (βy ). Maintenant, on peut écrire  f (d)αy (d) d  1 · fy (n) = βy (m). (3.24) x d x nx

dx

mx/d

3.8. MOYENNE D’UNE FONCTION MULTIPLICATIVE À VALEURS DANS [0,1]

69

Comme la série à termes positifs ou nuls  f (d)αy (d)   f (pν ) = d pν py ν 0

d1

est convergente, on déduit de (3.24), grâce au théorème de la convergence dominée, que fy possède une valeur moyenne, égale à   f (d)αy (d) 1   f (pν ) M (βy ) = = M (fy ). 1− d p pν py

d1

ν 0

D’où, pour chaque y > 2 fixé, 1 f (n)  M (fy ) + o(1) (3.25) x nx

(x → ∞).

M (fy ) est une fonction décroissante de y . Donc si le produit infini M (f ) diverge, on a M (fy ) → 0 lorsque y → ∞. Dans ce cas, on obtient bien que f possède une valeur moyenne nulle. Si le produit M (f ) converge, il en va de même de la série  1 − f (p) . p p On a alors, pour tout entier n  1,   f (pν )  1 − f (pν ) − fy (n) − f (n) = pν n, py





pν n, p>y

d’où

pν n

 1 − f (pν )



f (pν )

pν n, p>y

   fy (n) − f (n)  1 − f (pν ) ⌊x/pν ⌋

nx

p>y ν 1

  1 1 − f (p) + =: xε(y), x p p(p − 1) p>y

disons, où ε(y) tend vers 0 lorsque y tend vers l’infini. Le résultat souhaité découle de cette estimation grâce à (3.25), en faisant tendre successivement x et y vers l’infini. ⊓ ⊔

N OTES

§ 3.2. Cette présentation du principe de l’hyperbole est due à Diamond (1982). La démonstration originale de Voronoï est élémentaire et repose sur la formule sommatoire d’Euler–Maclaurin. Deux autres démonstrations élémentaires classiques de l’inégalité α  1/3 sont celle de Landau (1912), utilisant la théorie des fonctions de Bessel, et celle de I.M. Vinogradov (1917), exposée dans le livre de Gelfond & Linnik (1965), et qui est également fondée sur la formule d’Euler– Maclaurin. La majoration α  131/416 de Huxley (2003) est obtenue en affinant la méthode d’Iwaniec & Mozzochi (1988) qui fournit α  7/22, améliorant ainsi un résultat de Kolesnik (1985), α  139/429. Le gain numérique est relativement faible (139/429 ≈ 0,324, 131/416 ≈ 0,315), comme dans toute l’histoire de ce problème, mais les idées impliquées sont importantes. La méthode de Kolesnik est une extension à plusieurs variables de celle de van der Corput (1922), esquissée au Chap. I.6. Celle de Iwaniec & Mozzochi revient, par un procédé complexe, à majorer une moyenne de sommes doubles d’exponentielles. Il s’agit d’une version bidimensionnelle du traitement de Bombieri & Iwaniec (1986), qui a permis d’obtenir une nouvelle majoration de la fonction zêta de Riemann sur la droite critique : |ζ ( 21 + it)| ≪ε t9/56+ε . Le meilleur résultat actuellement connu dans cette direction est dû à Huxley (2005) qui obtient, en élaborant cette même méthode,

|ζ ( 12 + it)| ≪ε t32/205+ε . Le fait que (x) n’est pas o(x1/4 ) découle directement de l’évaluation en moyenne quadratique de Tong (1956) :  x  ζ (3/2)4 3/2 x + O x(ln x)5 . (y)2 dy = 2 6π ζ (3) 0

§ 3.4. Améliorant un résultat d’Erdos ˝ & Shapiro (1951), Montgomery (1987) montre que  3   sup  x ln2 x > ϕ (n) − 2 x2 lim < 0. inf π nx

NOTES

71

§ 3.6. La démonstration du Théorème 3.8 est essentiellement celle qui est proposée par Diamond (1982). L’implication (ii) ⇒ (i) dans le Théorème 3.8 est un cas particulier d’un résultat général concernant les inverses de Möbius de fonctions à variation bornée — cf. Ellison & Mendès France (1975), th. 3.1. § 3.7. Le Théorème 3.11 est dû à Landau (1909). Le meilleur terme d’erreur actuellement connu pour la formule (3.22) est    √ (ln x)3/5  x exp −c O . (ln2 x)1/5

Il est dû à Walfisz (1963). Sous l’hypothèse de Riemann, S. Graham (1981a), améliorant un résultat de Montgomery & Vaughan (1981), a montré que l’on peut obtenir  Oε x8/25+ε .

˝ dans les années § 3.8. La méthode des fonctions αy ,βy , remonte au moins à Erdos, trente. Elle a été utilisée de manière remarquable par Daboussi — cf. 1979, 1984 en particulier. Le cas de convergence du produit M (f ) peut être généralisé comme suit : Soit f une fonction multiplicative à valeurs complexes et telle que  |f ∗ μ(n)| < ∞. (3.26) n n1

Alors on a



f (n) = x{M (f ) + o(1)}

nx

où le produit M (f ), défini comme dans le Théorème 3.12, est absolument convergent.En effet, posant h = f ∗ μ, on a pour x  1 $x%  h(d) 1 1 (x → +∞) → f (n) = h(d) x x d d nx

dx

d1

d’après le théorème de la convergence dominée. Il est alors facile de vérifier que l’hypothèse de convergence absolue implique  h(d) = M (f ). d d1

Nous verrons au Théorème II.1.3 que l’hypothèse (3.26) équivaut à (3.27)

  |f (pν ) − f (pν −1 )| p

ν 1



< ∞.

Le cas de valeur moyenne nulle dans le Théorème 3.12 peut être traité par le Théorème III.3.5. Une telle approche fournit en fait une majoration effective.

E XERCICES

 52. Montrer que n1 1/n2 = π 2 /6 : (a) en intégrant la série de Fourier de t ; (b) en intégrant la série de Taylor de argth x/x. [On calculera l’intégrale par la méthode des résidus.(1) ]  53. Montrer que nx 2ω(n) = (6/π 2 )x ln x + O(x).

54. Un résultat de M. Nair.(2)  (a) Montrer que 2ω(n) = d2 |n μ(d)τ (n/d2 ) (n  1).  (b) En déduire une formule asymptotique pour nx 2ω(n) avec terme d’erreur √ O( x ln x). 55. Déterminer une fonction arithmétique h telle que h ∗ 2ω = μ2 2ω . (a) Montrer que n>x |h(n)|n−1 ≪ε x−1/2+ε pour tout ε > 0.  (b) En déduire que nx μ(n)2 2ω(n) = Cx ln x + O(x) où  C := (1 − 1/p)2 (1 + 2/p). p

56. Montrer que



3ω(n) = 21 Cx(ln x)2 + O(x ln x),

nx

où C est la constante définie à l’Exercice 55. Généraliser.    57. (a) Montrer que nx 2(n) = kln x/ ln 2 2k mx/2k f (m) où f est la fonction multiplicative définie par f (pν ) := 0 (si p = 2), := 2ν (si p  3). (b) montrer  l’on déterminera, ! que  En écrivant f = τ ∗ h, où h est une fonction que nx f (n) = 14 C0 x ln x + O(x) pour C0 = p>2 1 + 1/p(p − 2) .  (c) Montrer que nx 2(n) = (C0 /8 ln 2)x(ln x)2 + O(x ln x). 1 2

Voir par exemple Cartan (1961), pp. 107-109. Communication privée.

EXERCICES

73

58. Valeur moyenne de 3(n) . Dans cet exercice, on suppose connue la formule d’Euler (II.1.6) relative à la fonction de Riemann s → ζ (s). On rappelle que u

désigne la partie fractionnaire d’un nombre réel u. (a) On pose  ln 3 ln(3/2) , v := u + 1 = , f (ϑ ) := 3−ub− ϑ −vb (ϑ ∈ R). u := ln 2 ln 2 b0

Montrer que



3a+b = 23 z v f

+ O(z)

(z  1).

3(n) . Montrer que   3a+b 3(m)

(x  1).

a0, b0 2a 3b z

(b) On pose A(x) :=

A(x) =

ln z 



ln 2

nx

mx (m,6)=1

a0, b0 2a 3b x/m

(c) Soit h la fonction multiplicative définie par  0 si p = 2 ou 3 et ν  1, ν h(p ) := 3ν si p  5. Montrer que, pour c  1, x  1, on a



(3.28)

mx (m,6)=1

 h(m)  3(m) 1 =  · c c m m 1 − 3/pc mx

5px

En déduire que



mx (m,6)=1

3(m) ≪ (ln x)3 m

(x  2).

(d) En utilisant l’inégalité (1 − 3r)−1  (1 − r)−3 (1 + 8r2 ) (0  r  1/5), déduire de (3.28) qu’il existe une constante absolue A telle que



(m,6)=1

3(m)  Aζ (c)3 mc

(c > 1).

(e) Montrer que, pour tout ε ∈]0,v − 1[ et tout x  2, on a



m>x (m,6)=1

3(m)  mv



(m,6)=1

3(m)  Ax1−v+ε ζ (1 + ε)3 . m1+ε xv−1−ε

Qu’obtenez-vous en choisissant ε := 1/ ln x pour x assez grand ?

74

I.3. ORDRES MOYENS

(f) Montrer que la série

g(ϑ ) :=

3(m) ln m  f ϑ − mv ln 2



m1 (m,6)=1

est convergente pour tout ϑ réel. En utilisant les résultats établis en (a), (b), (c), (d), prouver que

ln x  + O(x(ln x)3 ) (x  2). A(x) = 23 xv g ln 2 59. Pour r ∈ N∗ et x > 0, on désigne par Sr (x) le nombre des couples d’entiers (a,b) tels que 1  a,b  x et pgcd(a,b) = r. 6 (x  1). (a) Montrer que S1 (x) = 2 x2 + O(x ln 2x) π (b) Donner une relation simple entre les fonctions Sr et S1 . (c) En déduire que  6 T (x) := pgcd(a,b) = 2 x2 ln x + O(x2 ). π 1a, bx

(d) À l’aide de la formule n =



d|n ϕ (d),

T (x) = x2

montrer que

 ϕ (d) + O(x2 ). d2

dx

(e) En déduire une formule asymptotique pour



2 dx ϕ (d)/d .

60. Théorème d’Axer (1910). Soit λ(x) une fonction bornée et à variation bornée Vλ (I) sur tout intervalle borné I et soit {an }∞ n=1 une suite réelle satisfaisant à  (i) |an | = O(x) (x  1) nx

(ii)

A(x) :=



an = o(x)

nx

(a) Écrire la somme S(x,y) := intégrale de Stieltjes. Montrer que



ny

(x → ∞).

an λ(x/n) (x  1, y  1) comme une

|S(x,x) − S(x,y)|  o(x) + Vλ ([1,x/y]) sup |A(t)|

(1  y  x).

y 0, t  1, fα (n) := n/ϕ (n) , et   Fx (t) := {n  x : n > tϕ (n)}.

76

I.3. ORDRES MOYENS

(a) En appliquant le résultat de l’Exercice 66 à fα avec α = α (t) convenablement choisi, montrer qu’il existe une constante absolue positive c telle que

Fx (t) ≪ x exp{−ect }

(x  1, t  1).

(b) Montrer que pour α > 0, ε > 0, fixés on a   n α fα (p) − 1  + O(xε ). =x 1+ ϕ (n) p p nx

68. Suite de Farey, 1. Soient N  1, FN la suite de Farey d’ordre N et a/b, a′ /b′ deux éléments consécutifs de FN apparaissant dans cet ordre. (a) Montrer que l’équation bu − av = 1 possède des solutions en nombres entiers u et v tels que u  1, N − b < v  N . En déduire que u/v ∈ FN , u/v > a/b. (b) Montrer que, si u/v = a′ /b′ , alors u/v − a′ /b′  1/vb′ . En déduire que u/v − a/b > N/bb′ v . Montrer que cette dernière inégalité n’a pas lieu et en déduire que a′ /b′ = u/v . (c) Application. Construire le successeur de 94 dans F13 . 69. Suite de Farey, 2. Soient FN la suite de Farey d’ordre N et a/b, a′′ /b′′ , a′ /b′ trois éléments consécutifs de FN apparaissant dans cet ordre. Montrer que a + a′ a′′ = · b′′ b + b′ 70. Entiers carrus.(3) Soit S := {n  1 : p|n ⇒ p2 |n}, S(x) := |S ∩ [1,x]|.   (a) En estimant nx, n∈S x/n, montrer que √ S(x) ≪ x ln x. (b) Montrer que chaque n de S peut s’écrire de manière unique sous la forme n = m3 d2 où m est sans facteur carré. En déduire que(4)

S(x) ∼

ζ (3/2) √ x. ζ (3)

! 71. Noyau d’un entier. Soit k(n) := p|n p le noyau sans facteur carré d’un entier générique n.  (a) Déduire du Théorème 3.12 que nx k(n)/n ∼ Cx avec  C := 1 − 1/p(p + 1) . p

(b) En utilisant le résultat de l’Exercice 70(b), montrer que  k(n) √ = Cx + O( x). n nx

(c) Montrer que

(5)



nx

3 4 5

 k(n) = 21 Cx2 + O x3/2 .

Nous proposons le néologisme « carru » comme traduction de l’anglais squarefull. Voir Suryanarayana & Sitaramachandra (1973) pour un résultat plus précis. Voir aussi Cohen (1960, 1964).

EXERCICES

77

72. Montrer l’existence d’une constante positive A telle que 

√   ω τ (n) = Ax + O x(ln x)3 nx

et établir l’estimation





nx 

τ (n) = x ln2 x + O(x).(6)

73. Montrer que le théorème des nombres premiers implique  ∞ ψ (t) − t dt = −1 − γ . t2 1 74. Soit λ(n) la fonction de Liouville, définie par λ(n) := (−1)(n) , où (n) désigne le nombre total des facteurs premiers de n, comptés avec multiplicité. (a) Montrer que λ = μ ∗ κ, où κ désigne la fonction indicatrice des carrés. (b) Montrer que le théorème des nombres premiers est élémentairement équivalent à la validité de la formule asymptotique  λ(n) = o(x) (x → ∞). nx

75. Identité de Selberg (1949). On définit la fonction arithmétique 2 := ln2 ∗μ =  ∗  +  ln. (a) Montrer que, pour tous p, q premiers, p = q , et tous entiers α  1, β  1, on a 2 (pα ) = (2α − 1) ln2 p, 2 (pα q β ) = 2 ln p ln q et 2 (n) = 0 si ω(n) > 2.    (b) Montrer que nx 2 (n) = px ln2 p + pqx ln p ln q + O(x).   (c) Montrer que nx τ ∗ 1(n) = 12 x ln2 x + ax ln x + bx + O x2/3 ln(2x) , où a et b sont des constantes réelles. En déduire que, pour des constantes convenables A et B , la fonction h := 2τ ∗ 1 + Aτ + B 1 − ln2 possède une fonction sommatoire H(x) ≪ x3/4 .  (d) Montrer que nx 2 (n) = 2x ln x + O(x).(7) 76. Soit g une fonction multiplicative complexe, à valeurs dans le disque unité.  On pose S(n) := d|n g(d). Montrer l’existence de la valeur moyenne 1 |S(n)/τ (n)|2 x→+∞ x

lim

nx

et l’exprimer sous forme de produit eulérien. En déduire que la condition  {1 − ℜe g(p)}/p = ∞ p

 est nécessaire et suffisante pour que l’on ait S(n) = o τ (n) pour presque tout entier n, autrement dit pour qu’il existe une fonction ε(x) vérifiant limx→∞ ε(x) = 0 et telle que    n  x : |S(n)| > ε(x)τ (n)  = o(x) (x → ∞).

6

Voir Rieger (1972) ; Heppner (1974). Selberg déduit élémentairement le théorème des nombres premiers de cette formule. Cette implication est en fait valable dans un cadre général : voir Shapiro (1959). 7

C HAPITRE

I.4 M ÉTHODES

DE CRIBLE

4.1. Le crible d’Ératosthène Le principe d’inclusion–exclusion ou la formule d’inversion de Möbius peuvent théoriquement servir à calculer π (x). Posons pour x assez grand  p; P = √ p x

√ une condition nécessaire et suffisante pour qu’un entier n, x < n  x, soit premier est que (n,P ) = 1. On peut donc écrire $x%   √ μ(d) (4.1) π (x) − π ( x) + 1 = δ ((n,P )) = . d nx

d|P

À ce stade, si nous nous contentons d’estimer ⌊x/d⌋ par x/d + O(1), il vient

√   √ 1 +O 2π ( x) . π (x) − π ( x) + 1 = x 1− p √ p x

D’après la formule de Mertens, le terme principal de cette estimation vaut {2e−γ + o(1)}x/ ln x, mais les estimations de Tchébychev montrent que le terme d’erreur est plus grand que toute puissance de x. Cela appelle deux commentaires. D’une part, la formule exacte (4.1) — appelée formule du crible d’Ératosthène — comporte beaucoup trop de termes pour avoir une validité pratique raisonnable. D’autre part, l’estimation du terme principal montre a posteriori, compte tenu du théorème des nombres premiers, que les « termes d’erreur » créés en remplaçant ⌊x/d⌋ par x/d ont globalement une

4.2. LE CRIBLE COMBINATOIRE DE BRUN

79

contribution du même ordre de grandeur que les « termes principaux ». Cela suggère que, même convenablement adaptée, cette méthode ne permettra jamais de démontrer le théorème des nombres premiers. Nous verrons qu’elle est cependant susceptible de fournir des estimations de type Tchébychev dans un contexte très général. Pour obtenir un résultat non trivial à partir de la formule (4.1), il faut introduire un paramètre y , 1  y  x, et majorer π (x) − π (y) + 1 par le nombre des entiers n n’excédant pas x et n’ayant aucun facteur premier  y . On obtient avec les mêmes calculs  1 x e−γ + o(1) π (x)  x + O(2y )  {e−γ + o(1)} +O(2y ) = x 1− p ln y ln2 x py

pour le choix essentiellement optimal y = ln x. C’est avec le souci d’accroître l’efficacité de cette méthode que le mathématicien norvégien Viggo Brun a inventé la théorie du crible combinatoire entre 1917 et 1924.

4.2. Le crible combinatoire de Brun Le crible d’Ératosthène repose sur l’identité μ ∗ 1 = δ. L’idée de Brun consiste à introduire deux fonctions auxiliaires μ1 ,μ2 , satisfaisant à μ1 ∗ 1  δ  μ2 ∗ 1,

(4.2)

et s’annulant suffisamment souvent pour que le nombre des termes de la formule résultante analogue à (4.1) ne soit pas prohibitif. Le choix initial de Brun, conduisant à ce qu’on a coutume d’appeler dans la littérature le crible de Brun pur, est le suivant. Théorème 4.1 (Brun). Désignons par χt la fonction indicatrice de l’ensemble des entiers n tels que ω(n)  t. Alors, pour tout entier h  0, les fonctions définies par (4.3)

μi (n) := μ(n)χ2h+2−i (n)

(i = 1,2)

satisfont les inégalités (4.2). Démonstration. Comme μi ∗ 1(n) ne dépend que du noyau sans facteur carré de n, il suffit de considérer le cas où μ(n)2 = 1. Si ω(n) = k , alors n possède pour  chaque r, 0  r  k , exactement kr diviseurs d tels que ω(d) = r. On peut donc écrire pour tout t  0       r k t k−1 μχt ∗ 1(n) = = (−1) μ(d) = (−1) , t r d|n, ω(d)t

rt

où la dernière égalité est aisément obtenue par récurrence sur t.

⊓ ⊔

80

I.4. MÉTHODES DE CRIBLE

Corollaire 4.2. Soit A un ensemble fini d’entiers, et P un ensemble de nombres premiers. On pose

Ad := card{a ∈ A : a ≡ 0 (mod d)},  P (y) := p, p∈P, py

S(A,P,y) := card{a ∈ A : (a,P (y)) = 1}. Alors on a, pour tout entier h  0,  μ(d)Ad  S(A,P,y)  (4.4) d|P (y), ω(d)2h+1



μ(d)Ad .

d|P (y), ω(d)2h

Voyons comment ce résultat permet d’améliorer considérablement la borne supérieure fournie pour π (x) par le crible d’Ératosthène. Nous choisissons, dans le corollaire ci-dessus, A = {n : n  x} et P = P, l’ensemble de tous les nombres premiers. D’où   $x%   μ(d)  +O y+ +y =x μ(d) π (x)  1 d d d|P (y) ω(d)2h

(4.5)

=x



py

1−

 1 +O y+ p

d|P (y) ω(d)2h

d|P (y) ω(d)2h



1+x

d|P (y) ω(d)2h



d|P (y) ω(d)>2h

 1 . d

Le second des trois termes d’erreurs ne dépasse pas y 2h puisque cette quantité majore tous les entiers d tels que d | P (y), ω(d)  2h. La somme en d figurant dans le troisième terme reste est majorée, pour chaque valeur du paramètre u  1, par    uω(d)−2h  1 u −2 h =u  exp − 2h ln u + u 1+ . d p p py

d|P (y)

Pour le choix optimal u = 2h



py

py

p−1 , on obtient que cette quantité est

≪u (ln y)−v

où l’on a posé v = u ln u − u : cela découle du Théorème 1.10. Lorsque u > 5, on a v > 3. Il est facile de constater que, pour y assez grand, il existe un u = u(y), 5 < u < 6, tel que 1 h := 12 u p py

soit entier. On a dans cette circonstance, pour x assez grand,

y 2h  y 6 ln2 y+O(1) < x2/3 dès que (4.6)

y  x1/(10 ln2 x) =: Y (x).

4.2. LE CRIBLE COMBINATOIRE DE BRUN

81

En rassemblant toutes les estimations précédentes, nous obtenons, pour le choix y = Y (x), x ln2 x π (x) ≪ . ln x Bien qu’inférieur à celui de Tchébychev, ce résultat est remarquable à cause de la grande généralité de l’argument. La borne inférieure correspondante pour S(A,P,y) peut être établie identiquement. Cette quantité possède en fait un intérêt arithmétique intrinsèque : elle est égale au nombre des entiers n’excédant pas x et dont tous les facteurs premiers sont plus grands que y . Nous pouvons ainsi énoncer le résultat suivant. Nous rappelons que, pour chaque entier n  1, nous désignons par P − (n) le plus petit facteur premier de n, avec la convention P − (1) = +∞, et nous posons (x,y) := card{n  x : P − (n) > y}.

(4.7)

Théorème 4.3. Sous la condition (4.6), nous avons 

1   1 1+O . (4.8) (x,y) = x 1− p (ln y)2 py

Le choix des fonctions μ1 , μ2 définies par (4.3) n’est bien entendu pas optimal. On peut affiner la méthode, au prix de certaines complications techniques, en introduisant une partition de ]1,y] en intervalles ]yj ,yj+1 ], 0  j  k , et en choisissant pour i = 1,2, μi (d) = μ(d)χi∗ (d) où χi∗ est la fonction indicatrice des entiers d ayant au plus 2hj + 2 − i facteurs premiers distincts dans P∩]yj ,y] pour chaque j , 0  j  k — voir l’Exercice 86. Il y a ainsi deux familles de paramètres à optimiser, les yj et les hj . Il serait trop long de développer ici toute la théorie du crible combinatoire, qui est d’ailleurs toujours à l’heure actuelle en évolution. Le lecteur intéressé trouvera une exposition pédagogique de ce sujet dans le livre de Halberstam & Richert, Sieve Methods (1974) — voir aussi les Notes sur ce chapitre. Bornons-nous à citer le résultat de base de la théorie obtenu avec le choix des μi (d) indiqué plus haut. C’est en particulier ce théorème qui est visé lorsqu’on invoque dans la littérature « la méthode de Brun » sans autre forme de procès. Théorème 4.4 (Lemme fondamental du crible combinatoire). Avec les notations du Corollaire 4.2, supposons qu’il existe une fonction multiplicative w  0, un nombre réel X et des constantes positives κ,A, telles que l’on ait (a) (b)

Ad =: Xw(d)/d + Rd  A  w(p) −1 ln ξ κ 1+ < 1− p ln η ln η

(d | P (y)) (2  η  ξ ).

ηpξ

Alors on a uniformément par rapport à A, X , y et u  1

 w(p)   (4.9) S(A,P,y) = X 1− 1+O u−u/2 +O p py , p∈P



dy u , d|P (y)

 |Rd | .

82

I.4. MÉTHODES DE CRIBLE

On peut déduire facilement de ce résultat une majoration de type Tchébychev pour π (x), ainsi qu’une évaluation de l’ordre de grandeur de (x,y) pour y  xδ , où δ est un réel positif fixé. Nous laissons les détails au lecteur. Les meilleurs résultats de crible actuels obtenus par des techniques combinatoires sont dûs à Iwaniec (1980a,b).

4.3. Application aux nombres premiers jumeaux Nous illustrons ici les résultats du paragraphe précédent par le théorème de Brun sur les nombres premiers jumeaux. Il est clair que la différence de deux nombres premiers impairs consécutifs est au moins égale à 2. Lorsqu’elle est précisément égale à 2, on dit que ces nombres premiers sont jumeaux, ainsi {3,5},{5,7},{11,13},{17,19},{29,31}, etc. Une conjecture célèbre affirme l’existence d’une infinité de nombres premiers jumeaux. Posons   J := {p : p + 2 est premier} et J(x) := J ∩ [1,x]. Sur les bases d’une approche analytique, et en accord avec le calcul probabiliste heuristique, Hardy & Littlewood (1922) ont conjecturé que l’on a  x  1 1− (4.10) J(x) ∼ 2 (x → ∞). 2 (p − 1) (ln x)2 p>2

Par la méthode de Brun pure, nous établissons le résultat suivant. Théorème 4.5 (Brun). On a pour x infini

ln x 2 2 . (4.11) J(x) ≪ x ln x Corollaire 4.6. (4.12)

1 < ∞. p

p∈J

Démonstration. Nous appliquons le Corollaire 4.2 avec

A = {m(m + 2) : m  x}, en choisissant pour P l’ensemble de tous les nombres premiers. Pour tout y , 1  y  x, on a  (4.13) J(x)  S(A,P,y) + y  μ(d)Ad + y , d|P (y), ω(d)2h

où Ad est le nombre de solutions en entiers m  x de la congruence (4.14)

m(m + 2) ≡ 0 (mod d).

4.4. LE GRAND CRIBLE — FORME ANALYTIQUE

83

Cette relation équivaut à (4.15)

 m ≡ 0 (mod 2ν ), m ≡ 0 ou − 2 mod p (p|d, p = 2),

où ν vaut 1 ou 0 selon que d est pair ou impair. D’après le théorème chinois, il y a donc ̺ (d) solutions modulo d, où ̺ est la fonction fortement multiplicative définie par ̺ (2) = 1, ̺ (p) = 2

(4.16)

(p  3).

Chaque intervalle de longueur d contient ̺ (d) entiers m comptés dans Ad . Nous pouvons donc écrire

Ad = x

(4.17)

̺ (d) + O(̺ (d)) d

(μ(d)2 = 1).

En reportant cette évaluation dans (4.13) et en effectuant un calcul parallèle à (4.5), il suit (4.18)

J(x)  x

 μ(d)̺ (d) +O y+ d

d|P (y)



d|P (y) ω(d)2h

̺ (d) + x



d|P (y) ω(d)>2h

̺ (d)  . d

Le terme principal vaut   1 2 2 1  2x ∼ 2e−2γ x(ln y)−2 . 1− 1− 2x p p 2 0 on a τ (n) = Oε (nε ). Le corollaire s’obtient immédiatement en appliquant le Théorème 5.2 à f (n) = τ (n)/nε . Pour q = pν , on a en effet

f (q) = (ν + 1)/pνε  2(1 + ln q)/q ε → 0 (q → ∞). Preuve du Théorème 5.2. Désignons par q un entier générique égal à une puissance de nombre premier. Par hypothèse, il existe pour chaque ε > 0 un entier Q = Q(ε) tel que q > Q ⇒ |f (q)|  ε. Considérons alors la partition suivante de l’ensemble des q

Q1 := {q : q  Q,|f (q)|  1},

Q2 := {q : q  Q,|f (q)| > 1}, Q3 := {q : q > Q}.

Chaque entier n se décompose de manière unique sous la forme  n = n1 n2 n3 avec ni := q (i = 1,2,3). qn, q∈Qi

Il est clair que les ni sont deux à deux premiers entre eux, de sorte que (5.1)

f (n) = f (n1 )f (n2 )f (n3 ).

D’après la définition de Q1 , on a |f (n1 )|  1. Comme Q2 est inclus dans l’ensemble fini des q tels que |f (q)| > 1, il existe une constante A indépendante de ε

5.2. LA FONCTION τ (n)

121

tel que

|f (n2 )|  A. De plus, |f (n3 )|  ε sauf pour un nombre fini d’entiers n. Il découle donc de (5.1) que l’on a

lim sup |f (n)|  Aε, n→∞

⊓ ⊔

d’où la conclusion annoncée.

Le résultat suivant montre que le Corollaire 5.3 n’est pas très éloigné de l’optimalité : ε ne peut tendre vers 0 que comme c/ ln2 n. Théorème 5.4. Un ordre maximal de la fonction ln τ (n) est (ln 2)(ln n)/ ln2 n. Démonstration. Nous devons montrer que pour chaque ε > 0 on a τ (n) < n(ln 2+ε)/ ln2 n

(5.2)

pour n  n0 (ε), et τ (n) > n(ln 2−ε)/ ln2 n

(5.3)

pour une infinité d’entiers n. La majoration est facile. Pour chaque valeur du paramètre t, 2  t  n, on peut écrire    τ (n) = 2ν (ν + 1) (ν + 1)  pν n

pν n, p>t

pν n, pt



ln 2· ln n  ln n t  ν ln 2/ ln t  exp t(2 + ln2 n) + p .  1+ ln 2 ln t ν p n

Pour le choix t = ln n/(ln2 n)3 , il suit  ln 2· ln n

ln n  3 (5.4) τ (n)  exp 1+O ln2 n ln2 n d’où l’on déduit immédiatement (5.2).

Pour établir la minoration (5.3), il faut trouver des entiers ayant « beaucoup » de diviseurs. Des candidats naturels sont les produits  (5.5) nk := pj (k = 1,2, . . .) 1jk

où {pj : j  1} = {2,3,5, . . .} désigne la suite croissante des nombres premiers. On a τ (nk ) = 2k et

ln nk = ϑ (pk ) =



ppk

ln p  π (pk ) ln pk = k ln pk .

122

I.5. ORDRES EXTRÉMAUX

Cela implique

ln τ (nk )  (ln 2· ln nk )/ ln pk .

(5.6)

L’inégalité souhaitée (5.3) en découle, grâce à l’estimation de Tchébychev (2.29) sous la forme

ln nk = ϑ (pk )  Apk

(5.7)

pour une constante positive convenable A. En reportant (5.7) dans (5.6), il vient

1  ln 2· ln nk  (5.8) ln τ (nk )  1+O , ln2 nk ln2 nk

⊓ ⊔ ce qui implique bien (5.3). Remarque. La question de l’ordre minimal de τ (n) est triviale : on a τ (n)  2 avec égalité pour tout n premier.

5.3. Les fonctions ω (n) et  (n) On voit facilement par multiplicativité que l’on a pour tout entier n  1 2ω(n)  τ (n)  2(n)  n.

(5.9)

Chacune de ces inégalités est optimale : les deux premières sont des égalités si, et seulement si, n est sans facteur carré ; la troisième l’est si n est une puissance de 2. Cela permet d’évaluer rapidement les ordres maximaux de ω(n) et (n) — les ordres minimaux étant triviaux. D’une part, (5.4) et (5.9) impliquent ω(n)  {1 + o(1)} ln n/ ln2 n (n → ∞) et la relation (5.8) montre que cette majoration est optimale au facteur {1 + o(1)} près, puisque les nk figurant dans (5.8) sont sans facteur carré. La situation est encore plus simple pour (n) puisque la dernière inégalité de (5.9) est atteinte pour une infinité d’entiers n. Nous pouvons donc énoncer le résultat suivant. Théorème 5.5. (i) Un ordre maximal de la fonction ω(n) est ln n/ ln2 n. (ii) Un ordre maximal de la fonction (n) est ln n/ ln 2.

5.4. La fonction d’Euler ϕ (n) La fonction indicatrice d’Euler est multiplicative et sa valeur sur les puissances de nombres premiers est donnée par (5.10)

ϕ (pν ) = pν (1 − p−1 )

— cf. § 2.7. On a donc (5.11)

ϕ (n)  n

(n  1)

5.5. LES FONCTIONS σκ (N), κ > 0

123

et, pour tout ε > 0, ϕ (n)  n1−ε

(5.12)

(n  n0 (ε)).

La majoration (5.11) est triviale, la minoration (5.12) découle du Théorème 5.2 appliqué à f (n) = n1−ε /ϕ (n). Nous pouvons préciser ces estimations par l’énoncé suivant. Théorème 5.6. Un ordre maximal de ϕ (n) est n. Un ordre minimal est

e−γ n/ ln2 n où γ désigne la constante d’Euler. Démonstration. La première assertion découle immédiatement de (5.10). Pour établir la seconde on remarque que l’on a   1 1 n 1− 1− (5.13) ϕ (n) = n p p pq

p|n

pour tout entier q tel que π (q)  ω(n). D’après l’estimation inférieure de Tchébychev (Théorème 1.3) cette condition est réalisée dès que l’on a

q/ ln q  (ω(n)/ ln 2) + 4 et donc en particulier pour q = ⌊Aω(n) ln{2 + ω(n)}⌋ lorsque A est une constante positive convenable. D’après le Théorème 5.5(i) on a dans cette circonstance

q ≪ ln n d’où, par (5.13), en appliquant la formule de Mertens,

1 

1  e −γ  e −γ  n · (5.14) ϕ (n)  n 1+O 1+O ln q ln q ln2 n ln2 n

Pour achever la démonstration du Théorème 5.6, il reste à montrer que cette minoration est atteinte asymptotiquement sur une sous-suite convenable. Or, pour nk défini par (5.5), on a

1 

1   ϕ (nk ) e −γ  e−γ  = 1+O 1+O , = (1 − p−1 ) = nk ln pk ln pk ln2 nk ln2 nk ppk

grâce à l’évaluation de Tchébychev (2.29) sous la forme

ln2 nk = ln ϑ (pk ) = ln pk + O(1). ⊓ ⊔

Cela complète la démonstration.

5.5. Les fonctions σ κ (n), κ > 0 Nous avons défini au § I.2.2 la fonction arithmétique  σκ (n) = dκ (κ ∈ R). d|n

124

I.5. ORDRES EXTRÉMAUX

C’est une fonction multiplicative (σκ = j κ ∗ 1) et l’identité σκ (n) = nκ σ−κ (n) montre qu’il est suffisant d’étudier les ordres extrémaux pour les valeurs positives du paramètre — le cas κ = 0 ayant déjà été traité, puisque σ0 = τ . On a (5.15)

σκ (pν ) =

de sorte que

−(ν +1)κ p ( ν +1 ) κ − 1 νκ 1 − p , = p pκ − 1 1 − p −κ

σκ (n)  nκ

(5.16)

(n  1)

et, pour tout ε > 0, (5.17)

σκ (n)  nκ (1+ε)

(κ > 0, n  n0 (ε)),

grâce au Théorème 5.2. Lorsque κ  1, l’étude de σκ (n) est superposable à celle de ϕ (n), conduite à la section précédente. La minoration (5.16) fournit trivialement un ordre minimal de σκ (n) et la majoration (5.17) peut être facilement précisée. En effet, en choisissant q comme dans (5.13), on a  σκ (n) 1  −1 (5.18)  =: ζ (κ,q), 1 − nκ pκ pq

disons. Le produit converge lorsque κ > 1, et vaut eγ ln q + O(1) lorsque κ = 1. De plus, ln q  ln2 n + O(1). En particulier on peut donc écrire ⎧ γ si κ = 1, ⎨e ln 2 n + O(1)

1  (5.19) σκ (n)n−κ  si κ > 1. ⎩ζ (κ ) 1 + Oκ (ln n)κ

Ces majorations sont asymptotiquement atteintes sur la suite {mk } définie par (k)

 (k = 1,2, . . .) pj mk := 1jk

où p1 = 2 < p2 = 3 < . . . désigne la suite croissante des nombres premiers et où l’on a posé (k) = ⌊ln k⌋ . La vérification de ce dernier point est laissée au lecteur.

Lorsque 0 < κ < 1, l’étude précédente est encore valable, mais le comportement asymptotique du facteur ζ (κ,q) dans (5.18) est beaucoup plus complexe. Le théorème des nombres premiers implique, par sommation d’Abel, que (5.20)

ln ζ (κ,q) ∼ q 1−κ /(1 − κ ) ln q

mais même la forme la plus forte ne permet pas d’expliciter un équivalent élémentaire de ζ (κ,q). Une autre difficulté intrinsèque réside dans le fait que, en raison des fluctuations du terme d’erreur du théorème des nombres premiers, la valeur de q dans (5.18) n’est pas déterminée avec une grande précision en tant que fonction de n. Dans le cas où κ  1, cela n’avait pas de conséquence importante car ζ (κ,q) était une fonction à croissance lente de ln q . Il en va de manière radicalement différente lorsque 0 < κ < 1. Nous pouvons résumer les résultats obtenus dans le théorème suivant.

5.5. LES FONCTIONS σκ (N), κ > 0

125

Théorème 5.7. Pour κ > 0, un ordre minimal de σκ (n) est nκ . Pour κ > 1, un ordre maximal est ζ (κ )nκ . Pour κ = 1, un ordre maximal est eγ n ln2 n. Pour 0 < κ < 1, on a   (ln n)1−κ σκ (n)  nκ exp (1 + o(1)) (1 − κ ) ln2 n

et l’inégalité opposée est satisfaite pour une infinité de valeurs de n.

N OTES

§§ 5.1–5.5. La première étude systématique de l’ordre maximal d’une fonction arithmétique est due à Ramanujan (1915) qui s’est attaché non seulement à déterminer les grandes valeurs de τ (n) mais aussi à expliciter la structure des nombres pour lesquels ces grandes valeurs sont atteintes. L’étude des ordres maximaux des fonctions arithmétiques représente aujourd’hui un domaine vivant de la théorie des nombres, possédant des méthodes puissantes et des techniques originales. Un excellent survol, assorti d’une bibliographie exhaustive a été rédigé par Nicolas (1988). Le lecteur intéressé par ce sujet trouvera d’autres exemples de problèmes et de conjectures dans Nicolas (1974/75, 1978, 1983a), Erdos ˝ & Nicolas (1981a et b, 1989), Erdos ˝ & Tenenbaum (1989b), et Erdos ˝ & Sárközy (1994). Les questions liées aux ordres extrémaux sont souvent hautement non triviales, particulièrement dans la mesure où elles impliquent la structure fine des entiers. D’une manière générale le problème des « grandes valeurs » induit naturellement celui de la répartition des entiers pour lesquelles elles sont prises. Cet aspect de la question est souvent difficile. Même dans le cas célèbre de la fonction τ (n) et des nombres hautement composés de Ramanujan, les résultats obtenus sont incomplets — cf. Nicolas (1988). § 5.5. Pour le comportement asymptotique de ζ (κ,q), voir le Lemme III.5.16.

E XERCICES

87. Quels sont les ordres extrémaux de la fonction « somme des chiffres en base r » ? 88. On pose δr (n) := card{m1 , . . . ,mr : n = [m1 , . . . ,mr ]}. Calculer δr ∗ 1 et montrer que δr est une fonction multiplicative. Déterminer les ordres extrémaux de ln δr . 89. On se propose ici de retrouver un résultat d’Erdos ˝ & Nicolas (1981b) concernant les ordres extrémaux de la fonction F (n) = ϕ (n) + ϕ (n + 1). (a) Montrer que F (n)  3n/2 (n > 1). (b) On désigne par p1 = 2 pk et que p|(Nk + 1) ⇒ p = 2 ou p > pk . Montrer que ln Nk ≍ pk ≍ k ln k . En déduire que, lorsque k → ∞, ϕ (Nk ) ∼ Nk et ϕ (Nk + 1) ∼ 21 Nk . Quel est l’ordre maximal de F (n) ? ! (c) Montrer que pour n → ∞, on a ϕ (n) ∼ n p|n, pln n (1 − 1/p). (d) Déduire du résultat précédent que l’on a  (5.21) F (n)  {1 + o(1)}2e−γ /2 n/ ln2 n (n → ∞). √ [On pourra utiliser l’inégalité a + b  2 ab.] (e) Montrer qu’il existe un nombre entier r = r(k) tel que   1 1 ∼ (k → ∞). 1− 1− pj pj 1jr

r ! 0. Montrer que la borne supérieure supn1 τ (n)/nε est atteinte pour n = Nε := p pνp où l’on a posé νp := ⌊1/(pε − 1)⌋. (b) On note xk := (1 + 1/k)1/ε (k  1), K := ν2 = ⌊1/(2ε − 1)⌋. Montrer que k   p . Nε = 1kK

xk+1 0),

px

montrer que

ln Nε =



3 /4

ϑ (xk ) = ϑ (x1 ) + O(x1 ),

1kK

ln τ (Nε ) =



3 /4

π (xk ) ln(1 + 1/k) = (ln 2)π (x1 ) + O(x1 ).

1kK

(d) Soit R(x) une fonction croissante telle que π (x) − li(x) ≪ R(x) et ϑ (x) − x ≪ R(x). On suppose que x4/5 ≪ R(x) ≪ x/(ln x)2 . Montrer que, pour tout entier n  1, on a

ln τ (n)  (ln 2) li(x1 ) − εx1 + ε ln n + O(R(x1 )). En choisissant ε convenablement, montrer que (5.22)

ln τ (n)  (ln 2) li(ln n) + O(R(ln n))

(n  1),

et en particulier que

ln τ (n)  {1 + O(1/ ln2 n)}(ln 2)(ln n)/ ln2 n

(n  1).

(e) On suppose en outre que R(2x) ≪ R(x) (x  1). Montrer que l’inégalité (5.22) est une égalité pour une infinité d’entiers n. 91. (a) Déterminer l’ordre maximal de n → ln τ (n2 ). (b) Soit S := {s : p|s ⇒ p2 |s} l’ensemble des entiers carrus. Quel est l’ordre maximal de la fonction s → ln τ (s) (s ∈ S) ? (c) Soit ω1 (n) le nombre des facteurs premiers p de n tels que p2 ∤ n. Montrer que l’on a τ (n)  D(n)λ+o(1) 2(1−λ)ω1 (n)

(n → ∞)

avec λ := (ln 3)/ ln 4 et D(n) := maxmn τ (m).  α  τ (n) 92. Soit α > 1. On pose Fα (n) := 1i 1 fixé.

Remarque. Cantor a montré l’existence de nombres transcendants en remarquant que l’ensemble des nombres algébriques est dénombrable : à chaque nombre algébrique on peut associer injectivement la suite finie des entiers qui sont les coefficients de son polynôme minimal. Comme l’ensemble R n’est pas dénombrable (construction diagonale de Cantor, voir les Exercices 116 et 117), il doit contenir des nombres transcendants. D’après la théorie de Lebesgue, on voit même que presque tous les nombres réels sont transcendants. Le théorème de Liouville a eu une très riche postérité : Thue a montré en 1909 √ que l’on peut y remplacer d − 1 par tout δ > d/2 ; Siegel a amélioré cela en δ > 2 d − 1 en 1921 ; Dyson et Gelfond & Linnik√ont montré indépendamment en 1947–1948 que l’on pouvait en fait choisir δ > 2d − 1 ; et finalement, en 1955, K.F. Roth a montré que tout δ > 1 est admissible, ce qui lui a valu la Médaille Fields (1958). Le résultat est évidemment final. La démonstration est très compliquée et, comme d’ailleurs toutes les améliorations du théorème de Liouville, ineffective : étant donnés ϑ et δ > 1, elle ne donne aucun moyen de calculer explicitement la valeur de la constante c := inf q1 q δ q ϑ .

7.2. Meilleures approximations, fractions continues Soit ϑ ∈ R. Nous allons définir une suite de fractions rationnelles approchant ϑ de la manière la plus économique possible. Pour initialiser le processus, nous posons  0 si ϑ  12 z(ϑ ) := 1 si 21 < ϑ < 1, et p0 /q0 := ⌊ϑ ⌋ /1 si z(ϑ ) = 0,

p0 /q0 := ⌊ϑ ⌋ /1, p1 /q1 := (1 + ⌊ϑ ⌋)/1

si z(ϑ ) = 1.

Enfin, nous introduisons l’ensemble des meilleurs dénominateurs de ϑ

D+ (ϑ ) := {q  2 : q ϑ  < min mϑ }. 1mz(ϑ ) la suite finie ou infinie des éléments de D+ (ϑ ) rangés par ordre croissant. Nous désignons par D(ϑ ) la suite obtenue en adjoignant à {qj }j>z(ϑ ) la suite à un ou deux éléments {qj }0jz(ϑ ) . Proposition 7.7. Pour tout ϑ ∈ R, la suite {qj }j>z(ϑ ) est strictement croissante. Si k > z(ϑ ) et qk ϑ  =  0, alors qk possède un successeur dans D+ (ϑ ) et l’on a

qk ϑ   1/qk+1 . Démonstration. Si qk ∈ D+ (ϑ ) et qk ϑ ∈ Z, le théorème de Dirichlet implique l’existence d’un entier q tel que q ϑ  < qk ϑ . De plus, par définition de qk+1 , on a

qk ϑ   min q ϑ  q ϑ1 . Posons q := qk+1 − qk , p := pk+1 − pk , de sorte que

q ϑ − p = ϑk+1 − ϑk . On a q < qk+1 , donc |q ϑ − p|  q ϑ   |ϑk | si k > z(ϑ ). Cela implique bien ϑk ϑk+1 < 0 dans ce cas. Il reste à examiner les cas k = z(ϑ ) = 0 et k = z(ϑ ) = 1. Dans la première éventualité, on a ϑ  21 , donc m := ⌊1/ ϑ ⌋  2. De plus,

ϑ  j ϑ  1 − ϑ

(1  j < m),

1 − ϑ < m ϑ  1.

On a donc q1 = m et ϑ1 = mϑ − p1 = m ϑ − 1  0. Le cas restant peut être traité de façon similaire. ⊓ ⊔ Théorème 7.11. Soit ϑ ∈ R. Si 1  k < |D(ϑ )|, on a (7.5)

qk pk−1 − qk−1 pk = (−1)k .

Démonstration. Pour k = 1, z(ϑ ) = 1, on a q0 = q1 = 1, p0 = ⌊ϑ ⌋ , p1 = p0 + 1, donc q1 p0 − q0 p1 = p0 − p1 = −1. Pour k = 1, z(ϑ ) = 0, on a q0 = 1, p0 = ⌊ϑ ⌋ et d’après le calcul effectué dans la démonstration du Lemme 7.10, q1 := ⌊1/ ϑ ⌋, p1 = q1 p0 + 1.(1) Cela implique encore (7.5) pour k = 1. Plaçons-nous à présent dans le cas k  2, de sorte que k > z(ϑ ). On remarque d’abord que qk pk−1 − qk−1 pk = 0 : dans le cas contraire, on aurait pk−1 /qk−1 = pk /qk , donc

|ϑk−1 | = (qk−1 /qk )|ϑk | < |ϑk |,

ce qui contredirait la définition de qk . Ensuite, nous observons que

qk pk−1 − qk−1 pk = qk−1 (qk ϑ − pk ) − qk (qk−1 ϑ − pk−1 ) = qk−1 ϑk − qk ϑk−1 , d’où

|qk pk−1 − qk−1 pk |  qk−1 qk ϑ  + qk qk−1 ϑ   qk−1 /qk+1 + 1 < 2, en vertu de la Proposition 7.7. Nous avons donc obligatoirement

qk pk−1 − qk−1 pk = ±1. Comme nous avons vérifié la relation (7.5) pour k = 1, il suffit d’établir que le signe de l’expression est alterné. Or, pour k < |D(ϑ )| − 1, on a

(qk pk−1 − qk−1 pk )(qk+1 pk − qk pk+1 ) = (qk−1 ϑk − qk ϑk−1 )(qk ϑk+1 − qk+1 ϑk ) et il résulte du Lemme 7.10 que ce produit se développe en une somme de quatre termes négatifs. ⊓ ⊔ Corollaire 7.12. Les réduites sont réduites : on a (pk ,qk ) = 1 pour tout k  0. 1

On a 1 − ϑ < q1 ϑ  1, soit 1 − ϑ < q1 (ϑ − p0 )  1, et donc q1 p0 + 1 − ϑ < q1 ϑ  q1 p0 + 1.

7.2. MEILLEURES APPROXIMATIONS, FRACTIONS CONTINUES

157

Démonstration. C’est une conséquence immédiate du théorème de Bachet.

⊓ ⊔

Théorème 7.13. Soit ϑ ∈ R. Posons (p−2 ,q−2 ) := (0,1), (p−1 ,q−1 ) := (1,0) et (7.6)

ak := ⌊−ϑk−2 /ϑk−1 ⌋

(k  0)

où ϑk est défini par (7.4). Alors, on a, sous l’hypothèse ϑk−1 = 0, k  0,  pk = ak pk−1 + pk−2 , (7.7) qk = ak qk−1 + qk−2 . Démonstration. Comme le déterminant   pk−1 pk−2    qk−1 qk−2 

vaut (−1)k pour k  0, il existe des entiers ak et bk tels que  pk = ak pk−1 + bk pk−2 , qk = ak qk−1 + bk qk−2 . L’élimination fournit immédiatement qk−1 pk − qk pk−1 = 1, bk = qk−1 pk−2 − qk−2 pk−1 d’après le Théorème 7.11. De plus, on vérifie que (7.7) est satisfaite pour k = 0 en raison de la définition de (p0 ,q0 ). Pour k  1, on a ϑk qk ϑ − p k (ak qk−1 + qk−2 )ϑ − (ak pk−1 + pk−2 ) = = ϑk−1 ϑk−1 ϑk−1 (7.8) ϑk−2 = ak + ∈] − 1,0], ϑk−1 d’après le Lemme 7.10 et la définition des ϑk . Cela implique que la relation (7.7) est bien satisfaite pour k  1 lorsque les ak sont définis par (7.6). ⊓ ⊔ Définition 7.14. Soit ϑ ∈ R. Les nombres ak définis par (7.6) sont appelés les quotients incomplets du développement en fraction continue de ϑ . Les nombres αk := −ϑk−2 /ϑk−1 sont désignés comme les quotients complets du développement de ϑ . La dénomination de quotient complet est justifiée par la relation αk+1 pk + pk−1 ϑ= (k  0). αk+1 qk + qk−1 Théorème 7.15. Soit ϑ ∈ R. On a α0 = ϑ , αk+1 = 1/ αk (k  0). Pour k < |D(ϑ )|, on a (7.9)

pk = a0 + qk

1

·

1

a1 + a2 +

1

..

.+

1 ak

158

I.7. APPROXIMATION DIOPHANTIENNE

Démonstration. La relation (7.8) s’écrit encore 1/αk+1 = αk − ak = αk . Cela montre bien la première partie de l’assertion. La seconde est une conséquence immédiate du résultat suivant, où nous employons la notation

[a0 ,a1 , . . . ,ak ] pour désigner le membre de droite de (7.9) et étendons la validité de la notation à ⊓ ⊔ toutes suites finies {aj }kj=0 telles que aj > 0 pour j  1. Proposition 7.16. Pour k ∈ N, a0 ∈ R, a1 > 0, ..., ak−1 > 0 et tout nombre réel x > 0 on a xpk−1 + pk−2 [a0 ,a1 , . . . ,ak−1 ,x] = . xqk−1 + qk−2

où les pj , qj sont définis par (p−2 ,q−2 ) := (0,1), (p−1 ,q−1 ) := (1,0) et la relation de récurrence (7.7).

Démonstration. Nous raisonnons par récurrence sur k . La formule (7.9) est évidente si k = 0 ou 1. Si la propriété est satisfaite pour k , on a

= [a0 , . . . ,ak + 1/x] (ak + 1/x)pk−1 + pk−2 (ak + 1/x)qk−1 + qk−2 pk x + pk−1 (ak pk−1 + pk−2 )x + pk−1 = . = (ak qk−1 + qk−2 )x + qk−1 qk x + qk−1

=

⊓ ⊔

Le calcul algorithmique des quotients incomplets est très simple puisqu’il s’agit d’itérer la relation x → 1/ x . Considérons par exemple le cas du nombre π . Nous trouvons successivement 3 p0 α0 = π ≈ 3,141592653589793, = , a0 = 3, q0 1 α1 =

1 ≈ 7,062513305931045, π −3

a1 = 7,

7·3+1 p1 22 , = = q1 7·1+0 7

α2 =

1 ≈ 15,996594406685719, α1 − 7

a2 = 15,

15 · 22 + 3 p2 333 , = = q2 15 · 7 + 1 106

α3 =

1 ≈ 1,003417231013372, α2 − 15

a3 = 1,

1 · 333 + 22 p3 355 = = · q3 1 · 106 + 7 113

On a

355/113 ≈ 3,141592920353982. En quatre étapes, nous avons donc obtenu une fraction comportant six décimales exactes.

7.3. PROPRIÉTÉS DU DÉVELOPPEMENT EN FRACTION CONTINUE

159

Le théorème suivant donne les quotients partiels du développement en fraction continue d’un nombre rationnel en fonction des quotients et des restes de l’algorithme d’Euclide. Étant donné un nombre rationnel r/s avec s  1, on écrit l’algorithme d’Euclide de recherche du pgcd sous la forme

r = a0 s + r1 , 0  r1 < s, s = a1 r1 + r2 , 0  r2 < r1 , .. . rN −2 = aN −1 rN −1 + rN , 0  rN < rN −1 , rN −1 = aN rN , où rN = (r,s). Théorème 7.17. Soit r/s ∈ Q∗ , avec s  1, (r,s) = 1. On a avec les notations précédentes r = [a0 , . . . ,aN ]. s Démonstration. Posons s = r0 , r = r−1 . Nous allons montrer par récurrence descendante sur j ∈ [0,N ] que rj−1 = [aj , . . . ,aN ]. rj Le résultat est évident pour j = N . S’il est vrai pour j + 1, on peut écrire

= [aj ,aj+1 , . . . ,aN ] = [aj ,[aj+1 , . . . ,aN ]] = [aj ,rj /rj+1 ] = aj + rj+1 /rj = (aj rj + rj+1 )/rj = rj−1 /rj .

⊓ ⊔

7.3. Propriétés du développement en fraction continue Commençons par une remarque simple concernant les fractions continues finies. Proposition 7.18. Soit ϑ ∈ R. Pour k < |D(ϑ )|, on a (7.10)

[a0 ,a1 , . . . ,ak ] = a0 +

 (−1)j . qj qj+1

0j 0, donc ϑ = ϕ. ⊓ ⊔ Théorème 7.21. Soit ϑ ∈ R. Si qk ϑ  =  0, on a ϑ−

(7.11)

(−1)k pk = qk qk (αk+1 qk + qk−1 )

(k  0).

En particulier (7.12)

 1 pk   < ϑ −   . qk (qk+1 + qk ) qk qk qk+1 1

Démonstration. De la relation αk+1 = −ϑk−1 /ϑk , on tire ϑ=

αk+1 pk + pk−1 · αk+1 qk + qk−1

D’où ϑ−

qk pk−1 − qk−1 pk qk (αk+1 pk + pk−1 ) pk (αk+1 qk + qk−1 ) pk − = · = qk qk (αk+1 qk + qk−1 ) qk (αk+1 qk + qk−1 ) qk (αk+1 qk + qk−1 )

Cela implique bien (7.11), grâce à (7.5). On en déduit immédiatement l’encadrement (7.12) puisque

qk+1 = ak+1 qk + qk−1  αk+1 qk + qk−1 < (ak+1 + 1)qk + qk−1 = qk+1 + qk . ⊓ ⊔

7.3. PROPRIÉTÉS DU DÉVELOPPEMENT EN FRACTION CONTINUE

161

Corollaire 7.22. Soit ϑ ∈ R  Q. On a 1/(2 + lim sup ak )  lim inf qq ϑ   1/ lim sup ak . k→∞

q→∞

k→∞

Démonstration. On a évidemment lim inf q→∞ qq ϑ   lim inf k→∞ qk qk ϑ . Mais, pour qk  q < qk+1 , on a qq ϑ   qk qk ϑ , par définition de qk . On a donc

lim inf qq ϑ  = lim inf qk qk ϑ  q→∞

k→∞

et, puisque 0 < qk−1 /qk  1, le résultat annoncé est une conséquence immédiate de (7.12). ⊓ ⊔ Théorème 7.23 (Critère de Lagrange). Soit ϑ ∈ R  Q. Une condition nécessaire et suffisante pour que p/q soit une réduite de ϑ est qu’il existe des entiers p′ < p, q ′ < q et un nombre réel α > 1 tels que qp′ − pq ′ = ±1 et (7.13)

ϑ=

α p + p′ . αq + q′

Démonstration. La condition nécessaire est immédiate : il suffit de choisir (p′ ,q ′ ) = (pk−1 ,qk−1 ) et α = αk+1 si (p,q) = (pk ,qk ). Pour montrer qu’elle est suffisante, supposons (7.13) avec (p,q), (p′ ,q ′ ) comme indiqué. Développons alors p/q en fraction continue [a∗0 , · · · ,a∗k ] en choisissant la parité de la longueur k du développement de façon que ∗ ∗ ′ ′ qk∗ p∗k−1 − qk− 1 pk = qp − pq .

Comme p′ (resp. q ′ ) est déterminé modulo p (resp. q ) et que p′ < p (resp. q ′ < q ), ∗ cela implique (p′ ,q ′ ) = (p∗k−1 ,qk− 1 ). On en déduit en remplaçant dans (7.13) que ∗ ∗ l’on a ϑ = [a0 , · · · ,ak ,α ] et donc, grâce à l’unicité du développement en fraction continue, que α = αk+1 = −ϑk /ϑk−1 . Il s’ensuit que pk /qk est bien la réduite de ϑ d’indice k . ⊓ ⊔ Corollaire 7.24. Soit ϑ ∈ R  Q. Si |ϑ − p/q| < 1/(2q 2 ), alors p/q est une réduite de ϑ . Démonstration. Soit [a0 ,a1 , . . . ,ak ] le développement en fraction continue de p/q choisi de sorte que p/q − pk−1 /qk−1 soit de même signe que p/q − ϑ. Définissons α par α pk + pk−1 ϑ= . α qk + qk−1 On a α pk + pk−1 p pk sgn(ϑ − p/q) − = ϑ− = q α qk + qk−1 qk qk (α qk + qk−1 ) d’où 1 1 < 2 |ϑ − p/q| = qk (α qk + qk−1 ) 2qk et donc α > 2 − qk−1 /qk > 1. La conclusion souhaitée découle alors du critère de Lagrange. ⊓ ⊔

162

I.7. APPROXIMATION DIOPHANTIENNE

Pour terminer ce paragraphe, donnons une application arithmétique : la démonstration d’Hermite (1848) du théorème de Girard–Fermat (4.29). Théorème 7.25 (Girard–Fermat). Soit p un nombre premier congru à 1 modulo 4. Alors il existe des entiers r et s tels que p = r2 + s2 . Démonstration. On sait d’après le calcul du symbole de Legendre que −1 est résidu quadratique modulo p. Soit donc a un entier de [1,p − 1] tel que a2 ≡ −1 (mod p). Développons a/p en fraction continue et désignons les réduites √ par p0 /q0 , . . . ,pN /qN . Il existe un unique indice k tel que qk < p < qk+1 . On a d’après la Proposition 7.7 a p  1  k ,  −  p qk qk qk+1 √ donc |aqk − ppk |  p/qk+1 < p. Posons alors r = qk , s = aqk − ppk . Nous avons

r2 + s2 ≡ qk2 + a2 qk2 ≡ (1 + a2 )qk2 ≡ 0(mod p).

De plus, 0 < r2 + s2 = qk2 + s2 < 2p. Il s’ensuit que r2 + s2 = p.

⊓ ⊔

Remarque. La démonstration précédente fournit un algorithme pratique très performant de recherche des nombres r et s.

7.4. Développement en fraction continue des irrationnels quadratiques Définition 7.26. Deux nombres irrationnels ϑ et ϑ ′ sont dits équivalents pour le développement en fraction continue si leurs développements coïncident à partir de certains rangs, soit, pour des entiers convenables m et n, ϑ = [a0 , . . . ,am ,c0 ,c1 , . . .],

ϑ ′ = [b0 , . . . ,bn ,c0 ,c1 , . . .].

Théorème 7.27. Une condition nécessaire et suffisante pour que deux irrationnels ϑ et ϑ ′ soient équivalents pour le développement en fraction continue est qu’il existe des entiers a,b,c,d tels que ad − bc = ±1 et (7.14)

ϑ′ =

aϑ + b . cϑ + d

Démonstration. Si ϑ et ϑ ′ sont équivalents, on a, en notant σ := [c0 ,c1 , . . .], ϑ=

pm σ + pm−1 qm σ + qm−1

ϑ′ =

p′n σ + p′n−1 ′ qn′ σ + qn− 1

et similairement

7.4. DÉVELOPPEMENT EN FRACTION CONTINUE DES IRRATIONNELS QUADRATIQUES

163

où les pk /qk (resp. p′k /qk′ ) sont les réduites de [a0 , . . . ,am ] (resp. [b0 , . . . ,bn ]). On en déduit la formule indiquée puisque les transformations homographiques unimodulaires forment un groupe. Réciproquement, si la relation (7.14) est satisfaite, on peut supposer au prix d’un changement de tous les signes de a,b,c,d que cϑ + d > 0. Développons alors ϑ en fraction continue au rang k . Nous obtenons ϑ=

αk+1 pk + pk−1 . αk+1 qk + qk−1

Posons p := apk + bqk , p′ := apk−1 + bqk−1 , q = cpk + dqk , q ′ := cpk−1 + dqk−1 . On a ϑ′ =

pαk+1 + p′ aϑ + b = . cϑ + d q αk+1 + q ′

On vérifie par le calcul que pq ′ − qp′ = ±1. De plus,

q = c(pk − ϑ qk ) + qk (cϑ + d) = qk (cϑ + d) − cϑk ∼ qk (cϑ + d)

(k → ∞),

donc q > 0 pour k assez grand. De même, p > 0 pour k assez grand. Comme αk+1 > 1 (car c’est un quotient complet de ϑ ), on déduit du critère de Lagrange ′ ′ ′ que p′ /q ′ et p/q sont des réduites consécutives de ϑ ′ , disons p′n−1 /qn− 1 et pn /qn . Il existe donc un entier n tel que, avec des notations transparentes, ϑ′ =

′ ′ p′n αn+ 1 + pn−1 . ′ ′ qn′ αn+ 1 + qn−1

′ On a αk+1 = αn+ 1 = [c0 ,c1 , . . .] et

ϑ ′ = [b0 , . . . ,bk ,c0 ,c1 , . . .].

ϑ = [a0 , . . . ,ak ,c0 ,c1 , . . .],

⊓ ⊔

On dit qu’une fraction continue est périodique (ou périodique à partir d’un certain rang) s’il existe m et h tels que ak+h = ak pour k  m. Lorsqu’il en est ainsi, on note (7.15)

ϑ = [a0 , . . . ,am−1 ,am , . . . ,am+h−1 ]

le développement en fraction continue du nombre réel correspondant. Théorème 7.28. Soit ϑ ∈ R. Alors ϑ est irrationnel quadratique si, et seulement si, son développement en fraction continue est périodique à partir d’un certain rang. Démonstration. Supposons d’abord que la fraction continue de ϑ est périodique. On a donc αk+h = αk pour k  m. Il s’ensuit que ϑ = [a0 , . . . ,am−1 ,αm ] =

pm−1 αm + pm−2 qm−1 αm + qm−2

= [a0 , . . . ,am+h−1 ,αm ] =

pm+h−1 αm + pm+h−2 . qm+h−1 αm + qm+h−2

164

I.7. APPROXIMATION DIOPHANTIENNE

On obtient que αm est solution d’une équation quadratique dont le coefficient du terme de degré 2 est

qm+h−1 pm−1 − pm+h−1 qm−1 = 0

puisque deux réduites d’indices distincts sont distinctes.(2) Ainsi, αm est quadratique, donc aussi ϑ d’après le Théorème 7.27. Il reste à montrer que la condition est nécessaire. Soit ϑ un irrationnel quadratique, solution de l’équation aϑ 2 + bϑ + c = 0 avec a = 0. On a pour k  0 ϑ=

pk αk+1 + pk−1 , qk αk+1 + qk−1

donc αk+1 est solution de l’équation quadratique 2 Ak αk+ 1 + Bk αk+1 + Ck = 0

avec

⎧ ⎨Ak := ap2k + bpk qk + cqk2 , Bk := 2apk pk−1 + b(qk pk−1 + pk qk−1 ) + 2cqk qk−1 , ⎩ 2 Ck := ap2k−1 + bpk−1 qk−1 + cqk− 1.

Nous allons montrer que le triplet (Ak ,Bk ,Ck ) ne peut prendre qu’un nombre fini de valeurs. Cela montrera que, pour h, k convenables, avec h > 1, αk+1 et αk+h sont racines de la même équation et en fait sont égaux car l’une des équations est répétée un nombre infini de fois. Le développement sera donc bien périodique. Un calcul de routine permet de montrer que

Bk2 − 4Ak Ck = (b2 − 4ac)(qk pk−1 − pk qk−1 )2 = b2 − 4ac,

donc Bk2 = b2 − 4ac + 4Ak Ck . Comme Ck = Ak−1 , il suffit de montrer que Ak ne peut prendre qu’un nombre fini de valeurs. Or

Ak = a(qk ϑ − ϑk )2 + b(qk ϑ − ϑk )qk + cqk2

= qk2 (aϑ 2 + bϑ + c) − qk ϑk (2aϑ + b) + aϑk2 = −qk ϑk (2aϑ + b) + aϑk2 .

Comme |qk ϑk |  1 d’après le lemme de Dirichlet, on obtient

|Ak |  |2aϑ + b| + |a|, ce qui implique bien la propriété souhaitée.

⊓ ⊔

2 Dans le cas contraire on aurait |ϑ | = (q /q m m m+h−1 )|ϑm+h−1 | < |ϑm+h−1 |, ce qui contredirait la définition de qm+h−1 .

N OTES

§ 7.1. En 1872, Cantor rencontre Dedekind à Interlaken (Suisse). De leurs discussions naît la théorie moderne des ensembles. À la fin 1873, Cantor constate que Q est équipotent(3) à N et Dedekind établit qu’il en va de même de Q, l’ensemble des nombres algébriques. D’où l’idée de Cantor de montrer que R n’est pas équipotent à N, de manière à obtenir une nouvelle preuve du théorème de Liouville (Théorème 7.3) affirmant l’existence de nombres transcendants. Dans deux lettres adressées à Dedekind (7 et 9 décembre 1873), Cantor établit effectivement cela, mettant ainsi en évidence l’existence de plusieurs catégories d’infini. C’est le début de la topologie, de la théorie abstraite des ensembles, et de la théorie des ordres. Les idées de Cantor ont révolutionné les fondements mêmes des mathématiques et produit de nouveaux types de démonstrations. Le théorème de Cantor– Bernstein stipule que si deux ensembles E et F sont tels qu’il existe une injection de chacun dans l’autre, alors E et F sont équipotents. Charles Hermite a montré en 1873 que le nombre e, base des logarithmes, est transcendant. On savait déjà que e n’est ni rationnel, ni irrationnel quadratique, car son développement en fraction continue, connu depuis Euler, est :

e = [2,1,2,1,1,4,1,1,6,1,1,8, . . .]. Une preuve de cette formule est proposée, par exemple, par D.P. Parent (1978). La méthode d’Hermite reposait sur l’approximation des fonctions analytiques par des fractions rationnelles. Hermite pensait que sa méthode pouvait être adaptée pour établir la transcendance de π . Son intuition a été confirmée par Lindemann en 1882. Cela résout, par la négative, le fameux problème grec de la quadrature du cercle.

3

On dit que deux ensembles sont équipotents s’il existe une bijection de l’un sur l’autre.

E XERCICES

116. Construction diagonale de Cantor. (a) Soit E l’ensemble de tous les nombres réels x de [0,1] dont la représentation  triadique x = n1 εn /3n ne comporte que des chiffres εn égaux à 0 ou 1. Montrer que la représentation triadique d’un élément de E est unique. (b) Montrer que E , et donc a fortiori [0,1], n’est pas dénombrable en raisonnant par l’absurde et en utilisant la représentation décrite en (a). 117. Construction diagonale de Cantor–Mendès France.(4) (a) Montrer que l’ensemble des nombres algébriques est dénombrable. (b) Soit {xn }n1 la suite des nombres algébriques de l’intervalle [0,1] dans laquelle chaque nombre rationnel dyadique(5) apparaît deux fois. On écrit alors le développement en base 2  xn = enk /2k (n  1) k1

avec la convention que, lorsque xn est rationnel dyadique, l’un des deux développements est fini (i.e. comporte des 0 à partir d’un certain rang), l’autre comporte des 1 à partir d’un certain rang. Montrer qu’à chaque xn on peut associer au moins un xm tel que emk = enk pour tout k  1.  (c) Montrer que le nombre diagonal x := k1 ekk /2k est transcendant.  n 118. Le nombre ϑ := n0 1/23 est-il transcendant ? 119. Premier théorème de Hurwitz. Soient ϑ ∈ R  Q et {pk /qk }∞ k=0 la suite des réduites de ϑ. Montrer que

|ϑ − pk /qk | + |ϑ − pk+1 /qk+1 | = 1/qk qk+1

(k  0).

En déduire que l’inégalité qj ϑ  < 1/(2qj ) est satisfaite pour j = k ou j = k + 1. 120. Second théorème de Hurwitz. Soient ϑ ∈ R  Q et {pk /qk }∞ k=0 la suite des réduites de ϑ. On pose tk := qk /qk−1 . (a) Montrer que tk+1  1 + 1/tk (k  0). 4 5

Voir Brlek, Mendès France, Robson & Rubey (2004), et Mendès France (2007). Un nombre rationnel dyadique est un rationnel de forme a/2b , avec a ∈ Z, b ∈ N.

EXERCICES

167

(b) Montrer que si l’inégalité

√ |ϑ − pj /qj |  1/( 5qj2 ) √ est fausse pour j = k − 1 et j = k , alors t2k + 1 < 5tk . (c) Soit k  1. Montrer que (7.16) a lieu pour j = k − 1, j = k ou j = k + 1.

(7.16)

121. Constante de Markov. On appelle constante de Markov d’un nombre irrationnel ϑ la quantité finie ou infinie γ (ϑ ) := 1/ lim inf (qq ϑ ). q→∞

(a) Montrer que γ (ϑ ) = 1/ lim inf k→∞ qk qk ϑ . (b) Montrer que γ (ϑ ) = ∞ si, et seulement si, lim supk→∞ ak = ∞, où ak désigne le quotient partiel d’indice k de ϑ. (c) Que peut-on dire de √ la constante de Markov des irrationnels quadratiques ? (d) Soit ϕ := 12 (1 + 5) le nombre d’or. Calculer γ (ϕ ) et en déduire que le second théorème de Hurwitz est optimal. 122. Étant donné un nombre réel irrationnel ϑ, on note {pk /qk }∞ k=0 la suite des réduites de son développement en fraction continue, {αk }∞ la suite de ses quok=0 tients complets et {ak }∞ celle de ses quotients incomplets. k=0 (a) On pose sk := qk−1 /qk (k  1). Montrer que la constante de Markov γ (ϑ ) vérifie γ (ϑ ) = lim sup(αk+1 + sk ). k→∞

(b) Montrer que, si ak  3 pour une infinité de valeurs de k , alors γ (ϑ )  3. (c) Montrer que, √ si ak = 1 à partir d’un certain rang, alors, d’une part, on a αk = ϕ := 12 (1 + 5) pour k assez grand et, d’autre part, il existe une constante √ λ > 0 telle que qk ∼ λϕ k lorsque k → ∞. En déduire que γ (ϑ ) = 5. √ (d) Montrer que si ak =√2 à partir d’un certain rang alors αk = 1 + 2 pour k √ assez grand, limk→∞ sk = 2 − 1 et γ (ϑ ) = 8. (e) Montrer que, si ak vaut 1 ou 2 pour k assez grand, chaque valeur étant prise une infinité de fois, alors on a ak = 1 et ak+1 = 2 pour une infinité de valeurs de k . En remarquant que √ αk+2 < 3 implique αk+1 = ak+1 + 1/αk+2  7/3, montrer que γ (ϑ )  17/6 > 8.

√ (f) Établir le théorème suivant. Pour tout nombre réel ϑ, on a γ (ϑ )  5 avec égalité si, et seulement si, ak = 1 pour k assez grand. Si l’on exclut les nombres √ réels équivalents au nombre d’or ϕ, on a γ (ϑ )  √8 avec égalité si, et seulement si, ak = 2 pour k assez grand, i.e. ϑ équivalent à 2. 123. Montrer que si ϑ et ϑ ′ ont les mêmes √ quotients incomplets jusqu’au rang k , alors |ϑ − ϑ ′ |  10/ϕ 2k−1 où ϕ := 12 (1 + 5). 124. Soit ϑ un nombre irrationnel dont les quotients incomplets sont majorés par √ un entier a. Montrer que qn  bn où l’on a posé b := 12 (a + a2 + 4).

168

I.7. APPROXIMATION DIOPHANTIENNE

125. irrationnel ϑ dont le développement en fraction continue   Trouver le nombre est 8,1,1,5,5,1,1,16 , avec la notation (7.15). 126. Étant donné un nombre réel irrationnel ϑ, on considère la série entière  zn . Fϑ (z) := nϑ  n1

On note R(ϑ ) de rayon de convergence de Fϑ . On désigne par {pk /qk }∞ k0 la suite des réduites du développement en fraction continue de ϑ. (a) Montrer que R(ϑ )  1. (b) Montrer que, pour tout entier k  0 et pour tout entier n vérifiant qk  n < qk+1 , on a qk ϑ 1/qk  nϑ 1/n . En déduire que

R(ϑ ) = lim inf qk ϑ 1/qk . k→∞

(c) Montrer que, pour tout entier k  0, on a 1 1 < qk ϑ  < . 2qk+1 qk+1

(d) Soit ϕ := 12 (1 +

√ 5) le nombre d’or. Montrer que R(ϕ ) = 1.

(e) Calculer R(ϑ ) lorsque ϑ est un nombre irrationnel algébrique quelconque. (f) Montrer que, pour tout entier k  0, on a qk ak+1  qk+1  2qk ak+1 . En utilisant la question (c), en déduire que, pour tout nombre irrationnel ϑ, on a −1/q

R(ϑ ) = lim inf ak+1 k . k→∞

(g) Montrer que l’application R : R  Q → [0,1], qui, à ϑ, associe R(ϑ ), est surjective. 127. Bonnes approximations. Étant donné un nombre réel ϑ, on dit qu’un nombre rationnel p/q , où p ∈ Z, q ∈ N∗ , est une bonne approximation de ϑ si |ϑ − p/q| = min (u,v)∈Z×N∗ |ϑ − u/v|. 1vq

(a) Soit ϑ ∈ R. Montrer que toute réduite de ϑ est une bonne approximation de ϑ. (b) En considérant ϑ = 13 et p/q = 21 , montrer qu’une bonne approximation d’un nombre réel n’est pas nécessairement une réduite. 128. Réduites secondaires. Soit ϑ ∈ R, {pk /qk }k0 la suite, finie ou non, des réduites de ϑ et {ak }k0 celle de ses quotients partiels. Pour k  1, h  0, on pose pk,h := pk−1 + hpk , qk,h := qk−1 + hqk . On dit alors qu’un nombre rationnel p/q est une réduite secondaire de ϑ s’il existe des entiers k et h tels que k  1, 1  h < ak+1 , et p/q = pk,h /qk,h . (a) En utilisant le développement trouvé à la partie II, montrer que 17 7 est une √ réduite secondaire de ϑ = 1 + 2. √ (b) Montrer que 17 n’est pas une bonne approximation de 1 + 2. On pourra 7 √ considérer la réduite p2 /q2 de ϑ et utiliser les inégalités 75 < 2 < 99 < 10 . 70 5

EXERCICES

169

129. Bonnes approximations et réduites secondaires. (a) Montrer que si les nombres rationnels de dénominateurs positifs a/b, r/s et c/d vérifient a/b < r/s < c/d et bc − ad = 1, alors s > max(b,d). On pourra commencer par prouver que r/s − a/b  1/bs. (b) Soit ϑ un nombre réel irrationnel et soient {pk /qk }k0 la suite des réduites de ϑ et {ak }k0 la suite de ses quotients partiels. Calculer pk,h+1 qk,h − qk,h+1 pk,h pour toutes valeurs des paramètres entiers k  1, h  0. En déduire que, pour ak+1 tout entier k  1, la suite finie {pk,h /qk,h }h= 0 est strictement croissante si k est impair, strictement décroissante si k est pair. (c) Soit p/q une bonne approximation de ϑ telle que q  q1 . Montrer que p/q est une réduite ou une réduite secondaire de ϑ. On pourra supposer, par exemple, que ϑ < p/q , montrer qu’il existe k  1 tel que pk−1 p pk+1 <  , ϑ< qk+1 q qk−1 et utiliser les résultats établis aux questions (b) et (a). 130. Montrer que si ϑ, ϑ ′ , ϑ ′′ sont trois irrationnels tels que ϑ < ϑ ′ < ϑ ′′ et si ϑ et ϑ ′′ ont les mêmes réduites jusqu’au rang k , alors ϑ ′ a également les mêmes réduites jusqu’au rang k . 131. Soient ϑ un nombre réel irrationnel et p/q un nombre rationnel tel que |q ϑ − p| < 1/q . (a) Montrer qu’il existe n ∈ N, a0 ∈ Z, a1 ∈ N∗ , . . . , an ∈ N∗ tels que

p p > 0. = [a0 , . . . ,an ] et (−1)n ϑ − q q

(b) On note {pj /qj }n j=0 la suite des réduites de p/q et l’on définit α par la relation α pn + pn−1 , ϑ= α qn + qn−1 avec la convention usuelle (p−1 ,q−1 ) = (1,0). Montrer que |q ϑ − p| = 1/(α qn + qn−1 ) et en déduire que α > 0. (c) Montrer que, si α > 1, alors p/q est une réduite de ϑ. (d) Montrer que, si α  1, alors n  1 et ϑ = [a0 ,a1 , · · · ,an + 1/α ]. En déduire que p/q n’est pas une réduite de ϑ. (e) Montrer que p/q est une réduite de ϑ si, et seulement si, on a

|q ϑ − p|
1, ϑ ′ ∈] − 1,0[

est nécessaire et suffisante pour que le développement en fraction continue de ϑ soit purement périodique, i.e. de la forme [a0 ,a1 , . . . ,ah−1 ] . ′ ′ ′ (a) Montrer que, si ϑ vérifie (7.18), alors 1/αn+ 1 =  αn − an et αn ∈] − 1,0[  ′ pour tout entier n  0. En déduire que an = −1/αn+1 (n  0) et donc que si la relation αj = αj+h est valable pour deux entiers j  0, h  1, on a nécessairement α0 = αh , et ϑ = [a0 ,a1 , . . . ,ah−1 ] .

(b) Réciproquement, montrer que si ϑ est un nombre réel irrationnel quadratique dont le développement en fraction continue est purement périodique, avec une période de longueur h  1, alors ϑ > 1 et ϑ est racine du polynôme f (x) := qh−1 x2 + (qh−2 − ph−1 )x − ph−2 . Montrer que f (−1) > 0, f (0) < 0 et en déduire que ϑ ′ ∈] − 1,0[. 135. Développement des racines carrées. $√ % d . Soit d un nombre entier positif non carré. On pose md := √ (a) Montrer que ϑ := md + d satisfait à la condition (7.18) et possède donc un développement en fraction continue purement périodique. (b) Soit h la longueur de la période du développement de ϑ et {αn }∞ n=0 la suite de ses quotients complets. Montrer que αn = α0 si, et seulement si, n ≡ 0 (mod h). En déduire, avec les notations de l’Exercice 133, que l’on a vn = 1 si, et seulement si, n ≡ 0 (mod h). . . ,a0 ] avec a0 = 2md . En déduire que le dévelop(c) Montrer que ϑ = [a0 ,a1 , . √ pement en fraction continue de d est de la forme √ ' & d = md ,a1 , . . . ,ah−1 ,2md .

EXERCICES

171

136. Solution de l’équation de Pell. Soit d un nombre entier positif non carré. On appelle équation de Pell l’équation diophantienne

x2 − dy 2 = 1.

(7.19)

à partir de u0 = 0, v0 = 1, selon la On désigne par un et $vn les entiers construits % √ règle (7.17), avec an := (un + d)/vn . On note {pn /qn }∞ n=0 la suite des réduites √ de d et h la longueur de la période de son développement en fraction continue. (a) En écrivant √ αn+1 pn + pn−1 d= αn+1 qn + qn−1 et en faisant appel aux formules établies à l’Exercice 133, montrer que

p2n − dqn2 = (−1)n+1 vn+1

(n  0).

(b) Montrer que, pour chaque entier j  0, le couple (p2jh−1 ,q2jh−1 ) est une solution de (7.19). (c) Montrer que toute √ solution (x,y) de (7.19) avec x > 0, y > 0 est telle que x/y est une réduite de d. 137. (a) Montrer que, pour tout intervalle I de R contenant N nombres entiers, on a  

  1   e(nϑ )  min N , ,  2ϑ  n∈I

où, par convention, le membre de droite vaut N si ϑ ∈ Z. Cette convention sera utilisée systématiquement dans la suite. (b) Montrer que, pour tout ϑ ∈ R  Q, on a  SN (ϑ ) := e(n2 ϑ ) = o(N ). 1nN

(c) Déterminer l’ensemble E des nombres réels ϑ tels que la suite {n2 ϑ }∞ n=1 soit équirépartie modulo 1. (d) En appliquant le lemme de Weyl–van der Corput (Lemme 6.8) avec un choix convenable du paramètre libre, montrer que l’on a, pour tout entier N  1 et tout nombre réel ϑ,

 1  . |SN (ϑ )|2  2 min 2N , mϑ  0m2N

(e) Montrer que, pour tout entier N  1 et tout nombre réel ϑ, il existe des nombres entiers aN ∈ Z, qN ∈ N∗ tels que (aN ,qN ) = 1, qN  4N , et      ϑ − aN   1 .  qN  4N qN

En déduire que mϑ   21 aN m/qN  (1  m  2N ). On pourra introduire, pour chaque valeur de m considérée, l’unique nombre entier bm ∈ [0,qN /2] tel que aN m ≡ ±bm (mod qN ) et distinguer les cas bm = 0 et bm  1.

172

I.7. APPROXIMATION DIOPHANTIENNE

(f) Montrer que, en conservant les notations introduites aux questions précédentes, on a pour tout entier N  1 et tout nombre réel ϑ, ⎫ ⎧ ⎨   1⎬ 2 N . |SN (ϑ )|2  4 1 + N + qN qN ⎩ j⎭ 1jqN /2

En déduire l’existence d’une constante absolue C telle que    N + N ln(2qN ) . |SN (ϑ )|  C √ qN

T OME II

M ÉTHODES

D ’ ANALYSE COMPLEXE

C HAPITRE

II.0 LA

FONCTION G AMMA D ’E ULER

0.1. Définitions La définition originale de la fonction date de 1729, dans une lettre d’Euler à Goldbach : 1  (1 + 1/n)s (s =  0, − 1, − 2, . . .). (0.1) Ŵ (s) := s 1 + s/n n1

Il est facile de voir que le produit converge uniformément sur tout compact de C  (−N∗ ) et définit donc une fonction méromorphe sur C. Euler en déduit rapidement la formule intégrale  ∞ (0.2) Ŵ (s) = ts−1 e−t dt (σ > 0). 0

Ici et dans la suite on définit implicitement la partie réelle et la partie imaginaire d’un nombre complexe s par

s = σ + iτ . Théorème 0.1 (Euler). Soit  n t n s−1 t dt 1− Ŵn (s) := n 0

(σ > 0).

Alors on a (0.3)

Ŵn (s) =

et

ns n! , s(s + 1) · · · (s + n)

Ŵ (s) = lim Ŵn (s) = n→∞



0



ts−1 e−t dt

(σ > 0).

176

II.0. LA FONCTION GAMMA D’EULER

Démonstration. Le changement de variables u = t/n permet d’écrire  1 (1 − u)n us−1 du. Ŵn (s) = ns 0

On calcule ensuite l’intégrale à l’aide d’intégrations par parties successives : /1 . s   1 n 1 u (1 − u)n (1 − u)n−1 us du + (1 − u)n us−1 du = s s 0 0 0  1 n! = ··· = us+n−1 du s(s + 1) · · · (s + n − 1) 0 n! · = s(s + 1) · · · (s + n) On conclut en remarquant d’une part que  (1 + 1/j)s ns n! 1 Ŵn (s) = = (1 + 1/n)−s s(s + 1) · · · (s + n) s 1 + s/j 1jn

= Ŵ (s) + o(1)

et d’autre part que

(n → ∞),

lim Ŵn (s) =

n→∞





ts−1 e−t dt.

0

Cette dernière formule peut être établie élémentairement(1) et nous omettons les détails. ⊓ ⊔ Le résultat suivant montre que le prolongement méromorphe peut être retrouvé facilement en choisissant (0.2) comme définition de Ŵ. Théorème 0.2 (Équation fonctionnelle). On a Ŵ (s + 1) = sŴ (s)

(σ > 0).

⊔ Démonstration. Une intégration par parties fournit immédiatement le résultat. ⊓ Corollaire 0.3. Pour tout n ∈ N, on a Ŵ (n + 1) = n!. La propriété suivante conduit à une autre définition de Ŵ. Théorème 0.4. La fonction Ŵ est logarithmiquement convexe sur R+∗ . Démonstration. Il suffit d’appliquer l’inégalité de Cauchy–Schwarz  ∞ 2 Ŵ ′ (x)2 = e−u (ln u)ux−1 du  Ŵ (x)Ŵ ′′ (x). 0

⊓ ⊔ Emil Artin (1898–1962) a montré que l’équation fonctionnelle et la logconvexité caractérisent Ŵ. Nous verrons plus loin une application remarquable de ce résultat.

1 Le point de vue historique interdit d’employer ici le théorème de Lebesgue, mais on peut cependant utiliser le fait que (1 − t/n)n  e−t pour 0  t  n.

0.2. FORMULE DU PRODUIT DE WEIERSTRASS

177

Théorème 0.5 (Artin). Soit :]0,∞[→]0,∞[ une fonction dérivable telle que ln soit convexe et x (x) = (x + 1) pour tout x > 0. Alors on a (x) = (1)Ŵ (x) pour tout x > 0. Démonstration. H := /Ŵ est 1-périodique et H(1) = (1). Comme ′ / et Ŵ ′ /Ŵ sont croissantes on a pour x  0, n  1, ′ (n + x) Ŵ ′ (n + x) ′ (n + 1) Ŵ ′ (n) H ′ (n + x) ′ (n) Ŵ ′ (n + 1) −  = −  − . (n) Ŵ (n + 1) H(n + x) (n + x) Ŵ (n + x) (n + 1) Ŵ (n) Mais et Ŵ vérifient toutes les deux l’équation fonctionnelle

f ′ (x) 1 f ′ (x + 1) = + , f (x + 1) f (x) x donc

H ′ (n) 1 H ′ (n) 1 ′ (n + 1) Ŵ ′ (n) ′ (n) Ŵ ′ (n + 1) − = − , − = + · (n) Ŵ (n + 1) H(n) n (n + 1) Ŵ (n) H(n) n Il s’ensuit que H ′ (1) 1 1 H ′ (n) 1 H ′ (x) H ′ (n) 1 H ′ (1) − = −   + = + · H(1) n H(n) n H(x) H(n) n H(1) n En faisant tendre n vers l’infini, on obtient l’existence d’une constante k telle que H ′ (x)/H(x) = k pour tout x > 0, d’où H(x) = H(1)ekx . Comme H est périodique, on doit avoir k = 0. ⊓ ⊔ Le théorème de Bohr–Mollerup, proposé à l’Exercice 138, permet de se passer de l’hypothèse de dérivabilité dans le théorème d’Artin. Une autre caractérisation est établie à l’Exercice 139.

0.2. Formule du produit de Weierstrass Théorème 0.6 (Weierstrass). On a pour σ > 0  1 s  −s/j = seγ s e 1+ , (0.4) Ŵ (s) j j1

où γ désigne la constante d’Euler. De plus, la formule (0.4) définit un prolongement analytique de 1/Ŵ (s) en une fonction entière. Démonstration. Posons Hn :=



1jn

1/j (n  1), de sorte que

Hn = ln n + γ + o(1) D’après (0.3), on a Ŵn (s) =

(n → ∞).

es/j es(ln n−Hn )  ns  es/j e−s/j = · s 1 + s/j s 1 + s/j 1jn

1jn

On en déduit le résultat indiqué en faisant tendre n vers l’infini puisque le terme général du produit est 1 + O(1/j 2 ) uniformément sur tout compact de C  (−N). ⊓ ⊔

178

II.0. LA FONCTION GAMMA D’EULER

Corollaire 0.7. On a γ = −Ŵ ′ (1). Démonstration. La formule (0.4) fournit par dérivation logarithmique 1 1  1 −Ŵ ′ (s) =γ + + − · (0.5) Ŵ (s) s s+j j j1

Pour s = 1 la série est télescopique et vaut −1.

⊓ ⊔

0.3. Fonction Bêta La fonction Bêta, ou intégrale eulérienne de première espèce, est définie par  1 tx−1 (1 − t)y−1 dt (x > 0, y > 0). B(x,y) := 0

Théorème 0.8. On a (0.6)

B(x,y) = Ŵ (x)Ŵ (y)/Ŵ (x + y)

(x > 0, y > 0).

Première démonstration : changement de variables. On a  ∞  ∞ x−1 −t Ŵ (x)Ŵ (y) = t e dt uy−1 e−u du. 0

0

Avec le changement de variables u = tv et le théorème de Fubini, on obtient  ∞  ∞ x−1 −t Ŵ (x)Ŵ (y) = t e dt ty v y−1 e−vt dv 0 0  ∞  ∞  ∞ v y−1 y−1 x+y−1 −(v+1)t Ŵ (x + y) dv v dv t e dt = = (1 + v)x+y 0 0 0  ∞ v y−1 1 x−1 dv = Ŵ (x + y) 1+v 1+v (1 + v)2 0  1 wy−1 (1 − w)x−1 dw = Ŵ (x + y)B(x,y). ⊓ ⊔ = Ŵ (x + y) 0

Seconde démonstration : utilisation du théorème d’Artin. Soient y > 0 fixé et f (x) := Ŵ (x + y)B(x,y)/Ŵ (y). Nous devons donc montrer que f (x) = Ŵ (x). On a f (1) = yB(1,y) = 1 et (x + y)Ŵ (x + y) B(x + 1,y). f (x + 1) = Ŵ (y) Comme  1  1 t x (1 − t)x+y−1 dt tx (1 − t)y−1 dt = B(x + 1,y) = 1−t 0 0 /1 .  1

t x−1 dt (1 − t)x+y t x x = (1 − t)x+y + −(x + y) 1 − t x+y 0 1−t (1 − t)2 0 x B(x,y), = x+y

0.3. FONCTION BÊTA

179

on en déduit que

f (x + 1) = xf (x). Enfin l’inégalité de Hölder permet d’écrire, pour 1/p + 1/q = 1,  1 t(x−1)/p+(z−1)/q (1 − t)(y−1)/p+(y−1)/q dt B(x/p + z/q ,y) = 0

 B(x,y)1/p B(z ,y)1/q ,

ce qui établit que x → B(x,y), et donc aussi x → f (x), est bien log-convexe. Le théorème d’Artin permet alors de déduire de ce qui précède que f (x) = Ŵ (x). ⊓ ⊔ Corollaire 0.9. On a pour x > 0, y > 0,  π /2 (sin ϑ )2x−1 (cos ϑ )2y−1 dϑ. Ŵ (x)Ŵ (y)/Ŵ (x + y) = 2

En particulier

Ŵ ( 12 )

0

√ = π.

Démonstration. Il suffit d’effectuer le changement de variables t = (sin ϑ )2 dans (0.6). ⊓ ⊔

∞ −1/2 −t

∞ −u2 1 e dt = 2 0 e du, d’où On note également que Ŵ ( 2 ) = 0 t  √ 2 (0.7) e−u du = π . R

Corollaire 0.10 (Formule de Stirling réelle). On a √ (0.8) Ŵ (x + 1) ∼ xx e−x 2π x (x → ∞). Démonstration. Nous employons ici une méthode classique du calcul asymptotique consistant à mettre en évidence grâce à un changement de variable adéquat le domaine prépondérant d’une intégrale dépendant d’un paramètre. La fonction tx e−t , dont Ŵ (x + 1) est l’intégrale sur R+ , atteint son maximum en t = x. Le changement de variables t = x(1 + u) fournit  ∞ {x(1 + u)}x e−x(1+u) x du Ŵ (x + 1) = −1  ∞ {(1 + u)e−u }x du = xx+1 e−x (0.9) −1

√  √  ∞ −v 2 h v 2/x dv , = xx e−x 2x √ e

 où l’on a posé u = v 2/x et

h(w) :=



x/2

2 {w − ln(1 + w)}, w2

de sorte que h(0) = 1. Soit

gx (v) := 1[−√x/2,∞[ (v)e

√  −v 2 h v 2/x

.

180

II.0. LA FONCTION GAMMA D’EULER

On a pour tout nombre réel v fixé 2

lim gx (v) = e−v .

x→∞

De plus, en remarquant que

 1  w z dz 2 t dt = 2 , 2 w 0 1+t 0 1 + zw on voit que h(w)  1 pour w  0 et que h(w) est décroissante pour w  0, d’où 

√  v √2 − ln(1 + v √2)

 (x  1, v  0). h v 2/x  h v 2  v2 Il s’ensuit que √ √ 2 gx (v)  e−v 1]−∞,0[ (v) + (1 + v 2)e−v 2 1[0,∞[ (v). h(w) =

Cela nous permet d’appliquer le théorème de Lebesgue : on obtient   √ 2 lim gx (v) dv = e−v dv = π , x→∞

R

R

d’après (0.7). On en déduit la formule souhaitée en reportant dans (0.9).

⊓ ⊔

Corollaire 0.11 (Formule de duplication de Legendre). On a pour x > 0

x x + 1 √ = π 21−x Ŵ (x). (0.10) Ŵ Ŵ 2 2

  Démonstration. Considérons la fonction f (x) := 2x−1 π −1/2 Ŵ 12 x Ŵ 21 (x+ 1) . On a f (1) = 1 d’après (0.7) et   f (x + 1) = 2x π −1/2 Ŵ 21 (x + 1) Ŵ 21 x + 1   = 2x π −1/2 Ŵ 12 (x + 1) 21 xŴ 21 x = xf (x). Enfin, f est logarithmiquement convexe puisque     ln f (x) = (x − 1) ln 2 − 12 ln π + ln Ŵ 21 (x + 1) Ŵ 21 x .

D’après le théorème d’Artin, on a f (x) = Ŵ (x).

Une généralisation de ce résultat au produit proposée à l’Exercice 147.

!n−1 j=0

⊓ ⊔

Ŵ ((x + j)/n) (n  2) est

0.4. Formule de Stirling complexe Rappelons la définition des nombres et fonctions de Bernoulli au § I.0.2. Théorème 0.12 (Formule de Stirling complexe). Pour tout s ∈ C  R− , on a  ∞ dt 1 1 , (0.11) log Ŵ (s) = (s − 2 ) log s − s + 2 ln(2π ) − B1 (t) s +t 0

où, dans le membre de droite, le logarithme complexe est pris en détermination principale.

0.4. FORMULE DE STIRLING COMPLEXE

181

Remarques. (i) La formule du produit de Weierstrass montre que Ŵ (s) ne s’annule pas et a pour seuls pôles les entiers négatifs. (ii) L’intégrale est O(1/s) uniformément sur tout secteur s = 0, | arg(s)|  π −δ, où δ est une constante positive arbitraire. En fait, on a pour tout entier R  1  ∞  (−1)r Br+1 (−1)R+1  ∞ BR+1 (t) dt + dt. B1 (t) = s+t r(r + 1)sr R + 1 0 (t + s)R+1 0 1rR

Démonstration. Appliquons la formule sommatoire d’Euler–Maclaurin à l’ordre 0 à la fonction f (t) := log(t + s) pour s ∈ C  R− avec a = 0 et b = N . Nous obtenons



log(n + s) =



N

log(t + s) dt +

0

1nN

1 2



log(N + s) − log s +

= (s + N ) log(s + N ) − (s + N ) − s log s + s +  N B1 (t) dt 1 − 2 log s + t+s 0

= (s + N + 12 ) log(s + N ) − N − (s + 21 ) log s +

1 2



N

0

B1 (t) dt t+s

log(s + N )



0

N

B1 (t) dt . t+s

Soustrayons la formule de Stirling classique pour ln N ! sous la forme

ln N ! = (N + 21 ) ln N − N +

1 2

ln(2π ) + o(1)

(N → ∞).

Nous obtenons

 s log 1 + n 1nN

s = (N + 21 ) log 1 + + s log(s + N ) − (s + 21 ) log s N  N B1 (t) dt 1 + o(1) − 2 ln(2π ) + t+s 0  ∞  B1 (t) dt + o(1). = s 1 + ln N − (s + 12 ) log s − 21 ln(2π ) + t+s 0  ∗ Posant HN := 1nN 1/n, il suit, par exemple pour s ∈ R+ , , +  s  −s/n γs e ln se 1+ n 1nN  ∞ B1 (t) dt 1 1 = ln s + s(γ − HN + 1 + ln N ) − (s + 2 ) ln s − 2 ln(2π ) + + o(1) t+s 0  ∞ B1 (t) dt + o(1). = −(s − 12 ) ln s + s − 21 ln(2π ) + t+s 0 En faisant tendre N → ∞, on obtient bien le résultat annoncé, d’abord pour s ∈ R+ , puis pour tout s par prolongement analytique. ⊓ ⊔

182

II.0. LA FONCTION GAMMA D’EULER

Corollaire 0.13 (Comportement dans les bandes verticales). Soient σ1 , σ2 des nombres réels tels que σ1 < σ2 . On a uniformément lorsque σ1  σ  σ2 , |τ | → ∞, 

1 √ 1 (0.12) Ŵ (s) = 1 + O 2π |τ |σ − 2 e−π |τ |/2eihσ (τ ) τ

où l’on a posé hσ (τ ) := τ ln |τ | − τ + 12 π (σ − 21 ) sgn(τ ).

Démonstration. Nous avons arg s = sgn(τ ) 12 π − σ /τ + O(1/τ 2 ) ∈] − π ,π [, et log s = ln |s| + i arg s, avec

ln |s| =

1 2

ln(σ 2 + τ 2 ) = ln |τ | + O(1/τ 2 ).

Une intégration par parties fournit  ∞

1 B1 (t) dt =O . t+s |s| 0 Il suit

1

 σ  +O 2 + iτ ) ln |τ | + i 12 π sgn τ − τ τ 1 1 = (σ − 2 ) ln |τ | − 2 π |τ | + σ + ihσ (τ ) + O(1/τ ).

(s − 12 ) log s = (σ −

1 2

⊓ ⊔

Corollaire 0.14 (Formule d’inversion de Mellin). Pour x > 0, on a  σ +i∞ 1 Ŵ (s)x−s ds (σ > 0). (0.13) e−x = 2π i σ −i∞ Démonstration. On a pour σ > 0   ∞ u dx Ŵ (σ − iτ ) = = e−e +σ u e−iτ u du = f(σ (τ ), e−x xσ −iτ x R 0

où fσ (u) := exp{−eu + σ u}. Le Corollaire 0.13 garantit que f(σ ∈ L1 (R),(2) donc la formule d’inversion de Fourier s’applique. On obtient  e −σ u f(σ (τ )eiτ u dτ fσ (u)e−σ u = 2π R   1 1 = Ŵ (σ − iτ )e−(σ −iτ )u dτ = Ŵ (σ + iτ )e−(σ +iτ )u dτ . 2π R 2π R On en déduit le résultat annoncé en posant x = eu .

Corollaire 0.15 (Formule des compléments). Pour s ∈ C  Z, on a π (0.14) Ŵ (s)Ŵ (1 − s) = . sin(π s)

2

L’hypothèse σ > 0 garantit en effet que Ŵ(σ + iτ ) est bien défini pour tout τ ∈ R.

⊓ ⊔

0.4. FORMULE DE STIRLING COMPLEXE

183

Démonstration. Considérons la fonction méromorphe   1 s(1 − s) −1/j 1 s(1 − s)eγ  = e , 1+ + f (s) := Ŵ (s)Ŵ (1 − s) sin π s sin π s j j2 j1

où le développement résulte de la formule de Weierstrass. Tous les zéros de sin π s étant compensés par ceux du produit infini,(3) f est entière. De plus 1 −1 = Ŵ (s + 1)Ŵ (−s) sin π s Ŵ (s)(−s)Ŵ (−s) sin π s 1 = f (s), = Ŵ (s)Ŵ (1 − s) sin π s

f (s + 1) =

donc f est 1-périodique. Pour σ ∈ [0,1] et |τ | → ∞, on a en vertu de (0.12) √ √ 1 1 1 ∼ |τ |σ − 2 e−π |τ |/2 2π |τ | 2 −σ e−π |τ |/2 2π | sin π s| ∼ 2π e−π |τ | | sin π s|. |f (s)| Or, sin π s = sin π σ ch π τ + i sh π τ cos π σ , donc

| sin π s|2 = sin2 π σ ch2 π τ + sh2 π τ cos2 π σ ∼ 14 e2π |τ |. Il s’ensuit que lim|τ |→∞ |f (s)| = 1/π , donc f est bornée dans la bande verticale 0  σ  1. Par périodicité elle est donc bornée dans C, elle est donc constante en vertu du théorème de Liouville. Comme on a également

f (s) =

1 1 s = → Ŵ (s)Ŵ (1 − s) sin π s Ŵ (1 + s)Ŵ (1 − s) sin π s π

(s → 0),

il vient

f (s) = 1/π

(s ∈ C).

⊓ ⊔

Deux autres démonstrations de la formule des compléments sont proposées aux Exercices 150 et 151. Remarque. Lorsqu’on déplace la droite d’intégration de (0.13) vers la gauche, l’intégrale sur la droite translatée est  1 |s|σ − 2 e−π |τ |/2 x−σ dτ . ≪ R

Pour |σ | assez grand, on a |s|/x > 1, donc le théorème de Lebesgue nous permet d’affirmer que cette intégrale tend vers 0 lorsque σ → −∞. Or, on déduit de (0.14) que lorsque s → 0 Ŵ (s − n) =

π (−1)n ∼ , Ŵ (n + 1 − s) sin{π (s − n)} n!s

donc le résidu de Ŵ (s) en s = −n vaut (−1)n /n!. Le théorème des résidus nous permet donc de retrouver le développement en série  (−1)n xn . e−x = n! n0

3

Noter que 1 + 1/j + s(1 − s)/j 2 = (s + j)(j + 1 − s)/j 2 .

184

II.0. LA FONCTION GAMMA D’EULER

Corollaire 0.16 (Euler). On a pour tout z ∈ C  z2  sin π z = (0.15) 1− 2 . πz n n1

Démonstration. C’est une conséquence immédiate de la formule des compléments et de celle de Weierstrass puisque

sin π z 1 −1 = = 2 πz z Ŵ (z)Ŵ (1 − z) z Ŵ (z)Ŵ (−z)  −z  z/n  z2  z  −z/n −γ z  e e = eγ z e = 1+ 1− 2 . 1+ n n n n1

n1

n1

Par dérivation logarithmique, la formule d’Euler fournit 1  2z (0.16) π cot π z = + (z ∈ C  Z), z z 2 − n2

⊓ ⊔

n1

d’où l’on tire en faisant tendre z vers 0  1

(0.17)

n1

n2

= 61 π 2 .

0.5. La formule de Hankel Comme nous l’avons vu plus haut, la formule du produit de Weierstrass implique que 1/Ŵ est une fonction entière. La formule de Hankel fournit une représentation intégrale. Pour chaque valeur du paramètre positif r, nous désignons par contour de Hankel le chemin constitué du cercle |s| = r privé du point s = −r, et de la demi-droite ] − ∞, − r] parcourue deux fois, avec arguments respectifs +π et −π . t

–r

0

r

s

Contour de Hankel.

Théorème 0.17 (Formule de Hankel). Soit H un contour de Hankel. Pour tout nombre complexe z , on a  1 1 = s−z es ds. (0.18) Ŵ (z) 2π i H

0.5. LA FORMULE DE HANKEL

185

Démonstration. L’intégrale est absolument convergente pour chaque valeur de z et uniformément convergente sur tout compact. Elle définit donc une fonction entière de z qui est indépendante de r, d’après le théorème des résidus, puisque la seule singularité de l’intégrande est en s = 0. Lorsque ℜe z < 1, l’intégrale sur la partie circulaire |s| = r du contour de Hankel tend vers 0 avec r, alors que l’intégrale sur la double demi-droite tend vers  ∞  1 1 sin π z ∞ dσ sin π z dσ · Ŵ (1 − z) = = (eiπ z − e−iπ z ) z σ = z eσ 2π i 0 σ e π σ π Ŵ (z) 0 Cela établit (0.18) lorsque ℜe z < 1, et donc pour tout z , par prolongement analytique. ⊓ ⊔ Il est souvent utile de disposer d’une version effective de la formule de Hankel, où l’intégrale porte sur un contour de longueur finie. Corollaire 0.18. Désignons, pour chaque X > 1, par H(X) la partie du contour de Hankel situé dans le demi-plan σ > −X . Alors on a uniformément pour z ∈ C   1 1 1 (0.19) s−z es ds = + O 47|z| Ŵ (1 + |z|) e− 2 X . 2π i H(X) Ŵ (z) Démonstration. Pour s = σ e±iπ ,σ > 1, on a |s−z es |  (eπ σ )|z| e−σ . La différence entre le membre de gauche de (0.19) et l’intégrale (0.18) est donc  ∞  ∞ 1 π |z| |z| −σ π |z|− 12 X ≪e σ e dσ  e σ |z| e− 2 σ dσ . X

0

Le changement de variable σ = 2t fournit la majoration indiquée puisque 2eπ < 47. ⊓ ⊔

E XERCICES 138. Le théorème de Bohr–Mollerup. Soit ϕ : R → R une fonction convexe telle que ϕ (1) = 0, ϕ (x + 1) = ϕ (x) + ln x (x > 0). (a) Montrer que, pour tout entier n  1, la fonction ψn (x) := {ϕ (n + 1 + x) − ϕ (n + 1)}/x est croissante sur [−1,0[∪]0,1]. (b) En déduire que n   0  ϕ (x) − ln n! nx / (j + x)  1/n

(0 < x  1, n  1).

j=0

(c) Montrer que ϕ est uniquement déterminée et satisfait la formule de Gauss

eϕ (x) = lim n! nx n→∞

n 

(j + x)−1

(x > 0).

j=0

139. Une autre caractérisation de Ŵ. (a) Montrer que Ŵ ′ (x)/Ŵ (x) < ln x (x > 0). En déduire que x → ex x−x Ŵ (x) est décroissante pour x > 0. (b) Montrer que Ŵ est uniquement déterminée par la propriété de décroissance de (a) et les conditions Ŵ (1) = 1, Ŵ (x + 1) = xŴ (x). 140. Preuve de Gauss de la formule d’Euler. (a) Montrer que, pour tout entier n  0 et tout nombre complexe s tel que σ > 0,  Ŵ ′ (s) Ŵ ′ (s + n) 1 =− + . Ŵ (s) (s + j) Ŵ (s + n) 0j 1. (c) En déduire la formule d’Euler Ŵ (s) = limn→∞ ns n! 0jn 1/(s + j).

141. Soient {aj }kj=1 et {bj }kj=1 deux suites finies de nombres complexes telles que   bj ∈ / Z (1  j  k), aj = bj . 1jk

1jk

Montrer que

 Ŵ (1 − bj )   n − aj = . n − bj Ŵ (1 − aj )

n1 1jk

1jk

EXERCICES

187

142. Soient k  2 et εk = e2π i/k . Montrer, en utilisant le résultat de l’Exercice 141, que



n1

143. Montrer que



1

−1

1−

k−1 −1 x   = Ŵ 1 − εkj x1/k k n

(x > 0).

j=0

(1 + t)x−1 (1 − t)y−1 dt = 2x+y−1

Ŵ (x)Ŵ (y) (x > 0, y > 0). Ŵ (x + y)

144. L’intégrale de Dirichlet. n Montrer que pour f ∈ C[0,1], αj > 0 (1  j  n), β = j=1 αj , on a !n  1 

   dt j j=1 Ŵ (αj ) tj f = f (u)uβ −1 du. 1 −α j n Ŵ (β ) t 0 j=1 tj 1 1jn 1jn j

145. Calculer l’intégrale double  xα y β dx dy , où α, β sont des paramètres positifs et  est le domaine x  0, y  0, xμ + y ν  1 (μ > 0, ν > 0).

z+1 146. Calculer z log Ŵ (w) dw pour tout z ∈ C  R− . 147. La formule de Legendre–Gauss.

1 (a) En utilisant la formule de Legendre, montrer que 0 ln Ŵ (x) dx = (b) Montrer que pour tout entier n  2 on a  x + j  1 1 = (2π ) 2 (n−1) n 2 −x Ŵ (x) Ŵ (x > 0). n

1 2

ln(2π ).

0j 1). −Ŵ (1) = ln x − x 0  (b) En utilisant l’approximation ln t = nt 1/n− γ +O(1/t) (t > 1), retrouver la formule Ŵ ′ (1) = −γ . 149. Formules de Gauss et Dirichlet.  ∞ −t  1 1 − e−t e dt − dt puis que (a) Montrer que γ = t t 1 0  ∞ 1  −t 1 e dt. − γ = −t 1−e t 0 Ŵ ′ (z) z 1  = −γ − + (b) Montrer que pour ℜe z > 0 on a . En utilisant Ŵ (z) z n(z + n) n1

∞ (a) et en écrivant 1/(z + n) = 0 e−t(z+n) dt (ℜe z > 0), montrer la formule de Gauss  ∞ −t Ŵ ′ (z) e−zt  e = − dt (ℜe z > 0). Ŵ (z) t 1 − e−t 0

188

II.0. LA FONCTION GAMMA D’EULER



1 e−x  − dx = 0. En déduire grâce ε →0 ε (1 + x)2 ln(1 + x) x au résultat de (b) la formule de Dirichlet  ∞  dx Ŵ ′ (z) = (ℜe z > 0). e−x − (1 + x)−z Ŵ (z) x 0 (c) Montrer que lim



150. Une autre démonstration de la formule des compléments.

∞ (a) Pour α ∈]0,1[, montrer l’existence de l’intégrale I(α ) := 0 tα −1 dt/(1 + t) et calculer sa valeur. On pourra soit utiliser la méthode des résidus, soit traiter d’abord le cas α = p/q ∈ Q par le changement de variable t = uq et conclure par un argument de continuité. (b) Déduire de (a) que la formule des compléments Ŵ (z)Ŵ (1 − z) = π / sin(π z) est valide pour z ∈ C  Z. 151. (a) Soit TN (ξ ) le polynôme déterminé par la relation

TN (sin x) = sin{(2N + 1)x}. Montrer que

TN (ξ ) = (2N + 1)ξ



1kN

5 1 − ξ 2 sin2

πk  . 2N + 1

(b) Choisir ξ = sin{π x/(2N + 1)} et faire tendre N vers l’infini en justifiant soigneusement le passage à la limite pour obtenir la formule d’Euler  1 − x2 /k 2 . sin(π x) = π x k1

(c) En déduire, grâce à la formule du produit de Weierstrass, la formule des compléments pour Ŵ (x). 152. (a) Montrer les formules  ∞  tz−1 cos t dt = Ŵ (z) cos 21 π z 0 ∞  tz−1 sin t dt = Ŵ (z) sin 21 π z

(0 < ℜe z < 1), (−1 < ℜe z < 1).

0

(b) Calculer la valeur des intégrales de Fresnel  ∞  I= cos(t2 ) dt, J = 0



sin(t2 ) dt.

0

153. Sur le volume de la boule unité de Rn et les fonctions sphériques. On dit que f : Rn → R est sphérique s’il existe une fonction g : R+ → R telle que f (x) = g(x), où x désigne la norme euclidienne de x ∈ Rn . On désigne n par μ la mesure sur R+ image

∞de la mesure de

Lebesgue sur R par l’application x → x, de sorte que 0 g(t) dμ(t) = Rn g(x) dx pour toute fonction g : R+ → R telle que le second membre ait un sens. (a) Montrer que, pour tout y ∈ R+ , on a μ([0,y]) = y n Vn avec Vn = μ([0,1]). En déduire que dμ(y) = nVn y n−1 dy sur [0,∞[.

EXERCICES

189

(b) En choisissant une fonction sphérique f convenable, montrer que

(c) Montrer que



Rn

Vn = π n/2 /Ŵ (1 + n/2).  − 1 (n+1)  1 dx = π 2 (n+1) /Ŵ 12 (n + 1) . 1 + x2 2 1 , 2

154. (a) Montrer que, pour tout σ  l’on ait

il existe une constante M0 (σ ) telle que

|Ŵ (x + iy)|  M0 (σ )e−|y| (b) Montrer que pour z =

( 12  x  σ , y ∈ R).

1 2

+ iy , s = σ + iτ , σ  1, on a  s − 1 Ŵ (z − k)Ŵ (s − z + k) = (−1)k Ŵ (z)Ŵ (s − z) 1+ . j−z 1jk

En utilisant l’estimation |1 + w|  exp ℜe w + O(|w|2 ) (w ∈ C), en déduire que, pour chaque s vérifiant σ = ℜe s  1, il existe une constante M (s) > 0 telle que |Ŵ (z − k)Ŵ (s − z + k)|  M (s)k σ −1 e−|y|

(k  1, z =

1 2

+ iy , y ∈ R).

(c) On pose pour s ∈ C, ℜe s  1, u ∈]0,1[, k  0,  21 −k+i∞ 1 Ik (s,u) := Ŵ (z)Ŵ (s − z)u−z dz . 2π i 21 −k−i∞ Montrer que cette intégrale est absolument convergente et tend vers 0 lorsque k tend vers l’infini. (d) Montrer que l’on a pour v ∈ C, |v| < 1,  Ŵ (s + k) k v . Ŵ (s)(1 + v)−s = (−1)k k! k0

−s

(e) Montrer que I0 (s,u) = (1 + u) Ŵ (s) pour ℜe s  1, u ∈]0,1[. (f) Montrer que l’on a pour a,b ∈ [1,∞[, ℜe s  1,  21 +i∞ Ŵ (z)Ŵ (s − z) 1 Ŵ (s) = dz . (a + b)s 2π i 12 −i∞ az bs−z [On distinguera les cas a < b, a = b et a > b.] (g) Montrer qu’il existe une constante σ0 que l’on calculera (on ne demande pas la valeur optimale) telle que l’on ait pour σ > σ0  21 +i∞  1 3 2 −s ζ (3z)ζ (2s − 2z)Ŵ (z)Ŵ (s − z) dz Ŵ (s) (m + n ) = 2π i 12 −i∞ m1 n1

où ζ désigne la fonction zêta de Riemann.

C HAPITRE

II.1 F ONCTIONS

GÉNÉRATRICES SÉRIES DE D IRICHLET

:

1.1. Séries de Dirichlet convergentes Soit f une fonction arithmétique. Si la série entière  S(z) := f (n)z n n1

converge dans un voisinage de 0, plusieurs théorèmes classiques permettent de relier le comportement analytique de sa somme à la valeur des coefficients — par exemple la relation S (n) (0) = n!f (n) ou les formules de Cauchy. Similairement, le comportement analytique d’une série de Dirichlet convergente  f (n) (1.1) F (s) := ns n1

est en corrélation étroite avec la nature asymptotique de la suite f (n). L’un des buts essentiels de ce Tome II consiste à développer des méthodes permettant d’expliciter ce lien. La lettre s désigne une variable complexe. Les nombres réels σ et τ sont implicitement définis par la relation

s = σ + iτ . Définition 1.1. Soit f une fonction arithmétique. On appelle série de Dirichlet associée à f la fonction de variable complexe F (s) définie par (1.1) sur le domaine des points s où la série est convergente.

1.2. SÉRIES DE DIRICHLET DES FONCTIONS MULTIPLICATIVES

191

Les propriétés des séries de Dirichlet formelles étudiées au Chapitre I.2 laissent augurer de l’intérêt arithmétique de la notion de série de Dirichlet convergente. Nous commençons par un résultat simple mais fondamental, relatif à la convolution de Dirichlet. Théorème 1.2. Soient f ,g ,h des fonctions arithmétiques, de séries de Dirichlet respectives F , G, H . Supposons que

h = f ∗ g.

(1.2)

Alors la série H(s) converge dans tout domaine de convergence absolue commun aux séries F et G, et l’on a dans cette circonstance

H(s) = F (s)G(s).

(1.3)

Démonstration. Si F et G sont absolument convergentes au point s, on a pour tout x1   f (m)g(d)    f (m)    g(d)    h(n)           ms ds    ms   ds .  ns  nx

mdx

mx

dx

Cela implique la convergence absolue de H(s). La relation (1.3) en découle, grâce à l’identité formelle qui lui est associée — cf. § I.2.4. ⊓ ⊔ Remarque. La conclusion du Théorème 1.2 est en défaut si l’on considère les domaines de convergence au lieu des domaines de convergence absolue. Il est assez facile de construire des fonctions f , g , h satisfaisant (1.2) et telles que, pour certains points s, F (s) et G(s) convergent alors que H(s) diverge — cf. Exercice 227, voir aussi les Notes.

1.2. Séries de Dirichlet des fonctions multiplicatives Nous avons vu au Théorème I.2.5 que les séries de Dirichlet formelles des fonctions multiplicatives ont pour propriété caractéristique d’être développables en produit eulérien formel. Le théorème suivant fournit une condition suffisante pour qu’une telle identité algébrique prenne un sens analytique. Théorème 1.3. Soit f une fonction multiplicative et s un nombre complexe. Sous l’hypothèse      f (pν )    (1.4)  pν s  < ∞, p ν 1

la série de Dirichlet (1.1) est absolument convergente et l’on a   f (pν ) · (1.5) F (s) = pν s p ν 0

Remarques. (i) Si la série (1.1) est absolument convergente, il en va de même de (1.4). Ainsi les convergences absolues de (1.1) et de (1.4) sont équivalentes.

192

II.1. FONCTIONS GÉNÉRATRICES : SÉRIES DE DIRICHLET

(ii) Lorsque f est complètement (resp. fortement) multiplicative le second membre de (1.5) prend la forme plus simple     f (p)  f (p) −1 resp. 1+ s . , 1− s p p −1 p p Démonstration. Observons tout!d’abord que la condition (1.4) implique la conver  gence du produit infini M := p 1 + ν 1 |f (pν )/pν s | . Ensuite, nous pouvons écrire pour x  1   f (n)     f (pν )    f (n)  1+  s =  νs   M .  s  n n p + nx

P (n)x

px

ν 1

Cela montre bien que la série F (s) est absolument convergente. La majoration      f (n)   f (pν )    f (n)    f (n)   =  −    ns pν s   + ns  n>x ns n1

px ν 0

P (n)>x

implique alors (1.5), en faisant tendre x vers l’infini.

⊓ ⊔

Corollaire 1.4 (Formule d’Euler). Pour σ > 1, on a  1  −1 . 1− s (1.6) ζ (s) = p p Cette formule simple met en évidence le lien explicite entre la série de Riemann et la suite des nombres premiers. Elle constitue l’un des outils essentiels de la théorie analytique des nombres.

1.3. Propriétés analytiques fondamentales des séries de Dirichlet Soit n → an une fonction arithmétique. Posons  A(t) := an . net

Alors la série de Dirichlet associée à (an ) peut encore s’écrire sous la forme  ∞  an = e−ts dA(t). F (s) := ns 0− n1

Cette intégrale est appelée transformée de Laplace–Stieltjes de la fonction A(t). La plupart des théorèmes fondamentaux concernant les séries de Dirichlet se généralisent dans ce cadre, où le formalisme de l’intégrale de Stieltjes se révèle un outil technique agréable. Soit V la classe des fonctions définies sur R et à variation finie sur tout intervalle borné. Bien que notre objet d’étude soit prioritairement les séries de Dirichlet, nous considérons lorsque c’est possible (plus par souci de clarté que de généralité) la transformée de Laplace–Stieltjes des fonctions de V.

1.3. PROPRIÉTÉS ANALYTIQUES FONDAMENTALES DES SÉRIES DE DIRICHLET

193

Théorème 1.5. Soient A une fonction de V et  +∞ (1.7) F (s) := e−st dA(t) 0−

sa transformée de Laplace–Stieltjes. (i) Si l’intégrale (1.7) converge pour s = s0 = σ0 + iτ0 , alors elle converge pour tout s tel que σ > σ0 et la convergence est uniforme dans tout secteur

S(ϑ ) := {s ∈ C : | arg(s − s0 )|  ϑ }

(0  ϑ < π /2).

(ii) Si l’intégrale (1.7) converge absolument pour s = s0 , alors elle converge absolument et uniformément dans le demi-plan fermé σ  σ0 . (iii) La fonction F (s) est holomorphe dans tout domaine ouvert de convergence de (1.7) et l’on a  ∞ (1.8) F (k) (s) = (−t)k e−st dA(t) (k = 0,1,2, . . .). 0−

Démonstration. (i) Soit ϑ ∈ [0,π /2[. Le secteur S(ϑ ) est l’ensemble des nombres complexes s tels que

|s − s0 | 

σ − σ0 . cos ϑ

Pour chaque ε > 0, nous allons montrer l’existence d’un nombre réel x0 = x0 (ε,ϑ ) tel que l’on ait pour y  x  x0  y    (s ∈ S(ϑ )). e−ts dA(t)  ε  x

Posons

g(u) :=



u

e−ts0 dA(t)

(u  0).

0−

Par hypothèse, il existe un x0 = x0 (ε,ϑ ) tel que l’on ait pour v  u  x0

|g(v) − g(u)|  21 ε cos ϑ. Maintenant, on peut écrire pour y  x  x0 et s ∈ S(ϑ )  {s0 }  y   y      −ts e dA(t) =  e−u(s−s0 ) d{g(u) − g(x)}  x x  y    −y(s−s0 )  = e e−u(s−s0 ) {g(u) − g(x)} du {g(y) − g(x)} + (s − s0 ) x  y −u(σ −σ0 ) 1 1  2 ε cos ϑ + |s − s0 | 2 ε cos ϑ e du



1 ε cos ϑ 2

x

|s − s0 |  1  2 ε(cos ϑ + 1)  ε. 1+ σ − σ0

Cela établit bien la conclusion annoncée.

194

II.1. FONCTIONS GÉNÉRATRICES : SÉRIES DE DIRICHLET

L’assertion (ii) n’est qu’une reformulation de la majoration triviale  y  y −ts |e−ts0 | | dA(t)|, |e | | dA(t)|  x

x

valable pour y  x et σ  σ0 . Montrons (iii). La convergence uniforme de la série de l’exponentielle permet d’écrire pour tout x  0  x  sn  x (−t)n dA(t). e−ts dA(t) = n! 0− 0− n0

Le membre de gauche de cette égalité est donc une fonction entière de s, dont la dérivée k -ième vaut  x  sn−k  x (−t)n dA(t) = (−t)k e−ts dA(t). (n − k)! 0− 0− nk

L’assertion (iii) découle de ce qui précède, grâce au théorème de Weierstrass concernant l’analyticité d’une limite uniforme sur tout compact d’une suite de fonctions analytiques — cf. par exemple Cartan (1961), chap. V, th. 1. ⊓ ⊔

Considérons une intégrale F (s) de type (1.7). D’après les points (i) et (ii) du théorème précédent, l’ensemble des abscisses σ des points s où l’intégrale converge (resp. converge absolument) est une demi-droite d’origine σc (resp. σa ). On définit respectivement σc et σa comme l’abscisse de convergence et l’abscisse de convergence absolue de l’intégrale de Stieltjes F (s). Nous convenons que ces deux nombres peuvent valoir ±∞. Il est facile de construire des exemples de séries de Dirichlet convergeant partout, ou divergeant partout, sur l’axe de convergence σ = σc . Le résultat suivant montre que, le cas échéant, la somme de la série peut être évaluée sur l’axe de convergence par prolongement analytique. Théorème 1.6. Supposons que l’intégrale F (s) définie par (1.7) pour σ > σc possède un prolongement analytique F# (s) en certains points s d’abscisse σ = σc . Alors on a  +∞ # e−ts dA(t) F (s) = 0−

en tout point de convergence de l’intégrale.

Démonstration. On utilise l’uniformité établie au Théorème 1.5(i) sous la forme

F (s) = lim F (s + δ ) δ→0+

Comme F# est analytique, cela implique

F# (s) = lim F# (s + δ ) = lim F (s + δ ) = F (s), δ→0+

comme annoncé.

(σ = σc ).

δ→0+

⊓ ⊔

1.3. PROPRIÉTÉS ANALYTIQUES FONDAMENTALES DES SÉRIES DE DIRICHLET

195

À titre d’application du Théorème 1.6, considérons la fonction zêta de Riemann. On a pour σ > 1  ∞  ∞  ∞ t

d ⌊t⌋ s dt = s = dt. − s ⌊t⌋ (1.9) ζ (s) = s s+1 s+1 t t s − 1 t 1 1 1− Comme la dernière intégrale est absolument convergente pour σ > 0, cela montre que ζ (s) est prolongeable en une fonction méromorphe pour σ > 0 ayant pour seule singularité un pôle simple en s = 1. D’après le Théorème 1.6, on obtient donc que, sous l’hypothèse de convergence de la série, on a nécessairement  μ(n) = ζ −1 (1) = 0. (1.10) n n1

Ainsi, grâce au Théorème I.3.8, il s’ensuit que le théorème des nombres premiers est équivalent à la convergence de la série (1.10). Le théorème suivant montre que σc et σa ne peuvent être choisis indépendamment lorsque F (s) est une série de Dirichlet. Théorème 1.7. Soit F (s) une série de Dirichlet, définie par (1.1). Alors on a (1.11)

σc  σa  σc + 1.

Démonstration. Soit ε > 0. La convergence de la série la majoration

f (n) ≪ε nσc +ε



n1

f (n)/nσc +ε implique

et par conséquent la convergence absolue de la série (1.1) au point s = σc + 1 + 2ε. On a donc σa  σc + 1 + 2ε, d’où le résultat, par passage à la limite. ⊓ ⊔ Il est facile de constater que l’encadrement (1.11) est optimal. Pour la série  (−1)n = (21−s − 1)ζ (s) (1.12) G(s) := ns n1

on a σc = 0 (d’après le théorème des séries alternées) et, bien entendu, σa = 1. Une conséquence remarquable du Théorème 1.7 est l’unicité du développement en série de Dirichlet.  Théorème 1.8. Soit F (s) = n1 an /ns une série de Dirichlet nulle pour σ assez grand. Alors an = 0 pour n  1. Démonstration. Raisonnons par l’absurde et supposons la suite {an }∞ n=1 non identiquement nulle. Soit alors m le plus petit entier tel que am = 0. Pour σ assez grand, on a am (1.13) 0 = F (s) = s {1 + G(s)} m avec  am+k m s G(s) := . am m + k k1

196

II.1. FONCTIONS GÉNÉRATRICES : SÉRIES DE DIRICHLET

Cette série converge absolument pour σ > σc + 1 d’après le Théorème 1.7. Pour σ > σ1 > σc + 1 on a donc (1 + 1/m)σ1 −σ mσ1  |am+k | ≪σ1 (1 + 1/m)−σ . |G(s)|  |am | (m + k)σ1 k1

Ainsi G(s) tend vers 0 lorsque σ → +∞, ce qui contredit (1.13). ⊓ ⊔ De l’analogie avec le cas des séries entières, on pourrait être tenté de croire que toute série de Dirichlet possède nécessairement une singularité sur l’axe de convergence. Il n’en est rien. La série (1.12) constitue à cet égard un excellent contre–exemple. Nous verrons en effet au chapitre II.3 que la fonction zêta de Riemann est prolongeable en une fonction méromorphe sur C n’ayant qu’un seul pôle, simple, en s = 1. Cela implique que G(s) est prolongeable en une fonction entière. On peut aussi montrer directement que G(s) est prolongeable en une fonction holomorphe pour σ > −1 — cf. Exercice 156. Le théorème suivant, habituellement appelé théorème de Landau (cf. Notes), décrit un cas où l’axe de convergence contient toujours une singularité. Théorème 1.9 (Phragmén–Landau). Soient A une fonction de V et F (s) sa transformée de Laplace–Stieltjes, définie par (1.7). Si A est croissante au sens large, le point s = σc est une singularité de F (s). Corollaire 1.10. L’abscisse de convergence est une singularité de la somme de toute série de Dirichlet à coefficients  0. Démonstration du Théorème 1.9. Raisonnons par l’absurde et supposons que F est prolongeable en une fonction holomorphe dans un voisinage convenable de s = σc . Il existe alors deux nombres σ > σc et r > σ − σc tels que la série de Taylor de F au point σ , soit  1 F (k) (σ )(s − σ )k , F (s) = k! k0

converge dans le disque |s − σ | < r. Par (1.8), on peut écrire, sous cette condition,  ∞  1 k (−t)k e−σ t dA(t) F (s) = (s − σ ) k! 0 − k0  1  ∞ = tk (σ − s)k e−σ t dA(t). k! 0− k0

Lorsque s est réel, σ − r < s < σ , l’interversion des sommations est justifiée parce que l’intégrande et la mesure dA(t) sont positifs ou nuls. Il suit  ∞ 1 k t (σ − s)k e−σ t dA(t) F (s) = k! 0− k0  ∞  ∞ t(σ −s) −σ t = e e dA(t) = e−st dA(t). 0−

0−

Ainsi l’intégrale de Laplace–Stieltjes converge au point s, ce qui est absurde puisque l’on peut choisir s < σc . Cela termine la démonstration. ⊓ ⊔

1.3. PROPRIÉTÉS ANALYTIQUES FONDAMENTALES DES SÉRIES DE DIRICHLET

197

Dans la pratique, le théorème de Phragmén–Landau revêt une importance particulière car il sous-tend la plupart des théorèmes d’oscillations. Nous nous bornons à énoncer les deux résultats suivants, caractéristiques de son emploi. Théorème 1.11. Soit A : [1, + ∞[→ R une fonction mesurable localement bornée. Si l’intégrale  ∞ A(t) (1.14) H(s) := dt ts+1 1

possède une abscisse de convergence finie σc et si H(s) possède un prolongement analytique holomorphe au point s = σc , alors on a pour tout ε > 0 (1.15)

A(x) = ± (xσc −ε ).

Démonstration. Supposons par exemple l’existence d’une constante K = K(ε) telle que l’on ait

A(t)  Ktσc −ε pour t assez grand. Quitte à modifier la valeur de K , on peut supposer que cette inégalité est satisfaite pour tout t  1. Alors, on peut écrire  ∞  ∞ A(t) − Ktσc −ε K H(s) − dt = − = B(u)e−su du s+1 s − σc + ε t 0 1 avec

B(u) := Ke(σc −ε)u − A(eu )  0.

L’abscisse de convergence de la dernière intégrale est encore σc car  ∞ tσc −ε−s−1 dt 1

est absolument convergente pour σ > σc − ε. D’après le théorème de Phragmén– Landau, le point s = σc doit être une singularité de H(s) − K/(s − σc + ε) et H(s) n’est pas holomorphe au point σc . ⊓ ⊔

 s Théorème 1.12. Soit F (s) = n1 an /n une série de Dirichlet à coefficients réels, possédant une abscisse de convergence finie. Supposons l’existence d’un nombre réel σ0 > 0 tel que F (s) soit prolongeable en une fonction holomorphe en tous les points de la demi-droite [σ0 , + ∞[ et possède un pôle sur la droite verticale σ = σ0 . Alors on a  an = ± (xσ0 ). nx

 Démonstration. Posons A(t) := nt an et désignons par σc l’abscisse de convergence de l’intégrale H(s) définie par (1.14). Par sommation d’Abel, on a pour σ assez grand F (s) = sH(s) de sorte que H(s) est prolongeable holomorphiquement sur la demi-droite [σ0 , + ∞[. On peut supposer qu’il existe une constante K telle que A(t) + Ktσ0 soit de signe constant pour t assez grand — disons par exemple A(t)  −Ktσ0 à l’infini. Il existe alors une constante C telle que B(t) := A(t) + Ktσ0 + C  0

(t  1).

198

II.1. FONCTIONS GÉNÉRATRICES : SÉRIES DE DIRICHLET

L’intégrale





B(t) K C dt = H(s) + + , s+ 1 t s − σ0 s 1 étant holomorphe sur ]σ0 , + ∞[, est convergente pour σ > σ0 d’après le théorème de Phragmén–Landau. Si s0 = σ0 + iτ0 est un pôle de F (s) de partie principale λ(s − s0 )−m , on a donc d’une part L(s) :=

et d’autre part

|L(s0 + δ )|  L(σ0 + δ )

(δ > 0)

λ K , (δ → 0+). L(s0 + δ ) ∼ δ s0 δ m Cela implique |K|  |λ/s0 |. En particulier, A(t) + Ktσ0 n’est pas de signe constant à l’infini dès que   |K| < λ/s0 .

L(σ0 + δ ) ∼

⊓ ⊔ Nous proposons, à l’Exercice 160, trois exemples de théorèmes d’oscillation classiques.

1.4. Abscisse de convergence et valeur moyenne Soit A une fonction de V et (1.16)

F (s) =





e−ts dA(t)

0−

sa transformée de Laplace–Stieltjes. Dans cette section, notre but est de donner une formule explicite pour l’abscisse de convergence de (1.16) lorsque l’on suppose connu le comportement asymptotique de A. Il est clair que la valeur de A au voisinage d’un point quelconque à distance finie est sans influence sur la valeur de σc . Nous pouvons donc sans restreindre la généralité faire l’hypothèse simplificatrice (1.17)

A(0±) = 0.

Le calcul explicite de σc , analogue de la formule de Cauchy pour le rayon de convergence d’une série entière, est l’objet du Théorème 1.14 infra. La démonstration repose sur le résultat suivant. Théorème 1.13. Soit σc l’abscisse de convergence de l’intégrale (1.16). (i) Si l’on a A(x) ≪ eδx pour un réel δ, alors σc  δ.

(ii) Si l’intégrale (1.16) converge pour s = s0 avec σ0 > 0, alors

A(x) = o(eσ0 x )

(x → ∞).

(iii) Si l’intégrale (1.16) converge pour s = s0 avec σ0 < 0, alors il existe un nombre réel α tel que

A(x) = α + o(eσ0 x )

(x → ∞).

1.4. ABSCISSE DE CONVERGENCE ET VALEUR MOYENNE

Démonstration. (i). Pour tout x > 0, on a  x  −st −sx e dA(t) = A(x)e +s 0

x

199

e−st A(t) dt.

0

L’hypothèse concernant l’ordre de croissance de A(t) implique donc la convergence de l’intégrale (1.16) pour tout s tel que σ > δ. On a bien σc  δ. (ii). Par hypothèse,  x (1.18) B(x) := e−s0 t dA(t) = F (s0 ) + o(1) (x → ∞). 0

On peut donc écrire

A(x) =



x

0

= s0



es0 t dB(t) = es0 x B(x) − s0

0

x



x

es0 t B(t) dt

0

{B(x) − B(t)}es0 t dt + B(x).

Le résultat attendu découle alors de (1.18). (iii). Par le Théorème 1.5(i), on peut affirmer que F (s) converge pour s = 0. Posant α := F (0), il vient, avec la notation (1.18),  ∞  ∞ s0 t s0 x es0 t B(t) dt e dB(t) = −e B(x) − s0 α − A(x) = x x  ∞  ∞ s0 t = s0 o(eσ0 t ) dt = o(eσ0 x ). {B(x) − B(t)}e dt = s0 x x ⊓ ⊔ Remarque. Les points (ii) et (iii) du Théorème 1.13 deviennent faux lorsque σ0 = 0. Un contre-exemple à la première assertion est fourni par la fonction  0 (0  x  1) A(x) = 1 (x > 1). L’intégrale (1.16) converge alors pour s0 = 0, mais on n’a pas A(x) = o(1) à l’infini. Pour la seconde proposition, considérons  0√ (0  x  1) A(x) = (x > 1). 2 x On a clairement

F (i) = 2e

−i

+





t−1/2 e−it dt.

1

L’intégrale converge classiquement ; pourtant A(x) n’admet pas de limite finie lorsque x → ∞. Théorème 1.14. Posons κ := lim supx→∞ x−1 ln |A(x)|. (i) Si κ = 0, alors on a σc = κ.

(ii) Si κ = 0, ou bien A(x) ne tend pas vers une limite finie lorsque x → ∞, et l’on a σc = 0, ou bien il existe un réel α tel que A(x) → α pour x → ∞, et l’on a σc = lim sup x−1 ln |A(x) − α |  0. x→∞

200

II.1. FONCTIONS GÉNÉRATRICES : SÉRIES DE DIRICHLET

Démonstration. Pour chaque ε > 0 fixé, on a A(x) ≪ε e(κ +ε)x . Le point (i) du Théorème 1.13 implique donc dans tous les cas σc  κ.

(1.19)

Supposons d’abord κ > 0. Alors l’intégrale F (s) diverge dès que 0 < σ < κ : dans le cas contraire, on aurait, d’après le Théorème 1.13(ii), A(x) = o(eσ x ) ce qui contredit la définition de κ. Ainsi σc  κ, d’où l’égalité requise. Si κ < 0, alors A(x) → 0 lorsque x → ∞ ; le point (iii) du Théorème 1.13 implique donc

A(x) = o(eσ x )

(1.20)

(x → ∞)

pour tout σ > σc . Mais, par définition de κ, aucun σ < κ ne satisfait (1.20). Donc σc  κ, et finalement encore σc = κ. Plaçons nous maintenant dans le cas κ = 0. Si A(x) n’a pas de limite à l’infini, l’intégrale F (s) diverge en s = 0, donc σc  0 et (1.19) permet encore de conclure. Si A(x) = α + o(1), nous devons montrer que σc = ξ , où ξ est l’infimum des réels σ1 tels que

A(x) = α + o(eσ1 x ).

(1.21)

D’après le Théorème 1.13(iii), on a σc  ξ . Une intégration par parties montre trivialement, grâce à (1.21), que F (s) converge dès que σ > ξ , d’où σc  ξ . ⊓ ⊔

1.5. Une application arithmétique : le noyau d’un entier L’abscisse de convergence d’une série de Dirichlet possédant un développement eulérien est souvent assez facile à calculer. Grâce aux Théorèmes 1.13 et 1.14, on peut parfois en déduire des renseignements non triviaux sur les fonctions sommatoires associées. Considérons par exemple le cas du noyau(1) d’un entier n, (i.e. le plus grand diviseur de n sans facteur carré), que nous notons  p. (1.22) k(n) := p|n

Le Théorème 1.13 fournit immédiatement un renseignement concernant la fonction de répartition

N (x,y) := card{n  x : k(n)  y}. Théorème 1.15. Pour chaque ε > 0, et uniformément pour 1  y  x, on a

N (x,y) ≪ε yxε .

(1.23)

Démonstration. La fonction k(n) est multiplicative. Au vu de la convergence de la série à termes positifs   1 1 (ε > 0), = ν νε ε k(p )p p(p − 1) p p ν 1

1

Parfois également appelé radical.

1.5. UNE APPLICATION ARITHMÉTIQUE : LE NOYAU D’UN ENTIER

201

on déduit donc du Théorème 1.3 que l’abscisse de convergence de

F (s) :=



n1

1 k(n)ns

est σc = 0. Par le Théorème 1.13, il suit, pour tout ε > 0,



(1.24)

nx

1 ≪ε xε . k(n)

L’estimation annoncée (1.23) découle immédiatement de cette majoration, puisque  y . N (x,y)  k(n) nx

Nous proposons à l’Exercice 165 une minoration du type m N (x,y) ≫m y ln(2x/y) ,

⊓ ⊔

valable pour tout m > 0 et x  y  y0 (m). (Pour les meilleurs résultats connus concernant N (x,y) voir les Notes.) L’idée de comparer la fonction sommatoire d’une fonction arithmétique à un produit eulérien est la base de la méthode de Rankin (cf. § III.5.1). Nous montrons ci-dessous comment il est possible de recourir à cette technique simple pour affiner (1.23). Théorème 1.16. On a uniformément pour x  y  2 √ N (x,y) ≪ y(ln y)e 8 ln(x/y) . Démonstration. Si l’entier n est compté dans N (x,y), on a pour chaque ε, 0  ε  1,

x ε y 1−ε . 1 n k(n)

Posons v := ln(x/y). Nous pouvons supposer que v  2 car la conclusion est triviale dans le cas contraire. Il suit    1 1 1  yeεv 1+ + N (x,y)  yeεv ε 1 − ε ε n k(n) p p(p − 1) py

nx p|n⇒py

 K  1 +  y exp εv + ε p py

 avec K := p 1/(p ln p)  2. En choisissant ε = 2/v , et en estimant la dernière somme en p par le Théorème I.1.10, on obtient le résultat annoncé. ⊓ ⊔ 

202

II.1. FONCTIONS GÉNÉRATRICES : SÉRIES DE DIRICHLET

1.6. Ordre de grandeur dans les bandes verticales Une série de Dirichlet F (s) est à l’évidence bornée dans tout demi plan fermé contenu dans le domaine de convergence absolue. Cependant |F (s)| peut prendre de grandes valeurs lorsque σ → σa et |τ | → ∞. Le théorème suivant fournit un exemple important. Théorème 1.17. Pour tout réel T > 0, il existe un nombre réel τ > T tel que

sup |ζ (σ + iτ )| 

(1.25)

σ >1

1 10

ln2 (3 + τ ).

Pour établir ce résultat, nous ferons appel à une variante classique, concernant l’approximation simultanée de N nombres réels modulo 1, du théorème d’approximation de Dirichlet — Théorème I.7.1. Nous rappelons l’énoncé dans le lemme ci-dessous. Comme c’est l’usage, nous posons pour x ∈ R

x := min |x − n|. n∈Z

Lemme 1.18 (Dirichlet). Soient α1 ,α2 , . . . ,αN des nombres réels et D un nombre entier  1. Pour tout entier Q  2, il existe un entier q , D  q  D·QN , tel que

max q αj   1/Q.

(1.26)

1jN

Démonstration. Considérons la partition

6

N   jh jh + 1  , Q Q

0j1 ,...,jN 1, et tout entier N  1, on peut écrire  cos(τ ln n)  1 (1.27) ℜe ζ (s)  − . σ n nσ n>N

nN

Appliquons le lemme avec Q := 6, D := QN , et αn := existe donc un réel τ , 6N  τ  62N , tel que

1 2π

ln n (1  n  N ). Il

min cos(τ ln n)  cos(π /3) = 12 .

1nN

On déduit alors de (1.27)

ℜe ζ (s) 

1 2

 1  1 − = 12 ζ (σ ) − σ n nσ

nN

n>N

3 2

 1 1 − 3N 1−σ  σ n 2(σ − 1)

n>N

1.6. ORDRE DE GRANDEUR DANS LES BANDES VERTICALES

203

où la dernière inégalité découle des estimations usuelles de comparaison de séries et d’intégrales. Pour σ = 1 + 4/ ln N il vient

ℜe ζ (s) >

1 9

ln N 

1 10

ln2 (3 + τ )

si N  N0 . La condition supplémentaire τ > T est remplie dès que N > ln T / ln 6. Cela achève la démonstration. ⊓ ⊔

Le théorème suivant montre que, dans son domaine de convergence, une série de Dirichlet doit satisfaire à certaines majorations.  Théorème 1.19. Soit F (s) = n1 an /ns une série de Dirichlet d’abscisse de convergence σc . Soient σ0 > σc , ε > 0 ; on a uniformément pour σ0  σ  σc + 1

F (s) ≪ |τ |1−(σ −σc )+ε

(1.28)

(|τ |  1).

Démonstration. On peut manifestement supposer que l’on a 0 < ε < σ0 − σc . Posons  an A(t) := nσc +ε t ne

de sorte que A(t) = F (σc + ε) + o(1) lorsque t → ∞. De plus  ∞  a    n −t(s−σc −ε ) |F (s)| =  + e dA(t)  ns ln N nN  ∞  |an | |A(ln N )|  |A(t)|e−t(σ −σc −ε) dt. + + |s − σ − ε | c nσ N σ −σc −ε ln N nN

Comme |an | ≪ε nσc +ε , il vient

|F (s)| ≪ε N 1−(σ −σc )+ε + |s|N −(σ −σc )+ε .

⊔ Le résultat annoncé découle de cette estimation en choisissant N = 1 + ⌊|τ |⌋ . ⊓

Le problème de déterminer si une fonction donnée, analytique dans un certain demi-plan, est ou non représentable sous forme d’une série de Dirichlet est en général difficile. Le Théorème 1.19 montre que les fonctions satisfaisant une relation du type

(1.29)

F (s) ≪ |τ |A

(|τ |  1)

pour un certain A > 0 jouent un rôle particulier.(2) Si F satisfait (1.29) dans un domaine D, on dit que F est d’ordre fini dans D. Une série de Dirichlet est d’ordre fini dans tout demi-plan fermé inclus dans le domaine de convergence. Lorsque la somme est prolongeable analytiquement, il peut arriver que le prolongement soit encore d’ordre un domaine plus large. Considérons par exemple la  fini dans n s série G(s) := (− 1 ) /n , qui permet de prolonger analytiquement ζ (s) au n1 2

Dans certains circonstances, il peut être utile de remplacer dans (1.29) la condition |τ |  1 par |τ |  τ0 (F ) pour une constante arbitraire τ0 (F ). Tous les résultats présentés dans la suite demeurent valides avec cette modification.

204

II.1. FONCTIONS GÉNÉRATRICES : SÉRIES DE DIRICHLET

domaine σ > 0, s = 1 par la formule

ζ (s) = G(s)/(21−s − 1).

D’après le Théorème 1.19, on a pour 0 < σ < 1, |s − 1| ≫ 1, ζ (s) ≪ G(s) ≪ τ 1−σ +ε

de sorte que le prolongement de ζ (s) est d’ordre fini pour 0 < σ  1. Pour toute fonction F d’ordre fini dans un domaine D, nous notons μ(σ ) = μF (σ ) la borne inférieure de l’ensemble des nombres réels ξ tels que

F (s) ≪σ ,ξ |τ |ξ

(s ∈ D, |τ |  1).

Théorème 1.20. Soit F (s) une fonction d’ordre fini dans une bande verticale σ1  σ  σ2 . Alors la fonction μ(σ ) est convexe sur cet intervalle. En particulier, elle est continue pour σ1 < σ < σ2 . Démonstration. C’est une conséquence immédiate du classique théorème de Phragmén–Lindelöf(3) qui énonce que les majorations

(∀ε > 0)

F (s) ≪ε eε|τ |

(σ1  σ  σ2 )

et

F (σ1 + iτ ) ≪ |τ |k1 , F (σ2 + iτ ) ≪ |τ |k2

(|τ |  1)

impliquent

F (σ + iτ ) ≪ |τ |k(σ )

(σ1  σ  σ2 , |τ |  1)

où k(σ ) est la fonction linéaire prenant respectivement les valeurs k1 et k2 en σ1 et σ2 . On a donc (1.30)

μ(σ ) 

(σ2 − σ )μ(σ1 ) + (σ − σ1 )μ(σ2 ) σ2 − σ1

(σ1  σ  σ2 ). ⊓ ⊔

Remarque. Le théorème de Phragmén–Lindelöf implique en fait que l’on a, pour tout ε > 0,

F (s) ≪ε,σ1 ,σ2 |τ |k(σ )+ε dans le domaine σ1  σ  σ2 , |τ |  1. Nous aurons l’occasion d’utiliser cette uniformité locale en σ . Théorème 1.21. Pour toute série de Dirichlet F (s), on a (1.31)

μ(σ ) = 0

(σ > σa ).

De plus μ(σ ) est une fonction décroissante de σ dans toute région où F est d’ordre fini.

3

Voir par exemple Titchmarsh (1939), § 5.65, ou Valiron (1955), § 242.

1.6. ORDRE DE GRANDEUR DANS LES BANDES VERTICALES

205

Démonstration. Pour σ > σa , F (s) est bornée, donc μ(σ )  0. De plus, si am est le premier coefficient non nul, on a  |an | |am | >0 |F (s)|  σ − m nσ nm+1

dès que σ est assez grand. Comme cette minoration est indépendante de τ , on a μ(σ )  0, et par conséquent μ(σ ) = 0. En appliquant alors (1.30) avec σ et σ2 suffisamment grands (de sorte que μ(σ ) = μ(σ2 ) = 0), on obtient que μ(σ1 )  0 pour σ1 > σa ; cela implique bien (1.31). La deuxième assertion découle également de (1.30), en choisissant σ2 > σa : puisque μ(σ2 ) = 0, on peut écrire μ(σ ) 

σ2 − σ μ(σ1 )  μ(σ1 ) σ2 − σ1

(σ1  σ )

avec l’inégalité stricte μ(σ ) < μ(σ1 ) si μ(σ1 ) = 0 et σ > σ1 .

⊓ ⊔

Corollaire 1.22. Soit F (s) une série de Dirichlet d’ordre fini pour σ > σ0 avec σ0 < σa . Alors μ(σa ) = 0. Démonstration. Cela découle immédiatement de (1.31) et de la dernière assertion du Théorème 1.20. ⊓ ⊔

N OTES

§ 1.1. Il est facile d’étendre le Théorème 1.2 de la manière suivante : Si la série F (s) converge et si la série G(s) converge absolument, alors la série H(s) converge et l’on a H(s) = F (s)G(s).  En effet, posant, pour s fixé, A(x) := mx f (m)m−s , il existe pour chaque ε > 0 un y = y(ε) tel que

|A(z) − F (s)| < ε

(z > y).

On peut donc écrire pour x assez grand  f (m)g(d)  g(d) x   h(n) = = A ns (md)s ds d nx mdx dx

 g(d)  = {F (s) + O(ε)} + O s d dx/y

x/y 0, F (s0 + 1 + ε) et G(s0 + 1 + ε) convergent absolument, de sorte que H(s) est (absolument) convergente pour σ > σ0 + 1. On peut sans effort préciser considérablement ce résultat — cf. Landau (1909) pp. 759 et suiv., ou Hardy & Riesz (1915), p. 67. Théorème 1.23 (Stieltjes, 1887). Si F (s) et G(s) convergent en s = s0 , alors H(s) = F (s)G(s) converge en s = s0 + 12 . Démonstration. On peut supposer sans perte de généralité que s0 = 0. De plus, une sommation d’Abel montre immédiatement que l’hypothèse implique   (1.32) f (n)n−1/2 = o(y −1/2 ), g(n)n−1/2 = o(y −1/2 ) (y → ∞). n>y

n>y

NOTES

207

Maintenant, on peut écrire    f (m)m−1/2 g(d)d−1/2 + R1 + R2 (1.33) h(n)n−1/2 = √ d x

√ m x

nx

où l’on a posé

R1 :=



√ d x

g(d)d−1/2





f (m)m−1/2

x 0  (1.34) h(n) ≪ε x1/2+ε . nx

Cela découle, en effet, par le Théorème 1.13, du fait que la série associée à h(n) converge pour σ > 21 .

208

II.1. FONCTIONS GÉNÉRATRICES : SÉRIES DE DIRICHLET

Une analyse plus approfondie permet d’élucider plus avant cet exemple. Grâce à l’identité    τ (m) = T (x) − 2T 21 x + T 41 x mx, 2 ∤ m



T (x) :=



τ (n),

nx

on peut voir, après un calcul élémentaire, que    h(n) = (x) − 4 12 x + 4 41 x

(x > 0)

nx

où l’on a posé

(x) := T (x) − x(ln x + 2γ − 1).

Le théorème de Voronoï (Théorème I.6.11) permet donc de remplacer, dans (1.34), l’exposant 1/2 par 1/3 et il est naturel de conjecturer que l’abscisse de convergence de la série H(s) = F (s)2 est σc = 1/4. Nous donnons à l’Exercice 155 un exemple simple d’une série de Dirichlet F (s) convergeant partout sur l’axe de convergence σ = σc mais telle que la série F (s)2 diverge partout sur le même axe. Si σc (F ) et σc (F 2 ) sont les abscisses de convergence respectives de F (s) et F (s)2 , le Théorème 1.23 implique σc (F 2 )  σc (F ) + 21 .

(1.35)

Infirmant une conjecture de Cahen (1894), Landau (1909, p. 773) a montré que l’on peut avoir σc (F 2 ) > σc (F ).

(1.36)

Son raisonnement consiste à utiliser l’estimation (1.37)

1

ζ (s) = (|τ | 2 −σ )

(0 < σ < 21 ),

dont nous verrons au § 3.4 qu’elle découle directement de l’équation fonctionnelle de la fonction ζ (s). La relation maintenant familière  (−1)n G(s) := = (21−s − 1)ζ (s) (σ > 1) ns n1

montre que (1.37) est également valable pour G(s), bien que σc (G) = 0. Cela implique

G(s)4 = (|τ |2−4σ )

(0 < σ < 21 ),

de sorte que σc (G4 )  14 , par le Théorème 1.19. Ainsi (1.36) a lieu soit pour F = G, soit pour F = G2 . En fait, on peut même avoir égalité dans (1.35). Bohr (1910) a fourni un exemple de série de Dirichlet telle que σc = 0,σa = 1, et (1.38)

F (s) = ε (|τ |1−σ −ε )

(ε > 0, 0 < σ < 1).

Le Théorème 1.19 implique immédiatement que pour cette série σc (F 2 )  12 , d’où l’égalité par (1.35).

NOTES

209

La construction de Bohr est ingénieuse mais relativement facile. Considérons k une suite {τk }∞ k=1 de nombres réels tendant vers l’infini assez vite (τk := exp 2 δk ∞ convient), donnons nous une suite {δk }k=1 telle que δk → 0 et τk → +∞, et définissons la suite {an }∞ n=1 par la formule ⎧ 1 /2 ⎨0 (τk < n  τk1+δk )  i τ k An := am = n (τk1+δk < n  τk2 ) ⎩ mn 1 (τk2 < n  τk+1 ).  Alors la série F (s) := m1 am m−s satisfait (1.38). On a bien σc = 0 puisque An n’a pas de limite à l’infini (donc σc  0) et que la règle d’Abel montre que F (σ ) converge pour tout σ > 0 (donc σc  0). Par le Théorème 1.7, on a σa  1, et par le Théorème 1.19, μ(σ )  1 − σ pour 0  σ  1. Nous allons voir que pour tout σ , 0 < σ < 1, on a 1−σ (1+δk )

(k → ∞),

F (σ + iτk ) ∼ (i/σ )τk ce qui établit bien (1.38) et montre que μ(σ ) = 1 − σ

(1.39)

(0  σ  1).

Posant sk = σ + iτk , on a    F (sk ) = An {n−sk − (n + 1)−sk } = (· · · ) + √ n τ k

n1

puisque An = 0 lorsque est clairement



1+δk

n>τk

τ k < n  τk1+δk . La première des deux sommes ci-dessus



 √

(1−σ )/2

n τ k

n−σ ≪σ τk

La seconde vaut    sk An n−1−sk + O(s2k n−2−sk )

.

1+δk

n>τk

= sk



1+δk

τk

τk2

τk n

−1 −σ

+



1+δk

n>τk

τk2 n−2−σ



   1−δ −σ (1+δk ) i 1−σ (1+δk ) −σ (1+δk ) = sk σ −1 τk ∼ τk . + Oσ (τk−2σ ) + Oσ τk k σ

§ 1.3. Pour une mise au point historique concernant l’apport décisif de Phragmén au théorème dit « de Landau », le lecteur est invité à consulter l’article circonstancié de Dress (1983–84). Il y trouvera en outre une présentation pédagogique et un tour d’horizon actualisé des théorèmes d’oscillation obtenus dans la littérature. Voir aussi Kaczorowski & Pintz (1986–7). On peut énoncer le théorème de Phragmén–Landau sous la forme suivante : Soit f une fonction arithmétique positive ou nulle ; si la fonction F (s) définie par F (s) = n1 f (n)/ns pour σ > σ0 est prolongeable holomorphiquement à un domaine contenant la droite σ = σ0 , alors la série converge pour σ = σ0 .

210

II.1. FONCTIONS GÉNÉRATRICES : SÉRIES DE DIRICHLET

Ingham (1935) a montré que l’on peut remplacer dans cet énoncé la condition f  0 par |f |  M lorsque σ0 = 1. Cela permet de déduire immédiatement le théorème des nombres premiers du fait  que ζ (s) = 0 lorsque σ = 1 (cf. § 3.7). On obtient en effet la convergence de n1 μ(n)/n, d’où la conclusion souhaitée grâce au Théorème I.3.8. La démonstration d’Ingham reposait sur des considérations d’analyse de Fourier. D.J. Newman (1980) a donné de son théorème une preuve beaucoup plus simple en utilisant une astucieuse méthode d’intégration complexe. Korevaar (1982), puis Zagier (1997) ont encore réduit les prérequis dans une présentation élégante et ultra-courte d’une variante de la preuve de Newman : voir le Théorème 7.31. La preuve donnée ici du Théorème 1.12 fournit une minoration de la constante implicite dans la notation ± . Pour d’autres renseignements de ce type voir Dress (1983–84), ou Grosswald (1972). § 1.5. Les meilleurs résultats actuellement connus concernant N (x,y) sont dus à Robert & Tenenbaum (2013), améliorant significativement ceux de Squalli (1985) dans une thèse dirigée par l’auteur. Soit F la fonction continue sur R+ et dérivable sur R+  {ln m : m ∈ N∗ } définie pour v  0 par 6  min(1,ev /m) ! · F (v) := 2 π p|m (p + 1) m1

Robert & Tenenbaum établissent l’existence d’une suite de polynômes Qj (j  1), avec deg Qj  j , telle que l’on ait pour chaque N  1, , + 

ln v N +1   Qj (ln2 v) 8v 2 (v  3). + ON 1+ F (v) = exp ln v (ln v)j ln v 1jN

En particulier, Q1 (t) = 1 + 12 t. Posant systématiquement v := ln(x/y) (1  y  x), ils montrent notamment que

N (x,y) ≪ yF (v)

√ 1

et que, notant Yx := e 4

(x  y  2) √ 2 ln x(ln2 x)3/2 , Mx := 2 ln x ln2 x ln3 x, nous avons

N (x,y) ∼ yF (v) ⇔ y > Yx e−3Mx /8 eψx



ln x ln2 x

(ψx → ∞).

Le même article contient de nombreux renseignements sur le comportement local et global de N (x,y), qu’il serait trop long de citer ici in extenso. Nous nous limitons ci-dessous à quelques indications. La majoration de Rankin pour N (x,y) s’écrit

N (x,y) 

6y g(σv ) e π2

NOTES

où g(σ ) :=

 p

211

1 − p σ −1  (σ > 0) et σv est défini par l’équation ln 1 + p(pσ − 1)

g ′ (σv ) + v = 0. Nous avons alors le développement asymptotique généralisé(4)    Pk (ln2 v)  2 (v → ∞) σv ≈ 1+ v ln v (ln v)k k0

où Pk est un polynôme de degré  k . Ainsi

P1 (X) := 12 (X − ln 2), P2 (X) = 83 X 2 − ( 34 ln 2 + 21 )X +

1 2

ln 2 + 38 (ln 2)2 + 23 π 2 .

Robert & Tenenbaum établissent les six asserions suivantes : √ (i) ∀c ∈]0,1[ ∃b = bc : N (x,y) = yF (v)c+o(1) ⇔ y = e{b+o(1)} ln x ln2 x où la quantité bc est définie comme la solution d’une équation explicite dépendant de c ; √ (ii) N (x,y) = yF (v)o(1) ⇔ (ln y)/ ln x ln2 x → 0 ; (iii) N (x,y) ∼ yF (v)e−{1+o(1)}K (x  y  2) où K = K(x,y) est une quantité explicite vérifiant K ≍ v σv /y σv ; (iv) N (2x,y) ∼ N (x,y) ⇔ y = o(x) ; (v) N (x,2y) ∼ 2N (x,y) ⇔ ln y > (ln x)1/2+o(1) ; N (x,2y) ∼ 2b N (x,y) ⇔ ln y = (ln x)1/(b+1)+o(1) . (vi) (∀b > 1) Ces résultats permettent une formulation précise de la conjecture abc de Masser & Oesterlé — cf. Masser (1985) —, qui constitue l’un des plus célèbres problèmes actuellement ouverts en mathématiques. L’une de ses formulations équivalentes consiste à stipuler que, pour tout ε > 0, il existe une constante Mε telle que les conditions a ∈ N∗ , b ∈ N∗ , (a,b) = 1 impliquent c := a + b  Mε k(abc)1+ε . Elle fournit donc une limitation essentielle pour la structure multiplicative d’un produit dont les termes sont liés par une relation additive. Ses très nombreuses conséquences, notamment au grand théorème de Fermat, ont été abondamment décrites dans la littérature. L’hypothèse heuristique sous-tendant la conjecture abc consiste à supposer que les nombres k(a), k(b) et k(c) se comportent essentiellement comme des variables aléatoires indépendantes lorsque les tailles des paramètres sont d’un ordre de grandeur fixé. Comme les estimations décrites plus haut concernant N (x,y) fournissent essentiellement une description des mesures de répartition de ces variables aléatoires, elles permettent naturellement une formulation précise de la conjecture. Robert, Stewart & Tenenbaum (2014) obtiennent ainsi la version suivante grâce à un argument probabiliste de type Borel–Cantelli. Conjecture. Soit ε > 0. Il existe une constante positive A telle que, pour tout triplet (a,b,c) d’entiers positifs satisfaisant à (a,b) = 1, c = a + b, k = k(abc), on ait

c  AkF ( 23 ln k)3−(ln 4−ε)/ ln2 (k+2) , 3−(ln 4+ε)/ ln2 (k+2)  alors que l’inégalité c > kF 32 ln k a lieu pour une infinité de tels triplets. 4

Au sens où, en tronquant la série à un ordre quelconque, on obtient une formule asymptotique dont l’ordre du terme d’erreur ne dépasse pas celui du premier terme négligé.

212

II.1. FONCTIONS GÉNÉRATRICES : SÉRIES DE DIRICHLET

Pour une application du Théorème 1.16, voir l’Exercice 276, p. 480. § 1.6. Le Théorème 1.19, qui énonce que μ(σ )  1 − (σ − σc )

(σc  σ  σc + 1),

est optimal, comme l’atteste le contre–exemple de Bohr cité plus haut — cf. Hardy & Riesz (1915) p. 19. Nous verrons au § 2.2 (Théorème 2.8) une sorte de réciproque du Théorème 1.21 : si F (s) est holomorphe et satisfait μ(σ ) = 0 pour σ > σ0 , alors σc  σ0 .  Ainsi, si F (s) := 1 + n2 f (n)/ns converge pour σ > σ0 , ne s’annule pas dans ce demi-plan, et y satisfait la minoration |F (s)| ≫ε (1 + |τ |)−ε pour chaque ε > 0, alors la série G(s) = F (s)−1 converge pour tout σ > σ0 . Un théorème de Landau (1933) montre que la condition de croissance est en fait superflue.

E XERCICES

 155. Montrer que la série de Dirichlet F (s) = n1 (−1)n (ln 2n)−2 n−s converge en tout point de l’axe de convergence σ = 0. On pose  h(n) =: H(s). F (s)2 = ns n1

Montrer que h(n) n’est pas borné, et en déduire que H(s) ne converge en aucun point de la droite σ = 0.  156. On pose A(t) := nt (−1)n n (t  0).   (a) Montrer que A(N ) = (−1)N 12 (N + 1) pour tout entier N  1.

+∞ (b) Calculer l’abscisse de convergence de G(s) := 1− t−s−1 dA(t). (c) Montrer que pour σ > 0, on a  ∞ A(t) dt. (1.40) G(s) = (s + 1) ts+2 1

n+1  (d) Montrer que la série n1 A(n) n dt/t1+ε converge pour chaque ε > 0. (e) En déduire que (1.40) définit un prolongement analytique holomorphe de G(s) au demi-plan σ > −1.  s 157. Soit F (s) = n1 an /n une série de Dirichlet d’abscisse de convergence finie σc .  (a) Montrer que la série ϕ (z) = n1 an e−nz converge uniformément pour ℜe z  ε > 0. (b) Soit H := {s : σ > max(0,σc )}. Montrer que pour tout s ∈ H , il existe une constante C(σ ) telle que ϕ (t)  C(σ )t−σ (t > 0). En déduire que le domaine de ∞ convergence absolue de l’intégrale I(s) = 0 ts−1 ϕ (t) dt contient le demi-plan H . (c) Montrer que pour s ∈ H , on a F (s)Ŵ (s) = I(s).  s 158. Soit F (s) = n1 an /n une série de Dirichlet. On suppose qu’il existe z ∈ C, avec ℜe z > −1 tel que  A(x) := an ∼ x(ln x)z (x → ∞). 1nx

 Montrer que F (s) = Ŵ (z + 1)/(s − 1)z+1 + o 1/(σ − 1)ℜe z+1 lorsque s → 1 en restant dans le demi-plan σ > 1.

214

II.1. FONCTIONS GÉNÉRATRICES : SÉRIES DE DIRICHLET

159. On conserve les notations de l’Exercice 158, mais on suppose maintenant que A(x) ≪ 1. Montrer que F (s) est holomorphe dans le demi-plan σ > 0 et que, si F (s) possède un pôle sur la droite σ = 0, celui-ci est nécessairement simple. 160. Trois résultats d’oscillation. Pour cet exercice, on admet l’assertion suivante, qui est une conséquence très affaiblie des Théorèmes 3.3 et 3.19 infra : La fonction ζ (s) possède au moins un zéro dans le demi-plan fermé σ  21 et les zéros de la bande 0 < σ < 1 sont répartis symétriquement par rapport à l’axe σ = 12 .  (a) En utilisant les propriétés de la série G(s) := n1 (−1)n /ns , montrer que ζ (s) est prolongeable en une fonction méromorphe pour σ > 0 ayant pour seule singularité un pôle simple en s = 1 et ne s’annulant pas pour s ∈ ]0, + ∞[. 1

(b) Montrer, en considérant la série ζ (s) + ζ ′ (s)/ζ (s), que ψ (x) = x + ± (x 2 ). (c) Montrer, en considérant la série 1/ζ (s), que  1 M (x) := μ(n) = ± (x 2 ). nx

(d) Montrer, en considérant la série ζ (s)/ζ (2s), que  1 6 Q(x) := μ(n)2 = 2 x + ± (x 4 ). π nx

√ 161. (a) Soit f la fonction additive définie par f (pν ) = p (p ∈P, ν ∈ N∗ ). Déterminer l’ordre de grandeur de la fonction sommatoire F (x) := nx f (n).

(b) Même question en supposant maintenant f multiplicative tout en laissant √ inchangée la définition des nombres f (pν ). On pourra comparer f (n) à n et  appliquer soit le Théorème I.3.10, soit l’inégalité μ(n)2  1 − p2 |n 1.

(c) Déterminer les abscisses de convergence des séries de Dirichlet associées aux fonctions définies en (a) et (b). 162. (a) Montrer que pour s ∈]1,∞[, x > 0, N := ⌊x⌋, on a  1 1 1 < < , (s − 1)(N + 1)s−1 js (s − 1)N s−1 j>x

où la majoration est interprétée comme ζ (s) < ∞ lorsque N = 0. (b) Montrer que 1/(s − 1) < ζ (s) < s/(s − 1) pour tout s ∈]1,∞[.

(c) Établir que l’équation ζ (s) = 2 possède une et une seule solution ̺ sur la demi-droite ]1,∞[. Prouver que 23 < ̺ < 2. (d) Pour k ∈ N∗ , n ∈ N∗ , on note tk (n) le nombre de solutions de l’équation d1 d2 · · · d k = n où les inconnues d1 , . . . ,dk sont des entiers  2. On désigne par Tk (s) := n1 tk (n)/ns la série de Dirichlet associée à la fonction arithmétique tk . Exprimer T1 (s) en fonction de ζ (s) dans un domaine convenable du plan complexe, que l’on explicitera. (e) Montrer que tk = tk−1 ∗ t1 pour k  2. En déduire une expression simple de Tk (s). Préciser l’abscisse de convergence de cette série. (f) Montrer que, pour chaque entier n fixé, tk (n) = 0 dès que k est assez grand.

EXERCICES

(g) On pose f (n) :=



k1 tk (n).

F (s) :=

215

Montrer que, pour ℜe s > ̺, on a

 f (n) 1 − 1. = s n 2 − ζ (s)

n1

En déduire la valeur de l’abscisse de convergence de la série de Dirichlet F (s). (h) Montrer que f ∗ t1 = f − t1 . En déduire que, si l’on désigne par A(x) la fonction sommatoire de la fonction f , alors on a pour tout x  1  A(x) = ⌊x⌋ − 1 + A(x/j). 2jx

(i) Soit C := (̺ − 1)2̺−1 où ̺ est le nombre réel introduit en (c). Montrer que A(x)  Cx̺ pour tout x  1. On pourra raisonner par récurrence sur l’unique entier h tel que 2h  x < 2h+1 et faire appel à la minoration établie en (a). 163. On pose P (m,n) := m2 + n3 + mn. (a) Montrer que m2 + n3  P (m,n)  2(m2 + n3 ) pour m  1, n  1. (b) Montrer que l’on a  ∞

1  1 1 a1 −α ≍ = dt + O (n + a)α (t + a)α aα α−1 1 n1

uniformément pour a  1 et 1 < α  a.(5)   (c) Quelle est l’abscisse de convergence de n1 m1 P (n,m)−s ? (d) Quelles estimations peut-on en déduire pour

A(x) := |{n,m  1 : P (n,m)  x}|? (e) En raisonnant directement, évaluer à une constante multiplicative près l’ordre de grandeur de A(x). Retrouver ainsi le résultat de (c). 164. On pose an = 1 si l’écriture en base 10 de n ne comporte pas le chiffre 6, et an = 0 dans le cas contraire. Montrer qu’il existe un nombre réel δ > 0, que l’on calculera, tel que  an ≍ x1−δ (x  1). nx

Que peut-on en déduire quant à l’abscisse de convergence de la série de Dirichlet associée ? 165. Une minoration du nombre des entiers à petit noyau. (a) Soit m ∈ N∗ . Montrer que le nombre de solutions en nombres entiers ν1  0, ν2  0, . . . ,νm  0 de l’inégalité  νi  N 1im

 +m vaut N m . [On pourra utiliser le développement de Taylor de (1 − x)−m−1 .] 5

On rappelle que f ≍ g signifie f ≪ g ≪ f .

216

II.1. FONCTIONS GÉNÉRATRICES : SÉRIES DE DIRICHLET

(b) Soient p1 < p2 < · · · < pm des nombres premiers distincts. Montrer que tout entier n de la forme

n = pν11 · · · pνmm r, avec μ(p1 · · · pm r)2 = 1,

satisfait à k(n)  rp1 · · · pm . (c) Déduire de (a) et (b) que pour tout entier m  1, on a   m μ(p1 · · · pm r)2 . N (x,y) ≫m ln(2x/y) ry/p1 ···pm

 (d) Établir l’identité μ(n)2 = d2 |n μ(d) et en déduire que l’on a uniformément pour M  1, μ(M )2 = 1, y  1,   6  1 −1 √ μ(M r)2 = 2 1+ y + O 2ω(M) y . π p ry

p|M

(e) Prouver que l’on a, pour m  1 et x  y  p1 · · · pm , m N (x,y) ≫m y ln(2x/y) .

166. Soit f une fonction multiplicative. Montrer que la série de Dirichlet associée à n → f (kn) peut, pour chaque entier k  1, être développée en un produit infini de type eulérien. Applications : pour σ > 1, on a   τ (kn) 2 (a) (ν + 1 − ν p−s ), = ζ (s) ns ν n1 p k   

1   1 1 s p (b) = · log s −s τ (kn)n 1−p (j + ν + 1)pjs ν n1

p k j0

p∤ k

des nombres 167. Soient α ∈ ]0,1[, ϑ = 0 réels fixés.  (a) Montrer que A(x) := nx e ϑ nα ≪ x1−α . (b) Montrer que l’on a uniformément pour x  1, 0 < ε < 1,

A(x + εx1−α ) − A(x) = e(ϑ xα )εx1−α + O(1 + ε2 x1−α ).

(c) Montrer que l’abscisse de convergence de la série de Dirichlet   e ϑ nα F (s) := ns n1

est σc = 1 − α. 168. (a) Soient ϑ ∈ R et α, β des nombres réels de ]0,1[. Montrer que, s’il existe un entier m tel que 0 < α  |ϑ − m|  β < 1, alors ϑ   min(α,1 − β ). (b) Montrer que si ϑ est un nombre réel et n,p,q ,Q,v sont des nombres entiers tels que 0 < n < Q, 0 < q < Q, (p,q) = 1, |ϑ − p/q|  1/(qQ), 1 < v  q/2, np ≡ ±v (mod q), alors nϑ   (v − 1)/q . (c) Soit ϑ un nombre irrationnel fixé et {pk /qk }∞ k=0 la suite de ses réduites. On se propose dans cette question de déterminer un encadrement de la quantité  1 Aϑ (x) := nϑ  1nx

pour x  1. Dans tout ce qui suit, on considère x comme donné et l’on définit implicitement un nombre entier t  0 par l’encadrement qt  x < qt+1 .

EXERCICES

217

(i) Montrer que 1/(2qt qt+1 ) < |ϑ − pt /qt | < 1/(qt qt+1 ). En déduire un encadrement de ϑ qt . (ii) Montrer que Aϑ (x) > qt+1 . (iii) Montrer que nϑ  > 1/(2qt+1 ) pour tout entier n de [1,x]. (iv) Montrer, en utilisant l’inégalité établie en (b), que, pour tous entiers v ∈ [2, 12 qt ], n ∈ [1,x] tels que npt ≡ ±v (mod qt ), on a

nϑ   (v − 1)/qt .

ν + 1 /2 (v) Montrer que l’on a 1/ν  ν −1/2 dw/w pour tout nombre réel ν  1 et en déduire que  1  ln(2z + 1) (z > 0). n 1nz

(vi) Déduire des trois questions précédentes que, pour m ∈ N, on a   qt 1 < 6qt+1 + 2  6qt+1 + 2qt ln qt . nϑ  v−1 1nx mqt 0), F (s)xs (2.3) A∗ (x) = 2π i κ −i∞ s

où l’intégrale est semi-convergente lorsque x ∈ R  N et converge en valeur principale lorsque x ∈ N.

2.1. FORMULES DE PERRON

219

La démonstration repose sur le lemme suivant, qui est un calcul effectif d’inversion de Laplace concernant la fonction ⎧ (x > 1) ⎨1 (2.4) h(x) := 12 (x = 1) ⎩ 0 (0 < x < 1). Lemme 2.2. Pour tous κ, T , T ′ positifs, on a  κ +iT  1 ds  1 xκ 1  + ′ (i) xs   h(x) − 2π i κ −iT ′ s 2π | ln x| T T  κ +iT   1 κ ds   (ii) .   h(1) − 2π i κ −iT s T +κ

(x = 1),

Admettons momentanément ce lemme et voyons comment on peut en déduire la formule (2.3). Supposons dans un premier temps κ > σa . Alors la série F (s) est absolument et uniformément convergente pour σ = κ, d’où  κ +iT  κ +iT s xs 1  1 x ds an . F (s) ds = 2π i κ −iT ′ s 2π i n s κ −iT ′ n1

En appliquant le point (i) du lemme, il suit, pour x ∈ R  N,  1  κ +iT  |an | 1  xκ 1 xs   + ′ . F (s) ds − A∗ (x)  (2.5)  2π i κ −iT ′ s 2π T T |n|κ | ln(x/n)| n1

Comme le facteur | ln(x/n)| est minoré indépendamment de n, on obtient la première assertion du théorème en faisant tendre T et T ′ indépendamment vers l’infini. La seconde assertion est prouvée de la même manière : il suffit de prendre T = T ′ et de remplacer dans le membre de droite de (2.5) le terme (infini) correspondant à n = x par κ |ax |/(T + κ ). Supposons maintenant que σc < κ  σa . On a κ + 1 > σa d’après le Théorème 1.7. Considérons alors l’intégrale  xs I := F (s) ds s R où R est le rectangle formé par les droites σ = κ, τ = T , σ = κ + 1, τ = −T ′ . D’après le Théorème 1.19 on a

F (s)xs s−1 ≪ τ −(σ −σc )+ε xσ

(s ∈ R, |τ |  1)

donc la contribution à I des segments horizontaux de R tend vers 0 lorsque T et T ′ tendent vers l’infini. Comme F (s) est analytique pour σ > σc , le théorème des résidus montre que I = 0, d’où lorsque T , T ′ → +∞,  κ +1+iT  κ +iT ds s ds = + o(1). F (s)xs F (s)x s s κ +1−iT ′ κ −iT ′ Cela achève la démonstration du Théorème 2.1.

220

II.2. FORMULES DE SOMMATION

Démonstration du Lemme 2.2. Plaçons nous d’abord dans le cas x > 1. Soit k un entier assez grand et Rk le rectangle de sommets κ − iT ′ , κ + iT , κ − k + iT , κ − k − iT ′ . Par la formule des résidus, nous pouvons écrire  ds 1 = 1 = h(x). xs 2π i Rk s

Or, nous disposons des majorations   κ −k+iT ds  xκ  xs   ,  s T | ln x| κ +iT   κ −k−iT ′ xκ −k ds   (T xs    s k−κ κ −k+iT

  

κ −iT ′

xs

κ −k−iT ′

+ T ′ ).

ds  xκ ,  ′ s T | ln x|

On en déduit le résultat annoncé en faisant tendre k vers l’infini.

Le cas 0 < x < 1 est symétrique du précédent. On applique le même raisonnement en changeant k en −k . Nous omettons les détails.

Lorsque x = 1, on remarque simplement que l’on a  κ +iT 1 1  1 ds = arg(κ + iT ) − arg(κ − iT ) = arctan(T /κ ). 2π i κ −iT s 2π π La majoration souhaitée découle alors de l’encadrement suivant, valable pour tout y>0  ∞ π dt 2  . 0  − arctan y = 2 2 1 + t 1 + y y

⊓ ⊔

Cela achève la démonstration du lemme.

Dans la pratique, il est utile de disposer de versions effectives de la formule de Perron, c’est-à-dire de majorations explicites de la contribution du domaine |τ |  T à l’intégrale (2.3). Théorème 2.3 (Première formule de Perron effective). Pour κ > max(0,σa ), T  1, et x  1, on a     κ +iT 1 |an | ds + O xκ (2.6) A(x) = . F (s)xs 2π i κ −iT s nκ (1 + T | ln(x/n)|) n1

Démonstration. Il suffit de montrer que pour κ > 0 fixé on a uniformément en y > 0,T > 0  κ +iT   1 ds   y s  ≪ y κ / 1 + T | ln y| . (2.7) h(y) − 2π i κ −iT s En effet, en appliquant cette estimation avec y = x/n et en sommant pour n  1 (après multiplication par an ) on obtient exactement la formule annoncée. Lorsque T | ln y| > 1, la majoration (2.7) découle du Lemme 2.2(i). Dans la circonstance opposée, on peut écrire  κ +iT  κ +iT  κ +iT ds ds ds = yκ + yκ ys (y iτ − 1) · s s s κ −iT κ −iT κ −iT

2.1. FORMULES DE PERRON

221

La seconde intégrale est





T 0

|(τ ln y)/s| dτ  T | ln y|  1

de sorte que, grâce au Lemme 2.2(ii), l’on obtient que le membre de gauche de (2.7) est ≪ y κ . Cela termine la démonstration. ⊓ ⊔ Corollaire  2.4 (Seconde formule de Perron effective). Soit s F (s) := n1 an /n une série de Dirichlet d’abscisse de convergence absolue finie σa . On suppose qu’il existe un nombre réel α  0 tel que  (i) |an |n−σ ≪ (σ − σa )−α (σa < σ  σa + 1), n1

et l’on se donne une fonction B croissante au sens large telle que (ii)

|an |  B(n)

(n  1).

Alors on a pour x  2, T  2, σ  σa , κ := σa − σ + 1/ ln x,  κ +iT  an 1 dw = F (s + w)xw ns 2π i κ −iT w nx (2.8)

(ln x)α B(2x) ln T  + 1+x . + O xσa −σ σ T x T  Démonstration. Appliquons la formule (2.6) à la série bn /nw avec bn := an /ns . 1 La contribution des entiers n n’appartenant pas à [ 2 x,2x] est  ≪ xκ T −1 |an |n−κ −σ ≪ xσa −σ T −1(ln x)α . n1

1 x 2

 n  2x, on écrit n = N + h où N est l’entier le plus proche de x. Lorsque On a | ln(x/n)| ≫ |h|/x. Cela induit la contribution supplémentaire  |an | 1 B(2x)  ≪ x−σ 1 + T | ln(x/n)| xσ 1 + T h/x 0hx+1 x/2n2x     x B(2x)  ln T  B(2x) ≪ 1 + 1 + 1 + x ≪ . xσ Th xσ T 1hx/T

x/T max(0,σc ) et x  1, on a  κ +i∞  1 ds an ln(x/n) = (2.9) F (s)xs 2 , 2π i κ −i∞ s nx  κ +i∞  x ds 1 · (2.10) F (s)xs+1 A(t) dt = 2π i s(s + 1) κ −i∞ 0

222

II.2. FORMULES DE SOMMATION

Démonstration. Pour w  0 et x ∈ R+  N, la formule de Perron (2.3) implique  κ +i∞  ds 1 F (s)xs+w an n w = 2π i κ −i∞ s+w nx

lorsque κ > max(0,σc ). D’où (2.11)



nx

1 an (x − n ) = 2π i w

w



κ +i∞

F (s)xs+w

κ −i∞

w ds s(s + w)

et il est clair que cette formule est encore valable lorsque x est entier. D’après le Théorème 1.19, on a pour σ = κ

F (s) ≪ 1 + |τ |1−(κ −σc )+ε ,

(2.12)

de sorte que l’intégrale est absolument et uniformément convergente, ainsi que sa dérivée relativement à w. Les hypothèses de dérivation sous le signe somme sont donc satisfaites et (2.9) est obtenue en prenant les dérivées en w = 0 des deux membres de (2.11). La formule (2.10) correspond au cas w = 1 de (2.11), dont le membre de gauche vaut alors  x A(t) dt. 0

⊓ ⊔ La formule (2.7) peut parfois être avantageusement remplacée par une formule plus précise au prix d’une altération de l’intégrande. On a par exemple le résultat suivant. Lemme 2.6. Pour tout δ > 0, il existe des constantes complexes a = a(δ ) et b = b(δ ) telles que, posant

wδ (s) :=

1 a b + + s s+1 s+2

(y > 0), (s ∈ C), gδ (y) := h(y) 1+a/y+b/y 2

on ait, uniformément pour y > 0, κ > 0,  κ +iδ 

1 yκ κ (2.13) wδ (s)y s ds = gδ (y) + O + κ y . 2π i κ −iδ 1 + (ln y)2 Démonstration. On observe d’abord que (2.7) implique  κ +iδ 1 wδ (s)y s ds = g(y) + O(y κ ) 2π i κ −iδ

lorsque | ln y|  1. Ensuite, une intégration par parties, fournit, lorsque | ln y| > 1,  κ +iδ  κ +iδ ys wδ (s)y s ds = − wδ′ (s) ds ln y κ −iδ κ −iδ (2.14) 

yκ {|wδ (κ + iδ )| + |wδ (κ − iδ )|} . +O | ln y|

D’après le théorème des accroissements finis, le terme d’erreur de (2.14) est O(κ y κ /| ln y|) si a et b sont choisis tels que w(±iδ ) = 0. Maintenant on a, d’après

2.1. FORMULES DE PERRON

223

le théorème des résidus, toujours pour | ln y| > 1,  κ +iδ

yκ  1 ys ds = g(y) + O wδ′ (s) − 2π i κ −iδ ln y (ln y)2

en repoussant la droite d’intégration vers la gauche ou vers la droite à l’infini, selon que y > e ou y < e. ⊓ ⊔ On déduit de ce lemme une nouvelle variante de la formule de Perron.

 Théorème 2.7. Soit F (s) := n1 an /ns une série de Dirichlet convergente pour σ > 1 et dont les coefficients satisfont à une majoration du type  (2.15) |an | ≪ xb(x) (x  2) nx

où b est décroissante au sens large. Alors on a, pour κ = κx := 1/ ln x,  κx +iδ  an  1 = F (s + 1)wδ (s)xs ds + O b∗ (x) (x  2), (2.16) n 2π i κx −iδ nx

où l’on a posé

b∗ (x) := κx





1

b(t) dt. t1+κx

Démonstration. Nous observons d’emblée que  √x √ √ b(t) dt  2 e b∗ (x). (2.17) b(x)  b x  2κx t 1  D’après le Lemme 2.6, le terme d’erreur de (2.16) est ≪ 1j4 |Rj | avec  Rj := x−j an nj−1 (j = 1,2) nx

R3 :=



n1

R4 :=

|an | n1+κ {1 + (ln x/n)2 }

1  |an | . ln x n 1 +κ n1

On a trivialement R2 ≪ R1 ≪ b(x) et R4 ≪ b∗ (x) par sommation d’Abel. Pour estimer R3 , on remarque d’abord, grâce à (2.17), que l’on a, uniformément pour √ x  2 et k ∈ Z, 1/x  2k  x,  |an | b∗ (x) ≪ (2.18) n{1 + (ln x/n)2 } 1 + k2 k+1 k x/2

σ0 un prolongement analytique holomorphe satisfaisant à μ(σ ) = 0, alors on a σc  σ0 . Démonstration. On peut, sans perte de généralité, fixer arbitrairement la valeur de σ0 . Nous supposons σ0 < 0 et montrons que F (s) est convergente en s = 0. Soit δ un nombre réel satisfaisant à 0 < δ < −σ0 . Nous appliquons le Théorème 2.3 avec κ > σa + 1 fixé, et x ∈ 21 + N. Pour chaque entier n on a  | ln(x/n)|  ln (n + 12 )/n ≫ 1/n, de sorte que le terme reste de (2.6) est

≪ xκ



n1

|an | xκ  xκ ≪ · |an |n1−κ ≪ + T /n) T T

nκ (1

n1

Ensuite, nous déformons le contour d’intégration [κ − iT ,κ + iT ] en une ligne brisée passant par les points −δ − iT , − δ + iT . Ce faisant, nous avons modifié la valeur de l’intégrale de la valeur du résidu au pôle s = 0, c’est-à-dire F (0). Nous pouvons donc écrire  (2.19) an = F (0) + R1 + R2 + O(xκ /T ) nx

où R1 et R2 représentent respectivement les contributions à l’intégrale  1 ds F (s)xs 2π i s

des segments horizontaux et du segment vertical du nouveau contour. Puisque par hypothèse μ(σ ) = 0 pour σ  −δ, il vient immédiatement pour tout ε > 0

R1 ≪ε xκ T ε−1,

R2 ≪ε x−δ T ε .

(Il est à noter que l’on a utilisé ici le fait que la majoration F (s) ≪ T ε (|τ |  T ) est uniforme pour −δ  σ  κ — cf. la remarque suivant la preuve du Théorème 1.20.) En reportant dans (2.19 ) et en choisissant T := xκ +δ , ε := δ /2(κ +δ ), on obtient la convergence de la série an sous la forme “explicite”  an = F (0) + O(x−δ/2 ). nx

⊓ ⊔ Cela achève la démonstration. Semblablement, nous pouvons utiliser le Théorème 2.7 pour établir le théorème suivant, dû à Riesz (1909).

2.3. FORMULE DE LA VALEUR MOYENNE

225

 Théorème 2.9. Soit F (s) := n1 an /ns une série de Dirichlet convergente pour σ > 1, possédant un prolongement analytique holomorphe dans un voisinage de s = 1 et telle que  (2.20) A(x) := an = o(x) (x → ∞). nx

Alors F (s) est convergente en s = 1. Démonstration. Nous commençons par observer que, si limn→∞ an = 0, alors on a d’après (2.16)  κ +iδ  an 1 = F (s + 1)wδ (s)xs ds + o(1). n 2π i κ −iδ nx

Le résultat souhaité découle alors du théorème des résidus en choisissant δ assez petit pour que le carré de sommets ±δ ± iδ soit dans le domaine d’holomorphie de F (1 + s) et en déplaçant, pour x assez grand, l’abscisse d’intégration jusqu’à −δ. En effet, les intégrales sur les segments horizontaux sont ≪ 1/ ln x et celle portant sur le segment déplacé est ≪ 1/xδ .  Pour traiter le cas général, on introduit la série G(s) := n1 An /ns+1 avec An := A(n). Par sommation d’Abel, nous obtenons, pour tous N ∈ N∗ , s ∈ C,  An   an AN −s = (2.21) An ϕn (s) + s s+ 1 n n (N + 1)s 1nN

1nN

1nN

où l’on a posé ϕn (s) := n−s − (n + 1)−s − sn−s−1 (s ∈ C). De plus, d’après le théorème des accroissements finis,

|ϕn (s)|  |s(s + 1)|n−σ −2

(σ > 0).

Cela implique que F (s) − sG(s) possède un prolongement analytique holomorphe dans le demi-plan σ > 0 et donc que G(s) est prolongeable holomorphiquement au voisinage de s = 1. En appliquant à  G le résultat de la première partie de cette démonstration, on obtient que la série n1 An /n2 est convergente et a pour somme G(1). En utilisant (2.21) avec s = 1 et (2.20), on obtient bien que la  série n1 an /n converge et a pour somme F (1). ⊓ ⊔

2.3. Formule de la valeur moyenne Le résultat suivant est l’analogue, pour les séries de Dirichlet, du théorème de Parseval concernant les séries trigonométriques.   s s Théorème 2.10. Soient F (s) := n1 an /n et G(s) := n1 bn /n deux séries de Dirichlet d’abscisses de convergence absolue respectives σ1 et σ2 . Pour α > σ1 , β > σ2 , on a  T  an b n 1 F (α + iτ ) G(β − iτ ) dτ = · (2.22) lim T →∞ 2T −T n α +β n1

226

II.2. FORMULES DE SOMMATION

Démonstration. On a

F (α + iτ ) G(β − iτ ) =

 am b n  an b n + (n/m)iτ , α + β n mα n β

n1

m=n

les séries convergeant absolument et uniformément en τ . Nous pouvons donc intégrer terme à terme. Il vient  T  am bn  sin(T ln(n/m))   an b n 1 + F (α + iτ ) G(β − iτ ) dτ = . 2T −T n α +β mα n β T ln(n/m) n1

m=n

Le facteur impliquant T est borné uniformément par rapport à T ,m,n et tend vers 0 lorsque T → ∞. Le résultat annoncé découle donc du théorème de la convergence dominée. ⊓ ⊔ Corollaire 2.11. Pour σ > σa , on a  T  |an |2 1 (2.23) lim |F (s)|2 dτ = · T →∞ 2T −T n2σ n1

Corollaire 2.12. Pour σ > σa , on a  T 1 (2.24) lim F (s)ns dτ = an . T →∞ 2T −T Les formules (2.23) et (2.24) fournissent donc deux nouvelles démonstrations du théorème d’unicité de la représentation d’une fonction sous forme de série de Dirichlet (Théorème 1.8). La question du domaine de validité de la relation (2.23) est en général assez difficile. On peut montrer (cf. Titchmarsh (1939), § 9.5) que l’ensemble des points s où F (s) est holomorphe, d’ordre fini, et satisfait (2.23) est un demi-plan limité par une droite verticale σ = σm , avec  σm  max σc ,σa − 12 . Il est cependant possible que, même si F (s) n’est pas holomorphe pour σ  σ0 , le membre de gauche de (2.23) converge pour σ = σ0 . Titchmarsh (1951, § 7.2) montre dans le cas de la fonction zêta que l’on a  1 T |ζ (s)|2 dτ = ζ (2σ ) (σ > 21 ) (2.25) lim T →∞ T 1

de sorte que (2.23) a lieu, lorsque F = ζ , pour tout σ > 12 , σ = 1.

N OTES § 2.1. L’idée du Lemme 2.6 remonte à Landau (1910), qui prouve ainsi le Théorème 2.9. Elle permet d’affiner l’emploi de la formule de Perron lorsque l’intégrale est prise sur un segment vertical court, ce qui peut s’avérer essentiel. Une variante d’un lemme de Tenenbaum & Wu (2003) peut être énoncée comme suit. Lemme 2.13. Pour tout nombre réel T > 0 fixé, il existe des constantes réelles bj (1  j  5) telles que, posant   bj  bj  1 (x > 0), , gT (x) := h(x) 1 + wT (s) := + s s+j xj 1j5

1j5

on ait d’une part (2.26)



bj /j = 0

1j5

et d’autre part, uniformément pour x > 0, κ > 0,    κ +iT 1 κ 2 xκ xκ (2.27) + . wT (s)xs ds = gT (x) + O 2π i κ −iT 1 + (ln x)2 1 + | ln x| § 2.2. Le théorème de s’énonce ainsi : Si an ≪ε nε pour tout Schnee–Landau (1) s ε > 0 et si F (s) = n1 an /n possède, pour un certain σ0 , un prolongement holomorphe pour σ > σ0 satisfaisant à μ(σ )  α dans ce demi-plan alors   σ0 + α , σ0 + α . σc  min 1+α Pour une démonstration, voir Landau (1909) pp. 853 et suiv. α = 0, le théorème de Schnee–Landau implique la convergence de  Lorsque −s−κ a n pour κ > σa , σ > σ0 − κ. La condition an ≪ε nε est donc superflue, n1 n et l’on obtient le Théorème 2.8. Le Théorème 2.8 est établi dans Landau (1909), p. 848. Une autre démonstration figure dans Hardy & Riesz (1915), th. 50. Voir aussi Titchmarsh (1951), th. 3.13. § 2.3. Carlson (1922) a montré que, si F (s) est holomorphe et d’ordre fini pour

T σ  σ1 et si −T |F (s)|2 dτ ≪ T pour σ = σ1 , alors la formule (2.23) a lieu pour σ > σ1 . Voir par exemple Titchmarsh (1939), § 9.51. 1

De sorte que σa  1.

E XERCICES

169. Montrer que pour κ > max(0,σc ), on a  κ +i∞  x k ds k! an ln = F (s)xs k+1 n 2π i κ −i∞ s nx

où k  1 est un nombre entier arbitraire. 170. Soit w ∈ L1 (R) une fonction dont la transformée de Fourier

+∞ w( ( τ ) := −∞ e−itτ w(t) dt est elle-même intégrable sur R. Montrer que l’on a pour κ > σa  κ +i∞  x κ x  1 = an w ln F (s)xs w( ( τ ) ds. n n 2π i κ −i∞ n1

171. En appliquant à la fonction w(t) := {sin(t/2ε)}2 /{t/2ε}2 , la conclusion de l’Exercice 170, montrer que, si an  0, on a pour tout ε > 0  κ +iT  an  C εeκε |F (s)xs | | ds| (κ > σa ) κ −iT

| ln(x/n)|ε

avec C = 1/{2 sin 12 }2 , et T = 1/ε.

 172. Soit F (s) := an /ns une série de Dirichlet telle que limτ →∞ F (σ + iτ ) existe pour au moins une valeur de σ > σa . On désigne par λ cette limite.  (a) Montrer que |λ|2 = n1 |an |2 /n2σ . (b) Montrer que λ = a1 . [On pourra utiliser le Corollaire 2.12.] (c) En déduire que F (s) est constante. 

s

une série de Dirichlet convergente pour σ = ℜe s > 1. On suppose que F possède un prolongement analytique F# dans un voisinage de s = 1. # (a) Est-il vrai que l’on a nécessairement  F (1) = limσ →1+ F (σ ) ? (b) On suppose de plus que l’on a mn am = o(n) (n → ∞). Montrer que la  série an /n converge et a pour somme F# (1).

173. Soit F (s) =

n1

n1 an /n

EXERCICES

229

(c) Soient σ ∈] 1,∞[ et N ∈ N∗ . σ (i) Évaluer 1nN 1/n en appliquant la formule d’Euler–Maclaurin à l’ordre 0.  σ (ii) En déduire une expression de ζ (σ ) = n1 1/n pour σ > 1 et une  évaluation de 1nN 1/n. On fera intervenir, dans le second cas, la constante d’Euler γ . (d) Montrer que ζ (s) se prolonge méromorphiquement à un voisinage de s = 1 et donner son développement de Laurent à l’ordre 1 en s = 1. Même question pour ζ ′ (s). (e) Déduire du théorème des nombres premiers sous la forme de Tchébychev ψ (x) ∼ x (x → ∞) et du résultat établi en (b) l’existence et la valeur de    (n) − ln x K := lim x→∞ n nx

où  désigne la fonction de von Mangoldt. On pourra considérer la série de Dirichlet ζ (s) + ζ ′ (s)/ζ (s).

C HAPITRE

II.3 LA

FONCTION ZÊTA DE R IEMANN

3.1. Introduction La fonction zêta, qui permet d’exprimer de nombreuses séries de Dirichlet, joue un rôle central en arithmétique, notamment à cause de sa corrélation avec les nombres premiers, attestée par la formule d’Euler — cf. § 1.2. En liaison avec les formules de Perron établies au Chapitre 2, l’étude analytique de la fonction zêta s’avère donc d’un intérêt capital. D’une manière générale, l’évaluation d’une intégrale du type  T F (s)xs s−1 dτ , −T

où F est définie par une série de Dirichlet, peut être grandement facilitée, ainsi que nous l’avons vu au § 2.2, par l’introduction d’un contour fermé et l’emploi du théorème des résidus. Comme F (s) n’a pas de singularité dans le demi-plan σ > σc (cf. Théorème 1.5), il est naturel de chercher à appliquer préférentiellement cette méthode lorsque l’on peut choisir un contour fermé débordant dans le demi-plan complémentaire σ  σc . Cela nécessite l’existence d’un prolongement analytique de F (s). Nous verrons que cette condition est remplie dans le cas de ζ (s) — et par conséquent pour toutes les séries qu’elle permet d’exprimer. Dans cette perspective, l’étude des propriétés analytiques de ζ (s) (identifiée comme il se doit à son prolongement) constitue pour l’arithméticien un indispensable investissement. Nous nous proposons dans ce chapitre d’établir les principaux résultats à la base de la théorie — et nous invitons d’ores et déjà le lecteur intéressé par des développements plus complets ou plus sophistiqués à

3.2. PROLONGEMENT ANALYTIQUE

231

consulter les ouvrages classiques de Titchmarsh (1951), complémenté par HeathBrown (1986), d’Edwards, dont l’approche historique est lumineuse, ou d’Ivi´c (1985), qui constitue une véritable somme sur le sujet.

3.2. Prolongement analytique Théorème 3.1. La fonction ζ (s) est prolongeable analytiquement en une fonction méromorphe sur C ayant pour seule singularité un pôle simple, en s = 1, de résidu 1. Démonstration. Pour σ > 1, on a   (−1)n  1  1  1 = (21−s − 1)ζ (s). G(s) := = − − ns (2m)s ns (2m)s n1

n1

m1

m1

Or G(s) est convergente pour σ > 0, et l’on a  G(1) = − ln 2 = 0, G(sk ) = 0 sk := 1 + 2π ik/ ln 2, k = 0 . La seconde formule découle de l’estimation  1  1  (−1)n = 21−sk − =− s s k k n n nsk nx

nx/2

nx



x/2 0. Le même résultat provient d’ailleurs de la formule d’intégration par parties  ∞  ∞  ∞  ∞ d ⌊t⌋ dt d t

s dt ζ (s) = = − = − s t s+1 , s s s t t t s−1 t 1− 1 1− 1 initialement valide pour σ > 1, et qui permet d’expliciter différemment le prolongement pour σ > 0. On pourrait obtenir le résultat annoncé par intégrations successives à partir de l’une ou l’autre des formules précédentes — en utilisant par exemple, dans le second cas, la formule d’Euler–Maclaurin, cf. Exercice 183. Nous utilisons une autre méthode, due à Riemann, et qui fournit un renseignement supplémentaire utile pour établir l’équation fonctionnelle. Le point de départ est la formule  ∞ −s (3.1) Ŵ (s)n = ts−1 e−nt dt (σ > 0). 0

En sommant pour n  1, il vient pour σ > 1   ∞ ts−1 e−nt dt = Ŵ (s)ζ (s) = n1

0

0



ts−1 dt. et − 1

Nous obtenons un prolongement analytique de cette intégrale en remplaçant la demi-droite d’intégration par le contour de Hankel C̺ où ̺ est un paramètre réel, 0 < ̺ < 2π . 1

Voir, par exemple, (3.18) infra.

232

II.3. LA FONCTION ZÊTA DE RIEMANN

Cr

0

r

Le contour de Hankel C̺ .

C̺ est constitué de la demi-droite réelle [̺, + ∞[ parcourue de droite à gauche avec argument 0 + , du cercle |z| = ̺, privé du point z = ̺, parcouru dans le sens trigonométrique, et de la demi-droite [̺, + ∞[ parcourue, avec argument 2π − , de gauche à droite. Comme la fonction z → z s−1 (ez − 1)−1 est holomorphe dans la bande horizontale |ℑm z| < 2π privée de la demi-droite [0, + ∞[, l’intégrale  dz z s−1 z I(s) := e −1 C̺ est indépendante de ̺ dans ]0,2π [. Elle est absolument convergente pour chaque s ∈ C et uniformément convergente sur tout compact. C’est donc une fonction entière de s. On a   ∞ dt s−1 dz 2π is . z (3.2) I(s) = + (e − 1) ts−1 t z −1 e e −1 |z|=̺ ̺ Compte tenu de la majoration

|z s−1 /(ez − 1)| ≪s ̺ σ −2

(|z| = ̺  π ),

on obtient, en faisant tendre ̺ vers 0, la formule

I(s) = (e2π is − 1)Ŵ (s)ζ (s)

(σ > 1).

La formule des compléments Ŵ (s)Ŵ (1 − s) = π / sin(π s) implique donc

e−iπ s Ŵ (1 − s)I(s). 2π i Cette formule, initialement valide pour σ > 1, fournit explicitement le prolongement analytique de ζ (s) dans le plan complexe tout entier. Lorsque σ  0, le facteur Ŵ (1 − s) est holomorphe, donc ζ (s) n’a pas d’autre singularité que celle qui a déjà été mise en évidence en s = 1. Cela termine la démonstration. ⊓ ⊔ (3.3)

ζ (s) =

La formule (3.2) fournit immédiatement la valeur de ζ (s) aux entiers négatifs. Théorème 3.2. Notant Bn le n-ième nombre de Bernoulli, on a (3.4)

ζ (−n) = (−1)n

Bn+1 n+1

En particulier ζ (−2n) = 0 pour tout n  1.

(n  0).

3.3. ÉQUATION FONCTIONNELLE

233

Démonstration. Les nombres de Bernoulli ont été définis au Chapitre I.0 par le développement de Laurent

(ez − 1)−1 =

∞  1 Bm z m−1 . m!

m=0

On a donc par (3.2)



I(−n) =

|z|=̺

(ez − 1)−1 z −n−1 dz = 2π i

Bn+1 . (n + 1)! ⊓ ⊔

On obtient la formule annoncée en reportant dans (3.3).

3.3. Équation fonctionnelle Théorème 3.3. Pour tout s = 1, on a  (3.5) ζ (s) = 2s π s−1 sin 21 π s Ŵ (1 − s)ζ (1 − s).

Remarque. L’équation fonctionnelle prend la forme plus symétrique (s) = (1 − s)

(3.6)

(s = 0,1)

si l’on pose (s) := π −s/2 Ŵ (s/2)ζ (s).

(3.7)

Cela découle immédiatement de (3.5), de la formule des compléments, et de la formule de duplication (0.10) pour la fonction Ŵ. Démonstration. Soient k  1 et Hk le contour de Hankel de paramètre ̺k := (2k + 1)π . Alors |ez − 1|−1 reste borné lorsque z parcourt Hk , et l’on a     z s−1 (ez − 1)−1 dz  ≪s k σ . (3.8)  Hk

Soit ̺ tel que 0 < ̺ < 2π . Le contour C̺ − Hk entoure, dans le sens inverse, les pôles z = 2nπ i (n = ±1, ± 2, . . . , ± k). Le théorème des résidus implique donc    s−1 z −1 (2nπ i)s−1 z s−1 (ez − 1)−1 dz − 2π i I(s) = z (e − 1) dz = C̺

=



Hk

Hk

z s−1 (ez − 1)−1 dz − (2π i)s (1 − eiπ s )

1|n|k



ns−1 .

1nk

Compte tenu de (3.8), on obtient pour chaque s du demi-plan σ < 0, en faisant tendre k vers l’infini,

I(s) = (2π i)s (eiπ s − 1)ζ (1 − s). En reportant dans (3.3), cela fournit l’équation (3.5) lorsque σ < 0. Par prolongement analytique, elle est donc valide pour tout s.

234

II.3. LA FONCTION ZÊTA DE RIEMANN

Une conséquence immédiate des relations (3.4) et (3.5) est la formule suivante pour ζ (2n), que l’on peut obtenir aussi comme un cas particulier du développement en série de Fourier des fonctions de Bernoulli — cf. Exercice 1, p. 24. Théorème 3.4. On a (3.9)

ζ (2n) = (−1)n−1 22n−1

B2 n 2 n π (2n)!

(n  1).

3.4. Approximations et majorations dans la bande critique Posons (3.10)

χ (s) := 2(2π )s−1 Ŵ (1 − s) sin

de sorte que l’équation fonctionnelle (3.5) s’écrit

1 2

πs ,

ζ (s) = χ (s)ζ (1 − s).

(3.11)

Le comportement asymptotique de χ (s) lorsque σ est fixé et |τ | → ∞ peut être facilement déterminé en fonction de celui de Ŵ (s) — cf. le Corollaire 0.13, obtenu comme corollaire de la formule de Stirling complexe énoncée au Théorème 0.12. Nous obtenons   21 −σ |τ | (|τ | → +∞). (3.12) |χ (s)| ∼ 2π Ainsi, il découle de (3.11) que l’ordre de grandeur de ζ (s) sur les droites verticales est complètement déterminé lorsque σ < 0. Reprenant les notations du § 1.6, on a en particulier, pour la fonction zêta, 1 −σ (σ  0) . (3.13) μ(σ ) = 2 0 (σ  1) La valeur exacte de μ(σ ) dans la bande critique 0 < σ < 1 est un problème profond encore non résolu à l’heure actuelle. L’hypothèse la plus simple consiste à supposer que le graphe de μ(σ ) est composé de deux demi-droites, soit (3.14)

μ(σ ) = max( 21 − σ ,0).

Cette formule est connue sous le nom d’hypothèse de Lindelöf. Compte-tenu des propriétés de convexité de μ(σ ) (cf. Théorème 1.20), elle équivaut à μ( 21 ) = 0. Les relations μ(0) = 12 , μ(1) = 0 impliquent immédiatement par convexité l’inégalité μ(σ )  21 (1 − σ ) pour 0  σ  1. Le résultat suivant nous permettra d’améliorer cette estimation. Théorème 3.5. Soient σ0 > 0, 0 < δ < 1. On a uniformément pour σ  σ0 , x  1, 0 < |τ |  (1 − δ )2π x, (3.15)

ζ (s) =

 1  x1−s + O x−σ . − s n 1−s

nx

3.4. APPROXIMATIONS ET MAJORATIONS DANS LA BANDE CRITIQUE

235

La démonstration repose sur un lemme facile. Lemme 3.6. Pour σ > 0 et N ∈ Z+ , on a ζ (s) =

(3.16)

 ∞  1 t

N 1−s − s − dt. s s+1 n 1−s N t

nN

Démonstration. Pour σ > 1, on a  ∞  ∞  1 d ⌊t⌋ d t

N 1−s − ζ (s) − = = − s s n t 1−s ts N N nN (3.17)  ∞ t

N 1−s −s dt. =− s+1 1−s t N

Cette formule est encore valable pour σ > 0, par prolongement analytique. ⊓ ⊔ Démonstration du Théorème 3.5. Lorsque |τ |  (1 − δ )2π x, on a pour tout y  x  y  −iτ t−iτ dt + O(1) (3.18) n = x 1).

Démonstration. Il suffit d’appliquer le théorème à la fonction   (n) F (s) = log ζ (s) = − log(1 − p−s ) = ns ln n p n2

qui est convergente pour σ > 1. ⊓ ⊔ Nous sommes maintenant en mesure de prouver l’important résultat suivant. Théorème 3.13. La fonction ζ (s) ne possède aucun zéro dans le demiplan σ  1. Démonstration. Raisonnons par l’absurde et supposons que ζ (1 + iτ0 ) = 0. Alors τ0 = 0 et ζ (s) est holomorphe au voisinage de 1 + iτ0 . D’où ζ (σ + iτ0 ) ≪ σ − 1

(σ > 1).

238

II.3. LA FONCTION ZÊTA DE RIEMANN

Comme d’autre part ζ (σ ) ≪ 1/(σ − 1),

ζ (σ + 2iτ0 ) ≪ 1

(σ > 1)

(puisque s = 1 est un pôle simple et que ζ (s) est holomorphe partout sauf en s = 1), il suit ζ (σ )3 |ζ (σ + iτ0 )|4 |ζ (σ + 2iτ0 )| ≪ σ − 1

(σ > 1)

ce qui contredit (3.25) lorsque σ → 1+. ⊓ ⊔ Le Théorème 3.13 et l’équation fonctionnelle (3.5) impliquent à l’évidence le corollaire suivant. Corollaire 3.14. Dans le demi-plan σ  0, la fonction ζ (s) admet pour seuls zéros les points −2n (n = 1,2, . . .). Ce sont des zéros simples. Les zéros aux entiers négatifs pairs sont appelés les zéros triviaux de la fonction ζ . Nous verrons au § 3.7 que ζ (s) possède d’autres zéros, dans la bande critique 0 < σ < 1. L’égalité  (−1)n = (21−σ − 1)ζ (σ ) (0 < σ < 1) nσ n1

montre que ces zéros non triviaux ne sont pas réels. L’équation fonctionnelle et le fait que ζ (s) est réelle pour s réel impliquent qu’ils sont répartis symétriquement par rapport à la droite σ = 12 et à l’axe réel τ = 0. Une autre démonstration, particulièrement élégante, du Théorème 3.13 est due à Ingham (1930). Elle repose sur l’identité de Ramanujan (3.26)

 |τ (n,ϑ )|2 ζ (s)2 ζ (s + iϑ )ζ (s − iϑ ) = ζ (2s) ns n1

valable pour σ > 1, ϑ ∈ R, avec (3.27)

τ (n,ϑ ) :=



diϑ .

d|n

On vérifie facilement (3.26) en identifiant les facteurs des produits eulériens des deux membres — cf. aussi les Notes. Considérons l’abscisse de convergence σc de (3.26). On a σc  1 puisque |τ (n,ϑ )|  τ (n). D’après le Théorème 1.5, la somme de la série est holomorphe pour σ > σc . Comme les coefficients sont positifs ou nuls, le point s = σc est une singularité. Or, si s = 1 + iϑ est un zéro de ζ (s), il en va de même de 1 − iϑ (car ζ (¯ s) = ζ (s)) et ces deux zéros compensent le pôle double de ζ (s)2 en s = 1. Mais, puisque ζ (s) n’a pas d’autre singularité que s = 1, il découle de ce qui précède que (3.26) est holomorphe sur l’axe réel jusqu’au premier zéro de ζ (2s), c’est-à-dire s = −1. On aurait donc σc = −1, ce qui est absurde puisque |τ (n,ϑ )| ne tend pas vers 0.

3.6. Lemmes d’analyse complexe Les résultats classiques suivants nous seront utiles au cours de nos investigations ultérieures concernant la fonction zêta.

3.6. LEMMES D’ANALYSE COMPLEXE

239

Théorème 3.15 (Formule de Jensen). Soit F (s) une fonction holomorphe pour |s|  R, telle que F (0) = 1. Pour 0 < r  R, on désigne par n(r) le nombre des zéros (comptés avec multiplicité) de F dans le disque |s|  r. Alors on a  2π  R 1 n(r) dr = ln |F (Reiϑ )| dϑ. (3.28) r 2π 0 0 Démonstration. Si F (s) est non nulle pour |s| = r, on a   2π ′ iϑ 1 F (re ) iϑ 1 F ′ (s) ds = re dϑ. (3.29) n(r) = 2π i |s|=r F (s) 2π 0 F (reiϑ ) Formellement, l’égalité (3.28) s’obtient donc en divisant par r, en intégrant sur [0,R], et en égalant les parties réelles des deux membres. Il reste à montrer que les valeurs critiques de r correspondant aux modules des zéros n’introduisent pas de perturbation dans ce processus. Désignons par 0 < r1 < r2 < · · · < rk  R la suite finie de ces modules exceptionnels. Posons r0 := 0, rk+1 := R. On peut intégrer (3.29) sur tout intervalle ' & (j = 0, . . . ,k), (1 + ε)rj ,(1 − ε)rj+1

et sommer les égalités ainsi obtenues. Pour établir (3.28), il suffit donc de montrer que l’on peut sans dommage faire tendre ε vers 0, autrement dit que l’on a pour chaque j  1   2π   iϑ   F (1 + ε)rj e  ln  (3.30) lim  dϑ = 0. ε →0 0  F (1 − ε)rj eiϑ 

Comme F n’a qu’un nombre fini de zéros sur le cercle |s| = rj , il est clair que l’on peut sans perte de généralité considérer le cas où s = rj est le seul zéro de F (s) sur ce cercle, disons de multiplicité m  1. Alors     r ln |F (reiϑ )| = m ln 1 − eiϑ  + H(r,ϑ ) rj pour |r − rj |  εrj , 0  ϑ  2π , où H(r,ϑ ) est une fonction continue de r et ϑ. La relation (3.30) équivaut donc à   π   1 − (1 + ε)eiϑ   dϑ = 0.  (3.31) lim ln  ε →0 −π 1 − (1 − ε)eiϑ 

On a

  2 1 2  1 − (1 + ε)eiϑ 2   = ε + 4(1 + ε) sin 2 ϑ = 1 + O(ε)  1 − (1 − ε)eiϑ  ε2 + 4(1 − ε) sin2 21 ϑ

de sorte que l’intégrande de (3.31) est O(ε) uniformément pour |ϑ |  π . Cela implique bien (3.31). ⊓ ⊔

240

II.3. LA FONCTION ZÊTA DE RIEMANN

Théorème 3.16 (Lemme de la partie réelle, Borel–Carathéodory). Soit F (s) une fonction holomorphe pour |s|  R, telle que F (0) = 0. On suppose que max|s|=R ℜe F (s)  A. Alors on a   2AR k!  (k)  (3.32) (k  0, |s| < R). F (s)  (R − |s|)k+1 Démonstration. Considérons la série de Taylor de F en s = 0,  F (s) = an sn (|s|  R). n1

Si ϑn désigne, pour chaque n, l’argument de an , on peut écrire  ℜe F (Reiϑ ) = |an |Rn cos(nϑ + ϑn ), n1

la série étant absolument et uniformément convergente pour 0  ϑ  2π . Or l’holomorphie de F implique que la fonction ℜe F (s) possède la propriété de moyenne, soit  2π ℜe F (Reiϑ ) dϑ = 0. 0

Pour chaque entier n  1, il suit donc  2π  1 + cos(nϑ + ϑn ) ℜe F (Reiϑ ) dϑ  2π A. π |an |Rn = 0

  n On obtient (3.32) en multipliant par (|s|/R)n et en sommant pour n  1. ⊓ ⊔ k Une autre conséquence utile du Théorème 3.16 réside dans l’énoncé suivant. Corollaire 3.17. Soit F (s) une fonction holomorphe dans le disque |s|  R, telle que F (0) = 1, et |F (s)|  M (|s| = R). On désigne par Z la suite finie des zéros ̺ de F , comptés avec leur ordre de multiplicité, dans le disque |s|  12 R. Pour tout nombre s tel que |s| < 12 R, on a    ′   F (s)  1     16R ln M . (3.33)  F (s) − s − ̺  (R − 2|s|)2  ̺∈Z

! Démonstration. Soit G(s) := F (s) ̺∈Z (1 − s/̺ )−1 . On a |G(s)|  M pour |s| = R car chaque facteur du produit en ̺ est de module au plus 1. La fonction H(s) := log G(s) satisfait les hypothèses du Théorème 3.16 avec A = ln M dans le disque |s|  21 R. Le résultat annoncé découle donc de (3.32) avec k = 1. ⊓ ⊔

3.7. RÉPARTITION GLOBALE DES ZÉROS

241

3.7. Répartition globale des zéros Nous développerons à la section suivante, dans le cas particulier de la fonction zêta, la méthode générale de factorisation de Hadamard pour les fonctions entières d’ordre fini. Nous allons ici établir des résultats préliminaires. La fonction (s − 1)ζ (s) est entière, mais il est plus agréable de considérer  (3.34) ξ (s) := s(s − 1)π −s/2 Ŵ 12 s ζ (s) = s(s − 1) (s) qui satisfait en outre l’équation fonctionnelle ξ (s) = ξ (1 − s)

(3.35)

1 2

(s ∈ C).

La régularité de ξ pour σ  découle de celle de ζ , compte tenu du fait que le pôle en s = 1 est compensé par le facteur (s − 1). Par (3.35), ξ (s) est donc holomorphe dans tout le plan complexe. On a ξ (0) = ξ (1) = 1. D’après le Théorème 3.13, ξ (s) = 0 pour σ  1. Par (3.35), il s’ensuit que ξ (s) ne s’annule pas non plus pour σ  0. Donc tous les zéros de ξ (s) sont dans la bande critique 0 < σ < 1. Dans cette bande, ξ (s) et ζ (s) ont les mêmes zéros. Il n’en va pas de même dans le demi-plan  σ  0, puisque les zéros triviaux de ζ (s) y sont compensés par les pôles de Ŵ 12 s . On note traditionnellement ̺ = β + iγ un zéro générique de ξ (i.e. un zéro non trivial de ζ ), et l’on pose  N (T ) := 1. ̺ : 0γ T

Ici et dans toute la suite, nous adoptons la convention de compter chaque zéro ̺ avec son ordre de multiplicité. Nous nous proposons dans cette section d’établir une formule asymptotique pour N (T ) lorsque T → +∞. Dans cette perspective, il est évidemment utile de connaître l’ordre de croissance de ξ (s). On a par le Théorème 3.8 ζ (s) ≪ τ

(3.36)

(σ  0, |τ |  1).

De plus, en intégrant par parties le dernier terme de la formule de Stirling complexe (0.11), on obtient  ∞ 1 B2 (t) 1 1 1 −2 dt (3.37) log Ŵ (s) = (s − 2 ) log s − s + 2 ln(2π ) + 12s (t + s)2 0 2

où B2 (t) = t − t + (3.38)

1 6

désigne la seconde fonction de Bernoulli. Cela implique

ln |ξ (s)| ≪ |s| ln |s|

(|s| → ∞)

lorsque σ  12 , et donc dans tout le plan, grâce à (3.35). Nous utiliserons une majoration analogue pour prouver le résultat crucial suivant. Théorème 3.18. Pour T  2, on a (3.39)

N (T + 1) − N (T ) ≪ ln T .

242

II.3. LA FONCTION ZÊTA DE RIEMANN

Démonstration. Appliquons la formule de Jensen (3.28) à la fonction F (s) := ξ (s + 2 + iT )/ξ (2 + iT ) avec R = 3. √ D’une part, pour tout r, 5  r  3, le disque |s|  r contient le rectangle de sommets −2, − 2 + i, − 1, − 1 + i, d’où n(r)  N (T + 1) − N (T ). D’autre part, on déduit immédiatement de (3.36) et (3.37) l’estimation

ln |F (s)|  O(ln T )

(|s|  3).

La formule de Jensen implique donc



 √ N (T + 1) − N (T ) ln 3/ 5 



3

√ 5

n(r) dr ≪ ln T , r

d’où (3.39). ⊓ ⊔ Nous sommes maintenant en mesure d’établir le théorème fondamental suivant. Théorème 3.19. On a pour T infini (3.40)

N (T ) =

T T T ln − + O(ln T ). 2π 2π 2π

Remarque. Cela implique en particulier que ζ (s) possède une infinité de zéros non triviaux. Démonstration. On peut supposer sans perte de généralité que T n’est pas l’ordonnée d’un zéro de ξ (s). Soit R le rectangle de sommets 2 ± iT , − 1 ± iT , orienté dans le sens direct. On a classiquement, en vertu du principe de l’argument,  ′  ′ 1 ξ (s) ξ (s) 1 2N (T ) = ds = ds. ℑm 2π i R ξ (s) 2π R ξ (s) Comme R est symétrique par rapport aux axes σ = 12 et τ = 0 et que ξ ′ (s)/ξ (s) respecte cette symétrie à cause de l’équation fonctionnelle, on déduit de ce qui précède que  ′ ' 1& ξ (s) 1 ds = arg ξ (s) L (3.41) N (T ) = ℑm π π L ξ (s) ' & 1 où L est la ligne brisée 2,2 + iT , 2 + iT . Maintenant, par (3.34), nous avons

(3.42)

ξ (s) = 2(s − 1)π −s/2 Ŵ ( 12 s + 1)ζ (s)

et (3.43)

[arg(s − 1)]L = arg(iT − 12 ) = 21 π + O



1  , arg π −s/2 = − 21 T ln π . T L

De plus, par la formule de Stirling complexe (Théorème 0.12), & ' argŴ ( 12 s + 1) L = ℑm log Ŵ ( 12 iT + 45 ) 

1  1 3 1 5 1 5 1 = ℑm ( iT + ) log( iT + ) − iT − + ln 2π + O 2 4 2 4 2 4 2 (3.44) T

1 = 12 T ln 12 T − 21 T + 83 π + O . T

3.8. DÉVELOPPEMENT EN PRODUIT DE HADAMARD

243

Ainsi, il ne reste plus à établir que  ζ ′ (s) ds ≪ ln T . (3.45) ℑm L ζ (s) Le segment vertical de L étant situé dans le demi-plan de convergence absolue, on peut intégrer terme à terme. On a    2+iT ζ ′ (s)   (n)   ds  2 < ∞.   2 ζ (s)  n2 ln n n2

Pour traiter le segment horizontal, on fait appel au Corollaire 3.17 pour la fonction F (s) = ζ (2 +iT +s)/ζ (2 +iT ) avec R = 4 et r = 3/2. Le numérateur est de l’ordre d’une puissance de T et le dénominateur satisfait à  1 = 2 − 61 π 2 > 0. |ζ (2 + iT )|  1 − n2 n2

Si Z est la suite finie des zéros de ζ (s) (comptés avec multiplicité)& dans le disque' |s− 2 −iT |  32 , on obtient donc pour tout s du segment horizontal 21 + iT ,2 + iT ζ ′ (s)  1 − ≪ ln T . ζ (s) s−̺

(3.46)



̺∈Z

D’après le Théorème 3.18, on a ̺∈Z 1 ≪ ln T et, pour chaque ̺ de Z , on peut écrire    21 +iT  ds     π. ℑm  2+iT s − ̺  Cela implique bien (3.45), et achève la démonstration du Théorème 3.19.

⊓ ⊔

3.8. Développement en produit de Hadamard Nous sommes maintenant en mesure d’expliciter, pour la fonction entière ξ (s) (et par conséquent pour ζ (s)), le développement de Hadamard relatif aux zéros. Ainsi qu’il apparaîtra dans la démonstration, seul le Théorème 3.18, majorant localement le nombre de zéros non triviaux, sera nécessaire. Théorème 3.20 (Formule du produit de Hadamard). Pour des constantes convenables a, b, on a  (3.47) 1 − s/̺ es/̺ (s ∈ C), ξ (s) = eas ̺

−1    e 1 − s/̺ es/̺ Ŵ 21 s + 1 2(s − 1) ̺ bs

(3.48)

ζ (s) =

(s = 1).

Remarque. Nous proposons à l’Exercice 175 une démonstration de la relation

b = ln(2π ) − 21 γ − 1 ≈ 0.54927,

(3.49)

ce qui implique a =

1 2

ln(4π ) − 21 γ − 1 ≈ −0,02310.

244

II.3. LA FONCTION ZÊTA DE RIEMANN

Démonstration. D’après (3.39), on a  T  ln(2k)  1 dN (t)  2 ≪ ≪ 1. 2 2 |̺ | t k2 0 kT

|γ |T

Cela implique la convergence du produit infini  1 − s/̺ es/̺ P (s) := ̺

(s ∈ C)

dont le terme général est, pour chaque s, de la forme 1 + O(|̺ |−2 ). P (s) est donc une fonction entière de s ayant les mêmes zéros que ξ (s) et, puisque P (0) = ξ (0) = 1, on peut choisir une détermination holomorphe F (s) de log ξ (s)/P (s) prenant la valeur 0 en s = 0. Nous allons voir que l’on a

max ℜe F (Reiϑ ) ≪ R(ln R)2

(3.50)

0ϑ 2π

pour une suite de valeurs de R tendant vers l’infini. D’après le lemme de la partie réelle, il découle de (3.50) que F est une fonction linéaire de s, ce qui est exactement le résultat souhaité. Nous allons prouver (3.50) pour tous les R satisfaisant à   (3.51) min R − |̺ |  1/(C ln R) ̺

où C est une constante positive convenable. Chaque intervalle [k ,k + 2], k  2, contient au moins un tel R. En effet, si C est assez grand, on a

 card{̺ : k  |̺ |  k + 2}  2 N (k + 2) − N (k − 1) < J := ⌊C ln k⌋ . D’après le principe des tiroirs, il existe au moins un intervalle

[k + 2j/J ,k + (2j + 2)/J] (0  j < J) ne contenant aucun des nombres |̺ |. On peut alors choisir R := k + (2j + 1)/J . Considérons un nombre R satisfaisant (3.51). Pour |s| = R on a    ln |P (s)| = ln  1 − s/̺ es/̺  ̺

−

+



|̺|R/2

R + |̺ |



R/22R

où l’on a utilisé les inégalités

⎧ ⎨−|z| ln |(1 − z)ez |  −2 + ln |1 − z| ⎩ −|z|2

(|z|  1  2) 2  |z| < 2) (|z| < 12 ).

Grâce à (3.39), on déduit de ce qui précède la majoration

ln(1/|P (s)|) ≪ R(ln R)2 .

3.9. RÉGIONS SANS ZÉROS

245

Nous omettons les détails, qui sont faciles. Maintenant, on a aussi par (3.38)

ln |ξ (s)| ≪ R ln R. Cela implique bien (3.50) et achève la démonstration. Nous terminons cette section par une remarque. La majoration

⊓ ⊔

N (T + 1) − N (T ) ≪ ln T nous a suffi à prouver la formule du produit (3.47) pour ξ (s). Or cette formule implique facilement que N (T ) → ∞ avec T . En effet, dans le cas contraire ξ (s) serait de la forme ξ (s) = ecs Q(s) où c est une constante et Q(s) un polynôme en s. L’équation fonctionnelle ξ (s) = ξ (1 − s) impliquerait alors c = 0 mais la formule de Stirling pour s réel positif interdit que ξ ait une croissance polynomiale. Titchmarsh (1951, § 9.1) donne d’ailleurs un argument simple permettant de déduire de l’équation fonctionnelle la validité de la minoration

N (T + A) − N (T ) ≫ 1 pour une constante absolue convenable A.

3.9. Régions sans zéros Il est patent que la démonstration du Théorème 3.13, conduisant à l’assertion ζ (s) = 0 pour σ  1, pourrait être exploitée plus avant pour fournir une région explicite sans zéro de ζ (s) et débordant dans le demi-plan σ < 1. Nous donnons les détails, à titre indicatif, au § 4.2. Les résultats des sections précédentes, et notamment la formule du produit, nous permettent en effet d’obtenir assez facilement une région plus vaste. Théorème 3.21. Il existe une constante positive c telle que ζ (s) ne possède aucun zéro dans la région du plan complexe définie par l’inégalité σ  1 − c/ ln(2 + |τ |).

(3.52)

Démonstration. La série de Dirichlet



 (n) ζ ′ (s) = ζ (s) ns n1

est à coefficients positifs ou nuls. D’après le Théorème 3.11, on peut donc écrire pour tout σ > 1 et tout γ réel (3.53)

−3

ζ ′ (σ + 2iγ ) ζ ′ (σ + iγ ) ζ ′ (σ ) − 4ℜe − ℜe  0. ζ (σ ) ζ (σ + iγ ) ζ (σ + 2iγ )

Nous parviendrons au résultat annoncé en majorant chacun des trois termes du membre de gauche lorsque γ est l’ordonnée d’un zéro ̺ = β + iγ de ζ (s).

246

II.3. LA FONCTION ZÊTA DE RIEMANN

En premier lieu, on a



1 ζ ′ (σ ) = + O(1). ζ (σ ) σ −1

Ensuite, en dérivant logarithmiquement la formule du produit (3.48), on a pour s = 1, s = ̺, Ŵ ′ ( 12 s + 1)  1 ζ ′ (s) 1 1  = −b + − . (3.54) − + + 1 ζ (s) s − 1 2Ŵ ( 2 s + 1) ̺ s−̺ ̺ En estimant le terme relatif à Ŵ par la formule de Stirling complexe (0.11) et en remarquant que, pour σ > 1, ̺ et (s − ̺ ) sont de parties réelles positives, il vient

−ℜe

ζ ′ (s)  O(ln |τ |) ζ (s)

(σ > 1, |τ |  2),

et aussi, en tenant compte de la contribution du zéro β + iγ ,

−ℜe

1 ζ ′ (σ + iγ )  O(ln |γ |) − . ζ (σ + iγ ) σ −β

En reportant ces estimations dans (3.53), on déduit donc l’existence d’une constante positive c1 telle que l’on ait pour |γ |  2

d’où

3 4 −  −c1 ln |γ | σ −1 σ −β

1−β 

1 − c1 (σ − 1) ln |γ | . (3/(σ − 1)) + c1 ln |γ |

En choisissant σ = 1 + (2c1 ln |γ |)−1 , il suit

1 − β  c2 / ln |γ | avec c2 = 1/14c1 . Cela implique bien le résultat annoncé, puisque la condition |τ |  2 est inutile dans (3.52) si l’on réduit suffisamment la valeur de c. ⊓ ⊔

3.10. Majorations de ζ ′ /ζ , 1/ζζ et log ζ Le Théorème 3.21 établit une région d’holomorphie pour les trois fonctions du titre de cette section. Il est naturellement souhaitable de disposer de majorations précises dans le même domaine. Théorème 3.22. Il existe une constante positive c telle que l’on ait, pour |τ |  3 et σ  1 − c/ ln |τ |, (3.55)

ζ ′ (s)/ζ (s) ≪ ln |τ |,

(3.56)

1/ζ (s) ≪ ln |τ |,

(3.57)

| log ζ (s)|  ln2 |τ | + O(1).

3.10. MAJORATIONS DE ζ ′ /ζ , 1/ζ ET LOG ζ

247

Démonstration. Nous pouvons supposer τ > 0. D’après le Théorème 3.21, il existe 1 une constante c, 0 < c < 16 , telle que tout zéro non trivial ̺ = β + iγ de ζ (s) satisfasse à β < 1 − 8c/ ln(|γ | + 2). Nous allons voir que cela implique   1 1 0 + (3.58) min ℜe ̺ ̺ s−̺ Lorsque |s − ̺ | > ϑ := 2|s − ̺ |/|̺ |  1,

1 2 |̺ |,

(τ  4, σ  1 − 4c/ ln τ ).

la quantité à minimiser s’écrit encore, en posant

σ −β ϑ 2 β /4 + σ − β σ − 3/4 β + =  > 0. 2 2 2 |̺ | |s − ̺ | |s − ̺ | |s − ̺ |2

Lorsque |s − ̺ |  12 |̺ |, on a |τ − γ |  12 (|γ | + 1), donc |γ |  2τ + 2 et β < 1 − 8c/ ln(2τ + 4)  1 − 4c/ ln τ  σ . Cela implique donc (3.58). En reportant dans (3.54), il suit (3.59)

−ℜe

ζ ′ (s)  K ln τ ζ (s)

(τ  4, σ  1 − 4c/ ln τ )

où K est une constante absolue convenable. Nous sommes maintenant en mesure d’établir la majoration (3.55). Il est clair que l’on peut supposer τ assez grand. Soit, donc, s = σ + iτ un nombre complexe fixé tel que τ  5,σ  1 − c/ ln τ . Posons η := c/ ln τ ,s0 := 1 + η + iτ . Alors pour chaque w dans le disque |w|  4η le point s0 + w = σ ′ + iτ ′ satisfait à τ ′  4, σ ′  1 − 4c/ ln τ ′ , de sorte que, par (3.59), on peut écrire

−ℜe

ζ ′ (s0 + w)  2K ln τ . ζ (s0 + w)

Cela implique que la fonction

F (w) :=

ζ ′ (s0 ) ζ ′ (s0 + w) − ζ (s0 ) ζ (s0 + w)

satisfait, dans le disque |w|  4η, aux hypothèses du Théorème 3.16 de Borel– Carathéodory avec A := 2K ln τ + |ζ ′ (s0 )/ζ (s0 )|. Puisque |s − s0 |  2η, le Théorème 3.16 implique   ′  ′     ζ (s)    4K ln τ + 3  ζ (s0 )  .   ζ (s0 )   ζ (s) 

La majoration (3.55) découle de cette inégalité puisque l’on a   ′  ζ (s0 )     (n)n−1−η = η−1 + O(1) ≪ ln τ .  ζ (s0 )   n1

248

II.3. LA FONCTION ZÊTA DE RIEMANN

L’estimation (3.56) découle trivialement de (3.57). Pour établir cette dernière relation, on utilise (3.55) sous la forme   s ′  ζ (w) ζ (s) = (3.60) log dw ≪ |s − s0 | ln τ ≪ 1. ζ (s0 ) s0 ζ (w) Cela implique le résultat escompté en remarquant que      (n) −s   (n) −1−η n 0   n = ln ζ (1 + η) | log ζ (s0 )| =  ln n ln n   n2

n2

= ln(1/η) + O(1) = ln2 τ + O(1).

⊓ ⊔

N OTES

§§ 3.2–3.3. Pour la démonstration des théorèmes fondamentaux 3.1 et 3.2, nous avons suivi la démarche originale de Riemann (1859). Titchmarsh (1951) donne plusieurs autres démonstrations du prolongement analytique et de l’équation fonctionnelle de ζ (s). Voir en particulier les Exercices 183 et 184. § 3.4. Le Théorème 3.5 est dû à Hardy & Littlewood (1921). Dans la plupart des applications, le fait que la somme en n contienne au moins C|τ | termes est un inconvénient rédhibitoire. Un autre résultat de Hardy & Littlewood (1923, 1929)  permet de ramener ce nombre de termes à O( |τ | ). C’est la célèbre équation fonctionnelle approchée : Théorème 3.23. Pour tout δ > 0, et uniformément lorsque 0  σ  1, x > δ, y > δ, τ = 2π xy , on a    1 ζ (s) = n−s + χ (s) ns−1 + O x−σ + τ 2 −σ y σ −1 ) nx

ny

où χ (s) est défini par (3.10). Pour la démonstration de ce résultat, son extension aux puissances de ζ (s) et d’abondantes notes relatives à ces questions, voir le chapitre 4 de Ivi´c (1985) et le chapitre IV de Titchmarsh–Heath-Brown (1986). Améliorant des résultats de Bombieri & Iwaniec (1986) et de lui-même (1993b), Huxley a montré en322005 que l’on peut remplacer, dans la majoration de  ζ 21 + iτ , l’exposant 61 par 205 + ε pour tout ε > 0.

§ 3.5. La formule (3.26) est un cas particulier de la formule de Ramanujan  σa (n)σb (n) ζ (s)ζ (s − a)ζ (s − b)ζ (s − a − b) = ζ (2s − a − b) ns n1

qui est valable pour σ > 1 +max{0,ℜe a,ℜe b,ℜe(a+b)}. Titchmarsh (1951) donne de ce résultat une démonstration utilisant le produit eulérien. Une autre manière de l’établir consiste à remarquer que le membre de gauche est la série associée à

250

II.3. LA FONCTION ZÊTA DE RIEMANN

la fonction arithmétique    μ(h) K a Lb ma+b ha+b μ(h)k a b ma+b = h2 km|n

h|(K ,L)

KLm|n

=



a

b

K L m

a+b



 

κ a λb

d|n [κ,λ]=d

KLm|n (K ,L)=1

=

=

κ a λb = σa (n)σb (n).

κ,λ|n

§ 3.7. Le Théorème 3.19, conjecturé par Riemann dans son mémoire de 1859, a été prouvé par von Mangoldt en 1895. Soit S(T ) = (1/π ) arg ζ ( 21 + iT ), où l’argument est suivi par continuité le long de la ligne brisée L joignant les points 2, 2 + iT , 12 + iT . D’après (3.41), (3.42), (3.43) et (3.44), nous avons — cf. Titchmarsh (1951, § 9.2) —

1 7 T T T ln − + + S(T ) + O . (3.61) N (T ) = 2π 2π 2π 8 T Littlewood (1924) a établi la majoration  T S(τ ) dτ ≪ ln T , 0

ce qui montre que, au moins en moyenne, le terme Cela dit, Selberg a prouvé en 1946 que

(ln T )1/3  S(T ) = ± . (ln2 T )7/3

7 8

de (3.61) est significatif.

L’estimation S(T ) ≪ ln T prouvée au Théorème 3.19 demeure à l’heure actuelle le meilleur résultat connu. Une conséquence immédiate du Théorème 3.19 est que, si {γn }∞ n=1 désigne la suite croissante au sens large des ordonnées des zéros de ξ (s) dans le demi-plan supérieur, alors (3.62)

γn ∼ 2π n/ ln n (n → ∞).

Littlewood (1924) a montré que γn+1 − γn → 0. § 3.9. D’une manière générale, il est à noter que la connaissance d’une majoration pourζ (s) sur la droite σ = 1 fournit, grâce au Corollaire 3.17, une majoration de −ℜe ζ ′ (s)/ζ (s) en fonction de l’abscisse des zéros de ζ (s) « proches » de σ = 1, ce qui permet l’obtention d’une région sans zéro par un argument analogue à celui de la preuve du Théorème 3.21. Ainsi, on peut énoncer que, conceptuellement, il est équivalent de majorer |ζ (1 + iτ )| et de déterminer une région sans zéro de ζ (s). Korobov (1958) et Vinogradov (1958) ont établi la majoration  3/2 (ln τ )2/3 (σ  0, τ  2) (3.63) ζ (s) ≪ 1 + τ A(1−σ )

NOTES

251

d’où découle la meilleure région sans zéro actuellement connue, soit (3.64)

σ  1 − C(ln τ )−2/3 (ln2 τ )−1/3

(τ  3).

Pour une preuve détaillée de (3.63) et de la déduction de (3.64), voir Ivi´c (1985, chap. 6). § 3.10. La connaissance de la région (3.64) sans zéro de ζ (s) permet facilement une amélioration du Théorème 3.22. On obtient ζ ′ (s)/ζ (s) ≪ (ln τ )2/3 (ln2 τ )1/3 , 1/ζ (s) ≪ (ln τ )2/3 (ln2 τ )1/3 ,

| log ζ (s)|  lorsque s satisfait (3.64).

2 3

ln2 τ +

1 3

ln3 τ + O(1),

E XERCICES

174. Montrer que l’on a ζ (s) = 1/(s − 1) + γ + O(s − 1) au voisinage de s = 1, où γ désigne la constante d’Euler. 175. Calcul de la constante b du Théorème 3.20. (a) Montrer que Ŵ ′ (1) = −γ en utilisant soit le développement en produit infini pour Ŵ (z), soit la formule de Stirling complexe, soit la définition de Ŵ (z) sous forme intégrale. (b) Montrer que ζ ′ (0) = − 12 ln(2π ) en effectuant un développement limité de l’équation fonctionnelle de ζ (s) au voisinage de s = 1. (c) Montrer que la constante b telle que ζ (s) =

 ebs 1 1 − s/̺ es/̺ 2(s − 1)Ŵ 2 s + 1 ̺

vaut b = ln(2π ) − 1 − 12 γ . On pourra, à cette fin, calculer la dérivée logarithmique de ζ (s) en s = 0. 176. Soit R(n) := |{(d,d′ ) : [d,d′ ] = n}| (n  1). En utilisant le résultat de l’Exercice 47(c) (p. 56), déterminer l’abscisse de convergence de la série de Dirichlet associée. 177. On désigne par τk (n) le nombre de solutions en entiers m1 ,m2 , . . . ,mk  1 de l’équation n = m1 m2 . . . mk .  (a) Montrer que n1 τk (n)/ns = ζ (s)k . (b) Montrer que pour chaque k  1, il existe un δk > 0, que l’on calculera explicitement, tel que  τk (n) = xPk−1 (ln x) + Oε (x1−δk +ε ) nx

où Pk−1 désigne un polynôme de degré k − 1, dont on explicitera les coefficients pour k = 1,2,3. Quelle valeur de δk peut-on obtenir sous l’hypothèse de Lindelöf ? 178. Montrer que, pour τ ∈ R fixé et s = 1 + iτ , on a  κ +iT

ln x 1   μ(n) 1 xw = dw + O + s n 2π i κ −iT wζ (s + w) T x nx

EXERCICES

253

uniformément pour x  2, T  1, avec κ := 1/ ln x. En déduire, grâce aux évaluations du § 3.10, l’estimation  μ(n)  √ 1 + Os e−c ln x (σ = 1, x > 1). = s n ζ (s) nx

179. Montrer à l’aide de la formule de Perron effective et des évaluations du § 3.10 que l’on a ⎧ ′  √ ζ (1 + iτ ) x−iτ ⎪ ⎪ − (τ = 0) + Oτ e−c ln x ⎨−  (n) ζ (1 + iτ ) iτ = ⎪ n1+iτ ⎪  √ nx ⎩ (τ = 0). ln x − γ + O e−c ln x

Déduire de ce qui précède la validité des expressions suivantes pour σ = 1, τ = 0 :  (n)  1  −1 log ζ (s) = 1 − . , ζ (s) = ns ln n ps p n2



180. Soit τ (n) le nombre des diviseurs impairs d’un entier générique n. Expliciter la série de Dirichlet associée à τ ∗ (n) et en déduire par intégration complexe l’estimation asymptotique  1 (3.65) T ∗ (x) := τ ∗ (n) = 12 x ln(2x) + 2γ − 1 + Oε (x 2 +ε ). nx



On pose T (x) := nx τ (n). Montrer que T ∗ (x) = T (x) − T ( 21 x) et en déduire une amélioration du terme d’erreur de (3.65).

181. Soit z un nombre complexe de module  1. Montrer, en utilisant le déve loppement eulérien, que la série de Dirichlet F (s,z) := n1 z (n) /ns est convergente pour σ > 1 et possède un prolongement analytique, donné par le produit infini convergent  F (s,z) = ζ (ks)ak (z) , k1

 −1

k/d , dans tout ouvert simplement connexe du demiavec ak (z) := k d|k μ(d)z plan σ > 0 excluant les valeurs de s pour lesquelles ks (k = 1,2, . . .) est un zéro ou un pôle de la fonction zêta.

182. Montrer que les relations asymptotiques suivantes sont équivalentes à l’hypothèse de Lindelöf :(2)  T (ε > 0, k = 1,2, . . .); (a) |ζ ( 21 + iτ )|2k dτ ≪ε,k T 1+ε 1  T (b) |ζ (σ + iτ )|2k dτ ≪σ ,ε,k T 1+ε (σ > 21 , ε > 0, k = 1,2, . . .); 1   τk (n)2 1 T (σ > 21 , k = 1,2, . . .). (c) |ζ (σ + iτ )|2k dτ ∼ T 1 n2σ n1

2

Cf. Titchmarsh (1951), chap. XIII.

254

II.3. LA FONCTION ZÊTA DE RIEMANN

183. Le prolongement analytique par la formule d’Euler–Maclaurin. En appliquant la formule d’Euler–Maclaurin à f (t) := t−s , montrer que l’on a pour s > 1, avec les notations du Chapitre I.0,     ∞ k  Br+1 s + r − 1 s+k s − ζ (s) = + Bk+1 (t)t−s−k−1 dt. s−1 r+1 r k+1 1 r=0

En déduire une nouvelle preuve des Théorèmes 3.1 et 3.2.

184. L’équation fonctionnelle par la fonction thêta de Jacobi.  2 On pose ϑ (x) := n∈Z e−π n x (x > 0). 2 (a) En appliquant la formule de Poisson à f (t) := e−π t x , montrer que √ ϑ (1/x) = x ϑ (x) (x > 0). Effectuer le changement de variables x = π n2 y dans l’intégrale Ŵ (s/2) =

∞(b) −x s/2−1 e x dx et en déduire que l’on a pour σ > 1 0  ∞ (3.66) ζ (s)Ŵ (s/2)π −s/2 = ψ (x)xs/2−1 dx, 0

 où l’on a posé ψ (x) := ϑ (x) − 1 . (c) Montrer que le membre de droite de (3.66) vaut encore  ∞  −(s+1)/2 1 + x + xs/2−1 ψ (x) dx, s(s − 1) 1 1 2

où la dernière intégrale définit une fonction entière de s invariante par la transformation s → 1 − s. En déduire une nouvelle preuve des Théorèmes 3.3 et 3.4. 185. Donner une preuve du Théorème 3.5 sans recourir à la théorie de van der Corput et en adoptant la stratégie suivante pour établir la formule (3.18) : appliquer la formule d’Euler–Maclaurin à l’ordre 0 à f (t) := t−iτ , développer B1 (t) en série de Fourier, intégrer terme à terme et majorer chacune des intégrales obtenues par la seconde formule de la moyenne. 186. Fonction zêta Pour α ∈]0,1], on définit la fonction zêta de Hur∞de Hurwitz. −s witz ζ (s; α ) := (n + α ) . Montrer que ζ (s; α ) se prolonge en une foncn=0 tion méromorphe dans tout le plan complexe ayant pour seule singularité un pôle simple de résidu 1 en s = 1 et satisfaisant, pour σ < 0, à l’« équation fonctionnelle »  2Ŵ (1 − s)  sin π ( 21 s + 2nα ) e(nα ) ζ (s; α ) = Ŵ (1 − s) = (2nπ i)1−s (2π )1−s n1−s r∈Z{0}

n1

où le logarithme complexe est pris en détermination principale. 187. En admettant que tous les zéros de ζ (s) sont simples et qu’il existe, pour −ε chaque ε > 0, une suite {Tν }∞ ν =1 telle que min−1σ 2 |ζ (σ ± iTν )| ≫ Tν , montrer

EXERCICES

255

que l’on a pour x ∈]1,∞]  N   M (x) := μ(n) =

 2π 2n (−1)n x̺ − 2 − , ̺ζ ′ (̺ ) x (2n)! nζ (2n + 1) ̺ n1 nx  où la somme en ̺ est définie comme la limite de |ℑm ̺|Tν .

188. Montrer que l’on a pour tout k > 0 fixé et x > 1  xn = x ln x + (2γ − 1)x + (−1)n ζ (n) n!

1 2

+ Ok (1/xk ).

n2

1 On pourra considérer l’intégrale 2π i



a+i∞

a−i∞

π ζ (s)xs ds avec a ∈]0,1[. Ŵ (s + 1) sin π s

(3) 189. Une frontière naturelle pour une série de Dirichlet  naturelle. −s Soit P (s) la série de Dirichlet définie par P (s) = p∈P p pour σ > 1.

(a) Exprimer P (s) en fonction de log ζ (s) dans le demi-plan σ > 1.

(b) Montrer que P ′ (s) est prolongeable en une fonction méromorphe dans le demi-plan σ > 0, dont les pôles sont d’ordre 1. (c) Pour δ > 0, t > 0, on désigne par Q(δ,t) le carré défini par les inégalités 0 < σ < δ, t < τ < t + δ. Montrer qu’à chaque couple (δ,t) de nombres réels positifs on peut associer un nombre q0 (δ,t) > 0 tel que, pour chaque nombre premier q  q0 (δ,t), il existe au moins un zéro ̺q = σq + iτq de ζ (s) satisfaisant à 1 2  σq < 1 et qt < τq < q(t + δ ). (d) Pour tout zéro ̺ de ζ (s), on note ν (̺ ) son ordre, i.e. le plus grand entier tel que l’on puisse écrire, au voisinage de s = ̺, ζ (s) = (s − ̺ )ν H(s) où H est holomorphe en s = ̺. Montrer que, pour une constante absolue A convenable, on a 1  ν (̺q )  A ln q(t + δ ). En déduire que l’on peut choisir q0 (δ,t) de sorte que q ∤ ν (̺q ). (e) Montrer que ̺q /q est un pôle éventuel de P ′ (s) dont le coefficient vaut exactement  μ(m) m̺q  ν . cq = m q 1m2q−1

(f) En déduire que cq = 0, et donc que ̺q /q est une singularité de P (s).

(g) Montrer que la droite σ = 0 est une frontière naturelle pour la fonction P (s) — autrement dit que l’on ne peut obtenir le prolongement de P (s) en aucun point s tel que σ < 0 à partir de la série de Taylor de P en un point d’abscisse positive. 190. On définit la fonction arithmétique f = μ2 ∗ j , où μ désigne la fonction de Möbius et j la fonction identité. (a) Montrer que f est multiplicative et satisfait à f (n)  n pour tout entier n. 3

Voir Landau & Walfisz (1919).

256

II.3. LA FONCTION ZÊTA DE RIEMANN

  (b) On pose am :=  n  1 : f (n) = m . Montrer que l’on a pour σ > 1  1  am = · ms f (n)s

m1

n1

(c) Écrire, dans son domaine de validité, le développement eulérien de la série de Dirichlet  n/f (n) w F (s; w) := ns n1

où w est un paramètre complexe. (d) On pose F (s) = F (s; s). Montrer que l’on a, pour σ > 1, F (s) = ζ (s)G(s) avec  G(s) := 1 + (p + 1)−s − p−s . p

(e) Montrer que pour chaque p  2 on a     (p + 1)−s − p−s   min 2p−σ , |s|p−σ −1

(σ  0).

(f) Montrer que pour σ  1 − 1/ ln(3 + |τ |) on a



p3+|τ |

1  e ln2 (3 + |τ |) + O(1). pσ

(g) Déduire de (e) et (f) que G(s) est prolongeable holomorphiquement au domaine σ  1 − 1/ ln(3 + |τ |) et y satisfait la majoration

 2 e G(s) ≪ ln(3 + |τ |) .

(h) On pose σ (τ ) = 1 − 1/ ln(3 + |τ |). Montrer que  +∞     √   dτ  2 1 ≪ x exp − ln x . x1+σ (τ ) ζ σ (τ ) + iτ G σ (τ ) + iτ  2 σ (τ )2 + τ 2 −∞

[On pourra estimer les contributions des domaines |τ |  T et |τ | > T , √ séparément ln x .] avec T := exp  (i) Soit A(t) := nt an . Montrer que



1

x



√ 1 A(t) dt = 21 G(1)x2 + O x2 e− 2 ln x .

En déduire, en utilisant la croissance de A(t) que 

√ 1 A(x) = G(1)x + O xe− 4 ln x .

EXERCICES

257

191. Soit f la fonction arithmétique définie par  μ(d)2 d2 . f (n) = d3 |n

 On note F (s) := n1 f (n)/ns la série de Dirichlet associée à f et l’on désigne  par S(x) := nx f (n) la fonction sommatoire de f .

(a) Déduire du résultat obtenu à l’Exercice 44(c) un équivalent asymptotique de S(x). (b) Montrer que f est multiplicative. On pourra soit raisonner directement, soit employer un argument de convolution en observant que la fonction indicatrice des cubes est multiplicative. (c) Calculer f (pν ) pour tout nombre premier p et tout  entier ν  1. Donner, dans son domaine de convergence, la somme de la série ν 0 f (pν )/pν s , que l’on exprimera sous forme d’une fraction rationnelle en p−s . (d) Montrer que F (s) est absolument convergente pour σ > 1. (e) En utilisant les développements de ζ (s) et F (s) en produits eulériens, montrer que F (s) peut s’exprimer simplement à l’aide de ζ (s), ζ (3s − 2) et ζ (6s − 4). (f) Montrer que F (s) possède un pôle en s = 1, dont on déterminera l’ordre. Expliciter la partie polaire de F (s) au voisinage de s = 1. [On pourra utiliser le résultat de l’Exercice 174.] On exprimera les coefficients à l’aide de γ , π et κ := −ζ ′ (2)/ζ (2). (g) Déterminer l’abscisse de convergence de F (s). (h) Calculer l’ordre du pôle de ζ ′ (s) en s = 1 et la partie polaire correspondante.  (i) Montrer que G(σ ) := n1 (−1)n n−σ est non nul pour σ > 0. En déduire que ζ (s) ne possède aucun zéro sur la demi-droite réelle ]0,∞[. (j) Déterminer des nombres réels a et b tels que la série de Dirichlet H(s) := F (s) + aζ ′ (s) − bζ (s) possède un prolongement analytique holomorphe en tous les points de la demi-droite réelle ] 31 ,∞[. (k) En admettant que F (s) possède un pôle sur la droite σ = résultat d’oscillation pour la quantité

3 , 4

donner un

R(x) := S(x) − ax ln x + (a − b)x. Que signifie cette hypothèse en terme des zéros de la fonction ζ (s) ? 192. (a) Montrer que chaque entier naturel n  1 peut s’exprimer de manière unique sous la forme n = m2 avec μ(m)2 = 1. On pose alors f (n) := . Cette fonction est-elle multiplicative ?  (b) Montrer que, pour chaque nombre premier p, la série entière ν 0 f (pν )z ν √ est convergente dans le disque ouvert |z| < 1/ p. Calculer alors sa somme. En déduire que la série F (s) := n1 f (n)/ns converge absolument pour σ > 1 et peut s’exprimer simplement en fonction de ζ (s), ζ (2s) et ζ (2s − 1).

(c) Montrer que F (s) possède un pôle en s = 1. Quelle est l’abscisse de convergence de F (s) ?

258

II.3. LA FONCTION ZÊTA DE RIEMANN

  2 (d) On pose Q(x) := nx μ(n) et S(x) := nx f (n). Établir la for √ Q(x/2 ) (x  1) et donner une évaluation asymptotique mule S(x) =  x pour S(x). Retrouver ainsi le résultat obtenu en (c). (e) Calculer l’ordre et la partie principale du pôle de F (s) en s = 1.

(f) Calculer l’ordre et la partie principale du pôle en s = 1 de ζ ′ (s). (g) Déterminer des nombres réels a et b — que l’on exprimera en fonction de la constante d’Euler γ et du nombre δ := ζ ′ (2) — tels que la série F (s) − aζ (s) +&bζ ′ (s) possède un prolongement holomorphe en tous les points de & la demi-droite 41 , + ∞ . En admettant que F (s) possède au moins un pôle non réel sur la droite σ = 14 , en déduire un théorème d’oscillation pour la quantité S(x) − ax − b(x ln x − x). 193. Une cousine entière de la fonction zêta. Soient ϑ ∈]0,1[ et r := ϑ . On considère la série de Dirichlet  e(nϑ ) · Fϑ (s) := ns n1



s−1

z−2π iϑ

dz/{e − 1} où H est le contour de Hankel constitué On pose Iϑ (s) := H z de la demi-droite réelle [r, + ∞[ parcourue de droite à gauche avec argument 0 + , du cercle |z| = r, privé du point z = r, parcouru dans le sens trigonométrique, et de la demi-droite [r, + ∞[ parcourue, avec argument 2π − , de gauche à droite. (a) Montrer que Iϑ (s) est une fonction entière de s. (b) Montrer que Iϑ (1) = 0. (c) Montrer que, pour σ = ℜe s > 1, on a Fϑ (s)(e2π is − 1)Ŵ (s) = Iϑ (s). (d) En déduire que Fϑ (s) se prolonge holomorphiquement en une fonction entière.

C HAPITRE

II.4 LE

THÉORÈME DES NOMBRES PREMIERS ET L’ HYPOTHÈSE DE R IEMANN

4.1. Le théorème des nombres premiers Les renseignements acquis au chapitre précédent sur la fonction ζ (s) nous permettent d’obtenir facilement le théorème des nombres premiers sous sa forme classique. Théorème 4.1. Il existe une constante strictement positive c telle que l’on ait, pour x infini, 

√ ψ (x) = x + O xe−c ln x , (4.1) 

√ π (x) = li(x) + O xe−c ln x . (4.2) Démonstration. La seconde formule découle aisément de la première par sommation d’Abel. Montrons (4.1). Puisque (n)  ln n pour tout n de N∗ et

|ζ ′ (1 + σ )/ζ (1 + σ )| ≪ 1/σ (1)

(σ > 0),

la seconde formule de Perron effective nous permet d’écrire pour x  2, T  2,    κ +iT ′ ζ (s) xs 1 x ln T  ds + O ln x 1+ (4.3) ψ (x) = − 2π i κ −iT ζ (s) s T 1

Voir le § 2.1.

260

II.4. LE THÉORÈME DES NOMBRES PREMIERS ET L’HYPOTHÈSE DE RIEMANN

avec κ := 1 + 1/ ln x. D’après le Théorème 3.21, il existe une constante positive c0 telle que le point s = 1 soit la seule singularité de l’intégrande dans le rectangle |τ |  T , 1 − c0 / ln T  σ  κ. Puisque le résidu en s = 1 vaut x, on peut écrire  κ +iT ′  ′ 1 ζ (s) xs ζ (s) xs 1 ds = x − ds (4.4) − 2π i κ −iT ζ (s) s 2π i G ζ (s) s où G est la ligne brisée κ − iT , 1 − c0 / ln T − iT , 1 − c0 / ln T + iT , κ + iT . La majoration du Théorème 3.22 ζ ′ (s) ≪ ln T ζ (s)

(s ∈ G)

implique alors que la contribution des segments horizontaux de G à l’intégrale est ≪ x(ln T )/T et que celle du segment vertical est  ln x  (ln T )2 . ≪ x exp − c0 ln T √ En choisissant T := exp c0 ln x, on obtient que l’intégrale sur G est de l’ordre √ du terme reste de (4.1) pour toute constante c < c0 . Cela implique le résultat souhaité en reportant (4.4) dans (4.3). ⊓ ⊔

4.2. Hypothèses minimales Il est conceptuellement intéressant de comprendre quels sont, dans la théorie de la fonction zêta, les renseignements minimaux qui permettent de prouver le théorème des nombres premiers. L’inégalité fondamentale (mais facile) (4.5)

ζ (σ )3 |ζ (σ + iτ )|4 |ζ (σ + 2iτ )|  1

(σ > 1),

essentiellement due à Mertens (§ 3.5), nous a permis de montrer que ζ (s) ne s’annule pas pour σ = 1. Elle est à elle seule quasiment suffisante pour obtenir le théorème des nombres premiers. En effet, en utilisant les majorations élémentaires (cf. § 3.4) (4.6)

ζ (k) (s) ≪ (ln |τ |)k+1

(|τ |  2, σ  1 − c/ ln |τ |)

pour k = 0 et 1, on peut déduire de (4.5) le calcul effectif d’une région sans zéro de ζ (s) débordant dans le demi-plan σ < 1. Soit s = σ + iτ , 0 < η < c/ ln |τ |, s0 = 1 + η + iτ , alors on a pour σ  1 − η  s    ′  |ζ (s) − ζ (s0 )| =  ζ (w) dw  C0 η(ln |τ |)2 . s0

Maintenant (4.5) et (4.6) impliquent

|ζ (s0 )|4  C1 η3 (ln |τ |)−1 , d’où 1 /4

|ζ (s)|  C1 η3/4 (ln |τ |)−1/4 − C0 η(ln |τ |)2 .

4.2. HYPOTHÈSES MINIMALES

261

En choisissant η optimalement, on obtient  |τ |  2, σ  1 − C2 /(ln |τ |)9 , (4.7) |ζ (s)| ≫ 1/(ln |τ |)7 où C2 est une constante positive convenable.

Nous laissons au lecteur la tâche aisée de vérifier que la démonstration du Théorème 4.1 donnée au paragraphe précédent est adaptable à ces hypothèses affaiblies. La seule modification réside dans le choix du paramètre T , dont la valeur optimale devient T := exp c3 (ln x)1/10 . On obtient ainsi

 ψ (x) = x + O x exp − c(ln x)1/10 .

Il est remarquable que l’on puisse également parvenir au théorème des nombres premiers (mais sous sa forme la plus faible, i.e. ψ (x) ∼ x) en n’utilisant que les propriétés de ζ (s) dans le demi-plan σ  1. Appliquons en effet la formule de Perron (2.10) à la série de Dirichlet  (n) − 1 ζ ′ (s) F (s) = − . − ζ (s) = ζ (s) ns n1

Il vient pour tout κ > 1  x   F (κ + iτ )xiτ xκ +1 +∞ dτ . (4.8) ψ (t) − ⌊t⌋ dt = 2π −∞ (κ + iτ )(κ + 1 + iτ ) 0 Les estimations (4.6) et (4.7) montrent que (4.9)

F (κ + iτ ) ≪ (ln(2 + |τ |))9

(κ  1).

On peut donc appliquer le théorème de la convergence dominée à l’intégrale figurant au second membre de (4.8). Il suit  x  ψ (t) − ⌊t⌋ dt = x2 J(x) 0

avec

1 J(x) := 2π



+∞

−∞

F (1 + iτ )xiτ dτ . (1 + iτ )(2 + iτ )

Ainsi J(x) est la transformée de Fourier au point (− ln x) d’une fonction intégrable. D’après le lemme de Riemann–Lebesgue, on a donc J(x) = o(1) (x → ∞), d’où  x ψ (t) dt = 21 x2 + x2 ε(x) 0

avec ε(x) = J(x) + O(1/x) = o(1).

262

II.4. LE THÉORÈME DES NOMBRES PREMIERS ET L’HYPOTHÈSE DE RIEMANN

Posons η(x) := maxx/2y3x/2 |ε(y)|. On peut écrire pour tout h, 0 < h  21 x,  1 x h 2 x − − η(x)x2  ψ (t) dt  ψ (x) 2 h h x−h  1 x+h h 4  ψ (t) dt  x + + x2 η(x). h x 2 h  En choisissant h := x η(x), on obtient  η(x) = x(1 + o(1)). (4.10) ψ (x) = x 1 + O

Ainsi le théorème des nombres premiers découle du fait que ζ (s) ne s’annule pas pour σ = 1 et d’une majoration « raisonnable » de F (s) pour σ  1. On pourrait en effet sans dommage remplacer, dans la preuve précédente, l’estimation (4.9) par

F (s) ≪ 1 + |τ |1−δ

(σ  1)

Nous verrons au Chapitre II.7 que le théorème taubérien de Wiener–Ikehara (généralisé sous la forme du Théorème 7.13) permet de prouver (4.10) en supposant que ζ (1 + iτ ) = 0 sans nécessiter aucune majoration de F (s). L’absence de zéro de ζ (s) sur la droite σ = 1 constitue en fait une hypothèse minimale pour le théorème des nombres premiers, dont elle découle facilement.

Supposons en effet que ψ (x) ∼ x (x → ∞) et que s0 = 1 + iτ soit un zéro d’ordre m  1 de ζ (s). Dans cette circonstance, on a (4.11)

lim (σ − 1)

σ →1+

ζ ′ (σ + iτ ) =m ζ (σ + iτ )

alors que la formule suivante, prouvée par intégration par parties,  ∞  ζ ′ (s) s = ψ (t) − t t−s−1 dt − +s ζ (s) s−1 1

implique

    ′  ∞  ζ (σ + iτ )   σ + iτ   (σ − 1) + |σ + iτ |(σ − 1)     o(t)t−σ −1 dt (σ − 1)  ζ (σ + iτ )   τ  1 (σ → 1+). = o(1)

Cela contredit (4.11).

4.3. L’hypothèse de Riemann Riemann a conjecturé en 1859 que tous les zéros non triviaux de ζ (s) sont situés sur la droite σ = 12 . Ayant énoncé que le nombre des racines complexes de l’équation  (0 < ℜe τ  T ) (4.12) ζ 12 + iτ = 0

4.3. L’HYPOTHÈSE DE RIEMANN

263

est « environ égal à (T /2π ) ln(T /2π )−(T /2π ) » (cf. Théorème 3.19), il écrit : « On trouve, en effet, entre ces limites, un nombre environ égal à celui-ci de racines réelles, et il est très probable que toutes les racines sont réelles. » Cependant, on retrouve dans les papiers de Riemann une note précisant qu’il n’a « pas encore complété la démonstration » du premier point — cf. Riemann (1859) pp. 168–169 et 175. Aucune des deux affirmations de Riemann n’a pu à ce jour être confirmée ou infirmée. Hardy a prouvé en 1914 que ζ (s) possède une infinité de zéros sur la droite critique σ = 21 ; Selberg a établi en 1942 qu’une proportion positive des zéros est bien située sur la droite critique, autrement dit  (4.13) N0 (T ) := card{τ : 0  τ  T , ζ 12 + iτ = 0}  cN (T ) (T → ∞)

avec c > 0, et l’on dispose aujourd’hui de valeurs explicites de c, à la suite des travaux de Levinson (1974) qui a montré que pour T assez grand on peut prendre c = 0,342. L’affirmation selon laquelle toutes les racines de (4.12) sont réelles (c’est-àdire N0 (T ) = N (T )) est connue sous le nom d’hypothèse de Riemann. C’est l’une des plus célèbres conjectures des mathématiques. Elle possède des implications profondes dans toute la théorie analytique des nombres. Dans cette section, nous en développerons deux. Théorème 4.2. L’hypothèse de Riemann implique celle de Lindelöf. Plus précisément, si tous les zéros non triviaux de ζ (s) ont pour partie réelle 12 , alors on a (4.14)

log ζ (s) ≪ε (ln |τ |)2−2σ +ε

( 21 < σ  1, |τ |  2).

La démonstration utilise le résultat classique suivant. Lemme 4.3 (Lemme des trois cercles de Hadamard). Soit F (s) une fonction holomorphe dans la couronne R1  |s|  R2 . Alors la fonction

M (r) := max |F (s)| |s|=r

(R1  r  R2 )

est une fonction log-convexe de ln r dans l’intervalle R1  r  R2 . Démonstration du lemme. Le principe du maximum appliqué à sm F (s)n implique immédiatement pour R1 < r < R2 Rm M (R2 )n Rm M (R1 )n + 2 . rm M (r)n  1 r − R1 R2 − r Soit α tel que R1α M (R1 ) = R2α M (R2 ). En faisant, dans l’inégalité précédente, tendre m et n vers l’infini de façon que m/n → α, on obtient

rα M (r)  R1α M (R1 ),

c’est-à-dire en remplaçant α par sa valeur ln(r/R1 ) ln(R2 /r) ln M (R1 ) + ln M (R2 ). (4.15) ln M (r)  ln(R2 /R1 ) ln(R2 /R1 ) Cela établit bien la propriété souhaitée.

⊓ ⊔

264

II.4. LE THÉORÈME DES NOMBRES PREMIERS ET L’HYPOTHÈSE DE RIEMANN

Démonstration du Théorème 4.2. Observons d’abord que l’hypothèse de Riemann implique que, pour τ assez grand, la fonction   ζ (s0 + w) (s0 := 2 + iτ ) F (w) := log ζ (s0 ) est holomorphe dans le disque |w| < 32 . Comme il découle du Théorème 3.9 (par exemple) que, pour 0  δ  1,

ℜe F (w)  O(ln τ )

(|w| 

3 2

− δ ),

on déduit immédiatement du lemme de la partie réelle (cf. Théorème 3.16) que l’on a

(σ > 12 , τ  2).

log ζ (s) ≪σ ln τ

(4.16)

Soit alors s := σ + iτ avec σ > 12 , τ  τ0 . Donnons-nous deux paramètres σ1 et ε satisfaisant à 1 < σ1  τ , 0 < ε < min{σ1 − 1,σ − 21 }. En appliquant le lemme des trois cercles à log ζ (σ1 + iτ + w) pour

R1 := σ1 − 1 − ε, r := σ1 − σ , R2 := σ1 −

1 2

−ε

(de sorte que sur ces trois cercles le point σ1 + iτ + w passe respectivement par 1 + ε + iτ , s, 21 + ε + iτ ) on obtient

| log ζ (s)|  M11−α M2α avec

σ −σ  1 

1 ln(r/R1 ) σ1 − 1 − ε = α := = 2(1 − σ + ε) + O 1  ln(R2 /R1 ) σ1 − 1 + ε σ1 − 2 − ε ln σ1 − 1 − ε ln

et

M1  sup | log ζ (σ + iτ )| ≪ε 1, σ  1 +ε

M2 ≪ε ln τ ,

où la dernière évaluation découle de (4.16). En choisissant, par exemple, σ1 = 1 + ln τ , on obtient bien le résultat annoncé. ⊓ ⊔ Théorème 4.4. Soit  la borne inférieure des nombres réels ξ tels que ψ (x) − x ≪ xξ

(x  2).

Alors on a  = sup β

(4.17)

̺

où le supremum porte sur les zéros ̺ = β + iγ non triviaux de ζ (s). Corollaire 4.5. L’hypothèse de Riemann équivaut à

(∀ε > 0)

ψ (x) = x + Oε (x1/2+ε ).

4.4. FORMULE EXPLICITE POUR ψ(x)

265

Démonstration du Théorème. Posons R(x) := ψ (x) − x. On a pour σ > 1  ∞  ∞ 1 dψ (t) dR(t) ζ ′ (s) = = + − s ζ (s) t s − 1 ts 1− 1−  ∞ 1 R(t) = dt. +1+s s−1 ts+1 1

Par définition de , on a R(t) ≪ε t+ε , donc la formule ci-dessus définit un prolongement analytique de ζ ′ (s)/ζ (s) en une fonction méromorphe pour σ >  ayant s = 1 pour seule singularité. Cela implique en particulier que ζ (s) ne s’annule pas pour σ > . Réciproquement, si ζ (s) ne s’annule pas pour σ >  la majoration

(σ > 12 , |τ |  2)

ln |ζ (s)|  O(ln |τ |) et le lemme de la partie réelle impliquent(2) (4.18)

log ζ (s) ≪σ ln |τ |

(σ > , |τ |  2).

La formule de Cauchy appliquée pour un cercle de rayon δ < σ −  implique alors (4.19)

ζ ′ (s) ≪σ ln |τ | ζ (s)

(σ > , |τ |  2).

Par la formule de Perron effective (4.3) et le théorème des résidus sous la forme (4.4) — en choisissant pour G la ligne brisée κ − iT ,  + δ ± iT , κ + iT —, il vient   x ln T x ln T + x+δ (ln T )2 + (ln x) 1 + . ψ (x) − x ≪ T T  Pour le choix T := x cette majoration est O x+2δ . Puisque δ est arbitrairement petit, cela fournit la conclusion souhaitée. ⊓ ⊔

4.4. Formule explicite pour ψ (x) Mentionnée par Riemann et prouvée par von Mangoldt en 1895, la formule explicite pour ψ (x) fournit une description complète de la répartition des nombres premiers en fonction des zéros de la fonction zêta. Nous posons

x

:=

min

p∈P,ν 1, pν =x

|x − pν |.

Théorème 4.6. Pour x  2, on a (4.20) ψ0 (x) :=

1 2 {ψ (x)

+ ψ (x−)} = x −

′ x̺ − ln(2π ) − ̺ ̺

1 2

1 ln 1 − 2 , x

où l’apostrophe indique que, dans la somme sur les zéros non triviaux ̺ de ζ (s), les zéros ̺ et ̺ doivent être simultanément pris en compte.

2

Nous omettons les détails, le raisonnement étant identique à celui qui conduit à l’estimation (4.16).

266

II.4. LE THÉORÈME DES NOMBRES PREMIERS ET L’HYPOTHÈSE DE RIEMANN

De plus, pour x  2, T  2, on a  x̺ (4.21) ψ0 (x) = x − − ln(2π ) + ̺ |γ |T

1 2

ln

 1 + R(x,T ), 1 − 1/x2

avec

R(x,T ) ≪

(4.22)

x ln x x ln2 (xT ) + · T x + T x

Remarques. (i) Pour tout x > 2 fixé, on a limT →∞ R(x,T ) = 0. De plus, si x est un demi-entier, alors x

 21 , donc

R(x,T ) ≪

(4.23)

x(ln xT )2 . T

(ii) Rappelons que (4.24)

ζ ′ (0)/ζ (0) = ln(2π ).

Nous prouvons le Théorème 4.6 en plusieurs phases. Il est suffisant d’établir (4.21). Le point de départ naturel est la formule de Perron effective (Théorème 2.3). En prolongeant la fonction  par 0 sur R  N∗ et en faisant appel à l’inégalité obtenue au Lemme 2.2(ii) pour traiter la contribution à l’intégrale du terme de rang x lorsque (x) = 0, nous obtenons, pour κ > 1, T > 0, x > 0,  (n)(x/n)κ κ(x) + , (4.25) |ψ0 (x) − Jκ (x,T )| < 2 1 + T | ln(x/n)| T n1 n=x

où l’on a posé 1 Jκ (x,T ) := 2iπ



κ +iT

κ −iT

−ζ ′ (s)xs ds. sζ (s)

La première étape consiste à vérifier que le membre de droite de (4.25) est bien compatible avec (4.21). Lemme 4.7. Pour x  2, κ := 1 + 1/ ln x, T > 0, on a

|ψ0 (x) − Jκ (x,T )| ≪

x ln x x(ln x)2 + · T x + T x

Démonstration. La contribution au membre de droite de (4.25) des entiers n tels que n  3x/4 ou n  5x/4 est x ln x xκ  (n) −xκ ζ ′ (κ ) ≪ · ≪ = κ T n T ζ (κ ) T n1

Soit N1 := maxpν 2

1+

&5

2

 1 . p(p − 2)

310

II.6. DEUX APPLICATIONS ARITHMÉTIQUES

218. Le théorème d’Erd˝os–Kac (1939). (a) Déduire du théorème de la limite centrale en théorie des probabilités que l’on a pour tout réel λ  λ k  2 1 −x x = √ e e−t /2 dt. lim x→+∞ k! √ 2π −∞ kx+λ x

√ (b) Soit ϕx (t) := e−x xt /Ŵ (t + 1). Montrer que l’on a pour x  1, |t − x| ≪ x,  √  2 1 ϕx (t) = √ e−(t−x) /2x 1 + O(1/ x) . √ 2π  x x+λ x ϕx (t) d[t] et retrouver ainsi le résultat de la Estimer l’intégrale de Stieltjes −∞ question précédente. (c) En appliquant les estimations   obtenues par la méthode de Selberg–Delange pour πk (x) := {n  x : ω(n) = k}, établir le théorème d’Erdos–Kac ˝ :  λ   2 1  1 {n  x : ω(n)  ln2 x + λ ln2 x} = √ (∀λ ∈ R) lim e−t /2 dt. x→+∞ x 2π −∞ Quel terme d’erreur explicite pouvez-vous obtenir ?

C HAPITRE

II.7 T HÉORÈMES

TAUBÉRIENS

7.1. Introduction. Dualité théorèmes abéliens/taubériens Nous avons développé dans les précédents chapitres différentes méthodes pour évaluer la fonction sommatoire d’une suite arithmétique à partir du prolongement analytique de sa série de Dirichlet. Dans tous les cas, l’étude de ce prolongement hors du domaine de convergence s’est avérée capitale. Nous nous proposons, au contraire, d’établir ici des résultats permettant d’obtenir le comportement asymptotique des fonctions sommatoires en n’utilisant la série génératrice qu’en des points de convergence. Ce type de théorème possède un attrait remarquable : la facilité d’emploi, due à l’affaiblissement des hypothèses. Cet avantage est compensé par la médiocre qualité des termes d’erreur — dont on peut cependant souvent montrer qu’à ce degré de généralité ils sont pratiquement optimaux. Commençons par énoncer un résultat classique dû à Abel.  Théorème 7.1 (Abel). Soit f (z) := n0 an z n une série entière, de rayon de convergence 1, convergente pour z = 1. Pour tout nombre réel ϑ, 0  ϑ < π /2, et tout secteur S(ϑ ) := z : |z| < 1, | arg(1 − z)|  ϑ ,

on a

lim

z→1, z∈S(ϑ )

f (z) = f (1).

Démonstration. Soit z = 1 − reiϕ ∈ S(ϑ ), avec r > 0, |ϕ |  ϑ. On a

|z|2 = 1 − 2r cos ϕ + r2 < 1,

donc r < 2 cos ϕ. Comme r → 0 lorsque z → 1, nous pouvons supposer r  cos ϑ. Désignons par S ∗ (ϑ ) la partie de S(ϑ ) correspondant à cette condition supplémentaire. Lorsque z ∈ S ∗ (ϑ ), nous avons donc (7.1)

|1 − z| cos ϑ = r cos ϑ  r(2 cos ϕ − r) = 1 − |z|2  2(1 − |z|).

312

II.7. THÉORÈMES TAUBÉRIENS

Il suffit de montrer que la convergence de la série f (z) est uniforme dans le secteur S ∗ (ϑ ), i.e. que      n sup  an z  → 0 (N → ∞).  z∈S ∗ (ϑ ) n>N  Posons An := N N |An |, de sorte que notre hypothèse sur la convergence de f (1) équivaut à limN →∞ εN = 0. Une sommation d’Abel permet d’écrire, pour z ∈ S ∗ (ϑ ),       εN |1 − z||z|N    2εN n n    ( = · ⊔ ⊓ 1 − z) A z a z n n     1 − |z| cos ϑ n>N

n>N

y

S(␽) ␽ x

0

Le secteur S(ϑ).

Le Théorème 7.1 constitue le prototype d’une classe d’énoncés dits abéliens parce qu’ils partagent avec lui la caractéristique suivante : ils établissent que si une suite (ou une fonction) est assez régulière, alors une certaine moyenne de ses valeurs possède aussi un comportement régulier. Ainsi l’implication bien connue, due à Cesàro, 1  lim an = a ⇒ lim am = a n→∞ n→∞ n 0mn

 est-elle un théorème abélien. Posant bn := 0mn am (de sorte que l’on a   m n f (z) = a z = ( 1 − z) b z ) , le Théorème 7.1 peut également m n m0 n0 s’écrire  lim bn = b ⇒ lim (1 − z) bn z n = b. n→+∞

z→1, z∈S(ϑ )

n0

La réciproque d’un théorème abélien est en général fausse. Par exemple, la somme de la série entière  1 f (z) = (−1)n z n = 1+z n0

tend vers 12 lorsque z → 1, mais la série diverge en z = 1. On appelle taubérien un théorème qui fournit une condition suffisante (appelée condition taubérienne)

7.2. LE THÉORÈME DE TAUBER

313

pour qu’une telle réciproque soit vérifiée. Le premier résultat de ce type est dû au mathématicien autrichien Alfred Tauber (1897) — cf. § 7.2. Nous terminons cette section par un théorème abélien relatif aux séries de Dirichlet.  Théorème 7.2. Soit F (s) := n1 an /ns une série de Dirichlet convergente pour σ > a  0. S’il existe deux constantes c, ω, avec ω > −1, telles que    c + o(1) xa (ln x)ω an = (x → ∞), Ŵ (ω + 1) nx

alors on a

F (σ ) =

ca + o(1) (σ − a)ω+1

(σ → a+).

 Démonstration. Posons A(t) := net an et  +∞ G(h) := e−(a+h)t dA(t)

(h > 0).

0−

Comme on a   +∞ +∞ c ca ca −(a+h)t ω at e t d{e } = tω e−ht dt = ω+1 , Ŵ (ω + 1) 0 Ŵ (ω + 1) 0 h on peut écrire  +∞ ca ca e−(a+h)t A(t) dt − ω+1 G(h) − ω+1 = (a + h) h h 0  +∞   ac −(a+h)t (a + h)A(t) − = e eat tω dt. Ŵ (ω + 1) 0

Par hypothèse, il existe une fonction ε(t), avec limt→∞ ε(t) = 0, telle que l’expression entre accolades soit de la forme ε(t)eat tω + O(heat tω ). Cela implique bien

G(h) −

1  ca = o h ω +1 h ω +1

(h → 0+).

⊓ ⊔

7.2. Le théorème de Tauber Sous sa forme originale, le théorème de Tauber (1897) est l’exacte réciproque du théorème d’Abel.  Théorème 7.3 (Tauber). Soit f (z) := n0 an z n une série entière de rayon de convergence 1. On suppose que f (z) tend vers une limite  lorsque z → 1 en restant dans l’intervalle réel [0,1[. Sous la condition supplémentaire  (T) nan = o(x) (x → ∞), nx

la série



an converge et est de somme .

314

II.7. THÉORÈMES TAUBÉRIENS

Démonstration. Posons  A(x) := an , nx

(7.2)

On a

(7.3)

α (x) :=



x

t dA(t)

(x > 0),

0

(1 + u)e−u − 1 e−u − 1 (u > 0), , g(u) := −G′ (u) = u u2 (1 + u)e−u e−u (u > 0). , h(u) := −H ′ (u) = H(u) := u u2 G(u) :=

   −1/x 1 x 1 ∞ − A(x) = f e H(t/x)t dA(t) G(t/x)t dA(t) + x x  x ∞ 0  ∞  x∞ 1 1 = g(u) du dα (t) + h(u) du dα (t) x 0 t/x x x t/x    min(1,u)x  ux 1 ∞ 1 ∞ g(u) du h(u) du dα (t) + dα (t) = x 0 x 1 0 x  ∞  1 α (ux) α (x) α (ux) du − + du. g(u) h(u) = x x x 1 0

On a α (ux)/x ≪ u uniformément en x puisque α (x)/x est bornée sur R+ . Comme α (ux)/x tend vers 0 lorsque x → ∞ pour tout u fixé et comme ug(u) et uh(u) sont respectivement intégrables sur [0,1] et [1,∞[, on obtient bien, grâce au théorème de la convergence dominée, que  (7.4) f e−1/x − A(x) = o(1) (x → ∞).

⊓ ⊔ Cela achève la démonstration du théorème de Tauber. Il est à noterque la condition (T) est en fait également nécessaire pour la convergence de an . En effet, en reprenant les notations introduites au cours de la démonstration, on peut écrire, grâce à une sommation d’Abel,   α (x) 1 x 1 x = A(x) − (7.5) A(t) dt = {A(x) − A(t)} dt. x x 0 x 0 Ainsi A(x) →  entraîne immédiatement que α (x) = o(x). Nous pouvons donc finalement énoncer le théorème de Tauber sous forme intégrale, et plus générale, de la manière suivante. Théorème 7.4. Soient ω ∈ R+ et A : R+ → R une fonction à variation bornée sur tout intervalle fini. On suppose que l’intégrale de Laplace–Stieltjes  ∞ F (σ ) := e−σ t dA(t) 0

converge pour σ > 0 et satisfait à F (σ ) = o(1/σ ω ) (σ → 0+). Alors les deux assertions suivantes sont équivalentes (i) (ii)

A(x) − A(0) = o(xω )  x t dA(t) = o(xω+1 ) 0

(x → ∞) (x → ∞).

7.3. LES THÉORÈMES DE HARDY–LITTLEWOOD ET KARAMATA

315

Démonstration. Moyennant un changement de notation adéquat, le calcul (7.3) permet d’exprimer F (σ ) − A(1/σ ) + A(0) en fonction de la quantité α (x) définie en (7.2). La conclusion en découle comme précédemment par application du théorème de Lebesgue. ⊓ ⊔ Remarque. Le Théorème 7.3 correspond au cas ω = 0 du Théorème 7.4 : l’hypothèse F (σ ) = o(1) est alors obtenue en modifiant la valeur de A(0). En considérant l’énoncé du Théorème 7.4, on peut élargir et préciser la notion de théorème taubérien. Étant donnée une fonction à valeurs réelles ϕ (t,s), définie sur R+ × S où S ⊆ C, on définit la ϕ-transformée d’une fonction A à variation bornée sur tout intervalle fini par  ∞ (7.6) F (s) := ϕ (t,s) dA(t) 0

lorsque l’intégrale est convergente. On suppose ensuite que le théorème abélien suivant est vrai pour un nombre s0 de l’adhérence de S : Si limt→∞ A(t) = , alors l’intégrale (7.6) converge pour tout s de S et l’on a (7.7)

lim

s→s0 , s∈S

F (s) = .

Dans ces circonstances, nous appellerons taubérien un théorème fournissant une condition suffisante pour déduire de (7.7) que l’on a limt→∞ A(t) = . On peut encore étendre l’acception de l’adjectif taubérien aux résultats établissant que A(t) possède un comportement déterminé à l’infini (par exemple l’existence d’une limite pour une certaine ψ-transformée) sous une hypothèse de type (7.7) — cf. en particulier le chapitre 4 de Bingham, Goldie & Teugels (1987). L’ouvrage de référence actuel concernant les théorèmes taubériens est la somme de Korevaar (2004).

7.3. Les théorèmes de Hardy–Littlewood et Karamata La condition taubérienne (T) du Théorème 7.3 découle à l’évidence de l’hypothèse

an = o(1/n)

(n → ∞).

En 1913, Hardy & Littlewood ont montré que la condition unilatérale

an  −K/n

(n  1),

où K est une constante arbitraire, est suffisante. Le théorème suivant, dû à Karamata (1931), permet une nouvelle démonstration, plus simple, de ce résultat. Théorème 7.5 (Karamata). Soit A(t) une fonction croissante au sens large telle que l’intégrale  ∞ (7.8) F (σ ) := e−σ t dA(t) 0

316

II.7. THÉORÈMES TAUBÉRIENS

converge pour tout σ > 0. Supposons qu’il existe deux nombres réels c  0, ω > 0, tels que

F (σ ) =

c + o(1) σω

(σ → 0+).

Alors on a

A(x) =

{c + o(1)}xω Ŵ (ω + 1)

(x → +∞).

Démonstration. Nous pouvons supposer sans perte de généralité que A(0) = 0. Pour tout entier fixé n  0, nous avons  ∞  {c + o(1)} Ŵ (ω) F (n + 1)σ = e−nσ t e−σ t dA(t) = Ŵ (ω)σ ω (n + 1)ω 0  ∞ {c + o(1)} = e−nt e−t tω−1 dt (σ → 0+). Ŵ (ω)σ ω 0 Il s’ensuit que, pour chaque polynôme fixé P ,   ∞ {c + o(1)} ∞ tω − 1 P (e−σ t ) dA(t) = P (e−t ) t dt (σ → 0+). (7.9) σ t ω e Ŵ (ω)σ e 0 0 Nous allons montrer que cette relation persiste lorsqu’on remplace P par la fonction χ définie sur [0,1] par  t (0  t  1) e χ (e−t ) = 0 (t > 1)

et lorsque σ tend vers 0 de façon que 1/σ ne soit pas un point de discontinuité de A. Admettons cela pour un instant. Il suit 

1   ∞ χ (e−σ t ) {c + o(1)} ∞ u ω −1 = dA(t) = χ (e−u ) u du A σ t ω σ e Ŵ (ω)σ e 0 0  {c + o(1)} 1 ω−1 c + o(1) = u du = · ω Ŵ (ω)σ Ŵ (ω + 1)σ ω 0 Grâce à l’hypothèse de croissance faite sur A, cette relation asymptotique est en fait valide sans restriction sur les valeurs de σ , d’où la conclusion annoncée. Afin de montrer que (7.9) est valable pour χ, il est naturel d’approcher χ par des fonctions polynomiales. Considérons la fonction H(t) définie sur [0,1] par (7.10)

H(t) :=

χ (t) − t t(1 − t)

(0 < t < 1), H(0) = −1, H(1) = 2.

Elle possède un unique point de discontinuité, en t = 1/e. Pour chaque ε > 0, il existe donc des fonctions continues f et g satisfaisant à(1) ⎧ (0  t  1) ⎨f (t)  H(t)  g(t) g(t) − f (t)  ε (|t − 1/e| > ε) (7.11) ⎩ g(t) − f (t)  12 (|t − 1/e|  ε). 1

Le nombre 12 a pour seul mérite ici d’excéder la valeur de la discontinuité de H en t = 1/e.

7.3. LES THÉORÈMES DE HARDY–LITTLEWOOD ET KARAMATA

317

D’après le théorème d’approximation de Weierstrass, il existe des polynômes p et q tels que

max |p(t) − f (t)|  ε,

(7.12)

max |q(t) − g(t)|  ε.

0t1

0t1

En posant

 P (t) := t + t(1 − t) p(t) − ε ,

 Q(t) := t + t(1 − t) q(t) + ε ,

on déduit de ce qui précède que

P (t)  χ (t)  Q(t)

(7.13)

et, pour 0 < ε < 21 , 

1

0

Q(t) − P (t) dt  t(1 − t)



1 0

(0  t  1)



q(t) − p(t) dt + 2ε.

On établit aisément grâce à (7.11) et (7.12) que la dernière intégrale n’excède pas 27ε. Quitte à altérer, dans les calculs précédents, la valeur de ε, nous obtenons donc l’existence de deux polynômes P et Q satisfaisant (7.13) et  1 Q(t) − P (t) dt  ε. (7.14) t(1 − t) 0 Il est à présent facile d’établir la validité de (7.9) pour la fonction χ lorsque σ tend vers 0+ en évitant les discontinuités de A(1/t). Dans ces conditions, on a en effet  ∞ χ (e−σ t ) dA(t) A(1/σ ) = e −σ t 0   ∞ Q(e−σ t ) {c + o(1)} ∞ tω − 1 dA(t) = Q(e−t ) t dt.  − σ t ω e Ŵ (ω)σ e 0 0 Similairement

A(1/σ ) 



{c + o(1)} Ŵ (ω)σ ω



0

P (e−t )

tω − 1 dt. et

Maintenant,





0

avec

Q −t −t ω−1  (e )e t dt  P 







0

χ (e−t )e−t tω−1 dt ± R

tω −1 dt et 0  1

1  ω −1 Q(t) − P (t)  t(1 − t) ln dt  εM = t(1 − t) t 0

R :=

{Q(e−t ) − P (e−t )}

d’après (7.14), où M := sup0t1 t(1 − t){ln(1/t)}ω−1 est indépendant de σ et ε. ⊔ En faisant tendre successivement σ et ε vers 0, on obtient la formule attendue. ⊓

318

II.7. THÉORÈMES TAUBÉRIENS

Remarque. Lorsque ω = 0, la conclusion du Théorème 7.5 persiste sous la forme

A(x) − A(0) → c

(x → ∞).

Cela découle trivialement de la formule d’intégration par parties  ∞  ∞ −σ t F (σ ) = −A(0) + σ e A(t) dt = e−t A(t/σ ) − A(0) dt. 0

0

Puisque A est croissante au sens large, A(t/σ ) tend, pour chaque t, vers une limite finie ou non α := sup A(t). D’après le théorème de Lebesgue on a donc  ∞ c = lim F (σ ) = e−t {α − A(0)} dt = α − A(0). 0

Pour déduire le théorème de Hardy–Littlewood de celui de Karamata, nous aurons besoin d’un lemme de Landau (1906, 1929) qui possède par ailleurs un intérêt propre. Théorème 7.6 (Landau). Soient f une fonction deux fois dérivable sur R+ , α un nombre réel quelconque, et M une constante positive. Si l’on a (a)

f (x) = o(xα )

(b)

f ′′ (x)  M xα−2

(x → +∞, resp. 0+) (x > 0)

alors

f ′ (x) = o(xα−1 )

(x → +∞, resp. 0+).

Démonstration. Soit δ un nombre réel fixé, 0 < δ  21 . La formule de Taylor implique pour tout x > 0 l’existence de nombres ϑ± = ϑ± (x,δ ) ∈]0,1[ tels que  f (x ± δ x) − f (x) = ±δ xf ′ (x) + 21 δ 2 x2 f ′′ x(1 ± ϑ± δ ) . La dérivée seconde ne dépasse pas

M xα−2 {(1 + δ )α−2 + (1 − δ )α−2 }  Kxα−2 où K est indépendant de δ. On peut donc écrire grâce à (a)

o(xα )  ±δ xf ′ (x) + K δ 2 xα

(x → +∞, resp. 0+).

α

En divisant les deux membres par δ x et en faisant tendre x vers +∞ ou 0+, on obtient sup 1−α ′ x f (x)  lim  ± K δ. inf La conclusion en découle puisque δ est arbitrairement petit. ⊓ ⊔ Nous sommes à présent en mesure d’établir un théorème plus général que celui de Hardy–Littlewood. Étant donné ω  0, nous désignons par V∗ (R+ ) la classe des fonctions A : R+ → R à variation bornée sur tout intervalle borné telles que l’intégrale de Laplace–Stieltjes (7.8) converge pour σ > 0 et par K(ω) la sous-classe de celles qui vérifient, pour une constante convenable c (non nécessairement positive), à

7.3. LES THÉORÈMES DE HARDY–LITTLEWOOD ET KARAMATA

la fois

F (σ ) :=

(7.15)





e−σ t dA(t) =

0

et

A(x) − A(0) =

(7.16)

c + o(1) σω

{c + o(1)}xω Ŵ (ω + 1)

319

(σ → 0+)

(x → ∞).

Le terme A(0) dans (7.16) n’est bien entendu significatif que si ω = 0. Théorème 7.7 (Hardy–Littlewood–Karamata généralisé). Soient ω  0 et A ∈ V∗ (R+ ). S’il existe c ∈ R telle que (7.15) soit vérifiée et B ∈ K(ω + 1) telle que la mesure t dA(t) + dB(t) soit positive, alors A ∈ K(ω). Démonstration. Quitte à altérer A(0) lorsque ω = 0, ou à changer A(x) en A(x) − cxω /Ŵ (ω + 1) lorsque ω > 0, nous pouvons supposer que c = 0. Nous avons de plus pour 0 < σ < 1,  ∞ ′′ F (σ ) = t2 e−σ t dA(t) 0  ∞  ∞ −K − te−σ t dB(t) = {1 − σ t}B(t)e−σ t dt  ω+2 σ 0 0 pour une constante convenable K , où la dernière inégalité résulte du fait que B ∈ K(ω + 1). D’après le Théorème 7.6, nous en déduisons que  ∞ F ′ (σ ) = − te−σ t dA(t) = o(1/σ ω+1 ) (σ → 0+), 0

et donc, en utilisant toujours la relation B ∈ K(ω + 1), pour une constante b convenable,  ∞ b + o(1) · e−σ t {t dA(t) + dB(t)} = σ ω +1 0 Le Théorème 7.5 de Karamata fournit donc  x  x  {b + o(1)}xω+1 dB(t) + o xω+1 . {t dA(t) + dB(t)} = = Ŵ (ω + 2) 0 0

⊓ ⊔ La conclusion requise résulte alors du Théorème 7.4.  Corollaire 7.8 (Hardy–Littlewood). Soit f (z) := n0 an z n une série entière de rayon de convergence 1 et dont les coefficients sont réels et satisfont à nan  −K

(7.17)

(n  0)

pour une constante convenable K . Si l’on a

lim f (z) = ,

(7.18)

alors



z→1− n0

an =  .

320

II.7. THÉORÈMES TAUBÉRIENS

 Démonstration. Il suffit d’appliquer le Théorème 7.7 avec A(x) := nx an , B(x) := K ⌊x⌋, et ω = 0. ⊓ ⊔ Dans le cadre des séries de Dirichlet nous obtenons le résultat suivant.  Corollaire 7.9 (Hardy–Littlewood–Karamata). Soit F (s) := n1 an /ns une série de Dirichlet convergente pour σ > 1. On suppose qu’il existe des nombres réels c, K , ω, avec ω  0, tels que l’on ait an  −K(ln n)ω−1

(7.19)

(n  2)

et

F (σ ) =

(7.20)

Alors on a (7.21)

c + o(1) (σ − 1)ω

(σ → 1+).

 an {c + o(1)} = (ln x)ω n Ŵ (ω + 1)

nx

(x → +∞).

Remarque. La condition (7.19) peut être remplacée plus généralement par an  −bn (n  n0 ) où bn est le terme général d’une série de Dirichlet satisfaisant à la fois (7.20) et (7.21) pour une constante c convenable, mais avec le même ω. Une condition de ce type est par exemple (7.22)

an  −K1 (ln n)ω−1 − K2 τ (n)α

(n  2)

avec α := ln ω/ ln 2.

7.4. Le terme d’erreur dans le théorème de Karamata Au cours des années cinquante, la théorie taubérienne s’est développée dans la direction d’une forme effective des résultats, c’est-à-dire de formules asymptotiques avec termes d’erreurs explicites. Nous donnons ici une version effective du Théorème 7.5 de Karamata, qui est due à Freud (1952). Théorème 7.10 (Karamata–Freud). Soit A(t) une fonction croissante au sens large telle que l’intégrale  ∞ F (σ ) := e−σ t dA(t) 0

converge pour tout σ > 0. Supposons qu’il existe deux nombres réels c  0, ω > 0 et une fonction croissante ψ (t) tels que (7.23)

ψ (t) → +∞, ψ (t)/tω est décroissante pour t assez grand,

et (7.24)

Alors on a (7.25)

 

1  σ −ω F (σ ) = c + O ψ 1/σ



A(x) = c + O

xω 1  ln ψ (x) Ŵ (ω + 1)

(σ → 0+).

(x → ∞).

7.4. LE TERME D’ERREUR DANS LE THÉORÈME DE KARAMATA

321

Il est important de noter dès à présent que le terme d’erreur de (7.25) ne peut être amélioré sans hypothèse supplémentaire, comme le montre le contreexemple suivant, dû à Karamata (1952). Considérons la fonction croissante  x  1 + cos{(ln t)2 } dt. A(x) := 0

On a d’une part

x  . ln x Cela découle, en effet, d’une simple intégration par parties :  x  x t 2 d sin (ln t)2 cos (ln t) dt = 2 ln t 2 2 / .  x x 1  sin{(ln t)2 } t 2 sin (ln t) dt 1− − = 2 ln t ln t 2 ln t 2 2  

1  x 1 2 = + O sin (ln x) ln x 2 ln x A(x) = x + ±

(7.26)

où la dernière intégrale a été estimée par une seconde intégration par parties. Nous allons voir d’autre part que l’on a

F (σ ) =

(7.27)

1 + O(1) σ

(σ → 0+).

1 + ℜe J(σ ) + O(1), avec σ  ∞ J(σ ) := exp − σ t + i(ln t)2 dt.

Il est clair que F (σ ) =

1

complexe Nous estimons J(σ ) en remplaçant l’intégrale sur [1, + ∞[ par l’intégrale sur le contour constitué de l’arc de cercle Ŵ := eiϑ : 0  ϑ  π /4 et de la demi droite  := reiπ /4 : r  1 . Cette transformation est justifiée pour tout σ > 0 par la majoration    exp − σ z + i(log z)2   R−2ϑ e−σ R cos ϑ (z = Reiϑ , 0  ϑ  π /4). (7.28)

Or, l’intégrale sur Ŵ est clairement bornée et la majoration (7.28) appliquée avec ϑ = π /4 > 21 montre que l’intégrale sur  converge absolument et est majorée indépendamment de σ > 0. Cela implique bien (7.27).

Le principe de la démonstration du Théorème 7.10 consiste à rendre explicites les approximations polynomiales de la fonction χ intervenant dans la preuve du théorème de Karamata. La précision est mesurée en norme L1 et il est nécessaire de contrôler lataille des coefficients. Nous définissons la longueur (P ) d’un n polynôme P (x) := m=0 am xm par  (P ) := |am |. 0mn

Nous montrerons le résultat d’approximation unilatérale suivant.

322

II.7. THÉORÈMES TAUBÉRIENS

Théorème 7.11. Soit f (t) une fonction à variation bornée sur [0,1]. Il existe des constantes A1 ,A2 , ne dépendant que de f , telles que, pour chaque entier n  1, il existe deux polynômes p et q , de degrés au plus n, satisfaisant à ⎧ p(t)  f (t)  q(t) (0  t  1) ⎪ ⎪ ⎨  1 (7.29) q(t) − p(t) dt  A1 /n 0 ⎪ ⎪ ⎩ (p) + (q)  An2 .

Dans un premier temps, admettons ce résultat et voyons comment on peut en déduire le Théorème 7.10. Grâce à la seconde des hypothèses (7.23), la relation (7.24) implique pour tout entier m  1  ∞  ∞

1  1  c tω − 1 e−mσ t e−σ t dA(t) = ω . e−mt t dt + O σ Ŵ (ω) 0 e ψ (1/σ ) 0 Par linéarité, on en déduit que l’on a pour chaque polynôme P  ∞  ∞

(P )  1  c P (e−t ) ω−1 P (e−σ t ) (7.30) dA(t) = t dt + O . eσ t σ ω Ŵ (ω) 0 et ψ (1/σ ) 0

Appliquons maintenant le Théorème 7.11 à la fonction H définie par (7.10) et posons P (t) := t + t(1 − t)p(t), Q(t) := t + t(1 − t)q(t). On a P (t)  χ (t)  Q(t) pour tout t de [0,1] et il découle de (7.30) que l’on a, lorsque 1/σ n’est pas une discontinuité de A,  1  c ± R( σ ) , A(1/σ )  ω  σ Ŵ (ω + 1) avec  ∞ A2 n R(σ ) ≪ {Q(e−t ) − P (e−t )}e−t tω−1 dt + ψ (1/σ ) 0  1

1 ω−1 A1 A2 n A2 n ≪ + = {q(t) − p(t)}t(1 − t) ln . dt + t ψ (1/σ ) n ψ (1/σ ) 0

Pour le choix n := ⌊ln ψ (1/σ )/(2 ln A2 )⌋, on obtient bien l’estimation (7.25). Au cours de la preuve du Théorème 7.11, nous utiliserons le calcul classique suivant, relatif aux polynômes de Tchébychev Tn (x) (n ∈ N∗ ) définis sur [−1,1] par

Tn (cos ϑ ) = cos nϑ

(ϑ ∈ R).

Lemme 7.12. Pour tout entier n  1, on a    n n−m m 1 (2x)n−2m . (−1) (7.31) Tn (x) = 2 n−m m 0mn/2

En particulier (7.32)

√ n  (Tn )  n 1 + 2 .

7.4. LE TERME D’ERREUR DANS LE THÉORÈME DE KARAMATA

323

Démonstration. Le point de départ est la formule d’où nous tirons

sin (n ± 1)ϑ = sin nϑ cos ϑ ± cos nϑ sin ϑ, 2 cos nϑ =

(7.33)

sin(n − 1)ϑ sin(n + 1)ϑ . − sin ϑ sin ϑ

Posons fϑ (r) := |1 − reiϑ |2 (0  r < 1). On a d’une part   1 1 1 1 1 = = − fϑ (r) (1 − reiϑ )(1 − re−iϑ ) 2ir sin ϑ 1 − reiϑ 1 − re−iϑ  sin(n + 1)ϑ = rn , sin ϑ n0

et d’autre part

 1 1 = = (2r cos ϑ − r2 )j 2 fϑ (r) 1 − (2r cos ϑ − r ) j0   j  (2r cos ϑ )k (−1)j−k r2j−2k = k j0 0kj      n− n (2 cos ϑ )n−2 , (−1) = r  n0

0n/2

où la dernière formule a été obtenue en posant  = j − k . Il s’ensuit que    sin(n + 1)ϑ  n− (2 cos ϑ )n−2 . (−1) = (7.34) sin ϑ  0n/2

En reportant dans (7.33) et en posant x := cos ϑ, nous obtenons 2 cos nϑ       h n−2−h  n− n−2 (2x)n−2−2h (2x) (−1) (−1) − = h  0hn/2−1 0n/2       n−1− n− (2x)n−2 , (2x)n−2 + (−1) (−1) = −1  0n/2

1n/2

et donc finalement (7.31).   n−m m y  (1 + y)n−m pour le On en déduit √ (7.32 ) en utilisant l’inégalité m 1 ⊓ ⊔ choix y := 2 2 − 1 .

Preuve du Théorème 7.11. Soit Y la fonction de Heaviside définie par  0 (t < 0) Y (t) = 1 (t  0)

Nous allons montrer l’existence de constantes absolues B1 , B2 telles qu’il existe, pour chaque n  1, des polynômes R,S , de degrés  n, satisfaisant à ⎧ R(t)  Y (t)  S(t) (−1  t  1) ⎪ ⎪ ⎨ 1 (7.35) S(t) − R(t) dt  B1 /n ⎪ ⎪ ⎩ −1 (R) + (S)  B2n .

324

II.7. THÉORÈMES TAUBÉRIENS

L’énoncé général découle de ce cas particulier. En effet, si f1 et f2 sont deux fonctions croissantes au sens large telles que f = f1 − f2 , les polynômes définis sur [0,1] par  1  1 S(t − ξ ) df2 (ξ ) R(t − ξ ) df1 (ξ ) − p(t) := f (0) + 0

q(t) := f (0) +



0

1

S(t − ξ ) df1 (ξ ) −



0 1

0

R(t − ξ ) df2 (ξ )

satisfont les conditions (7.29) avec   1 d(f1 + f2 )(ξ ), A2 = 1 + 2|f (0)| + 2B2 A1 = B1

1

d(f1 + f2 )(ξ ).

0

0

La construction de R et S utilise les propriétés de Tchébychev.   des polynômes Pour r  1, nous désignons par xν := cos π ν − 12 /r (1  ν  r) les zéros   de Tr (x), et nous posons m := 21 (r + 1) , de sorte que xm+1 < 0  xm . Nous définissons alors R(t) comme l’unique polynôme de degré n = 2r − 2 satisfaisant à  1 (1  ν  m − 1) R(xν ) = R′ (xν ) = 0 (ν = m) 0 (m  ν  r), S(t)

R(t)

xm

–1 xr

x1

1

t

xm+1

Les polynômes R et S. ′

Ainsi R (t) s’annule au moins une fois sur chacun des (r − 2) intervalles ]xν +1 ,xν [ (1  ν  r, ν = m − 1). Cela met en évidence r − 1 + r − 2 = n − 1 zéros, donc R′ (t) ne s’annule pas pour xm  t < xm−1 et R′ (xm ) > 0 puisque R(xm−1 ) = 1 > R(xm ) = 0. Cela implique que R(t) possède des maxima locaux en tous les xν (ν = m) et un minimum entre chacun de ces maxima consécutifs. En particulier, on a bien R(t)  Y (t) (−1  t  1). On définit symétriquement S(t) par les équations  1 (ν  m + 1) S(xν ) = S ′ (xν ) = 0 (ν = m + 1). 0 (m + 2  ν  r), et l’on vérifie que cela implique S(t)  Y (t) (−1  t  1). Pour obtenir la seconde des propriétés (7.35), nous introduisons les polynômes

T (x) 2 r (1  ν  r). (7.36) Vν (x) := Tr′ (xν )−2 x − xν

7.4. LE TERME D’ERREUR DANS LE THÉORÈME DE KARAMATA

On a

 1 0

Vν (xj ) =

(j = ν ) , (j = ν )

325

Vν′ (xj ) = 0 (j = ν ).

Le polynôme W (x) := S(x) − R(x) − Vm (x) − Vm+1 (x) est de degré n et s’annule pour tous les xν (1  ν  r). Il existe donc un polynôme Z(x), de degré r − 2, tel que W (x) = Tr (x)Z(x). D’où  1  π dx W (x) √ cos ru · Z(cos u) du = 0 = 1 − x2 0 −1

et donc

(7.37)



0

1

{S(t) − R(t)} dt 



1

S(x) − R(x) √ dx 1 − x2 −1  π {Vm (cos u) + Vm+1 (cos u)} du. = 0

π m − 12 , de sorte que xm = cos τ . On a Posons τ := r r sin rτ . =± Tr′ (cos τ ) = r sin τ sin τ

En reportant dans (7.36) avec ν = m, il vient  π 2

sin τ 2  π cos ru Vm (cos u) du = du r cos u − cos τ 0 0

sin τ 2  π  sin r(u − τ )/2 sin r(u + τ )/2 2  ·  = du. r sin (u − τ )/2 sin (u + τ )/2 0 Nous pouvons supposer r  3. Alors on a, pour u dans [0,π ],  1 3 1 4 π 1 − 2/r  2 (u + τ )  4 π .

L’intégrale en u est donc





π

−π



  sin rv/2 2  dv = 2π r, sin v/2

d’après l’écriture classique du noyau de Fejér 2   sin(rv/2) =r+2 (r − j) cos(jv). sin(v/2) 1j 1. Schématiquement, on passe du demi-plan σ > 1 au point s = 0 et cette discontinuité entre l’hypothèse et la conclusion nous porte à suggérer, pour un résultat de ce type, l’appellation de théorème taubérien transcendant.

7.5. LE THÉORÈME D’IKEHARA

327

Le théorème d’Ikehara(2) (1931) fait partie de cette catégorie. Nous en donnons ci-dessous un énoncé qui le renforce dans deux directions. D’une part, nous généralisons l’hypothèse en considérant des séries ayant une singularité de type s−ω−1 (ω > −1) en s = 0 — cette forme aujourd’hui classique est essentiellement due à Ingham (1935) et Delange (1954). D’autre part, nous donnons une version effective de la conclusion, avec un terme d’erreur explicite. Un tel résultat ne semble pas exister tel quel dans la littérature, mais découle assez simplement de la méthode de Ganelius (1971). Théorème 7.13 (Ikehara–Ingham–Delange « effectif »). Soit A(t) une fonction croissante au sens large et telle que l’intégrale  ∞ (7.39) F (s) := e−st dA(t) 0

converge pour σ > a > 0. On suppose l’existence de constantes c  0, ω > −1, telles que la fonction (7.40)

G(s) :=

c F (s + a) − ω +1 s+a s

(σ > 0)

satisfasse pour chaque T > 0 fixé à  T |G(2σ + iτ ) − G(σ + iτ )| dτ = o(1) (7.41) η(σ ,T ) := σ ω −T

Alors on a (7.42)

avec

A(x) =



̺ (x) :=

  c + O ̺ (x) eax xω Ŵ (ω + 1) inf

T 32(a+1)



(σ → 0+).

(x  1),



1  1 1 + η ,T + . T x (T x)ω+1

La constante implicite dans (7.42) ne dépend que de a, c et ω. Un choix admissible de cette constante est  52 + 1652c(a + 1)(ω + 2) + 69c 1 + e1−ω (ω + 1)ω+2 /Ŵ (ω + 1).

L’argument de Ganelius repose sur une version locale de l’inégalité de Bohr (1935) (7.43)

f ∞ ≪ f ′ ∞ /T

qui est valable, lorsque les deux membres sont finis, pour toute fonction intégrable sur R dont la transformée de Fourier f((τ ) est nulle pour |τ |  T . Nous nous contentons ici d’une forme légèrement affaiblie du résultat de Ganelius, qui est cependant suffisante pour les applications envisagées. La démonstration procède d’idées très voisines de celle de l’inégalité classique de Berry–Esseen — cf. par exemple Feller (1971). 2 Souvent désigné dans la littérature sous le nom de théorème de Wiener–Ikehara, pour tenir compte de la part due à la théorie taubérienne de Wiener dans la preuve du résultat.

328

II.7. THÉORÈMES TAUBÉRIENS

Théorème 7.14 (Ganelius). Soit g une fonction intégrable et bornée sur R. On suppose l’existence d’un réel positif T tel que

sup

(7.44)

xyx+1/T

g((τ ) :=

(7.45)

Alors on a



{g(y) − g(x)}  K < ∞,

+∞

e−iτ x g(x) dx = 0

−∞

(|τ |  T ).

g∞ := sup |g(x)|  16K .

(7.46)

x∈R

Remarque. Nous n’avons pas cherché ici à optimiser la constante 16 qui apparaît dans (7.46). Démonstration. Nous pouvons supposer T = 1 : le cas général s’en déduit en considérant g(x/T ). L’hypothèse (7.45) implique

g(τ )( ( χ (τ ) = 0

(7.47)

(τ ∈ R)

pour toute fonction χ intégrable dont la transformée de Fourier est à support inclus dans [−1,1]. Nous choisissons 1 sin(t/2) 2 χ (t) = 2π t/2 de sorte que χ ( (τ ) = max(1 − |τ |,0). La relation (7.47) implique  +∞ g(x − t)χ (t) dt = 0 (x ∈ R) (7.48) −∞

et nous allons obtenir l’inégalité annoncée en utilisant le fait que χ (t) possède un « pic » en t = 0. Plus précisément, nous aurons recours à l’inégalité   4 ∞ dt 4 . (7.49) I := χ (t) dt  = 2 π t 5π |t|>5 5 Soit ε, 0 < ε < 1, un nombre réel fixé et ϑ = ±1 choisi de façon que

g∞ = sup{ϑ g(x)}. x∈R

Il existe alors un x0 = x0 (ε) tel que ϑ g(x0 )  (1 − ε)g∞ . En appliquant (7.48) avec x = x0 − 5ϑ et en tenant compte de (7.49) on peut écrire  +∞ 0=ϑ g(x0 − t − 5ϑ )χ (t) dt −∞ 5





 5 g(x0 )χ (t) dt − ϑ {g(x0 ) − g(x0 − t − 5ϑ )}χ (t) dt −5 −5  +ϑ g(x0 − t − 5ϑ )χ (t) dt |t|>5

 (1 − ε)(1 − I)g∞ − 10K(1 − I) − Ig∞ ,

7.5. LE THÉORÈME D’IKEHARA

329

où nous avons utilisé le fait que pour tout t tel que |t|  5, on a ϑ {g(x0 ) − g(x0 − t − 5ϑ )} 

sup

{g(y) − g(x)}  10K .

x 0. Nous allons appliquer le Théorème 7.14 à g − f où f est la convolée de g avec la fonction intégrable

  2 sin εt/2 sin (2T + ε)t/2 2 π εt dont la transformée de Fourier est la fonction trapézoïdale ⎧ (|τ |  T ) ⎨1 (T < |τ |  T + ε) α ((τ ) = (T + ε − |τ |)/ε ⎩ 0 (|τ | > T + ε). α (t) :=

( est à support compact, on a Comme f( = g( α f ∞ 

(7.50)

Il suit

sup xyx+1/T



1 ( 1 f1  2π 2π



T +ε

−T −ε

|( g(τ )| dτ .

 g(y) − f (y) − g(x) − f (x)  K + 2f ∞ ,

d’où, grâce au Théorème 7.14,

g∞  g − f ∞ + f ∞  16K + 33f ∞ . ⊔ Le résultat annoncé en découle, en faisant tendre ε vers 0, puisque 33/2π  6. ⊓ Démonstration du Théorème 7.13. Nous pouvons supposer sans restreindre la généralité que A(0+) = 0 et prolonger A(t) par 0 pour t  0. Dans un premier

330

II.7. THÉORÈMES TAUBÉRIENS

temps, nous appliquons le Théorème 7.15 à la fonction

gσ (t) := A(t)e−(a+σ )t (1 − e−σ t ) dont la transformée de Fourier est donnée, pour chaque valeur du paramètre positif σ , par la formule gσ (τ ) = G(σ + iτ ) − G(2σ + iτ ) + c (σ + iτ )−ω−1 − (2σ + iτ )−ω−1 . ( Le module du dernier terme n’excède pas    2σ +iτ  ds  c(ω + 1)σ   · c(ω + 1)  ω + 2 s |σ + iτ |ω+2 σ +iτ

En tenant compte de (7.41), on peut donc écrire    T  T dτ 1 ω +1 |( gσ (τ )| dτ  ω η(σ ,T ) + c(ω + 1)σ ω +2 σ −T max(σ ,|τ |) −T η(σ ,T ) + 2c(ω + 2) ·  σω Ensuite, la croissance et la positivité de A impliquent pour x > 0, y  0, (7.51)

gσ (x + y) − gσ (x)  A(x)e−(a+σ )x (1 − e−σ x )(e−(a+σ )y − 1)  −(a + σ )gσ ∞ y .

Cette inégalité est encore satisfaite si x  0 puisqu’alors gσ (x) = 0. En appliquant le Théorème 7.15 à −gσ , avec K = (a + σ )gσ ∞ /T , il vient, pour 0 < σ  1,

gσ ∞ 

16 6 (a + 1)gσ ∞ . η(σ ,T ) + 2c(ω + 2) + ω σ T

En choisissant T = Ta := 32(a + 1), nous obtenons

gσ ∞  M1 (σ )σ −ω avec M1 (σ ) := 12 η(σ ,Ta ) + 2c(ω + 2) .

(7.52)

Posons

B(t) :=

+

(0 < σ  1),

c e−t (1 − e−t )tω Ŵ (ω + 1) 0

(t > 0) (t  0).

La seconde étape de la démonstration consiste à appliquer une nouvelle fois le Théorème 7.15, mais à la fonction   c tω e−σ t (1 − e−σ t ) Gσ (t) := gσ (t) − σ −ω B(σ t) = A(t)e−at − Ŵ (ω + 1)

dont la transformée de Fourier vaut (σ (τ ) = G(σ + iτ ) − G(2σ + iτ ). G Pour tout t > 0, on a

c e−t tω−1 {2te−t − t + ω(1 − e−t )} Ŵ (ω + 1) c(ω + 1) −t c(ω + 1) −t ω e (1 − e−t )tω−1  e t .  Ŵ (ω + 1) Ŵ (ω + 1)

B ′ (t) =

7.5. LE THÉORÈME D’IKEHARA

331

De plus, B est continue sur R, donc égale à l’intégrale de sa dérivée, prolongée par exemple par 0 en t = 0. On en déduit d’une part, pour x < 0, x + y  0,  y c(ω + 1) −t ω c e t dt  y ω +1 , B(x + y) − B(x)  Ŵ ( ω + 1 ) Ŵ ( ω + 1 ) 0 et d’autre part, pour x  0, y  0,

 c(ω + 1) −x x+y ω e t dt B(x + y) − B(x)  Ŵ (ω + 1) x    c e−x ϑ (ω)(ω + 1)(x + y)ω y + 1 − ϑ (ω) y ω+1  Ŵ (ω + 1)

où l’on a posé ϑ (ω) = 1 si ω  0, et ϑ (ω) = 0 si −1 < ω < 0. Nous avons utilisé dans le cas ω < 0 l’inégalité classique de Minkowski

(x + y)ω+1 − xω+1  y ω+1

(−1 < ω < 0).

Un calcul facile permet d’en déduire que l’on a pour x ∈ R, 0  y  1/T  1, 0 < σ  1,

σ ω+1  σ + B(σ x + σ y) − B(σ x)  D , T T avec  c D := 1 + e1−ω (ω + 1)ω+2 . Ŵ (ω + 1) On vérifie en effet que DŴ (ω + 1)  c max{1,ϑ (ω)(ω + 1)e supt0 e−t tω }. Grâce à (7.51) et (7.52), nous obtenons dans les mêmes conditions   B(σ x + σ y) − B(σ x) (a + σ )gσ ∞ + Gσ (x + y) − Gσ (x)  − T σω  

σ  ω +1 1 M2 (σ ) +D − ω σ T T

avec M2 (σ ) := (a + 1)M1 (σ ) + D = 12(a + 1)η(σ ,Ta ) + 24c(a + 1)(ω + 2) + D. En appliquant alors le Théorème 7.15 à −Gσ , il vient, pour T  Ta , 

σ  ω +1  1 16M2 (σ ) + 6η(σ ,T ) + 16D |Gσ (x)|  ω σ T T   ω+1  1 384c(a + 1)(ω + 2) + 16D σ + 12η(σ ,T ) + 16D  ω σ T T 

σ  ω +1  M 1 + η(σ ,T ) + ,  ω σ T T avec M := max 384c(a + 1)(ω + 2) + 16D, 12  12 + 384c(a + 1)(ω + 2) + 16c 1 + e1−ω (ω + 1)ω+2 /Ŵ (ω + 1).

La conclusion en découle, en choisissant σ = 1/x. La constante implicite dans (7.42) n’excède pas eM/(1 − 1/e). ⊓ ⊔

332

II.7. THÉORÈMES TAUBÉRIENS

Le théorème d’Ikehara implique le théorème des nombres premiers sous la seule hypothèse que ζ (s) = 0 pour σ = 1, sans nécessiter de majoration de 1/ζ (s) — cf. Exercice 224. Bien entendu, toute majoration explicite de ζ ′ (s)/ζ (s) ou 1/ζ (s) fournit, grâce au Théorème 7.13, une version effective correspondante du théorème des nombres premiers — voir en particulier les Exercices 225 et 226.

7.6. L’inégalité de Berry–Esseen Comme annoncé à la section précédente, nous montrons maintenant comment le Théorème 7.15 implique l’inégalité probabiliste de Berry–Esseen. Conformément à l’usage, nous appelons fonction de répartition une fonction réelle F , de variable réelle, croissante au sens large, et satisfaisant à

F (−∞) = 0,

(7.53)

F (+∞) = 1.

La fonction caractéristique de F est la transformée de Fourier–Stieltjes  +∞ eiτ x dF (x). f (τ ) := −∞

Théorème 7.16 (Berry–Esseen). Soient F , G deux fonctions de répartition de fonctions caractéristiques respectives f , g . Supposons que G est dérivable et que G′ est bornée sur R. Alors on a pour tout T > 0  T   G′ ∞  f (τ ) − g(τ )  +6 (7.54) F − G∞  16   dτ . T τ −T

Démonstration. Posons H := F − G, et introduisons pour chaque valeur du paramètre positif ε, la fonction  x  +∞ eεt dH(t). (7.55) Hε (x) := − e−εt dH(x − t) = e−εx −∞

0

On vérifie aisément que Hε est intégrable et que sa transformée de Fourier vaut  +∞ f (−τ ) − g(−τ ) ( ε (τ ) = . e−iτ x Hε (x) dx = H ε + iτ −∞

La seconde égalité (7.55) fournit par intégration par parties  x eεt H(t) dt. (7.56) Hε (x) = H(x) − εe−εx −∞

Comme H∞  1 et H(−∞) = 0, on en déduit facilement que l’on a, pour chaque x fixé,

lim Hε (x) = H(x).

ε →0+

Posons α := G′ ∞ . On a clairement

H(x + y) − H(x)  −α y et

d  −ε x e dx



x

−∞

(x ∈ R, y > 0)

  eεt H(t) dt = −εe−εx

x

−∞

eεt H(t) dt + H(x)  2.

7.7. L’HOLOMORPHIE COMME CONDITION TAUBÉRIENNE

333

En reportant dans (7.56), il suit

Hε (x + y) − Hε (x)  −

(α + 2ε) T

x ∈ R, 0  y 

1 . T

α + 2ε , nous obtenons En appliquant le Théorème 7.15 à −Hε avec K := T  T   (α + 2ε)  f (τ ) − g(τ )  +6 |Hε (x)|  16 (x ∈ R).   dτ T τ −T

⊓ ⊔ Cela implique (7.54) en faisant tendre ε vers 0. Remarques. (i) L’inégalité (7.54) ne fournit une borne finie que si |f − g| est intégrable pour la mesure dτ /τ . Une condition suffisante pour cela est que f et g appartiennent à l’espace E des fonctions ϕ telles que |1 − ϕ (τ )|/|τ | soit intégrable à l’origine. Il n’est pas difficile de montrer qu’une fonction

caractéristique ϕ est dans E si et seulement si sa fonction originale H vérifie R ln+ |z| dH(z) < ∞. (ii) La valeur numérique des constantes de l’inégalité de Berry–Esseen est habituellement de faible incidence sur les applications. Feller (1971) donne les valeurs 24/π et 1/π , qui sont respectivement améliorables — cf. Vaaler (1985), th. 13 — en π et 0,16318.

7.7. L’holomorphie comme condition taubérienne Commençons par une extension du Théorème 7.14 essentiellement due à Ganelius (1971). Théorème 7.17. Soient g une fonction intégrable et bornée sur R, C une constante positive, et ψ : R → [1,∞[ une fonction croissante au sens large et telle que ψ (x) = 1 pour x  0, ψ (2x)  C ψ (x) pour x  0. On suppose que l’on a, pour un nombre réel convenable T > 0, (i) sup {g(x + y) − g(x)}  K/ψ (x) (x ∈ R), 0y1/T

g ∈ C∞ ([−T ,T ]). (ii) ( Alors il existe un nombre entier N = N (C ,K) et une constante A, ne g (n) [−T ,T ] , telle que dépendant que de C , K , T et M := supnN ( (7.57)

|g(x)|  A/ψ (x)

(x ∈ R).

Démonstration. Supposons sans perte de généralité que T = 1. Nous pouvons clairement nous restreindre à établir (7.57) pour x  x0 (C). Traitons d’abord le cas où g((τ ) = 0 pour |τ |  1. Nous remarquons alors que le Théorème 7.14 nous permet de majorer g∞ par 16K . Soit χ une fonction positive ou nulle de C∞ (R), à décroissance rapide, dont la transformée de Fourier a pour support [−1,1], et telle que χ ( (0) = 1.(3) On a n en particulier χ (x) ≪n 1/(1 + |x| ) pour tout entier n et par conséquent χ (x)  B/{(1 + x2 )ψ (|x|)} pour une constante convenable B . 3

Un choix possible est χ (x) := {( σ (x)}2 /



R

{( σ (t)}2 dt, avec

σ (t) := exp{−1/(1 − 4t2 )}1]−1/2,1/2[ (t)

(t ∈ R).

334

II.7. THÉORÈMES TAUBÉRIENS

Il existe par ailleurs un nombre entier R > 0 tel que  1 . χ (t) dt < IR := 2 C +1 |t|>R Soient x  4R, et ϑ := sgn g(x). On a g ∗ χ = 0, d’où  R ϑ g(x) χ (t) dt −R





R

−R

{g(x) − g(x − t − Rϑ )}χ (t) dt − ϑ

Il suit



|t|>R

g(x − t − Rϑ )χ (t) dt.

 2RK(1 − IR ) + |g(x − t − Rϑ )|χ (t) dt ψ (x − 2R) |t|>R  A1 (1 − IR ) |g(x − t − Rϑ )|χ (t) dt,  + ψ (x) |t|>R

(1 − IR )|g(x)| 

avec A1 := 2CRK . Dans l’intégrale, on majore |g(x − t − Rϑ )| par supy>x/2 |g(y)| si |t + Rϑ |  x/2 et par 16K dans le cas contraire. En remarquant que IR /(1 − IR )  1/2C , il vient  16K 1 A1 + sup |g(y)| χ (t) dt + |g(x)|  ψ (x) 1 − IR |t+Rϑ |>x/2 2C y>x/2  ∞ 16C 2 BK dt 1 A1 + sup |g(y)| +  2 ψ (x) (1 − IR )ψ (x) −∞ 1 + t 2C y>x/2



A2 1 + sup |g(y)|, ψ (x) 2C y>x/2

avec A2 = A2 (C ,K). Par itération, il suit pour tout entier J  0

|g(x)|  



0jJ



0jJ

A2 j (2C) ψ (x/2j ) A2 C j j 2 C j ψ (x)

+

+

1 2J C J

sup |g(y)|

y>x/2J

16K . 2J C J

En faisant tendre J vers l’infini, on obtient, puisque C  1,

|g(x)|  A3 /ψ (x) avec A3 := 2A2 . Considérons maintenant le cas général où g((τ ) n’est pas nécessairement nulle sur [−1,1]. Nous introduisons alors une fonction α ∈ C∞ (R) ∩ L1 (R) telle que ((τ ) = 0 pour |τ |  1, et nous posons α ((τ ) = 1 pour |τ |  21 , α  eiτ x α ((τ )( g (τ ) dτ . f (x) := R

7.7. L’HOLOMORPHIE COMME CONDITION TAUBÉRIENNE

335

Des intégrations par parties successives montrent que f (x) ≪M ,N 1/(1 + |x|N ) où M = MN est défini comme dans l’énoncé. On a donc

|f (x)|  A4 /ψ (x)

(7.58)

où A4 ne dépend que de C et MN avec N = N (C) convenablement choisi. Comme on a f((τ ) − g((τ ) = 0 pour |τ |  12 , on peut appliquer le résultat établi dans la première partie de la démonstration pour obtenir

|f (x) − g(x)|  A5 /ψ (x).

Compte tenu de (7.58), cela achève la démonstration.

⊓ ⊔

Le théorème précédent fournit une preuve facile du résultat suivant dû à Korevaar (1954b), ayant lui-même affiné un théorème de Fatou (1906).

 Théorème 7.18 (Fatou-Korevaar). Soit f (z) = n0 an z n une série entière convergente pour |z| < 1 et possédant un prolongement holomorphe en z = 1. S’il existe une fonction ψ satisfaisant aux hypothèses du Théorème 7.17 telle que an  −1/ψ (n)

(7.59)

alors



n0

(n  0),

an converge vers f (1) et l’on a

1   an = f (1) + O ψ (x)

(x → ∞).

nx

Démonstration. Soient r tel que f (z) soit prolongeable holomorphiquement pour |z − 1|  r et 0 < ε < ln{1/(1 − r)}. Posons  gε (x) := an e−εn − f (e−ε )1R+ (x), nx

de sorte que

gε (τ ) = − (



0



e−iτ x



an e−εn dx =

n>x

f (e−ε−iτ ) − f (e−ε ) . iτ

Pour ε > 0 et |τ |  T avec T assez petit, on a donc ( gε ∈ C∞ ([−T ,T ]) et les dérivées de ( gε sont bornées indépendamment de ε. Comme par ailleurs,  1+y+M , gε (x + y) − gε (x) = e−εn an − f (e−ε )1]x,x+y] (0)  − ψ (x) x 1 et possédant un prolongement holomorphe en s = 1. Si l’on a an  −1/ψ (ln n) (n  2) pour une fonction ψ satisfaisant aux hypothèses du Théorème 7.17, alors

1   an = F (1) + O (x → ∞). (7.60) n ψ (ln x) nx

Démonstration. Il suffit de considérer, pour δ > 0 assez petit, la fonction  an . gδ (x) := 1R+ (x) n 1 +δ n>ex Nous omettons les détails, qui sont semblables à ceux de la démonstration du Théorème 7.18. ⊓ ⊔

Ainsi que l’a remarqué Landau (1910), la condition taubérienne peut être remplacée par une inégalité en moyenne, mais bilatérale. Nous obtenons ici une version effective du Théorème 2.9. Théorème 7.20. Dans le Théorème 7.19, la conclusion persiste sous l’hypothèse  am ≪ n/ψ (ln n) (n  2). mn

Démonstration. Posons ϕn (s) := n−s − (n + 1)−s − sn−s−1 (s ∈ C), de sorte que

|ϕn (s)|  |s(s + 1)|/nσ +2

(σ > 0).

 Soit An := mn am . On a donc An ≪ n/ψ (ln n) (n  2). On vérifie aisément que l’on a pour tout entier N  1 et tout s ∈ C, (7.61)

 An   an AN − s = . An ϕn (s) + s s+ 1 n n (N + 1)s 1nN

1nN

1nN

On en déduit, en faisant N → ∞, que

G(s) :=

 An F (s) 1  − = An ϕn (s) s+ 1 n s s

n1

(σ > 1).

n1

La seconde série est holomorphe pour σ > 0, donc G(s) possède un prolongement analytique holomorphe en σ = 1. On peut donc appliquer le Théorème 7.19 à G(s), ce qui fournit 

 An 1 = G( 1 ) + O . n2 ψ (ln N ) nN

En reportant dans (7.61) avec s = 1, on obtient le résultat annoncé.

⊓ ⊔

7.8. THÉORÈMES TAUBÉRIENS ARITHMÉTIQUES

337

7.8. Théorèmes taubériens arithmétiques Les tentatives de preuves élémentaires du théorème des nombres premiers ont incité les arithméticiens à considérer une problématique plus générale. Soient f , g des fonctions arithmétiques liées par la relation f = g ∗ 1. Posant   F (x) := f (n), G(x) := g(n), nx

nx

on cherche alors à déterminer les conséquences sur g de l’hypothèse

F (x) = ax + o(x) (x → ∞).

(7.62)

Le cas emblématique correspond au choix g = μ, f = δ, et donc a = 0. La relation G(x) = o(x) est alors élémentairement équivalente au théorème des nombres premiers — cf. Théorème I.3.8. Toutefois, notre objectif ne consiste pas ici à chercher une nouvelle démonstration élémentaire du théorème des nombres premiers, que nous utilisons librement dans la suite. Théorème 7.21 (Ingham, 1945). Sous l’hypothèse (7.62), on a  g(n) G(x) = + a + o(1) (x → ∞). (7.63) n x nx

 peut donc supposer a = 0, Démonstration. On a F (x) = nx g(n) ⌊x/n⌋ . On  quitte à changer la valeur de g(1). De plus G(x) = nx μ(n)F (x/n). On a donc  x  g(n) G(x)  x 1 1  G(u) − = − dG(u) = du n x x u2 1− u 1 nx  x  μ(n)  x/n  dv du F (v) 2 F (u/n) 2 = μ(n) = u n v 1 n nx nx  x 

 x  μ(n) dv dv = o(1). = o = F (v) 2 n v2 1 1 v{ln(2x/v)} nx/v

⊓ ⊔ Théorème 7.22 (Landau, 1910). Si g est réelle et satisfait à g(n)  −K pour tout n  1, alors la relation (7.63) implique  g(n) = a. (7.64) n n1

Démonstration. Quitte à altérer g(1), on peut supposer a = 0. Alors  g(n) G(x)  x G(u) du = o(1). (7.65) − = n x u2 1 nx

338

II.7. THÉORÈMES TAUBÉRIENS

Si G(N ) > cN avec c > 0 pour une infinité d’entiers N , alors, pour N < u  (1+ε)N et ε assez petit, on a G(u) > cN − K(u − N + 1) > 21 cN . Cela implique que  (1+ε)N G(u) du > 21 cε/(1 + ε)2 , 2 u N et, par (7.65), on obtient une contradiction. En appliquant le même raisonnement à −G, on en déduit bien que G(N ) = o(N ). ⊓ ⊔ La conjonction des Théorèmes 7.21 et 7.22 fournit immédiatement une condition taubérienne sur g pour l’implication (7.62)⇒(7.64). Corollaire 7.23 (Ingham, 1945). Si l’on a (7.62) et si inf n g(n) > −∞, alors on a (7.64). L’approche d’Ingham fournit aussi le résultat suivant. Théorème 7.24 (Skałba, 1998). Si l’on a (7.62) et f (n) ≪ 1, alors G(x) = o(x) et l’on a (7.64). Démonstration. En supposant, sans perte de généralité, que a = 0, on a, d’après le principe de l’hyperbole (Théorème I.3.1), pour chaque y  2 fixé,   f (n)M (x/n) − F (x/y)M (y). (7.66) G(x) = μ(m)F (x/m) + my

nx/y

En majorant M (z) par ≪ z/(ln z)2 et f (n) par O(1) dans cette somme, on voit immédiatement que lim supx→∞ |G(x)|/x ≪ 1/ ln y , et donc G(x) = o(x). En reportant dans (7.63), on obtient bien le résultat souhaité. ⊓ ⊔ Corollaire 7.25 (Skałba, 1998). Si f : R → C est 2π -périodique et Riemann– intégrable, alors  2π  g(n) 1 f (u) du = . 2π 0 n n1

Démonstration. L’intégrale est la valeur moyenne de f (n) = f (2π n/2π ), d’après le critère de Weyl (Théorème I.6.13), puisque n/2π est équirépartie modulo 1. ⊓ ⊔ Ainsi qu’il est mentionné dans l’article de Skałba (1998), Drmota a prouvé la réciproque du Théorème 7.24. Théorème 7.26 (Drmota, 1998). Si f est réelle, satisfait à inf n f (n) > −∞, et si l’on a (7.64), alors la relation (7.62) a lieu. Démonstration. On a pour chaque y > 0   g(n) = f (n)e−ny . ny e −1 n1

n1

7.8. THÉORÈMES TAUBÉRIENS ARITHMÉTIQUES

339

Le membre de gauche est la série de Lambert associée à g(n)/n . Comme le procédé de Lambert est régulier (voir plus bas), il vaut donc a + o(1) /y quand y → 0+. Le théorème taubérien de Karamata (Théorème 7.5) implique alors (7.62). ⊓ ⊔ Montrons la propriété requise pour le procédé de Lambert. On pose ϕ (y) := y/(ey − 1).

 Lemme 7.27 (Régularité du procédé de Lambert). Si n an = a, alors  an ϕ (ny) = a + o(1) (y → 0+). n

 Démonstration. On peut supposer a = 0. Soit An := mn am . Alors An = o(1) et   an ϕ (ny) = An ϕ (ny) − ϕ (ny + y) . n

n

+

Or ϕ est décroissante sur R . Donc, pour chaque N fixé     |An | ϕ (ny) − ϕ (ny + y) + ϕ (N y) sup |An |. An ϕ (ny) − ϕ (ny + y)   n

Il suit

n>N

nN

  lim sup  An ϕ (ny) − ϕ (ny + y)   sup |An | y→0+

n

d’où le résultat en faisant tendre N vers l’infini.

n>N

⊓ ⊔

N OTES

§ 7.1. La restriction z ∈ S(ϑ ) est indispensable dans le théorème d’Abel. Le contre-exemple suivant est dû à B. de Mathan. Soit αk := exp(i/k) (k = 1,2, . . .). La fonction  log(1 − z/αk ) f (z) = 2k k1

est holomorphe pour |z| < 1 car la série converge uniformément sur tout compact inclus dans le disque ouvert. Comme

lim |f (z)| = ∞

z→αk

(k = 1,2, . . .),

on voit que f (z) n’admet pas de limite lorsque z → 1. Or la série de Taylor de f (z) est  z n  α −n k . − n 2k n1

k1

Cette série converge en z = 1, d’après la règle d’Abel. Les sommes partielles sont en effet uniformément majorées :    αn    1     k n = α    k 2k 2k k1 1nm k1 1nm  1  1 − α m   1 k   < ∞.    k k− 1  2 1 − αk 2 1 − e−i/k  k1 k1

§ 7.3. On peut étendre le théorème de Karamata en considérant l’hypothèse plus générale

F (σ ) = {c + o(1)}σ −ω L(1/σ )

(σ → 0+)

où L(t) est une fonction à croissance lente, i.e. satisfaisant pour tout k > 0 fixé à

L(kt) ∼ L(t)

(t → ∞).

La conclusion du Théorème 7.5 est alors valable en remplaçant xω par xω L(x) — cf. Hardy (1949), th. 108.

NOTES

341

§ 7.4. Le Théorème 7.11 est dû à Freud (1952). Voir aussi Freud & Ganelius (1957). La démonstration autonome que nous en donnons ici suit essentiellement celle de Korevaar (1954a). Ingham (1965) fournit une démonstration directe du théorème de Karamata–Freud n’utilisant pas explicitement de lemme sur l’approximation–L1 par des polynômes, mais intégrant directement l’emploi de fonctions pics dans la preuve de Karamata. § 7.5. Pour des développements relatifs à l’inégalité de Bohr (7.43), voir l’article de Hörmander (1954). Ainsi qu’il est indiqué dans l’Exercice 225, le Théorème 7.13 fournit, pour tout ε > 0, un reste d’ordre ≪ x/(ln x)2−ε dans le théorème des nombres premiers. Rieger (1983) a obtenu, en utilisant également la méthode de Wiener-Ikehara, un reste d’ordre ≪ x exp − c(ln x)1/25 .

Ainsi que l’a remarqué Diamond dans sa recension (1988), il n’est pas exact stricto sensu que le théorème de Hardy–Littlewood–Karamata ne puisse conduire à une preuve du théorème des nombres premiers. En utilisant un certain nombre de propriétés analytiques de la fonction zêta de Riemann telles que l’équation fonctionnelle, la formule du produit, la finitude de l’ordre, l’absence de zéros sur σ = 1 et une majoration du type N (T ) ≪ T A pour le nombre de zéros d’ordonnées n’excédant pas T , Littlewood a en effet montré en 1971 que l’on pouvait utiliser le théorème de Hardy–Littlewood–Karamata pour obtenir une preuve « rapide » du théorème des nombres premiers. Puisqu’aucune démonstration connue du fait que ζ (s) = 0 pour σ = 1 ne fournit de minoration effective moins bonne que (7.67)

|ζ (s)| ≫



−A ln(3 + |τ |)

(σ  1),

une telle démarche semble cependant d’un intérêt théorique assez limité. Sous l’hypothèse (7.67), la formule de Perron à elle seule permet d’obtenir le théorème des nombres premiers, et il n’est nul besoin de recourir à un argument taubérien — cf. § 4.2. L’attrait spécifique du théorème d’Ikehara est de fournir la conclusion sous la seule hypothèse minimale, ζ (s) = 0 pour σ = 1, sans autre renseignement analytique supplémentaire. Delange (1954) a généralisé le théorème d’Ikehara au cas d’une singularité de type mixte, comportant dans sa partie principale des termes monomiaux et logarithmiques.  Théorème 7.28 (Delange). Soit F (s) := n1 an /ns une série de Dirichlet à coefficients positifs ou nuls, convergente pour σ > a > 0. On suppose que F (s) est holomorphe en tous les points de la droite σ = a autres que s = a et que l’on a, au voisinage de ce point et pour σ > a, 

1 j  1 F (s) = + g(s), g (s) log j (s − a)ω+1 s−a 0jq

où ω est un nombre réel quelconque, et les gj (s) et g(s), sont des fonctions holomorphes en s = a, le nombre gq (a) étant non nul. Alors :

342

II.7. THÉORÈMES TAUBÉRIENS

(i) si ω n’est pas un entier négatif, on a pour x infini  gq (a) xa (ln x)ω (ln2 x)q , A(x) := an ∼ aŴ (ω + 1) nx

(ii) si ω = −m − 1 avec m entier  0 et si q  1, on a pour x infini

A(x) ∼ (−1)m m!

qgq (a) xa (ln2 x)q−1 . a (ln x)m+1

§ 7.6. Nous avons donné ici la formulation classique de l’inégalité de Berry–Esseen, dans laquelle on suppose l’absolue continuité de l’une des deux fonctions de répartition. La même technique fournit un résultat en toute généralité, exprimé à l’aide de la fonction de concentration (7.68)

QG () := sup{G(z + ) − G(z)}

( > 0).

z

Elliott (1980, lemma 1.47) montre ainsi que la majoration     T   f (τ ) − g(τ )  1   dτ + (7.69) F − G∞ ≪ QG   T τ −T

est valable, uniformément en F et G, pour toute valeur du nombre réel positif T . Affinant un résultat d’Alladi (1987), Stef & Tenenbaum ont établi (2001) un analogue de l’inégalité de Berry–Esseen valable pour la transformée de Laplace bilatérale  e−uz dF (z) F( (u) := R

des fonctions de répartition.

Théorème 7.29 (Stef & Tenenbaum, 2001). Soient F , G deux fonctions de répartition, et h : R+ → R+ une fonction continue croissante au sens large et satisfaisant à la condition (7.70)

h(u) ≫ u4

(u  0).

Soient ε, κ , L des nombres réels satisfaisant à 0 < ε < 1/{3 + h(2)}, 0 < κ  L, et tels que   F( (u) − G(u) ( ε (i) (0  u  κ ),  ( (ii) F((u) + G(u) ≪ h |u| < ∞ (−L  u  L). Alors on a

ln L ln W  + (7.71) F − G∞ ≪ QG , L W où W est une solution quelconque de l’équation h(W ) = 1/ε. La constante implicite dans (7.71) dépend au plus de κ et des constantes implicites de (7.70) et (ii).

NOTES

343

Dans le cas particulier où G est absolument continue et à densité bornée, on obtient le corollaire suivant. Corollaire 7.30 (Stef & Tenenbaum). On conserve les hypothèses du Théorème 7.29 et l’on suppose en outre que : (iii) G est absolument continue avec G′ ∈ L∞ (R) ; (iv) ∃ϑ  1 : ln h(u) ≪ 1 + uϑ (0  u  L).

Alors (7.72)

F − G∞ ≪



ln | ln ε| ln L + L | ln ε|1/ϑ



G′ ∞

où la constante implicite dépend au plus de κ et des constantes implicites de (ii) et (iv). Ainsi qu’il est établi dans l’article de Stef & Tenenbaum, l’exposant de | ln ε| apparaissant dans (7.72) est optimal, au moins lorsque ϑ = 2k/(2k − 1) (k ∈ N∗ ).

§ 7.7. Le théorème de Newman mentionné dans les Notes du Chapitre II.1 est un autre exemple d’utilisation de l’holomorphie comme condition taubérienne. Nous en donnons ci-dessous une version intégrale due à Korevaar (1982) et Zagier (1997). Théorème 7.31 (Newman, 1980 ; Korevaar, 1982 ; Zagier, 1997). Soit f une fonction localement intégrable et bornée sur R+ , dont la transformée de Laplace  ∞ F (z) := f (t)e−tz dt, 0

initialement définie pour ℜe z > 0, est prolongeable analytiquement au demiplan ℜe z  0. Alors  ∞ f (t) dt = F (0). 0

T Démonstration. Posons FT (z) := 0 f (t)e−tz dt. C’est clairement une fonction entière de z . Nous devons montrer que FT (0) tend vers F (0) lorsque T → ∞. Soit R > 0 un paramètre destiné à tendre vers l’infini, et soit L la frontière du domaine D := {z ∈ C : |z|  R, ℜe z  −δ } où δ > 0 est assez petit (en fonction de R) pour que F soit holomorphe sur D. Alors, d’après la formule intégrale de Cauchy 

1 z 2  dz · {F (z) − FT (z)}ezT 1 + 2 (7.73) F (0) − FT (0) = 2π i L R z Soit C le bord du demi-cercle L ∩ {z : ℜe z > 0} et M := f ∞ . Comme on a   ∞   −zt  (ℜe z > 0) f (t)e dt  M e−T ℜe z /ℜe z |F (z) − FT (z)| =  T

344

II.7. THÉORÈMES TAUBÉRIENS

et (7.74)

   zT 2|ℜe z| z 2  1  e = eT ℜe z 1 +  R2 z  R2

(|z| = R),

on voit que, sur C , l’intégrande de (7.73) est borné en valeur absolue par 2M/R2 , ce qui implique que la contribution de C à l’intégrale de (7.73) est au plus M/R. Nous allons majorer la contribution de B := L  C en considérant F et FT séparément. Comme FT est entière, on peut remplacer B par le bord du demi-cercle C ′ := {z ∈ C : |z| = R, ℜe z < 0}. Comme    T  T  M e−ℜe zT   −zt (ℜe z < 0), |FT (z)| =  f (t)e dt  M e−ℜe zt dt =  0  |ℜe z| −∞

on voit grâce à (7.74) que   

 1 z 2  dz  M zT  ·  1+ 2 FT (z)e  2π i R z  R B Enfin, pour chaque R > 0 fixé, 1 T →∞ 2π i

lim



z 2  dz F (z)ezT 1 + 2 =0 R z B

d’après le théorème de Lebesgue. Il s’ensuit que

lim sup |F (0) − FT (0)|  2M/R. T →∞

Nous obtenons le résultat souhaité en faisant tendre R vers l’infini.

⊓ ⊔

§7.8. Landau a en fait montré une forme plus générale du Théorème 7.22 : si n1 g(n)/n = a en moyenne de Cesàro d’ordre k , et si g(n)  −K (n  1), alors on a (7.64) ; cf. Hardy (1949), th. 64. Notre démonstration du Théorème 7.24 est différente de celle de Skałba, qui cite le Corollaire 7.23 mais ne l’utilise pas. De profondes extensions des théorèmes taubériens arithmétiques ont été considérées par Erdos ˝ & Ingham (1964).

E XERCICES

 N 219. Soient {an }∞ ∈ R. On pose sn := 0mn am (n  0). n=0 ∈ R et b  (a) Calculer bN := (1/N ) 0nN sn en fonction de a0 , . . . ,aN . En déduire que, sous l’hypothèse lim bN = b,

(7.75)

N →∞

 une condition nécessaire et suffisante pour que la série n0 an converge vers b  est que l’on ait 0nN nan = o(N ) (N → ∞). (b) On suppose la condition (7.75) réalisée. (i)Calculer sn en fonction  de bn n et bn−1 . Montrer que les séries n convergent dans le disque unité s z et A(z) := S(z) := n n0 an z n0 ouvert.  (ii) Montrer que S(x) = (1 − x) n0 nbn xn pour 0 < x < 1. En déduire que limx→1− (1 − x)S(x) = b. On pourra poser bn = b + εn (n  0) où εn tend vers 0 et majorer E(x) := | n0 εn nxn |. (iii) Pour 0 < x < 1, écrire (1 − x)S(x) en fonction de A(x). (c) Soit K ∈ R. La condition inf n∈N nan > −K est-elle une condition taubériennesuffisante pour que l’hypothèse (7.75) implique la convergence vers b de la série n0 an ? 220. Déduire du Théorème 7.10 l’estimation(4)  μ(n) ln x ≪ (x → ∞). n ln2 x nx



d ω(n/d) , où ω(m) désigne le nombre des fac221. On pose an := d|n (−1) 2 teurs premiers distincts de m . Déterminer le comportement asymptotique de  −σ a n lorsque σ → 1 + . En déduire par le théorème de Karamata–Freud n n1 que

 an (ln x)3 ≪ n ln2 x

nx

(x → ∞).

4 Cette estimation non triviale est bien entendu beaucoup plus faible que (3.15), mais n’utilise qu’une information très fragmentaire sur la série de Dirichlet 1/ζ (s) associée à la fonction de Möbius.

346

II.7. THÉORÈMES TAUBÉRIENS

Montrer en employant la méthode de Selberg–Delange que l’on a  an ∼ C(ln x)2 (x → ∞) n nx

avec C := −(3 ln 2)/π 2 . 222.  Soit−σ{ap } une suite bornée indexée par les nombres premiers.  Montrer que si ap p tend vers une limite lorsque σ → 1+ alors la série ap /p converge. Montrer que le résultat est faux pour une suite indexée par les entiers. 223. Soit A une constante positive et {bn }∞ n=1 une suite complexe satisfaisant à |bn |  Aτ (n) pour tout entier n  1 et à 

 bn 1 (σ → 1+). = o (7.76) nσ (σ − 1)2 n1

  (a) Est-il vrai que l’on a nécessairement nx bn /n = o (ln x)2 (x → ∞) ?  (b) Même question pour la relation asymptotique nx bn = o(x ln x) lorsque x → ∞. (c) Soit {an }∞ n=1 une suite complexe bornée telle que

1   an (σ → 1+). = o nσ σ −1 n1  On suppose maintenant que bn := d|n ad . Montrer que l’on a (7.76). L’hypothèse supplémentaire concernant la structure de la suite n → bn implique-t-elle une modification de vos conclusions quant à la validité des relations considérées en (a) et (b) ? 224. Posons Z(s) := ζ ′ (s)/{sζ (s)}. Montrer que l’hypothèse ζ (1 + iτ ) = 0 pour τ = 0 implique, pour tout T fixé,  T  1  1  + lim  dτ = 0. Z(1 + 2σ + iτ ) − Z(1 + σ + iτ ) − σ →0+ −T 2σ + iτ σ + iτ

En déduire le théorème des nombres premiers par application du théorème d’Ikehara. 225. En utilisant les majorations élémentaires prouvées au § 4.2 ζ (k) (s) ≪ (ln |τ |)k+1 ,

ζ (s)−1 ≪ (ln |τ |)7

(|τ |  2, σ  1),

montrer que l’intégrale de l’Exercice 224 est ≪ σ (ln T )19 pour T  2, σ > 0. En déduire grâce au Théorème 7.13, l’estimation effective

(ln x)19   2 ψ (x) := . (n) = x + O x ln x nx

226. Utiliser la méthode de l’Exercice 225 pour établir la majoration



nx

&

μ(n) ≪ x

(ln2 x)17 · ln x

Indication : Utiliser la série de Dirichlet ζ (s) + 1/ζ (s).

'

EXERCICES

347

227. Théorème de Berry–Esseen. Soit X une variable aléatoire réelle, de moyenne nulle, de variance égale à 1, et de moment absolu d’ordre 3 fini ̺. On pose F (x) := Prob (X  x) (x ∈ R) et  +∞ eiτ x dF (x) (τ ∈ R). ϕ (τ ) := −∞

√ n Enfin, on désigne par Fn (x) la fonction de répartition de (1/ n) j=1 Xj , où les Xj sont des variables indépendantes de même loi que X . (a) Montrer que ̺  1.

(b) En utilisant les inégalités    1 1   iy (iy)j   |y|m+1 e − j! (m + 1)! 0jm

(y ∈ R, m  0)

et | ln(1 − y) + y|  |y|2 (|y|  21 ), montrer que

|ϕ (τ ) − 1|  21 τ 2 , |ϕ (τ ) − 1 + 12 τ 2 |  61 ̺ |τ |3      ln ϕ (τ ) + 12 τ 2   14 τ 4 + 61 ̺ |τ |3 (|τ |  1).

(τ ∈ R),

(c) Montrer que l’on a pour tout n  1  τ n   |τ |3 √ 2 2 τ4    (̺ |τ |  n). − e − τ /2  ≪ e − τ /4 ̺ √ + ϕ √ n n n

(d) Déduire de ce qui précède que l’on a  x   2 1 ̺   e−t /2 dt  C √ sup Fn (x) − √ n 2π −∞ x∈R

où C est une constante absolue convenable.(5)

228. Sur une idée de Wirsing (1956). Soient P un ensemble de nombres premiers, et ϑ la fonction indicatrice de l’ensemble des entiers dont tous les facteurs  premiers sont dans P. On pose T (x) := nx ϑ (n). On suppose l’existence de constantes δ > 0 et K > 0 telles que, lorsque x → +∞,   ϑ (p)  δx ∼ K(ln x)δ . , (ii) 1+ (i) ϑ (p) ∼ ln x p−1 px

px

(a) Montrer que, pour x → ∞, on a   ϑ (m) , (iii) ϑ (n) ln n ∼ δ x m nx

mx

(iv) T (x) ∼

δ x  ϑ (m) . ln x m mx

(b) Montrer que la relation (i) seule implique, lorsque σ → 0+,   ϑ (p) ϑ (p) = γ δ + o(1). (1 − p−σ ) − p p 1 +σ pexp(1/σ )

5

p>exp(1/σ )

Feller (1970) montre que la valeur C = 3 est admissible.

348

II.7. THÉORÈMES TAUBÉRIENS

En déduire que

 ϑ (m) ∼ e −γ δ m 1 +σ

m1



pexp(1/σ )

1−

ϑ (p) −1 p

(σ → 0+). (c) Mon-

trer que sous les hypothèses (i) et (ii), on a

T (x) ∼

δ Ke−γ δ x(ln x)δ−1 Ŵ (δ + 1)

(x → ∞).

229. Une réciproque d’un théorèmed’Ingham (Corollaire 7.23). Soit {an }∞ n=1 une suite complexe bornée telle que n1 an /n = a. (a) Montrer que, pour tout y > 1 fixé, on a     N/m   an N dt = o(N ). = an n n 0 N/y 0 (1  j  k). 1jk

ν

Pour chaque indice j , soit gj une racine primitive modulo pjj , i.e. un générateur ν de (Z/pjj Z)∗ . Alors pour chaque entier m tel que (m,q) = 1, on peut définir de manière unique ε(m), η(m), μj (m) (1  j  k) satisfaisant à

m ≡ (−1)ε(m) 5η(m) (mod 2ν ), ε(m) = 0 ou 1, 0  η(m) < 2ν −2 , μ (m)

m ≡ gj j

ν

ν

(mod pjj ), 0  μj (m) < ϕ (pjj ) (1  j  k).

Si ν = 0 ou 1, nous convenons que ε(m) = 0. Avec ces notations, les caractères de (Z/qZ)∗ sont les ϕ (q) fonctions définies sur ce groupe par   λj μj (m)   λε(m) λ′ η(m) m ∈ (Z/qZ)∗ + ν −2 + (8.6) χ (m) = e νj 2 2 ϕ (pj ) 1jk

lorsque l’on choisit arbitrairement les paramètres λ, λ′ , λj de façon que λ = 0 ou 1,

0  λ′ < 2ν −2 ,

ν

0  λj < ϕ (pjj )

(1  j  k).

8.1. INTRODUCTION. CARACTÈRES DE DIRICHLET

353

Définition 8.2. On appelle caractère de Dirichlet de module q (ou : modulo q ) la fonction arithmétique prolongeant un caractère χ du groupe (Z/qZ)∗ selon la formule  χ (m), si n ≡ m (mod q), 1  m  q , (m,q) = 1, (8.7) χ (n) = 0, si (n,q) > 1. Exemples. (i) L’unique caractère non trivial modulo 3 est défini par  e(m/3) − e(−m/3) 1 si m ≡ 1 (mod 3), √ χ3 (m) := = − 1 si m ≡ 2 (mod 3). i 3 (ii) Soit χ4 l’unique caractère non trivial modulo 4. On a nécessairement χ4 (1) = 1, χ4 (−1) = −1, donc χ4 (2n + 1) = (−1)n pour tout n  0. (iii) Comme 2 est racine primitive modulo 5, on a m ≡ 2μ2 (m) (mod 5) où μ2 est définie sur (Z/5Z)∗ par μ2 (1) = 4, μ2 (2) = 1,

μ2 (3) = 3,

μ2 (4) = 2.

En choisissant λ2 = 2, on définit un caractère de Dirichlet modulo 5 par  1 si n ≡ ±1 (mod 5), μ2 (n) χ (n) = (−1) = −1 si n ≡ ±2 (mod 5) et, bien entendu, χ (n) = 0 si n ≡ 0 (mod 5). C’est le seul caractère réel modulo 5, et l’on constate aisément qu’il est égal au symbole de Legendre. D’une manière générale, le symbole de Jacobi modulo un nombre impair q est le caractère donné par la formule     n νj   n := n ∈ (Z/qZ)∗ . = (−1) 1jk νj μj (n) χ (n) = q pj 1jk

La propriété d’homomorphisme des caractères de (Z/qZ)∗ se traduit par le fait qu’un caractère de Dirichlet est une fonction arithmétique complètement multiplicative. Le Théorème 8.1 permet d’énoncer les relations fondamentales suivantes. Nous désignons, comme c’est l’usage, par caractère principal, et notons χ0 , le prolongement du caractère unité, soit  1 si (n,q) = 1, (8.8) χ0 (n) = 0 si (n,q) > 1. Théorème 8.3 (Relations d’orthogonalité). (a) Pour tous entiers n,m  1, on a   1 si n ≡ m(mod q) et (m,q) = 1, 1 χ (n)χ (m) = (8.9) 0 dans le cas contraire. ϕ (q) χ (mod q)

(b) Pour tous caractères de Dirichlet χ,χ ′ , de module q , on a   1 1 si χ = χ ′ , ′ (8.10) χ (n)χ (n) = 0 dans le cas contraire. ϕ (q) 1nq

354

II.8. NOMBRES PREMIERS EN PROGRESSIONS ARITHMÉTIQUES

1.2. Caractères primitifs Certains résultats de la théorie prennent une forme plus simple pour une classe particulière de caractères, appelés caractères primitifs. Définition 8.4. On dit qu’un caractère de Dirichlet χ de module q est primitif s’il n’existe aucun caractère χ1 de module q1 < q , tel que χ (n) = χ1 (n) pour tout entier n premier à q . Lorsqu’un tel caractère χ1 existe, on dit que χ1 induit χ. On a alors, trivialement, (8.11)

(m,q) = (n,q) = 1 et m ≡ n (mod q1 ) ⇒ χ (m) = χ (n).

Réciproquement, si q1 satisfait (8.11), il est facile de montrer grâce au théorème chinois que, pour tout entier n satisfaisant à (n,q1 ) = 1, il existe un entier t tel que (n + tq1 ,q) = 1.(4) On peut alors poser χ1 (n) := χ (n + tq1 ), la définition étant indépendante de t choisi comme indiqué. Cela définit bien un caractère de Dirichlet χ1 de module q1 : χ1 est par construction périodique modulo q1 et l’on a lorsque (mn,q1 ) = 1, pour des entiers convenables s et t, χ1 (mn) = χ ((m + sq1 )(n + tq1 )) = χ (m + sq1 )χ (n + tq1 ) = χ1 (n)χ1 (m). Il est alors évident que χ1 induit χ. Nous avons donc établi qu’une condition nécessaire et suffisante pour qu’un caractère χ soit primitif est que q soit le plus petit des entiers q1 vérifiant (8.11). Si χ1 de module q1 < q induit χ et si q1 est minimal, alors q1 |q puisque, si la relation (8.11) est satisfaite pour q1 , elle l’est également pour (q ,q1 ). Proposition 8.5. Chaque caractère de Dirichlet χ non primitif de module q est induit par un unique caractère primitif χ1 modulo un diviseur propre q1 de q . Lorsque (n,q1 ) = 1, on a χ1 (n) := χ (n + tq1 ), où t est un entier quelconque tel que (n + tq1 ,q) = 1. Démonstration. Soient χ un caractère non primitif de module q et q1 < q le plus petit entier vérifiant (8.11). Nous avons vérifié plus haut que l’application χ1 définie comme indiqué dans l’énoncé est un caractère de Dirichlet induisant χ . On a χ1 (1) = χ (1) = 1, donc χ1 n’est pas identiquement nul. De plus, χ1 est nécessairement primitif puisque si (m,q1 ) = (n,q1 ) = 1 et m ≡ n (mod q2 ) impliquent χ1 (m) = χ1 (n), alors q2 vérifie (8.11) et donc q2  q1 , d’après la propriété de minimalité de q1 . Établissons ensuite l’unicité. Si χ2 est un caractère primitif de module q2 induisant χ, alors q2 vérifie (8.11) et donc q2 = q1 en vertu de la minimalité de q1 . Soit n tel que (n,q1 ) = 1. Alors on a (n + tq1 ,q) = 1 pour un entier t convenable. Donc χ2 (n) = χ2 (n + tq1 ) = χ (n + tq1 ) = χ1 (n). Ainsi χ1 = χ2 . ⊓ ⊔ 4

En effet, n + tq1 est identiquement premier avec tout facteur premier p de q1 puisque (n,q1 ) = 1, et n + tq1 peut être rendu premier avec tout facteur premier p de q ne divisant pas q1 puisque q1 est inversible modulo p.

8.1. INTRODUCTION. CARACTÈRES DE DIRICHLET

355

On désigne habituellement par conducteur d’un caractère de Dirichlet le module du caractère primitif qui l’induit, qui est donc également le plus petit module d’un caractère qui l’induit.

1.3. Sommes de Gauss Définition 8.6. Soit χ un caractère de Dirichlet de module q . On appelle somme de Gauss relative à χ la fonction arithmétique définie par  G(n,χ ) := χ (m)e(mn/q) (n  1). 1mq

Théorème 8.7. Soit χ un caractère primitif de module q . Alors on a

G(n,χ ) = χ (n)G(1,χ )

(8.12)

(n  1).

Démonstration. Si χ = χ0 , la condition de primitivité implique q = 1, et le résultat est trivial. Nous pouvons donc supposer dans la suite que χ n’est pas principal. Si (n,q) = 1, on a   χ (n)G(1,χ ) = χ (n)χ (m)e(m/q) = χ (n)χ (nh)e(nh/q) = G(n,χ ), 1mq

1hq

puisque nh parcourt un système complet de résidus modulo q lorsque h varie dans [1,q]. Il est d’ailleurs à noter que cette relation est valable même si χ n’est pas primitif. Lorsque (n,q) > 1, nous devons montrer que G(n,χ ) = 0. Posons d = (n,q), n = dn1 , q = dq1 , de sorte que (n1 ,q1 ) = 1. Nous pouvons supposer que q1 > 1 : dans le cas contraire, on a q|n, d’où  G(n,χ ) = χ (m) = 0. 1mq

Nous devons donc établir la relation  (8.13) χ (m)e(mn1 /q1 ) = 0. 1mq

Décomposons chaque entier m ∈ [1,q] sous la forme m = uq1 + v avec 0  u < d, 1  v  q1 . Alors e(mn1 /q1 ) = e(vn1 /q1 ) et le membre de gauche de (8.13) vaut   e(vn1 /q1 ) χ (uq1 + v). 1vq1

0u 0, ce qui détermine en fait l’abscisse de convergence. Associé aux relations d’orthogonalité, le développement eulérien (8.23) permet de repérer les nombres premiers en progression arithmétique. Comme dans le cas de la fonction zêta de Riemann, on a recours à la dérivation logarithmique. Théorème 8.12. Pour tous entiers a,q , (a,q) = 1, on a  (n) L′ −1  (s,χ ) (8.25) χ (a) = ns ϕ (q) χ L

(σ > 1)

n1 n≡a (mod q)

où la sommation sur χ est étendue aux ϕ (q) caractères de Dirichlet de module q . Démonstration. Par (8.23), on a pour tout χ   χ (pν ) ln p  χ (n)(n)  χ (p) ln p −L′ (s,χ ) = = = . L ps − χ (p) pν s ns p p ν 1

n1

Le résultat découle donc de (8.9) avec m = a, par interversion de sommations dans le membre de droite de (8.25). ⊓ ⊔ La série de Dirichlet (8.25) est la transformée de Mellin–Stieltjes de  (8.26) ψ (x; a,q) := (n). nx n≡a (mod q)

Comme dans le cas de la fonction classique de Tchébychev ψ (x) = ψ (x; 1,1), une intégration par parties permet de relier les comportements asymptotiques de ψ (x; a,q) et de la fonction de comptage des nombres premiers de la progression arithmétique correspondante, i.e.  (8.27) π (x; a,q) := 1. px p≡a (mod q)

Le théorème de Dirichlet cité au début de ce chapitre signifie que l’expression (8.27) tend vers l’infini avec x pour tous a,q fixés avec (a,q) = 1. En fait, Dirichlet a établi un résultat plus précis qui implique qu’en un certain sens les

360

II.8. NOMBRES PREMIERS EN PROGRESSIONS ARITHMÉTIQUES

nombres premiers sont harmonieusement répartis parmi les ϕ (q) classes résiduelles possibles. Il a montré que l’on a  1 ln2 x ∼ (x → ∞). (8.28) p ϕ (q) px p≡a (mod q)

Cette estimation découle immédiatement de l’hypothèse

L(1,χ ) = 0

(8.29)

(χ = χ0 )

grâce au théorème de Hardy–Littlewood–Karamata (Corollaire 7.9). En effet, on déduit de (8.25) et (8.29) que l’on a, pour a et q fixés,  (n) −L′ (σ ,χ0 ) + Oq (1) = (σ > 1), (8.30) nσ ϕ (q)L(σ ,χ0 ) n1 n≡a (mod q)

et, par (8.24), on a dans les mêmes conditions  ln p L′ ζ′ 1 (8.31) − (σ ,χ0 ) = − (σ ) − = + Oq (1). L ζ pσ − 1 σ −1 p|q

En appliquant le Théorème 7.10 de Karamata–Freud, on obtient même la forme avec reste

ln x   (n) ln x = + Oq (8.32) n ϕ (q) ln2 x nx n≡a (mod q)

d’où l’on tire par sommation d’Abel une version effective de (8.28), soit  1 ln2 x = + Oq (ln3 x) (x → ∞). (8.33) p ϕ (q) px p≡a (mod q)

En fait, comme l’a montré Mertens (1874), on peut déduire du fait que L(1,χ ) = 0 une amélioration de (8.33).

Théorème 8.13 (Mertens). Si L(1,χ ) = 0 pour tout caractère non principal de module q , alors on a, pour tout a tel que (a,q) = 1,

1   1 ln2 x = + c(a,q) + O (x → ∞) (8.34) p ϕ (q) ln x px p≡a (mod q)

avec

  1   χ (p)   1 1 − + ln c(a,q) := χ (a) γ− ϕ (q) 1 − 1/p p p p p χ =χ0

8.2. SÉRIES L. LE THÉORÈME DE LA PROGRESSION ARITHMÉTIQUE

361

Démonstration. La relation de convolution χ ln = χ ( ∗ 1) = χ  ∗ χ implique  χ (m)(m)  χ (d)  χ (n) ln n = . n m d nx

mx

dx/m

Par sommation d’Abel, on voit que la somme intérieure vaut L(1,χ ) + O(m/x), d’où  χ (m)(m)  χ (n) ln n = L(1,χ ) + O(1) n m nx

mx

= L(1,χ )

 χ (p) ln p + O(1). p

px

Comme le membre de gauche converge par la règle d’Abel, on en déduit que, sous l’hypothèse L(1,χ ) = 0,  χ (p) ln p ≪ 1. p px

Une sommation d’Abel permet alors d’établir la convergence de formule asymptotique

1   χ (p)  χ (p) = +O (x → ∞). p p ln x p



p

χ (p)/p et la

px

Cela implique immédiatement le résultat annoncé par combinaison linéaire de caractères. ⊓ ⊔ Remarque. Si R(x) désigne le terme d’erreur de (8.34), on a  x li(x) + π (x; a,q) = {R(x) − R(t)} dt + O(1). ϕ (q) 2 Ainsi, on voit que le théorème des nombres premiers en progressions arithmétiques équivaut à R(x) = o(1/ ln x) : cela résulte immédiatement de la formule ci-dessus pour la condition suffisante, et la réciproque relève, par exemple, de la technique élémentaire employée au Corollaire I.3.9(vi).

2.2. Sur les nombres L(1,χχ )

! Nous avons vu plus haut que l’hypothèse χ =χ0 L(1,χ ) = 0 implique l’équirépartition des nombres premiers en progressions arithmétiques sous la forme (8.34).(5) Réciproquement, nous déduisons immédiatement de la relation (8.34) que, pour χ = χ0 ,   χ (p) = χ (a)c(a,q). p p 1aq (a,q)=1

5 Cette assertion résulte également du théorème taubérien de Hardy–Littlewood–Karamata tel qu’énoncé au Théorème 7.7. Voir par exemple l’Exercice 222, p. 368.

362

II.8. NOMBRES PREMIERS EN PROGRESSIONS ARITHMÉTIQUES

Cette formule implique à son tour, par sommation d’Abel, que  ∞  χ (p) χ (p) dx = (σ − 1) F (σ ,χ ) := σ p p xσ 1 p px

tend vers une limite finie lorsque σ → 1+. Comme

L(σ ,χ ) = eF (σ ,χ )

 e−χ (p)/pσ , 1 − χ (p)/pσ p

où, pour tout σ  1, le produit infini converge absolument et uniformément vers une limite non nulle, on en déduit que L(1,χ ) = 0. Ainsi, on peut formellement ! énoncer que la validité de (8.34) pour tout a premier avec q équivaut à χ =χ0 L(1,χ ) = 0.

Comme nous le verrons plus loin, la valeur de L(1,χ ) joue un rôle particulier dans la théorie lorsque χ est un caractère de Dirichlet primitif réel. La relation (8.19) nous permet de donner une formule finie pour cette quantité. Notons à ce stade que, pour χ réel, on a   G(χ ) = χ (m)e(m/q) = χ (−1) χ (m)e(−m/q) = χ (−1)G(χ ) 1mq

1mq

donc G(χ ) est réel si χ (−1) = 1, imaginaire pur si χ (−1) = −1. Théorème 8.14. Soit χ un caractère de Dirichlet réel primitif, de module q > 1. On a ⎧ −iπ  ⎪ ⎪ si G(χ ) ∈ iR, mχ (m) ⎪ ⎨ qG(χ ) 1m 0, et considérons l’expression  F (α,σ ) := fσ (n)e−αn . n1

D’une part, on a

F (α,σ ) 



n

2(1−σ ) −α n2

e





2

t2(1−σ ) e−αt dt

1

n1

(8.58)



 21 α σ −3/2 Ŵ

3 2



−σ −

√ 1 1  21 π α σ −3/2 − · 3 − 2σ 3 − 2σ

D’autre part, en revenant à la définition de fσ , on peut aussi écrire



F (σ ,α ) =

χ (d)d1−σ e−α md =

m, d1



χ (d)

d1

L(σ ,χ )  d1−σ = − χ (d)h(d) α d e −1 α d1

où l’on a posé

g(t) :=

1 1 − t , t e −1

h(t) := t1−σ g(α t).

On vérifie facilement que h est positive et décroissante sur [1, + ∞[. De plus, h′ est négative et croissante sur le même intervalle. Nous pouvons donc écrire  ∞  ∞ L(σ ,χ ) =− h(t) dK(t) = K(t)h′ (t) dt F (α,σ ) − α 1− 1   q+1  q+1    1 ∞ ′ ′ ′ = |K(t)| |h (t)| + K(t) h (t + jq) dt  |h (v)| dv dt q t 1 1 j0 8  q+1  q+1  2 M2 (χ ) h(t)  dt  √ = h(t) − qh′ (t) dt |K(t)| − h′ (t) + q q 1 1 8  q+1 2 h(t) − qh′ (t) dt  13 1

√ en vertu de l’inégalité M2 (χ )  q/3, qui découle de (8.38) compte tenu de nos réductions liminaires. À ce stade, nous observons que, pour t > 0, et {t2 − (2 sh t/2)2 } t2 et − (et − 1)2 =  0, 2 t 2 t (e − 1) t2 (et − 1)2 et (1 + et ) 2{(sh t/2)3 − (t/2)3 ch t/2} 2 =  0, g ′′ (t) = 3 − t 3 t (e − 1) (t sh t/2)3 g ′ (t) =

où la dernière inégalité peut être établie en observant que ϕ (u) := (sh u)3 − u3 ch u vérifie ϕ (0) = 0 et ϕ ′ (u) = 3 ch u{(sh u)2 − u2 } − u3 sh u  u3 (u ch u − sh u)  0. De plus  (2k − 1)B2k t2k−2 (|t| < 2π ), g ′ (t) = − (2k)! k1

8.3. MINORATION DE |L(s, χ)| POUR σ  1. PREUVE DU THÉORÈME 8.16

369

où les B2k désignent les nombres de Bernoulli. En particulier, g ′ est continue en 0 1 et vérifie g ′ (0) = − 12 B2 = − 12 . Il suit, pour 1  t  q + 1,

h(t)  g(0) = 12 , |h′ (t)|  et donc  q+1 1

2 h(t) − qh′ (t) dt 



q+1 1

α σ −1 (σ − 1)g(0) + α |g ′ (0)| = + t 2t 12

 q 2 (σ − 1)2 (α q + 6)2  dt + 2 2t 72

 12 (σ − 1)2 q 2 +

1 72 (α q

+ 6)2 q 

1 128 q

+

1 72 q(α q

+ 6)2 .

Posons α = λ/q et reportons dans l’inégalité initiale. Nous obtenons, en majorant 1 1 par 72 , 128  λ 1 + (λ + 6)2 √ · L(σ ,χ )  α F (α,σ ) − 18 2q En insérant (8.58), il suit    λ 42{1 + (λ + 6)2 } λ π λ λ σ −1 1 − · L(σ ,χ )  2 − √ q q q(3 − 2σ ) 144 q Choisissons λ =



1 5

9 et observons que (8q)1−σ  (8q)−3/(25 q) > 10 . Il vient √ √ 9 5π 1 1 493 √ − L(σ ,χ ) q  − √ > · 100 450 6 5 3 − 6/5

Si χ est induit par un caractère primitif χ1 , de module q1 , nous avons  √   q1 1 χ1 (p) 1  √ L(σ ,χ1 )  √ > √ · 1− L(s,χ )  L(σ ,χ1 ) p 2 q 9 q 6 2q

⊔ ⊓

p|q,p+q1

Théorème 8.22. Il existe une constante absolue c0 > 0 telle que l’on ait pour χ 2 = χ0 , χ = χ0 , σ  1,  6 si |τ | > c0 q −1/2 (ln 2q)−2 , L (L + 1/|τ |) (8.59) L(s,χ )−1 ≪ √ q si |τ |  c0 q −1/2 (ln 2q)−2 . Démonstration. La seconde des évaluations annoncées découle immédiatement des Théorèmes 8.18 et 8.21. Un développement de Taylor à l’ordre 1 fournit en effet pour tout τ , |τ |  1,  |L(s,χ )|  L(σ ,χ ) + O τ (ln 2q)2 , d’où l’estimation requise, compte tenu de (8.57).

370

II.8. NOMBRES PREMIERS EN PROGRESSIONS ARITHMÉTIQUES

Nous pouvons donc supposer que |τ | ≫ q −1/2 (ln 2q)−2 . Nous employons alors la méthode du Théorème 8.20. Soit η un paramètre positif. Posons σ0 = σ + η, s0 = σ0 + iτ , s1 = σ0 + 2iτ . On a   (1 − p−σ0 )−1 (L + 1/|τ |). (1 − p−s1 )ζ (s1 ) ≪ L(s1 ,χ0 ) = p|q

p|q

Il découle donc de (8.49) que  (1 − p−σ0 )−2 ζ (σ0 )−3 (L + 1/|τ |)−1 . L(s0 ,χ )4 ≫ p|q

Grâce à (8.47) on en déduit l’existence de deux constantes absolues positives C3 et C4 telles que

|L(s,χ )|  C3 η3/4 (L + 1/|τ |)−1/4 − C4 ηL2 .

En choisissant η = C5 (L + 1/|τ |)−1 L−8 avec C5 convenable, on obtient la minoration souhaitée. ⊓ ⊔ Preuve du Théorème 8.16. Nous appliquons le Théorème 7.13 à la série (8.25). Si G(s) est définie par (8.42), nous obtenons

1 1 

x (8.60) ψ (x; a,q) = ,T + O x min +η T 64 T ϕ (q) ln x avec  T   G(2σ + iτ ) − G(σ + iτ ) dτ (σ > 0). (8.61) η(σ ,T ) := −T

Nous évaluons cette dernière quantité en majorant |G′ (s)|. On a 1  ′ |Z (s,χ )| (8.62) G′ (s) ≪ ϕ (q) χ avec

⎧  ln p −ζ ′ (s + 1) 1 1 ⎪ ⎪ ⎪ ⎨ (s + 1)ζ (s + 1) − s + (s + 1) ps p|q Z(s,χ ) := ⎪ −L′ (s + 1,χ ) ⎪ ⎪ ⎩ (s + 1)L(s + 1,χ )

(χ = χ0 ), (χ = χ0 ).

Grâce aux estimations du § 4.2, concernant ζ (s), et aux Théorèmes 8.18, 8.20, 8.22, relatifs à L(s,χ ), χ = χ0 , on obtient, après un calcul de routine, pour σ  0 ⎧ 18 L /|s + 1| si χ 2 = χ0 ou |τ | > (ln 2q)−1 , ⎪ ⎪ ⎪ ⎨ si χ 2 = χ0 et c0 (ln 2q)−2 q −1/2 < |τ |  (ln 2q)−1 , Z ′ (s,χ ) ≪ L16 /|τ |2 ⎪ ⎪ ⎪ ⎩ 4 L q si χ 2 = χ0 et |τ | < c0 (ln 2q)−2 q −1/2 . Reportons dans (8.62) puis (8.61), en tenant compte de (8.52). Il vient η(σ ,T ) ≪ σ L(q ,T )19 . En choisissant T = (ln x)/(ln2 x)19/2 , nous obtenons par (8.60) la formule annoncée pour ψ (x; a,q). ⊓ ⊔

8.4. L’ÉQUATION FONCTIONNELLE DES FONCTIONS L(S, χ)

371

8.4. L’équation fonctionnelle des fonctions L(s, χ ) Théorème 8.23. Soit χ un caractère primitif de module q . On pose α = α (χ ) := 21 {1 − χ (−1)}. Alors la fonction L(s,χ ) est prolongeable méromorphiquement au plan complexe tout entier, avec pour seule singularité un pôle simple, de résidu 1, en s = 1 lorsque χ = 1. De plus, L(s,χ ) satisfait l’équation fonctionnelle ξ (s,χ ) = E(χ )ξ (1 − s,χ )

(s ∈ C)

où l’on a posé ξ (s,χ ) :=

π − 21 (s+α) s + α  L(s,χ ), Ŵ q 2

E(χ ) :=

Remarque. Lorsque χ n’est pas primitif, on a  (1 − χ1 (p)/ps ) (8.63) L(s,χ ) = L(s,χ1 )

G(1,χ ) √ . iα q

(σ > 1)

p|q, p ∤ q1

où χ1 est le caractère primitif induisant χ. On en déduit une extension évidente des propriétés de prolongement de L(s,χ ). Démonstration. Montrons d’abord que L(s,χ ) est prolongeable en une fonction méromorphe dans tout le plan complexe. La méthode utilisée pour la fonction ζ (s) s’applique sans induire de difficulté nouvelle. Nous nous bornons à indiquer les étapes essentielles. Posant  −1   W (t,χ ) := χ (n)e−nt = 1 − e−qt χ (a)e−at (t > 0), n1

on a

Ŵ (s)L(s,χ ) =

1a 1).

0

Nous obtenons un prolongement analytique de cette intégrale en remplaçant la demi-droite d’intégration par le contour de Hankel C̺ (voir p. 248) où ̺ est un paramètre réel, 0 < ̺ < 2π /q . Comme la fonction z → z s−1 (1 − e−qz )−1 est holomorphe dans la bande horizontale |ℑm z| < 2π privée de la demi-droite [0, + ∞[, l’intégrale  z s−1 W (z ,χ ) dz , I(s,χ ) := C̺

est indépendante de ̺ dans ]0,2π /q[. Elle est absolument convergente pour chaque s ∈ C et uniformément convergente sur tout compact. C’est donc une fonction entière de s. On a   ∞ I(s,χ ) = W (z ,χ )z s−1 dz + (e2π is − 1) ts−1 W (t,χ ) dt. |z|=̺

̺

Compte tenu de la majoration |z s−1 (ez − 1)−1 | ≪s ̺ σ −2 (|z| = ̺  π ), on obtient, en faisant tendre ̺ vers 0,

I(s,χ ) = (e2π is − 1)Ŵ (s)L(s,χ )

(σ > 1).

372

II.8. NOMBRES PREMIERS EN PROGRESSIONS ARITHMÉTIQUES

En utilisant la formule des compléments, on parvient donc à l’expression e−iπ s Ŵ (1 − s)I(s,χ ), (8.64) L(s,χ ) = 2π i qui fournit le prolongement analytique dans le plan complexe tout entier. Les seules singularités possibles de L(s,χ ) sont donc les entiers positifs. Comme L(s,χ ) converge pour σ > 0 lorsque χ = χ0 , on voit que L(s,χ ) est dans ce cas prolongeable en une fonction entière. La formule (8.24) implique que le prolongement de L(s,χ0) possède une unique singularité, en s = 1, qui est un pôle simple de résidu ϕ (q)/q . Ce résidu vaut donc 1 lorsque χ est principal et primitif. Établissons à présent l’équation fonctionnelle. Soit Hk := C̺k le contour de Hankel ayant pour paramètre ̺k := (2k + 1)π /q , k  1. Alors, pour 1  a  q , z = ̺k eiϑ , la quantité

|e−az | e(2k+1)(1−a/q)π cos ϑ = (2k+1)π cos ϑ +i(2k+1)π sin ϑ −qz |1 − e | |e − 1| reste bornée lorsque ϑ parcourt [0,2π ], et l’on a donc     W (z ,s)z s−1 dz  ≪s k σ . (8.65)  Hk

Soit ̺ tel que 0 < ̺ < 2π /q . Le contour C̺ − Hk entoure, dans le sens inverse, les pôles zn = 2nπ i/q (n = ±1, ± 2, . . . , ± k). Le théorème des résidus implique donc  I(s,χ ) = z s−1 W (z ,χ ) dz C̺

=



Hk

=





z s−1 W (z ,χ ) dz −

2π i q

z s−1 W (z ,χ ) dz +

2π i s

Hk

q

(zn )s−1



χ (a)e−azn

1aq

1|n|k

{eiπ s − χ (−1)}



G(n,χ )ns−1 .

1nk

−iπ α

On a χ (−1) = 1 − 2α = e . Compte tenu de (8.65), on obtient pour chaque s du demi-plan σ < 0, en faisant tendre k vers l’infini, 2π i s   G(n,χ )ns−1 . I(s,χ ) = eiπ s − e−iπ α q n1

D’après le Théorème 8.8, on a G(n,χ ) = χ (n)G(1,χ ) lorsque χ est primitif. Il suit 2π i s  I(s,χ ) = eiπ s − e−iπ α G(1,χ )L(1 − s,χ ). q

En reportant dans (8.64), on obtient la forme asymétrique de l’équation fonctionnelle

2π s √q sin 21 π (s + α ) Ŵ (1 − s)L(1 − s,χ ), (8.66) L(s,χ ) = E(χ ) q π

qui est donc valide pour tout s par prolongement analytique. On en déduit l’équation fonctionnelle sous la forme indiquée dans l’énoncé grâce aux formules des compléments et de duplication pour Ŵ. ⊓ ⊔

8.5. FORMULE DU PRODUIT DE HADAMARD ET RÉGIONS SANS ZÉRO

373

Remarque. Les zéros triviaux de L(s,χ ) sont situés aux points −2k (k  0) lorsque α = 0, c’est-à-dire χ (−1) = 1, et aux points −2k − 1 (k  0) lorsque α = 1, c’està-dire χ (−1) = −1.

8.5. Formule du produit de Hadamard et régions sans zéro Conservons les notations α = α (χ ) et E(χ ) du Théorème 8.23. Nous allons développer

q (s+α)/2  ξ (s,χ ) := Ŵ 21 (s + α ) L(s,χ ) π en produit de Hadamard en utilisant une technique voisine de celle qui a été employée au chap. II.3 pour la fonction zêta. Théorème 8.24. Soit χ un caractère primitif non principal de module q . Alors L(s,χ ) possède une infinité de zéros ̺ dans la bande critique et l’on a  (8.67) ξ (s,χ ) = eA+Bs (1 − s/̺ )es/̺ (s ∈ C) ̺

où les zéros sont comptés avec multiplicité. Le produit infini est absolument convergent et l’on a    A = A(χ ) := log Ŵ 21 (1 + α ) (q/π )(1+α)/2 E(χ )L(1,χ )

B = B(χ ) :=

ξ′ ξ′ (0,χ ) = − (1,χ ). ξ ξ

Démonstration. La preuve est semblable à celle qui a été effectuée pour la fonction ζ (s) ; nous nous contentons d’en indiquer les grandes lignes. On a d’abord, avec les notations (8.16) et (8.17),   ∞   ∞  K(x)  dx   2H(χ )|s| (σ  21 ). |L(s,χ )| = s dx  |s|H(χ ) s+1 x x3/2 1 1 Cela implique que ξ (s,χ ) est une fonction entière d’ordre 1. Posons

N (T ,χ ) := |{̺ : L(̺,χ ) = 0, |ℑm ̺ |  T }|. Il est à noter que les zéros ne sont plus nécessairement disposés de manière symétrique par rapport à l’origine. On montre alors par intégration complexe (8.68)

1 N (T ,χ ) 2

=

qT T T ln − + O(ln qT ) (T  2). 2π 2π 2π

Les détails sont essentiellement identiques à ceux du cas de ζ (s), mais il est plus commode de considérer le rectangle R de sommets 52 ± iT , − 32 ± iT , de manière à éviter l’éventuel zéro trivial en s = −1. Ainsi, R contient toujours exactement un zéro trivial de L(s,χ ), soit en 0, soit en −1.

374

II.8. NOMBRES PREMIERS EN PROGRESSIONS ARITHMÉTIQUES

L’estimation de N (T ,χ ) implique la convergence du produit infini, disons P (s,χ ), sur les zéros et l’on en déduit comme dans le cas de ζ (s) que log{ξ (s,χ )/P (s,χ )} est une fonction affine de s. ⊓ ⊔ Les régions sans zéro sont essentiellement identiques à celles de la fonction zêta, à l’exception d’un éventuel zéro réel. Le résultat est essentiellement dû à Landau (1918), l’application aux caractères primitifs ayant initialement été obtenue par Page (1935). Théorème 8.25 (Landau–Page). Il existe une constante absolue c > 0 telle que la région

Dq := {s ∈ C : σ > 1 − c/ ln qT } (T := |τ | + 2) ! contienne au plus un zéro de χ (mod q) L(s,χ ) et au plus un zéro de   L(s,χ ). (8.69)

q1 q χ (mod q1 ) χ primitif

Dans les deux cas, l’éventuel zéro exceptionnel est réel, simple, et correspond à un caractère réel. On conjecture que l’éventuel zéro exceptionnel (couramment appelé « zéro de Siegel ») n’existe pas. La conjecture la plus forte dans cette direction est que tous les zéros des fonctions L sont situés sur la droite critique σ = 21 — c’est l’hypothèse de Riemann généralisée. La démonstration du Théorème 8.25 repose essentiellement sur le lemme suivant qui est lui-même une conséquence de la formule du produit et de l’équation fonctionnelle des fonctions L(s,χ ). Nous conservons la convention de désigner par ̺ = β + iγ un zéro générique de L(s,χ ). Lemme 8.26. Il existe une constante absolue c0 telle que l’on ait, pour tout caractère χ non principal de module q  1 L′ (8.70) −ℜe (s,χ )  c0 ln qT − (σ > 1, T = |τ | + 2) ℜe L s − ̺ ̺

où la série est à termes positifs ou nuls. Démonstration. On peut supposer sans perte de généralité que χ est primitif puisque, si χ1 est le caractère primitif induisant χ, la relation (8.63) implique  L′   ln p L′    ln q (σ > 1). (8.71)  (s,χ ) − (s,χ1 )  L L pσ − 1 p|q

8.5. FORMULE DU PRODUIT DE HADAMARD ET RÉGIONS SANS ZÉRO

375

Par dérivation de la formule du produit (8.67),

(8.72)

−ℜe

L′ (s,χ ) L  1 Ŵ′ 1 1 q = 21 ln + ℜe . ( 2 s + 21 α ) − ℜe B(χ ) − ℜe + π 2Ŵ s−̺ ̺ ̺

Comme χ est supposé primitif, l’équation fonctionnelle ξ (s,χ ) = E(χ )ξ (1 − s,χ ) fournit, par dérivation logarithmique, ξ′ ξ′ (s,χ ) = − (1 − s,χ ). ξ ξ Pour s = 0, on obtient par la formule du produit  1 1 B(χ ) = −B(χ ) − + ̺ 1−̺ ̺ car ̺ décrit les zéros de L(s,χ ) lorsque ̺ décrit ceux de L(s,χ ). Mais on a B(χ ) = B(χ ), comme on peut le voir facilement en utilisant la formule

B(χ ) = −

Ŵ′ 1 1 ξ′ L′ (1,χ ) = − 21 ln(q/π ) − ( 2 + 2 α ) − (1,χ ). ξ 2Ŵ L

Il suit 2ℜe B(χ ) = −ℜe

1 ̺

̺

+

1 · 1−̺

Dans cette série à termes positifs ou nuls, et donc permutables, on peut remplacer 1 − ̺ en ̺. On obtient ainsi

1 1   1 =− ℜe · + ℜe ℜe B(χ ) = − 21 ̺ ̺ ̺ ̺ ̺ En reportant dans (8.72), nous pouvons écrire

−ℜe

L′ (s,χ ) = L

1 2

ln

 1 Ŵ′ q + 21 ℜe ( 12 s + 12 α ) − ℜe · π Ŵ s−̺ ̺

On en déduit la majoration (8.70) grâce à l’estimation Ŵ ′ (s)/Ŵ (s) ≪ ln T qui découle de la formule de Stirling complexe. ⊓ ⊔

Démonstration du Théorème 8.25. On observe d’abord que l’on a, par un raisonnement analogue à celui qui a conduit à (8.49),

L′ L′ L′ (σ ,χ0 ) − 4ℜe (s,χ ) − ℜe (s + iτ ,χ 2 )  0. (σ > 1). L L L Majorons les trois termes du membre de gauche. Nous avons d’abord (8.73)

(8.74)

−3

−3

3 L′ ζ′ (σ ,χ0 )  −3 (σ )  + c1 . L ζ σ −1

Ici et dans toute la suite de cette démonstration, les cj (j  0) désignent des constantes positives absolues.

376

II.8. NOMBRES PREMIERS EN PROGRESSIONS ARITHMÉTIQUES

Ensuite, si ̺ = β + iγ est un zéro de L(s,χ ) et si χ 2 = χ0 , nous déduisons de (8.70) que

−4ℜe

(8.75)

4 L′ (σ + iγ ,χ )  4c0 ln qT − L σ −β

L′ (σ + 2iγ ,χ 2 )  2c0 ln qT . L Nous pouvons donc écrire

(σ > 1)

−ℜe

3 4  + c2 ln qT . σ −β σ −1

En choisissant σ = 1 + c3 / ln qT avec c3 convenable, nous obtenons β  1 − c4 / ln qT . Il reste à examiner le cas où χ 2 = χ0 , c’est-à-dire le cas où χ est réel. Pour cela, nous commençons par préciser la seconde inégalité (8.75). En dérivant logarithmiquement la formule du produit pour ζ (s), nous obtenons  1 1 Ŵ′ 1 1  ζ′ −b+ ( 2 s + 1) − + − (s) = ζ s−1 2Ŵ ̺ s−̺ ̺ où la sommation, qui porte maintenant sur les zéros non triviaux de ζ (s), est à terme général  0. Nous pouvons donc écrire

−ℜe D’où

−ℜe

1 ζ′ (s)  ℜe + c5 ln T . ζ s−1

L′ ζ′ 1 (s + iτ ,χ 2 ) = −ℜe (s) + O(ln q)  ℜe + c6 ln qT . L ζ s−1

En reportant dans (8.73) tout en tenant compte de la première inégalité (8.75), nous obtenons 4 3 1  + ℜe + c7 ln qT . σ −β σ −1 σ − 1 + 2iγ

Choisissons σ = 1 + δ / ln qT et supposons que |γ |  δ / ln qT . Il suit, en posant L = ln qT ,

et donc

4 3L L  + + c7 L σ −β δ 5δ β 1−

(4 − 5c7 δ )δ . (16 + 5c7 δ )L

Cela implique bien, en choisissant convenablement δ, que ̺ ∈ Dq si la constante c0 est assez petite. Nous avons montré jusqu’ici que, pour chaque δ > 0 il existe une constante c(δ ) > 0 telle que, si l’on choisit c = c(δ ) dans la définition de Dq , alors Dq ne

8.5. FORMULE DU PRODUIT DE HADAMARD ET RÉGIONS SANS ZÉRO

377

contient aucun zéro générique ̺ = β + iγ de L(s,χ ) lorsque l’une des conditions suivantes est réalisée : (i) χ 2 = χ0 . (ii) χ 2 = χ0 et |γ |  δ / ln q . Nous allons maintenant montrer que, lorsque χ est réel et δ est assez petit, L(s,χ ) possède au plus un unique zéro dans le rectangle 1 − δ / ln q  β  1, |γ |  δ /(2 ln q), et que ce zéro est alors nécessairement réel. En effet, si L(̺,χ ) = 0 avec γ = 0, on a, grâce à (8.70),

−ℜe

1 L′ (σ ,χ )  c0 ln q − 2ℜe L σ −̺

où le facteur 2 provient du fait que, χ étant réel,  les zéros sont symétriques par rapport à l’axe réel. Mais, puisque ζ (s)L(s,χ ) = n1 f (n)/ns avec f = 1 ∗ χ  0,(6) on a aussi

−ℜe D’où

ζ′ 1 L′ (σ ,χ )  (σ )  − − c1 . L ζ σ −1

1 2(σ − β )  + c8 ln q . 2 2 (σ − β ) + γ σ −1

Pour σ = 1 + 2δ / ln q , de sorte que |γ |  41 (σ − 1)  41 (σ − β ), on obtient

1  9 ln q 32  + c9 ln q  17(σ − β ) 2δ 17δ

δ / ln q et donc 1 − β  14 δ / ln q , une contrapour δ assez petit. Il suit σ − β  32 9 9 diction. Le même raisonnement peut évidemment être reconduit si L(s,χ ) possède deux zéros réels ou un zéro double sur le segment [1 − δ / ln q ,1]. ⊓ ⊔ Grâce aux informations à présent établies, nous pouvons déduire facilement du résultat suivant, dû à Landau (1918), les deux assertions de l’énoncé. Lemme 8.27 (Landau). Soient χ1 et χ2 des caractères primitifs distincts dont les fonctions L associées ont des zéros réels β1 et β2 . Alors 1 − min(β1 ,β2 )  c10 / ln q1 q2 .

Admettons en effet ce lemme un instant. Comme L(s,χ ) et L(s,χ1 ) ont les mêmes zéros ! dans le demi-plan σ > 0 si χ1 est le caractère primitif associé à χ, on voit que χ (mod q) L(s,χ ) possède au plus un zéro réel dans Dq pour une constante c > 0 convenable. La seconde assertion (initialement due à Page) est alors immédiate. ⊓ ⊔ Preuve du Lemme 8.27. Le caractère χ1 χ2 est non principal modulo q1 q2 . En effet, dans le cas contraire, on aurait χ1 (n) = χ2 (n) pour tout entier n premier à q1 q2 , donc ces caractères primitifs induiraient le même caractère modulo q1 q2 : c’est impossible d’après ce qui a été vu au § 8.1. 6

Voir la démonstration du Théorème 8.21.

378

II.8. NOMBRES PREMIERS EN PROGRESSIONS ARITHMÉTIQUES

Maintenant, observons que, par le Lemme 8.26, on a, pour σ > 1, L′ − (σ ,χ1 χ2 )  c0 ln q1 q2 L et aussi 1 L′ (j = 1,2). − (σ ,χj )  c0 ln qj − L σ − βj

Mais



ζ′ L′ L′ L′ (σ ) − (σ ,χ1 ) − (σ ,χ2 ) − (σ ,χ1 χ2 ) ζ L L L  (n) = {1 + χ1 (n)}{1 + χ2 (n)}  0. nσ n1

Donc 1 1 1 +  + c11 ln q1 q2 . σ − β1 σ − β2 σ −1

Pour le choix σ = 1 + δ / ln q1 q2 et δ assez petit, on obtient bien la conclusion annoncée. ⊓ ⊔

Remarque. Le!lemme de Landau implique immédiatement que la suite des qj pour lesquels χ (mod qj ) L(s,χ ) possède un zéro réel βj  1 − c12 / ln qj satisfait qj+1 > qj2 lorsque la constante c12 est choisie assez petite. En effet

c12 / ln qj  1 − min(βj ,βj+1 )  c11 / ln qj qj+1 c /c12

d’où qj qj+1  qj 11

 qj3 si c12  13 c11 .

8.6. Formules explicites pour ψ (x ; χ ) On pose ψ (x; χ ) :=



(n)χ (n),

nx

ψ ∗ (x; χ ) := 21 {ψ (x−; χ ) + ψ (x; χ )}.

On a donc ψ (x; a,q) =

1 ϕ (q)



χ (a)ψ (x; χ ).

χ (mod q)

D’après le théorème de Landau–Page (Théorème 8.25), la région Dq définie en (8.69) contient, lorsque la constante c est convenablement choisie, au plus un zéro de  L(s,χ ) χ (mod q)

et, lorsqu’il existe, ce zéro est réel, simple et correspond à un caractère réel. Nous désignons par χ1 ce caractère, et posons  1 si χ = χ1 , ϑ (χ ) := 0 si χ = χ1 .

8.6. FORMULES EXPLICITES POUR ψ(x; χ)

379

De plus, nous notons β1 l’éventuel zéro exceptionnel de L(s,χ1 ). Par définition de Dq , on a 1 − β1 < c/ ln 2q . Dans toute la suite de ce chapitre, nous adoptons la convention que les quantités faisant explicitement intervenir χ1 ou β1 doivent être considérées comme nulles s’il n’existe pas de zéro exceptionnel au sens décrit plus haut. Enfin, nous posons  ′  L (s,χ ) ;0 . (8.76) b(χ ) := Rés sL(s,χ ) Théorème 8.28. Soit χ un caractère de Dirichlet non principal, de module q . On a pour x  2  x−2m+α ′′ x̺ − (1 − α ) ln x − b(χ ) + (8.77) ψ ∗ (x,χ ) = − ̺ 2m − α ̺ m1

où la double apostrophe indique que la somme sur les zéros  non triviaux ̺ de L(s,χ ) est comprise comme la limite lorsque T → ∞ de |ℑm ̺|T . De plus, pour q  2, 2  T  x,

(8.78)

ψ (x; χ ) = −ϑ (χ )

∗ x̺ xβ1 − + Rq (x,T ) β1 ̺ |γ |T



x(ln qx)2 + x1/4 T et où l’astérisque indique que, si ϑ (χ ) = 1, les zéros β1 et 1 − β1 sont omis dans la somme. Rq (x,T ) ≪

Démonstration. Supposons d’abord χ primitif. En utilisant la première formule de Perron effective (Théorème 2.3) et en raisonnant comme au Lemme 4.7, nous obtenons    x ln x x(ln T x)2 −1 κ +iT L′ xs (s,χ ) ds + O + (8.79) ψ (x; χ ) = 2π i κ −iT L s T x + T x

où l’on a posé

x

:=

min |x − pν | = |x − N |.

ν 1, p∈P pν =x

Nous allons obtenir la formule annoncée par déplacement du segment d’intégration et application du théorème des résidus. Les pôles de l’intégrande sont les zéros de L(s,χ ) et le point s = 0, qui est donc un pôle double lorsque α (χ ) = 0, c’est-à-dire χ (−1) = 1. Grâce au principe des tiroirs et au vu de la formule asymptotique (8.68) pour N (T ,χ ), on peut choisir T , dans tout intervalle de longueur ≫ ln q , tel que min ||γ | − T | ≫ 1/ ln qT .

380

II.8. NOMBRES PREMIERS EN PROGRESSIONS ARITHMÉTIQUES

Par dérivation logarithmique de la formule du produit (8.67), on a aussi  Ŵ′ s + α  s q L′ − B(χ ) − , (8.80) − (s,χ ) = 12 ln + L π 2Ŵ 2 ̺ (s − ̺) ̺ alors que la dérivation logarithmique de la formule (0.4) du produit de Weierstrass pour Ŵ fournit  Ŵ′ α + s  γ 1 1  1 =− − − − . 2Ŵ 2 2 s+α 2n + s + α 2n n1

De plus, en dérivant logarithmiquement l’équation fonctionnelle sous sa forme asymétrique (8.66), nous voyons que   2π L′ Ŵ′ L′ + 21 π cot{ 12 π (s + α )} − (1 − s) − (1 − s,χ ) (s,χ ) = ln L q Ŵ L (8.81) ≪ ln (q|s|) (σ  −1). En effet la formule de Stirling complexe garantit que Ŵ ′ (1 − s)/Ŵ (1 − s) ≪ ln |s| lorsque σ  −1 et la formule de la cotangente, soit 1  2z π cot(π z) = + (z ∈ C  Z), z z 2 − n2 n1

cot{ 21 π (s+ α )}

implique ≪ 1 lorsque s = σ ±iT , σ  −1. On peut donc déplacer la droite d’intégration vers la gauche jusqu’à −∞. On obtient ainsi, par le théorème des résidus,

 x̺  xα−2n + ̺ 2n − α n1 |γ |T   L′ xs + Rés − (s,χ ) ; 0 + O(R1 + R2 ) L s

ψ (x; χ ) = − (8.82)

avec

x(ln xT )2 x ln x + , (8.83) R1 := x + T x

T

 ′  σ L x  (σ + iεT ,χ ) dσ . R2 := max ε =±1 −∞  L T 

Or, on déduit facilement de (8.68) que  1 ≪ ln{q(2 + |t|)} (8.84) 1 + |t − γ |2 ̺

κ

(t ∈ R),

donc, pour −1  σ  2, s = σ + iT , s0 := 2 + iT ,

L′ L′ L′ (s,χ ) = (s,χ ) − (s0 ,χ ) + O(1) L L L  2−σ + O(ln T ) = = (s − ̺ )(s0 − ̺ ) ̺



̺ |τ −γ |1

1 + O(ln qT ). s−̺

8.6. FORMULES EXPLICITES POUR ψ(x; χ)

381

Il y a ≪ ln qT termes dans la dernière somme en ̺ et, par hypothèse, ils sont tous de module ≪ ln qT . Cela implique que, pour −1  σ  2, nous avons  L′    (s = σ + iT , − 1  σ  2  T ).  (s,χ ) ≪ (ln qT )2 L Nous obtenons donc, compte tenu de (8.81),  κ σ  −1 σ x x ln{q(|σ | + T )} dσ + (ln qT )2 dσ R2 ≪ T T −1 −∞ (8.85)



x(ln qT )2 x(ln qT )2 ln qT + ≪ . T x ln x T ln x T ln x

Calculons maintenant le résidu en s = 0 apparaissant dans (8.82). Rappelons la définition (8.76). On a b(χ ) = L′ (0,χ )/L(0,χ ) si α = 1 et

L′ 1 (s,χ ) = + b(χ ) + a1 s + · · · L s si α = 0. Il suit, dans tous les cas,  s ′  x L (s,χ ) ; 0 = (1 − α ) ln x + b(χ ). Rés sL(s,χ ) Ainsi

 x̺  x−2m+α + − (1 − α ) ln x − b(χ ) ̺ 2m − α m1 |γ |T   x(ln qxT )2 x ln x + . +O x + T x

T

ψ (x; χ ) = − (8.86)

On obtient donc (8.77) en faisant tendre T vers l’infini. Il reste à établir (8.78). Il résulte clairement de (8.86) que, lorsque 2  T  x,  x̺ − b(χ ) + O(R3 ) (8.87) ψ (x; χ ) = − ̺ |γ |T

avec

x(ln xq)2 T Nous devons encore estimer b(χ ) et prendre en compte la contribution du zéro exceptionnel. Appliquons (8.80) en s et en 2 et effectuons la différence. Nous obtenons     1 Ŵ′ s + α 1 L′ (s,χ ) = − + + O(1). − L 2Ŵ 2 s−̺ 2−̺ ̺ R3 :=

Si α = 1, il vient, en prenant s = 0,    1 1 2 L′ + O(1). + O(1) = − + b(χ ) = (0,χ ) = − L ̺ 2−̺ ̺ (2 − ̺ ) ̺ ̺

382

II.8. NOMBRES PREMIERS EN PROGRESSIONS ARITHMÉTIQUES

Cette formule est encore valable si α = 0 puisque −Ŵ ′ (s/2)/{2Ŵ (s/2)} = 1/s+O(1) lorsque s tend vers 0. De plus, on déduit de (8.84) que   1 2 ≪ ≪ ln q |̺ (2 − ̺ )| |2 − ̺ |2 |γ |1

|γ |1

alors que (8.68) implique



|γ |1

1 ≪ ln q . |2 − ̺ |

Nous déduisons donc de ce qui précède que  1 + O(ln q). (8.88) b(χ ) = − ̺ |γ |1

En reportant dans (8.87), nous obtenons finalement  1  x̺ ψ (x; χ ) = − + + O(R3 ). ̺ ̺ |γ |T

|γ |1

D’après le théorème!de Landau–Page (Théorème 8.25), il existe une constante absolue c telle que χ =χ0 L(s,χ ) possède au plus un zéro ̺ = β + iγ tel que |γ |  1 et β  1 − c/ ln q , ce zéro étant alors le zéro exceptionnel β1 , réel. Nous pouvons supposer c  16 , et donc β1  43 . Alors

 1 ≪ (ln q)2 , ̺

|γ |1 ̺=β1

d’où

∗ x̺  xβ1 − 1 x1−β1 − 1  ψ (x; χ ) = − ϑ (χ ) + O(R3 ) + − ̺ β1 1 − β1 |γ |T

=−

∗ x̺ xβ1 + O(R3 + x1/4 ), − ϑ (χ ) ̺ β1

|γ |T

puisque

x1−β1 − 1 = (ln x) (1 − β1 )



1

β1

x1−v dv ≪ x1/4 ,

1 ≪ 1. β1

Cela achève la preuve de (8.78) lorsque χ est primitif. Lorsque χ est induit par un caractère primitif χ ∗ , on a    ln p ≪ ln x ln q . (n)  |ψ (x; χ ) − ψ (x; χ ∗ )|  nx (n,q)>1

p|q ν ln x/ ln p

On obtient la formule annoncée pour ψ (x; χ ), mais où β1 est le zéro exceptionnel associé à χ ∗ , et, par conséquent, n’est pas nécessairement exceptionnel pour χ. Dans ce dernier cas, on aurait cependant β1 > 1 − c/ ln q ∗ et β1 < 1 − c/ ln q .

8.7. LE THÉORÈME DES NOMBRES PREMIERS EN PROGRESSIONS ARITHMÉTIQUES

383

La formule (8.78) reste alors valable puisque le terme impliquant β1 y est pris en compte dans la somme en ̺. ⊓ ⊔

8.7. Le théorème des nombres premiers en progressions arithmétiques Théorème 8.29. Soit κ une constante positive arbitraire. Il existe une constante √ c = c(κ ) > 0 telle que, uniformément sous les conditions x  2, 1  q  eκ ln x , (a,q) = 1, on ait 

√ χ1 (a)xβ1 x − + O xe−c ln x . (8.89) ψ (x; a,q) = ϕ (q) β1 Démonstration. Les relations d’orthogonalité des caractères fournissent 1 1  1  χ (a)ψ (x; χ ) = χ (a)ψ (x; χ ). ψ (x; χ0 ) + ψ (x; a,q) = ϕ (q) χ ϕ (q) ϕ (q) χ =χ0

Or, on a

|ψ (x) − ψ (x; χ0 )| 



(n) 

nx (n,q)>1





p|q ν ln x/ ln p

ln p ≪ (ln x) ln q

et, pour une constante convenable c0 > 0, 

√ ψ (x) = x + O xe−c0 ln x .

Pour χ = χ0 , on déduit du Théorème 8.28 que 

x(ln qx)2 ∗ x̺ xβ1 + x1/4 − +O ψ (x; χ ) = −ϑ (χ ) β1 ̺ T

(1  T  x).

|γ |T

Dans la somme en ̺, chaque zéro satisfait à β  1 − c/ ln qT , et donc x̺ ≪ xe−c1 ln x/ ln qT , d’après le Théorème 8.25. De plus, on a d’après (8.68)  1  1 ≪ (ln q)2 , ≪ (ln qT )2 ≪ (ln qx)2 . |̺ | |̺ | |γ |1

1 21 quitte à modifier la constante implicite dans la définition de Dq . On a pour β1  σ  1, N > 1,  ∞  ln n  ∞ |K(t) − K(N )| ln t ln t ′ dK(t) ≪ + dt L (σ ,χ1 ) = − σ nσ tσ +1 1− t N nN

ln N N 1 −σ − 1 ln N + H(χ1 ) σ . ≪ 1−σ N

En choisissant N := H(χ1 ), nous obtenons 2 L′ (σ ,χ1 ) ≪ H(χ1 )1−β1 ln H(χ1 ) ≪ (ln q)2 , puisque H(χ1 )  q , 1 − β1 ≪ 1/ ln q . D’où

L(1,χ1 ) = L(1,χ1 ) − L(β1 ,χ1 ) ≪ (1 − β1 )(ln q)2 .

Cela implique bien (8.90), au vu de (8.57).

⊓ ⊔

Corollaire 8.31. Il existe une constante c > 0 telle que, pour toute fonction h(x) tendant vers l’infini avec x, et uniformément pour x  3, 1  q  (ln x)2 / {h(x)2 (ln2 x)6 }, (a,q) = 1, on ait 

1 x  (8.91) ψ (x; a,q) = 1+O . ϕ (q) (ln x)c h(x)

⊓ ⊔ Démonstration. Il suffit d’appliquer (8.89) et (8.90). Remarque. Toutes les constantes intervenant dans (8.91) sont effectivement calculables. On a en particulier x (8.92) ψ (x; a,q) ∼ ϕ (q)  lorsque x → ∞ et q = o (ln x)2 /(ln2 x)6 . C’est essentiellement le meilleur résultat effectif connu. Pour étendre le domaine de validité de l’équivalence asymptotique (8.92), il est nécessaire de disposer de meilleures minorations pour 1 − β1 . Le théorème de Siegel fournit une telle amélioration, au prix toutefois d’une ineffectivité des constantes. Nous donnons une démonstration du théorème de Siegel due à Estermann (1948). Nous énonçons le résultat sous la forme plus générale d’une version effective du théorème de Phragmén–Landau.  Théorème 8.32. Soit F (s) := n1 an /ns une série de Dirichlet convergente pour σ > 1 et dont les coefficients satisfont à an  δ (n) pour n  1.(7) On suppose qu’il existe des nombres réels r ∈]0,1[ et M > 0 tels que : (i) f (s) := F (s)(s − 1) est prolongeable analytiquement au disque |s − 1|  r ; (ii) sup|s−1|r |f (s)|  M ; (iii) ∃β ∈ [1 − r/2,1[: f (β )  0. 7

On rappelle que δ(n) := δ1n avec la notation de Kronecker.

8.7. LE THÉORÈME DES NOMBRES PREMIERS EN PROGRESSIONS ARITHMÉTIQUES

385

Alors on a

c1 (1 − β ) M c 2 (1 − β ) où c1 et c2 sont des constantes positives ne dépendant que de r. f (1) 

(8.93)

Remarque. On a f (1) = limσ →1+ F (σ )(σ − 1), donc f (1)  0. Si f (1) = 0, alors F est analytique dans le disque |s − 1|  r, donc, d’après le théorème de Phragmén–Landau, son abscisse de convergence est < 1 − r. Cela implique  β F (β ) = n1 an /n > 0 et donc f (β ) = (β − 1)F (β ) < 0. Les hypothèses effectuées impliquent donc f (1) > 0 et l’on peut voir (8.93) comme une version effective de cette minoration. Démonstration. Posons β = 1 − μr avec 0 < μ  21 et introduisons α := 1 + λr, avec 0 < λ  12 . Comme F (s) est holomorphe dans le disque |s − α | < λr, on peut écrire dans ce domaine le développement de Taylor convergent  F (s) = Fn (α − s)n . n0

On a F0 = F (α )  1 et Fn = (−1)n F (n) (α )/n!  0 pour tout n  1, donc Fn  δ (n). De plus, on a, pour |s − α | < λr,  (α − s)n f (1) f (1)  α − s n = = f (1) . s−1 (α − 1)n+1 λr λr n0

n0

Or, le développement de Taylor

F (s) −

f (s) − f (1)  f (1) = = bn (α − s)n s−1 s−1 n0

est convergent dans le disque |s − α |  (1 − λ)r car il représente une fonction holomorphe. Les formules de Cauchy permettent donc d’écrire  ds f (s) − f (1) (−1)n bn = , 2π i |s−α |=(1−λ)r s−1 (s − α )n+1 d’où, puisque |s − 1|  |s − α | − |α − 1| = (1 − 2λ)r pour |s − α | = (1 − λ)r,

|bn | 

2M · (1 − 2λ)(1 − λ)n rn+1

Des relations

bn = Fn −

f (1) f (1)  δ (n) − (λr)n+1 (λr)n+1

(n  0),

386

II.8. NOMBRES PREMIERS EN PROGRESSIONS ARITHMÉTIQUES

nous déduisons donc que, pour tout entier N  1, et sous la condition supplémentaire μ + 2λ < 1, nous avons

f (1) f (β ) − f (1)  1−β β −1  f (1)(α − β )n  (α − β )n 2M − 1− n+ 1 (λr) (1 − 2λ)r (1 − λ)n rn nN

0n 0 il existe une constante c(ε) > 0 telle que l’on ait L(1,χ ) > c(ε)/q ε pour tout caractère réel non principal de module q . En particulier, on a 1 − β1 ≫ε 1/q ε . Démonstration. Soient χ1 , χ2 des caractères primitifs réels de modules respectifs q1 , q2 . On a vu dans la démonstration du Lemme 8.27 que χ1 χ2 est non principal (mais pas forcément primitif) modulo q1 q2 . Considérons la série de Dirichlet  an . (8.95) F (s) = ζ (s)L(s,χ1 )L(s,χ2 )L(s,χ1 χ2 ) = ns n1

On a a1 = 1 et

log F (s) =

  {1 + χ1 (p)ν }{1 + χ2 (p)ν } p

ν 1

ν pν s

,

donc an  0 pour tout entier n  2. De plus, F possède un prolongement méromorphe au disque |s − 1| < 1 de la forme f (s)/(s − 1) avec f (1) = L(1,χ1 )L(1,χ2 )L(1,χ1 χ2 ). Enfin il découle d’une sommation d’Abel que L(σ ,χ ) ≪ q pour tout caractère non principal de module q et tout σ de ]0,1[. On a donc f (s) ≪ (q1 q2 )2 pour 0 < σ < 1. Pour pouvoir appliquer le Théorème 8.32, nous devons trouver un nombre β de, disons, [ 12 ,1[ tel que f (β )  0, ou, ce qui revient au même, F (β )  0. Soit ε ∈]0, 12 [. S’il existe un caractère primitif réel non principal χ tel que L(s,χ ) s’annule sur [1 − ε,1[, nous choisissons χ2 = χ et β = β2 . On a alors F (β2 ) = 0 pour tout χ1 . Dans le cas contraire, on a L(σ ,χ ) = 0 pour tout caractère primitif

8.7. LE THÉORÈME DES NOMBRES PREMIERS EN PROGRESSIONS ARITHMÉTIQUES

387

réel non principal χ et tout σ de [1 − ε,1[. Choisissons alors β = 1 − ε/2 et χ2 égal à un caractère primitif réel non principal quelconque. Comme ζ (β ) < 0 et comme les trois fonctions L de (8.95) sont strictement positives sur [β,1], on a F (β ) < 0. Ainsi F (β )  0 dans tous les cas et (8.93) implique

L(1,χ1 )L(1,χ2 )L(1,χ1 χ2 )  c1 (1 − β )/(q1 q2 )c2 (1−β )  c1 (1 − β )/(q1 q2 )c2 ε . Lorsque χ2 est fixé, β ne dépend que de ε. De plus, d’après le Théorème 8.18, on a L(1,χ1 χ2 ) ≪ ln q1 q2 et L(1,χ2 ) ≪ ln q2 où les constantes impliquées sont absolues. Il suit donc

L(1,χ1 )(ln q1 q2 )(ln q1 ) ≫ε 1/q1c2 ε . ⊓ ⊔ Comme c2 est absolue, cela implique bien le résultat annoncé. Remarque. La minoration fournie pour L(1,χ1 ) dans le théorème de Siegel est ineffective : étant donné ε, elle ne permet pas de calculer numériquement la constante c(ε). Preuve du théorème de Siegel–Walfisz (Théorème 8.17). Il suffit de reporter la minoration de β1 dans la formule du Théorème 8.29 pour ε  1/2A. On remarque que le résultat est ineffectif dès que A  1 : l’inégalité de Pólya–Vinogradov est alors inutile. ⊓ ⊔

N OTES

§ 8.1. Pour une étude plus complète concernant les caractères des groupes abéliens finis, le lecteur pourra consulter, par exemple, Ayoub (1963) ou Ellison & Mendès France (1975). La présentation des caractères primitifs et la démonstration du Théorème 8.7 suivent celle de Davenport (1980). Le symbole de Kronecker est défini comme une généralisation de celui de Legendre : pour d ∈ Z∗ , on pose ⎧   si d ≡ ±1 (mod 8),   ⎨1   d ν d d si d ≡ 0 (mod 2), := := 0 , ⎩ 2 n p −1 si d ≡ ±3 (mod 8), pν n

le symbole (d|p) conservant la signification de Legendre lorsque p > 2. Il est facile de vérifier que l’application n → (d|n) est un caractère réel. On peut montrer — cf. Davenport (1980) — qu’un caractère réel primitif de module q est nécessairement de la forme   d (8.96) χ (n) = n où d est un discriminant fondamental, i.e. un produit de nombres premiers entre eux de la forme −4, ±8, (−1)(p−1)/2 p où p est un nombre premier impair et où le membre de droite est défini au sens de Kronecker. Le module de χ vaut alors q = |d|. Ainsi, il y a deux caractères réels primitifs de module q si 8q et un seul dans les autres cas. On a alors — voir Landau (1966), th. 215 — √ (8.97) G(n,χ ) = χ (n) d, où la racine carrée est prise en détermination principale.

√ Pour des améliorations ultérieures de la valeur de c telle que H(χ )  c q , voir Sárközy (1977), Sokolovskii (1979). Par ailleurs, Montgomery & Vaughan (1979) √ ont établi que, pour tout ε > 0, on a H(χ ) ≪ε q pour tous sauf au plus εϕ (q) caractères non principaux de module q .

NOTES

389

Plus précisément, Paley a montré en 1932 que l’on a en fait pour une infinité de valeurs de q √ max H(χ ) ≫ q ln2 q . χ =χ0

De plus, Montgomery & Vaughan (1977) ont montré que, sous l’hypothèse de Riemann généralisée, on a √ H(χ ) ≪ q ln2 q . √ L’inégalité |K(x)|  2 q ln q est clairement sans intérêt pour les petites valeurs √ de x, par exemple x  q . Burgess (1962, 1963) a étudié cette question. Il montre par exemple que l’on a   (8.98) x  q 3 /8 + ε χ (n) ≪ x/q δ nx

où δ = δ (ε) > 0. De plus, (8.98) est valable pour x  q 1/4+ε si q est sans facteur cubique. Voir aussi Hildebrand (1986d). § 8.3. Notre démonstration du Théorème 8.21 suit essentiellement celle de Ellison & Mendès France (1975), chap. 7, A1, avec une amélioration due à l’emploi d’une majoration pour M2 (χ ) au lieu de la borne triviale H(χ )  q/2. Le gain induit dans le Théorème 8.16 n’est pas significatif avec l’approche taubérienne employée ici, mais la méthode d’intégration complexe fournit effectivement ainsi une meilleure uniformité en q — cf. Exercice 237. La théorie des formes quadratiques, et notamment la formule des classes de Dirichlet — voir par exemple Davenport (1980, chap. 6) —, fournit immédiatement une borne comparable à celle du Théorème 8.21. Ramaré (2001a) note même que l’on peut en déduire la minoration √ L(1,χ )  π 2ω(q)−1 / q et établit par des moyens purement analytiques une minoration qualitativement équivalente. Pour des majorations de L(1,χ ), voir Ramaré (2001b, 2004). § 8.5. La présentation adoptée ici de la démonstration du Théorème 8.25 suit essentiellement celle de Davenport (1980). Miech (1969) a montré que l’on peut choisir c = 1/20 dans l’énoncé du théorème de Landau–Page (Théorème 8.25) lorsque q  q0 . La meilleure valeur de c actuellement connue pour q assez grand est c = 0,10367, due, selon Graham (1981b), à Schoenfeld dans un travail non publié — voir le lemme 10 de Chen (1983) pour une démonstration. Heath-Brown (1992) a établi qu’il y a au plus un zéro dans la région σ  1 − 0,348/ ln q , |τ |  1. En admettant l’hypothèse de Riemann généralisée, on peut améliorer le théorème de Siegel–Walfisz en √ x + O x(ln x)2 (x  2, q  1). (8.99) ψ (x; a,q) = ϕ (q)

Le théorème de Bombieri–Vinogradov — cf. Bombieri (1965), A.I. Vinogradov (1965, 1966) — établit inconditionnellement que (8.99) est satisfaite en moyenne.

390

II.8. NOMBRES PREMIERS EN PROGRESSIONS ARITHMÉTIQUES

Théorème 8.34 (Bombieri–Vinogradov). Soit A une constante positive. On a uniformément pour Q  1, x  1   4 √  x y   (8.100) max ψ (y; a,q) − + xQ ln(Qx) . ≪ A ϕ (q) (ln x) (a,q)=1 qQ

yx

Pour une démonstration élémentaire de ce résultat, reposant sur une méthode générale féconde, voir Vaughan (1980). On peut améliorer l’exposant 4 en 52 + ε, pour tout ε > 0, cf. Dress, Iwaniec & Tenenbaum (1983). La conjecture dite d’Elliott–Halberstam énonce que le membre de gauche de (8.100) est o(x) pour Q  x1−ε pour tout ε > 0. Cela remplacerait avantageusement l’hypothèse de Riemann généralisée dans la plupart des applications arithmétiques. § 8.7. D’autres démonstrations analytiques du théorème de Siegel ont été données par Chowla (1950) et Goldfeld (1974).

E XERCICES

232. (a) Soit p > 2. Pour chaque d  1, nous désignons par ψ (d) le nombre des éléments de (Z/pZ)∗ qui sont exactement d’ordre d. Établir la relation  d|(p−1) ψ (d) = p − 1.

(b) Soit y un élément d’ordre d dans (Z/pZ)∗ . Montrer que l’équation x − 1 ≡ 0 (mod p) possède exactement d solutions, que l’on explicitera. En déduire que tout élément d’ordre d est l’un des ϕ (d) générateurs du groupe engendré par y . (c) Montrer que ψ (d)  ϕ (d) pour tout d, et donc que cette inégalité est une égalité si d|(p − 1). En déduire que (Z/pZ)∗ est cyclique. d

233. Soient p > 2, et g une racine primitive modulo p. (a) Montrer que l’ordre de g (mod p2 ) est soit p − 1 soit p(p − 1). Établir que, dans la première éventualité, g +p n’est pas d’ordre p− 1. En déduire que (Z/p2 Z)∗ est cyclique. (b) Soient ν  2 et g une racine primitive mod p2 . Montrer que g p−1 = 1 + hp avec (h,p) = 1. En déduire que ν

g ϕ (p ) ≡ 1 (mod pν +1 )

et donc que g engendre (Z/pν +1 Z)∗ .

234. Dans cet exercice, on ne suppose pas connu le théorème des nombres premiers. On pourra toutefois utiliser librement les estimations de Tchébychev. Soient q un nombre entier > 1 et χ un caractère de Dirichlet de module q . On note χ0 le caractère principal modulo q et l’on pose    M (x; χ ) := μ(n)χ (n), ψ (x; χ ) := χ (n)(n), D(x; χ ) := χ (n) ln n. nx

nx

nx

(a) Rappeler, sans détailler les calculs, les étapes principales de la preuve élémentaire de l’implication : limx→∞ M (x)/x = 0 ⇒ limx→∞ ψ (x)/x  = 1. (b) Montrer que, pour x  2, q  1, on a ψ (x,χ0 ) = ψ (x) + O (ln q) ln x . Proposer et établir une amélioration de la dépendance en q du terme d’erreur. (c) Montrer que, pour χ = χ0 , on a D(x; χ ) ≪ q ln x (x  2). Proposer et établir une amélioration de la dépendance en q dans cette majoration. (d) Établir la relation de convolution entre fonctions arithmétiques χ  = (χ μ) ∗ (χ ln).

392

II.8. NOMBRES PREMIERS EN PROGRESSIONS ARITHMÉTIQUES

(e) Montrer que, si, pour q > 1 fixé et tout χ = χ0 , on a M (x; χ ) = o(x) lorsque x → ∞, alors ψ (x; a,q) ∼ ψ (x)/ϕ (q) pour tout entier a tel que (a,q) = 1. (f) Est-il vrai que la conclusion de la question précédente découle aussi de l’hypothèse que l’on a  μ(n) = o(x) (x → ∞) nx n≡a (mod q)

pour tout entier a tel que (a,q) = 1 ? 235. En employant la méthode du Théorème 8.21, montrer que, pour tout carac√ tère de Dirichlet réel non principal de module q , on a L(1,χ )  1/(4 q). 236. Montrer que pour (a,q) = 1, σ > 1, on a  1  1 = χ (a) log L(s,χ ) + h(s) s p ϕ (q) χ p≡a(mod q)

où h(s) est une fonction holomorphe dans le demi plan σ > 21 . En déduire, sous l’hypothèse que L(s,χ ) = 0 pour σ  1, que

1   1 1 log + h1 (s) = (σ > 1) ps ϕ (q) s−1 p≡a(mod q)

où h1 est holomorphe dans le demi plan σ  1. Établir alors le théorème des nombres premiers en progressions arithmétiques par application du théorème taubérien de Delange — cf. Théorème 7.28. √ 237. On pose Q = q(ln 2q)2 . Montrer l’existence de constantes absolues positives c1 ,c2 telles que les évaluations des Théorèmes 8.18, 8.20, 8.22 soient en fait valables pour ⎧ (χ 2 = χ0 ) ⎨c1 L−9 −8 −1 (χ 2 = χ0 , |τ |Q > c2 ) 1 − σ  c1 L (L + 1/|τ |) ⎩ −1 c1 Q (χ 2 = χ0 , |τ |Q  c2 ). En déduire, par la méthode du § 4.2, l’existence d’une constante absolue c > 0 et d’une quantité δ (q) ≫ q −1/2 (ln q)−10 telles que l’on ait uniformément pour q  exp(ln x)1/10

 2ω(q) x + O x exp{−c(ln x)1/10 } + (ln q)9 x1−δ(q) . ψ (x; a,q) = ϕ (q) ϕ (q)

Montrer que, pour tout ε > 0, la formule asymptotique ψ (x; a,q) ∼ x/ϕ (q) persiste uniformément pour q  (ln x)2−ε .

238. Entiers sans facteur carré en progressions arithmétiques. On pose

Q(s,χ ) =

 μ(n)2 χ (n) . ns

n1

Montrer que l’on a Q(s,χ ) = L(s,χ )H(s,χ ) où H(s,χ ) est une fonction holomorphe et bornée pour σ  σ0 > 21 . Montrer que L(s,χ ) ≪ε (T q)1−σ +ε pour

EXERCICES

393

0  σ  1,|τ | + 1  T , et en déduire que l’on a, pour tout ε > 0 et uniformément pour x  2, q  1, (a,q) = 1, 

 x (1 − p−2 ) + Oε x2/3+ε q 1/3 . (8.101) μ(n)2 = q nx n≡a (mod q)

p∤q

Montrer que l’argument de convolution employé dans la preuve du Théorème √ I.3.10 fournit en fait une meilleure majoration du terme d’erreur, soit O( x). Retrouver essentiellement ce résultat (i.e. ≪ x1/2+ε ) par la méthode analytique précédente(8) en utilisant la majoration de Montgomery (1971), theorem 10.1,   T |L( 12 + iτ ,χ )|4 dτ ≪ (qT )1+ε . χ (mod q)

−T

239. Soit χ4 l’unique caractère de Dirichlet non principal de module 4. Montrer que L(1,χ4 ) = π /4. Montrer que l’ensemble des nombres premiers de la forme 4m + 3 satisfait aux hypothèses (i) et (ii) de l’Exercice 228, avec δ = 21   −1/2 ! . En déduire et K = (2/π ) eγ /2 A, où l’on a posé A := p≡3(mod 4) 1 − p−2 que le nombre N3 (x) des entiers n n’excédant pas x et dont tous les facteurs premiers sont de la forme 4m + 3 satisfait à √ 2Ax N3 (x) ∼ √ . π ln x Donner une version avec terme d’erreur de ce résultat. Généraliser.(9) 240. Sommes de deux carrés. Conservons la notation χ4 de l’Exercice 239. En utilisant les propriétés établies au § I.4.8 pour la fonction indicatrice h des sommes de deux carrés, établir la formule   h(n) (1 − p−2s )−1/2 (σ > 1) = (1 − 2−s )−1/2 ζ (s)1/2 L(s,χ4)1/2 s n n1

p≡3 (mod 4)

où les racines carrées sont prises en détermination principale. En déduire, par application de la méthode de Selberg–Delange que l’on a, pour une constante convenable c > 0,  1 /3 

√  x1−t g(t) dt + O xe−c ln x h(n) = nx

où l’on a posé

g(t) :=

0



 −tζ (1 − t)L(1 − t,χ4 ) 1   · π (1 − t) t(1 − 2t−1 ) p≡3 (mod 4) 1 − p2t−2

En déduire un développement asymptotique dont la formule (I.4.90) est la spécialisation à l’ordre 1. 8

Pour des estimations plus fines ou en moyenne, voir Prachar (1958), Warlimont (1969,1980). Prachar montre en particulier, par une modification très simple de la méthode élémentaire, que le terme d’erreur de (8.101) est ≪ x1/2 q −1/4 + q 1/2 . 9 Voir Landau (1909), vol. 2, pp. 641-669, et Wirsing (1956).

394

II.8. NOMBRES PREMIERS EN PROGRESSIONS ARITHMÉTIQUES

241. Répartition des diviseurs dans les classes de congruences. Pour tout caractère de Dirichlet χ, on pose τ (n; χ ) := d|n χ (d) (n ∈ N∗ ). On définit également, lorsque a, q , n sont des entiers positifs,   1. 1, τ (n; a,q) := τq (n) := d|n d≡a (mod q)

d|n (d,q)=1

(a) Montrer que l’on a pour tous entiers n  1, q  1,   1  τq (n) 2 τ (n; a,q) − |τ (n; χ )|2 = ϕ (q) ϕ (q) χ =χ0

1aq (a,q)=1

où la somme en χ porte sur tous les caractères non principaux de module q . (b) Soient z ,w des nombres complexes tels que |z| < 1 = |w|. Établir l’identité  2     1 − z2 ν j . z  w  = (1 − z)2 (1 − wz)(1 − wz) ν 0

0jν

En déduire que l’on a, pour tout caractère χ non principal de module q ,

F (s,χ ) :=

 |τ (n; χ )|2 ζ (s)2 L(s,χ )L(s,χ ) = g (s) q ns ζ (2s)

n1

!

avec gq (s) := p|q (1 + 1/ps )−1 . (c) Montrer que, pour χ non principal de module q , s = σ + iτ , 0 < ε < 12 ,  1−σ +ε . ε  σ  1, |τ | + 2  T , on a L(s,χ ) ≪ε q 1/2 T (d) En appliquant la seconde formule de Perron effective au segment [κ − iT ,κ + iT ] avec κ := 1 + 1/ ln x, T := (x/q)3/14 , et en déplaçant l’abscisse d’intégration jusqu’à σ = 21 + ε, montrer que, pour chaque ε > 0, on a uniformément pour 1  q  x  |τ (n; χ )|2 = xP (ln x,χ ) + O(q 3/14 x11/14+ε ) nx

où P (Y ,χ ) est un polynôme du premier degré en Y , que l’on déterminera explicitement en fonction des quantités  6 a(χ ) := 2 |L(1,χ )|2 (1 + 1/p)−1 , π p|q

 ln p L′ (1,χ ) 2ζ ′ (2) + 2γ − 1 − . b(χ ) := + 2ℜe p+1 ζ (2) L(1,χ ) p|q

On rappelle que ζ (s) ≪ T (1−σ )/3+ε lorsque

1 2

 σ  1, 1  |τ |  T .

EXERCICES

395

(e) Déduire de ce qui précède la validité, pour 1  q  x, de la formule asymptotique(10)     τq (n) 2 = Aq x ln x + Bq x + Oε x11/14+ε q 3/14 τ (n; a,q) − ϕ (q) nx 1aq (a,q)=1

avec Aq :=

Bq := Aq

6gq (1)  |L(1,χ )|2 et π 2 ϕ (q)

+

χ =χ0

 ln p 2ζ ′ (2) + 2γ − 1 − p+1 ζ (2) p|q

,

+



12gq (1)  ℜe L′ (1,χ )L(1,χ ). π 2 ϕ (q) χ =χ0

242. Soit W (x) := + 1)2 (x  1). Exprimer W (x) à l’aide des nx (n)μ(n √ 2 quantités ψ (x; −1,d ) pour d  x + 1. En déduire, grâce au Théorème 8.34, une formule asymptotique pour W (x), puis pour le nombre π0 (x) des nombres premiers p  x tels que p + 1 soit sans facteur carré. 243. On désigne par χ4 l’unique caractère de Dirichlet non principal modulo 4. On rappelle que L(1,χ4 ) = π /4.  (a) Montrer que, pour tout n  1, on a τ (n) = 2 d|n 1 + O(1). √ d n 2

(b) Soit  ̺ (d) le nombre de solutions de la congruence n + 1 ≡ 0 (mod d). Montrer que n1 ̺ (n)/ns = ζ (s)L(s,χ4 )/ζ (2s). Préciser le domaine de convergence. (c) En déduire, par application d’un théorème taubérien, un équivalent asymptotique pour R(x) := dx ̺ (d)/d.  (d) On pose S(x) := dx ̺ (d). Montrer que   (8.102) τ (n2 + 1) = 2xR(x) + O x + S(x) . nx

(d) Montrer que ̺  λ ∗ 1 où λ est la fonction complètement multiplicative définie par λ(p) = 1 si p = 2 ou p ≡ 1 (mod 4 ) et λ(p) = 0 si p ≡ 3 (mod 4). (e) Montrer que, notant h := 1/ ln x, on a px cp /p = p cp /p1+h +O(1) pour toute suite bornée {cp }p . En déduire, grâce aux résultats obtenus en (c) et (d), une preuve élémentaire de la relation x + S(x) = o(xR(x)). (f) Montrer en employant un théorème de type Selberg–Delange que l’on a

S(x) = Cx + O(x/ ln x)

(x → ∞),

où C est une constante positive que l’on déterminera. En déduire une formule asymptotique pour le membre de gauche de (8.102). 244. Nombre de représentations d’un entier comme somme de deux carrés. On conserve les notations χ4 et ̺ de l’Exercice 243 et l’on note r(n) le nombre de représentations de l’entier n ∈ N∗ comme somme a2 + b2 de deux carrés d’entiers relatifs. On désigne par r+ (n) le nombre des représentations correspondant aux conditions supplémentaires (a,b) = 1 et a ∈ N∗ , b ∈ N∗ , et par r∗ (n) le nombre 10

Hall (1970, 1971b) obtient le terme d’erreur plus précis ≪ (qx)1/2+ε .

396

II.8. NOMBRES PREMIERS EN PROGRESSIONS ARITHMÉTIQUES

de représentations telles que (a,b) = 1, a ∈ Z, b ∈ Z. Enfin, pour n ∈ N∗ et x ∈ (Z/nZ)∗ , on note x l’inverse de x modulo n. (a) En utilisant l’identité (I.4.88), montrer que, pour tout n ∈ N∗ , si les couples (a,b) et (A,B) sont comptés dans r+ (n) et sont tels que ab ≡ AB (mod n), alors a = A et b = B . En déduire que r+ (n)  ̺ (n). (b) Soit x √ ∈ [0,n[ un nombre entier tel que x2 + 1 ≡ 0 (mod n). En appliquant, pour Q := ⌊ n⌋, le Théorème I.7.1 d’approximation de Dirichlet à ϑ := x/n, construire un couple (a,b) compté dans r+ (n). En déduire que l’on a identiquement r+ (n) = ̺ (n). (c) Montrer que, pour tout n ∈ N∗ , on a r∗ (n) = 4̺ (n) . (d) Montrer que, pour tout n ∈ N∗ , on a r(n) = 4 d2 |n ̺ (n/d2 ). En déduire, grâce à la formule établie à l’Exercice 243(b) que  χ4 (d) (n  1). (8.103) r(n) = 4 d|n

T OME III

M ÉTHODES

PROBABILISTES

C HAPITRE

III.1 D ENSITÉS

1.1. Définitions. Densité naturelle Comme les autres parties des mathématiques (et peut-être plus encore !) la théorie des nombres est confrontée au problème de formaliser rigoureusement des notions intuitives. Parmi celles-ci figure en bonne place l’idée de probabilité qu’un entier appartienne à une suite donnée. Il s’agit donc d’attribuer un sens mathématique à des assertions du type : un entier sur deux est pair, presque aucun entier n’est somme de deux carrés, etc. La première approche qui vient à l’esprit est bien entendu de recourir à la théorie constituée des Probabilités. La donnée d’une mesure de probabilité sur N∗ permet en effet d’associer une probabilité à chaque sous-ensemble A de l’ensemble des entiers. Cependant, le résultat suivant nous montre qu’un tel formalisme contrevient fondamentalement à l’une des plus fortes de nos intuitions sur les nombres : celle qui suggère que la proportion des entiers divisibles par a  1 est exactement 1/a. Théorème 1.1. Pour a ∈ N∗ , désignons par aN∗ l’ensemble des multiples positifs de a. Il n’existe pas de probabilité P sur N∗ telle que

P (aN∗ ) = 1/a

(a = 1,2, . . .).

Démonstration. Raisonnons par l’absurde. Puisque

aN∗ ∩ bN∗ = abN∗

dès que (a,b) = 1, on voit que, sous cette hypothèse, les événements aN∗ et bN∗ sont indépendants. Il en va donc de même de leurs complémentaires Na et Nb , avec la notation Na := N∗  aN∗ . D’où

1 1  1− P (Na ∩ Nb ) = 1 − a b

400

III.1. DENSITÉS

lorsque (a,b) = 1. Par itération, on obtient immédiatement pour tous entiers m, n, m < n, 

 1 . 1− Np = P ({m})  P p m t0 ).

D’où, en reportant dans (1.7), pour x > t0 ,     dA − ε ln x/t0  L(x)  1 + ln t0 + dA + ε) ln x/t0 .

Le résultat annoncé découle de cet encadrement, en faisant tendre x vers +∞ puis ε vers 0. ⊓ ⊔ La réciproque du Théorème 1.2 est fausse : l’existence de la densité logarithmique n’implique nullement celle de la densité naturelle. Un contre-exemple est fourni par la suite (1.4). Le calcul suivant montre qu’elle possède une densité logarithmique δ A = ln 2/ ln 10. On a  1  1 = L(x) = a n k k ax

=

0kln x/ ln 10 10 n 1/σ . 0  La convergence des séries m1 λm (σ ) pour σ ∈ S implique, pour chaque ε > 0, l’existence d’un entier N = N (ε,σ ) tel que   

 λm (σ ) + ϑε, λn (σ ) Pσ (A) = mN

nN , n∈A

avec |ϑ |  1. En choisissant ε = ε(σ ) → 0 lorsque σ → σ0 , on se ramène donc à une définition voisine de celle du premier paragraphe, mais dans laquelle la fonction λn dépend également de x. Dans certains cas, on peut établir, par une technique taubérienne, l’existence d’un procédé équivalent qui est strictement du type (1.1). Même dans  une telle situation, ce formalisme possède une justification : lorsque les séries λn (σ ) sont bien choisies, le fait de considérer (1.8) au lieu de (1.1) peut notablement simplifier les calculs ou favoriser l’emploi de certaines techniques d’analyse. Cela tient au fait de remplacer la troncature par un procédé plus régulier. L’exemple fondamental est obtenu en choisissant S := ]1,∞[, σ0 := 1 et λn (σ ) := 1/nσ (n  1). Il vient alors 1  1 (1.9) Pσ (A) = . ζ (σ ) nσ n∈A

La présence de la série de Dirichlet associée à la fonction indicatrice de A ouvre la possibilité, pour le calcul de densité, de recourir à toutes les propriétés analytiques et algébriques des séries de Dirichlet — notamment celles relatives au produit de convolution. On désigne par densité analytique d’une suite A la limite éventuelle de l’expression (1.9) lorsque σ → 1+. On peut bien entendu considérer à la place de (1.9) la quantité  1 (1.10) (σ − 1) nσ n∈A

mais il est souvent agréable de conserver le facteur 1/ζ (σ ) lorsqu’interviennent des produits eulériens.

404

III.1. DENSITÉS

Le lien attendu entre la densité analytique et une densité du type (1.1) est explicité dans le résultat suivant. Théorème 1.3. Soit A une suite d’entiers. Alors A possède une densité analytique si, et seulement si, A possède une densité logarithmique. Dans ce cas, les deux densités sont égales.

 Démonstration. Conservons la notation L(x) = ax 1/a où a désigne un élément générique de A. Par sommation d’Abel, on a  ∞  1 L(x) 2 = ( σ − 1 ) dx (σ > 1). (1.11) (σ − 1) aσ xσ 1 Supposons d’abord que A possède une densité logarithmique δ = δ A, c’est-à-dire

L(x) = {δ + o(1)} ln x

(x → ∞).

En reportant dans le second membre de (1.11), on en déduit  1 = δ + o(1) (σ → 1+), (1.12) (σ − 1) aσ donc A possède une densité analytique égale à δ. Réciproquement, si (1.12) est réalisée, on peut réécrire (1.11) sous la forme suivante, avec h := σ − 1,  ∞  ∞ dx −ht t 2 (h → 0+). h e dL(e ) = h L(x) 1+h = δ + o(1) x 0 1 Le théorème de Karamata II.7.5 implique donc

L(et ) = {δ + o(1)}t ce qui équivaut au résultat annoncé.

(t → ∞), ⊓ ⊔

1.4. La théorie probabiliste des nombres Les notions mises en place dans les sections précédentes forment la base d’une branche originale de la théorie des nombres. Le concept-clef est celui de densité naturelle, qui permet de jeter un éclairage nouveau sur les fonctions arithmétiques. L’une des spécificités de ces fonctions réside en effet dans la nature intrinsèquement irrégulière et erratique de leurs variations — de sorte que les techniques classiques de l’analyse sont souvent impuissantes à décrire convenablement leur comportement. La théorie probabiliste des nombres répond au désir, naturel en une telle circonstance, d’entreprendre une étude statistique. À côté des ordres extrémaux et moyens, qui fournissent une classification sommaire, nous définirons (cf. Chapitre III.3) la notion d’ordre normal d’une fonction arithmétique, destiné à refléter le comportement « presque sûr ». En pratique, cela revient à étudier chaque fonction en négligeant un ensemble d’entiers de densité nulle (dépendant évidemment de la fonction considérée), de manière à éliminer les valeurs

1.4. LA THÉORIE PROBABILISTE DES NOMBRES

405

aberrantes. Le résultat est saisissant, en ce sens qu’il fait soudain apparaître de l’ordre et de la régularité là où semblait régner un chaos constitutif. Le prisme du « presque partout » révèle ainsi un nouveau champ d’investigation, possédant des méthodes spécifiques et des résultats distinctifs. Ainsi que l’a remarqué Delange (1982), on devrait donc plutôt parler de « théorie probabiliste des fonctions arithmétiques ». La situation générique (cf. la remarque (d) du § 1.1) est obtenue en considérant une fonction arithmétique f comme une variable aléatoire sur l’espace discret constitué des N premiers entiers et muni de la loi uniforme. La question fondamentale consiste alors à déterminer dans quel(s) sens on peut énoncer que la loi de f tend vers une loi limite lorsque N → ∞. Nous préciserons cela dans les prochains chapitres.

N OTES

§§ 1.1–1.3. Beaucoup d’autres types de densités d’une suite d’entiers ont été définies dans la littérature. Bornons-nous ici à en signaler trois. (a) La densité multiplicative de Davenport & Erdos ˝ (1951), liée à la répartition de A dans les différentes sous-suites de N∗ obtenues en écartant les entiers ayant un « grand » facteur premier — cf. Exercice 246. (b) La densité de Schnirelmann (1930) définie par σ (A) = inf n1 A(n)/n. Elle est liée à l’addition des suites ; si l’on définit

A + B := {a + b : a ∈ A, b ∈ B}, un important théorème de Mann (1942) énonce que (1.13) σ (A + B)  min 1,σ (A) + σ (B) .

On trouvera une démonstration assez simple de (1.13) dans Halberstam & Roth (1983), chap. I, § 4. (c) La densité divisorielle de Hall (1978). Lorsqu’elle existe, c’est l’unique nombre DA satisfaisant à  1 = DA + o(1) τ (n) pp, d|n, d∈A

où la mention pp (presque partout) signifie que la relation ainsi désignée a lieu lorsque n → ∞ en restant dans une suite convenable de densité naturelle unité. Cette définition est très éloignée de celles des §§ 1.1–1.3. Par exemple, pour tous α,β dans [0,1] on peut trouver une suite A telle que dA = α, DA = β (Hall, 1978). Pour d’autres propriétés, on pourra consulter Hall (1981), Tenenbaum (1982), Dupain, Hall & Tenenbaum (1982), Hall & Tenenbaum (1986). Voir aussi les Exercices 272 et 273. § 1.3. Une étude plus approfondie des propriétés des fonctions arithmétiques vis à vis des lois Pσ (A) a été entreprise par Nanopoulos (1975, 1977, 1982).

E XERCICES

Rappelons que nous désignons par P + (n) le plus grand facteur premier d’un entier n, avec la convention P + (1) = 1. Sauf dans l’Exercice 252, on pose, pour y  2, A ⊆ N∗ ,

Ay := A ∩ {n : P + (n)  y}.

Pour chaque entier j  1, on désigne par A(j) la suite finie constituée des j plus petits éléments de A et l’on convient que A(0) = ∅. 245. Pour n  1, posons ny := max{d : d|n, P + (d)  y}. Soit A ⊆ N∗ une suite d’entiers satisfaisant, pour un y  2 convenable, à A = {n : ny ∈ Ay }. Montrer que l’on a pour s ∈ C, σ > 1,    1  1 1 = ζ (s) · 1− s s n p as py

n∈A

a∈Ay

En déduire l’existence de dA et la formule  1  1 · dA = 1− p a py

a∈Ay

246. Densité multiplicative (Davenport & Erd˝os, 1951). Pour y  2, A ⊆ N∗ , on pose  1  1 · 1− my A := p a py

a∈Ay

Si my A tend vers une limite mA lorsque y → ∞, on dit que mA est la densité multiplicative de A. On pose encore mA := lim sup my A, y→∞

mA := lim inf my A. y→∞

(a) Montrer que, pour tout A, on a 0  mA  mA  1. (b) Montrer que pour toute suite A on a δ A  eγ mA. √ (c) Soit A := {n  1 : P + (n)  n}. Montrer que dA = 1 − ln 2,

mA = 1 − e−γ .

408

III.1. DENSITÉS

247. Densité séquentielle d’un ensemble de multiples.(2) Soit A une suite d’entiers. Son ensemble de multiples M(A) est la partie de N∗ définie par M(A) := {am : a ∈ A, m  1}.(3)

(a) Montrer que Mj := M(A(j) )  M(A(j−1) ) possède pour chaque j  1 une densité naturelle dMj = j (A) donnée par   1 1 + , (−1)k j (A) := aj [ai1 , . . . ,aik ,aj ] 1kj−1

1i1 1.

(b) Avec la notation de l’Exercice 247, montrer que Gj (1) = j (A). (c) Montrer que limσ →1+ G(σ ) = (A). (d) Montrer que δ M(A) = (A)  dM(A). (e) Montrer que, pour chaque j  1, on a dM(A)  que dM(A) = (A).



1ij

i (A). En déduire

251. Un théorème de Rényi (1955). ω(n) Soit z ∈ C. On pose ϕz (n) := z (n)−  , λz (n) := (ϕz ∗ μ)(n). (a) Montrer que pour |z| < 2, on a n1 |λz (n)|/n < +∞.  (b) En déduire une évaluation de nx ϕz (n).

(c) Montrer que pour chaque entier k  0 la suite {n : (n) − ω(n) = k} possède une densité naturelle dk que l’on peut calculer grâce à la relation  6  1 − z/(p + 1)  (|z| < 2). dk z k = 2 π p 1 − z/p k0

252. Facteurs directs de N∗ . On dit que deux parties A et B de N∗ forment un couple de facteurs directs si 1 ∈ A ∩ B et si chaque entier n > 1 se décompose de manière unique sous la forme n = ab avec a ∈ A, b ∈ B. Lorsqu’il en est ainsi on écrit a = πA (n), b = πB (n) ; on convient que πA (1) = πB (1) = 1. Pour y  2, n  1, on désigne!par ny le plus grand diviseur de n n’ayant pas de facteur premier > y , soit ny := pν n, py pν , et l’on pose

Ay := {n : n ∈ N∗ , ny ∈ A}, Ay (x) := |Ay ∩ [1,x]|, A(x) := |A ∩ [1,x]|.

Dans tout l’exercice, a (resp. b) désigne un entier générique de A (resp. B) où (A,B) est un couple donné de facteurs directs de N∗ . (a) Montrer que pour chaque y  2, on a   1  1 1 −1 = . 1− a + b p + P (a)y

P (b)y

py

(b) Montrer l’existence de dAy et la formule −1   1 dAy = . b + P (b)y

410

III.1. DENSITÉS

(c) Soit ϕy : A → Ay l’application définie par ϕy (a) = πA (ay )a/ay . Montrer que si ϕy (a) = ϕy (a′ ), alors aπB (a′y ) = a′ πB (ay ). En déduire que ϕy est injective et établir que l’on a A(x)  Ay (x) pour x  1, y  2.  1/b = ∞ alors dA = 0. (d) Montrer que si  (e) On suppose ici que 1/b < ∞. Soient α,β les fonctions caractéristiques respectives de A,B. Montrer que α = 1 − α ∗ (β − δ ). En déduire grâce au résultat de la question (c) que l’on a pour y  2

 1 −1  1 1− . dA  b b + + P (b)y

P (b)>y

(f) Montrer que A possède une densité naturelle donnée par la formule

 1  −1 dA = b b∈B

où le membre de droite est interprété comme 0 lorsque la série diverge.(5)

5

Ce résultat est dû à Saffari (1976) et Erdos, ˝ Saffari & Vaughan (1979). La démonstration proposée ici est essentiellement celle de Daboussi (1979).

C HAPITRE

III.2 L OI

DE RÉPARTITION D ’ UNE FONCTION ARITHMÉTIQUE

2.1. Définition — fonctions de répartition Comme nous l’avons vu au chapitre précédent, on peut concevoir la théorie probabiliste des nombres comme l’étude asymptotique de l’espace probabilisé N := {n : 1  n  N } muni de la loi uniforme νN . La donnée d’une fonction arithmétique équivaut, dans ce contexte, à celle d’une suite de variables aléatoires

fN = (f ,νN )

(N = 1,2, . . .)

prenant les valeurs f (n), 1  n  N , avec probabilité 1/N . Nous nous proposons d’examiner dans cette optique la notion probabiliste classique de fonction de répartition. Rappelons (cf. Ch. II.7) que l’on désigne par fonction de répartition(1) une fonction croissante au sens large F : R → [0,1], continue à droite et satisfaisant à F (−∞) = 0, F (+∞) = 1. L’ensemble D(F ) des points de discontinuité de F est donc au plus dénombrable et ne contient que des discontinuités de première espèce. On désigne par C(F ) le complémentaire de D(F ), c’est-à-dire l’ensemble des points de continuité de F . On appelle point de croissance de F un nombre réel z tel que F (z + ε) − F (z − ε) > 0 pour tout ε > 0. Tout point de discontinuité est un point de croissance, mais la réciproque est fausse. Posons D(F ) = {zν }∞ ν =1 et sν := F (zν ) − F (zν −). La fonction  sν (z) = zν z

1

En abrégé f.r.

412

III.2. LOI DE RÉPARTITION D’UNE FONCTION ARITHMÉTIQUE

croît exclusivement par sauts et est constante dans tout intervalle fermé ne contenant pas de zν . Si D(F ) n’est pas vide, est, à une constante multiplicative près, une fonction de répartition. Une telle f.r. est dite purement discrète ou atomique. On vérifie facilement que F − est continue. On dit que F est impropre (ou qu’elle est la f.r. d’une loi impropre) si elle est égale à une fonction de saut en un point unique, disons  0 (z < z0 ) F (z) = 1 (z  z0 ). Un exemple simple de f.r. continue est une fonction du type  z h(t) dt F (z) = −∞

où h  0 est intégrable au sens de Lebesgue et satisfait à h1 = 1. On dit alors que F est absolument continue. Le théorème de Radon–Nikodym (cf. par exemple, Rudin (1970), th. 6.9) permet d’écrire toute f.r. continue sous la forme

c0 F0 + c1 F1 où F0 est absolument continue et F1 est purement singulière, c’est-à-dire continue et telle que 

dF1 (z) = 1

N

où N est un sous-ensemble de R de mesure de Lebesgue nulle. Nous pouvons rassembler les observations précédentes dans l’énoncé suivant. Théorème 2.1 (Théorème de décomposition de Lebesgue). Toute f.r. F peut être représentée de manière unique sous la forme

F = α1 F1 + α2 F2 + α3 F3 avec α1 ,α2 ,α3  0, α1 + α2 + α3 = 1, et où les Fi sont des f.r. telles que F1 est absolument continue, F2 est purement singulière, et F3 est atomique. On dit qu’une suite {Fn }∞ n=1 de f.r. converge faiblement vers une fonction F si l’on a (2.1)

lim Fn (z) = F (z)

n→∞

(z ∈ C(F )).

Il est à souligner que la limite faible F est nécessairement croissante au sens large et bornée, mais peut ne pas être une f.r. On peut toujours la supposer continue à droite puisque (2.1) n’impose aucune contrainte lorsque z ∈ D(F ). Considérons une fonction arithmétique réelle f . Pour chaque N  1 la fonction  1 (2.2) FN (z) := νN {n : f (n)  z} = {n  N : f (n)  z} N est une f.r. atomique. Définition 2.2. On dit qu’une fonction arithmétique réelle f possède une fonction de répartition F (ou encore : possède une loi limite de f.r. F ) si la suite FN définie par (2.2) converge faiblement vers F et si F est une f.r.

2.1. DÉFINITION — FONCTIONS DE RÉPARTITION

413

Ainsi l’existence d’une f.r. pour f équivaut à la conjonction des deux assertions suivantes. (i) La limite F (z) := limN →∞ FN (z) existe pour tout z appartenant à un certain sous-ensemble E dense dans R.  1 . (ii) On a lim F (z) = 0 z→±∞ z∈E

En effet, on peut alors prolonger F en une fonction croissante au sens large et continue à droite. Cela implique la validité de (2.1). Le résultat suivant, qui a souvent été implicitement utilisé par Erdos, ˝ fournit une condition suffisante pratique pour montrer qu’une fonction arithmétique possède une loi limite. Théorème 2.3. Soit f une fonction arithmétique réelle. Supposons que pour chaque ε > 0 il existe une fonction à valeurs dans Z+ , n → aε (n), ayant les propriétés suivantes (i) lim lim sup d{n : aε (n) > T } = 0, (ii)

ε →0 T →+∞

lim d{n : |f (n) − f (aε (n))| > ε} = 0,

ε →0

(iii) pour chaque a  1, la densité d{n : aε (n) = a} existe. Alors f possède une loi limite. Démonstration. Choisissons, lorsque η → 0+, deux fonctions ε = ε(η) → 0+ et T = T (ε(η)) → +∞ telles que la densité supérieure dans (i) soit  η. Désignons par d(a,ε) la densité (iii) et posons  d(a,ε), F (z) := lim sup F (z ,η). F (z ,η) := η→0

aT (ε ), f (a)z

Montrons d’abord que FN (z), définie par (2.2), converge faiblement vers F . Pour z ∈ C(F ), on a    1 1 1 1+ 1. 1+ FN (z)  N N N nN aε (n)T (ε ) f (aε (n))z+ε

nN aε (n)>T (ε )

nN |f (n)−f (aε (n))|>ε

Par (iii), le premier terme de cette majoration vaut F (z + ε,η) + o(1) lorsque N → ∞. Les deux autres peuvent être majorés grâce à (i) et (ii). En faisant tendre successivement N vers +∞ et η vers 0, nous obtenons  lim sup FN (z)  lim sup F z + ε(η),η = F (z). N →∞

η→0

La dernière égalité provient de la croissance en w de F (w,η) et du fait que z ∈ C(F ). On obtient symétriquement  lim inf FN (z)  lim sup F z − ε(η),η = F (z). N →∞

η→0

Ainsi FN converge faiblement vers F et nous pouvons normaliser cette fonction de manière à la rendre continue à droite.

414

III.2. LOI DE RÉPARTITION D’UNE FONCTION ARITHMÉTIQUE

Il reste à établir que F (−∞) = 0, F (+∞) = 1. Puisque F (z) = lim FN (z) pour z ∈ C(F ), on a clairement 0  F  1. Soit alors ε > 0. Choisissons z dans C(F ) tel que z > max{f (a) : a  T (ε)} + ε. Alors f (n) > z implique soit aε (n) > T (ε), soit |f (n) − f (aε (n))| > ε. Par (i) et (ii) la densité correspondante 1 − F (z) tend vers 0 lorsque η → 0+. Cela implique F (+∞) = 1. On obtient F (−∞) = 0 de manière analogue. ⊓ ⊔ Dans l’étude probabiliste d’une fonction arithmétique, il est naturel d’opérer une normalisation en introduisant l’espérance et la variance de f relativement à νN , soit  +∞ 1  f (n), z dFN (z) = (2.3) EN (f ) := N −∞ 1nN

et

VN (f ) = DN (f )2 := (2.4)

1 = N



1nN



+∞

−∞



2 z − EN (f ) dFN (z)

{f (n) − EN (f )}2 .

Cela suggère une approche différente du problème de la répartition des valeurs d’une fonction arithmétique. Au lieu d’étudier le comportement asymptotique de FN (z), on considère celui de (2.5) GN (z) := νN n : f (n)  EN (f ) + zDN (f ) .

On peut regarder cette question comme centrale(2) en théorie probabiliste des nombres. La suite des f.r. FN (z) ou GN (z) contient toute l’information concernant la fonction arithmétique f , et l’on peut « traduire » en termes de f.r. les questions habituellement soulevées. Citons deux exemples. (a) Il est équivalent de dire qu’une suite d’entiers A possède une densité naturelle α et d’énoncer que sa fonction indicatrice 1A (n) possède une f.r. atomique ⎧ (z < 0) ⎨0 (0  z < 1) F (z) = 1 − α ⎩ 1 (z  1). (b) S’il existe deux suites réelles AN ,BN , telles que  HN (z) := FN AN + zBN

converge faiblement vers une f.r. H(z) et si la convergence des espérances

z dHN (z) est dominée au sens de Lebesgue, on a    +∞ z dH(z) + o(1) BN (N → ∞). EN (f ) = AN + −∞

2

Sans jeu de mots, bien que le théorème central–limite et la convergence vers la loi de Gauss soient incontournables dans cette branche de l’arithmétique : voir notamment le Théorème 4.15, et l’Exercice 287, p. 515.

2.2. FONCTIONS CARACTÉRISTIQUES

415

Ainsi une connaissance suffisamment fine de la f.r. de f fournit-elle une estimation de la valeur moyenne. En règle générale, on peut énoncer que l’étude d’une fonction arithmétique ne doit être considérée comme complète que lorsque sa f.r. est élucidée.

2.2. Fonctions caractéristiques Ainsi qu’il a été mentionné au Ch. II.7, la fonction caractéristique(3) d’une f.r. F est la transformée de Fourier de la mesure de Stieltjes dF (z), soit  +∞ (2.6) ϕ (τ ) := eiτ z dF (z) (τ ∈ R). −∞

C’est une fonction uniformément continue sur la droite réelle, satisfaisant à

|ϕ (τ )|  1 = ϕ (0)

(τ ∈ R).

La correspondance F ↔ ϕ est bijective, comme l’atteste la formule d’inversion  T 1 1 − e−iτ h −iτ z (2.7) F (z + h) − F (z) = lim e ϕ (τ ) dτ , T →∞ 2π −T iτ valable pour z et z +h dans C(F ). La démonstration de (2.7) est analogue à celle de la formule classique d’inversion de Fourier, et ne présente aucune difficulté nouvelle. Si F et G ont la même f.c., il découle de (2.7) que F (z+h)−F (z) = G(z+h)− G(z) pour presque tous z , h. En faisant tendre h vers −∞, on obtient que F (z) = G(z) presque partout. Comme F et G sont croissantes au sens large et continues à droite, cela implique bien que F = G. Le célèbre théorème de continuité de Paul Lévy relie la convergence faible des f.r. à la convergence simple des f.c. Théorème 2.4 (Théorème de continuité, Lévy, 1925). Soit {Fn }∞ n=1 une suite de f.r. et {ϕn }∞ n=1 la suite de leurs f.c. Alors Fn converge faiblement vers une f.r. F si, et seulement si, ϕn converge simplement sur R vers une fonction ϕ continue en 0. De plus, dans ce cas, ϕ est la f.c. de F , et la convergence de ϕn vers ϕ est uniforme sur tout compact. Ce résultat classique est établi en détail dans la plupart des livres sur la théorie des probabilités — cf. par exemple Cramér (1970), Feller (1971), Loève (1963), Lukacs (1970). Nous nous contentons ici d’indiquer les principales étapes. Le premier point est une identité qui découle facilement de (2.7). Lemme 2.5. Soit F une f.r., ϕ sa f.c. Pour z ∈ R, h > 0, on a    +∞ 1 z+h 1 z 1 sin(τ /2) 2 −iτ z/h τ  dτ . (2.8) F (t) dt− F (t) dt= e ϕ h z h z−h 2π −∞ τ /2 h

z+h Preuve du lemme. Il suffit d’appliquer (2.7) à la f.r. F0 (z) := (1/h) z F (t) dt. Une intégration par parties permet d’établir immédiatement que la f.c. de F0 (z) est ϕ (τ )(1 − e−iτ h )/iτ h. Un changement de variables évident fournit alors le résultat. ⊓ ⊔ 3

Nous utiliserons dans la suite l’abréviation f.c.

416

III.2. LOI DE RÉPARTITION D’UNE FONCTION ARITHMÉTIQUE

Démonstration du théorème. La nécessité de la condition est facile. Si Fn converge faiblement vers F , on obtient par un argument standard l’existence, pour chaque ε > 0, d’un X = X(ε) tel que      iτ z sup sup  e dFn (z)  sup dFn (z)  ε. n1 τ ∈R

n1

|z|>X

|z|>X

On peut choisir X de sorte que ±X ∈ C(F ) et l’on voit, par exemple grâce à une intégration par parties, que  X  X eiτ z dF (z) eiτ z dFn (z) → −X

−X

uniformément sur tout compact. Quitte à changer la valeur de X , la dernière intégrale vaut ϕ (τ ) + O(ε). Cela implique bien que ϕn → ϕ uniformément sur tout compact. Pour établir la réciproque, il suffit de montrer que si ϕn converge simplement vers ϕ continue en 0, alors Fn converge faiblement vers une f.r. F . En effet, il découle alors du sens direct que ϕ est la f.c. de F et que la convergence ϕn → ϕ est uniforme sur tout compact. Le premier pas consiste à remarquer que l’on peut extraire de {Fn }∞ n=1 une sous-suite {Fnj }∞ j=1 convergeant faiblement vers une fonction croissante au sens large et continue à droite F . Cela découle d’un procédé diagonal classique, et nous omettons les détails. On a trivialement 0  F  1, et il reste à montrer que F est une f.r., c’est-à-dire F (+∞) − F (−∞) = 1. À cette fin, nous appliquons (2.8) avec z = 0, F = Fnj , ϕ = ϕnj , et faisons tendre j vers +∞. Les conditions d’application du théorème de Lebesgue sont trivialement remplies. On obtient donc (2.8) où F est la limite faible des Fnj , et ϕ la limite simple des ϕnj . Lorsque h → +∞, le membre de droite tend vers F (+∞) − F (−∞) puisque F est croissante au sens large, et le membre de gauche tend vers ϕ (0) car ϕ est continue en 0 et bornée. Or, ϕ (0) = 1 puisque ϕn (0) = 1 pour tout n. La limite faible des Fnj est donc bien une f.r. Il en va de même de toute autre limite faible, disons F ∗ . Et, puisque F ∗ a nécessairement encore ϕ pour f.c. (d’après la première partie de la démonstration), on en déduit que F = F ∗ . Donc toute sous-suite faiblement convergente de ∞ {Fn }∞ n=1 converge vers F , ce qui signifie que {Fn }n=1 converge faiblement vers F , et achève la démonstration. ⊓ ⊔ Lorsque la loi limite F (z) est absolument continue et de densité bornée, disons  z h(t) dt, F (z) = −∞

l’inégalité de Berry–Esseen (Théorème II.7.16) donne une évaluation quantitative de l’approximation de Fn par F . On a pour tout T > 0  T   1  ϕn (τ ) − ϕ (τ )  (2.9) sup |Fn (z) − F (z)| ≪ sup |h(t)| +   dτ . T t∈R τ z∈R −T

ε Supposons, que limε→0 supn 0 |1 − ϕn (τ )| dτ /τ = 0.(4) Puisque ϕn tend vers ϕ uniformément sur tout compact, le membre de droite de (2.9) est alors majoré, 4 On peut montrer que cette condition équivaut à l’uniforme dF -intégrabilité de ln+ |x|, soit n

limT →∞ supn |x|>T ln |x| dFn (x) = 0.

2.2. FONCTIONS CARACTÉRISTIQUES

417

pour un choix convenable de T = Tn , par une quantité εn ne dépendant que de n et telle que limn→∞ εn = 0. Cette majoration est dans la pratique d’une importance capitale — cf. par exemple le Théorème 4.15. Compte tenu de la définition de la f.r. limite d’une fonction arithmétique, le théorème de continuité fournit immédiatement le critère suivant. Théorème 2.6. Soit f une fonction arithmétique réelle. Alors f possède une f.r. F si, et seulement si, la suite de fonctions 1  iτ f (n) (2.10) ϕN (τ ) := e N nN

converge simplement sur R vers une fonction ϕ (τ ) continue en 0. Dans ce cas, ϕ est la f.c. de F .

+∞ Si FN (z) est définie par (2.2), on a en effet ϕN (τ ) = −∞ eiτ z dFN (z). Lorsque f est additive, la fonction n → eiτ f (n) est, pour chaque τ , une fonction multiplicative de module 1. Le problème de l’existence d’une loi limite pour f est donc équivalent à celui de l’existence de la valeur moyenne d’une fonction multiplicative à valeurs dans le disque unité. Nous verrons au Chapitre III.4 comment on peut exploiter cette dualité.

N OTES

§ 2.1. Pour plus de détails concernant la théorie des f.r., consulter Feller (1970, 1971), Loève (1963), ou Lukacs (1970). Le Théorème 2.3 est identique au lemma A2 de Hall & Tenenbaum (1988). La normalisation (2.5) des f.r. des fonctions arithmétiques possède un intérêt théorique manifeste. En pratique, il est souvent préférable de conserver une plus grande souplesse et de poser la question plus générale de savoir pour quelles fonctions AN ,BN , la suite de f.r.

HN (z) := νN {n : f (n)  AN + zBN }

(N = 1,2, . . .)

converge faiblement vers une f.r. H(z). C’est le point de vue adopté par Elliott (1979). Son livre est aujourd’hui considéré comme l’une des références incontestables de la théorie probabiliste des nombres. § 2.2. Notre démonstration du théorème de Lévy suit essentiellement celle de Cramér (1970). La théorie des f.c. est particulièrement adaptée pour traiter des convolutions de f.r. On appelle convolée de deux f.r. F , G la f.r. H définie par  +∞  +∞ G(z − y) dF (y). F (z − y) dG(y) = H(z) := −∞

−∞

Si ϕ (τ ), γ (τ ) sont les f.c. respectives de F , G alors η(τ ) = ϕ (τ )γ (τ ) est la f.c. de H . La formule de Parseval s’écrit  +∞  +∞ 1 g(z) dF (z) = (2.11) g((τ )ϕ (τ ) dτ 2π −∞ −∞

pour toute fonction g ∈ L1 (R) dont la transformée de Fourier

1

est aussi dans L (R).

g((τ ) =



+∞

−∞

e−iτ z g(z) dz

NOTES

419

Désignons par Cb (R) l’espace des fonctions continues et bornées sur R. La relation (2.11) persiste sous la forme  λ  +∞ |τ |  1 g (τ )ϕ (τ ) dτ ( 1− g(z) dF (z) = lim (2.12) λ→∞ 2π −λ λ −∞

pour toute fonction g ∈ L2 (R) ∩ Cb (R). On peut établir cela rapidement grâce aux propriétés du noyau de Fejér λ sin λz/2 2 wλ (z) := , 2π λz/2

de transformée w ;λ (τ ) = (1 − |τ |/λ)+ . En effet, sous les hypothèses indiquées pour g , on sait classiquement que gλ := g ∗wλ converge simplement et en moyenne quadratique vers g et que gλ ∞  g∞ . De plus, g(λ = ( gw ;λ est dans L1 (R) en 2 tant que produit d’une fonction de L (R) par une fonction continue à support compact. En appliquant (2.11) à gλ , et en évaluant la limite du membre de gauche par le théorème de Lebesgue, on obtient bien (2.12). En choisissant, dans (2.12), g(z) = sin{T (z − y)}/{T (z − y)}, de sorte que g((τ ) = π e−iτ y /T (|τ |  T ), g((τ ) = 0 (|τ | > T ), on obtient  T  +∞ 1 sin{T (z − y)} dF (z) = e−iτ y ϕ (τ ) dτ . T (z − y) 2 T −T −∞ Par intégration sur R relativement à dF (y), il suit  T  +∞  +∞ sin{T (z − y)} 1 dF (z) dF (y) = |ϕ (τ )|2 dτ . (2.13) T (z − y) 2T −T −∞ −∞ D’où, en faisant tendre T vers +∞, (2.14)



n0

s2n = lim

T →∞

1 2T



T

−T

|ϕ (τ )|2 dτ

où {sn }∞ n=1 est la suite des sauts de F , ordonnée de façon à être décroissante. En particulier, la relation  T 1 |ϕ (τ )|2 dτ = 0 (2.15) lim T →∞ 2T −T est une condition nécessaire et suffisante pour que F soit continue. Comme nous le verrons au Chapitre III.4, la convergence de produits de convolutions (2.16)

F1 ∗ F2 ∗ · · · ∗ Fn

(n → ∞)

est capitale pour l’étude des lois limites des fonctions additives ou multiplicatives. Dans ce contexte, nous citons trois résultats fondamentaux, que nous rassemblons dans un même énoncé. Nous notons ϕj (τ ) la f.c. de Fj et désignons par σj son plus grand saut, soit σj := max{Fj (z) − Fj (z−)}. z∈R

Enfin, nous écrivons Y := 1[0,∞[ la fonction de Heaviside.

420

III.2. LOI DE RÉPARTITION D’UNE FONCTION ARITHMÉTIQUE

Théorème 2.7. Les trois conditions suivantes sont équivalentes : (i) Le produit (2.16) converge faiblement vers une f.r. F lorsque n → ∞, ! (ii) ∃δ > 0 : limm,n→∞ m 0. Pour chaque j 1, nous choisissons un nombre réel uj tel que σj = Fj (uj ) − Fj (uj −). La série il existe un δ > 0 j1 uj est nécessairement convergente : dans le cas contraire,  et deux suites d’entiers mk , nk tendant vers l’infini tels que | mk δ pour tout k , d’où   dFmk ,nk (z), σj  |z|>δ

mk 0, F (u) − F (u−)  ! j1

{uj } j1

j1

et F n’est pas continue au point u.

Réciproquement, si la condition (2.17) est réalisée, soit ε > 0 et m = m(ε) tel  que 1jm (1 − σj )  1/ε2 . Pour   0 (ε) on a QFj ()  σj + 1/m (1  j  m). En appliquant (2.20) puis (2.21) on obtient QF () ≪ ε. Cela montre que QF () tend vers 0 avec  et donc que F est bien continue.

422

III.2. LOI DE RÉPARTITION D’UNE FONCTION ARITHMÉTIQUE

Le lemme suivant fournit un encadrement de Q(F ) en fonction de moyennes de ϕ (τ ). Nous notons simplement w(z) le noyau de Fejér w1 (z).  < 1,022. Lemme 2.9. Soient K1 := w(1) > 0,146 et K2 := 1/ 2π w 21 Pour toute f.r. F de f.c. ϕ , on a  1  1 (2.22) K1 |ϕ (τ )|2 dτ  Q(F )  K2 |ϕ (τ )| dτ . −1

−1

Démonstration. Pour chaque z ∈ R, on a  z+1/2 1 1 dF (v) F (z + 2 )−F (z − 2 ) =



1 w(1/2)



z−1/2 +∞

−∞

w(z − v) dF (v) = K2



1

−1

(1 − |τ |)e−iτ z ϕ (τ ) dτ ,

où la dernière égalité découle de (2.11). Cela implique la majoration de (2.22). Pour la minoration, on note que  +∞  z+1/2  +∞ 2 Q(F ) = Q(F ) F (z + 12 ) − F (z − 21 ) dz . dF (v) dz  −∞

−∞

z−1/2

Or, la formule d’inversion (2.7) sous la forme  T sin(τ /2) 1 1 1 ϕ (τ )e−iτ z dτ lim F (z + 2 ) − F (z − 2 ) = 2π T →∞ −T τ /2

étant interprétée comme une transformée de Fourier dans L2 (R), on peut écrire la formule de Plancherel  +∞  1  +∞  2 1 2 1 F (z + 2 ) − F (z − 2 ) dz = w(τ )|ϕ (τ )| dτ  w(1) |ϕ (τ )|2 dτ . −∞

−∞

−1

Cela fournit bien l’inégalité annoncée. ⊓ ⊔ Nous sommes maintenant en mesure d’établir le Théorème 2.8. La preuve qui suit est une variante de celle de Esseen (1966), ou Hengartner & Theodorescu (1973). Nous pouvons supposer sans perte de généralité que  = 1, et que Q(Fj ) < 1 pour 1  j  n. Par (2.22), on peut écrire  1  n |ϕj (τ )| dτ Q(F )  K2 −1 j=1

(2.23)

 K2



1

exp

−1





1 2

2

   1 − |ϕj (τ )|2 dτ ,

1jn

en vertu de l’inégalité u  e−(1−u )/2 , valable pour 0  u  1. Soit Fˇj (z) := 1 − Fj (−(z+)) la f.r. symétrique de Fj (z), de f.c. ϕj (τ ). On définit la symétrisée Gj := Fj ∗ Fˇj , dont la f.c. est donc |ϕj (τ )|2 . On a ainsi  +∞ (1 − cos(τ z)) dGj (z). (2.24) 1 − |ϕj (τ )|2 = −∞

NOTES

Posons I := [− 21 , 21 [ et   dGj (z) = pj :=

+∞

−∞

RI

dFj (y)



x∈y−I /

423

dFj (x)  1 − Q(Fj ) > 0.

Nous introduisons maintenant la f.r. Hj définie par  si z ∈ / I, Gj (z)/pj Hj (z) = Gj (− 12 )/pj si z ∈ I .

dGj  pj dHj et nous reportons cette On a   minoration dans (2.24). Posons T := 1jn 1/αj = 1. Grâce à l’inéga1jn pj , αj := T /pj , de sorte que lité de Hölder avec exposants αj , on déduit de (2.23) et de la minoration issue de (2.24) en introduisant dHj , que  +∞ n  1   1/αj  1 Q(F )  K2 exp − 2 αj pj (1 − cos(τ z)) dHj (z) dτ . j=1

−1

−∞

On a αj pj = T pour tout j . L’exponentielle de la formule précédente peut donc être majorée, grâce à l’inégalité de Jensen, par  +∞ e−T (1−cos(τ z))/2 dHj (z), −∞

d’où, en intervertissant l’ordre des intégrations, 1/αj  1 n   +∞  −T (1−cos(τ z))/2 Q(F )  K2 dHj (z) e dτ . j=1

−∞

−1

On peut supposer |z|  21 pour majorer l’intégrale intérieure puisque dHj (z) ne charge pas I . Il suit  |z|  1 2 e−T (1−cos(τ z))/2 dτ = e−T (1−cos v)/2 dv |z| −1 0  |z|  π −T (1−cos v)/2 2 e dv 1+  |z| π 0 

2  +∞ −T v2 /π 2 19 e dv  √ .  4+ π T 0

Cela implique la majoration (2.21) lorsque T  1. Comme le résultat est trivial dans le cas contraire, la preuve du Théorème 2.8 est complète. Pour un complément d’information sur les f.c., consulter le remarquable ouvrage de Lukacs (1970).

E XERCICES

253. Fonction de répartition de ϕ (n)/n !. Soient ε > 0, y := 1/ε2 , et aε (n) := pν n, py pν (n  1). (a) Montrer que

d{n : aε (n) = a} =

1  1 1− a p py

+

pour a  1, P (a)  y. (Utiliser, par exemple, l’Exercice 77, p. 122.)   (x  1). (b) Établir la majoration nx ln aε (n) ≪ x ln 1/ε

(c) On pose f (n) = ϕ (n)/n, où ϕ est la fonction d’Euler. Montrer que  1    f (n) − f aε (n)   . p p|n, p>y

(d) Montrer que f (n) possède une loi limite. On déduira de (b) et (c) que les conditions (i) et (ii) du Théorème 2.3 sont satisfaites. 254. Un théorème de Schoenberg (1928). Déterminer, pour chaque τ ∈ R, la iτ  = fonction arithmétique λτ satisfaisant à ϕ (n)/n d|n λτ (d). Montrer que  la série ψ (τ ) := d1 λτ (d)/d est absolument convergente, et retrouver ainsi le résultat de l’Exercice 253. Montrer que la loi limite F est donnée par

F (ez ) = lim Fp1 ∗ Fp2 ∗ · · · ∗ Fpn (z) n→∞

où pj désigne le j -ième nombre premier et dFpj est une combinaison linéaire de deux mesures de Dirac. En déduire, par application du Théorème 2.7(a) que F est continue.(6) Montrer que F est pure en utilisant le Théorème 2.7(b).  255. Traiter les Exercices 253 et 254 en considérant σ (n)/n (avec σ (n) := d|n d) à la place de ϕ (n)/n. Généraliser. 256. Une condition suffisante de singularité (Erdos, ˝ 1939). Dans tout l’exercice on suppose donnée une fonction à valeurs entières, croissante au sens large, R(y) satisfaisant à  (i) p 1/pR(p) < ∞

6 On peut établir directement cette propriété en faisant appel au critère (2.15) des Notes — cf. la fin de la démonstration du Théorème 4.1.

EXERCICES

425

(ii) Pour tout y assez grand, il existe R = R(y) entiers m1 < m2 < · · · < mR tels que (α)  P + (mj )  y , μ(mj )2 = 1 (1  j  R(y)), (β) 1jR(y) 1/ϕ (mj )  c ln y , où c est une constante absolue positive.

On se propose ici d’établir le résultat suivant, dû à Erdos ˝ : Soit f une fonction arithmétique fortement additive telle que f (p) ≪ 1/R(p)3 . Alors f possède une f.r. atomique ou purement singulière.  (a) Calculer limx→∞ x−1 nx eiτ f (n) par la méthode suggérée à l’Exercice 254. En déduire l’existence de la loi limite, et son caractère de type pur.(7) (b) On désigne par λ(I) la mesure de Lebesgue d’un sous-ensemble Riemann– intégrable générique I de R. Montrer que si la loi limite de f est absolument continue alors limλ(I)→0 d{n : f (n) ∈ I} = 0. ! (c) Soient ε > 0, et y = y(ε) assez grand. On pose aε (n) := py,p|n p. Montrer que l’on a pour a  1, μ(a)2 = 1, P + (a)  y , 1 1  d{n : aε (n) = a} = 1− ϕ (a) p py

et que l’on peut appliquer le Théorème 2.3 pour fournir une seconde preuve de l’existence de la f.r. de f . (d) Le nombre y(ε) étant choisi assez grand, on pose 6 ' & f (mj ) + − 1/R(y)2 , 1/R(y)2 . I := 1jR(y)

Montrer que d{n : f (n) ∈ I} ≫ 1. Conclure.

257. Montrer que R(y) = y δ satisfait pour tout δ > 0 aux hypothèses de l’Exer&cice 256. En déduire que les f.r. de ϕ (n)/n et σ (n)/n 'sont purement singulières. On admettra ici le résultat des Exercices 254 et 255.

258. Soit F (z) une f.r. de f.c. ϕ (τ ). Montrer que si ϕ ∈ L2 (R), alors F est absolument continue. On pourra faire appel au théorème de Plancherel et à la formule de Parseval (2.11) pour une fonction arbitraire g de classe C 2 et à support compact. 259. Un résultat de Saffari (1979). Soit f la fonction fortement additive définie par f (2) = 0, f (p) = (ln p)−α (p > 2), où α > 0 est donné. (a) Montrer que f admet une f.r. F , et calculer sa f.c. ϕ (τ ). (b) Montrer, en calculant |ϕ (τ )|2 , que  1   sin2 21 τ f (p) . ϕ (τ ) ≍ exp − 2 p p

(c) Évaluer la somme en p à l’aide du théorème des nombres premiers et établir que |ϕ (τ )| = |τ |−1/α+o(1) (|τ | → ∞). En déduire, grâce au résultat de l’Exercice 258, que F est absolument continue dès que α < 2. 260. Soit h(n) le nombre des facteurs premiers p de n tels que n1/3 < p  n1/2 . Montrer que h(n) possède une mesure de répartition. 7

Voir les Notes, Théorème 2.7.

426

III.2. LOI DE RÉPARTITION D’UNE FONCTION ARITHMÉTIQUE

261. Concentration d’une fonction additive sur les diviseurs. Étant donnée une fonction additive réelle f , on définit, pour chaque entier n, une f.r. Fn par  1 1. Fn (z) := τ (n) d|n, f (d)z

(a) Calculer la f.c. ϕn (τ ) de Fn et en déduire que Fn = F ν . Montrer pν n p que, s’il existe une constante absolue positive c telle que Q(Fpν )  1 − c, alors on a Q(Fn ) ≪ {1 + ω(n)}−1/2 . (b) Dans le cas f = ln, on définit la fonction  de Hooley(8) (1979) par  (n) = Q(Fn )τ (n) = max 1.

*

u∈R

d|n, eu 0, on ait

|f (n) − g(n)|  ε|g(n)| pour un ensemble d’entiers n de densité unité. Une notation commode pour exprimer une telle situation est(1) (3.1) f (n) = 1 + o(1) g(n) pp.

Bien entendu, une fonction f donnée peut avoir plusieurs ordres normaux, qui sont des fonctions équivalentes à l’infini. La notion n’est alors pertinente que pour les fonctions g dont le comportement asymptotique est, en un certain sens, plus simple que celui de f . C’est certainement avec cette arrière-pensée que Hardy & Ramanujan (1917), dans un article que l’on peut aujourd’hui considérer comme l’acte de naissance de la théorie probabiliste des nombres, ont restreint la dénomination d’ordre normal aux fonctions g qui sont en outre élémentaires et monotones. Il est toujours délicat d’hasarder une définition du mot élémentaire. Pour fixer les idées, nous pouvons lui donner ici l’acception relativement large de : qui s’exprime au moyen des symboles de l’analyse réelle. Ainsi, nous considérons comme élémentaire une fonction comme li(x) mais rejetons la dénomination dans le cas d’une fonction définie exclusivement par une intégrale de Cauchy. Quoique satisfaites dans la quasi-totalité des situations connues, nous n’avons pas souhaité conserver ici les deux limitations de Hardy & Ramanujan, de manière à conserver une flexibilité maximale à la notion théorique. 1

Rappelons que la mention pp (presque partout) signifie que la relation ainsi désignée est valable sur un ensemble convenable de densité naturelle unité.

428

III.3. ORDRE NORMAL

En termes de fonctions de répartition (f.r.), l’existence d’un ordre normal s’interprète comme la convergence vers une loi impropre après une renormalisation convenable. Par exemple, il est immédiat que, dans le cas de fonctions positives, la relation (3.1) équivaut à la convergence faible des f.r. HN (z) := νN n : f (n)/g(n)  z

vers H(z) := 1[1,∞[ (z). Nous verrons, dans la suite de ce chapitre et dans les suivants, que de nombreuses fonctions arithmétiques d’apparence irrégulière possèdent en fait un ordre normal. Leur comportement est alors élucidé « presque partout » et l’ensemble des renseignements de ce type contribue à l’élaboration de notre notion de nombre « normal » — c’est-à-dire « au hasard », dans le sens décrit par la densité naturelle. Qu’un tel concept soit susceptible de propositions quantitatives, et puisse finalement servir de base à une théorie mathématique complète, n’est pas le moindre des attraits de la vision probabiliste de l’arithmétique.

3.2. L’inégalité de Turán–Kubilius Dans l’étude d’une fonction arithmétique f , il est souvent raisonnable de considérer la valeur moyenne (ou une approximation adéquate d’icelle) 1  f (n) (3.2) g(N ) = EN (f ) := N 1nN

comme un bon candidat à constituer l’ordre normal de f . Lorsque g est monotone, une condition nécessaire pour cela est que la croissance de g soit suffisamment lente pour que l’on ait (3.3) g(n) = 1 + o(1) g(N ) pour tous sauf au plus o(N ) entiers n  N . Il est alors naturel de penser qu’un calcul de dispersion, c’est-à-dire une évaluation de la variance empirique  2 (3.4) VN (f ) := EN |f (n) − g(N )| ,

permettra, grâce à l’inégalité de Bienaymé–Tchébychev, d’établir effectivement que g est un ordre normal pour f . Cette méthode est particulièrement efficace dans le cas des fonctions additives. L’inégalité de Turán–Kubilius (Théorème 3.1) fournit alors une majoration de (3.4) qui suffit souvent à la détermination de l’ordre normal. Avant d’énoncer le résultat, intéressons-nous à en expliciter les idées probabilistes sous-jacentes. Soit f une fonction additive complexe. On a  (3.5) f (n) = f (pν )ξpν (n) (n  N ) pν N

avec (3.6)

ξpν (n) =



1 0

si pν n, sinon.

3.2. L’INÉGALITÉ DE TURÁN–KUBILIUS

429

Autrement dit, dans l’espace probabilisé N := {n : 1  n  N } muni de la loi uniforme νN , on a l’égalité entre variables aléatoires  f= f (pν )ξpν . pν N

Les ξpν sont des variables de Bernoulli, déterminées par leurs espérances (3.7)

wN (pν ) := EN (ξpν ) = νN {n : ξpν (n) = 1}    

1 1 − 1/p 1 N N = − = + O . N pν p ν +1 pν N

Lorsque q = p, on peut encore écrire         1 N N N N − ν +1 μ − ν μ+1 + ν +1 μ+1 EN (ξpν ξqμ ) = N pν q μ p q p q p q

1

1 (1 − 1/p)(1 − 1/q) ν μ = E + O ( ξ )E ( ξ ) + O . N p N q pν q μ N N Ainsi ξpν et ξqμ sont asymptotiquement indépendantes lorsque p = q , et, à p fixé, les nombres EN (ξpν ) (ν = 0,1,2, . . .) sont proches des probabilités d’une variable aléatoire géométrique de paramètre (1 − 1/p). Cela conduit à formuler l’hypothèse heuristique que la répartition de f , en tant que variable aléatoire sur N := {n : 1  n  N }, est voisine de celle de  (3.8) ZN = Zf ,N := ζp =

pN

où les ζp = ζp (f ) sont des variables indépendantes, sur un espace probabilisé abstrait (,P ), de lois  (3.9) P ζp = f (pν ) = (1 − 1/p)p−ν (ν = 0,1,2, . . .).

[Noter que f (1) = 0.] Par abus de notation, nous interprétons (3.9) en convenant que, si plusieurs valeurs (en nombre éventuellement infini) f (pν ) sont égales, la probabilité correspondante est la somme des probabilités apparaissant au second membre. Nous pouvons également supposer, sans perte de généralité, que f (pν ) = 0 si pν > N . On a

E(Zf ,N ) = (3.10)

 f (pν ) 1 1 − pν p ν

p N

V(Zf ,N ) = Bf (N )2 − Rf (N )2 où l’on a posé

 |f (pν )|2 1 1 − pν p pN pν N     1 2  Rf (N )2 := |E(ζp )|2 = 1−  p

Bf (N )2 := (3.11)



pN

E(|ζp |2 ) =

pN

1ν (ln N )/ ln p

2 f (pν )  pν 

et où E et V désignent respectivement l’espérance et la variance relatives à la loi de probabilités abstraite P satisfaisant (3.9).

430

III.3. ORDRE NORMAL

Pour fixer les idées, nous observons dès à présent que, d’après l’inégalité de Cauchy–Schwarz,  |f (pν )|2 1 1  2 Bf (N )2 , 1 − (3.12) Rf (N )2  p ν +1 p ν p N

de sorte que (3.13)

1 B (N )2 2 f



 1 2 |f (pν )|2 1−  V(Zf ,N )  Bf (N )2 . p pν ν

p N

De plus, 1  |f (pν )| N ν p N ) *1/2   |f (pν )|2  1 V(Zf ,N ) ν  · ≪ p ν N p ln N ν ν

|EN (f ) − E(Zf ,N )|  (3.14)

p N

p N

L’inégalité de Turán–Kubilius énonce essentiellement que (3.15)

CN := sup VN (f )/V(Zf ,N ) ≪ 1

(N  1).

f =0

Ici, VN (f ) désigne la variance empirique 1  2 |f (n) − EN (f )| , (3.16) VN (f ) := N 1nN

qu’il est souvent plus commode de remplacer par la variance semi-empirique 1  2 |f (n) − E(Zf ,N )| . (3.17) V∗N (f ) := N 1nN

Nous considérerons donc également la quantité (3.18)

∗ CN := sup V∗N (f )/V(Zf ,N ). f =0

Anticipant un instant sur (3.15), nous déduisons aisément de (3.14) que l’on a   V(Zf ,N ) (3.19) VN (f ) = V∗N (f ) + O , ln N où la constante implicite est indépendante de f , et donc

1  ∗ (N  2). (3.20) CN = CN + O ln N Observons par ailleurs que (3.15) est qualitativement optimale : on a

1 ∗ (N  1), (3.21) min(CN ,CN )  21− (ln N )/ ln 2 + O N

3.2. L’INÉGALITÉ DE TURÁN–KUBILIUS

431

et donc ∗ lim sup CN = lim sup CN  2.

(3.22)

N →∞

En effet, pour N  2, le choix  1 ν f (p ) := 0

N →∞

si p = 2 et 2ν  N < 2ν +1 , dans tous les autres cas,

fournit, en posant v := ⌊(ln N )/ ln 2⌋,

1 1 1 , E(Zf ,N ) = v+1  , N 2 N

1  1 1  1 ∗ 1 1 +O , V(Z ) = 1 − . 1− , VN (f ) = VN (f ) = f , N N N N N2 2v+1 2v+1

EN (f ) =

Nous sommes à présent en mesure d’énoncer l’inégalité de Turán–Kubilius. Nous posons ) ) 1/2   1 1/2  4 8 ν μ εN := 2 p q pν + . N N p ν μ ν p N

p q N p=q

pN

Grâce à une intégration par parties standard dont nous omettons les détails, le théorème des nombres premiers fournit immédiatement l’estimation  ln2 N (N  3). (3.23) εN ≪ ln N Théorème 3.1 (Inégalité de Turán–Kubilius). Pour toute fonction arithmétique additive complexe f , nous avons  (N  1). (3.24) V∗N (f )  4 + εN Bf (N )2  (8 + 2εN )V(Zf ,N )

En particulier,

∗ max(CN ,CN )

(3.25)

 8+O



ln2 N ln N



(N  3).

Démonstration. Il suffit d’établir la première inégalité dans (3.24) car la seconde résulte de (3.13). Considérons dans un premier temps le cas où f est réelle et positive ou nulle. On a  (3.26) V∗N (f ) = EN {f − E(Zf ,N }2 = M2 − 2E(Zf ,N )EN (f ) + E(Zf ,N )2 avec

M2 :=

1  1  f (n)2 = N N nN

=



pν N



f (pν )f (q μ )

nx pν n, qμ n

1  1+ f (pν )2 N nN pν n



pν qμ N p=q

f (pν )f (q μ )

1 N



nN pν n, qμ n

1.

432

III.3. ORDRE NORMAL

La première somme intérieure n’excède pas N/pν , la seconde est au plus égale à N p−ν q −μ (1 − 1/p)(1 − 1/q) + 2. Il vient, avec la notation (3.11),  2 f (pν )f (q μ ). (3.27) M2  2Bf (N )2 + E(Zf ,N )2 + N ν μ p q N , p=q

Estimons le dernier terme à l’aide de l’inégalité de Cauchy–Schwarz : <   f (pν ) f (q μ ) ν /2 μ/2 2= = · p q  2 B (N ) pν q μ . f > ν μ pν /2 q μ/2 ν μ p q N p=q

p q N p=q

En reportant dans (3.26) compte tenu de (3.14), nous obtenons 8  < 2E(Zf ,N )Bf (N ) 4Bf (N )2 =  ∗ 2 ν = 2 VN (f )  2Bf (N ) + p + > ν μ N N ν p N

pν q μ .

p q N p=q

Une nouvelle application de l’inégalité de Cauchy–Schwarz, sous la forme  1  f (pν )2 1   1 − 1/p E(Zf ,N )2  1 −  Bf (N )2 ν ν p p ν p p ν p N

p N

pN

+

implique donc, lorsque f est à valeurs dans R ,  V∗N (f )  2 + 12 εN Bf (N )2 .

Lorsque f est réelle et prend des valeurs des deux signes, on introduit les fonctions additives f + et f − , définies par f ± (pν ) = max ± f (pν ), 0 . On a alors, pour tout entier n  1, 2 2 2 f (n) − E(Zf ,N )  2 f + (n) − E(Zf + ,N ) + 2 f − (n) − E(Zf − ,N )

et Bf (N )2 = Bf + (N )2 + Bf − (N )2 (N  1). Cela implique la validité de (3.24) dans cette circonstance.

Lorsque f est à valeurs complexes, on applique le résultat précédent aux parties réelle et imaginaire de f . L’inégalité persiste trivialement. ⊓ ⊔ Les constantes 4 et 8 apparaissant dans (3.24) ne sont pas optimales. Kubilius a montré en 1983 que si l’on pose

Bf+ (f )2 :=

 |f (pν )|2 , pν ν

p N

alors (3.28)

+ CN := sup V∗N (f )/Bf+ (N )2 = f =0

+ CN ,

3 2

  1 . +O √ ln N

on peut prendre indifféremment le supremum sur les Dans la définition de fonctions f additives réelles ou complexes. Deux autres démonstrations indépendantes de la validité et de l’optimalité de la constante 32 sont dues à Hildebrand (1983) et Stein (1984).

3.3. FORME DUALE DE L’INÉGALITÉ DE TURÁN–KUBILIUS

433

Ainsi que l’ont remarqué La Bretèche & Tenenbaum (2005b), il est relativement aisé de déduire de la preuve de Hildebrand et de (3.22) que ∗ lim sup CN = lim sup CN = 2.

(3.29)

N →∞

N →∞

Ce résultat constitue une remarquable mesure de l’écart entre la théorie probabiliste des nombres et le modèle probabiliste : le fait que les constantes CN ∗ et CN soient bornées illustre l’influence du caractère d’indépendance des ξpν ; le fait que la limite supérieure commune de ces quantités n’ait pas pour valeur 1 souligne la relativité de cette influence. Les énoncés classiques de l’inégalité de Turán–Kubilius ont longtemps été + exprimés en termes de CN ou de quantités voisines.(2) Le caractère fondamental de l’interprétation de CN comme rapport de la variance empirique d’une fonction ∗ arithmétique à celle de son modèle probabiliste — la quantité CN reflétant essentiellement les mêmes phénomènes mais se révélant plus maniable — conduit à préférer la formulation (3.29). Les mêmes motivations sont présentes, sous une forme encore plus radicale, dans l’étude l’extension friable de l’inégalité de Turán–Kubilius, dont la validité est conditionnelle à un choix adéquat du modèle : voir les Notes du Chapitre III.5.

3.3. Forme duale de l’inégalité de Turán–Kubilius Soient f une fonction arithmétique additive et N ∈ N∗ . Pour 1  n  N , nous avons  f (n) − E(ZN ,f ) = cnr yr , rN

où nous avons posé,

yr :=

⎧ ⎪ ⎨ ⎪ ⎩

8

f (pν )

1 − 1/p pν

si r = pν , si r = pν ,

0

et, avec la notation (3.6), ⎧ 8  ⎪ ⎨ pν 1 − 1/p ν cnr := ξp (n) 1 − 1/p − pν ⎪ ⎩ 0

2

Hildebrand (1983) compare également VN (f ) à     |f (pν )|2 wN (pν ) − Bf∗ (N )2 := pν N

pN



si r = pν , si r = pν .

1ν(ln N)/ ln p

2 f (pν )wN (pν ) ,

où nous avons employé la notation wN définie en (3.7). La quantité Bf∗ (N )2 représente la somme des variances, relativement à la mesure νN , des fonctions arithmétiques additives fp définies par  si pν n, f (pν ) fp (n) := 0 si p ∤ n.

434

III.3. ORDRE NORMAL

L’inégalité de Turán–Kubilius peut donc encore s’écrire, avec la notation (3.18), 2      ∗ cnr yr   N CN |yr |2 .  nN

rN

rN

Puisque les yr sont des nombres complexes arbitraires, nous pouvons appliquer le principe de dualité faisant l’objet du Lemme I.4.8. Il suit 2      ∗ cnr an   N CN |an |2  rN

nN

nN

pour toute suite de nombres complexes {an }N n=1 . Remarquons alors que l’on a, pour r = pν , + ,    1 − 1/p  pν an − an . cnr an = 1 − 1/p pν ν nN

nN

nN , p n

Nous pouvons donc énoncer le résultat suivant.

Théorème 3.2. Pour toute suite {an }N n=1 de nombres complexes, on a  2   pν   1 − 1/p   ∗ (3.30) an − an   N CN |an |2 .  ν 1 − 1 /p p ν ν p N

nN , p n

nN

nN

On reconnaît ici une variante du Théorème I.4.14, obtenu comme corollaire de l’inégalité du grand crible. La comparaison des termes d’indice p, correspondant donc à ν = 1, met en évidence deux disparités d’influences opposées : une seule classe de congruence est considérée pour chaque nombre premier p, mais la sommation en p est significativement plus longue. Cette estimation est très utile en pratique grâce à sa complète généralité et à sa totale uniformité. Elle exprime qu’en moyenne toute suite an suffisamment dense est bien répartie dans les classes de congruence n ≡ 0 (mod pν ). Elliott a consacré un livre entier (1997) à la description et au développement des différentes méthodes élaborées pour exploiter la dualité dont le Théorème 3.2 constitue le prototype. Sa lecture est vivement recommandée pour circonscrire et approfondir les idées fondamentales de la théorie analytique et probabiliste des nombres moderne.

3.4. Le théorème de Hardy–Ramanujan et autres applications Comme annoncé au paragraphe 3.2, l’inégalité de Turán–Kubilius est un outil particulièrement bien adapté à la détermination de l’ordre normal d’une fonction additive. On a le résultat général suivant, où les notations sont celles de (3.10) et (3.11). Théorème 3.3. Soit f une fonction additive à valeurs complexes. Sous l’hypothèse  (3.31) Bf (N ) = o E(Zf ,N ) (N → ∞),  la fonction n → g(n) := E Zf ,n est un ordre normal pour f .

3.4. LE THÉORÈME DE HARDY–RAMANUJAN ET AUTRES APPLICATIONS

435

Démonstration. Montrons d’abord que g(n) = 1 +o(1) g(N ) pour tous les entiers n √  N sauf au plus o(N ). Cela découle de la majoration suivante, valable pour N < n  N,   1 − 1/p   |g(N ) − g(n)| =  f (pν )  pν n ε|g(N )| = o(1).

Or, le membre de gauche n’excède pas  

 f (n) − g(N ) 2   Bf (N ) 2    = o(1), (3.33) EN   ≪  εg(N ) εg(N ) 

⊔ d’après le Théorème 3.1 et l’hypothèse (3.31). Cela achève la démonstration. ⊓ L’exemple historique d’application du Théorème 3.3 est celui des fonctions ω(n) et (n). Dans les deux cas, on constate sans peine que l’on a

(3.34)

g(N ) = ln2 N + O(1),

Bf (N )2 = ln2 N + O(1),

de sorte que (3.31) est bien satisfaite. Nous obtenons ainsi le résultat remarquable que le nombre des facteurs premiers d’un entier n, comptés avec ou sans leur ordre de multiplicité, est normalement équivalent à ln2 n. C’est cet énoncé que l’on désigne habituellement comme le théorème de Hardy & Ramanujan (1917). La version quantitative suivante est due à Turán (1934). Théorème 3.4. Soit ξ (N ) → ∞. Pour N  3, on a     n  N : |ω(n) − ln2 N | > ξ (N ) ln2 N  ≪ N/ξ (N )2 . (3.35)

De plus, la même majoration est valable pour (n) à la place de ω(n).

√ Démonstration. Il suffit, compte tenu de (3.34), de choisir ε = ξ (N )/ ln2 N dans (3.33). ⊓ ⊔ La démonstration originale de Hardy & Ramanujan reposait sur une majoration, uniforme en N et k  1, des lois locales νN {n : ω(n) = k} et, partant, représentait une étude assez complexe — cf. Exercice 264, p. 445. C’est avec le souci de la simplifier que Turán a établi en 1934 la forme initiale du Théorème 3.1. Au vu de l’inégalité 2ω(n)  τ (n)  2(n) , valable pour tout entier n  1, on déduit immédiatement du Théorème 3.4 que l’on a (3.36)

et même (3.37)

τ (n) = (ln n)ln 2+o(1)

pp

   τ (n) = (ln n)ln 2 exp O ξ (n) ln2 n

pp

436

III.3. ORDRE NORMAL

pour toute fonction ξ (n) → ∞. Stricto sensu, ces relations devraient s’interpréter par l’assertion que ln τ (n) possède un ordre normal. Cependant, par abus de langage, on fait souvent référence à (3.36) ou (3.37) en disant que τ (n) est d’ordre normal (ln n)ln 2 . Nous rencontrons ici, pour la première fois, une situation courante en théorie probabiliste des nombres : l’ordre moyen — ici ln n — ne reflète pas le comportement normal — ici (ln n)ln 2 . L’origine de ce phénomène tient au fait que la somme  τ (n) nx

est « dominée » par un petit nombre d’entiers « anormaux », pour lesquels τ (n) est « grand ». Nous verrons plus loin — cf. Exercice 274(b) — que ce sont précisément les entiers n pour lesquels ω(n) ∼ 2 ln2 n. On a en fait, pour chaque ε > 0,   τ (n) (x → ∞). τ (n) ∼ x ln x ∼ nx

nx |ω(n)−2 ln2 n|ε ln2 n

Une telle situation est susceptible d’applications pratiques. Elle ouvre la possibilité de considérer, dans certaines sommations, la fonction arithmétique τ (n) comme un coefficient pondéral qui fait prévaloir les entiers n pour lesquels ω(n) ∼ 2 ln2 n. Nous donnons ci-dessous, sans démonstration, quelques résultats qui sont des applications immédiates de l’inégalité de Turán–Kubilius. Nous désignons par ξ (n) une quantité arbitraire telle que ξ (n) → ∞. (a) Pour a  1, q  1, (a,q) = 1, soit ω(n; a,q) le nombre des facteurs premiers distincts de n dans la progression arithmétique p ≡ a (mod q). On a

  ln2 n + O ξ (n) ln2 n (3.38) ω(n; a,q) = pp. ϕ (q)

Plus généralement, si E désigne un ensemble de nombres premiers tel que  1 → +∞ (x → +∞), E(x) := p px, p∈E

alors on a (3.39)

ω(n; E) :=



p|n, p∈E

  1 = E(n) + O ξ (n) E(n)

pp.

(b) Considérons, pour k  2 fixé, le nombre τk (n) de représentations de n comme produit de k entiers strictement positifs. On a   pp. (3.40) τk (n) = (ln n)ln k exp O ξ (n) ln2 n

On notera la disparité de l’ordre « normal » (ln n)ln k et de l’ordre moyen (ln n)k−1 /(k − 1)! de τk (n) — cf. Théorème II.5.2.

(c) Pour k  1, soit δk (n) le nombre de représentations de n sous la forme n = [m1 , . . . ,mk ] avec m1  1, . . . ,mk  1. On a   k pp. (3.41) δk (n) = (ln n)ln(2 −1) exp O ξ (n) ln2 n

3.5. MAJORATIONS EFFECTIVES DE SOMMES DE FONCTIONS MULTIPLICATIVES

437

Ici encore l’ordre normal est très éloigné de l’ordre moyen : en utilisant la relation de convolution δk ∗ 1 = τ k , on déduit facilement du Théorème II.5.2 que l’on a  k (3.42) δk (n) ∼ Ck x(ln x)2 −2 nx

avec

2k   1 (ν + 1)k 1 1− . Ck := k (2 − 2)! p p pν ν 0

3.5. Majorations effectives de sommes de fonctions multiplicatives Nous nous proposons ici de mettre en place un autre type d’outil permettant de retrouver le théorème de Hardy et Ramanujan. Il s’agit d’estimations uniformes pour les valeurs moyennes de fonctions multiplicatives appartenant à une certaine classe. Il est capital de garder dès à présent à l’esprit que les applications sont subordonnées au fait que les bornes obtenues ne dépendent pas de la fonction choisie dans la classe. Théorème 3.5. Soit f une fonction multiplicative positive ou nulle satisfaisant, pour des constantes convenables A et B , à  (y  0), (i) py f (p) ln p  Ay

f (pν ) ln pν  B . pν Alors on a, pour x > 1,  x  f (n) · (3.43) f (n)  (A + B + 1) ln x n (ii)

  p

ν 2

nx

nx

Démonstration. Désignons par S(x) le membre de gauche de (3.43) et posons  L(x) := nx f (n)/n. On a trivialement

S(x)  xL(x)

(3.44)

(x  1).

Maintenant, on peut écrire    x  ln p + f (n) f (n) S(x) ln x = f (n) ln + n nx

nx

= S1 + S2 + S3

pn

(disons).

nx



ln pν

ν 2, pν n

On a clairement S1  xL(x). En effectuant le changement de variables n = mp dans S2 , on obtient   f (p) ln p  AxL(x). S2 = f (m) mx

px/m, p ∤ m

438

III.3. ORDRE NORMAL

Enfin, par interversion de sommations, on a    x S3 = f (m)  f (pν ) ln pν f (pν ) ln pν S ν p p ν 2 p ν 2 mx/pν , p ∤ m  x x  f (pν ) ln pν ν L ν  BxL(x), p p p ν 2

où l’on a utilisé (3.44) et le fait que L est une fonction croissante.

⊓ ⊔

Cela achève la démonstration. En pratique, on utilise souvent le Théorème 3.5 sous la forme suivante. Corollaire 3.6. Soient λ1 ,λ2 des constantes telles que λ1 > 0, 0  λ2 < 2. Pour toute fonction arithmétique multiplicative f satisfaisant à (3.45)

0  f (pν )  λ1 λ2ν −1

(p  2, ν = 1,2, . . .),

on a uniformément   1   f (pν ) (3.46) f (n) ≪ x 1− p pν nx

px

(x  1).

ν 0

La constante impliquée dans (3.46) n’excède pas  (3.47) 4 1 + 9λ1 + λ1 λ2 /(2 − λ2 )2 . Remarque. Nous n’avons pas cherché ici à optimiser les constantes numériques apparaissant dans (3.47). Démonstration. Il est clair que (3.45) implique les conditions (i) et (ii) du Théorème 3.5. D’après le Théorème I.1.4, on a A  λ1 ln 4. De plus  ln p  ln p  λ2 ν −1 ν  2λ1 λ2 B  λ1 p p (p − λ2 )2 p p ν 2

 ln n 2λ1 λ2 ln 2 + 4λ ·  1 (2 − λ2 )2 (n − 2)2 n3

On montre facilement que la série en n est  25 . En observant que

 f (n)   f (pν ) ,  n pν

nx

px ν 0

on obtient donc l’estimation annoncée avec une constante au plus égale à

1 + 10λ λ1 λ2  1 K ln 4 + λ1 + ln 4 (2 − λ2 )2 où l’on a posé K := supx2 K(x) avec K(x) := (1/ ln x)

!

px (1

− 1/p)−1 .

3.5. MAJORATIONS EFFECTIVES DE SOMMES DE FONCTIONS MULTIPLICATIVES

439

Montrons que K = K(2) = 2/ ln 2. À cette fin, nous vérifions d’abord numériquement que K(x)  K(2) pour x  300. Ensuite, nous observons que l’on a pour x>y2   1 π2  π2  1 1  exp K(x)  1+ 1+ . 6 ln x p 6 ln x p p px

py

y y  2), p ln y y 300. Cela achève la démonstration. ⊓ ⊔ Le résultat suivant, qui découle immédiatement du Corollaire 3.6, nous servira à établir une forme forte du Théorème 3.4. Nous posons pour t > 0   ν (n  1). 1, (n,t) := (3.48) ω(n,t) := p|n, pt

pν n, pt

Théorème 3.7. Soit y0 > 0. On a uniformément pour 0  y  y0 , x  t  2,  (3.49) y ω(n,t) ≪ x(ln t)y−1 nx

Sous l’hypothèse supplémentaire y0 < 2, la même √ estimation est valable pour (n,t), sous réserve que l’on ait ξ  c ln t, où c est une constante < 1. Démonstration. Pour chaque t, la fonction n → y ω(n,t) est multiplicative et satisfait (3.45) avec λ1 = 1 + y0 , λ2 = 1. Dans le cas de y (n,t) , la condition est encore réalisée, avec λ1 = 1 + y0 , λ2 = max(1,y0 ). La majoration (3.46) vaut alors

1   1  y 1+ +O 2 . x 1− p p p pt

On en déduit le résultat grâce à la formule de Mertens.

√ Théorème 3.8. On a, uniformément pour x  t  3 et 0  ξ < ln2 t,     n  x : |ω(n,t) − ln2 t| > ξ ln2 t  ≪ xe−ξ 2 /3 . (3.50)

⊓ ⊔

 1 /6 2 2 De plus, si ξ ≪ ln2 t , on peut remplacer e−ξ /3 par e−ξ /2 . Les mêmes assertions sont valables pour (n,t) si ξ  c ln2 t où c est une constante < 1. Lorsque t = x, on a ω(n,t) = ω(n) pour tout entier n  x. Dans son domaine de validité, la majoration (3.50) constitue un remarquable renforcement de (3.35). √ Démonstration. Posons δ := ξ / ln2 t, de sorte que 0  δ < 1, et désignons par χ (n) la fonction indicatrice de l’ensemble des entiers n tels que   ω(n,t) − ln2 t > δ ln2 t. (3.51)

440

III.3. ORDRE NORMAL

On a χ (n)  (1 − δ )ω(n,t)−(1−δ) ln2 t + (1 + δ )ω(n,t)−(1+δ) ln2 t . En sommant pour n  x et en faisant appel à (3.49), on obtient  (3.52) χ (n) ≪ x(ln t)−Q(1−δ) + x(ln t)−Q(1+δ) nx

avec

(3.53)

Q(y) := y ln y − y + 1 =



y−1

ln(1 + v) dv

(y > 0).

0

On a pour 0  δ  1, Q(1 ± δ )  13 δ 2 , et Q(1 ± δ ) = 21 δ 2 + O(δ 3 ). Cela implique les bornes annoncées. La démonstration est inchangée dans le cas de (n,t). ⊓ ⊔

3.6. Structure normale de la suite des facteurs premiers d’un entier La factorisation d’un entier n est entièrement déterminée par le comportement de la fonction en escalier (n,t). Nous considérons plutôt ici la fonction ω(n,t) qui est techniquement plus maniable. Ce choix n’est, en tout état de cause, guère important puisque l’on a 0  (n,t) − ω(n,t)  (n) − ω(n) pour tous n, t ; les Théorèmes I.3.6 & I.3.7 impliquant que cette dernière différence est de valeur moyenne bornée, il s’ensuit que la majoration (3.54)

(n,t) − ω(n,t) ≪ ξ (n)

pp

a lieu uniformément en t, pour toute fonction ξ (n) → ∞. Le Théorème 3.8 décrit le comportement de ω(n,t) pour t fixé. Cependant, seules les variations en fonction de t peuvent conduire à une connaissance de la structure multiplicative de n. Cela nécessite donc une approximation, valable presque partout, de t → ω(n,t) pour la norme de la convergence uniforme. Le résultat suivant, que nous déduirons simplement du Théorème 3.8, fournit un tel renseignement. Théorème 3.9. Soient ε > 0, et ξ (n) → ∞. On a    ω(n,t) − ln2 t    1+ε (3.55) sup  √ 2 ln2 t ln3 t  ξ (n)tn

pp.

Démonstration. Soit ξ un nombre réel arbitrairement grand. On a ξ (n) > ξ pp ; il suffit donc d’établir que la densité supérieure des entiers n contrevenant à (3.55) lorsque ξ (n) est remplacé par ξ tend vers 0 quand ξ → ∞. À cette fin, nous introduisons des points-tests

tj := exp exp j

(j  ln2 ξ ),

et remarquons que, puisque ω(n,t) est une fonction croissante de t et puisque ln2 tj+1 − ln2 tj  1, on a, pour ξ assez grand,      ω(n,tj ) − j  √  ω(n,t) − ln2 t     > 1 + ε.  > 1 + ε ⇒ sup  √ sup  √ 2j ln j  2 ln2 t ln3 t  ξ tj n ξ tn

3.6. STRUCTURE NORMALE DE LA SUITE DES FACTEURS PREMIERS D’UN ENTIER

441

 En choisissant, dans le Théorème 3.8, t = tj et ξ = (2 + 2ε) ln j pour tous les entiers j tels que ln2 ξ  j  ln2 x, on voit que la densité supérieure des entiers n satisfaisant à la dernière inégalité est  1 1 ≪ · ≪ j 1 +ε (ln2 ξ )ε jln2 ξ

Cela achève la démonstration. ⊓ ⊔ Le Théorème 3.9 peut être reformulé en faisant intervenir directement la factorisation de n. Désignons par pj (n) le j -ème facteur premier distinct de n, de sorte que la factorisation canonique s’écrit  pj (n)νj n= 1jω(n)

où les νj sont des entiers strictement positifs. Alors ω(n,pj (n)) = j . En effectuant le changement de variable t → pj (n) dans (3.55), on obtient donc le résultat suivant. Théorème 3.10. Soient ε > 0, ξ (n) → ∞. On a    ln2 pj (n) − j    (3.56) sup  √2j ln j   1 + ε ξ (n)jω(n)

pp.

Ce résultat a été annoncé sous une forme plus précise par Erdos ˝ (1946), mais sans démonstration. Les détails ont été fournis par Hall & Tenenbaum (1988), chap. 1. On peut retenir que, pour un entier normal, le j -ème facteur premier est « de l’ordre » de exp exp j . Cela engendre un modèle heuristique précieux pour la structure multiplicative normale des entiers — dont il ne faut, toutefois, pas exagérer la portée : pris trop littéralement, ce modèle conduit à des conjectures fausses ; cf. Hall & Tenenbaum (1988) § 1.2, voir aussi les Notes.

N OTES

§ 3.2. La minoration (3.22) a été initialement observée par La Bretèche & Tenenbaum (2005b). Lorsque l’on restreint f aux fonctions fortement additives, un élégant résultat de J. Lee (1989) précise que ) 2 * N α ln 2 + +O (3.57) CN = 23 − ln N ln N où α est une constante absolue positive. Cela implique en particulier l’existence d’un N0 absolu tel que l’on ait, pour toute fonction f fortement additive, (3.58)

V∗N (f )  23 Bf+ (N )2  6V(Zf ,N )

(N  N0 ).

D’une manière générale, on s’attend à ce que les répartitions de f (relativement à νN ) et de Zf ,N soient proches. Ruzsa (1982) introduit à ce propos un intéressant distinguo méthodologique en définissant, pour les problèmes de ce type : (a) l’approche directe, où la théorie des probabilités n’apparaît que comme modèle heuristique et où la démonstration est purement arithmétique ; (b) l’approche indirecte, caractérisée par une comparaison de (f ,νN ) et (Zf ,N ,P ) en tant que variables aléatoires, et où le résultat arithmétique est déduit, dans un second temps, d’un résultat spécifiquement probabiliste. Dans le cas de l’inégalité de Turán–Kubilius, l’énoncé direct classique est (sans s’attacher aux constantes)

VN (f ) ≪ Bf+ (N )2

(3.59)

alors que l’énoncé indirect est (3.60)

VN (f ) ≪ V(Zf ,N ).

La première majoration découle de la seconde grâce au théorème de Probabilités sur la variance d’une somme de variables aléatoires indépendantes, puisque

V (ζp )  E(ζp2 ) 



1ν (ln N )/ ln p

|f (pν )|2 . pν

Quoique nous nous soyons attaché à la présenter sous la forme (3.60), qui est plus fondamentale, notre démonstration du Théorème 3.1, qui suit essentiellement

NOTES

443

celle d’Elliott (1979), est de type direct. Le remarquable résultat suivant, dû à Ruzsa, fournit une approche indirecte dont (3.60) est une conséquence immédiate. Théorème 3.11 (Ruzsa, 1984). Soit f une fonction additive à valeurs complexes et F : R+ → R+ une fonction croissante au sens large. On a uniformément pour A ∈ R, N ∈ Z+ ,   (3.61) EN F (|f − A|) ≪ E F (3|Zf ,N − A|) .

La détermination de la meilleure constante dans (3.61) est un problème intéressant. Infirmant une conjecture émise dans son article de 1984, Ruzsa a montré que l’on ne peut pas remplacer, en toute généralité, la constante 3 par une fonction de N tendant vers 1. Plus précisément, il a établi (communication privée) que la constante optimale est  1 + 2/e ≈ 1,73575. L’inégalité de Turán–Kubilius ne fournit pas toujours l’ordre de grandeur exact de VN (f ) ou V∗N (f ). En 1983, Ruzsa a montré que l’on a pour f réelle + (3.62) VN (f ) ≍ min λ2 + BN (f − λ ln)2 . λ∈R

Ensuite, Hildebrand a obtenu une formule asymptotique pour VN (f ) en fonction uniquement des nombres f (p), p  N . Il tire plusieurs corollaires intéressants de son résultat. L’un est une nouvelle preuve de l’admissibilité du facteur 23 + o(1) dans (3.28). Un autre est une caractérisation des fonctions additives telles que

VN (f ) ≍ Bf+ (N )2 .

(3.63)

Théorème 3.12 (Hildebrand, 1983). Soit f une fonction additive. On a (3.63) si et seulement si     f (p) ln p  1  < √1 .  (3.64) lim sup +   p 2 N →∞ Bf (N ) ln N pN

§ 3.3. Elliott (1979, chap. 4), donne plusieurs variantes de l’inégalité (3.30) du Théorème 3.2. On a par exemple le résultat suivant. Théorème 3.13 (Elliott, 1979). Pour tout nombre réel x  2 et pour toute suite complexe {an : 1  n  x}, on a    1  2 36   x an − an   1 + p |an |2 . p ln x √ p x

nx, p|n

nx

nx

Ici encore, la constante 36 n’est pas optimale. Il est parfois plus utile de recourir à la forme duale de (3.28) qu’à celle de (3.29). On obtient alors, pour toute suite complexe {an }N n=1 , 2        1 − 1/p   + |an |2 . an − an   N CN pν  ν p   nN nN pν N pν n, nN

+ = 23 +o(1) peut en effet s’avérer capital. Dans certaines applications, le fait que CN

444

III.3. ORDRE NORMAL

Pour une étude plus approfondie des relations entre l’inégalité de Turán– Kubilius et le grand crible, consulter le chapitre 4 d’Elliott (1979) et surtout le livre d’Elliott (1997). § 3.4. C’est en vue d’établir le Théorème 3.4 que Turán énonce dans son article de 1934 l’inégalité du Théorème 3.1 pour la fonction ω(n), et sans préciser la valeur de la constante. Il généralise rapidement (1936) le résultat au cas où 0  f (p)  C . La méthode est ensuite systématiquement exploitée par Kubilius (1956, 1964). § 3.5. Le Théorème 3.5 apparaît sous cette forme dans Hall & Tenenbaum (1988), th. 01. Il constitue une version simplifiée, et affaiblie, d’un résultat de Halberstam & Richert, lui-même généralisant un théorème de Hall (1974) — cf. Exercice 276 — que nous énonçons ci-dessous. Théorème 3.14 (Halberstam & Richert, 1979). Soit f une fonction multiplicative positive ou nulle satisfaisant, pour une constante convenable κ > 0, à

y   (y  2) (i) f (p) ln p  κ y + O (ln y)2 py   f (pν ) 1 (y  2) ln pν ≪ (ii) pν ln y py ν 2

Alors on a (3.65)



nx



1  κ x  f (n) f (n)  1 + O ln x ln x n

(x  2).

nx

La constante implicite dépend au plus des constantes impliquées dans (i) et (ii). Des résultats analogues de majoration et minoration sont donnés par Hildebrand (1984a, 1987b). La constante κ de (3.65) est optimale, ainsi que le montre le choix  0 (p  x/ ln x), f (pν ) := κ (x/ ln x < p  x). La technique de démonstration du Théorème 3.8 fait partie d’une méthode élémentaire générale extrêmement féconde — voir Hall & Tenenbaum (1988), chap. 0, ainsi que la section III.5.1 du présent ouvrage. Dans le cas du Théorème 3.8, et pour t = x, l’idée remonte à Turán — cf. Elliott (1980), pp. 18–20. Pour d’autres applications du Théorème 3.5, voir les Exercices 268–274. § 3.6. La version la plus précise du Théorème 3.10, annoncée par Erdos ˝ (1946) et établie en détail dans le livre de Hall & Tenenbaum (1988), chap. 1, est la suivante. Théorème 3.15 (Erdos, ˝ 1946). Soient ε > 0, et ξ (n) une fonction tendant vers +∞ avec n, assez lentement. On a    ln2 pj (n) − j   √   1+ε pp. (3.66) sup  2j ln2 j  ξ (n)jω(n)

De plus, si l’on remplace 1 + ε par 1 − ε dans le membre de droite, la densité de l’ensemble des entiers n satisfaisant (3.66) est nulle.

NOTES

445

Le principe de la démonstration de ce résultat consiste à montrer que la loi du logarithme itéré est applicable asymptotiquement à la fonction arithmétique  ω(n,t) = χp (n) pt

où χp (n) est la fonction indicatrice de l’ensemble des entiers n divisibles par p. Comme nous l’avons vu précédemment, les χp ne sont pas complètement indépendantes, et c’est ce qui induit la principale difficulté. Pour des valeurs individuelles de j = j(n), il est possible d’obtenir des renseignements très précis. Ainsi, Galambos démontre le résultat suivant. Théorème 3.16 (Galambos, 1976). (i) Soient ε > 0 et j = j(N ) → +∞ de façon que

j(N )  ln2 N − (ln2 N )(1/2)+ε . Alors on a (3.67)

 1 lim νN n : ln2 pj (n)  j + z j = √ N →∞ 2π



z

2

e−t

/2

dt.

−∞

(ii) Soient ε > 0 et j = j(N ) → +∞ de façon que j(N )  (1 − ε) ln2 N . Alors on a (3.68) lim νN n : ln2 pj+1 (n) − ln2 pj (n)  z = 1 − e−z (z > 0). N →∞

Les Théorèmes 3.9, 3.10 ou 3.15 laissent présager  que la quantité ω(n; s,t) := ω(n,t) − ω(n,s) est normalement de l’ordre de ln ln t/ ln s . Erdos ˝ a montré en 1969 que  ω(n; s,t) ∼ ln ln t/ ln s pp

uniformément pour 3  s  t  n, pourvu que le membre de droite tende vers l’infini plus vite que ln3 n. Cette condition est en fait nécessaire. D’autres résultats sur la répartition normale des facteurs premiers sont disponibles dans l’article de Bovey (1977). On peut appliquer le Théorème 3.15 à la détermination de l’ordre normal du j -ème diviseur d’un entier. Désignons par {dj (n) : 1  j  τ (n)} la suite croissante des diviseurs de n. On a le résultat suivant (dont une forme plus faible est proposée à l’Exercice 269). Théorème 3.17 (Hall & Tenenbaum, 1988). Soit ε > 0, et soit ξ (n) une fonction tendant vers +∞ avec n, assez lentement. On a    ln2 dj (n) − (ln j)/ ln 2    1+ε   pp. (3.69) sup  (2/ ln 2) ln j ln3 j  ξ (n)jτ (n)

De plus, si l’on remplace 1 + ε par 1 − ε dans le membre de droite, la densité de l’ensemble des entiers n satisfaisant (3.69) est nulle.

446

III.3. ORDRE NORMAL

Ainsi le modèle heuristique de la structure des diviseurs d’un entier normal est (ξ (n)  j  τ (n)). (3.70) dj (n) ≈ exp j 1/ ln 2

Cela est bien en accord avec l’ordre normal (ln n)ln 2 de τ (n) mais conduit à des hypothèses erronées lorsque l’on donne à cette équivalence une interprétation trop locale. Ainsi, une ancienne conjecture d’Erdos, ˝ établie par Maier & Tenenbaum (1984), énonce que (3.71)

dj+1 (n) → 1, 1jτ (n) dj (n)

pp.

min

Cela implique que le minimum en question est atteint pour j → ∞, ce qui contredit (3.70) si l’on donne au symbole ≈ un sens trop précis. Un autre modèle, également en contradiction avec une interprétation trop restrictive de (3.70), de la structure de l’ensemble des diviseurs d’un entier normal est celui d’un objet fractal de dimension ln 2. La pertinence d’un tel modèle est sous-tendue par des résultats arithmétiques relativement précis concernant des fonctions arithmétiques liées à la structure locale de la suite des diviseurs — cf. Mendès France & Tenenbaum (1993). Les Théorèmes 3.15–3.17 ne fournissent pas de renseignement sur la suite des pj (n) ou des dj (n) pour les petites valeurs de j . En 1979, Erdos ˝ a introduit les densités j (d), λj (p), correspondant respectivement à la suite des entiers n satisfaisant à dj (n) = d et à pj (n) = p. L’étude asymptotique de ces densités a été entreprise par Erdos ˝ & Tenenbaum (1989a), qui ont en particulier établi que j (d) > 0 si et seulement si τ (d)  j  d. Elle a été poursuivie par De Koninck & Tenenbaum (2002) et La Bretèche & Tenenbaum (2002). Posons  λ∗k (y) := d{n : pk (n) > y} = λk (p). p>y

Renforçant un résultat d’Erdos ˝ (1969), De Koninck & Tenenbaum montrent notamment que l’on a uniformément pour k  1, z ∈ R,

1 √  0 (z) (3.72) λ∗k exp exp k + z k = ∗ (z) − √ +O , k 2π k avec  ∞ 2 2 du 0 (z) := 31 + A − 13 z 2 e−z /2 , e−u /2 √ , ∗ (z) := 2π z  1  1 − ≈ 0,26150. ln A := γ − 1 − 1/p p p La Bretèche & Tenenbaum évaluent asymptotiquement ∗k := maxd k (d) lorsque k → ∞ et montrent en particulier que ce maximum est atteint lorsque

d = k {1+o(1)}(ln2 k)/ ln 4 .

E XERCICES

264. Inégalité de Hardy–Ramanujan (1917). (a) Montrer que l’on a pour x > 0, 0 < α < 1 < β

 e−x xk e−Q(α)x √ < k! (1 − α ) α x

kα x

et

√ −Q(β )x  e−x xk βe √ < k! (β − 1) 2π x kβ x

avec Q(y) := y ln y − y + 1.(3)   (b) On considère la fonction πk (x) := {n  x : ω(n) = k}. Montrer que l’on a pour k  1, x > 0,   (k + 1)πk+1 (x)  πk x/pν . pν x

En déduire l’existence de deux constantes absolues c0 ,c1 , telles que πk (x) 

c0 x (ln2 x + c1 )k−1 ln x (k − 1)!

(x  3, k  1).

(c) Retrouver ainsi le Théorème 3.8 pour la fonction ω(n) = ω(n,x). (d) Adapter la méthode pour traiter le cas de la fonction (n).(4) 265. Soit A(n) la fonction arithmétique additive définie par A(pν ) = ν p — cf. Alladi & Erdos ˝ (1977, 1979).

1   π 2 x2  (a) Montrer que 1+O . A(n) = 12 ln x ln x nx

+ (b) Montrer que pour tout n  1 on a P + (n) − 1  A(n) √  (n)P (n). + (c) Montrer que la suite des entiers n tels que P (n)  n possède une densité naturelle, égale à ln 2. (d) Soit χ (n) la fonction indicatrice de l’ensemble A des entiers n tels que  P + (n)  n2/5 . Montrer que χ (n)  1 − p|n, p>n2/5 1, et en déduire que A possède une densité inférieure positive. (e) Montrer que A(n) ne possède pas d’ordre normal monotone. 3

Voir Norton, 1976, et, pour des estimations plus précises, 1978. Pour des généralisations et des bornes inférieures, voir Norton (1976, 1979, 1982), Balazard (1987) et les références indiquées à l’Exercice 286, p. 514. 4

448

III.3. ORDRE NORMAL

266. Soit g(n) la fonction fortement additive telle que g(pν ) = ln p.

√ (a) Montrer, avec les notations du § 2, que l’on a Bg (N ) ∼ EN (g)/ 2.   (b) Montrer que nx ln n − g(n) ≪ x.

(c) En déduire que g possède un ordre normal, non accessible par l’inégalité de Turán–Kubilius.  267. Soit δ > 1, gδ (n) := p|n (ln p)δ . Montrer que αnδ (ln n)δ  gδ (n)  αnδ−1 (ln n)δ

(n  1)

avec αn := ln P (n)/ ln n. Montrer que pour chaque α, 21  α  1, la suite des entiers n tels que αn  α possède une densité naturelle que l’on calculera. En déduire que gδ ne possède pas d’ordre normal monotone.(5) +

268. Pour y  2, on désigne par χ (n; y) la fonction indicatrice de l’ensemble des entiers n tels que P + (n)  y et par (x,y) sa fonction sommatoire. (a) Montrer que pour chaque α > 0, on a   √ α √ (x,y)  x + n/ x χ (n; y). nx

(b) En déduire, en appliquant le Théorème 3.5 à la fonction n → nα χ (n; y) avec un choix convenable de α, que l’on a (x,y)  c1 x1−c2 / ln y

(x  y  2)

où c1 et c2 sont des constantes absolues positives. 269. On désigne par√ ξ (n) une fonction tendant et  vers +∞ assez lentement,  l’on pose L(t) := 2 ln2 t ln3 t, ω(n,t) := 1, (n , t) := ν p|n, pt p n, pt ν,  τ (n,t) := d|n, dt 1.  (n,t) − ln t   2  (a) Montrer que, pour tout ε > 0, on a sup    1 + ε, pp. L(t) ξ (n)tn (b) En déduire que  τ (n,t)  (ln t)ln 2 2(1+ε)L(t) ξ (n)  t  n pp.   (c) Soit τ (n; t,u) := {d : d|n, d > t, P + (d)  u}. Montrer en utilisant le résultat de l’Exercice 268 que l’on a    ln t (2  t, u  x). τ (n; t,u) ≪ x(ln u) exp −c2 ln u nx

α (d) Soit α := 1/ ln 2, tj := exp j α (j = 1,2, . . .), uj := exp{c 2 j /(10 ln j)} ln 2 pp. (j = 1,2, . . .). Montrer que τ (n; tj ,uj ) = 0 ξ (n)  j  (ln n)

(e) Montrer que 2ω(n,u)  τ (n,t)+ τ (n; t,u) et en déduire que pour chaque ε > 0 on a  τ (n,tj )  j 2−(1+ε)L(tj ) ξ (n)  j  (ln n)ln 2 , pp. 5

Il en va de même lorsque 0 < δ < 1, cf. Exercice 291, p. 559.

EXERCICES

(f) Établir que l’on a pour chaque ε > 0    ln2 dj (n) − α ln j    sup  √2α ln j ln j   1 + ε 2 ξ (n)jτ (n)

449

pp.

270. Ensemble des multiples de ]y ,2y]. Soient y  2, A := Z+ ∩]y ,2y], et My := M(A) l’ensemble des multiples de A, c’est-à-dire l’ensemble des entiers n ayant au moins un diviseur d tel que y < d  2y . (a) Montrer l’existence de dMy =: εy et exprimer cette quantité à l’aide du principe d’inclusion–exclusion. (b) Soit By := n : (n,y)  (ln2 y)/ ln 2 . Montrer l’existence de dBy et établir la formule   1 1 dBy = · 1− p b + py

b∈By , P (b)y

[Cf. Exercice 245, page 432.] (c) Soit χy (n) la fonction indicatrice de By . Montrer que l’on a pour tout z  1 χy (n)  (ln y)−(ln z)/ ln 2 z (n,y)

(n  1).

En déduire, en opérant un choix convenable du paramètre z , que l’on a dBy  K(ln y)−δ où K est une constante absolue et δ := 1 − (1 + ln2 2)/ ln 2 ≈ 0,08607. (d) Soit B′y := My  By . Montrer que B′y possède une densité naturelle. Désignons par χy′ (n) la fonction indicatrice de B′y . Montrer que l’on a pour tout z , 0 < z  1,  χy′ (n)  (ln y)−(ln z)/ ln 2 z (n,y) 1. d|n, y 0. Montrer l’existence d’une suite yk → ∞ telle que (i) εyk  ε/2k+2

(k  0)

H(x,yk )  2εyk x (k  0, x  yk+1 ). ? + Soit A = Z ∩ k0 ]yk ,2yk ] et M = M(A) l’ensemble des multiples de A. Montrer que dM  ε, dM  21 , et donc qu’un ensemble de multiples ne possède pas nécessairement de densité naturelle. Donner, en utilisant la méthode de l’Exercice 270, une majoration de H(x,y) √ uniforme pour 2  y  x. En déduire que l’on peut choisir yk = exp{c(2k ε−1 )1/δ } pour une constante absolue c assez grande. (ii)

6

Améliorant des estimations de Tenenbaum (1984) — voir aussi Hall & Tenenbaum (1988), chapitre 2 — Ford (2007) a montré que l’on a en fait εy ≍ (ln y)−δ (ln2 y)−3/2 .

450

III.3. ORDRE NORMAL

272. Densité divisorielle (Hall, 1978). Soit A une suite d’entiers de fonction indicatrice χ. On dit que A possède une densité divisorielle z , et l’on note DA = z , si l’on a   τ (n,A) := χ (d) = z + o(1) τ (n) pp. d|n

Dans tout l’exercice, on suppose donnés deux entiers a,q , avec q  2, et l’on pose

A := {d : ω(d) ≡ a (mod q)}. q−1 (a) Montrer que χ (d) = (1/q) j=0 e2π ij(ω(d)−a)/q (d  1) et en déduire l’existence de dA et la valeur dA = 1/q . q−1 ! (b) Montrer que τ (n,A) = (1/q) j=0 e−2π ija/q pν n (1 + ν e2π ij/q ). ! (c) Établir que, si l’on note m := pn p, on a    τ (n,A) − τ (n)/q   τ (n/m) 2 cos π /q ω(m) = τ (n) cos π /q ω(m) .

(d) Montrer que la fonction arithmétique n → ω(m) est additive et a pour ordre normal ln2 n. (e) En déduire que DA = 1/q . 273. Un autre résultat sur la densité divisorielle. Soit δ un nombre réel fixé, 0 < δ < 21 . On pose A(δ ) := m : m  3, ω(m)  ( 12 + δ ) ln2 m . (a) Montrer que dA(δ ) = 0. (b) Montrer que pour chaque ε, 0 < ε < 1, on a

|{p : p|n, ln2 p > (1 − ε) ln2 n}| ∼ εω(n) pp et en déduire que |{d : d|n, ln2 d > (1 − ε) ln2 n}| ∼ τ (n) pp.  (c) Montrer que d|n y ω(d)  (1+y)(n) (y  0, n  1) et utiliser cette inégalité pour établir que pour tout η, 0 < η < 21 , on a

|{d : d|n,ω(d)  ( 21 + η)(n)}| ∼ τ (n) pp. (d) Montrer que DA(δ ) = 1. 274. Méthode des moments évanescents.  z (a) Montrer que pour − 21  z  21 , on a nx τ (n)z ≪ x(ln x)2 −1 . En déduire, en choisissant z suffisamment proche de 0, que si α < ln 2 < β alors    n  x : τ (n) ∈ / [(ln x)α , (ln x)β ]  = o(x).

Préciser le résultat en choisissant α = α (x) → ln 2−, β = β (x) → ln 2+.  (b) Établir la validité de la majoration nx τ (n)y ω(n) ≪ x(ln x)2y−1 uniformément pour x  2, 0  y  y0 . En déduire que l’on a pour 0 < ε < 1  τ (n) ≪ x(ln x)1−2η nx, |ω(n)−2 ln2 x|>ε ln2 x

avec η := (1 + 12 ε) ln(1 + 21 ε) − 21 ε > 0.

EXERCICES

451

275. Un théorème d’Erd˝os & Hall (1974).  − α  Soient α > ln 2, εd ≪ ln(d + 1) (d  1), et f (n) := d|n εd . (a) Montrer que, pour chaque ε > 0, lim d n : sup (n,d)/ ln2 d  1 + ε = 0. z→∞

d>z

(b) Montrer que

lim lim sup x−1

z→∞ x→∞

 

nx d|n, d>z

|εd |2−(n,d) (ln d)ln 2 = 0.

(c) Établir, par une utilisation convenable du III.2.3, que f (n) possède une loi limite.(7) 276. Un théorème de Hall (1974). Soit f une fonction multiplicative, 0  f  1. On pose S(x) := nx f (n). ! (a) Soit k(n) := p|n p. Montrer que    f (n) ln k(n)  f (m)ψ x/m nx

mx

et en déduire que le membre de gauche n’excède pas x



mx f (m)/m

+ O(x).

(b) Soit N (x,y) le nombre des entiers n  x tels que k(n)  y . Montrer que pour tout y , 1  y  x, on a   f (n) ln x/k(n)  N (x,y) ln x + S(x) ln(x/y). nx

(c) En déduire, grâce au Théorème II.1.16, que l’on a 

ln x  x  f (m) 2 S(x)  1 + O , ln x ln x m mx

où la constante implicite est absolue. [On pourra choisir y = x/ ln3 x dans (b).] 277. Soit f une fonction arithmétique possédant un ordre normal croissant. Montrer que l’on a, pour tout ε > 0 ,    (m,n) : 1  m  n  x, f (n)  (1 − ε)f (m)  = o(x2 ).

278. Soit f une fonction arithmétique multiplicative telle que l’ensemble A := {f (p) : p ∈ P} possède au moins deux éléments. On suppose en outre −δ que f (p) = 1 + !O(p ) pourν un certain δ > 0 fixé et tout nombre premier p. On pose fy (n) := pν n, p>y f (p ). (a) Majorer, pour y assez grand, la valeur moyenne de μ(n)2 | ln fy (n)| et en déduire que, pour tout ε > 0 et tout a ∈ A, la suite des entiers n tels que |f (n) − a|  ε est de densité inférieure positive. (b) En utilisant le résultat de l’Exercice 277, montrer que f ne possède pas d’ordre normal croissant. (c) Applications : f (n) = n/ϕ (n), f (n) = σ (n)/n. 7

Erdos ˝ & Hall prouvent en fait que la f.r. correspondante est continue.

452

III.3. ORDRE NORMAL

279. Sur la valeur moyenne de la fonction  de Hooley.  Posons (n) := maxu∈R d|n, eu R

soient convergentes pour au moins ! une valeur de R > 0. ν (a) Pour y  2, on pose ny := pν n p . Montrer que d{n : ny = m} existe pν y

pour tout entier m  1 et que d{n : ny > T } tend vers 0 lorsque T → ∞.

(b) Soit ε > 0. En observant que l’inégalité |f (n) − f (ny )| > ε implique que

l’une des trois conditions suivantes est réalisée : (i) ∃pn :

|f (p)| > R, p > y ,

∃ν > 1, p > y : pν n,   (iii)  pn, p>y f (p) > ε, (ii)

ν

|f (p)|R

montrer que limy→∞ d{n : |f (n) − f (ny )| > ε} = 0. On utilisera l’inégalité de Turán–Kubilius pour majorer la densité supérieure de l’ensemble des entiers vérifiant (iii). (c) Établir, grâce au Théorème 2.3, que f possède une loi de répartition limite.

8 La minoration de (3.73) est due à Hall & Tenenbaum (1982), la majoration à Hooley (1979). Tenenbaum (1985) a montré que l’on peut remplacer l’exposant 4/π − 1 par o(1) ; voir aussi Hall & Tenenbaum (1988), chap. 7.

C HAPITRE

III.4 R ÉPARTITION

DES FONCTIONS ADDITIVES ET VALEUR MOYENNE DES FONCTIONS MULTIPLICATIVES 4.1. Le théorème d’Erd˝os–Wintner Le résultat suivant apporte une réponse complète au problème de l’existence d’une loi de répartition limite pour une fonction additive. Son énoncé et sa démonstration le placent dans le cadre des théorèmes de comparaison entre fonction additive et somme de variables aléatoires indépendantes. Le résultat probabiliste sous-jacent est le théorème des trois séries de Kolmogorov — cf., par exemple, Feller (1971), § IX.9. Théorème 4.1 (Erdos–Wintner, ˝ 1939). Une condition nécessaire et suffisante pour qu’une fonction additive réelle f (n) possède une loi de répartition limite est que les trois séries suivantes soient simultanément convergentes pour au moins une valeur du nombre réel positif R :  f (p)2  f (p)  1 ; (b) ; (c) · (a) p p p |f (p)|>R

|f (p)|R

|f (p)|R

Lorsque ces conditions sont remplies, la fonction caractéristique de la loi limite est donnée par le produit convergent ν  1   eiτ f (p ) 1− (4.1) ϕ (τ ) = (τ ∈ R). p pν p ν 0

La loi limite est nécessairement pure. Elle est continue si, et seulement si,  1 = ∞. (4.2) p f (p)=0

454

III.4. FONCTIONS ADDITIVES ET MULTIPLICATIVES

Remarques. (i) Si les trois séries de l’énoncé convergent pour une valeur de R > 0, alors il en va de même pour toute valeur de R > 0. Il n’y a donc, en pratique, pas de perte de généralité à supposer R = 1. (ii) Il est à souligner que l’existence d’une loi de répartition limite pour f ne dépend pas des valeurs f (pν ) lorsque ν  2. La démonstration originale de ce résultat, due à Erdos ˝ seul pour la condition suffisante, est directe, et repose sur des estimations délicates des fréquences νx {n : f (n)  z}. Nous allons donner ici une démonstration simple, due à Delange (1961), et reposant de manière essentielle sur le théorème de continuité de Lévy (Théorème 2.6). Delange établit le résultat fondamental suivant, dont le Théorème 4.1 est une conséquence facile. Théorème 4.2 (Delange). Soit g une fonction multiplicative à valeurs dans le disque unité. (i) Si g possède une valeur moyenne 1 M (g) := lim g(n) x→∞ x nx

non nulle, alors on a :   (a) la série p 1 − g(p) /p converge,

(b) il existe un entier ν  1 tel que g(2ν ) = −1.

(ii) Si la condition (a) précédente est réalisée, alors g possède une valeur moyenne, donnée par la formule  1   g(pν ) (4.3) M (g) = 1− · p pν p ν 0

Nous donnons la démonstration de ce résultat à la section suivante. Montrons maintenant comment on peut en déduire le Théorème 4.1 — mises à part les assertions concernant la pureté et la continuité de la loi limite. Le lemme simple suivant nous sera utile. ∞ Lemme 4.3. Soient H ∈ R+ et {un }∞ n=1 et {vn }n=1 deux suites de nombres complexes telles que 1 + un + vn = 0 (n  1) et  (4.4) |un |2 + |vn |  H . n1

!

Alors le produit infini n1 (1 + un + vn ) converge si, et seulement si, la série  n1 un converge. Dans ce cas, on a        (4.5) (1 + un + vn )  exp 6H + ℜe un .  n1

n1

Démonstration. Si |un | + |vn |  21 , alors |un |2 + |vn |  |un |2 − |un | + 21  14 . Par (4.4), cela implique que l’ensemble E des entiers n pour lesquels |un | + |vn |  21 possède au plus 4H éléments.

˝ 4.1. LE THÉORÈME D’ERDOS–WINTNER

Lorsque n ∈ / E, on utilise la majoration

| log(1 + z) − z|  |z|2

(4.6)

(|z|  12 )

avec z = un + vn . Pour tous m,M , 0  m < M , on obtient          (u + v ) − log( 1 + u + v ) n n n n    mR

1 − eiτ f (p) p

(|τ |  T ).

˝ 4.1. LE THÉORÈME D’ERDOS–WINTNER

457

De plus, lorsque |f (p)|  R, on peut écrire   1 − eiτ f (p) = −iτ f (p) + 1 − cos τ f (p) + i τ f (p) − sin τ f (p) 

= −iτ f (p) + O T 2 f (p)2 + T 3 Rf (p)2 ,

uniformément pour |τ |  T . Cela fournit la convergence uniforme sur [−T ,T ] de la série  1 − eiτ f (p) . p



|f (p)|R

Ainsi la série p {1 − gτ (p)}/p est uniformément convergente sur tout compact. D’après le point (ii) du Théorème 4.2, on en déduit l’existence, pour tout τ ∈ R, de la moyenne M (gτ ) = ϕ (τ ), où ϕ (τ ) donnée par (4.9). Puisque le terme général du produit (4.9) vaut 1 − {1 − gτ (p)}/p + O(1/p2 ), le Lemme 4.3 montre que la convergence du produit infini est uniforme sur tout compact. Par conséquent, ϕ (τ ) est continue. D’après le Théorème 2.6, f possède une loi de répartition limite. Les assertions concernant la pureté et la continuité de la loi limite découlent du Théorème 2.7, puisque cette loi est égale au produit de convolution infini

*F

p

p

où Fp est la fonction de répartition atomique donnée par  1 1 (z ∈ R). Fp (z) = 1− ν p p ν f (p )z

En particulier, l’écart à 1 du plus grand saut de Fp vaut 1/p + O(1/p2 ) si f (p) = 0 et O(1/p2 ) si f (p) = 0. Pour la commodité du lecteur, nous donnons ici une preuve directe du fait que la condition  1 (4.15) =∞ p f (p)=0

est nécessaire et suffisante pour que la loi limite soit continue. Montrons d’abord que la condition est nécessaire. Si la série (4.15) converge, alors la suite A des entiers n qui sont sans facteur carré et tels que p|n ⇒ f (p) = 0 est de densité positive. Cela découle, par exemple, du Théorème I.3.12, puisque la fonction indicatrice de A est multiplicative.(1) Comme f (n) = 0 pour tout n de A, on voit que la loi limite n’est pas continue à l’origine. Pour établir la suffisance de la condition (4.15), nous montrons la continuité de la loi limite sous la forme équivalente (cf. Chapitre III.2, Notes)  T  1 1 |ϕ (τ )|2 dτ = lim 21 |ϕ (T y)|2 dy = 0. (4.16) lim T →∞ T →∞ 2T −T −1 1

On obtient incidemment que dA = 6π −2 cette valeur explicite.

!

f (p)=0 (1

+ 1/p)−1 , mais nous n’avons pas besoin de

458

III.4. FONCTIONS ADDITIVES ET MULTIPLICATIVES

Soient N un entier assez grand, et a1 < a2 < · · · < aJ les valeurs distinctes non nulles prises par les nombres de f (p), p  N . Posons



εj :=

pN , f (p)=aj

1 p

(1  j  J),

SN :=



εj =

1jJ



pN , f (p)=0

1 . p

D’après l’inégalité de Hölder, on a pour chaque entier h  1 et tout nombre réel y , |y|  1,



1jJ

2h  2h−1  SN εj cos(aj T y) εj cos2h (aj T y), 1jJ

d’où





1

−1

1jJ

 2h  2h−1 εj dy  SN εj cos(aj T y) 1jJ

1

cos2h (aj T y) dy .

−1

Lorsque T → ∞, la dernière intégrale tend vers



4 π

π /2

0

1 (cos w)2h dw ≪ √ , h

où la majoration découle d’une évaluation classique des intégrales de Wallis — cf., par exemple, l’Exercice 3(b), p. 24. Pour chaque N fixé, et T assez grand, on peut donc affirmer que la mesure de l’ensemble des y de [−1,1] tels que    1   SN εj cos(aj T y)  1 −  h 1jJ

√ est ≪ 1/ h. En utilisant (4.10), il suit 

1

−1

|ϕ (T y)|2 dy ≪



1

exp

−1

1 ≪ √ + e−2SN /h ≪ h





−2



1jJ

ln SN SN

  εj 1 − cos(aj T y) dy

pour le choix h := ⌊SN / ln SN ⌋. Puisque (4.15) implique que SN → ∞ lorsque N → ∞, on obtient bien (4.16).

4.2. Le théorème de Delange Nous donnons ici une démonstration du Théorème 4.2 également due à Delange, mais différente de sa preuve originale et reposant, à partir d’une idée de Rényi (1965), sur l’inégalité de Turán–Kubilius. Le point fondamental est le résultat suivant.

4.2. LE THÉORÈME DE DELANGE

459

Théorème 4.4 (Delange). Soit g une fonction multiplicative à valeurs dans le disque unité. Sous l’hypothèse  1 − ℜe g(p) < ∞, (4.17) p p

on a

(4.18)

 1 1   g(pν ) g(n) = 1− + o(1) x p pν nx

px

ν 0

(x → ∞).

Démonstration. Définissons, pour chaque nombre réel y  2, une fonction multiplicative gy par  ν (p  y) g(p ) gy (pν ) := 1 (p > y). Le comportement de gy est plus simple que celui de g puisque gy n’est non triviale que sur un ensemble fini de nombres premiers. Cependant, on peut espérer que gy est une « bonne » approximation de g lorsque y est grand : c’est là l’idée directrice de la démonstration. Considérons hy := μ ∗ gy . On a hy (pν ) = g(pν ) − g(pν −1 ) si ν  1, p  y , et hy (pν ) = 0 si ν  1, p > y . Cela implique



 |hy (m)| m m>x mx √  |hy (m)| √  2  √  x . 1+ √  x m p−1

Hy (x) :=

|hy (m)| + x

m1

py

On en déduit facilement que, pour chaque y fixé, gy possède une valeur moyenne, soit $x%  hy (m)    =x gy (n) = hy (m) + O Hy (x) m m m1 nx mx = x M (gy ) + o(1) ,

avec

M (gy ) :=

 1   g(pν ) 1− . p pν

py

ν 0

Maintenant, définissons une fonction multiplicative r par r(n) := |g(n)|, et une fonction additive ϑ par  si g(pν ) = 0, arg g(pν ) ν ϑ (p ) := 0 si g(pν ) = 0, la détermination de l’argument étant choisie dans ] − π ,π ]. Posant  A(x) := ϑ (p)/p, px

460

III.4. FONCTIONS ADDITIVES ET MULTIPLICATIVES

nous allons montrer par le critère de Cauchy que la quantité

M (gy )e−iA(y)

(4.19)

tend vers une limite finie M lorsque y → +∞. On a pour 2  y  z  x   1    gz (n)e−iA(z) − gy (n)e−iA(y)  S(x,y ,z) :=  x nx nx  1     gz (n)e−iA(z) − gy (n)e−iA(y)  x nx

1   −i{A(z)−A(y)} e  x nx



pν n, y 0, x  2,  1 x dα x (4.31) G(x) ≪ HT (α ) + · ln x 1/ ln x α T Le résultat énoncé par Montgomery correspond au cas T = ∞ de (4.31). Montrons d’abord comment on peut déduire la seconde partie du théorème de Halász de cet énoncé. Nous utilisons à cette fin le lemme suivant. Lemme 4.8. Soit {ϕn (τ )}∞ n=1 une suite de fonctions continues telle que, pour chaque τ , |τ |  1, ϕn (τ ) → ∞ en croissant. Alors la convergence est uniforme. Démonstration. Raisonnons par l’absurde. Si la conclusion est en défaut, alors inf |τ |1 ϕn (τ ) ne tend pas vers +∞ avec n, et il existe une constante A et une sous-suite d’indices {nj }∞ j=1 , nj → ∞, telles que inf |τ |1 ϕnj (τ )  A pour j  1. Comme les ϕnj sont continues, il y a, pour chaque entier j , un τj ∈ [−1,1] tel que ϕnj (τj ) = inf |τ |1 ϕnj (τ ). Quitte à extraire une nouvelle sous-suite, nous pouvons supposer que τj → τ0 lorsque j → +∞. Soit alors n un entier arbitraire fixé. Pour j assez grand, on a ϕnj (τj )  ϕn (τj )  21 ϕn (τ0 ) puisque ϕn (τj ) → ϕn (τ0 ). Il s’ensuit que ϕn (τ0 )  2A, ce qui contredit l’hypothèse que ϕn (τ0 ) → +∞ quand n → ∞. ⊓ ⊔ 2

En fait une estimation du type est suffisante.



x 1

4.3. LE THÉORÈME DE HALÁSZ

465

Nous sommes maintenant en mesure de compléter la preuve du théorème de Halász. Par le Lemme 4.3, on a   g(pν ) − g(pν −1 )piτ  1 − g(p)p−iτ F (s)  = + 1− ζ (σ ) pσ pν s p ν 2  (4.32)    1 − ℜe g(p)p−iτ ≪ exp − pσ p et, sous l’hypothèse que la série (4.24) diverge pour tout nombre réel τ , le Lemme 4.8 implique que le membre de droite tend vers 0 uniformément en τ sur tout compact lorsque σ → 1+. On en déduit que l’on a HT (α ) = o(1/α ) uniformément en T lorsque α → 0+, d’où G(x) = o(x) (x → ∞), en reportant dans (4.31).

3.2. Lemmes Pour la démonstration du Théorème 4.7, nous aurons besoin de trois résultats auxiliaires. Le premier est une inégalité générale, due à Gallagher (1970) concernant les valeurs moyennes de polynômes trigonométriques. Lemme 4.9 (Gallagher). Soient N ∈ N∗ , {λn }N n=1 une suite finie de nombres N réels distincts. On pose δn := minm=n |λm − λn |. Pour tous {an }N n=1 ∈ C et T > 0, nous avons 2  T       1  , |an |2 T + an e(λn t) dt ≪ (4.33)  δn −T 1nN

1nN

où la constante implicite est absolue. En particulier, pour toute série de Dirichlet F (s) := n1 an /ns d’abscisse de convergence < α et pour tout T > 0, on a uniformément  T  |an |2 |F (s)|2 dτ ≪ (4.34) (T + n) (σ  α ). n2α −T n1

Démonstration. L’inégalité (4.34) découle immédiatement du cas λn := ln n (n  1) de (4.33) par passage à la limite en N . Pour établir (4.33), nous observons que, posant   an , S(t) := an e(λn t), A(x) := 2T 1nN |x−λn |1/4T

on a

( := A(t)



R

A(x)e(−tx) dx = S(−t)

1nN

sin(π t/2T ) · π t/2T

D’après la formule de Plancherel, nous pouvons donc écrire 2  T      S(−t) sin(π t/2T )  dt = |S(t)|2 dt ≪ |A(x)|2 dx.   π t/ 2 T R R −T

466

III.4. FONCTIONS ADDITIVES ET MULTIPLICATIVES

 Posons Nk := |2T λn −k|1 |an | (k ∈ Z) et observons que |A(x)|  2T Nk lorsque |x − k/2T |  1/4T . Il suit   |A(x)|2 dx ≪ T Nk2 . R

k∈Z

{λ∗j

: 1  j  Jk } la suite des λn comptés dans Nk , réordonnée par ordre Notons croissant, et posons bj := |an | si λ∗j = λn , δj∗ := T (λ∗j+1 − λ∗j ) (1  j < Jk ). Si  2 Jk  1, nous avons clairement Nk2  |2T λn −k|1 |an | . Dans le cas contraire, nous pouvons écrire, en vertu de l’inégalité de Cauchy–Schwarz,

 b2j   b2j 1  2 2 2 1 + |a | . + b  + b  Nk2  T (λ∗Jk − λ∗1 ) n Jk Jk δj∗ δj∗ T δn 1j 1  T  T |B(s)|2 dτ . |A(s)|2 dτ  3 (4.35) −T

−T

Démonstration. Considérons la fonction χ (τ ) := max(0,1 − |τ |/T ), dont la transformée de Fourier vaut  +∞

sin(tT /2) 2 . eiτ t χ (τ ) dτ = T χ ( (t) = tT /2 −∞

On a pour tout τ0 ∈ R  +∞  am an n iτ0 m  χ ( ln χ (τ − τ0 )|A(s)|2 dτ = (mn)σ m n −∞ m,n1  +∞  bm bn n  = ln  χ ( χ (τ )|B(s)|2 dτ . (mn)σ m −∞ m,n1

Si h(τ ) désigne la fonction indicatrice de [−T ,T ], on a

h(τ )  χ (τ − T ) + χ (τ ) + χ (τ + T ), d’où



T 2

−T

|A(s)| dτ  3



+∞

−∞

2

χ (τ )|B(s)| dτ  3



T

−T

|B(s)|2 dτ . ⊓ ⊔

3 Voir Montgomery (1971), p.158, et aussi Montgomery (1994), § 7.3, qui mentionne que l’argument employé ici est dû à Wirsing.

4.3. LE THÉORÈME DE HALÁSZ

467

Le troisième résultat auxiliaire est une décomposition pratique du produit eulérien F (s). Lemme 4.11. Soit g une fonction multiplicative de module  1. On a  g(n) (4.36) = 1 + D(s) F1 (s)J(s) (σ > 1) s n n1

avec

D(s) :=

 g(2ν ) ν 1

2ν s

F1 (s) := exp

,

p>2

et où J(s) est holomorphe pour σ > (4.37)

 g(p)

1 2

,

et satisfait à ′

1 ≪ J(s) ≪ 1,

ps

J (s) ≪ 1

(σ  1).

Démonstration. On a

J(s) =



s

e−g(p)/p

p>2

 g(pν ) ν 0

pν s

·

Le facteur générique de ce produit vaut 1 + O(p−2σ ), donc J(s) est bien holomorphe pour σ > 21 et uniformément bornée pour σ  43 . Cela implique en particulier les majorations de J(s) et J ′ (s) dans (4.37). D’autre part puisque l’on a   1   g(pν )p−ν s   (p > 2, σ  1)  21  p−1 ν 1

on déduit de (4.6) que | log J(s)|  dans (4.37).



p>2 2/(p

− 1)2 , d’où la minoration de |J(s)| ⊓ ⊔

3.3. Preuve du Théorème 4.7 Nous pouvons manifestement, sans perte de généralité, supposer T arbitrairement grand. Il sera commode de disposer de la minoration (4.38)

HT (α ) ≫ 1

(α > 0).

Pour cela, observons d’abord que, notant ϑν := arg g(2ν ) avec |ϑν |  π , on a  | cos(ϑν − τ ν ln 2)| |1 + D(1 + α + iτ )|  1 −  21 (1 − | cos(ϑ1 − τ ln 2)|). 2ν ν 1

Désignant par k0 l’entier le plus proche de (ϑ1 − 21 π )/ ln 2 (avec une convention arbitraire en cas d’ambiguïté), on a donc |1 + D(s)|  12 (1 − sin ln 2) > 0 pour σ  1, |τ − k0 |  12 . On note que |k0 |  8. On a de plus  k0 + 12  g(p)  k0 + 21  1 ≪ 1. log F1 (s) dτ = p−iτ dτ ≪ σ p p ln p k0 − 21 k0 − 21 p p>2

468

III.4. FONCTIONS ADDITIVES ET MULTIPLICATIVES

Cela implique max|τ −k0 | 1 |F1 (s)| ≫ 1, et donc 2   max |F (s)|  min  1 + D(s) J(s) max |F1 (s)| ≫ 1, σ =1 +α |τ −k0 | 12

d’où (4.38).

La première étape de la démonstration consiste à établir une majoration de G(x) en fonction d’une moyenne de la même fonction, soit  x

x  x |G(t)| dt + O . (4.39) |G(x)|  2 ln x 1 t ln x  Posons K(x) := nx g(n) ln n. On a   ln(x/n) ≪ x. g(n) ln(x/n) ≪ (4.40) G(x) ln x − K(x) = nx

nx

Donc, il suffit, pour établir (4.39), de montrer que l’on a  x |G(t)| (4.41) |K(x)|  x dt + O(x). t2 1

Maintenant, on peut écrire     ln p = g(mpν ) ln p K(x) = g(n) nx



=

pν x

=

(4.42)



dx

pν x

pν |n

mx/pν

    (ln p) g(pν )G x/pν + O x/pν +1

(d)g(d)G(x/d + O(x).

Il s’ensuit que, notant R(v) := ψ (v) − v , où ψ est la fonction de Tchébychev, et en supposant x non entier, on peut écrire  x  |K(x)|  (d)|G(x/d)| + O(x) = |G(x/t)| dψ (t) + O(x) 1

dx x

=



1

|G(x/t)| dt +



1

x

|G(x/t)| dR(t) + O(x).

La  dernière  intégrale peut être évaluée par sommation d’Abel en remarquant que d|G(v)|   d ⌊v⌋. On a  x  x |G(x/t)| dR(t) = |G(x)| − R(x/t) d|G(t)| 1 1   x ≪ |G(x)| + ≪ x, |R(x/n)| ≪ x + n(ln 2x/n)2 nx

1nx

où nous avons utilisé le théorème des nombres premiers sous la forme

R(v) ≪ v/(ln 2v)2 Cela fournit bien (4.41).

(v  1).

4.3. LE THÉORÈME DE HALÁSZ

La seconde étape réside dans la majoration  x

2  (ln x)2 |G(t)| ln t ln x + dt ≪ H (4.43) T t2 ln x T 1

469

(x  2).

Nous pouvons remplacer, dans (4.43), |G(t)| ln t par |K(t)|. En effet, par (4.40), l’erreur impliquée est O(ln x), ce qui est acceptable au vu de (4.38). Maintenant l’inégalité de Cauchy–Schwarz 1/2  x  x  x dt |K(t)|2 |K(t)| dt  dt t2 t3 t 1 1 1

nous permet de ramener la preuve de (4.43) à celle de  ∞ |K(t)|2 1 HT (α )2 (4.44) dt ≪ (α > 0). + 3 2 3+2α t α α T 1 En effet, la majoration souhaitée découlera alors du choix α = 2/ ln x. La relation  ∞ −F ′ (s) (σ > 1) K(eu )e−uσ e−iuτ du = s 0 nous permet d’écrire la formule de Plancherel  ∞  +∞  ′  ∞  |K(t)|2 |K(eu )|2 1  F (1 + α + iτ ) 2 (4.45) dt = du =   dτ . t3+2α 2π −∞ 1 + α + iτ e2u(1+α) 1 0

Estimons la contribution du domaine |τ | > T par le lemme de Gallagher (Lemme 4.9) : nous avons  ′     T |F ′ (1 + α + 2ikT + iτ )|2  F (1 + α + iτ ) 2   dτ  dτ  1 + α + iτ  k2T 2 |τ |>T −T |k|1

(4.46)

1 1 1  (T + n)(ln n)2 ≪ + 3 2· T2 n2+2α T α T



n1

Pour estimer la contribution du domaine complémentaire |τ |  T , nous écrivons  k+ 21   F ′ (1 + α + iτ ) 2  1   (4.47) |F ′ (1 + α + iτ )|2 dτ . d τ ≪   2+1 1 1 + α + i τ k k− 2 |τ |T |k|T

La dernière intégrale n’excède pas (4.48)

2

max |F (s)|

σ =1 +α |τ −k| 21



k+ 21

k− 12

F′ 2    (1 + α + iτ ) dτ . F

À ce stade, on fait appel au Lemme 4.11 sous la forme

F′ D′ (s) F′ J′ (s) = + 1 (s) + (s). F 1 + D(s) F1 J

470

III.4. FONCTIONS ADDITIVES ET MULTIPLICATIVES

D’après (4.37), le dernier terme est uniformément borné. Il fournit donc une contribution O(1) à l’intégrale de (4.48). On a de plus  g(p) ln p F1′ (s) = − · F1 ps p>2

Par le Lemme 4.10, on a donc  k+ 12  ′  21  ′ 2 2  F1  F1    (1 + α + iτ ) dτ =  (1 + α + ik + iτ ) dτ 1 1 F F 1 1 k− 2 −2  21  ′  21 2 dτ 1 ζ  3 ≪ · ( 1 + α + i τ ) d τ ≪   2 2 1 1 α + τ ζ α −2 −2

On a encore

 ν 1 =1+ − D(s) 1 + D(s)

(σ > 1).

ν 1

En tant que série de Dirichlet, cette expression possède des coefficients qui ne dépassent pas, en valeur absolue, ceux de ⎞ν ⎛ s   1 1 ⎠ = 2 −1 ≪ ⎝ · 1+ 2ms 2s − 2 |s − 1| ν 1

m1

Compte tenu de la majoration D′ (s) ≪ 1, valable uniformément pour σ  1, on déduit donc du Lemme 4.10 que  k+ 12   21  dτ  D′ (1 + α + iτ ) 2  dτ ≪  2 1 1 1 + D(1 + α + iτ ) k− 2 − 2 |1 + D(1 + α + ik + iτ )|  21  1+α+iτ − 1 2 1 2 ≪  1+α+iτ  dτ ≪ · −2 α − 12 2 Il découle des calculs précédents que l’intégrale de (4.48) est O(1/α ) uniformément en k . En reportant dans (4.47) compte tenu de (4.46), cela fournit  ∞ 1 1 |K(t)|2 HT (α )2 dt ≪ + 3 2+ · 3+2α t α α T T 1

Le dernier terme étant dominé par la somme des deux précédents, nous obtenons bien (4.44), et donc (4.43). Nous pouvons à présent conclure. Puisque HT (α ) ≫ 1, le second terme de la majoration (4.39) est de l’ordre de grandeur requis. Pour évaluer le premier, nous utilisons (4.43) sous la forme    y 2 |G(t)| ln y + (y  e). dt ≪ HT 2 √ t ln y T y

4.3. LE THÉORÈME DE HALÁSZ

471

Il suit



x

e2

|G(t)| dt ≪ t2





x2

e2





x

e2

|G(t)| t2



t

t2

dy dt ≪ y ln y



x2

e2

dy y ln y



y

√ y

|G(t)| dt t2

 x2

2  ln y  dy HT (α ) ln x . + ≪ HT dα + T T ln y y ln y α e2

Cela termine la démonstration du Théorème 4.7.

3.4. Applications Notre première application est une forme effective du Théorème 4.5 de Halász. Corollaire 4.12. Soit g une fonction multiplicative de module  1. On pose pour x  2, T  2,   1 − ℜe g(p)p−iτ 1 + m(x,T ) 1 , R(x,T ) := + · m(x,T ) := min p T |τ |T em(x,T ) px

Alors on a



(4.49)

nx

g(n) ≪ x R(x,T ).

Démonstration. Posons μ(x,τ ) :=



px

 ℜe g(p)/p1+iτ ,

μ∗ (x,T ) := max μ(x,τ ), |τ |T

de sorte que m(x,T ) = ln2 x − μ∗ (x,T ) + O(1). Commençons par établir une propriété de pseudo-monotonicité pour la fonction x → μ∗ (x,T ). Nous avons trivialement

   ∂μ(x,τ )   |g(p)| ln p   ≪ ln x,  ∂τ   p px

donc μ(x,ϑ ) = μ(x,τ ) + O(1) pour |ϑ − τ |  1/ ln x et μ(x,τ ) =

1 2

ln x



τ +1/ ln x

μ(x,ϑ ) dϑ + O(1). τ −1/ ln x

472

III.4. FONCTIONS ADDITIVES ET MULTIPLICATIVES

Soit τy , |τy |  T − 1/ ln y , tel que μ(y ,τy ) = μ∗ (y ,T − 1/ ln y). D’après ce qui précède on a μ∗ (y ,T )  μ(y ,τy ) + O(1) et donc  ln y τy +1/ ln y μ(y ,τ ) dτ + O(1) μ∗ (y ,T ) = 2 τy −1/ ln y

ln y = 2 (4.50)



τy +1/ ln y

τy −1/ ln y

 μ∗ (x,T ) −

ln y 2

 μ∗ (x,T ) + ln y

 μ(x,τ ) − {μ(x,τ ) − μ(y ,τ )} dτ + O(1)



τy +1/ ln y



τy −1/ ln y yexp(1/α )

1 ≪ 1, p 1 +α

qui découle, par sommation d’Abel, du théorème des nombres premiers. On déduit de (4.60) et (4.61) que

F (s) ≪ α K λ−1 lnB (|τ | + 3) où B est une constante absolue convenable. La fonction de Montgomery H(α ) := limT →∞ HT (α ), où HT est définie par (4.30), satisfait donc à

H(α )2 ≪ α 2K λ−2

 lnB (|k| + 4) k2 + 1

k∈Z

d’où

H(α ) ≪ α K λ−1 .

(4.62)

Posons alors S :=



px

λ ln(1/α ) + O(1) =

{1 − g(p)}/p. On a pour 1/ ln x  α  1,



pexp(1/α )

1 − g(p)  1 − g(p)  − p p px

 S − 2 ln2 x + 2 ln(1/α ) + O(1)



exp(1/α ) 0, nous notons Lα (N∗ ) la classe des fonctions arithmétiques g telle que 1/α  1 < ∞. |g(n)|α gα := lim sup x→∞ x nx

Théorème 4.16 (Elliott). Soit α > 1. Une condition nécessaire et suffisante pour qu’une fonction arithmétique multiplicative g ∈ Lα (N∗ ) possède une valeur moyenne non nulle M (g) est que les séries

 g(p) − 1 p∈P

p

,



|g(p)|3/2

|g(p) − 1|2 , p

convergent et que l’on ait  g(pν ) ν 0



= 0



|g(p)|>3/2

|g(p)|α , p

  |g(pν )|α p∈P ν 2



(p ∈ P).

Lorsqu’il en est ainsi, on a

M (g) =



p∈P

4

1−

1   g(pν ) · p pν ν 0

Voir l’Exercice 280 p. 481 pour une preuve directe reposant sur l’inégalité de Turán–Kubilius.

480

III.4. FONCTIONS ADDITIVES ET MULTIPLICATIVES

§ 4.2. Le Théorème 4.4 n’a pas été publié par Delange mais a fait l’objet de plusieurs exposés oraux. Une autre démonstration du point (i) du Théorème 4.2 est due à Daboussi (1982, 1989). Nous en proposons une troisième, inspirée de la démonstration originale de Delange et basée sur l’emploi d’un théorème taubérien, à l’Exercice 282. Une remarquable généralisation du Théorème 4.4 est donnée par Elliott (1997), th. 11.1. § 4.3. De nombreuses généralisations du théorème de Wirsing (Théorème 4.6) ont été obtenues dans la littérature. Voir par exemple Elliott (1997), chap. 17. Tenenbaum (2007) a montré que, pour toute fonction multiplicative réelle g , si g 2 possède une valeur moyenne, alors il en va de même pour g et que, dans cette circonstance, on a M (g) = 0 dès que

 {g(p) − 1}2 p∈P

p

= ∞.

Au vu du facile Théorème I.3.12, cela implique immédiatement le Théorème 4.6. Montgomery (1994) déduit d’inégalités de type Hilbert le renforcement suivant de (4.33)    T    2    3  |an |2   2    dt − T |a | · (4.71) a e( λ t) n n n   2   δn  −T  1nN

1nN

1nN

Le Théorème 4.7 est énoncé et prouvé par Montgomery (1978b) avec T = ∞ et pour une fonction g complètement multiplicative. L’extension au cas général est purement technique. Dans le même article, Montgomery remarque que son résultat permet d’établir des estimations du type de celle du Théorème 4.14. Voir aussi Montgomery & Vaughan (2001). Ce sont les évaluations de cette nature que l’on appelle majorations effectives, ou encore théorèmes quantitatifs de valeurs moyennes. Leur caractéristique est l’uniformité relativement à la fonction sommée (dans une certaine classe), qui peut en particulier dépendre de x. Le Théorème 3.5 est un exemple simple d’un tel résultat. L’estimation du Théorème 4.14 peut être étendue aux fonctions g à valeurs complexes telles que |g|  1 et g(p) appartient pour tout p à l’ellipse ℑm (e−iϕ z)2  δ 2 1 − ℜe (e−iϕ z)2 où δ, ϕ sont des paramètres arbitraires tels que 0  δ < 1, 0  ϕ < π . Hall & Tenenbaum (1991) donnent pour chaque valeur du couple (δ,ϕ ) la meilleure constante K(δ,ϕ ) > 0 telle que

G(x) ≪ xe−K(δ,ϕ )



px {1−ℜe g(p)}/p

.

Le principe de la majoration (4.39) dans la preuve du Théorème 4.7 est dû à Granville & Soundararajan (2003). Le même travail contient de nombreux résultats de majorations effectives de sommes de fonctions multiplicatives, notamment des variantes du Théorème 4.7 et une version du Corollaire 4.12 dont les

NOTES

481

constantes numériques essentielles sont explicitées. Les auteurs construisent également des contre-exemples attestant de l’optimalité qualitative de ces estimations. Pour d’autres énoncés généraux et la technique nécessaire pour les obtenir, voir Elliott (1980), chap. 19, où sont exposées et affinées des estimations de Halász (1971). Elliott prouve les deux résultats suivants ; le premier correspond au Théorème 4.14, le second est une version effective du théorème de Delange (Théorème 4.2). Théorème 4.17. Soit g une fonction complètement multiplicative qui satisfait, pour une constante convenable λ > 0, à g(p) = 0 ou λ  |g(p)|  2 − λ pour tout p. Soit ϑp l’argument de g(p) lorsque g(p) = 0. On suppose qu’il  existe des réels ϑ0 , δ, |ϑ0 |  π , δ > 0, tels que |eiϑp − eiϑ0 |  δ g(p) = 0 . Alors on a     |g(p)| − 1  |g(p)| − ℜe g(p)  1   −c + 2λ g(n) ≪ x exp  p p p nx

px

px

px g(p)=0

où c est une constante ne dépendant que de δ et λ.

Théorème 4.18. Soit g une fonction complètement multiplicative qui satisfait à |g(p) − 1|  η  η0 < 1 pour tout p. Alors on a     1 − ℜe g(p)    g(n) − Ax ≪ ηx exp −  p nx px

   |g(p)| − 1  + x e−c1 /η + (ln x)−c2 exp p px





où l’on a posé A := exp px (g(p) − 1)/p et où c1 ,c2 sont des constantes positives ne dépendant que de η0 . Le Théorème 4.5 permet d’apporter une réponse complète au problème de la répartition limite des fonctions additives translatées, c’est-à-dire la convergence faible des f.r. (4.72)

νN {n : f (n)  AN + z}

(N → ∞).

Le résultat suivant, obtenu indépendamment par Elliott & Ryavec (1971), Levin & Timofeev (1971), Delange, et Kubilius (non publiés), est prouvé dans Elliott (1979), chap. 7. Théorème 4.19. Soit f une fonction additive réelle. Une condition nécessaire et suffisante pour qu’il existe une fonction AN telle que les fréquences (4.72) convergent faiblement vers une f.r. est que, pour une constante convenable c, on ait, posant h(n) := f (n) − c ln n (n  1), 1 min(1,|h(p)|2 ) < ∞. p p

482

III.4. FONCTIONS ADDITIVES ET MULTIPLICATIVES

 Dans ce cas, on peut choisir AN := pN , |h(p)|1 h(p)/p + c ln N . Pour cette fonction AN , la fonction caractéristique de F vaut   1 wp (τ )e−iτ h(p)/p wp (τ ) 1 + icτ |h(p)|1

|h(p)|>1

  −iτ h(p−ν ) −ν où l’on a posé wp (τ ) := 1 − 1/p p . De plus, F est de type ν 0 e pur. Elle est continue si, et seulement si,  1 = ∞. p f (p)=0

§ 4.4. Il est clair que nous aurions également pu déduire le théorème d’Erdos–Kac ˝ des estimations des fréquences νN {n : ω(n) = k} par sommation sur l’ensemble adéquat des valeurs de k , ainsi qu’il est suggéré à l’Exercice 218, p. 329. Ces estimations ont été obtenues au Chapitre II.6 en utilisant le même outil de base que celui qui a servi ici : la méthode de Selberg–Delange. La démonstration originale d’Erdos ˝ & Kac (1939) ne √ fournissait pas de terme d’erreur explicite. LeVeque a conjecturé la borne ≪ 1/ ln2 N en 1949 et démontré que ≪ (ln3 N )/(ln2 N )1/4 est admissible. Ce résultat fut amélioré par Kubilius en 1956 et la conjecture de LeVeque fut finalement démontrée par Rényi  & Turán en 1958 par la méthode employée ici. En utilisant les estimations de nx z ω(n) pour z complexe (cf. Théorème II.6.1), Delange (1959) a obtenu un résultat plus précis : on a(5)  νN n : ω(n)  ln2 N + y ln2 N  2

1  E D  e−y /2 1 2 = (y) + √ a − 6 y − ln2 N + y ln2 N +O ln2 N 2π ln2 N où a ≈ 0,40516.

5

On rappelle la notation t pour la partie fractionnaire de t ∈ R.

E XERCICES

281. Montrer que chacun des trois types de fonction de répartition possibles pour une fonction additive peuvent effectivement se produire. [Indication : voir les Exercices 256–259, pp. 450-451.] 282. Preuve de la condition nécessaire du théorème de Delange via un théorème taubérien.(6) Soit g une fonction arithmétique multiplicative complexe à valeurs dans le disque unité et possédant une valeur moyenne non nulle M (g). Pour σ > 0  et p ∈ P, on pose Gp (σ ) := ν 0 g(pν )/pνσ et l’on désigne par log la détermination principale du logarithme complexe. ! (a) Montrer que limσ →1+ ζ (σ )−1 p∈P Gp (σ ) = M (g). (b) Montrer que l’on a Gp (σ ) ∈ C  R− pour tout σ > 1 et que les limites     g(p) − 1   lim lim log G2 (σ ) + log 1 − p−σ Gp (σ ) , σ →1+ σ →1+ pσ p>2

p∈P

sont bien définies dans C.  (c) Déduire de ce qui précède que G2 (1) = 0 et que p {g(p) − 1}/pσ tend vers une limite finie lorsque σ → 1+. (d)En employant le Théorème II.7.7 avec ω = 0, établir la convergence de la série p {g(p) − 1}/p.

283. Sur la répartition des fonctions multiplicatives. Soit g une fonction multiplicative réelle. (a) Montrer (en utilisant par exemple le Théorème I.3.12) que l’on a   1 1 d{n : g(n) = 0} = 1 − 1− , ν p p ν p ν 0, g(p )=0

où le produit infini est interprété comme valant 0 lorsqu’il  est divergent. En déduire en particulier que g(n) = 0 pp si, et seulement si, g(p)=0 1/p = ∞. (b) On suppose que g n’est pas nulle pp, et l’on pose  g(pν ). g ∗ (n) := pν n, g(pν )=0

6

La démonstration proposée ici repose, comme celle de Delange (1961), sur l’emploi du théorème taubérien de Hardy–Littlewood–Karamata (nous employons la forme généralisée du Théorème II.7.7), mais les détails sont significativement différents.

484

III.4. FONCTIONS ADDITIVES ET MULTIPLICATIVES

Montrer que g et g ∗ possèdent simultanément des lois de répartition limites. On pourra traiter d’abord le cas d’une fonction fortement multiplicative puis recourir au lemme 1.45 d’Elliott (1979).(7) (c) On suppose maintenant ! ensemble νde  g(n) = 0 (n  1). Soit E un nombres premiers tel que pν n, p∈E / g(p ), p∈E 1/p < ∞. On pose h(n) := A := {a : p|a ⇒ p ∈ E},  et l’on réserve la lettre a pour désigner un entier générique de A. Montrer que a∈A 1/a < ∞. Montrer que l’on a pour tous N  1, z ∈ R,  1   1. μ(a′ ) νN {n : g(n)  z} = N ′ ′ aN a N/a

mN/aa , g(a)h(m)z

En déduire que, si h possède une fonction de répartition H alors g possède une fonction de répartition G donnée presque partout par   1   Ha z/g(a) G(z) = 1− p a p∈E

a∈A

où l’on a posé Ha (z) := H(z) si g(a) > 0, Ha (z) := 1 − H(z) si g(a) < 0. (d) Établir l’extension suivante d’un théorème de Galambos & Szüsz (1986)  : Soit g une fonction multiplicative telle que g(n) = 0 pour n  1, et g(p) y),

uy (p) := 0 (p  y),

vy (p) := 1 − uy (p).

Montrer que uy := 1 ∗ vy μ, et en déduire que uy possède la propriété (D).

(d) Soit f une fonction multiplicative de module  1 satisfaisant à f (pν ) = 0 si ν  2. Montrer que f = f uy ∗ f vy . En déduire, par une application convenable de

7 Il s’agit d’une variante du théorème de continuité stipulant qu’une fonction arithmétique g possède une fonction de répartition si, et seulement si, pour tous τ ∈ R et j ∈ {0,1} fixés, la fonction arithmétique  si g(n) = 0, |g(n)|iτ sgn g(n)j Gjτ (n) := 0 si g(n) = 0,

possède une valeur moyenne ϕj (τ ) continue en τ = 0. 8 Une condition nécessaire et suffisante d’existence d’une f.r. pour une fonction fortement multiplicative réelle est donnée par Galambos (1971). Pour le cas général, voir Elliott (1979), th. 7.11.

EXERCICES

485

l’inégalité de Cauchy–Schwarz que l’on a pour x  1 1  2   f (n)e(α n)  A(x){B1 (x) + B2 (x)}  x nx



avec A(x) := (1/x)

B1 (x) :=

nx uy (n)

2  1   f (d)vy (d) uy (n) x dx

B2 (x) :=

et

nx/d



1d,d′ x, d=d′

f vy (d)f vy (d′ ) !

1 x



nx/d′ , nx/d

 uy (n)e α n(d − d′ ) .

(e) Montrer que limx→∞ A(x) = py (1 − 1/p). Montrer que B1 (x)  1. En utilisant le fait que f vy (d) n’est non nul que pour un nombre fini d’entiers d, montrer que B2 (x) → 0 lorsque x → +∞. (f) En faisant y → ∞, montrer le théorème de Daboussi : Toute fonction multiplicative de module  1 possède la propriété (D).(9) 285. Une estimation de Montgomery & Vaughan (2001). On pose M (n,x) = d|n, dx μ(d).

(a) En appliquant le Lemme 4.13, montrer que l’on a uniformément pour 0 < α  1, τ = 0,  cos(τ ln p)  2 ln2 (3 + |τ |) + O(1), − p 1 +α p>exp(1/|τ |)



p>exp(1/|τ |)

2 1 4 | cos(τ ln p)|  ln + (2 − ) ln2 (3 + |τ |) + O(1). 1 + α p π α π

(b) Montrer que pour tout entier n  1 on a

 2 − 2 /π    1 − p−1−α −iτ ) ≪ α −1/π ln(3 + |τ |) p|n

(0 < α  1, τ = 0).

(c) En déduire, grâce au Théorème 4.7, que l’on a  (1/π )−1 (x  2). (4.73) max |M (n,x)| ≪ x ln x n1

le membre

∞(d) Montrer 2que ! de gauche de (4.73) est ≫ x/ ln x. Évaluer +i M (n , t) dt/t pour n := x x px, cos ln p0 p, et en déduire que l’exposant 1/π 1 (10) dans (4.73) est optimal. 286. Un théorème de Halász (1971). Soit E un ensemble de nombres premiers. On pose E(x) := px, p∈E 1/p et l’on considère la fonction arithmétique définie  par la formule (n; E) := pν n, p∈E ν.

9 La démonstration proposée ici, différente de la preuve originale de Daboussi (cf. Daboussi & Delange, 1982) est également due à Daboussi (1989). 10 Par la méthode de Hall & Tenenbaum (1991), on peut en fait montrer que l’on peut remplacer ≪ dans (4.73) par ≍.

486

III.4. FONCTIONS ADDITIVES ET MULTIPLICATIVES

(a) Montrer, en utilisant le Théorème 4.17, que si δ > 0, δ  |z|  2−δ on a, pour une constante c1 > 0 ne dépendant que de δ,   z (n;E) ≪ x exp |z| − 1 − c1 (|z| − ℜez) E(x) . nx

(b) Montrer en utilisant le Théorème 4.18 que, si |z − 1|  21 , on a pour des constantes absolues c2 > 0, c3 > 0, 1     z (n;E) − e(z−1)E(x)   x nx   ≪ |z − 1|e(ℜez−1)E(x) + e(|z|−1)E(x) e−c2 /|z−1| + (ln x)−c3 .

(c) En employant la formule de Cauchy de manière semblable à celle de la preuve du Théorème II.6.3, déduire de (a) et (b) que l’on a uniformément pour E(x)  2, δ E(x)  m  (2 − δ )E(x),(11)

1  E(x)m −E(x)  |m − E(x)|  e 1+O  1=x . + m! E(x) E(x) nx, (n;E)=m

287. Convergence vers la loi de Gauss. Dans tout l’exercice, on pose y = y(x) = x1/ ln2 x . (a) Soit A(x) la classe des fonctions multiplicatives G à valeurs dans le disque unité et satisfaisant à G(pν ) = 1 pour p > y et tout ν  1. Montrer que l’on a uniformément pour x  2, G ∈ A(x),

x    1   G(pν ) +O . G(n) = x 1− ν p p ln x nx

py

ν 0

de fonctions multiplicatives de module (b) Soit {gx : x  2} une famille  au plus 1 telle que limx→+∞ y 0

x σ  = xσ ζ (σ ,y). (5.5) (x,y)  n + n1, P (n)y

On obtient ensuite une majoration explicite en choisissant σ optimalement. Ce procédé, simple mais remarquablement efficace, peut être généralisé de diverses manières. Il est aujourd’hui connu sous le nom de méthode de Rankin. Nous l’appliquons, sous une forme rudimentaire, dans la démonstration du Théorème 5.1 ci-dessous. La quantité

u :=

(5.6)

ln x ln y

(x  y  2)

joue un rôle déterminant dans l’étude du comportement asymptotique de (x,y). Nous faisons un usage systématique de la notation (5.6) au cours de ce chapitre. Théorème 5.1. On a (x,y) ≪ xe−u/2

(5.7)

(x  y  2).

Démonstration. Nous pouvons supposer y  11, puisque, dans le cas contraire, on a (x,y)  (x,7) ≪ (ln x)4 alors que la majoration de (5.7) est de l’ordre d’une puissance de x. Cela étant, nous avons pour tout α  0  n α χ (n,y). (5.8) (x,y)  x3/4 + x3/4 nx

Pour le choix α := 2/(3 ln y), la fonction multiplicative n → nα χ (n,y) satisfait les hypothèses du Corollaire 3.6. On obtient   α ln p    pα − 1   x exp O ≪ x. nα χ (n,y) ≪ x 1+ p p nx

py

py

En reportant dans (5.8) et en remarquant que l’on a ln x > 21 u pour y  11, on obtient le résultat annoncé. ⊓ ⊔ Il est patent que la démonstration précédente n’est pas optimale. Une exploitation approfondie de la majoration de Rankin (5.5) a permis à de Bruijn (1966) d’obtenir une évaluation asymptotique uniforme fournissant un équivalent de ln (x,y) lorsque u et y tendent vers l’infini. Nous donnons ci-dessous une version légèrement plus précise, dont le terme d’erreur relatif tend vers 0 dès que y → ∞. Nous posons  1

y y  ln x  y  ln x (5.9) Z := ln 1 + ln 1 + + =u dv . ln 1 + ln y ln x ln y y v ln x 0 1 4

1

Voir le Théorème 5.26 infra.

490

III.5. ENTIERS FRIABLES. LA MÉTHODE DU COL

Théorème 5.2. On a, uniformément pour x  y  2, 

1 1  + (5.10) ln (x,y) = Z 1 + O . ln y ln2 2x Démonstration. On peut manifestement supposer x assez grand. Posons −ζ ′ (σ ,y)  ln p = (0 < σ  1). (5.11) ϕy (σ ) := ζ (σ ,y) pσ − 1 py

La valeur optimale du paramètre σ dans (5.5) est la solution (unique) α = α (x,y) de l’équation ϕy (α ) = ln x. La première étape de la démonstration consiste à trouver une approximation explicite de α (x,y). On fait appel, à cette fin, au théorème des nombres premiers pour évaluer ϕy (σ ) uniformément pour y  2, 0 < σ  1. On obtient

1  1 − y −(1−σ )  y (5.12) ϕy (σ ) = σ 1+O · . y −1 1−σ ln y Nous omettons ici la preuve, passablement technique, de cette estimation, mais dégageons les étapes du raisonnement à l’Exercice 288.

On peut déduire de (5.12) l’évaluation 

ln y  2 (5.13) α (x,y) = β (x,y) 1 + O ln y

(x  y  2)

où β = β (x,y) est la solution de l’équation y/(y β − 1) = ln x, soit β (x,y) :=

(5.14)

ln(1 + y/ ln x) · ln y

Pour montrer (5.13), on observe d’abord que 21  (1 − y −(1−σ ) )/(1 − σ )  ln y (0  σ  1), d’où l’on tire, en reportant dans (5.12), que α = β + O(ln2 y/ ln y). Cela établit (5.13) lorsque β > 12 . Si β  12 , on réinjecte l’estimation précédente dans (5.12), soit 

ln y  y y 2 = 1 + O , ln x = β y −1 (1 − β )(y α − 1) ln y d’où y α = y β {1 + O(β ln2 y)}, et finalement (5.13).

Nous obtiendrons la majoration du Théorème 5.2 en choisissant σ = β dans (5.5). Il est à noter que

 1 y ln . (5.15) Z = β ln x + ln y 1 − y −β Par (5.5), on a

(5.16)

  (x,y)  xβ ζ (β,y) = ζ (1,y) exp β ln x +

β

1

 ϕy (σ ) dσ .

5.1. INTRODUCTION. LA MÉTHODE DE RANKIN

491

Lorsque y  (ln x)2 , on a certainement β  23 . Grâce à (5.12), on peut donc écrire  1 

1  y  2/3 (ln y)dσ ϕy (σ ) dσ = 1 + O ln y ln y ( 1 − σ )(y σ − 1) β β 

 1 y 1−σ ln y dσ . +O 2 /3

Le second terme d’erreur est ≪ y 1/3 . L’intégrale en σ vaut  2 /3

1  ∞ t dt  

1 − y − 2 /3 

 2/3 σ ln y ln y +O = ln d σ +O d σ yσ − 1 yσ − 1 1 − y −β ln y β ln y et − 1 β β 

1 1 + β ln y  1 +O + . = ln 1 − y −β y β ln y y 2 /3 Il suit



β

1



y(1 + β ln y)  

1  y 1 ln + O . ϕy (σ ) dσ = 1 + O ln y ln y 1 − y −β y β (ln y)2

Le second terme d’erreur est ≪ Z/ ln y . En effet, lorsque y  ln x, on a β ln y ≪ 1, d’où Z ≫ y/ ln y , et lorsque ln x < y  (ln x)2 , on a β ln y ≫ 1, d’où

Z y(1 + β ln y) β y 1 −β ≍ . ≍ βu ≪ β 2 y (ln y) ln y ln y

En reportant dans (5.16), nous avons donc établi la majoration 

1  (5.17) ln (x,y)  Z 1 + O ln y lorsque y  (ln x)2 .

Lorsque (ln x)2 < y  x, on a β ≫ 1. Il découle alors de (5.12) que

1  y 1 −σ − 1  (β  σ  1). ϕy (σ ) = 1+O 1−σ ln y

Cela implique immédiatement  1 

1   (1−β ) ln y ev − 1 y 1 −β dv ≪ · ϕy (σ ) dσ = 1 + O ln y v (1 − β ) ln y 0 β

1 1 −1 + En observant que y 1−β = ≍ ln x, on voit que y ln x  1 ln x , ϕy (σ ) dσ ≪ ln 2x β d’où

ln (x,y)  β ln x + O



ln x 

1  Z 1+O . ln2 x ln2 x

492

III.5. ENTIERS FRIABLES. LA MÉTHODE DU COL

Nous avons ainsi établi dans tous les cas la majoration contenue dans (5.10). Pour obtenir la minoration, nous posons v := ⌈u⌉, z := x1/v , k := π (z). Nous avons alors (x,y)  (x,z) et il est clair que chaque k -uple (ν1 , . . . ,νk ) d’entiers k  0 tels que j=1 νj  v fournit au moins un entier compté dans (x,z), à savoir !k νj j=1 pj (où pj désigne le j -ième nombre premier). Il suit   k+v (x,y)  , v d’où, en appliquant la formule de Stirling,

 ln (x,y)  (k + v) ln(k + v) − k ln k − v ln v + O 1 + ln min(k ,v) .

k Le terme principal de cette minoration peut encore s’écrire 0 ln(1 + v/t) dt. On voit donc que l’erreur commise en remplaçant k par z/ ln z est

z v ln x  z ≪ ln 1 + ln 1 + . ≪ 2 2 (ln z) k (ln z) z

Nous pouvons ainsi écrire (5.18)

avec



1  ln (x,y)  W (z) 1 + O ln z W (z) :=

z z  ln x  ln x + . ln 1 + ln 1 + ln z ln x ln z z

On vérifie facilement que

1 ln x  W (t) + ln 1 + . t ln t ln t t √ Cela implique, par un petit calcul, que l’on a pour y  t  y 2 ⎧  ln x ⎪ ⎨ y  (ln x)4 ln t W ′ (t) ≪ t(ln  x) ln2 x ⎪ ⎩ (ln x)4 < y  x . t(ln t)2 W ′ (t) = −

Gardant à l’esprit que (ln y)/ ln z = 1 + O(1/u), il suit, en quelques lignes supplémentaires,

1 1  + . Z − W (z) = W (y) − W (z) ≪ min(ln y , ln2 x) ≪ Z ln y ln2 x En reportant dans (5.18), nous obtenons 

1 1  + . ln (x,y)  Z 1 + O ln y ln2 x

Cela achève la démonstration du Théorème 5.2.

⊓ ⊔

Le Théorème 5.2 met en évidence un changement de comportement de (x,y) lorsque y passe par la valeur ln x. Ce phénomène sera décrit plus amplement dans les prochains paragraphes. Il peut être expliqué, au moins partiellement, par le

5.2. LA MÉTHODE GÉOMÉTRIQUE

493

fait que la relation



p = o(x),

py

valable, lorsque x → ∞, dès que y  (1 − ε) ln x, impose une structure particulière aux entiers comptés dans (x,y) quand y est « petit » : certains exposants dans la décomposition canonique doivent alors être « grands ».

5.2. La méthode géométrique Nous avons vu, au cours de la preuve de la minoration du Théorème 5.2, que la quantité (x,y) peut être interprétée comme le dénombrement des points à coordonnées entières dans un polyèdre de Rk , avec k := π (y). Lorsque k n’est pas trop grand, on obtient assez facilement une bonne estimation. Soit {aj }∞ j=1 une suite de nombres réels positifs. Nous posons      Nk (z) :=  (ν1 , . . . ,νk ) ∈ Nk : 1jk νj aj  z . Théorème 5.3. On a pour k  1, z  0, k    1 z + 1jk aj zk  1 (5.19) < Nk (z)  . k! aj k! aj 1jk

1jk

Pour le choix k := π (y), z := ln x, aj := ln pj (où pj désigne le j -ème nombre premier), on a Nk (z) = (x,y) et 1jk aj = ϑ (y) ≪ y . On obtient donc immédiatement le résultat suivant. √ Corollaire 5.4 (Ennola, 1969). Pour 2  y  ln x ln2 x, on a uniformément

y 2  1  ln x  (5.20) (x,y) = 1+O . π (y)! ln p ln x ln y py

Démonstration du Théorème 5.3. Nous procédons par récurrence sur k . Le résultat est acquis pour k = 1 puisque   z z + a1 z  < N1 (z) = 1 + . a1 a1 a1 Supposons la double inégalité (5.19) satisfaite pour k − 1, avec k  2. On a  Nk (z) = Nk−1 (z − ν ak ), 0ν z/ak

d’où

 1  1 1 1 Sk (z) < Nk (z)  Sk (w), (k − 1)! aj (k − 1)! aj 1j 1)

(iv)

̺ (u)  1/Ŵ (u + 1)

(u  0).

(ii)

̺ (u) > 0 ′

Démonstration. Le point (i) découle immédiatement de (5.25) et des conditions initiales pour ̺. En effet les deux membres de (i) ont même dérivée pour u > 1 et même valeur en u = 1. Montrons (ii). Soit τ := inf{u : ̺ (u) = 0}. Si τ est fini, alors τ > 1 puisque ̺ est continue et satisfait à ̺ (u) = 1 pour 0  u  1. Par (i), on peut alors écrire  τ ̺ (v) dv . 0 = τ ̺ (τ ) = τ −1

La continuité de ̺ implique alors que le membre de droite de cette égalité est strictement positif — d’après la définition même de τ . Cela montre que τ n’est pas fini, d’où (ii). Le point (iii) découle immédiatement de (ii) et de l’équation fonctionnelle (5.25). Nous établissons (iv) par récurrence sur k := ⌊u⌋. La propriété est satisfaite pour k = 0 puisque ̺ (u) = 1 (0  u  1). Si k  1, on déduit de (i), (ii), (iii) et de l’hypothèse de récurrence que l’on a  ̺ (u − 1) 1 1 1 u  = · ̺ (u) = ̺ (v) dv  u u−1 u uŴ (u) Ŵ (u + 1)

⊓ ⊔

Nous verrons (Corollaire 5.19) que la relation asymptotique (5.23) persiste dans un très large domaine en x,y . Un premier essai d’utilisation inductive de l’identité de Buchstab fait l’objet du théorème suivant, qui représente un succès partiel dans cette direction. Théorème 5.8. On a uniformément pour x  y  2

x  (5.26) (x,y) = x̺ (u) + O . ln y Démonstration. Au vu de la décroissance rapide de ̺ (u) lorsque u → ∞, nous pouvons nous contenter de faire la démonstration lorsque u  2 ln2 y . Dans le cas contraire, le terme d’erreur de (5.26) est d’ordre supérieur à celui du terme principal, et le résultat découle par exemple du Théorème 5.1. Soit alors (x,y) la quantité implicitement définie par la relation (x,y) = x̺ (u) +

x(x,y) . ln y

5.3. ÉQUATIONS FONCTIONNELLES

497

Ainsi que nous l’avons précédemment remarqué, on a (x,y) ≪ 1 pour y  2, 1  u  2. En effet, la relation (5.22) avec z = x fournit alors

x    . ⌊x/p⌋ = x(1 − ln u) + O π (x) = x̺ (u) + O (x,y) = ⌊x⌋ − ln x y 1, s = −ξ (u) + iτ , τ ∈ R, on a  (|τ |  π ) exp I(ξ ) − τ 2 u/2π 2 (5.49) ̺(s) ≪ ( (|τ | > π ) exp I(ξ ) − u/(π 2 + ξ 2 )

et

(5.50)

̺(s) = (

1 + uξ  1 1+O s s

(|τ | > 1 + uξ ).

Démonstration. Remarquons d’abord que (5.50) découle immédiatement de (5.45) et (5.44) sous la forme

s( ̺(s) = e−J(s) .

(5.51)

Il suffit en effet d’appliquer la majoration triviale J(s) ≪ e−σ |τ |−1 avec σ = −ξ (u). Pour établir (5.49), nous introduisons la quantité  1 1 − cos(hτ ) dh. ehξ H(τ ) := I(ξ ) − ℜe I(−s) = h 0

Lorsque |τ |  π , on a 1 − cos(hτ )  2τ 2 h2 /π 2 pour 0  h  1, d’où  2τ 2 1 ξ h h e dh. H(τ )  2 π 0 La conclusion souhaitée provient alors de la minoration  1  1  1 hξ hξ 1 1 h e dh  2 e dh  4 ehξ dh = 41 u. 0

1 /2

0

Lorsque |τ | > π , nous remarquons que nous pouvons supposer u assez grand, car la conclusion est triviale dans le cas contraire. Compte tenu de (5.48), nous nous plaçons donc dans la circonstance où

u > π 2 + ξ 2. Nous pouvons alors écrire  1

eξ +iτ − 1  ehξ 1 − cos(hτ ) dh = u − ℜe H(τ )  ξ + iτ 0

uξ eiτ + eiτ − 1  2 ξ cos ϑ  − u 1−  , = u − ℜe ξ + iτ π2 + ξ2 τ2 + ξ2

5.4. LA FONCTION DE DICKMAN

503

avec ϑ := τ − arctan(τ /ξ ). Le facteur de u dans la dernière expression est au moins égal à π 2 /(2π 2 + 2ξ 2 ). Il suit

H(τ ) 

2u u uπ 2 − 2 > 2 · 2 2 2 2(π + ξ ) π + ξ π + ξ2

⊓ ⊔ Nous sommes maintenant en mesure d’établir le résultat suivant, qui fournit une formule asymptotique avec terme d’erreur pour ̺(u) lorsque u → ∞. Théorème 5.13 (de Bruijn ; Alladi). On a pour u  1  

1  ξ ′ (u) eγ −uξ +I(ξ ) . (5.52) ̺ (u) = 1 + O u 2π Remarques.  En dérivant (5.47) par rapport à u, on obtient immédiatement ξ ′ (u) = ξ / 1 + u(ξ − 1) . En particulier, on a ξ ′ (u) ∼ 1/u lorsque u → ∞. Par ailleurs, il est utile de noter que le terme principal de (5.52) peut être transformé en utilisant l’identité  u (5.53) uξ − I(ξ ) = ξ (t) dt (u > 0). 1

 2 ln(u + 1)/u et  δ 1 ̺(s)eus dτ ( K(u) := 2π −δ

Démonstration. Soient δ = δ (u) := π

où l’on a posé s = −ξ (u) + iτ . Dans un premier temps, nous montrons que la différence  1 ̺(s)eus ds ( (5.54) ̺ (u) − K(u) = 2π i |τ |>δ peut être englobée par le terme d’erreur de (5.52). Nous utilisons à cette fin le Lemme 5.12. La contribution à l’intégrale (5.54) du domaine δ < |τ |  π est   ∞ dt e−uξ +I(ξ ) e−uξ +I(ξ ) ∞ −uξ +I(ξ ) −τ 2 u/2π 2 √ e−t √ ≪ . ≪e e dτ ≪ u u 3 /2 t δ ln(u+1) De même, la contribution du domaine π < |τ |  1 + uξ est ≪ (1 + uξ ) exp − uξ + I(ξ ) − u/(π 2 + ξ 2 ) .

Ces majorations sont pleinement acceptables. Enfin, nous pouvons évaluer la contribution du domaine |τ | > 1 + uξ grâce à (5.50). On a  ∞  ∞ −uξ +iτ u 

uξ  e us dτ ≪ e−uξ 1+O ̺(s)e dτ = ( τ τ 1+uξ 1+uξ

où nous avons fait appel à la seconde formule de la moyenne pour traiter le terme en 1/τ . Puisque I(ξ ) ∼ u, cette majoration est encore de l’ordre de grandeur requis.

504

III.5. ENTIERS FRIABLES. LA MÉTHODE DU COL

Il reste à évaluer K(u). Pour cela, nous écrivons le développement de Taylor de ( ̺(s) au voisinage de τ = 0. En remarquant que, pour ℜe s = −ξ et k  1, on a   (k)   1 k−1 hs  I (s) =  h e dh  I (k) (ξ )  I ′ (ξ ) = u, 0

il vient

I(ξ − iτ ) = I(ξ ) − iτ u − 21 τ 2 I ′′ (ξ ) − 16 iτ 3 I ′′′ (ξ ) + O(uτ 4 ). On peut donc écrire, pour τ ≪ u−1/4 ,  exp I(ξ − iτ ) + us = exp I(ξ ) − uξ − 21 τ 2 I ′′ (ξ ) 1 + h(u) , avec

h(u) = exp − 16 iτ 3 I ′′′ (ξ ) + O(uτ 4 ) − 1 = − 61 iτ 3 I ′′′ (ξ ) + O(uτ 4 + u2 τ 6 ).

En reportant dans l’intégrale définissant K(u) et en remarquant que la contribution du terme en τ 3 est nulle par symétrie, on obtient  e−uξ +I(ξ ) δ −τ 2 I ′′ (ξ )/2 (5.55) K(u) = 1 + O(uτ 4 + u2 τ 6 ) dτ . e 2π −δ La contribution des termes d’erreur est



e−uξ +I(ξ )  . u I ′′ (ξ )

On évalue celle du terme principal en étendant l’intégrale jusqu’à l’infini et en majorant la contribution du domaine |τ | > δ. En notant que

I ′′ (ξ ) = 1/ξ ′ (u) = u − (u − 1)/ξ ,

(5.56)

il vient



δ

e −τ

2 ′′

I (ξ )/2

dτ =

−δ

8

1  2π  1 + O . I ′′ (ξ ) u

En reportant cette estimation dans (5.55) et en tenant compte de (5.56), on obtient bien la formule annoncée (5.52). ⊓ ⊔ Corollaire 5.14. Soit k un entier  0, et u0 un nombre réel > 1. On a (5.57) ̺ (k) (u) = (−1)k ξ (u)k ̺ (u) 1 + O(1/u) (u  u0 ). Démonstration. Dérivons k fois l’équation fonctionnelle (5.37). Nous obtenons (5.58)

u̺ (k+1) (u) = −̺ (k) (u − 1) − k ̺ (k) (u)

(u > 1).

Cela implique immédiatement par récurrence sur k que l’on a (5.59)

(−1)k ̺ (k) (u) > 0

On a donc (5.57) lorsque u est borné.

(u > 1).

5.5. APPROXIMATIONS DE (x, y) PAR LA MÉTHODE DU COL

505

La relation (5.56) montre que ξ ′ (u) ∼ 1/u,

(5.60)

ξ ′′ (u) ∼ −1/u2

(u → ∞).

On en déduit, pour u assez grand, (5.61)

ξ (u − 1) = ξ (u) 1 + O(1/u) , ′





u

ξ (t) dt = ξ (u) + O(1/u).

u−1

En reportant dans la formule asymptotique (5.52), écrite en tenant compte de (5.53), on obtient (5.62) ̺ (u − 1) = ̺ (u)eξ (u) 1 + O(1/u) = uξ (u)̺ (u) 1 + O(1/u) .

Cela permet de prouver (5.57) par récurrence sur k . En supposant la formule satisfaite au  rang k , on peut écrire grâce à (5.58), (5.60) — sous la forme ξ (u − 1) = ξ (u) 1 + O(1/u) — et (5.62),  u̺ (k+1) (u) = (−1)k ξ (u)k − uξ (u)̺ (u) + O ξ (u)̺ (u) 1 + O(1/u)

= (−1)k+1 ξ (u)k+1 u̺ (u) 1 + O(1/u) .

La démonstration de (5.57) est ainsi complétée.

⊓ ⊔

Corollaire 5.15. On a uniformément pour 0  v  u (5.63)

̺ (u − v) ≪ ̺ (u)evξ (u) .

Démonstration. Lorsque u − 1 < v  u, on a ̺ (u − v) = 1. L’évaluation (5.63) découle alors de (5.52), puisque I(ξ ) ∼ u. Lorsque 0  v  u − 1, on déduit de (5.52) et (5.53) que l’on a  v  u ̺ (u − v) ≪ exp ξ (u − t) dt . ̺ (u) u−v 0

Par (5.60), on a ξ (u − t)  ξ (u) − c t/u pour une constante absolue positive convenable c. Le résultat souhaité découle alors de l’ inégalité élémentaire   cv 2 u + O(1) (0  v  u − 1). (5.64)  ln 2u u−v

⊓ ⊔

5.5. Approximations de (x,y) par la méthode du col La formule de Perron nous permet d’écrire pour tout α > 0  α+i∞ ds 1 (x ∈ / N∗ ). ζ (s,y)xs (5.65) (x,y) = 2π i α −i∞ s Nous allons voir que la méthode du col, employée au paragraphe précédent pour évaluer la fonction de Dickman, fonctionne aussi pour l’intégrale (5.65).

506

III.5. ENTIERS FRIABLES. LA MÉTHODE DU COL

Le choix optimal pour le paramètre α est la solution (unique) α (x,y) de l’équation transcendante  ln p −ζ ′ (α,y) = = ln x. (5.66) ζ pα − 1 py

Ainsi que nous l’avons vu au cours de la démonstration du Théorème 5.2, la quantité α (x,y) est également la meilleure valeur du paramètre dans la méthode de Rankin, et la formule (5.13) fournit un équivalent de α (x,y) dès que y → ∞. Cependant, la nature implicite de α (x,y) laisse augurer d’un certain défaut de maniabilité dans la formule asymptotique résultant d’un tel traitement. Le but principal recherché dans ce paragraphe est d’établir que l’on peut sans dommage, dans une sous-région convenable en x,y , remplacer α (x,y) par une approximation explicite. Le résultat est une extension simultanée des formules (5.31) et (5.35) respectivement dues à de Bruijn et Hildebrand. L’approximation explicite de α (x,y) est naturellement suggérée par le lemme suivant. Nous posons Yε := exp (ln y)(3/2)−ε et conservons dans toute la section les notations ln x u := , Lε (y) := exp (ln y)(3/5)−ε . ln y

En vue d’applications ultérieures, nous donnons une forme plus générale que nécessaire. Lemme 5.16. Pour tout ε ∈]0, 21 [, il existe un nombre réel y0 = y0 (ε) tel que, sous les conditions 1 , |τ |  Y3ε , (5.67) y  y0 (ε), σ 1− 2 / 5 + ε + L2/3+ε (ln y) τ

où l’on a posé Lτ := ln(2 + |τ |), on ait uniformément

  (5.68) ζ (s,y) = ζ (s)(s − 1) ln y ̺ ( (s − 1) ln y 1 + O

 2/ 3+ε 1 . + y −1/Lτ Lε (y)

Démonstration. Observons d’abord que l’on a sous les hypothèses indiquées  (n)  1 ζ′ + O y 2 −σ . (5.69) − (s,y) = s ζ n ny

En effet, le terme d’erreur est en valeur absolue au plus égal à  ln p  ln p  (n)   ln p 1 = ≪ + ≪ y 2 −σ . σ νσ σ 2σ n p y p √ √ n>y P + (n)y

py

ν>

ln y ln p

p y

y 1, une intégration par parties montre, au vu de (5.69), que cette relation est encore satisfaite, quitte à multiplier le terme d’erreur par σ — nous omettons les détails, qui sont standard. Supposons temporairement τ = 0 et intégrons la relation (5.72) ainsi modifiée sur la demi-droite {s + t : t  0}. Il vient  

1 2/ 3+ε + y −1/Lτ ζ (s,y) = ζ (s)e−J((s−1) ln y) 1 + O Lε (y) avec la notation (5.42) pour J(s). Le résultat annoncé découle donc de la formule s( ̺(s) = e−J(s) — le cas τ = 0 étant obtenu par passage à la limite. ⊓ ⊔ 4 5

Voir les Notes du Chapitre II.3. Voir les Notes sur le § II.3.10.

508

III.5. ENTIERS FRIABLES. LA MÉTHODE DU COL

Le fait que l’on soit en mesure de bien estimer l’intégrale de Laplace inverse pour ( ̺ (s) sur la droite σ = −ξ (u) et l’occurrence de cette même fonction dans l’approximation de ζ (s,y) sont deux raisons heuristiques plus que suffisantes pour choisir, dans l’intégrale de Perron (5.65), l’abscisse α telle que (α − 1) ln y = −ξ (u), c’est-à-dire α = α0 , avec α0 := 1 −

(5.73)

ξ (u) · ln y

Il est d’ailleurs facile de vérifier, à l’aide des évaluations découlant du théorème des nombres premiers — cf. Exercice 288 — pour la fonction ϕy (σ ),(6) que α0 est une excellente approximation de α (x,y) dans un large domaine en x,y : on a 

1 1 + (5.74) α (x,y) = α0 + O Lε (y) (ln x) ln y uniformément pour x  x0 (ε), (ln x)1+ε  y  x.

Pour que le Lemme 5.16 soit applicable avec σ = α0 comme abscisse d’intégration et un terme d’erreur relatif 1 + O(1/Lε (y)), il est nécessaire que l’on ait ξ (u)  (ln y)3/5−ε pour un ε > 0 convenable, c’est-à-dire, en tenant compte du Lemme 5.11, que x et y appartiennent à la région du plan définie, pour un nombre réel arbitraire ε > 0 fixé, par (Hε ) x > x0 (ε), exp (ln2 x)(5/3)+ε  y  x. Maintenant, le Lemme 5.16 suggère que, sous cette hypothèse, la quantité  α0 +i∞  ds 1 (5.75) ζ (s)(s − 1) ln y ̺ ( (s − 1) ln y xs 2π i α0 −i∞ s

est une bonne approximation de (x,y). Après le changement de variables (s − 1) ln y → s, l’expression (5.75) devient  −ξ (u)+i∞

x s  s eus ds. ̺ (s)ζ 1 + ( (5.76) 2π i −ξ (u)−i∞ ln y s + ln y

Or, on peut vérifier facilement que l’on a, pour tout nombre complexe s tel que ℜe s > − ln y,  ∞

⌊y t ⌋  s  s = (5.77) e−st d ζ 1+ . s + ln y ln y yt −∞

Le théorème de convolution montre donc que le facteur de x dans (5.76) est l’intégrale de Laplace inverse de  ∞  ̺ (u − v) d ⌊y v ⌋ /y v = (x,y)/x. −∞

Ainsi la fonction de de Bruijn, (x,y), apparaît-elle, dans le cadre de l’étude analytique par la méthode du col, comme l’approximation naturelle de (x,y). À vrai dire, les considérations heuristiques présentées ci-dessus constituent un réel schéma de démonstration. 6

Définie en (5.11).

5.5. APPROXIMATIONS DE (x, y) PAR LA MÉTHODE DU COL

509

Nous sommes maintenant en mesure d’énoncer le résultat principal de cette section. Théorème 5.17 (Saias, 1989). Soit ε > 0. Lorsque (x,y) est dans le domaine (Hε ), on a 

1  (5.78) (x,y) = (x,y) 1 + O . Lε (y) Avant d’aborder la démonstration, montrons comment ce théorème permet de retrouver la formule asymptotique (5.35) de Hildebrand. Lemme 5.18. Soit ε > 0. Sous la condition

x > x0 (ε),

(5.79)

(ln x)1+ε  y  x,

on a



ln(u + 1)  · (x,y) = x̺ (u) 1 + O ln y

(5.80)

Démonstration. Par sommation d’Abel, on peut écrire  u y v

(5.81) (x,y) = x̺ (u) − x − x ̺ ′ (u − v) v dv . y 0 D’après les Corollaires 5.14 et 5.15, on a pour tout v , 0  v  u, ̺ ′ (u − v) ≪ ξ (u)̺ (u − v) ≪ ln(u + 1)̺ (u)eξ (u)v . Or, dans le domaine (5.79), on a

Cela implique  (5.82)

0

 ξ (u)  ln2 x + O(1)  1 − 21 ε ln y . u

̺ ′ (u − v)y −v dv ≪ ln(u + 1)̺ (u)





̺ (u) ln(u + 1) , ln y

0

u



eξ (u) y

v

et fournit donc la conclusion souhaitée.

dv

⊓ ⊔

Corollaire 5.19 (Hildebrand). Soit ε > 0. Sous la condition x  3, exp (ln2 x)(5/3)+ε  y  x,

on a uniformément (5.83)



ln(u + 1)  . (x,y) = x̺ (u) 1 + O ln y

Démonstration. Lorsque x > x0 (ε), cela découle immédiatement de (5.78) et (5.80). Comme ̺ (u) > 0 pour u  1, la conclusion est triviale pour 3  x  x0 (ε). ⊓ ⊔

510

III.5. ENTIERS FRIABLES. LA MÉTHODE DU COL

Bien entendu, l’estimation (5.78) contient une information beaucoup plus précise que la formule (5.83). On peut notamment en déduire un développement asymptotique de (x,y) selon les puissances de ln(u + 1)/ ln y — cf. les Notes. La première étape de la démonstration du Théorème 5.17 consiste à tronquer l’intégrale de Perron de façon à pouvoir ensuite approcher l’intégrande en utilisant le Lemme 5.16. Nous énonçons le résultat ci-dessous. Lemme 5.20. Soit ε > 0. Posons T := Lε/2 (y). Pour x,y dans (Hε ), on a 1 (x,y) = 2π i

(5.84)



α0 +iT 2

ζ (s,y)

α0 −iT 2

x̺ (u)  xs ds + O . s Lε (y)

Démonstration. On fait appel au Théorème II.2.3. Désignant par R le terme d’erreur de (5.84), on a

R ≪ xα0



P + (n)y

n −α 0 xα0 ζ (α0 ,y) ≪ + RT , 1 + T 2 | ln(x/n)| T

avec RT := (x + x/T ,y) − (x − x/T ,y). Lorsque u n’est pas trop grand, nous utilisons la majoration triviale

RT ≪ x/T . Dans le cas contraire, nous procédons comme à l’Exercice 171 p. 244, en introduisant la fonction de poids  1 sin tT /2 2 (t ∈ R) w(t) := 2π tT /2 dont la transformée de Fourier vaut  ∞  τ  + 1   1−  . w(t)e−itτ dt = w( ( τ ) := T T −∞ On a alors

RT ≪



P + (n)y

 α0 +iT

x α0 x  1 = w ln ζ (s,y)xs w( ( τ ) ds. n n 2π i α0 −iT

Nous pouvons donc finalement écrire x   xα0 ζ (α0 ,y) √ , xα0 √ max ζ (α0 + iτ ,y) . (5.85) R≪ + min T T T |τ |T

D’après le Lemme 5.16 et le Théorème 5.13, on a

 √ ξ (u)  − ξ (u) ( ̺ − ξ (u) ≪ x ln y u ̺ (u). (5.86) xα0 ζ (α0 ,y) ∼ x e−uξ (u) ζ 1 − ln y

Le premier terme du membre de droite de (5.85) est donc acceptable. Il en va de même du second si u  2 ln Lε (y). En effet, on a alors ̺ (u) u −2 u 1 ≪ √ ≪ . T L T ε (y)

5.5. APPROXIMATIONS DE (x, y) PAR LA MÉTHODE DU COL

511

Lorsque u > 2 ln Lε (y), nous pouvons utiliser le Lemme 5.16 (avec 21 ε à la place √ de ε) et le Lemme 5.12. On a pour T < |τ |  T , s = α0 + iτ ,  ζ (s,y) ≪ ζ (s)(s − 1) ln y ̺ ( (s − 1) ln y ≪ ζ (s) ≪ ln T √ puisque |τ | ln y  T  1 + uξ (u). Grâce au Théorème 5.13, nous déduisons donc de ce qui précède que le second terme du membre de droite de (5.85) est

≪ xα0 ln T ≪ xe−uξ (u) ln y ≪ x̺ (u)/Lε (y) où nous avons utilisé le fait que I(ξ ) ∼ u lorsque u → ∞. Cela achève la démonstration du Corollaire 5.20. ⊓ ⊔ Nous sommes maintenant en mesure de compléter la preuve du Théorème 5.17. La première étape consiste à remplacer ζ (s,y) par son approximation régulière dans l’intégrale de (5.84). En appliquant le Lemme 5.16 avec 12 ε au lieu de ε, on voit que l’erreur commise dans cette manipulation n’excède pas  2 xα0 ζ (α0 ,y) T dτ ≪ T |α0 + iτ | 0 avec T = Lε/2 (y). Grâce à (5.86), on obtient que cette majoration est de l’ordre de grandeur requis. En effectuant le changement de variables (s − 1) ln y → s, nous pouvons réécrire le nouveau terme principal sous la forme  −ξ (u)+iT 2 ln y

s  s x eus ds ̺(s)ζ 1 + ( P := 2π i −ξ (u)−iT 2 ln y ln y s + ln y  −ξ (u)+iT 2 ln y x ( = λy (s)eus ds 2π i −ξ (u)−iT 2 ln y

où nous avons posé (5.87)

λy (u) :=





−∞

 ̺ (u − v) d ⌊y v ⌋ /y v

(y u ∈ / N∗ )

avec la convention λy (u) = λy (u+) si y u ∈ N∗ , de sorte que l’on a identiquement (x,y) = xλy (u). En scindant l’intégrale de (5.87) selon que v  u/2 ou v > u/2, on voit immédiatement que l’on a uniformément pour u  0, y  2, (5.88)

λy (u) ≪ ̺ (u/2) + y −u/2

Cela implique que l’intégrale de Laplace inverse  −ξ (u)+i∞ 1 ( λy (s)eus ds (5.89) λy (u) = 2π i −ξ (u)−i∞

/ N∗ , et donc certainement dans le converge dès que ξ (u) < 12 ln y , y u ∈ domaine (Hε ) privé des couples (u,y) tels que y u ∈ N∗ . Lorsque x = y u ∈ N∗ ,

512

III.5. ENTIERS FRIABLES. LA MÉTHODE DU COL

l’intégrale (5.89) converge en valeur principale vers



1 λy (u) + λy (u−) = λy (u) + . 2x Nous pouvons donc supposer dans la suite que x est demi-entier. Il vient    us ( (5.90) P = (x,y) + O x λy (s)e ds . 1 2

σ =−ξ (u) |τ |>T 2 ln y

Lorsque s = −ξ (u) + iτ , |τ | > T 2 , on a d’après le Lemme 5.12

1 + uξ  (5.91) s( ̺(s) = 1 + O s et il découle des estimations usuelles de la fonction zêta que

1 s  ≪ |s|−1/2 . (5.92) ζ 1+ s + ln y ln y

Le terme d’erreur de (5.90) est donc 

e−uξ (u) (1 + uξ (u)) 

s  eus √ ds + O x ≪x ζ 1+ ln y s + ln y T ln y

=



σ =−ξ (u) |τ |>T 2 ln y

ζ (s)

σ =α 0 |τ |>T 2

x̺ (u)  xs ds + O . s Lε (y)

Pour majorer la dernière intégrale, nous utilisons l’approximation de ζ (s) par la somme partielle de la série, sous la forme du Théorème II.3.5, soit

1 

1   1  1 |τ |1−s + O ζ (s) = = − + O . ns 1−s |τ |σ ns |τ |σ n|τ |

Il vient



σ =α 0 |τ |>T 2

n|τ |



xα0 

x s ds ds  = +O . ζ (s)x s s T |τ |max(n,T 2 ) n s

n1

Le dernier terme est pleinement acceptable. La formule (II.2.7) nous permet d’estimer le terme général de la somme en n par

x α0 1 . ≪ n 1 + (n + T 2 )| ln(x/n)|

En considérant séparément les deux cas obtenus en comparant |x − n| à x3/4 , on obtient donc que la somme en n est  xα0 x̺ (u) . ≪ + x3/4 ≪ 3 / 2 2 T n +T n1

Cela montre que le terme d’erreur de (5.90) est bien de l’ordre requis, et achève ainsi la démonstration du Théorème 5.17.

5.5. APPROXIMATIONS DE (x, y) PAR LA MÉTHODE DU COL

513

Lorsque la condition (Hε ) n’est pas remplie, la méthode du col fonctionne encore, à condition de choisir l’abscisse d’intégration théorique σ = α (x,y) définie par (5.66). Cette démarche a été suivie par Hildebrand et l’auteur (1986), qui obtiennent le résultat suivant, valable pour x  y  2. Nous rappelons les notations  pσ (ln p)2  ln p dϕy (σ ) ′ ϕy (σ ) = , ϕ · ( σ ) = = − y pσ − 1 dσ (pσ − 1)2 py

py

Théorème 5.21 (Hildebrand–Tenenbaum). On a uniformément pour xy2

1 ln y  xα ζ (α,y)  + , 1+O (5.93) (x,y) = 7 u y α 2π |ϕy′ (α )| (5.94)



ln x  1  1 + ln x ln y 1 + O |ϕy′ (α )| = 1 + . y ln(u + 1) ln y

De plus, si 0 < ε < 21 , y  (ln x)1+ε , on a  ln(u + 1) u  + (5.95) (x,y) = x̺ (u) exp O . ln y Lε (y)

Nous ne démontrerons pas ici ce résultat, et nous nous bornons à quelques commentaires. Tout d’abord, observons que l’estimation (5.13) pour α et la formule (5.94) impliquent 8  7 

y y ln x  ≪ . 2π u 1 + (5.96) ln y ≪ α 2π |ϕy′ (α )| ∼ ln 1 + ln x y ln y Cette estimation permet de comparer la majoration de Rankin à la taille véritable de (x,y). Même si elle ne fournit jamais l’ordre exact, la méthode de Rankin est remarquablement efficace : lorsque y = ln x par exemple, toutes les évaluations disponibles dans la littérature impliquent un facteur d’incertitude ≫ exp y 1+o(1) . Ensuite, nous notons que la formule (5.95), prouvée grâce à un léger renforcement du Théorème 5.8 pour les petites valeurs de u, contient strictement le Corollaire 5.19.

Enfin, il est nécessaire d’attirer l’attention du lecteur sur l’intérêt d’une formule telle que (5.93), dépendant d’un paramètre implicite comme α (x,y). Nous avons déjà vu comment l’insertion d’une approximation de α permet d’obtenir une véritable formule asymptotique. Il existe cependant une application d’un autre type, reposant sur le fait que les petites variations de α (x,y) sont assez facilement étudiables. Cela permet l’étude du comportement local de (x,y), même dans les régions où le comportement global n’est pas complètement élucidé. Le résultat suivant, caractéristique de la méthode, peut être obtenu par une extension immédiate du theorem 3 de Hildebrand & Tenenbaum (1986).

514

III.5. ENTIERS FRIABLES. LA MÉTHODE DU COL

Théorème 5.22. On a uniformément pour x  y  2, c  1, et t := (ln c)/ ln y, 

1 ln y  + (5.97) (cx,y) = (x,y)cα (x,y) 1 + O (t2 + 1) . u y Ainsi on a par exemple (2x,y) ∼ (x,y) ⇔ y  (ln x)1+o(1) et (2x,y) ∼ 2 (x,y) ⇔ (ln y)/ ln2 x → ∞. Pour une autre application du Théorème 5.22, voir l’Exercice 296. L’estimation (5.93) fournit aussi des renseignements sur le comportement local relatif à la variable y . Il est par exemple facile de déduire de (5.93) et de l’estimation (5.13) pour α (x,y) que (5.98)

(x,y)/ (x,y−) ∼ (ln x)/y

dès que y est un nombre premier avec y  (ln x)1−ε . Il n’existe donc pas de fonction continue équivalente à (x,y) dans cette région. Hildebrand (1986f) a montré qu’une approximation continue ne peut être « trop » précise dans le domaine y  (ln x)2−ε . Le théorème suivant donne une estimation unilatérale uniforme pour le comportement local de (x,y). C’est une conséquence facile de (5.93). Théorème 5.23. On a uniformément pour x  y  2, c  1 

1 ln y  + . (5.99) (cx,y)  cα (x,y) 1 + O u y Démonstration. Soit α1 := α (cx,y). Alors α1  α. Par (5.93), on peut écrire

1 ln y  (cx)α1 ζ (α1 ,y)  + (cx,y) = 7 . 1+O u y α1 2π |ϕy′ (α1 )|

α Par définition de α1 , on a (cx)α1 ζ (α7 1 ,y)  (cx) ζ (α,y). Un calcul de routine permet

par ailleurs de vérifier que σ → σ

|ϕy′ (σ )| est une fonction décroissante de σ . En

appliquant une seconde fois (5.93), après avoir remplacé α1 par α dans le membre de droite, on obtient l’inégalité annoncée. ⊓ ⊔

5.6. La fonction de Jacobsthal et le théorème de Rankin Nous nous proposons dans ce paragraphe de montrer comment les majorations précédemment obtenues pour (x,y) permettent d’établir le théorème de Rankin sur les grandes différences entre nombres premiers consécutifs. À cette fin, nous déduisons(7) des Théorèmes 5.2 et 5.21 que l’on a √ (5.100) (x,y) ≪ xu−u + x (x  y  2). 7

Les détails, faciles, sont laissés au lecteur.

5.6. LA FONCTION DE JACOBSTHAL ET LE THÉORÈME DE RANKIN

515

Nous utiliserons également le résultat suivant, qui découle aisément du grand crible ou du crible de Selberg.(8) Lemme 5.24. Soient M , N ∈ N∗ et A un ensemble d’entiers inclus dans l’intervalle ]M ,M + N ]. On suppose que, pour chaque nombre premier p, A est exclu de w(p) classes résiduelles modulo p et que w(p) ≪ 1. Alors on a  w(p)  . |A| ≪ N 1− p pN

On appelle fonction de Jacobsthal, et l’on note n → j(n), la fonction arithmétique qui associe à un entier naturel n l’écart maximal j(n) entre deux entiers premiers à n. Maier et Pomerance (1990) introduisent le nombre maximal j ∗ (n) d’entiers consécutifs qui peuvent être criblés par les facteurs premiers de n, autrement dit j ∗ (n) := sup x ∈ N : ∃t ∈ N,∃{ap }p|n : ∀m ∈]t,x + t] ∃p|n : m ≡ ap (mod p) . Il est facile de voir que

(5.101)

j ∗ (n) = j(n) − 1

(n  1).

ϕ (n) D’une part, si {ak }k=1 désigne la suite croissante des entiers de [1,n] premiers à n et si j(n) = am+1 − am , alors l’intervalle ]am ,am+1 − 1] est criblé par les facteurs ∗ ∗

premiers de n, donc j(n) − 1  j (n). D’autre part, si ]t,t + j (n)] est un intervalle criblé par les facteurs premiers de n et si {ap }p|n est un système de résidus associés, le théorème chinois garantit l’existence d’un N tel que N ≡ −ap (mod p) pour tout p|n. Il s’ensuit que tout entier de la forme N + m avec t + 1  m  t + j ∗ (n) est non premier à n. Donc j ∗ (n)  j(n) − 1. Remarque. On a aussi j ∗ (n) = sup x ∈ N : ∃{ap }p|n : ∀m ∈]0,x] ∃p|n : m ≡ ap (mod p) . En effet, cela revient à remplacer ap par ap − t dans la définition de j ∗ (n). Notons P := {pn }n1 la suite croissante des nombres premiers, posons dn = pn+1 − pn (n  1) et  P (z) := p. pz

Les seules minorations dans la littérature pour dn sont en fait issues  disponibles de minorations de j P (z) . En effet, si j P (z) > x, il existe un intervalle ]t,t + x] entièrement criblé par des nombres premiers  z . D’après ce qui précède, il existe donc N  P (z) tel que l’intervalle ]N + t,N + t + x] ne contienne que des entiers m tels que P − (m)  z , et en particulier ne contienne aucun nombre premier. Comme on peut toujours choisir t  P (z), il s’ensuit que

j(P (z)) > x ⇒ ∃pk  2P (z) : pk+1 − pk  x. Conservons la notation (x,y), introduite au § I.4.2, pour le nombre des entiers n  x tels que P − (n) > y . Le lemme suivant exprime quantitativement 8

On peut également donner une preuve via le crible de Brun, mais plus compliquée.

516

III.5. ENTIERS FRIABLES. LA MÉTHODE DU COL

l’idée qu’un intervalle de longueur x peut être criblé en deux étapes, en éliminant d’abord les entiers ayant un petit facteur premier, puis en considérant des classes de congruence relatives à des nombres premiers plus grands. Lemme 5.25. Soient t, x, z , Z des nombres entiers tels que π (Z) − π (z)  (x + t,z) − (t,z).

(5.102)

Alors on a

 j P (Z) > x.

(5.103)

Démonstration. À chaque nombre premier p de ]z ,Z], on peut associer surjectivement un entier m compté dans (x + t,z) − (t,z). Désignons alors par kp le résidu de m modulo p. Posons  0 si p  z ap := −kp si z < p  Z . D’après le théorème chinois, il existe un entier N tel que N ≡ ap (mod p) pour tout p  Z . L’intervalle ]N + t,N + t + x] ne contient aucun entier n tel que P − (n) > Z . En effet, si n = N + m avec t < m  t + x, ou bien P − (m)  z et P − (m)|N , donc P − (m)|n, ou bien P − (m) > z et il existe un nombre premier p ∈]z ,Z] tel que N + m ≡ 0 (mod p), donc P − (n)  Z . Ainsi l’intervalle ]N + t,N + t + x] est constitué d’entiers criblés par les facteurs premiers de P (Z), donc  j ∗ P (Z)  x

⊓ ⊔

et (5.103) en découle.

Théorème 5.26 (Rankin). On a (5.104)

 Z ln Z ln3 Z j P (Z) ≫ (ln2 Z)2

(Z  100).

En particulier, il existe une constante c > 0 telle que l’on ait pour une infinité de valeurs de n ∈ N ln pn ln2 pn ln4 pn · (5.105) dn > c (ln3 pn )2 Démonstration. Soient z  2, M := P (z) et v , w tels que 2  v  w  z . On pose   M1 := P (v), M2 := p, M3 := p, v z , donc a  x/z . On choisit v := x/z , de sorte que

On impose aussi z >



b = 1 ⇒ a = 1. x, ce qui implique b = 1 ⇒ b ∈ P.

On voit donc que m vérifie (5.106) si, et seulement si, l’une des deux conditions suivantes est réalisée : (i)

m | M2∞ , et donc P + (m)  w,

(ii) m ∈ P, m > z , (m + 1,M2 ) = 1. Le nombre H de solutions de (5.106) vérifie donc

x ln v , ln x ln w où le dernier terme correspond à une majoration du nombre des solutions de (ii) par le Lemme 5.24. On choisit x = z(ln z)(ln3 z)/(ln2 z)2 et w = z A ln3 z/ ln2 z , où A est une constante convenable. Alors u := ln x/ ln w ∼ ln2 z/(A ln3 z), donc u ln u ∼ (1/A) ln2 z ∼ (1/A) ln2 x. Il suit (t + x,z) − (t,z)  H ≪ (x,w) +

(x,w) ≪ xu−u ≪ x/(ln x)1/A ≪ z/(ln z)2

dès que A est assez petite. On en déduit (t + x,z) − (t,z) ≪

z x ln v z ≪ + . 2 (ln z) ln x ln w ln z

Avec les notations du Lemme 5.25, on peut donc choisir Z ≪ z . Comme M = P (Z)  eBZ d’après Tchébychev, il s’ensuit que dn  x dès que pn  eCz . Cela implique bien la minoration annoncée. ⊓ ⊔

N OTES

§ 5.1. Il est souvent capital en arithmétique de décomposer un entier en deux ou plusieurs facteurs déterminés par la taille de leurs facteurs premiers. Cela explique en partie l’omniprésence de la fonction (x,y) en théorie analytique des nombres. Daboussi (1984) a montré que l’on peut prouver le théorème des nombres premiers par passage à la limite à partir du modèle constitué des entiers y -friables pour y fixé. Ce résultat est l’un des nombreux exemples d’application d’une méthode générale féconde reposant sur les propriétés des entiers friables — cf. Daboussi (1989). Pour des exposés historiques concernant les nombreux travaux consacrés au comportement asymptotique de (x,y) et au rôle des entiers friables en arithmétique, voir notamment Norton (1971), Hildebrand & Tenenbaum (1993b), Pomerance (1995). § 5.2. Ennola (1969) fournit aussi une formule asymptotique, plus compliquée, lorsque y  (ln x)3/4 . § 5.3. La méthode itérative de Hildebrand est illustrée simplement dans la démonstration du résultat suivant. Théorème 5.27 (Hildebrand, 1986). Soit ε > 0. Il existe une constante C3 > 0 telle que l’on ait uniformément pour x  y  2 (5.107) (x,y)  x̺ (u) exp − C3 u/Lε (u) .

Démonstration. On peut supposer u  y 2 . Le Théorème 5.13 montre aisément, dans le cas contraire, que le membre de droite de (5.107) n’excède pas 1. Lorsque u  y 2 , nous pouvons supposer y assez grand, quitte à modifier C3 . Fixons donc y  y0 et posons 5 δ (u) := inf (y v ,y) y v ̺ (v). 0vu

L’équation fonctionnelle (5.34) permet d’écrire   (5.108) (x,y) ln x  (d) (x/d,y)  xδ (u)S 1 + xδ u − 12 (S1 − S 1 , 2

dy

2

NOTES

519

où l’on a posé

 (d) ln d  ̺ u− d ln y ϑ

Sϑ :=

(0  ϑ  1).

dy

Admettons temporairement l’estimation  ϑ

 u ln(u + 1)  . ̺ (u − v) dv + O ̺ (u) 1 + (5.109) Sϑ = ln y Lε (y) 0

1 Puisque 0 ̺ (u−v) dv = u̺ (u), on obtient en reportant dans (5.108) et en divisant par x̺ (u) ln x = xu̺ (u) ln y

  (x,y)  δ (u)r(u) + δ u − 21 1 − r(u) + O Rε (u) x̺ (u)

avec

r(u) :=

1 u̺ (u)



0

1 2

̺ (u − v) dv ,

Rε (u) :=

1 ln(u + 1) + . u ln y Lε (y)

La décroissance de ̺ implique r(u)  12 . Puisque δ est également décroissante, on a    δ (u)r(u) + δ u − 12 1 − r(u)  21 δ (u) + δ u − 21

et donc, pour y  y0 , u  y 2 ,         δ (u)  δ u − 12 1 + O Rε (u)  δ u − 21 exp O Rε (u) .

Par itération, il suit  ln(u + 1) u ln(u + 1)      + δ (u)  exp O  exp O Rε 12 k ln y Lε (y) ku   exp O u/L2ε (u) . Il reste à montrer (5.109). Le théorème des nombres premiers implique  (d)  = v ln y − γ + O 1/Lε (y v ) . d v dy

D’où

Sϑ =



0

ϑ

 ̺ (u − v) ϑ + O ̺ (u − v) d v ln y + O Lε (y v ) 0



0

ϑ

̺ ′ (u − v)  dv . Lε (y v )

Le premier terme est bien le terme principal de (5.109). Posons κ := 35 − ε. Le Corollaire 5.15 nous permet de majorer le second terme par    u ln(u + 1)  . ≪ ̺ (u) + ̺ (u) exp ϑξ (u) − (ϑ ln y)κ ≪ ̺ (u) 1 + Lε (y)

520

III.5. ENTIERS FRIABLES. LA MÉTHODE DU COL

Grâce aux Corollaires 5.14 et 5.15, on voit que le troisième terme est  1 exp v ξ (u) − (v ln y)κ dv . ≪ ̺ (u) ln(u + 1) 0

Si ξ (u) 

1 (ln y)κ , 2

l’intégrale précédente est au plus égale à



0

Si ξ (u) > 

0

1 (ln y)κ , 2

1

exp



 1 1 ≪ . − 21 (v ln y)κ dv ≪ ln y ln(u + 1)

elle n’excède pas  1 1 /2  v ξ (u) exp v ξ (u) − ( 21 ln y)κ dv e dv + 1 /2



eξ (u) u eξ (u)/2 + ≪ . ln(u + 1) L2ε (y) ln(u + 1) L2ε (y) ⊓ ⊔

Cela établit (5.109) et achève la démonstration.

§ 5.4. Ainsi que l’on noté Hildebrand & Tenenbaum (1993), une application standard des techniques de l’analyse asymptotique(9) permet de montrer que l’on a, pour u assez grand,

1 m 1 + u ln u k  2 (5.110) ξ (u) = ln u + ln2 u + cmk ln u u ln u m0 k1

où l’on a posé    

zez m  zm m+k ;0 − cmk = Rés (ez − 1)m+k ez − 1 m + k m

(m  0, k  0).

Le Théorème 5.13, sous la forme présentée ici, a été prouvé par Alladi (1982), améliorant une formule asymptotique due à de Bruijn (1951a). La méthode employée par ces auteurs est différente de la nôtre, et repose entre autres sur le résultat suivant. Théorème 5.28 (de Bruijn ; Alladi). Soit f (u) une fonction continue pour u > 0 et satisfaisant à  u f (t) dt (u > 1) (5.111) uf (u) = u−1

Alors on a pour une constante convenable C et tout λ, 0 < λ < 41 ,  λ f (u) = C + O e−u ̺ (u) (u → ∞).

La démonstration originale utilise la théorie des équations de Volterra. Une voie alternative consiste à étudier directement f (t) par transformation de Laplace inverse via la méthode du col. Hildebrand et l’auteur (1993a) montrent ainsi que la solution générale d’une équation différentielle aux différences du type uf ′ (u) + af (u) + bf (u − 1) = 0 (u > 1) avec a,b ∈ C admet une représentation 9

Voir notamment de Bruijn (1970).

NOTES

sous la forme d’une série convergente  f (u) = α F (u) + αn Fn (u)

521

(u > 2)

n∈Z

où les constantes α, αn sont explicitement calculables à partir des conditions initiales (i.e. la donnée de f (u) sur [0,1]) et les fonctions F , Fn sont des solutions fondamentales de l’équation, ne dépendant que de a et b, dont le comportement asymptotique peut être élucidé. De plus, cette représentation est également un développement asymptotique. Dans le cas de l’équation (5.111), l’approximation au premier ordre fournit le résultat suivant. Théorème 5.29 (Hildebrand–Tenenbaum). Soit 0 < a < 2π 2 . Sous les hypothèses du Théorème 5.28, on a    2 f (u) = C + O e−au/(ln u) ̺ (u) (u → ∞)

avec C :=

∞ 1 −∞ 0

f (v)(1 − e−vt )e−t dv dt/t( ̺(t).

La méthode employée ici pour établir le Théorème 5.13 permet facilement d’obtenir un développement asymptotique de ̺ (u) selon les puissances de 1/u. Plus précisément, il existe une suite {hj }j1 de fonctions analytiques réelles telles que l’on ait, pour u  1, N  0, ξ = ξ (u),

1   hj (ξ ) exp γ − uξ + I(ξ )   . + O 1+ (5.112) ̺ (u) = N I ′′ (ξ )j u N +1 2π I ′′ (ξ ) 1jN

′′

De plus, u − (u − 1)/ξ  I (ξ )  u (u  1) et, pour chaque j  1 fixé, il existe une constante cj telle que (5.113)

hj (ξ ) = cj + O(1/ξ )

(u → ∞).

Pour une preuve détaillée d’un tel résultat et l’extension aux puissances (positives réelles) de convolution de ̺ (u), voir Smida (1991), qui étend un théorème de Hensley (1986a). Le cas des puissances complexes de convolution de ̺ (u) a été traité par Hildebrand (1990). Le comportement local de la fonction de Dickman se révèle un outil essentiel pour analyser l’approximation de de Bruijn (x,y). Le Corollaire 5.15 peut être notamment précisé par la formule (5.114)

̺ (u − v) = ̺ (u)evξ (u)+O(v

2

/(u+v 2 ))

(0  v  u)

qui découle de (5.63) et du Lemme 6.1 de Fouvry & Tenenbaum (1996). Dans ce contexte, la dérivée logarithmique r(u) := −̺ ′ (u)/̺ (u) joue souvent un rôle capital. Hildebrand (1986) a montré que r est croissante sur [1,∞[ et ainsi que l’ont remarqué Evertse, Moree, Stewart & Tijdeman (2003), on a

r(u − 1)  ξ (u)  r(u)

(u > 1).

La Bretèche & Tenenbaum (2005b) ont montré que

r(v) − ξ (v) ≪ 1/v , r′ (v) − ξ ′ (v) ≪ 1/v 2 , r′′ (v) ≪ 1/v 2

(v  1).

522

III.5. ENTIERS FRIABLES. LA MÉTHODE DU COL

Martin & Tenenbaum (2010) établissent d’autres propriétés de cette fonction, notamment r′′′ (v) ≪ 1/v 3 (v  1). § 5.5. L’estimation (5.74) pour α (x,y) est établie dans Hildebrand & Tenenbaum (1986), § 7. Voir aussi le Lemme 6.1. Ainsi que l’a montré Saias (1989), on peut obtenir un développement asymptotique de (x,y). La manière la plus agréable de parvenir à ce résultat consiste à écrire la formule de Taylor–Lagrange pour ̺ (u) — cf. Fouvry & Tenenbaum (1991), Lemme 4.2. Si l’on pose

rmj := ̺ (j) (m) − ̺ (j) (m−)

(0  m  j),

on a pour u  0, v  0, k  0  (−1)j ̺ (j) (u)v j + Rk (u,v) + Jk (u,v), ̺ (u − v) = (5.115) j! 0jk

où l’on a posé

Rk (u,v) :=

 (−1)j+1 j!

0jk

Jk (u,v) :=

(−1)k+1 k!



0

v



u−v 0, k  0 fixés,   (k+1)  ̺ (u) ̺ (j) (u) + O x (5.116) (x,y) = x aj (ln y)j (ln y)k+1 0jk

uniformément sous la condition (5.117)

x  2,

1 +ε

(ln x)

 y  x,

min

0jk, ju



u−j k+1−j





ln2 y , ln y

où les aj sont les coefficients de Taylor en s = 0 de sζ (s + 1)/(s + 1). La dernière des conditions (5.117) est en fait nécessaire — cf. Saias (1989). Bien que le Théorème 5.17 ait été obtenu dans une thèse dirigée par l’auteur, la démonstration présentée ici est sensiblement plus simple que la preuve originale. Hildebrand (1984a) a montré que la persistance de la formule  (5.118) (x,y) = x̺ (u) 1 + O ln(u + 1)/ ln y

pour y  (ln x)2+ε équivaut à l’hypothèse de Riemann. La méthode de démonstration du Corollaire 5.20 fournit une estimation du nombre des entiers friables dans de petits intervalles. Voir le Lemme 6.13, et le th. 4 de Hildebrand & Tenenbaum (1986).

NOTES

523

On pourra trouver un exposé de synthèse concernant la méthode du col et ses applications arithmétiques dans le survol de l’auteur (1988). La connaissance du comportement local de (x,y) et de la généralisation  1 (5.119) m (x,y) := n∈S(x,y) (n,m)=1

est capitale dans la plupart des problèmes arithmétiques utilisant les entiers friables. Cela explique pourquoi l’étude des fluctuations locales de m (x,y) a suscité un nombre important de travaux depuis une quinzaine d’années : voir notamment Hensley (1986b), Friedlander & Granville (1993), Hildebrand (1985, 1986f), Granville (1993), Hildebrand & Tenenbaum (1986), et, pour le cas parti! culier m = pz p, Saias (1995). Le travail de La Bretèche & Tenenbaum (2005a) fournit, pour le comportement local de la quantité (5.119), un document synthétique contenant des formules aussi précises et aussi générales que le permettent les techniques actuellement disponibles. Citons, entre autres, le résultat suivant. Nous rappelons la définition du point-selle α (x,y) en (5.66). Nous notons u := min{u,y/ ln y}, uy := u + (ln y)/ ln(u + 1) et posons δ := 21 si y  (ln x)2 , δ := 0 dans le cas contraire. Nous introduisons également la quantité Wm := log pω(m) ≍ log ω(m) + 2 (m  1) où pk désigne le k -ième nombre premier et où l’on convient, par commodité d’écriture, que p0 = 2. Nous notons encore ϑm = ϑm (y) :=

Em := Em (x,y) =

log(1 + y/ log x) Wm , α = α (x,y) := , log y log y

⎧ ϑm {u log(u + 2)}ϑm ⎪ ⎪ ⎪ ⎪ ⎨ 1 + ϑm log(u + 2)

⎪  ⎪ 1 u (u log y)ϑm ⎪ ⎪ ⎩ 1+ u log y ϑm α log y

si y > (log x)2 ,

si y  (log x)2 .

Théorème 5.30 (La Bretèche & Tenenbaum). Il existe des constantes absolues strictement positives b1 , b2 , et une fonction b = b(x,y; d,m) satisfaisant à b1  b  b2 (x  y  2, d  1, m  1) telles que, sous les conditions 1  d  x/y et √ (5.120) x  y  2, P (m)  y , ω(m) ≪ y/(ln y)δ ,

on ait uniformément bu  

x  (x,y)  t2 1 − p −α (5.121) m ,y = 1 + O(hm ) 1 − 2 2 d dα u +u p|m où l’on a posé α := α (x,y), t := (ln d)/ ln y , et

hm = hm (x,y; d) :=

t 1 Em  + + (1 + Em ) . uy u u

524

III.5. ENTIERS FRIABLES. LA MÉTHODE DU COL

Lorsque ω(m) ≪ 1, la formule (5.121) est valable uniformément sous les conditions 1  d  x et (5.120) et l’on a

hm ≍ h1 ≍

(5.122)

1 t + · uy u

Selon un autre résultat du même article, dans le domaine (Hε ) et pour P (m)  y , ω(m) ≪ y 1/ ln(u+2) , on a   2

y 1/(Wm +6)   ϑm + ϑm ln(u + 1) m (x,y) = x̺ (u)Z(β ) 1 − p −β 1 + O u x p|m

où l’on a posé β := 1 + ̺ ′ (u)/{̺ (u) ln y}, Z(s) := (s− 1)ζ (s)/s. Cela fournit, dans le même domaine de validité, un renforcement de la formule de Hildebrand (5.118). Pour l’étude des valeurs moyennes friables de fonctions arithmétiques, qui a suscité une très abondante littérature, voir notamment Tenenbaum & Wu (2003, 2008a, 2008b), Hanrot, Tenenbaum & Wu (2008) et les références données dans ces travaux. Le Théorème 5.30 suggère que l’approximation   1 1 p (x/pν ,y) ≈ να 1 − α , (5.123) (x,y) p p

avec α = α (x,y), qui possède l’avantage d’être une fonction simple de p lorsque x et y sont fixés, est pertinente dans un large domaine des quatre variables et sans restriction sur les tailles relatives de x et y . Cela conduit à modéliser une fonction arithmétique additive f définie sur l’ensemble S(x,y) des entiers y -friables n’excédant pas x par la variable aléatoire  Zf ,x,y := ξp py

où les ξp sont indépendantes sur un espace probabilisé abstrait (,P ) et de lois géométriques   1 1 (ν = 0,1,2, . . .), P (ξp = f (pν )) = να 1 − α p p avec la convention que, si plusieurs valeurs (en nombre éventuellement infini) f (pν ) sont égales, la probabilité correspondante est obtenue en sommant les probabilités apparaissant au second membre. On a   f (pν )  1 1− α , E(Zf ,x,y ) = pνα p pν ∈S(x,y) 2    2    |f (pν )|2  f (pν )  1 1  . 1− α − 1− α V(Zf ,x,y ) =  pνα p p pνα  ν ν p ∈S(x,y)

py

p x

NOTES

525

Avec ces notations, l’analogue de la variance semi-empirique (3.17) est la quantité  1 |f (n) − E(Zf ,x,y )|2 . V∗x,y (f ) := (x,y) n∈S(x,y)

La Bretèche & Tenenbaum (2005b, 2016) ont montré que la version friable de l’inégalité de Turán–Kubilius est valable uniformément pour x  y  2 , autrement dit que nous avons (5.124)

C ∗ (x,y) := sup f =0

V∗x,y (f ) ≪1 V(Zf ,x,y )

(x  y  2 ).

De plus (5.125)

C ∗ (x,y) = 1 + o(1)

1

u

+

 ln x →0 . y

Les mêmes estimations sont valables en remplaçant la variance semi-empirique par la variance empirique. La démarche décrite à l’Exercice 280, p. 481, peut être généralisée pour déduire de (5.124) un théorème d’Erdos–Wintner ˝ friable : voir La Bretèche & Tenenbaum (2005b). Contrairement au cas classique, l’existence de la loi limite, lorsque x et y tendent vers l’infini, d’une fonction arithmétique f sur S(x,y) fait intervenir, dans ce cadre, les valeurs f (pν ) pour 1  ν  1/α (x,y) + o(1). Tous ces résultats s’interprètent naturellement dans le cadre du modèle de Kubilius de la théorie probabiliste des nombres : voir les Notes du Chapitre III.6. § 5.6. Il est naturel de supputer que la construction du Lemme 5.25 peut être améliorée. En effet, sur des bases probabilistes, on s’attend à ce que, pour chaque p ∈]z ,Z], il existe une classe de congruence kp contenant ≫ ln z/ ln2 z entiers m de ]t,t + x] tels que P − (m) > z . Ainsi, on peut émettre la conjecture que la condition (5.102) peut être remplacée par (5.126)

(Z − z) ln2 z ≫ (x + t,z) − (t,z). (ln z)2

Cela conduit à multiplier la minoration de Rankin par (ln z)/ ln2 z , et donc à conjecturer que (5.127)

 z(ln z)2 ln3 z . j P (z) ≍ (ln2 z)3

La constante c de (5.105) peut être précisée. Pendant de nombreuses années, tous les résultats connus étaient du type c > beγ − ε pour ε > 0 arbitraire et n > n0 (ε). Rankin (1938) a obtenu b = 1/3, Maier & Pomerance (1990) ont montré que l’on peut choisir b ≈ 1,31256. Le meilleur résultat de cette forme, soit b = 2, est dû à Pintz (1997). Cependant, Ford, Green, Konyagin, Maynard & Tao ont annoncé très récemment (2014) que, dans le dénominateur du membre de droite de (5.105), la quantité (ln3 pn )2 peut être remplacée par ln3 pn . Iwaniec (1978) a montré que la fonction de Jacobsthal vérifie

j(n) ≪ ω(n)2 (ln{2ω(n)})2

(n  2).

E XERCICES

288. Pour ε > 0, y  2, on pose Lε (y) := exp (ln y)(3/5)−ε . (a) Montrer, par application du théorème des nombres premiers sous une forme forte, que l’on a pour chaque ε > 0 et uniformément pour y  2, σ > 0, 

1   y  ln p dt = 1 + O + O(1). σ σ p −1 Lε (y) 3 /2 t − 1 py

[On pourra intégrer par parties la contribution à la somme en p du reste R(t) := ϑ (t) − t, puis considérer séparément les trois cas obtenus en plaçant σ relativement à 12 et 1 − 2 ln Lε (y)/ ln y .] (b) Soit δ > 0. Montrer que l’on a uniformément pour σ  δ   y  y 1 + O 1/Lε (y) dt dt + O(1). = σ −1 −σ σ t 1 − y t 3 /2 1 Montrer que la conclusion persiste pour σ  2(ln2 2y)/ ln y , quitte à remplacer Lε (y) par ln y dans le terme d’erreur. [On pourra utiliser la relation 1/(tσ − 1) = t−σ + O t−2σ /(1 − 2−σ ) , valable pour t  23 .] (c) On suppose maintenant 0 < σ  2/3. Établir les relations  y  y  

ln y   y  −1/6  y dt dt dt dt  . = 1 + O y , = 1 + O σ σ σ σ 1 / 6 √ √ y y t y t −1 3 /2 t − 1 1 t Montrer que



y



y

 dt 1 1 y − ≪ σ . − σ − σ σ 1−t 1−y t (y − 1) ln y

[On pourra utiliser l’inégalité 1 − (y/t)−σ  σ ln(y/t).] (d) Établir la formule suivante, uniforme pour y  2, σ > 0,   ln p 1 + O(E) y dt + O(1) = pσ − 1 1 − y − σ 1 tσ py

avec E ≪δ 1/Lε (y) si σ  δ, et E ≪ 1/ ln y pour tout σ > 0. Montrer que (1 − σ )(1 − y −σ ) ln y ≪ y 1−σ − 1 pour 0 < σ  1 et en déduire la formule (5.12) du § 5.1.

EXERCICES

527

289. Preuve arithmétique de la formule ( ̺ (0) = eγ . (a) Déduire du Théorème 5.1 que l’on a pour x  y  2  1 ≪ e−u/2 ln y . n + n>x, P (n)y

(b) Déduire du Théorème 5.8 que l’on a pour x  y  2  u  1 = ln y ̺ (v) dv + O(u). n 0 n∈S(x,y)

(c) Montrer, grâce à la formule de Mertens, que l’on a pour u  1, y  2,  u 

u + e−u/2 ̺ (v) dv = eγ + O ln y 0

et en déduire, par un choix convenable de u = u(y), que ( ̺(0) = eγ .

 290. Valeur moyenne de ln P + (n). Soit S(x) := nx ln P + (n).  x  (a) Montrer que S(x) = x ln x − (x,y)/y dy + O(ln x). 1

(b) En déduire, par application du Théorème 5.8, que l’on a

S(x) = α x ln x + O(x ln2 x) 



̺ (v) dv ≈ 0,62433. v2 1 (c) Déduire du point (a) et du Théorème 5.17 que l’on a pour tout ε > 0  x

 dy + O x exp − (ln x)(3/8)−ε . S(x) = x ln x − (x,y) y 1

avec α := 1 −

(d) Montrer que l’on a pour |s| < 1  ∞

⌊t⌋  sζ (s + 1) = t−s d t s+1 1−

où l’intégrale est uniformément convergente sur tout compact. En déduire que  x

ln x 

⌊t⌋  =1−γ +O ln t d , t x 1

où γ est la constante d’Euler.

(e) Montrer que  x   x

⌊t⌋  x ∞ ̺ (v) dy =x dv d ln (x,y) 2 y t 1−(ln t)/ ln x v t 1− 1

= (1 − α )x ln x + α (1 − γ )x + O(ln x)

et en déduire la formule asymptotique



 S(x) = α x ln x − α (1 − γ )x + O x exp − (ln x)(3/8)−ε .

528

III.5. ENTIERS FRIABLES. LA MÉTHODE DU COL

 291. Soit δ, 0 < δ < 1, un nombre réel fixé. On pose gδ (n) := p|n (ln p)δ .  (a) Montrer que nx gδ (n) ∼ (x/δ )(ln x)δ (x → ∞).   (b) Soit N (x; λ) :=  n  x : gδ (n)  (λ/δ )(ln x)δ  (λ > 1). Montrer que N (x; λ)  (λ − 1)/λ + o(1) x (x → ∞).  (c) Pour n > 1, on pose αn := ln P + (n) / ln n. Montrer que αn possède une fonction de répartition et la calculer. (d) Montrer que, pour tout n > 1, on a gδ (n)  (αn )δ−1 (ln n)δ−1 g1 (n). En utilisant l’Exercice 266 (p. 477) et la question précédente, montrer que, pour chaque λ > 0, il existe une quantité c(λ,δ ) > 0 telle que N (x; λ)  1 − c(λ,δ ) + o(1) x (x → ∞). (e) Montrer que gδ n’a pas d’ordre normal croissant.

292. Soit Nk (z) la quantité définie au § 5.2.

∞ (a) Calculer F (σ ) := 0− e−σ t dNk (t). (b) Montrer que Nk (z)  ek F (k/z). (c) En déduire la majoration

Nk (z) 

ez k k

exp

k k  k  1 . ai 2z ai i=1

i=1

Pour quelles valeurs de z cette majoration est-elle plus précise que celle du Théorème 5.3 ? 293. Entiers dont le produit des petits facteurs premiers est grand. (a) Montrer en utilisant le grand crible (Corollaire I.4.13) que l’on a pour xy2   x (x,y) :=  n  x : P − (n) > y  ≪ . ln y   ! (b) On pose (x,y ,z) :=  n  x : pν n, py pν > z . Montrer que  (x,y ,z)  (x/a,y) + (x,y). z 0 et uniformément lorsque x  y  2, (x,y) ≪ xu−u + xε . En déduire que, pour chaque ε > 0, on a, uniformément pour x  z  y  2 avec v := (ln z)/ ln y ,(10) (x,y ,z) ≪ε xv −v + xz −1+ε . 10 Une formule asymptotique pour (x,y,z) est donnée dans Tenenbaum (2006) : voir le Théorème 6.23.

EXERCICES

529

294. Posons u := min(u,y/ ln y), uy := u + (ln y)/ ln(u + 1). En faisant appel au Théorème 5.30, montrer que, l’on a, uniformément pour x  y  2,(11) 

1   1 ln n = ln x − + O (x,y) α α uy n∈S(x,y)   ln y + O(ln2 y) (x,y). = ln x − ln(1 + y/ ln x) 295. On conserve la notation uy de l’Exercice 294. En utilisant le Théorème 5.30, montrer que l’on a, uniformément pour x  y  2,(12)

1     1 · (x,y) (n) − ω(n) = 1 + O (x,y;  − ω) := uy pα (pα − 1) n∈S(x,y)

py

En déduire que (x,y;  − ω) → ∞ (x → ∞) (x,y) 2yz(x)

inf

si, et seulement si, z(x)  (ln x)2+o(1) . 296. Entiers friables sans facteur carré. En utilisant le Corollaire 5.19, le Théorème 5.22 et l’estimation (5.13), montrer que l’on a uniformément pour x  y  2, x → ∞,  μ(n)2 = 1/ζ (β1 ) + o(1) (x,y) n∈S(x,y)

avec β1 := max(1,2β (x,y)) où β (x,y) est défini par (5.14).(13)

11

Voir La Bretèche & Tenenbaum (2005a), cor. 2.8. Voir La Bretèche & Tenenbaum (2005a), cor. 2.11. 13 Des résultats plus précis sont établis par Ivic ´ & Tenenbaum (1986), Naïmi (1988). La Bretèche & Tenenbaum (2005a) prouvent la formule uniforme  μ(n)2 = (x,y){1/ζ (2α,y) + O(R)} (x  y  2) 12

n∈S(x,y)

√ avec R := min y (ln y )2 /uy , ln(u + 1)/ u ≪ (ln2 y)/ ln y où u, uy sont définis comme à ! 2α l’Exercice 294 et y := py (1 + 1/p ). Voir également La Bretèche & Tenenbaum (2002).

C HAPITRE

III.6 E NTIERS

SANS PETIT FACTEUR PREMIER

6.1. Introduction Il s’agit ici d’entreprendre l’étude duale de celle du chapitre précédent, c’est-àdire l’évaluation de la quantité   (x,y) := {n  x : P − (n) > y} (x  y  2).

À l’instar de (x,y), cette fonction est d’une utilité constante en théorie analytique et probabiliste des nombres. Elle intervient en particulier de manière fondamentale dans les problèmes de crible. Nous conservons la notation systématique

u :=

ln x ln y

(x  y  2)

introduite au Chapitre III.5. Nous avons vu (Théorème I.4.3) que la méthode de Brun « pure » fournit l’évaluation

1  x  (2  y  x1/10 ln2 x ) (6.1) (x,y) = 1+O ζ (1,y) (ln y)2

alors que le lemme fondamental du crible combinatoire (Théorème I.4.4) donne l’estimation uniforme pour x  y  2   x 1 + O u−u/2 + O (x,y) . (6.2) (x,y) = ζ (1,y)

L’apparition de (x,y) comme terme d’erreur dans l’évaluation de (x,y) n’est pas étonnante. La fonction indicatrice η(n; y) de l’ensemble des entiers n tels que P − (n) > y est en effet multiplicative et peut s’écrire, grâce à la formule d’inversion

6.1. INTRODUCTION

531

de Möbius, (6.3)



η(n; y) =

μ(d)

(n  1).

d|n, P + (d)y

Par sommation sur n  x, il vient  (6.4) (x,y) =

dx, P + (d)y

μ(d) ⌊x/d⌋

(x  y  2).

Le terme principal de (6.2) correspond à la quantité obtenue, à partir de (6.4), par suppression des parties entières et extension de la sommation à l’infini. Il est clair que l’erreur impliquée dans cette manipulation est liée à (x,y). Pour obtenir, selon cette voie, notre premier résultat, nous utiliserons l’évaluation technique suivante concernant le point-selle α (x,y) défini en (5.66) comme la solution unique de l’équation  ln p (6.5) = ln x. pα − 1 py

Nous introduisons à cet effet la notation supplémentaire  u := min u,y/ ln y = min(ln x,y)/ ln y . (6.6) Lemme 6.1. On a uniformément pour x  y  2

y 1 −α − 1 ≍ u. (1 − α ) ln y

(6.7)

Démonstration. La formule (5.12) permet d’évaluer le membre de gauche de (6.5). On obtient

1  y 1 −α − 1  (6.8) u(1 − y −α ) = 1+O . (1 − α ) ln y ln y Maintenant, l’évaluation (5.13), soit

(6.9)

implique

α=

ln y  ln(1 + y/ ln x)  2 1+O , ln y ln y  1 − y −α ≍ min 1,y/ ln x

dès que y est assez grand. En fait, cette estimation persiste pour y borné : on a d’une part, par (6.5), (ln 2)/(2α − 1)  ln x, d’où 1 − y −α  1 − 2−α ≫ 1/ ln x, et d’autre part, par (6.9), 1 − y −α  α ln y ≪ 1/ ln x. On en déduit immédiatement le résultat souhaité en reportant dans (6.8).

⊓ ⊔

Désignons, comme au Chapitre III.5, par ξ (u) l’unique racine réelle non nulle de l’équation (6.10)

eξ = 1 + u ξ

532

III.6. ENTIERS SANS PETIT FACTEUR PREMIER

pour u > 0,u = 1, et posons ξ (1) = 0. Nous pouvons réécrire (6.7) sous la forme (1 − α ) ln y = ξ (bu) avec b ≍ 1. Les estimations (5.48) et (5.60) pour ξ (u) et ξ ′ (u) nous permettent donc de déduire immédiatement du Lemme 6.1 l’évaluation  ln u ln(u + 1) + O(1) (x  y  2). (6.11) α = 1− ln y Théorème 6.2. On a uniformément pour x  y  2  x + O (x,y) . (6.12) (x,y) = ζ (1,y) Remarque. Cette estimation n’est non triviale que pour

y  xc ln3 x/ ln2 x , où c = c(x) → 1. Hors d’une telle région, la formule (6.12) est plus faible que la majoration du crible (cf. Corollaire I.4.13, par exemple) (x,y) ≪

x ln y

(x  y  2).

Démonstration. Ainsi que nous venons de l’observer, nous pouvons supposer u assez grand, de sorte que (6.9) et (6.11) impliquent

(1 − α ) ln y  c0 > 0.

(6.13)

D’après (6.4), le terme d’erreur de (6.12) vaut





dx P + (d)y

μ(d)

DxE d

−x



d>x P + (d)y

avec

M (x,y) :=

μ(d) ≪ (x,y) + x d





∞ x

|M (t,y)|

dt , t2

μ(d).

dx, P + (d)y

En majorant trivialement |M (t,y)| par (t,y), nous obtenons, grâce au Théorème 5.23, un résultat très légèrement inférieur à l’estimation requise. On a en effet  ∞  ∞ (x,y) dt . tα−2 dt ≪ (t,y) 2 ≪ x1−α (x,y) x t 1−α x x

Or, un résultat de l’auteur (1990), également prouvé par la méthode du col, énonce que l’on a

exp{−c u/ ln2 (u + 1)}  1 + exp − (ln y)(3/2)−ε (6.14) M (x,y) ≪ (x,y) ln y

uniformément pour x  y  2. On peut donc certainement diviser par ln y la majoration précédemment obtenue pour l’intégrale en t, et la conclusion requise découle alors de (6.13). ⊓ ⊔

6.2. ÉQUATIONS FONCTIONNELLES

533

6.2. Équations fonctionnelles Comme (x,y) et la plupart des fonctions intervenant dans des problèmes de crible par des nombres premiers, (x,y) possède une équation fonctionnelle. Théorème 6.3. On a pour x  1, y  1,    (6.15) (x,y) = 1 + x/pν ,p . y p. Il suit      (x,y) = 1 + 1=1+ 1, y 1, on déduit de (6.21) que l’on a pour u > 2  u ′ ω′ (t) dt. (6.31) uω (u) = ω(u − 1) − ω(u) = − u−1

Si τ est fini, on obtient pour u = τ   τ ′ ′ τ |ω (τ )|  |ω (t)| dt < τ −1

τ

τ −1

̺ (t) dt = τ ̺ (τ )

d’où |ω′ (τ )| < ̺ (τ ), ce qui est absurde. Donc τ n’est pas fini, et l’on a bien (6.29).

6.3. LA FONCTION DE BUCHSTAB

537

La décroissance rapide de ̺ (u) à l’infini nous permet alors d’écrire pour u > 1  ∞  ∞ ′ −γ ̺ (t) dt. ω (t) dt ≪ ω(u) − e = − u

u

On obtient (6.30) en utilisant le Corollaire 5.14 sous la forme  ∞  ∞ ̺ (u) −̺ ′ (t) dt ≪ . ̺ (t) dt ≪ (6.32) ln(t + 1 ) ln(u + 1) u u

⊓ ⊔

6.3. La fonction de Buchstab L’objet de cette section est d’entreprendre l’étude asymptotique de ω(u) par la méthode du col. Nous obtiendrons ainsi, outre le calcul explicite de la transformée de Laplace  ∞ (6.33) ω ( (s) := e−su ω(u) du, 0

un remarquable renforcement du Théorème 6.6. Par dérivation sous le signe somme, on peut écrire, lorsque σ > 0, /∞ . −su   ∞ d uω(u) 1 ∞ −su e ( (s) = − ω e−su uω(u) du = e d{uω(u)}. − ds s s 0 0 0

Le terme tout intégré est nul. Si δ1 désigne la mesure de Dirac en u = 1, on déduit de (6.21) et (6.22) l’égalité entre mesures ′ d{uω(u)} = δ1 + uω(u) du = δ1 + ω(u − 1) du. Après le changement de variables (u − 1) → u, nous obtenons

d e−s ( (s) = − 1+ω ( (s) ω ds s

d’où l’on déduit que 1 + ω ( (s) = CeJ(s) pour une constante convenable C , avec  ∞ −s−t e dt. J(s) := s+t 0 Le Corollaire 5.9 montre alors que (6.34)

et en particulier que

1+ω ( (s) =

C s( ̺(s)

lim ω ( (s) = C − 1,

s→+∞

∞ puisque s( ̺(s) = 0 ̺ (u/s)e−u du → ̺ (0) = 1 quand s → +∞. Or, il découle clairement de (6.23) que ω ( (s) → 0 lorsque s → +∞. On a donc C = 1, et nous pouvons énoncer le résultat suivant.

538

III.6. ENTIERS SANS PETIT FACTEUR PREMIER

Théorème 6.7. La fonction ω ( (s), définie par (6.33) pour σ > 0, est prolongeable en une fonction méromorphe sur C, donnée explicitement par la formule 1 (s = 0). (6.35) 1+ω ( (s) = s( ̺(s)

Lorsque s n’est pas réel négatif, on a

1+ω ( (s) = eJ(s) .

(6.36)

Remarques. (i) On peut établir (6.35) de manière purement arithmétique en utilisant les estimations élémentaires de (x,y) et (x,y) déduites des équations fonctionnelles (Théorèmes 6.4 et 5.8) et la dualité naturelle entre ces quantités : voir l’Exercice 297. (ii) Inversement, on peut utiliser (6.35) pour retrouver analytiquement que limu→∞ ω(u) = e−γ , ce que nous avions établi au Corollaire 6.5 grâce à la formule de Mertens. Pour cela, observons que (6.35) implique

lim s( ω(s) = 1/( ̺(0) = e−γ .

s→0+

Compte tenu de la positivité de ω, le théorème de Karamata (Théorème II.7.5) fournit l’évaluation  u (u → ∞). ω(t) dt = e−γ + o(1) u 0

Or, il découle de (6.21) et (6.23) que uω′ (u) ≪ 1. Pour une fonction ε(u) → 0 convenable et tout h, 0 < h  u, nous obtenons donc d’une part 

1 u+h u ω(t) dt = e−γ + O ε(u) h u h et d’autre part  

h 1 u+h h  1 u+h dt = ω(u) + O ω(t) dt = ω(u) + O . h u h u u u  Il suffit donc de choisir h = u ε(u).

Il est facile de déduire de l’équation différentielle aux différences (6.21)–(6.22) satisfaite par la fonction de Buchstab que celle-ci est, pour chaque entier j  0, de classe Cj sur R{1,2, . . . ,j+ 1}. Aux points exceptionnels, les dérivées successives possèdent des discontinuités de première espèce, et nous convenons de définir ω(j) (u) sur R tout entier en effectuant le prolongement par continuité à droite. En particulier, ω′ (u) est à variation bornée sur tout intervalle borné. Associée à la décroissance rapide à l’infini (Théorème 6.6), cette propriété suffit à impliquer la convergence (vers la valeur ω′ (u)) de l’intégrale de Laplace inverse pour u = 1 ou 2, et cela quelle que soit l’abscisse d’intégration. Nous pouvons donc utiliser la méthode du col pour évaluer ω′ (u) à l’infini. Nous obtenons le résultat suivant, dans l’énoncé duquel nous utilisons la notation H(u) := exp u/ ln2 (u + 2) (u  0).

6.3. LA FONCTION DE BUCHSTAB

539

Théorème 6.8. Il existe une constante absolue positive a telle que l’on ait ω(u) − e−γ

(6.37)

ω′ (u)

≪ ̺ (u)H(u)−a

(u  0).

Démonstration. Nous pouvons supposer u > 2. Observons d’abord que la seconde majoration implique facilement la première puisque  ∞ −γ ω(u) − e = − ω′ (t) dt. u

On conclut alors en utilisant la décroissance de H(u)−a et l’estimation (6.32). Soit h(s) la transformée deLaplace de ω′ (u). Comme nous l’avons déjà remarqué, on a  κ +i∞ 1 (6.38) ω′ (u) = h(s)eus ds (u > 2) 2π i κ −i∞ pour tout nombre réel κ. On a

h(s) = s( ω(s) − e−s

(6.39)

où le second terme provient de la discontinuité de ω(u) en u = 1. En tenant compte de (6.35), il suit

h(s) = ( ̺ (s)−1 − e−s − s.

(6.40)

Rappelons que ̺ (s) = e (

γ +I(−s)

I(s) :=



0

s

ev − 1  dv . v

En accord avec les principes de la méthode du col, et en négligeant temporairement l’influence du terme −e−s − s dans ce calcul, il faut donc choisir l’abscisse d’intégration κ de façon que l’une au moins des solutions complexes de l’équation (6.41)

e−s = 1 + su

soit d’abscisse κ. Contrairement à la situation que nous avons rencontrée pour la fonction de Dickman, l’équation au point-selle (6.41) ne possède pas ici de solution réelle non triviale. Nous allons voir cependant que, pour u assez grand, elle possède une solution dont la partie réelle est proche de −ξ (u). Opérons en effet le changement de variables s = −ξ (u) + iπ − z dans (6.41). On obtient (6.42)

z λ(z) = w

avec

ez − 1  − u, λ(z) := (1 + uξ ) z

w := −iπ u − 2.

Puisque ξ (u) ∼ ln u (u → ∞) — cf. Lemme 5.11 — on voit qu’il existe une constante absolue positive u0 telle que  |z λ(z)| > |w| |z| = 2π / ln(u + 1), u > u0 .

540

III.6. ENTIERS SANS PETIT FACTEUR PREMIER

Comme λ(z) ne s’annule pas pour |z| < 2π / ln(u + 1), u > u0 , cela implique, d’après le théorème de Rouché, que l’équation (6.42) possède dans ce disque une solution unique. Le théorème de Lagrange précise d’ailleurs que cette solution est une fonction analytique de w dont on peut calculer explicitement les coefficients de Taylor — voir par exemple Whittaker & Watson (1927), § 7.32. Nous n’utilisons pas ici ce dernier renseignement. Nous pourrions effectuer le calcul de l’intégrale (6.38) en choisissant précisément κ = −ξ (u) − ℜe z . Cela conduirait à un résultat légèrement plus précis que (6.37) — voir les Notes. Nous nous contentons cependant ici d’opérer le choix plus simple κ = −ξ (u), qui est heuristiquement justifié par le fait que (6.42) possède une solution tendant vers 0 lorsque u → ∞. Cela nous permettra d’utiliser les estimations obtenues au Chapitre III.5 pour ( ̺(s) sur la droite σ = −ξ (u). Posons donc, pour toute la suite de cette démonstration, κ = −ξ (u). Nous considérons dans un premier temps la contribution à (6.38) du domaine |τ | > eξ . De l’évaluation

e−s  1 e−s +O (τ = 0), J(s) = 1− s s |τ |3

on déduit de (6.39) et (6.36) que l’on a pour s = −ξ (u) + iτ , |τ | > eξ , 

e3ξ  1 2 1  e −2 s e−s + − s − e−s +O 1− 1− h(s) = s 1 + s s 2s2 s |τ |3

e3ξ  e−s e −2 s =− + +O 2 . iτ 2iτ τ En utilisant la seconde formule de la moyenne, on peut estimer l’intégrale relative aux termes principaux ; en évaluant la contribution du terme résiduel de manière évidente, on obtient que la contribution à (6.38) du domaine |τ | > eξ est

≪ e−uξ +2ξ ≪ ̺ (u)e−u/2

où la seconde estimation découle du Théorème 5.13. Pour évaluer la contribution complémentaire, nous utilisons la forme (6.40) de h(s). Nous allons montrer que, pour une constante positive convenable a, on a ̺ (s)−1 ≪ ̺ ( ((−ξ )H(u)−2a

(6.43)

(σ = −ξ , |τ |  eξ ).

Admettant momentanément cette majoration, il suit  ̺ (−ξ )H(u)−2a + eξ ≪ ̺ (u)H(u)−a , h(s)esu ds ≪ e−uξ +ξ ( |τ |eξ

grâce au Théorème 5.13.

Il reste à établir (6.43), c’est-à-dire (en posant T := u/ ln2 (u + 1)) (6.44) ℜe I(ξ + iτ ) + I(ξ )  2aT + O(1) (|τ |  eξ ).

6.4. APPROXIMATIONS DE (x, y) PAR LA MÉTHODE DU COL

541

Le membre de gauche vaut  1  dv  evξ 1 + cos(τ v) − 2 v 0  1  12   2 dv + dv evξ 1 + cos(τ v) − 1 − cos(τ v) − 1 v v 0 2 . vξ  14 τ

ev(ξ +iτ ) /1 e 2 dv = −2 + + ℜe − ln 4 (sin v) v ξ ξ + iτ 1 0 2

 u  1  cos λ  +O +  O ln(1 + τ 2 ) + eξ ξ ξ ξ2 + τ2

où l’on a posé λ := τ − Arctan(τ /ξ ). Il existe une constante absolue τ0 telle  que cos λ  0 pour |τ |  τ0 . La minoration précédente est alors  u + O( u/ξ ). Lorsque |τ | > τ0 , elle est

1 

 u 

 u  1 eξ ≫ ≫ T + O(1). + O  eξ + O − ξ ξ ξ3 ξ ξ 2 + τ02

⊓ ⊔

Cela établit (6.44) et complète la preuve du Théorème 6.8. Corollaire 6.9. Soit j un nombre entier  1. On a (6.45)

ω(j) (u) ≪ ̺ (j) (u)H(u)−a

(u → ∞).

Démonstration. L’équation (6.21) et notre convention de prolonger ω et toutes ses dérivées par continuité à droite permettent d’écrire, après j dérivations, (6.46)

uω(j+1) (u) = ω(j) (u − 1) − (j + 1)ω(j) (u)

(u ∈ R).

Cela implique (6.45) par récurrence sur j en utilisant le Corollaire 5.14 sous la forme ̺ (j) (u − 1) ≪ ̺ (u − 1) lnj (u + 1) = −u̺ ′ (u) lnj (u + 1) (u  1) ≪ u̺ (u) lnj+1 (u + 1) ≪ u̺ (j+1) (u). ⊔ ⊓

6.4. Approximations de (x, y) par la méthode du col Comme sa duale (x,y), la fonction (x,y) peut être estimée par la méthode du col, à partir de son intégrale de Perron. Toutefois, deux différences sont à noter d’emblée. D’une part, la série de Dirichlet associée ζ (s)/ζ (s,y) possède maintenant un pôle en s = 1 ; le choix optimal de l’abscisse d’intégration sera de ce fait subordonné à un emploi préalable du théorème des résidus. D’autre part, il ne s’agit plus ici de déterminer le comportement asymptotique de la fonction étudiée, mais d’estimer son terme d’erreur relativement à un terme principal élucidé — cf. Théorème 6.4. Nous conservons, pour toute cette section, certaines notations du Chapitre III.5, comme le domaine  (5/3)+ε   y  x, (Hε ) x > x0 (ε), exp ln2 x

542

III.6. ENTIERS SANS PETIT FACTEUR PREMIER

et la fonction

Lε (y) := exp (ln y)(3/5)−ε .

(6.47)

Nous introduisons également les notations suivantes (6.48) Yε := exp (ln y)(3/2)−ε , E(x,y) := H(u)−c Lε (y)−1 + Yε−1 , (6.49)

μy (u) :=





0

ω(u − v)y −v dv ,

W (x,y) := xμy (u)

eγ ln y . ζ (1,y)

La lettre c, avec ou sans indice, désigne une constante absolue positive. L’objet essentiel de cette section consiste à établir le résultat suivant. Théorème 6.10. Soit ε > 0. On a pour x  y  2  (x,y) E(x,y) (dans le domaine Hε ) (6.50) (x,y) − W (x,y) ≪ (x,y) (hors de Hε ). Commençons par démontrer la seconde majoration. C’est une conséquence facile du lemme suivant. Lemme 6.11. Soit δ > 1. On a uniformément pour x  y  2   μy (u)eγ ln y − 1 ≪ ̺ (u)H(u)−c1 + x−1 (eδ u + y). (6.51)

Admettons un instant cette estimation. Grâce au Théorème 5.27, on a

x̺ (u)H(u)−c1 ≪ (x,y)H(u)−c1 /2 . De plus, il est facile de constater que l’approximation Z , du Théorème 5.2, pour ln (x,y) satisfait à

y ln x  y  ln 1 + +  u ln 4 Z := u ln 1 + ln x ln y y et aussi à

Z  12 u + ln y + O(1) Pour 1 < δ < ln 4 −

1 , 3

(u  2).

on a donc

y + eδ u ≪ (x,y)e−u/3 .

En reportant dans (6.51), on obtient ainsi (x,y) x ≪ H(u)−c1 /2 (6.52) W (x,y) − ζ (1,y) ln y La seconde des majorations (6.50) découle de cette estimation et du Théorème 6.2. Preuve du Lemme 6.11. Une banale intégration par parties permet d’écrire  ∞ y ω′ (u − v)y −v dv , (6.53) μy (u) ln y = ω(u) − − x 0 où le second terme du membre de droite est produit par la discontinuité de ω(u) en u = 1.

6.4. APPROXIMATIONS DE (x, y) PAR LA MÉTHODE DU COL

543

Compte tenu de la majoration du Théorème 6.8 pour ω(u) − e−γ , il suffit, pour prouver (6.51), de montrer que l’on a pour x  y  2  ∞  ′  ω (u − v)y −v dv ≪ ̺ (u)H(u)−c1 + eδ u x−1 . (6.54) 0

Observons d’abord que l’on a, pour chaque ε > 0,

H(u − v)−a ≪ε H(u)−a eεv

(0  v  u)

où a est la constante absolue du Théorème 6.8. Posons yε := ye−ε . Nous obtenons donc, grâce au Théorème 6.8,  ∞  ∞  ′  −v −a   (6.55) ω (u − v) y dv ≪ε H(u) ̺ (u − v)yε−v dv . 0

0

Soit λ un paramètre  1. On peut réécrire la dernière intégrale sous la forme  u  ∞  −u  −u t −u yε ̺ (t)yε dt  yε ̺ ( − ln(yε /λ) . ̺ (t)yεt λu−t dt = yε /λ 0

0

Si yε  e , on peut choisir λ = yε e−ξ (u) ; compte tenu du Théorème 5.13, on obtient que le membre de gauche de (6.55) est  ≪ε H(u)−a e−uξ (u) ̺ ( − ξ (u) ≪ H(u)−a/2 ̺ (u). ξ (u)

La relation (6.54) est donc satisfaite dans ce cas.

Lorsque yε < eξ (u) , on fait appel à la majoration (6.29) du Théorème 6.6 pour |ω (u)|. Le membre de gauche de (6.55) est au plus égal à  ∞  u ̺ (u − v)y −v dv = ̺ (t)y t−u dt  y −u ( ̺ (− ln y) = y −u eγ +I(ln y) . ′

0

0

 Puisque I(ln y) ∼ y/ ln y lorsque y → ∞ et I ε + ξ (u) ∼ eε u lorsque u → ∞, on a certainement dans le domaine considéré eγ +I(ln y) ≪ eδ u

dès que ε = ε(δ ) est assez petit. Cela achève la preuve de (6.54) et complète la démonstration du Lemme 6.11. ⊓ ⊔ Nous tournons maintenant notre attention sur la première des majorations du Théorème 6.10, relative au domaine (Hε ). Par la formule de Perron, on a pour tout nombre réel κ > 1  κ +i∞ ζ (s)xs 1 ds (x ∈ / Z+ ). (6.56) (x,y) = 2π i κ −i∞ ζ (s,y)s Le résidu en s = 1 vaut x/ζ (1,y). L’intégrande est une fonction holomorphe de s pour s = 0 ou 1, et tend vers 0 lorsque |τ | → ∞ dans toute bande 0 < σ0  σ  1. On peut donc déplacer l’abscisse d’intégration vers la gauche jusqu’à σ = α0 := 1 −

ξ (u) . ln y

544

III.6. ENTIERS SANS PETIT FACTEUR PREMIER

On obtient (6.57)

(x,y) =

1 x + ζ (1,y) 2π i



α0 +i∞

α0 −i∞

ζ (s)xs ds. ζ (s,y)s

Le Lemme 5.16 et le Théorème 6.7 nous permettent d’approcher, lorsque |τ |  Lε (y), l’intégrande de (6.57) par  ( (z) xeuz 1 + ω z := (s − 1) ln y . 1 + z/ ln y

En négligeant momentanément l’influence du domaine |τ | > Lε (y) sur l’intégrale de (6.57), nous obtenons l’approximation heuristique de (x,y)  −ξ (u)+i∞ x 1+ω ( (s) us x (6.58) W1 (x,y) := + e ds. ζ (1,y) 2π i −ξ (u)−i∞ s + ln y

Nous verrons plus loin que cette intégrale est effectivement convergente. D’après le Théorème 6.7, ω ( (s) possède un pôle simple en s = 0, de résidu e−γ . En déplaçant maintenant vers la droite l’abscisse d’intégration de (6.58) jusqu’à σ = κ > 0, il vient  κ +i∞ 1+ω ( (s) us xe−γ x x − + e ds. (6.59) W1 (x,y) = ζ (1,y) ln y 2π i κ −i∞ s + ln y  Or, 1 + ω ( (s) /(s + ln y) est la transformée de Laplace de la fonction  ∞ t → y −t + ω(t − v)y −v dv 0

qui est continue et à variation bornée sur tout intervalle borné. Le théorème d’inversion de Laplace — cf. Widder (1946), th. II.7.3 — fournit donc la formule explicite   1 e−γ − + μy (u) . (6.60) W1 (x,y) = 1 + x ζ (1,y) ln y Maintenant, nous observons que le Lemme 6.11 implique, dans le domaine (Hε ),

1 e−γ  − 1 − μy (u)eγ ln y W1 (x,y) − W (x,y) = 1 + x ζ (1,y) ln y (6.61)

≪ x̺ (u)H(u)−c1 Lε (y)−1 ≪ (x,y)E(x,y).

Cette différence est de l’ordre du terme d’erreur annoncé dans (6.50). Nous pouvons donc regarder W (x,y) comme l’approximation naturelle, issue de la méthode du col, pour (x,y). Il reste à mettre en place rigoureusement le raisonnement ébauché cidessus. Nous utiliserons à plusieurs reprises l’estimation suivante, qui découle du Théorème 5.13, du Lemme 5.16, et du Corollaire 5.19. On a, uniformément dans (Hε ), √ (6.62) xα0 ζ (α0 ,y) ≍ (x,y) u ln y .

6.4. APPROXIMATIONS DE (x, y) PAR LA MÉTHODE DU COL

545

Posons L := Lε/2 (y). Nous allons établir les trois estimations suivantes  ζ (s)xs ds ≪ (x,y)E(x,y), (6.63) σ =α0 ζ (s,y)s |τ |>L

1 L

(6.64)

(6.65)

x





σ =α 0 |τ |L

σ =−ξ |τ |>L

 ζ (s)xs     ds ≪ (x,y)E(x,y),  ζ (s,y)s

1+ω ( (s) us e ds ≪ (x,y)E(x,y). s + ln y

Cela suffit pleinement à établir le Théorème 6.10 : la majoration (6.63) permet de tronquer l’intégrale (6.56), la majoration (6.64) permet de négliger le terme d’erreur créé en utilisant le Lemme 5.16 (approximation régulière de ζ (s,y)), et la majoration (6.65) permet d’étendre jusqu’à l’infini l’intégrale obtenue en remplaçant ζ (s,y) par son approximation régulière. Le point le plus difficile est l’estimation (6.63). Nous aurons besoin des deux résultats auxiliaires suivants. Lemme 6.12. Pour (x,y) dans (Hε ), s = α0 + iτ , on a  

1 c2 τ 2 u  | (6.66) ζ (s,y) ≪ ζ (α0 ,y) exp − , τ |  Y ε (1 − α0 )2 + τ 2 ln y (6.67)

ζ (s,y)−1 ≪ ζ (α0 ,y)H(u)−c2

(|τ |  Yε ).

Démonstration. Montrons d’abord (6.66). Un calcul facile montre que    1 − p −α 0    1 − cos(τ ln p)  2 1 − cos(τ ln p) −1/2   =  exp − (6.68) 1 +   1 − p−s pα0 (1 − p−α0 )2 pα 0 d’où

|ζ (s,y)|ζ (α0 ,y)−1  e−X , avec X :=

 1 − cos(τ ln p) . pα 0

py

Nous devons minorer X . On a (6.69)

X ln y  A(α0 ) − ℜe A(α0 + iτ ) + O(1)

avec

A(s) :=

 (n) . ns

ny

Le terme d’erreur de (6.69) prend en compte la contribution des entiers n non premiers dans A(s).

546

III.6. ENTIERS SANS PETIT FACTEUR PREMIER

La formule de Perron effective (Corollaire II.2.4) permet d’écrire 

ln y  yw −1 κ +iT ζ ′ dw + O α0 (s + w) A(s) = 2π i κ −iT ζ w y

avec κ := 1 − α0 + 1/ ln y , T := Yε2 . On déplace le segment d’intégration jusqu’à ℜe w = 1 − α0 − (ln T )−(2/3)−ε/10, de sorte que le point s + w reste constamment dans la région sans zéro de Vinogradov. Le seul pôle traversé est le point w = 1 −s. La contribution du segment vertical est   ln y ≪ y 1−α0 exp − (ln y)ε/2 ≪ (ln T )2 y 1−α0 exp − ( 2 / 3 )+ ε / 10 (ln T )

et l’on vérifie sans peine que la même majoration est valable pour la contribution des segments horizontaux. Nous obtenons ainsi

 y 1−s + O y 1−α0 exp − (ln y)ε/2 . A(s) = 1−s

En reportant dans (6.69), il vient

 1 − α0  y 1 −α 0 + O y 1−α0 exp − (ln y)ε/2 X ln y  ℜe 1 − 1 − α0 1−s et donc

X

 uτ 2 eξ (u) τ 2 + O exp ξ (u) − (ln y)ε/2 ≫  , (1 − α0 )2 + τ 2 ξ (u) (1 − α0 )2 + τ 2

puisque l’on a pour |τ |  1/ ln y (6.70)

τ2 1 1  ≫ 2 . 2 2 2 (1 − α0 ) + τ ξ (u) + 1 ln y

Cela établit bien (6.66). La preuve de (6.67) est analogue. Le point de départ est       cos(τ ln p) 1/2 (1 − p−s )(1 − p−α0 ) = 1 − p−2α0 1 − 2 1 +  2 p α 0 1 + p −α 0  1 + cos(τ ln p)  ,  exp − 4pα0

d’où

 1 + cos(τ ln p)   ζ (s,y)ζ (α0 ,y)−1  e−V /4 , avec V := · pα 0 py

Lorsque |τ | > 1/ ln y , la minoration établie pour X vaut encore pour V : il suffit de considérer A(α0 ) + ℜe A(α0 + iτ ). Compte tenu de (6.70), on a bien (6.67) dans ce cas. Lorsque |τ |  1/ ln y , on peut écrire

V 

1 + cos 1  ln p y 1 −α 0 − 1 = u. ≫ ln y pα 0 (1 − α0 ) ln y py

Cela complète la preuve du Lemme 6.12.

⊓ ⊔

6.4. APPROXIMATIONS DE (x, y) PAR LA MÉTHODE DU COL

547

Lemme 6.13. Soit ε > 0. On a uniformément pour (x,y) dans (Hε ) et 1  z  Yε  √ (6.71) x + x/z ,y − (x,y) ≪ (x,y) u ln y 1/z + e−c3 u .

Démonstration. Nous procédons comme au Corollaire 5.20. Posant  +∞  τ  + 1 sin tz 2 1   w(t) := w(t)eiτ t dt = , w( ( τ ) := 1−  , 2π tz 2z 2z −∞

on voit que le membre de gauche de (6.71) est

≪ ≪



P + (n)y

 α0 +2iz

x α0 x  1 = w ln ζ (s,y)xs w( ( τ ) ds n n 2π i α0 −2iz

  1 α0 x ζ (α0 ,y) + xα0 max ζ (α0 + iτ ,y). z 1|τ |2z

Le résultat annoncé découle donc de (6.66) et (6.62). Preuve de (6.63). Posons ⎧ L ⎪ ⎪ ⎪ ⎪ ⎨ (6.72) T := Lec4 u ⎪ ⎪ ⎪ ⎪ ⎩ Yε/3

si

⊓ ⊔

1  u  (ln y)3(1−ε)/5,

si (ln y)3(1−ε)/5 < u  (ln y)(3−ε)/2, si (ln y)(3−ε)/2 < u  Lε (y),

où c4 est une constante absolue convenable. Lorsque T = L — c’est-à-dire lorsque  3(1−ε)/5 u > ln y —, on a d’après (6.67), en estimant ζ (s) par le Théorème II.3.9,  T 1 −α 0 ζ (s)xs ds ≪ xα0 ζ (α0 ,y)H(u)−c2 ≪ (x,y)E(x,y) ζ (s,y)s (1 − α0 )2 σ =α 0 LT

est également de l’ordre de grandeur de la majoration précédente. La forme rudimentaire de l’équation fonctionnelle approchée de la fonction zêta énoncée au Théorème II.3.5 permet d’écrire pour s = α0 + iτ

1   1 +O . (6.73) ζ (s) = s n |τ |α0 n|τ |

Il suit (6.74)

 ζ (s) = ζ (s,y)



n|τ | P (m)y

ζ (α ,y)  μ(m) 0 . + O (mn)s |τ |α0

548

III.6. ENTIERS SANS PETIT FACTEUR PREMIER

La contribution à R du terme résiduel de (6.74) est  ∞ xα0 ζ (α0 ,y) dτ α0 √ ≪ ≪ x ζ (α0 ,y) ≪ (x,y)E(x,y), τ 1 +α 0 T T où nous avons de nouveau fait appel à (6.62). La première formule de Perron effective, sous la forme de la majoration (2.7) permet d’écrire, uniformément pour z > 0,  zs z α0 ds ≪ . 1 + T | ln z| σ =α 0 s |τ |>T

La contribution à R du terme principal de (6.74) peut donc être estimée comme suit 

x s ds   μ(m) mn s σ =α 0 + n1 P (m)y

(6.75)

|τ |max(T ,n)







n1 P + (m)y

(x/mn)α0 . 1 + (T + n)| ln(x/mn)|

La contribution à (6.75) des couples (m,n) tels que | ln(x/mn)| > 1 est  1 xα0 ζ (α0 ,y) √ ≪ ≪ xα0 ζ (α0 ,y) ≪ (x,y)E(x,y). α n 0 (T + n) T n1 Pour traiter l’ensemble complémentaire, c’est-à-dire les couples (m,n) tels que | ln(x/mn)|  1, il est utile de garder à l’esprit que T  xε dès que x, et donc y , est assez grand. Nous désignons par S1 ,S2 les contributions respectives correspondant aux conditions supplémentaires m  x/T , m > x/T . On a d’une part, avec la notation (5.1),     1 ln ex/m S1  ≪ 1 + |n − x/m| m∈S(x/T ,y) m∈S(x/T ,y) x/em L). s Cela montre la semi-convergence de l’intégrale de (6.65). La seconde formule de la moyenne nous permet d’écrire  

uξ (u) + ln y  1+ω ( (s) us eus  e ds = ds ≪ e−uξ L−1 . 1+O s + ln y s s σ =−ξ σ =−ξ 1+ω ( (s) = 1 + O

|τ |>L

|τ |>L

Puisque le Théorème 5.13 et le Corollaire 5.19 nous permettent d’écrire dans le domaine (Hε ) (x,y) ≫ xe−uξ eu/2 , nous obtenons bien l’estimation requise (6.65). Cela achève la démonstration du Théorème 6.10. Corollaire 6.14. Soit ε > 0. Pour (x,y) dans (Hε ), on a  x̺ (u)  −c5 x ≪ H u (6.76) (x,y) − + Yε−1 ζ (1,y) ln y Démonstration. Cela découle immédiatement de (6.50) et (6.52). Corollaire 6.15. Soit ε > 0. Pour (x,y) dans (Hε ), on a    eγ x̺ (u)  −c6 −1 +O + Yε . (6.77) (x,y) = xω(u) − y H(u) ζ (1,y) ln2 y

⊓ ⊔

550

III.6. ENTIERS SANS PETIT FACTEUR PREMIER

Démonstration. Le terme résiduel de (6.77) est compatible avec la première majoration de (6.50). Il suffit donc de montrer que (6.77) est valable en remplaçant (x,y) par W (x,y). D’après (6.53), on a  ∞  eγ xeγ − ω′ (u − v)y −v dv . W (x,y) = xω(u) − y ζ (1,y) ζ (1,y) 0

Par (6.55), avec ε = 1, et le Corollaire 5.15, la dernière intégrale est  ∞  1+ξ (u) v e H(u)−a ̺ (u) −a ≪ H(u) ̺ (u) dv ≪ y ln y 0 √ 1+ξ (u) puisque, dans (Hε ), on a par exemple e  y dès que x, et donc y , est assez grand. Cela implique bien (6.77). ⊓ ⊔ Corollaire 6.16. On a uniformément pour x  2y  5

e−u/3  eγ xω(u) − y  1+O . (6.78) (x,y) = ζ (1,y) ln y Démonstration. On vérifie sans peine que xω(u) − y ≫ x sous les hypothèses indiquées. Le résultat est donc (largement) impliqué par (6.77) lorsque (x,y) est dans (Hε ). Dans le cas contraire, on déduit de (6.53) et (6.54) que

 eγ xe−u/3 ≪ (x,y) ≪ W (x,y) − xω(u) − y ζ (1,y) (ln y)2

où la dernière estimation découle du Théorème 5.1. Cela fournit bien le résultat annoncé. ⊓ ⊔

6.5. Le modèle de Kubilius Ces dernières années, l’importance, en théorie des nombres, de la dualité entiers friables/entiers criblés n’a cessé de croître, tant en raison des méthodes théoriques nouvelles où la décomposition canonique associée joue un rôle essentiel, que par les applications fondamentales aux problèmes de factorisation. Les applications algorithmiques sont liées au fait que les entiers friables sont précisément ceux pour lesquels une factorisation peut être facilement obtenue : il n’est nécessaire d’essayer que les petits nombres premiers. L’incidence des nombres friables dans les problèmes arithmétiques provient notamment du développement des techniques de crible. Nous avons précédemment mentionné(1) la preuve élémentaire de Daboussi (1984) pour le théorème des nombres premiers où la décomposition n = ab avec

P + (a)  y < P − (b) avec y fixé est exploitée non trivialement. 1

Voir les notes sur le § 5.1.

6.5. LE MODÈLE DE KUBILIUS

551

De nombreux développements de la méthode du cercle, notamment ceux dûs à Vaughan & Wooley(2) reposent largement sur les propriétés des entiers friables, qui sont choisis comme ensembles de sommations de sommes d’exponentielles. Les bonnes propriétés de répartition des diviseurs des entiers friables (par exemple dj+1  ydj si dj et dj+1 sont deux diviseurs consécutifs d’un entier y -friable n) permettent de contrôler les nombres de solutions de certaines équations diophantiennes, qui sont à leur tour interprétés comme des normes-Lp de sommes d’exponentielles. Les résultats obtenus à l’aide de la méthode du col sur les fonctions de crible (x,y) et (x,y) ont également des applications en théorie probabiliste des nombres. Nous nous proposons ici d’en décrire une, de nature fondamentale. Soient n ∈ N∗ , n := {1,2, . . . ,n} et Ty la tribu des événements de n définis par des conditions de divisibilité relatives aux puissances de nombres premiers pj pour p  y . Les événements Ty -mesurables de n sont les réunions d’ensembles de la forme

Ea := {m  n : m = ab, P − (b) > y}

(P + (a)  y).

Pour la mesure empirique uniforme νn sur n , on a donc 1 n  (P + (a)  y). νn (Ea ) = ,y n a

Un modèle probabiliste de (n ,νn ,Ty ) est obtenu en se donnant, sur un ensemble abstrait , π (y) partitions 6 = ωp,j (p  y) j0

Ty∗

et la tribu engendrée par les intersections finies d’ensembles ωp,j . On mime alors Ea , pour P + (a)  y , par Ea∗ := ∩pj a ωp,j et l’on compare νn à la mesure de probabilité Py définie sur  par (6.79)

Py (ωp,j ) = (1 − 1/p)p−j

(p  y , j ∈ N)

avec la condition que ωp,j et ωq,k sont indépendants si p = q . On peut donc associer à toute partie Ty -mesurable E de n une partie Ty∗ -mesurable E ∗ de  définie par la formule 6 E ∗ := Ea∗ . Ea ⊂E

La jauge de Kubilius K(n,y) est une mesure de l’écart entre les espaces probabilisés (n ,νn ,Ty ) et (,Py ,Ty∗ ). Elle est définie par (6.80)

K(n,y) := sup |νn (E) − Py (E ∗ )|, E∈Ty

d’où, par (6.79), en écrivant E = ∪a∈A Ea     1 n  1   ,y − K(n,y) = sup  ·   n a a ζ ( 1, y) A⊂S(∞,y) a∈A

2

Voir, par exemple, le chap. 12 de Vaughan (1997).

552

III.6. ENTIERS SANS PETIT FACTEUR PREMIER

On peut se contenter de prendre le supremum sur les ensembles A pour lesquels νn (E) − Py (E ∗ )  0 : l’ensemble complémentaire est obtenu en changeant A en A := S(∞,y)  A, ce qui change seulement le signe de la quantité considérée. Ainsi, K(n,y) peut être approché avec une précision arbitraire par une quantité du type   1 n  1 · ,y − n a aζ (1,y) a∈A

Cette expression est clairement maximale lorsque A := a ∈ S(∞,y) : (n/a,y)  n/(aζ (1,y)) ,

ce qui montre incidemment que le supremum dans (6.80) est atteint. Il suit +   1 n  1 K(n,y) = ,y − n a aζ (1,y) P + (a)y       1 n  1  1 n  1 1  = 2  n a ,y − aζ (1,y)  + n a ,y − aζ (1,y) , + P (a)y

et donc, pour tous n ∈ N, y  1, (6.81)

K(n,y) =

1 2



P + (a)y

 1 n  1   ·  ,y − n a aζ (1,y)

La version classique du « lemme fondamental » du modèle de Kubilius, due à Kubilius (1956), Barban & Vinogradov (1964) et Elliott (1979) énonce que, notant u := (ln n)/ ln y , on a (6.82)

K(n,y) ≪ u−u/8 + n−1/15 .

Il est remarquable que le seuil à partir duquel K(n,y) tend vers 0, soit y = no(1) coïncide avec celui où la constante de Turán–Kubilius friable tend vers 1 — voir (5.125). Chacun de ces deux phénomènes traduit une forme spécifique d’indépendance asymptotique des conditions de divisibilité modulo les puissances de « petits » nombres premiers. Les approximations pour (x,y) et (x,y) issues de la méthode du col permettent d’obtenir une meilleure estimation de K(n,y). Le résultat s’exprime en partie à l’aide de la fonction  1 |ω(v) − e−γ |̺ (u − v) dv + 21 ̺ (u). (6.83) (u) := 2 R

Cette quantité a été introduite par Arratia & Stark (1997), qui ont prouvé que, pour chaque u fixé, on a limy→∞ K(y u ,y) = (u). On peut montrer que (6.84)

3

(u) = ̺ (u)2u+o(u)

(u → ∞),(3)

Une évaluation plus précise est donnée par Tenenbaum (1999).

6.5. LE MODÈLE DE KUBILIUS

553

donc (u) tend très vite vers 0 : en particulier, (u) ≪ u−u

(u  1).

L’énoncé suivant a été obtenu par l’auteur (1999). Théorème 6.17. Soient n ∈ N, y ∈ R tels que n  y  2. Pour chaque ε > 0, nous avons (6.85)

K(n,y) ≪ε ̺ (u)2(1+ε)u + n−1+ε

où l’on a posé u := (ln n)/ ln y . De plus, pour chaque ε > 0, la relation (6.86)

 

ln(u + 1) + 2−u ln y  ̺ (u/2)2 2 +O K(n,y) = (u) 1 + O ln y exp{(ln y)3/2−ε }

a lieu uniformément dans le domaine

(Hε )

n  3,

exp{(ln2 n)5/3+ε }  y  n.

Ainsi qu’il est établi dans le même travail, on ne peut remplacer ε par 0 dans aucune de ses deux occurrences au membre de droite de (6.85). Nous déduisons en particulier de (6.85) l’amélioration quasi-optimale de (6.82) (6.87)

K(n,y) ≪ε u−u + n−1+ε

(n  y  2),

alors que (6.86) implique la validité, pour tout ε > 0, de la formule asymptotique 

ln y  2 (6.88) K(n,y) = (u) 1 + O ln y dans le domaine

(Gε )

n  3,

exp{(ln n)2/5+ε }  y  n.

N OTES

§ 6.3. Comme évoqué dans la démonstration du Théorème 6.8, le comportement asymptotique fin de la fonction de Buchstab ω(u) est relié à l’équation

eζ = 1 − u ζ .

(6.89)

L’équation (6.89), comme (6.10), possède une infinité de solutions complexes, proches de la droite ℜe ζ = ξ (u). Cependant, alors que (6.10) possède, pour u > 1, une unique solution réelle non nulle, qui joue ipso facto un rôle fondamental, (6.89) n’a pas de solution réelle non triviale. Ce sont donc les deux solutions conjuguées les plus proches de l’axe réel qui permettent de décrire précisément le comportement asymptotique de ω(u), en appliquant la méthode du col avec le « bon » choix de l’abscisse d’intégration. Désignons(4) par ζ0 (u) et ζ−1 (u) = ζ0 (u) ces solutions. Hildebrand & Tenenbaum (1993a) ont établi que ζ0 (u) est, pour u réel assez grand, l’unique solution de (6.89) satisfaisant à

|ζ0 (u) − ξ (u) + iπ |  π et que l’on a en fait (6.90) (6.91)

1  π ξ (u) π2 − i + O 2ξ (u)2 ξ (u) − 1 ξ (u)3 

1  1 −ξ (u) + iπ −ζ0 (u) = . +O +O uζ0′ (u) = ζ0 (u) − 1 uξ (u) ξ (u) − 1 − iπ ξ (u)3 ζ0 (u) = ξ (u) +

Posons ensuite (6.92)

(u) :=

exp{−uζ0(u) − I(ζ0 (u))}  · ζ0 (u) 2π u{1 − 1/ζ0 (u)}

Hildebrand (1990) a montré que l’on a (6.93)

ω(u) − e−γ = −2e−γ R(u) cos ϑ (u) + O(1/u)

avec R(u) := | (u)|, ϑ (u) := arg (u). Ainsi qu’il est établi par l’auteur (1999), cette relation découle simplement de la théorie générale de Hildebrand & Tenenbaum (1993a), qui fournit ici un certain nombre d’informations supplémentaires, 4

Conformément aux notations employées dans Hildebrand & Tenenbaum (1993a).

NOTES

555

notamment les formules

R(u) = ̺ (u) exp

(6.94)

et (6.95)

ϑ ′ (u) =

u   −π 2 u . +O 2 2ξ (u) ξ (u)3

ln u 

1  π ξ (u) 1  2 +O = 2π 1 + . +O 3 ξ (u) − 1 ξ (u) ln u (ln u)2

Il est également à noter que R est strictement décroissante : cela résulte facilement de (6.92). Les formules (6.93) et (6.95) impliquent en particulier que ω(u) − e−γ change infiniment souvent de signe. Comme l’a montré Hildebrand (1990), si λn désigne le n-ième zéro de cette quantité, on peut déduire de (6.95) que

ln n  1 2 +O . λn+1 − λn = 1 − ln n (ln n)2 Pour une extension de ces résultats à la solution générale d’une équation différentielle aux différences du type

uf ′ (u) + af (u) + bf (u − 1) = 0 où a,b sont des nombres complexes arbitraires, voir Hildebrand & Tenenbaum (1993a). § 6.4. En écrivant la formule de Taylor–Lagrange à l’ordre k pour ω(u),(5) on peut généraliser la formule (6.53) de la façon suivante. Lemme 6.18. Soit ωmj := ω(j) (m) − ω(j) (m−) (j  0, 1  m  j + 1). Pour tout entier k  0, on a (6.96)

μy (u) ln y =

 (−1)j ω(j) (u) + (ln y)j

0jk

+

(−1)k+1 (ln y)k





0



y m−u

1mk+1 mu



m−1jk

(−1)j+1 ωmj (ln y)j

ω(k+1) (u − v)y −v dv .

Cela permet de préciser le Corollaire 6.15 en fournissant, dans le domaine (Hε ), un développement asymptotique de (x,y) selon les puissances de 1/ ln y . Il est en effet facile de montrer que, dans cette région, l’intégrale de (6.96) est

≪k

̺ (u)  −c H u . ln y

De même que (6.93) et (6.94) montrent que le Théorème 6.8 est optimal à la valeur de l’exposant de H(u) près, on peut établir, en un sens analogue, que le Corollaire 6.14 est essentiellement optimal — voir Friedlander, Granville, Hildebrand & Maier (1991). Dans cet article, les auteurs étudient les changements de 5

Cf. Tenenbaum (1990), lemme 6.

556

III.6. ENTIERS SANS PETIT FACTEUR PREMIER

signe de (x,y) − x/ζ (1,y) pour en déduire des théorèmes d’oscillations concernant la répartition des nombres premiers. L’idée originale à la base de cette corrélation quelque peu surprenante, est due à Maier (1985). Voir aussi Hildebrand & Maier (1989) et Friedlander & Granville (1989). Le Théorème 6.10 est significativement plus précis que le résultat classique de de Bruijn (1950)

x  (x  y  2). (6.97) (x,y) = W (x,y) + O Lε (y)

C’est  clair lorsque (x,y) appartient à (Hε ). Dans le cas contraire, le terme d’erreur O (x,y) du Théorème 6.10 est certainement

≪ xe−Lε (y) .

On peut montrer que le Lemme 6.12 est valable pour x  y  ln x, à condition de remplacer α0 par la solution α (x,y) de l’équation (6.5) — cf. Hildebrand & Tenenbaum (1986), lemme 8, et Tenenbaum (1990), corollaire au lemme 1. Le résultat suivant constitue un raffinement du Théorème 6.10. Nous rappelons les notations (6.47), (6.48) et (6.49). Théorème 6.19 (Tenenbaum, 1999). Soit ε > 0. On a uniformément pour xy2 (x,y) = W (x,y) + O(E(x,y)),

(6.98)

avec (6.99)

 xR(u)/Lε (y) + x̺ (u)/Yε E(x,y) := (x,y)

si (x,y) ∈ (Hε ), dans le cas contraire.

Corollaire 6.20 (Tenenbaum, 1999). Soit ε > 0. On a uniformément pour (x,y) ∈ (Hε )

xR(u) x̺ (u)  x +O + (6.100) , (x,y) = ζ (1,y) ln y Yε (6.101)

(x,y) =

xR(u) ln(u + 1) x̺ (u)  eγ {xω(u) − y} +O . + ζ (1,y) (ln y)2 Yε

Un second corollaire, établi dans le même article, du Théorème 6.19 est relatif à la valeur moyenne de la fonction ln P − (n). Le résultat dual, concernant ln P + (n), précisant une formule asymptotique due à de Bruijn (1951b) a été établi à l’Exercice 290, p. 558. L’intérêt essentiel du présent corollaire consiste à illustrer, sur un exemple concret, les diverses possibilités d’exploitation de la nature spécifique du terme principal W (x,y) de (6.98).(6) La technique peut être facilement adaptée à l’obtention d’évaluations précises de valeurs moyennes pour une 6

Pour une étude duale, relative aux entiers friables, de cette approche, voir Tenenbaum & Wu (2008b).

NOTES

557

large classe de fonctions arithmétiques de la forme f (P − (n)). Nous posons  ∞

 1  1+γ ln p −γ −γ dt + + e + ln 1 − { ω (t) − e } A := . eγ t (p − 1)ζ (1,p) p 1 p Corollaire 6.21. Soit ε > 0. On a, uniformément pour x  2, 

 3 / 8 −ε ln P − (n) = e−γ x ln2 x + Ax + O xe−(ln x) . 1 0 : F (z − δ ) − δ  G(z)  F (z + δ ) + δ (∀z ∈ R)}. Corollaire 6.22 (Tenenbaum, 1999). Soit f une fonction additive réelle et soient AN , BN des quantités réelles définies pour tout entier N  1 avec BN > 0. On pose

FN (z) := νN (f (n)  AN + zBN ),

GN (z) := P (Zf ,N  AN + zBN )

où Zf ,N désigne la variable aléatoire définie en (3.8) Alors on a, pour tout ε > 0 et uniformément pour 0 < h < 1, 2  y  N ,   1 (6.102) L(FN ,GN ) ≪ε + h + ̺ (u)2(1+ε)u + N −1+ε . pν yhBN /u

Notre seconde application concerne la fonction (x,y ,z) := |{n  x : ny > z}| où ny est le plus grand diviseur y -friable de n. Le principe d’Erdos ˝ de la croissance doublement exponentielle des facteurs premiers d’un entier normal (cf., par exemple, le Théorème 3.10) laisse augurer que (x,y ,z) est petit devant x dès que ln z est grand devant ln y et nous avons déjà obtenu à l’Exercice 293, p. 559, une majoration uniforme pour cette quantité. Nous décrivons à présent un résultat plus précis.

558

III.6. ENTIERS SANS PETIT FACTEUR PREMIER

Posons λ1 (w) := σ (u,v) :=





w∞ v

̺ (t) dt

(w  0),

̺ (t)ω(u − t) dt

(u  1, v  0),

ϑ (u,v) := ̺ (u) + σ (u,v) (u  1, v  0), κ (u,v) := (1 − γ )̺ (u − 1) + γ ̺ (v)ω(u − v)

(u  1, v  0).

Il résulte aisément des estimations de la fonction de Dickman données au Chapitre III.5 que 

1 ̺ (w)  (w  1). 1+O (6.103) λ1 (w) = ln(w + 1) ln(w + 1)

Puisque l’on a 12  ω(t)  1 (t  1) et ̺ (v + h) ≫ ̺ (v){v ln(v + 1)}−h pour 0  h  1  v , cela implique en particulier que ϑ (u,v) ≍ λ1 (v) dès que u − 1 − v ≫ 1/ ln(v + 1). Théorème 6.23 (Tenenbaum, 1999, 2006). Soit ε > 0. Sous la condition (6.104) x  2, y  2, 1  z  exp exp (ln y)3/5−ε

nous avons

(6.105) (x,y ,z) =



e −γ + O

ln(v + 2)  ln y



xλ1 (v) + O x̺ (u)2(1+ε)u + xε ,

où l’on a posé u := (ln x)/ ln y , v := (ln z)/ ln y . Si de plus, 1  z  x/y , nous avons uniformément    κ (u,v) λ1 (v) ̺ (v) ln(v + 2) 1 +O + (6.106) (x,y ,z) = x ϑ (u,v) − + . ln y ln y (ln y)2 z En particulier, si

 (ln y)2  z  min x/y 1+ε/ ln(u+1) , exp exp (ln y)3/5−ε ,

nous avons (6.107)



ln(v + 2)  (x,y ,z) = 1 + O ϑ (u,v)x. ln y

Notons que la condition z  x/y n’est pas restrictive puisque l’on a (x,y ,z) = (x,y) − (z ,y) lorsque x/y < z  x.

E XERCICES 297. (a) Établir, avec la notation (5.1), l’identité suivante pour x  y  2 :  (x/n,y) + (x,y) − (x/y ,y). ⌊x⌋ = n∈S(x/y ,y)

(b) En utilisant les Théorèmes 5.8 et 6.4, déduire de (a) l’identité de convolution  u ̺(u) + ̺ (v)ω(u − v) dv = 1 (u  0). 0

Retrouver ainsi (6.35). Dans les exercices qui suivent, on désigne par k (x,y ,z) le nombre des entiers n  x satisfaisant à  ν = k. (n; y ,z) := z y, Nederl. Akad. Wetensch. Proc. Ser. A 54, 50–60. 1966. On the number of positive integers  x and free of prime factors > y, II, Nederl. Akad. Wetensch. Proc. Ser. A 69, 239–247 = Indag. Math. 28, 239– 247. 1970. Asymptotic methods in Analysis, North Holland (Amsterdam), 3◦ éd. ; réimpression : Dover (New York), 1981. N.G. de Bruijn, C. van Ebbenhorst Tengbergen & D. Kruyswijk, 1949–51. On the set of divisors of a number, Nieuw Arch. f. Wisk. Ser. II 23, 191–193. V. Brun, 1917. Sur les nombres premiers de la forme ap + b, Arkiv. for Math. og Naturvid. B 34, no 14, 9 pp. 1919a. Le crible d’Ératosthène et le théorème de Goldbach, C. R. Acad. Sci. Paris 168, 544–546. 1919b. La série 1/5 + 1/7 + 1/11 + 1/13 + 1/17 + 1/19 + 1/29 + 1/31 + 1/41 + 1/43 +1/59 + 1/61 + . . . où les dénominateurs sont nombres premiers jumeaux est convergente ou finie, Bull. Sci. Math. (2) 43 100–104 ; 124–128. 1922. Das Sieb des Eratosthenes, 5 Skand. Mat. Kongr., Helsingfors 197–203. 1924. Untersuchengen über das Siebverfahren des Eratosthenes, Jahresber. Deutsch. Math.-Verein. 33, 81–96. 1967. Reflections on the sieve of Eratosthenes, Norske Vid. Selsk. Skr. (Trondheim) no 1, 9 pp. A.A. Buchstab, 1937. An asymptotic estimation of a general number-theoretic function, Mat. Sbornik (2) 44, 1239–1246. D.A. Burgess, 1962. On character sums and L-series, I, Proc. London Math. Soc. 12, 193–206. 1963. On character sums and L-series, II, Proc. London Math. Soc. 13, 524-536. E. Cahen, 1894. Sur la fonction ζ (s) de Riemann et sur des fonctions analogues, Ann. Éc. Norm. (Ser. 3) 11, 75–164. F. Carlson, 1922. Contributions à la théorie des séries de Dirichlet, Note I, Ark. för Mat., Astron. och Fys. 16, 18–19. H. Cartan, 1961. Théorie élémentaire des fonctions analytiques d’une ou plusieurs variables complexes, Hermann (Paris). E.D. Cashwell & C.J. Everett, 1959. The ring of number theoretic functions, Pacific J. Math. 9, 975–985. J.-R. Chen, 1983. The exceptional set of Goldbach numbers (II), Sci. Sinica 26, 714–731. S. Chowla, A new proof of a theorem of Siegel, Ann. of Math. (2) 51, 120–122. E. Cohen, 1960. Arithmetical functions associated with the unitary divisors of an integer, Math. Z. 74, 66–80. 1964. Some asymptotic formulas in the theory of numbers, Trans. Amer. Math. Soc. 112, 214–227. J.B. Conrey, 1989. More than two fifths of the zeros of the Riemann zeta function are on the critical line, J. reine angew. Math. 399, 1–26.

INTRODUCTION À LA THÉORIE ANALYTIQUE ET PROBABILISTE DES NOMBRES

565

J.G. van der Corput, 1921. Zahlentheorische Abschätzungen, Math Ann. 8,53–79. 1922. Verschärferung der Abschätzung beim Teilerproblem, Math. Annalen 87, 39–65. 1923. Neue zahlentheoretische Abschätzungen, erste Mitteilung, Math. Annalen 89, 215–254. 1928a. Zum Teilerproblem, Math. Annalen 98, 697–716. 1928b. Zahlentheoretische Abschätzungen, mit Anwendung auf Gitterpunktprobleme, Math. Z. 28, 301–310. 1929. Neue Zahlentheoretische Abschätzungen, zweite Mitteilung, Math. Z. 29, 397–426. 1931. Diophantishe Ungleichungen I. Zur Gleichverteilung modulo Eins, Acta Math. 56, 373–456. 1936–37. Über Weylsche Summen, Mathematica B, 1–30. H. Cramér, 1970. Random variables and probability distributions, 3-ième éd., Cambridge Tracts in Mathematics and Mathematical Physics no 36, Cambridge. H. Daboussi, 1974. Voir : Daboussi & Delange (1974). 1979. On the density of direct factors of the set of positive integers, J. London Math. Soc. (2) 19, 21–24. 1981. On the limiting distribution of non-negative additive functions, Compositio Math. 43, 101–105. 1982. La méthode de convolution, Théorie élémentaire et analytique des nombres (J. Coquet éd.), Journées SMF–CNRS de Valenciennes, Dép. Math. Univ. Valenciennes, 26–29. 1984. Sur le théorème des nombres premiers, C. R. Acad. Sc. Paris 298, Série I, no 8, 161–164. 1989. On a convolution method, in : E. Aparicio, C. Calderón & J.C. Peral (eds.), Congreso de Teoria de los Números (Universitad del País Vasco), 110–137. H. Daboussi & H. Delange, 1974. Quelques propriétés des fonctions multiplicatives de module au plus égal à 1, C. R. Acad. Sci. Paris Sér. A 278, 657–660. 1982. On multiplicative arithmetical functions whose modulus does not exceed one, J. London Math. Soc. (2) 26, 245–264. 1985. On a class of multiplicative functions, Acta Sci. Math. 49, 143–149. H. Davenport, 1980. Multiplicative Number Theory (2nde édition), Springer, New York, Heidelberg, Berlin. H. Davenport & P. Erdos, ˝ 1937. On sequences of positive integers, Acta Arith. 2, 147–151. 1951. On sequences of positive integers, J. Indian Math. Soc. 15, 19–24. H. Davenport & H. Halberstam, 1966. The values of a trigonometric polynomial at well spaced points, Mathematika 13, 91–96. Corrigendum and Addendum, Mathematika 14 (1967), 229–232. J.-M. De Koninck & G. Tenenbaum, 2002. Sur la loi de répartition du k-ième facteur premier d’un entier, Math. Proc. Camb. Phil. Soc. 133, 191–204. H. Delange, 1954. Généralisation du Théorème de Ikehara, Ann. Sci. Éc. Norm. Sup. (3) 71, fasc. 3, 213–242. 1959. Sur des formules dues à Atle Selberg, Bull. Sc. Math. 2◦ série 83, 101–111. 1961. Sur les fonctions arithmétiques multiplicatives, Ann. Scient. Éc. Norm. Sup., 3◦ série, 78, 273–304.

566

BIBLIOGRAPHIE

1971. Sur des formules de Atle Selberg, Acta Arith. 19, 105–146. 1982. Théorie probabiliste des nombres, in : Journées Arithmétiques, Metz 1981, Astérisque 94, 31–42. H. Delange & G. Tenenbaum, 1992. Un théorème sur les séries de Dirichlet, Mh. Math. 113, 99–105. J.-M. Deshouillers, F. Dress & G. Tenenbaum, 1979. Lois de répartition des diviseurs, 1, Acta Arith. 23, 273–285. H.G. Diamond, 1982. Elementary methods in the study of the distribution of prime numbers, Bulletin (N.S.) of the Amer. Math. Soc. 7, 553–589. 1984. A number theoretic series of I. Kasara, Pacific J. Math. 111, no 2, 283–285. 1988. Review no 88a : 40006, Mathematical Reviews. H.G. Diamond & H. Halberstam, 1985. The Combinatorial sieve, in : K. Alladi (ed.), Number Theory, Proc. 4th Matsci. Conf. Ootacamund, India, 1984, Springer Lecture Notes 1122, 63–73. K. Dickman, 1930. On the frequency of numbers containing prime factors of a certain relative magnitude, Ark. Math. Astr. Fys. 22, 1–14. P.G.L. Dirichlet, 1837. Beweis des Satzes, daß jede unbegrenzte arithmetische Progression, deren erstes Glied und Differenz ganze Zahlen ohne gemeinschaftlichen Factor sind, unendlich viele Primzahlen enthält, Abh. Akad. Berlin (1837 math. Abh. 45– 71). F. Dress, 1983-84. Théorèmes d’oscillation et fonction de Möbius, Séminaire de Théorie des nombres (Bordeaux), exposé no 33 (33 pp.). F. Dress, H. Iwaniec & G. Tenenbaum, 1983. Sur une somme liée à la fonction de Möbius, J. reine angew. Math. 340, 53–58. Y. Dupain, R.R. Hall & G. Tenenbaum, 1982. Sur l’équirépartition modulo 1 de certaines fonctions de diviseurs, J. London Math. Soc. (2) 26, 397–411. F.J. Dyson, 1947. The approximation to algebraic numbers by rationals, Acta Math., Uppsala 79, 225-240. H.M. Edwards, 1974. Riemann’s zeta function, Pure and Applied Mathematics 58, Academic Press, New York-London, xiii+315 pp. P.D.T.A. Elliott, 1979. Probabilistic number theory : mean value theorems, Grundlehren der Math. Wiss. 239, Springer-Verlag, New York, Berlin, Heidelberg. 1980. Probabilistic number theory : central limit theorems, Grundlehren der Math. Wiss. 240, Springer-Verlag, New York, Berlin, Heidelberg. 1985. Arithmetic functions and integer products, Grundlehren der Math. Wiss. 272, Springer-Verlag, Berlin, New York, Tokyo. 1997. Duality in analytic number theory, Cambridge Tracts in Mathematics 122, Cambridge University Press, Cambridge. P.D.T.A. Elliott & C. Ryavec, 1971. The distribution of values of additive arithmetical functions, Acta Math. 126, 143–164. V. Ennola, 1969. On numbers with small prime divisors, Ann. Acad. Sci. Fenn. Ser. AI 440, 16 pp.

INTRODUCTION À LA THÉORIE ANALYTIQUE ET PROBABILISTE DES NOMBRES

567

W.J. Ellison & M. Mendès France, 1975. Les nombres premiers, Hermann, Paris. P. Erdos, ˝ 1935. On the normal number of prime factors of p − 1 and some related problems concerning Euler’s ϕ-function, Quart. J. Math. (Oxford) 6, 205–213. 1935/37/38. On the density of some sequences of numbers I, J. London Math. Soc. 10, 120–125 ; II, ibid. 12, 7–11 ; III, ibid. 13, 119–127. 1939. On the smoothness of the asymptotic distribution of additive arithmetical functions, Amer. J. Math. 61, 722–725. 1940. The difference of consecutive primes, Duke Math. J. 6, 438–441. 1946. On the distribution function of additive functions, Ann. of Math. 47, 1–20. 1949. On a new method in elementary number theory which leads to an elementary proof of the prime number theorem, Proc. Nat. Acad. Sci. (Washington) 35, 374–384. 1969. On the distribution of prime divisors, Aequationes Math. 2, 177–183. 1979. Some unconventional problems in number theory, Astérisque 61, 73–82. P. Erdos ˝ & R.R. Hall, 1974. On the distribution of values of certain divisor functions, J. Number Theory 6, 52–63. P. Erdos, ˝ R.R. Hall & G. Tenenbaum, 1994. On the densities of sets of multiples, J. reine angew. Math. 454, 119-141. P. Erdos ˝ & A.E. Ingham, 1964. Arithmetical Tauberian theorems, Acta Arith. 9, 341–356. P. Erdos ˝ & M. Kac, 1939. On the Gaussian law of errors in the theory of additive functions, Proc. Nat. Acad. Sci. U.S.A. 25, 206–207. 1940. The Gaussian law of errors in the theory of additive number theoretic functions, Amer. J. Math. 62, 738–742. P. Erdos ˝ & J.-L. Nicolas, 1981a. Sur la fonction : nombre de facteurs premiers de N , Ens. Math. 27, 3–27. 1981b. Grandes valeurs d’une fonction liée aux produits d’entiers consécutifs, Ann. Fa. Sci. Toulouse 3, 173–199. 1989. Grandes valeurs de fonctions liées aux diviseurs premiers consécutifs d’un entier, in : J.-M. De Koninck & C. Levesque (eds.), Théorie des nombres/Number Theory, W. de Gruyter, 169–200. P. Erdos, ˝ B. Saffari & R.C. Vaughan, 1979. On the asymptotic density of sets of integers II, J. London Math. Soc. (2) 19, 17–20. P. Erdos ˝ & A. Sárközy, 1994. On isolated, respectively consecutive large values of arithmetic functions, Acta Arith. 66, 269–295. P. Erdos, ˝ A. Sárközy & E. Szemerédi, 1967. On an extremal problem concerning primitive sequences, J. London Math. Soc. 42, 484–488. P. Erdos ˝ & H.N. Shapiro, 1951. On the changes of signs of a certain error function, Canad. J. Math. 3, 375–385. P. Erdos ˝ & G. Tenenbaum, 1989a. Sur les densités de certaines suites d’entiers, Proc. London Math. Soc. (3) 59, 417–438. 1989b. Sur les fonctions arithmétiques liées aux diviseurs consécutifs, J. Number Theory 31, 285–311.

568

BIBLIOGRAPHIE

P. Erdos ˝ & P. Turán, 1948. On a problem in the theory of uniform distribution I, II, Indag. Math. 10, pp. 370–378 ; ibid. 406–413. P. Erdos ˝ & A. Wintner, 1939. Additive arithmetical functions and statistical independence, Amer. J. Math. 61, 713–721. C.G. Esseen, 1942. On the Liapounoff limit of error in the theory of probability, Ark. Mat. Astr. Fysik 28 A, 1–19. 1945. Fourier analysis of distribution functions. A mathematical study of the Laplace–Gaussian law, Acta Math. 77, nos. 1–2, 1–125. 1966. On the Kolmogorov–Rogozin inequality for the concentration function, Z. Wahrscheinlichkeitstheorie verw. Geb. 5, 210–216. T. Estermann, 1948. On Dirichlet’s L functions. J. London Math. Soc. 23, 275–279. J.-H. Evertse, P. Moree, C.L. Stewart & R. Tijdeman, 2003. Multivariate Diophantine equations with many solutions. Acta Arith. 107, no 2, 103–125. J. Fatou, 1906. Séries trigonométriques et séries de Taylor, Acta Math. 30, 335–400. W.J. Feller, 1970. An introduction to probability theory and its applications, vol. 1, John Wiley (1ère éd. 1950). 1971. An introduction to probability theory and its applications, vol. 2, John Wiley (1ère éd. 1966). K. Ford, 2007. The distribution of integers with a divisor in a given interval, Annals of Math. (2) 168, n◦ 2, 367–433. K. Ford, B. Green, S. Konyagin, J. Mayrard & T. Tao, 2014. Long gaps betwen primes, prépublication. K. Ford & H. Halberstam, 2000. The Brun–Hooley sieve, Journal Number Theory 81, no 2, 335–350. E. Fouvry & F. Grupp, 1986. On the switching principle in sieve theory, J. reine angew. Math. 370, 101– 125. E. Fouvry & G. Tenenbaum, 1991. Entiers sans grand facteur premier en progressions arithmétiques, Proc. London Math. Soc. (3) 63, 449–494. 1996. Répartition statistique des entiers sans grand facteur premier dans les progressions arithmétiques, Proc. London Math. Soc., (3) 72 481-514. G. Freud, 1952. Restglied eines Tauberschen Sätzes I, Acta Math. Acad. Sci. Hung. 2, 299–308. 1953. Restglied eines Tauberschen Sätzes II, Acta Math. Acad. Sci. Hung. 3, 299–307. 1954. Restglied eines Tauberschen Sätzes III, Acta Math. Acad. Sci. Hung. 5, 275– 289. G. Freud & T. Ganelius, 1957. Some remarks on one sided approximation, Math. Scand. 5, 276–284. J.B. Friedlander & A. Granville, 1989. Limitations to the equidistribution of primes I, Ann. Math. 129, 363–382. 1993. Smoothing « smooth » numbers, in : R. C. Vaughan (éd.), Theory and applications of numbers without large prime factors, Phil. Trans. R. Soc. London A 345, no 1676, 339–347.

INTRODUCTION À LA THÉORIE ANALYTIQUE ET PROBABILISTE DES NOMBRES

569

J.B. Friedlander, A. Granville, A. Hildebrand & H. Maier, 1991. Oscillation theorems for primes in arithmetic progressions and for sifting functions, J. Amer. Math. Soc. 4, 25–86. J. Galambos, 1970. Distribution of arithmetical functions. A survey, Ann. Inst. H. Poincaré Sect. B (N.S.) 6, 281–305. 1971. On the distribution of strongly multiplicative function, Bull. London Math. Soc. 3, 307–312. 1976. The sequences of prime divisors of integers, Acta Arith. 31, 213–218. J. Galambos & P. Szüsz, 1986. On the distribution of multiplicative arithmetical functions, Acta Arith. 47, 57–62. P.X. Gallagher, 1967. The large sieve, Mathematika 14, 14–20. 1970. A large sieve density estimate near σ = 1, Invent. Math. 11, 329–339. 1972. Sieving by prime powers, in : Proceedings of the 1972 Number Theory Conference (Univ. Colorado, Boulder, Colo., 1972), pp. 95–99. Univ. Colorado, Boulder, Colo. 1973/74. Sieving by prime powers, Collection of articles dedicated to Carl Ludwig Siegel on the occasion of his seventy-fifth birthday, V, Acta Arith. 24, 491– 497. T. Ganelius, 1971. Tauberian Remainder Theorems, Springer Lecture Notes 232. F.R. Gantmacher, 1966. Théorie des matrices, Dunod, Paris. A. Gelfond, 1946. Comments to the papers ‘On the determination of the number of prime numbers not exceeding a given quantity’ and ‘On prime numbers’ (en russe), in : Collected works of P. L. Chebyshev, vol. 1, Moscow-Leningrad, 285–288. A. Gelfond & Y. Linnik, 1948. On Thue’s method in the problem of effectiveness in quadratic fields (en russe), Doklady Akad. Nauk SSSR (N.S.) 61, 773–776. 1965. Méthodes élémentaires dans la théorie analytique des nombres, GauthierVillars, Paris. D. Goldfeld, 1974. A simple proof of Siegel’s theorem, Proc. Nat. Acad. Sci. U.S.A. 71, 1055. 2004. The elementary proof of the prime number theorem : an historical perspective. Number theory (New York, 2003), 179–192, Springer, New York. D.A. Goldston, Y. Motohashi, J. Pintz, C.Y. Yıldırım, 2006. Small gaps between primes exist, Proc. Japan Acad. Ser. A Math. Sci. 82, n◦ 4, 61–65. D.A. Goldston, J. Pintz, C.Y. Yıldırım, 2006. Primes in tuples, III. On the difference pn+ν − pn , Funct. Approx. Comment. Math. 35, 79–89. D.S. Gorshkov, 1959. On the deviation of polynomials with rational integer coefficients from zero on the interval [0, 1] (en russe), in : Proceedings of the 3rd All-union congress of Soviet mathematicians (Moscow, 1956), vol. 4, 5–7. S.W. Graham, 1981a. The distribution of squarefree numbers, J. London Math. Soc. (2) 24, 54–64. 1981b. On Linnik’s constant, Acta Arith. 39, 163–179.

570

BIBLIOGRAPHIE

S.W. Graham & G. Kolesnik, 1991. Van der Corput’s method of exponential sums, London Math. Soc. Lecture Notes 126, Cambridge University Press. S.W. Graham & J.D. Vaaler, 1981. A class of extremal functions for the Fourier transform, Trans. Amer. Math. Soc. 265, 283–302. 1984. Extremal functions for the Fourier transform and the large sieve, in G. Halász (ed.) Topics in classical number theory, Colloq. Budapest 1981, vol. I, Colloq. Math. Soc. János Bolyai 34, 599–615. A. Granville, 1993. Integers, without large prime factors, in arithmetic progressions. II, in : R. C. Vaughan (éd.), Theory and applications of numbers without large prime factors, Phil. Trans. R. Soc. London A 345, no 1676, 349–362. A. Granville & K. Soundararajan, 2003. Decay of mean values of multiplicative functions, Canad. J. Math. 55 (2003), no 6, 1191–1230. G. Greaves, 2001. Sieves in number theory, Ergebnisse der Mathematik und ihrer Grenzgebiete (3) [Résultats en mathématiques et domaines liés (3)], 43, Springer-Verlag, Berlin, 2001. xii+304 pp. E. Grosswald, 1972. Oscillation theorems, Conference on the theory of arithmetic functions, Springer Lecture Notes 251, 141–168. J. Hadamard 1896. Sur la distribution des zéros de la fonction ζ (s) et ses conséquences arithmétiques, Bull. Soc. Math. de France 14, 199-220. G. Halász, 1968. Über die Mittelwerte multiplikativer zahlentheoretischer Funktionen, Acta Math. Acad. Sci. Hung. 19, 365–403. 1971. On the distribution of additive and the mean values of multiplicative arithmetic functions, Studia Scient. Math. Hung. 6, 211–233. 1972. Remarks to my paper ‘On the distribution of additive and the mean values of multiplicative arithmetic functions’, Acta Math. Acad. Scient. Hung. 23, 425– 432. H. Halberstam & H.-E. Richert, 1974. Sieve Methods, Academic Press, London, New York, San Francisco. 1979. On a result of R.R. Hall, J. Number Theory (1) 11, 76–89. H. Halberstam & K.F. Roth, 1966. Sequences, Oxford ; 2-nde éd. Springer, 1983. R.R. Hall, 1970. On the distribution of divisors of integers in residue classes (mod k), J. Number Theory 2, 168–188 ; Erratum ibid. 2, 509. 1971a. On the distribution of divisors of integers in residue classes (modk), II, J. Number Theory 3, 204–209. 1971b. On the distribution of divisors of integers in residue classes (modk), III, J. Number Theory 3, 278–287. 1974. Halving an estimate obtained from Selberg’s upper bound method, Acta Arith. 25, 347–351. 1978. A new definition of the density of an integer sequence, J. Austral. Math. Soc. Ser. A 26, 487–500. 1981. The divisor density of integer sequences, J. London Math. Soc. (2) 24, 41–53.

INTRODUCTION À LA THÉORIE ANALYTIQUE ET PROBABILISTE DES NOMBRES

571

R.R. Hall & G. Tenenbaum, 1982. On the average and normal orders of Hooley’s -function, J. London Math. Soc. (2) 25, 392-406. 1986. Les ensembles de multiples et la densité divisorielle, J. Number Theory 22, 308–333. 1988. Divisors, Cambridge Tracts in Mathematics 90, Cambridge. 1991. Efffective mean value estimates for complex multiplicative functions, Math. Proc. Camb. Phil. Soc. 110, 337–351. G. Hanrot, G. Tenenbaum & J. Wu, 2008. Moyennes de certaines fonctions multiplicatives sur les entiers friables, 2, Proc. London Math. Soc. (3) 96, 107–135. D. Hanson, 1972. On the product of primes, Canad. Math. Bull. 15, 33–37. G.H. Hardy, 1914. Sur les zéros de la fonction ζ (s) de Riemann, C. R. Acad. Sci. Paris 158, 1012–1014. 1916a. On Dirichlet’s divisor problem, Proc. London Math. Soc. 15, (2) 1–25. 1916b. The average orders of the functions P (x) and (x), Proc. London Math. Soc. 15 (2), 192–213. 1949. Divergent Series, Oxford at the Clarendon Press. G.H. Hardy & J.E. Littlewood, 1913. Contributions to the arithmetic theory of series, Proc. London Math. Soc. (2) 11, 411–478. 1921. The zeros of Riemann’s zeta function on the critical line, Math. Z. 10, 283–317. 1922. Some problems of partitio numerorum III : On the expression of a number as a sum of primes, Acta Math. 44, 1–70. 1923. The approximate functional equation in the theory of the zeta function, with applications to the divisor problems of Dirichlet and Piltz, Proc. London Math. Soc. (2), 21, 39–74. 1929. The approximate functional equations for ζ (s) and ζ (s)2 , Proc. London Math. Soc. (2) 29, 81–97. G.H. Hardy & S. Ramanujan, 1917. The normal number of prime factors of a number n, Quart. J. Math. 48, 76–92. G.H. Hardy & M. Riesz, 1915. The general theory of Dirichlet series, Cambridge Tracts in Mathematics and Mathematical Physics no 18, Cambridge University Press ; 2-nde impression : 1952. G.H. Hardy & E.M. Wright, 1938. An introduction to the theory of numbers, Oxford (5-ième éd. 1979). D.R. Heath-Brown, 1992. Zero-free regions for Dirichlet L-functions, and the least prime in an arithmetic progression, Proc. London Math. Soc. (3) 64, no 2, 265–338. W. Hengartner & R. Theodorescu, 1973. Concentration functions, Academic Press, New York, London. D. Hensley, 1986a. The convolution powers of the Dickman function, J. London Math. Soc. (2) 33, 395–406. 1986b. A property of the counting function of integers with no large prime factors, J. Number Theory 22, no 1, 46–74. 1987. The distribution of round numbers, Proc. London Math. Soc. (3) 54, 412–444. E. Heppner, 1974. Über die Iteration von Teilerfunktionen, J. reine angew. Math. 265, 176–182.

572

BIBLIOGRAPHIE

A. Hildebrand, 1983. An asymptotic formula for the variance of an additive function, Math. Z. 183, 145–170. 1984a. Integers free of large prime factors and the Riemann hypothesis, Mathematika 31, 258–271. 1984b. Quantitative mean value theorems for non-negative multiplicative functions I, J. London Math. Soc. (2) 30, 394–406. 1984c. Fonctions multiplicatives et équations intégrales, Séminaire de Théorie des Nombres, Paris 1982–83, Prog. Math. 51, 115–124. 1985. Integers free of large prime factors in short intervals, Quart. J. Math. Oxford (2) 36, 57–69. 1986a. On the number of positive integers  x and free of prime factors > y, J. Number Theory 22, 289–307. 1986b. The prime number theorem via the large sieve, Mathematika 33, 23–30. 1986c. On Wirsing’s mean value theorem for multiplicative functions, Bull. London Math. Soc. 18, 147–152. 1986d. A note on Burgess’ character sum estimate, C. R. Acad. Sci. Canada 8, 35–37. 1986e. Multiplicative functions at consecutive integers, Math. Proc. Camb. Phil. Soc. 100, 229–236. 1986f. On the local behavior of (x,y), Trans. Amer. Math. Soc. 297, 729–751. 1987a. Multiplicative functions in short intervals, Canad. J. Math. 1987b. Quantitative mean value theorems for non negative mutliplicative functions II, Acta Arith. 48, 209–260. 1990. The asymptotic behavior of the solutions of a class of differential-difference equations, J. London Math. Soc. (2) 42, 11–31. A. Hildebrand & H. Maier, 1989. Irregularities in the distribution of primes in short intervals, J. reine angew. Math. 397, 162–193. A. Hildebrand & G. Tenenbaum, 1986. On integers free of large prime factors, Trans. Amer. Math. Soc. 296, 265–290. 1988. On the number of prime factors of an integer, Duke Math. J. 56, no 3 (1988), 471–501. 1993a. On a class of differential-difference equations arising in number theory, J. d’Analyse 61, 145–179. 1993b. Integers without large prime factors, J. Théorie des Nombres de Bordeaux 5, 411-484. C. Hooley, 1979. A new technique and its applications to the theory of numbers, Proc. London Math. Soc. (3) 38, 115–151. 1994. On an almost pure sieve. Acta Arith. 66 (1994), no 4, 359–368. L. Hörmander, 1954. A new proof and a generalization of an inequality of Bohr, Math. Scand. 2, 33-45. M.N. Huxley, 1972a. On the difference between consecutive primes, Inventiones Math. 15, 164– 170. 1972b. The distribution of prime numbers, Oxford. 1990. Exponential sums and lattice points, Proc. London Math. Soc. (3) 60, 471– 502 ; Corrigenda 66 (1993), 70. 1993a. Exponential sums and lattice points, II, Proc. London Math. Soc. (3) 66, 279– 301. 1993b. Exponential sums and the Riemann zeta function IV, Proc. London Math. Soc. (3) 66, 1–40. 1996. Area, lattice points, and exponential sums, London Mathematical Society Monographs, New Series, 13. Oxford Science Publications. The Clarendon

INTRODUCTION À LA THÉORIE ANALYTIQUE ET PROBABILISTE DES NOMBRES

573

Press, Oxford University Press, New York. xii+494 pp. Exponential sums and lattice points, III, Proc. London Math. Soc. (3) 87, no 3, 591–609. 2005. Exponential sums and the Riemann zeta function, V. Proc. London Math. Soc. (3) 90 (2005), no 1, 1–41. M.N. Huxley & G. Kolesnik, 1991. Exponential sums and the Riemann zeta function III, Proc. London Math. Soc. (3) 62, 449–468 ; Corrigenda 66 (1993), 302. M.N. Huxley & N. Watt, 1988. Exponential sums and the Riemann zeta function, Proc. London Math. Soc. (3) 57, 1–24. S. Ikehara, 1931. An extension of Landau’s theorem in the analytic theory of numbers, J. Math. and Phys. (Mass. Inst. of Techn.) 10, 1–12. A.E. Ingham, 1930. Notes on Riemann’s ζ -function and Dirichlet’s L-functions, J. London Math. Soc. 5, 107–112. 1935. On Wiener’s method in Tauberian theorems, Proc. London Math. Soc. (2) 38, 458–480. 1945. Some Tauberian theorems connected with the prime number theorem. J. London Math. Soc. 20, 171–180. 1965. On Tauberian theorems, Proc. London Math. Soc. (3) 14A, 157–173. 1990. The distribution of prime numbers, Reprint of the 1932 original, with a foreword by R.C. Vaughan, Cambridge Mathematical Library, Cambridge University Press, Cambridge xx+114 pp. A. Ivi´c, 1985. The Riemann zeta-function, John Wiley, New York, Chichester, Brisbane, Toronto, Singapore. A. Ivi´c & G. Tenenbaum, 1986. Local densities over integers free of large prime factors, Quart. J. Math. (Oxford), (2) 37, 401–417. H. Iwaniec, 1978. On the problem of Jacobsthal, Demonstratio Math. 11, no 1, 225–231. 1980a. Rosser’s sieve, Acta Arith. 36, 171–202. 1980b. A new form of the error term in the linear sieve, Acta Arith. 37 (1980), 307– 320. 1981. Rosser’s sieve—Bilinear Forms of the Remainder Terms—Some applications, in : H. Halberstam & C. Hooley (eds.), Recent Progress in Analytic Number Theory, Academic Press, London, New York, Toronto, Sydney, San Francisco, vol. 1, 203–230. H. Iwaniec & C.J. Mozzochi, 1988. On the divisor and circle problems, J. Number Theory 29, 1, 60–93. B. Jessen & A. Wintner, 1935. Distribution functions and the Riemann Zeta function, Trans.Amer. Math. Soc. 38, 48–88. J. Johnsen, 1971. On the large sieve method in GF (q,x), Mathematika 18, 172–184. J. Kaczorowski & J. Pintz, 1986–7. Oscillatory properties of arithmetical functions, I, Acta Math. Hung. 48, 173–185 ; II, ibid. 49, 441–453. J.-P. Kahane & H. Queffélec, 1997. Ordre, convergence et sommabilité de produits de séries de Dirichlet, Ann. Inst. Fourier, Grenoble 47, 2 (1997), 485–529. 2003.

574

BIBLIOGRAPHIE

T. Kamae & M. Mendès France, 1978. Van der Corput’s difference theorem, Israel J. Math. 31, 335–342. J. Karamata, 1931. Neuer Beweis und Verallgemeinerung der Tauberschen Sätze, welche die Laplacesche und Stieltjesche Transformation betreffen, J. reine angew. Math. 164, 27–39. 1952. Compte rendu de l’article de G. Freud (1952), Zentralblatt für Math. 44, 324. A.A. Karatsuba, 1981. On the distance between consecutive zeros of the Riemann zeta function that lie on the critical line (en russe), in : Number theory, mathematical analysis and their applications, Trudy Mat. Inst. Steklov. 157, 49–63, 235. Y. Katznelson, 1968. An introduction to harmonic analysis, Dover, New York (2◦ édition, 1976). S. Kerner, 2002. Répartition d’entiers avec contraintes sur les diviseurs, thèse, Univ. Henri– Poincaré Nancy 1. I. Kobayashi, 1973. A note on the Selberg sieve and the large sieve, Proc. Japan. Acad. 49, 1–5. G. Kolesnik, 1981. On the estimation of multiple exponential sums, in : H. Halberstam & C. Hooley (eds.) Recent Progress in Analytic Number Theory Academic Press, London, New York, Toronto, Sydney, San Francisco, vol. 1, 231–246. 1985. The method of exponent pairs, Acta Arith. 45, 115–143. A. Kolmogorov, 1956. Two uniform limit theorems for sums of independent random variables, Theor. Probab. Appl. 1, 384–394. 1958. Sur les propriétés des fonctions de concentration de M. P. Lévy, Ann. Inst. Henri Poincaré 16, no 1, 27–34. J. Korevaar, 1954a. A very general form of Littlewood’s theorem, Indag. Math. 16, 36–45. 1954b. Another numerical Tauberian theorem for power series, Indag. Math. 16, 46– 56. 1982. On Newman’s quick way to the prime number theorem, Math. Intelligencer 4, 108–115 2004. Tauberian theory. A century of developments, Grundlehren der Mathematischen Wissenschaften 329, Springer-Verlag, Berlin, xvi+483 pp. N.M. Korobov, 1958a. Estimates of trigonometric sums and their applications (en russe), Usp. Mat. Nauk. 13, 185–192. 1958b. Estimates of Weyl sums and the distribution of prime numbers (en russe), Dokl. Akad. Nauk SSSR 123, 28–31. 1958c. On zeros of ζ (s) (en russe), Dokl. Akad. Nauk SSSR 118, 231–232. J. Kubilius, 1956. Méthodes probabilistes en théorie des nombres (en russe), Uspehi Mat. Nauk 11 (no 2), 31–66 = Amer. Math. Soc. Transl. 19 (1962), 47–85. 1964. Probabilistic methods in the theory of numbers, Amer. Math. Soc. Translations of Math. Monographs, no 11, Providence. 1983a. Estimation of the central moment for strongly additive arithmetic functions (en russe, résumés en anglais et lituanien.), Litovsk. Mat. Sb. 23 (no 1), 122– 133. 1983b. Estimate of the second central moment for any additive arithmetic functions (en russe, résumés en anglais et lituanien), Litovsk. Mat. Sb. 23 (no 2), 110– 117.

INTRODUCTION À LA THÉORIE ANALYTIQUE ET PROBABILISTE DES NOMBRES

575

R. Kusmin, 1927. Sur certaines inégalités trigonométriques (en russe), J. Math.–Phsy. Leningrad 1, 233-239. E. Landau, 1906. Über die Grundlagen der Theorie der Fakultätenreihen, Sitzungsberichte der mathematische-physikalischen Klasse der Kgl. Bayerischen Akademie der Wissenschaften zu München, 36, 151–218. 1909. Handbuch der Lehre von der Verteilung der Primzahlen (2 vols.), Teubner, Leipzig ; troisième édition : Chelsea, New York (1974). 1910. Über die Bedeutung einiger neuen Grenzwertsätze der Herren Hardy und Axer, Prace matematyczno-fizycne (Warszawa) 21, 97-177. 1912. Über die Anzahl der Gitterpunkte in gewissen Bereichen, Göttingen Nachrichten, 687–771. 1918. Über die Klassenzahl imaginär-quadratischer Zahlkörper, (German) Gött. Nachr. 1918, 285-295. 1927. Vorlesungen über Zahlentheorie (3 vols ; Hirzel, Leipzig). Réimpression par Chelsea, New York, 1969. 1928. Über einer trigonometrische Summen, Nachr. Ges. Wiss. Göttingen 1928, 21– 24. 1929. Darstellung und Begründung einiger neuerer Ergebnisse der Funktionentheorie, 2◦ éd., Berlin. 1933. Über den Wertervorrat von ζ (s) in den Halbebene σ > 1, Göttingen Nachrichten, 81–91 1966. Elementary Number Theory (2◦ éd.) Chelsea ; 1◦ éd. Hirzel, Leipzig, 1927. E. Landau & A. Walfisz 1919. Über die Nichfortsetzbarkeit einiger durch Dirichletsche Reihen definierter Funktionen, Rendiconti di Palermo 44, 82–86. C. de La Vallée–Poussin, 1896. Recherches analytiques sur la théorie des nombres, 1, Ann. Soc. Scient. Bruxelles 20, 183–256. J. Lee, 1989. On the constant in the Turán–Kubilius inequality, PhD Thesis, Univ. Michigan. W.J. LeVeque, 1949. On the size of certain number theoretic functions, Trans. Amer. Math. Soc. 66, 440–463. B.V. Levin & N.M. Timofeev, 1971. An analytic method in probabilistic number theory (en russe), Vladimir. Gos. Ped. Inst. Uˇ cen. Zap. 38, 57–150. N. Levinson, 1974. More than one third of the zeros of Riemann’s zeta function are on σ = 12 , Adv. Math. 13, 383–436. 1975. A simplification of the proof that N0 (T ) > 13 N (T ) for Riemann’s zeta-function, Adv. Math. 18, 239–242. P. Lévy, 1925. Calcul des probabilités, Gauthier-Villars, Paris. 1931. Sur les séries dont les termes sont des variables éventuelles indépendantes, Studia Math. 3, 119–155. 1937. Théorie de l’addition des variables aléatoires, Gauthier-Villars, Paris (2nde éd., 1954). Ju. V. Linnik, 1941. Le grand crible (en russe), Dokl. Akad. Nauk SSSR 30, 292–294.

576

BIBLIOGRAPHIE

J.E. Littlewood, 1924. On the zeros of the Riemann Zeta-function, Cambr. Phil. Soc. Proc. 22, 295– 318. 1971. The quickest proof of the prime number theorem, Acta Arith. 18, 83–86. M. Loève, 1963. Probability Theory, 2 vols. Springer ; 4◦ éd. 1977. E. Lukacs, 1970. Characteristic functions, 2◦ éd., Griffin (London). H. Maier, 1985. Primes in short intervals, Michigan Math. J. 32, 221–225. H. Maier & C. Pomerance, 1990. Unusually large gaps between consecutive primes, Trans. Amer. Math. Soc. 322, no 1, 201–237. H. Maier & G. Tenenbaum, 1984. On the set of divisors of an integer, Invent. Math. 76, 121–128. H. von Mangoldt, 1895. Zu Riemann’s Abhandlung : “Über die Anzahl der Primzahlen unter einer gegebenen Grösse”, J. reine angew. Math. 114, 255–305. H.B. Mann, 1942. A proof of the fundamental theorem on the density of sums of sets of positive integers, Ann. Math. (2) 43, 523–527. B. Martin & G. Tenenbaum, 2010. Sur l’inégalité de Turán-Kubilius friable, J. reine angew. Math. 647, 175–234. D.W. Masser, 1985. Open problems, Proc. Symp. Analytic Number Theory, (W.W.L. Chen, ed.), Imperial Coll. London. J. Maynard, 2015. Small gaps between primes, Annals Math. 181, 1, 383–413. M. Mendès France, 2007. Cantorian tableaux revisited, Funct. Approx. Comment. Math. 37, n◦ 2, 329– 336. M. Mendès France & G. Tenenbaum, 1993. Systèmes de points, diviseurs, et structure fractale, Bull. Soc. Math. de France 121, 197–225. F. Mertens, 1874. Ein Beitrag zur analytischen Zahlentheorie. Über die Vertheilung der Primzahlen, Borchardt J. 78, 46-63. 1898. Über eine Eigenschaft der Riemann’schen ζ -Function, Wien. Ber. 107, 14291434. R.J. Miech, 1969. A number theoretic constant, Acta Arith. 15, 119–137. H.L. Montgomery, 1968. A note on the large sieve, J. London Math. Soc. 43, 93–98. 1971. Topics in Multiplicative Number Theory, Springer Lecture Notes 227, Springer, Berlin, Heidelberg. 1978a. The analytic principle of the large sieve, Bulletin of the Amer. Math. Soc. 84, no 4, 547–567. 1978b. A note on the mean values of multiplicative functions, Inst. Mittag-Leffler, Report no 17. 1987. Fluctuations in the mean of Euler’s phi function, Proc. Indian Acad. Sci. Math. Sci. 97, nos. 1–3, 239–245.

INTRODUCTION À LA THÉORIE ANALYTIQUE ET PROBABILISTE DES NOMBRES

1994.

577

Ten lectures on the interface between analytic number theory and harmonic analysis, CBMS Regional Conference Series in Mathematics, 84, Published for the Conference Board of the Mathematical Sciences, Washington, DC, by the American Mathematical Society, Providence, RI. xiv+220 pp. H.L. Montgomery & R.C. Vaughan, 1973. On the large sieve, Mathematika 20, 119–134. 1974. Hilbert’s inequality, J. London Math. Soc. (2) 8, 73–81. 1977. Exponential sums with multiplicative coefficients, Invent. Math. 43, 69–82. 1979. Mean values of character sums, Can. J. Math. 31, 476–487. 1981. The distribution of squarefree numbers, in : H. Halberstam & C. Hooley (eds.), Recent Progress in Analytic Number Theory, Academic Press ; vol. 1, 247–256. 2001. Mean values of multiplicative functions, Period. Math. Hungar. 43 (2001), nos 1-2, 199–214. L. Moser & J. Lambek, 1953. On monotone multiplicative functions, Proc. Amer. Math. Soc. 4, 544–545. M. Ram Murty, 1988. Prime numbers in certain arithmetic progressions, J. Madras University 51, 161–169. M. Ram Murty & N. Thain, 2006. Prime numbers in certain arithmetic progressions, Funct. Approx. Comment. Math. 35, 249–259. Y. Motohashi, 1979. A note on the large sieve. III, Proc. Japan Acad. Ser. A Math. Sci. 55, n◦ 3, 92–94. M. Naïmi, 1988. Les entiers sans facteur carré  x dont les facteurs premiers sont  y, Groupe de travail en théorie analytique des nombres 1986-87, 69-76, Publ. Math. Orsay 88-01, Univ. Paris XI, Orsay. M. Nair, 1982a. On Chebyshev-type inequalities for primes, Amer. Math. Monthly, 89, no 2, 126–129. 1982b. A new method in elementary prime number theory, J. London Math. Soc. (2) 25, 385–391. P. Nanopoulos, 1975. Lois de Dirichlet sur N∗ et pseudo-probabilités, C. R. Acad. Sci. Paris 280, Série A, 1543–1546. 1977. Lois zêta et fonctions arithmétiques additives : loi faible des grand nombres, C. R. Acad. Sci. Paris 285, Série A, 875–877. 1982. Lois zêta et fonctions arithmétiques additives : convergence vers une loi normale, C. R. Acad. Sci. Paris, Série I, 295, 159–161. D.J. Newman, 1980. Simple analytic proof of the prime number theorem, Amer. Math. Monthly 87, no 9, 693–696. J.-L. Nicolas, 1974/75. Grandes valeurs des fonctions arithmétiques, Sém. de Théorie des Nombres (Delange-Pisot-Poitou) 16-ième année, no G20. 1978. Sur les entiers N pour lesquels il y a beaucoup de groupes abéliens d’ordre N , Ann. Inst. Fourier 28, 1–16. 1983a. Petites valeurs de la fonction d’Euler, J. Number Theory 17, 375–388. 1983b. Autour de formules dues à A. Selberg, Pub. Math. Orsay 83-04, Colloque Hubert Delange, 122–134. 1984. Sur la distribution des nombres entiers ayant une quantité fixée de nombres premiers, Acta Arith. 44, 191–200.

578

BIBLIOGRAPHIE

1988.

On highly composite numbers, in : G. E. Andrews, R. A. Askey, B. C. Berndt, K. G. Ramanathan & R. A. Rankin (eds.), Ramanujan Revisited, Academic Press, 215–244.

K.K. Norton, 1971. Numbers with small prime factors and the least kth power non-residue, Mem. Amer. Math. Soc. no 106. 1976. On the number of restricted prime factors of an integer I, Illinois J. Math. 20, 681–705. 1978. Estimates for partial sums of the exponential series, J. Math. Analysis and Appl. 63, 265–296. 1979. On the number of restricted prime factors of an integer II, Acta Math. 143, 9–38. 1982. On the number of restricted prime factors of an integer III, Enseign. Math., II Sér., 28, 31–52. E.V. Novoselov, 1964. A new method in probabilistic number theory (en russe), Izv. Akad. Nauk SSSR, Ser. Mat., 28, 307–364. A. Oppenheim, 1926. On an arithmetic function, J. London Math. Soc. 1, 205–211. 1927. On an arithmetic function, II, J. London Math. Soc. 2, 123–130. A. Page, 1935. On the number of primes in an arithmetic progression, (English) Proc. London math. Soc. (2) 39, 116-141. R.E.A.C. Paley, 1932. A theorem on characters, J. London Math. Soc. 7, 28–32. D.P. Parent, 1978. Exercices de théorie des nombres, Gauthier-Villars. E. Phillips, 1933. The zeta function of Riemann : further developments of van der Corput’s method, Quart. J. Math. (Oxford) 4, 209–225. J. Pintz, 1984. On the remainder term of the prime number formula and the zeros of Riemann’s zeta function, in : H. Jager (ed.), Number Theory, Noordwijkerhout 1983, Lecture Notes in Mathematics 1068, Springer, Berlin, 186–197. 1997. Very large gaps between consecutive primes, J. Number Theory 63 (1997), no 2, 286–301. G. Pólya, 1919. Verschiedene Bemerkungen zur Zahlentheorie, Jahresber. Deutsch. Math.-Ver. 28, 31–40. C. Pomerance, 1984. On the distribution of round numbers, in : K. Alladi (ed.), Number theory, Proc. 4th Matsci. Conf. Ootacamund, India, 1984, Springer Lecture Notes 1122, 173– 200. 1995. The role of smooth numbers in number-theoretic algorithms, Proceedings of the International Congress of Mathematicians, Vol. 1, 2 (Zürich, 1994), 411– 422, Birkhäuser, Basel. K. Prachar, 1958. Über die kleinste quadratfreie Zahl einer arithmetischen Reihe, Monatsh. Math. 62, 173–176. S. Ramanujan, 1915. Highly composite numbers, Proc. London Math. Soc. (2) 14, 347–409. O. Ramaré, 2001a. A purely anaytical bound for L(1,χ), prépublication.

INTRODUCTION À LA THÉORIE ANALYTIQUE ET PROBABILISTE DES NOMBRES

579

2001b. Approximate formulae for L(1,χ), Acta Arith. 100, no 3, 245–266. 2004. Approximate formulae for L(1,χ), II, Acta Arith. 112, no 2, 141–149. R. Rankin, 1938. The difference between consecutive prime numbers, J. London Math. Soc. 13, 242–247. A. Rényi, 1950. On the large sieve of Ju. V. Linnik, Compositio Math. 8, 68–75. 1955. On the density of certain sequences of integers, Publ. Inst. Math. (Belgrade) 8, 157–162. 1965. A new proof of a theorem of Delange, Publ. Math. Debrecen 12, 323–329. A. Rényi & P. Turán, 1958. On a theorem of Erdos–Kac, ˝ Acta Arith. 4, 71–84. G.J. Rieger, 1972. Über einige arithmetische Summen, Manuscripta Math. 7, 23–34. 1983. On Wiener’s method in prime number theory, Abstracts Amer. Math. Soc. 4, no 5, Abstract 802-10-86, p. 144 ; II, ibid., no 5, Abstract 83 T-10-345, p. 392. B. Riemann, 1859. Über die Anzahl der Primzahlen unter einer gegebenen Grösse, Monatsberichte der Berliner Akademie, 671–680 ; voir : Œuvres de Riemann, Albert Blanchard, Paris 1968, 165–176. M. Riesz, 1909. Sur les séries de Dirichlet et les séries entières. C. R. Acad. Sci. Paris 149, 909–912. J. Rivat & P. Sargos, 2001. Nombres premiers de la forme ⌊nc ⌋, Canad. J. Math. 53, no 2, 414–433. J. Rivat & G. Tenenbaum, 2005. Constantes d’Erdos–Turán, ˝ The Ramanujan Journal 9, 111–121. J. Rivat & J. Wu, 2001 Prime numbers of the form [nc ], Glasg. Math. J. 43, no 2, 237–254. O. Robert & G. Tenenbaum, 2013. Sur la répartition du noyau d’un entier, Indag. Math. 24, 802–914. O. Robert, C. Stewart & G. Tenenbaum, 2014. A refinement of the abc conjecture, Bull. London. Math. Soc. 46, 1156–1166. B.A. Rogozin, 1961. An estimate for concentration functions, Theor. Probab. Appl. 6, 94–97. J.B. Rosser & L. Shoenfeld, 1962. Approximate formulas for some functions of prime numbers, Illinois J. Math. 6, 64–94. 1975. Sharper bounds for the Chebyshev functions ϑ(x) and ψ(x), Math. Comp. 29, 243–269. K.F. Roth, 1955. Rational approximations to algebraic numbers, Mathematika 2, 1–20 ; corrigendum, 168. 1965. On the large sieves of Linnik and Rényi, Mathematika 12, 1–9. W. Rudin, 1970. Real and Complex Analysis, McGraw-Hill. I.Z. Ruzsa, 1982. Effective results in probabilistic number theory, in : J. Coquet (ed.), Théorie élémentaire et analytique des nombres, Dépt. Math. Univ. Valenciennes, 107– 130. 1983. On the variance of additive functions, Studies in Pure Mathematics, Mem. of P. Turán, 577–586.

580

BIBLIOGRAPHIE

1984. Generalized moments of additive functions, J. Number Theory 18, 27–33. B. Saffari, 1976. On the asymptotic density of sets of integers, J. London Math. Soc. (2) 13, 475–485. 1979. Comportement à l’infini de la transformée de Fourier de μf pour f (fortement) additive telle que f (p) = (log p)−α , α > 0 fixé, communication privée. E. Saias, 1989. Sur le nombre des entiers sans grand facteur premier, J. Number Theory 32, no 1, 78–99. 1993. Entiers sans grand ni petit facteur premier. III, Acta Arith. 71, no 4, 351–379. A. Sárközy, 1977a. Some remarks concerning irregularities of distribution of sequences of integers in arithmetic progressions, IV, Acta Math. Acad. Sci. Hung. 30, 155–162. 1977b. Remarks on a paper of G. Halász, Periodica Math. Hung. 8, 135–150. L.G. Sathe, 1953. On a problem of Hardy and Ramanujan on the distribution of integers having a given number of prime factors, J. Indian Math. Soc. 17, 63–141. 1954. (même titre), J. Indian Math. Soc. 18, 27–81. L.G. Schnirelmann, 1930. Über additive Eigenschaften von Zahlen, Annals Inst. polyt. Novocherkassk. 14, 3–28 ; Math. Annalen 107 (1933), 649–690. I.J. Schoenberg, 1928. Über die asymptotische Verteilung reeller Zahlen mod 1, Math. Z. 28, 171–200. 1936. On asymptotic distributions of arithmetical functions, Trans. Amer. Math. Soc. 39, 315–330. L. Schoenfeld, 1976. Sharper bounds for the Chebyshev functions ϑ(x) and ψ(x), II, Math. Comp. 30, 337–360. A. Selberg, 1942. On the zeros of Riemann’s zeta-function on the critical line, Skr. Norske Vid. Akad. Oslo, no 10. 1946. Contributions to the theory of the Riemann zeta-function, Arch. Math. Naturvid. 48, no 5, 89–155. 1947. On an elementary method in the theory of primes, Norske Vid. Selsk. Forh., Trondhjem 19, n◦ 18, 64–67. 1949. An elementary proof of the prime number theorem, Ann. Math. 50, 305–313. 1954. Note on the paper by L.G. Sathe, J. Indian Math. Soc. 18, 83–87. 1977. Remarks on multiplicative functions, in : Number theory day (Proc. Conf., Rockefeller Univ., New York, 1976), pp. 232–241. Lecture Notes in Math., Vol. 626, Springer, Berlin, 1977. H.N. Shapiro, 1950. On the number of primes less than or equal to x, Proc. Amer. Math. Soc. 1, 346–348. 1959. Tauberian theorems and elementary prime number theory, Comm. Pure Appl. Math. 12, 579–610. 1972. On the convolution ring of arithmetic functions, Comm. Pure Appl. Math. 25, 287–336. C.L. Siegel, 1921. Über den Thueschen Satz, Krist. Vid. Selsk. Skr. I, no 16, 12 S. 1936. Über die Classenzahl quadratischer Körper, Acta Arith. 1, 83–86. 1966. Gesammelte Abhandlungen, Springer-Verlag, vol. 1, 406–409.

INTRODUCTION À LA THÉORIE ANALYTIQUE ET PROBABILISTE DES NOMBRES

581

V. Sitaramaiah & M.V. Subbarao, 1993. The maximal order of certain arithmetic functions, Indian J. Pure Appl. Math. 24(6), 347-355. M. Skałba, On ζ -convergence of sequences, Math. Slovaca 48, 167–172. H. Smida, 1991. Sur les puissances de convolution de la fonction de Dickman, Acta Arith. 59, 123–143. A. Smith, 1980. On Shapiro’s Tauberian theorem, Carleton Math. Ser. 170, 14 pp. A.V. Sokolovskii, 1979. Lower bounds in the “large sieve", Zap. Nauˇcn. Sem. Leningrad. Otdel. Mat. Inst. Steklov. (LOMI) 91, 125–133, 181–182 ; English translation : J. Soviet. Math. 17 (1981), 2166–2173. K. Soundararajan, 2007. Small gaps between prime numbers : the work of Goldston-Pintz-Yıldırım, Bull. Amer. Math. Soc. (N.S.) 44, no 1, 1–18. E. Sperner, 1928. Ein Satz über Untermengen einer endlichen Menge, Math. Z. 27, 544-548. H. Squalli, 1985. Sur la répartition du noyau d’un entier, Thèse 3-ième cycle, Univ. Nancy I. B. Srinivasan & A. Sampath, 1988. An elementary proof of the prime number theorem with a remainder term, J. Indian Math. Soc. (N.S.) 53, nos 1-4, 1–50. A. Stef & G. Tenenbaum, 2001. Inversion de Laplace effective, The Annals of Probability 29, no 1, 558–575. C.M. Stein, 1984. On the Turán–Kubilius inequality, Technical Report no 220, Stanford University. T.J. Stieltjes, 1887. Note sur la mutliplication de deux séries, Nouvelles Annales de Mathématiques, sér. 3, 6, 210–215. D. Suryanarayana & R.R. Sitaramachandra, 1973. The distribution of squarefull integers, Arkiv. Math. 11, 195–201. P. Szüsz, 1974. Remark to a theorem of P. Erdos, ˝ Acta Arith. 26, 97–100. A. Tauber, 1897. Ein Satz aus der Theorie der unendlichen Reihen, Monatshefte für Mathematik und Physik 8, 273–277. G. Tenenbaum, 1982. Sur la densité divisorielle d’une suite d’entiers, J. Number Theory 15, no 3, 331-346. 1984. Sur la probabilité qu’un entier possède un diviseur dans un intervalle donné, Compositio Math. 51, 243–263. 1985. Sur la concentration moyenne des diviseurs, Comment. Math. Helvetici 60, 411-428. 1987. Sur un problème extrémal en Arithmétique, Ann. Inst. Fourier (Grenoble) 37, 2, 1–18. 1989. La méthode du col en théorie analytique des nombres, in : C. Goldstein (ed.), Séminaire de Théorie des Nombres, Paris 1986–87, Prog. Math. 75, 411–441, Birkhäuser.

582

BIBLIOGRAPHIE

1990. Sur un problème d’Erdos ˝ et Alladi, in : C. Goldstein (ed.), Séminaire de Théorie des Nombres, Paris 1988–89, Prog. Math. 91, 221–239, Birkhäuser. 1999. Crible d’Ératosthène et modèle de Kubilius, in : K. Gyory, ˝ H. Iwaniec, J. Urbanowicz (eds.), Number Theory in Progress, Proceedings of the conference in honor of Andrzej Schinzel, Zakopane, Poland 1997, 1099–1129, Walter de Gruyter, Berlin, New York. 2006. Integers with a large friable component, Acta Arith. 124, no 3, 287–291. 2007. Remarques sur les valeurs moyennes de fonctions multiplicatives, Ens. Mathématique 53, 155–178. 2014. Théorie analytique et probabiliste des nombres : 307 exercices corrigés (en collaboration avec J. Wu), coll. Échelles, Belin, Paris, 347 pp. G. Tenenbaum & M. Mendès France, 2000. Les nombres premiers, collection « Que sais-je ? », no 571, Presses Universitaires de France, seconde éd. G. Tenenbaum & J. Wu, 2003. Moyennes de certaines fonctions multiplicatives sur les entiers friables, J. reine angew. Math. 564, 119–166. 2008a. Moyennes de certaines fonctions multiplicatives sur les entiers friables, 3, Compositio Math. 144, n◦ 2, 339–376. 2008b. Moyennes de certaines fonctions multiplicatives sur les entiers friables, 4, Actes du colloque de Montréal, 2006, Centre de Recherches Mathématiques, CRM Proceedings and Lecture Notes 46, 129–141. A. Thue, 1909. Über Annäherungswerte algebraischer Zahlen, J. für Math. 135, 284-305. E.C. Titchmarsh, 1939. The theory of functions, Oxford University Press (seconde édition, réimpression en 1979). 1951. The theory of the Riemann zeta-function, Oxford University Press. E.C. Titchmarsh & D.R. Heath-Brown, 1986. The theory of the Riemann zeta-function, Oxford. K.C. Tong, 1956. On divisor problems II, III, Acta Math. Sinica 6, 139–152 ; 515–541. P. Turán, 1934. On a theorem of Hardy and Ramanujan, J. London Math. Soc. 9, 274–276. 1936. Über einige Verallgemeinerungen eines Satzes von Hardy und Ramanujan, J. London Math. Soc. 11, 125–133. J.D. Vaaler, 1985. Some extremal functions in Fourier Analysis, Bull. (N.S.) of the Amer. Math. Soc. 12, 183–216. G. Valiron, 1955. Théorie des fonctions (2-nde édition), Masson, Paris. R.C. Vaughan, 1980. An elementary method in prime number theory, Acta Arith. 37, 111–115. 1997. The Hardy-Littlewood method, second edition, Cambridge University Press. A.I. Vinogradov, 1965. On the density hypothesis for Dirichlet L-functions, Izv. Akad. Nauk SSSR, Ser. Math. 29, 903–934. 1966. Correction to the paper of A.I. Vinogradov ‘On the density hypothesis for Dirichlet L-functions’ , Izv. Akad. Nauk SSSR, Ser. Math. 30, 719–720. I.M. Vinogradov, 1954. The method of trigonometric sums in the theory of numbers, Interscience. 1958. A new estimate for ζ (1 + it) (en russe), Izv. Akad. Nauk SSSR, Ser. Math. 22, 161–164.

INTRODUCTION À LA THÉORIE ANALYTIQUE ET PROBABILISTE DES NOMBRES

583

G. Voronoï, 1903. Sur un problème de calcul des fonctions asymptotiques, J. reine angew. Math. 126, 241–282. M. Vose, 1984. Integers with consecutive divisors in small ratio, J. Number Theory 19, 233– 238. A. Walfisz, 1963. Weylsche Exponentialsummen in der Neueren Zahlentheorie, VEB Deutscher Verlag, Berlin. R. Warlimont, 1969. On squarefree numbers in arithmetic progressions, Monatsh. Math. 73, 433– 448. 1980. Squarefree numbers in arithmetic progressions, J. London Math. Soc. (2) 22, no 1, 21–24. N. Watt 1989. Exponential sums and the Riemann zeta function II, J. London Math. Soc. (2) 39, 385–404. H. Weyl 1916. Über die Gleichverteilung von Zahlen mod. Eins, Math. Ann 77, 313–404. 1921. Zur Abschätzung von ζ (1 + ti), Math. Z. 10, 88–101. E.T. Whittaker & G.N. Watson, 1927. A course of modern analysis (4-ième éd.), Cambridge University Press (réimpression : 1986). D.V. Widder, 1946. The Laplace transform, Princeton University Press, Princeton, New Jersey. 1971. An introduction to transform theory, Academic Press, New York and London. E. Wirsing, 1956. Über die Zahlen, deren Primteiler einer gegeben Menge angehören, Arch. der Math. 7, no 4, 263–272. 1967. Das asymptotische Verhalten von Summen über multiplikative Funktionen II, Acta Math. Acad. Sci. Hung. 18, 411–467. J. Wu, 1990. Sur la suite des nombres premiers jumeaux, Acta Arith. 55, 365–394. 2004. Chen’s double sieve, Goldbach’s conjecture and the twin prime problem, Acta Arith. 114, no 3, 215–273. D. Zagier, 1997. Newman’s short proof of the prime number theorem, Amer. Math. Monthly 104 no 8, 705–708. Y. Zhang, 2014. Bounded gaps between primes, Annals Math. 179, n◦ 3, 1121–1174.

I NDEX

A Abel, Niels critère de convergence, 20 règle, 20 sommation, 19, 20 théorème, 311, 340 transformation, 19 abélien (théorème), 312, 313, 315 abscisse de convergence, 194, 196–198, 200, 201, 203, 208, 213–217 de convergence absolue, 194 absolument continue fonction de répartition —, 412, 420 addition des suites, 406 Alladi, Krishnaswami, 109, 342, 503, 520 Alladi & Erdos, ˝ 75, 129, 447 anneau des fonctions arithmétiques, 46, 53, 55 des séries de Dirichlet formelles, 45 factoriel, 46 Aparicio Bernardo, Emiliano, 37 arcsinus (loi), 300, 301 Arratia, Richard, voir ci-dessous Arratia & Stark, 552 Artin, Emil, 176, 177, 180 atomique fonction de répartition —, 412, 420, 425 Axer, Aleksander, 74 Ayoub, Raymond, 388

B Babu, G. Jogesh, 420, 479 Bachet, Claude-Gaspard, 38, 157

Balazard, Michel, 305, 306, 447 Balazard & Smati, 286 Balazard & Tenenbaum, 286 Balazard, Delange & Nicolas, 305 bande critique, 234, 236, 238, 241, 365, 373 Barban & Vinogradov, 552 Bateman, Paul T., 272, 278, 286 Behrend, Felix, 426 Bernoulli, Jacques fonctions, 22, 24, 138, 234, 241 nombres, 22, 232, 233, 369 variables aléatoires, 429 Bernstein, Felix, voir Cantor Berry–Esseen inégalité, 327, 329, 332, 333, 342, 416, 476, 477 théorème, 347 Bertrand, Joseph postulat, 28, 39, 40 Besicovitch, Abram S., 449 Beurling, Arne, 104, 111 Bézout, Étienne, 38 Bienaymé, Jules, voir ci-dessous Bienaymé–Tchébychev, 428 Bingham, Nick H., voir ci-dessous Bingham, Goldie & Teugels, 315 Blanchard, André, 271 Bohr, Harald, 207–209, 212, 327 Bohr–Mollerup, 177 Bombieri, Enrico, 83, 111, 389 Bombieri & Davenport, 112, 116 Bombieri & Iwaniec, 70, 130, 249 Bombieri–Vinogradov, 111, 112, 116, 389, 390 bonne approximation, 168

Borel, Émile, voir ci-dessous Borel–Carathéodory, 240, 247 Bovey, John D., 445 de la Bretèche, Régis, voir ci-dessous de la Bretèche & Tenenbaum, 433, 442, 446, 521, 523, 525, 529 Brlek, Srecko, ˇ voir ci-dessous Brlek, Mendès France, Robson & Rubey, 166 de Bruijn, Nicolaas Govert, 489, 498, 501, 503, 506, 508, 520, 521, 556 de Bruijn, van Ebbenhorst Tengbergen & Kruyswijk, 426 Brun, Viggo, 79, 81, 82, 92, 94, 109, 114, 530 Brun–Titchmarsh, 93 Buchstab, Aleksandr Adolfovich fonction de —, 110, 534, 538, 554 identité, 495, 496, 498, 499, 533, 559 Burgess, David A., 389

C Cahen, Eugène, 208 Cantor, Georg, 154, 165, 166 Cantor–Bernstein, 165 Cantor–Mendès France, 166 caractère de Dirichlet, 353 primitif, 111, 354 principal, 353 réel, 353, 366, 374, 378 caractères d’un groupe abélien, 350 de (Z/qZ)∗ , 352 orthogonalité des —, 353 Carathéodory, Constantin, voir Borel

INDEX

Carlson, Fritz, 227 carru, 76 Cartan, Henri, 72, 194 Cashwell, Edmond D., voir ci-dessous Cashwell & Everett, 46 cercle méthode du —, 551 problème du —, 130, 138, 148 quadrature du —, 165 Cesàro, Ernesto, 206, 312, 344 chaînes de diviseurs, 426 Chen, Jing Run, 389 Chowla, Sarvadaman, 390 classe Lα (N∗ ), 479 classes (formule des —), 389 Cohen, Eckford, 76 col (méthode du —), 129, 306, 501, 505, 508, 513, 520, 523, 532, 537–539, 541, 544, 551, 552, 554 comparaison d’une somme et d’une intégrale, 21, 203 compléments formule des —, 182–184, 188, 232, 233, 285, 372 complètement additive fonction —, 43 complètement multiplicative fonction —, 43 concentration, 342, 420, 421 des diviseurs, 290, 426, 452 fonction de —, 342, 420, 421 sur les diviseurs, 426 conducteur, 355 conjecture abc, 211 d’Elliott–Halberstam, 390 de Goldbach, 115 Conrey, J. Brian, 271 constante de Markov, 167 continuité (théorème de —), 415, 454 convergence faible, 412, 415, 428, 476, 481 vers la loi de Gauss, 414, 486 convolution de Dirichlet, 46 de fonctions de répartition, 418 van der Corput, Johannes Gualtherus, 59, 70, 130, 132–138, 144, 145, 254 corrélation, 145 Cramér, Harald, 415, 418 crible à puissances, 101

combinatoire, 79, 117 d’Ératosthène, 78, 79, 80, 114 de Brun pur, 79 de Selberg, 94, 95, 102, 103, 105, 112, 115, 116 dimension, 110 grand —, 83, 84, 86, 89, 92, 93, 110, 111, 115, 444 grand — arithmétique, 90 lemme fondamental du — combinatoire, 81, 114 critère de Fejér, 149 de Weyl, 141, 142, 148 croissance lente, 340, 463

D Daboussi, Hédi, 28, 71, 111, 410, 480, 484, 485, 518, 550 Daboussi & Delange, 111, 485 Davenport, Harold, 388, 388, 389, voir aussi Bombieri Davenport & Erdos, ˝ 406–408 Davenport & Halberstam, 84 décomposition de Lebesgue, 412 De Koninck & Tenenbaum, 307, 446 Dedekind, Richard, 165 Delange, Hubert, 111, 275, 286, 287, 305, 308, 327, 341, 392, 405, 454, 458, 459, 461, 462, 480, 481, 482, voir aussi Daboussi Delange & Tenenbaum, 207 dénombrable, 154, 166 densité, 400 analytique, 403 asymptotique, 401 asymptotique inférieure, 401 asymptotique supérieure, 401 d’une loi de probabilité, 301, 343 de Schnirelmann, 406 divisorielle, 406, 449, 450 logarithmique, 402 logarithmique inférieure, 402 logarithmique supérieure, 402 multiplicative, 407, 408 naturelle, 401 naturelle inférieure, 401 naturelle supérieure, 401 séquentielle, 408 Deshouillers, Dress & Tenenbaum, 307

585

diagonale de Cantor, 154, 166 de Cantor–Mendès France, 166 Diamond, Harold, 70, 71, 269, 292, 341 Diamond & Halberstam, 109 Dickman, Karl fonction de —, 104, 105, 110, 495, 496, 499, 500, 505, 521, 539, 558 fonction de — généralisée, 105 Dirichlet, Peter G. Lejeune–, 349, 350, 359 caractère, 111, 353 convolution, 46, 96 formule des classes, 389 formule pour Ŵ ′ /Ŵ, 187 principe de l’hyperbole, 58, 75 problème des diviseurs, 58, 59, 130, 138 série L, 358 série de — formelle, 45, 95 théorème d’approximation, 152, 153, 155, 164, 202, 396 théorème de la progression arithmétique, 93, 114, 350, 359 discrépance, 142, 148, 150 discriminant fondamental, 388 distance de Lévy, 557 diviseurs chaînes de —, 426 concentration sur les —, 426 des entiers friables, 551 en progressions arithmétiques, 394 Dress, François, 209, 210, voir aussi Deshouillers Dress, Iwaniec & Tenenbaum, 390 Drmota, Michael, 338 Dupain, Hall & Tenenbaum, 406 duplication formule de, 180, 233, 372 dyadique, 166 Dyson, Freeman J., 154

E van Ebbenhorst Tengbergen, Ca., voir de Bruijn écarts entre nombre premiers, 116 Edwards, Harold M., 231

586

INDEX

élémentaire, 427 Elliott, Peter D.T.A., 94, 111, 342, 418, 420, 434, 443, 444, 479–481, 484, 552, 557 Elliott & Ryavec, 481 Elliott–Halberstam, 390 Ellison & Mendès France, 71, 269, 271, 388, 389 empirique (variance), 428, 430, 433 Ennola, Veikko, 493, 494, 518 ensemble de multiples, 408, 449 entiers carrus, 76 friables, 488 équation de Pell, 171 de Volterra, 520 différentielle aux différences, 104, 495, 499, 520, 534, 536, 538, 555 équation fonctionnelle approchée, 249 asymétrique pour ζ (s), 233 asymétrique pour L(s,χ ), 372 pour Ŵ (s), 176 pour (x,y), 533 pour (x,y), 494 pour ϑ (x), 254 symétrique pour ζ (s), 233 symétrique pour L(s,χ ), 371 équipotents (ensembles), 165 équirépartie modulo 1 suite —, 140, 145 équivalents (nombres), 162 Ératosthène crible d’—, 78–80, 114 Erdos, ˝ Paul, 28, 28, 37, 55, 71, 116, 129, 287, 413, 424, 425, 441, 444, 445, 446, 454, 479, 557, voir aussi Alladi ; Davenport Erdos ˝ & Hall, 451 Erdos, ˝ Hall & Tenenbaum, 408 Erdos ˝ & Ingham, 344 Erdos ˝ & Kac, 310, 476, 482 Erdos ˝ & Nicolas, 126, 127 Erdos, ˝ Saffari & Vaughan, 410 Erdos ˝ & Sárközy, 126 Erdos, ˝ Sárközy & Szemerédi, 426 Erdos ˝ & Shapiro, 70 Erdos ˝ & Tenenbaum, 126, 446 Erdos ˝ & Turán, 142, 143 inégalité, 146, 149, 150 Erdos ˝ & Wintner, 452, 453, 479, 484

Esseen, Carl–Gustav, 422, voir aussi Berry Estermann, Theodor, 384 Euclide, 350 algorithme, 159 premier théorème, 27, 38 second théorème, 27, 28 Euler, Leonhard, 42, 165, 175, 184 constante, 23, 26 fonction indicatrice, 44, 45, 51, 54, 60, 61, 63, 70, 75, 122, 123, 127, 272, 278, 288, 424, 425, 451 formule, 35, 73 Euler–Maclaurin formule, 21, 23, 24, 26, 70, 147, 148, 181, 229, 231, 254, 494 Everett, Cornelius J., voir Cashwell Evertse, Jan–Hendrik, voir ci-dessous Evertse, Moree, Stewart & Tijdeman, 521

F facteurs directs, 409 factoriel anneau, 46 Farey, John suite de —, 61, 76 Fejér, Lipót critère, 149 noyau, 149, 325, 419, 422 Feller, William, 327, 333, 347, 415, 418, 453 Fermat, Pierre de, 105, voir aussi Girard Fibonacci, Leonardo suite, 160 fonction à croissance lente, 340, 463 Bêta d’Euler, 178 caractéristique, 332, 415, 453, 455 d’Alladi–Erdos, ˝ 75, 129, 447 de Buchstab, 110, 534, 538, 554 de Dickman, 104, 105, 110, 495, 496, 499, 500, 505, 521, 539, 558 de Dickman généralisée, 105 de Jacobsthal, 515 de saut, 412 Delta de Hooley, 290, 426, 452 Gamma, 175 sphérique, 188 thêta de Jacobi, 254

trapézoïdale, 329 fonction additive, 43, 433, 452, 524 fonction arithmétique, 43 fonction de concentration, 342, 420, 421 fonction de répartition, 332, 411 absolument continue, 412, 420 atomique, 412, 414, 420, 425 d’une fonction additive, 483 d’une fonction arithmétique, 405, 412, 413, 416, 417, 424, 425, 451, 453–455, 457, 476, 479, 484, 525 discrète, 412 impropre, 412 purement singulière, 412, 420, 425 fonction multiplicative, 43, 47, 48, 54, 55, 66–68, 71, 72, 77, 81, 92, 95, 97–100, 116, 120, 124, 127, 191, 216, 275, 295, 296, 303, 304, 367, 417, 437, 444, 451, 454, 455, 459, 462–464, 467, 471, 473, 476, 479, 480, 483, 484, 488, 489 au sens de Selberg, 95 monotone, 55 normale, 95 régulière, 95 singulière, 95 fonctionde Jacobsthal, 525 fonctions L de Dirichlet, 111, 358, 365, 374 de Bernoulli, 22, 24 de Tchébychev, 50, 63 fonctions multiplicatives répartition des —, 483 Ford, Kevin, 449 Ford, Green, Konyagin, Maynard & Tao, 525 Ford & Halberstam, 109 formule d’Euler pour Ŵ (s), 175, 186 d’Euler pour sin π z , 88, 184, 188 d’Euler pour ζ (s), 35, 73, 192, 230 d’Euler–Maclaurin, 21, 23, 24, 26, 70, 181, 229, 231, 254, 494 de duplication, 180 des classes, 389 des compléments, 182–184, 188, 232, 233, 285, 372

INDEX

seconde — de la moyenne, 21, 147, 254, 503, 540, 549 formule d’inversion de Fourier, 182, 415 de Laplace, 219, 500, 501, 508, 511, 520, 538, 544 de Möbius, 48, 49, 53, 66, 78 de Möbius généralisée, 96 de Mellin, 182 formule de duplication, 233, 372 Jensen, 239, 242 la cotangente, 380 la valeur moyenne, 225 Legendre–Gauss, 187 Mertens, 34, 78, 123, 439, 501, 527, 536, 538 Parseval, 418 Perron, 218, 220, 222–224, 227 Plancherel, 422, 465, 469 Poisson, 86, 87, 117, 131, 133, 144, 145, 254 Ramanujan, 249 formule de Stirling, 24, 298, 492 complexe, 180, 234, 242, 246, 252, 268, 270, 375, 380 réelle, 179, 245 formule explicite pour ψ (x), 265, 268, 271, 273 pour ψ (x; χ ), 379 fortement additive fonction —, 43 fortement multiplicative fonction —, 43 Fouvry, Étienne, voir ci-dessous Fouvry & Grupp, 112 Fouvry & Tenenbaum, 521, 522 fraction continue, 157 Fresnel, Augustin, 188 Freud, Géza, 320, 341, voir aussi Karamata Freud & Ganelius, 341 friable, 488 Friedlander, John, voir ci-dessous Friedlander & Granville, 523, 556 Friedlander, Granville, Hildebrand & Maier, 555 frontière naturelle, 255

G Galambos, Janos, 445, 479, 484

Galambos & Szüsz, 484 Gallagher, Patrick X., 111, 112, 465, 469 Ganelius, Tord, 327, 328, 329, 333, voir aussi Freud Gantmacher, Felix R., 99 Gauss, Carl Friedrich, 28, 42, 186 formule pour Ŵ ′ /Ŵ, 187 loi, 476, 486 sommes, 355, 356, 388 Gelfond, Aleksandr Osipovich, 37 Gelfond & Linnik, 70, 154 Girard, Albert, 105 Girard–Fermat, 106, 107, 162 Goldbach, Christian, 115, 175 Goldfeld, Dorian, 390 Goldie, Charles M., voir Bingham Goldston, Pintz & Yıldırım, 94, 113, 116 Gorshkov, D.S., 37 Graham, Sidney W., 71, 389 Graham & Kolesnik, 130, 145 Graham & Vaaler, 111 Granville, Andrew, 523, voir aussi Friedlander Granville & Soundararajan, 480 Greaves, George, 95 Green, Ben, voir Ford Grosswald, Emil, 210 Grupp, Frieder, voir Fouvry

H Hadamard, Jacques, 28, 237, 241, 243 formule du produit, 243, 373 lemme des trois cercles, 263, 264 Halász, Gábor, 462–465, 471, 481, 485, 486 Halberstam, Heini, voir Davenport ; Diamond ; Elliott ; Ford Halberstam & Richert, 81, 95, 112, 115, 116, 444 Halberstam & Roth, 406, 408, 426 Hall, Richard R., 395, 406, 444, 450, 451, voir aussi Dupain ; Erdos ˝ Hall & Tenenbaum, 109, 290, 406, 418, 441, 444, 445, 449, 452, 473, 480, 485 Hankel, Hermann contour, 184, 185, 231, 233, 258, 279, 280, 287, 289, 290, 371, 372 formule, 184, 185

587

Hanrot, Tenenbaum & Wu, 113, 524 Hanson, Denis, 37 Hardy, Godfrey H., 59, 146, 263, 269, 340, 344 Hardy & Littlewood approximation de ζ (s), 249 conjecture, 82 équation fonctionnelle approchée, 249 théorème taubérien, 315, 318, 319, 348 Hardy–Littlewood–Karamata, 319, 320, 326, 360, 361, 483 Hardy & Ramanujan, 427, 435 inégalité, 447 Hardy & Riesz, 206, 212, 227 Hardy & Wright, 305 Heath–Brown, D. Roger, 231, 249, 389 Hengartner, Walter, voir ci-dessous Hengartner & Theodorescu, 420, 422 Hensley, Douglas, 105, 306, 521, 523 Heppner, Ernst, 77 Hermite, Charles, 162, 165 Hildebrand, Adolf J., 111, 389, 432, 433, 443, 444, 506, 514, 521, 522, 523, 554, 555, 557, voir aussi Friedlander Hildebrand & Maier, 556 Hildebrand & Tenenbaum, 113, 306, 513, 518, 520, 522, 523, 554–556 Hooley, Christopher, 109 fonction , 290, 426, 452 Hörmander, Lars, 341 Hurwitz, Adolf, 166, 167, 254 Huxley, Martin N., 59, 70, 94, 130, 145, 146, 148, 249 Huxley & Kolesnik, 130 Huxley & Watt, 130 hyperbole (principe de l’—), 58, 64, 67, 70, 75, 138, 338 hypothèse de Riemann, 71, 262–264, 272, 273, 522 hypothèse de Riemann généralisée, 374, 389, 390

I identité de Buchstab, 495, 496, 498, 499, 533, 559 Ramanujan, 238, 273 Selberg, 77

588

INDEX

Ikehara, Shikao, 327, 341, 346, 363–365 voir aussi Wiener Ikehara–Ingham–Delange, 327, 329 inclusion–exclusion, 52, 53, 56, 78, 449 indépendance asymptotique, 429 indépendantes (variables aléatoires), 442 indicatrice d’Euler, 44, 51, 54, 60, 61, 70, 75, 122, 123, 127, 278, 288, 424, 425, 451 ineffective (constante), 154, 365, 384, 387 inégalité Berry–Esseen, 327, 329, 332, 333, 342, 416, 476, 477 Bienaymé–Tchébychev, 428 van der Corput, 133, 135, 136, 144 Erdos–Turán, ˝ 142, 143, 146, 149, 150 Hardy–Ramanujan, 447 Jensen, 423 Kolmogorov–Rogozin, 421 Minkowski, 331 Pólya–Vinogradov, 357, 358, 365, 387 Turán–Kubilius, 428, 430, 431, 433, 434, 436, 442–444, 448, 452, 458, 460, 477, 479 Turán–Kubilius friable, 525 Weyl–van der Corput, 136, 137, 145 Ingham, Albert Edward, 209, 210, 238, 271, 327, 337, 338, 341, 348, voir aussi Erdos ˝ ; Ikehara intégrales trigonométriques, 131 inverse de convolution, 47, 48 Ivi´c, Aleksandar, 145, 231, 249, 251, 269, 271 Ivi´c & Tenenbaum, 529 Iwaniec, Henryk, 82, 109, 110, 525, voir aussi Bombieri ; Dress ; Rosser Iwaniec & Mozzochi, 59, 70, 130

Jensen, Johan formule, 239, 242 inégalité, 423 Jessen & Wintner, 420 Johnsen, John, 112 Johnsen–Selberg, 101 Jordan, Camille, 131 jumeaux nombres premiers —, 82, 92, 94 nombres premiers — généralisés, 116

K Kac, Mark, voir Erdos ˝ Kaczorowski, Jerzy, voir ci-dessous Kaczorowski & Pintz, 209 Kahane & Queffélec, 207 Kalmár, László, 37 Kamae, Teturo, voir ci-dessous Kamae & Mendès France, 145 Karamata, Jovan, 315, 318, 319, 320, 321, 339, 340, 341, 404, 538, voir aussi Hardy–Littlewood Karamata–Freud, 360 Karatsuba, Anatolij A., 146 Katznelson, Yitzhak, 87, 89 Kerner, Sébastien, 306 Kobayashi, Isamu, 94 Kolesnik, Grigori, 70, 130, voir aussi Graham ; Huxley Kolmogorov, Andreï N., 421, 453, 479 Kolmogorov–Rogozin, 421 Konyagin, Sergei, voir Ford Korevaar, Jacob, 210, 315, 335, 341, 343 Korobov, Nikolaï Mikhaïlovich, 250 Kronecker, Leopold notation, 96, 384 symbole, 388 Kruyswijk, D., voir de Bruijn Kubilius, Jonas, 432, 444, 481, 482, 552, voir aussi Turán Kusmin, R.O., 144 Kusmin–Landau, 134, 135, 149

J

L

Jacobi, C. Gustav fonction thêta, 254 symbole, 353 Jacobsthal, Ernst, 515, 525 jauge de Kubilius, 551, 557

La Vallée–Poussin, Charles de, 28, 237, 349 Lagrange, Joseph, 540 critère, 161 Lambek, Joachim, voir Moser

Lambert, Johann Heinrich procédé de sommation, 339 série, 339 Landau, Edmund, 59, 63, 70, 71, 144, 196, 206, 207, 208, 209, 212, 224, 227, 318, 336, 337, 344, 374, 377, 378, 388, 393, voir aussi Kusmin ; Phragmén ; Schnee notation de —, 14 symbole, 14 Landau & Walfisz, 255 Landau–Page, 374, 378, 382, 389 Laplace, Pierre Simon de, 144 Laplace–Stieltjes intégrale de —, 314 transformation de —, 192 Lebesgue, Henri, 176, 180, 183, 315, 318, 412, 416, 419 théorème de décomposition, 412 Lee, Jungseob, 442 Legendre, Adrien–Marie, 28 formule de duplication, 180, 233 symbole, 42, 106, 353 lemme de Gallagher, 465, 469 de la partie réelle, 240, 244, 247, 265 de Landau, 318 de Montgomery–Wirsing, 466 de Riemann–Lebesgue, 87, 261 des trois cercles, 263 lemme fondamental du crible combinatoire, 81, 114 du modèle de Kubilius, 552 LeVeque, William Judson, 482 Levin, B.V., voir ci-dessous Levin & Timofeev, 481 Levinson, Norman, 263, 271 Lévy, Paul, 420 distance, 557 théorème de continuité, 415, 418, 454 Lindelöf, Ernst Leonard, voir aussi Phragmén hypothèse, 234, 252, 253, 263 Lindemann, Ferdinand, 165 Linnik, Yurii Vladimirovich, 83, voir aussi Gelfond Liouville, Joseph, 153, 154, 165, 183 fonction, 77 Littlewood, John Edensor, 250, 341, voir aussi Hardy

INDEX

Loève, Michel, 415, 418 logarithme itéré, 445 loi de Gauss, 476, 486 de l’arcsinus, 300, 301 de répartition, 412 du logarithme itéré, 445 impropre, 412, 428 limite, 405, 412, 413, 416, 417, 424, 425, 451, 453–455, 457, 476, 479, 483, 484, 525 locale, 294, 435 normale, 476, 486 pure, 420, 424, 453 uniforme, 411 longueur d’un polynôme, 321 Lukacs, Eugene, 415, 418, 423

M Maier, Helmut, 556, voir aussi Friedlander ; Hildebrand Maier & Pomerance, 525 Maier & Tenenbaum, 446 majorations effectives, 480 von Mangoldt, Hans, 63, 250, 265 fonction, 40, 44, 49, 229 von Mangoldt, Hansfonction, 39 Mann, Henry B., 406 Markov, Andreï A., 167 Martin, Bruno, voir ci-dessous Martin & Tenenbaum, 522 Masser, David W., 211 Mathan, Bernard de, 340 Maynard, James, 94, 116, voir aussi Ford Mellin, Robert Hjalmar, 182 Mendès France & Tenenbaum, 446 Mendès France, Michel, 145, 166, voir aussi Brlek ; Cantor ; Ellison ; Kamae ; Tenenbaum Mersenne, Marin, 41 Mertens, Franz, 237, 260, 360 formule, 34, 78, 123, 439, 501, 527, 536, 538 premier théorème, 31, 33, 109, 400, 439 second théorème, 34, 41 méthode de Rankin, 109, 489, 501, 515, 550 des moments évanescents, 452 du cercle, 553

du col, 129, 307, 501, 505, 508, 513, 520, 522, 532, 537–539, 541, 544, 551, 552, 554 paramétrique, 109 Miech, Ronald J., 389 Minkowski, Hermann, 331 Möbius, August fonction, 44, 45, 48, 60, 63, 255, 345 formule d’inversion, 48, 49, 53, 66, 78, 530 modèle de Kubilius, 525, 550 lemme fondamental, 552 Mollerup, Johannes, voir Bohr moments évanescents, 450 monotone fonction multiplicative —, 55 Montgomery, Hugh L., 70, 83, 84, 92, 111, 145, 393, 464, 466, 475, 480 Montgomery & Vaughan, 71, 83, 84, 112, 388, 389, 480, 485 Montgomery–Wirsing, 466 Moree, Pieter, voir Evertse Moser, Leo, voir ci-dessous Moser & Lambek, 55 Motohashi, Yoichi, 112 Mozzochi, Charles J., voir Iwaniec Murty, Marouti Ram, 350 Murty & Thain, 350

N Naïmi, Mongi, 529 Nair, Mohan, 30, 37, 72 Nanopoulos, Photius, 406 Newman, Donald J., 210, 343 Nicolas, Jean-Louis, 126, 305, 308, voir aussi Erdos ˝ Nikodym, Otton, voir Radon nombre d’or, 160, 167, 168 nombre de diviseurs, 44, 54, 57–59, 77, 120–122, 126, 128, 208, 288, 289, 292, 300, 301, 435, 436, 446, 450 nombres algébriques, 153, 154, 165, 166, 168 carrus, 76 composés, 41 de Stirling, 56 équivalents, 162 friables, 488 friables sans facteur carré, 529

589

hautement composés, 126 voir aussi ordre maximal de τ (n) irrationnels quadratiques, 162–165, 167, 169, 170 k -libres, 54 premiers jumeaux, 82, 92, 94 premiers jumeaux généralisés, 116 presque carrés, 115 quasi-premiers, 114 sans facteur carré, 54, 66, 76, 122, 150, 151, 392, 529 transcendants, 154, 165, 166 nombres premiers, 27 différences entre —, 116, 514, 516 Norton, Karl K., 306, 447, 518 notation de Landau, 14 de Vinogradov, 14 Novoselov, E.V., 479 noyau d’un entier, 76, 79, 200, 215 de Fejér, 87, 149, 325, 419, 422

O Oesterlé, Joseph, voir Masser Oppenheim, Alexander, 291, 292 ordre, 129 fini, 203–205 maximal, 120–123, 125–129 maximal de τ (n), 128 minimal, 120, 122–125, 127 moyen, 57 normal, 404, 427, 428, 487 normal du j -ième diviseur, 445 normal du j -ième facteur premier, 441 orthogonalité des caractères, 353 oscillation (théorèmes d’—), 197, 198, 209, 214, 257, 258, 556

P Page, A., 374, 377, voir aussi Landau paires d’exposants, 145 Paley, Raymond E.A.C., 389 Paley–Wiener, 89 Parent, D.P., 165 Parseval, Marc A., 225 formule, 418, 425

590

INDEX

partie réelle (lemme), 240, 244, 247 Pell, John, 171 Perron, Oskar, 218, 221 formule, 218, 220, 222–224, 227 première formule effective, 220 seconde formule effective, 221 phase stationnaire, 144 Phillips, Eric, 145 Phragmén, Edvard, 209 Phragmén–Landau, 196–198, 209, 384, 385 Phragmén–Lindelöf, 204 Piatetski–Shapiro, Ilya I., 146 Pintz, János, 271, 525, voir aussi Goldston ; Kaczorowski Plancherel, Michel formule, 422, 465, 469 théorème, 425 plus petit terme sommation au —, 26 point de continuité, 411 de croissance, 411 de discontinuité, 411 test, 440 Poisson, Denis formule somatoire, 86, 87, 117, 131, 133, 144, 145, 254 loi, 294, 560 Pólya, George, 357 Pólya–Vinogradov, 357, 358, 365, 387 polynôme minimal, 153 polynômes de Tchébychev, 322, 324 longueur, 321 Pomerance, Carl, 306, 518, voir aussi Maier Prachar, Karl, 393 presque partout, 427 primitive racine, 352, 353, 391 suite, 426 principe d’inclusion–exclusion, 52, 53, 56, 78, 449 de dualité, 84, 94 de l’hyperbole, 58, 64, 67, 70, 75, 138, 338 des tiroirs, 152, 202, 244, 379 problème du cercle, 130, 148 procédé de Lambert, 339 produit de Hadamard, 243

purement singulière fonction de répartition —, 412

Q quadratique forme, 94, 99, 100, 102, 389 irrationnel, 162–165, 167, 169, 170 non-résidu, 115 réciprocité, 42 résidu, 41, 42, 105–107, 115, 162 quadrature du cercle, 165 quasi-premiers nombres, 114 quotients complets, 157 incomplets, 157

R racine primitive, 352, 353, 391 radical d’un entier, 200 Radon, Johann, voir ci-dessous Radon–Nikodym, 412 Ramanujan, Srinivasan, 126, 128, 238, 249, 273, voir aussi Hardy nombres hautement composés, 126 sommes, 54 Ramaré, Olivier, 389 Rankin, Robert Alexander, 489, 506, 513, 525 méthode, 109, 201, 489, 513, 548 théorème, 514, 525 réciprocité quadratique, 42 réduite, 155, 156, 160–164, 166–169, 171, 216 secondaire, 168, 169 région sans zéro pour ζ (s), 237, 245, 250, 251, 257, 260, 269, 507, 546 pour L(s,χ ), 364, 365, 374 régulier (procédé de sommation), 339 Rényi, Alfréd, 83, 409, 458 Rényi & Turán, 476, 482 répartition des fonctions additives, 453 des fonctions multiplicatives, 483 résidu inversible, 44, 51, 93, 106, 350 quadratique, 41, 42

Richert, Hans-Egon, voir Halberstam Rieger, Georg Johann, 77, 341 Riemann, Bernhard, 249, 250, 263, 265, 349 hypothèse, 71, 262–264, 272, 273, 522 hypothèse généralisée, 374, 389, 390 intégrabilité, 141, 338, 425 Riemann–Lebesgue, 87, 261 Riesz, Marcel, 224, 335, voir aussi Hardy Rivat, Joël, voir ci-dessous Rivat & Sargos, 146 Rivat & Tenenbaum, 143, 146 Rivat & Wu, 146 Robert, Olivier, voir ci-dessous Robert & Tenenbaum, 210, 211 Robert, Stewart & Tenenbaum, 211 Robson, John Michael, voir Brlek Rogozin, Boris A., 421, voir aussi Kolmogorov Rosser, J. Barkley, voir ci-dessous Rosser & Schoenfeld, 37 Rosser–Iwaniec, 94, 109 Roth, Klaus Friedrich, 83, 154, voir aussi Halberstam Rubey, Martin, voir Brlek Rudin, Walter, 412 Ruzsa, Imre, 442, 443 Ryavec, Charles, voir Elliott

S Saffari, Bahman, 410, 425, voir aussi Erdos ˝ Saias, Éric, 509, 522, 523 Sampath, Ashwin, voir Srinivasan Sargos, Patrick, voir Rivat Sárközy, András, 388, 486, voir aussi Erdos ˝ Sathe, L.G., 294 Schnee, Walter, voir ci-dessous, Schnee–Landau, 224, 227, 273 Schnirelmann, Lev G., 406 Schoenberg, Isaac Jacob, 424 Schoenfeld, Lowell, 37, 389, voir aussi Rosser seconde formule de la moyenne, 21, 147, 254, 503, 540, 549 Selberg, Atle, 28, 77, 84, 88, 95, 250, 263, 269, 275, 294, 305, 306, voir aussi Johnsen

INDEX

crible à puissances, 95, 112 crible de —, 94, 95, 102, 103, 105, 112, 115, 116 fonctions multiplicatives, 95, 96 identité, 28, 77 inégalité du grand crible, 84 Selberg–Delange, 303, 305, 310, 346, 395, 426, 476, 482 semi-empirique (variance), 430 séries L, 111, 358, 365, 374 Shapiro, Harold N., 39, 53, 77, voir aussi Erdos ˝ Siegel, Carl Ludwig, 154, 364, 384, 386 Siegel–Walfisz, 93, 364, 387, 389 Sitaramachandra, Rao R., voir Suryanarayana Sitaramaiah, Varanasi, voir ci-dessous Sitaramaiah & Subbarao, 129 Skałba, Mariusz, 338, 344 Smati, Hakim, voir Balazard Smida, Hikma, 113, 521 Smith, Arthur, 39 Sokolovskii, A.V., 388 sommation au plus petit terme, 26 d’Abel, 19 de Cesàro, 206 de Lambert, 339 somme des diviseurs, 60 sommes de deux carrés, 105–107, 148, 162, 393, 395 Gauss, 355, 356, 388 parties entières, 147 parties fractionnaires, 147 Ramanujan, 54 Soundararajan, Kannan, 113, voir aussi Granville Sperner, Emmanuel, 426 sphérique (fonction —), 188 Squalli, Hassane, 210 squarefull, 76 Srinivasan, Bhama R., voir ci-dessous Srinivasan & Sampath, 269 Stark, Dudley, voir Arratia Stef & Tenenbaum, 342, 343 Stein, Charles M., 432 Stewart, Cameron, voir Evertse ; Robert Stieltjes, Thomas Joannes, 206, 207, voir aussi Fourier ; Laplace intégrale, 20 mesure, 21

Stirling, James formule, 24, 181, 298, 492 formule complexe, 180, 234, 241, 242, 246, 252, 268, 270, 375, 380 formule réelle, 179, 245 nombres de —, 56 Subbarao, Matukumalli Venkata, voir Sitaramaiah suite d’entiers, 400 suite primitive, 426 Suryanarayana & Sitaramachandra, 76 Szüsz, Peter, 479, voir aussi Galambos symbole de Jacobi, 353 de Kronecker, 388 de Landau, 14 de Legendre, 42, 106, 162, 353

T Tao, Terence, voir Ford Tauber, Alfred, 313, 314 taubérien théorème, 312, 315 théorème — arithmétique, 337, 344 théorème — d’Ikehara– Ingham–Delange effectif, 327, 364 théorème — de Hardy–Littlewood, 318, 319, 348 théorème — de Hardy– Littlewood–Karamata, 320, 483 théorème — de Karamata, 315, 319–321, 339, 404, 538 théorème — de Wiener–Ikehara, 327 théorème — effectif, 320, 329 théorème — limite, 326 théorème — transcendant, 326 taubérienne (condition), 312, 315, 333, 336, 338, 345 Tchébychev, Pafnouti, 28, 33, 36, 37, 39, 322, voir aussi Bienaymé fonctions sommatoires, 50, 63, 128 polynômes, 324 Tenenbaum, Gérald, 129, 211,406, 449, 452, 480, 523, 528, 532, 552, 553–555, 556, 557, voir aussi Balazard ;

591

de la Bretèche ; Delange ; De Koninck ; Deshouillers ; Dress ; Dupain ; Erdos ˝ ; Fouvry ; Hall ; Hanrot ; Hildebrand ; Ivi´c ; Maier ; Mendès France ; Rivat ; Robert ; Stef, Tenenbaum & Mendès France, 28 Tenenbaum & Wu, 105, 112, 227, 524, 556 Teugels, Józef L., voir Bingham Thain, Nithum, voir Murty Theodorescu, Radu, voir Hengartner théorème chinois, 83, 91, 351, 354, 515, 516 d’Abel, 311, 340 d’Axer, 74 d’Erdos–Kac, ˝ 310, 476, 482 d’Erdos–Wintner, ˝ 452, 453, 479, 484 d’Erdos–Wintner ˝ friable, 525 des nombres premiers, 259, 269 des trois séries, 453 fondamental de l’arithmétique, 27, 38, 46 taubérien, 326 théorème de Bachet, 38, 157 Berry–Esseen, 347 Bohr–Mollerup, 177, 186 Bombieri–Vinogradov, 111, 112, 116, 389, 390 Brun–Titchmarsh, 93 Cantor–Bernstein, 165 continuité, 415, 454 Daboussi, 484 Davenport–Erdos, ˝ 408 Delange, 454, 483 décomposition de Lebesgue, 412 Fatou–Korevaar, 335 Girard–Fermat, 106, 107, 162 Halász, 462–465 Hardy–Littlewood, 318, 319 Hardy–Littlewood– Karamata, 326, 341 Hardy–Ramanujan, 435 Jessen–Wintner, 420 Karamata, 315, 319–321, 339, 404, 538 Karamata–Freud, 320, 341, 345 Kusmin–Landau, 135 Landau–Page, 374, 378, 382, 389

592

INDEX

Liouville, 153, 154, 165 Maier–Tenenbaum, 446 Paley–Wiener, 89 Phragmén–Landau, 196–198, 209, 384, 385 Phragmén–Lindelöf, 204 Plancherel, 425 Rankin, 514 Schnee–Landau, 224, 227, 273 Siegel, 384, 386, 387, 390 Siegel–Walfisz, 93, 364, 387, 389 Stef–Tenenbaum, 342 Voronoï, 138 Wirsing, 463, 464 Thue, Axel, 154 Tijdeman, Robert, voir Evertse Timofeev, Nikolaï Mikhaïlovich, voir Levin Titchmarsh, Edward Charles, 130, 131, 136, 144, 204, 226, 227, 231, 245, 249, 250, 253, 269, 271, 276, voir aussi Brun Tong, Kwang-Chang, 70 transformation d’Abel, 19 de Fourier–Stieltjes, 332 de Laplace, 105, 500, 537, 539, 544, 560 de Laplace bilatérale, 342 de Laplace inverse, 219, 500, 501, 508, 511, 520, 538, 544 de Laplace–Stieltjes, 192, 314 de Mellin–Stieltjes, 359 de Weyl–van der Corput, 145 triadique, 166 Turán–Kubilius, 428, 430, 431, 433, 434, 436, 442–444, 448, 452, 458, 460, 477, 479, 525 Turán, Paul, 435, 444, voir aussi Erdos ˝ ; Rényi

V Vaaler, Jeffrey, 88, 111, 333, voir aussi Graham valeur moyenne, 58, 63, 68, 69, 71, 77, 148, 338, 415, 417, 428, 440, 451, 452, 454–456, 459, 461, 462, 472, 473, 476, 480, 483, 484, 556 valeur moyenne (formule), 225 Valiron, Georges, 204 valuation p-adique, 31 variable aléatoire, 301, 347, 411, 429, 442 de Bernoulli, 429 géométrique, 429 variables aléatoires indépendantes somme de —, 421, 442, 453 variance empirique, 414, 428, 430, 433 semi-empirique, 430 semi-empirique friable, 525 Vaughan, Robert C., 390, 551, voir aussi Erdos ˝ ; Montgomery Vaughan & Wooley, 551 Vinogradov, Aleksei Ivanovich, 389, voir aussi Bombieri Vinogradov, Ivan M., 70, 146, 250, 357 voir aussi Pólya, notation de —, 14 Volterra, Vito, 520 Voronoï, Georges, 59, 70, 130, 138, 145 Vose, Michael D., 129

W Walfisz, Arnold, 60, 61, 71, voir aussi Landau ; Siegel Wallis, John, 24, 458 Warlimont, Richard, 393

Watson, George Neville, voir Whittaker Watt, Nigel, 130, voir aussi Huxley Weierstrass, Karl, 141, 177, 183, 184, 188, 194, 317 Weyl, Hermann, 136, 137, 141, 142, 145 Weyl–van der Corput, 136, 145 Whittaker, Edmund Taylor, voir ci-dessous Whittaker & Watson, 540 Widder, David Vernon, 20, 269, 501, 544 Wiener, Norbert G., 327, voir aussi Paley Wiener–Ikehara, 262, 327 Wintner, Aurel, voir Jessen ; Erdos ˝ Wirsing, Eduard, 347, 393, 462, 463, 464, 466, voir aussi Montgomery Wooley, Trevor D., voir Vaughan Wu, Jie, 112, voir aussi Hanrot ; Rivat ; Tenenbaum

Y Yıldırım, Cem Y., voir Goldston

Z Zagier, Don Bernard, 210, 343 zéro de Siegel, 364, 374, 383 zéros de ζ (s), 145, 237, 238, 241–244, 250, 253–255, 257 zéros triviaux de L(s,χ ), 373 de ζ (s), 238, 241 Zhang, Yitang, 94, 116